AI, oluşturulan sanatı gerçek fotoğraflarla karıştırmamız için bizi kandırabilir. Peki eller neden bu kadar büyük bir zorluk?

AI jeneratörleri, gözlerimizin önünde korkutucu bir hızla gelişiyor, ancak yine de kusurları var. AI görüntülerinde garip detayları tespit etmek aslında oldukça komik. Bu nedenle Midjourney ibreleri, birçok motorda yaygın olan bir sorun olan sıcak bir konu haline geldi.

Ellerin AI görüntü oluşturucularına neden bu kadar meydan okuduğunu açıklayalım. Programcıları bu memeye layık sorunu zaten çözüyorlar, ancak yapay zekanın nasıl öğrendiğini düşünmek ilginç, önüne çıkanlardan bahsetmeye bile gerek yok.

Yapay Zeka Tarafından Üretilen Eller Neden Heyecan Yarattı?

Görüntü oluşturmak için AI motorlarını kullanan herkes, ellerin nadiren doğru çıktığını fark etmiş olabilir, ancak sorun, Twitter'da bir grup "fotoğraf" göründüğünde dikkatleri üzerine çekti.

Daha yakından incelendiğinde, insanların tuhaf elleri onları yapay zeka tarafından oluşturulmuş görüntüler olarak ele verdi. Bunun Midjourney'nin oyunu olması durumu daha da ilginç kılıyordu.

instagram viewer

Piyasadaki en iyi AI motorlarından biri, insan elinin karmaşıklığının üstesinden gelemedi, bu nedenle Midjourney ve rakiplerinin yetenekleri teste tabi tutuldu. Yeterince doğru, DALL-E bile gerçekçi olmayan parmaklara ve tırnaklara eğilimlidir.

Aldatmaca orantısızdı, yapay zeka tarafından üretilen ellerin her zaman bir sorun olduğu düşünüldüğünde, ancak ekstra dikkat, serbest bırakılmasını sağladı. Midjourney v5, v4'te geliştirilecek.

Yeni sürüm, el tasarımını geliştirme noktasına geldi; bu, AI mühendislerinin komik karıştırmaya dikkat ettiğini ve yazılımın yeteneklerini yükseltmeye karar verdiklerinin açık bir göstergesiydi.

Diğer motorlar, Midjourney örneğini takip etmekte yavaştır, bu nedenle AI sanatını Photoshop ile sabitleme paha biçilmez bir beceri olmaya devam ediyor. Programcılar için ana engel, ikna edici eller çekmek için yapay zekayı eğitmenin ne kadar karmaşık olduğudur.

AI Görüntü Oluşturucuları Neden Ellerle Mücadele Ediyor?

Yapay zeka motorları, görüntüler üretmek için üretken rakip ağlar (GAN'lar) veya Stable Diffusion kullanır. Her iki teknoloji de en temel sanat eserlerini yaratmak için kapsamlı kaynak materyalleri, eğitim ve işlem gücü gerektirir.

Önceden var olan görüntüler bir yapay zekanın eğitiminin merkezinde yer aldığından, programcıların yazılımlarını milyonlarca olmasa da binlerce resimle beslemesi gerekir. bilgi istemlerinin yanı sıra - motor belirli bir kelimenin neyi ifade ettiğini ve bunun nasıl temsil edileceğini anlayana kadar işlemi tekrar tekrar tekrarlamak nesne.

Ancak bir yapay zekanın öğrendiği kaynak görüntüler, ellerin çeşitli konumlarda tasvir edildiği esas olarak 2B'dir. İster düz ister kıvrık, beş veya üç parmak gösteriliyor.

Günün sonunda, bir makine aslında el kavramını anlamıyor ve öğrendiği resimlerde her zaman elleri yeterince net veya tutarlı bir şekilde göstermiyor. Midjourney'in ellerinin bu kadar çirkin olmasının nedeni budur: AI karışıklığı.

kadar geçerli Elon Musk'ın AI geliştirme konusundaki endişeleri olabilir, teknolojinin bazı kısımlarında hala öğrenilecek çok şey var. Ve engelleri yetersiz örnek ellerin ötesine geçiyor.

Yapay Zeka Görüntü Oluşturucularının Yavaş Gelişmesinin Diğer Nedenleri

Bakmak Midjourney modelleri, v5, metin istemleri ve üretilen görüntüler arasında gelişmiş tutarlılığın yanı sıra daha yüksek çözünürlük ve ek araçlar sunar. Ancak bu tür başarılar ucuza gelmiyor.

Bir AI'yı ellerle daha iyi yapmak üzere eğitmek, özellikle 3D olmak üzere daha iyi görüntüler beslemesini gerektirir. Bu, kaynak materyallerin elde edilmesinden kodlamanın iyileştirilmesine ve yapay zeka doğru yapana kadar eğitimin tekrarlanmasına kadar süreçlere çok fazla zaman ve insan gücü harcanması anlamına gelir.

O zaman bile yazılım, başka türlü çarpıcı sanat eserlerinde hatalar yapabilir. Büyük ve karmaşık bir iş olmasının yanı sıra pahalıdır. Yani beklemeyin ücretsiz yapay zeka metinden görüntüye oluşturucular henüz Midjourney'nin kalibresine çıkmak için.

Basitçe ifade etmek gerekirse, yapay zeka motorlarıyla ilgili sorun, yalnızca bu bilgisayar programlarının eller ve ayaklar gibi insan özelliklerinin nasıl göründüğünü veya çalıştığını tam olarak anlayamamasıyla ilgili değildir. Aynı zamanda maliyeti ve teknolojinin 3D görüntülere erişimi ve üreticilerin etraflarındaki dünyayı daha gerçekçi bir şekilde kavramasına yardımcı olabilecek makine öğrenimi tekniklerine de bağlıdır.

Yapay Zeka Görüntü Oluşturucuları Sonsuza Kadar Mücadele Etmeyecek

Eller, yapay zekanın ikili kafasını sarması için aldatıcı bir kavramdır, ancak sorunun çözümleri zaten iş başındadır. Midjourney, DALL-E 2 ve diğer platformlar sonunda ilginç parmakları tamamen ortadan kaldırmasalar bile minimumda tutabilecekler.

Diğer AI alanlarındaki ilerlemeler, teknolojinin sürekli olarak gelişmesini ve geliştiricilerinin her zaman onu uygulamak ve geliştirmek için yeni yollar öğrenmesini sağlar.