Birkaç ay önce, bir şeyin resmini oluşturmak istiyorsanız, eskiz yapabilmeniz, boyayabilmeniz veya başkalarının bahsettiği photoshop araçlarından birini kullanabilmeniz gerekiyordu. Ancak 2022'den sonra her şey AI sayesinde değişti - evet, "yapay zeka"da olduğu gibi.

Sanata yatkın AI araçları, dünyaya hükmetmeye çalışmak yerine, onlara tanımladığınız her şeyi bir görüntüye dönüştürebilir.

Yapay zeka destekli metin görselleştirme dünyasına girerken bizimle gelin ve yalnızca aklınızdakileri yazarak düşüncelerinizi gerçek resimlere dönüştürmek için bu tür araçları nasıl kullanabileceğinizi görün.

Dall-E: OpenAI'nin GPT-3'ünün Sanatsal Yönü

Popüler hale gelen ilk AI destekli araçlar, OpenAI'nin GPT-3'üne dayanıyordu. Bunun nedenlerinden biri, projenin dışarıdan erişime açık olmasıydı ve bu da bazı önerilere yol açtı. GPT-3, yaratıcı çalışmanın geleceğidir.

Bugün adresinde bulabileceğiniz resmi araçları kullanabilirsiniz. OpenAI'nin beta sitesi veya dilsel süper güçlerinden yararlanan üçüncü taraf çözümler. Örneğin, GPT-3'ten bir gönderi için bir taslak hazırlamasını, basit soruları yanıtlamasını, hatta bazı metinleri gözden geçirmesini veya tercüme etmesini isteyebilirsiniz.

instagram viewer

2022'de OpenAI, GPT-3'ün görüntü oluşturmada eşit derecede iyi olduğunu ortaya çıkardı. Pixar'ın WALL-E filminin ve Dali'nin adının bir oyunu olan DALL-E projesi, metinle çalışmak için değil, bir görüntü oluşturma motoru olarak GPT-3'ü kullanıyor.

GPT-3 ve metinde olduğu gibi, DALL-E de görüntüleri yoktan var eden yaratıcı bir dahi değildir. Bunun yerine, zaten çevrimiçi olan milyonlarca görüntü üzerinde "eğitildi". AI güçleri, bu görüntüleri analiz etmede, onlardan öğeler almada, ince ayar yapmada, dönüştürmede, ayarlamada ve son olarak bunları yeni görüntülerde birleştirmede yatmaktadır.

En azından, arka planda olanların basitleştirilmiş bir versiyonu. Çoğu insan yalnızca önlerinde gördükleriyle ilgilenir ve bu, bir şeyler yazabileceğiniz ve birkaç dakika sonra bir görüntüye dönüştüğünü görebileceğiniz bir metin kutusudur.

Google'ın Imagen Cevabı

Google, AI araştırmasında ilk üç "oyuncudan" biridir. Yine de, ilerlemeleri kolayca algılanamaz ve uygulamaları OpenAI'nin teklifleri kadar erişilebilir ürünler değildir.

Google AI'nın yaygın olarak kullanılabilen ilk uygulamalarından biri, Akıllı Yazma olarak bilinen daha akıllı otomatik tamamlama ve öneriler biçiminde Google Dokümanlar ve Gmail'deydi. Daha önce ele aldığımız için ayrıntılara girmeyeceğiz Akıllı Yazma (ve onu nasıl kullanabilirsiniz).

Bu özellikler etkin olduğunda, Google'ın web uygulamaları, kullanıcının yazdıklarını geçmişte milyonlarca kişinin yazdıklarıyla karşılaştırır. Ardından, daha sonra yazdıklarını önerir.

İnanmayı sevdiğimiz şeye rağmen, o kadar da farklı olmadığımızın kanıtı. 100 kişiden 99'u "görüşürüz"den sonra "sonra" yazarsa, muhtemelen biz de yazmaya devam edeceğiz.

Hepimiz, "aptal telefon" döneminin T9 akıllı metin sisteminde arkadan bile olsa, bir tür otomatik tamamlama kullandık. Bu nedenle Google'ın AI araçları, OpenAI'nin GPT-3'ü kadar akıllı görünmüyordu. 21. yüzyıl için geliştirilmiş daha iyi bir T9 sisteminden daha fazla kullanımda hissetmediler. Ve bu yüzden Imagen'in açıklaması biraz şok oldu.

Steroidlerdeki bir DALL-E gibi, Imagen bir metin görselleştirme aracıdır. Bugün mevcut olana dayanarak, Imagen "daha temiz" ve daha canlı görüntüler üretirken aynı zamanda yayılma ve şeffaflık gibi gelişmiş özelliklerle nasıl başa çıkacağını da biliyor.

Ne yazık ki, bu yazının yazıldığı sırada Imagen'e erişim sınırlı kaldı, bu yüzden deneyemedik.

DALL-E Mini ve Arkadaşları: İşletmeye Açık

Henüz DALL-E ve Imagen'e özgürce erişemezsiniz. Yine de, AI destekli metinsel görüntü oluşturma ile uğraşmak istiyorsanız, birçok alternatif zaten mevcut.

Bunların ilk günler olduğunu ve sundukları sonuçların veya kullanıcı deneyiminin optimal olmaktan uzak olabileceğini göz önünde bulundurarak, yine de aşağıdakilerden bazılarına göz atmaya değer.

Dall-E Mini ile Mem Yapmak

Yeterliden fazla sonuçların ve kullanıcı dostu bir arayüzün kombinasyonu sayesinde, ancak daha da önemlisi, geniş kullanılabilirliği sayesinde DALL-E mini, en popüler AI metin görselleştiricilerinden biri haline geldi.

Mükemmel olmaktan uzak, bazen DALL-E mini'nin sonuçları amaçlanandan daha soyut olabilir.

Diğer zamanlarda, aklınızdaki şeyi yaratmada başarısız olabilir, ancak oldukça yakınlaşabilir.

Popülaritesindeki patlamadan sonra, DALL-E mini'nin yaratıcıları onu yeni bir marka altında yeni bir eve taşıdı. Artık DALL-E mini'nin en son sürümünü şu şekilde bulabilirsiniz: Craiyon kendi sitesinde.

Craiyon'u bugün kullanmak, mevcut bir görseli internette aramak kadar kolay. Sitesini ziyaret edebilir, metin alanına resminizin açıklamasını yazabilir ve Enter'a basabilirsiniz. Bir süre sonra sonuçları ekranınızda göreceksiniz.

Çarpıcı olan, Craiyon ve benzeri araçların görsel stilleri taklit etmede ne kadar iyi olduğudur. Örneğin, bir kaykay üzerinde bir köpek yavrusu görüntülerini canlandırmasını istedik:

Daha sonra aynı ifadeyi kullandık ama arkasına bir "Pixar stili" ekledik. Bir süre sonra Craiyon, sevgili filmlerinde Pixar'ın ışın izlemeli grafikleri olarak algıladığımıza daha yakın, daha fazla "çizgi film" görüntülerinden oluşan bir ızgara gösterdi.

Aynı komutta "Pixar stili"ni "anime stili" ile değiştirdiğimizde Craiyon bize daha da iyi sonuçlar verdi.

Anime, görünüşte Pixar'ın daha gerçekçi görüntülerinden daha stilize edilmiş ve bu da Craiyon'un neredeyse kullanıma hazır bazı görüntüler üretmesine yardımcı olmuş gibi görünüyor.

Gizli Difüzyonla Dolaşmak

LAION-400M veri kümesi üzerinde eğitilen Gizli Yayılma modeli, başka bir ilginç AI metin görselleştiricisidir. Bununla birlikte, kullanımında da daha karmaşıktır. Sadece bir metin alanına yazmak yerine onu çevrimiçi olarak sanal bir makinede çalıştırmalı ve çeşitli parametreleriyle oynamalısınız. Yine de, göründüğünden daha kolay.

  1. ziyaret edin Google Gizli Yayılım ortak çalışma alanı şu anda onun evi.
  2. Biraz aşağı kaydırın ve dikkat edin Çabuk altındaki alan parametreler. Varsayılan istemi, resminizin göstermesini istediğiniz şeyle değiştirin.
  3. Seçmek Tümünü Çalıştır itibaren Çalışma süresi menüsüne basın veya CTRL + F9.
  4. Üretilen görüntüleri doğrudan araç içinden dışa aktarabilmek istiyorsanız, Google Drive hesabınıza bağlamak isteyip istemediğiniz sorulduğunda olumlu yanıt verin. Aracın yapılandırmasını tamamlaması biraz zaman alır ve işlem sırasında bazı dosyaları indirmesi gerekir.

için değerlerin arttırılması adımlar, yinelemeler, ve Samples_in_parallel, daha ayrıntılı sonuçlara yol açabilir. Ancak araç, Google sunucularındaki kaynaklarda son derece talepkar. Sonuç olarak, bu değerleri çok fazla artırırsanız çökebilir veya belirli bir görüntüyü oluşturma süreci beklenenden daha karmaşık hale gelir.

İlginç Alternatifler

DALL-E mini ve Latent Difüzyon'u test etmek için önemli miktarda zaman harcadık. Bilimsel yöntemimiz iki ayrı bölümden oluşuyordu. İlk olarak, doğru bir şekilde çılgınlık olarak tanımlanabilecek kavramlar bulmamız gerekiyordu. Ardından, bu AI görselleştiricilerinden onları görüntülere dönüştürmelerini isteyin. Beklenenden daha sık olarak, öngördüğümüz genel düzene yaklaşmayı başardılar.

Bu makale için mevcut alternatiflerden bazılarını da denedik. Hâlâ diğerlerine erişmeyi bekliyoruz. Kontrol etmeye değer olanlardan bazıları (belirli bir sırayla):

  • yolculuk
  • MindsEye beta
  • StarryAI
  • Rüya
  • Disko Difüzyon

Yapay Zeka Tarafından Oluşturulan Sanat, Görsel Sanatların Yerini Alacak mı?

Görüntü üreten AI destekli araçların bolluğu ve sürekli artan popülaritesi, birçok kişinin görsel sanatların yakında öleceği sonucuna varmasına neden oluyor. Bir yapay zekanın sizden daha hızlı (ve yakında daha iyi) yapabileceği bir şeyi görselleştirmek için karmaşık yazılımları nasıl çizeceğinizi veya kullanacağınızı öğrenmek için zaman ve enerjiye yatırım yapmanın anlamı nedir?

Fark ettiyseniz, bu araçların tümü "veri kümeleri üzerinde eğitilmiştir". Sade İngilizce'de bu, daha önce aynı şeyi yapmış olan insanlar sayesinde yaptıklarını yaptıkları anlamına gelir.

Bu araçların neden insan sanatının, yaratıcılığının ve yaratıcılığının yerini alamayacağına dair ipucu. Onlar taklitçi, akıllı çoğaltıcılar. Üzerinde eğitildikleri insan yapımı orijinaller olmadan herhangi bir çıktı üretemezler.

Yine de, şimdi bu ve geleceğin ne getireceğini bilmediğimizi kabul ediyoruz. Şimdilik görsel sanatçılar güvenle uyuyabilir. Yapay zekanın gelişme hızına rağmen, konuyla ilgili birçok uzman, sizinki gibi insanların çalışmalarının yerini gerçekten alıp almayacağı konusunda hemfikir. Bu sadece bir zaman meselesi.

Ama hey, tüm kıyamet ve kasvet değil. Skynet işimizi elimizden almaya hazırlanırken, en azından kaykaylarda yavru köpeklerin görüntülerini zahmetsizce yaratarak ruh halimizi aydınlatabiliriz!