GPT-4 burada ve göz atmanız gereken yeni özellikler bunlar.
OpenAI sonunda merakla beklenen GPT güncellemesi GPT-4'ü yayınladı. Büyük Dil Modeli (LLM), dünya çapındaki kullanıcıları şimdiden şok etmiş olan bazı güçlü yeni özellikler ve yeteneklerle birlikte gelir.
OpenAI'nin viral sohbet robotu ChatGPT, GPT-4'ü destekleyen mevcut LLM, GPT-3.5'ten önemli ölçüde daha iyi olmasının yanı sıra, daha karmaşık girdileri anlar, çok daha büyük bir karakter giriş sınırına sahiptir, çok modlu yeteneklere sahiptir ve bildirildiğine göre daha güvenlidir kullanmak.
1. GPT-4 Daha Karmaşık Girdileri Anlayabilir
GPT-4'ün en büyük yeni özelliklerinden biri, daha karmaşık ve incelikli istemleri anlama yeteneğidir. Buna göre OpenAI, GPT-4 "çeşitli profesyonel ve akademik ölçütlerde insan düzeyinde performans sergiliyor."
Bu, GPT-4'ü belirli bir eğitim olmaksızın birkaç insan düzeyinde sınava ve SAT, BAR ve GRE gibi standartlaştırılmış testlere tabi tutarak gösterildi. GTP-4, bu testleri anlayıp genel olarak nispeten yüksek bir puanla çözmekle kalmadı, aynı zamanda her seferinde selefi GPT-3.5'i geride bıraktı.
GPT-4'ün çok daha geniş bir kelime sınırına sahip olması, daha incelikli giriş istemlerini anlama becerisine de yardımcı olur. Yeni model, 25.000 kelimeye kadar giriş istemlerini işleyebilir (bağlam için GPT-3.5, 8.000 kelimeyle sınırlandırılmıştır). Bu, kullanıcıların bilgi istemlerine sığdırabilecekleri ayrıntıları doğrudan etkileyecek, dolayısıyla modele çalışmak için çok daha fazla bilgi verecek ve daha uzun çıktılar üretecektir.
GPT-4 ayrıca Letonca, Galce ve Svahili gibi düşük kaynaklı diller de dahil olmak üzere 26'dan fazla dili destekler. MMLU kıyaslamasında üç atış doğruluğu ile kıyaslandığında GPT-4, 24 dilde İngilizce performansı açısından GPT-3.5'in yanı sıra PaLM ve Chinchilla gibi diğer önde gelen LLM'leri geride bıraktı.
2. Çok Modlu Yetenekler
önceki sürümü ChatGPT sadece metin istemleriyle sınırlıydı. Buna karşılık, GPT-4'ün en yeni özelliklerinden biri, çok modlu yetenekleridir. Model, hem metin hem de resim istemlerini kabul edebilir.
Bu, yapay zekanın bir görüntüyü girdi olarak kabul edebileceği ve tıpkı bir metin istemi gibi yorumlayıp anlayabileceği anlamına gelir. Bu yetenek, ikisini birleştiren belgeler, elle çizilmiş eskizler ve hatta ekran görüntüleri dahil olmak üzere tüm boyut ve türdeki görüntü ve metinleri kapsar.
Ancak GPT-4'ün görüntü okuma yetenekleri, onları yorumlamanın ötesine geçer. OpenAI bunu, GPT-4'e bir şaka web sitesinin elle çizilmiş bir maketini sağladıkları geliştirici akışında (yukarıda) sergiledi. Model, şakaları gerçek olanlarla değiştirirken maketi bir web sitesine dönüştürmek için HTML ve JavaScript kodu yazmakla görevlendirildi.
GPT-4, makette belirtilen düzeni kullanırken kodu yazdı. Testin ardından kod, tahmin edebileceğiniz gibi gerçek şakalar içeren çalışan bir site oluşturdu. Anlamında mı AI gelişmeleri, programlamanın sonu anlamına gelecek? Tam olarak değil, ancak yine de programcılara yardımcı olmak için kullanışlı olacak bir özellik.
Bu özellik ne kadar ümit verici görünse de, hâlâ araştırma ön izleme aşamasındadır ve genel kullanıma açık değildir. Ek olarak, modelin görsel girdileri işlemesi çok zaman alıyor ve OpenAI'nin kendisi daha hızlı hale gelmenin çalışma ve zaman alabileceğini belirtiyor.
3. Daha Fazla Yönlendirilebilirlik
OpenAI ayrıca GPT-4'ün yüksek derecede yönlendirilebilirliğe sahip olduğunu iddia ediyor. Ayrıca, AI'nın karakteri bozmasını zorlaştırdı, yani belirli bir karakteri oynamak için bir uygulamada uygulandığında başarısız olma olasılığı daha düşük.
Geliştiriciler, "sistem" mesajındaki yönü açıklayarak yapay zekalarının stilini ve görevini belirleyebilir. Bu mesajlar, API kullanıcılarının kullanıcı deneyimini belirli sınırlar içinde büyük ölçüde özelleştirmesine olanak tanır. Bu mesajlar aynı zamanda modeli "jailbreak" yapmanın en kolay yolu olduğundan, onları daha güvenli hale getirmek için de çalışıyorlar. GPT-4 demosu, bir kullanıcının GPT-4'ün Sokratik bir öğretmen olmasını engellemeye çalışmasını ve sorularına yanıt vermesini sağlayarak bu noktayı net bir şekilde ortaya koydu. Ancak model karakterini bozmayı reddetti.
4. Emniyet
OpenAI, GPT-4'ü yapmak için altı ay harcadı daha güvenli ve daha uyumlu. Şirket, uygunsuz veya başka bir şekilde izin verilmeyen içerik taleplerine yanıt verme olasılığının %82 daha az, yanıt verme olasılığının %29 daha yüksek olduğunu iddia ediyor. OpenAI'nin hassas taleplere politikalarına uygun olarak yanıt verin ve kıyasla %40 daha gerçek yanıtlar üretme olasılığı GPT-3.5.
Mükemmel değil ve yine de zaman zaman "halüsinasyon" görmesini bekleyebilir ve tahminlerinde yanılabilirsin. Elbette, GPT-4'ün daha iyi algılama ve tahmin gücü vardır, ancak yine de yapay zekaya körü körüne güvenmemelisiniz.
5. Performans geliştirmeleri
OpenAI, modelin insan sınavlarındaki performansını değerlendirmenin yanı sıra botu makine öğrenimi modelleri için tasarlanmış geleneksel ölçütlerde de değerlendirdi.
GPT-4'ün mevcut LLM'lerden ve "en gelişmiş modellerden" "önemli ölçüde daha iyi performans gösterdiğini" iddia ediyor. Bu kriterler şunları içerir: yukarıda bahsedilen MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval ve Drop, hepsi bireysel yetenekleri test eder.
Akademik vizyon ölçütlerinde performansı karşılaştırırken benzer sonuçlar bulacaksınız. Yürütülen testler, tümü GPT-4'ün üzerinde olan VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA ve LSMDC'yi içerir. Ancak OpenAI, araştırmacılar modelin üstesinden gelebileceği yeni ve daha zorlu şeyler bulmaya devam ettikçe, GPT-4'ün bu testlerdeki sonuçlarının "yeteneklerinin kapsamını tam olarak temsil etmediğini" belirtti.
GPT-4 için Küçük Adım, Yapay Zeka için Dev Adım
Daha fazla doğruluk, kullanım güvenliği ve gelişmiş yeteneklerle GPT-4, ayda 20'ye mal olan ChatGPT+ aylık abonelik planı aracılığıyla halka sunuldu. Ayrıca OpenAI, GPT-4 ile tüketiciye yönelik ürünler oluşturmaya başlamak için farklı kuruluşlarla ortaklık kurdu. Diğerlerinin yanı sıra Microsoft Bing, Duolingo, Stripe, Be My Eyes ve Khan Academy, ürünlerinde zaten GPT-4'ü uygulamıştır.
GPT-4, GPT-3.5'e göre artımlı bir güncelleme olabilir, ancak genel olarak yapay zeka için büyük bir kazançtır. Model, API'si aracılığıyla hem ortalama kullanıcı hem de geliştiriciler için daha erişilebilir hale geldikçe, alanlar genelinde LLM uygulamaları için iyi bir örnek olacak gibi görünüyor.