Muhtemelen OpenAI'nin GPT'sini duymuşsunuzdur, ancak bloktaki tek Yüksek Lisans'lar onlar değil.

Temel Çıkarımlar

  • OpenAI'nin GPT-4'ü, 1,76 trilyon parametre ve çok modlu yeteneklerle en gelişmiş ve en yaygın kullanılan büyük dil modelidir.
  • Anthropic'in Claude 2'si, yaratıcı yazma görevlerinde GPT-4 ile rekabet ediyor ve daha az kaynağa sahip olmasına rağmen yerini koruyor.
  • Google'ın PaLM 2'si, GPT-4 katili olmasa da güçlü çok dilli ve yaratıcı yeteneklere sahip güçlü bir dil modelidir. Falcon-180B, ticari devlere rakip olan ve GPT-3.5 ile burun buruna durabilen açık kaynaklı bir modeldir.

Yapay zeka mevsimi geldi ve teknoloji şirketleri bir fırından alınan ekmek gibi büyük dil modellerini seri üretime geçiriyor. Yeni modeller hızla piyasaya sürülüyor ve takip edilmesi de zorlaşıyor.

Ancak yeni sürümlerin telaşı arasında yalnızca birkaç model zirveye çıktı ve geniş dil modeli alanında gerçek rakipler olarak kendilerini kanıtladı. 2023'ün sonuna yaklaşırken denemeniz gereken en etkileyici altı büyük dil modelini bir araya getirdik.

instagram viewer

1. OpenAI'nin GPT-4'ü

GPT-4 bugüne kadar halka açık en gelişmiş geniş dil modelidir. OpenAI tarafından geliştirilen ve Mart 2023'te piyasaya sürülen, GPT-4, Üretken Önceden Eğitimli Transformatör serisinin en son sürümüdür 2018'de başladı. GPT-4, muazzam yetenekleriyle dünyada en yaygın kullanılan ve en popüler büyük dil modellerinden biri haline geldi.

Resmi olarak doğrulanmasa da kaynaklar GPT-4'ün 1,76 trilyon gibi şaşırtıcı bir parametre içerebileceğini tahmin ediyor. Önceki GPT-3.5'ten yaklaşık on kat daha büyük ve Google'ın amiral gemisi PaLM 2'den beş kat daha büyük. Bu devasa ölçek, GPT-4'ün çok modlu yeteneklerini etkinleştirerek hem metni hem de görüntüleri girdi olarak işlemesine olanak tanır. Sonuç olarak GPT-4, metnin yanı sıra diyagramlar ve ekran görüntüleri gibi görsel bilgileri de yorumlayabilir ve tanımlayabilir. Çok modlu yapısı, gerçek dünya verilerinin daha insani bir şekilde anlaşılmasını sağlar.

Bilimsel kıyaslamalarda GPT-4, çeşitli testlerde diğer çağdaş modellerden önemli ölçüde daha iyi performans gösteriyor. Karşılaştırmalar tek başına bir modelin güçlü yönlerini tam olarak göstermese de, gerçek dünyadaki kullanım örnekleri, GPT-4'ün pratik sorunları sezgisel olarak çözme konusunda olağanüstü derecede becerikli olduğunu göstermiştir. GPT-4 şu anda aylık 20 ABD doları olarak faturalandırılmaktadır ve ChatGPT'nin Plus planı aracılığıyla erişilebilir.

2. Antropik'in Claude 2'si

Resim Kredisi: Antropik

Anthropic AI tarafından geliştirilen Claude 2, GPT-4 kadar popüler olmasa da, çeşitli alanlarda GPT-4'ün teknik kriterlerini ve gerçek dünya performansını karşılayabilir. Seçilmiş sınavlar da dahil olmak üzere bazı standart testlerde Claude 2, GPT-4'ten daha iyi performans gösteriyor. Yapay zeka dil modeli ayrıca GPT -4'ün 8k ve 32k jeton modelleriyle karşılaştırıldığında yaklaşık 100.000 jetonla oldukça üstün bir bağlam penceresine sahiptir. Daha büyük bağlam uzunluğu her zaman daha iyi performans anlamına gelmese de Claude 2'nin genişletilmiş kapasitesi, 75.000 kelimelik kitapların tamamının analiz için sindirilmesi gibi açık avantajlar sağlar.

Genel performansta GPT-4 üstün olmayı sürdürüyor ancak kurum içi testlerimiz Claude 2'nin bunu aştığını gösteriyor çeşitli yaratıcı yazma görevlerinde. Claude 2, değerlendirmelerimize göre programlama ve matematik becerilerinde de GPT-4'ün ardından geliyor ancak insan benzeri, yaratıcı yanıtlar sağlamada öne çıkıyor. Bu listedeki tüm modellerden yaratıcı bir eser yazmasını veya yeniden yazmasını istediğimizde, on üzerinden altı kez, kulağa doğal gelen insan benzeri sonuçlar nedeniyle Claude 2'nin sonucunu seçtik. Şu anda, Claude 2, Claude AI sohbet robotu aracılığıyla ücretsiz olarak edinilebilir. Ekstra özelliklere erişim için 20 dolarlık ücretli bir plan da var.

OpenAI ve Microsoft gibi devlerden daha az mali desteğe sahip olmasına rağmen Anthropic'in Claude 2 AI modeli, popüler GPT modellerine ve Google'ın PaLM serisine karşı üstünlük sağlıyor. Daha az kaynağa sahip bir yapay zeka için Claude 2 etkileyici derecede rekabetçidir. Yakın gelecekte GPT'ye rakip olma şansının en yüksek olduğu mevcut modelin hangisi olduğuna dair bahse girmek zorunda kalırsanız, Claude 2 en güvenli bahis gibi görünüyor. Her ne kadar finansman konusunda yetersiz olsa da Claude 2'nin gelişmiş yetenekleri, onunla bile rekabet edebileceğini gösteriyor. iyi finanse edilen devler (ancak Google'ın birçok büyük katkı yaptığını belirtmekte fayda var) Antropik). Model kendi ağırlık sınıfının üzerinde performans sergiliyor ve yeni ortaya çıkan bir rakip olarak umut vaat ediyor.

3. OpenAI'nin GPT-3.5'i

İmaj Kredisi: Marcelo Mollaretti/Shutterstock

GPT-4'ün piyasaya sürülmesinin gölgesinde kalsa da GPT-3.5 ve onun 175 milyar parametresi hafife alınmamalıdır. Performans, doğruluk ve güvenliğe odaklanan yinelemeli ince ayarlar ve yükseltmeler sayesinde GPT-3.5, orijinal GPT-3 modelinden çok uzun bir yol kat etti. GPT -4'ün multimodal yeteneklerinden yoksun olmasına ve bağlam uzunluğu ve parametre sayısında geride kalmasına rağmen, GPT-3.5 yüksek kapasiteye sahip olmaya devam ediyor; GPT-4, her yönüyle performansını aşabilen tek model oluyor kararlı bir şekilde.

GPT ailesinde ikinci kademe bir model olmasına rağmen, GPT-3.5 kendine hakim olabilir ve hatta çeşitli kıyaslamalarda Google ve Meta'nın amiral gemisi modellerinden daha iyi performans gösterebilir. Google'ın PaLM 2'sine karşı matematik ve programlama becerilerinin yan yana test edildiği testlerde, farklar çok belirgin değildi; GPT-3.5 bazı durumlarda hafif bir üstünlüğe bile sahipti. Mizah ve anlatı yazma gibi daha yaratıcı görevler, GPT-3.5'in kararlı bir şekilde öne çıktığını gördü.

Dolayısıyla, GPT-4 yapay zeka alanında yeni bir dönüm noktasına işaret ederken, GPT-3.5 etkileyici derecede güçlü bir model olmaya devam ediyor, en gelişmiş alternatiflerle rekabet edebiliyor ve hatta bazen onları aşabiliyor. Devam eden iyileştirme, daha gösterişli yeni nesil modellerin yanında bile geçerliliğini korumasını sağlıyor.

4. Google'ın PaLM 2'si

Resim Kredisi: Google

Bir yapay zeka modelinin yeteneklerini değerlendirirken kanıtlanmış formül, teknik raporu okumak ve Karşılaştırma puanlarını kontrol edin, ancak öğrendiğiniz her şeye biraz şüpheyle yaklaşın ve modeli test edin kendin. Her ne kadar mantığa aykırı görünse de, bazı yapay zeka modelleri için kıyaslama sonuçları her zaman gerçek dünya performansıyla uyumlu olmuyor. Kağıt üzerinde, Google'ın PaLM 2'sinin GPT-4'ün katili olması gerekiyordu ve resmi test sonuçları, bazı kıyaslamalarda GPT-4 ile eşleştiğini gösteriyor. Ancak günlük kullanımda farklı bir tablo ortaya çıkıyor.

Mantıksal akıl yürütme, matematik ve yaratıcılıkta PaLM 2, GPT-4'ün gerisinde kalıyor. Ayrıca bir dizi yaratıcı yazma görevinde Anthropic'in Claude'unun gerisinde kalıyor. Ancak, bir GPT-4 katili olarak faturasını yerine getiremese de, Google'ın PaLM 2'si güçlü bir dil modeli olmaya devam ediyor kendi başına, muazzam yeteneklere sahip. Bu konudaki olumsuz düşüncelerin çoğu, düpedüz düşük performanstan ziyade, GPT-4 gibi modellerle yapılan karşılaştırmalardan kaynaklanıyor.

PaLM 2, 340 milyar parametresiyle dünyanın en büyük modelleri arasında yer alıyor. Özellikle çok dilli görevlerde üstündür ve güçlü matematik ve programlama yeteneklerine sahiptir. Her ne kadar bu konuda en iyisi olmasa da PaLM 2, yazma gibi yaratıcı görevlerde de oldukça verimlidir. Dolayısıyla, karşılaştırmalar tam olarak gerçekleşmeyen iyimser bir tablo çizse de, PaLM 2, tüm rakiplerini geride bırakmasa bile hala etkileyici yapay zeka becerileri sergiliyor.

5. TSEV'in Falcon-180B'si

Yapay zeka dil modeli yayınlarının hızlı temposuna ayak uydurmadığınız sürece Falcon-180B ile muhtemelen hiç karşılaşmamışsınızdır. BAE'nin Teknoloji İnovasyon Enstitüsü tarafından geliştirilen 180 milyar parametreli Falcon-180, en güçlü uçaklardan biri GPT modellerinin ad tanıma özelliğinden veya Meta'nın yaygın kullanımından yoksun olsa bile, açık kaynaklı dil modelleri mevcuttur. Lama 2. Ancak hata yapmayın; Falcon-180B, sınıfının en iyileriyle karşı karşıya gelebilir.

Karşılaştırma sonuçları, Falcon-180B'nin çoğu açık kaynaklı modelden daha iyi performans gösterdiğini ve aşağıdaki gibi ticari rakiplerle rekabet ettiğini ortaya koyuyor: PaLM 2 ve GPT-3.5. Matematik, kodlama, akıl yürütme ve yaratıcı yazma görevlerini test ederken GPT-3.5 ve PaLM 2'yi bile geride bıraktı. zamanlar. GPT-4, GPT-3.5 ve Falcon-180B'yi sıralıyorsak, Falcon-180B'yi çeşitli kullanım durumlarındaki gücü nedeniyle doğrudan GPT-4 ile GPT-3.5 arasına yerleştiririz.

Genel performans açısından GPT-3.5'ten daha iyi olduğunu kesin olarak söyleyemesek de, kendini kanıtlıyor. Her ne kadar belirsiz olsa da, bu model, daha iyi bilinen alternatiflerin yeteneklerini eşleştirmesi veya aşması nedeniyle ilgiyi hak ediyor. Falcon-180B modelini şu adreste deneyebilirsiniz: Sarılma Yüz (açık kaynaklı bir LLM platformu).

Meta AI'nın 70 milyar parametreli büyük dil modeli olan Llama 2, selefi Llama 1'i temel alıyor. Önde gelen modellerden daha küçük olmasına rağmen Llama 2, kıyaslamalarda ve gerçek dünya kullanımında halka açık çoğu açık kaynaklı LLM'den önemli ölçüde daha iyi performans gösteriyor. Falcon-180B bir istisna olacaktır.

Yeteneklerini ölçmek için Llama 2'yi GPT-4, GPT-3.5, Claude 2 ve PaLM 2'ye karşı test ettik. Şaşırtıcı olmayan bir şekilde GPT-4, neredeyse tüm parametrelerde Llama 2'yi geride bıraktı. Ancak Llama 2, çeşitli değerlendirmelerde GPT-3.5 ve PaLM 2'ye karşı üstünlük sağladı. Lama 2'nin PaLM 2'den üstün olduğunu iddia etmek yanlış olsa da, Lama 2, kodlama görevleri de dahil olmak üzere PaLM 2'yi şaşırtan birçok sorunu çözdü. Claude 2 ve GPT-3.5, bazı alanlarda Llama 2'yi geride bıraktı ancak yalnızca sınırlı sayıda görevde kesin olarak daha iyiydi.

Bu nedenle, en büyük tescilli modellerin yeteneklerini aşmamakla birlikte, açık kaynaklı Llama 2, ağırlık sınıfının üzerinde performans sergiliyor. Açık olarak temin edilebilen bir model için, seçkin değerlendirmelerde PaLM 2 gibi yapay zeka devleriyle rekabet eden etkileyici bir performans sergiliyor. Lama 2, açık kaynak dil modellerinin gelecekteki potansiyeline dair bir fikir veriyor.

Yapay Zeka Modelleri Arasındaki Performans Farkı Daralıyor

Yapay zeka ortamı baş döndürücü bir hızla gelişse de OpenAI'nin GPT-4'ü grubun lideri olmaya devam ediyor. Bununla birlikte, GPT-4 ölçek ve performans açısından rakipsiz kalırken Claude 2 gibi modeller, yeterli beceriyle daha küçük modellerin belirli alanlarda rekabet edebileceğini gösteriyor. Google'ın PaLM 2'si, bazı yüksek beklentilerin gerisinde kalmasına rağmen hala derin yetenekler sergiliyor. Falcon-180B, açık kaynak girişimlerinin, yeterli kaynaklar sağlandığında endüstri devleriyle omuz omuza ayakta durabileceğini kanıtlıyor.