ChatGPT, OpenAI'nin interneti hayrete düşüren, oyunun kurallarını değiştiren yapay zeka sohbet robotudur. Tüm yerleşik teknoloji trendlerine rağmen, ChatGPT'nin dijital hayatımızın neredeyse her alanına girmesi uzun sürmedi.
Çok az teknolojik yenilik, ChatGPT'nin bu kadar kısa sürede elde ettiği kadar ilgi topladı. Harika numaralar hiç bitmiyor gibi görünüyor; her gün yapabileceğini bilmediğimiz heyecan verici yeni şeyler öğreniyoruz.
Ancak ChatGPT yapabildiklerini nasıl yapabiliyor? ChatGPT nasıl çalışır?
ChatGPT Nasıl Oluşturuldu?
ChatGPT'nin nasıl çalıştığını anlamak için, kökenine ve son teknoloji yapay zeka sohbet robotunun arkasındaki beyne bakmaya değer.
Birincisi, ChatGPT ne kadar büyülü görünse de, tıpkı piyasadaki her değerli yazılım teknolojisi gibi, insan dehası tarafından inşa edildi. OpenAI, DALL-E, InstructGPT ve Codex gibi diğer güçlü AI araçlarının arkasındaki devrim niteliğindeki AI araştırma ve geliştirme şirketi ChatGPT'yi yarattı. daha önce cevaplamıştık
ChatGPT hakkında sahip olabileceğiniz bazı sorular, öyleyse bir göz atın.ChatGPT 2022'nin sonlarına doğru viral hale gelirken, ChatGPT'ye güç veren temel teknolojinin çoğu, çok daha az tanıtılsa da çok daha uzun süredir ortalıkta. ChatGPT modeli, GPT-3'ün (veya daha spesifik olarak GPT-3.5'in) üzerine inşa edilmiştir. GPT, "Generative Pre-trained Transformer 3" anlamına gelir.
GPT-3, GPT yapay zeka modelleri serisinin üçüncü yinelemesidir ve GPT-2 ve GPT'den önce gelir. GPT modellerinin önceki yinelemeleri de aynı derecede faydalıdır, ancak GPT-3 ve ince ayarlı GPT-3.5 yinelemesi çok daha güçlüdür. ChatGPT'nin yapabileceklerinin çoğu temeldeki GPT-3 teknolojisinden kaynaklanmaktadır.
GPT Nedir?
Böylece, ChatGPT'nin üçüncü nesil GPT modeli üzerine kurulduğunu belirledik. Ama yine de GPT nedir?
Kısaltmaları kolay anlaşılır ve teknik olmayan bir şekilde paketinden çıkararak başlayalım.
- GPT'deki "Üretken", doğal insan dili metni oluşturma yeteneğini temsil eder.
- "Önceden eğitilmiş", modelin zaten bazı sonlu veri kümelerinde eğitilmiş olduğu gerçeğini temsil eder. Tıpkı bir kitap ya da belki birkaç kitap okumuş olmanız gibi, onunla ilgili soruları yanıtlamanız istenmeden önce.
- "Transformer", GPT'ye güç veren temeldeki makine öğrenimi mimarisini temsil eder.
Şimdi, hepsini bir araya getirerek, Generative Pre-trained Transformer (GPT), önceden eğitilmiş bir dil modelidir. ile sunulduğunda insan dilinde metin oluşturmak amacıyla internetten alınan veriler kullanılarak eğitilmiştir. çabuk. GPT'nin eğitildiğini defalarca söyledik ama nasıl eğitildi?
ChatGPT Nasıl Eğitildi?
ChatGPT'nin kendisi sıfırdan eğitilmemiştir. Bunun yerine, GPT-3'ün ince ayarlı bir versiyonu olan GPT-3.5'in ince ayarlı bir versiyonudur. GPT-3 modeli, internetten toplanan büyük miktarda veri ile eğitildi. Wikipedia, Twitter ve Reddit'i düşünün; internetin her köşesinden kazınan veriler ve insan metniyle besleniyordu.
GPT eğitiminin nasıl çalıştığını merak ediyorsanız, GPT-3, denetimli öğrenme ve İnsan Geri Bildirimi Yoluyla Güçlendirmeli Öğrenim (RLHF) kombinasyonu kullanılarak eğitilmiştir. Denetimli öğrenme, modelin internetten kazınmış büyük bir metin veri kümesi üzerinde eğitildiği aşamadır. Takviyeli öğrenme aşaması, insanların hem insan benzeri hem de doğru olarak kabul edeceği şeylerle uyumlu daha iyi yanıtlar üretmek üzere eğitildiği yerdir.
Denetimli Öğrenme ile Eğitim
Denetimli ve pekiştirmeli öğrenmenin ChatGPT'ye nasıl uygulandığını daha iyi anlamak için, bir öğrenciye öğretmen tarafından kompozisyon yazmanın öğretildiği bir senaryo hayal edin. Denetimli öğrenme, öğretmenin öğrenciye okuması için yüzlerce makale vermesine eşdeğer olacaktır. Burada amaç, öğrencinin yüzlerce yazının üslubuna, söz dağarcığına, yapısına alışarak nasıl yazı yazılacağını öğrenmesidir.
Ancak bu yüzlerce deneme arasında iyiler ve kötüler olacaktır. Öğrenci hem iyi hem de kötü kopyalar üzerinde eğitildiğinden, bazen öğrenci kötü bir makale yazabilir çünkü öğrenci bir noktada kötü denemelerle de beslenmiştir. Bu, öğrenciden bir kompozisyon yazması istendiğinde, öğretmen için kabul edilebilir veya yeterince iyi olmayan bir kopya yazabileceği anlamına gelir. Takviyeli öğrenmenin devreye girdiği yer burasıdır.
Takviyeli Öğrenme ile Eğitim
Öğretmen, öğrencinin yüzlerce makale okuyarak makale yazmanın genel kurallarını anladığını belirledikten sonra, öğretmen öğrenciye sık sık makale yazma ödevi verir. Daha sonra öğretmen, öğrencilere neleri iyi yaptıklarını ve neleri geliştirebileceklerini söyleyerek kompozisyon yazma ödevi hakkında geri bildirimde bulunurdu. Öğrenci, sonraki makale yazma ödevine rehberlik etmek için geri bildirimi kullanır ve öğrencinin zaman içinde gelişmesine yardımcı olur.
Bu, GPT modeli eğitiminin takviyeli öğrenme aşamasına benzer. Model, internetten kazınmış büyük miktarda metinle beslendikten sonra soruları yanıtlayabilir. Ancak doğruluğu yeterince iyi olmayacaktır. İnsan eğitmenleri modele bir soru sorar ve her soru için hangi cevabın daha uygun olduğu konusunda geri bildirimde bulunur.
Model, soruları daha doğru ve daha çok bir insanın nasıl yanıtlayacağına benzer şekilde yanıtlama yeteneğini geliştirmek için geri bildirim kullanır. Bu, ChatGPT'nin hem tutarlı, ilgi çekici hem de genel olarak doğru olan kulağa insanca gelen yanıtlar üretebilmesini sağlar.
ChatGPT Soruları Nasıl Yanıtlayabilir?
Böylece, ChatGPT web sitesini ziyaret edip oturum açarsınız. ChatGPT'ye şunu sorarsınız: "Snoop Dogg tarzında bir rap şarkısı yaz." Snoop Dogg'un yazacaklarına çarpıcı biçimde benzeyen bir rap şarkısının sözleriyle yanıt veriyor. Bu nasıl mümkün olabilir?
ChatGPT'nin arkasındaki "sihir", eğitimine düzgün bir şekilde bağlıdır.
Fizik 101 ders kitabınızın her santimini okuduktan sonra, size yöneltilen herhangi bir soruyu yanıtlama şansınız yüksektir. Neden? Çünkü okudunuz ve öğrendiniz. ChatGPT ile aynı şey, öğrenir. Ve insan uygarlığının gösterdiği gibi, yeterli eğitimle hemen hemen her sorunu çözmek mümkündür.
Hayatınız boyunca muhtemelen yüzlerce kitabı yönetebilirken, ChatGPT veya GPT zaten internetin büyük bir bölümünü tüketmiştir. Bu çok büyük bir bilgi hazinesi. Orada, bir yerlerde, muhtemelen Snoop Dogg'un sayısız şarkısının sözleri vardır. Yani, tabii ki, ChatGPT onu tüketmiş (hatırlayın, önceden eğitilmiştir) ve Snoop Dogg'un sözlerindeki kalıpları tanımış olmalıdır. Daha sonra, Snoop Dogg'un yazacağına benzer bir şarkının sözlerini "tahmin etmek" için bu modelin "bilgisini" kullanırdı.
Buradaki vurgu "tahmin" üzerindedir. ChatGPT, soruları bizim insanlar gibi yanıtlamaz. Örneğin, "Portekiz'in başkenti neresidir?" Lizbon diyebilir ve bunu bir "gerçek" olarak söyleyebilirsiniz. Ancak ChatGPT, soruları %100 kesinlikle yanıtlamaz. Bunun yerine, eğitim veri setinde tükettiği verilere göre doğru cevabı tahmin etmeye çalışır.
ChatGPT'nin Soruları Yanıtlamaya Yaklaşımı
Yanıtları tahmin etme kavramını daha iyi anlamak için ChatGPT'yi bir cinayeti çözmekle görevli bir dedektif olarak hayal edin. Dedektife kanıtlar sunulur, ancak cinayeti kimin işlediğini ve nasıl olduğunu bilmezler. Ancak yeterli kanıtla dedektif, cinayetten kimin sorumlu olduğunu ve suçun nasıl işlendiğini büyük bir doğrulukla "tahmin edebilir".
İnternetten veri tükettikten sonra, ChatGPT orijinal verileri atar ve verilerden öğrendiği nöral bağlantıları veya kalıpları depolar. Bu bağlantılar veya modeller, ChatGPT'nin herhangi bir istemi yanıtlamaya çalıştığında analiz ettiği kanıt parçaları gibidir.
Yani teoride ChatGPT çok iyi bir dedektif gibidir. Bir cevabın gerçeklerinin ne olması gerektiğini kesin olarak bilmez, ancak etkileyici bir şekilde dener. doğruluk, en uygun şekilde yanıtlayacak insan dili metninin mantıksal bir dizisini tahmin etmek için soru. Sorularınıza bu şekilde yanıt alırsınız.
Bu cevaplardan bazılarının çok inandırıcı görünmesine rağmen son derece yanlış olmasının nedeni de budur.
ChatGPT: İnsan Gibi Cevaplar, Makine Gibi Düşünür
ChatGPT'nin altında yatan teknik ayrıntılar karmaşıktır. Ancak ilkel bir bakış açısıyla, tıpkı bizim insanlar gibi öğrenerek ve istendiğinde öğrendiklerini yeniden üreterek çalışır.
ChatGPT araştırma yoluyla geliştikçe, çalışma şekli değişebilir. Bununla birlikte, temel çalışma ilkeleri, en azından yıkıcı yeni bir teknoloji ortaya çıkana kadar bir süre daha aynı kalacaktır.