GPTBot muhtemelen düşündüğünüz gibi değil.

Temel Çıkarımlar

  • OpenAI'nin GPTBot'u, genel web sitelerinden veri toplamak için tasarlanmış bir web tarayıcısıdır ve bu daha sonra GPT-4 ve ChatGPT gibi AI modellerini eğitmek ve geliştirmek için kullanılır.
  • İnternetteki en büyük web sitelerinden bazıları GPTBot'u engelliyor çünkü telif hakkıyla korunan içeriğe içerik oluşturuculara izin veya tazminat ödemeden erişiyor ve kullanıyor.
  • Web siteleri, GPTBot'u engellemeye çalışmak için robots.txt gibi araçları kullanabilir ancak OpenAI'nin bu kurallara uyacağına ve onlara telif hakkıyla korunan verilere erişim konusunda kontrol vereceğine dair hiçbir garanti yoktur.

Ağustos 2023'te, ChatGPT'yi geliştiren yapay zekanın güç merkezi OpenAI, web'de gezinmek ve veri toplamak için tasarlanmış bir web tarayıcısı olan GPTBot'u duyurdu.

Bu duyurudan kısa bir süre sonra internetteki en büyük web sitelerinden bazıları botun kendi web sitelerine erişimini engelledi. Ama neden? OpenAI'nin GPTBot'u nedir? Büyük web siteleri neden bundan korkuyor ve neden engellemeye çalışıyorlar?

instagram viewer

OpenAI'nin GPTBot'u Nedir?

GPTBot, OpenAI tarafından internette arama yapmak ve OpenAI'nin yapay zeka geliştirme hedefleri için bilgi toplamak amacıyla oluşturulan bir web tarayıcısıdır. Herkese açık web sitelerini tarayacak ve verileri OpenAI sunucularına geri gönderecek şekilde programlanmıştır. OpenAI daha sonra bu verileri giderek daha gelişmiş yapay zeka sistemleri oluşturmak amacıyla yapay zeka modellerini eğitmek ve geliştirmek için kullanıyor. GPT-4 gibi gelişmiş yapay zeka modelleri veya ChatGPT gibi alt ürünlerini oluşturmak için web tarayıcıları neredeyse vazgeçilmezdir.

Bir yapay zeka modelini eğitmek çok büyük miktarda veri gerektirir ve bu verileri toplamanın en etkili yollarından biri web tarayıcıları gibi araçları dağıtmaktır. Tarayıcılar sistematik olarak web'e göz atabilir, büyük hacimli web sayfalarını dizine eklemek için bağlantıları takip edebilir ve önceden tanımlanmış bir kalıpla eşleşen metin, görseller ve meta veriler gibi önemli verileri çıkarabilir.

Bu veriler daha sonra doğal dil işleme yeteneklerini veya görüntü oluşturma yeteneklerini eğitmek veya onları diğer yapay zeka görevleri için eğitmek için yapay zeka modellerine yapılandırılabilir ve beslenebilir. Başka bir deyişle, web tarayıcıları ChatGPT veya DALL-E gibi araçların yaptıklarını yapmasını mümkün kılan verileri toplar.

Web tarayıcıları yeni bir kavram değil. Bugün internette bulunan milyarlarca web sitesini tarayan muhtemelen milyonlarca kişi vardır. Ve en azından 90'ların başından beri ortalıktalar. GPTBot, OpenAI'nin sahip olduğu tarayıcılardan yalnızca bir tanesidir. Peki bu özel web tarayıcısıyla ilgili tartışmanın nedeni nedir?

Büyük Teknoloji Siteleri GPTBot'u Neden Engelliyor?

Buna göre İşletme İçeriğiİnternet'teki en büyük web sitelerinden bazıları, web sitelerinde OpenAI'nin tarayıcısını aktif olarak engelliyor. Öyleyse, eğer GPTBot'un nihai hedefi yapay zeka gelişimini ilerletmekse, neden bazıları yapay zekadan şu ya da bu şekilde faydalanmış olan internetteki en büyük sitelerden bazıları buna karşı çıkıyor?

İşte olay şu. Üretken yapay zeka teknolojilerinin 2022'de yeniden canlanmasından bu yana, yapay zeka şirketlerinin üretim yapma hakları konusunda çok sayıda tartışma yaşandı. Önemli bir kısmı yasal olarak korunan internet kaynaklı verileri neredeyse sınırsız olarak kullanın. telif hakkı. Bu şirketlerin verileri kendi çıkarları için nasıl toplayıp kullanacaklarını belirleyen açık bir yasa yok.

Temel olarak, GPTBot gibi tarayıcılar web'i tarar, insanların metin, resim veya diğer biçimlerdeki yaratıcı çalışmalarını yakalar. herhangi bir izin, lisans almadan veya orijinaline karşılık bedel ödemeden medyayı ticari amaçlarla kullanamazsınız. yaratıcılar.

Dışarısı vahşi bir batıda ve yapay zeka şirketleri ellerine geçen her şeyi ele geçiriyor. Quora, CNN, New York Times, Business Insider ve Amazon gibi büyük web siteleri, telif hakkıyla korunan içerik bu tarayıcılar tarafından toplanıyor, böylece OpenAI bundan kendi başlarına mali fayda elde edebiliyor masraf.

Bu sitelerin, web tarayıcılarını engellemek için onlarca yıllık bir yöntem olan "robots.txt"yi kullanmalarının nedeni budur. Buna göre OpenAI, GPTBot, web tarayıcılarına bir sitede nasıl davranmaları gerektiğini söyleyen küçük bir metin dosyası olan robots.txt dosyasında yerleşik kurallara dayalı olarak web sitelerini taramak veya taramaktan kaçınmak için verilen talimatlara uyacaktır. Kendinize ait bir siteniz varsa ve GPTBot'un verilerinizi ele geçirmesini engellemek istiyorsanız, bunu şu şekilde yapabilirsiniz: OpenAI tarayıcılarının web sitenizi kazımasını engelleyin.

Web Siteleri Gerçekten GPTBot'u Durdurabilir mi?

GPTBot gibi tarayıcılar, gerekli olan büyük miktarda veriyi toplamak için vazgeçilmezdir. Gelişmiş yapay zeka sistemlerini eğitirken, telif hakkı ve adil kullanımla ilgili olarak çözülemeyecek geçerli endişeler vardır. görmezden gelindi.

Elbette, buna karşı korunmak için kullanılabilecek robots.txt gibi basit araçlar var, ancak GPTBot'un bu dosyadaki talimatlara uyup uymaması tamamen OpenAI'nin takdirindedir. Bunu yapacaklarına dair hiçbir garanti yok ve bunu yapıp yapmadıklarını anlamanın anında kusursuz bir yolu da yok. GPTBot'u telif hakkıyla korunan verilerden uzak tutma mücadelesinde OpenAI en azından şimdilik asları elinde tutuyor.