Web sitenizi içerik için kazıyan AI sohbet robotlarından endişe mi duyuyorsunuz? Neyse ki, bunu yapmalarını engelleyebilirsiniz. İşte nasıl.
Mevcut durumda, AI sohbet robotlarının web sitenizi kazımak ve içeriğini sizin izniniz olmadan kullanmak için ücretsiz bir lisansı vardır. İçeriğinizin bu tür araçlar tarafından kazınmasından mı endişeleniyorsunuz?
İyi haber şu ki, AI araçlarının web sitenize erişmesini durdurabilirsiniz, ancak bazı uyarılar var. Burada, web siteniz için robots.txt dosyasını kullanarak botları nasıl engelleyeceğinizi ve artılarını ve eksilerini gösteriyoruz.
AI Sohbet Robotları Web İçeriğinize Nasıl Erişir?
AI sohbet botları, bazıları açık kaynaklı ve herkese açık olan birden çok veri kümesi kullanılarak eğitilir. Örneğin GPT3, beş veri seti kullanılarak eğitildi. OpenAI tarafından yayınlanan bir araştırma makalesi:
- Common Crawl (eğitimde %60 ağırlık)
- WebText2 (egzersizde %22 ağırlık)
- Books1 (antrenmanda %8 ağırlık)
- Books2 (antrenmanda %8 ağırlık)
- Vikipedi (antrenmanda %3 ağırlık)
Ortak Tarama Google'ın arama algoritmasının web içeriğini tarama yöntemine benzer şekilde, 2008'den beri web sitelerinden toplanan petabaytlarca (binlerce TB) veri içerir. WebText2, Reddit gönderilerinden en az üç olumlu oyla bağlantılı yaklaşık 45 milyon web sayfası içeren, OpenAI tarafından oluşturulan bir veri kümesidir.
Dolayısıyla, ChatGPT söz konusu olduğunda, yapay zeka botu web sayfalarınıza doğrudan erişmiyor ve onları taramıyor - zaten henüz değil. Buna rağmen, OpenAI'ler ChatGPT tarafından barındırılan bir web tarayıcısının duyurusu bunun değişmek üzere olabileceği endişelerini dile getirdi.
Bu arada, web sitesi sahipleri, piyasaya daha fazla çıktıkça diğer AI sohbet botlarına göz kulak olmalıdır. Bard, bu alandaki diğer büyük isim ve hakkında çok az şey biliniyor. onu eğitmek için kullanılan veri kümeleri. Açıkçası, Google'ın arama botlarının sürekli olarak web sayfalarını taradığını biliyoruz, ancak bu, Bard'ın aynı verilere erişimi olduğu anlamına gelmez.
Bazı Web Sitesi Sahipleri Neden Endişeli?
Web sitesi sahipleri için en büyük endişe, ChatGPT, Bard ve Bing Chat gibi yapay zeka botlarının içeriklerinin değerini düşürmesidir. AI botları, yanıtlarını oluşturmak için mevcut içeriği kullanır, ancak aynı zamanda kullanıcıların orijinal kaynağa erişme ihtiyacını da azaltır. Bilgiye erişmek için web sitelerini ziyaret eden kullanıcılar yerine, ihtiyaç duydukları bilgilerin bir özetini oluşturmak için Google veya Bing'i alabilirler.
Aramada AI sohbet botları söz konusu olduğunda, web sitesi sahiplerinin en büyük endişesi trafik kaybetmektir. Bard durumunda, yapay zeka botu üretken yanıtlarında nadiren alıntılar içerir, kullanıcılara bilgilerini hangi sayfalardan aldığını söyler.
Dolayısıyla Bard, web sitesi ziyaretlerini yapay zeka yanıtlarıyla değiştirmenin yanı sıra, kullanıcı daha fazla bilgi istese bile kaynak web sitesinin trafik alma olasılığını neredeyse tamamen ortadan kaldırır. Bing Chat ise daha yaygın olarak bilgi kaynaklarına bağlanır.
Başka bir deyişle, mevcut üretken yapay zeka araçları filosu, içerik oluşturucuların çalışmalarını kullanmak içerik oluşturuculara olan ihtiyacı sistematik olarak değiştirmek. sonuçta sormak lazım bu, web sitesi sahiplerini ne kadar teşvik ediyor? içerik yayınlamaya devam etmek için. Ek olarak, web siteleri çalışmak için güvendikleri içeriği yayınlamayı bıraktığında AI botlarına ne olur?
Yapay Zeka Botlarını Web Sitenizden Nasıl Engellersiniz?
AI botlarının web içeriğinizi kullanmasını istemiyorsanız, sitenize erişmelerini engelleyebilirsiniz. robots.txt dosya. Ne yazık ki, her bir botu tek tek engellemeniz ve isimleriyle belirtmeniz gerekiyor.
Örneğin, Common Crawl'ın botunun adı CCBot'tur ve aşağıdaki kodu robots.txt dosyanıza ekleyerek onu engelleyebilirsiniz:
Kullanıcı aracısı: CCBot
İzin verme: /
Bu, Common Crawl'ın gelecekte web sitenizi taramasını engelleyecek, ancak önceki taramalardan toplanmış olan hiçbir veriyi kaldırmayacaktır.
Web içeriğinize erişen ChatGPT'nin yeni eklentilerinden endişe ediyorsanız, OpenAI zaten yayınladı botunu engelleme talimatları. Bu durumda, ChatGPT'nin botunun adı ChatGPT-User'dır ve aşağıdaki kodu robots.txt dosyanıza ekleyerek onu engelleyebilirsiniz:
Kullanıcı aracısı: ChatGPT-User
İzin verme: /
Arama motoru AI botlarının içeriğinizi taramasını engellemek tamamen başka bir sorundur. Google, kullandığı eğitim verileri konusunda son derece gizli olduğundan, hangi botları engellemeniz gerektiğini ve hatta botlarınızın sisteminizdeki komutlara uyup uymayacağını belirlemek imkansızdır. robots.txt dosya (çoğu tarayıcı bunu yapmaz).
Bu Yöntem Ne Kadar Etkili?
Cihazınızdaki AI botlarını engelleme robots.txt file şu anda mevcut olan en etkili yöntemdir, ancak özellikle güvenilir değildir.
İlk sorun, engellemek istediğiniz her botu belirtmeniz gerektiğidir, ancak piyasaya çıkan her AI botunu kim takip edebilir? Bir sonraki sorun, cihazınızdaki komutların robots.txt dosyası zorunlu olmayan talimatlardır. Common Crawl, ChatGPT ve diğer birçok bot bu komutlara saygı gösterse de birçok bot saygı göstermez.
Diğer büyük uyarı, yalnızca AI botlarının gelecekteki taramaları gerçekleştirmesini engelleyebilmenizdir. Önceki taramalardan veri kaldıramaz veya OpenAI gibi şirketlere verilerinizin tamamını silmeleri için istek gönderemezsiniz.
Ne yazık ki, tüm AI botlarının web sitenize erişmesini engellemenin basit bir yolu yoktur ve her bir botu manuel olarak engellemek neredeyse imkansızdır. Web'de dolaşan en son yapay zeka botlarına ayak uydursanız bile, hepsinin sizin sisteminizdeki komutlara uyacağının garantisi yoktur. robots.txt dosya.
Buradaki asıl soru, sonuçların çabaya değer olup olmadığıdır ve kısa cevap (neredeyse kesin olarak) hayırdır.
AI botlarını web sitenizden engellemenin de potansiyel dezavantajları vardır. Hepsinden önemlisi, Bard gibi araçların arama motoru pazarlamacılığı stratejinize fayda mı yoksa zarar mı verdiğini kanıtlamak için anlamlı veriler toplayamayacaksınız.
Evet, alıntı eksikliğinin zararlı olduğunu varsayabilirsiniz, ancak AI botlarının içeriğinize erişmesini engellediğiniz için yalnızca veri eksikliğiniz varsa tahminde bulunuyorsunuz. Google ilk tanıttığında benzer bir hikayeydi öne çıkan snippet'ler aramak.
Alakalı sorgular için Google, sonuç sayfasında web sayfalarından bir içerik pasajı göstererek kullanıcının sorusunu yanıtlar. Bu, kullanıcıların aradıkları yanıtı almak için bir web sitesine tıklamaları gerekmediği anlamına gelir. Bu, arama sorgularından trafik oluşturmaya güvenen web sitesi sahipleri ve SEO uzmanları arasında paniğe neden oldu.
Bununla birlikte, öne çıkan snippet'leri tetikleyen sorgu türleri genellikle "X nedir" veya "New York'ta hava nasıl" gibi düşük değerli aramalardır. Derinlemesine bilgi veya kapsamlı bir hava durumu raporu isteyen herkes yine de tıklayacaktır ve istemeyenler hiçbir zaman o kadar değerli olmamıştır.
Bunun üretken yapay zeka araçlarıyla benzer bir hikaye olduğunu görebilirsiniz, ancak bunu kanıtlamak için verilere ihtiyacınız olacak.
Hiçbir Şey İçin Acele Etme
Web sitesi sahipleri ve yayıncılar, anlaşılır bir şekilde yapay zeka teknolojisi konusunda endişeli ve botların içeriklerini anında yanıt oluşturmak için kullanma fikrinden bıkmış durumda. Ancak, karşı saldırıya geçmenin zamanı değil. AI teknolojisi hızlı hareket eden bir alandır ve her şey hızlı bir şekilde gelişmeye devam edecektir. İşlerin nasıl yürüdüğünü görmek ve yapay zekanın masaya getirdiği potansiyel tehditleri ve fırsatları analiz etmek için bu fırsatı kullanın.
Yerini almak için içerik oluşturucuların çalışmalarına dayanan mevcut sistem sürdürülebilir değil. Google ve OpenAI gibi şirketler yaklaşımlarını değiştirsin veya hükümetler yeni düzenlemeler getirsin, bir şeyler vermek zorundadır. Aynı zamanda, yapay zeka sohbet robotlarının içerik oluşturma üzerindeki olumsuz etkileri, web sitesi sahiplerinin ve içerik oluşturucuların kendi avantajlarına kullanabilecekleri şekilde giderek daha belirgin hale geliyor.