İlan
İnternette bir şey yayınlandığında, sonsuza kadar yayınlanmış olduğu fikrine inanıyor musunuz? Bugün bu efsaneyi ortadan kaldıracağız.
Gerçek şu ki, çoğu durumda bilgiyi internetten silmek oldukça mümkündür. Elbette, arama yaptığınızda silinen web sayfalarının bir kaydı vardır. Geri Dönüş Makinesi, sağ? Evet, kesinlikle. Wayback Machine'de yıllarca geriye giden web sayfalarının kayıtları var - web sayfası artık bulunmadığından Google aramasıyla bulamayacağınız sayfalar. Birisi sildi veya web sitesi kapatıldı.
Yani, etrafta dolaşmak yok, değil mi? Bilgi sonsuza dek İnternet taşa kazınacak, nesiller görecek mi? Tam olarak değil.
Gerçek şu ki, bir haber web sitesinden veya blogdan bir virüs gibi diğerine çoğalan büyük haberleri silmek zor veya imkansız olsa da, bir web sayfasını veya birkaç web sayfasını tüm varoluş kayıtlarından tamamen silmek oldukça kolaydır - bu sayfayı hem arama motorları hem de Geri Dönüş Makinesi Yeni Wayback Makinesi, İnternet Zamanında Görsel Olarak Geri Dönmenizi Sağlıyor 2001 yılında Wayback Machine lansmanından bu yana, site sahipleri Alexa tabanlı arka ucu atmaya ve kendi açık kaynak kodlarıyla yeniden tasarlamaya karar verdiler. İle testler yaptıktan sonra ... Daha fazla oku . Elbette bir şey var, ama buna ulaşacağız.
Blog Sayfalarını İnternetten Kaldırmanın 3 Yolu
İlk yöntem, web sitesi sahiplerinin çoğunun kullandığı yöntemdir, çünkü daha iyisini bilmiyorlar - sadece web sayfalarını silmek. Bu, sitenizde yinelenen içeriğiniz olduğunu fark ettiğiniz veya arama sonuçlarında görünmesini istemediğiniz bir sayfanız olduğu için olabilir.
Sayfayı Silin
Sayfaları web sitenizden tamamen silmeyle ilgili sorun, sayfayı sitenizde zaten oluşturduğunuzdan net olarak, kendi sitenizden bağlantılar ve diğer sitelerden söz konusu siteye giden harici bağlantılar olması muhtemeldir. sayfa. Sildiğinizde, Google söz konusu sayfanızı hemen eksik sayfa olarak tanır.
Bu nedenle, sayfanızı silerken yalnızca kendiniz için "Bulunamadı" tarama hatalarıyla ilgili bir sorun oluşturmadınız, aynı zamanda sayfaya bağlanan herkes için de bir sorun yarattınız. Genellikle, bu harici bağlantılardan birinden sitenize gelen kullanıcılar 404 sayfanızı görür. kullanıcılara faydalı önerilerde bulunmak için Google’ın özel 404 kodu gibi bir şey kullanırsanız veya alternatifler. Ancak, mevcut gelen bağlantılar için bu 404'lerin tümünü tekmelemeden sayfaları arama sonuçlarından silmenin daha zarif yolları olabileceğini düşünüyor musunuz?
Peki, var.
Bir Sayfayı Google Arama Sonuçlarından Kaldırma
Her şeyden önce, Google arama sonuçlarından kaldırmak istediğiniz web sayfası kendi sitenizdeki bir sayfa değilse, yasal nedenler olmadıkça veya site kişisel bilgilerinizi sizin tarafınızdan çevrimiçi olarak yayınlamıyorsa, şansınız kalmaz izni. Bu durumda, Google’ın kaldırma sorun gidericisi sayfanın arama sonuçlarından kaldırılması için istek göndermek. Geçerli bir vakanız varsa, sayfanın kaldırılmasında bir miktar başarı elde edebilirsiniz - elbette daha da fazla başarı elde edebilirsiniz web sitesi sahibiyle iletişim kurma İnternette Yanlış Kişisel Bilgileri KaldırmaÇevrimiçi gizlilik artık garanti edilmiyor. Bir web sitesini nasıl bildireceğinizi ve kişisel bilgileri internetten nasıl kaldıracağınızı öğrenin. Daha fazla oku 2009'da nasıl yapılacağını açıkladım.
Şimdi, arama sonuçlarından kaldırmak istediğiniz sayfa kendi sitenizdeyse, şanslısınız demektir. Tek yapmanız gereken bir robots.txt dosyasını açın ve arama sonuçlarında istemediğiniz sayfaya veya dizine eklenmesini istemediğiniz içeriğin bulunduğu dizinin tamamına izin vermediğinizden emin olun. Tek bir sayfayı engelleme şuna benzer.
Kullanıcı aracısı: * İzin verme: /my-deleted-article-that-i-want-removed.html
Botların sitenizin tüm dizinlerini taramasını aşağıdaki gibi engelleyebilirsiniz.
Kullanıcı aracısı: * İzin verme: / kişisel öğeler hakkında içerik /
Google'ın mükemmel bir Destek sayfası daha önce hiç oluşturmadıysanız bir robots.txt dosyası oluşturmanıza yardımcı olabilir. Son zamanlarda hakkında bir makalede açıkladığım gibi, bu çok iyi çalışıyor sendikasyon anlaşmalarını yapılandırma Sendikasyon Teklifleri Nasıl Anlaşılır ve Arama Sıralamanızı Nasıl KorurSendikasyon bugünlerde tüm öfke. Ancak aniden sendikasyon ortağının, başlangıçta yazdığınız bir hikaye için arama sonuçlarında sizden daha yukarıda listelendiğini fark edebilirsiniz! Arama sıralamalarınızı koruyun. Daha fazla oku size zarar vermemeleri için (sendikasyon ortaklarından sendikasyon yaptığınız sayfaların dizine eklenmesine izin vermemelerini isteyin). Kendi sendikasyon iş ortağım bunu kabul ettiğinde, blogumdan içerik kopyalanan sayfalar arama listelerinden tamamen kayboldu.
Başlığımızı listelediği sayfa için yalnızca ana web sitesi üçüncü sırada geliyor, ancak blogum şimdi hem birinci hem de ikinci noktalarda listeleniyor; neredeyse imkansız olacak bir şey, daha yüksek otoriteye sahip bir web sitesinin kopyalanan sayfayı dizine ekledi.
Pek çok insanın farkına varmadığı şey, bunun İnternet Arşivi (Wayback Machine) ile de başarılmasıdır. Bunun için robots.txt dosyanıza eklemeniz gereken satırlar.
Kullanıcı aracısı: ia_archiver. İzin verme: / örnek kategorisi /
Bu örnekte, İnternet Arşivinden sitemdeki örnek kategori alt dizinindeki herhangi bir şeyi Wayback Machine'den kaldırmasını söylüyorum. İnternet arşivi, bunun Dışlama yardım sayfalarında nasıl yapılacağını açıklar. Burası aynı zamanda “İnternet Arşivi, yazarları koleksiyonunda materyalleri istemeyen web sitelerine veya diğer İnternet belgelerine erişim sunmakla ilgilenmiyor”.
Bu, İnternet'e gönderilen herhangi bir şeyin tüm sonsuzluk için arşive taşındığı yaygın olarak kabul edilen inancın aksine uçar. Hayır - içeriğin sahibi olan web yöneticileri, robots.txt yaklaşımını kullanarak içeriği özellikle arşivden çıkarabilir.
Meta Etiketleri Olan Tek Bir Sayfayı Kaldırma
Google Arama sonuçlarından kaldırmak istediğiniz yalnızca birkaç ayrı sayfanız varsa, aslında robots.txt yaklaşımını kullanmanız gerekmez hiç bir şekilde tek tek sayfalara doğru "robotlar" meta etiketini ekleyebilir ve robotlara tüm bağlantıyı dizine eklememelerini veya izlememelerini söyleyebilirsiniz. sayfa.
Robotların sayfayı dizine eklemesini durdurmak için yukarıdaki "robotlar" meta kodunu kullanabilir veya özellikle Google robotuna söyleyebilirsiniz. dizine eklenmez, böylece sayfa yalnızca Google arama sonuçlarından kaldırılır ve diğer arama robotları yine de sayfaya erişebilir içeriği.
Robotların sayfa ile ne yaptığını ve sayfanın listelenip listelenmeyeceğini nasıl yönetmek istediğiniz tamamen size bağlıdır. Sadece birkaç bireysel sayfa için bu daha iyi bir yaklaşım olabilir. Tüm bir içerik dizinini kaldırmak için robots.txt yöntemiyle devam edin.
İçeriği “Kaldırma” Fikri
Bu tür “İnternetten içerik silme” kavramını kafasına çevirir. Teknik olarak, sitenizdeki bir sayfaya olan tüm kendi bağlantılarınızı kaldırırsanız ve bunu Google Arama'dan ve İnternet Arşivi robots.txt tekniğini kullanarak, sayfa tüm amaç ve amaçlarla İnternet'ten “silinmiştir”. Güzel olan şey, sayfaya mevcut bağlantılar varsa, bu bağlantılar yine de çalışır ve bu ziyaretçiler için 404 hataları tetiklemezsiniz.
Sitenizin İnternet'teki mevcut bağlantı popülaritesini tamamen bozmadan içeriği İnternet'ten kaldırmaya yönelik daha “yumuşak” bir yaklaşımdır. Sonunda, arama motorları ve İnternet Arşivi tarafından hangi içeriğin toplandığını yönetme konusunda size nasıl karar vereceksiniz insanların çevrimiçi olarak yayınlanan şeylerin ömrü hakkında söylediklerine rağmen, gerçekten tamamen sizin içinizde olduğunu unutmayın. kontrol.
Ryan Elektrik Mühendisliği lisans derecesine sahiptir. 13 yıl otomasyon mühendisliği, 5 yıl BT'de çalıştı ve şu anda bir Uygulama Mühendisi. MakeUseOf'un eski bir Genel Yayın Yönetmeni, Veri Görselleştirme üzerine ulusal konferanslarda konuştu ve ulusal TV ve radyoda yer aldı.