Arama motorları, kullanıcıların yeni bir bilgi aradıklarında bilgiye ulaştıkları ve sorguladıkları bir araçtır. Web sitelerimizin arama motorlarında üst sıralarda yer alması, belirlediğimiz anahtar kelimelerde gösterilmesi, sitelerimizin için en iyi trafik kaynaklardan birisidir. Arama motorları sitelerimizi tararken örümcek (web spider) ismi verilen botları kullanır. Botlar sitelerimizi taradıktan sonra arama motorları da web sitelerimizi dizinlerine eklerler.
robots.txt Robots Exclusion Protocol (Robots Dışlama Protokolü) ismi verilen, bu botları dışlamak için kullanılan bir metin dosyasıdır. Arama motorlarının botlarına, hangi içeriğin taranacağını veya taranmayacağını bu metin dosyası ile bildiririz.
Robots.txt dosyasında tüm botlara izin vermek için bir parametre yazılır ve genel kullanımı şu şekildedir;
User-agent: *
Bu girdi ile internet üzerinde çalışan tüm arama motorları botlarına izin vermiş oluruz.
Arama motorlarının botları web sitemizi ziyaret ettiğinde, web sitemizde ulaşılabilen tüm linkleri kendi dizinlerine eklerler. Web sitemizde arama motorlarının dizine eklenmemesini istediğimiz bir klasör veya link var ise aşağıdaki şekilde kapatabiliriz;
User-agent: *
Disallow: /gizli_klasor
Yukarıdaki ibare tüm arama motorlarına “gizli_klasor” adlı klasörün taranmamasını söyler. Robots.txt bir protokoldür, siz bunu yazdığınızda farklı arama motorları (mj12bot gibi) yine de klasörü dizinlerine ekleyebilir.
Arama motorlarının tümünü engellemek istediğimizde aşağıdaki ifadeyi robots.txt dosyamıza yazarız.
User-agent: *
Disallow: /
Belli bir arama motorunu engellemek istiyorsak, botun User-agent bilgisini robots.txt’ye yazarız.
User-agent: Googlebot
Disallow: /
veya
User-agent: bingbot
Disallow: /
robots.txt özellikle web tasarım ve web design işlemlerinde önemli bir yer tutar ve yanlış yapılandırılmış robots.txt arama motorlarında yer almamanıza yol açabilir.
Linux işletim sistemi, açık kaynak kodlu özgür bir işletim sistemidir. Günümüzde dünya genelinde pek çok…
Cloud ve dedicated sunucu , günümüzde işletmelerin bilişim altyapılarını yönetmek için en çok tercih ettikleri…
En iyi veri yedekleme yöntemleri, bulut hizmetleri, yedekleme yaparken dikkat edilmesi gerekenlere dair her şey.
VDS (Sanal Ayrılmış Sunucu) donanım sanallaştırmasıdır. Ayrılmış sunucu tamamen tek bir kullanıcıya tahsis edilmiş fiziksel…
Plesk üzerinde, panel lisansınız bittiyse veya ssh üzerinde mail işlemleri yapmak isterseniz, aşağıdaki cli komutlarını…
Bilgi teknolojilerinde, sunucular ve network cihazları her zaman en önemli araçlar arasındadır. Özellikle veri merkezleri…