Kategoriler
Blog

Sunucu kaynaklarını sömüren botlar / crawler

Daha önce kendi sunucusunda blog yazacak arkadaşlar için önerilerde bulunmuştum, kendi sunucunda bir WordPress blogu kurarak yazmak isteyen veya yazmayı sürdürenlerin bloglarının yazı, etiket, kategori vs. çoğaldıkça ve bunun yanında ziyaretçi trafiği yükseldikçe pişmiş tavuğun başına gelmeyenler onun başına gelebiildiğini bizzat yaşamış ve yazmıştım.

Buradaki blog maceramda 3 faklı hosting firması ile çalıştım, ilki Arif beyin Tescilet.net firması idi, bu firmada doğduk diyebilirim, ikincisi Dreamhost ve şu anda Seçkin Bey'in yönettiği Hostcin ile çalışıyoruz, mutluyuz.

Tecrübelerime dayanarak web sitelerinin sunucu kaynaklarını o siteye giriş yapan insanlardan çok crawler (indeksleyici) yani arama veya her neyse o şey onlara ait bot'lar sömürüyor diyebilirim.
Burada bu botları engellememiz tabiki mümkün diyebilirsiniz, fakat diğer taraftan Google, Yahoo, Msn gibi arama motorlarının botlarının veya sadece bloglar ve rss akışı olan siteler özel olan botları engeller isek bu sefer blogunuz oradan gelen ziyaretçilerden mahrum kalabilir. Engellemezseniz blogunuzun bulunduğu sunucunun tüm kaynakları bu botlar tarafından sömürülüp diğer okurlara ve hatta size blogsuz bir hayat kalabiliyor, ya hosting firmanız size "koçum bu seni kesmez daha büyük bir sunucu kirala" diyecek veya direk sizin blogunuzu veya hesabınızı kapatacaktır, o da olmadı bir diğer ihtimal siz ve ziyaretçiler dakikalarca blog sayfanızın açılışını beklemek zorunda kalacaksınız, çok keyifsiz bir hal alacaktır blog yazmak.

Sunucu kaynaklarını sömüren botlar crawler

Tüm bunları yazmamdaki neden benim gibi bu problemlerle karşılaşacak arkadaşlara faydalı olmak, benim tavsiyem Google, Yahoo ve Msn harici diğer tüm arama motoru crawler larını engellemeniz, sunucunuzda iyi bir araştırma yapın ve istatistiklerden blogunuza en çok bağlantı yapılan ip adreslerini kontrol edip o ip adreslerinin hangi firmaya veya hangi ülkeye ait olduklarını tespit edin. Örneğin ip adreslerini araştırdığımda bu bloga Türkiye'den çok ABD kaynaklı ip adreslerinin bağlandığını keşfedince çok şaşırmıştım, bu ip adresleri tahmin edeceğiniz gibi Feedburner, Google vb. servislere ait idi.

Ben çok fazla robot engelledim bunların arasında en berbat olanı aşağıdaki, sizde sunucunuzda bir yavaşlık hissediyorsanız hemen istatistikleri konrol edebiliyorsanız edin veya hosting hizmeti veren firmanıza bu konuda danışın;

Twiceler crawls from the following IP addresses:
38.99.13.121 38.99.44.101 64.1.215.166 208.36.144.6
38.99.13.122 38.99.44.102 64.1.215.162 208.36.144.7
38.99.13.123 38.99.44.103 64.1.215.163 208.36.144.8
38.99.13.124 38.99.44.104 64.1.215.164 208.36.144.9
38.99.13.125 38.99.44.105 64.1.215.165 208.36.144.10
38.99.13.126 38.99.44.106

Kısacası kendi sunucunuzda blog yazacaksanız eğer sunucu kaynaklarını crawler lara, botlara ve kötü niyetli makinelere yedirmeyin, dikkatli olun ve her şeyi hosting firmasına bırakmayın, çünkü onlar çalıştıkları diğer yüzlerce web sitesi gibi sizin blogunuzuda sıradan bir site gibi görecektir, pek fazla ilgilenmeyecektir, oysa sizin blogunuz size özel ve sizin için önemlidir.

WOLKANCA

Volkan Yılmaz

Volkan Yılmaz #SEO, Digital Marketing, Growth Hacking #wolkanca volkan@volkanyilmaz.com.tr

“Sunucu kaynaklarını sömüren botlar / crawler” için 13 yanıt

valla bu botlar gerçekten tehlikeli yazılımlar, bir de bazen sarhoş sarhoş dolaşanlar var onları anlamıyorum, bir yazıya defalarca istek gönderiyor ama ne spam yorum bırakıyor ne birşey en sonunda da barındırma şirketi kapatmıştı sitemi. aynı ddos saldırısı gibi ama bana kim saldırı yapmak istesin. bu arada benim sitemin kapanmasına sebep olan ip adresi 64.13.232.16
benim trafiğimin sadece %56'sı türkiye'den, geri kalanı amerika, arabistan, israil lübnan hepsi botlar, ama senin listendekiler ben de yok. 😀

koçum bu seni kesmez daha büyük bir sunucu kirala 🙂
arkadaşlar bu gün aldıgımız saldırılar sonunda birşey dikkatimi çekti sadece saldırılar sonucu tüketilen trafik 130 gb kadar dı 🙂 adamlar saldırarak zarar veremesede band ımızı sömürüyorlar geçen gün yaptıgım ayar sonucu google botları bile serverdan banlanmıştı hatta ben bile 🙂
şu robotlara bi güzellik yapacam ama biraz kafamı toparlamam lazım önce

sayın me-g konu içinde sorunuza cevap var ama tekrar yazayım.

tespit etmek için istatistiklere bakacaksını her sitenin logları vardır sunucularda bu kanunen de bir zorunluluk zaten. engellemek için de htaccess kurallarını kullanacaksınız.

ben bu konuda acemiyim. sunucu admin panelinden log lara tıkladığımda access, ssl, log, processed, gz kelimeleri içeren dosyalar var. (örn: access_log.processed.1.gz) dosya içindekiler zaten çok karışık. fakat ben "visitor maps and who's online" eklentisini kullanıyorum ve kayıtlı olmasada canlı olarak giren çıkan ip leri izleyebiliyorum. ip leri mi engellemem gerek? nasıl engelliyebilirim? (wordpress de bunun için birşey varmı) htaccess kuralları derken..? 🙂

ilginiz için teşekkürler.. saygılarımla..