域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
做網(wǎng)站有大半年了,今天第一次寫這類文章。至于為什么要寫這篇文章,是因?yàn)?009年下半年以來(lái)一直到現(xiàn)在,百度經(jīng)常不正常,導(dǎo)致很多站長(zhǎng)的網(wǎng)站出現(xiàn)快照不更新,快照回檔,甚至被K的現(xiàn)象。所以在A5論壇和seowhy論壇上經(jīng)??吹接行┱鹃L(zhǎng)說(shuō),希望百度能盡快更新自己的快照。其實(shí)快照第二天是否更新,不一定要寄希望于他人,只要自己查查web日志,就能知道。也就是我今天要跟大家說(shuō)的話題。
下面我就簡(jiǎn)單的談一下關(guān)于百度蜘蛛訪問(wèn)網(wǎng)站后,web日志所返回的狀態(tài)碼與首頁(yè)的百度快照是否會(huì)更新之間的關(guān)系,所談到的都是小弟大半年以來(lái)每天觀察自己網(wǎng)站的web日志里百度蜘蛛的爬行痕跡所摸索出來(lái)的規(guī)律,希望對(duì)大家有些幫助。
大家可以嘗試著打開web日志的.log文件,web日志的默認(rèn)路徑是C:\WINDOWS\system32\LogFiles\W3SVC1 ,用虛擬主機(jī)的朋友可以找空間商索要。打開文件夾下的.log文件,搜索百度蜘蛛,百度蜘蛛的名字為baiduspider。然后一直Enter,可以查出百度蜘蛛訪問(wèn)網(wǎng)站后留下的所有足跡。在查找中,注意一下百度蜘蛛名字前面的IP,還有整行最后的狀態(tài)碼。
一般情況下,蜘蛛抓取網(wǎng)頁(yè)如果返回200 0 0代碼,則表示該網(wǎng)頁(yè)已經(jīng)成功編入索引,200 0 64是指索引數(shù)據(jù)庫(kù)已經(jīng)存在,沒有發(fā)現(xiàn)網(wǎng)頁(yè)有更新的內(nèi)容,不需要重新索引的意思。304 0 0是指原來(lái)緩沖的文檔還可以繼續(xù)使用,跟200 0 64意思應(yīng)該差不多吧。 (值得一提的是:200 0 64并不是網(wǎng)上很多人說(shuō)的會(huì)被K站或降權(quán),是正?,F(xiàn)象,動(dòng)態(tài)網(wǎng)站抓取的時(shí)候大多數(shù)出現(xiàn)200 0 0,即便是網(wǎng)站沒有更新。)
在說(shuō)一下蜘蛛IP,我的web日志里查到的蜘蛛IP一般都是220.181.7.*和123.125.66.*比較多,還有一個(gè)61.135.162.*,這三個(gè)段的IP是抓取網(wǎng)頁(yè)的,123.125.68.*這個(gè)段的是百度沙盒蜘蛛IP。61.135.168.*這個(gè)段的蜘蛛是抓取圖片的。不過(guò)百度蜘蛛應(yīng)該還有很多,可能是按照網(wǎng)站的地區(qū)和線路發(fā)放蜘蛛的吧。具體情況還要具體對(duì)待。不過(guò)有一點(diǎn)可以肯定的是,在網(wǎng)站沒被降權(quán)的情況下,只要有兩個(gè)IP段的蜘蛛(比如我的日志里的220.181.7.*和123.125.66.*這兩個(gè)段)都抓取了網(wǎng)站首頁(yè)且返回的狀態(tài)碼是200 0 0,那就不用每天等到零晨四點(diǎn)看百度更新首頁(yè)的快照了(我以前經(jīng)常等到凌晨四五點(diǎn)才睡覺,呵呵,不過(guò)現(xiàn)在一般都是在早上六七點(diǎn)才更新快照)。
一般百度首頁(yè)快照比較慢、網(wǎng)站權(quán)重比較低或者被降權(quán)的網(wǎng)站,蜘蛛一般都是返回的200 0 64的狀態(tài)碼。我有一個(gè)被K過(guò)的網(wǎng)站,當(dāng)時(shí)每天都只有123.125.68.*這個(gè)段的IP,且狀態(tài)碼都是返回的200 0 0。
本文由熱血傳奇* 站長(zhǎng)原創(chuàng),首發(fā)于admin5,轉(zhuǎn)載請(qǐng)保留鏈接,謝謝!
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!