6月7日消息,近日百度悄然上線了極光算法,該算法推出了“網(wǎng)站落地頁時(shí)間因子”的概念,其實(shí)就是網(wǎng)站內(nèi)容的發(fā)布和更新時(shí)間。通過固定格式的代碼就可以提交內(nèi)容發(fā)布的時(shí)間。并且優(yōu)質(zhì)、時(shí)效性更強(qiáng)的內(nèi)容排序會(huì)靠前,但具體效果如何還有待于觀察。該算法會(huì)作用于所有網(wǎng)站類似,包括論壇、問答、新聞資訊等。早在2013年百度官方就推出了原創(chuàng)星火計(jì)劃,為了鼓勵(lì)優(yōu)質(zhì)的原創(chuàng)內(nèi)容,不過打擊抄襲、采集的垃圾內(nèi)容并不容易。
加入時(shí)間因子判斷內(nèi)容質(zhì)量
對于百度搜索引擎來說,如何判斷內(nèi)容是否為某站的原創(chuàng),這一點(diǎn)從技術(shù)層面來說很困難?;ヂ?lián)網(wǎng)上的大大小小的網(wǎng)站數(shù)量巨大,而轉(zhuǎn)載和抄襲的內(nèi)容也很多。如果加入了“時(shí)間因子”的因素,那么就可以通過時(shí)間指標(biāo)來判斷內(nèi)容是否為原創(chuàng)。不過前提是百度蜘蛛能夠爬行、記錄這些頁面,否則一些權(quán)重高的網(wǎng)站轉(zhuǎn)載新站上的內(nèi)容,通常百度會(huì)先收錄權(quán)重高的頁面。當(dāng)然新站的內(nèi)容就很難再被收錄了,并且還會(huì)被誤認(rèn)為轉(zhuǎn)載或抄襲權(quán)重高的網(wǎng)站。
杜絕內(nèi)容轉(zhuǎn)載抄襲技術(shù)難題
要完全杜絕網(wǎng)站內(nèi)容被抄襲或轉(zhuǎn)載,操作起來難度很大,可以說是幾乎不可能的。此次百度推出極光算法,應(yīng)該從技術(shù)層面上去處罰那些頻繁抄襲、轉(zhuǎn)載他人的網(wǎng)站。如果在頁面上提交了時(shí)間因子,那么基本可以斷定該內(nèi)容是否為首發(fā)。但是這個(gè)數(shù)據(jù)量非常大,需要搜索引擎蜘蛛的爬行效率很高,否則很多小站上的內(nèi)容不能被索引和記錄。另外,讓網(wǎng)站運(yùn)營者可以提交申訴頁面,如果發(fā)現(xiàn)某個(gè)權(quán)重高的網(wǎng)站轉(zhuǎn)載了自己的內(nèi)容,而且這些內(nèi)容也被百度收錄了,那么可以申請刪除收錄記錄。
內(nèi)容和更新頻率會(huì)更重要嗎
影響百度搜索排序的因素很多,百度早已取消了網(wǎng)頁快照,如今新算法強(qiáng)調(diào)的是內(nèi)容時(shí)間和更新頻率?;蛟S內(nèi)容和更新頻率在排名因素中占的比例會(huì)提高。內(nèi)容的重要性無可厚非,但更新頻率也同樣重要,一個(gè)頁面或網(wǎng)站長期無更新,搜索引擎蜘蛛肯定不會(huì)光顧。百度每次推出新算法都會(huì)有針對性,只是互聯(lián)網(wǎng)數(shù)據(jù)量龐大,所以百度算法也難以做到百分之百有效,難免就有誤傷或漏網(wǎng)的站點(diǎn)。不過這個(gè)比例不能很大,否則新算法就是很失敗的。
新站或小站的權(quán)重遠(yuǎn)不及一些門戶類型的大站,所以在搜索引擎面前肯定處于劣勢位置。但大站若抄襲或轉(zhuǎn)載小站上的內(nèi)容就屬于侵權(quán),搜索引擎應(yīng)該一視同仁的對待。
本文由 石景山杰飛電腦培訓(xùn) http://www.ps868.com/ 站長原創(chuàng) 轉(zhuǎn)載保留
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!