當前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

網(wǎng)站文章被采集?嘗試使用這幾種方法進行最大防護

 2021-06-26 13:31  來源: A5專欄   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

站長,在做網(wǎng)站的時候,時有發(fā)生網(wǎng)站內(nèi)容被采集的情況,特別是現(xiàn)在這種采集成本極低的環(huán)境,只要稍微會一點代碼,就可以制作采集模塊。即便不會代碼,也可以花費低廉的價格去找人代寫。

新站上線,勤勤懇懇的做著原創(chuàng)內(nèi)容,卻被突如其來的采集工具采集了整站。換誰也受不了。

并且,新站開始是沒有權(quán)重的,即使你發(fā)布的是你的原創(chuàng),權(quán)重高的網(wǎng)站采集了你的文章并發(fā)布,蜘蛛爬取網(wǎng)頁,也優(yōu)先收錄了權(quán)重高的網(wǎng)頁,并且認為這是他的原創(chuàng)文章。

這就是典型的為他人做嫁衣。

雖然現(xiàn)在文章也有版權(quán)保護,但是在面對采集站點而言,又有什么用呢,既然他敢采集,就不怕你去維權(quán),而且當下維權(quán)的成本又高。

以前熊掌號有一個原創(chuàng)保護功能,但是因為百度業(yè)務原因,給下線了?,F(xiàn)在的原創(chuàng)真的無法保護。

所以今天五車二為大家分享幾方法,最大限度的保證自己的創(chuàng)作不被采集。

內(nèi)容優(yōu)化篇

1,寫作的時候,在你的作品中插入相關的品牌詞。如:“XXX網(wǎng)小編”,“XXX提醒大家”……或者使用替代詞,百度知道替代為Baidu知道,擺渡知道,百度了解等。為文章打上標記,以便在后期的時候反饋作為證據(jù)使用。

當然采集軟件也有過濾功能,所以可以每篇文章都用不同的詞匯。雖然累一點,不過有些采集者比較不傷心,總會漏掉一些細節(jié)。

2,圖片水印處理,采集工具是無法識別圖片并過濾的。原創(chuàng)文章的用圖,可以使用水印。即便采集了,他如果要處理,也要重新編輯。

更新技巧(技術(shù)層)篇

采集者,會讓工具通過網(wǎng)站的URL來識別最新文章。只要我不把最新的文章發(fā)布出去,采集工具就無法獲取到相關代碼。只要我的文章先行收錄,他在做采集,也會被搜索引擎判定是復制轉(zhuǎn)載,而非原創(chuàng)。

1,隱藏式更新(延時) ,自己站內(nèi)的蜘蛛會爬取站內(nèi)的所有URL連接,采集工具不能。所以只要我們將一個頁面隱藏而不放進某一個分類,等待收錄之后在移入分類。就可以避免第一時間被采集。

2,程序限制頁面訪問(多少時間只能訪問多少個) ,機器的速度比人快,一個人不可能在3分鐘內(nèi)訪問每一個分類的每一篇文章,并且每個文章都打開。(注意:某些采集工具是可以做到延時采集的,因為他也可以設定幾分鐘訪問一篇。但這需要成本。

3,限制面向用戶的頁面展示 ,比如,我只給你展示1頁,第二頁進行驗證。

4,驗證機制 ,其實有些網(wǎng)站,是可以做到當用戶不正常訪問的時候就彈出驗證碼框來進行人機校驗,也可以規(guī)避采集工具的采集。

5,鏈接盡量不要有序化 ,采集工具的原來,是通過源碼來進行URL識別,一些有序的URL鏈接對于采集者非常喜歡,因為不麻煩,可以采集整站數(shù)據(jù)。星空站長網(wǎng),就是xingkongweb.com/1.html,工具甚至可以不進入分類,而直接采集文章1-99999.html即可。所以這是一種不好的URL設計習慣。

百度站長工具篇

百度站長工具可以手動提交鏈接。

結(jié)合上面的【技術(shù)層】篇章中的第1點,我們先延時更新,把頁面隱藏起來。

然后利用百度的站長工具,收錄提交,提交了我們原創(chuàng)文章的URL,然后靜待百度收錄之后。

再將文章更新到首頁或分類。

以上就是星空站長網(wǎng)(https://www.xingkongweb.com)五車二給各位站長朋友分享的防護經(jīng)驗,希望對大家有幫助,并且讓創(chuàng)作越來越有動力。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
網(wǎng)站采集

相關文章

熱門排行

信息推薦