筆者之前發(fā)表了一篇《巧用301重定向?qū)?04錯誤轉(zhuǎn)化為網(wǎng)站外鏈》的文章,談了一下如何通過301重定向的方式,將從外部得到錯誤URL轉(zhuǎn)化為可訪問的URL,從而達(dá)到傳遞權(quán)重的文章。
今天在站長網(wǎng)看到了一篇《淺談利用301重定向?qū)?04頁面轉(zhuǎn)移成自己外鏈的危害》,反駁了我之前那篇文章中的觀點(diǎn)。我覺得非常好,SEO行業(yè)正應(yīng)該有這種質(zhì)疑的精神和獨(dú)立思考的能力。
仔細(xì)拜讀了文章,發(fā)現(xiàn)作者誤解了我的意思。所以再寫一篇文章澄清一下其中的觀點(diǎn),以及介紹一下301重定向的作用。
1.首先我明確兩個在《使用301重定向?qū)?04錯誤轉(zhuǎn)化為網(wǎng)站外鏈》一文中的思路:
2.文章所講述的是將404錯誤URL,通過301重定向回到原文的URL。這點(diǎn)需要說明,我沒有在文章提到任何301到首頁或者其他頁面的意思 文章中的例子,講述的是從外部(B網(wǎng)站)鏈入自身網(wǎng)站(A網(wǎng)站),在過程中有可能出現(xiàn)的URL錯誤拼寫、鏈接添加錯誤甚至故意產(chǎn)生錯誤URL的行為。而不是A網(wǎng)站自身出現(xiàn)的404錯誤
原文一直在那里,有質(zhì)疑的朋友可以再仔細(xì)閱讀一下。以下我再反駁一下這位朋友的觀點(diǎn)(藍(lán)字是有反駁意見朋友的觀點(diǎn)):
反駁第一段
“原作者,將外鏈指向中的404錯誤歸結(jié)于是網(wǎng)站外部造成的,這句話無可厚非,但是這種404錯誤的出現(xiàn),也是由于自己網(wǎng)站程序所決定的,既然出現(xiàn)了就沒有辦法逃避,就比如在站長網(wǎng)上頁面也可以出現(xiàn)很多個這樣活著那樣的后綴404頁面,直接在后面加入1.html,2.html,就可以了,如此而已,但是如果有人處心積慮的用外鏈的形式來進(jìn)行鏈接這樣的網(wǎng)頁,那也是為網(wǎng)站帶來鏈接,如此而已,頂多產(chǎn)生一個404頁面,而不會有其他。”
網(wǎng)站出現(xiàn)404錯誤,不一定是網(wǎng)站內(nèi)部程序的問題。蜘蛛通過外部網(wǎng)站(以B網(wǎng)站為例)一個錯誤的URL爬行到自身網(wǎng)站(以A網(wǎng)站為例),同樣會造成404錯誤,即:錯誤的URL導(dǎo)致了錯誤的頁面。
蜘蛛是不會管你鏈接URL存在于網(wǎng)站內(nèi)部還是外部,只要在順著URL爬行的過程中出現(xiàn)了“頁面不存在”的情況,就會記錄一個404錯誤。
這點(diǎn)我們在谷歌管理員工具的“運(yùn)行狀況” — “抓取錯誤” – “找不到” 一欄中可以明確的看到。404錯誤被谷歌分為“在sitemap中” (內(nèi)因)和 “鏈接到您網(wǎng)站網(wǎng)頁的域” (外因)兩項(xiàng)。
顧名思義,其中“鏈接到您網(wǎng)站網(wǎng)頁的域”是指從B網(wǎng)站鏈接到A網(wǎng)站的URL。
反駁第二段
“而原作者的意思是如何把握這一方面的權(quán)重,想要將這種外鏈的權(quán)重直接倒回去,而不是放掉,這里呢,筆者也有自己的觀點(diǎn),本身這種外鏈“;,這種外鏈所鏈接過來的就是404頁面,如果你將這些頁面301掉,這種情況就和網(wǎng)站中出現(xiàn)大量的404頁面,然后直接將404頁面301到一個頁面的情況是一樣的;那么如果你的網(wǎng)站有404頁面,那么為了防止這些權(quán)重的流失,難道將這些頁面全部301到首頁?這完全就是不符合搜索引擎的要求,如果想知道清楚的話,就直接百度一下“404頁面301到首頁的危害就”就可以明白更多。”
首先,對于“自身行為”還是“外部行為”,顯然搜索引擎有著明確的區(qū)分。拿鏈接建設(shè)來說,內(nèi)鏈和外鏈在權(quán)重方面的效果是不同的。這點(diǎn)大家都很清楚。其核心思想就是外鏈?zhǔn)蔷W(wǎng)站站長無法控制的,而內(nèi)鏈?zhǔn)钦鹃L可以自行設(shè)置的。雖然在搜索引擎的發(fā)展過程中,出現(xiàn)“可被站長控制的外鏈”這一因素(就是平常的外鏈建設(shè))。但無論可控還是不可控,有一個思想是明確的,即誰也不會在別人的網(wǎng)站可以發(fā)布正確URL的前提下,卻去發(fā)錯誤的URL,導(dǎo)致用戶無法正常訪問自己的網(wǎng)站或在自己的網(wǎng)站上出現(xiàn)“該網(wǎng)頁不存在”的字眼。
其次,對于301到原網(wǎng)頁還是301到首頁。這點(diǎn)我不想多說,大家都原文就可以明白我的意思。我這里想說的是搜索引擎如何甄別原文的出處的一些信號:
1.搜索引擎最先在哪里看到內(nèi)容
2.諸多同樣內(nèi)容所在的域名信任度
3.指向哪里的鏈接最多(原文中的內(nèi)鏈)
4.拷貝是否鏈接回原始出處(版權(quán)鏈接)
由于第二條信號的存在,我們原創(chuàng)作者很多發(fā)布或被轉(zhuǎn)載在其他網(wǎng)站的內(nèi)容,無法獲得好的排名。很多作者也對此有抱怨。但我們可以利用1、3、4點(diǎn)信號將這個錯誤糾正過來。
百度在這方面做的還不是很好,但谷歌已經(jīng)可以很快且很準(zhǔn)的識別出原文的出處。這就得益于以上3條。而其中“拷貝是否鏈接回原始出處”這一因素,也是我在《使用301重定向?qū)?04錯誤轉(zhuǎn)化為網(wǎng)站外鏈》這篇文章中所闡述的目的之一,還有一個目的大家也看到了就是傳遞權(quán)重。
最后,將一個用戶無法訪問的錯誤URL,合理的通過301的方式重定向到正確的URL。也對用戶體驗(yàn)有所幫助。我們同樣在谷歌管理員工具的“抓取錯誤”中看到了這句話。
Googlebot 無法抓取該網(wǎng)址,因?yàn)樗赶虻木W(wǎng)頁不存在。通常,404 不會影響您的網(wǎng)站在搜索結(jié)果中的排名,但您可以借助它改善用戶體驗(yàn)。
解決404錯誤的方式無非是通過robots.txt屏蔽,或者通過301重定向。我不認(rèn)為屏蔽后可以改善用戶體驗(yàn)。robots.txt的方式只能改善蜘蛛體驗(yàn)。因?yàn)橛脩酎c(diǎn)擊錯誤URL后,訪問的還是一個不存在的頁面和看到404錯誤。
反駁第三段
“直接復(fù)制原話“如果針對不存在的網(wǎng)頁返回 404 或 410 以外的代碼(或?qū)⒂脩糁囟ㄏ蛑潦醉摰绕渌W(wǎng)頁,而不是返回 404),則可能會出現(xiàn)問題。首先,這樣就等于告訴搜索引擎通過該網(wǎng)址可以找到實(shí)際的網(wǎng)頁。結(jié)果,搜索引擎可能會抓取該網(wǎng)址,并將其內(nèi)容編入索引。因?yàn)?Googlebot 要使用很多的時間處理不存在的網(wǎng)頁,可能無法迅速找到您的網(wǎng)址或頻繁訪問這些網(wǎng)址,也無法頻繁地訪問這些網(wǎng)址,從而影響對您網(wǎng)站內(nèi)容的抓取量(另外,您一定也不希望自己的網(wǎng)站經(jīng)常出現(xiàn)在 [未找到文件] 的搜索查詢中)。”這是404頁面的原話,如果你不按照要求繼續(xù)錯誤頁面的跳轉(zhuǎn)的話,可能出現(xiàn)的情況就是你的網(wǎng)站上出現(xiàn)大量的相同頁面,相同標(biāo)題,相同描述,相同內(nèi)容,等等,然后這就是不同的URL和相同的內(nèi)容之間的故事,至于以后會發(fā)生什么?這個大家可以自己去百度,自己去google上找找就知道了。”
反駁的朋友既然提到了google管理員指南,就千萬別忘記摘錄另外一段文字:
一般來說,404 錯誤不會影響您的網(wǎng)站在 Google 中的排名,因此您可以放心忽略這些錯誤。這些錯誤通常是由于以下原因?qū)е碌模浩磳懹姓`、配置有誤(例如由內(nèi)容管理系統(tǒng)自動生成的鏈接)或 Google 加強(qiáng)了識別和抓取 JavaScript 等嵌入式內(nèi)容中的鏈接的力度。
要查看無效鏈接的來源,請點(diǎn)擊相關(guān)網(wǎng)址。在錯誤對話框中,點(diǎn)擊鏈接自以下網(wǎng)頁標(biāo)簽。如果相關(guān)鏈接來自您的網(wǎng)站,請修復(fù)或刪除這些鏈接。如果這些鏈接來自外部網(wǎng)站,您可以使用這些數(shù)據(jù)改善網(wǎng)站的用戶體驗(yàn)。例如,如果某人本打算鏈接到您的網(wǎng)站但卻輸錯了網(wǎng)址,那么就會出現(xiàn)拼寫有誤的合法網(wǎng)址(如 www.example.com/awesome 拼寫成了 www.example.com/awsome)。您可以將拼寫有誤的網(wǎng)址 301 重定向到正確的網(wǎng)址并通過該鏈接獲取預(yù)期流量,而不是返回 404 錯誤。您也可以在將用戶定向到 404 網(wǎng)頁后,確保幫助他們找到所需內(nèi)容,而不是僅僅顯示“404 未找到”。不過,我們只建議您在錯誤鏈接可產(chǎn)生較高流量的情況下采取上述措施。
很遺憾的是,這位朋友只看到了其一,卻沒有看到其二。我們在做SEO時,官方的資料非常重要,很多細(xì)節(jié)都隱藏在其中,需要花大量的時間去仔細(xì)閱讀和理解。
實(shí)際上,谷歌管理員工具中很多設(shè)置和說明文字都是有其道理的。只是我們一些SEO不愿意去理解。就像404產(chǎn)生的內(nèi)因和外因這種事情,在“抓取錯誤”一項(xiàng)中將它區(qū)分開也是有其道理的。而不是閑著沒事干就那么做了。
總結(jié):
作為SEO,我們要吸取很多知識,同時開拓自己的思路和分析問題的辦法。但需要確保你學(xué)習(xí)的知識是先進(jìn)的而不是陳舊的。否則自己的思路很容易被誤導(dǎo),從而產(chǎn)生不好的效果。
對觀點(diǎn)的爭論也是SEO工作中非常重要的一個環(huán)節(jié)。沒有人可以肯定的說自己的理解是正確的,我們只能拿官方透露出來的一些資料和自己通過數(shù)據(jù)分析得出來的結(jié)論來證明自己思路和理論的正確性。
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!