關(guān)鍵詞是SEO的核心概念之一,SEO實(shí)踐中很多工作都圍繞關(guān)鍵詞開展。本文嘗試從搜索技術(shù)原理和網(wǎng)站優(yōu)化實(shí)踐結(jié)合,總結(jié)內(nèi)容頁關(guān)鍵詞布局在SEO中的具體落地方法。
一、搜索引擎技術(shù)原理簡述
搜索引擎最核心的底層技術(shù)基礎(chǔ)是將用戶查詢詞切分成自然語言中有意義的詞組,然后從索引庫找到包含這些詞組中全部或部分關(guān)鍵詞的內(nèi)容,返回結(jié)果。
正常人的搜索思路是帶著關(guān)鍵詞,去查找內(nèi)容中是否包含該關(guān)鍵詞。假設(shè)要從序號1-10的10個網(wǎng)頁查找包含“關(guān)鍵詞布局”的網(wǎng)頁,分別去這10個網(wǎng)頁中全文搜索是否包含“關(guān)鍵詞布局”這個詞,然后返回包含該詞的網(wǎng)頁的序號。但如果是從百萬、千萬個網(wǎng)頁中查找呢,速度就很慢了,于是就發(fā)明了倒排索引的概念。(以下圖中數(shù)據(jù)皆非實(shí)際數(shù)據(jù),僅作示意)
如上圖示,為一個最簡單的倒排索引模型(DocID是搜索引擎為所抓取網(wǎng)頁分配的唯一編號)。搜索引擎爬蟲每次抓取一個網(wǎng)頁的時候,就把網(wǎng)頁切分成若干個詞組,將這些詞一一與倒排索引表比對:如果倒排索引表的“關(guān)鍵詞”一列有這個詞,就在其對應(yīng)的倒排列表中增加當(dāng)前網(wǎng)頁的編號DocID;如果沒有,就增加一行(涉及到新詞識別,此處不展開),給這個關(guān)鍵詞分配一個ID,再寫入當(dāng)前網(wǎng)頁的編號。這樣,當(dāng)我們查詢“關(guān)鍵詞1”的時候,很快就能知道相關(guān)的網(wǎng)頁有(1,2,3,5)。復(fù)雜一些的查詢詞假設(shè)被切分成“關(guān)鍵詞1”、“關(guān)鍵詞3”、“關(guān)鍵詞6”這3個詞,也能快速查詢到相關(guān)網(wǎng)頁有(1,2,3,5,6,7,9)。
僅僅這樣,還不足以對搜索結(jié)果進(jìn)行排序。非作弊的情況下,一個網(wǎng)頁出現(xiàn)某關(guān)鍵詞次數(shù)越多,該關(guān)鍵詞越能代表此網(wǎng)頁的特征,前提是要過濾停用詞(停用詞就是幾乎每個網(wǎng)頁中都有很多,但不能表達(dá)任何具體意義的詞,比如:“的”、“是”、“了”等等)。如果我們能在倒排索引表里面加入關(guān)鍵詞在網(wǎng)頁中出現(xiàn)的頻率信息(簡稱:詞頻--TF),就能對網(wǎng)頁進(jìn)行排序了。如下圖所示:當(dāng)我們的查詢詞被分詞為“關(guān)鍵詞1”、“關(guān)鍵詞2”時,就能將相關(guān)網(wǎng)頁排序?yàn)?3,5,1,2)。
假設(shè)現(xiàn)在有兩個網(wǎng)頁1、網(wǎng)頁2,在倒排索引中的信息如下圖:
我們搜索“關(guān)鍵詞怎么布局”,搜索詞被分詞為“關(guān)鍵詞”、“怎么”、“布局”,其中網(wǎng)頁1中“關(guān)鍵詞”、“怎么”、“布局”分別出現(xiàn)2、2、2次,共6次;網(wǎng)頁2中“怎么”、“布局”共出現(xiàn)7次,按照前面的邏輯,最終的搜索結(jié)果排序?yàn)?2,1),這顯然不是理想的排序結(jié)果,網(wǎng)頁2的主題明顯是講“圍棋怎么布局”的。此時需要引入IDF(逆文檔頻率指數(shù))來解決這個問題。
如果一個網(wǎng)頁集合中包含某個關(guān)鍵詞的網(wǎng)頁越少,則該關(guān)鍵詞具有越好的網(wǎng)頁區(qū)分能力,故IDF越大,即具有更高的權(quán)重。假設(shè)上圖中的“關(guān)鍵詞”、“怎么”、“布局”、“圍棋”的IDF分別為2.5、0.3、0.8、3,每個詞的TF乘以IDF后求和,得到網(wǎng)頁1、2的相關(guān)性分別為:7.2、4.6,所以搜索“關(guān)鍵詞怎么布局”的排序結(jié)果為(1,2),就比較符合實(shí)際了。
關(guān)鍵詞的位置信息也是一個重點(diǎn),一般認(rèn)為標(biāo)題中出現(xiàn)關(guān)鍵詞比正文部分出現(xiàn)相同的關(guān)鍵詞,更能體現(xiàn)一個網(wǎng)頁的主題特征,H標(biāo)簽的重要性即在于此。搜索引擎還能夠根據(jù)代碼布局和噪音比例(如停用詞出現(xiàn)頻率)來判斷哪里是導(dǎo)航、哪里是正文、哪里是側(cè)邊欄等等。在倒排索引列表中會把這些位置信息都標(biāo)注進(jìn)去,參與排序決策。
除此之外,還有一些其他的常用技術(shù)方法,如:雙詞索引/短語索引,“關(guān)鍵詞怎么布局”不一定就是切分為三個短詞,還可能切分成“關(guān)鍵詞布局”、“詞怎么”、“怎么布局”等等;關(guān)聯(lián)詞合并搜索,“關(guān)鍵詞”的關(guān)聯(lián)詞“關(guān)鍵字”,“怎么”的關(guān)聯(lián)詞“如何”等。
當(dāng)然,實(shí)際中現(xiàn)代大型搜索引擎的倒排索引模型會復(fù)雜很多,再融入其他諸多因素(一個重點(diǎn)是超鏈分析)參與排序算法,限于篇幅和作者水平有限,不繼續(xù)展開了。
二、關(guān)鍵詞如何布局
1、標(biāo)題中一定要有關(guān)鍵詞,但不一定要完整的疑問句
鑒于搜索引擎會把查詢詞切分為N多的單詞、雙詞、短語,并在查詢時加入關(guān)聯(lián)詞合并查詢,所以標(biāo)題中的關(guān)鍵詞不一定是完完整整的一個疑問句,一個典型是“做XXXX哪家公司好”。標(biāo)題中不一定需要這個完整的詞,即使標(biāo)題中包含了這個完整的短句,也不能匹配其他完整短句,一個優(yōu)質(zhì)的網(wǎng)頁往往能匹配成百上千的長尾關(guān)鍵詞,顯然一個標(biāo)題不可能全部包含。標(biāo)題的另一大作用是吸引點(diǎn)擊,點(diǎn)擊率也是影響排名的一個因素,但其中的“XXXX”、“好”、“公司”這些核心詞一定要出現(xiàn)。
2、正文自然、均勻的分布一些核心詞和切分詞
搜索引擎發(fā)展初期,很多技術(shù)人員利用TF*IDF算法權(quán)重較高的漏洞,大量堆砌關(guān)鍵詞,從而快速獲得較好的搜索排名。后來搜素引擎從算法層面修復(fù)漏洞打擊作弊,就出現(xiàn)了網(wǎng)絡(luò)上流行的“理想關(guān)鍵詞密度3%~8%”的觀點(diǎn)。首先,這個密度不是計算完整查詢詞的,而是切分后的詞全部計算,并且實(shí)踐中,你會發(fā)現(xiàn)有關(guān)鍵詞密度稍微低于3%的,也有關(guān)鍵詞密度高出8%很多的網(wǎng)頁能夠獲得不錯的排名。
如果你是搜索引擎的工程師,會怎么做?我想我會結(jié)合全網(wǎng)的歷史訪問數(shù)據(jù)(如百度統(tǒng)計、手機(jī)百度等都能獲取較全面的訪問數(shù)據(jù))和關(guān)鍵詞密度信息劃定一個合理范圍和警戒范圍,超出警戒范圍的給予沉默處理,在警戒范圍區(qū)間的結(jié)合該站點(diǎn)歷史數(shù)據(jù)和第一階段的小流量排名的訪問數(shù)據(jù)反饋,決定是打壓還是維持或給予更高的排名。
相比于關(guān)鍵詞密度,我們更應(yīng)該注重的是語言的通順流暢(一味地強(qiáng)插關(guān)鍵詞顯得啰嗦和別扭)和內(nèi)容的質(zhì)量深度。畢竟,搜索引擎的排序因素多達(dá)成百上千個,也不能顧此失彼。
3、正文下方相關(guān)內(nèi)容和側(cè)邊欄推薦適當(dāng)布局關(guān)鍵詞
雖說搜索引擎能夠通過代碼和噪音比例判斷這些不是正文部分,從而降低一些此處關(guān)鍵詞的權(quán)重,但從百度快照緩存來看,還是有一點(diǎn)作用的。
正文下方和側(cè)邊欄的相關(guān)內(nèi)容和推薦內(nèi)容多是從橫向和縱向兩個角度選取內(nèi)容。比如本文,主題是關(guān)于“關(guān)鍵詞布局”,那橫向推送一些“網(wǎng)站結(jié)構(gòu)布局”、“關(guān)鍵詞挖掘技巧”等站內(nèi)優(yōu)化方面的內(nèi)容,大概率是有很多訪客感興趣的;縱向推送一些“教你怎么建設(shè)高質(zhì)量的外鏈”、“如何提高著落頁的轉(zhuǎn)化率”等內(nèi)容,也是訪客可能暫時抑制的隱性需求。增加了關(guān)鍵詞布局的同時,還能提高PV,降低跳出,提升用戶體驗(yàn),何樂而不為。
作者:建站監(jiān)理網(wǎng)
來源:盧松松博客,(QQ/微信:13340454),也歡迎您在線投稿
網(wǎng)址:https://lusongsong.com/reed/13384.html
友情提示:A5官方SEO服務(wù),為您提供權(quán)威網(wǎng)站優(yōu)化解決方案,快速解決網(wǎng)站流量異常,排名異常,網(wǎng)站排名無法突破瓶頸等服務(wù):http://www.admin5.cn/seo/zhenduan/
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!