SEO網絡培訓:基于詞頻和關鍵詞位置統計排序算法!

在整個搜索引擎優化過程當中,詞頻和關鍵詞位置這是在傳統的情報檢索理論和技術基礎上發展而來的。對用戶輸人的檢索詞,如果在一網頁中出現的頻率越高,出現的位置越重要,則認為,這網頁與此檢索詞的相關性越好,越能滿足用戶的需求。早期的搜索引擎結果排序都是基于這一思想的,如Infoseek,Excite,Lycos等,它們基本上是沿用了網絡時代之前圖書情報界的研究成果。一般情況下,詞在網頁中出現的頻率和位置通過加權的方法來表示,當然,在實際運作過程中,不同的搜索引擎具體的操作方法是不同的。

SEO網絡培訓:基于詞頻和關鍵詞位置統計排序算法!

1、詞頻加權

詞頻加權的方法有絕對詞頻加權、相對詞頻加權、反詞頻加權、基于詞分辨值加權等等。對于單一詞搜索引擎,只用單純地計算一個詞在網頁中的出現頻率就可給定權值。而對于具有進行邏輯組配功能的搜索引擎,則必須用其它的加權方法。因為用組配的檢索式檢索時,檢索結果跟檢索式中的每個檢索詞相關,而每個檢索詞在所有的網頁中出現的總頻率是不同的,如果按總權值來排序,就會造成結果的不相關。這可以通過其它多種方法解決。例如,利用相對詞頻加權原理,可以通過對大量網頁的統計,把越是在所有網頁中出現頻率高的詞賦予一個較低的初始值相對地,在所有網頁中出現頻率低的詞,給一個較高的權值。

2、詞位置加權

通過對詞在網頁中不同位置和版式,給予不同的權值,從而根據權值來確定所搜索的結果和搜索詞的相關程度。

詞的位置包括:網頁標題、網頁描述、關鍵字、正文標題、正文內容、文本鏈接、標識等。

版式包括:字體、字號、有無加粗強調等。和傳統文獻一樣,一般在較重要的位置如標題、正文的結尾句等出現的詞給較大的權值,例如要了解百度,在搜索“百度”時,有兩個結果,一個標題是《百度介紹》,另一篇文章的標題是《谷歌節紹》,但內容有個別地方提到百度,顯然第一個結果的相關性更大,“百度”這個詞在第一個結果中給予的權值應大一些。另外,字符較大、加粗強調的地方,一般也會給予較大的權值。

3、詞頻和位置統計排序優缺點

詞頻統計有易用,易實現的優點,其技術也發展得最成熟。至今仍是各搜索引擎排序核心技術的基礎,因為依鼎單純的鏈接分析,如果檢索詞和網頁相關度不高,就算網頁的質量再高,再權威,相對用戶來說也是沒用的,這也是為何很多網站站長發了大量的外鏈排名不佳的真實原因,甚至有些站點僅僅是把標題和頁面內容保持高度的一致相關,沒有任何外部優化的作用,也可達到良好的排名效果。詞頻統計也有很多不足,它根本沒有利用跟網絡中網頁有關的特性,可以說是前網絡時代的技術。

然而,網絡時代的主要文獻是以網頁的形式存在的,而幾乎每個人都可以隨心所欲地在網上發表各種內容,詞頻相同的兩個網頁,質量相差可以很遠。為了能夠排在某些檢索結果的前幾位,許多網頁內容的制作者絞盡腦汁,在其頁面上堆砌關鍵詞,例如,在網頁中加人和背景顏色一樣的層,并加大量的關鍵詞,這樣,人來瀏覽網頁時,完全看不到,但搜索引擎在標引時,卻能發現。對此,搜索引擎也研究出各種方法來,發現和懲罰這種作弊的行為。

上一篇:SEO規范培訓:從倒排索引看搜索引擎結果排序!
下一篇:黑帽SEO培訓:基于PageRank算法對SEO結果排序影響分析!

網友回應

說點什么吧
  • 全部評論(0
    還沒有評論,快來搶沙發吧!

歡迎掃描關注我們的微信公眾平臺!

歡迎掃描關注我們的微信公眾平臺!

福彩3d天齐网