SEO算法:SEO的貝葉斯算法與偽命題

大學時候學離散數學,啥都沒學好,但是還有一個東西觸動了我。比如一個事物,我們常說真的、假的事物(真命題、假命題),但是還有一個東西,有些事物對與錯是有概率性,不一定對也不一定錯,這樣我們只能把概率融入到選擇中來進行選擇,這就是貝葉斯算法。

 

2011年學了seo之后,沒料到這個算法影響了很多方面。在seo的很多方面都是這樣的,呈現了很多的兩面性,而且在一定概率之后,影響的因素會發生了很多的變化。seo實質是追求平穩態的一個動態過程,例如圖上的就說明白了很多問題。所以你了解seo后,你發現現在所謂的seo培訓都是不行的,因為他們的都是告訴你哪些因素的影響了那些權重,其實任何的一個因素和其它因素之間,一個因素自身對網站影響都是具有著非線性、相對性、階段性的影響,下面我就慢慢解釋一下:

比如百度切詞,粒度越小,召回就越多,建立倒排索引時,索引的長度就越長;粒度的層次越多,索引的數量就越多。一個多,一個長形成了不同的用戶體驗,搜索引擎一般采用性價比的方式來進行選擇。例如搜索排序算法里存在著這里的例子,網頁排序與查詢的匹配程度,和網頁本身的好壞都有關系,如過兩者存在一定的差異,就只好采用貝葉斯算法進行匹配……(本段節選百度博客)

 

在鏈接方面也存在著相同的東西。在網站權重理解上,我一般分成了三種,其中2個鏈接因素兩個內容因素,兩個內容因素是相反的,兩個鏈接因素也是相反的。這其實是出乎我的意料之外的。

 

以上所說的解釋了一個東西,那就是seo的影響因素是相對性的,真假命題很多時候是貝葉斯算法在起著作用,下面的一個感想對我感觸非常大,也是這篇博客所要說的:

 

昨晚第N次讀了夜息的金字塔鏈接模型,思考一下,在以前我曾經讀了這篇文章后狠狠地研究了下鏈接模型和拓撲連接模型,例如我這篇博客的頭型就是最好的拓撲連接模型,但是我昨晚卻忽然覺得有些地方錯誤了,就在2012年鐘聲敲響的時候,我忽然想也許夜息和我們都錯了……

 

如果您已經讀了那篇博客,其中有兩個概念不得不說,一個是鏈輪一個是站群,這兩個都是目前非常流行的seo策略,被很多人所推崇,前一段經常看到這方面的研究,都在說明網站權重傳遞是怎么的好,其中的原理就是鏈接之間的相互迭代傳遞,或者在圖論邏輯上是向量空間模型。

 

說道向量空間模型,這里有一個問題必須說明的是,在數據結構里搜索是如何存儲數據的。一般情況下我們認為是單一節點存儲的,但是大量的鏈接關系的話,需要的存儲空間是非常巨大的,如何節省存儲呢,最簡單就是把相同方向指向的放在一起,這樣一來一個問題就產生了,如果采用鏈輪或者站群在第一層迭代和第二層迭代里數據是相同的(或者第二層迭代小于第一層迭代),如果搜索采用數據統計來研究網站鏈接的話,這么簡單的數據蜘蛛不明白是什么神馬嗎……我嚇死差點……(本人認為搜索會進行此數據統計,而且會采用二叉樹節點計算來做鏈接的迭代計算。)

 

其實,更加深究這些問題,比如外鏈要不要做模型。我們可以這么一個設想,加入一個網站有101個頁面(1個首頁和100個內頁),假設兩種特別情況,每個頁面都連向首頁,但是相互之間不連接,首頁連向每個頁面;另一個條件是每個網頁都連向其他100個鏈接,那么對于一個網站來說,這兩種情況下網站權重一樣嗎?(這是在理想情況下,沒有任何外鏈情況下,切記首頁只是一個網頁)

 

對于這個問題我曾經一度非常的糾結,后來借助三權(頁權、位權和域權)分立研究,發現了很多有趣的問題,假如我們把上面的問題改為另外一個問題,加入一個人擁有一個公司100%的股份,價值是100W,或者一個人擁有100個公司每個公司1%股份,價值也是100W,請問這個人的財富影響力變化了沒有?

 

其實結果是或許是這樣的,如果這個人比較強勢,那么其影響力輻射到100個公司,其財富影響力最大可以到100個100W,如果一個人比較弱勢,那么其影響力從100w到了0.這非常類似于谷歌的隨機沖浪模型,如何用戶體驗很好,或許會點很多,也許只點擊進入頁就走了……

 

就現實來說,其實還存在一個問題,就是公司股權問題,以上兩種之外還存在一個黃金點35.9W控制一個公司的股權(具體大家可以參考金融),那么這個很穩定的控制影響力,可以控制200W和其他的一點,這個我可以稱之為穩定態,而最初的兩種被稱為初始態和最終態,而35.9是最好的比例點,這點也可以解釋每個網頁最穩定的最好的鏈接比例是多少,一個網頁有36個主題html鏈接有最穩定的隨機沖浪點擊鏈接(大家可以測試下)。

 

這個問題其實我是想說的是偽命題,因為每個網站內容不同,用戶體驗不同,其連接位置、鏈接關鍵詞不同等,同一個網站任何一個網頁權重產生了差異性。但是任何鏈接模型都是在降低域權來提高位權的一個過程,兩者的權重和是沒有改變的,有改變的是其中的“現實過程”或隨機沖浪者可以達到的UV數量,而這個最終和頁權改變有關系。而頁權就是和你勞動力有關系的一個權重,所以做了一圈總的能量是守恒的,而變化的是您的力氣化作了能量。(頁權、位權和域權是三種不同的權重計算方式,任何一個網頁都是由此三種權重傳遞而來,看清楚了是三種不是三個……)

 

看到這里,連我這個解釋者都覺得很多人難以理解,其實這個意思簡單就是說無論站群或者鏈輪并沒有從本質上改變網站權重,和連不連接模型一點關系都沒有,因為鏈輪和站群并沒有增加二度迭代的鏈接數量,所以說搜索引擎不會K掉鏈輪和站群的,因為是您的“花費的時間”轉化為了頁權,而您在這段時間里也可以通過提高其他權重達到相同的效果。

 

PS:頭暈如麻,昨晚看了一晚的seo博客,今天大年初一睡了一天的覺,本來想寫篇文章探討下一個網站多少條外鏈效果最大,以后會逐次遞減的,可是寫著寫著自己都不知道寫了神馬東東,大家隨意看看吧,很多地方寫錯了也不想改了,本來還有很長的探討現在也沒心情寫了,如果對此篇文章不懂的可以PM。

 

1,36個是相對穩定態,不是絕對值,不要追究為何不是35;

 

2,一些說法都是相對說法,都不是絕對的,所以你要站在相對論的前提下閱讀本篇文章;

 

3,本人研究seo時間很短,很慚愧地說也沒有接受神馬培訓,不過看了很多免費資料,自己造的一套seo理論是依據三權、五構、七標、十三點(核心是自然的平穩態),里面內容比較駁雜,以后慢慢通過寫博客分享出來,其中這篇文章當中很多細節都需要解釋的,會在以后慢慢解釋;

 

4,本人覺得國平seo適合對網站進行數據分析,而我的理論主要是對網站進行seo架構設計,我正逐步分析大量網站來對理論進行驗證和修正,寫這么多僅供參考,您可以鄙視我的無知,回復著請不要打擊我的熱心……

上一篇:談點SEO排名的背后一些事
下一篇:SEO思維進化論3之TF-IDF算法

網友回應

說點什么吧
  • 全部評論(0
    還沒有評論,快來搶沙發吧!

歡迎掃描關注我們的微信公眾平臺!

歡迎掃描關注我們的微信公眾平臺!

福彩3d天齐网