谷歌排名規(guī)則因素是什么?谷歌搜索排名的底層邏輯
這篇文章是基于谷歌公司負(fù)責(zé)搜索引擎的副總裁Pandu Nayak在2023年10月份美國(guó)針對(duì)谷歌的反壟斷案中的證詞和提交的文件整理而來。雖然部分文件未對(duì)外開放,但現(xiàn)有的官方資料已經(jīng)提供了大量信息,對(duì)于對(duì)搜索引擎優(yōu)化(SEO)感興趣的人來說,這是一個(gè)值得深入研究的資源。
平哥SEO盡量用最樸實(shí)的句子來把這些信息解讀一下,方便大家理解:
谷歌搜索的工作原理:
1.Google索引系統(tǒng)
谷歌搜索是基于網(wǎng)絡(luò)的。網(wǎng)絡(luò)就是由很多網(wǎng)頁(yè)和鏈接組成的一個(gè)巨大的信息庫(kù)。每個(gè)網(wǎng)頁(yè)都有一個(gè)地址,叫做URL,就像你家的門牌號(hào)一樣。
谷歌搜索的第一步,就是要把網(wǎng)絡(luò)上的所有網(wǎng)頁(yè)都收集起來,這個(gè)過程叫做爬取。
谷歌搜索用了一些特殊的程序,叫做爬蟲,來不斷地訪問網(wǎng)絡(luò)上的網(wǎng)頁(yè),并把它們的內(nèi)容復(fù)制下來,這個(gè)過程叫做Index(索引)。
你可以把索引想象成一本很大的書,里面記錄了每個(gè)網(wǎng)頁(yè)的地址和內(nèi)容。
但是,網(wǎng)絡(luò)上的網(wǎng)頁(yè)是不斷變化和增加的,所以谷歌搜索要經(jīng)常更新它的索引,把新的網(wǎng)頁(yè)加進(jìn)去,把舊的網(wǎng)頁(yè)刪掉,或者把變化的網(wǎng)頁(yè)修改一下。
谷歌搜索的索引非常龐大,可能有4000億個(gè)網(wǎng)頁(yè)(最新泄露出來的2020年的數(shù)據(jù)),但是并不是所有的網(wǎng)頁(yè)都有用,有些網(wǎng)頁(yè)可能是重復(fù)的,有些網(wǎng)頁(yè)可能是很垃圾的,有些網(wǎng)頁(yè)可能是錯(cuò)誤的。
Nayak解釋說,規(guī)模并非一切,網(wǎng)絡(luò)上存在大量重復(fù)內(nèi)容。Google的目標(biāo)是創(chuàng)建一個(gè)“全面的索引”。
所以,谷歌搜索要盡量把這些無用的網(wǎng)頁(yè)從索引中去掉,只保留有用的網(wǎng)頁(yè),這樣才能提高索引的質(zhì)量。
“刪除不是好信息的內(nèi)容”是“提高索引質(zhì)量”的一種方法。(所以如果你的文章質(zhì)量很垃圾,不如不發(fā)布,有些通過刪除網(wǎng)頁(yè),3個(gè)月內(nèi)流量增加了33%)
Nayak還解釋了索引在信息檢索中的作用:
“So when you have a query,you need to go and retrieve documents from the index that match the query.The core of that is the index itself.Remember,the index is for every word,what are the pages on which that word occurs.
And so—this is called an inverted index for various reasons.And so the core of the retrieval mechanism is looking at the words in the query,walking down the list—it’s called the postings list—and intersecting the postings list.
This is the core retrieval mechanism.And because you can’t walk the lists all the way to the end because it will be too long,you sort the index in such a way that the likely good pages,which are high quality—so sometimes these are sorted by page rank,for example,that’s been done in the past,are sort of earlier in the thing.
And once you’ve retrieved enough documents to get it down to tens of thousands,you hope that you have enough documents.
So this is the core of the retrieval mechanism,is using the index to walk down these postings lists and intersect them so that all the words in the query are retrieved.”
翻譯為:
“因此,當(dāng)你有一個(gè)查詢時(shí),你需要從匹配查詢的索引中檢索文檔。其核心是索引本身。記住,索引是對(duì)于每個(gè)單詞,它出現(xiàn)在哪些頁(yè)面上。因此——這就是所謂的倒排索引,出于各種原因。
因此,檢索機(jī)制的核心是查看查詢中的單詞,向下遍歷列表——它被稱為postings列表——并交叉postings列表。這是檢索機(jī)制的核心。而且因?yàn)槟悴荒芤恢弊叩搅斜淼哪┪玻驗(yàn)檫@樣會(huì)太長(zhǎng),所以你根據(jù)文檔的質(zhì)量對(duì)索引進(jìn)行排序,這樣質(zhì)量好的文檔,比如有時(shí)按PageRank排序的文檔,就可以排在前面。
一旦你檢索了足夠的文檔,將其減少到幾萬(wàn)個(gè),你希望你已經(jīng)有了足夠的文檔。
所以這就是檢索機(jī)制的核心,是使用索引來遍歷這些postings列表并交叉它們,以便檢索查詢中的所有單詞。”
大意為:
谷歌搜索是基于查詢的。查詢就是你在搜索框里輸入的一些詞,比如“谷歌搜索是如何工作的”。當(dāng)你輸入一個(gè)查詢后,谷歌搜索就會(huì)從它的索引中找出和你的查詢相關(guān)的網(wǎng)頁(yè),這個(gè)過程叫做檢索。
谷歌搜索會(huì)根據(jù)你的查詢中的每個(gè)詞,去索引中查找包含這些詞的網(wǎng)頁(yè),然后把這些網(wǎng)頁(yè)的地址和內(nèi)容列出來,這個(gè)列表叫做postings列表。
你可以把postings列表想象成一張清單,上面寫著每個(gè)詞出現(xiàn)在哪些網(wǎng)頁(yè)上。
谷歌搜索會(huì)把不同詞的postings列表合并起來,找出同時(shí)包含所有詞的網(wǎng)頁(yè),這些網(wǎng)頁(yè)就是和你的查詢匹配的網(wǎng)頁(yè)。
但是,和你的查詢匹配的網(wǎng)頁(yè)可能有很多,有些網(wǎng)頁(yè)可能比其他網(wǎng)頁(yè)更相關(guān),更有用,更準(zhǔn)確,更新鮮,更受歡迎。
所以,谷歌搜索要對(duì)這些網(wǎng)頁(yè)進(jìn)行排序,把最好的網(wǎng)頁(yè)放在前面,這個(gè)過程叫做Ranking(排名)。
對(duì)于SEO人員來說,掌握Google如何使用索引來檢索文檔是至關(guān)重要的。這樣,你才能有效地創(chuàng)建更有可能與查詢匹配的文檔。
同時(shí),不要忽視排名的重要性。排名是決定你的頁(yè)面在搜索結(jié)果中顯示順序的核心因素。排名靠前的頁(yè)面不僅會(huì)獲得更多的內(nèi)容抓取和曝光,而且會(huì)吸引更多的用戶點(diǎn)擊和信任。
2.谷歌排名系統(tǒng)
Google使用索引來檢索與查詢匹配的頁(yè)面,那么它是如何從索引中找出和你的搜索查詢最相關(guān)的網(wǎng)頁(yè)的呢?
索引就是谷歌搜索收集和復(fù)制網(wǎng)絡(luò)上的所有網(wǎng)頁(yè)的一個(gè)巨大的數(shù)據(jù)庫(kù)。查詢就是你在搜索框里輸入的一些詞,比如“谷歌搜索是如何工作的”
有時(shí)候,你的查詢可能和很多網(wǎng)頁(yè)都有關(guān)系,有可能是幾百萬(wàn)個(gè)。比如你搜索"蘋果",可能世界上有幾十萬(wàn)個(gè)網(wǎng)站都有關(guān)于"蘋果"的網(wǎng)頁(yè),這樣的話,谷歌搜索就不知道該給你顯示哪些網(wǎng)頁(yè)了。
所以,谷歌搜索用了很多不同的方法和標(biāo)準(zhǔn),叫做算法和機(jī)器學(xué)習(xí)模型,來幫助它對(duì)網(wǎng)頁(yè)進(jìn)行排序,讓你看到最相關(guān),最有用,最準(zhǔn)確的網(wǎng)頁(yè)。
算法和機(jī)器學(xué)習(xí)模型就是一些規(guī)則和公式,告訴谷歌搜索如何判斷和比較網(wǎng)頁(yè)的好壞。
Pandu Nayak曾在2021年發(fā)表的一篇文章中說過:Google使用“數(shù)百個(gè)算法和機(jī)器學(xué)習(xí)模型,其中沒有一個(gè)完全依賴于任何單個(gè)的大模型.
意思是:谷歌搜索的算法和機(jī)器學(xué)習(xí)模型有很多,可能有幾百個(gè),它們都有自己的作用和重要性。
谷歌搜索不會(huì)只用一個(gè)或幾個(gè)算法和機(jī)器學(xué)習(xí)模型來對(duì)網(wǎng)頁(yè)進(jìn)行排序,而是會(huì)用很多個(gè),這樣才能更準(zhǔn)確和全面地評(píng)估網(wǎng)頁(yè)的質(zhì)量。
Nayak解釋說,這些算法和機(jī)器學(xué)習(xí)模型本質(zhì)上是將索引“精簡(jiǎn)”到最相關(guān)的網(wǎng)頁(yè)。
“So that’s—the next phase is to say,okay,now I’ve got tens of thousands.Now I’m going to use a bunch of signals to rank them so that I get a smaller set of several hundred.And then I can send it on for the next phase of ranking which,among other things,uses the machine learning.”
"因此,下一階段就是,好吧,現(xiàn)在我已經(jīng)有了幾萬(wàn)個(gè)網(wǎng)頁(yè)信息。現(xiàn)在,我將使用一系列信號(hào)對(duì)它們進(jìn)行排名,這樣就能得到一組較小的幾百條信息。然后,我就可以將其送入下一階段的排名系統(tǒng)中,其中包括使用機(jī)器學(xué)習(xí)系統(tǒng)來研究這些信息。
可以理解成下面的工作模式:
谷歌搜索會(huì)分幾個(gè)階段來對(duì)網(wǎng)頁(yè)進(jìn)行排序,每個(gè)階段都會(huì)用不同的算法和機(jī)器學(xué)習(xí)模型,以及不同的信息和數(shù)據(jù),叫做信號(hào),來幫助它對(duì)網(wǎng)頁(yè)進(jìn)行排序。信號(hào)就是從網(wǎng)頁(yè)的內(nèi)容,質(zhì)量,來源,鏈接,更新時(shí)間,點(diǎn)擊率,用戶評(píng)價(jià)等等方面收集和分析的信息和數(shù)據(jù)。
谷歌搜索的第一個(gè)階段,就是從索引中找出和你的查詢相關(guān)的網(wǎng)頁(yè),這個(gè)過程叫做檢索。這個(gè)階段可能會(huì)找出幾萬(wàn)個(gè)網(wǎng)頁(yè),但是這些網(wǎng)頁(yè)還沒有經(jīng)過排序,所以還不知道哪些網(wǎng)頁(yè)更好。
谷歌搜索的第二個(gè)階段,就是用一些信號(hào)來對(duì)這些網(wǎng)頁(yè)進(jìn)行初步的排序,這樣就可以把網(wǎng)頁(yè)的數(shù)量減少到幾百個(gè),這些網(wǎng)頁(yè)就是更有可能和你的查詢匹配的網(wǎng)頁(yè)。
谷歌搜索的第三個(gè)階段,就是用更多的算法和機(jī)器學(xué)習(xí)模型,以及更多的信號(hào),來對(duì)這些網(wǎng)頁(yè)進(jìn)行更細(xì)致的排序,這樣就可以把網(wǎng)頁(yè)的順序確定下來,讓你看到最好的網(wǎng)頁(yè)。
谷歌搜索的一些算法和機(jī)器學(xué)習(xí)模型之前已經(jīng)公布過,比如BERT、Helpful Content System、PageRank、Review System等等,但是谷歌搜索還有一些新的和未公開的算法和機(jī)器學(xué)習(xí)模型.
3.超過100種排名信號(hào)/因素
谷歌搜索用了很多不同的信息和數(shù)據(jù),叫做Signal信號(hào),來幫助它對(duì)網(wǎng)頁(yè)進(jìn)行排序。信號(hào)就是從網(wǎng)頁(yè)的各個(gè)方面收集和分析的信息和數(shù)據(jù),比如網(wǎng)頁(yè)的內(nèi)容,質(zhì)量,來源,鏈接,更新時(shí)間,點(diǎn)擊率,用戶評(píng)價(jià)等等。
谷歌搜索的信號(hào)有很多,但是并不是所有的信號(hào)都一樣重要,有些信號(hào)可能比其他信號(hào)更有影響力
谷歌搜索排名的一些信號(hào)/因素大家可能已經(jīng)知道,比如上面提到的網(wǎng)頁(yè)的內(nèi)容質(zhì)量,鏈接這些,信號(hào)是Factor因素的組成部分,有時(shí)候也是一個(gè)單獨(dú)的因素.
谷歌搜索還會(huì)使用一些其他的信號(hào),根據(jù)Nayak的說法,可能超過100個(gè).
Google曾經(jīng)說過它使用超過200個(gè)排名因素來對(duì)頁(yè)面進(jìn)行排名。這個(gè)數(shù)字在2010年短暫飆升至10,000個(gè),(Google的Matt Cutts曾解釋說,Google的200多個(gè)信號(hào)中的許多信號(hào)在一個(gè)因素中有多達(dá)50個(gè)變體)
現(xiàn)在,根據(jù)Nayak的證詞,Google的信號(hào)數(shù)量已經(jīng)下降到“可能還有100多個(gè)”
Nayak說,對(duì)于檢索文檔來說,"最重要的信號(hào)(與Google的Gary Illyes今年在Pubcon上所說的相吻合)可能來自文檔本身"。
Nayak說:"我們所有的核心主題信號(hào)、頁(yè)面質(zhì)量信號(hào)、本地化信號(hào)。這些信號(hào)會(huì)對(duì)數(shù)以萬(wàn)計(jì)的網(wǎng)頁(yè)進(jìn)行分析,然后得出一個(gè)分?jǐn)?shù),再?gòu)闹羞x出前幾百個(gè)。
根據(jù)nayak的說法,核心信號(hào)包括:
文件本身(又稱"頁(yè)面上的文字內(nèi)容"等)。
核心主題
頁(yè)面質(zhì)量
可靠性
本地化
Navboost
核心主題信號(hào)是衡量頁(yè)面與查詢相關(guān)性的關(guān)鍵指標(biāo)。Nayak說,這些信號(hào)包括:
關(guān)鍵詞出現(xiàn)的頻率和位置
關(guān)鍵詞在頁(yè)面中的語(yǔ)境
頁(yè)面中與關(guān)鍵詞相關(guān)的其他內(nèi)容
頁(yè)面質(zhì)量信號(hào)
頁(yè)面質(zhì)量信號(hào)是衡量頁(yè)面整體質(zhì)量的指標(biāo)。Nayak說,這些信號(hào)包括:
頁(yè)面內(nèi)容的相關(guān)性和準(zhǔn)確性
頁(yè)面結(jié)構(gòu)和可用性
頁(yè)面信任度
本地化信號(hào)
本地化信號(hào)是衡量頁(yè)面與用戶搜索位置相關(guān)性的指標(biāo)。Nayak說,這些信號(hào)包括:
頁(yè)面內(nèi)容是否與用戶搜索位置相關(guān)
頁(yè)面是否針對(duì)用戶搜索位置優(yōu)化
其他排名信號(hào)
Nayak在證詞中提到了其他一些排名信號(hào),包括:
用戶行為信號(hào):例如,用戶點(diǎn)擊、滯留時(shí)間和跳出率
社交信號(hào):例如,社交媒體分享和回復(fù)
付費(fèi)廣告:例如,廣告排名
總結(jié)一下:
谷歌搜索的第一個(gè)階段,就是從索引中找出和你的查詢相關(guān)的網(wǎng)頁(yè),這個(gè)過程叫做檢索。這個(gè)階段可能會(huì)找出幾萬(wàn)個(gè)網(wǎng)頁(yè),但是這些網(wǎng)頁(yè)還沒有經(jīng)過排序,所以還不知道哪些網(wǎng)頁(yè)更好。這個(gè)階段最重要的信號(hào)可能是網(wǎng)頁(yè)本身,也就是網(wǎng)頁(yè)上的文字和其他內(nèi)容。
?谷歌搜索的第二個(gè)階段,就是用一些信號(hào)來對(duì)這些網(wǎng)頁(yè)進(jìn)行初步的排序,這樣就可以把網(wǎng)頁(yè)的數(shù)量減少到幾百個(gè),這些網(wǎng)頁(yè)就是更有可能和你的查詢匹配的網(wǎng)頁(yè)。這個(gè)階段的一些重要的信號(hào)有:
?主題性。這個(gè)信號(hào)是看網(wǎng)頁(yè)的內(nèi)容和你的查詢的話題是否相關(guān),比如你查詢“谷歌搜索是如何工作的”,那么和谷歌搜索有關(guān)的網(wǎng)頁(yè)就會(huì)得到更高的分?jǐn)?shù)。
?頁(yè)面質(zhì)量。這個(gè)信號(hào)是看網(wǎng)頁(yè)的內(nèi)容是否有用,是否準(zhǔn)確,是否可靠,是否有權(quán)威,是否有錯(cuò)誤,是否有垃圾,等等,比如你查詢“谷歌搜索是如何工作的”,那么來自谷歌官方或者專家的網(wǎng)頁(yè)就會(huì)得到更高的分?jǐn)?shù)。
?可靠性。這個(gè)信號(hào)是看網(wǎng)頁(yè)的內(nèi)容是否真實(shí),是否客觀,是否公正,是否有證據(jù),是否有引用,等等,比如你查詢“谷歌搜索是如何工作的”,那么有數(shù)據(jù)和事實(shí)支持的網(wǎng)頁(yè)就會(huì)得到更高的分?jǐn)?shù)。
?本地化。這個(gè)信號(hào)是看網(wǎng)頁(yè)的內(nèi)容是否和你的地區(qū),語(yǔ)言,文化,習(xí)慣等等有關(guān),比如你查詢“谷歌搜索是如何工作的”,那么用你的母語(yǔ)寫的,或者和你的國(guó)家或城市有關(guān)的網(wǎng)頁(yè)就會(huì)得到更高的分?jǐn)?shù)。
?Navboost,也叫Glue,是一種觀察用戶點(diǎn)擊和交互行為來評(píng)估網(wǎng)頁(yè)質(zhì)量的算法.
另外還有一個(gè)新的instant glue信號(hào),2021年被發(fā)現(xiàn)的,在原先的基礎(chǔ)上加上了新鮮度和時(shí)間的因素.
?內(nèi)容豐富度:這個(gè)信號(hào)是看網(wǎng)頁(yè)是否是一些特殊的類型,比如導(dǎo)航網(wǎng)頁(yè),新聞網(wǎng)頁(yè),圖片網(wǎng)頁(yè),視頻網(wǎng)頁(yè),地圖網(wǎng)頁(yè),購(gòu)物網(wǎng)頁(yè)等等,比如你查詢“谷歌搜索是如何工作的”,那么有視頻或圖片解釋的網(wǎng)頁(yè)就會(huì)得到更高的分?jǐn)?shù)。
?谷歌搜索的第三個(gè)階段,就是用更多的算法和機(jī)器學(xué)習(xí)模型,以及更多的信號(hào),來對(duì)這些網(wǎng)頁(yè)進(jìn)行更細(xì)致的排序,這樣就可以把網(wǎng)頁(yè)的順序確定下來,讓你看到最好的網(wǎng)頁(yè)。
其他排名信號(hào)
Nayak在證詞中提到了其他一些排名信號(hào),包括:
用戶行為信號(hào):例如,用戶點(diǎn)擊、滯留時(shí)間和跳出率
社交信號(hào):例如,社交媒體分享和回復(fù)
付費(fèi)廣告:例如,廣告排名
點(diǎn)擊
Nayak還討論了點(diǎn)擊對(duì)排名的影響。他表示,點(diǎn)擊是“一個(gè)重要信號(hào),但不是唯一信號(hào)”。
Nayak說:“點(diǎn)擊是重要的,因?yàn)樗鼈儽砻饔脩粽J(rèn)為頁(yè)面是相關(guān)和有用的。但是,還有其他信號(hào)可以幫助我們了解頁(yè)面的質(zhì)量。例如,我們可以查看頁(yè)面的內(nèi)容、結(jié)構(gòu)和可用性。我們還可以查看來自其他來源的信號(hào),例如社交媒體分享和回復(fù)。”
人工評(píng)估
Nayak證詞中的一個(gè)有趣的發(fā)現(xiàn)是,Google會(huì)使用人工評(píng)估來評(píng)估頁(yè)面質(zhì)量。
Nayak說:“人工評(píng)估者是幫助我們了解頁(yè)面質(zhì)量的重要工具。他們可以告訴我們頁(yè)面的內(nèi)容是否相關(guān)和準(zhǔn)確,頁(yè)面是否易于使用,以及頁(yè)面是否可信。我們使用人工評(píng)估者來評(píng)估各種類型的頁(yè)面,包括搜索結(jié)果、廣告和其他產(chǎn)品。”
4.SERP的組成
了解了前面的谷歌索引,排名系統(tǒng)和排名系統(tǒng)之后,最后就是SERP的部分了,SERP是谷歌搜索結(jié)果展現(xiàn)頁(yè)的簡(jiǎn)稱.
上圖是一個(gè)典型的現(xiàn)代SERP,包含了很多元素,包括網(wǎng)頁(yè),圖片,知識(shí)卡片和People also ask這些,不久的將來還會(huì)加上SGE這些,那么這些和我們做SEO有什么關(guān)系呢?
簡(jiǎn)單來說,出現(xiàn)的位置=流量的多少.
不管是網(wǎng)頁(yè)排名,我們還有很多其他可以著力的地方.
優(yōu)化標(biāo)題,meta desrciption,視頻,圖片,圖片描述,優(yōu)化內(nèi)容以贏得Feature snippet等都能幫助我們贏得排名的機(jī)會(huì),從而獲得提高排名,獲得流量.
結(jié)論
Nayak的證詞為我們揭開了Google搜索和排名機(jī)制的神秘面紗。
這份證詞確認(rèn)了Google運(yùn)用多種算法和機(jī)器學(xué)習(xí)模型來確定網(wǎng)頁(yè)的排名,
同時(shí)強(qiáng)調(diào)了用戶行為數(shù)據(jù)、社交媒體信號(hào)和付費(fèi)廣告對(duì)排名的顯著影響。
對(duì)SEO專家而言,這些信息是極其寶貴的。
關(guān)鍵的見解是,SEO策略應(yīng)該集中在打造高品質(zhì)、相關(guān)性強(qiáng)且對(duì)用戶友好的內(nèi)容上。這樣的內(nèi)容更有可能獲得搜索結(jié)果中的高排名。
其次,不要忽視點(diǎn)擊的重要性。點(diǎn)擊是衡量頁(yè)面質(zhì)量的重要信號(hào)。
用戶黏性,停留時(shí)長(zhǎng)等都要考慮.
第三,了解Google使用的各種排名信號(hào)。這將有助于您創(chuàng)建更有可能獲得較高排名的頁(yè)面。
掃描二維碼推送至手機(jī)訪問。
版權(quán)聲明:本文由【平哥SEO學(xué)堂】整理發(fā)布,如需轉(zhuǎn)載請(qǐng)注明出處。






