亚洲欧美日韩熟女|做爱高潮视频网址|国产一区二区三级片|国产Av中文字幕www.性色av|亚洲婷婷永久免费|国产高清中文字幕|欧美变态网站久re视频精品|人妻AV鲁丝第一页|天堂AV一区二区在线观看|综合 91在线精品

Google優(yōu)化算法內(nèi)幕被扒,2500頁大小文檔實(shí)名泄露,搜索排名謊言暴露。

2024-06-01

【導(dǎo)讀】剛剛,一份2500頁的內(nèi)部文件泄露,谷歌優(yōu)化算法的內(nèi)幕,讓很多人大吃一驚。


近日,谷歌2500頁內(nèi)部文件被曝光,曝光搜索——「網(wǎng)絡(luò)上最強(qiáng)大的仲裁者」運(yùn)行模式。


SparkToro是SparkToro的聯(lián)合創(chuàng)始人和CEO,他在自己的網(wǎng)站上發(fā)表博客文章,聲稱「一個(gè)匿名者和我分享了谷歌搜索API文檔的1000多頁泄露,SEO中的每個(gè)人都應(yīng)該看到。」!


多年來,Rand 在SEO領(lǐng)域,F(xiàn)ishkin一直是SEO領(lǐng)域(Search Engine Optimization,頂級(jí)代言人,搜索引擎優(yōu)化),「網(wǎng)站權(quán)威性」(Domain Rating)他提出了這個(gè)概念。


因?yàn)樵谶@一領(lǐng)域德高望重,Rand 在Fishkin爆料之前,自然要仔細(xì)檢查這個(gè)身份不明的匿名者。


上個(gè)星期五,在發(fā)了幾封電子郵件之后,Rand Fishkin和這個(gè)神秘的人進(jìn)行了視頻聊天,當(dāng)然,對(duì)方并沒有露面。


這個(gè)電話讓Rand了解了更多關(guān)于這個(gè)泄露文件的信息:這是一個(gè)超過2500頁的API文件,其中包含了14014個(gè)Attributes,這些特征似乎來自Google的內(nèi)部。「Content API Warehouse」。


該代碼于2024年3月27日上傳至GitHub,并于2024年5月7日被刪除,這是文檔提交的歷史記錄。


通話結(jié)束后,Rand決定了匿名人士的工作經(jīng)歷和他們?cè)跔I(yíng)銷領(lǐng)域認(rèn)識(shí)的人。他決定滿足匿名人士的期望——發(fā)表一篇文章分享泄露,并駁斥谷歌員工?!付嗄陙硪恢眰鬟_(dá)的一些謊言」。


Matt Cutts、Gary Ilyes和John 多年來,Mueller否認(rèn)谷歌將基于點(diǎn)擊的用戶數(shù)據(jù)用于排名。


關(guān)于沙盒、點(diǎn)擊量、停留時(shí)間等影響SEO的因素,Rand的文章是谷歌之前強(qiáng)烈否認(rèn)的。


這篇文章一發(fā)表,果然立刻引起了輿論的嘩然,特別是SEO圈的特別關(guān)注。



另一位SEO專家Mikee King還發(fā)表文章,揭示谷歌「算法的秘密」。


Mike King說,「泄露的文件涉及谷歌收集和使用哪些數(shù)據(jù),谷歌將哪些網(wǎng)站推廣到選舉等敏感話題,谷歌如何處理小網(wǎng)站等話題?!?/p>


許多資料表明,谷歌多年來并沒有完全真實(shí)地報(bào)道,「文件中的一些信息似乎與谷歌代表的公開聲明相沖突?!?/p>


面臨著大家的質(zhì)疑,谷歌選擇沉默,拒絕發(fā)布這次爆炸性泄漏的帖子。


主人沒有說話,而是一個(gè)神秘的人出現(xiàn)了,他之前匿名提供消息。5月28日,神秘人終于決定帶頭,發(fā)布了一段視頻,視頻中公布了他的身份。


他的名字叫Erfan Azimi,同時(shí)也是SEO從業(yè)者,EA Eagle Digital的創(chuàng)始人。


因此,既然Erfan Google內(nèi)部提供的Azimi文檔?!窩ontent API Warehouse」,有必要知道谷歌API是什么意思? Content Warehouse,而這份文件究竟泄露了什么?


谷歌搜索「黑箱」



這個(gè)泄密事件似乎來自GitHub,最可靠的解釋和Erfan 在通話中,Azimi告訴Rand的協(xié)議:


由于文件中的許多鏈接指向個(gè)人GitHub倉庫,以及谷歌公司網(wǎng)站上需要具體認(rèn)證登錄的內(nèi)部頁面,因此這些文件可能會(huì)在短時(shí)間內(nèi)被公開。


API文檔在2024年3月至5月這段可能是偶然的公開時(shí)間內(nèi)被傳播到Hexdocs(搜索公開的GitHub倉庫),并被他人發(fā)現(xiàn)和傳播。


令Rand疑惑的是,他確信其他人也有一份副本,但是直到這次爆料之前,這份文件才被公開討論。


根據(jù)谷歌前開發(fā)人員的說法,幾乎每個(gè)谷歌團(tuán)隊(duì)都有這樣一份文件,用來解釋各種API屬性和模塊,幫助項(xiàng)目人員熟悉可用的數(shù)據(jù)元素。


該泄漏信息符合GitHub公共倉庫和谷歌云API文檔中的其它信息,采用相同的符號(hào)風(fēng)格、格式,甚至流程/模塊/功能名稱和引用。


「API Content Warehouse」它聽起來像一個(gè)技術(shù)術(shù)語,但是我們可以把它看作是谷歌搜索引擎團(tuán)隊(duì)成員的指南。


就像圖書館里的書目錄一樣,谷歌用它來告訴員工有哪些書,以及如何獲得。


但不同的是,圖書館是公開的,谷歌搜索是世界上神秘而嚴(yán)格的黑匣子之一。在過去的20年里,谷歌搜索部門從未發(fā)生過如此大規(guī)?;蛟敿?xì)的泄露事件。


「泄露」了什么?


1. 使用用戶點(diǎn)擊數(shù)據(jù)

文件中的一些模塊被提及「goodClicks」、「badClicks」、「lastLongestClicks」、印象、擠壓、未擠壓、獨(dú)角獸點(diǎn)擊等功能。這與Navboost和Glue有關(guān),看過谷歌司法部證詞的人可能對(duì)這兩個(gè)詞并不陌生。


下面是Kenneth司法律師 搜索質(zhì)量團(tuán)隊(duì)的Dintzer搜索副總裁Panduu 關(guān)于Nayak交叉詢問的摘錄:


Q. 所以請(qǐng)?zhí)嵝盐?,Navboost是否可以追溯到? 2005 年?


A. 這一范圍內(nèi),甚至可能更早。


Q. 已更新,已不再是當(dāng)年的Navboost了?


A. 不是了


Q. 還有一個(gè)是glue,對(duì)嗎?


A. glue只是Navboost的另一個(gè)名稱,它包含了頁面上所有其他功能。


Q. 好吧。本來打算以后再談,但是現(xiàn)在可以談了。正如我們所討論的,Navboost可以產(chǎn)生網(wǎng)頁結(jié)果,對(duì)嗎?


A. 是的。


Q. glue也可以處理網(wǎng)頁中所有不是網(wǎng)頁結(jié)果的內(nèi)容,對(duì)嗎?


A. 沒錯(cuò)。


Q. 他們共同幫助找出我們搜索結(jié)果中最終顯示的內(nèi)容并進(jìn)行排名?


A. 沒錯(cuò)。他們都是這方面的信號(hào),沒錯(cuò)。



這個(gè)泄露的API文件支持Nayak先生的證詞,并且與Google網(wǎng)站的質(zhì)量專利保持一致。


Google似乎有辦法過濾掉他們不想計(jì)入排名系統(tǒng)的點(diǎn)擊量,并將他們想要計(jì)入排名系統(tǒng)的點(diǎn)擊量納入其中。


它們似乎也可以衡量點(diǎn)擊時(shí)間。(pogo-sticking,指搜索者在點(diǎn)擊結(jié)果后,迅速點(diǎn)擊返回按鈕,因?yàn)閷?duì)找到的答案不滿意)和印象。


2. 點(diǎn)擊流程征用Chrome

谷歌代表多次表示,它不會(huì)使用Chrome數(shù)據(jù)對(duì)頁面進(jìn)行排名,但是在相關(guān)網(wǎng)站如何在搜索中顯示泄露文檔的部分,尤其是Chrome。


透露文件的匿名消息來源表示,早在2005年,谷歌就希望獲得數(shù)十億互聯(lián)網(wǎng)用戶的完整點(diǎn)擊流,他們已經(jīng)通過Chrome瀏覽器得到了他們想要的。


API文檔顯示,谷歌可以使用Chrome瀏覽器來計(jì)算幾個(gè)與單頁和整個(gè)域相關(guān)的指標(biāo)。


本文介紹了谷歌如何創(chuàng)建Sitelinks的相關(guān)功能,特別有趣。


它展示了一個(gè)名為topUrl的調(diào)用,即 「A list of top urls with highest two_level_score, i.e., chrome_trans_clicks.」


由此可以推斷,谷歌很可能已經(jīng)使用了。 Chrome 在瀏覽器中點(diǎn)擊網(wǎng)頁的次數(shù),從而確定平臺(tái)上最受歡迎或最重要的頁面。 URL,這樣就可以計(jì)算出哪些URL應(yīng)該包含在Sitelinks功能中。


通過跟蹤數(shù)十億Chrome用戶的點(diǎn)擊量,谷歌搜索結(jié)果中總能顯示出用戶訪問量最大的頁面。


網(wǎng)民們當(dāng)然對(duì)谷歌的這種行為表示不滿。



3. 建立嚴(yán)肅話題白名單

通過它并不難「高質(zhì)量的旅游網(wǎng)站」 這個(gè)模塊得到了一個(gè)推理——谷歌在旅游領(lǐng)域有一個(gè)白名單,雖然不清楚這是否是專門用于谷歌的。「旅游」搜索選項(xiàng),或者更廣泛的網(wǎng)絡(luò)搜索。


另外,文檔中提到的很多地方。 「isCovidLocalAuthority」(新冠當(dāng)?shù)貦?quán)威)和 「isElectionAuthority」(選舉權(quán)威)進(jìn)一步說明谷歌正在管理特定域名的白名單,用戶搜索有爭(zhēng)議的問題時(shí)可能會(huì)優(yōu)先顯示這些域名。


例如,在2020年美國(guó)總統(tǒng)大選之后,一位候選人聲稱選票被盜,沒有證據(jù),并鼓勵(lì)他的追隨者沖擊國(guó)會(huì)山。


如果他們的搜索引擎返回了不準(zhǔn)確描述選舉證據(jù)的宣傳網(wǎng)站,那么谷歌幾乎肯定會(huì)成為人們首先搜索此事相關(guān)信息的地方之一,這可能會(huì)直接導(dǎo)致更多的爭(zhēng)論、暴力甚至美國(guó)民主的結(jié)束。


從這個(gè)角度來看,白名單有其實(shí)際意義。Rand Fishkin說「對(duì)于那些希望繼續(xù)自由公正選舉的人來說,我們應(yīng)該非常感謝谷歌的工程師們?cè)谶@種情況下使用了白名單?!?/p>


4. 使用人工評(píng)價(jià)網(wǎng)站質(zhì)量


長(zhǎng)久以來,谷歌一直有一個(gè)質(zhì)量評(píng)級(jí)平臺(tái)叫做EWOK。我們現(xiàn)在有證據(jù)表明,質(zhì)量評(píng)估者的一些元素被用于搜索系統(tǒng)。


Rand Fishkin認(rèn)為,EWOK質(zhì)量評(píng)估者產(chǎn)生的分?jǐn)?shù)和數(shù)據(jù)可以直接參與谷歌的搜索系統(tǒng),而不僅僅是實(shí)驗(yàn)訓(xùn)練集。


這些可能性是肯定的「僅用于檢測(cè)」,但在瀏覽泄露的文檔時(shí),你會(huì)發(fā)現(xiàn),當(dāng)這是真的時(shí)候,它會(huì)在注釋和模塊的詳細(xì)信息中明確指出。


其中提到的「每個(gè)文檔的相關(guān)性評(píng)級(jí)」即來自 EWOK 評(píng)價(jià),雖然沒有詳細(xì)的說明,但是我們很容易想象,人類對(duì)網(wǎng)站的評(píng)價(jià)究竟有多重要。


文件也提到了「人工評(píng)級(jí)」(比如來自 EWOK 評(píng)級(jí)),并指出他們,「一般只在評(píng)估管道內(nèi)加充評(píng)估管道」,這表明它們可能主要是該模塊中的訓(xùn)練數(shù)據(jù)。


但Rand Fishkin認(rèn)為這仍然是一個(gè)很重要的角色,銷售人員不能忽視質(zhì)量評(píng)級(jí)人員對(duì)其網(wǎng)站的良好感知和評(píng)級(jí)有多重要。


5. 使用點(diǎn)擊數(shù)據(jù)確定權(quán)重。

谷歌將鏈接搜索分為三個(gè)等級(jí)(低、中、高質(zhì)量),點(diǎn)擊數(shù)據(jù)來確定網(wǎng)站屬于哪個(gè)等級(jí)。


- 若站點(diǎn)未被點(diǎn)擊,將進(jìn)入低質(zhì)量檢索,鏈接也將被忽略。


- 若站點(diǎn)來自可驗(yàn)證設(shè)備的點(diǎn)擊量較高,則會(huì)進(jìn)入高質(zhì)量檢索,并且鏈接會(huì)傳遞排名信號(hào)。


由于屬于更深層次的檢索,鏈接一旦成為 “可靠 “鏈接,它可以移動(dòng)PageRank和錨點(diǎn),或者被垃圾鏈接系統(tǒng)過濾/刪除。


低質(zhì)量的鏈接檢索鏈接不會(huì)損害網(wǎng)站的排名,它們只會(huì)被忽略。


網(wǎng)絡(luò)上最重要的系統(tǒng)是谷歌的優(yōu)化算法,它決定了不同網(wǎng)站的生死存亡和我們?cè)诰W(wǎng)上看到的內(nèi)容。


但它是如何對(duì)網(wǎng)站進(jìn)行排名的,長(zhǎng)期以來一直是一個(gè)謎。從事SEO工作的記者、研究人員和人們不斷拼接這個(gè)謎題的答案。


谷歌在這次泄漏事件中仍然裝聾作啞,似乎會(huì)讓這個(gè)謎題長(zhǎng)久存在。


但是這次谷歌到目前為止最嚴(yán)重的泄露,還是撕開了一個(gè)缺口,讓人們對(duì)搜索的工作原理有了前所未有的了解。


參考資料:


https://sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/


本文來自微信微信官方賬號(hào)“新智元”(ID:AI_era),編輯:庸庸 ,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com