站長之家(chinaz.com)11月30日報道:谷歌中文網(wǎng)管理員博客今日發(fā)表博文,針對重負內(nèi)容網(wǎng)頁的URL選擇做了相關(guān)解析。即谷歌發(fā)現(xiàn)一組重復(fù)內(nèi)容網(wǎng)頁時,Google算法會選出一個有代表性的URL。一組網(wǎng)頁可能包含來自相同或不同網(wǎng)站的URL。從一組不同的網(wǎng)站中選出有代表性的URL,這種選擇就被稱為跨域選擇。
谷歌表示大多情況下,算法做出的選擇正確反映了網(wǎng)站管理員的意圖。但是在極少情況下,谷歌發(fā)現(xiàn)網(wǎng)站管理員不明白為何算法會做出此種選擇,也不知如何處理,他們認為算法的選擇是錯誤的。為了使跨域URL選擇過程更透明,谷歌特意發(fā)布了此文,探討各種可能出現(xiàn)跨域URL選擇的情況,以及如何修復(fù)那些站長認為是錯誤的情況。
以下是博客內(nèi)容全文:
一份內(nèi)容一般可通過多個URL獲得,而非全部集中在同一域名。幾年來我們把用多個URL獲得同一份內(nèi)容,稱為重復(fù)內(nèi)容。 發(fā)現(xiàn)一組重復(fù)內(nèi)容網(wǎng)頁時,Google算法會選出一個有代表性的URL。一組網(wǎng)頁可能包含來自相同或不同網(wǎng)站的URL。從一組不同的網(wǎng)站中選出有代表性的 URL,這種選擇就被稱為跨域選擇。舉個簡單的例子,如果一組URL中一個來自a網(wǎng)站,一個來自b網(wǎng)站,我們的算法選擇了來自b網(wǎng)站的URL,那么a網(wǎng)站 的URL就無法再在我們的搜索結(jié)果中顯示,并且與此內(nèi)容相關(guān)的搜索流量也會下降。
網(wǎng)站管理員通過使用一個目前支持的機制,比如rel="canonical" elements 或 301 重定向 來指示他們的首選URL,這在很大程度上影響了我們算法的選擇結(jié)果。大多情況下,算法做出的選擇正確反映了網(wǎng)站管理員的意圖。但是在極少情況下,我們發(fā)現(xiàn)網(wǎng)站管理員不明白為何算法會做出此種選擇,也不知如何處理,他們認為算法的選擇是錯誤的。
為使跨域URL選擇過程更透明,我們正在發(fā)布新的有關(guān)網(wǎng)站管理工具的信息,試圖在我們的算法選擇了外部URL而非管理員網(wǎng)站的URL時對網(wǎng)站管理員給予提示。這些信息的工作原理細節(jié)可在關(guān)于該主題的幫助中心文章中找到,在本篇博文中我們將探討各種可能出現(xiàn)跨域URL選擇的情況,以及如何修復(fù)那些您認為是錯誤的情況。
引起跨域URL選擇的主要原因:
很多情況都會導(dǎo)致我們的算法進行跨域URL選擇。
多數(shù)情況下,網(wǎng)站管理員會發(fā)出能夠影響選擇結(jié)果的信號,我們的算法會根據(jù)此信號來選擇URL。例如,如果網(wǎng)站管理員按照我們的指南和最佳方法對網(wǎng)站進行遷移,這明顯表明新網(wǎng)站的URL才是他們希望Google選擇的。如果您正在遷移您的網(wǎng)站并在網(wǎng)站管理工具中看到這些新信息,您可以對我們算法給出的提示予以確認。
不過,我們經(jīng)??匆娋W(wǎng)站管理員提交問題說我們的算法選擇的URL與他們想選擇的不同。當(dāng)您的網(wǎng)站遇到跨域選擇,并且您認為該選擇不正確(比如選擇結(jié)果與您所預(yù)想的不符)時,您還可以運用一些策略來進行改善。這里有一些導(dǎo)致預(yù)料之外跨域選擇URL的常見原因,以及改善方法:
1. 重復(fù)內(nèi)容,包括多域名網(wǎng)站上的內(nèi)容:我們常見到網(wǎng)站管理員在多個域名上使用同種語言和相似的內(nèi)容。這有時是疏忽所致,有時是以地理區(qū)域為標(biāo)準來決定顯示語言種類的。例如,在域名為.com 和.net的網(wǎng)站上,管理員通常會使用英語作為顯示語言,而在域名為 .de, .at,和.ch的網(wǎng)站則使用德語作為顯示語言。
根據(jù)網(wǎng)站和用戶的不同,您可以使用一種目前支持的標(biāo)準化技術(shù)來提示算法您希望選擇的URL。以下是關(guān)于此主題的文章,僅供參考:
* 規(guī)范化, 尤其是 rel="canonical" elements 和 301 重定向
* 多域名及多語言網(wǎng)站 以及管理多區(qū)域網(wǎng)站
* 關(guān)于 rel="alternate" hreflang="x"
2. 配置錯誤: 一些錯誤的配置會使我們算法作出錯誤決定。出現(xiàn)錯誤配置的例子包括:
1.標(biāo)準化錯誤:錯誤使用規(guī)范化技術(shù)指向外部網(wǎng)站上的URL會使我們的算法在搜索結(jié)果中選擇外部URL。我們曾在配置錯誤的內(nèi)容管理系統(tǒng)(CMS)或網(wǎng)站管理安裝的CMS插件上遇到過此類問題。
要修復(fù)此類狀況,需查清您的網(wǎng)站是如何錯誤指示規(guī)范URL偏好的(例如:通過錯誤使用了一個rel="canonical"元素或錯誤使用了301重定向)并進行修復(fù)。
2.服務(wù)器配置錯誤:有時我們會遇到主機托管配置錯誤的情況-a網(wǎng)站內(nèi)容被返回b網(wǎng)站的URL。當(dāng)兩個無關(guān)的網(wǎng)站服務(wù)器返回相同軟 404 頁面而我們又未能發(fā)現(xiàn)此錯誤網(wǎng)頁時,以上類似狀況會再次出現(xiàn)。這兩種情況中,我們都會認為相同內(nèi)容正從兩個不同網(wǎng)站返回,而我們的算法可能錯誤地將a網(wǎng)站的URL選做了B網(wǎng)站URL的規(guī)范偏好。
您需要調(diào)查網(wǎng)站服務(wù)基礎(chǔ)設(shè)施的哪部分配置有誤。例如,在遇到錯誤網(wǎng)頁時,您的服務(wù)器返回的可能是HTTP 200(成功)狀態(tài)代碼,也可能會混淆其托管的不同域名的要求。一旦查到問題的根本原因,您要和服務(wù)器管理員一起矯正配置進行。
3. 惡性網(wǎng)站攻擊:一些網(wǎng)站攻擊會引入導(dǎo)致不良標(biāo)準化的代碼。例如,惡性代碼可能導(dǎo)致網(wǎng)站返回HTTP 301 重定向 或在HTML 或HTTP header中插入一個跨域rel="canonical" 鏈接元素,這通常會指向一個托管惡性內(nèi)容的外部URL。該情況下,我們的算法可能選擇惡性或垃圾URL而非默認網(wǎng)站上的URL。
碰到這種情況,請按照我們的網(wǎng)站清理指南進行操作并在清理完成后遞交重新審核請求。如果想要識別cloaked攻擊,您可以使用網(wǎng)站管理工具中的Googlebot 抓取功能,這樣您看到的網(wǎng)頁內(nèi)容便會和在Googlebot上看到的一樣。
極少情況下,我們的算法會未經(jīng)您的允許,就選擇那些包含您網(wǎng)站內(nèi)容的外部網(wǎng)站的URL。如果您認為另一網(wǎng)站復(fù)制了您網(wǎng)站上的內(nèi)容,違反了版權(quán)法,請聯(lián)系網(wǎng)站托管主機,填寫數(shù)字千年版權(quán)法案政策申請刪除那些侵權(quán)網(wǎng)頁。
總之,如果您在如何認定錯誤原因或修復(fù)辦法方面需要幫助,您可以瀏覽我們關(guān)于此主題的幫助中心的文章并在我們的網(wǎng)站管理員幫助論壇上提問。
(舉報)