Google搜尋引擎排名
什麼是Google炸彈?
Google炸彈(Google Bombing)指的是這樣一種情況:
1)數目眾多的網頁連結指向某一個URL
2)這些連結都使用特定關鍵詞做連結文字
3)被連結的URL中一般並不包括這個關鍵詞,內容和這個關鍵詞也基本無關
4)達到的效果就是這個被連結的URL在這個特定關鍵詞下,搜尋引擎排名急劇上升,很多時候都排到第一
Google炸彈大部分都是出於惡作劇,政治目的,做實驗等。
Google炸彈的實現是基於搜尋引擎排名算法中的兩個事實:
1)外部連結是排名的重要因素之一
2)連結文字很多時候比連結數量更重要
所以當有大量包括特定關鍵詞的連結指向某一個網頁的時候,這個網頁就算沒提到這個關鍵詞,排名也會非常好。
最有名的Google炸彈
就是美國白宮的這個例子。2003年10月,George Johnston成功號召人們用「miserable failure」(慘敗)這個關鍵詞做為連結文字,
連結向美國白宮網站布希總統的個人介紹頁。
兩個月後,在Google搜尋「miserable failure」的時候,布希的這個個人介紹頁升到第一,搜「failure」的時候也是第一。
而在這個頁面中,不論是miserable,failure,或是miserable failure,都沒有提到過。
06年9月,大概白宮有人試圖扭轉Google炸彈所造成的影響,把介紹布希的這個網頁做了JS轉向到介紹所有總統的一個通用網頁。
結果跳轉傳輸連結效果,這個並不是特別給哪一個總統準備的網頁,在搜尋「miserable failure」時排到了第一。
Google修改算法消除Google炸彈
07年1月,Google對算法做了修正,防止Google炸彈的發生。
對具體算法Google並沒做出解釋,也不太可能解釋,因為這涉及到了Google算法中非常核心的部分。
眾所周知,連結是Google排名中最重要的因素之一。
那麼這些連結中哪些會被賦予權重?哪些會降權?當然不會告訴我們。
在Google做了這個調整以後,大部分Google炸彈現象消失了。
搜尋「miserable failure」的時候,白宮的網頁已經找不到了。
猜想Google預防Google炸彈的考慮有這麼幾項:
1)短時間內大量外部連結指向某個網頁時,有可能是Google炸彈
2)這個網頁並沒有提到這些連結中所用的關鍵詞
3)若果這個關鍵詞是負面的
值得注意的是,Google算法改變後,這種負面性質的炸彈消失了。
但同樣的效應在普通關鍵詞上還是存在的。
比如大家搜尋「click here」的時候,排在第一的是Adobe Reader下載頁,而這個網頁上並不存在「click here」這個詞。
原因是大量網站用「click here」作連結文字指向了Adobe網頁,推薦人們下載Adobe Reader。
Google炸彈再次炸向白宮
這兩天在Google搜尋「failure」時,白宮這個網頁再次排到了第一名,不過這次是白宮自找的。
因為他們在網頁上放上了failure這個詞:
In a time of war, it』s irresponsible for the… Democratic leadership in Congress to delay for months on end while
our troops in combat are waiting for the funds. The bottom line is this: Congress』s failure to fund our troops on
the front lines will mean that some of our military families could wait longer for their loved ones to return from
the front lines. And others could see their loved ones headed back to the war sooner than they need to.
That is unacceptable to me, and I believe it is unacceptable to the American people.
這樣本來與failure這個詞不關聯的網頁,一下子變得關聯了,預防Google炸彈的算法失去了作用。
Google炸彈其實並不只存在於Google,大家去雅虎搜尋一下miserable failure,到現在為止,白宮網頁還是排在第一。
所以雖然叫Google炸彈,但其實現在Google已經修改,而雅虎等卻沒修改。
一直不太想說Google PR劫持這個話題,因為怕造成一些人刻意利用來騙其他的站長。
不過前幾天在點石有幾個帖子都涉及到了這個問題。
而且我再想想,若果有人就想欺騙,還是可以找到這個方法的。
不如在這裡公開討論一下,讓大家都知道,反而可以減少上當的可能性。
大家都知道,Google PR是站長們都在追逐的東西,雖然不一定對排名有多大用,但是光那一段工具條上的綠色,越長就越讓人興奮。
今天要談的就是PR劫持,也就是用欺騙手段獲得工具條上比較高的PR值顯示。方法是利用跳轉。
以前說過,一般搜尋引擎在處理301和302轉向的時候,都是把目的URL當作實際應該收錄的URL。
當然也有特例,不過在大部分情況下是這樣處理的。
所以若果你從域名A做301或302跳轉到域名B,而域名B的PR值比較高,域名A在PR更新後,也會顯示域名B的PR值。
有人就利用這一點,把自己的域名PR值刻意提高。
最簡單的就是先做301或302跳轉到高PR的域名B,等PR更新過後,立刻取消轉向,放上自己的內容,然後開始賣連結。
這個做假的PR顯示值至少維持到下一次PR更新,一般有兩三個月時間。
其他站長來到這個網站,看到的是一個高PR值,卻不知道這個PR值是通過轉向得到的,不是這個網站的PR值,而是另外一個網站的。
更隱諱一點的辦法是,通過程式檢驗到Google蜘蛛,返回301或302轉向,對普通訪問者和其他蜘蛛都返回標準內容。
這樣我們看到的是普通網站,只有Google會看到轉向。
比如下面這段PHP代碼就可以達到這個效果:
if (strstr($_SERVER[』HTTP_USER_AGENT』], 「Googlebot」)) {
header(」HTTP/1.1 301 Moved Permanently」);
header( http://www.apple.com/);
exit;
}
else {
header(』Content-Type: text/html; charset=ISO-8859-1′);
};
?>
這裡開始普通HTML碼
我不懂寫程式,上面只是大概意思,不一定準確。懂PHP的人一看就知道該怎麼寫了。
這兩種手段得到的PR值,都不是自己域名真實的PR值。
一般這樣得到PR值的人的目的也很明顯,就是為了賣連結,賣PR。
若果賣連結的訴求是廣告性的直接點擊流量,還有情可原,若果主要訴求或唯一訴求就是高PR值,這無疑就是欺騙。
這種網站上的連結對PR值沒有任何貢獻。
那麼怎樣鑒別這種欺騙得來的PR值呢?
最準確的當然就是看Google的網頁快照,若果你看到的網頁是一個樣,Google快照看到的卻是另外一個網站,
一般網站標題和logo都會顯示出來,這恐怕就非常可疑了。
另外一個值得注意的是,在尋找和買連結的時候,若果對方炫耀的就是高PR值,都要非常小心。
建立連結應該以內容的關聯性為最主要的考量,PR高低對實際排名影響沒有很多人想像的那麼重要。
Google與一家名為渡虎谷(英文名為Doragle)的公司在今年4月1號簽訂了一份備忘錄,使渡虎谷成為唯一獲Google授權的SEO軟體。
一直以來,Google對使用軟體進行查詢和改善都持反對態度。
在Google的站長指南中明確提出,使用軟體自動查詢Google資料庫是違反Google規則的。
不過由於任何人可能使用軟體查詢競爭對手的排名情況,所以估計不太可能因為使用這種查詢軟體對排名造成影響,
有可能的只是封掉使用這個軟體
的IP位址。
在這份與渡虎谷簽訂的備忘錄中,Google同意渡虎谷軟體向Google資料庫發出自動查詢,甚至給渡虎谷提供Google排名算法中的一些資訊。
當然出於一些顯而易見的防作弊理由,對這個公司和軟體做出了一些限制。
軟體只可以運行於伺服器端(server side),不可以做成桌面軟體(desktop software),
這樣Google可以從URL知道這些自動查詢是來自於授權軟體的。
基於Google的一貫風格,渡虎谷軟體將免費提供所有人使用,而且渡虎谷公司不可以提供任何形式的SEO咨詢和服務。
軟體介面和渡虎谷網站可以放贊助和廣告。
渡虎谷軟體將包括30項Google排名算法參數(據說Google考慮的排名參數有200項之多),
這30項因素都是已經被大家熟知而且不容易作弊的。
渡虎谷軟體只可以提醒使用者,網站的某一項因素已經超出了Google可以忍受的範圍,不容許提供改進的建議。
比如若果你的網頁標題過長,有垃圾之嫌,軟體可以給出警示,但不可以給出參考過Google算法後的最佳標題寫法。
這個項目本該在備忘錄簽署一週年的時候上線,不過最近卻傳出了爭執,問題在於渡虎谷是否可以公開宣佈他們的軟體是經由Google授權的。
Google認為自己不適合背書任何此類軟體,但渡虎谷負責人斯通認為,若果有人問起這個問題,Google不是肯定就是否定,
模稜兩可的回答大概會被認為是肯定。但若果Google否定這一點,那麼這個項目可能就毫無意義了。
對Google來說,同意進行這個項目合作的出發點是使網站的搜尋引擎友好性提高,減少無意中造成的垃圾和黑帽手段,
同時避免被作弊者利用。但怎麼掌握好平衡,真的不被人利用,卻是很大的一個難題。
另外讓人很感興趣的是,渡虎谷軟體是否會造成SEO服務商之間的不公平。
雖然Google不容許渡虎谷提供SEO服務,也肯定不容許洩露具體的算法,但怎麼保證呢?
樓主發現他的一個網站很長時間排名第一,不過近幾天排名降到31,整整下降30位,並且排名穩穩的就停在那裡了。
不少跟帖的人也發現類似的問題,都是原來排名第一的,下降整整30位。
這個懲罰不是線性的,若果原來排名在第二的,可能下降的就是50位60位了。
有的人認為,這種排名下降30位懲罰和連結錨文字過度改善有關,有的人認為和Google的人工審查有關。
被稱為小Matt Cutts的Adam(幾個月前加入Google的新員工,負責與站長社區溝通)在Google Group裡面回答這個問題時說:
你是不是確認你的網站提供獨特的內容?
大部分使用者是不是覺得你的網站比其他網站更有用?
你的網站是否遵守了Google的站長指南?
有人繼續問,說的這三條好像並沒回答上面的問題。Adam再次強調說,這三條已經清楚的解釋了這個問題。
Adam並沒有承認也沒有否認這種懲罰是否真實存在,而是直接列出了可能的原因,這大概是暗示這種懲罰是存在的。
他列出的這三條原因都是老生常談,卻很符合邏輯。
站長世界的管理員tedster認為,Adam的解釋已經再清楚不過了。他覺得這顯示著Google排名算法的進步。
以前站長們所用的SEO技術,可能都是零星的,這兒改善一點那兒改善一點,每個技術看起來也都是白帽技術。
不過當這些改善的地方加起來的時候,對Google來說就是個警訊。
Google不會因為某一項改善手段懲罰網站,但是它會檢驗所有的這些改善痕跡,當你超過一定限度的時候,懲罰就顯現出來了。
對單個網站來說,也許這種懲罰並不公平,使用SEO技術並不一定意味著網站的內容不好,或是沒有權威性。
但Google看的是總體,這種算法和懲罰是否能最大限度的清除搜尋結果中的垃圾?牽扯連累無辜是必然的,但是卻是可以忽略的。
某一個好的網站被懲罰,對站長來說是個災難,對使用者和Google來說,沒有什麼傷害,因為只要確保補上來的還是一個好的網站就可以了。
前天Google站長工具Webmaster Tools(也就是以前的Google Sitemaps)增加了幾個新功能,幻滅做了詳細的介紹。
以前也曾經談過Google Sitemaps,對瞭解Google是怎樣抓取和理解網頁有很大的幫助。
在這次新增加的工具當中,Google蜘蛛活動情況Googlebot activity比較吸引我的注意。
我發現我的兩個排名不太好的網站,從8月份以來,Google蜘蛛活動下降很多。而其他標準的網站,Google蜘蛛活動沒有什麼明顯的變化。
記得以前Matt Cutts曾經說過,在Google眼裡,總體質量不高的網站抓取頻率會比較低。
那麼Google自己顯示的這個圖表,是否能在某種程度上說明網站在Google眼裡的權威度和信任度呢?很值得觀察。
另外一個,我在自己的帳號裡看到和幻滅的截屏不一樣的是,我所有網站自訂抓取頻率中」更快」都是不可以選的,上面有一行文字,」
Google抓取是由很多因素決定的,目前抓取頻率不是你網站抓取的一個因素。」
這說明我的網站沒辦法要求更快抓取,這是因為Google認為我的網站無法承受更多負荷,還是說明我的網站一切標準不必再加快呢?
非常建議所有的站長建立Google站長工具帳號。不過不在萬不得已的情況下,不要提交Google Sitemaps,觀察其他資訊就好了。
很多站長反映提交了Sitemaps後,收錄數反倒急劇下降。我自己沒有提交過Sitempas,因為所有的網站都沒有收錄問題。
只要網站結構合理,有一兩個高質量的連結,網頁收錄通常不會有什麼問題。
在這方面多一事不如少一事是比較好的態度,沒問題的時候就不要自找麻煩。