2008年10月22日

網站登錄Google與網站設計

對網友來說,沒有比Google將自己嘔心瀝血建好的網站拒之門外更讓人鬱悶的事了。的確,就目前Google所處的地位來說,將自己的網站登錄 Google搜尋引擎成了站主們心中的頭等大事。可有時就是天不隨人願,花好大代價建成的網站,誰見了都被迷得五迷三道,而讓對面的Google看過來, 它卻不理不睬,搞得站主們心裡直犯嘀咕:我到底哪兒得罪Google了?

  其實在對待收錄網站的問題上,Google還是相當寬容的,而且從掃瞄技術上說它也是最全面的,不過萬一你的網站得不到Google的賞識,不仿從以下幾個方面找找原因(請首先確認Google的確沒收錄你的網站):


  網站設計是否搜尋引擎友好
  1、純Java網站


  如果你的網站是用純Java設計的,那麼就要小心了,因為Google曾在一些場合明確表示過不會收錄用純Java技術製作的網站。


  2、Flash網站


  如果你的網站大量使用Flash,例如首頁為一個Flash動畫,並且連結內嵌在Flash中,對這種網站Google是不太感冒的,而且一些 搜尋引擎(Google、Fast/AllTheWeb等)雖然已能解讀圖像中的內嵌文字和連結,但並未正式使用在對內部網頁的檢索上。


  3、純圖像首頁


  目前許多網站(尤其是企業網站)將首頁設計成僅包含圖像的形象頁面(splash page),加上網站內容太少,因此常常造成無法成功登錄Google。聽聽Google對此是怎麼說的:「We want to point users to content pages,not to doorways or splash screens」。


  4、網頁框架(frameset)


  Google可以檢索使用網頁框架結構的網站,但由於搜尋引擎工作方式與一般的網頁瀏覽器不同,因此會造成返回的結果與用戶的需求不符,這是搜 尋引擎所極力要避免的,所以Google在收錄網頁框架結構的網站時還是有所保留的。如果你非用框架結構不可,可以將相關內容放在標籤中。


  5、動態網頁


  Google是較早支持動態網頁檢索的搜尋引擎之一,但有一定限度,Google的解釋是:「because our web crawler can easily overwhelm and crash sites serving dynamic content, we limit the amount of dynamic pages we index」。


  不過據我們觀察,Google現在對動態網頁的支持很好。但如果動態網頁存在回路(loop),很容易將spider套住讓它無法脫身,所以當你找不到其他無法登錄Google的原因時,可以試著將動態網頁改成靜態html文件。


  6、網站內部連結


  網頁之間的連結最好是文字連結,其次是圖像連結。雖然Google已能跟蹤和解析JavaScript和Flash中內嵌的連結,但從搜尋引擎友好的角度講還是不要大量採用JavaScript和Flash連結。


  網站/網頁訪問是否正常
  1、網站訪問速度


  你也許想不到,網站訪問速度太慢也是影響成功註冊Google引擎的原因。這方面我們是有「血」的教訓的。如果發現網站響應速度過慢,建議你趕快換一個主機。如果你對登錄Google是認真的,多花些錢還是值得的。


  2、網頁大小


  雖然網頁大小不是最關鍵的因素,但從搜尋引擎友好的角度說,下載越快的網頁被成功收錄的幾率也就越大。至於網頁字節數多少合適沒有一個正式的標 準,一般說法是不超過50K,不過有一點是肯定的,如果你做一個100多K的網頁,無論對搜尋引擎還是普通瀏覽者來說都不是件好事吧?


  3、更改文件名


  對網站進行調整時要注意,不要對網頁文件名做過多地更改。當Google探測到用戶點擊的多數是無效連接時,會將你的網頁從搜尋結果中摘除。如 果你必須大面積更改文件名,可以使用主機的301轉發功能,將原來的連結指向新的文件(切記不要在原頁面設置META Refresh轉發)。