close

XML 網頁設計 技巧

熬左半個通宵,寫左自己既Google SiteMap文件,係呢度寫出詳細教程,願對大家有所幫助。

Google SiteMap既作用及協議格式詳解

Google SiteMap Protocol係Google自己推出既一種站點地圖協議,此協議文件基於早期既robots.txt文件協議,並有所升級。在Google官方指南中指出加入了Google SiteMap文件的網站將更有利於Google網頁爬行機器人的爬行索引,咁會提高索引網站內容的效率和準確度。文件協議應用左簡單既XML格式,一共用到6個標籤,其中關鍵標籤包括連結地址、更新時間、更新頻率和索引優先權。

Google SiteMap文件生成後格式如下:


<!--StartFragment-->
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
<url>
<loc>http://www.chinaz.com</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.chinaz.com/300687.html</loc>
<lastmod>2005-06-02T20:20:36Z</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>

XML標籤

  • changefreq:頁面內容更新頻率。
  • lastmod:頁面最後修改時間
  • loc:頁面永久連結地址
  • priority:相對於其他頁面的優先權
  • url:相對於前4個標籤的父標籤
  • urlset:相對於前5個標籤的父標籤

我將一句一句分解講解呢個xml文件既每一個標籤:

  1. &amp;amp;amp;lt;urlset xmlns=&amp;amp;amp;quot;http://www.google.com/schemas/sitemap/0.84&amp;amp;amp;quot;&amp;amp;amp;gt;呢行定義左此xml文件既命名空間,相當於網頁文件中既<html>標籤一樣的作用。
  2. &amp;amp;amp;lt;url&amp;amp;amp;gt;呢個係具體某一個連結既定義入口,你所希望展示在SiteMap文件中既每一個連結都要用<url>和</url>包含在裡面,這是必須的。
  3. <loc>http://www.chinaz.com</loc>
  4. 用<loc>描述出具體的連結地址,呢度需要注意既係連結地址中既一d特殊字符必須轉換為XML(HTML)定義的轉義字符,如下表: 字符 轉義後的字符 HTML字符 字符編碼
    and(和) & &amp; &#38;
    單引號 &apos; &apos; &#39;
    雙引號 " &quot; &#34;
    大於號 > &gt; &#62;
    小於號 < &lt; &#60;
  5. &amp;amp;amp;lt;lastmod&amp;amp;amp;gt;2005-06-03T04:20:32-08:00&amp;amp;amp;lt;/lastmod&amp;amp;amp;gt;<lastmod>係用黎指定該連結的最後更新時間,呢個好重要。Google既機器人會在索引此連結前先和上次索引記錄的最後更新時間進行比較,如果時間一樣就會跳過不再索引。所以如果你既連結內容基於上次Google索引時的內容有所改變,應該更新該時間,讓Google下次索引時會重新對該連結內容進行分析和提取關鍵字。呢度必須用ISO 8601中指定的時間格式進行描述,格式化的時間格式如下:
    • 年:YYYY(2005)
    • 年和月:YYYY-MM(2005-06)
    • 年月日:YYYY-MM-DD(2005-06-04)
    • 年月日小時分鐘:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37 08:00)
    • 年月日小時分鐘秒:YYYY-MM-DDThh:mmTZD(2005-06-04T10:37:30 08:00)
    呢度需注意既係TZD,TZD指定就係本地時間區域標記,像中國就係 08:00了
  6. &amp;amp;amp;lt;changefreq&amp;amp;amp;gt;always&amp;amp;amp;lt;/changefreq&amp;amp;amp;gt;用呢個標籤告訴Google此連結可能會出現既更新頻率,比如首頁肯定就要用always(經常),而對於好耐前既連結或者唔再更新內容既連結就可以用yearly(每年)。呢度可以用來描述的單詞共這幾個:"always", "hourly", "daily", "weekly", "monthly", "yearly",具體含義我就唔解釋鄞,單睇單詞既意思就明白。
  7. &amp;amp;amp;lt;priority&amp;amp;amp;gt;1.0&amp;amp;amp;lt;/priority&amp;amp;amp;gt;<priority>係用來指定此連結相對於其他連結的優先權比值,此值定於0.0 - 1.0之間
  8. 還有</url>和</urlset>,呢兩個就係來關閉xml標籤的,這和HTML中的</body>和</html>係一個道理
  9. 另外需要注意的是,呢個xml文件必須係utf-8的編碼格式,不管你係手動生成定係通過代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡單既方法就是用記事本打開xml然後另存為時選擇編碼(或轉換器)為UTF-8。

登陸Google提交你的SiteMap文件,讓Google開始爬行吧打開

https://www.google.com/webmasters/sitemaps/連結,如果還沒有註冊或者登陸Google,就先用自己的帳號登陸Google,登陸後轉到Your Sitemaps狀態頁面,可以點擊那個Add a Sitemap 跳轉到提交頁面進行Sitemap文件的提交。建議文件放在你的站點根目錄下。給Google提交你的Sitemap URL後可以看見在列表裡已存在,不過這時候還沒有生效,必須過幾個小時後Status欄變成OK表示正式生效,如果不是OK,可以查看Google給出的狀態標示解釋看看是什麼原因

arrow
arrow
    全站熱搜

    dettori 發表在 痞客邦 留言(0) 人氣()