網站地圖(站點地圖)工具及制作方法

2019年12月6日19:07:52網站地圖(站點地圖)工具及制作方法已關閉評論 357

網站地圖站點地圖)工具及制作方法
什么是網站地圖
網站地圖,又叫站點地圖,它就是一個列出了你網站上所有頁面地址的清單文件,一般來說分為2種,一種是給搜索引擎看的,一種是給用戶看的,前者幫助搜索引擎更好地收錄你的網站,后者幫助用戶更好的了解你的網站整體結構、更快的找到他們想要找的內容。本文講的主要是前者。
站點地圖格式
一般有3種格式,txt、xml、html,絕大部分情況下都是用xml格式,百度、谷歌都是支持xml格式。下面簡單介紹3種格式。
2.1. txt格式
這種格式最簡單,一般較少采用,示例如下:

  http://liuxianan.com/
  http://liuxianan.com/link.html
  http://liuxianan.com/msgboard.html

注意事項:
文本文件每行都必須有一個網址。網址中不能有換行。
不應包含網址列表以外的任何信息。
您必須書寫完整的網址,包括 http。
每個文本文件最多可包含 50,000 個網址,并且應小于10MB(10,485,760字節)。如果網站所包含的網址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
文本文件需使用 UTF-8 編碼或GBK編碼。
2.2. xml格式
示例sitemap.xml如下:

  <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
  <loc>http://liuxianan.com/</loc>
  <lastmod>2016-09-06T00:00:16+08:00</lastmod>
  <changefreq>daily</changefreq>
  <priority>1.0</priority>
  </url>
  <url>
  <loc>http://liuxianan.com/link.html</loc>
  <lastmod>2016-09-06T00:00:16+08:00</lastmod>
  <changefreq>daily</changefreq>
  <priority>0.8</priority>
  </url>
  </urlset>

其中:
loc表示完整網址,必填項,長度不得超過256字節
lastmod表示本網頁最后修改時間,必須是ISO-8601時間格式,具體這個格式是什么樣的沒整清楚,根據我的理解,反正就當成是:yyyy-MM-ddTHH:mm:ss+08:00,最后面的+08:00應該表示的是東八區;
changefreq 表示更新頻率,可選值:always、hourly、daily、weekly、monthly、yearly、never
priority 用來指定此鏈接相對于其他鏈接的優先權比值,可選值 0.0-1.0,一般來說網站首頁1.0,然后二級三級頁面依次降低,具體這個屬性有多重要不太清楚。
以上4項中,除了loc是必填項之外,其它3個都不是必須的,但最好都寫上。
一個sitemap文件包含的網址不得超過 5 萬個,且文件大小不得超過 10 MB。如果您的sitemap超過了這些限值,請將其拆分為幾個小的sitemap。這些限制條件有助于確保您的網絡服務器不會因提供大文件而超載。一個站點支持提交的sitemap文件個數必須小于5萬個
下面從 百度站長平臺 復制的幾項QA:
Q:我提交時填寫的周期是什么含義?
A:百度Spider會參考設置周期抓取Sitemap文件,因此請根據Sitemap文件內容的更新(比如增加新url)來設置。請注意若url不變而僅是url對應的頁面內容更新(比如論壇帖子頁有新回復內容),不在此更新范圍內。Sitemap工具不能解決頁面更新問題。
Q:Sitemap提交后,多久能被百度處理?
A:Sitemap數據提交后,一般在1小時內百度會開始處理。在以后的調度抓取中,如果您的sitemap支持etag,我們會更頻繁抓取sitemap文件,從而及時發現內容更新;否則抓取的周期會比較長。
Q:提交的Sitemap都會被百度抓取并收錄嗎?
A:百度對已提交的數據,不保證一定會抓取及收錄所有網址。是否收錄與頁面質量相關。
Q:我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮?
A:可以。請使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應該小于 10MB(10,485,759字節)。
Q:XML格式的 Sitemap 中,“priority”提示會影響我的網頁在搜索結果中的排名嗎?
A:不會。sitemap中的priority提示只是說明該網址相對于您自己網站上其他網址的重要性,并不會影響網頁在搜索結果中的排名。
Q:網址在 Sitemap 中的位置是否會影響它的使用?
A:不會。網址在 Sitemap 中的位置并不會影響百度對它的識別或使用方式。
Q:Sitemap中提交的url能否包含中文?
A:因為轉碼問題建議最好不要包含中文。
2.3. html格式
本小結暫待補充。
2.4. sitemap索引格式
如需提交大量sitemap文件,則可將其列在sitemap索引文件中,然后將該索引文件提交。
因為這個我幾乎不會用到,所以懶得研究,有興趣的參考這里。
如何制作網站地圖
可以采用一些第三方工具來制作,也可以自己寫個簡單的爬蟲去爬自己的網站,如果網站內容鏈接比較單一,也可以自己直接查數據庫拼接。
因為我需要網站有內容更新時自動更新網站地圖,而且存在多種二級域名,很多第三方工具都無法滿足,所以我還是自己來生成比較好。方法就是先將已知的鏈接放入一個集合,然后再將博客所有列表頁面、標簽頁面、分類列表頁面、所有文章鏈接全部通過查詢數據庫一次性得到并最終自己拼接字符串生成xml文件,然后放到網站根目錄。當然,并不推薦這種做法。
由于我沒有找到比較好用的、能滿足我需求的生成工具,所以這里就不推薦了,大家有好用的值得推薦的歡迎評論指出。
提交到搜索引擎
生成好后最好還要主動提交給搜索引擎,增加被收錄的概率和速度。
4.1. 百度提交站點地圖
百度提交sitemap地址:http://zhanzhang.baidu.com/linksubmit/index

網站地圖(站點地圖)工具及制作方法-1

網站地圖百度提交搜索方法

 

weinxin
掃一掃微信聯系我
營銷推廣問題,請加我微信