1.對搜索引擎做出規定,抓取或者不抓取。
2.由于有些信息規定了不讓抓取,所以可以保護到一些必要的信息,比如:網站后臺,用戶信息。3.節省搜索引擎抓取資源。 二.robots.txt規則
1.User-agent,用于告訴"/>

亚洲精品国产第一综合99久久,免费男女羞羞的视频网站黄色,国产在线精品一区二区高清不卡 ,91福利国产在线在线播放

網站首頁 網站建設 推廣運營 關于我們 聯系我們 建站知識 新聞動態 幫助文檔 客戶案例

關于網站優化robots.txt的相關知識介紹

2018年04月19日

閱讀量:

一.robots.txt具體作用
1.對搜索引擎做出規定,抓取或者不抓取。
2.由于有些信息規定了不讓抓取,所以可以保護到一些必要的信息,比如:網站后臺,用戶信息。

3.節省搜索引擎抓取資源。

 

二.robots.txt規則
1.User-agent,用于告訴識別蜘蛛類型。比如,User-agent: Baiduspider 就是指百度蜘蛛。
各類蜘蛛列舉如下:
百度蜘蛛:Baiduspider
谷歌機器人:GoogleBot
360蜘蛛:360Spider
搜狗蜘蛛:Sogou News Spider
雅虎蜘蛛:“Yahoo! Slurp China” 或者 Yahoo!
有道蜘蛛:Youdaobot 或者 Yodaobot
Soso蜘蛛:Sosospider
2.Allow,允許蜘蛛抓取指定目錄或文件,默認是允許抓取所有。
3.Disallow,不允許蜘蛛抓取指定目錄或文件。
4.通配符,“*”,匹配0或多個任意字符。
5.終止符,“$”,可以匹配以指定字符結尾的字符。
舉個例子:下面是一個wordpress程序的robots.txt
User-agent: *
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /feed
Disallow: /*/feed
Disallow: /comments/feed
Disallow: /*.js$
Disallow: /*?*
Sitemap: http://www.znbo.com/sitemap.xml
解釋:
User-agent: *:對所有搜索引擎都使用下面的規則。
Disallow: /wp-admin/:不讓蜘蛛抓取根目錄下的wp-admin文件夾。
Disallow: /*.js$:不讓蜘蛛抓取根目錄下所有的js文件。
Disallow: /*?*:不抓取所有的動態鏈接。

Sitemap: http://www.znbo.com/sitemap.xml:給蜘蛛提供網站地圖,方便蜘蛛抓取網站內容。

 

三.robots.txt注意事項
1.如果你希望搜索引擎收錄網站上所有的內容,那么就不要建立robots.txt文件。
2.如果同時存在動態和靜態鏈接,那么建議屏蔽動態鏈接。
3.robots.txt只能是屏蔽站內文件的,對站外文件沒有屏蔽功能。
4.User-agent,Allow,Disallow,Sitemap的首字母都是大寫的。
5.User-agent,Allow,Disallow,Sitemap的冒號后面都是有空格的,沒有寫空格直接寫接下來的內容會出錯。
6.網站通常會屏蔽搜索結果頁面。因為搜索結果頁和正常展示的內容頁相比,標題和內容上相同的,而這兩個頁面鏈接是不同的。那搜索引擎該將這篇文章歸屬于哪個內鏈呢?這樣就會造成內鏈之間相互競爭,造成內部資源損耗。
比如上面舉的例子,那個wordpress程序,在沒有設置偽靜態,還是動態鏈接的時候,搜索結果頁面鏈接都包含有/?s=,而 標題和內容 與 正常展示的動態鏈接內容頁重復,可以通過Disallow: /?=*來屏蔽搜索結果頁面。
而現在那個wordpress程序已經設置了偽靜態,也設置了Disallow: /*?*,Disallow: /*?*本身就包含了Disallow: /?=*,所以Disallow: /?=*這句寫不寫都沒有關系
7.建議屏蔽js文件。Disallow: /*.js$,以 .js 結尾的路徑統統被屏蔽,這樣就屏蔽了js文件。
8.路徑是區分大小寫的。Disallow: /ab/ 和 Disallow: /Ab/ 是不一樣的。
9.robots.txt會暴露網站相關目錄,寫robots.txt時要考慮到這一點。
10.有些seo會將文件直接備份在服務器中,文件是 .zip 格式,然后在robots.txt中屏蔽。個人不建議這樣,這就是明顯告訴人家你的備份文件位置。建議文件和數據都備份到本地。
11.一些特殊規則對比:
①Disallow: /和Disallow: / ab (/后面有個空格,再有ab)是一樣的,/后面多了個空格,蜘蛛之認空格前面那一段,就是Disallow: /,所以兩個都是屏蔽整站的。
②Disallow: /ab和Disallow: /ab*是一樣的。比如兩個都能屏蔽http://域名/ab,http://域名/abc,http://域名/abcd。
③Disallow: /ab/和Disallow: /ab是不一樣的。很明顯,Disallow: /ab范圍更廣,包含了Disallow: /ab/。因為Disallow: /ab/只能屏蔽http://域名/ab/,http://域名/ab/....這樣的路徑,也就是只能屏蔽ab目錄和ab目錄下的文件不被蜘蛛抓取。

文章均為奇跡mu私服專注網站建設青島網站建設青島網站建設公司原創,轉載請注明來自
http://m.avtb2063.com/faq/431.html

填寫服務需求或選擇下列套餐服務。

 PC端網站建設 600 手機網站建設 600 PC+手機網站建設 1000 響應式網站建設 1000 外貿網站建設 800

* 服務套餐價格會不定時變化,請認真填寫需求信息,我們會在24小時內與您取得聯系。

網站建設套餐

PC端600元

網站類型
前臺模板
后臺管理系統
建站所需時間
推廣運營
企業PC端網站建設
HTML5+DIV+CSS布局
帝國CMS(安全穩定開源)
1-3個工作日
保證百度收錄,不包排名
服務內容
1.欄目添加刪除
2.模板微調
3.產品文章添加(20個內)
4.網站數據定時備份
5.SEO關鍵詞設置
6.客服、分享、統計插件
7.7X24技術支持
贈送內容
1.COM/NET/CN域名1個
2.萬網或海外1G虛擬空間
3.網站備案
4.免費維護1年
5.簡單LOGO設計
6.三張廣告圖制作

網站建設套餐

手機端600元

網站類型
前臺模板
后臺管理系統
建站所需時間
推廣運營
企業手機端網站建設
HTML5+DIV+CSS布局
帝國CMS(安全穩定開源)
1-3個工作日
保證百度收錄,不包排名
服務內容
1.欄目添加刪除
2.模板微調
3.產品文章添加(20個內)
4.網站數據定時備份
5.SEO關鍵詞設置
6.客服、分享、統計插件
7.7X24技術支持
贈送內容
1.COM/NET/CN域名1個
2.萬網或海外1G虛擬空間
3.網站備案
4.免費維護1年
5.簡單LOGO設計
6.三張廣告圖制作

網站建設套餐

PC+手機端1000元

網站類型
前臺模板
后臺管理系統
建站所需時間
推廣運營
PC+手機端同步數據
HTML5+DIV+CSS布局
帝國CMS(安全穩定開源)
1-3個工作日
保證百度收錄,不包排名
服務內容
1.欄目添加刪除
2.模板微調
3.產品文章添加(20個內)
4.網站數據定時備份
5.SEO關鍵詞設置
6.客服、分享、統計插件
7.7X24技術支持
贈送內容
1.COM/NET/CN域名1個
2.萬網或海外2G虛擬空間
3.網站備案
4.免費維護1年
5.簡單LOGO設計
6.三張廣告圖制作

網站建設套餐

響應式1000元

網站類型
前臺模板
后臺管理系統
建站所需時間
推廣運營
企業響應式網站建設
HTML5+DIV+CSS布局
帝國CMS(安全穩定開源)
1-3個工作日
保證百度收錄,不包排名
服務內容
1.欄目添加刪除
2.模板微調
3.產品文章添加(20個內)
4.網站數據定時備份
5.SEO關鍵詞設置
6.客服、分享、統計插件
7.7X24技術支持
贈送內容
1.COM/NET/CN域名1個
2.萬網或海外2G虛擬空間
3.網站備案
4.免費維護1年
5.簡單LOGO設計
6.三張廣告圖制作

網站建設套餐

英文外貿800元

網站類型
前臺模板
后臺管理系統
建站所需時間
推廣運營
英文外貿網站建設
HTML5+DIV+CSS布局
帝國CMS(安全穩定開源)
1-3個工作日
保證百度收錄,不包排名
服務內容
1.欄目添加刪除
2.模板微調
3.產品文章添加(20個內)
4.網站數據定時備份
5.SEO關鍵詞設置
6.客服、分享、統計插件
7.7X24技術支持
贈送內容
1.COM/NET/CN域名1個
2.香港或美國1G虛擬空間
3.免費維護1年
4.簡單LOGO設計
5.三張廣告圖制作
線上服務咨詢15906391238填寫需求索取報價