欧美三区_成人在线免费观看视频_欧美极品少妇xxxxⅹ免费视频_a级毛片免费播放_鲁一鲁中文字幕久久_亚洲一级特黄

網站優化攻略:Robots.txt使用指南

系統 1878 0


【簡 介】
搜索引擎訪問一個網站時,它首先會檢查該網站的根域下是否有一個叫做robots.txt的純文本文件。Robots.txt文件用于限定搜索引擎對其網站的訪問范圍,即告訴搜索引擎網站中哪些文件是允許它進行檢索(下載)的。

  搜索引擎訪問一個網站時,它首先會檢查該網站的根域下是否有一個叫做robots.txt的純文本文件。Robots.txt文件用于限定搜索引擎對其網站的訪問范圍,即告訴搜索引擎網站中哪些文件是允許它進行檢索(下載)的。這就是大家在 上常看到的“拒絕Robots訪問標準”(Robots Exclusion Standard)。下面我們簡稱RES。 Robots.txt文件的格式:Robots.txt文件的格式比較特殊,它由記錄組成。這些記錄通過空行分開。其中每條記錄均由兩個域組成:

  1) 一個User-Agent(用戶代理)字符串行;

  2) 若干Disallow字符串行。

  記錄格式為: ":"

  下面我們分別對這兩個域做進一步說明。

  User-agent(用戶代理):

  User-agent行(用戶代理行) 用于指定搜索引擎robot的名字,以Google的檢索程序Googlebot為例,有:User-agent: Googlebot

  一個robots.txt中至少要有一條User-agent記錄。如果有多條User-agent記錄,則說明有多個robot會受到RES標準的 限制。當然了,如果要指定所有的robot,只需用一個通配符"*"就搞定了,即:User-agent: * Disallow(拒絕訪問聲明):

  在Robots.txt文件中,每條記錄的第二個域是Disallow:指令行。這些Disallow行聲明了該網站中不希望被訪問的文件和(或)目 錄。例如"Disallow: email.htm"對文件的訪問進行了聲明,禁止Spiders下載網站上的email.htm文件。而"Disallow: /cgi-bin/"則對cgi-bin目錄的訪問進行了聲明,拒絕Spiders進入該目錄及其子目錄。Disallow聲明行還具有通配符功能。例如 上例中"Disallow: /cgi-bin/"聲明了拒絕搜索引擎對cgi-bin目錄及其子目錄的訪問,而"Disallow:/bob"則拒絕搜索引擎對/bob.html和 /bob/indes.html的訪問(即無論是名為bob的文件還是名為bob的目錄下的文件都不允許搜索引擎訪問)。Disallow記錄如果留空, 則說明該網站的所有部分都向搜索引擎開放。

  空格 & 注釋

  在robots.txt文件中,凡以"#"開頭的行,均被視為注解內容,這和UNIX中的慣例是一樣的。但大家需要注意兩個問題:

  1) RES標準允許將注解內容放在指示行的末尾,但這種格式并不是所有的Spiders都能夠支持。譬如,并不是所有的Spiders都能夠正確理 解"Disallow: bob #comment"這樣一條指令。有的Spiders就會誤解為Disallow的是"bob#comment"。最好的辦法是使注解自成一行。

  2) RES標準允許在一個指令行的開頭存在空格,象"Disallow: bob #comment",但我們也并不建議大家這么做。

  Robots.txt文件的創建:

  需要注意的是,應當在UNIX命令行終端模式下創建Robots.txt純文本文件。好的文本編輯器一般都能夠提供UNIX模式功能,或者你的FTP客戶端軟件
也“應該”能夠替你轉換過來。如果你試圖用一個沒有提供文本編輯模式的HTML編輯器來生成你的robots.txt純文本文件,那你可就是瞎子打蚊子——白費力氣了。

  對RES標準的擴展:

  盡管已經提出了一些擴展標準,如Allow行或Robot版本控制(例如應該忽略大小寫和版本號),但尚未得到RES工作組的正式批準認可。

  附錄I. Robots.txt用法舉例:

  使用通配符"*",可設置對所有robot的訪問權限。

  User-agent: *

  Disallow:

  表明:允許所有搜索引擎訪問網站下的所有內容。

  User-agent: *

  Disallow: /

  表明:禁止所有搜索引擎對網站下所有網頁的訪問。

  User-agent: *

  Disallow: /cgi-bin/Disallow: /images/

  表明:禁止所有搜索引擎進入網站的cgi-bin和images目錄及其下所有子目錄。需要注意的是對每一個目錄必須分開聲明。

  User-agent: Roverdog

  Disallow: /

  表明:禁止Roverdog訪問網站上的任何文件。

  User-agent: Googlebot

  Disallow: cheese.htm

  表明:禁止Google的Googlebot訪問其網站下的cheese.htm文件。

  上面介紹了一些簡單的設置,對于比較復雜的設置,可參看一些大型站點如CNN或Looksmart的robots.txt文件

  附錄II. 相關robots.txt文章參考:

  1. Robots.txt常見問題解析

  2. Robots Meta Tag的使用

  3. Robots.txt檢測程序

網站優化攻略:Robots.txt使用指南


更多文章、技術交流、商務合作、聯系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产麻豆精品 | 人人九九 | 一区二区三区毛A片特级 | 一级毛片视频 | 国产乱码一区二区三区 | 日韩h片在线观看 | 国产免费观看一级国产 | 99热久久精品免费精品 | 男女午夜性爽快免费视频不卡 | 国产精品点击进入在线影院高清 | 久久美女精品国产精品亚洲 | 91短视频社区在线观看 | 欧美成人看片黄a免费看 | 久久2| 在线看片国产 | 色综合天天射 | 国产综合在线播放 | 91亚洲影院 | av一区二区三区 | 欧美午夜精品一区二区蜜桃 | 日韩 欧美 综合 | 五月婷婷激情第五季 | 天堂资源最新在线 | 久草综合在线视频 | 国产精品免费一区二区三区都可以 | 久久99精品久久久久久国产越南 | 日本精品不卡 | 亚洲精品一区久久狠狠欧美 | 久爱网 | 久久精品亚洲欧美日韩精品中文字幕 | 国产亚洲视频免费播放 | 亚洲精品456人成在线 | 免费的黄网站男人的天堂 | 欧美vide| 欧美黄色网| 日韩h片在线观看 | 欧美视屏一区二区 | 二区三区偷拍浴室洗澡视频 | 在线视频a| 米奇777四色精品人人爽 | 美女在线视频网站 |