深度剖析的robots協(xié)議的原理以及重要作用

作者:安秋 來(lái)源: 2011-12-19 13:22:13 閱讀 我要評(píng)論 直達(dá)商品

robots是網(wǎng)站和搜索引擎之間的一個(gè)協(xié)議,那么他有什么作用呢,說(shuō)這個(gè)咱們需要搞清楚搜索引擎爬蟲(chóng)的原理。當(dāng)蜘蛛下載一個(gè)網(wǎng)頁(yè);保存一個(gè)txt純文本,就是那個(gè)快照緩存文本。爬蟲(chóng)還會(huì)提取一些標(biāo)記和標(biāo)簽比如a標(biāo)簽。他把站外的鏈接和內(nèi)部鏈接進(jìn)行分開(kāi)然后再次抓取。就是這樣來(lái)連接整個(gè)互聯(lián)網(wǎng)。這個(gè)就是一個(gè)爬去原理。這就出現(xiàn)了一個(gè)問(wèn)題,如果咱們不想讓爬蟲(chóng)爬取,那怎么辦呢,于是就出現(xiàn)了一個(gè)協(xié)議,叫做robots協(xié)議。robots協(xié)議的早期是防止網(wǎng)站內(nèi)的隱私,防止抓取用戶不用想讓搜索引擎進(jìn)行曝光的頁(yè)面。

   robots協(xié)議,他是一個(gè)協(xié)議不是一個(gè)命令,命令是馬上要執(zhí)行的,而協(xié)議是在搜索引擎的爬蟲(chóng)爬取后一段時(shí)間后才會(huì)生效,百度和google聲明24小時(shí)就會(huì)生效,事實(shí)上并非如此我觀察了一下,有的頁(yè)面甚至一個(gè)月才會(huì)生效,我給robots協(xié)議生效的時(shí)間做了一個(gè)總結(jié),那就是24小時(shí)到一個(gè)月。那么robots協(xié)議到底有什么作用呢。robots協(xié)議用得好,會(huì)讓我們網(wǎng)站邊的更純凈,下面一起來(lái)看一下。
 
   1.可以屏蔽無(wú)內(nèi)容頁(yè)面,我內(nèi)容頁(yè)面比如說(shuō) 登陸頁(yè) 打印頁(yè) 個(gè)人信息頁(yè) 商城的購(gòu)物頁(yè)等等 大家都知道無(wú)內(nèi)容頁(yè)面會(huì)影響頁(yè)面和全站的質(zhì)量以及權(quán)重。
   2.可以屏蔽重復(fù)頁(yè)面,比如頁(yè)面的簡(jiǎn)寫(xiě)版本以及空評(píng)論頁(yè),再或者多個(gè)路徑可以打開(kāi)同一頁(yè)面,等等重復(fù)頁(yè)面。重復(fù)的頁(yè)面對(duì)于站內(nèi)頁(yè)面的質(zhì)量也是會(huì)受到非常嚴(yán)重的影響的。
   3.可以屏蔽死鏈接。當(dāng)然站內(nèi)的錯(cuò)誤和服務(wù)器問(wèn)題,所造成的死鏈接是沒(méi)辦法屏蔽的。


    robots語(yǔ)法,他一共有三個(gè)語(yǔ)法,第一個(gè) Disallow:禁止的意思 第二個(gè) Allow 允許的意思 第三個(gè)User-agent:定義搜索引擎的。當(dāng)然有的robots文件開(kāi)頭和結(jié)尾有“#”這個(gè)字符是注釋的意思搜索引擎會(huì)忽略。還有兩個(gè)通配符,“$”和“*” “$”這個(gè)是結(jié)束符(所有以他結(jié)尾的都能夠進(jìn)行匹配。)。“*”是匹配零或者多個(gè)任意字符。這里說(shuō)三個(gè)大家一直很難理解的地方。

   禁止語(yǔ)法:Disallow

  請(qǐng)看這個(gè)代碼 Disallow: /seo/  禁止 該網(wǎng)站的 SEO目錄;Disallow: /seo  它不僅僅能夠禁seo這個(gè)目錄下的路徑,他還能夠禁止所有以SEO開(kāi)頭的目錄和文件。這里的斜杠代表目錄。如果Disallow: /直接加斜杠就代表禁止根目錄。沒(méi)有禁止的頁(yè)面,默認(rèn)是允許的這樣也許大家會(huì)有疑問(wèn),既然默認(rèn)是允許還要Allow這個(gè)允許含義的語(yǔ)法有何意義?下面我就來(lái)舉例說(shuō)一下。

   允許語(yǔ)法:Allow
  
   Disallow: /citations?
   Allow: /citations?user= 
   Allow: /citations?view_op=new_profile
   這三條代碼的意思是禁止所有以citations?開(kāi)頭的所有路徑。但是除了 “Allow”允許的兩個(gè)路徑。其實(shí)allow的用處就是簡(jiǎn)寫(xiě)robots代碼。讓robots文件變得更精簡(jiǎn)。

    通配符“$”的使用。
 
    Disallow: /places/
    Allow: /places/$
    只收錄  /places/ 這個(gè)路徑不收錄這個(gè)路徑里面所有的頁(yè)面和路徑。

  robots語(yǔ)法對(duì)網(wǎng)站非常重要,運(yùn)用好robots會(huì)讓你的網(wǎng)站更健康更純凈。好了就寫(xiě)這么多本人原創(chuàng)轉(zhuǎn)載請(qǐng)標(biāo)明出處 捷易通激活碼 http://www.taobaomaiyifu.com 謝謝大家支持。


  推薦閱讀

  實(shí)站分享外鏈和收錄不穩(wěn)定我們?nèi)绾螒?yīng)對(duì)

對(duì)百度這樣經(jīng)常小更新和大更新,許多SEOER就開(kāi)始非常不淡定了。特別是新手做站長(zhǎng)的時(shí)候就非常不淡定。百度一些不穩(wěn)定的小更新就讓我們很多站長(zhǎng)們開(kāi)始糾結(jié)了。對(duì)于外鏈和收錄不穩(wěn)定情況問(wèn)題,在各大SEO論壇當(dāng)中很多站>>>詳細(xì)閱讀


本文標(biāo)題:深度剖析的robots協(xié)議的原理以及重要作用

地址:http://www.sdlzkt.com/a/34/20111219/19853.html

樂(lè)購(gòu)科技部分新聞及文章轉(zhuǎn)載自互聯(lián)網(wǎng),供讀者交流和學(xué)習(xí),若有涉及作者版權(quán)等問(wèn)題請(qǐng)及時(shí)與我們聯(lián)系,以便更正、刪除或按規(guī)定辦理。感謝所有提供資訊的網(wǎng)站,歡迎各類(lèi)媒體與樂(lè)購(gòu)科技進(jìn)行文章共享合作。

網(wǎng)友點(diǎn)評(píng)
我的評(píng)論: 人參與評(píng)論
驗(yàn)證碼: 匿名回答
網(wǎng)友評(píng)論(點(diǎn)擊查看更多條評(píng)論)
友情提示: 登錄后發(fā)表評(píng)論,可以直接從評(píng)論中的用戶名進(jìn)入您的個(gè)人空間,讓更多網(wǎng)友認(rèn)識(shí)您。
自媒體專(zhuān)欄

評(píng)論

熱度

主站蜘蛛池模板: 国产精品成人va在线观看| 成人无码嫩草影院| 成人无遮挡毛片免费看| 成人性生交大片免费看| 国产日韩欧美成人| 国产午夜成人AV在线播放| 窝窝视频成人影院午夜在线| 成人免费777777被爆出| 免费国产成人午夜私人影视| 成人深夜福利在线播放不卡| 国产成人黄色在线观看| 6080yy成人午夜电影| 国产成人精品怡红院| 老司机成人精品视频lsj| 国产v片成人影院在线观看| 成人无码WWW免费视频| 久久亚洲国产成人精品性色| 国产麻豆成人传媒免费观看| 青青国产成人久久激情911| 国产成人精品无码片区在线观看| 欧美成人全部免费观看1314色| 国产成人精品一区二区三区| 成人禁在线观看| 青青草成人免费| 中国成人在线视频| 国产成人av乱码在线观看| 成人免费观看视频高清视频| 欧美成人精品大片免费流量| a级成人高清毛片| 久久国产成人精品国产成人亚洲| 午夜成人理论福利片| 亚洲美女人黄网成人女| 亚洲欧美成人综合久久久| 免费成人在线网站| 久久成人免费电影| 窝窝午夜看片成人精品| 成人精品一区二区不卡视频| 成人综合婷婷国产精品久久蜜臀| 成人自拍视频在线观看| 国产麻豆成人传媒免费观看| 国产成人久久av免费|