大家好,我是魏東東!對(duì)于很多站長(zhǎng)來(lái)說(shuō),分析iss日志都知道很重要,但是卻很少去重視它。通常網(wǎng)站的基本數(shù)據(jù)都可以通過(guò)ga又或者百度統(tǒng)計(jì)、站長(zhǎng)工具可以查到,但是有些東西想通過(guò)這些常用的 工具并不能全名鏈接網(wǎng)站的一些細(xì)節(jié)方面。比如說(shuō)蜘蛛的爬去方式。通過(guò)iss日志我們可以很好的觀察到網(wǎng)站被搜索引擎蜘蛛爬去的方式。那么我們?yōu)楹我M(jìn)行網(wǎng)站日志分析呢。大 家可能發(fā)現(xiàn)自己網(wǎng)站的內(nèi)頁(yè),通常情況下,搜索引擎不都是能收錄你網(wǎng)站的內(nèi)容頁(yè)。這在一方面其實(shí)跟我們的蜘蛛爬去的方式可能存在一定的關(guān)系。
iss日志我們可以做些什么呢?
1、可以間接的分析網(wǎng)站的外鏈效果
2、我們的空間的好壞
3、蜘蛛對(duì)我們的頁(yè)面哪些頁(yè)面比較喜歡哪些頁(yè)面不喜歡?
4、蜘蛛什么時(shí)候頻繁訪問(wèn)我們的網(wǎng)站,我們究竟什么時(shí)候需要更新網(wǎng)站內(nèi)容
通常我們看我們的iss日志的時(shí)候,通常情況下是看有多少的200狀態(tài)嗎,那么iss日志就那么點(diǎn)功能吧,其實(shí)不然,下面通過(guò)一些方面給大家介紹一下為什么seoer要養(yǎng)成看日志的習(xí)慣。
一、iss日志重要型表現(xiàn)在那些方面?
1.通過(guò)iss日志我們可以間接的發(fā)現(xiàn)蜘蛛在爬去你網(wǎng)站的時(shí)候的頻繁度,外鏈的數(shù)量其實(shí)可以間接的反應(yīng)你網(wǎng)站的的外鏈做的成功度。蜘蛛通過(guò)外部鏈接來(lái)爬去你網(wǎng)站的的時(shí) 候的內(nèi)容,可以通過(guò)iss日志發(fā)現(xiàn)蜘蛛的抓取方式與軌跡。
2.iss日志的更新頻率與網(wǎng)站的內(nèi)容更新頻率有一定的關(guān)系,網(wǎng)站的更新同時(shí)與網(wǎng)站的微調(diào)也有一定的關(guān)系!這些我們同時(shí)可以通過(guò)網(wǎng)站的iss日志可以看見(jiàn)
3.我們可以通過(guò)iss日志去發(fā)現(xiàn)我們空間那些地方出現(xiàn)問(wèn)題了。這些東西都可以提前做好預(yù)警。通過(guò)iss日志分析我們可以間接的分析出一個(gè)網(wǎng)站空間的穩(wěn)定性,我們可以很好
的發(fā)現(xiàn)到底哪個(gè)空間商不錯(cuò)!
4.通過(guò)蜘蛛我們可以發(fā)現(xiàn)到底哪些頁(yè)面蜘蛛頻繁抓取,這些頁(yè)面頻繁抓取對(duì)于我們的帶寬嚴(yán)重浪費(fèi)。所以我們就要好好的分析這些頻繁的頁(yè)面到底是哪些頁(yè)面老是被頻繁抓取,而 這些頁(yè)面對(duì)你并沒(méi)有多大的作用,那么我們可以通過(guò)網(wǎng)站的robots,屏蔽這些頁(yè)面被頻繁抓取。
二、如何下載日志及日志設(shè)置注意事項(xiàng)?
1.首頁(yè)我們的空間log日志分析文件中會(huì)出現(xiàn)這個(gè)iss記錄文件通過(guò)ftp從下載到本地。然后我們通過(guò)一些常用的日志分析工具可以發(fā)現(xiàn)一些規(guī)律,推薦大家使用光年日志分析 工具
2.對(duì)于大型網(wǎng)站一個(gè)iss日志會(huì)很大,用工具打開(kāi)的時(shí)候會(huì)造成死機(jī),對(duì)于小型的網(wǎng)站我們會(huì)發(fā)現(xiàn)還可以,可是大網(wǎng)站的話,確實(shí)是一件難事,不過(guò)我們可以采用即時(shí)下載 iss日志。會(huì)很好的解決這些問(wèn)題,不過(guò)目前很多情況下發(fā)部分日志分析工具都可以解決這些問(wèn)題,具體問(wèn)題具體分析吧
三、iss日志的具體分析。
1.日志的后綴名是log的我們用記事本打開(kāi),選擇格式里的自動(dòng)換行這樣看起來(lái)方便,對(duì)于BaiduSpider和Googlebot
百度蜘蛛
2012-03-13 00:47:10 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo+(+ baidu /search/spider ) 200 0 0 15256 197 265
谷歌機(jī)器人
2012-03-13 08:18:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1+(+ google /bot ) 200 0 0 985 200 31
我們分段來(lái)解釋
2012-03-13 00:47:10 蜘蛛什么時(shí)候訪問(wèn)了你網(wǎng)站
W3SVC177 這個(gè)是機(jī)器碼這個(gè)是惟一的 我們不去管它
116.255.169.37 這個(gè)IP地址是服務(wù)器的IP地址
GET 代表事件
GET后面就是蜘蛛爬取的網(wǎng)站頁(yè)面,斜杠就代表首頁(yè)
80 是端口的意思
220.181.51.144 這個(gè)IP則是蜘蛛的IP,這里告訴大家一個(gè)鑒別真假百度蜘蛛的方法,我們電腦點(diǎn)擊開(kāi)始運(yùn)行輸入cmd打開(kāi)命令提示符,輸入nslookup空格加蜘蛛IP點(diǎn)擊回車 ,一般真百度蜘蛛都有自己的服務(wù)器IP而假蜘蛛則沒(méi)有。
如果有時(shí)候你發(fā)現(xiàn)你的空間很多情況下又冒充百度蜘蛛的假蜘蛛來(lái)頻繁訪問(wèn)你的網(wǎng)站,那么這個(gè)時(shí)候我們就要好好的去屏蔽這個(gè)ip,過(guò)度去采集我們網(wǎng)站的內(nèi)容。
200 0 0 200反應(yīng)蜘蛛抓取正常
197 265最后兩個(gè)數(shù)字則代表著訪問(wèn)和下載的數(shù)據(jù)字節(jié)數(shù)。
2.我們分析的時(shí)候先看看狀態(tài)碼 200代表下載成功,304代表頁(yè)面未修改,500代表服務(wù)器超時(shí),這些東西可以去搜索下,網(wǎng)上都有詳細(xì)的說(shuō)明。
3.我們可以通過(guò)蜘蛛喜歡那些頁(yè)面,來(lái)預(yù)計(jì)估測(cè)蜘蛛到底喜歡什么內(nèi)容,以后我們可以判斷我們到底該怎么寫(xiě)我們網(wǎng)站內(nèi)容。
4.有時(shí)候我們可以發(fā)現(xiàn)蜘蛛在爬去我們網(wǎng)站的時(shí)候到底出現(xiàn)了那些問(wèn)題,對(duì)癥下藥!
5.我們通過(guò)蜘蛛抓取的頻率可以很好的分析出那些時(shí)間段,時(shí)間頻段蜘蛛常來(lái),然后我們趕在這個(gè)時(shí)間對(duì)岸前把我們的網(wǎng)站更新,這樣可以讓搜索引擎知道咱們網(wǎng)站是最新 的
6.蜘蛛對(duì)于我們的頁(yè)面的抓取是分等級(jí)的,是根據(jù)權(quán)重依次遞減的,一般順序?yàn)槭醉?yè)、目錄頁(yè)、內(nèi)頁(yè)。
7.不同IP的蜘蛛他們的抓取頻率也是不相同的
作為一個(gè)合格的seoer人員要養(yǎng)成看日志的習(xí)慣,在日志中可以很清楚的看到我們網(wǎng)站的一切!
轉(zhuǎn)載請(qǐng)手下留情請(qǐng)保留http://www.weidongdong.com/seoer-kan-rizhi.html

網(wǎng)友點(diǎn)評(píng)
精彩導(dǎo)讀
科技快報(bào)
品牌展示