隱含語(yǔ)義索引原理就是搜索引擎的一種算法,它是基于中文分詞原理而來(lái)的。搜索引擎通過(guò)上千萬(wàn)億個(gè)網(wǎng)頁(yè)去判斷某一個(gè)關(guān)鍵詞的密度,計(jì)算它的排名是非常非常困難的事,而且想在零點(diǎn)零點(diǎn)幾秒內(nèi)計(jì)算出來(lái),那更是不可能了。搜索引擎利用中文分詞原理將上千萬(wàn)億個(gè)網(wǎng)站內(nèi)的文字劃分到我們中國(guó)現(xiàn)有的八萬(wàn)條詞匯中去,就變得非常簡(jiǎn)單了。那么隱含語(yǔ)義索引原理是怎么計(jì)算的呢?
隱含索引語(yǔ)義原理就是搜索引擎的蜘蛛把一個(gè)頁(yè)面下載完成之后,會(huì)將下載的數(shù)據(jù)上傳到服務(wù)器上然后進(jìn)行一系列的算法計(jì)算分析,把這個(gè)頁(yè)面的內(nèi)容分成兩部分,一部分是頁(yè)面里面的所有鏈接(內(nèi)部鏈接和外部鏈接),另一部分是頁(yè)面內(nèi)容的正文。把正文的內(nèi)容整理再進(jìn)行分詞,把它分成若干個(gè)不可再分的詞,把一些詞按照算法處理過(guò)濾掉,比如:“這個(gè)、那個(gè)、他”這些沒(méi)有意義巔峰詞,只保留一些名詞、動(dòng)詞、形容詞。
當(dāng)蜘蛛爬取下載分析完站點(diǎn)頁(yè)面后,隱含索引語(yǔ)義就把下載頁(yè)面的所有單詞制成一個(gè)列表,然后再將站點(diǎn)所有頁(yè)面的內(nèi)容都做成單詞列表,然后利用這些列表可以做成一個(gè)以頁(yè)面為X軸,單詞為Y軸的巨型矩陣,如果一個(gè)單詞出現(xiàn)在某一個(gè)頁(yè)面,那么對(duì)于的頁(yè)面位置我們就標(biāo)為1,反之為0.這樣就可以很清楚的看到每個(gè)單詞在整站頁(yè)面出現(xiàn)的頻率。
當(dāng)然僅僅靠這樣是不能準(zhǔn)確的計(jì)算的,隱含索引語(yǔ)義原理還引入了一個(gè)關(guān)鍵詞權(quán)重問(wèn)題。關(guān)鍵詞在頁(yè)面出現(xiàn)的越高這個(gè)關(guān)鍵詞在頁(yè)面的權(quán)重也就越高;整站關(guān)鍵詞頻率高的權(quán)重越低。隱含語(yǔ)義索引最重要的是可以計(jì)算出某一個(gè)關(guān)鍵詞的相關(guān)關(guān)鍵詞在其他頁(yè)面出現(xiàn)的頻率。這樣的好處就是即使你的某一個(gè)站點(diǎn)頁(yè)面未出現(xiàn)你搜索的關(guān)鍵詞,也可以將相關(guān)頁(yè)面搜索出來(lái)。還有就是你頁(yè)面做相關(guān)的長(zhǎng)尾關(guān)鍵詞相互提升其競(jìng)爭(zhēng)力,就是因?yàn)樗麄兊南嚓P(guān)性。這就是隱含索引語(yǔ)義原理的核心所在,這就是為什么搜索引擎知道你的關(guān)鍵詞在頁(yè)面出現(xiàn)了幾次以及相關(guān)詞的比例,如果超出這個(gè)比例,搜索引擎就可能認(rèn)為你在作弊,也可以算出關(guān)鍵詞的密度,看你的網(wǎng)站是不是關(guān)鍵詞堆積。
本文由常州102骨科醫(yī)院:http://www.102guke.cn/ 原創(chuàng)提供,轉(zhuǎn)載請(qǐng)尊重版權(quán)。
推薦閱讀
早期我就分享過(guò)給新手,告訴大家如何發(fā)外鏈,老手可以飄過(guò),最近抽空在網(wǎng)上看到很多談到seo優(yōu)化中,外鏈怎么做,怎么做有效的帖子,大多是重復(fù)性比較高,而且沒(méi)有說(shuō)到點(diǎn)子上教程,今天張清和大家分享一下外鏈相關(guān)的>>>詳細(xì)閱讀
本文標(biāo)題:解密隱含語(yǔ)義索引原理,讓你的網(wǎng)站快速收錄
地址:http://www.sdlzkt.com/a/shousuo/20120426/55264.html