五個(gè)方面淺析如何處理搜索詞
發(fā)布時(shí)間:2013-12-24 瀏覽:200打印字號(hào):大中小
第一、首先分詞:分詞是一大特色,無(wú)論我們輸入的是長(zhǎng)句子或者是短語(yǔ),搜索引擎都會(huì)把這些詞語(yǔ)進(jìn)行切分,將這些搜索的字符串切分成以詞為基礎(chǔ)的關(guān)鍵詞組合。只要這樣,才能更好的通過(guò)自己已經(jīng)預(yù)處理后的數(shù)據(jù)庫(kù)進(jìn)行查詢(xún)和比對(duì),把所有符合這些詞的也沒(méi)列舉返回給用戶(hù)。這個(gè)分詞和頁(yè)面分詞的原理有些類(lèi)似。
第二、去停止詞:我們?cè)谒阉鲿r(shí)候帶有很多的主觀性,很多時(shí)候把口語(yǔ)話的一些詞語(yǔ)都用在了搜索詞上,但這次詞往往對(duì)要搜索的內(nèi)容沒(méi)有實(shí)質(zhì)性的幫助,但我們已經(jīng)養(yǎng)成了輸入這些詞的習(xí)慣,所以搜索引擎必須要能去停止詞,程度上保證搜索的準(zhǔn)確率以及相關(guān)性。
第三、指令的處理:平時(shí)我們?cè)谒阉鲿r(shí)會(huì)輸入多個(gè)詞語(yǔ),其實(shí)默認(rèn)的情況下,搜索引擎把多個(gè)默認(rèn)的詞語(yǔ)都按照“與”來(lái)進(jìn)行詞語(yǔ)。比如你搜索“網(wǎng)站”時(shí),引擎會(huì)默認(rèn)我們輸入的“減網(wǎng)站”來(lái)進(jìn)行處理,單獨(dú)包含“減肥”或者“網(wǎng)站”的內(nèi)容理論上將不會(huì)返回,但實(shí)際情況往往也會(huì)出現(xiàn)單獨(dú)包含一個(gè)詞語(yǔ)的網(wǎng)站。另外,還要處理各種高級(jí)搜索指令的詞語(yǔ),比如加號(hào)減號(hào)等。
第四、錯(cuò)誤矯正:很多時(shí)候我們輸入都會(huì)存在錯(cuò)誤的問(wèn)題,拼音本來(lái)諧音就比較多,輸錯(cuò)也實(shí)屬正常,但如果搜索引擎不進(jìn)行糾錯(cuò)的話,就會(huì)返回很多我們不希望看到的結(jié)果。所以,有時(shí)候我們即使輸入的全拼,搜索引擎也會(huì)根據(jù)這個(gè)來(lái)提示正確的中文。
第五、分類(lèi)對(duì)待:不同詞語(yǔ)一般是不同對(duì)待的,這是搜索引擎的一個(gè)特色功能。比如我們搜索一般性的關(guān)鍵詞,返回的一般以網(wǎng)頁(yè)居多,而當(dāng)我們搜索一個(gè)明星的名字,則會(huì)出現(xiàn)很多新聞網(wǎng)絡(luò)營(yíng)銷(xiāo)、視頻、圖片等綜合的搜索結(jié)果。所以,搜索引擎要根據(jù)用戶(hù)的需求去進(jìn)行判斷
最新文章
- 1網(wǎng)站內(nèi)容收錄后被刪除的解決方法
- 2北京網(wǎng)站設(shè)計(jì)公司哪家好
- 3網(wǎng)站優(yōu)化如何提高關(guān)鍵詞排名
- 4北京網(wǎng)站設(shè)計(jì)公司:企業(yè)網(wǎng)站忽視十大重要優(yōu)化重點(diǎn)
- 5北京網(wǎng)站建設(shè):SEO優(yōu)化對(duì)企業(yè)營(yíng)銷(xiāo)的重要性
- 6北京網(wǎng)站制作公司談網(wǎng)站草圖設(shè)計(jì)
- 7北京網(wǎng)站制作公司-Robots協(xié)議到底要不要寫(xiě)
- 8北京電商網(wǎng)站建設(shè)公司
- 9企業(yè)網(wǎng)站關(guān)鍵詞優(yōu)化方法
- 10如何設(shè)置網(wǎng)站標(biāo)題更利于SEO優(yōu)化


