百度是如何區分英文分詞
二月 21st, 2009 by maggy
這篇文章僅僅是站在個人的角度來分析一下百度是如何區分英文分詞技術的,可能文章內容會有一些偏頗,希望大家諒解。
首先,我們來看一個例子,百度如何來區分一個詞組。例如在百度搜尋zhn seo,看百度的搜尋路徑用藍色字體來表示要搜尋的關鍵詞,符號「+」是百度自動加上的,於是我們得到的結論是百度通過符號「+」來區分一個英文詞組,延伸一下思維,如果域名中允許使用特殊符號「+」註冊,雖然在輸入上會很麻煩,但是在搜尋引擎的表現上是否會佔有很大的優勢呢?^_^
再來先下面這個案例,記得好友丘世達以前與大家分享過如何刷某一個詞的相關搜尋,比如在搜seo的時候會出現zhn,如何實現呢?首先要先在百度裡搜尋zhn,然後得到的結果是緊接著在搜尋seo,得到的結果是,從路徑2的URL當中可以看出已經包含了路徑1的zhn這個詞,所以只要針對路徑2進行大量點擊便在搜尋seo的時候出現關於zhn的相關搜尋。但是近來發現這種方法貌百度對待這種方法已經不感冒了,畢竟這也算是一種作弊手法,而搜尋引擎的每一次算法調整以為也越來越站在用戶的角度去思考問題。
現在的相關搜尋是如何產生的呢?個人感覺是根據某一個詞延伸出來的長尾詞,某一個長尾詞被用戶在自然情況下搜尋的越多便會在相關搜尋中排名越靠前,而當在相關搜尋靠前的時候,用戶在搜尋這個詞的時候很自然的就點擊了這個詞的長尾詞,這一系列動作都是在一種自然的情況下產生的,也符合了一般用的搜搜習慣,可能聰明的人想到了什麼東西喔^_^