免费人成a大片在线观看_调教済み変态JK扩张调教し_白丝美女被狂躁免费视频网站_精品久久久久久久久久中文字幕

專注網站建設SEO推廣17年
證券簡稱:思億歐 證券代碼:839255
1對1的貼心(xin)服務13603054593

您當前的位置:首頁 >> SEO知識 >> 網站幫助

什么是全文搜索引擎

發布時間:2020-06-23 13:28:29瀏覽次數:

有專(zhuan)家認為,無論對(dui)文(wen)獻標(biao)(biao)引的(de)(de)(de)質量(liang)(liang)如何(he)(he),對(dui)用戶檢(jian)索(suo)(suo)的(de)(de)(de)滿足(zu)率都不可能百分(fen)之百。例如,用戶想檢(jian)索(suo)(suo)關于陳毅在抗日戰爭中活動(dong)的(de)(de)(de)文(wen)獻,采用對(dui)標(biao)(biao)引詞(ci)(ci)(主題詞(ci)(ci)、關鍵詞(ci)(ci))字段的(de)(de)(de)檢(jian)索(suo)(suo)就很難滿足(zu)檢(jian)索(suo)(suo)要求,只(zhi)有全文(wen)檢(jian)索(suo)(suo)才能滿足(zu)這一檢(jian)索(suo)(suo)目(mu)的(de)(de)(de)。因(yin)此,無論對(dui)文(wen)獻的(de)(de)(de)標(biao)(biao)引和分(fen)類如何(he)(he),全文(wen)檢(jian)索(suo)(suo)的(de)(de)(de)功能都是(shi)不可替代的(de)(de)(de)。然而,由(you)于全文(wen)檢(jian)索(suo)(suo)是(shi)直接對(dui)“原文(wen)”的(de)(de)(de)檢(jian)索(suo)(suo),檢(jian)索(suo)(suo)時會產生誤(wu)檢(jian),大(da)量(liang)(liang)的(de)(de)(de)檢(jian)索(suo)(suo)垃圾降低(di)了全文(wen)檢(jian)索(suo)(suo)的(de)(de)(de)查準(zhun)率,同時由(you)于作者用詞(ci)(ci)的(de)(de)(de)不統一,同義詞(ci)(ci)繁多,全文(wen)檢(jian)索(suo)(suo)的(de)(de)(de)查全率也受到影響(xiang)。所以,解決這些問題是(shi)刻不容緩的(de)(de)(de)。

1.提(ti)高查全(quan)率

作者(zhe)用(yong)(yong)詞(ci)(ci)(ci)的(de)不統(tong)一(yi),影響了用(yong)(yong)戶(hu)的(de)查全。例(li)如(ru),查找“非典型(xing)(xing)肺炎”,由(you)于不同(tong)(tong)的(de)文獻(xian)使用(yong)(yong)的(de)詞(ci)(ci)(ci)匯不同(tong)(tong),如(ru)“非典型(xing)(xing)肺炎”、“SARS”、“非典”等,只用(yong)(yong)某一(yi)詞(ci)(ci)(ci)查找就(jiu)可能出(chu)現漏檢(jian),如(ru)果(guo)讓用(yong)(yong)戶(hu)去列舉(ju)出(chu)所有同(tong)(tong)義(yi)詞(ci)(ci)(ci)來檢(jian)索,勢必增加了用(yong)(yong)戶(hu)的(de)檢(jian)索負擔(dan)。因此,構(gou)造全文檢(jian)索算法時應考慮(lv)到檢(jian)索詞(ci)(ci)(ci)的(de)擴(kuo)充,采(cai)用(yong)(yong)同(tong)(tong)義(yi)詞(ci)(ci)(ci)詞(ci)(ci)(ci)典無疑是一(yi)個好的(de)方法。

同義詞(ci)詞(ci)典(dian)是(shi)把(ba)含義相(xiang)同的(de)(de)詞(ci)匯關聯起(qi)來,在全(quan)文檢(jian)(jian)索(suo)中的(de)(de)作用是(shi),當用戶使(shi)用某個詞(ci)匯檢(jian)(jian)索(suo)時,系統直接將(jiang)同義詞(ci)取出,構成“或(huo)”運(yun)算檢(jian)(jian)索(suo)式,在全(quan)文中匹配查詢(xun),這樣(yang)確保了具有高查全(quan)率的(de)(de)檢(jian)(jian)索(suo)效果。對于同義詞(ci)詞(ci)典(dian),應(ying)能(neng)(neng)夠及時更(geng)新,或(huo)具有學習功能(neng)(neng),為維護同義詞(ci)詞(ci)典(dian)提供幫助(zhu)。

2.提高查(cha)準率

由(you)于中文詞(ci)之間沒有間隔標(biao)記,所以進行(xing)全(quan)文檢(jian)索(suo)時極易(yi)產生(sheng)誤檢(jian)索(suo),使查準率偏低。例(li)如,用(yong)“華人”一詞(ci)去(qu)檢(jian)索(suo),會(hui)使得含有“中華人民(min)共和國”詞(ci)匯的文獻被檢(jian)索(suo)出來;用(yong)“民(min)法(fa)’’檢(jian)索(suo),會(hui)把“人民(min)法(fa)院”檢(jian)索(suo)出來。解決這類問(wen)題同樣(yang)可通過(guo)構造檢(jian)索(suo)輔(fu)助詞(ci)典(dian)來完成,而實(shi)現這一任務的詞(ci)典(dian),稱為“排除詞(ci)詞(ci)典(dian)”。

排除詞(ci)(ci)詞(ci)(ci)典的(de)結構為(wei),將檢(jian)(jian)索(suo)用(yong)詞(ci)(ci)(如民法(fa))與(yu)欲排除詞(ci)(ci)(如人民法(fa)院、移民法(fa)等)關聯起來,用(yong)于在(zai)檢(jian)(jian)索(suo)時消(xiao)除誤檢(jian)(jian)。用(yong)排除詞(ci)(ci)詞(ci)(ci)典排除誤檢(jian)(jian)的(de)做法(fa)有(you)許多(duo),最簡單的(de)方法(fa)是將檢(jian)(jian)索(suo)詞(ci)(ci)在(zai)每(mei)一文獻中檢(jian)(jian)索(suo)出數量(檢(jian)(jian)索(suo)詞(ci)(ci)在(zai)文獻中出現次數)與(yu)所有(you)欲排除詞(ci)(ci)在(zai)文獻中出現的(de)數量相比(bi)較,若相等,該文獻就被排除,否則為(wei)命中。

聯系我們
地址:深圳市龍崗區 龍城大道85號萬科龍崗云中心16層
13603054593
版權所有:深圳市西企網科技有限公司 |深圳Google推廣公司,技巧,效果怎么樣
X

截屏(ping),微信識(shi)別二維碼(ma)

微信號:13603054593

(點擊微信號復制(zhi),添加好友)

打開微信

{dede:global.tongji/}