STAKE中国官方网站

STAKE中国官方网站看法

全文搜索

宣布时间:2009-09-02

有专家以为,, , ,,无论对文献标引的质量怎样,, , ,,对用户检索的知足率都不可能百分之百。。。。。。

有专家以为,, , ,,无论对文献标引的质量怎样,, , ,,对用户检索的知足率都不可能百分之百。。。。。。例如,, , ,,用户想检索关于陈毅在抗日战争中运动的文献,, , ,,接纳对标引词(主题词、要害词)字段的检索就很难知足检索要求,, , ,,只有全文检索才华知足这一检索目的。。。。。。因此,, , ,,无论对文献的标引和分类怎样,, , ,,全文检索的功效都是不可替换的。。。。。。然而,, , ,,由于全文检索是直接对“原文”的检索,, , ,,检索时会爆发误检,, , ,,大宗的检索垃圾降低了全文检索的查准率,, , ,,同时由于作者用词的不统一,, , ,,同义词繁多,, , ,,全文检索的查全率也受到影响。。。。。。以是,, , ,,解决这些问题是刻禁止缓的。。。。。。

1.提高查全率

作者用词的不统一,, , ,,影响了用户的查全。。。。。。例如,, , ,,查找“非典范肺炎”,, , ,,由于差别的文献使用的词汇差别,, , ,,如“非典范肺炎”、“SARS”、“非典”等,, , ,,只用某一词查找就可能泛起漏检,, , ,,若是让用户去枚举出所有同义词来检索,, , ,,势必增添了用户的检索肩负。。。。。。因此,, , ,,结构全文检索算法时应思量到检索词的扩充,, , ,,接纳同义词辞书无疑是一个好的要领。。。。。。

同义词辞书是把寄义相同的词汇关联起来,, , ,,在全文检索中的作用是,, , ,,当用户使用某个词汇检索时,, , ,,系统直接将同义词取出,, , ,,组成“或”运算检索式,, , ,,在全文中匹配盘问,, , ,,这样确保了具有高查全率的检索效果。。。。。。关于同义词辞书,, , ,,应能够实时更新,, , ,,或具有学习功效,, , ,,为维护同义词辞书提供资助。。。。。。

2.提高查准率

由于中文词之间没有距离标记,, , ,,以是举行全文检索时极易爆发误检索,, , ,,使查准率偏低。。。。。。例如,, , ,,用“华人”一词去检索,, , ,,会使得含有“中华人民共和国”词汇的文献被检索出来;;;;;;;;用“民法’’检索,, , ,,会把“人民法院”检索出来。。。。。。解决这类问题同样可通过结构检索辅助辞书来完成,, , ,,而实现这一使命的辞书,, , ,,称为“扫除词辞书”。。。。。。

扫除词辞书的结构为,, , ,,将检索用词(如民法)与欲扫除词(如人民法院、移民法等)关联起来,, , ,,用于在检索时消除误检。。。。。。用扫除词辞书扫除误检的做法有许多,, , ,,最简朴的要领是将检索词在每一文献中检索出数目(检索词在文献中泛起次数)与所有欲扫除词在文献中泛起的数目相较量,, , ,,若相等,, , ,,该文献就被扫除,, , ,,不然为掷中。。。。。。

tel 24小时免费服务咨询热线:400-080-3010

连忙咨询连忙咨询 联系STAKE中国官方网站联系STAKE中国官方网站
【网站地图】【sitemap】