STAKE中国官方网站看法
全文搜索
宣布时间:2009-09-02
有专家以为,,,,,无论对文献标引的质量怎样,,,,,对用户检索的知足率都不可能百分之百。。。。。。
有专家以为,,,,,无论对文献标引的质量怎样,,,,,对用户检索的知足率都不可能百分之百。。。。。。例如,,,,,用户想检索关于陈毅在抗日战争中运动的文献,,,,,接纳对标引词(主题词、要害词)字段的检索就很难知足检索要求,,,,,只有全文检索才华知足这一检索目的。。。。。。因此,,,,,无论对文献的标引和分类怎样,,,,,全文检索的功效都是不可替换的。。。。。。然而,,,,,由于全文检索是直接对“原文”的检索,,,,,检索时会爆发误检,,,,,大宗的检索垃圾降低了全文检索的查准率,,,,,同时由于作者用词的不统一,,,,,同义词繁多,,,,,全文检索的查全率也受到影响。。。。。。以是,,,,,解决这些问题是刻禁止缓的。。。。。。
1.提高查全率
作者用词的不统一,,,,,影响了用户的查全。。。。。。例如,,,,,查找“非典范肺炎”,,,,,由于差别的文献使用的词汇差别,,,,,如“非典范肺炎”、“SARS”、“非典”等,,,,,只用某一词查找就可能泛起漏检,,,,,若是让用户去枚举出所有同义词来检索,,,,,势必增添了用户的检索肩负。。。。。。因此,,,,,结构全文检索算法时应思量到检索词的扩充,,,,,接纳同义词辞书无疑是一个好的要领。。。。。。
同义词辞书是把寄义相同的词汇关联起来,,,,,在全文检索中的作用是,,,,,当用户使用某个词汇检索时,,,,,系统直接将同义词取出,,,,,组成“或”运算检索式,,,,,在全文中匹配盘问,,,,,这样确保了具有高查全率的检索效果。。。。。。关于同义词辞书,,,,,应能够实时更新,,,,,或具有学习功效,,,,,为维护同义词辞书提供资助。。。。。。
2.提高查准率
由于中文词之间没有距离标记,,,,,以是举行全文检索时极易爆发误检索,,,,,使查准率偏低。。。。。。例如,,,,,用“华人”一词去检索,,,,,会使得含有“中华人民共和国”词汇的文献被检索出来;;;;;;;;用“民法’’检索,,,,,会把“人民法院”检索出来。。。。。。解决这类问题同样可通过结构检索辅助辞书来完成,,,,,而实现这一使命的辞书,,,,,称为“扫除词辞书”。。。。。。
扫除词辞书的结构为,,,,,将检索用词(如民法)与欲扫除词(如人民法院、移民法等)关联起来,,,,,用于在检索时消除误检。。。。。。用扫除词辞书扫除误检的做法有许多,,,,,最简朴的要领是将检索词在每一文献中检索出数目(检索词在文献中泛起次数)与所有欲扫除词在文献中泛起的数目相较量,,,,,若相等,,,,,该文献就被扫除,,,,,不然为掷中。。。。。。
上一篇:SEO文案的视察剖析准备事情
下一篇:搜索引擎蜘蛛的事情历程
相关内容NEW
24小时免费服务咨询热线:400-080-3010
连忙咨询
联系STAKE中国官方网站






连忙咨询
联系STAKE中国官方网站