距离算法之美赠书活动截止还有最后2天
Posted 白马负金羁
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了距离算法之美赠书活动截止还有最后2天相关的知识,希望对你有一定的参考价值。
一、引子
查询扩展(Query Expansion)是信息检索领域的一个重要话题。一方面,用户本身可能会出错,他会输入一些错别字,比如把“冯小刚”,错写成“冯晓刚”;或者某个复杂的专有名词,用户自己也不是很清楚,例如图灵当年研究的Entscheidungsproblem,因为这个词很生僻,你可能只隐约记得 En...ch...dungsproblem。现代IR要求面对用户的错误输入或者不完整的输入也能给出尽量相关的查询结果,这就需要用到查询扩展。另一方面,自然语言本来就具有多意性,例如当你输入java时,它可能指一种计算机语言,也可能是印尼的一座岛,甚至是某个品种的咖啡豆。这些问题也要借助查询扩展来加以应对。
你可能会想到使用通配符(wildcard)来协助查询,这也的确可以解决上述我们列举的部分问题,事实上现代IR系统基本都有这方面的设计,但这还远远不够。为了应对语言本身的模糊性(ambiguity),我们还需要一些对query进行优化、提炼,从而使其更加明确。这方面的策略主要分成两类,即全局性方法和局部性方法。全局性
以上是关于距离算法之美赠书活动截止还有最后2天的主要内容,如果未能解决你的问题,请参考以下文章