基于短文本的标签推荐算法

Posted 红楼明月

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于短文本的标签推荐算法相关的知识,希望对你有一定的参考价值。

在做从用户输入的短文本识别小区的名字时,一直没有想到一种比较好的算法,最后用正则和模式匹配实现了,准确率还可以。


不过,实现是实现了,但是维护起来却是非常的麻烦,修东墙漏西墙,拣了芝麻丢了西瓜的事情不少发生,这是基于规则的系统的通病。这个问题比较复杂的地方在于:

  1. 短文本,上下文没有,但是人类却还是可以判断的

  2. 使用关键词提取算法,无论是TFIDF还是textrank都是没有用的

  3. 分类算法也基本用不上,因为类别不确定,而且类别的数量很大

  4. 相似性算法,这个倒是可以使用一下,实现的时候也部分使用了,但是构造样本库的成本相当大


网上搜索,貌似也没找到太多有效的信息,或许研究这个的不多,或许搜索的关键词有问题。


显示中,类似这样的场景其实是非常多的,我们有一小部分的经验样本数据,希望快速将这部分经验应用到大量的观测数据中。


以上是关于基于短文本的标签推荐算法的主要内容,如果未能解决你的问题,请参考以下文章

短视频系统开发常用的推荐算法,各有什么优缺点

推荐系统相关算法

算法基于内容的个性化推荐算法

推荐系统学习——基于TF-IDF的改进

07_推荐系统算法详解

基于TF-IDF的新闻标签提取