基于词向量匹配的对话系统 工程实践

Posted 梳下鱼

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了基于词向量匹配的对话系统 工程实践相关的知识,希望对你有一定的参考价值。

这个台湾作者GitHub的代码和开发日志(如https://zake7749.github.io/2016/08/28/word2vec-with-gensim/  )将聊天系统所需的知识储备以及整个系统框架都描述得特别清楚,他的思路核心是:将用户输入的句子断成若干个词,通过词向量匹配预先设定的主题词,模板以及对话等,在通过若干条设定的对话策略,得到最佳答复。
下载到的代码里其实有三个可以运行的主代码:
    
 1. free chat的demo
    这个demo可算是我碰到的最黄的机器人了,因为语料取自台湾ptt.cc网站的八卦板块
    所以啊,一个优良的语料集是非常重要的,大家不要乱选语料集教坏小孩
       
    思路:
         
 

 2. 基于规则匹配的demo
    这一demo的思路如下:
        
        注:由于作者在整个系统中用的都是繁体字,所以如果用户输入和词向量模型最好统一为繁体,才好实现结果
        作者设定的主题有闹钟(时间),娱乐,住宿,医药,购物,每个主题下有若干个子主题
            
          结果:
                 
    3. 规则+free chat
        这个相当于free chat和规则组合合成的chatbot
        1)首先用户输入,到free chat 的模块,若返回的结果分数高于阈值,则直接回答该结果,否则,到到(2)
        2)规则匹配,匹配上了,则转到task model
        3)task model有以下,每个包含一个py文件,内设置该task下的回复规则,如若是住宿,则会到网上酒店的各种信息
                
                
 

 

 

 
 

 





以上是关于基于词向量匹配的对话系统 工程实践的主要内容,如果未能解决你的问题,请参考以下文章

对话系统简介与OPPO小布助手的工程实践

结合工程实践选题调研分析同类软件产品

结合工程实践选题调研分析同类软件产品

多轮检索式对话——CIKM 2019IMN

vs2010基于对话框的mfc工程怎样实现点击按钮更新对话框的部分内容

检索式对话系统在美团客服场景的探索与实践