自然语言交互的窘境

Posted 氖星智能

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了自然语言交互的窘境相关的知识,希望对你有一定的参考价值。

我的做自然语言交互的同行可能很多不能理解为什么自己的产品没有好口碑。其实我们也没有。

从根本上讲,我们的问题可能和别人不一样。但有一点是相同的,就是用户使用体验差。大多数自然语言交互产品的问题出在交互的流畅性上。很多技术人员不能从用户的角度看问题,总觉得用户太挑剔难伺候。实际上用户没有义务被一个交流经常被打断的产品折磨。我们总以为我们的产品已经接近完美了,实际上用户的使用体验可能比吃了一顿难吃的早餐还要痛苦。

什么是交流的流畅性,就是交流能不能顺利进行下去,会不会被经常打断。实际上可能大多数产品很难流畅交流。比如,不能理解用户意图,对于语音识别错误不能处理,不能理解省略句,知识量有限,不能跨场景顺畅切换(想进入不能进入,不想进入乱进入,想退出不能退出,不想退出乱退出),不能处理语义的细微差别,不能处理一个问题的多种表达等等这些都会造成人机交流终断

原因是什么呢?

前几天和产品以及研发的同事讨论机器人应用模块(相当于亚马逊Alexaskill开发的问题,他们认为我提的方案会增加大量的数据。这实际上是个误解。

比如从北京到西安怎么走这种句式,他们认为可能产生的数据量是无限的,全部写入数据库是不可能的。

实际上我们的计算主要是按前三个关键字计算的。正常情况下两个地理名词不能同时出现在前三个关键字里。当然,目前算法会有一些bug

目前直接说北京西安会在前三个关键字里出现两个地理名词。但当用户这样表达时语义是比较模糊的。比如用户说的是北京亦庄前三个关键字里有两个地理方位名词,但实际上是一个地方。还有,用户可能说的是北京北京只是重复自己的话表示强调。这时候前三个关键字里也有两个地理方位名词。而实际上这个提取关键字可能是错的,无论如何不应该在前三个关键字里同时出现两个地理方位名词。

之所以我们同事和我有这样分歧是源于我们本身不成熟和他们不了解我们自己,也不熟悉行业。

大家知道现在对话产品很多的。车机都是语音交互的BAT都推出了自己的语音智能音箱;手机都有语音助手。那么为什么我们还要做?

让我们先想想用户的痛点是什么呢?实际上只有我们有可能能做出来流畅地对话。

拿车机来说,要使用一个应用首先要进入这个应用,用户记不住进入应用的方法这个应用就没法使用了。有车机用户反应车机的有些功能他从来没用过,因为不知道怎么进入。比如小明小明,放音乐”“小明小明,开启导航”“小明小明今天北京天气怎样这些都是进入应用的命令。虽然这些命令看起来是句子,实际上是关键字。关键字变了,就不行了。比如放音乐,用户说的是小明小明,来首曲子”“小明小明,来首摇滚可能就不行了。如果语音识别出错,就更不行了。比如语音识别的结果可能是“小民小民,来首腰鼓。”

另外,在应用跳转时也会出问题。比如在放音乐场景下,用户说小明小明,我想去桂林,车机可能会打开地图开始导航。而我们知道这是一首歌的名称,这时播放这首歌是最恰当的处理。在天气预报场景下,用户说小明小明,北京车机也可能打开导航。而实际上这种情况用户的意图可能是查北京天气。

这样做的结果就是人机交流的流畅性很差,经常被打断,给用户体验造成很大的伤害。这种产品,用户使用的兴趣不会大。

我们是怎么做的?

这个我反复讲过,也写文章讲过。大家可以翻翻我写的文章。

首先我们强调平行结构的系统,根据用户意图进入场景,不同应用处理不同场景。我们不是根据关键字进入的,进去应用的入口往往是无限多的,不用用户记命令。用户说“我想听音乐”“来首歌”“刘德华的歌”“听小苹果”等等都能开启音乐播放。

其次我们系统的平行结构保证用户能在不同应用直接顺畅跳转,我们根据用户意图处理,我们联系上下文处理。当用户说“北京”的时候,根据对话场景决定是调用地图导航,还是播放一首名为“北京的音乐”。

最后,我们强大的地方正是我们语义处理能力,我们理解一个问题的多种表达,我们能透过语音识别的错误理解用户意图。比如我们知识库存的是我要去亦庄用户说的可能是怎么去亦庄”“我要去亦庄怎么走”“我要去亦庄怎么办”“我要去亦庄怎么好”“我要去亦庄,请推荐路线。如果仅仅是关键字处理,不可能穷举所有用户可能输入的关键字组合,只能让用户按固定格式输入,这样交互的流畅性就会降低。

所以,我们的优势其实是在交互更加自然流畅上。这方面我们绝对是顶尖的,无人超越。别人都做了,我们做得更好。

所以,如果我们销售的同事不是去推广我们交互的流畅性,就是没有把我们的强项拿出来。拿我们的短板和别人竞争,很难有结果

深圳的车机公司也有研发团队,为什么还找我们?南京某大学难道科研能力不强?为什么还找我们?北京某国有集团公司的机器人也有研发团队,为什么还找我们?

都是因为他们解决不了对话的流畅性。

如果我们不能证明我们在这方面的优势,合作不可能继续下去。

另外,如果按照别人的方法去开发应用只处理关键字,我们强大的语言处理能力就没用了。

之所以非常自信我们能做出来交互流畅的产品,就是因为我们有强大的语言处理能力。我们现在的主要问题是缺乏知识,我们的机器人如果有海量知识,就会发挥更多的用处。而这也是造成现阶段我们机器人交互不流畅的原因。但这个问题并非算法那样难以处理,只要有足够的资本,我们知识短缺的问题就可以解决。


氖星机器人大脑快速申请体验:

体验网址:
http://www.neonstar.cn

快速生成机器人:
http://www.neonstar.cn/statics/rapid.html

文章来源:北京小谛机器人科技有限公司CEO彭军辉先生



以上是关于自然语言交互的窘境的主要内容,如果未能解决你的问题,请参考以下文章

码农故事1——受惠寄居遇驴友 维艰窘境见人心

交互搜索中的自然语言理解技术

vue和c语言可以交互吗

中文分词做不好,人机自然语言交互当然难以取得突破

自然语言交互是个坑

刘挺:语言智能的目标是实现自然语言与机器语言的连续交互