变量实体提取 - 句子实体中没有模式 - NLP
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了变量实体提取 - 句子实体中没有模式 - NLP相关的知识,希望对你有一定的参考价值。
我正在开发一个客户支持机器人,它可以帮助业务用户理解某些技术术语的含义或某些请求的状态。典型的句子如下所示
- 向我解释空气压缩机/加热和冷却系统/热力学定律
- 获取Ticket123 / HEATER12的状态
到目前为止我做了什么
我目前使用Microsoft LUIS来识别我上传所有可能实体的实体,LUIS进行字符串匹配并返回它们。这种方法的问题是
- 实体列表不断变大,需要每天更新
- 用户可能输入拼写错误 - 在某些情况下,用户类型一词可能不是要更正的拼写的字典单词。
我的解决方案是什么(似乎效果不佳)
我目前正在考虑一种标记POS并将名词短语/名词分组的方法,但我不认为这将是一种有效的方法。
还有一点需要注意的是,实体不遵循任何模式。我的方法应该在这里。任何指针将不胜感激。
答案
您正在尝试解决两个不同的问题
- 管理知识库,以回答用户学习/理解的问题
- 提供特定票证的状态
第一部分可以通过使用Q&A制造商服务进行全面管理,而无需使用一行代码。参考... https://www.qnamaker.ai/
第二部分的唯一目的是根据实体值(票证)从数据库中获取值。
专注于为第二部分构建和微调机器人,并将问答制造商作为知识基础进行整合,将负责第一部分。
另一答案
您可以在下面解决您的问题:
- 列出Excel中的所有实体,如果它不断变大,您只需要在Excel中添加更多行而不是代码。之后写一个正则表达式,使您的实体与所需信息相匹配。
- 对于拼写错误:你可以实现像
Fuzzywuzzy in Python
这样的东西。您将获得最接近的匹配,然后您可以应用步骤1来捕获您的实体。
以上是关于变量实体提取 - 句子实体中没有模式 - NLP的主要内容,如果未能解决你的问题,请参考以下文章
Elasticsearch:如何部署 NLP:命名实体识别 (NER) 示例