变量实体提取 - 句子实体中没有模式 - NLP

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了变量实体提取 - 句子实体中没有模式 - NLP相关的知识,希望对你有一定的参考价值。

我正在开发一个客户支持机器人,它可以帮助业务用户理解某些技术术语的含义或某些请求的状态。典型的句子如下所示

  1. 向我解释空气压缩机/加热和冷却系统/热力学定律
  2. 获取Ticket123 / HEATER12的状态

到目前为止我做了什么

我目前使用Microsoft LUIS来识别我上传所有可能实体的实体,LUIS进行字符串匹配并返回它们。这种方法的问题是

  • 实体列表不断变大,需要每天更新
  • 用户可能输入拼写错误 - 在某些情况下,用户类型一词可能不是要更正的拼写的字典单词。

我的解决方案是什么(似乎效果不佳)

我目前正在考虑一种标记POS并将名词短语/名词分组的方法,但我不认为这将是一种有效的方法。

还有一点需要注意的是,实体不遵循任何模式。我的方法应该在这里。任何指针将不胜感激。

答案

您正在尝试解决两个不同的问题

  1. 管理知识库,以回答用户学习/理解的问题
  2. 提供特定票证的状态

第一部分可以通过使用Q&A制造商服务进行全面管理,而无需使用一行代码。参考... https://www.qnamaker.ai/

第二部分的唯一目的是根据实体值(票证)从数据库中获取值。

专注于为第二部分构建和微调机器人,并将问答制造商作为知识基础进行整合,将负责第一部分。

另一答案

您可以在下面解决您的问题:

  1. 列出Excel中的所有实体,如果它不断变大,您只需要在Excel中添加更多行而不是代码。之后写一个正则表达式,使您的实体与所需信息相匹配。
  2. 对于拼写错误:你可以实现像Fuzzywuzzy in Python这样的东西。您将获得最接近的匹配,然后您可以应用步骤1来捕获您的实体。

以上是关于变量实体提取 - 句子实体中没有模式 - NLP的主要内容,如果未能解决你的问题,请参考以下文章

可增量训练的实体识别分类器

BERT关系抽取之R-BERT模型

Elasticsearch:如何部署 NLP:命名实体识别 (NER) 示例

使用Google NLP API将实体字符串传递给主要活动(Android)

NLP常见任务

知识图谱命名实体识别(NLP)