我如何训练以在 NLP 中找到美国状态的出现？

Posted 2023-03-12

技术标签:

【中文标题】我如何训练以在 NLP 中找到美国状态的出现？【英文标题】：How do I train to find the occurrence of a US state in NLP? 【发布时间】：2020-08-23 22:59:40 【问题描述】：

当这个集合被限制为 50 个州时，我如何训练以找到美国州的出现，因为我们需要大量数据（比如 1000 行）来训练某个标签。

【问题讨论】：

这个答案 (***.com/a/59959188/8243797) 中有很多关于从句子中提取城市的信息，答案或多或少地解释了一个从头到尾的整个问题，这可能会对您有所帮助。跨度> 【参考方案1】：

我认为这取决于您在这里尝试解决的任务。您是否需要区分某些两个字母组合是否为美国州名？只需一组简单的名称就可以吗？或者您正在尝试为州名称构建某种简单的 NER (https://en.wikipedia.org/wiki/Named-entity_recognition)？这样，您也可以从通过正则表达式进行简单匹配开始，但如果您想稍后训练一些模型 - 您有超过 50 个示例。您的数据集不仅仅是“这两个字母是否代表状态”，而是许多句子，其中有状态名称，或者根本没有。

【讨论】：

以上是关于我如何训练以在 NLP 中找到美国状态的出现？的主要内容，如果未能解决你的问题，请参考以下文章

NLP-词向量：如何理解TF-IDF？

对比学习（Contrastive Learning）在CV与NLP领域中的研究进展

如何绑定事件以在输入文本时获得通知

如何使标准偏差出现在状态栏中？

在 NLP 中训练数据集后如何预测标签

NLP - 找到具有不一致数字样本的输入变量