我是否需要提供培训Spacy NER的句子或段落是否合适?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我是否需要提供培训Spacy NER的句子或段落是否合适?相关的知识,希望对你有一定的参考价值。

我正在尝试培训一种新的Spacy模型来识别对法律文章的引用。我开始使用空白模型,并根据文档中给出的示例训练ner管道。

即使输入点有数千个,训练模型的性能也很差。我试图找出原因。

一个可能的答案是,我提供完整的段落来训练,而不是示例中的句子。这些段落中的每一段都可以多次提及法律条款。这可能是一个问题吗?

答案

段落应该没问题。你能给出一个输入数据点的例子吗?

以上是关于我是否需要提供培训Spacy NER的句子或段落是否合适?的主要内容,如果未能解决你的问题,请参考以下文章

为 SpaCy NER 格式化训练数据集

每次迭代后保存spacy的NER模型

如何用Spacy用句子来分解文档

将自定义 NER 模型添加到 spaCy 管道

如何使用混淆矩阵计算自定义训练的 spacy ner 模型的整体准确性?

将 NER 训练数据转换为 Spacy 训练数据格式