stanford maxent 分类预测

Posted

技术标签:

【中文标题】stanford maxent 分类预测【英文标题】:stanford maxent classification prediction 【发布时间】:2015-06-08 05:05:10 【问题描述】:

我正在尝试使用 stanford maxent 分类来使用 4 个特征对数据进行分类,第 5 个是类。当我提供测试数据时,准确率是 99%,这几乎是不可能的。

当我检查预测的标签时,它们与数据本身完全相同。但后来我更改了数据中的标签,预测的标签也发生了变化。 我想使用分类器模型的预测不应该考虑数据中给出的标签。请建议如何在看不见的数据上使用 maxent 模型。

【问题讨论】:

能否请您重新提出您的问题,目前尚不清楚您如何将数据分成训练和测试集。 【参考方案1】:

您的分类器不应使用基准标签作为特征。在训练时,传入一个带有标签集的数据;在测试时,传入一个以相同方式进行特征化但没有标签集的数据。

【讨论】:

以上是关于stanford maxent 分类预测的主要内容,如果未能解决你的问题,请参考以下文章

深度学习

Python NLTK 最大熵分类器错误

Stanford-NER 定制对软件编程关键词进行分类

使用NLTK和MaltParser的依赖性解析器

如何在Java中提取所有类型的名词?

在 Zeppelin 中使用分类器指定依赖关系