测试最大熵分类器

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了测试最大熵分类器相关的知识,希望对你有一定的参考价值。

是否可以通过斯坦福最大熵分类器对新数据进行分类而不创建包含所有功能的外部文件?

换句话说,我有一个以下格式的测试文件:

token1 t feature1_1 t ... t feature1_N t goldLabel1

...

tokenM t featureM_1 t ... t featureM_N t goldLabelM

我想知道是否可以使用数据结构来包含测试数据而无需创建外部文件。

任何帮助,将不胜感激!

谢谢

答案

如果您查看此方法(ColumnDataClassifier中的第409行)

private Pair<GeneralDataset<String,String>, List<String[]>> readDataset(String filename, boolean inTestPhase) {

你可以看到代码如何从文件路径转到Pair<GeneralDataset<String,String>, List<String[]>>

这是评估所需的关键数据对象。

如果您查看此方法(ColumnDataClassifier中的第2158行),您可以看到评估是如何完成的

public Pair<Double, Double> testClassifier(String testFile) {

如果你查看main()方法(第2011行),你会看到正在构建的ColumnDataClassifier的一个例子。

通过查看这三种方法,您可以编写其他代码来执行您想要执行的操作并避免写入磁盘。

以上是关于测试最大熵分类器的主要内容,如果未能解决你的问题,请参考以下文章

Python NLTK 最大熵分类器错误

大数据集的最大熵分类器

最大熵分类中的“共识”

最大熵模型原理小结

最大熵模型原理小结

逻辑回归与最大熵模型