解读分类报告

Posted 2021-03-29

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了解读分类报告相关的知识，希望对你有一定的参考价值。

我一直致力于用150个文件（100列车和50个测试）实施KEA监督的关键词提取方法。结果让我有些困惑。这是我的分类报告：

           precision    recall  f1-score   support

      0       0.97      1.00      0.98     29118
      1       0.00      0.00      0.00       951

avg / total       0.94      0.97      0.95     30069

我在解释这一点从未被预测过。你认为我没有足够的训练数据吗？

答案

问题不在于你一般有足够的训练数据，但特别是第1类没有足够的样本。从本质上讲，有几种方法可以解决这个问题：

尝试增加案例1的样本数量：最明显的答案也可能不太现实，因为您可能首先开始使用更多的训练数据。但是有相关的方法，即
数据增加：我不熟悉特定的算法，所以我不能说它一般有多容易，但是你可能会为你的例子添加一些形式的排列，这些例子仍然保持意义（即代表同一个类），但是不同足以作为“另一个训练样本”。
加权类：取决于学习算法的具体细节，您通常也可以指定某种形式的类权重，这样可以让您更加“惩罚”算法，从而错误地分类您感兴趣的类。

一般来说，这是一项非常艰巨的任务，您不可能突然获得更好的结果，但这些肯定有助于改善您的情况，并帮助您更好地了解您的具体情况出了什么问题。另请注意，您添加的文档，培训程序等信息越多（它可能是您正在使用的实施的参考/链接），您获得合适答案的可能性就越大。

以上是关于解读分类报告的主要内容，如果未能解决你的问题，请参考以下文章

组织架构设计优化法则及华为海尔组织架构案例（分类精讲案例解读）|免费直播

FastQC质控报告解读

深度学习图像分类网络：GoogLeNet（V1-V4）模型搭建解读（附代码实现）

解读并加工BeautifulReport 报告模板

安全测试报告解读

解读2022年度敏捷教练行业现状报告