Weka 中决策树的信息增益

Posted

技术标签:

【中文标题】Weka 中决策树的信息增益【英文标题】:Information gain for decision tree in Weka 【发布时间】:2021-12-10 03:08:00 【问题描述】:

我在 Weka 中使用 GainRatioAttributeEval。我得到了这个结果

我无法解释这个结果。我的意思是这部分是什么意思?

Ranked attributes:
 1.0000000000000009    5 Na_to_K
 0.3935404073616423    3 BP
 0.2063964793752467    1 Age
 0.09316668988826002   4 Cholesterol
 0.007712386387024157  2 Sex

我的数据集有 6 个属性和 200 个实例。其中药物是我的类属性。我还附上了数据集的预处理概述。

我知道如何计算信息增益并创建决策树。但我无法得到这个结果。

【问题讨论】:

【参考方案1】:

Gain ratio 和info gain 是两种独立的属性评估方法,具有不同的公式。有关详细信息,请参阅链接的 Javadoc。

【讨论】:

该信息很有帮助。请看***.com/questions/69698962/…

以上是关于Weka 中决策树的信息增益的主要内容,如果未能解决你的问题,请参考以下文章

决策树是不是试图最大化信息增益或熵?

熵是什么?熵的公式是什么?决策树如何把熵的递减变换为信息增益进行树枝的分叉以及树的生长的?

Weka 使用增益比和信息增益(ID3 和 C4.5(J48))

算法干货----决策树算法中的熵与信息增益

ID3决策树分析

机器学习--决策树