非离散(连续)数据的信息增益计算

Posted

技术标签:

【中文标题】非离散(连续)数据的信息增益计算【英文标题】:information gain calculation for non discrete (continuous) data 【发布时间】:2015-07-28 16:33:30 【问题描述】:

我正在使用 iris 数据集。这是一个非离散数据集。我分为3个等宽方法。但在那之后我不知道该怎么办。如何计算此数据集的信息增益?如何计算连续数据的信息增益?请举例说明这一点。

【问题讨论】:

【参考方案1】:

    离散化属性(例如等宽)

    将 bin 映射为类别(例如低、中、高)

    按照分类数据处理

【讨论】:

以上是关于非离散(连续)数据的信息增益计算的主要内容,如果未能解决你的问题,请参考以下文章

快速信息增益计算

python里怎么计算信息增益,信息增益比,基尼指数

SparkMLlib回归算法之决策树

一条SQL搞定信息增益的计算

使用 Scikit-learn 计算信息增益

数据挖掘十大经典算法