为 NaN 值创建 Bin

Posted

技术标签:

【中文标题】为 NaN 值创建 Bin【英文标题】:Creating a Bin for NaN values 【发布时间】:2017-10-02 18:25:19 【问题描述】:

我正在尝试做一些数据分析,想法是使用autobinning 命令创建最佳分箱,计算每个分箱的 WOE(证据权重)值,然后替换属于每个分箱的原始值与各自的WOE值。所以下面是我的工作:

CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0);
scAB = autobinning(CreSC,'Algorithm','Monotone');
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE');

问题是上述过程没有考虑 DATA 中的 NaN 值并自动排除它们。

我的目标是仅为NaN 值创建一个单独的bin,并强制autobinning 命令考虑NaN 值。

有人有合理的解决方案吗?

【问题讨论】:

【参考方案1】:

查找所有 NaN 值。

选择数据中不存在的值。

用这个值替换所有的 NaN 值。

运行您的分箱,最后自己将此值映射到 NaN。

【讨论】:

感谢您的回答。我已经尝试过了。这种方式似乎不起作用,因为箱的间隔受到 NaN 上分配的值的影响。同样,我的目标是创建一个只有 NaN 的 bin!

以上是关于为 NaN 值创建 Bin的主要内容,如果未能解决你的问题,请参考以下文章