为 NaN 值创建 Bin

Posted

技术标签:

【中文标题】为 NaN 值创建 Bin【英文标题】:Creating a Bin for NaN values 【发布时间】:2017-10-02 18:25:19 【问题描述】:

我正在尝试做一些数据分析,想法是使用autobinning 命令创建最佳分箱,计算每个分箱的 WOE(证据权重)值,然后替换属于每个分箱的原始值与各自的WOE值。所以下面是我的工作:

CreSC = creditscorecard(Data_Table ,'IDVar','CustID','GoodLabel',0);
scAB = autobinning(CreSC,'Algorithm','Monotone');
DataTransformed = bindata(scAB,t_Data,'OutputType','WOE');

问题是上述过程没有考虑 DATA 中的 NaN 值并自动排除它们。

我的目标是仅为NaN 值创建一个单独的bin,并强制autobinning 命令考虑NaN 值。

有人有合理的解决方案吗?

【问题讨论】:

【参考方案1】:

查找所有 NaN 值。

选择数据中不存在的值。

用这个值替换所有的 NaN 值。

运行您的分箱,最后自己将此值映射到 NaN。

【讨论】:

感谢您的回答。我已经尝试过了。这种方式似乎不起作用,因为箱的间隔受到 NaN 上分配的值的影响。同样,我的目标是创建一个只有 NaN 的 bin!

以上是关于为 NaN 值创建 Bin的主要内容,如果未能解决你的问题,请参考以下文章

如何在创建 geojson 时处理 NaN 值

pandas创建内容全是缺失值NaN的dataframepandas创建dataframe指定每个数据列的数据类型

满足某些条件时将值替换为 NaN 或 Inf

用 NaN 替换矩阵的某些元素(MATLAB)

如何在 pandas DataFrame 中忽略滚动平均值计算的 NaN 值?

创建用 NaN 填充的 numpy 矩阵