如何标准化数据集中的数值变量?

Posted

技术标签:

【中文标题】如何标准化数据集中的数值变量?【英文标题】:How can I normalize the numerical variables in a dataset? 【发布时间】:2022-01-11 17:58:03 【问题描述】:

如何规范化数据集?

数据集由 int 和 float 组成(它们也有负值),大约有 36 列(变量),分布不同。

我想对它们进行转换,以便为回归模型的应用提供正态分布。

我尝试了box-coxyeo-jansen,但在第一种情况下我遇到了负值问题,而在第二种情况下我遇到了这个错误:

"RuntimeWarning: divide by zero encountered in log".

【问题讨论】:

你试过Numpy吗? 【参考方案1】:

您可以使用sklearn.preprocessing。链接到documentation

【讨论】:

以上是关于如何标准化数据集中的数值变量?的主要内容,如果未能解决你的问题,请参考以下文章

如何发现数据中的异常值?对异常值是怎么处理的?

根据标准从大型数据集中读取特定数据,以避免将整个文件读入内存

如何从 Java 中的标准输入中读取整数值

sas如何计算相邻观测的差值

常用标准化方法

R 聚类热图-数据的标准化