如何标准化数据集中的数值变量?
Posted
技术标签:
【中文标题】如何标准化数据集中的数值变量?【英文标题】:How can I normalize the numerical variables in a dataset? 【发布时间】:2022-01-11 17:58:03 【问题描述】:如何规范化数据集?
数据集由 int 和 float 组成(它们也有负值),大约有 36 列(变量),分布不同。
我想对它们进行转换,以便为回归模型的应用提供正态分布。
我尝试了box-cox
和yeo-jansen
,但在第一种情况下我遇到了负值问题,而在第二种情况下我遇到了这个错误:
"RuntimeWarning: divide by zero encountered in log".
【问题讨论】:
你试过Numpy吗? 【参考方案1】:您可以使用sklearn.preprocessing
。链接到documentation
【讨论】:
以上是关于如何标准化数据集中的数值变量?的主要内容,如果未能解决你的问题,请参考以下文章