python 将连续变量Bin变为离散级别 - Telco数据集
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 将连续变量Bin变为离散级别 - Telco数据集相关的知识,希望对你有一定的参考价值。
df['Binned_MonthlyCharges'] = pd.cut(x=df['MonthlyCharges'],
bins=[0, 30, 55, 70, 90, 110, 120],
labels=['$0-30', '$30-55', '$55-70', '$70-90', '$90-110', '$110-120'])
df['Binned_MonthlyCharges'] = df['Binned_MonthlyCharges'].astype('category')
df['Binned_MonthlyCharges'].cat.reorder_categories(['$0-30', '$30-55', '$55-70', '$70-90', '$90-110', '$110-120'],
inplace=True)
df['Binned_Tenure'] = pd.cut(x=df['tenure'],
bins=[0, 5, 20, 40, 65, 72],
labels=['0-5m', '5-20m', '20-40m', '40-65m', '65-72m'])
df['Binned_Tenure'] = df['Binned_Tenure'].astype('category')
df['Binned_Tenure'].cat.reorder_categories(['0-5m', '5-20m', '20-40m', '40-65m', '65-72m'],
inplace=True)
以上是关于python 将连续变量Bin变为离散级别 - Telco数据集的主要内容,如果未能解决你的问题,请参考以下文章
将熊猫间隔转换为字符串(然后再返回)
如何区别离散变量和连续变量?
建立logistic回归模型步骤
连续型变量与离散型变量
连续型变量与离散型变量的区别是啥?
统计学离散型变量和连续型变量有啥区别?