python 将连续变量Bin变为离散级别 - Telco数据集

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 将连续变量Bin变为离散级别 - Telco数据集相关的知识,希望对你有一定的参考价值。

df['Binned_MonthlyCharges'] = pd.cut(x=df['MonthlyCharges'], 
                                     bins=[0, 30, 55, 70, 90, 110, 120], 
                                     labels=['$0-30', '$30-55', '$55-70', '$70-90', '$90-110', '$110-120'])

df['Binned_MonthlyCharges'] = df['Binned_MonthlyCharges'].astype('category')

df['Binned_MonthlyCharges'].cat.reorder_categories(['$0-30', '$30-55', '$55-70', '$70-90', '$90-110', '$110-120'],
                                                   inplace=True)
                                                   
                                                   
                                                   
                                
df['Binned_Tenure'] = pd.cut(x=df['tenure'], 
                             bins=[0, 5, 20, 40, 65, 72], 
                             labels=['0-5m', '5-20m', '20-40m', '40-65m', '65-72m'])

df['Binned_Tenure'] = df['Binned_Tenure'].astype('category')

df['Binned_Tenure'].cat.reorder_categories(['0-5m', '5-20m', '20-40m', '40-65m', '65-72m'],
                                           inplace=True)

以上是关于python 将连续变量Bin变为离散级别 - Telco数据集的主要内容,如果未能解决你的问题,请参考以下文章

将熊猫间隔转换为字符串(然后再返回)

如何区别离散变量和连续变量?

建立logistic回归模型步骤

连续型变量与离散型变量

连续型变量与离散型变量的区别是啥?

统计学离散型变量和连续型变量有啥区别?