在特定列标准化Pandas DataFrame
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了在特定列标准化Pandas DataFrame相关的知识,希望对你有一定的参考价值。
我有一个具有以下结构的Pandas DataFrame。
Feature 1 | Feature 2 | Feature 3
10 | 200 | True
30 | 233 | False
45 | 344 | True
任何想法我怎么能只对功能1和功能2进行标准化?而不更改原始DataFrame的索引。
我已经尝试过以下代码,但它会对所有列进行规范化并将数据框的索引更改为0,1,2
x = df.values
min_max_scaler = preprocessing.MinMaxScaler()
x_scaled = min_max_scaler.fit_transform(x)
dataset = pd.DataFrame(x_scaled)
答案
只需创建数据框的视图:
x = df[['Feature 1', 'Feature 2']]
min_max_scaler = preprocessing.MinMaxScaler()
x_scaled = min_max_scaler.fit_transform(x)
dataset = pd.DataFrame(x_scaled)
dataset['Feature 3'] = df['Feature 3']
以上是关于在特定列标准化Pandas DataFrame的主要内容,如果未能解决你的问题,请参考以下文章
pandas删除dataframe列名称中包含特定字符串的数据列(dropping columns contains specifiec substring in dataframe)
pandas基于条件判断更新dataframe中特定数据列数值内容的值(Conditionally updating values in specific pandas Dataframe )
pandas基于条件判断更新dataframe中特定数据列数值内容的值(Conditionally updating values in specific pandas Dataframe )
pandas使用set_index函数将dataframe中的特定数据列转化为索引列(setting a new index of a dataframe)