数据处理常用

Posted aixiao07

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据处理常用相关的知识,希望对你有一定的参考价值。

1,dataframe获取列名称

dataframe.columns.values.tolist()

2,dataframe转化为numpy

dataframe.values

转化为数组后可以进行数值计算

3,numpy转化为列表

list = numpy.tolist()

4,进行数组运算时如果有字符串(null),肯定会报错str和list不能进行运算

通过以下办法将空字符串转化为0

datas = pd.read_csv(‘negative.csv‘, encoding=‘utf-8‘, low_memory=False)
datas.loc[datas[‘dou_01‘] == ‘(null)‘, ‘dou_01‘] = 0
datas[‘dou_01‘] = datas[‘dou_01‘].astype(‘float‘)
data11_dou_01 = datas[‘dou_01‘].values

5,header=None设置是否使用文件index为列名,使用这参数就表示不用,那列名就被认为是数值,将不能通过引用列名索引数据

6,重置列名,注意重置的列名要与data的列数据匹配上

data.columns=[‘user_id‘,‘hlw_all3‘,‘vedio_app_time‘,‘game_app_time‘,‘read_app_time‘,‘music_app_time‘,‘dm_app_time‘,‘toutiao_app_time‘]

以上是关于数据处理常用的主要内容,如果未能解决你的问题,请参考以下文章

C#常用代码片段备忘

swift常用代码片段

# Java 常用代码片段

# Java 常用代码片段

IOS开发-OC学习-常用功能代码片段整理

21个常用代码片段