数据处理常用
Posted aixiao07
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据处理常用相关的知识,希望对你有一定的参考价值。
1,dataframe获取列名称
dataframe.columns.values.tolist()
2,dataframe转化为numpy
dataframe.values
转化为数组后可以进行数值计算
3,numpy转化为列表
list = numpy.tolist()
4,进行数组运算时如果有字符串(null),肯定会报错str和list不能进行运算
通过以下办法将空字符串转化为0
datas = pd.read_csv(‘negative.csv‘, encoding=‘utf-8‘, low_memory=False)
datas.loc[datas[‘dou_01‘] == ‘(null)‘, ‘dou_01‘] = 0
datas[‘dou_01‘] = datas[‘dou_01‘].astype(‘float‘)
data11_dou_01 = datas[‘dou_01‘].values
5,header=None设置是否使用文件index为列名,使用这参数就表示不用,那列名就被认为是数值,将不能通过引用列名索引数据
6,重置列名,注意重置的列名要与data的列数据匹配上
data.columns=[‘user_id‘,‘hlw_all3‘,‘vedio_app_time‘,‘game_app_time‘,‘read_app_time‘,‘music_app_time‘,‘dm_app_time‘,‘toutiao_app_time‘]
以上是关于数据处理常用的主要内容,如果未能解决你的问题,请参考以下文章