Pandas从入门到实战(day3)
Posted 啊~小 l i
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas从入门到实战(day3)相关的知识,希望对你有一定的参考价值。
Pandas数据排序
- Series的排序:
Seriex.sort_values(ascendiong=True, inplace=False)
参数说明:
- ascendiong:默认为True升序排列,为False为降序排序
- inplace:是否修改原始的Series
- DataFrame的排序:
DataFrame.sort_values(by, ascendiong=True, inplace=Flase)
参数说明:
- by:字符串或List<字符串>,单排列或多列排序
- ascendiong:True/False或者List[True/False],升序还是降序,如果是list对应的by的多列
- inplace:是否修改原始的DataFrame
Series的排序
df['a'].sort_valuses()
DataFrame的排序
- 单列排序
df.sort_values(by='a')
- 多列排序
df.sort_values(by=['a', 'b'], ascending=[True, False])
第一列升序,第二列降序
demo
为txt文件按照最后一列(sum)的顺序从小到大排序
import pandas as pd
data = pd.read_csv("./finall_sort_frist.txt", sep=",")
sort = data.sort_values(by='sum', ascending=False)
sort.to_csv("./a.txt")
其他关键使用的总结
- 使用
pd.read_csv()
读取txt文件时候,可以在括号里增加参数sep="你使用分割数据的符号"
- 在DataFrame上面增加列索引
data.columns = ['索引1', ‘索引2’]
- 将多个Series/DataFrame合并成一个DataFrame使用
frames = [df1, df2['ResNetData']]
all = pd.concat(frames, axis=1, join='outer')
参数
pd.concat(objs, axis=0, join=‘outer’, join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)
含义
- objs 需要连接的对象,eg [df1, df2]
- axis axis = 0, 表示在水平方向(row)进行连接 axis = 1, 表示在垂直方向(column)进行连接
- join outer, 表示index全部需要; inner,表示只取index重合的部分
- join_axes 传入需要保留的index
- ignore_index 忽略需要连接的frame本身的index。当原本的index没有特别意义的时候可以使用
- keys 可以给每个需要连接的df一个label
以上是关于Pandas从入门到实战(day3)的主要内容,如果未能解决你的问题,请参考以下文章
pytorch-geometric 从入门到不放弃 day3
高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库