Pandas从入门到实战(day3)

Posted 啊~小 l i

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas从入门到实战(day3)相关的知识,希望对你有一定的参考价值。

Pandas数据排序

  1. Series的排序:
    Seriex.sort_values(ascendiong=True, inplace=False)
    参数说明:
  • ascendiong:默认为True升序排列,为False为降序排序
  • inplace:是否修改原始的Series
  1. DataFrame的排序:
    DataFrame.sort_values(by, ascendiong=True, inplace=Flase)
    参数说明:
  • by:字符串或List<字符串>,单排列或多列排序
  • ascendiong:True/False或者List[True/False],升序还是降序,如果是list对应的by的多列
  • inplace:是否修改原始的DataFrame

Series的排序

df['a'].sort_valuses()

DataFrame的排序

  1. 单列排序
    df.sort_values(by='a')
  2. 多列排序
    df.sort_values(by=['a', 'b'], ascending=[True, False])第一列升序,第二列降序

demo


为txt文件按照最后一列(sum)的顺序从小到大排序

import pandas as pd
data = pd.read_csv("./finall_sort_frist.txt", sep=",")
sort = data.sort_values(by='sum', ascending=False)
sort.to_csv("./a.txt")

其他关键使用的总结

  1. 使用pd.read_csv()读取txt文件时候,可以在括号里增加参数sep="你使用分割数据的符号"
  2. 在DataFrame上面增加列索引data.columns = ['索引1', ‘索引2’]
  3. 将多个Series/DataFrame合并成一个DataFrame使用
frames = [df1, df2['ResNetData']]
all = pd.concat(frames, axis=1, join='outer')

参数
pd.concat(objs, axis=0, join=‘outer’, join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)
含义

  • objs 需要连接的对象,eg [df1, df2]
  • axis axis = 0, 表示在水平方向(row)进行连接 axis = 1, 表示在垂直方向(column)进行连接
  • join outer, 表示index全部需要; inner,表示只取index重合的部分
  • join_axes 传入需要保留的index
  • ignore_index 忽略需要连接的frame本身的index。当原本的index没有特别意义的时候可以使用
  • keys 可以给每个需要连接的df一个label

以上是关于Pandas从入门到实战(day3)的主要内容,如果未能解决你的问题,请参考以下文章

Pandas从入门到实战(day2)

pytorch-geometric 从入门到不放弃 day3

Java从小白到入门,Day3(程序流程控制)

高端实战 Python数据分析与机器学习实战 Numpy/Pandas/Matplotlib等常用库

Python应用实战-从pandas的角度来对比MySQL,教你如何更快更好的学习sql

Python实战作业-day3