Python Pandas Dataframe 数据透视表列和值顺序
Posted
技术标签:
【中文标题】Python Pandas Dataframe 数据透视表列和值顺序【英文标题】:Python Pandas Dataframe Pivot Table Column and Values Order 【发布时间】:2021-12-14 04:06:40 【问题描述】:长期 XLS 用户仍然是 Python/Pandas 的新手。我正在尝试自动生成一些价格曲线的报告,但我无法以我正在寻找的格式获取 Pivot。提前感谢您的帮助!
我有一个这种格式的数据框:
data = [['AAA',1,11,1,],['AAA',2,12,2],['AAA',3,13,3],
['BBB',1,21,5],['BBB',2,22,6],['BBB',3,23,7],
['CCC',1,31,9],['CCC',2,32,10],['CCC',3,33,11]]
df = pd.DataFrame(data, columns = ['Curve', 'Tenor','Price','Change'])
print(df)
Curve Tenor Price Change
0 AAA 1 11 1
1 AAA 2 12 2
2 AAA 3 13 3
3 BBB 1 21 5
4 BBB 2 22 6
5 BBB 3 23 7
6 CCC 1 31 9
7 CCC 2 32 10
8 CCC 3 33 11
我将 df 旋转如下,结果如下所示:
df2 = pd.pivot_table(df, values=['Price','Change'], index='Tenor',columns='Curve', aggfunc=np.mean)
Change Price
Curve AAA BBB CCC AAA BBB CCC
Tenor
1 1 5 9 11 21 31
2 2 6 10 12 22 32
3 3 7 11 13 23 33
我希望它更改列分组的顺序,使其看起来像
AAA BBB CCC
Tenor Price Change Price Change Price Change
1 11 1 5 21 31 9
2 12 2 6 22 32 10
3 13 3 7 23 33 11
在 XLS 中,您只需在 Pivot 中物理移动字段。我敢肯定它在这里也同样微不足道:) 但无论我如何谷歌,我似乎都找不到解决方案。再次感谢你的帮助!任何和所有的帮助表示赞赏。干杯。
【问题讨论】:
【参考方案1】:我们可以通过swaplevel
、sort_index
和reindex
重新组织标题:
df2 = (
df.pivot_table(values=['Price', 'Change'], index='Tenor', columns='Curve')
.swaplevel(axis=1)
.sort_index(level=0, axis=1)
.reindex(['Price', 'Change'], level=1, axis=1)
.rename_axis(columns=[None, None])
)
df2
:
AAA BBB CCC
Price Change Price Change Price Change
Tenor
1 11 1 21 5 31 9
2 12 2 22 6 32 10
3 13 3 23 7 33 11
swaplevel
切换0级和1级的值(所以AAA、BBB、CCC成为***索引)
sort_index
将按字典顺序对新的*** AAA
BBB
CCC
进行排序(我们也可以使用 .reindex(['AAA', 'BBB', 'CCC'], level=0, axis=1)
来为该级别提供特定的顺序。)
reindex
需要将“价格”放在“更改”之前,因为排序不起作用,因为“更改”按字母顺序排在“价格”之前
rename_axis
去掉旋转时创建的轴名称“Curve”。
【讨论】:
感谢您的帮助。这很好用!我有一个稍微复杂的支点来创建一个我遇到类似问题的报告。 ***.com/questions/69951324/…以上是关于Python Pandas Dataframe 数据透视表列和值顺序的主要内容,如果未能解决你的问题,请参考以下文章
Pandas - 在 DataFrame 中的任何位置查找值索引
python pandas dataframe 写入hdfs