python--pandas合并与连接
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python--pandas合并与连接相关的知识,希望对你有一定的参考价值。
参考技术Aappend 方法根据行在原数据框添加新的数据框。
如果想要合并后的数据框索引重写排序,可以设置参数 ignore_index=True 。
concat 函数是panda自带的,可以按行或按列合并多个pandas数据框。
按行合并多个数据框,需要注意的是 objs参数接受一个可迭代对象 。concat函数默认按行合并。
设置 ignore_index=True ,使合并后的数据框索引重新排序。
按行合并时,concat对所有的列进行全连接(参数 join=\'outer\' ),没有的列会填充为NaN。
设置参数 join=\'inner\' ,可以只保留共有的列。
设置参数 axis=1 或 axis=\'columns\' ,可以按列合并多个数据框。
merge 方法根据列或索引连接数据框。
当两个数据框只有一个相同列时, merge 方法会自动根据相同列进行内连接, on 参数可以省略。
设置参数 how=[\'left\',\'right\',\'outer\',\'inner\',\'cross\'] ,可以完成不同类型的连接。
当两个数据框没有相同列时,需要设置 left_on 和 right_on 参数,表示按这两列进行连接。
如果需要根据数据框的索引进行连接,需要根据需求设置参数 left_index=True 或者 right_index=True 。
设置 suffixes ,可以给相同的列名添加后缀。默认后缀是 _x , _y 。
join 方法与 merge 方法作用相同,基本上 merge 方法已经可以完成所有的连接操作。
join 方法对按索引连接更方便而已。
当连接的两个数据框中没有相同列时,可以直接按索引进行左连接。
同样,可以设置 how 参数,控制连接的行为。
当数据框中有相同列时,需要设置后缀。
以上是关于python--pandas合并与连接的主要内容,如果未能解决你的问题,请参考以下文章
使用 python、pandas 合并 2 个基于 3 个条件的单独 excel 文件
python数据表的合并(python pandas join() merge()和concat()的用法)