如何在 Pandas 中组合文本行
Posted
技术标签:
【中文标题】如何在 Pandas 中组合文本行【英文标题】:How to Combine Rows of Text in Pandas 【发布时间】:2017-03-08 12:53:47 【问题描述】:我有一个包含两列的表格,我想将具有相同 id 的文本组合起来
import pandas as pd
df = DataFrame('id':[101453,101465,101478,101453,101465,101465], 'text' :['this','is','a','test','string','one'])
我需要这样的结果:
df = DataFrame('id':[101453,101465,101478], 'text':['this test','is string one','a'])
【问题讨论】:
【参考方案1】:使用groupby
和apply
join
:
print (df.groupby('id')['text'].apply(' '.join).reset_index())
id text
0 101453 this test
1 101465 is string one
2 101478 a
【讨论】:
【参考方案2】:df['id'] = sorted(list(set(df['id'])))
set() 删除所有相等的元素。然后将其返回给 list()。并根据需要对其进行排序。
【讨论】:
以上是关于如何在 Pandas 中组合文本行的主要内容,如果未能解决你的问题,请参考以下文章
如何在多行 UILabel 中找到最后一个文本行的位置,或者让 UILabel 有 0 填充
如何使用 bs4 或 lxml 在 Python 中找到 XML 标记的文本行?