如何在 Pandas 中组合文本行

Posted

技术标签:

【中文标题】如何在 Pandas 中组合文本行【英文标题】:How to Combine Rows of Text in Pandas 【发布时间】:2017-03-08 12:53:47 【问题描述】:

我有一个包含两列的表格,我想将具有相同 id 的文本组合起来

import pandas as pd
df = DataFrame('id':[101453,101465,101478,101453,101465,101465], 'text' :['this','is','a','test','string','one'])

我需要这样的结果:

df = DataFrame('id':[101453,101465,101478], 'text':['this test','is string one','a'])

【问题讨论】:

【参考方案1】:

使用groupbyapply join

print (df.groupby('id')['text'].apply(' '.join).reset_index())
       id           text
0  101453      this test
1  101465  is string one
2  101478              a

【讨论】:

【参考方案2】:
df['id'] = sorted(list(set(df['id'])))

set() 删除所有相等的元素。然后将其返回给 list()。并根据需要对其进行排序。

【讨论】:

以上是关于如何在 Pandas 中组合文本行的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 OpenCV 从图像中提取文本行

如何在多行 UILabel 中找到最后一个文本行的位置,或者让 UILabel 有 0 填充

如何使用 bs4 或 lxml 在 Python 中找到 XML 标记的文本行?

如何在 C++ 程序中的 2 个特定字符之间比较 2 个文件中的文本行

如何在文件顶部添加新的文本行?

如何使用正则表达式从文本行中捕获 3 个不同的部分