如何在没有分组的情况下连接熊猫中数据框一列的所有行[重复]

Posted

技术标签:

【中文标题】如何在没有分组的情况下连接熊猫中数据框一列的所有行[重复]【英文标题】:how to concatenate all rows of a column of a data frame in pandas without group by [duplicate] 【发布时间】:2019-01-17 11:13:29 【问题描述】:

我有一个这样的数据框

服用 12 天,服用 60 毫克百忧解 4 年以上。索引句

  1   I feel the best I have felt in years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               
  2   "I have taken for over 7 years.                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                  
  3   I slept 2 hours".                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  4   IT SAVED MY LIFE                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    
  5   IT SAVED MY LIFE" 

然后我想将它们连接到一个数组中。问题是可能有一些句子是可重复的,但我仍然想保留所有句子,所以结果是:

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" , "IT SAVED MY LIFE"]

我已经尝试过link 和this,它们都在 r 中。

我也试过这种方法:

dfsent.groupby(['sentences']).apply(','.join)

但由于我的数据框中的某些行是重复的,它只给了我其中一个。如果是我的示例,请返回:

["I feel the best I have felt in years", "I have taken for over 7 years." , "I slept 2 hours." , "IT SAVED MY LIFE" ]

提前致谢:)

【问题讨论】:

你不想要df.sentences.tolist()吗?然后,您可以根据需要加入。 你是对的,它只是给了我正确的答案。太感谢了。你想添加你的答案吗? 不,谢谢,我认为这可能是一个重复的问题,很乐意提供帮助 :) 它根本不重复,因为它想转换为列表,但我的目的是连接它们。所以我不知道我可以用另一种方式找到这个问题,顺便谢谢:) 你想要一个字符串作为结果吗?如果是这样,请使用df.sentences.str.cat(sep=',') 我认为这可能是您真正想要的,如果是这种情况,我将重新提出问题,因为不是骗子 【参考方案1】:

如果您只想在 Pandas 数据框中的列中生成所有值(唯一或非唯一)的列表,则更简单的方法是使用 .tolist() 方法。

因此,dfsent['sentences'].tolist() 将产生所需的输出。

【讨论】:

以上是关于如何在没有分组的情况下连接熊猫中数据框一列的所有行[重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何按一列的最大值获取SQL行,按另一列分组

按一列分组并在熊猫中找到另一列的总和和最大值

熊猫数据框列的分组和计数

如何更新python中熊猫数据框特定列中的所有行?

熊猫:设置列等于另一列的分组总和[重复]

如何一次性检测和删除熊猫数据帧每一列的异常值? [复制]