如何过滤数据框行并将总和保存在新行中?

Posted

技术标签:

【中文标题】如何过滤数据框行并将总和保存在新行中?【英文标题】:How can I filter data frame rows and save the sum in new row? 【发布时间】:2021-10-31 16:55:33 【问题描述】:

我想合并所有分数列小于 63 的行,

然后取出所有的一些并将它们保存在一个新行中,我们可以称之为“新总和”,它将是所有分数小于或等于 63 的分数的总和。

删除包含小于 63 的值的列。

我正在使用熊猫。

请看附图

【问题讨论】:

【参考方案1】:

您可以这样做:

df.loc[len(df)] = ['Other', "", df[df['Score'] < 63]['Score'].sum(), ""]

如果你想删除Score

df.drop(df[df['Score'] < 63].index, inplace=True)

注意:选项inplace=True 永久更改DataFrame。如果您不希望将更改永久应用于DataFrame,请省略此选项,例如

new_df = df.drop(df[df['Score'] < 63].index)

演示:

import pandas as pd
import numpy as np

df = pd.DataFrame(
    'Name': ['Alisa', 'Bobby', 'Cathrine', 'Alisa', 'Bobby', 'Cathrine', 'Alisa', 'Bobby', 'Cathrine', 'Alisa', 'Bobby',
             'Cathrine'],
    'Subject': ['Mathematics', 'Mathematics', 'Mathematics', 'Science', 'Science', 'Science', 'History', 'History',
                'History', 'Economics', 'Economics', 'Economics'],
    'Score': [62, 47, 55, 74, 31, 77, 85, 63, 42, 62, 89, 85],
    'score-ranked': [7.5, 10.0, 9.0, 5.0, 12.0, 4.0, 2.5, 6.0, 11.0, 7.5, 1.0, 2.5]
)

df.loc[len(df)] = ['Other', "", df[df['Score'] < 63]['Score'].sum(), ""]

df.drop(df[df['Score'] < 63].index, inplace=True)

print(df)

输出:

        Name    Subject  Score score-ranked
3      Alisa    Science     74          5.0
5   Cathrine    Science     77          4.0
6      Alisa    History     85          2.5
7      Bobby    History     63          6.0
10     Bobby  Economics     89          1.0
11  Cathrine  Economics     85          2.5
12     Other               299   

【讨论】:

您好,我并不是要您删除您的答案 :-) 我看到您有时会回答正则表达式问题(这很棒),我只是想提出一些建议。 @Thefourthbird - 一如既往地感谢您的鼓励。不知何故,我只是在删除我的答案后才看到你的评论。我删除答案的原因是我对我的答案不满意:)。顺便说一句,您在评论中发布的解决方案很棒;请将其发布为答案。【参考方案2】:

试试 df[df['分数'] > 63] df.groupby(['Name'])[Score].sum() 我写它作为答案,因为我不能评论

【讨论】:

谢谢Faika,但是不行,我想同时合并和drop。【参考方案3】:

你可以使用pandas内置的Fancy indexing

df = df[df['score'] < 30]
df.loc[len(df.index)] = ["TOTAL","",sum(df['score']),""] 

【讨论】:

我想做点别的,不是df[df['Score'] > 63] 检查是否是你想要的 谢谢你,佩德罗,实际上,它是我想要的一部分,它是可行的,但我也想将它们全部结合起来,删除小于 63 的任何东西 立即试用代码

以上是关于如何过滤数据框行并将总和保存在新行中?的主要内容,如果未能解决你的问题,请参考以下文章

如何计算特定单元格的总和?

数据框行中内容的修剪/截断平均值

如何通过java过滤文本文件并将结果保存到新文件中

如何将过滤器应用于照片并将其保存到数据库 php css javascript

将列表附加为数据框行

计算不同行的总和并保存在单行 BigQuery 中