对 .csv 文件中具有相同“年份”的数字求和 [重复]

Posted

技术标签:

【中文标题】对 .csv 文件中具有相同“年份”的数字求和 [重复]【英文标题】:sum numbers with the same 'Year' from .csv file [duplicate] 【发布时间】:2022-01-15 07:33:40 【问题描述】:

问题:如何使用“pandas”将“Global_Sales”与相同的“Year”相加。我真的不知道该怎么做。

P.S 我也需要做“Plot”,但我知道怎么做。

我的代码:

将熊猫导入为 pd 将 matplotlib.pyplot 导入为 plt

plt(情节)

来自“vgsales.csv”的数据:

排名、名称、平台、年份、类型、出版商、NA_Sales、EU_Sales、JP_Sales、Other_Sales、Global_Sales 1,Wii Sports,Wii,2006,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74 2,超级马里奥兄弟,NES,1985,平台,任天堂,29.08,3.58,6.81,0.77,40.24 ... 24,侠盗猎车手V,X360,2013,动作,Take-Two Interactive,9.63,5.31,0.06,1.38,16.38 ... 45,侠盗猎车手V,PS4,2014,动作,Take-Two Interactive,3.8,5.81,0.36,2.02,11.98 等等

【问题讨论】:

您的问题被误导了,matplotlib 只会帮助您绘制结果,仅此而已。你的问题也不是很清楚:你的数据有什么样的结构?我假设它是由 CSV 构建的 pandas 数据框。是否要仅当另一列的值重合时才计算一列的值的总和? "您是否要仅在另一列的值重合时才计算一列的值的总和?"是的,我只想在“Year”列的值一致时计算“Global_Sales” 【参考方案1】:

这是一个起点:

import pandas as pd

df = pd.read_csv (r'C:\temp\sales.csv') # read the csv file

df.groupby(by='Year').sum()  # group by sales year and get the sum

如 cmets 中所述,获取总和不涉及 Matplotlib。

【讨论】:

【参考方案2】:
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('vgsales.csv')
df.head()

df_1 = df.groupby(by='Year').sum()
plt.plot(df_1['Global_Sales'])

【讨论】:

以上是关于对 .csv 文件中具有相同“年份”的数字求和 [重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何对大量 csv 文件进行排序以按特定顺序读取它们?

如何将数据框从长转换为宽,索引中的值按年份分组?

如何对具有相同 ID OpenOffice 的条目求和 - Calc

如何对特定列中具有相同值的行求和

如何在 SQL Server 中对具有相同 ID 的多行求和

在雪花中对具有不同大小的移动窗口的数字列求和