对 .csv 文件中具有相同“年份”的数字求和 [重复]
Posted
技术标签:
【中文标题】对 .csv 文件中具有相同“年份”的数字求和 [重复]【英文标题】:sum numbers with the same 'Year' from .csv file [duplicate] 【发布时间】:2022-01-15 07:33:40 【问题描述】:问题:如何使用“pandas”将“Global_Sales”与相同的“Year”相加。我真的不知道该怎么做。
P.S 我也需要做“Plot”,但我知道怎么做。
我的代码:
将熊猫导入为 pd 将 matplotlib.pyplot 导入为 pltplt(情节)
来自“vgsales.csv”的数据:
排名、名称、平台、年份、类型、出版商、NA_Sales、EU_Sales、JP_Sales、Other_Sales、Global_Sales 1,Wii Sports,Wii,2006,Sports,Nintendo,41.49,29.02,3.77,8.46,82.74 2,超级马里奥兄弟,NES,1985,平台,任天堂,29.08,3.58,6.81,0.77,40.24 ... 24,侠盗猎车手V,X360,2013,动作,Take-Two Interactive,9.63,5.31,0.06,1.38,16.38 ... 45,侠盗猎车手V,PS4,2014,动作,Take-Two Interactive,3.8,5.81,0.36,2.02,11.98 等等【问题讨论】:
您的问题被误导了,matplotlib 只会帮助您绘制结果,仅此而已。你的问题也不是很清楚:你的数据有什么样的结构?我假设它是由 CSV 构建的 pandas 数据框。是否要仅当另一列的值重合时才计算一列的值的总和? "您是否要仅在另一列的值重合时才计算一列的值的总和?"是的,我只想在“Year”列的值一致时计算“Global_Sales” 【参考方案1】:这是一个起点:
import pandas as pd
df = pd.read_csv (r'C:\temp\sales.csv') # read the csv file
df.groupby(by='Year').sum() # group by sales year and get the sum
如 cmets 中所述,获取总和不涉及 Matplotlib。
【讨论】:
【参考方案2】:import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_csv('vgsales.csv')
df.head()
df_1 = df.groupby(by='Year').sum()
plt.plot(df_1['Global_Sales'])
【讨论】:
以上是关于对 .csv 文件中具有相同“年份”的数字求和 [重复]的主要内容,如果未能解决你的问题,请参考以下文章
如何对具有相同 ID OpenOffice 的条目求和 - Calc