Pandas计算标准差

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas计算标准差相关的知识,希望对你有一定的参考价值。

参考技术A

标准差(或方差),分为总体标准差(方差)和样本标准差(方差)。

前者分母为n,后者为n-1。后者是无偏的。

pandas 里的 df.std() 和 df.var() 都是算的无偏的。

而 numpy 是有偏的。

如果需要用 pandas 的 std() 方法计算有偏标准差,可以用下面两种方法:

Excel中也有计算有偏标准差和无偏标准差的函数。
STDEV 是估计 样本的标准偏差
STDEVA 是在前者基础上令文本和逻辑值参与计算。
STDEVP 是整个样本 总体的标准偏差
STDEVPA 也是在前者基础上令文本和逻辑值参与计算。

如何计算列表中每个系列的标准差和平均值

【中文标题】如何计算列表中每个系列的标准差和平均值【英文标题】:How to calculate the standard deviation and mean of each series in a list 【发布时间】:2019-01-01 18:09:18 【问题描述】:

如何计算上述列表中每个系列的标准差和平均值。

【问题讨论】:

请以文字形式提交问题材料,而不是屏幕截图,并展示您迄今为止为解决问题所做的工作。 Pandas series mean and standard deviation的可能重复 【参考方案1】:

Pandas 为 Series 内置了 meanstd 方法:

[(x.mean(), x.std()) for x in data]

输出:

[(0.49934333895737004, 0.27461607837320307),
 (0.48249584271287005, 0.29392453866333784),
 (0.5253031047833215, 0.2915732660895214),
 (0.502227202304306, 0.2800155771737585),
 (0.45248717136739863, 0.3065349918155113),
 (0.524076962361421, 0.30774118943725953),
 (0.49854839726526873, 0.2903590219165625)]

数据:

import numpy as np
import pandas as pd 

np.random.seed(123)
data = [pd.Series(x) for x in np.random.random(size=(7,245))]

【讨论】:

以上是关于Pandas计算标准差的主要内容,如果未能解决你的问题,请参考以下文章

pandas使用groupby函数agg函数获取每个分组聚合对应的标准差(std)实战:计算分组聚合单数据列的标准差(std)计算分组聚合多数据列的标准差(std)

pandas使用groupby函数计算dataframe数据中每个分组的N个数值的滚动标准差(rolling std)例如,计算某公司的多个店铺每N天(5天)的滚动销售额标准差

如何使用 Pandas 中的数据透视表计算标准差?

Pandas Groupby 加权标准差

在 pandas df 中查找 timedelta 对象的均值和标准差

标准差怎么计算 标准差的计算方法