Pandas计算标准差
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Pandas计算标准差相关的知识,希望对你有一定的参考价值。
参考技术A标准差(或方差),分为总体标准差(方差)和样本标准差(方差)。
前者分母为n,后者为n-1。后者是无偏的。
pandas 里的 df.std() 和 df.var() 都是算的无偏的。
而 numpy 是有偏的。
如果需要用 pandas 的 std() 方法计算有偏标准差,可以用下面两种方法:
Excel中也有计算有偏标准差和无偏标准差的函数。
STDEV 是估计 样本的标准偏差 ;
STDEVA 是在前者基础上令文本和逻辑值参与计算。
STDEVP 是整个样本 总体的标准偏差 ;
STDEVPA 也是在前者基础上令文本和逻辑值参与计算。
如何计算列表中每个系列的标准差和平均值
【中文标题】如何计算列表中每个系列的标准差和平均值【英文标题】:How to calculate the standard deviation and mean of each series in a list 【发布时间】:2019-01-01 18:09:18 【问题描述】:如何计算上述列表中每个系列的标准差和平均值。
【问题讨论】:
请以文字形式提交问题材料,而不是屏幕截图,并展示您迄今为止为解决问题所做的工作。 Pandas series mean and standard deviation的可能重复 【参考方案1】:Pandas 为 Series 内置了 mean
和 std
方法:
[(x.mean(), x.std()) for x in data]
输出:
[(0.49934333895737004, 0.27461607837320307),
(0.48249584271287005, 0.29392453866333784),
(0.5253031047833215, 0.2915732660895214),
(0.502227202304306, 0.2800155771737585),
(0.45248717136739863, 0.3065349918155113),
(0.524076962361421, 0.30774118943725953),
(0.49854839726526873, 0.2903590219165625)]
数据:
import numpy as np
import pandas as pd
np.random.seed(123)
data = [pd.Series(x) for x in np.random.random(size=(7,245))]
【讨论】:
以上是关于Pandas计算标准差的主要内容,如果未能解决你的问题,请参考以下文章
pandas使用groupby函数agg函数获取每个分组聚合对应的标准差(std)实战:计算分组聚合单数据列的标准差(std)计算分组聚合多数据列的标准差(std)
pandas使用groupby函数计算dataframe数据中每个分组的N个数值的滚动标准差(rolling std)例如,计算某公司的多个店铺每N天(5天)的滚动销售额标准差