Pandas .. 分位数函数是不是需要排序数据来计算百分位数?
Posted
技术标签:
【中文标题】Pandas .. 分位数函数是不是需要排序数据来计算百分位数?【英文标题】:Pandas.. does quantile function need sorted data to calculate percentiles?Pandas .. 分位数函数是否需要排序数据来计算百分位数? 【发布时间】:2020-01-27 23:39:16 【问题描述】:我正在使用 Pandas 清理一些数据并进行基本统计。我想知道quantile()
是在计算之前对值进行排序还是我必须事先进行排序?
例如,这里我试图获得每家公司员工人数的第 50 个百分位
Percentile50th = Y2015_df.groupby (["company"])["worker"].quantile(0.50)
我之所以问,是因为当我使用 MS Excel 中的结果验证我得到的值时,我发现 Median 函数需要对数据进行排序以获得正确的中位数。但我不确定 Pandas 是否是这种情况。
【问题讨论】:
没有。看看这个。enter link description here @Parth 不,你的意思是它不需要我这边的任何排序,对吧?该功能完成所有工作..只是想仔细检查 【参考方案1】:您不需要排序。请参阅我之前评论中的链接。 Example
【讨论】:
非常感谢@Parth以上是关于Pandas .. 分位数函数是不是需要排序数据来计算百分位数?的主要内容,如果未能解决你的问题,请参考以下文章
pandas使用groupby函数计算dataframe数据中每个分组的N个数值的滚动分位数(rolling quantile)例如,计算某公司的多个店铺每N天(5天)的滚动销售额分位数
pandas使用cut函数基于分位数进行连续值分箱(手动计算分位数)处理后出现NaN值原因及解决