如何从 PHP 中的双精度数组中计算第 n 个百分位数?
Posted
技术标签:
【中文标题】如何从 PHP 中的双精度数组中计算第 n 个百分位数?【英文标题】:How can I calculate the nth percentile from an array of doubles in PHP? 【发布时间】:2014-07-25 18:41:31 【问题描述】:我有一个大的双精度数组,我需要计算数组的第 75 个和第 90 个百分位值。通过函数执行此操作的最有效方法是什么?
【问题讨论】:
对数组进行排序,计算值的数量,计算 75% 和 90% 的条目等瞧 【参考方案1】:自从统计数据以来已经有一段时间了,所以我可以离开这里 - 但这里有一个裂缝。
function get_percentile($percentile, $array)
sort($array);
$index = ($percentile/100) * count($array);
if (floor($index) == $index)
$result = ($array[$index-1] + $array[$index])/2;
else
$result = $array[floor($index)];
return $result;
$scores = array(22.3, 32.4, 12.1, 54.6, 76.8, 87.3, 54.6, 45.5, 87.9);
echo get_percentile(75, $scores);
echo get_percentile(90, $scores);
【讨论】:
修复超出范围的索引:$index = ($percentile/100) * (count($array) - 1);【参考方案2】:如果您使用较高的百分比值 (100) 并且没有根据 Excel PERCENTILE 函数返回正确的值,上述答案可能会引发未定义索引通知。你可以see here an example of how it fails。
我已经根据Wikipedia Second 变体在 php 中编写了一个函数,它是 Excel 中使用的函数。此函数还受到非百分比值(超出范围)的保护。
function getPercentile($array, $percentile)
$percentile = min(100, max(0, $percentile));
$array = array_values($array);
sort($array);
$index = ($percentile / 100) * (count($array) - 1);
$fractionPart = $index - floor($index);
$intPart = floor($index);
$percentile = $array[$intPart];
$percentile += ($fractionPart > 0) ? $fractionPart * ($array[$intPart + 1] - $array[$intPart]) : 0;
return $percentile;
【讨论】:
【参考方案3】:根据上述 Mark 的功能,我认为该功能实际上应该是:
function get_percentile($percentile, $array)
sort($array);
$index = (($percentile/100) * (count($array))-1;
if (floor($index) == $index)
return $array[$index];
else
return ($array[floor($index)] + $array[ceiling($index)])/2;
我认为有三点需要改正:
-
需要将
count
减一以避免超出范围的索引(如上所述)
如果计算出的index
是一个整数,那么你应该可以只返回索引。仅当index
不是整数时才需要取平均值。
对于平均值,最好使用floor
和ceiling
来使索引取平均值,而不是随意从索引中减去一个
【讨论】:
以上是关于如何从 PHP 中的双精度数组中计算第 n 个百分位数?的主要内容,如果未能解决你的问题,请参考以下文章