如何从 PHP 中的双精度数组中计算第 n 个百分位数?

Posted

技术标签:

【中文标题】如何从 PHP 中的双精度数组中计算第 n 个百分位数?【英文标题】:How can I calculate the nth percentile from an array of doubles in PHP? 【发布时间】:2014-07-25 18:41:31 【问题描述】:

我有一个大的双精度数组,我需要计算数组的第 75 个和第 90 个百分位值。通过函数执行此操作的最有效方法是什么?

【问题讨论】:

对数组进行排序,计算值的数量,计算 75% 和 90% 的条目等瞧 【参考方案1】:

自从统计数据以来已经有一段时间了,所以我可以离开这里 - 但这里有一个裂缝。

function get_percentile($percentile, $array) 
    sort($array);
    $index = ($percentile/100) * count($array);
    if (floor($index) == $index) 
         $result = ($array[$index-1] + $array[$index])/2;
    
    else 
        $result = $array[floor($index)];
    
    return $result;


$scores = array(22.3, 32.4, 12.1, 54.6, 76.8, 87.3, 54.6, 45.5, 87.9);

echo get_percentile(75, $scores);
echo get_percentile(90, $scores);

【讨论】:

修复超出范围的索引:$index = ($percentile/100) * (count($array) - 1);【参考方案2】:

如果您使用较高的百分比值 (100) 并且没有根据 Excel PERCENTILE 函数返回正确的值,上述答案可能会引发未定义索引通知。你可以see here an example of how it fails。

我已经根据Wikipedia Second 变体在 php 中编写了一个函数,它是 Excel 中使用的函数。此函数还受到非百分比值(超出范围)的保护。

function getPercentile($array, $percentile)

    $percentile = min(100, max(0, $percentile));
    $array = array_values($array);
    sort($array);
    $index = ($percentile / 100) * (count($array) - 1);
    $fractionPart = $index - floor($index);
    $intPart = floor($index);

    $percentile = $array[$intPart];
    $percentile += ($fractionPart > 0) ? $fractionPart * ($array[$intPart + 1] - $array[$intPart]) : 0;

    return $percentile;

【讨论】:

【参考方案3】:

根据上述 Mark 的功能,我认为该功能实际上应该是:

function get_percentile($percentile, $array) 
    sort($array);
    $index = (($percentile/100) * (count($array))-1;
    if (floor($index) == $index) 
         return $array[$index];
    
    else 
        return ($array[floor($index)] + $array[ceiling($index)])/2;
    

我认为有三点需要改正:

    需要将 count 减一以避免超出范围的索引(如上所述) 如果计算出的index 是一个整数,那么你应该可以只返回索引。仅当index 不是整数时才需要取平均值。 对于平均值,最好使用floorceiling 来使索引取平均值,而不是随意从索引中减去一个

【讨论】:

以上是关于如何从 PHP 中的双精度数组中计算第 n 个百分位数?的主要内容,如果未能解决你的问题,请参考以下文章

postgresql中的第n个百分位数计算

如何在小数点后将 Dart 中的双精度数舍入到给定的精度?

如何在android中添加两个没有指数的双精度值

尝试从文本字段中读取格式化的双精度

x64 浮点混合

PHP随机按百分比抽奖