计数排序

Posted 跳跳揽月

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了计数排序相关的知识,希望对你有一定的参考价值。

今天我们来探讨一下常用的非比较排序算法:计数排序,它的时间复杂度可以达到O(n+k)。

这里我们用到的唯一数据结构就是数组,当然我们也可以利用链表来实现下述算法。

计数排序(Counting Sort)

计数排序用到一个额外的计数数组C,根据数组C来将原数组A中的元素排到正确的位置。

通俗地理解,例如有10个年龄不同的人,假如统计出有8个人的年龄不比小明大(即小于等于小明的年龄,这里也包括了小明),那么小明的年龄就排在第8位,通过这种思想可以确定每个人的位置,也就排好了序。当然,年龄一样时需要特殊处理(保证稳定性):通过反向填充目标数组,填充完毕后将对应的数字统计递减,可以确保计数排序的稳定性。

计数排序的步骤如下:

  1. 统计数组A中每个值A[i]出现的次数,存入C[A[i]]

  2. 从前向后,使数组C中的每个值等于其与前一项相加,这样数组C[A[i]]就变成了代表数组A中小于等于A[i]的元素个数

  3. 反向填充目标数组B:将数组元素A[i]放在数组B的第C[A[i]]个位置(下标为C[A[i]] – 1),每放一个元素就将C[A[i]]递减

计数排序的实现代码如下:

#include<iostream>

using namespace std;

 

// 分类 ------------ 内部非比较排序

// 数据结构 --------- 数组

// 最差时间复杂度 ---- O(n + k)

// 最优时间复杂度 ---- O(n + k)

// 平均时间复杂度 ---- O(n + k)

// 所需辅助空间 ------ O(n + k)

// 稳定性 ----------- 稳定

 

 

const int k = 100;   // 基数为100,排序[0,99]内的整数

int C[k];            // 计数数组

 

void CountingSort(int A[], int n)

{

    for (int i = 0; i < k; i++)   // 初始化,将数组C中的元素置0(此步骤可省略,整型数组元素默认值为0)

    {

        C[i] = 0;

    }

    for (int i = 0; i < n; i++)   // 使C[i]保存着等于i的元素个数

    {

        C[A[i]]++;

    }

    for (int i = 1; i < k; i++)   // 使C[i]保存着小于等于i的元素个数,排序后元素i就放在第C[i]个输出位置上

    {

        C[i] = C[i] + C[i - 1];

    }

    int *B = (int *)malloc((n) * sizeof(int));// 分配临时空间,长度为n,用来暂存中间数据

    for (int i = n - 1; i >= 0; i--)    // 从后向前扫描保证计数排序的稳定性(重复元素相对次序不变)

    {

        B[--C[A[i]]] = A[i];      // 把每个元素A[i]放到它在输出数组B中的正确位置上

                                  // 当再遇到重复元素时会被放在当前元素的前一个位置上保证计数排序的稳定性

    }

    for (int i = 0; i < n; i++)   // 把临时空间B中的数据拷贝回A

    {

        A[i] = B[i];

    }

    free(B);    // 释放临时空间

}

 

int main()

{

    int A[] = { 15, 22, 19, 46, 27, 73, 1, 19, 8 };  // 针对计数排序设计的输入,每一个元素都在[0,100]上且有重复元素

    int n = sizeof(A) / sizeof(int);

    CountingSort(A, n);

    printf("计数排序结果:");

    for (int i = 0; i < n; i++)

    {

        printf("%d ", A[i]);

    }

    printf("\n");

    return 0;

}


下图给出了对{ 4, 1, 3, 4, 3 }进行计数排序的简单演示过程

计数排序的时间复杂度和空间复杂度与数组A的数据范围(A中元素的最大值与最小值的差加上1)有关,因此对于数据范围很大的数组,计数排序需要大量时间和内存。

例如:对0到99之间的数字进行排序,计数排序是最好的算法,然而计数排序并不适合按字母顺序排序人名,将计数排序用在基数排序算法中,能够更有效的排序数据范围很大的数组。


知道什么是最重要的,

知道什么是不重要的。

而后,做一个简单的人。

——阿甘正传


以上是关于计数排序的主要内容,如果未能解决你的问题,请参考以下文章

计数排序vs基数排序vs桶排序

算法 计数排序

8计数排序

排序--09---计数排序

计数排序算法是如何计数的?

排序算法非比较排序:计数排序基数排序桶排序