手撕C语言标准库qsort(自我实现简化高效版C风格泛型快排)

Posted C_YCBX Py_YYDS

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了手撕C语言标准库qsort(自我实现简化高效版C风格泛型快排)相关的知识,希望对你有一定的参考价值。

查看源代码的网址(我自己写的)

  • 如果对快排足够熟练可以直接来看看这源码。
    这是我GitHub仓库对应的GitHub1s网址链接:
    GitHub1s在线查看源码

如果还不懂快排,推荐看看我很久以前写的一篇博客

这里是几种logn排序的比较
虽然只写了实现代码
你可以根据看到过的快排的动画过程(哔哩哔哩一大堆),然后看看我这个代码实现即可,快排有很多种,我这只是最简单的两类。

具体实现细节

由于C语言缺少泛型的现代语法支持,不像C++有泛型模板,所以底层的代码复用一般采取 void 指针的方式,如果需要外界的控制则采取函数指针,然后通过回调函数实现外界控制的功能,而 qsort 就是利用的这一逻辑,用第四个参数传递函数指针,实现外界的函数控制。

第一:void指针的使用

  • 想要实现C的通用函数库,一般都是把指针转为void类型,然后再根据传入的数据长度,用一个字节的char类型指针对每个元素进行操作。

比如实现 qsort 时里面所需要的 swap 函数。

  • 这个swap的实现是通过qsort里面把void类型的指针转char类型再传入即可。
void swap(char *a, char *b, int width) //把一块width大小的内存分成一个字节的换
    char tmp;
    if (a != b) //不是同一片内存才开始交换
        while (width--) 
            tmp = *a;
            *a++ = *b;
            *b++ = tmp;
        
    

第二:回调函数实现

根据C标准的函数库来看:

  • 如果按照 return a-b; 则返回负值也就是 a<b 的时候,这是我们默认的从小到大正常次序。也就是函数内部如果通过这两个数回调函数返回值为负数,那么就默认这个两个数的位置是正确的。所以当我们把它设置为 a>b 返回负数的时候,那么它就会以从大到小的次序进行排序了!

讲实话,这个判断函数只需要两个状态即可,是否已经排好序,或者是没有排好序,所以完全可以直接一个 bool 型通过 0 和 1 来表示是否已经拍好,而负数则完全没有必要。暂时不清楚C标准库为什么一般都是采取负数 0 正数的方式来比较,可能是这种方式能够准确的直接通过返回值来判断两个数是 '<' or '>' or '=' 而只返回 0 和 1 则只能判断一个表达式是否正确。但在排序这里完全可以只采取 0 和 1,毕竟只需要清楚是否为正确次序即可,所以C++的 sort 都是通过直接的返回 bool 表达式来进行判断。

对应代码实现

只把用到了compar 回调函数的部分拎出来了,cmp 是作为排序的基准数,而base通过指针移位到不同的位置来与 cmp 进行判断,cmp 左边都应该小于等于它,cmp 右边都应该大于等于它。关于快排为什么会不稳定,就是因为它会在两者相等的时候停住进行数据交换,这样就无法按照开始插入的顺序进行排序,也就是可能开始插入的顺序中有紧挨着的几个相等元素,而快排可能会将他们进行数据交换。

外界函数实现

从这里 strcmp 的使用就应该能从一个角度来切入为什么qsort 采取 int 返回来控制,毕竟这样可以兼容 strcmp 等一众函数。

#include <string.h>
struct Student
    int score;
    char* name;
    int id;
;
//自定义:按分数从大到小排序,名字按照strcmp的结果进行排序(按字典序从小到大)
int cmp(const void*a,const void*b)
    if( (*(Student*)a).score - (*(Student*)b).score==0)
        return strcmp(((Student*)a)->name,((Student*)a)->name);
   if( (*(Student*)a).score > (*(Student*)b).score)
       return -1;
   return 1;

内部调用(部分我实现源码)

    while (tl <= tr) 
        while (compar(base + (tl * size), cmp) < 0)tl++;//实际上可以直接根据0和1确定如何排序,然而C标准似乎是还需要利用到负数
        while (compar(cmp, base + (tr * size)) < 0)tr--;
        if (tl <= tr) 
            swap(base + (tl * size), base + (tr * size), size);
            tl++;
            tr--;
        
    

完整qsort实现

推荐用GitHub1s在线查看,毕竟查看的各种信息界面分类更舒适。
在线查看源码界面

//
// Created by Alone on 2021/11/23.
//

#ifndef MY_TINY_STL_QSORT_H
#define MY_TINY_STL_QSORT_H

#include <string.h>
#include <assert.h>

typedef long long _size_t;

//函数声明
void swap(char *a, char *b, int width);

void quickSort(char *base, _size_t size, _size_t left, _size_t right, int (*compar)(const void *, const void *));

void _qsort(void *base, _size_t nitems, _size_t size, int (*compar)(const void *, const void *));

/*函数实现*/
void swap(char *a, char *b, int width) //把一块width大小的内存分成一个字节的换
    char tmp;
    if (a != b) //不是同一片内存才开始交换
        while (width--) 
            tmp = *a;
            *a++ = *b;
            *b++ = tmp;
        
    


//快速排序真正的处理函数,一个字节一个字节的处理,而一个size大小的字节代表一个元素
//而关于比较部分的函数compar则是外部定义的回调函数,关于回调函数的标准,大于等于0表示
void quickSort(char *base, _size_t size, _size_t left, _size_t right, int (*compar)(const void *, const void *)) 
    if (left >= right)return;
    _size_t tl = left, tr = right;//拷贝一份左右指针,用于移动更新
    char cmp[size];
    //以中间的数为标准进行快排,用cmp存储,使得swap不会对cmp的内容作出任何改变
    memmove(cmp, (base + (tl + (tr - tl) / 2) * size), size);
    while (tl <= tr) 
        while (compar(base + (tl * size), cmp) < 0)tl++;//实际上可以直接根据0和1确定如何排序,然而C标准似乎是还需要利用到负数
        while (compar(cmp, base + (tr * size)) < 0)tr--;
        if (tl <= tr) 
            swap(base + (tl * size), base + (tr * size), size);
            tl++;
            tr--;
        
    
    /*递归分治完成*/
    quickSort(base, size, left, tr, compar);
    quickSort(base, size, tl, right, compar);


//快排入口
void _qsort(void *base, _size_t nitems, _size_t size, int (*compar)(const void *, const void *)) 
    assert(base != NULL && compar != NULL);
    quickSort((char *) base, size, 0, nitems - 1, compar);

#endif //MY_TINY_STL_QSORT_H

简单效率验证

本地验证

排序的元素类型 和 初始化

打印和初始化代码

本地 效率测试

测试数据为1000w级别,只打印出10个数据予以证明。否则不好查看。

_qsort打印结果(我的实现)


qsort打印结果

果然不出所料,qsort 快很多!原因我大概也能想得到,主要是因为采用的一个字节一个字节的寻址操作,大大拖慢了排序的过程,实际上底层的 qsort 应该是采取了一些措施优化了编译的过程,让每次寻址操作不至于总是一个字节的处理,应该同时处理多个字节。

LeetCode平台验证(912.排序数组)

C库的qsort实现效率:

自己实现的qsort效率:

  • 这里就几乎没有任何差别了,我猜原因可能是LeetCode平台会对代码作出一些编译上的优化。(毕竟我本地用的C++的g++编译器,而不是gcc)

LeetCode这题的链接:排序数组

我的提交代码

typedef long long _size_t;
void swap(char* a,char *b,int width)//把一块width大小的内存分成一个字节的换
    char tmp;
    if(a!=b)//不是同一片内存才开始交换
        while (width--)
            tmp = *a;
            *a++ = *b;
            *b++ = tmp;
        
    

//快速排序真正的处理函数,一个字节一个字节的处理,而一个size大小的字节代表一个元素
//而关于比较部分的函数compar则是外部定义的回调函数,关于回调函数的标准,大于等于0表示
void quickSort(char* base, _size_t size,_size_t left, _size_t right,int (*compar)(const void *, const void *)) 
    if (left >= right)return;
    _size_t tl = left, tr = right;
    char cmp[size];
    //以中间的数为标准进行快排,用cmp存储,使得swap不会对cmp的内容作出任何改变
    memmove(cmp,(base + (tl+(tr-tl)/2)*size),size);
    while (tl <= tr) 
        while (compar(base+(tl*size),cmp)<0)tl++;
        while (compar(cmp,base+(tr*size))<0)tr--;
        if (tl <= tr) 
            swap(base+(tl*size), base+(tr*size),size);
            tl++;
            tr--;
        
    
    quickSort(base,size, left, tr,compar);
    quickSort(base,size, tl, right,compar);


//快排入口
void _qsort(void *base, _size_t nitems, _size_t size, int (*compar)(const void *, const void *)) 
    quickSort((char*)base,size,0,nitems-1,compar);

int cmp(const void* a,const void* b)
    return *(int*)a - *(int*)b;

int* sortArray(int* nums, int numsSize, int* returnSize)
    
    *returnSize = numsSize;
    _qsort(nums,numsSize,sizeof(int),cmp);
    return nums;

以上是关于手撕C语言标准库qsort(自我实现简化高效版C风格泛型快排)的主要内容,如果未能解决你的问题,请参考以下文章

c语言重要库函数解读 和模拟实现————Qsort

C语言--回调函数实列 模拟qsort函数

C语言之qsort函数进行排序

C语言篇 + 指针进阶练习 + qsort模拟实现(回调函数思想) + 指针和数组笔试题

CGO实战-封装qsort函数

CGO实战-封装qsort函数