数据结构与算法之数组

Posted 乞力马扎罗的雪CYF

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据结构与算法之数组相关的知识,希望对你有一定的参考价值。

    数组的基本概念:数组是最简单最常用的数据结构,但是也有一些注意事项:

(1)数组的分配方式以及存储位置;

(2)初始化;

(3)不同语言中的数组高级定义;

(4)多维数组;


C/C++中数组分配方式:

(1)int a[10];

适用于数组长度已知或者对数组长度不敏感的情况,比如定义一个字符串。

(2)int *a = (int *)malloc(sizeof(int)*n);

用在C中,适用于动态申请数组的长度。记得最后要free,防止内存泄露。

(3)int[] a = new int[n];

用在C++中。最后要delete。


进程的虚拟地址空间:

技术分享


进程在运行的过程中会将地址划分为许多段,重要的有两个:运行时堆和用户栈。动态申请的数组(malloc和new)会在运行时堆中,常量数组(int a[10])会放在用户栈里面。放在运行时堆中的数组是永久性的,不主动释放就会永久存在,所以才会导致内存泄露。而在用户栈空间是临时,会随着函数的调用和返回进行回收。所以我们不能返回局部变量的地址,尤其是返回一个常量数组的首地址,因为这个地址会在用完之后被回收。所以说一个函数如果在函数内部被修改,想要在函数外部继续用的话,就要使用动态分配的数组。


C/C++中数组的初始化

编程中很多bug都是由直接引用未初始化的变量导致的,一般数组的初始话如下:

(1)全局数组自动初始化;

(2)malloc方式不初始化,可以用memset(可初始化为0或者-1),fill进行初始化;

(3)new方式需要根据编译器判断;


     基础的数组直接操作内存,效率高,但是缺乏丰富的api,所以高级语言往往会有相应的高级实现。C/C++中使用STL中的vector.

     多维数组是一维数组的扩展,二维数组可以用来描述矩阵或者图,如下:

    int a1[10][10];//要求数组的两维都确定;
    int **a2;//两维都不确定;
    int* a3[10];//每一维单独分配,长度可以不一致;
    vector<int> a4[10];//只能在C++中使用;
    vector<vector<int>> a5;//只能在C++中使用;

多维数组在访问过程中要注意cache缺失问题,数组可以有按行操作方式和按列操作方式。按行操作方式要好过按列操作方式。因为二维数组加载到cache的过程是按行来的,所以当在访问某一行的时候,这一行的元素都已经在cache中了。但是按列方式访问就不同,通常只有一个元素在cache中,其他元素都会缺失的,所以按列访问会造成严重的cache缺失问题,会严重影响性能。


数组在排序中的作用

    对于常用的七大排序,在我前面几篇博客中都有讲到,包括代码实现。其中数组在排序中有非常大的作用,下面做一个简单的排序概述:

复杂度为O(n^2):

(1)插入排序-复杂度为O(n^2)中最快的;

(2)选择排序、冒泡排序比较慢,一般会出现在面试题中。


复杂度为O(N*logN):

(1)快速排序:基于比较的排序中速度最快的;

(2)归并排序:实际中较少使用,经常在面试中;

(3)堆排序:实际中较少使用,但是堆很常用;


复杂度为O(n),只能对正整数进行排序:

(1)基数排序-复杂度O(n+r),r为基数;

(2)计数排序-复杂度O(n+k),k为元素范围;


但是在实际开发中,C/C++中自带了排序函数:

(1)在C语言中有qsort函数,需要自定义cmp比较函数,函数形式如下:

int cmp(const void *a,const void *b);

(2)C++中,STL中自带排序函数sort,调用方法如下:

sort(a.begin(),a.end(),[greater<int>() | less<int>()]);



以上是关于数据结构与算法之数组的主要内容,如果未能解决你的问题,请参考以下文章

数据结构与算法之深入解析“数组的均值分割”的求解思路与算法示例

数据结构与算法之数组

数据结构与算法之深入解析“恢复数组”的求解思路与算法示例

数据结构与算法(Java)之稀疏数组与队列

数据结构与算法之深入解析“一维数组的动态和”的求解思路与算法示例

数据结构与算法之深入解析“一维数组的动态和”的求解思路与算法示例