第二十二篇 玩转数据结构——构建动态数组
Posted xuezou
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第二十二篇 玩转数据结构——构建动态数组相关的知识,希望对你有一定的参考价值。
1.. 数组基础
-
数组就是把数据码成一排进行存放。
-
Java中,数组的每个元素类型必须相同,可以都为int类型,string类型,甚至是自定义类型。
-
数组的命名要语义化,例如,如果数组用来存放学生的成绩,那么命名为scores就比较合适。
-
索引(index)是数组中的一个重要概念,它是我们给数组中的每个元素分配的编号,从0开始,依次递增。如果数组中存放了n个元素,第一个元素的索引是0,最后一个元素的索引是n-1。
-
通过索引,我们可以对数组中的元素进行快速访问,例如,我们访问索引为2的元素也就是数组中的第3个元素,就可以通过scores[2]这种形式。
-
在Java中声明一个简单的数组
-
public class Main { public static void main(String[] args) { int[] arr = new int[10]; for (int i = 0; i < arr.length; i++) arr[i] = i; } }
- 声明一个有初始值的数组
-
public class Main { public static void main(String[] args) { int[] scores = new int[]{100, 99, 86}; for (int i = 0; i < scores.length; i++) System.out.println(scores[i]); } }
- for循环的另一种使用形式
-
public class Main { public static void main(String[] args) { int[] scores = new int[]{100, 99, 86}; for (int score : scores) System.out.println(score); } }
- 修改数组中的元素
-
socres[1] = 98;
-
数组的索引可以是语义化的,也可以是非语义化的。
-
数组的最大优点,就是可以通过索引对数据进行快速查询,因此,我们倾向于使用语义化的索引,这样我们就很清楚自己在查什么。
-
如果我们的应用场景中,索引没有语义,那么使用其它数据结构可能是更好的选择。
-
对于一些特殊应用场景,虽然使用了语义化索引,但依然不适合使用数组,例如,身份证号,我们不能使用身份证号来作为数组的索引,因为这个数字太大了,会导致巨大的空间浪费。
-
如果数组的索引是非语义化的,我们就需要考虑很多问题,例如,当数组的空间未被填满时,如何表示空位处的元素?如何向数组中添加新的元素?如何删除掉数组中原有的元素?等等。Java所提供的原生数组是无法解决这些问题的,我们需要定制属于自己的数组类Array,即,基于Java的原生数组,二次封装属于我们自己的数组类。
2.. 实现自定义数组类Array所包含的基本方法:
-
public class Array { private int[] data; //设置为private,不希望用户从外部直接获取这些信息,防止用户篡改数据 private int size; //构造函数,传入数组的容量capacity构造Array public Array(int capacity) { data = new int[capacity]; size = 0; } //无参数构造函数,默认数组容量capacity=10 public Array() { this(10); //这里的capacity是IDE自动添加的提示信息,实际不存在 } //获取数组中的元素个数 public int getSize() { return size; } //获取数组的容量 public int getCapacity() { return data.length; } //判断数组是否为空 public boolean isEmpty() { return size == 0; } }
3.. 实现向自定义数组中添加元素的方法
- 向数组中添加元素的最简单的方法就是向数组的末尾添加元素
-
//向数组末尾添加一个新元素 public void addLast(int e) { if (size == data.length) { throw new IllegalArgumentException("AddLast failed. Array is full."); } data[size] = e; size++; }
- 向数组中指定索引位置插入一个元素
-
//在index位置插入一个新元素e public void add(int index, int e) { if (size == data.length) { throw new IllegalArgumentException("Add failed. Array is full."); } if (index < 0 || index > size) { throw new IllegalArgumentException("Add failed. Require index >= 0 and index <= size"); } for (int i = size - 1; i >= index; i--) { data[i + 1] = data[i]; } data[index] = e; size++; }
- 定义完向数组中指定索引位置插入一个元素的方法add之后,我们之前定义的向数组末尾插入元素的方法addLast其实可以调用add方法来实现,我们调整addLast方法如下:
-
//向数组末尾添加一个新元素 public void addLast(int e) { add(size, e); }
- 我们还可以调用add方法实现一个向数组开头添加一个新元素的方法
-
//向数组开头添加一个新元素 public void addFirst(int e) { add(0, e); }
4.. 实现在数组中查询元素和修改元素的方法
- 实现自定义打印数组格式
-
@Override public String toString() { //覆盖父类的toString方法 StringBuilder res = new StringBuilder(); res.append(String.format("Array: size=%d, capacity=%d ", size, data.length)); res.append(‘[‘); for (int i = 0; i < size; i++) { res.append(data[i]); if (i != size - 1) { res.append(", "); } } res.append(‘]‘); return res.toString(); }
- 在main函数中进行测试:
-
public class Main { public static void main(String[] args) { Array arr = new Array(20); for (int i = 0; i < 10; i++) { arr.addLast(i); //测试addLast方法 } System.out.println(arr); arr.add(1, 100); //测试add方法 System.out.println(arr); arr.addFirst(-1); //测试addFirst方法 System.out.println(arr); } }
- 打印效果如下:
-
Array: size=10, capacity=20 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=11, capacity=20 [0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=12, capacity=20 [-1, 0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9]
- 实现获取指定索引元素的方法
-
//获取index位置的元素 public int get(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Get failed. Index is illegal."); } return data[index]; }
- 实现修改指定索引元素的方法
-
//修改index位置的元素为e public void set(int index, int e) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Set failed. Index is illegal."); } data[index] = e; }
- 实现查看数组中是否包含元素e的方法
-
//查找数组中是否存在元素e public boolean contains(int e) { for (int i = 0; i < size; i++) { if (data[i] == e) { return true; } } return false; }
- 实现查看数组中指定元素的索引的方法,若找不到,返回-1
-
//查看数组中元素e的索引,若找不到元素e,返回-1 public int find(int e){ for(int i=0;i<size;i++){ if(data[i] == e){ return i; } } return -1; }
- 实现删除数组中指定索引的元素的方法
-
//删除掉index位置的元素,并且返回所删除的元素 public int remove(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Add failed. Require index >= 0 and index < size"); } int ret = data[index]; for (int i = index + 1; i < size; i++) { data[i - 1] = data[i]; } size--; return ret; } //删除掉数组开头的元素,并返回所删除的元素 public int removeFirst() { return remove(0); } //删除掉数组末尾的元素,并返回所删除的元素 public int removeLast() { return remove(size - 1); } //如果数组中有元素e,那么将其删除,否则什么也不做 public void removeElement(int e) { int index = find(e); if (index != -1) { remove(index); } }
5.. 整理我们目前实现的业务逻辑:
-
public class Array { private int[] data; //设置为private,不希望用户从外部直接获取这些信息,防止用户篡改数据 private int size; //构造函数,传入数组的容量capacity构造Array public Array(int capacity) { data = new int[capacity]; size = 0; } //无参数构造函数,默认数组容量capacity=10 public Array() { this(10); //这里的capacity是IDE自动添加的提示信息,实际不存在 } //获取数组中的元素个数 public int getSize() { return size; } //获取数组的容量 public int getCapacity() { return data.length; } //判断数组是否为空 public boolean isEmpty() { return size == 0; } //向数组末尾添加一个新元素e public void addLast(int e) { add(size, e); } //向数组开头添加一个新元素e public void addFirst(int e) { add(0, e); } //在index位置插入一个新元素e public void add(int index, int e) { if (size == data.length) { throw new IllegalArgumentException("Add failed. Array is full."); } if (index < 0 || index > size) { throw new IllegalArgumentException("Add failed. Require index >= 0 and index <= size"); } for (int i = size - 1; i >= index; i--) { data[i + 1] = data[i]; } data[index] = e; size++; } //获取index位置的元素 public int get(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Get failed. Index is illegal."); } return data[index]; } //修改index位置的元素为e public void set(int index, int e) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Set failed. Index is illegal."); } data[index] = e; } //查找数组中是否存在元素e public boolean contains(int e) { for (int i = 0; i < size; i++) { if (data[i] == e) { return true; } } return false; } //查看数组中元素e的索引,若找不到元素e,返回-1 public int find(int e) { for (int i = 0; i < size; i++) { if (data[i] == e) { return i; } } return -1; } //删除掉index位置的元素,并且返回删除的元素 public int remove(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Remove failed. Index is illegal."); } int ret = data[index]; for (int i = index + 1; i < size; i++) { data[i - 1] = data[i]; } size--; return ret; } //删除掉数组开头的元素,并返回删除的元素 public int removeFirst() { return remove(0); } //删除掉数组末尾的元素,并返回删除的元素 public int removeLast() { return remove(size - 1); } //如果数组中有元素e,那么将其删除,否则什么也不做 public void removeElement(int e) { int index = find(e); if (index != -1) { remove(index); } } @Override public String toString() { //覆盖父类的toString方法 StringBuilder res = new StringBuilder(); res.append(String.format("Array: size=%d, capacity=%d ", size, data.length)); res.append(‘[‘); for (int i = 0; i < size; i++) { res.append(data[i]); if (i != size - 1) { res.append(", "); } } res.append(‘]‘); return res.toString(); } }
6.. 现在我们的自定义数组的元素只允许为int类型,我们需要进行优化,让数组可以放置"任意"类型的元素,解决这个问题的技术称之为"泛型"。这里的"任意"加了引号,这是因为在Java中一个泛型类并不能放置任意数据类型的元素,泛型不能放置基本数据类型,只能放置类对象。在Java中,共有8中基本数据类型:int、short、long、boolean、byte、char、float、double。如果将数组设置成泛型数组,那么就无法放置这些基本数据类型了。为了解决这个问题,Java语言为每个基本数据类型都设计了一个包装类,把本来不是类对象的数据包装成了类对象。这8中基本数据类型所对应的包装类分别为:Int、Short、Long、Boolean、Byte、Char、Float、Double,在需要的情况下,包装类与其对应的基本数据类型可以自动进行转换。
7.. 优化后,Array类的业务逻辑如下:
-
public class Array<E> { private E[] data; //设置为private,不希望用户从外部直接获取这些信息,防止用户篡改数据 private int size; //构造函数,传入数组的容量capacity构造Array public Array(int capacity) { data = (E[]) new Object[capacity]; size = 0; } //无参数构造函数,默认数组容量capacity=10 public Array() { this(10); //这里的capacity是IDE自动添加的提示信息,实际不存在 } //获取数组中的元素个数 public int getSize() { return size; } //获取数组的容量 public int getCapacity() { return data.length; } //判断数组是否为空 public boolean isEmpty() { return size == 0; } //向数组末尾添加一个新元素e public void addLast(E e) { add(size, e); } //向数组开头添加一个新元素e public void addFirst(E e) { add(0, e); } //在index位置插入一个新元素e public void add(int index, E e) { if (size == data.length) { throw new IllegalArgumentException("Add failed. Array is full."); } if (index < 0 || index > size) { throw new IllegalArgumentException("Add failed. Require index >= 0 and index <= size"); } for (int i = size - 1; i >= index; i--) { data[i + 1] = data[i]; } data[index] = e; size++; } //获取index位置的元素 public E get(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Get failed. Index is illegal."); } return data[index]; } //修改index位置的元素为e public void set(int index, E e) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Set failed. Index is illegal."); } data[index] = e; } //查找数组中是否存在元素e public boolean contains(E e) { for (int i = 0; i < size; i++) { if (data[i].equals(e)) { return true; } } return false; } //查看数组中元素e的索引,若找不到元素e,返回-1 public int find(E e) { for (int i = 0; i < size; i++) { if (data[i].equals(e)) { return i; } } return -1; } //删除掉index位置的元素,并且返回删除的元素 public E remove(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Remove failed. Index is illegal."); } E ret = data[index]; for (int i = index + 1; i < size; i++) { data[i - 1] = data[i]; } size--; //data[size]会指向一个类对象,这部分空间不会被释放loitering objects data[size] = null; return ret; } //删除掉数组开头的元素,并返回删除的元素 public E removeFirst() { return remove(0); } //删除掉数组末尾的元素,并返回删除的元素 public E removeLast() { return remove(size - 1); } //如果数组中有元素e,那么将其删除,否则什么也不做 public void removeElement(E e) { int index = find(e); if (index != -1) { remove(index); } } @Override public String toString() { //覆盖父类的toString方法 StringBuilder res = new StringBuilder(); res.append(String.format("Array: size=%d, capacity=%d ", size, data.length)); res.append(‘[‘); for (int i = 0; i < size; i++) { res.append(data[i]); if (i != size - 1) { res.append(", "); } } res.append(‘]‘); return res.toString(); } }
8.. 再次在main方法中实例化我们的自定义数组,进行测试:
-
public class Main { public static void main(String[] args) { Array<Integer> arr = new Array<>(20); for (int i = 0; i < 10; i++) { arr.addLast(i); } System.out.println(arr); arr.add(1, 100); System.out.println(arr); arr.addFirst(-1); System.out.println(arr); arr.remove(2); System.out.println(arr); arr.removeElement(4); System.out.println(arr); arr.removeFirst(); System.out.println(arr); arr.removeLast(); System.out.println(arr); } }
- 输出结果如下:
-
Array: size=10, capacity=20 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=11, capacity=20 [0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=12, capacity=20 [-1, 0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=11, capacity=20 [-1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=10, capacity=20 [-1, 0, 1, 2, 3, 5, 6, 7, 8, 9] Array: size=9, capacity=20 [0, 1, 2, 3, 5, 6, 7, 8, 9] Array: size=8, capacity=20 [0, 1, 2, 3, 5, 6, 7, 8]
9.. 测试让自定义数组去承载对象
-
public class Student { private String name; private int score; public Student(String studetName, int studentScore) { name = studetName; score = studentScore; } @Override public String toString() { return String.format("Student(name: %s, score: %d)", name, score); } public static void main(String[] args) { Array<Student> arr = new Array<>(); arr.addLast(new Student("XueZou", 98)); arr.addLast(new Student("Guiche", 100)); arr.addLast(new Student("QUiShui", 99)); System.out.println(arr); } }
- 输出结果如下:
-
Array: size=3, capacity=10 [Student(name: XueZou, score: 98), Student(name: Guiche, score: 100), Student(name: QUiShui, score: 99)]
10.. 动态数组,即数组的容量可伸缩
-
修改add方法的业务逻辑,使自定义数组支持扩容
-
//在index位置插入一个新元素e public void add(int index, E e) { if (index < 0 || index > size) { throw new IllegalArgumentException("Add failed. Require index >= 0 and index <= size"); } if (size == data.length) { resize(2 * size); //扩大为原容量的2倍 } for (int i = size - 1; i >= index; i--) { data[i + 1] = data[i]; } data[index] = e; size++; }
- 我们需要实现resize方法,业务逻辑如下:
-
private void resize(int newCapacity) { E[] newData = (E[]) new Object[newCapacity]; for (int i = 0; i < size; i++) { newData[i] = data[i]; } data = newData; }
- 实现扩容后,进行测试:
-
public static void main(String[] args) { Array<Integer> arr = new Array<>(); for (int i = 0; i < 10; i++) { arr.addLast(i); } System.out.println(arr); arr.add(1, 100); System.out.println(arr); arr.addFirst(-1); System.out.println(arr); }
- 输出效果如下:
-
Array: size=10, capacity=10 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=11, capacity=20 [0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=12, capacity=20 [-1, 0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9]
- 修改remove方法,使数组中的元素减少到一定程度时,自动缩小数组容量
-
//删除掉index位置的元素,并且返回删除的元素 public E remove(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Remove failed. Index is illegal."); } E ret = data[index]; for (int i = index + 1; i < size; i++) { data[i - 1] = data[i]; } size--; //data[size]会指向一个类对象,这部分空间不会被释放loitering objects data[size] = null; if (size == data.length / 2) { resize(data.length / 2); //被利用的空间等于总空间的一半时,将数组容量减少一半 } return ret; }
- 实现自动降低容量后,进行测试:
-
public static void main(String[] args) { Array<Integer> arr = new Array<>(); for (int i = 0; i < 10; i++) { arr.addLast(i); } System.out.println(arr); arr.add(1, 100); System.out.println(arr); arr.addFirst(-1); System.out.println(arr); arr.remove(2); System.out.println(arr); arr.removeElement(4); System.out.println(arr); arr.removeFirst(); System.out.println(arr); }
- 输出效果如下:
-
Array: size=10, capacity=10 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=11, capacity=20 [0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=12, capacity=20 [-1, 0, 100, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=11, capacity=20 [-1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9] Array: size=10, capacity=10 [-1, 0, 1, 2, 3, 5, 6, 7, 8, 9] Array: size=9, capacity=10 [0, 1, 2, 3, 5, 6, 7, 8, 9]
11.. 简单的时间复杂度分析
-
O(1), O(n), O(lgn), O(nlgn), O(n^2)
-
大O描述的是算法的运行时间和输入数据之间的关系
-
通常我们会说下面的这段代码的算法是O(n)的,n在这里简单理解为nums中的元素个数,O(n)是说下面这段代码的运行效率,与nums中的元素个数n是呈线性关系的,线性关系体现在n是一次方。
-
public static int sum(int[] nums) { int sum = 0; for (int num: nums) { sum += num; return sum; }
-
按照这个思路我们对上面所实现的方法,挨个分析一下它们的算法的时间复杂度:添加操作中addLast(e)方法的时间复杂度是O(1),这表示我们的算法所消耗的时间与我们数据的规模没有关系,这里所指的数据规模是我们数组中的元素个数;addFirst(e)方法的时间复杂度是O(n),因为每个元素都需要向后移动一位;add(index, e)方法的时间复杂度与index的具体取值相关,它的时间复杂度也是O(n);综合来看,添加操作是一个O(n)级别的算法。
-
删除操作中,removeLast(e)方法的时间复杂度是O(1);removeFirst(e)的时间复杂度是O(n);remove(index, e)的时间复杂度也是O(n);综合来看,删除操作的时间复杂度也是O(n)。
-
修改操作set(index, e)的时间复杂度是O(1),这是数组的最大优势,专业术语称为"支持随机访问"。
-
查询操作中,get(index)方法的时间复杂度是O(1);find(e)方法和contains(e)方法的时间复杂度都是O(n)。
12.. 总的来看,对于动态数组来说,增删改查四种操作:
-
增:时间复杂度O(n);
-
删:时间复杂度O(n);
-
改:已知索引O(1),未知索引O(n);
-
查:已知索引O(1),未知索引O(n);
-
因此,索引具有语义时,选择数组是非常好的,我们可以通过索引轻松检索数据中的内容。
13.. resize的时间复杂度分析
-
对于添加操作,如果我们只使用addLast方法,那么它的时间复杂度本来应该是O(1),但是,由于存在resize方法,而resize方法的时间复杂度是O(n),所以addLast方法的时间复杂度就不是O(1)了,但是它的均摊复杂度是O(1);
-
类似的对于删除操作,如果只使用removeLast方法,那么它的均摊复杂度也是O(1);
14.. 复杂度震荡
-
复杂度震荡,是指我们在数组容量的临界位置交替进行添加和删除操作,这会导致数组不断执行扩容和缩容操作,而扩容和缩容的时间复杂度都是O(n),出现这种问题的原因在于,我们执行removeLast方法后,resize得有点着急(Eager),解决方案是使用更加懒惰的策略(Lazy),简单理解就是,当数组占用量刚好减到1/2时,不着急缩容,等减到1/4时,再触发缩容,只缩1/2。
-
我们需要稍微改动一下remove方法,如下所示:
-
public E remove(int index) { if (index < 0 || index >= size) { throw new IllegalArgumentException("Remove failed. Index is illegal."); } E ret = data[index]; for (int i = index + 1; i < size; i++) { data[i - 1] = data[i]; } size--; //data[size]会指向一个类对象,这部分空间不会被释放loitering objects data[size] = null; if (size == data.length / 4 && data.length / 2 != 0) { //改动在这里 resize(data.length / 2); //被利用的空间等于总空间的一半时,将数组容量减少一半 } return ret; }
以上是关于第二十二篇 玩转数据结构——构建动态数组的主要内容,如果未能解决你的问题,请参考以下文章