备战秋招冲击大厂Java面试题系列—数据结构与算法

Posted Java-桃子

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了备战秋招冲击大厂Java面试题系列—数据结构与算法相关的知识,希望对你有一定的参考价值。

1. 数据结构定义

数据结构是计算机存储、组织数据的方式。数据结构是指相互之间存在一种或多种特定关系的数据元素的集合。通常情况下,精心选择的数据结构可以带来更高的运行或者存储效率。数据结构往往同高效的检索算法和索引技术有关。

  • 数组:物理存储单元上连续、顺序的存储结构
  • 链表:链表是一种物理存储单元上非连续、非顺序的存储结构,数据元素的逻辑顺序是通过链表中的指针链接次序实现的。
  • 队列:队列(queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表。
  • 栈:栈(stack)又名堆栈,它是一种运算受限的线性表。限定仅在表尾进行插入和删除操作的线性表。这一端被称为栈顶,相对地,把另一端称为栈底。
  • 堆:堆通常是一个可以被看做一棵完全二叉树的数组对象。将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。建堆时间复杂度O(n),堆总是满足下列性质:堆总是一棵完全二叉树;堆中某个结点的值总是不大于或不小于其父结点的值;
  • 散列表:(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构

2. 堆的创建、插入、删除、堆排序

  • 堆的插入:在已经建成的最小堆的后面插入元素,堆的结构可能被破坏,再向上调整使其满足性质。
  • 堆的删除:删除时每次删除堆顶元素,删除方法:
    1)将堆中最后一个元素代替堆顶元素。
    2)将堆中元素个数减少一个,相当于将堆中最后一个元素删除。
    3)此时堆的结构可能被破坏,在向下调整使其满足性质。
  • 堆排序:
    1)将堆顶元素与第size-1个元素交换。
    2)hp->size–
    3)将其余的元素调整为最小堆
    4)重复1、2、3步hp->size-1次。

更多Java学习资料、面试真题获得,请【点击此处

3. 跳表

  跳表,是基于链表实现的一种类似“二分”的算法。它可以快速的实现增,删,改,查操作。这种链表加多级索引的结构,就叫做跳表。跳表的查询时间复杂度可以达到O(logn)。跳表也可以实现高效的动态更新,定位到要插入或者删除数据的位置需要的时间复杂度为O(logn).
  在插入的时候,我们需要考虑将要插入的数据也插入到索引中去。在这里使用的策略是通过随机函数生成一个随机数K,然后将要插入的数据同时插入到k级以下的每级索引中。

4. 排序算法

  • 不同条件下,排序方法的选择
    • 若n较小(如n≤50),可采用直接插入或直接选择排序。当记录规模较小时,直接插入排序较好;否则因为直接选择移动的记录数少于直接插人,应选直接选择排序为宜。
    • 若文件初始状态基本有序(指正序),则应选用直接插入、冒泡或随机的快速排序为宜;
    • 若n较大,则应采用时间复杂度为O(nlgn)的排序方法:快速排序、堆排序或归并排序。
      a) 快速排序是目前基于比较的内部排序中被认为是最好的方法,当待排序的关键字是随机分布时,快速排序的平均时间最短;
      b) 堆排序所需的辅助空间少于快速排序,并且不会出现快速排序可能出现的最坏情况。这两种排序都是不稳定的。
      c) 若要求排序稳定,则可选用归并排序。
    • TopK或优先队列通常用堆排序来实现

5. Bitmap位图算法

位图是指内存中连续的二进制位,用于对大量的整型数据做去重和查询。Bit-map就是用一个bit位来标记某个元素对应的Value,而Key即是该元素。由于采用了Bit为单位来存储数据,因此在存储空间方面,可以大大节省。

  • bitmap应用
    1)可进行数据的快速查找,判重,删除,一般来说数据范围是int的10倍以下。
    2)去重数据而达到压缩数据
    位图只是可以映射数字类型的数据,变成字符串以及其他文件好像就不再那么得心应手了,这时就要使用布隆过滤器

6. 布隆过滤器

bloom算法类似一个位图,用来判断某个元素(key)是否在某个集合中。和一般的位图不同的是,这个算法无需存储key的值,对于每个key,只需要k个比特位,每个存储一个标志,用来判断key是否在集合中。

  • 应用场景:比如网络爬虫抓取时url去重,邮件提供商反垃圾黑名单Email地址去重,之所以需要k个比特位是因为我们大多数情况下处理的是字符串,那么不同的字符串就有可能映射到同一个位置,产生冲突。
  • 优点:不需要存储key,节省空间
  • 缺点:算法判断key在集合中时,有一定的概率key其实不在集合中,已经映射的数据无法删除

7. (Tire)字典树

  • 定义:又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
  • 3个基本性质:
    • 根节点不包含字符,除根节点外每一个节点都只包含一个字符;
    • 从根节点到某一节点路径上经过的字符连接起来,为该节点对应的字符串;
    • 每个节点的所有子节点包含的字符都不相同。

8. 海量数据找出前K大的数

top K类问题,通常比较好的方案是分治+Trie树/hash+小顶堆(就是上面提到的最小堆),即先将数据集按照Hash方法分解成多个小数据集,然后使用Trie树活着Hash统计每个小数据集中的query词频,之后用小顶堆求出每个数据集中出现频率最高的前K个数,最后在所有top K中求出最终的top K。

9. 五大查找方式

10. BFS、DFS优缺点

  • 深搜优缺点
    • 优点
      • 能找出所有解决方案
      • 优先搜索一棵子树,然后是另一棵,所以和广搜对比,有着内存需要相对较少的优点
    • 缺点
      • 要多次遍历,搜索所有可能路径,标识做了之后还要取消。
      • 在深度很大的情况下效率不高
  • 广搜优缺点
    • 优点
      • 对于解决最短或最少问题特别有效,而且寻找深度小
      • 每个结点只访问一遍,结点总是以最短路径被访问,所以第二次路径确定不会比第一次短
    • 缺点
      • 内存耗费量大(需要开大量的数组单元用来存储状态)

更多Java学习资料、面试真题获得,请【点击此处

11. 动态规划

  • 核心思想:将大问题分为小问题进行解决,从而一步步获得最优解的处理算法,与分治算法不同的是适合于动态规划求解的问题,经分解得到的子问题往往不是相互独立的。
  • 求解方式:填表
  • 思想:w[i]为第i个商品的重量,v[i]代表第i个商品的价值,v[i][j]表示在前i个物品中能够装入容量为j的背包中的最大价值
a)  v[i][0]=v[0][j]=0;//使得i和j刚好和第几个商品对应
b)  当w[i]>j时:v[i][j]=v[i-1][j];//当准备加入新增的商品的容量w[i]大于当前背包的容量j时就直接使用上一单元格的装入策略
c)  当w[i]<=j时:v[i][j]=max{v[i-1][j], v[i]+v[i-1][j-w[i]]};
//上一个单元格的装入的最大值v[i-1][j]
//v[i]当前商品的价值
//v[i-1][j-w[i]]装入i-1个商品剩余空间j-w[i]的最大值
1.  //根据前面得到公式来动态规划处理
2.  for(int i = 1; i < v.length; i++) {//不处理第一行i是从1开始的
3.      for(int j=1; j < v[0].length; j++){//不处理第一列,j是从1开始的
4.        //公式
5.        if(w[i-1]> j){//因为我们程序i是从1开始的,因此原来公式中的w[i]修改成w[i-1]
6.          v[][j]=v[i-1][j];
7.        }else{
8.          //说明:
9.          //因为我们的i从1开始的,因此公式需要调整成
10.         //v[i][j]=Math.max(v[i-1][j],val[i-1]+v[i-1][j-w[i-1]]);
11.         v[][j]=Math.max(v[i-1][j], val[i]+v[i-1][j-w[i-1]]);
12.       }
13.     }
14. }

12. 什么样的题适合用动态规划?

  • 最值型动态规划,比如求最大,最小值是多少
  • 计数型动态规划,比如换硬币,有多少种换法
  • 坐标型动态规划,比如在m*n矩阵求最值型,计数型,一般是二维矩阵
  • 区间型动态规划,比如在区间中求最值

13. 暴力匹配算法

1.  public static int ViolenceMatch(String str1, String str2) {
2.          char[] s1 = str1.toCharArray();
3.          char[] s2 = str2.toCharArray();
4.   
5.          int i = 0;
6.          int j = 0;
7.   
8.          while (i < s1.length && j < s2.length) {
9.              if (s1[i] == s2[j]) {
10.                 i++;
11.                 j++;
12.             } else {
13.                 i = i - (j - 1);
14.                 j = 0;
15.             }
16.         }
17.  
18.         if (j == s2.length) {
19.             return i - j;
20.         }
21.  
22.         return -1;
23.  }

14. KMP算法

建立部分匹配表

移动位数 = 已匹配的字符数 – 对应的部分匹配值

1.  public static int[] KmpMatchTable(String str) {
2.          int[] matchTable = new int[str.length()];
3.          matchTable[0] = 0;
4.          for (int i = 1, j = 0; i < str.length(); i++) {
5.              //不等时重新获取前一个的值,kmp算法核心
6.              while (j > 0 && str.charAt(i) != str.charAt(j)) {
7.                  j = matchTable[j - 1];
8.              }
9.              //部分匹配则值+1
10.             if (str.charAt(i) == str.charAt(j)) {
11.                 j++;
12.             }
13.             matchTable[i] = j;
14.         }
15.         return matchTable;
16. }

KMP搜索

1.  public static int KMPMatch(String str1, String str2) {
2.          int[] matchTable=KmpMatchTable(str2);
3.   
4.          for (int i = 0,j=0; i < str1.length(); i++) {
5.              //处理不等情况
6.              while(j>0&&str1.charAt(i)!=str2.charAt(j)){
7.                  j = matchTable[j-1];
8.              }
9.   
10.             if (str1.charAt(i)==str2.charAt(j)){
11.                 j++;
12.             }
13.             if (j==str2.length()){
14.                 return i-j+1;
15.             }
16.         }
17.  
18.         return -1;
19. }

15. 贪心算法

16. 普利姆算法(prim)

  • 求最小生成树
  • 普里姆算法介绍
    • 普利姆(Prim)算法求最小生成树,也就是在包含n个顶点的连通图中,找出只有(n-1)条边包含所有n个顶点的连通子图,也就是所谓的极小连通子图
    • 普利姆的算法如下:
      (1) 设G=(V,E)是连通网,T=(U,D)是最小生成树,V,U是顶点集合,E,D是边的集合
      (2) 若从顶点u开始构造最小生成树,则从集合V中取出顶点u放入集合U中,标记顶点v的visited[u]=1
      (3) 若集合U中顶点ui与集合V-U中的顶点vj之间存在边,则寻找这些边中权值最小的边,但不能构成回路,将顶点vj加入集合U中,将边(ui,vj)加入集合D中,标记visited[vj]=1
      (4) 重复步骤②,直到U与V相等,即所有顶点都被标记为访问过,此时D中有n-1条边
      (5) 提示:单独看步骤很难理解,我们通过代码来讲解,比较好理解.

17. 二叉树的中序遍历

1.  List<Integer> list = new ArrayList<>();
2.      public TreeNode increasingBST(TreeNode root) {
3.          if(null==root)return null;
4.          Deque<TreeNode> queue = new ArrayDeque<>();
5.          while(root!=null||!queue.isEmpty()){
6.              while(root!=null){
7.                  queue.add(root);
8.                  root = root.left;
9.              }
10.             root = queue.pollLast();
11.             list.add(root.val);
12.             root=root.right;
13.         }
14.         return list;
15. }

18. 二叉树层序遍历

1.  public List<List<Integer>> levelOrder(TreeNode root) {
2.      List<List<Integer>> res = new ArrayList<>();
3.      Queue<TreeNode> queue = new ArrayDeque<>();
4.      if (root != null) {
5.          queue.add(root);
6.      }
7.      while (!queue.isEmpty()) {
8.          int n = queue.size();//记录节点个数
9.          List<Integer> level = new ArrayList<>();
10.         //遍历每个节点的左右子节点
11.         for (int i = 0; i < n; i++) { 
12.             TreeNode node = queue.poll();
13.             level.add(node.val);
14.             if (node.left != null) {
15.                 queue.add(node.left);
16.             }
17.             if (node.right != null) {
18.                 queue.add(node.right);
19.             }
20.         }
21.         res.add(level);
22.     }
23.  
24.     return res;
25. }

19. 二叉树之字形打印

1.  public List<List<Integer>> zigzagLevelOrder(TreeNode root) {
2.          List<List<Integer>> res = new ArrayList<>();
3.          if (root == null)
4.              return res;
5.          //创建队列,保存节点
6.          Queue<TreeNode> queue = new LinkedList<>();
7.          queue.add(root);//先把节点加入到队列中
8.          boolean leftToRight = true;//第一步先从左边开始打印
9.          while (!queue.isEmpty()) {
10.             //统计这一层有多少个节点
11.             int count = queue.size();
12.             //记录每层节点的值
13.             List<Integer> level = new ArrayList<>();
14.             //遍历这一层的所有节点,把他们全部从队列中移出来,顺便
15.             //把他们的值加入到集合level中,接着再把他们的子节点(如果有)
16.             //加入到队列中
17.             for (int i = 0; i < count; i++) {
18.                 //poll移除队列头部元素(队列在头部移除,尾部添加)
19.                 TreeNode node = queue.poll();
20.                 //判断是从左往右打印还是从右往左打印。
21.                 if (leftToRight) {
22.                     //如果从左边打印,直接把访问的节点值加入到列表level的末尾
23.                     level.add(node.val);
24.                 } else {
25.                     //如果是从右边开始打印,每次要把访问的节点值加入到列表的最前面
26.                     level.add(0, node.val);
27.                 }
28.                 //左右子节点如果不为空会被加入到队列中
29.                 if (node.left != null)
30.                     queue.add(node.left);
31.                 if (node.right != null)
32.                     queue.add(node.right);
33.             }
34.             //把这一层的节点值加入到集合res中
35.             res.add(level);
36.             //改变下次访问的方向
37.             leftToRight = !leftToRight;
38.         }
39.         return res;
40.     }

20. 判断A是否是B的子树

1.  public class Solution {
2.     //分为两个函数,一个用于遍历节点当做子树的根节点,
3.      public boolean hasSubtree(TreeNode root1,TreeNode root2) {
4.          if(root1==null||root2==null) return false;
5.          //直接判断isSubTree(root1,root2),并且采取||的方式确定结果。
6.          return isSubTree(root1,root2)||hasSubtree(root1.left,root2)
7.                  ||hasSubtree(root1.right,root2);
8.      }
9.      //另一个用于判断是否是子树(必须要root2先空)
10.     public boolean isSubTree(TreeNode root1,TreeNode root2){
11.         if(root2==null) return true;
12.         if(root1==null) return false;
13.         if(root1.val==root2.val){
14.             return isSubTree(root1.left,root2.left)&&
15.             isSubTree(root1.right,root2.right);
16.         }else{
17.             return false;
18.         }
19.     }
20. }

21. 最小硬币数

  • 动态规划算法题:给定不同面额的硬币数组coins和总额amounts,求能够组成总额的最小硬币数。如coins=[1,2,5],amounts=11,那么最少硬币数为5+5+1=3.
1.  public static int CoinsChange(int[] coins, int amount, int coinSize) {
2.          if (null == coins || amount == 0) return -1;
3.   
4.          int[] temp = new int[amount + 1];
5.          for (int i = 0; i <= amount; i++) {
6.              temp[i] = amount + 1;
7.          }
8.          temp[0] = 0;
9.          for (int i = 1; i <= amount; i++) {
10.             for (int j = 0; j < coinSize; j++) {
11.                 if (i >= coins[j]) {
12.                     temp[i] = Math.min(temp[i], 1 + temp[i - coins[j]]);
13.                 }
14.             }
15.         }
16.         return temp[amount] > amount ? -1 : temp[amount];
17.     }

更多Java学习资料、面试真题获得,请【点击此处

以上是关于备战秋招冲击大厂Java面试题系列—数据结构与算法的主要内容,如果未能解决你的问题,请参考以下文章

备战秋招冲击大厂Java面试题系列—数据库

备战秋招冲击大厂Java面试题系列—JVM及垃圾回收机制

备战秋招冲击大厂Java面试题系列—Java集合

备战秋招冲击大厂Java面试题系列—Java基础

备战秋招冲击大厂Java面试题系列—并发编程

2021 备战秋招新鲜出炉的美团字节阿里腾讯等大厂综合 Java 岗面试题