2021百度大数据挖掘之二面面经
Posted 柳小葱
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2021百度大数据挖掘之二面面经相关的知识,希望对你有一定的参考价值。
图片为证
上次过了一面之后,6月2就通知二面了,二面面试管在一个小屋子里,边喝茶边和我聊,主要问了以下问题:
- 自我介绍
- mapreduce的过程是什么?
- MapReduce是hadoop的核心,shuffle是什么?
- 你能说说map端的shuffle和reduce端的shuffle吗?
- 当我说到map端的shuffle中先根据key值分区然后排序后,他问我这里面的排序是什么方式?我回答快排
- 请你写一下快速排序!
- 快排是稳定的吗?
- 我们这里有100G的文件,里面都是URL地址,但主机只有1G的内存,请你找出出现次数最多的URL
- 再来写一个算法题吧,两个有序数组合并。
- 结束
楼主用递归写的快排,出了点bug,100G文件那个不会,最后那一道算法题用指针也没写出来,就差一点点。
以上是关于2021百度大数据挖掘之二面面经的主要内容,如果未能解决你的问题,请参考以下文章