2022秋招蚂蚁金服数据研发一面
Posted 柳小葱
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2022秋招蚂蚁金服数据研发一面相关的知识,希望对你有一定的参考价值。
♥️今天收到了蚂蚁金服的数据研发的面试,真的是太激动了,记得4月份春招找实习的时候,阿里连我简历筛选都过不去。下午面试完,晚上来总结下,对往期内容感兴趣的小伙伴可以查看👇:
- 链接: 2022年秋招快手数据开发一、二面
- 链接: 2022暑期实习字节跳动数据研发面试经历-基础数仓.
- 链接: 2022百度大数据开发工程师实习面试经历.
- 链接: 2022暑期实习字节跳动数据研发面试经历-data部门
- 链接: 2021年暑假滴滴数据开发面试
目录
面试问题
1. 自我介绍
2. 你本科和研究生都是信管相关专业,学过一些什么课程,和计算机和大数据相关的课程有哪些呢?
从本科的课程和研究生的课程进行了介绍。
3. 介绍一下你在字节的大数据平台是什么样子的,主要有什么功能?
主要介绍了一下dataleap,里面有数据集成、数据开发、任务调度的功能,和阿里的dataworks差不多,后面还举了一些例子。
4. 介绍一下你在字节做的其中的一个项目?
这里主要介绍了一下tiktok电商客服im的数据仓库建设。
5. 字节这边的数据仓库模型是什么样的?比如数据仓库层级、数据治理等方面的
主要介绍了一下ods、dwd、dwm、dm、app层的作用,以及一些主题的划分,数据治理方面,主要说了一下我们部门数据同步的规范,比如表的生命周期,命名方式、监控等等。
6. 看你熟悉spark和flink,你能说说他们俩之间的差别吗?
这里说了一下spark主要是离线计算框架,也有sparkstreaming的流式框架、主要是批处理,说了一下flink是流式框架,主要是是流处理。
7. flink中的时间有几种,分别是什么?
说了3种时间:事件时间(真实的时间)、摄取时间(进入flink的时间)、处理时间(进入具体算子的时间)这块我强调了一下,我是做离线的,很少做实时。
8. 你在使用flink或者spark的时候,有没有碰见过数据倾斜,碰到这种情况你是如何处理的?
碰见最多就是无效key值过多,直接排除,还说了count(distinct),热点值采用加盐+两阶段聚合,两个大表采用笛卡尔积解决数据倾斜。
9. 看你熟悉python语言,你们那边开发使用python多还是java多一些?
这里我介绍了一下平台主要是写sql和python多一些,sql和python处理结构数据本质上没有区别,可以写sql和pyspark,主要是sql不能递归,然后说一下自己遇见的sql递归如何处理之类的。
10. 算法题:3数之和
链接: 3数之和
def threeSum(self, nums: List[int]) -> List[List[int]]:
nums.sort()
n=len(nums)
res=[]
for i in range(n):
if i>0 and nums[i]==nums[i-1]:
continue
left=i+1
right=n-1
while left<right:
if nums[left]+nums[right]<-nums[i]:
left+=1
elif nums[left]+nums[right]>-nums[i]:
right-=1
else:
res.append([nums[left],nums[right],nums[i]])
while left<right and nums[left]==nums[left+1]:
left+=1
left+=1
right-=1
return res
反问阶段
1. 我想请问您一下您这边做的是什么业务?以及您所在的业务线和目前的工作在未来的发展前景如何?
2. 冒昧问您一句,您这边确实有hc吗?
以上是关于2022秋招蚂蚁金服数据研发一面的主要内容,如果未能解决你的问题,请参考以下文章