2022秋招蚂蚁金服数据研发一面

Posted 2022-11-07 柳小葱

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了2022秋招蚂蚁金服数据研发一面相关的知识，希望对你有一定的参考价值。

♥️今天收到了蚂蚁金服的数据研发的面试，真的是太激动了，记得4月份春招找实习的时候，阿里连我简历筛选都过不去。下午面试完，晚上来总结下，对往期内容感兴趣的小伙伴可以查看👇:

面试问题

1. 自我介绍

2. 你本科和研究生都是信管相关专业，学过一些什么课程，和计算机和大数据相关的课程有哪些呢？

从本科的课程和研究生的课程进行了介绍。

3. 介绍一下你在字节的大数据平台是什么样子的，主要有什么功能？

主要介绍了一下dataleap，里面有数据集成、数据开发、任务调度的功能，和阿里的dataworks差不多，后面还举了一些例子。

4. 介绍一下你在字节做的其中的一个项目？

这里主要介绍了一下tiktok电商客服im的数据仓库建设。

5. 字节这边的数据仓库模型是什么样的？比如数据仓库层级、数据治理等方面的

主要介绍了一下ods、dwd、dwm、dm、app层的作用，以及一些主题的划分，数据治理方面，主要说了一下我们部门数据同步的规范，比如表的生命周期，命名方式、监控等等。

6. 看你熟悉spark和flink，你能说说他们俩之间的差别吗？

这里说了一下spark主要是离线计算框架，也有sparkstreaming的流式框架、主要是批处理，说了一下flink是流式框架，主要是是流处理。

7. flink中的时间有几种，分别是什么？

说了3种时间：事件时间（真实的时间）、摄取时间（进入flink的时间）、处理时间（进入具体算子的时间）这块我强调了一下，我是做离线的，很少做实时。

8. 你在使用flink或者spark的时候，有没有碰见过数据倾斜，碰到这种情况你是如何处理的？

碰见最多就是无效key值过多，直接排除，还说了count（distinct），热点值采用加盐+两阶段聚合，两个大表采用笛卡尔积解决数据倾斜。

9. 看你熟悉python语言，你们那边开发使用python多还是java多一些？

这里我介绍了一下平台主要是写sql和python多一些，sql和python处理结构数据本质上没有区别，可以写sql和pyspark，主要是sql不能递归，然后说一下自己遇见的sql递归如何处理之类的。

10. 算法题：3数之和

链接: 3数之和

def threeSum(self, nums: List[int]) -> List[List[int]]:
        nums.sort()
        n=len(nums)
        res=[]
        for i in range(n):
            if i>0 and nums[i]==nums[i-1]:
                continue
            left=i+1
            right=n-1
            while left<right:
                if nums[left]+nums[right]<-nums[i]:
                    left+=1
                elif nums[left]+nums[right]>-nums[i]:
                    right-=1
                else:
                    res.append([nums[left],nums[right],nums[i]])
                    while left<right and nums[left]==nums[left+1]:
                        left+=1
                    left+=1
                    right-=1
        return res

反问阶段

1. 我想请问您一下您这边做的是什么业务？以及您所在的业务线和目前的工作在未来的发展前景如何？

2. 冒昧问您一句，您这边确实有hc吗？

以上是关于2022秋招蚂蚁金服数据研发一面的主要内容，如果未能解决你的问题，请参考以下文章

2022秋招蚂蚁金服数据研发一面

2023秋招——大数据研发工程师提前批一面

Java程序员秋招三面蚂蚁金服，java零基础教学系列视频教程

2022秋招蚂蚁金服数据研发一面

目录

面试问题

1. 自我介绍

2. 你本科和研究生都是信管相关专业，学过一些什么课程，和计算机和大数据相关的课程有哪些呢？

3. 介绍一下你在字节的大数据平台是什么样子的，主要有什么功能？

4. 介绍一下你在字节做的其中的一个项目？

5. 字节这边的数据仓库模型是什么样的？比如数据仓库层级、数据治理等方面的

6. 看你熟悉spark和flink，你能说说他们俩之间的差别吗？

7. flink中的时间有几种，分别是什么？

8. 你在使用flink或者spark的时候，有没有碰见过数据倾斜，碰到这种情况你是如何处理的？

9. 看你熟悉python语言，你们那边开发使用python多还是java多一些？

10. 算法题：3数之和

反问阶段

1. 我想请问您一下您这边做的是什么业务？以及您所在的业务线和目前的工作在未来的发展前景如何？

2. 冒昧问您一句，您这边确实有hc吗？