字节跳动2022年最新面试经验分享,2个部门6轮面试全复盘(算法岗)
Posted 超级实习生
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了字节跳动2022年最新面试经验分享,2个部门6轮面试全复盘(算法岗)相关的知识,希望对你有一定的参考价值。
说起1、2月,绝对算得上求职者的黄金准备期。传说中的金三银四和校园春招都马上要到来了,相信有准备的朋友们已经开始刷题了,今天就为大家分享一篇字节跳动的真实面经:
字节电商&垂直策略部nlp算法工程师面经分享
第一次面的字节电商下的智能客服组,主要做对话生成,部门的技术涉及到知识图谱以及多轮对话生成。一二面面试官都问得比较深,懂的东西也很多,对单纯的背八股回答不感兴趣,喜欢应试者有自己的思考。三面面试官面试的时候一直在看手机回消息,有时候根本没在听,最终三面不出所料地挂掉了。
一面
1. 详细介绍EMNLP的论文
a) 比BERT好在哪?某种attention,以及实现一定程度的信息跨句传播
b) 标注的细节?
c) 可否处理未见事件
2. 介绍文本表示方法:
One-hot,词袋模型,神经网络word2vec,w2v负采样,BERT的多头attention作用(面试官不喜欢背八股,喜欢有自己的思考,讨论了多头attention可以关注到一个小部分的信息,比如100/1000维,单独处理前100维不会使之被后面的轻易average掉)
3. 做题:二分查找
反问:字节电商下的抖音电商,业务有知识图谱和对话结构化。知识图谱主要针对抖音电商商家所填信息不完整的情况,和标题填一大堆引流的情况。
二面
1. 详细介绍EMNLP论文
a) Tensor-composition的具体过程,为什么work
b) 事件比attention好在哪里?
一个是高亮事件
一个是可以关注到模式(主-谓,谓-宾)
c) 是否分析bad case:句子比较长,事件被avg掉了
d) 为啥用交叉熵不用MSE
e) L1正则化为什么稀疏?涉及到凸优化的理论,面试官建议多看点机器学习基础内容。
2. 了解LDA吗
3. 代码题:手写k-means
三面
1. 讲EMNLP论文,无详细提问
2. BERT的改进有哪些模型
3. 场景题:以过去一年的所有对话为数据,构建一个对话系统
4. 代码:删除链表中的重复节点
5. 场景题:给出淘宝的总商品总量,估算拼多多的商品总量,分类后分别抽样,每个类前面乘一个权重,权重是单价分之一。
字节电商这边挂掉后转到了同一hr负责的垂直策略部,也就是火山引擎,主要做to B业务。
一面(垂直策略-火山引擎to b业务)
1. 二叉树中最大路径和,要求修改全局变量,不会做
2. 问项目
3. 讲BERT
4. 层次softmax中怎么就节省了计算量?类似Word2vec
5. Word2vec中用的前面那个映射矩阵还是后面那个映射矩阵
6. 为什么不能在nlp当中用bn,而是用ln
7. AUC了解吗
8. 梯度爆炸的缓解方法
二面
1. 做题:股票买卖1,股票买卖3(限制为两次)
2. 介绍EMNLP论文,只问了创新点在哪里
3. 讲self-attention
4. 讲BERT的两个预训练任务
5. Topic model原理?只会用。
6. GCN原理?只会用
7. 圆上取三点,围成锐角三角形的概率,钝角三角形的概率?
反问:
1. 业务:卖技术,推荐各种东西
2. 推荐背景重要吗?不重要
3. 哪方面能力重要:数据处理(有时候加去重都会提升效果),模型上面提升不大
4. 三面通过率:较小,三分之一,必须有一方面突出,代码或者算法
三面
1. 介绍论文
2. 提问缓解过拟合
3. 为什么论文里不用MSE?
4. 优化器:adam和adagrad的区别
5. 做题:找到一个和等于target的最小连续数组长度
八股文不背不行,背了不受用,面试都不知道该怎么刷题了。现在春招即将开启,很多同学还不知道该如何准备,解决就业难,进大厂难的CSDN超级实习生计划2022年内推正式开启!大厂、名企实习直通车,年薪最高可达30万,先到先得!即日起可填表预约测评及内推啦!
想知道你的实操能力如何?
点击链接开始测评>>> CSDN超级实习生测评名单收集
另有一份Java核心面试知识点整理,免费分享给大家,点击文章底部VX名片扫描添加即可免费领取!
以上是关于字节跳动2022年最新面试经验分享,2个部门6轮面试全复盘(算法岗)的主要内容,如果未能解决你的问题,请参考以下文章
7月最新字节跳动Java三面面经分享(框架+线程+Redis等等)