蚂蚁金服:数据仓库高级工程师面试


一、电话面

一面&二面,一面面试官是你所在组的组长。二面面试官是应该是组长的领导都是考察技术为主:

这两轮面试的面试问题和考察点重复度比较高,可能一面更偏向技术细节点,二面的面试官更偏向架构和理解一点,我就放一起说了以下问题不是面试实际顺序。

面试题目 | 电面 

1.首先几分钟的自我介绍
2.对于数据仓库的理解,数据仓库主要为的解决什么问题3.数据仓库模型的理解,数据仓库分层设计的好处是什么

4.数据建模考虑的点是什么,然后随机给了你一个业务场景问问你如果建立模型大致怎么设计

5.你挑一个你印象最深刻的项目来描述下以及为什么让你印象最深刻

注:这个问题要慎重回答,对于经验比较丰富的建议要么回答你对架构做了些有亮点设计的项目要么就是从业务上带来很大价值的项目

6.你处理过最大的数据量大概是多少,遇到性能问题时候怎么优化

7.对于数据中台的理解,和数据仓库和数据湖的区别

8.MAPREDUCE的主要过程,MAP阶段和REDUCE阶段的SHUFFLE各是什么过程

9SORT BY和ORDER BY的区别

10.分桶和PARTITION的区别,并且分桶和PARTITION的各自机制是什么

11 HIVE数据倾斜的原理和不同场景下的解决方案是什么,MPP架构数据下的数据倾斜解决方案是什么

现在回想起来的问题大致就以上这些还有些在讲项目过程中的具体问题就不列出来了这个完全因人而异。

一面和二面间隔时间大概一周左右,有的时候是突然打电话过来的。建议知道有面试前就做好准备,要不然被突然袭击有可能发挥不好。面试官很专业而且态度非常友好,应该是我经历过的面试中面试体验最棒的。

二、现场面

后来被告知两轮电话面通过,需要到杭州现场面。阿里对面试候选人还是比较厚道的,基本等同于出差一样,酒店来回交通费用吃饭都是报销的。

现场面第一轮,面试官是业务和交叉业务的LEADER(P9级别)以及HRBP,去之前我还是做了技术面的准备,但是那天基本没有考察技术细节。

面试题目 | 现场面:

  1. 自我介绍几分钟
  2. 谈谈你对元数据管理和数据资产管理的理解
  3. 你认为你来做这个岗位的优势和劣势是什么
  4. 谈谈你对这个岗位所需技能的理解,假如你来到这个岗位未来半年你的工作思路是什么
  5. 以你对传统数仓的理解,什么样的业务会有实时性的需求?
  6. 挑一个你印象最深刻的项目,这个项目你觉得哪些地方可以再优化的?还有些项目延伸的问题。
  7. 针对蚂蚁金服的具体业务部门,让你谈一谈你对这块业务的理解和数据如何给业务产生价值

 现场面大致印象比较清楚的就以上这些问题,当然面试过程中面试官可能会随时打断你在你陈述的基础上再追问,也有个别面试官可能故意是很挑战的语气,遇到这种情况不要慌还是把自己的思路表达清楚即可。

第一轮面试大致持续了一个小时,然后参与面试的内部讨论下。如果一致通过就会接下来和大部门的领导(P10级别)加上另一个HRBP再谈谈人生谈谈理想,基本就是看看价值观有没有问题就不赘述了。

三、结束语

   总体面试流程下来,感觉我遇到的这个部门LEADER可能对具体的工具不是特别在意,更在意的是你对你所做工作理解的深度,以及你这个人的个性是什么样的。当然也有很多面试官更侧重于你实际的技术栈匹配度这个就因人而异了。