BAT数据分析面试过程详解


确认基本信息

正式开始面试之前,为了保证信息的统一,以及目标的明确。一般会问以下几个问题:

1、工作年限;最近的一家公司、团队、职级,以及相应的工作大方向上的内容

2、当前是否在职。如果不在职,多久走的;如果在职,看机会的大概目的和原因

3、最近的绩效水平,未来的发展方向如何

以上问题,不会都问,但是会确定一些简历里提到的信息。

一来保证简历如实;二来确定是真的想找工作,且符合当前所招岗位要求,保证双方不会互相浪费时间。

基于这两个判断,面试官才会继续往下去“设置”问题,有针对性的了解候选人。

简历沟通

一般来说,简历沟通最直接的方式,就是自我介绍。

这个自我介绍不要重复讲一遍简历上的内容,这个内容看简历就好了。作为面试官,想听到的是简历上没有的东西。

自我介绍中可以包含最近一份工作中,团队是什么定位,什么工作内容,以及候选人在其中负责什么,是否是核心成员,负责的业务是否核心。如果能说出“战绩”,那是一个非常大的加分项。

这个自我介绍的过程,一定要清晰明确,有针对性和条理性。针对性不仅要说出为什么你觉得你适合这个岗位,优势是什么,还要表达出你对这个岗位的了解和期望。而条理性则是一个分析师所必须的,做业务,做分析,都需要条理性。切忌讲话啰哩啰嗦,没有逻辑,没有重点。

项目提问

项目提问一般会分成两类问题:

1、基于自我介绍,或者简历内容,任选一个候选人自认为做的很出彩的项目做介绍。

这个问题,基本会有三个层次:

  1. 举一个在工作中最有收获的项目?
  2. 能进一步说明你当时具体做了什么吗?
  3. 你觉得哪个环节是最有意义的?

这里更多的深入到候选人经历过的一些项目中去深挖,看看候选人的业务理解深度,以及平常工作中所做事情的深度。

如果只是简单的做了指标体系,没有思考背后为什么要建立这些指标,以及指标之间如何联系,到最后指标如何使用和产生价值,那么就只属于做了而已。这样会是一个减分项。

2、基于面试官感兴趣或者假设的一个场景,提出问题,让候选人解。

这个问题更多的是考验一种解决问题的迁移能力。一般情况下,面试官都会出和JD契合的问题。这种问题不会很难,主要是考量候选人的经验是否可以复用,以及能复用多少。用来判断候选人是否合适的标准之一。

沉淀思考

这一块儿,会问一些诸如行业上的理解,业务上的思考,方法论沉淀。主要考察候选人在平时工作中的积累,从而判断出,候选人的大致能力水平。

举几个例子大家可以感受一下:

  • 日常监控异常维度如何快速挖掘?
  • 分析方法论沉淀?
  • 统计学应用?
  • 对于数据分析价值的思考?

技术能力

这里就是一些很具体的技术上的问题了,但是都会比较基础。一般就为了保证,招来的候选人可以独立干活儿。

毕竟如果是个P7,来了不会写SQL,就很尴尬了。数据都没有,了解那么多的分析方法论,也没有一个用武之地。就如同你有一把好枪,但是不好意思,子弹得现加工。

就我自己来说,我一般会问这些问题:

  • 用到的技术栈主要有哪些?
  • hive的底层运行原理大体说明?
  • 数据倾斜问题是否遇到过,如何处理?
  • 销量表sale_table,列涵盖:日期(day)、商品(id)、用户id(uid)、购买量(cnt)。如何获取每日销售最多的TOP10商品id?
  • Python里的pandas库中DataFrame,返回前几行和后几行数据,对某一列数据排序,怎么操作?

总体评估方向

总体来说,评估一个候选人,一般会考量三个方向:

1、个人能力

  • 技术实现能力(大数据处理、数据分析、特征工程、实时计算、数仓知识、分布式基础知识)
  • 关键贡献及历史战绩(做过的出彩的项目,以及在项目中的角色)
  • 能力沉淀(行业知识,业务理解,方法沉淀)

2、性格特质

  • 是否足够聪明(学习能力,沟通协调能力)
  • 是否足够皮实(坦荡真实,有韧性,有耐心)
  • 是否会自省(不断反思成长)
  • 不要是事儿逼&卷王(这点就不展开说了【手动狗头】)

3、与岗位契合度

  • 历史经验与岗位契合度(是否能做事)
  • 能力沉淀与岗位契合度(是否能做好事)
  • 未来发展与岗位契合度(是否能长久做事)