求职刷题神器

funit.cn

讨论区 > 求职面经 > 社招 杭州阿里巴巴数据分析面经

社招 杭州阿里巴巴数据分析面经

四方霸主
发布于2021-05-10 17:27:07 32浏览

一面(技术面)

突击电面(共53分钟)

在此之前还没经历过这么长时间的面试,面试官人很好,说话很亲切,面试像在聊天一样,整个人几乎没什么压力。

1. 自我介绍(比较仓促,下一轮应认真准备)

2. 问:讲一个最近在做的项目。

答:机器指标异常检测(讲完了背景和难点)

3. 问:数据量有多大?

答:(答得不太好)excel打不开的数据量。。。

4. 引导:采样频率?

答:采样频率每个数据集不同,有的是60s一次,有的60ms一次,有的好几分钟才一次,涉及到了统一的问题。

5. 问:怎样统一?

答:(这时候有点慌,因为还没做到)我们先做的单维的数据分析,所以还没有涉及到这方面的问题。但是如果需要统一的话,初步想法有两个:(1)可以把几秒之内出现的时间戳看成同一个时间;(2)可以把较大的时间区间分割成小的,和较小的区间合并。

6. 问:如果给你一个异常检测的项目,你一般会走的基本流程是什么?

答:首先可视化,观察,根据异常类型采用合适的算法,同时还要看有什么样的需求,如果需要实时性,需要设置一个时间窗或者用一个有记忆性的算法。

7. 问:我来介绍一下我以前做过的一个项目,你来评估一下这个流程。

根据描述大致流程为:预处理、异常分类->看时间序列类型(平稳型、波动型、周期型)->根据所属类型建模(STL, ARIMA, Hot Winters)->看残差一般服从Gaussian分布->离群的即为异常点。

我中间插了一嘴:当时我们也用过STL,但是需要确定一个周期T,我们当时想的是每天为一个周期,不知道有没有什么更好的确定方法。(面试官似乎对这一点印象深刻,表明我对这个项目进行了深入的思考。)面试官解释STL他们有一个专门选周期的程序,来确定最小周期。

另外我还插了一句:ARIMA容易受到前面异常值的影响。另外对算法提出一些质疑,我们之前尝试过同样的方法,但是效果不太好,而且有些差分操作之类的需要视时间序列的具体情况而定。但面试官说他们的方法可以自动选定差分次数等参数,有点好奇他们是怎么做的。

最后,我和面试官一起总结了一下,大体是我做的可能偏科研,所以找了一些比较偏的方法,但是公司处理业务的时候,应该用比较正常的方法来做。

8. 问:还有什么项目可以介绍一下?

答:植树造林对云和降雨的影响。简单说了一下背景,和数据处理方面的一些问题。面试官插话,可以直接用ARIMA,我说ARIMA下来全是白噪声,所以只能分析相关性。他似乎觉得我还是处理的一些时序问题,就没有继续追问下去,及时叫停。

9. 问:你会不会一些大数据处理的工具,比如流处理、批处理的Spark啥啥的?

答:不会,但是可以学,应该不难。

10. 问:之前看你做的都是科研类项目,数据都是给定的,结论也是给定的,但淘宝做的很多都是数据挖掘,根本不知道能用已经有的数据做什么。举例:比如流量转化率问题(其实我并不知道流量转化率是什么,下面还用这个做了例子,差点把自己搞死)。你需要从一个问题中,确定自己需要什么样的数据,然后来进行业务的分析。

答:这一块我真的没做过,但具体的流程还是了解过一点。(开始现学现卖,前几天刚学的知识)本来想用流量转化率做例子,后来实在扯不下去,转成了淘宝双十一购物券的例子。大概流程是,先确定问题:首先是我们做了这个活动后什么发生了(比如某些顾客使用了优惠券),为什么会发生,我们怎样做才能是这个活动效果变得更好?针对这些问题,进行数据的提取,比如分析顾客行为就要提取年龄、过去几个月使用优惠券的频率,婚姻状态,职业等等数据,对顾客进行一个画像,同时也要了解顾客过去使用优惠券的行为,然后进行数据清洗,数据基本操作来发现其中的相关性或者一些规律,然后进一步通过可视化和模型的方法对前面发现的规律进行验证。(这一块说的比较乱,估计面试官也知道我不是很熟悉)

11. 问:你有什么其他想了解的?

(1)我过了吗?(没错,就是这么直白)

面试官直接说他接下来去跟他们老板对接,让我进二面(好开心,这是我第一个进二面的面试)。

(2)问一下二面大概问什么?

还是问项目,但是不会有很多技术性的东西,表述的时候要尽量展现自己是数据敏感度和分析能力。

(3)公司入职的培训会包括哪些方面?

· 开发平台的使用,阿里有开源的开发平台(分布式系统ODPS,FLINK等等(都是些术语不太懂))

· 百阿:阿里发展历史,结识非本校的新同学,1-2星期

· 百技:了解其他岗位的知识,可以参与其他岗位的项目

· 其他课程培训几乎每天都有,都可以报名(听起来好好的样子)

· 每人一个mentor

总结:一面总体就是扣住一个项目,详细分析,项目细节问的很细,一定要说自己非常熟悉的项目,不能掉以轻心。


本文首次发布于趣IT ,转载请注明出处,谢谢合作

社招 杭州阿里巴巴数据分析面经

全部评论0

成为第一个评论的人

还可以上传7

表情
  • 微信扫码加好友进群