正文
由于目前数据行业从业人员背景千差万别,所以不同背景的面试官关注的点可以能不一样,有的侧重于具体的技术细节,有的更看重business impact,所以在准备简历的时候,最好能保证两个方面都照顾到。在聊简历到过程中,常被问到这些问题:一,为什么用某一种方法及与之相关的各种技术细节;二,如果有机会重新做这个项目,有什么可以改进提高的地方等等。
聊简历的终极奥义是引导面试官聊你最熟悉的内容,引导面试官问你想让他问的问题(能体现你的水平与思考的)
。
总的来说,简历从写到聊水很深,有机会单独再详细说。但是最基本的要求,必须熟悉简历上的每一句话,每一个关键字,了解每一个技术点。
机器学习是Data Scientist面试中非常非常重要的一个部分,因为这是Data Scientist看家吃饭的技能,所以机器学习的面试结果会很大程度上左右最终面试结果
。
一般公司会从广度,深度,经验三个角度进行考察。
从广度上讲,应该对机器学习各个方面(regression, classification, clustering, etc)的算法都有所涉猎,不要求精通,但是至少能够用几句话描述出算法是在怎样的假设下用怎样的步骤解决了怎样的问题,有什么优缺点。
从深度上讲,一方面,能完整的掌握几种机器学习的算法。不仅仅知道算法是干什么的,更要知道与之相关的数学推理、技术细节。比如Naive Bayes怎么利用Naive Assumption简化,比如AUC为什么对于数据不平衡问题不敏感等等。另一方面,能够对算法进行横向比较。比如什么情况下Random Forests 比Gradient Boosting好,什么情况下不如GBM,为什么会这样。