华为数据分析师技术面试

送分小仙女□ 提交于 2020-01-19 15:27:51

华为数据分析师技术面试感受

前言

年末华为的各个部门好像都在招人。笔者收到了个面试邀请,是数据分析师的。好像只有三个步骤,投递简历,技术面试,业务面试。就其中可能是大家最想知道的技术面试和大家分享一下。

正文

首先面试的形式是电话面试,时间大概是35分钟鬼知道我这么能聊)。

首先是先寒暄了几句。问了我现在在哪个城市,然后强调了一下是签德科,这是招聘的基础。目前社招的17级及以下的都是走德科哈。至于德科和华为的关系,建议大家自行百度。(当然之后我如果签了,我肯定也会分享出来这方面的感受)

然后说进行技术面试,先自我介绍
我:“XXXX”(大概三分钟)

接着是询问你简历里的和数据分析的项目
因为我的工作是做图像识别,而且公司做图像的只有我一个。所以这方面的所有步骤我都很清楚,而这个又是和数据分析能扯到关系的。所以回答的算是很不错。

再然后就是问数据分析的问题,猜测应该是考察对数据分析的了解的。建议了解下数据预处理和相关算法。
问题有
1.如何去衡量一个模型是一个好模型。
我:“如何衡量一个模型的好坏应该有五点,准确率,速度,强壮型,可规模性,可解释性。然后就这五点我都举了各自的例子”

2.如何去优化一个模型。
我:“模型的优化,还是要看你对模型的哪一点不满意。你要是对准确性不满意,那么可以尝试把多个弱分类器组成一个强分类器;对速度不满意,可以import numba,然后在函数前面加@jit;对别的不满意就针对性的去改就好。。。XXX说了一堆”

3.如何提高模型的准确性。
我就举了些别人的经验,之前网上看的kaggle一些大神的经验分享,这时候就派上了用场。没吃过猪肉,但我见过猪跑啊。别人的名人名言,从我嘴里出来,那就是我的了。

4.过大的数据的准确度要怎么提高。
说实话,这个我就不知道了,完全不知道。我回答是“您提到了以亿级别的数据量,我第一个考虑到的就是时间问题。”我先打了一下擦边球,然后说了不太清楚。

5.你处理的最大的数据量是什么级别的,百万的?千万的?亿?十亿?
。。。。。。不好意思,最高就十万(TAT)

6.你做图像处理的时候,如何防止处理过程中的丢失数据对结果的影响?
说到了图像,瞬间我就可以举一反三。从图像金字塔扯到深度学习里的池化层。归根到底,应该就是具有特征的数据不丢就行。

7.你觉得你已经有了很大的训练数据,这时候又有了些新的数据,你觉得这些新的数据对你是否有用。
我先回答的是要看这些数据是否具有我需要的特征,然后我再做决定。然后我又改了下我的回答,改成了有用。我会把这些数据给放到我的测试集里去。也不知道我回答的对不对。

8.你有没有用过python做过一些爬虫类的项目?
答“没有,但我用python做过按键精灵。Python 实现按键精灵的功能,超简单详细

大概就这8个,没有什么其他问题了,问完之后就和我说,我技术面试过了,还差个业务面,这个面试不会问技术的问题了。接着评价我的广度够了,深度不够。(这个肯定啊,我深度在图像上啊)

下一步就是我问他了,这一部分我写下我获取到的信息。
部门是企业交付与服务部,负责华为全国的AI项目。这个工作base在成都,但需要经常出差,短则一两星期,长则半年。出差地大多是北京和广州。顺带提一下,面试电话的来源也是在广州。
工作时间跟着项目走(这个大家都懂)
至于薪资,想来各位会比较感兴趣。说实话,我没问,之后还有个业务面,那个时候的面试官肯定会主动的去问你的,到时候先漫天要价好了。

面试前的准备

既然通过了技术面,那么分享下我的准备,给大家做一做参考。
1.了解技术分析师是做什么的,这个去搜下他们的招聘需求就知道了,里面也有些相关的知识。
2.了解“数据挖掘的十大算法”分别是C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART。了解他们的优点,缺点,适用的数据类型和场景。对其中的一部分算法用代码跑了一下,感受了一下。
3.数据库的相关知识,恶补了我的mySQL。(虽然面试官基本没问)
4.平时的积累,我也觉得挺有用的。说出一些大牛的观点和对问题解决的思路,感觉也有点用。

这篇文章发之前和我的面试官沟通了一下,比较担心隐私的问题,不过还是获得了允许的。希望对各位看官有用,以及麻烦能点个赞和要个关注。承诺周更。有不清楚的可以留言给我,会及时回复的。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!