今天我们来分析一下这个数据挖掘工程师的职位。这个职位乍听起来,给人一种高大上的感觉。挖掘本来就给人一种神秘的感觉,许多人可能都没有做过,只是觉得应该需要专业的技术才能够进行挖掘工作。数据嘛倒还好一点,不过这块挖掘的数据可能和我们平时理解不太一样。把两个东西合在一起,就更显得神秘莫测了。
常见的数据挖掘职位长这样,我们来看看。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
熟悉spark mllib,tensorflow,deeplearning4j等机器学习框架,有深度学习工作经验者优先;
熟练使用 Hadoop/Spark/Hive/strom/flume/kafka, 有性能调优经验;
熟悉linux开发环境,熟练掌握至少一种语言(Java/Python/Shell/Scala);
有算法基础,知其原理,能灵活运用(贝叶斯,KNN,LR,决策树,SVM),有NLP经验者优先;
有数据挖掘处理经验优先(NLP,用户推荐,反作弊,知识库建设)
良好的时间和流程意识,良好的团队意识,业务导向意识,良好的责任心;
良好的抗压能力
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
从这个描述来看,我们认为这个职位面对是一个现成的系统,很可能使用了某种解决方案。通常来说,能够使用数据挖掘系统,企业已经有一定规模的业务,企业系统通过数据挖掘系统的使用,让业务规模扩大,或者另外的影响。在这里有一些开源的机器学习框架,这个职位对这一点多半不是仅仅知道框架名字,简单用过就可以了。这些框架里面提供了许多现成的算法和模型可以很容易的实现,企业应该是有某些地方需要对现成的算法和模型做调整,多半是结合自身业务。这部分应该就是这个职位的主要工作内容。
紧接着提到的,对数据处理系统的调优经验,这一条应该算是一种行业要求。当前大多数的软件产品都是采用某种解决方案或者委托第三方企业开发完成。最终在企业里面,就会有这样的一类岗位,要求能够调优现成产品,不过我们认为这也表示了公司在招聘什么样的人员,但是在这里,我们觉得调优应该不是主要的,应该主要是指在从事业务的时候有能力顺便调优的意思。
接下来是对基本开发工具,以及基本算法的要求。这个应该是基本条件,掌握基本开发工具,可以获取到想要的数据,掌握基本算法,可以了解数据的意义。但是这个职位应该需要更多的技能。正如后面,公司希望该职位的人拥有经验。
最后提到的各种意识,我们认为是挖掘的数据有时效性,或者业务有季节性。最后提到的团队合作应该也是这样。
图解:我们认为这个岗位可能是在一个部门中与其他人共同工作的岗位。
右边的一栏,我们用来表示一种可能的流程。左边的部分,我们用来表示职位。
其中绿色的五角星表示业务部门的领导,红色的五角星表示数据部门的领导。中间重叠的部分,表示双方互相交换需求。紫色的方框表示数据部门的小组长,我们认为这个职位描述可能符合这种情况。蓝色的方框表示小组成员。红色的方框表示数据部门的领导一般情况下会向小组下达任务,小组会向组员下达任务。在右边的方框部分就描述了这样的流程。当业务做完以后,通常情况下会进行相反的传递。
我们认为通过我们的这种职位描述图式,可以清晰,直观的了解各种职位。转载请注明出处。
留言与评论(共有 0 条评论) |