扒一扒这个数据挖掘行业,黄油和面包

Posted 爱数据原统计网

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了扒一扒这个数据挖掘行业,黄油和面包相关的知识,希望对你有一定的参考价值。


声明:本文指的是做数据挖掘这行,不是数据仓库


我干这行有几年了,见了很多人,干了很多公司,爆一爆这个行业的状况吧……让后来人有所了解,也让猎头挖人挖的有点方向,起码和candidates聊天的时候不至于什么也不清楚谈不明白,不清楚价值,等等


个人的经验,干这行最重要的第一是人,第二是项目,绝对的人才加上做合适的项目才能成长起来,其余都是扯淡的,就算理论知识再完备,没有机遇也难以成长。


目录:


1-哪些公司主要招这个行业的人


2-这个行业的基本待遇如何


3-以后的发展之路


4-如何成为混合型人才


5-未来的路我也看不清楚



公司



说起公司,有很多种分类方式,我这里选择几个指标(规模、产品线、solution、项目数量)


一级:IBM、Teradata、SAS


二级:Accenture、Ernst & Young、Deloitte、KXEN、Fair Isaac、招行


三级:百度、网易、腾讯、搜狐、淘宝、阿里巴巴、京东、新蛋、天涯、千橡、盛大、360、人民搜索、优酷、当当……一堆想做又不知道怎么做,连思路和成功案例都没有的公司,主要为互联网公司、零售业的一些公司


三级公司还包括国内的厂商和咨询公司:亚信、华为、斯特奇、融通、华胜、中盈、神马、联创、新华信……这些见过猪跑,没吃过猪肉的类型……


扒一扒这个数据挖掘行业,黄油和面包


至于为什么这样分类,有人肯定不同意,那也没关系,我列出以下理由:


IBM,Teradata这俩公司有自己的DW产品、DM产品,CRM产品(包含ACRM和OCRM),同时这两个公司单子很多,也就是挖掘的项目很多,电信、金融都有。


SAS在中国也很牛,软件很厉害,就是贵的真要命啊,不是小喽喽能玩的起的,而且只租不卖,在中国solution做的不多,就是个卖软件。SAS在北京西安有研发中心,这个是其他公司不具备的,因此SAS有资格成为一级公司,IBM和Teradata在中国也有研发中心,不过对其挖掘的产品开发工作不多,这个可以去打听一下,一个在上地,一个在五道口。


AC、EY、DT三家都是咨询背景的,没产品是绝对的缺陷,都是绑着别人做的,不过单子也不少,AC,EY主要干电信,DT金融单子多点。招行列在这的原意是:招行是唯一一个有自己挖掘团队的国内金融客户,我指的是真正能做出来东西的团队,不是其他四大行那种混日子的团队,招行的钱也不少哦。



人才



数据挖掘的”正规军“:一般都在一级、二级公司任职,圈子很小,互相都认识,比如坛子上也基本不说话,新人想入行的老人也不咋教,核心技术与业务核心理念存在于几个人脑子里,没文档描述,就算有也是给客户看的,没什么用处,给新人模型也看不懂,只要不给解释,那就是不可能明白其中的业务思考深度和模型的构建逻辑,进来的人基本上靠天赋和机遇,碰上心好的前辈口口相传,慢慢积累出来突然一天发现,我的妈呀,终于入行了!门槛挺高的,多是大厂商出来的或者pure咨询背景的兄弟姐妹,不知道我发完帖子之后会不会一大帮哥们蹦出来骂我哈。


扒一扒这个数据挖掘行业,黄油和面包


数据挖掘的”野战军“:存在于三级公司,想法多,思路多,专注于算法、代码等等,根本不会去想数据挖掘的商业价值,如何把知识转换为生产力,如何赚钱,cost control,marteting等等商业问题。


正规军具备详尽的知识体系、战略思想、解决方案、软件架构、较好的数学,计算机,统计理论背景等等,这些都是野战军不具备的,当然野战军中也有游侠一样的高人,出来也是秒杀正规军一片人马,我这里指的只是一般情况。


待遇


一二级公司:junior,1~2W/月,senior,2.5~4W/月左右,mgr,4~6W/月左右,SM,6~9W/月,Director,10W~,partner没数了……,也有疯狂的,见过一个AC的SM,140万package,当然也要背quota,他能力也超强。


三级公司就便宜多了,三级公司基本照着码农、码奴的要求招人,所以去的人也少,只知道一个百度的大哥,70W的package,是中层了;因此,市场上活蹦乱跳天天招人的那些公司还在每天活蹦乱跳的招。AC、EY、DT的薪水是超过IBM和Teradata很多的。




待遇其实是由市场决定的,一级二级公司的人做的都是银行电信的单子,大项目,拿钱多正常的,三级公司给自己做,钱少点,所以没啥牛人,web mining的项目居多,多以尝试为主,没有经济效益。




发展



顾问路线:c-sc-mgr-sm-director-partner


技术路线:se-ae-pm-spm-director-vp-cfo


还有很多路线:比如sales、software路线等等,这个就因人而异了



能力



一定要懂点战略、才能结合商业;


一定要漂亮的presentation、才能buyin;


一定要有global view、才能打单;


一定要懂业务、才能结合市场;


一定要专几种工具、才能干活;


一定要学好excel、才能有效率;


一定要有强悍理论基础、才能入门;


一定要努力、才能赚钱;


最重要的:一定要务实、才有reputation;不懂的化以后慢慢就明白了;


目标


1-做过多少个项目?


2-业务背景有哪些,是否跨行业?


3-做过多少种类型的模型?做了多少个模型?


4-基于模型做过多少次完整的marketing闭环?


以上四个问题,足以秒杀95%以上的忽悠和菜鸟!



未来



行业今后如何,我也不知道,反正养家活口不成问题,有转甲方的,有做sales的,有做partner的,自己开公司的也有;


自己努力的话,永远不会被社会甩掉;


不能转化为生产力的数据挖掘是永远没有市场的一项技术!


前景很好,与同学们共同努力!


End.



本文为中国统计网原创文章,需要转载请联系中国统计网(小编微信:itongjilove),转载时请注明作者及出处,并保留本文链接。



以上是关于扒一扒这个数据挖掘行业,黄油和面包的主要内容,如果未能解决你的问题,请参考以下文章

网时扒一扒IDC行业内直男癌晚期的IDC服务商

从零开始的python生活①手撕爬虫扒一扒力扣的用户刷题数据

扒一扒 EventServiceProvider 源代码

扒一扒Oracle数据库迁移中的各种坑

借用经典案例,来扒一扒会员体系

扒一扒轻舟模式:字节美团同时看好的L4自动驾驶路线