数据分析这碗饭,该怎么吃?

Posted Python数据科学

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据分析这碗饭,该怎么吃?相关的知识,希望对你有一定的参考价值。

之前发过很多关于数据分析的文章,收到大家不少的好评,不过也有一些困惑:

  • 入门数据分析该学哪些知识点?该看哪些书?

  • 是从Python入手还是R语言?哪些算法是常用的?

  • 网上看了很多文章,但感觉没有个系统,号主有系统性的资料推荐吗?


的确,我当时学数据分析也有同样的苦恼,网上关于数据分析的学习资料非常多,但缺乏系统性,没有老师时时给你解答问题,很多时候都感觉自己要放弃了。


但,我不得不说一句:学数据分析,没错,坚持下去你会看到一个完全不一样的自己。


之前在百度的曹政举了他身边的例子,令人印象深刻,蛮多看上去并不优秀的人却都能靠着数据分析C位出道。

十来年前我在百度招聘过一个人大本科应届的小伙子邓明生,从学历背景看在百度并不占优势,当时开始跟我做数据分析,写程序分析百度的业务数据,后来慢慢独挡一面,因为对百度所有业务线的数据都清晰,后来百度出现一些人事危机的时候开始成为救火队长,连续在不同业务部门担纲重要职位,一路升到联盟事业部总经理,今年离职出来创办御势资本,青出于蓝而胜于蓝,人家现在比我厉害很多了。

还是十来年前,又有一个应届生吴海生,从百度产品部门申请内部调动去做数据分析,开始经验不足,写报告还被我嘲讽过的那种。好多年不见,最近看新闻才知道,已经某新近上市的金融公司CEO,妥妥的C位出道有没有,真是让人刮目相看。


那么,数据分析到底该怎么学呢?

其实真的没那么复杂,你只需要做好这三件事


1.找到一个实力与经验俱佳的“教练”,从思维、工具、实战带你“即学即用”

2.制定一份正确的学习计划与路径,你真正需要的是好方法而不是蛮力

3.有效工具的运用会让你事半功倍


在这里,不得不给大家介绍下我自己在看的数据分析学习资料 —— 极客时间的《数据分析实战45讲》。作者是清华大学计算机系博士陈旸,最近刚刚更新完毕,好评度也超高。


在这个专栏中,陈旸清晰地把数据分析拆解成下面三个组成部分:数据采集、数据可视化和数据挖掘。在后面文章里,我会给大家分享这三部分所需要掌握的知识,让你有个更深入了解。:



并且,专栏里一直秉承着“MAS学习法“,即 Multi-DImension(多维度认识)、Ask(提问)和Sharing(分享),从“思维”到“工具”再到“实践”,学以致用,更高效上手数据分析。


现在要插播一下,今天我特意向极客时间运营小姐姐申请了一个我的专属粉丝福利,我领衔开了一个《数据分析实战45讲》超级团,参团只要79元,原价99元,便宜20元,但仅限今天24小时,且只有200个名额,先到先得。想扩大自己能力边界的同学们,请抓紧搭上这个快车。


数据分析这碗饭,该怎么吃?

识别上图二维码,立即加入我的专属福利团


好,下面接着给大家分享上图中数据采集、数据可视化和数据挖掘需要掌握的知识。


数据采集


当你入门Python后,接下来就算是正式进入数据处理阶段。「数据分析」涵盖两部分:数据是基础,分析是过程,所以数据的前期准备工作也很重要。第一步,就是采集数据。


你可以用Python自动采集数据,也可以使用第三方平台,比如用八爪鱼来采集数据。《数据分析实战45讲》中,作者陈旸用了两个实战案例来讲解如何用Python和八抓鱼来采集数据,讲的非常细致,看完你可以掌握这两种常用方法。


详细地,你可以去直接看专栏里这两篇文章:

  • 第9讲 | 如何用八爪鱼采集微博上的“D&G”评论?

  • 第10讲 | 如何用Python自动化下载王祖贤海报?


数据可视化


大多数人都很容易被数据可视化吸引。试想一下,用各种酷炫的图片将数据的规律直观地呈现给大家,是一件特别有成就感的事情。应用也很广泛,比如天猫双十一的数据大屏等。我们可以用各种工具、编程语言做数据可视化,比如DataV、Tableau、Python或者R语言。


在《数据分析实战45讲》中,主要用Python的 Matplotlib 工具来做数据可视化。Matplotlib 是Python的可视化基础库,非常适合入门学习。学完专栏,下面的这几张图我也可以做出来,非常抢眼。


数据分析这碗饭,该怎么吃?


你可以看看专栏里这篇文章:

  • 第15讲 | 如何用Python绘制10种常见的可视化视图?


数据挖掘


当你掌握了数据分析中基础的操作后,接下来就该正式处理数据了。为了进行数据挖掘任务,数据科学家们提出了各种算法,《数据分析实战45讲》中详细讲解了数据挖掘十大经典算法,根据用途,把它们分为四大类:

  • 分类算法:C4.5,朴素贝叶斯(Naive Bayes),SVM,KNN,Adaboost,CART

  • 聚类算法:K-Means,EM

  • 关联分析:Apriori

  • 连接分析:PageRank


值得一提的是,专栏里用了大篇幅内容、许多案例来讲解这十大算法,还会提供一些数据库让大家去实操,亲测有效。


数据分析这碗饭,该怎么吃?


学完《数据分析实战45讲》专栏,你一定会对数据分析游刃有余。这个专栏已有超过1.1w人加入学习给大家截了部分读者评价,你可以参考。


数据分析这碗饭,该怎么吃?


也给大家放下当初“诱惑”我入手这个专栏的曹政大佬截图。


最后,再强调一遍周末的粉丝专属福利。


最后,再强调一遍我给大家争取到的粉丝专属福利。


《数据分析实战45讲》限时优惠,从我这里参团只需¥79,原价¥99,便宜20元,但仅限今天24小时。想扩大自己能力边界,想在职场有更多选择的同学们,请抓紧搭上这个快车。

以上是关于数据分析这碗饭,该怎么吃?的主要内容,如果未能解决你的问题,请参考以下文章

测试这碗饭,你还拿得稳吗?

万达娱乐 关键词竞争度「环境分析」

吃了程序员这碗青春饭 40岁你该怎么办?

五个问题(书还没看完)……

快速排序递归

男女交往最忌讳什么