有哪些数据分析、数据挖掘的书推荐下

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有哪些数据分析、数据挖掘的书推荐下相关的知识,希望对你有一定的参考价值。

1. 深入浅出数据分析 (豆瓣) 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分。
难易程度:非常易。
2. 啤酒与尿布 (豆瓣) 通过案例来说事情,而且是最经典的例子。
难易程度:非常易。
3. 数据之美 (豆瓣) 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助。
难易程度:易。
4. 集体智慧编程 (豆瓣) 学习数据分析、数据挖掘、机器学习人员应该仔细阅读的第一本书。作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码。
难易程度:中。
5. Machine Learning in Action (豆瓣) 用人话把复杂难懂的机器学习算法解释清楚了,其中有零星的数学公式,但是是以解释清楚为目的的。而且有Python代码,大赞!目前中科院的王斌老师(微博: @王斌_ICTIR)已经翻译这本书了 机器学习实战 (豆瓣)。这本书本身质量就很高,王老师的翻译质量也很高。
难易程度:中。
6. 推荐系统实践 (豆瓣) 这本书不用说了,研究推荐系统必须要读的书,而且是第一本要读的书。
难易程度:中上。
7. 数据挖掘导论 (豆瓣) 最近几年数据挖掘教材中比较好的一本书,被美国诸多大学的数据挖掘课作为教材,没有推荐Jiawei Han老师的那本书,因为个人觉得那本书对于初学者来说不太容易读懂。
难易程度:中上。
8. The Elements of Statistical Learning (豆瓣) 这本书有对应的中文版:统计学习基础 (豆瓣)。书中配有R包,非常赞!可以参照着代码学习算法。
难易程度:难。
9. 统计学习方法 (豆瓣) 李航老师的扛鼎之作,强烈推荐。
难易程度:难。
10. Pattern Recognition And Machine Learning (豆瓣) 经典中的经典。
这些都是在“绿色BI论坛”http://www.powerbibbs.com 找到的,这个论坛经常有数据分析的干货分享,你可以看一下。
参考技术A 数据分析需要对与所在行业有关的一切核心数据有深入的理解,以及一定的数据敏感性培养。

经典图书推荐:《概率论与数理统计》、《统计学》、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用 》、《Excel 2007 VBA参考大全》、《深入浅出统计学》《深入浅出数据分析》等。
数据挖掘需要理解数据库原理,编程语言和数据处理软件工具,经典图书推荐:《数据挖掘概念与技术》、《机器学习实战》、《人工智能及其应用》、《数据库系统概论》、《算法导论》、《Web数据挖掘》、《 Python标准库》、《thinking in Java》、《Thinking in C++》、《数据结构》等。

关于数据挖掘的相关学习,推荐CDA数据师的相关课程,CDA数据分析师课程培养学员硬性的数据挖掘理论与Python数据挖掘算法技能的同时,还兼顾培养学员软性数据治理思维、商业策略优化思维、挖掘经营思维、算法思维、预测分析思维,全方位提升学员的数据洞察力。点击预约免费试听课。
参考技术B 我这边有些资料,因为现在没有用了,就送给你了。需要的私信我。

技术资源推荐(数据仓库篇)

0x00 前言

前段时间有不少朋友让推荐一些数据仓库的书出来,本着“如果重复三次回答通一个问题,就应该写一篇博客”的原则,在这里梳理一下数据仓库相关的资源给大家。

这里的推荐只有居士自己看过的书,至少是看过大部分的。几本书正好在身边,拍个照方便大家参考。另外,一些已经买不到的书就不再推荐了,能买到的都尚且看不完,不增加更多的心理负担。


0x01 书籍推荐

一、数据仓库工具箱(第3版):维度建模权威指南

英文名:《The DataWarehouse Toolkit-The Complete Guide to Dimensona Modeling》

维度建模是大师 Ralph Kimball 所倡导的, 这本《数据仓库工具箱》是数据仓库经典书籍,特别是维度建模相关的内容非常权威,目前市面上能买到的书,很少有比这个更权威的了。

优点:

  1. 实践性较强,基本所有的概念都有例子说明

  2. 易懂,语言通俗易懂

  3. 没太多抽象的理论

缺点:

  1. 示例都是传统行业

  2. 还是有一些抽象的概念,零基础来读,可能要花点时间,毕竟经典的数据都需要一些上层次抽象的概念。

二、数据仓库(原书第4版)

范式是数据库逻辑模型设计的基本理论,一个关系模型可以从第一范式到第五范式进行无损分解。在数据仓库的模型设计中目前一般采用第三范式。范式模型由数据仓库之父 Inmon 提倡,而这本书就是 Inmon 所写。

这本书是我看的第二本数据仓库的书,个人感受是理论比较强,刚开始看基本就是一头雾水,然后当你做了一段时间后,再回头来看这本书会有很多理论指导,比如说元数据该怎么做,模型该怎么设计,参考性很强。

三、数据挖掘:概念与技术(原书第3版)

这是一本数据挖掘的书,但是没关系,数据仓库本身就是和数据挖掘息息相关的,或者是说数据仓库是数据挖掘的支撑。这本书的前5章,十分值得一读,这本书讲了其它书没有深入讲的OLAP和数据立方体技术,比如说Kylin构建Cube,其实看看这本书的第五章基本就知道是怎么回事了。

所以强烈推荐看了这本书,至少是前5五章。

四、大数据之路:阿里巴巴大数据实践

阿里的大数据最佳实践,基本上讲了阿里在大数据实践上的方方面面,特别是数据模型的设计和实践,目前是我看到最好的一本书,倒不是说理论多好,主要是贴近于工作,不过多解释,只管去看就行。

五、大数据日知录

这本书偏向于大数据的各个组件,和前四本不同,这本书主要偏向于各种大数据系统的原理。

推荐这本书的原因就在于现在大部分互联网公司的数据仓库都是基于这一套大数据框架来的,更准确的来讲,大家其实都是先工程,后理论,因此这本书可以作为对大数据生态的一览。

0xFF 总结

这几本书都是居士看的比较多的,其中大数据之路和大数据日知录有8成以上的内容都看过,数据仓库工具箱有5成以上都看过,其余的两本有3成是认真看过的,其余的都是需要了来做参考。

以上是关于有哪些数据分析、数据挖掘的书推荐下的主要内容,如果未能解决你的问题,请参考以下文章

做数据分析不得不看的书有哪些?

python在金融方面都有哪些好的书 知乎

Python 入门书籍都有哪些推荐?

请大家介绍下关于JSP和J2EE方面的书

java学习书籍都有哪些比较好?

有哪些用 Python 语言讲算法和数据结构的书