Mahout实践指南 pdf

Posted 电子读物

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Mahout实践指南 pdf相关的知识,希望对你有一定的参考价值。

Mahout实践指南 pdf

【编辑推荐】


内容全面而深入,既展示Mahout的强大功能,又全方位讲解利用Mahout进行大数据分类、聚类和预测分析的各种技术细节、方法和最佳实践


实战性强,包含丰富案例,涉及Mahout开发环境、序列文件使用方式、整合Mahout和外部资源、实现朴素贝叶斯分类器、股市预测、顶棚聚类、频谱预测、K-均值聚类等




【内容简介】


本书是软件开发专家数十年行业经验的结晶,深入浅出地论述如何使用Mahout进行数据分类、聚类和预测,涉及Mahout开发环境、序列文件使用方式、整合Mahout和外部资源、实现朴素贝叶斯分类器、股市预测、顶棚聚类、频谱预测、K-均值聚类等。本书是面向编程的,不涉及深奥的理论,简单、易学,可以帮助读者快速掌握Mahout的基本用法,实用性强。


全书共分10章。第1章介绍如何在单台机器上创建完整的Mahout开发环境。第2章重点介绍序列文件的使用方式。第3章详细介绍如何使用命令行工具和代码从RDBMS中读写数据。第4章详细讨论朴素贝叶斯分类器和互补朴素贝叶斯分类器的使用方法。第5章介绍如何使用logistic回归和随机森林预测股市。第6章描述Mahout框架中最常用的算法,包括大数据的聚类分析和分类。第7章描述频谱聚类的使用方式。第8章描述使用K-均值(包括序列方式和MapReduce方式)对主题中的文本文档进行分类。第9章介绍频繁模式挖掘算法的使用方式。第10章描述使用遗传算法解决旅行商问题和提取规则。


作者简介:
Piero Giacomelli 资深软件技术专家,精通Java、.NET和php等多种编程语言,尤其对Java语言有独到见解。

他曾先后在多家大中型公司担任行政和技术职务,包括航空航天、网络服务、塑料制造业和电子健康协会。

他在FP7欧盟项目中参与了多项欧盟研究基金资助的工程,如CHRONIOUS、I-DONT-FALL、FEARLESS和CHROMED等。

他在科研期刊上发表了若干篇论文,并两次获得由IARIA颁发的最佳论文奖。

2012年,他出版了Apache HornetQ框架标准参考书《HornetQ Messaging Developer’s Guide》。



目录:
第1章 Mahout入门 / 1
第2章 使用序列文件——什么时候和为什么 / 19
第3章 将Mahout和外部资源整合 / 33
第4章 实现朴素贝叶斯分类器 / 49
第5章 股市预测 / 67
第6章 顶棚聚类 / 87
第7章 频谱聚类 / 101
第8章 K-均值聚类 / 119
第9章 软计算 / 139
第10章 实现遗传算法 / 159