Mahout实践指南 pdf
Posted 电子读物
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Mahout实践指南 pdf相关的知识,希望对你有一定的参考价值。
【编辑推荐】
内容全面而深入,既展示Mahout的强大功能,又全方位讲解利用Mahout进行大数据分类、聚类和预测分析的各种技术细节、方法和最佳实践
实战性强,包含丰富案例,涉及Mahout开发环境、序列文件使用方式、整合Mahout和外部资源、实现朴素贝叶斯分类器、股市预测、顶棚聚类、频谱预测、K-均值聚类等
【内容简介】
本书是软件开发专家数十年行业经验的结晶,深入浅出地论述如何使用Mahout进行数据分类、聚类和预测,涉及Mahout开发环境、序列文件使用方式、整合Mahout和外部资源、实现朴素贝叶斯分类器、股市预测、顶棚聚类、频谱预测、K-均值聚类等。本书是面向编程的,不涉及深奥的理论,简单、易学,可以帮助读者快速掌握Mahout的基本用法,实用性强。
全书共分10章。第1章介绍如何在单台机器上创建完整的Mahout开发环境。第2章重点介绍序列文件的使用方式。第3章详细介绍如何使用命令行工具和代码从RDBMS中读写数据。第4章详细讨论朴素贝叶斯分类器和互补朴素贝叶斯分类器的使用方法。第5章介绍如何使用logistic回归和随机森林预测股市。第6章描述Mahout框架中最常用的算法,包括大数据的聚类分析和分类。第7章描述频谱聚类的使用方式。第8章描述使用K-均值(包括序列方式和MapReduce方式)对主题中的文本文档进行分类。第9章介绍频繁模式挖掘算法的使用方式。第10章描述使用遗传算法解决旅行商问题和提取规则。
作者简介:
Piero Giacomelli 资深软件技术专家,精通Java、.NET和php等多种编程语言,尤其对Java语言有独到见解。
他曾先后在多家大中型公司担任行政和技术职务,包括航空航天、网络服务、塑料制造业和电子健康协会。
他在FP7欧盟项目中参与了多项欧盟研究基金资助的工程,如CHRONIOUS、I-DONT-FALL、FEARLESS和CHROMED等。
他在科研期刊上发表了若干篇论文,并两次获得由IARIA颁发的最佳论文奖。
2012年,他出版了Apache HornetQ框架标准参考书《HornetQ Messaging Developer’s Guide》。
目录:
第1章 Mahout入门 / 1
第2章 使用序列文件——什么时候和为什么 / 19
第3章 将Mahout和外部资源整合 / 33
第4章 实现朴素贝叶斯分类器 / 49
第5章 股市预测 / 67
第6章 顶棚聚类 / 87
第7章 频谱聚类 / 101
第8章 K-均值聚类 / 119
第9章 软计算 / 139
第10章 实现遗传算法 / 159
以上是关于Mahout实践指南 pdf的主要内容,如果未能解决你的问题,请参考以下文章
关于举办“大数据分析和挖掘技术实战-Mahout/MLlib/Storm/Docker” 培训