《OD大数据实战》Mahout入门实例
Posted 沙漏哟
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了《OD大数据实战》Mahout入门实例相关的知识,希望对你有一定的参考价值。
一、环境搭建
1. 下载
2. 解压
3.
mahout org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
hdfs dfs -ls /output
转换成普通文本
hdfs dfs -ls /output/clusteredPoints
mahout seqdumper -i output/clusteredPoints -o dataset/clusteredPoints
cat clusteredPoints | more
cat clusteredPoints | awk `{print $2}` | sort | uniq
mahout vectordump -i output/data -o dataset/raw_data
以上是关于《OD大数据实战》Mahout入门实例的主要内容,如果未能解决你的问题,请参考以下文章
Kafka消息队列大数据实战教程-第一篇(Kafka基础入门)