掌握Spark机器学习库-02-mllib数据格式

Posted moonlightml

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了掌握Spark机器学习库-02-mllib数据格式相关的知识,希望对你有一定的参考价值。

MLlib

1.MLlib介绍

1)MLlib特点

2)哪些算法

3)阅读官方文档

MLlib提供了哪些:

  • 算法
  • 特征工程
  • 管道
  • 持久化

2.MLlib数据格式

1)本地向量

技术分享图片

2)标签数据

技术分享图片

3)本地矩阵

技术分享图片

4)分布式矩阵

技术分享图片

5)分布式数据集:RDD,DATASET,DATAFRAME

技术分享图片

 

 

技术分享图片

 

技术分享图片

 

以上是关于掌握Spark机器学习库-02-mllib数据格式的主要内容,如果未能解决你的问题,请参考以下文章

掌握Spark机器学习库 大数据开发技能更进一步视频教程

掌握Spark机器学习库 大数据开发技能更进一步 高清无密

掌握Spark机器学习库-07.6-线性回归实现房价预测

掌握Spark机器学习库-07-回归算法原理

掌握Spark机器学习库-05-spark中矩阵与向量的使用

掌握Spark机器学习库-07-回归分析概述