SparkML之推荐算法ALS

Posted free-dog

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SparkML之推荐算法ALS相关的知识,希望对你有一定的参考价值。

参考:
SparkML之推荐算法(一)ALS --有个比较详细的讲解,包含blocks使用。
Spark ALS源码总结

//TODO 源码,集群尝试、研究blocks使用原理及作用。
官方解释:numBlocks is the number of blocks used to parallelize computation (set to -1 to auto-configure).
即bloclk用于并行计算。并行计算量的大小。
block设定小值,集群中我们设置spark.default.parallelism=10 或者blocks=2。大大降低了运算时间,从6min降低到40s。但是这是为什么? 因为RDD的lineage?

以上是关于SparkML之推荐算法ALS的主要内容,如果未能解决你的问题,请参考以下文章

推荐算法协同过滤算法代码(pyspark | ALS)

推荐算法ALS算法原理和在音乐推荐上的应用

ALS推荐算法在Spark上的优化

推荐系统中矩阵分解算法-funkSVD和ALS

ALS推荐算法—训练并保存—加载并测试

协同过滤之ALS