一个高效易用的分布式机器学习框架

Posted 区块链技术吧

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了一个高效易用的分布式机器学习框架相关的知识,希望对你有一定的参考价值。


什么是xLearn


xLearn是一种高性能、易用、可扩展的机器学习软件包,可用于解决大规模的机器学习问题。xLearn对于解决大规模稀疏数据的机器学习问题特别有用,这是近年来在诸如在线广告和推荐系统等互联网服务中非常常见的问题。如果您是liblinearlibfm、或libffm的用户,现在xLearn是另一个更好的选择。


性能参考

一个高效易用的分布式机器学习框架



XLearn是用高效的C++精心设计和优化开发出来的。我们的系统被设计为最大化CPU和内存利用率,提供缓存感知计算,并支持无锁编程学习。通过结合这些见解,xLearn比相似系统快5x-13x


易于使用


xLearn不依赖任何麻烦的第三方库,因此用户可以克隆代码并使用CMake编译。此外,xLearn支持非常简单的PythonR API的数据科学,它还提供了许多有用的特点,已被广泛应用于机器学习和数据挖掘比赛,如交叉验证,早退模式等。


性能

xLearn可用于解决大规模机器学习问题。首先,xLearn支持非核心训练,它可以通过利用PC的磁盘来处理非常大的数据(TB)。此外,xLearn支持分布式训练,它通过使用参数服务器框架来跨越许多机器的规模超过数十亿的示例。


项目位置:https://github.com/aksnzhy/xlearn 


以上是关于一个高效易用的分布式机器学习框架的主要内容,如果未能解决你的问题,请参考以下文章

本源发布量子机器学习框架VQNet,可高效连接机器学习和量子算法展现量子优势

TOP 7 最流行AI机器学习框架

使用伯克利AI分布式框架Ray加速TensorFlow

学习Weiflow——微博机器学习框架

分布式机器学习第3章——分布式机器学习框架

TensorFlow机器学习:如何正确的掌握Google深度学习框架TensorFlow(第二代分布式机器学习系统)?