predictionio 随机森林

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了predictionio 随机森林相关的知识,希望对你有一定的参考价值。

其实predictionio 也是支持随机森林算法的,可惜官方的例子没有出现,我简单写了一点,您也可以参考这个地址:
https://github.com/runapal5/PredictionIO-DefectPrediction/blob/master/engine.json

public class RandomForestAlgorithm extends P2LJavaAlgorithm<PreparedData, RandomForestModel, Query, PredictedResult> {

    /**
     * 
     */
    private static final long serialVersionUID = 1L;

    private final RandomForestAlgorithmParams ap;

    public RandomForestAlgorithm(RandomForestAlgorithmParams ap) {
        this.ap = ap;
    }

    @Override
    public RandomForestModel train(SparkContext sc, PreparedData preparedData) {
        String datapath = "/root/whk/company.txt";
        JavaRDD<LabeledPoint> treedata = MLUtils.loadLibSVMFile(sc, datapath).toJavaRDD();
        Map<Integer,Integer> categoricalFeaturesInfo = new HashMap<Integer,Integer>();
        return RandomForest.trainClassifier(treedata, ap.getNumClasses(), categoricalFeaturesInfo, ap.getNumTrees(),
                                     ap.getFeatureSubsetStrategy(),ap.getImpurity(),ap.getMaxDepth(),ap.getMaxBins(),12345);
    }

    @Override
    public PredictedResult predict(RandomForestModel model, final Query query) {
        double[] b={12,0,0};
        model.predict(Vectors.dense(b));                                  
        return null;
    }
}

以上是关于predictionio 随机森林的主要内容,如果未能解决你的问题,请参考以下文章

基于随机森林算法完成鸢尾花卉品种预测任务 代码+数据

随机森林代码审查

随机森林算法

Spark MLlib速成宝典模型篇06随机森林Random Forests(Python版)

数据结构-集成算法-随机森林

spark 随机森林 源码解析