并行化 rfcv() 函数以在 randomForest 包中进行特征选择

Posted

技术标签:

【中文标题】并行化 rfcv() 函数以在 randomForest 包中进行特征选择【英文标题】:Parallelize rfcv() function for feature selection in randomForest package 【发布时间】:2012-09-29 20:20:59 【问题描述】:

我想知道是否有人知道如何并行化 R-package 'randomForest' 中实现的 rfcv() 函数。抱歉,这个问题听起来很基础,但我尝试使用 'foreach' 进行此操作,但没有任何结果。

【问题讨论】:

【参考方案1】:

查看caret 包及其文档。

它不仅更通用(允许比“仅”随机森林更多的模型),而且还集成了预处理和后处理 --- 同时还可以在可行的情况下为您提供并行执行,特别是对于评估和交叉验证是一个“令人尴尬的并行”问题。

【讨论】:

非常感谢@Dirk。现在我设法在“插入符号”中尝试过滤和递归特征消除功能。但我也在徘徊是否有机会使用例如 mclapply (来自“多核”)并行化 rfcv()。我之所以问,是因为我目前正在研究的 r-cloud 上提供了“多核”,而 doMC 由于某些原因不能很好地工作......

以上是关于并行化 rfcv() 函数以在 randomForest 包中进行特征选择的主要内容,如果未能解决你的问题,请参考以下文章

R randomForest 的 rfcv 方法实际上是不是说明了它选择了哪些功能?

并行化-你的高并发大杀器

如何使用 sfInit 和 makeCluster 类型“MPI”/R 中的消息传递/集群上的并行化

“reduce”函数可以在函数式编程中并行化吗?

“线程安全”函数是不是依赖于并行化框架?

如何并行化 R 中包的函数