R中栅格堆栈的无监督随机森林分类

Posted

技术标签:

【中文标题】R中栅格堆栈的无监督随机森林分类【英文标题】:unsupervised random forest classification of raster stack in R 【发布时间】:2015-05-04 04:03:23 【问题描述】:

我想从 R 中的栅格堆栈中计算无监督的随机森林分类。栅格堆栈表示不同光谱带中的相同程度,因此我想获得堆栈的无监督分类。 我的代码有问题,因为我的数据非常庞大。是否可以将堆栈转换为数据帧以便像这样运行随机森林算法:

stack_median <- stack(b1_mosaic_median, b2_mosaic_median, b3_mosaic_median, b4_mosaic_median, b5_mosaic_median, b7_mosaic_median)
stack_median_df <- as.data.frame(stack_median)

这是 csv 文件 (https://www.dropbox.com/s/gkaryusnet46f0i/stack_median_df.csv?dl=0) 形式的数据 - 您可以通过以下方式读取它:

stack_median_df<-read.csv(file="stack_median_df.csv")
stack_median_df<-stack_median_df[,-1]
stack_median_df_na <- na.omit(stack_median_df)

我的下一步将是无监督分类:

median_rf <- randomForest(stack_median_df_na, importance=TRUE, proximity=FALSE, ntree=500, type=unsupervised, forest=NULL)

由于我的数据集庞大,无法计算邻近度度量(大约需要 6000GB)。你知道怎么才能看分类吗? predict(median_rf)plot(median_rf) 不返回任何内容。

对于无监督随机森林分类及其准确性度量的每一个建议、改进或代码 sn-p,我都很高兴,... 非常感谢!

【问题讨论】:

【参考方案1】:

我认为您可以使用大样本进行无监督分类,然后使用创建监督分类模型(从原始数据预测类别;并且应该非常适合)并将其应用于整个数据集.

【讨论】:

以上是关于R中栅格堆栈的无监督随机森林分类的主要内容,如果未能解决你的问题,请参考以下文章

机器学习:R语言实现随机森林

决策树、随机森林

R语言 | randomForest包的随机森林回归模型以及对重要变量的选择

R语言︱决策树族——随机森林算法

R中随机森林中的二元分类或未知类

随机森林算法