随机森林不分类

Posted

技术标签:

【中文标题】随机森林不分类【英文标题】:Random Forest does not classify 【发布时间】:2019-09-05 12:08:15 【问题描述】:

我通过对数据集(图像)使用迁移学习得到了特征向量

X =
[[0.06381412 1.5189143  0.7007909  ... 0.22550535 0.56980544 0.07307615]
 [0.06381412 1.5189143  0.7007909  ... 0.22550535 0.56980544 0.07307615]
 [0.06381412 1.5189143  0.7007909  ... 0.22550535 0.56980544 0.07307615]
 ...
 [0.06381412 1.5189143  0.7007909  ... 0.22550535 0.56980544 0.07307615]
 [0.06381412 1.5189143  0.7007909  ... 0.22550535 0.56980544 0.07307615]
 [0.06381412 1.5189143  0.7007909  ... 0.22550535 0.56980544 0.07307615]]







imgs_train, imgs_test, y_train, y_test, = train_test_split(X, Y,test_size=0.33, random_state=42)                
Mrfc = RandomForestClassifier(n_estimators = 1000, 
                                 bootstrap = True,
                                 oob_score = True,
                                 criterion = 'gini', 
                                 max_features = 'auto',
                                 max_depth = dep,
                                 min_samples_split = int(3000), 
                                 min_samples_leaf = int(1000), 
                                 max_leaf_nodes = None,
                                 n_jobs=-1
                                )       
Mrfc.fit(imgs_train,y_train)
y_predict = Mrfc.predict(imgs_train)

y_predict 的输出全为零:

[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. ...]

Y 包含标签(0 或 1) 该模型无法做出预测。我能做什么?

【问题讨论】:

X 是 (1050, 2048)...1050 张图片...每张图片有 2048 个特征 【参考方案1】:

您的标签中的类别是否存在偏差,因此全零的预测实际上可以为您提供很高的准确度?在这种情况下,您可能想尝试为您的 RandomForestClassifier 设置 class_weight="balanced"。

【讨论】:

以上是关于随机森林不分类的主要内容,如果未能解决你的问题,请参考以下文章

Spark Random Forest classifier 随机森林分类

随机森林图像分类实战:随机森林分类聚类(Kmeans)降维后的数据随机森林分类聚类(Kmeans)降维后的合成(append)数据

随机森林

为啥随机森林分类器 .predict() 和 .predict_proba() 的预测不匹配?

随机森林

随机森林