使用 OneVsRestClassifier 时全为零

Posted

技术标签:

【中文标题】使用 OneVsRestClassifier 时全为零【英文标题】:All zeros when using OneVsRestClassifier 【发布时间】:2016-04-01 08:54:52 【问题描述】:

我正在尝试在我的数据集上使用OneCsRestClassifier。我提取了将训练模型的特征并在其上拟合线性 SVC。模型拟合后,当我尝试对拟合模型的相同数据进行预测时,我得到全零。是因为一些实现问题还是因为我的特征提取不够好。我认为,由于我在预测与我的模型相同的数据,所以我应该得到 100% 的准确率。但相反,我的模型预测全为零。这是我的代码-

#arrFinal contains all the features and the labels. Last 16 columns are labels and features are from 1 to 521. 17th column from the last is not taken
X=np.array(arrFinal[:,1:-17])
X=X.astype(float)
Xtest=np.array(X)

Y=np.array(arrFinal[:,522:]).astype(float)
clf = OneVsRestClassifier(SVC(kernel='linear'))
clf.fit(X, Y)
ans=clf.predict(Xtest) 
print(ans)
print("\n\n\n")

我的 OneVsRestClassifier 实现有问题吗?

【问题讨论】:

尝试参数调整。看看SVC(kernel='linear', C=10000) 是否会给你不同的结果。见***.com/questions/34475245/… 这真的很奇怪。如果 C 足够高,它应该准确地产生给它的东西,除非特征完全相同或真正的相关性为 0。我觉得我们错过了一些东西。你能提供数据吗? pastie.org/private/jeusjl8nfna0vlelzbnbhq 这是有道理的。您的 X 值太小。尝试功能扩展,或将您的 C 增加很多。 优秀。我正在使用 StandardScaler 示例添加答案。它可能对你有用。 【参考方案1】:

查看您的数据后,看起来这些值对于 C 值来说可能太小了。尝试使用sklearn.preprocessing.StandardScaler

X=np.array(arrFinal[:,1:-17])
X=X.astype(float)
scaler = StandardScaler()
X = scaler.fit_transform(X)
Xtest=np.array(X)

Y=np.array(arrFinal[:,522:]).astype(float)
clf = OneVsRestClassifier(SVC(kernel='linear', C=100))
clf.fit(X, Y)
ans=clf.predict(Xtest) 
print(ans)
print("\n\n\n")

从这里,您应该查看使用交叉验证对C 进行的参数调整。使用学习曲线或使用网格搜索。

【讨论】:

以上是关于使用 OneVsRestClassifier 时全为零的主要内容,如果未能解决你的问题,请参考以下文章

OneVsRestClassifier 的损失函数

如何用 OneVsRestClassifier 做 GridSearchCV?

如何使用带有 SVC 估计器的 OneVsRestClassifier 的 GridSearchCV?

OneVsRestClassifier(svm.SVC()).predict() 给出连续值

Scikit-learn 多输出分类器使用:GridSearchCV、Pipeline、OneVsRestClassifier、SGDClassifier

GridSearch 用于 OneVsRestClassifier 中的估计器