使用 scikit-learn 执行 LDA 降维时出错

Posted

技术标签:

【中文标题】使用 scikit-learn 执行 LDA 降维时出错【英文标题】:error while performing LDA dimensional reduction with scikit-learn 【发布时间】:2021-05-18 10:30:42 【问题描述】:

我已从名为 df 的 pandas Dataframe 中的此 URL 导入数据集: https://www.kaggle.com/jakeshbohaju/brain-tumor?select=Brain+Tumor.csv

但是,在运行线性判别分析时,我总是得到底部的错误。

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
X = df.drop(['label','Image'], axis=1)
y = df[['label']]

lda = LinearDiscriminantAnalysis(n_components=2)
X_r2 = lda.fit(X, y).transform(X)

错误:

ValueError                                Traceback (most recent call last) <ipython-input-41-f7a0f19db224> in <module>
     25 lda = LinearDiscriminantAnalysis(n_components=2)
     26 lda2 = LinearDiscriminantAnalysis(n_components=2)
---> 27 X_r3 = lda2.fit(X_train,y_train.values.ravel()).transform(X_train)
     28 X_r2 = lda.fit(X, y).transform(X)
     29 

~/miniforge3/envs/pyM1/lib/python3.8/site-packages/sklearn/discriminant_analysis.py in fit(self, X, y)
    537         else:
    538             if self.n_components > max_components:
--> 539                 raise ValueError(
    540                     "n_components cannot be larger than min(n_features, "
    541                     "n_classes - 1)."

ValueError: n_components cannot be larger than min(n_features, n_classes - 1).

【问题讨论】:

【参考方案1】:

解决方案

lda.fit(X, y) 不返回任何内容,因此您不能在其上调用名为.transform() 的方法。 API 将允许您仅在已定义方法时调用该方法。请参阅文档。

改成这个。我还鼓励您花更多时间在文档上。

lda = LinearDiscriminantAnalysis(n_components=2)

# either use: lda.fit_transform(X, y)
X_r2 = lda.fit_transform(X, y)

## PREFERRED WAY
# or, use: lda.fit(X, y)
# followed by lda.transform(X)
lda.fit(X, y)
X_r2 = lda.transform(X)

参考文献

    LinearDiscriminantAnalysis - Docs

【讨论】:

使用您的代码,我仍然会收到此错误消息:/python3.8/site-packages/sklearn/utils/validation.py:63: DataConversionWarning: A column-vector y was passed when a 1d array预料之中。请将 y 的形状更改为 (n_samples, ),例如使用 ravel()。 使用ravel()没有效果,还是报错 这里有一个例子。 scikit-learn.org/stable/modules/generated/…。请先尝试运行它。检查 X、y 和变换后的 X 的形状。然后确保您的Xtrainytrain 也遵循相同的形状。 @scapiest 感谢您接受答案。如果对您有帮助,还请考虑投票答案。

以上是关于使用 scikit-learn 执行 LDA 降维时出错的主要内容,如果未能解决你的问题,请参考以下文章

LDA和PCA降维的原理和区别

LDA和PCA降维总结

降维技术2-线性判别分析(LDA)

使用LDA(Linear Discriminant Analysis)进行降维(dimention reduction)详解和实战

降维方法-LDA线性判别分析

用scikit-learn学习LDA主题模型