截断的 SVD 需要很多时间

Posted

技术标签:

【中文标题】截断的 SVD 需要很多时间【英文标题】:Truncated SVD is taking lot of time 【发布时间】:2019-09-30 19:22:39 【问题描述】:

我正在尝试通过使用截断 SVD 计算最佳 n_components 来减少数据集的维度,但这需要花费大量时间。

from sklearn.decomposition import TruncatedSVD
pca = TruncatedSVD()
pca.n_components = 10048
pca_data = pca.fit_transform(X_tr)
percentage_var_explained = pca.explained_variance_ / 
np.sum(pca.explained_variance_);cum_var_explained = np.cumsum(percentage_var_explained)

【问题讨论】:

【参考方案1】:

您可以改用以下内容(如果我们想保留 95% 的数据方差,请根据需要更改数字):

from sklearn.decomposition import PCA
pca = PCA(n_components = 0.95)
reduced = pca.fit_transform(X)

如果我错过了重点,请告诉我我没有连接的地方,我会尽力提供帮助。

【讨论】:

以上是关于截断的 SVD 需要很多时间的主要内容,如果未能解决你的问题,请参考以下文章

奇异值分解(SVD)详解

矩阵的SVD分解

奇异值分解(SVD)原理详解及推导

奇异值分解SVD

特征 SVD 双铸

SVD(奇异值分解)(转)