截断的 SVD 需要很多时间
Posted
技术标签:
【中文标题】截断的 SVD 需要很多时间【英文标题】:Truncated SVD is taking lot of time 【发布时间】:2019-09-30 19:22:39 【问题描述】:我正在尝试通过使用截断 SVD 计算最佳 n_components 来减少数据集的维度,但这需要花费大量时间。
from sklearn.decomposition import TruncatedSVD
pca = TruncatedSVD()
pca.n_components = 10048
pca_data = pca.fit_transform(X_tr)
percentage_var_explained = pca.explained_variance_ /
np.sum(pca.explained_variance_);cum_var_explained = np.cumsum(percentage_var_explained)
【问题讨论】:
【参考方案1】:您可以改用以下内容(如果我们想保留 95% 的数据方差,请根据需要更改数字):
from sklearn.decomposition import PCA
pca = PCA(n_components = 0.95)
reduced = pca.fit_transform(X)
如果我错过了重点,请告诉我我没有连接的地方,我会尽力提供帮助。
【讨论】:
以上是关于截断的 SVD 需要很多时间的主要内容,如果未能解决你的问题,请参考以下文章