如何使用`matplotlib`可视化5-D功能集和回归结果?
Posted
技术标签:
【中文标题】如何使用`matplotlib`可视化5-D功能集和回归结果?【英文标题】:How to visualize 5-D feature set and regression results using `matplotlib`? 【发布时间】:2016-10-19 14:22:45 【问题描述】:我正在使用sklearn.svm
支持向量回归来解决连续数据集上的回归问题,其中特征集有5维和1维 标签集,下面是数据集的样子:
>>> type(feature_set)
55: <type 'numpy.ndarray'>
>>> type(label_set)
56: <type 'numpy.ndarray'>
>>> feature_set.shape
57: (31875, 5)
>>> label_set.shape
58: (31875,)
现在我只想可视化/绘制数据,但我不知道该怎么做。 此外,特征集中有 5 个维度,但我们只能绘制两个维度,对吧?
这是我的回归器:
from sklearn.svm import SVR
reg = SVR()
count = int(len(feature_set)*0.8)
reg.fit(feature_set[:count], label_set[:count])
是否也可以可视化/绘制回归量的结果?
我对此非常陌生,因此对任何或不同的技术持开放态度,通过这些技术我将能够可视化连续数据(首选matplotlib
)。
谢谢。
【问题讨论】:
【参考方案1】:您应该首先查看以下 scikit-learn 示例,该示例演示了如何使用主成分分析和线性判别分析。如果这不能将您的数据带到您想要的位置,您可以尝试流形模块的计算成本更高的方法。
http://scikit-learn.org/stable/auto_examples/decomposition/plot_pca_vs_lda.html#example-decomposition-plot-pca-vs-lda-py
http://scikit-learn.org/stable/modules/manifold.html
编辑:在将数据传递给任何降维之前缩放数据可能是一个好主意。参见例如http://scikit-learn.org/stable/modules/preprocessing.html#preprocessing
【讨论】:
以上是关于如何使用`matplotlib`可视化5-D功能集和回归结果?的主要内容,如果未能解决你的问题,请参考以下文章
Python使用matplotlib可视化安德鲁斯曲线安德鲁斯曲线可以用来查看分类变量对于数据集是否具有判别性区分性(Andrews Curve)
如何使用 matplotlib 在 python 中绘制 3D 密度图
python使用matplotlib对比多个模型的在训练集上的效果并使用柱状图进行可视化:基于交叉验证的性能均值(mean)和标准差(std)进行可视化分析使用标准差信息添加误差区间条yerr