在散点图中可视化文本类

Posted

技术标签:

【中文标题】在散点图中可视化文本类【英文标题】:Visualize text classes in a scatter-plot 【发布时间】:2020-06-24 09:22:26 【问题描述】:

我正在寻找方法来调查我的训练数据“可建模性”,并检查这些类在词汇方面是否得到很好的区分......等等。

我有点尴尬,但我想知道是否可以在 Torch 中为文本分类模型做散点图?或任何其他调查数据质量的方法。

【问题讨论】:

【参考方案1】:

您可以使用降维(PCA、t-SNE 或 UMAP)+ 色调来检查您的数据。我建议使用散景以交互方式查看您的数据,即使在这里我将向您展示 seaborn。

import numpy as np
import seaborn as sns
import umap
from sklearn.datasets import load_digits

digits = load_digits()

embedding = umap.UMAP().fit_transform(digits.data)  # 2D embedding

sns.scatterplot(x=embedding[:,0], y=embedding[:,1], hue=digits.target)

【讨论】:

以上是关于在散点图中可视化文本类的主要内容,如果未能解决你的问题,请参考以下文章

R语言可视化散点图(scatter plot)并在散点图中叠加回归曲线叠加lowess拟合曲线(linear and lowess fit lines)使用plotlineabline函数

R语言plotly可视化:plotly可视化在散点图中添加误差条(Scatterplot with Error Bars with plotly in R)

R语言plotly可视化:plotly可视化在散点图中添加误差条(Line Graph with Error Bars with plotly in R)

R语言ggplot2可视化:ggplot2可视化分组散点图并使用geom_smooth函数在散点图图中为不同的散点簇添加对应的回归曲线并使用se参数设置拟合回归线的置信区间

如何在散点图中自定义标记颜色和形状? [复制]

R语言ggplot2可视化在散点图中的每个点上绘制两个错误条:常见的是垂直错误条,它对应于Y值点上的错误(error bar),添加与X轴(水平)相关的错误条(error bar)