了解数据可视化|Facets
Posted ToKnowSomething
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了了解数据可视化|Facets相关的知识,希望对你有一定的参考价值。
Better data leads to better models.
KNOW YOUR DATA
Facets 是一款旨在帮助用户理解并分析各类机器学习数据集的开源可视化工具。
机器学习之所以强大,是因为它具有从大量数据中学习模式的能力。理解数据对于构建强大的机器学习系统至关重要。由于机器学习数据集可以包含数亿个数据点,每个数据点由数百 (甚至数千) 的特征组成,几乎不可能以直观的方式了解整个数据集。Google 开源的 Facets 就是专门为解决这个痛点而生。
Facets 包含两个部分:Facets Overview 和 Facets Dive。你可以使用 Facets Overview 可视化数据每一个特征,或者使用 Facets Dive 探索个别的数据观察集。这些可视化允许你调试数据,这在机器学习中和调试模型一样重要;还可以轻易地被用在 Jupyter notebooks 之内,或者嵌入网页之中。除了开放 Facets 源代码,还创建了演示网站,允许任何人在浏览器中直接可视化数据集而无需安装任何软件或设置,也无需数据离开你的计算机。
Facets Overview从数据集中获得输入特征数据,分析它们的功能特征并作可视化。它让用户能快速了解数据集的特征值分布,并揭示一些常见的问题,如意外的特征值、缺少大量观测的特征值、训练/服务扭曲和训练/测试/验证集扭曲等。
Facets Dive是一种交互式开发大量数据点的工具。它提供了一个交互式界面,用于探索数据集的所有不同特征之间的数据点之间的关系。可视化中的每个项目代表一个数据点。Dive的成功案例包括:检测分类器故障、识别系统错误、评估地面实况和对潜在的新信号进行排序。
如果你想更深入地了解这个数据可视化项目,记得点击阅读原文哦!
以上是关于了解数据可视化|Facets的主要内容,如果未能解决你的问题,请参考以下文章
Google 可视化库 Facets:如何将 python 模块“facets”输出 html 离线保存到本地驱动器?
R语言ggplot2可视化按照因子排序(order of facets)可视化分组多子图(facet面图)实战
R语言ggplot2可视化分面图(faceting)在所有的分面中添加相同的参考基准曲线(overlay a base or reference plot to all facets )