检测outliers的新工具-Kibana
Posted 数据小事记
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了检测outliers的新工具-Kibana相关的知识,希望对你有一定的参考价值。
今天是周末,所以打算给大家推送一个轻量级的内容。
一整天都泡在第五届Phoenix Data Conference上。这个会以big data为主,所以所有sessions都在说hadoop,spark,cloud ... 听的我实在太痛苦了。因为听不懂,所以只能讲一个我听懂了的东西给大家了。
大家在data preprocessing的时候肯定会想找出outliers,然后对outliers进行处理。接下来的这个产品就是能帮助我们找到outliers,同时能告诉我们这些outliers被哪些变量影响。这个产品叫做Elastic - Kibana.
这个Elastic公司应该是开发了一整套的产品线,检测outliers是其中的一个。网站在此,中文友好:https://www.elastic.co/cn/products/kibana
下面这张图标注出了outliers的点,以及是被哪些因素影响的。官方介绍是运用了unsupervised learning.
界面设计还是不错的,而且提供了开发工具,可以跳过终端直接进行处理。
--------------------------------------------------------------------
短小精悍。哈哈哈~ 完毕!
为了显得这篇文章不像在凑数,另外附上一个内容。Tableau最近推出了Desktop Specialist证书。是一个入门级的证书,现在报名打半折 - 50美金。如果刚好需要给自己的resume加一个技能的同学们,可以考虑报考一下。我有空的话,可能也会去考一次看看,给大家提供一些信息。
在之前的投票环节,大家(感谢9位投票的同学❤️)最想了解的是Tableau的酷炫图表设计 ---> 考试信息 ---> Tableau的计算,所以明天会带给大家一篇实用文 《如何考取Tableau Desktop Associate证书》。是我之前写的,明天整理一下。
感觉一个星期出一篇应该是比较合适的速度,同时有一些快速消息也会以简讯的形式带给大家。
谢谢阅读 & 欢迎大家留言交流~ (要不要组一个Tableau的交流群呢?)
了解更多Tableau Conference 2018的信息,请点击以下文章阅读:
以上是关于检测outliers的新工具-Kibana的主要内容,如果未能解决你的问题,请参考以下文章
Novelty and Outlier Detection(奇异值和异常值检测)
R语言使用car包的outlierTest函数通过假设检验的方法检测回归模型中的异常值(outlier)输出异常值对应的统计量p值以及Bonferonnii校正p值
R语言基于可视化进行多变量离群(Mulltivariate outliers)点检测识别:散点图可视化多变量离群点模型平滑多变量异常检测使用平行坐标图查看钻石数据集中的异常值
A practical algorithm for distributed clustering and outlier detection