干货|数据挖掘的8个最佳开源工具

Posted 网舟科技

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了干货|数据挖掘的8个最佳开源工具相关的知识,希望对你有一定的参考价值。

点击上方 “公众号” 可以订阅哦!

干货|数据挖掘的8个最佳开源工具

数据挖掘,又称为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤,是一个挖掘和分析大量数据并从中提取信息的过程。其中一些应用包括市场细分 – 如识别客户从特定品牌购买特定产品的特征,欺诈检测 – 识别可能导致在线欺诈的交易模式等。在本文中,我们整理了进行数据挖掘的 8 个最佳开源工具。

Weka

干货|数据挖掘的8个最佳开源工具

WEKA 作为一个公开的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。

Rapid Miner

RapidMiner 是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术。它数据挖掘任务涉及范围广泛,包括各种数据艺术,能简化数据挖掘过程的设计和评价。

Orange

干货|数据挖掘的8个最佳开源工具

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python 以进行脚本开发。它包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。其由C++ 和 Python 开发,它的图形库是由跨平台的 Qt 框架开发。

Knime

KNIME (Konstanz Information Miner) 是一个用户友好,智能的,并有丰演的开源的数据集成,数据处理,数据分析和数据勘探平台。

jHepWork

干货|数据挖掘的8个最佳开源工具

jHepWork 是一套功能完整的面向对象科学数据分析框架。 Jython 宏是用来展示一维和二维直方图的数据。该程序包括许多工具,可以用来和二维三维的科学图形进行互动。

Apache Mahout

Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使用。该项目已经发展到了它的最二个年头,目前只有一个公共发行版。Mahout 包含许多实现,包括集群、分类、CP 和进化程序。此外,通过使用 Apache Hadoop 库,Mahout 可以有效地扩展到云中。

ELKI

ELKI (Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。ELKI 是类似于 weka 的数据挖掘平台,用 java 编写,有 GUI 图形界面。可以用来寻找离群点。

Rattle

干货|数据挖掘的8个最佳开源工具

Rattle(易于学习的 R 分析工具)提供数据的统计和可视化摘要,将数据转换成容易建模的形式,从数据中构建无监督和监督模型,以图形方式呈现模型的性能,并得出新的数据集。


来源:今日头条


若涉及版权请告之我们,我们会在第一时间处理!我们对文中观点保持中立,仅供参考、交流目的。

干货|数据挖掘的8个最佳开源工具
干货|数据挖掘的8个最佳开源工具

长按上方二维码识别

【网舟科技】

网舟联合科技(北京)有限公司,成立于2004年,注册资金2000万元,目前拥有13年互联网大数据服务经验,公司长期专注于金融保险、通信、互联网、旅游酒店等行业的电子渠道大数据运营,为客户提供全球领先的电子渠道转型咨询、大数据挖掘和应用定制服务,助力客户互联网转型,提升数字化运营和数据营销能力。


网舟科技是Adobe数字营销的全球解决方案级合作伙伴,具备一流的数字营销一体化解决方案能力。


官方网站: www.eship.com.cn

官方微信: eship2004

以上是关于干货|数据挖掘的8个最佳开源工具的主要内容,如果未能解决你的问题,请参考以下文章

2021年11个我们喜爱的DevOps开源工具

2021年11个我们喜爱的DevOps开源工具

2021年11个我们喜爱的DevOps开源工具

2021年11个我们喜爱的DevOps开源工具

Bossies 2016:最佳开源大数据工具

Bossies 2016:最佳开源大数据工具