有哪些好用的机器学习和数据挖掘工具?

Posted 数据皮皮侠

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有哪些好用的机器学习和数据挖掘工具?相关的知识,希望对你有一定的参考价值。

尝试写一些我工作中用到过的,

且个人感觉有特点,比较看好的工具吧。


我的分析工具可以分为三大类:

1.机器学习工具

2.数据集成/转换工具

3.前端可视化工具




机器学习工具:

PyTorch,Tensorflow,Weka,Keras

我个人用Keras比较多,

这里贴两个我经常看API文档链接:

主页 - Keras 中文文档

Keras:基于Python的深度学习库 - Keras中文文档


不过这些除了Weka以外都是代码库,

也就是写代码来操作的工具,

以下是个人推荐两个 码农锄具:

Sublime,PyCharm.

Sublime 比较追求写的体验,
PyCharm比较追求调用使用。

如果你曾是PyCharm等IDE的使用者,

我强推Sublime

熟悉后它能让你在写代码这个过程有好体验,

而且有时轻量级的脏数据处理,

也可以在这Sublime上面解决。

而且长期使用Sublime,

遇到面试也不会因为掉包而退化写码能力。

一举多得(纯个人想法)


数据集成/转换工具:

Informatica,Kettle.


有哪些好用的机器学习和数据挖掘工具?
Kettle图形化界面


虽然这kettle有些时候比较...

比较受限制比较乏力就是了...

但还是有特点的,方便传递给别人使用。

与打包好的可执行文件不同。

做ETL, Kettle 调通一次之后,

甩给别人去跑都可以,

出了问题用的人也很容易找到问题,

毕竟就那么几个模块。

而且Kettle集成了Hadoop生态服务的支持。

也是加分项。


前端可视化工具

数据转图像也是很重要的一步,可视化有时是在分析过程中需要比较直观查看数据的方式。同时也是关系到展示数据后能否执行做好沟通的关键命门。

可视化工具:

Echarts,pyecharts,Tableau

Tableau 个人用得比较少,

但还是很看好的一个工具。

具有出色的图表操作UI。


然后不太推荐pyecharts,

尽管它python党的福音

但我还是觉得Echarts更好些。

原因就是pyecharts大更了,

然后文档和目前的工具库有挺多对不上的坑。

详情见:Crow·Lu:[pyecharts]v1版本爬坑之旅


所以比较推荐Echarts,地图可视化也很实用。

让国内各省数据直观的在地图上展示再好不过。

贴一个Echarts:

Examples - Apache ECharts (incubating)





如果你目前只会用一门编程语言,

我其实建议多开几扇门。

最后贴一个趣闻(大概内容应该没记错):

我的导师在一堂 数据挖掘课 开始前讲到,
如果你不能在一顿早饭的功夫掌握一个新语言,
那你还是趁早出门左转,退掉我的课。
——bilibili uper “胖丁家的林亦”


以上是我个人常用且认为有特点,

可以利用好的数据挖掘工具。


当我看到一个工具优势特点非常明显,

那么他的缺点其实也很明显。


同时,

缺点很明显的工具,

也很有可能在某些领域具有独特的优势。


能不能用好,其实还是看用的人。

没有最好的工具,

只有会用工具的人。

有的时候,不是工具好让人完成一些事。
而是一些人用了这些工具完成了这些事。

数据挖掘资源:数据、电子书、资料等

我们整理了一个超级棒的资料包,请关注下面的微信

以上是关于有哪些好用的机器学习和数据挖掘工具?的主要内容,如果未能解决你的问题,请参考以下文章

好用的可视化数据建模工具

国内外都有哪些比较好用的bi数据分析工具

好用的数据可视化工具有哪些?

大数据分析工具都有哪些,好用的有吗

数据分析工具类软件,好用的都有哪些

Python模拟数据工具哪些比较好用