有哪些好用的机器学习和数据挖掘工具?
Posted 数据皮皮侠
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了有哪些好用的机器学习和数据挖掘工具?相关的知识,希望对你有一定的参考价值。
尝试写一些我工作中用到过的,
且个人感觉有特点,比较看好的工具吧。
我的分析工具可以分为三大类:
1.机器学习工具
2.数据集成/转换工具
3.前端可视化工具
机器学习工具:
PyTorch,Tensorflow,Weka,Keras
我个人用Keras比较多,
这里贴两个我经常看API文档链接:
主页 - Keras 中文文档
Keras:基于Python的深度学习库 - Keras中文文档
不过这些除了Weka以外都是代码库,
也就是写代码来操作的工具,
以下是个人推荐两个 码农锄具:
Sublime,PyCharm.
Sublime 比较追求写的体验,
PyCharm比较追求调用使用。
如果你曾是PyCharm等IDE的使用者,
我强推Sublime
熟悉后它能让你在写代码这个过程有好体验,
而且有时轻量级的脏数据处理,
也可以在这Sublime上面解决。
而且长期使用Sublime,
遇到面试也不会因为掉包而退化写码能力。
一举多得(纯个人想法)
数据集成/转换工具:
Informatica,Kettle.
虽然这kettle有些时候比较...
比较受限制比较乏力就是了...
但还是有特点的,方便传递给别人使用。
与打包好的可执行文件不同。
做ETL, Kettle 调通一次之后,
甩给别人去跑都可以,
出了问题用的人也很容易找到问题,
毕竟就那么几个模块。
而且Kettle集成了Hadoop生态服务的支持。
也是加分项。
前端可视化工具
数据转图像也是很重要的一步,可视化有时是在分析过程中需要比较直观查看数据的方式。同时也是关系到展示数据后能否执行做好沟通的关键命门。
可视化工具:
Echarts,pyecharts,Tableau
Tableau 个人用得比较少,
但还是很看好的一个工具。
具有出色的图表操作UI。
然后不太推荐pyecharts,
尽管它python党的福音
但我还是觉得Echarts更好些。
原因就是pyecharts大更了,
然后文档和目前的工具库有挺多对不上的坑。
详情见:Crow·Lu:[pyecharts]v1版本爬坑之旅
所以比较推荐Echarts,地图可视化也很实用。
让国内各省数据直观的在地图上展示再好不过。
贴一个Echarts:
Examples - Apache ECharts (incubating)
如果你目前只会用一门编程语言,
我其实建议多开几扇门。
最后贴一个趣闻(大概内容应该没记错):
我的导师在一堂 数据挖掘课 开始前讲到,
如果你不能在一顿早饭的功夫掌握一个新语言,
那你还是趁早出门左转,退掉我的课。
——bilibili uper “胖丁家的林亦”
以上是我个人常用且认为有特点,
可以利用好的数据挖掘工具。
当我看到一个工具优势特点非常明显,
那么他的缺点其实也很明显。
同时,
缺点很明显的工具,
也很有可能在某些领域具有独特的优势。
能不能用好,其实还是看用的人。
没有最好的工具,
只有会用工具的人。
有的时候,不是工具好让人完成一些事。
而是一些人用了这些工具完成了这些事。
数据挖掘资源:数据、电子书、资料等
我们整理了一个超级棒的资料包,请关注下面的微信
以上是关于有哪些好用的机器学习和数据挖掘工具?的主要内容,如果未能解决你的问题,请参考以下文章