什么是学习机器学习的好的第一个实现? [关闭]
Posted
技术标签:
【中文标题】什么是学习机器学习的好的第一个实现? [关闭]【英文标题】:What is a good first-implementation for learning machine learning? [closed] 【发布时间】:2011-03-11 18:09:00 【问题描述】:我发现学习新主题最好通过简单的代码实现来获得想法。这就是我学习遗传算法和遗传编程的方式。有什么好的入门程序可以开始使用机器学习?
最好让任何引用的资源都可以在线访问,以便社区受益
【问题讨论】:
一般来说,学习遗传算法的第一个简单实现是什么? 参加 coursera.org 上的 ML 课程。 【参考方案1】:您将使用哪种语言进行开发?如果你很灵活,我推荐 Matlab、python 和 R 作为不错的选择。这些是用于开发和评估算法的一些更常用的语言。它们有助于快速算法开发和评估、数据操作和可视化。大多数流行的 ML 算法也可以作为库提供(带有源代码)。
我会首先关注 R2 中的基本分类和/或聚类练习。它更容易可视化,通常足以探索 ML 中的问题,如风险、类别不平衡、嘈杂的标签、在线与离线训练等。从日常生活或您感兴趣的问题创建数据集。或使用经典,如 Iris 数据集,因此您可以将您的进度与已发表的文献进行比较。您可以在以下位置找到 Iris 数据集:
http://en.wikipedia.org/wiki/Iris_flower_data_set 或 http://archive.ics.uci.edu/ml/datasets/Iris它的一个很好的特性是它有一个类,“setosa”,它很容易与其他类线性分离。
一旦您选择了几个有趣的数据集,就可以开始实施一些标准分类器并检查它们的性能。这是要学习的分类器的简短列表:
k-最近邻 线性判别分析 决策树(例如 C4.5) 支持向量机(例如,通过 LibSVM) 提升(带树桩) 朴素贝叶斯分类器使用 Iris 数据集和我提到的其中一种语言,您可以轻松地使用任何分类器快速进行小型研究(几分钟到几小时,具体取决于您的速度)。
编辑:您可以谷歌“虹膜数据分类”找到很多例子。这是 Mathworks 使用 Iris 数据集的分类演示文档:
http://www.mathworks.com/products/statistics/demos.html?file=/products/demos/shipping/stats/classdemo.html
【讨论】:
【参考方案2】:我认为您可以编写一个“朴素贝叶斯”分类器来过滤垃圾邮件。 你可以从这本书中得到很多信息。
http://nlp.stanford.edu/IR-book/information-retrieval-book.html
【讨论】:
这是另一本很棒的免费书籍 - 统计学习的要素 - www-stat.stanford.edu/~hastie/Papers/ESLII.pdf EoSL 在我看来有些困难。不适合初读,适合研究生水平。 是的,我也同意 Imsasu。但是《An Introduction to Information Retrieval》这本书并不难读。【参考方案3】:决策树。它经常用于分类任务并且有很多变体。 Tom Mitchell 的书是实现它的一个很好的参考。
【讨论】:
【参考方案4】:神经网络可能是最容易首先实现的东西,而且它们在整个文献中都得到了相当全面的介绍。
【讨论】:
这将是一个很好的资源:@987654321@【参考方案5】:有一种东西叫做书;你熟悉这些吗?二十年前我在探索人工智能的时候,有很多书。我想现在互联网已经存在,书籍很古老,但您可能可以在古老的图书馆中找到一些。
【讨论】:
很抱歉人们认为书不好,但是书里有丰富的资源。书籍会比这里的其他答案更有帮助。 我想您无法阅读引用好书的其他答案...以上是关于什么是学习机器学习的好的第一个实现? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章