最优分类算法

Posted

技术标签:

【中文标题】最优分类算法【英文标题】:optimal classification algorithm 【发布时间】:2011-05-19 17:15:36 【问题描述】:

我想知道,从下面的分类算法中,哪种分类算法是最优的(在内存和处理能力方面),哪种分类算法被广泛使用?

k-最近邻(KNN)算法 朴素贝叶斯(NB)算法 基于概念向量的 (CB) 算法 基于奇异值分解的算法 分层算法 组合算法 支持向量机

我正在寻找一种对网络流量进行分类的最佳算法。

谢谢!

-sathish

【问题讨论】:

在不知道问题域的情况下没有“最佳”解决方案(您试图在网络流量中分类什么?) 【参考方案1】:

IMO,SVM 是最好的,目前在许多应用中使用。

【讨论】:

它被广泛使用,但并不是解决所有问题的最佳选择。之前应该考虑问题域。 @max taldykin,OP 要求网络流量,它可以在那里使用,KNN 等其他方法也是旧方法,我认为每种方法的自定义使其对给定问题有用,不完全是选择的方法,这不是问题的解决方案。【参考方案2】:

没有单一的最佳分类方法的陈述是没有免费午餐定理之一 - http://www.no-free-lunch.org/ 既然您提到了处理时间和内存要求,我注意到朴素贝叶斯非常便宜,并且在实践中已经足够好。

在http://www.cs.waikato.ac.nz/ml/weka/,您可以找到许多现成的方法和一个框架,让您可以尝试并比较它们。

通常情况下,您选择哪些特征用于分类方法比您选择的方法更重要。

【讨论】:

以上是关于最优分类算法的主要内容,如果未能解决你的问题,请参考以下文章

优化方法基础系列-优化问题分类

机器学习算法--svm实战

04-08 梯度提升算法代码(鸢尾花分类)

数据挖掘十大算法之SVM支持向量机分类算法

优化分类基于matlab灰狼算法优化最小二乘支持向量机分类(多输入多分类)含Matlab源码 1558期

机器学习之决策树算法