新类别的增量添加
Posted
技术标签:
【中文标题】新类别的增量添加【英文标题】:Incremental Adding of New Categories 【发布时间】:2015-02-06 13:07:35 【问题描述】:我想知道是否有任何算法可以将新类增量添加到现有分类器系统中。例如如果我已经训练了一个有 50 个类别的系统,并且我想在系统中添加另外 10 个类别,我应该研究什么方法?有广泛的算法允许使用来自现有类别的额外训练样本增量更新系统,但我不知道允许添加更多类别的方法。从理论上讲,我认为类似最近邻的算法可以应用于此任务,但是是否有其他算法适用于大规模任务(比如更新一个训练有 500 个类别和 50 个附加类别的系统?可能属于增量决策树的领域? 增量 SVM 等算法不能很好地适应大量类别。如果有任何论文/代码,我将不胜感激。
【问题讨论】:
你的意思是聚类,而不是分类,对吧? 【参考方案1】:如果我对您的问题的理解正确,那么您是在询问分裂聚类(您有一组给定的数据并希望用比以前更多的组重新聚类它们)。
我熟悉的大多数算法都需要从头开始重新构建集群。但是,您可能想查看 BIRCH 算法。由于它仅存储类的摘要(没有明确的数据引用),因此它 a)适用于 Big Data™,并且 b)它具有一种距离度量,可以告诉您接下来应该拆分哪个类别(以防您想要动态生成另外 50 个“最独特”的类别)。
【讨论】:
以上是关于新类别的增量添加的主要内容,如果未能解决你的问题,请参考以下文章