用于分类的多个不同大小的特征集
Posted
技术标签:
【中文标题】用于分类的多个不同大小的特征集【英文标题】:Multiple Feature Sets of different Size for Classification 【发布时间】:2020-09-09 12:16:18 【问题描述】:我有多个不同的功能集。这些特征存储在数据框中。问题是,它们的大小不同。 我的第一个特征集是一个 512 长的浮点向量。 第二个特征集是 12 个浮点数。 以此类推。
我想在所有这些功能集上使用不同的分类器。我认为我不能将所有特征都放在单个向量上,因为性能会因为维度的固化和小向量的缺失影响而中断。
于是我有了一个想法: 在每个特征集上训练多个分类器,将这些结果用作最终分类器的新特征集。
有没有标准的方法来处理这些问题?
【问题讨论】:
【参考方案1】:如果你的所有特征集都描述了相同的输出,那么根据所有特征进行实际预测是最有意义的。我会接受你的第一个建议:
将所有特征合并到一个向量中,虽然一个向量很长,但对于像 SVM 这样的分类器来说应该不是问题 - 它旨在与 许多 特征一起正常工作。你的另一个想法:
为每个特征集训练一个单独的分类器听起来像是增加了额外的复杂性。首先,您还有一个抽象需要担心。其次,如果数据量有限的小特征集(例如与单个 SVM 相比),小型/初始分类器可能不会那么好。tl;dr:我会合并所有特征(当然,如果不同的集合描述相同的观察/变量)并将它们与 SVM 一起使用。
【讨论】:
是的,我忘了说,数据集是这样设计的,set1 中的特征 i 与 set2 中的特征 i 具有相同的类 .... 所以我会尝试一下!谢谢!以上是关于用于分类的多个不同大小的特征集的主要内容,如果未能解决你的问题,请参考以下文章