R中的svm,训练数据集[关闭]

Posted

技术标签:

【中文标题】R中的svm,训练数据集[关闭]【英文标题】:svm in R, train data set [closed] 【发布时间】:2013-12-16 12:00:39 【问题描述】:

更一般的问题,但由于我使用的是 R -> 标签

我的训练数据集有 15,000 个条目,其中大约 20 个我想用于正数据集 -> 构建 svm。我想将剩余的重采样数据集用作我的负数据集,但我想知道,与负数据集采用相同大小(大约 20)可能会更好,否则它是高度 imbalanced?在 1000 轮重采样后,是否有一种简单的方法来池化 R 中的分类器(基于集合)? (甚至使用e1071 包)

后续问题:我想在之后为每个预测计算一个分数,是否可以将概率乘以 100?

谢谢

【问题讨论】:

它有点笼统,但措辞也模棱两可。条目=功能?或样品?我猜是20个样本?我建议你查看caret 包的网页,它对此类问题有非常清楚的解释:caret.r-forge.r-project.org/index.html 感谢 stephen,features = 5,20 个样本,scusi! 【参考方案1】:

您可以尝试“类权重”方法,在这种方法中,较小的类获得更多的权重,从而花费更多的代价来错误分类正标记类。

【讨论】:

以上是关于R中的svm,训练数据集[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

数据集必须包含 R 中 SVM 中的所有因素

r软件ManyNAs函数属于啥程序包

SVM 训练性能

R中关于SVM分类器的查询

第八篇:支持向量机 (SVM)

MATLAB SVM:使用相同的数据集进行训练和测试会产生不同的结果