R中的svm,训练数据集[关闭]
Posted
技术标签:
【中文标题】R中的svm,训练数据集[关闭]【英文标题】:svm in R, train data set [closed] 【发布时间】:2013-12-16 12:00:39 【问题描述】:更一般的问题,但由于我使用的是 R -> 标签
我的训练数据集有 15,000 个条目,其中大约 20 个我想用于正数据集 -> 构建 svm。我想将剩余的重采样数据集用作我的负数据集,但我想知道,与负数据集采用相同大小(大约 20)可能会更好,否则它是高度 imbalanced?在 1000 轮重采样后,是否有一种简单的方法来池化 R 中的分类器(基于集合)? (甚至使用e1071
包)
后续问题:我想在之后为每个预测计算一个分数,是否可以将概率乘以 100?
谢谢
【问题讨论】:
它有点笼统,但措辞也模棱两可。条目=功能?或样品?我猜是20个样本?我建议你查看caret
包的网页,它对此类问题有非常清楚的解释:caret.r-forge.r-project.org/index.html
感谢 stephen,features = 5,20 个样本,scusi!
【参考方案1】:
您可以尝试“类权重”方法,在这种方法中,较小的类获得更多的权重,从而花费更多的代价来错误分类正标记类。
【讨论】:
以上是关于R中的svm,训练数据集[关闭]的主要内容,如果未能解决你的问题,请参考以下文章