R中的svm，训练数据集[关闭]

Posted 2023-03-13

技术标签:

【中文标题】R中的svm，训练数据集[关闭]【英文标题】：svm in R, train data set [closed] 【发布时间】：2013-12-16 12:00:39 【问题描述】：

更一般的问题，但由于我使用的是 R -> 标签

我的训练数据集有 15,000 个条目，其中大约 20 个我想用于正数据集 -> 构建 svm。我想将剩余的重采样数据集用作我的负数据集，但我想知道，与负数据集采用相同大小（大约 20）可能会更好，否则它是高度 imbalanced？在 1000 轮重采样后，是否有一种简单的方法来池化 R 中的分类器（基于集合）？（甚至使用e1071 包）

后续问题：我想在之后为每个预测计算一个分数，是否可以将概率乘以 100？

谢谢

【问题讨论】：

它有点笼统，但措辞也模棱两可。条目=功能？或样品？我猜是20个样本？我建议你查看caret 包的网页，它对此类问题有非常清楚的解释：caret.r-forge.r-project.org/index.html 感谢 stephen，features = 5，20 个样本，scusi！ 【参考方案1】：

您可以尝试“类权重”方法，在这种方法中，较小的类获得更多的权重，从而花费更多的代价来错误分类正标记类。

【讨论】：

以上是关于R中的svm，训练数据集[关闭]的主要内容，如果未能解决你的问题，请参考以下文章

数据集必须包含 R 中 SVM 中的所有因素

MATLAB SVM：使用相同的数据集进行训练和测试会产生不同的结果