如果我的权重向量本质上是二进制的,是不是需要在 SVM 中缩放数据?

Posted

技术标签:

【中文标题】如果我的权重向量本质上是二进制的,是不是需要在 SVM 中缩放数据?【英文标题】:Is there any need to scale data in SVM if my weight vector is binary in nature?如果我的权重向量本质上是二进制的,是否需要在 SVM 中缩放数据? 【发布时间】:2011-08-10 19:12:35 【问题描述】:

我的权重向量是 SVM 训练(使用 Libsvm)将只有特征编号,然后是 1 或 0,即表示是否存在。

它会像下面的 libsvm 格式。

1 1:0 2:1 3:0 4:1...9600:1
0 1:1 2:0 3:1 4:0...9600:0
....

因为所有测量都基于一个标准,无论是否存在?缩放会成为问题吗?

谢谢。

【问题讨论】:

【参考方案1】:

不,缩放应该不是问题,因为缩放基本上就是这样做的:将数据缩放回 0-1 范围。

【讨论】:

以上是关于如果我的权重向量本质上是二进制的,是不是需要在 SVM 中缩放数据?的主要内容,如果未能解决你的问题,请参考以下文章

哈希函数的本质及生成方式

奇怪的大于逻辑与字符向量中的数字

c++ 类向量中的段错误

如何使用 SVM 的权重向量和逻辑回归进行特征重要性?

如何获得逻辑回归中的权重向量?

attention的前世今生