WEKA 中的有监督和无监督重采样有啥区别?
Posted
技术标签:
【中文标题】WEKA 中的有监督和无监督重采样有啥区别?【英文标题】:What is the difference between supervised and unsupervised reampling in WEKA?WEKA 中的有监督和无监督重采样有什么区别? 【发布时间】:2020-11-09 02:45:02 【问题描述】:我想知道weka.filters.supervised.instance.Resample
和weka.filters.unsupervised.instance.Resample
有什么区别?
在什么情况下我们应该使用每一个?
【问题讨论】:
【参考方案1】:监督和非监督重采样的文档是相同的除了 监督重采样的文档有额外的句子:
可以使过滤器保持子样本中的类分布, 或将类分布偏向均匀分布。
有监督的重采样也有额外的参数:
-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data
1 = uniform distribution.
(default 0)
因此,监督重采样仅适用于存在类变量的情况。当完全偏向输入分布(B=0)时,每个子样本都会复制整个数据集的类分布。 B=1 等效于无监督重采样,其中点从整个总体中统一抽取,不考虑类别。
【讨论】:
以上是关于WEKA 中的有监督和无监督重采样有啥区别?的主要内容,如果未能解决你的问题,请参考以下文章