二进制数据,但是过采样器声明它是多标签的

Posted

技术标签:

【中文标题】二进制数据,但是过采样器声明它是多标签的【英文标题】:Binary data however oversampler states it is multilabeled 【发布时间】:2022-01-21 18:47:33 【问题描述】:

我正在使用 Kaggle 的 Twitter 数据集,并试图对少数类进行过采样。

尽管 y 是二进制的,但过采样器会返回一个错误,指出它是多类的

我的 x 和 y 分别是推文和标签。

【问题讨论】:

请不要发布代码/错误的图片。有关更多提示,请参阅How do I ask a good question?。 【参考方案1】:

我想通了,我必须改用 reshape(-1,1) 或 (1,-1)

【讨论】:

以上是关于二进制数据,但是过采样器声明它是多标签的的主要内容,如果未能解决你的问题,请参考以下文章

过采样:Python 中二进制和分类数据的 SMOTE

如何在jmeter tcp采样器中发送多个十六进制数据有效负载?

如何在词嵌入层之前应用 SMOTE 技术(过采样)

Pandas TimeSeries 重新采样产生 NaN

过样本二进制[重复]

Xgboost 处理不平衡的分类数据