非常相似模式的二元分类任务

Posted

技术标签:

【中文标题】非常相似模式的二元分类任务【英文标题】:Binary Classification Task on Very Similar Patterns 【发布时间】:2017-09-25 05:32:15 【问题描述】:

我正在尝试对一组彼此非常相似的句子进行二元分类任务。我的问题是我不确定如何处理样本之间如此相似的问题。以下是我的一些问题:

(1)。在这种情况下,哪种分类技术更适合?

(2)。在这种情况下,特征选择会有所帮助吗?

(3)。基于循环神经网络 (LSTM) 的序列分类算法能否成为一种潜在的方法?

很高兴看到有关此问题的任何提示或帮助,谢谢!

【问题讨论】:

我很惊讶!为什么要减分?这个问题有什么问题?也许我需要考虑聚类算法而不是分类算法? 我猜评分是因为这类问题不适合 SO,请参阅guidelines。我建议你试试Cross Validated 谢谢@ncfirth!我换了话题。 什么是'如此相似'?这个问题没有任何意义...... @Anony-Mousse 正如上面所解释的,“如此相似”是指代表数据集样本的句子。 【参考方案1】:

(仅是 3 的潜在答案) 假设您只需要对它们是否属于某个类别进行分类,那么您不会想要使用 RNN,除非您真的希望它从中做出新的东西(序列到序列)

也就是说,如果你用序列展平器和全连接层结束它,就可以对其进行分类

【讨论】:

感谢您的回答。我的数据样本是句子(短句),类标签是 0 或 1。所以,实际上我将使用 RNN 来构建预测模型而不是生成模型。

以上是关于非常相似模式的二元分类任务的主要内容,如果未能解决你的问题,请参考以下文章

二元分类网络中输出单元的数量和损失函数

如何使用 sklearn.metrics 计算多标签分类任务的微观/宏观度量?

FreeRTOS--二元信号量--任务与中断的同步

小白学习PyTorch教程十二迁移学习:微调VGG19实现图像分类

Spark DecisionTreeClassifier

LOSS 在非常简单的 KERAS 二元分类器中没有改变