非常相似模式的二元分类任务
Posted
技术标签:
【中文标题】非常相似模式的二元分类任务【英文标题】:Binary Classification Task on Very Similar Patterns 【发布时间】:2017-09-25 05:32:15 【问题描述】:我正在尝试对一组彼此非常相似的句子进行二元分类任务。我的问题是我不确定如何处理样本之间如此相似的问题。以下是我的一些问题:
(1)。在这种情况下,哪种分类技术更适合?
(2)。在这种情况下,特征选择会有所帮助吗?
(3)。基于循环神经网络 (LSTM) 的序列分类算法能否成为一种潜在的方法?
很高兴看到有关此问题的任何提示或帮助,谢谢!
【问题讨论】:
我很惊讶!为什么要减分?这个问题有什么问题?也许我需要考虑聚类算法而不是分类算法? 我猜评分是因为这类问题不适合 SO,请参阅guidelines。我建议你试试Cross Validated 谢谢@ncfirth!我换了话题。 什么是'如此相似'?这个问题没有任何意义...... @Anony-Mousse 正如上面所解释的,“如此相似”是指代表数据集样本的句子。 【参考方案1】:(仅是 3 的潜在答案) 假设您只需要对它们是否属于某个类别进行分类,那么您不会想要使用 RNN,除非您真的希望它从中做出新的东西(序列到序列)
也就是说,如果你用序列展平器和全连接层结束它,就可以对其进行分类
【讨论】:
感谢您的回答。我的数据样本是句子(短句),类标签是 0 或 1。所以,实际上我将使用 RNN 来构建预测模型而不是生成模型。以上是关于非常相似模式的二元分类任务的主要内容,如果未能解决你的问题,请参考以下文章
如何使用 sklearn.metrics 计算多标签分类任务的微观/宏观度量?