如何在 scikit learn 中将特定课程与我的词袋配对
Posted
技术标签:
【中文标题】如何在 scikit learn 中将特定课程与我的词袋配对【英文标题】:How to pair a particular class to my bag of words in sci-kit learn 【发布时间】:2018-09-15 23:12:40 【问题描述】:我有多个 tf*idf 向量,我想将它们与一个关联类与我的训练数据配对,以便在 sci-kit learn 中与 SVM 一起使用。有没有一种 sci-kit 方法可以将一个类与一个词向量配对以在我的训练阶段使用?
【问题讨论】:
【参考方案1】:您尝试做的正是您在使用机器学习时不想要做的。如果您将手动将一组特征与输出类相关联,那么您所做的与过去的统计方法没有什么不同。机器学习的重点是将特征集与输出类的关联自动化。我们让机器确定输入中的哪些模式应该与某些类相关联。
您应该构建数据集,以相同的方式对所有实例进行矢量化。然后,您将该矩阵提供给您的 SVM 模型,SVM 将确定放置边界的位置,以便您的类在由您的特征定义的超空间中区分。
【讨论】:
对不起,我没有说清楚,我只是想给我的训练数据贴标签,想知道是否有一种简单的 sci-kit 学习格式。以上是关于如何在 scikit learn 中将特定课程与我的词袋配对的主要内容,如果未能解决你的问题,请参考以下文章
使用 scikit learn DictVectorizer 对特定列进行矢量化时出现问题?
在 Scikit-learn 中将训练标签拟合到 2D 列表中
在 scikit-learn 中将数据加载到 SVC 模型时尝试避免 .toarray()
在 scikit-learn 中将 RandomizedSearchCV(或 GridSearcCV)与 LeaveOneGroupOut 交叉验证相结合