如何在机器学习中赋予文本作为特征和价值? [关闭]

Posted

技术标签:

【中文标题】如何在机器学习中赋予文本作为特征和价值? [关闭]【英文标题】:How to give text as feature and value in Machine learning? [closed] 【发布时间】:2018-04-25 01:26:45 【问题描述】:

目前,我正在研究基于文本的机器学习。我是 ML 新手。我从输入文本中提取了不同的特征,例如:Feature1、Feature2 等带有 value1、value2。 ML算法要学习的输出应该是一些文本,例如:Output1,Output2。我想知道哪个是可以使用的最好的 ml 算法以及训练数据格式是什么?

【问题讨论】:

【参考方案1】:

我建议您查看bag of words approach。

它基本上计算每个文档中唯一单词的频率,并将每个文档表示为一个向量,其中唯一单词是您的特征。

然后,您可以将其用作您决定使用的任何机器学习模型的输入。 一个好的机器学习模型可能是 k-means clustering 或 support vector machines,但“最佳”模型取决于您要解决的问题类型。

【讨论】:

以上是关于如何在机器学习中赋予文本作为特征和价值? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

如何在机器学习的训练集中结合文本和数字特征?

机器学习之路:python 文本特征提取 CountVectorizer, TfidfVectorizer

[视频] 数据超市对于文本数据挖掘的流程 机器学习如何搭建文本分类器

文本分类特征工程概述

NLP之文本分类

机器学习-2.特征工程和文本特征提取