如何在机器学习中赋予文本作为特征和价值? [关闭]
Posted
技术标签:
【中文标题】如何在机器学习中赋予文本作为特征和价值? [关闭]【英文标题】:How to give text as feature and value in Machine learning? [closed] 【发布时间】:2018-04-25 01:26:45 【问题描述】:目前,我正在研究基于文本的机器学习。我是 ML 新手。我从输入文本中提取了不同的特征,例如:Feature1、Feature2 等带有 value1、value2。 ML算法要学习的输出应该是一些文本,例如:Output1,Output2。我想知道哪个是可以使用的最好的 ml 算法以及训练数据格式是什么?
【问题讨论】:
【参考方案1】:我建议您查看bag of words approach。
它基本上计算每个文档中唯一单词的频率,并将每个文档表示为一个向量,其中唯一单词是您的特征。
然后,您可以将其用作您决定使用的任何机器学习模型的输入。 一个好的机器学习模型可能是 k-means clustering 或 support vector machines,但“最佳”模型取决于您要解决的问题类型。
【讨论】:
以上是关于如何在机器学习中赋予文本作为特征和价值? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章
机器学习之路:python 文本特征提取 CountVectorizer, TfidfVectorizer