需要机器学习方法:在给定特征向量中的所有其他特征的情况下预测最可能的特征值

Posted

技术标签:

【中文标题】需要机器学习方法:在给定特征向量中的所有其他特征的情况下预测最可能的特征值【英文标题】:Machine Learning Approach needed: Predict most likely feature value given all other features in a feature vector 【发布时间】:2012-07-18 23:13:16 【问题描述】:

我需要一种合适的机器学习方法,它可以告诉我特征向量中某个特征的最可能值(考虑到该向量中其他特征的组合(以及从训练集中获得的知识))。我的特征向量可以包含数千个特征。然而,真正可能发生的特征组合只有极少数。我希望分类器学习这些似是而非的组合。

玩具示例:如果我的训练向量是 (0,1,2), (1,1,2), (2,2,2),那么分类器应该预测对于未知项目 (3,1,x ) x 的最可能值是“2”。

请注意,在给定向量中其他特征的 (n-1) 个值的情况下,分类器应该能够对向量中的每个特征进行此类预测。

我已经尝试过使用朴素贝叶斯分类器...但这仅告诉我给定特征向量最可能的类别...而不是传入特征向量中特定特征的可能值。

谁能建议一个合适的方法来为我做这件事?最好参考 Python 中合适的包?

感谢和亲切的问候 -

拍拍

【问题讨论】:

这个问题在stats.stackexchange.com会更好。 【参考方案1】:

查看Scikit-Learn 中的可用内容。您正在寻找的是其中包含“回归”一词的任何内容(与分类相对)。我会从线性回归作为你的基线开始,然后根据你能负担得起的计算尝试其他一些回归技术。

【讨论】:

对于迟到的反馈感到抱歉......这是一个很好的参考资料,有很多资料可供深入研究。太感谢了!这很有帮助。 支持向量机

以上是关于需要机器学习方法:在给定特征向量中的所有其他特征的情况下预测最可能的特征值的主要内容,如果未能解决你的问题,请参考以下文章

如何输出特征向量机器学习分类算法

机器学习朴素贝叶斯-01

C++ 中的最大特征值(和相应的特征向量)

使用SAP Cloud Platform Leonardo机器学习提取图片的特征向量

Python机器学习及实践 知识总结

文本分类之特征描述vsm和bow