决定使用哪种机器学习算法

Posted

技术标签:

【中文标题】决定使用哪种机器学习算法【英文标题】:Deciding which machine learning algorithm to use 【发布时间】:2017-03-19 02:18:45 【问题描述】:

我在测试中得到了这个问题。我不清楚正确答案是什么,因为这三个都是分类算法:

您有一项拼车服务,人们可以根据价格和时间在线选择他们的游乐设施。一名司机一次可以运送超过 1 人。您有最近 400 万次出行的信息(基本上是谁乘坐了哪趟车)。

目标是预测未来哪些游乐设施的乘客人数将超过“X”。

你不会使用哪种算法:

A) 逻辑回归 B) 朴素贝叶斯 C) 支持向量机 D) 这些都不是

有什么想法吗?我对这里的思考过程很感兴趣。

【问题讨论】:

如果没有额外的信息,看起来这些算法中的任何一个都可以在这里使用。 这就是你掌握的所有信息吗? 感谢您的意见。这是问题中提供的所有信息,但假设您是提供在线服务的公司,并且可以访问此类网站预期会产生的任何信息。这基本上意味着上车地点(城市)、下车地点(城市)和用户 ID(以及每个用户在网站上的历史记录)。还有一些信息,比如用户发送了多少条消息、个人资料图片、评分等...... 【参考方案1】:

这取决于,但就这些信息而言,答案是 D, 因为你面临回归问题(超过'X'),而A,B,C可以用于回归问题(虽然朴素的基础回归不是很流行)

【讨论】:

这可能是正确的答案。我一直认为这个问题是一个分类问题,您可以在其中创建两个类别。 “超过 X”或“等于和低于 X”,但我认为它可以重新表述为回归问题。我真的很好奇,在这种情况下,使用回归算法和分类算法有什么区别?

以上是关于决定使用哪种机器学习算法的主要内容,如果未能解决你的问题,请参考以下文章

机器学习系统设计

哪种机器学习算法更适合这种情况

如何选择 Microsoft Azure 机器学习的算法

机器学习算法 Android 拼写检查和自动更正

机器学习概念

机器学习算法备忘单!