预测销售数量是回归问题还是分类问题? [关闭]
Posted
技术标签:
【中文标题】预测销售数量是回归问题还是分类问题? [关闭]【英文标题】:Is predicting number of sales a Regression or Classification problem? [closed] 【发布时间】:2018-06-11 08:20:25 【问题描述】:我是一名机器学习初学者,目前正在 Coursera 上学习 Andrew Ng 的机器学习课程。在讲座中,他问了一个简单的问题:您将以下问题称为分类问题还是回归问题?
您有大量相同物品的库存。你想预测有多少 其中的商品将在未来 3 个月内售出
我选择分类是因为我认为我们只是预测会卖 (1) 或不会卖 (0)。但他说这是一个回归问题,因为有数千个相同的项目,而且它是一个连续的输出。我不明白它是如何连续输出的。在我看来,它就像一个具有数千个值的离散输出。谁能给我解释一下?
【问题讨论】:
请注意,问题是您想预测有多少这些商品将在未来 3 个月内售出。那只是预测总数。因此它是回归。它不会对每个库存项目进行单独 (1/0) 预测。 【参考方案1】:我不明白它是如何连续输出的。在我看来,它就像一个具有数千个值的离散输出。
嗯,这里的连续输出没有正式的数学意义;严格来说,您的输出(某个整数值)是离散的是正确的,但这不是本文的重点。
使其成为回归问题而非分类问题的关键区别在于,在分类中,输出仅限于某些(通常少数)预定义值/水平;很容易看出,这里的情况并非如此,因为售出的数量原则上可以是任何(整数)值,并且将值 18 和 19 视为不同的 类完全没有意义.
尝试将分类输出视为类别可能也很有用,一般而言,它们之间可能没有序数关系;从这个角度来看,18和19的区别可以认为与18和856的区别是一样的(它们只是不同的类别);直观地说,很明显,由于我们对销售的确切数量感兴趣,因此这些差异在它们之间是非常不同的,我们更愿意将“18”错误预测为“19”而不是作为“856”...
【讨论】:
谢谢!我现在明白了。以上是关于预测销售数量是回归问题还是分类问题? [关闭]的主要内容,如果未能解决你的问题,请参考以下文章