从监督学习数据集中删除列时出现奇怪的值

Posted

技术标签:

【中文标题】从监督学习数据集中删除列时出现奇怪的值【英文标题】:Strange values when dropping column from a supervised learning dataset 【发布时间】:2018-07-25 01:16:27 【问题描述】:

我正在尝试预测自行车的可用性。最初,我将此问题定义为时间序列。为了预测自行车,我将我的集合转换为一个有监督的学习问题,然后将其提供给 NN。

在第一种方法中,我将监督问题定义如下

day_of_year(t-1) | time(t-1) | weekday(t-1) | weekday(t-1) | free_bikes(t-1) | free_bikes(t)

但是想了一会儿。将来,当我想预测未来的自行车时,而不是不久的将来,我想知道例如第二天或下周的可用性,所以我不想将所有时间步长提供给 nn。相反,我想出了这个:

day_of_year(t-1) | time(t-1) | weekday(t-1) | weekday(t-1) | free_bikes(t)

我已删除 free_bikes(t-1) 作为问题的输入。

在这之后预测值被搞砸了,预测值是荒谬的,我不完全明白为什么会这样。

链接:

Predicted values Output of the script Model

【问题讨论】:

【参考方案1】:

首先,如果你改变了输入维度,你需要重新训练模型。

您的模型的输入维度为 (batch_size,1,3)。所以它是一个时间步长,每个时间步长三个特征。这与您在问题中描述的输入尺寸不匹配。

请指定问题设置。

【讨论】:

以上是关于从监督学习数据集中删除列时出现奇怪的值的主要内容,如果未能解决你的问题,请参考以下文章

11.分类与监督学习,朴素贝叶斯分类算法

11.分类与监督学习,朴素贝叶斯分类算法

聊聊机器学习中的无监督学习

GAN实战:半监督生成对抗网络

深度学习之无监督训练

机器学习Introduction