从监督学习数据集中删除列时出现奇怪的值
Posted
技术标签:
【中文标题】从监督学习数据集中删除列时出现奇怪的值【英文标题】:Strange values when dropping column from a supervised learning dataset 【发布时间】:2018-07-25 01:16:27 【问题描述】:我正在尝试预测自行车的可用性。最初,我将此问题定义为时间序列。为了预测自行车,我将我的集合转换为一个有监督的学习问题,然后将其提供给 NN。
在第一种方法中,我将监督问题定义如下
day_of_year(t-1) | time(t-1) | weekday(t-1) | weekday(t-1) | free_bikes(t-1) | free_bikes(t)
但是想了一会儿。将来,当我想预测未来的自行车时,而不是不久的将来,我想知道例如第二天或下周的可用性,所以我不想将所有时间步长提供给 nn。相反,我想出了这个:
day_of_year(t-1) | time(t-1) | weekday(t-1) | weekday(t-1) | free_bikes(t)
我已删除 free_bikes(t-1)
作为问题的输入。
在这之后预测值被搞砸了,预测值是荒谬的,我不完全明白为什么会这样。
链接:
Predicted values Output of the script Model【问题讨论】:
【参考方案1】:首先,如果你改变了输入维度,你需要重新训练模型。
您的模型的输入维度为 (batch_size,1,3)。所以它是一个时间步长,每个时间步长三个特征。这与您在问题中描述的输入尺寸不匹配。
请指定问题设置。
【讨论】:
以上是关于从监督学习数据集中删除列时出现奇怪的值的主要内容,如果未能解决你的问题,请参考以下文章