如何使用 tensorflow 或 keras 重新训练具有新子集的线性回归模型?

Posted

技术标签:

【中文标题】如何使用 tensorflow 或 keras 重新训练具有新子集的线性回归模型?【英文标题】:How to do retrain a linear regression model with a new subset using tensorflow or keras? 【发布时间】:2021-03-24 21:14:59 【问题描述】:

我有 100 Gb 的数据并将其分成小的子集。我想使用新的子集以增量方式训练模型,直到所有算法都在所有子集上训练。我如何才能实现这个 TensorFlow 或 sklearn?

【问题讨论】:

【参考方案1】:

一些scikit-learn 模型确实支持通过partial_fit 方法进行增量学习。一种流行的选择是随机梯度下降法,它可以最小化一次查看一个数据样本的损失函数。这是一个示例,假设您有两个可以连续加载到内存的数据块,(X1, y1), (X2, y2)

from sklearn.linear_model import SGDRegressor
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
sgd = SGDRegressor(random_state=42)

X1_scaled = scaler.partial_fit(X1).transform(X1)
sgd.partial_fit(X1_scaled, y1)

X2_scaled = scaler.partial_fit(X2).transform(X2)
sgd.partial_fit(X2_scaled, y2)

【讨论】:

以上是关于如何使用 tensorflow 或 keras 重新训练具有新子集的线性回归模型?的主要内容,如果未能解决你的问题,请参考以下文章

如何在 TensorFlow、Keras 或 PyTorch 中部署 CoreML 模型?

如何将训练有素的 Tensorflow 模型转换为 Keras?

如何将 Keras .h5 导出到 tensorflow .pb?

如何在 Python 2.7.18 中安装 Keras 和 Tensorflow?

Tensorflow,Keras:如何创建仅在特定位置更新的可训练变量?

将 Keras 与 Tensorflow 2、Theano 或 CNTK 后端一起使用是不是存在语法差异?