尽管数据集不是很大，我的拟合模型太大而无法上传到github

Question

我正在使用线性回归创建一个模型，并且在要使用的模型之外创建文件后，文件的大小大于400mb。 Github仅允许100mb的文件，所以我无法提交和推送使用Heroku所需的文件。

我很困惑，因为我的训练集的形状是（3759，10）所以有10个特征和3759个观测值。

from sklearn.pipeline import make_pipeline
from sklearn.impute import SimpleImputer 
from sklearn.linear_model import LinearRegression
import category_encoders as ce

#Create pipelines for different regressors
linear_regression = make_pipeline(
  ce.OneHotEncoder(use_cat_names = True),
  SimpleImputer(),  
  LinearRegression()
)


#Fit Models!
linear_regression.fit(X_train,y_train)


#Create file out of model
from joblib import dump
dump(linear_regression, 'linear_regression.joblib')

从模型中创建文件后，将其传输到另一个文件夹以用于应用程序。任何建议将不胜感激

Answer 1

另一答案