learning_curve没有绘制超过200万条记录

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了learning_curve没有绘制超过200万条记录相关的知识,希望对你有一定的参考价值。

我正在尝试绘制300万训练数据的sklearn learning_curve,其中LGBMClassifier是估算器。但是当我绘制时,learning_Curve只显示了200万条记录。

请在下面找到我的代码:

train_sizes, train_scores, validation_scores = learning_curve(
                                 estimator = lgb_estimator,
                                      X = train,
     y = target, train_sizes = np.linspace(0.1,1,5), cv = 3,
                scoring = 'roc_auc')

plt.style.use('seaborn')

plt.plot(train_sizes, train_scores_mean, label = 'Training error')
plt.plot(train_sizes, validation_scores_mean, label = 'Validation error')

plt.ylabel('MSE', fontsize = 14)
plt.xlabel('Training set size', fontsize = 14)
plt.title('Learning curves for a linear regression model', fontsize = 18, y = 1.03)
plt.legend()
plt.ylim(0.1,1)

请直到这是预期的行为,或者我们可以通过sklearn learning_curve绘制任意数量的记录。请告诉我将用任意数量的记录绘制学习曲线的代码

答案

你试过设置你的xlim吗?

plt.xlim(0,3000000)

以上是关于learning_curve没有绘制超过200万条记录的主要内容,如果未能解决你的问题,请参考以下文章

200万条记录的SqlDataAdapter.Update()速度极慢

超过 500 万条记录的 MongoDB 查询性能

如果在单个请求中与 Oracle 和 PostgreSql 交互以处理超过 20 万条记录,如何提高 EF Core 性能

Azure 排队服务总线超过百万条记录的功能没有到达终点

python learning_curve函数

sklearn.learning_curve