如果数据集的错误过多,大模型未必好用

Posted 猪洋洋

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如果数据集的错误过多,大模型未必好用相关的知识,希望对你有一定的参考价值。

在存在大量标注错误的现实世界数据集中,小容量模型可能比大容量模型更有用。举个例子,从基于原始给定标签的测试准确率来看,NasNet 似乎要优于 ResNet-18,但如果用标签修正之后的测试集进行测试,NasNet 的准确率其实比不上 ResNet-18。由于后者在现实中更为重要,在这种情况下,我们在现实中部署的也应该是 ResNet-18,而不是 NasNet。

以上是关于如果数据集的错误过多,大模型未必好用的主要内容,如果未能解决你的问题,请参考以下文章

使用带有大数据集的SciPy曲线拟合库的RuntimeError

个人对粗糙集的一些理解和简单举例

R中一个数据集的向量大小分配错误,但对于相同大小的不同数据集却没有

大数据分析领域模型有哪些

大数据分析领域模型有哪些

获取预测模型在测试集中预测错误的数据样本