数据集切割

Posted liyuewdsgame

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据集切割相关的知识,希望对你有一定的参考价值。

一、数据集切割

  我们通常将数据及切割成两部分:训练数据集(Training Dataset);测试数据集(Testing Dataset).

  注意:可采用分层抽样的方式进行,以保持数据在目标字段上分布的一致性。

技术图片

 

 

 

  1.数据分割

• 80%训练数据→在训练数据上可以做任何的分析
• 20%测试数据→在测试数据上不可做任何的分析

2. 10-fold cross -validation

  将数据集分成10份,做十次训练和测试,每次那一块作为测试集,剩下9份作为训练集。

  技术图片

 

以上是关于数据集切割的主要内容,如果未能解决你的问题,请参考以下文章

Tensorflow2.0语法 - dataset数据封装+训测验切割

05模型建立与评价

对diamonds.csv数据集的数据探索性分析及其实现(EDA)

sklearn交叉验证-老鱼学sklearn

在不使用 API 的情况下,是不是有任何可接受的方式来切割/重组 Django 查询集?

OCR技术系列之三大批量生成文字训练集