数据集切割
Posted liyuewdsgame
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了数据集切割相关的知识,希望对你有一定的参考价值。
一、数据集切割
我们通常将数据及切割成两部分:训练数据集(Training Dataset);测试数据集(Testing Dataset).
注意:可采用分层抽样的方式进行,以保持数据在目标字段上分布的一致性。
1.数据分割
• 80%训练数据→在训练数据上可以做任何的分析
• 20%测试数据→在测试数据上不可做任何的分析
2. 10-fold cross -validation
将数据集分成10份,做十次训练和测试,每次那一块作为测试集,剩下9份作为训练集。
以上是关于数据集切割的主要内容,如果未能解决你的问题,请参考以下文章
Tensorflow2.0语法 - dataset数据封装+训测验切割
对diamonds.csv数据集的数据探索性分析及其实现(EDA)