python学习13之数据泄密
Posted fb1704011013
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python学习13之数据泄密相关的知识,希望对你有一定的参考价值。
在本教程中,您将了解什么是数据泄漏以及如何防止数据泄漏。如果你不知道如何防止它,泄漏将经常出现,它将破坏您的模型在微妙和危险的方式。因此,对于实践数据科学家来说,这是最重要的概念之一。
1、摘要
数据泄漏(或泄漏)发生在您的训练数据包含关于目标的信息时,但是当使用模型进行预测时,将无法获得类似的数据。
这将导致训练集上的高性能(甚至可能是验证数据),但是模型在生产中表现很差。
换句话说,泄漏导致模型看起来很精确,直到您开始使用模型做出决策,然后模型变得非常不准确。
泄漏主要有两种类型:
target leakage 和 train-test contamination.
2、
以上是关于python学习13之数据泄密的主要内容,如果未能解决你的问题,请参考以下文章