第七章:数据挖掘建模的优化和限度
Posted jp-mao
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第七章:数据挖掘建模的优化和限度相关的知识,希望对你有一定的参考价值。
7.1数据挖掘模型的优化要遵循有效、适度的原则
- 有效原则:模型的结论或者应用效果是否满足当初业务需求
- 适度原则:投入产出性价比
7.2如何有效地优化模型
7.2.1从业务思路上优化模型是最重要的模型优化措施
- 有没有更加明显且直观的规则、指标可以代替复杂的建模
- 有没有一些明显的业务逻辑(业务假设)在前期的建模阶段被疏忽
- 通过前期的初步建模和数据熟悉,是否有新的发现,甚至能颠覆之前的业务推测或者业务直觉
- 目标变量的定义是否稳定(在不同的时间点抽样验证)
7.2.2从建模的技术思路上优化
7.2.3从建模的技术技巧上优化
7.3如何思考优化的限度
7.4模型效果评价的主要指标体系(二元目标变量)
7.4.1评价模型准确度和精度的系列指标
- True Positive(TP):指模型预测为正(1)的,并且实际上也的确是正(1)的观察对象数量
- True Negative(TN):指模型预测为负(0)的,并且实际上也的确是正(0)的观察对象数量
- False Positive(FP):指模型预测为正(1)的,并且实际上是负(0)的观察对象数量
- False Negative(FN):指模型预测为负(0)的,并且实际上是正(1)的观察对象数量
以上是关于第七章:数据挖掘建模的优化和限度的主要内容,如果未能解决你的问题,请参考以下文章
数据预测基于matlab斑点鬣狗算法优化BP神经网络数据预测含Matlab 219期
《深入浅出Mysql》——第三篇 优化篇 第十七章 常用SQL技巧和常见问题 + 第十八章 SQL优化 + 第十九章 优化数据库对象