第七章:数据挖掘建模的优化和限度

Posted jp-mao

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第七章:数据挖掘建模的优化和限度相关的知识,希望对你有一定的参考价值。

 

7.1数据挖掘模型的优化要遵循有效、适度的原则

  • 有效原则:模型的结论或者应用效果是否满足当初业务需求
  • 适度原则:投入产出性价比

7.2如何有效地优化模型

7.2.1从业务思路上优化模型是最重要的模型优化措施

  • 有没有更加明显且直观的规则、指标可以代替复杂的建模
  • 有没有一些明显的业务逻辑(业务假设)在前期的建模阶段被疏忽
  • 通过前期的初步建模和数据熟悉,是否有新的发现,甚至能颠覆之前的业务推测或者业务直觉
  • 目标变量的定义是否稳定(在不同的时间点抽样验证)

7.2.2从建模的技术思路上优化

7.2.3从建模的技术技巧上优化

7.3如何思考优化的限度

7.4模型效果评价的主要指标体系(二元目标变量)

7.4.1评价模型准确度和精度的系列指标

  • True Positive(TP):指模型预测为正(1)的,并且实际上也的确是正(1)的观察对象数量
  • True Negative(TN):指模型预测为负(0)的,并且实际上也的确是正(0)的观察对象数量
  • False Positive(FP):指模型预测为正(1)的,并且实际上是负(0)的观察对象数量
  • False Negative(FN):指模型预测为负(0)的,并且实际上是正(1)的观察对象数量技术分享图片

    技术分享图片

    技术分享图片

    技术分享图片

     

以上是关于第七章:数据挖掘建模的优化和限度的主要内容,如果未能解决你的问题,请参考以下文章

数据预测基于matlab斑点鬣狗算法优化BP神经网络数据预测含Matlab 219期

数据库第七篇:数据库优化建表优化

第七章 缓存库存

《深入浅出Mysql》——第三篇 优化篇 第十七章 常用SQL技巧和常见问题 + 第十八章 SQL优化 + 第十九章 优化数据库对象

Linux性能优化 第七章 性能工具:网络

数学建模第七章 数理统计