2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案相关的知识,希望对你有一定的参考价值。
1、数据需要清洗
注意在读取csv格式文件之后需要对空值进行补全类似如下代码:
2、特征工程
此处选取以下几个指标作为分类和回归的特征
3、深度模型失效
通过日志发现 正样本即Y>0的样本所占比例在14%左右,深度分类模型可能将所有的数据分为Y=0导致没有数据进行回归
所以此处采用传统方法 使用SVM 方法和 决策树进行分类
进过测试发现SVM效果较好
4、正样本过少
考虑将回归模型改为广义线性回归 放弃深度模型
以上是关于2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案的主要内容,如果未能解决你的问题,请参考以下文章
自动驾驶将颠覆汽车保险业,保险公司和车企或合并?| K·Golbal