正态回归和生存回归中的预测极限
Posted
技术标签:
【中文标题】正态回归和生存回归中的预测极限【英文标题】:Prediction limit in normal regression and survival regression 【发布时间】:2019-01-27 22:55:47 【问题描述】:我正在尝试预测燃气管道泄漏所需的持续时间。我使用了 15 个特征,其中最重要的一个是“管道安装年”。我拥有的最新泄漏数据是 2017 年发生的泄漏,该管道是 2009 年安装的2009 年之后安装。我之所以这么说是因为我首先根据他们的“安装年份”对数据进行排序,然后进行训练测试拆分以查看它在预测测试数据集方面的作用,我得到了 %93 R 平方但是当我转身在训练测试拆分中关闭 shuffle 功能(这意味着与正常的训练测试拆分不同,子集是随机选择的,数据将按照第一个 %80 训练和最后一个 %20 测试的顺序),看看它是否可以预测他们“安装年份”的管道不在模型训练中,我只得到了 %30 R 的平方。我知道“安装年份”是一个非常重要的特征,ML 模型无法预测其“安装年份”未在模型中训练的管道。
我也在正常的 ML 模型之上使用生存回归。我不确定在 COX PH 模型和其他多变量生存模型中是否也会遇到同样的问题。 COX PH 能否预测 2009 年以后安装的管道的危险比和生存函数?
【问题讨论】:
我建议目视检查持续时间的散点图与 15 个特征中的每一个特征,以确定数据建议的任何明显的数据转换,例如 exp、log 等。这既简单又快速,如果您看到一些明显的东西,它将有助于建模。 目前听起来不像是一个编码问题。也没有初始编码工作的数据或演示。 【参考方案1】:coxph
能否预测 2009 年之后安装的管道的危险比和生存函数?
coxph
应该能够计算给定时期的风险比和生存函数(这是它应该做的)。您可以运行它并绘制一个KM
以查看它是否有意义并且您可以利用结果。
【讨论】:
以上是关于正态回归和生存回归中的预测极限的主要内容,如果未能解决你的问题,请参考以下文章
ELM回归预测基于matlab探路者优化极限学习机回归预测含Matlab源码 2231期
DELM回归预测基于matlab多元宇宙优化算法改进深度学习极限学习机数据回归预测含Matlab源码 2230期
回归预测基于matlab粒子群算法优化混合核极限学习机KELM回归预测含Matlab源码 JQ002期
回归预测基于matlab离群鲁棒极限学习机(ORELM)求解回归预测问题含Matlab源码 1441期
DELM回归预测基于matlab灰狼算法改进深度学习极限学习机GWO-DELM数据回归预测含Matlab源码 1867期
DELM回归预测基于matlab灰狼算法改进深度学习极限学习机GWO-DELM数据回归预测含Matlab源码 1867期