第二课第一周第8节 风险得分计算+作业解析

Posted Tina姐

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第二课第一周第8节 风险得分计算+作业解析相关的知识,希望对你有一定的参考价值。

在本课中,我们将把前面示例中使用风险方程式得到的分数进行形式化地描述,我们还将研究交互项以及它们为何有用。

到目前为止,我们看到的预测模型是通过所有特征乘以与该特征相关的系数。

例如,年龄特征乘以年龄的系数,血压等其他特征也一样,然后将所有数值相加得到总分。这就是所谓的风险方程(risk equation)。

现在,风险方程在特征本身中不需要是线性的,它们在自然对数中可以是线性的,或者对数以 10 为底的特征,就像我们在 MELD 分数中看到的那样。最后,风险方程还可以包括交互项。就像我们在 ASCVD 风险示例中看到的那样我们可能有两个相互相乘的特征,并且然后进一步乘以相关的系数。

要理解交互项有什么作用,让我们先看看没有交互项的风险方程。假设我们有一个取决于年龄的自然对数和血压的自然对数。我们以年龄的自然对数为x轴为,血压的自然对数为y轴。

风险等级:黄色>绿色>蓝色。

如果没有交互项,如果我们被问及血压和分数之间的关系,我们会说血压或血压的对数增加,风险增加。我们可以通过简单地固定年龄来看到这一点,所以我们有固定年龄的黄线,并观察随着对数血压升高的风险如何变化,我们可以看到从蓝绿色到绿色再到浅绿色。所以风险越来越大。

现在让我们看看交互项会发生什么。现在这里是带有交互项的风险方程。请注意,我们现在有了一个新术语,它将 BP 的自然对数乘以年龄的自然对数,以及与该项相关的系数。

让我们固定年龄,看看血压变化时风险如何变化。在左边,我们首先将年龄的年龄对数固定为 3.8,我们看到随着血压的升高,风险也在增加。但是在右边,当我们固定年龄时,增加血压同样停留在黄色带中。

在没有交互项的情况下,血压和年龄这两个变量的影响是独立的。无论多大年纪,血压对风险的影响都是一样的。随着血压上升,风险也在上升。但是在交互项下,年龄较小时,血压的增加风险也增加的,但年老时血压对风险的影响较小。

既然您已经熟悉了预测模型风险方程和交互项如何改变变量和变量之间的关系风险,让我们看看如何评估预后模型。

作业解析

学到这里,我们需要做一个作业,学会如何组合特征

作业文件名:C2_W1_lecture_ex_03.ipynb
作业地址:公zonghao 菜单栏查看相关内容

在本练习中,您将练习使用 pandas 数据结构组合特征。
此外,您将探索为什么将两个特征相乘而不是相加来创建交互项更有意义。

首先,您将生成一些要使用的数据。

先生成100个数据,每个数据有4个特征。

组合特征: 使用A特征+B特征

为什么特征要相乘不是相加?

这里例举了一个例子,从表中看,加法或乘法的区别可能不是很明显;使用
更有用的方式查看数据,将特征 1 是行索引,特征 2 是列名。然后将两个特征的总和设置为值。在热图中显示结果数据。

这里用到关键函数pivot

当v1+v2

如果我们固定V2,看值随v1的变化

可以看见,值并没有发生变化。

当v1*v2

使用乘法时,我们固定v2,值随v1的增大而增大。这更容易区分特征。

总结:当您发现两个特征之间的交互时,您理想地希望看到一个特征的变化如何对交互项产生影响。这最好通过将两个特征相乘而不是相加来实现。

另一种思考方式是,您希望将特征空间分成“网格”,您可以通过将特征相乘来做到这一点。

文章持续更新,可以关注微信公众号【医学图像人工智能实战营】获取最新动态,一个关注于医学图像处理领域前沿科技的公众号。坚持已实践为主,手把手带你做项目,打比赛,写论文。凡原创文章皆提供理论讲解,实验代码,实验数据。只有实践才能成长的更快,关注我们,一起学习进步~

我是Tina, 我们下篇博客见~

白天工作晚上写文,呕心沥血

觉得写的不错的话最后,求点赞,评论,收藏。或者一键三连

以上是关于第二课第一周第8节 风险得分计算+作业解析的主要内容,如果未能解决你的问题,请参考以下文章

第二课第一周第8节 风险得分计算+作业解析

第二课第一周大作业--构建和评估一个线性风险模型

第二课第一周大作业--构建和评估一个线性风险模型

第二课第一周大作业--构建和评估一个线性风险模型

第二课第一周第9-11节 评估预后模型+作业解析

第二课第一周第9-11节 评估预后模型+作业解析