R/Python 医学数据分析第三期:机器学习实战 - 一个代谢组学案例
Posted 和鲸社区
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R/Python 医学数据分析第三期:机器学习实战 - 一个代谢组学案例相关的知识,希望对你有一定的参考价值。
欢迎来到此次 R/Python 医学数据分析 workshop,本周我们即将进入整个学习的第三期。(对整个活动,或者往期内容感兴趣的,可以直接往后拉)
机器学习实战
一个代谢组学案例
· 内容简介 ·
一个肺癌案例,串起假设检验、回归分析与常见机器学习模型。
首先我们会对代谢组学进行基本介绍,侧重关注的科学问题、分析方法、数据结构;然后会引入一组肺癌患者与对照组尿样的开放数据并介绍数据特征;之后会应用最简单的假设检验来寻找差异表达代谢物并讲解多重比较问题;最后结合患者的信息构建预测肺癌的统计学习模型,并讲解从单一模型到模型组合的数据分析过程。最终目的是使大家意识到实际数据分析的复杂性,并掌握一些处理实际问题的方法。
· 内容大纲 ·
1. 代谢组学简介
组学与代谢组学
代谢组学在医学中的应用
代谢组学分析方法
代谢组学数据结构
2. 案例数据
案例背景介绍
数据可视化
主成分分析
3. 差异分析
t 检验
多重比较问题
4. 预测模型
随机森林模型及解释
模型组合方法
5. 作业
用另一组数据进行分析并给出报告。
· 参与方式 ·
扫描海报中二维码,或者点击“阅读原文”,至此次活动页面报名。再次强调一下,此次活动用爱发电,完全免费!
· workshop简介 ·
这是和鲸社区举办的线上培训,聚焦 R/Python 在医学数据分析场景中的实际应用,面向所有医学领域人士或者对医学数据分析感兴趣的朋友。活动全程免费,并全程提供免费的算力&在线开发工具 ModelWhale,同时支持 R/Python。
在接下来的 4 周时间内,你可以自学 4 份在线教案项目、完成作业、参加线上作业点评交流会直播,通过案例探究+实战,切实提高自己的医学数据分析水平。
· 活动亮点 ·
随到随学
workshop 分为四期,每期持续一周时间。难度合理,内容独立,随到随学。
教案不错
围绕实际应用场景的教案设计:因果分析、meta 分析、机器学习、风险模型预测。有数据有代码,有思路有方法。
项目实战
采取 案例探究+项目实战 机制,所有教案项目&作业均可在 ModelWhale 上完成阅读、代码调试、动手实践。
· 特邀导师 ·
年前,我们有幸邀请到医学领域 4 位资深科研/临床专业人士,作为导师,为大家精心准备各期教案(非常感谢 4 位导师!)。按照各期时间顺序,向大家介绍:
· 日程安排 ·
第零期:2021 年 2 月 16 日(已结束)
开营直播&第一期教案简介
第一期:2021 年 2 月 17 日起(已结束)
因果分析入门:肾结石手术 VS 超声波治疗
第二期:2021 年 2 月 24 日起(即将结束)
meta 分析大作战
第三期:2021 年 3 月 3 日起
机器学习实战:一个代谢组学案例
第四期:2021 年 3 月 10 日起
亲手搭建一个糖尿病及并发症风险预测模型
· 活动奖励 ·
每一期作业点评交流会上,当期导师将挑选 1-2 份优秀作业。他们将会获得:和鲸社区鲸币 20、虚拟蛇徽 1 枚(将展示在你社区个人主页)、纪念马克杯 1 个、价值 ¥ 50 京东电子购物卡 1 张。
· 往期内容 ·
第一期
因果分析入门 - 肾结石手术 VS 超声波治疗
1. 因果分析简介
用 intervention 来定义因果分析
相关性和因果性
因果分析区别去一般统计分析的地方
代码(R):手把手教你模拟因果性与相关性
2. 从几个悖论来看因果分析的意义
辛普森悖论
混杂因子偏差(Confounding Bias)
案例:肾结石手术与超声波疗法对比
3. 基于观察数据的因果分析与随机对照实验(RCT)的关系
为什么 RCT 是一个很有价值的工具
RCT 的优缺点
代码(R):生成模拟肾结石实验数据
4. Inverse Probability Weighting(IPTW)
模型简介
代码(R):肾结石数据分析
小心!IPTW 在分析观察数据的注意事项
5. 一个作业
谁是更好的击球手?
比较两种治疗方法的康复率
(Extra)Monty Hall 游戏
第二期
meta 分析大作战 - 心梗后服用阿司匹林能否降低死亡率
1. meta 分析简介
什么是 meta 分析
meta 分析的优点
标准流程:七步法
Meta 分析的目的及适用性
Meta 分析的局限性
2. 应用 R 语言做 meta 分析
meta 分析的类型
R 语言做 meta 分析的类型
R 语言做 meta 分析的使用场景
3. 经典案例:心梗后服用阿司匹林能否降低死亡率?
数据背景介绍
具体数据介绍
输入数据的格式化
meta 分析主程序
结果解释
森林图的绘制
改变效应量画图
漏斗图的绘制
减补法对发表偏倚进行校正
敏感性分析:评估你的结果稳健性
敏感性分析的实现
4. 探索异质性的来源:当研究间的结果不一致时
meta 回归探索异质性来源
研究人群的平均年龄是否是研究结果不一致的来源
meta 回归的结果解释
研究发表年份是否是研究结果不一致的来源
meta 回归的结果的图形展示
根据 meta 回归的结果,将 Age 分为 young 和 old 两组
亚组分析,meta 分析探讨异质性来源的主要法宝
亚组分析,调整参数
总结
5. 作业:请分析 Olkin95 溶解血栓剂治疗数据,并给出报告
※ “往期”指作业提交、导师点评已结束,但报名活动后仍可回看教案
以上是关于R/Python 医学数据分析第三期:机器学习实战 - 一个代谢组学案例的主要内容,如果未能解决你的问题,请参考以下文章