GEO/TCGA 数据挖掘到底什么套路?

Posted 生物学霸

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了GEO/TCGA 数据挖掘到底什么套路?相关的知识,希望对你有一定的参考价值。

羡慕别人实验室可以做测序做芯片,样本多,数据多。 听说利用 GEO、TCGA 数据库就能挖掘大量数据,发自己的文章,虽然只有三分,但堪称性价比最高的套路!


那么到底如何做 GEO、TCGA 数据挖掘呢?


第一步,自己要分析的疾病,然后下载数据,差异表达分析,筛选得到几个关键的分子(可以是lncRNA,mRNA,miRNA,circRNA)。


差异基因表达量聚类热图: 肿瘤样品与正常组织之间对比做差异表达分析,筛选出肿瘤细胞中表达显著差异的基因,之后根据表达量绘制表达热图
 
GEO/TCGA 数据挖掘到底什么套路?
差异基因差异倍数与显著性的分布图,左边蓝色点代表下调基因,右边蓝色点代表上调基因


第二步,进行 GO 富集分析、Pathway 富集分析、GSEA 富集分析、PPI 分析、IPA 通路分析等,最后再做生存分析、ROC曲线分析等,就可以得到与疾病诊断相关的biomarker。
 
GEO/TCGA 数据挖掘到底什么套路?
Cox回归分析与预后相关的biomarker,构建预后模型。 根据预后模型划分病人风险,检验预后模型的可靠性。 左图为模型ROC曲线结果,右图为生存分析结果
 
GEO/TCGA 数据挖掘到底什么套路?
找到与肿瘤预后相关的关键基因,做蛋白互作网络分析结果


第三步,如果发高分的文章,可以再做一下小鼠模型,细胞模型,敲除,过表达等补充实验,对分子机理进行深入研究,干湿结合,文章就能再上一个档次。
另外,还有其他套路组合,例如做一下 WGCNA 或者联合 Oncomine 数据挖掘等等。

GEO/TCGA 数据挖掘到底什么套路?
WGCNA分析: 所有基因共表达基因模块的划分(左边的层次聚类每一个分支代表一个基因,旁边对应的彩色条带表示不同模块),以及基因之间共表达相关性(热图)


为满足科研人员对系统了解 TCGA、GEO 数据产生,格式、组合、分析及挖掘的实战课程的需求, 丁香园和组学大讲堂共同举办 GEO/TCGA 数据挖掘案例实操线下培训班 ,帮助基础医学或转化医学方向研究者学习如何利用 TCGA、GEO 数据库进行多组学数据分析与挖掘。



本次培 训主题

1. R语言与绘图基础技能,零基础入门
2. TCGA、GEO数据库挖掘类文章思路解析
3. TCGA、GEO各组学数据下载与整理
4. TCGA、GEO数据库挖掘分析技能


课程安排如下

GEO/TCGA 数据挖掘到底什么套路?


适合人群

广大医生,医学生及相关科研人员


课程特色

1.以发 SCI 文章为目的,真实体验 TCGA、GEO 数据分析挖掘全过程;
2.内容量适中,拒绝填鸭式兜售教学,让您有高质量学习体验;
3.课程内容设置由浅入深,生信零基础也可入门;
4.线下培训+线上视频课程温习,解决学后易忘的难题;
5.线下培训结合QQ群及论坛答疑,即时解决后续学习、分析过程中遇到的问题;


主讲老师

黄莉莎,组学大讲堂技术总监,10年生物信息从业经验,长期从事生物数据分析与挖掘,包括转录组(mRNA,lncRNA,miRNA),人类单基因病/复杂疾病/癌症,表观甲基化等领域数据挖掘分析工作。 精通R语言、python语言,perl语言,linux系统等分析工具,具有丰富的科研及测序数据分析经验,学员人数20000+。


往期好评

GEO/TCGA 数据挖掘到底什么套路?
图片来源微信交流群


培训名称: GEO/TCGA 数据挖掘案例实操班
培训主办: 丁香园、组学大讲堂
培训时间: 2019.12.6-12.8 (周五-周日)
培训地点: 北京工美蓝孔雀商务酒店
培训费用: 3800元/人 (培训包含三日午餐,其余食宿费用自理)
优惠政策:
  • 老学员价 3600 元/人
  • 3 人及以上报名,只要 3500 元/人
  • 转发文章至朋友圈可以优惠 100 元

另外,报名线下培训班赠送 9 门课程(总价值1796.9元)


《GEO不同平台芯片数据标准化》、《医学癌症TCGA-文章套路解析》、《医学癌症TCGA-基因差异表达分析》、《医学癌症TCGA-生存分析》、《GEO芯片数据挖掘》、《GSEA富集分析-表达量数据应用》等。


报名方式


报名及咨询请联系客服人员
微信: Drugirl(药丸同学)
电话: 13033603379 陈老师
客服微信二维码

注意事项


本次培训按照报名顺序按照座位,建议及早报名。
支持开票: 开票内容为会议服务费或培训费,开票请联系客服人员。
提供盖公章的会议通知。
请学员自带电脑,课程内容包括上机实操。
实际授课过程中,老师会根据学员学习速度进行微调。

以上是关于GEO/TCGA 数据挖掘到底什么套路?的主要内容,如果未能解决你的问题,请参考以下文章

我们也要开班讲临床医生的数据挖掘了(R,GEO,TCGA)。

2018医学方VIP科研沙龙火热开启!实现R语言-数据挖掘-生信文章思路解析三连撞!

Oncomine 数据库

手把手教你Oncomine数据挖掘

科研数据挖掘实战专题研讨会(北京)

React虚拟DOM是个什么套路?