GEO/TCGA 数据挖掘到底什么套路?
Posted 生物学霸
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了GEO/TCGA 数据挖掘到底什么套路?相关的知识,希望对你有一定的参考价值。
羡慕别人实验室可以做测序做芯片,样本多,数据多。
听说利用 GEO、TCGA 数据库就能挖掘大量数据,发自己的文章,虽然只有三分,但堪称性价比最高的套路!
第一步,自己要分析的疾病,然后下载数据,差异表达分析,筛选得到几个关键的分子(可以是lncRNA,mRNA,miRNA,circRNA)。
差异基因表达量聚类热图:
肿瘤样品与正常组织之间对比做差异表达分析,筛选出肿瘤细胞中表达显著差异的基因,之后根据表达量绘制表达热图
差异基因差异倍数与显著性的分布图,左边蓝色点代表下调基因,右边蓝色点代表上调基因
第二步,进行 GO 富集分析、Pathway 富集分析、GSEA 富集分析、PPI 分析、IPA 通路分析等,最后再做生存分析、ROC曲线分析等,就可以得到与疾病诊断相关的biomarker。
Cox回归分析与预后相关的biomarker,构建预后模型。
根据预后模型划分病人风险,检验预后模型的可靠性。
左图为模型ROC曲线结果,右图为生存分析结果
找到与肿瘤预后相关的关键基因,做蛋白互作网络分析结果
第三步,如果发高分的文章,可以再做一下小鼠模型,细胞模型,敲除,过表达等补充实验,对分子机理进行深入研究,干湿结合,文章就能再上一个档次。
另外,还有其他套路组合,例如做一下 WGCNA 或者联合 Oncomine 数据挖掘等等。
WGCNA分析:
所有基因共表达基因模块的划分(左边的层次聚类每一个分支代表一个基因,旁边对应的彩色条带表示不同模块),以及基因之间共表达相关性(热图)
为满足科研人员对系统了解 TCGA、GEO 数据产生,格式、组合、分析及挖掘的实战课程的需求,
丁香园和组学大讲堂共同举办 GEO/TCGA 数据挖掘案例实操线下培训班
,帮助基础医学或转化医学方向研究者学习如何利用 TCGA、GEO 数据库进行多组学数据分析与挖掘。
1.以发 SCI 文章为目的,真实体验 TCGA、GEO 数据分析挖掘全过程;
2.内容量适中,拒绝填鸭式兜售教学,让您有高质量学习体验;
4.线下培训+线上视频课程温习,解决学后易忘的难题;
5.线下培训结合QQ群及论坛答疑,即时解决后续学习、分析过程中遇到的问题;
黄莉莎,组学大讲堂技术总监,10年生物信息从业经验,长期从事生物数据分析与挖掘,包括转录组(mRNA,lncRNA,miRNA),人类单基因病/复杂疾病/癌症,表观甲基化等领域数据挖掘分析工作。
精通R语言、python语言,perl语言,linux系统等分析工具,具有丰富的科研及测序数据分析经验,学员人数20000+。
培训时间:
2019.12.6-12.8 (周五-周日)
培训费用:
3800元/人 (培训包含三日午餐,其余食宿费用自理)
另外,报名线下培训班赠送 9 门课程(总价值1796.9元)
《GEO不同平台芯片数据标准化》、《医学癌症TCGA-文章套路解析》、《医学癌症TCGA-基因差异表达分析》、《医学癌症TCGA-生存分析》、《GEO芯片数据挖掘》、《GSEA富集分析-表达量数据应用》等。
支持开票:
开票内容为会议服务费或培训费,开票请联系客服人员。
以上是关于GEO/TCGA 数据挖掘到底什么套路?的主要内容,如果未能解决你的问题,请参考以下文章
我们也要开班讲临床医生的数据挖掘了(R,GEO,TCGA)。
2018医学方VIP科研沙龙火热开启!实现R语言-数据挖掘-生信文章思路解析三连撞!
Oncomine 数据库
手把手教你Oncomine数据挖掘
科研数据挖掘实战专题研讨会(北京)
React虚拟DOM是个什么套路?