R语言-均值合并多个探针对应一个基因

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了R语言-均值合并多个探针对应一个基因相关的知识,希望对你有一定的参考价值。

参考技术A 数据框:mRNA; 基因名列:Symbol(在该数据框最后一列);

results = t(sapply(split(mRNA,mRNA$Symbol),function(x) colMeans(x[,1:(ncol(x)-1)])))

请问用基因芯片得到很多差异基因的探针号和基因名称,怎样得到批量GO注释呢

专利名称基因探针信息注释方法
技术领域本发明涉及一种基因芯片技术平台的构建方法,尤其涉及一种基因芯片探针的信息注释方法。
背景技术 基因芯片的出现是近年来高新技术领域中极具时代特征的重大进展,是物理学、微电子学与分子生物学综合交叉形成的高新技术。基因芯片技术是一种高通量的技术,其基本原理是通过微加工工艺在厘米见方的芯片上集成有数以万计的DNA探针,来实现对MRNA和DNA序列进行高效快捷的定量检测,在基因功能的阐述、疾病原因及机理的探索、可能的诊断及治疗靶点的发现等应用领域,基因芯片正发挥着越来越大的用途。
由于基因芯片具有高通量和高信息量的特性,因此其探针注释系统是构建基因芯片技术平台的一个关键步骤。基因芯片注释系统主要功能是注释芯片上数以万计的基因探针、整合关于基因的序列、功能以及代谢通路的最新相关信息,以满足基因芯片检测结果自动化分析和基因芯片探针设计的需要。当前世界上著名的基因芯片注释系统有美国国立健康科学院Button等人发明的DAVID系统、美国约翰霍普金斯大学Wilkinson等人发明的DRAGON系统以及斯坦福大学发明Diehn等人发明的SOURCE系统。这些系统的基本原理都是利用数据仓库技术,通过将各个公共源数据库物理整合,建立基因芯片探针相关信息的“一站式”的记录。
参考技术A 使用blast2go

以上是关于R语言-均值合并多个探针对应一个基因的主要内容,如果未能解决你的问题,请参考以下文章

以基因名字合并两个数据集(R语言,merge函数)

R语言vtreat包自动处理dataframe的缺失值并生成对应的数据列_isbad来指示数据的原始缺失情况查看特定字段缺失的那些数据行查看数据集中多个字段的均值

R语言ggplot2可视化在箱图中为箱图添加均值的标签及对应数值实战

R语言实现对基因组SNV进行注释

R语言heatmap包绘制热力图/生物信息学/基因表达差异陈金文老师手把手教学

R语言合并两个或多个有序数dataframe实战(dataframe的纵向合并):使用R原生方法data.tabledplyr等方案