2019意犹未尽的基因组可视化IGV(一)

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2019意犹未尽的基因组可视化IGV(一)相关的知识,希望对你有一定的参考价值。

参考技术A

做项目最后一般会得到几个Excel表格,比如其中会有上下调基因,高表达低表达基因等,按照表格去找基因很麻烦并且不容易比较。因此,基因组浏览器是一个非常常用的功能,可以方便我们看看变异信息、可变剪切信息,上下游基因等等特性。目前开发了40多种浏览器,总体上有这么几个特点:针对高通量数据(尤其是为分析变异而测的数据)、对大的bam文件进行可视化、自己电脑上运行保证数据私密性

我们的主要目标是学习IGV,那么 它到底能干什么?

使用IGV的 基本步骤:

就像把大象塞进冰箱需要三步一样,使用IGV也很简单:启动=》选择合适的基因组(这里一定要选合适,因为即使一个物种基因组版本不同,基因的坐标也有区别)=》加载组学数据=》可视化探索(比如找SNVs、结构变异、基因融合等)

通过这个教程,基本可以做到:

IGV官网: http://software.broadinstitute.org/software/igv/download

比如上面输入 chr1:10,000-11,000 ,就将这1000bp的区间显示出来,还将序列显示为有颜色的长条,sequence顶部一行为碱基序列,其中A为绿色,C为蓝色,G是橙色,T是红色,这样利用颜色方便了识别重复序列;

另外它的下方几行是翻译的氨基酸序列,其中绿色表示蛋氨酸,红色为终止密码子,通过点击顶部那一行可以选择隐藏或显示氨基酸序列

然后看右上角的 + ,可以缩放,让我们看碱基看的更清楚,直到单碱基水平,它会先从基因开始显示,当放大到一定程度时,序列信息就展示出来(看来自官网的解释: https://software.broadinstitute.org/software/igv/sequence_track_options )

(只要之前添加了基因名的注释track),例如直接在长条框中输入 BRCA1

另外,定位到基因后,还可以看看两个相邻基因有什么区别:

比如可以看到:BRCA1和NBR2两个基因方向相反,BRCA1的第一个外显子在最右侧

横线表示内含子区域,竖条表示外显子区域,箭头表示基因转录的方向或者说转录的链。高的竖条表示外显子的CDS区域,矮的竖条是UTR。图中表示的是3’=》5‘方向,基因也是在负链,5’UTR在左侧,3‘UTR在右侧

(颜色不用管,都是自己可以设置的:右键track=》change track color)

(在biostar的解释: https://www.biostars.org/p/105248/ )

(关于基因结构: https://www.jianshu.com/p/705a93f9db36 )

结合IGV理解这句话:

有时想保存当前的搜索区域,有点像浏览器的书签功能,可以利用 Regions 的 Region Navigator 功能,当进行全局浏览时,可以边看边点击 add 来添加

ruby Ruby&IGV

require 'nokogiri'

tracks = []

%w{H3k4me1 H3k4me3 H3k27ac}.each do |mark|
  url = "http://ftp.ebi.ac.uk/pub/databases/ensembl/encode/supplementary/integration_data_jan2011/byDataType/signal/jan2011/bigwig/wgEncodeBroadHistoneGm12878#{mark}StdAln_2Reps.norm5.rawsignal.bw"
  tracks << {path: url, color: "217,95,14", name: mark}
end

builder = Nokogiri::XML::Builder.new do |xml|
  xml.Global(:genome => "hg19", :version => "3") {
    xml.Resources {
      tracks.each do |t|
        xml.Resource(:path => t[:path])
      end
    }
    xml.Panel {
      tracks.each do |t|
        xml.Track(:id => t[:path], :name => t[:name],
                  :color => t[:color])
      end
    }
  }
end

puts builder.to_xml

以上是关于2019意犹未尽的基因组可视化IGV(一)的主要内容,如果未能解决你的问题,请参考以下文章

转录组入门:了解参考基因组及基因注释

用IGV查看reads的方向

R语言大会:宏基因组数据分析和可视化套路总结

IGV软件如何在linux系统使用

服务器端使用IGV

使用IGV简单绘制甲基化分布图