bed文件格式解读
Posted djx571
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了bed文件格式解读相关的知识,希望对你有一定的参考价值。
1)BED文件
BED 文件(Browser Extensible Data)格式是ucsc 的genome browser的一个格式 ,提供了一种灵活的方式来定义的数据行,以用来描述注释信息。BED行有3个必须的列和9个额外可选的列。每行的数据格式要求一致(见下图)。 每条线的字段数目必须是任意单条数据的在注释上一致。
BED文件结构:
-------------------------------------------------------------必须有以下3列------------------------------------------------------------------------
chrom :即染色体号
chromStart :即feature在染色体上起始位置 。在染色体上最左端坐标是0
chromEnd :即feature在染色体上的终止位置。例如一个染色体前100个碱基定义为chromStart=0, chromEnd=100, 跨度为 0-99.
----------------------------------------------------------------可选9列-------------------------------------------------------------------------------
name :feature的名字 ,在基因组浏览器左边显示;
score :在基因组浏览器中显示的灰度设定,值介于0-1000;
strand :定义链的方向,‘‘+” 或者”-”
thickStart :起始位置(例如,基因起始编码位置)
thickEnd :终止位置(例如:基因终止编码位置)
itemRGB :是一个RGB值的形式, R, G, B (eg. 255, 0,0), 如果itemRgb设置为‘On”, 这个RBG值将决定数据的显示的颜色。
blockCount :BED行中的block数目,也就是外显子数目
blockSize:用逗号分割的外显子的大小, 这个item的数目对应于BlockCount的数目
blockStarts :用逗号分割的列表, 所有外显子的起始位置,数目也与blockCount数目对应
2)和gff之间的关系
4) 参考资源
https://en.wikipedia.org/wiki/BED_file_format
以上是关于bed文件格式解读的主要内容,如果未能解决你的问题,请参考以下文章