生物数据格式 - bed
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了生物数据格式 - bed相关的知识,希望对你有一定的参考价值。
参考技术A
BED格式文件有3个基本列和9个可选的附加列
基本列
第一列:chrom,染色体号;
第二列:chromStart,在染色体上的起始位置,从0开始计数;
第三列:ChromEnd,在染色体上的终止位置。bed文件为左闭右开区间,当片段碱基为0-99时,记为“ChromStart=0,ChromEnd=100”。
附加列
第四列:name,行名;
第五列:score,基因组浏览器中显示的灰度设定值,介于0-1000之间,越大越黑;
第六列:正负链标记,“+”、“-”、“.”(no strand);
第七列:thickStart,编码起始位置;
第八列:thickEnd,编码终止位置;
第九列:itemRgb-R,G,B,当 itemRgb 设置为“On”,行会显示颜色;
第十列:blockCount,外显子数量;
第十一列:BlockSizes,外显子大小列表,逗号分隔;
第十二列:blockStarts,外显子起始列表位置,逗号分隔,是与 chromStart 相对的一个位置。
增加两端长度
增加一端长度
链特异性影响
genomic features通常使用bed 或者gff文件表示,两者最基本的信息就是染色体或Contig的ID或编号、DNA的正负链信息以及在染色体上的起始和终止位置数值。两种文件的区别在于,BED文件中起始坐标为0,结束坐标至少是1,GFF中起始坐标是1而结束坐标至少是1。把BED转成对应的GFF格式(仅保留两者相同信息)
生物劝退文章汇总
应某位师妹的要求,整理了这份文集。我自己不是生物相关专业的,无法用自身实例说服别人,所以需要收集一些他人的文章,以示后人。
劝退一人胜发 7 篇 SCI。
以上是关于生物数据格式 - bed的主要内容,如果未能解决你的问题,请参考以下文章