python:计算fasta的GC含量

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python:计算fasta的GC含量相关的知识,希望对你有一定的参考价值。

参考技术A fasta文件、格式就不多说了

😀😀

GC depth: GC含量和测序深度

参考技术A

1 相关概念

GC depth分布图可以看出测序是否有明显的GC偏向。如果存在样品污染,通常能够从GC含量分析中呈现出来,出现独立的序列簇,类似Bin。

2 计算碱基depth

3 计算GC depth

samtools stats
地址: http://www.htslib.org/doc/samtools-stats.html

metabat2所带程序

4 GC depth

GC content可以自己写脚本计算: python:计算fasta的GC含量
利用GC depth数据可对组装序列可视化(bin着色)

数据

ggplot geom_point

来自参考

第二参考给的图如上,如果其中有独立序列簇,应该可以认为是存在生物污染。在meta Bin分析中一个微生物一般是相对独立的簇。

更多阅读:
测序数据的深度、覆盖度等计算
GCdepth散点图绘制

以上是关于python:计算fasta的GC含量的主要内容,如果未能解决你的问题,请参考以下文章

生物信息学算法之Python实现|Rosalind刷题笔记:005 GC含量计算

GC depth: GC含量和测序深度

python 计算任何给定fasta文件的GC内容

python文本处理---计算fasta文件中不同氨基酸的数目

如何在 fasta 文件中并行化计算,其中每个处理器采用一个序列

统计碱基数目GC含量read数最长的read最短的read及平均read长度