python处理fasta文件，ID和序列放在一行

Posted 2020-10-17 爬行的乌龟

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了python处理fasta文件，ID和序列放在一行相关的知识，希望对你有一定的参考价值。

#!/usr/bin/python
#-*- coding:utf-8 -*-
"处理fasta文件，将ID号和序列放在一行"
import sys
with open(sys.argv[1]) as f:
    fw=open(‘out.fasta‘, ‘w‘)
    line=f.read()
    line=line.replace(‘\n‘, ‘‘).replace(‘>‘, ‘\n>‘)
    for aa in line:
        fw.write(aa)
    fw.close()
"""
>chr1|hos107.1#gene1
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.4#gene3
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.5#gene4
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
"""
"""
>chr1|hos107.1#gene1ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.4#gene3ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.5#gene4ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
"""

#提取目标序列
f=open(‘./out.fasta‘, ‘r‘)
fw=open(‘target.fasta‘, ‘w‘) 
for line in f.readlines():
    if line.startswith(‘>chr1|hos107.1‘):
        fw.write(line)
f.close()
fw.close()


"""可以从上述处理好的单行文件out.fasta中提取指定目标ID的文件，并将其
写入到target.fasta文件中"""

#整体思路：
#先统一fasta文件格式从test.fasta----out.fasta
#取出目标ID序列：out.fasta----target.fasta

以上是关于python处理fasta文件，ID和序列放在一行的主要内容，如果未能解决你的问题，请参考以下文章

perl处理fasta文件

如何在 fasta 文件中并行化计算，其中每个处理器采用一个序列

samtools faidx 命令处理fasta序列

生物信息学算法之Python实现|Rosalind刷题笔记：005 GC含量计算

python学习——通过命令行参数根据fasta文件中染色体id提取染色体序列

WSL 一行命令快速合并文件 Fasta Fas合并