python处理fasta文件,ID和序列放在一行

Posted 爬行的乌龟

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python处理fasta文件,ID和序列放在一行相关的知识,希望对你有一定的参考价值。

#!/usr/bin/python
#-*- coding:utf-8 -*-
"处理fasta文件,将ID号和序列放在一行"
import sys
with open(sys.argv[1]) as f:
    fw=open(out.fasta, w)
    line=f.read()
    line=line.replace(\n, ‘‘).replace(>, \n>)
    for aa in line:
        fw.write(aa)
    fw.close()
"""
>chr1|hos107.1#gene1
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.4#gene3
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
>chr1|hos107.5#gene4
ACACTCCCGGGCCCCCCCCCCCC
ACCTTTCAAAAAAAAAAAAAAA
AATTTTC
"""
"""
>chr1|hos107.1#gene1ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTCCCCCCAAAGGGG
>chr1|hos107.2#gene2ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.4#gene3ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
>chr1|hos107.5#gene4ACACTCCCGGGCCCCCCCCCCCCACCTTTCAAAAAAAAAAAAAAAAATTTTC
"""

#提取目标序列
f=open(./out.fasta, r)
fw=open(target.fasta, w) 
for line in f.readlines():
    if line.startswith(>chr1|hos107.1):
        fw.write(line)
f.close()
fw.close()


"""可以从上述处理好的单行文件out.fasta中提取指定目标ID的文件,并将其
写入到target.fasta文件中"""

#整体思路:
#先统一fasta文件格式从test.fasta----out.fasta
#取出目标ID序列:out.fasta----target.fasta

 

以上是关于python处理fasta文件,ID和序列放在一行的主要内容,如果未能解决你的问题,请参考以下文章

perl处理fasta文件

如何在 fasta 文件中并行化计算,其中每个处理器采用一个序列

samtools faidx 命令处理fasta序列

生物信息学算法之Python实现|Rosalind刷题笔记:005 GC含量计算

python学习——通过命令行参数根据fasta文件中染色体id提取染色体序列

WSL 一行命令 快速合并文件 Fasta Fas合并