bioperl 自动化下载genbank 中的序列

Posted 2020-09-22 庐州月光

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了bioperl 自动化下载genbank 中的序列相关的知识，希望对你有一定的参考价值。

当我们想要从genbank 中下载序列的时候，总需要点击右上角的download 按钮，选择对应的格式，然后通过浏览器进行下载，这样反复的点击很费时间了

其实可以通过bioperl 自动化的完成下载；

代码如下：

#!/usr/bin/env perl
use Bio::SeqIO;
use Bio::DB::GenBank;


my ($acc, $out_dir) = @ARGV;

die "Usage:perl $0 <acc_number> <out_dir>\\n" if scalar @ARGV != 2;


system qq{mkdir -p $out_dir} if not -d $out_dir;

my $seq_obj = retriev_seq($acc);

download_seq($seq_obj, \'fasta\',   qq{>$out_dir/sequence.fasta});
download_seq($seq_obj, \'genbank\', qq{>$out_dir/sequence.gb});


sub retriev_seq
{
    my $acc = shift;
    my $db_obj  = Bio::DB::GenBank->new;
    my $seq_obj = $db_obj->get_Seq_by_acc($acc);

    return $seq_obj;
}

sub download_seq
{
    my $seq_obj = shift;
    my $fmt     = shift;
    my $out     = shift;

    my $seqio_obj = Bio::SeqIO->new(-file => $out, 
                                  -format => $fmt );

    $seqio_obj->write_seq($seq_obj);
}