Genbank格式转换为GFF3格式

在处理数据的过程中,遇到最多的恐怕就是Genbank格式转换为GFF3格式,推荐使用脚本genbank2gff3.pl,官方脚本,速度快,使用灵活,转换的格式较为标准,注意要更新到最新的版本,先前的版本ID标志符使用基因的名称,这样会产生一个比较严重的问题,GBrowse对于有重复的基因显示错误,全部当做同一个基因。用法:

genbank2gff3.pl [options] filename(s)
   Options:
        --dir     -d  path to a list of genbank flatfiles GB格式文件所在的目录
        --outdir  -o  location to write GFF files 转换的GFF3文件保存的目录
        --zip     -z  compress GFF3 output files with gzip 转换的GFF3数据进行压缩
        --summary -s  print a summary of the features in each contig
        --filter  -x  genbank feature type(s) to ignore 过滤掉某些类型的feature
        --split   -y  split output to seperate GFF and fasta files for 
                      each genbank record  Genbank中每条记录单独
        --nolump  -n  seperate file for each reference sequence
                      (default is to lump all records together into one
                       output file for each input file)
        --ethresh -e  error threshold for unflattener
                      set this high (>2) to ignore all unflattener errors
        --help    -h  display this message

继续阅读