二代测序数据预处理与分析

Next generation sequencing (NGS)

主要的测序技术及其产生数据的差异

常使用的工具列表

  • 质量控制Quality Control:FastQC、Fastx-toolkit
  • 拼接Aligner:BWA,Bowtie, Tophat, SOAP2
  • Mapper:Tophat, Cufflinks
  • 基因定量 Gene Quantification: Cufflinks, Avadis NGS
  • 质量改进 Quality improvement: Genome Analysis Toolkit(GATK)
  • SNP: Unified Genotyper,Glfmultiple, SAMtools, Avadis NGS
  • CNV: CNVnator
  • Indel: Pindel, Dindel, Unified Genotyper, Avadis NGS
  • Mapping to a gene: Cufflinks, Rsamtools, Genomic Features

相关的数据格式

  • FASTQ:
  • SAM: A generic nucleotide alignment format
  • BAM: binary format
  • VCF

数据处理的流程

二代测序数据处理流程

RNAseq数据不容易分析的原因:

  • 差异大,0~几万
  • 基因多
  • 巨大的变异
  • 样本量小

鉴定SNP可供借鉴的经验

如果一个基因中SNP数目超过3个,10个碱基中SNP数目超过2个,这样的SNP就需要怀疑;

通过RNAseq、DNAseq鉴定SNP,有什么区别?

本质没有区别,但是RNAseq时,需要注意可变剪接造成的SNP。

新书推荐

 » 转载文章请注明,转载自:博耘生物 » 《二代测序数据预处理与分析》
 » 原文链接:http://boyun.sh.cn/bio/?p=1862

3 thoughts on “二代测序数据预处理与分析

    • RNA-SEQ方面还没有专门的书籍,而目前生物信息领域还真没分的这么细,所以专业书籍也都是针对整个领域的。而学习方法,主要还是看文献,由点及面,不断的深入。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

请启用Javascript,以完成验证!