测序,又称基因测序,主要是指通过基因测序设备对脱氧核苷酸(DNA)进行其碱基排列顺序测定的技术。 具体而言,主要是测定包括腺嘌呤(A),胸腺嘧啶(T),胞嘧啶(C)和鸟嘌呤(G)四种碱基的排列顺序,从而解读所蕴藏的DNA遗传密码。虽然现也可对RNA进行测序,不过目前主流的RNA测序方法是先将RNA转换为cDNA,继而进行测序,故仍可归之于DNA测序。 Q2:什么是二代测序? 二代测序技术,能够一次并行对几十万到几百万条DNA片段进行序列测定,也称为高通量测序技术(High-throughput sequencing)或大规模平行测序(Massively parallel sequencing,MPS)。不同于之前的Sanger测序,它的速度更快,价格也更为便宜,是对传统测序的一次革命性改变,也由于其跨时代的意义,这类测序技术被称为第二代测序或下一代测序(next generation sequencing ,NGS)。由于NGS可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为深度测序。 原理:以lllumina平台的工作原理为例:从本质上而言,二代测序(NGS)和Sanger测序相同,都是在每一个测序周期中,利用计算机检测DNA聚合酶催化荧光标记的dNTP结合到DNA模板时产生的荧光信号。但与Sanger单位时间检测单片段不同的是,NGS能同时检测成千上万的孔道的信号,因此大大提高了效率。 工作流程: llumina工作过程可以分为以下四步: 1.文库准备:提取的DNA和cDNA通过物理或其他方法随机切割成相同大小的片段,并在5'和3'添加接头(adapter)。该接头主要用于提高PCR效率,在测序时提供barcode/index。 2.生成簇:通过桥式PCR,单片段序列被大量扩增成簇。 3.测序:每个片段基于SBS(边合成边测序)原理,由计算机读取read。 4.数据比对和分析。 单端测序(Single-read)是指首先将DNA样本进行片段化处理形成200-500bp的片段,引物序列连接到DNA片段的一端,然后末端加上接头,将片段固定在flow cell上生成DNA簇,上机测序单端读取序列。该方式建库简单,操作步骤少,可快速、经济地提供大量的高质量数据,对于小RNA-Seq或染色质免疫沉淀测序(ChIP-Seq)等,是很好的选择。 双端测序(Paired-end)是指在构建待测DNA文库时在两端的接头上都加上测序引物结合位点,在第一轮测序完成后,去除第一轮测序的模板链,用对读测序模块(Paired-End Module)引导互补链在原位置再生和扩增,以达到第二轮测序所用的模板量,进行第二轮互补链的合成测序。 双端测序较单端测序的优势主要有以下两点: 1、Illumina测序的片段长度较短,单端测序对于不同位置重复出现的序列片段识别出相同的信息,这导致将该序列比对至参考序列中时,出现一定的误差。而双端测序中,不同读段间的距离已知,即使对于重复出现的序列,双端测序也可推断出不同序列出现的位置,大大减少了序列比对的误差,故双端测序的序列信息往往可以得到较好的组装结果。
2、所有的reads只能按照一个方向进行读取时,会导致测序的质量随着读取长度的增加而下降。对于单端测序,其测序的质量会随着测序的进行而下降,所以reads越往后面越不准确,下游测序质量就会较差;而双端测序会从两个方向读取超过待测序列的一半,再根据两个序列重合部分进行拼接,读取序列的质量整体会优于单端测序的结果。 基础概念篇主要是这些,进阶篇将会继续介绍测序深度、测序覆盖度等概念 |