本文来源:中华医学杂志, 2018,98(12) : 895-900. 基因检测在遗传性、感染性及肿瘤等疾病的辅助诊断、用药指导等方面起到举足轻重的作用。该领域检测方法众多,不同技术的优势及不足明显。例如:荧光定量PCR检测速度快,但是通量有限,无法方便快捷地满足临床对于多基因的数十个至数百个位点检测的需求,而高通量测序虽然通量极高,但其成本、耗时、人员需求等也不适用于此类检测。因此,亟需新的技术平台来填补该项空白。 20世纪80年代出现的基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)打破了以往质谱仅可进行小分子物质分析的传统,使得核酸、蛋白质等生物大分子也可应用质谱进行研究,极大推进了基因组学、蛋白质组学的发展,并且给生物领域及医学领域带来了革命性的突破,由此其奠基人田中耕一和约翰贝内特芬恩于2002年获得诺贝尔化学奖,美国食品药品监督管理局(FDA)于2014年批准MALDI-TOF MS可用于临床核酸检测。本共识将通过介绍MALDI-TOF MS的原理、基因检测原理及应用等方面内容,提高该平台在中国临床实验室中的认知程度。 MALDI-TOF MS原理 质谱技术的基本原理是通过样品离子化,产生不同质荷比的离子,然后再经过质量分析器测定该样品中不同种类离子的分子量,并按照从小到大的顺序依次排列从而得到一幅质量图谱。质谱仪器平台虽然种类众多,但可以通过样品进样方式、离子源、质量分析器等方面进行简易分类。其中,MALDI-TOF MS采用的是样品与基质混合进样,激光解吸方式电离以及飞行时间方法进行质量分析。目前仪器灵敏度达到500 fmol,采用标准样品牛血清白蛋白(BSA)进行测定,分辨率达到50以上。 1.基质: MALDI-TOF MS需要基质参与电离的过程,基质多为具有很强激光能量吸收能力的有机酸,其主要作用为增强样品对激光的吸收,并在一定程度上降低激光对样品的破坏。基因检测所选用的基质通常为羟基吡啶甲酸(HPA)。 2.离子源工作原理: 样品与基质混合结晶后,在激光的照射下基质迅速蒸发,基质和样品分子间的作用力快速削弱,使得样品分子被释放出来。同时,基质可将吸收到的激光能量传递至样品分子并使其电离。因此,MALDI技术属于光子激发的表面解吸离子源,其能量由激光的光子提供。另外,MALDI电离技术灵敏度极高,仅需pmol~fmol级别的微量样本即可进行检测。 3.飞行时间质量分析器(TOF MS)原理: 飞行时间质量分析器最早出现于1955年,20世纪80年代后期开始快速发展,并常与MALDI离子源联用。其原理是通过间歇式的脉冲电场对离子化的样品进行加速,然后不同分子量的离子在真空飞行管内以各自不同的恒定速度飞向离子检测器。由于真空管内离子飞行速度与其质荷比(m/z)的平方根成反比,不同质荷比的离子到达检测器的飞行时间不同,从而可以区分出样品中具有不同分子量的物质。理论上,TOF分析器的相对分子质量检测范围为0至无限大,但在实际基因检测应用中该检测范围多限制在1 000~10 000区间。 早期的TOF MS分辨率较低,主要原因是当时所采用的离子连续引出技术存在缺陷,即同时离开离子源的相同m/z离子间的动能存在差异。后续Wiley和Mclaren在20世纪50年代开发了延迟引出(DE)技术,离子化后的样品首先进入无场区,然后在几百纳秒或几微秒的延迟后加上电压脉冲引出离子,纠正了具有相同质荷比离子的能量离散,增强了TOF分析器的分辨率。但是,延迟引出的方式每次只能对分子量相对较低的部分进行优化,对高质量区无效,因此Mamyrin和Shmikk提出了另一种采用反射器提高分辨率的方法。该方法通过引入一个迟滞场可以偏转离子并将其送回飞行管中,该迟滞场位于与离子源相对的自由场的后面,并将检测器设置在迟滞场的一侧用于捕获被反射的离子。反射器可以修正相同质荷比离子的动能偏差,使得不同动能的离子在同一时间到达检测器,从而达到提高分析器的分辨率的效果。与延迟引出技术的弱点相比,反射器对高质量区离子同样可以进行优化,但代价是损失灵敏度和缩小质量范围。由于基因检测多集中于1 000~10 000区间,属于低质量区,因此检测时主要采用带有延迟引出技术的线性模式。 二、基因检测 1.单核苷酸多态性检测: 单核苷酸多态性(SNP)是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性,且这些变异在人群中所占比例>1%。单核苷酸多态性在遗传疾病的诊断和筛查以及用药种类及剂量指导等方面有着极其重要的作用。目前,临床最为常用的SNP检测手段主要为Sanger测序、荧光定量PCR、低密度基因芯片和焦磷酸测序等,这些技术大大推动了基因检测在临床医学中的应用。但是,随着人们对疾病机制和治疗手段不断深入的研究,临床对SNP检测的需求正在从单基因的有限几个位点(如氯吡格雷用药指导的CYP2C19 *2*3两个位点检测)逐步转移至多基因多位点(如耳聋基因检测涉及4个基因20个位点)。所以,虽然上述现有临床常用基因检测技术在实验操作、TAT时间、成本、数据分析难易度等方面各有利弊,但总体来说并不完全适合多基因多位点的检测需求。相比之下,MALDI-TOF MS利用多重PCR技术,即1个反应管可同时检测多个SNP位点(最大可同时检测52个位点),可极大的提高多基因多位点的检测效率以及降低样本用量,满足临床新的需求。 质谱SNP检测主要基于PCR和单碱基延伸技术,其原理是首先通过PCR引物对含待检SNP的目标片段进行扩增,PCR结束后加入虾碱性磷酸酶(SAP)去除反应液中的dNTP。然后在反应液中加入SNP延伸引物及ddNTP等相关组分并进行单碱基延伸反应,反应过程中SNP延伸引物可与待测SNP的5′端序列结合并延伸一个碱基,根据不同的SNP模板可得到不同的延伸产物。例如,SNP位点模板为胞嘧啶(C),则延伸鸟嘌呤(G),SNP模板为腺嘌呤(A),则延伸胸腺嘧啶(T)。该步骤完成后,反应液与树脂混合进行离子交换用于去除液体中吸附于DNA片段上的K+、Na+、Mg2+等离子,防止其干扰质谱检测结果。最后,反应液与基质在靶板上结晶,进行质谱检测并得到图谱。由于各延伸产物分子量不同,因此可以在各自的分子量位置查看是否出现检测峰,然后判断该样品的SNP分型。例如,若在检测结果的图谱中可分别看到G和T的检测峰,则该样品为G/T杂合型,若在结果中只有G检测峰或T检测峰,则相对应的SNP结果为GG纯合或TT纯合型。质谱平台特异性良好,使用国际通用标准品能达到30 ppm,最低检测限为5 ng基因组DNA,对比试验选择的金标准验证技术为Sanger测序技术和同类型获批的检测产品,符合性均为100%。 2.基因突变检测: 基因突变最大特点是突变碱基所占比例不一,以肿瘤EGFR突变为例,其突变比例范围可从<1%至>50%,因此该类检测对于灵敏度、重复性等指标要求高。以往临床所使用的电泳、PCR、测序等方法需要通过染色显色或发光基团激发后显色等方式,进行多次化学、物理及电信号处理后才可获得检测结果,因此出错率较高。相比之下,质谱学方法无需对样品进行标记,可直接根据A、G、C、T这4种核苷酸分子量的不同,直观地了解待测样本的组成。另外,质谱谱图检测峰显示清晰,数据准确且易于判别。 基因突变检测原理与SNP检测相同,均通过PCR、单碱基延伸的方式对样本进行处理并通过质谱分析得到样品谱图。与SNP检测不同的是,数据分析时,基因突变检测不存在纯合型及杂合型的称谓,而是突变型和野生型。另外,质谱谱图中检测峰的峰面积与样品中该分子量所代表的核酸片段的含量呈正相关,因此可通过突变型和野生型峰面积之间的比值获得该突变位点的比例,而目前质谱法可检测的最低基因突变比例为0.5%。质谱平台特异性良好,使用国际通用标准品能达到3×10-5,最低检测限为5 ng基因组DNA,可检测到0.5%以上的突变样本,对比试验选择的金标准验证技术为突变扩增阻滞系统荧光定量技术(ARMS-PCR)和同类型获批的检测产品,符合性>95%。 3.DNA甲基化检测: 在人类基因组中,约3%~6%的胞嘧啶都会在DNA甲基化转移酶的作用下与甲基基团结合并在CpG二苷酸的C′5位碳上形成共价键。CpG二苷酸在人类基因组中常以大小为300~3 000 bp的密集形式存在(CpG岛),而这些CpG岛通常位于基因的转录起始位置附近,具有调控基因表达的功能。CpG岛的异常甲基化水平升高会抑制相关基因的表达,造成该基因所代表的蛋白质水平急剧下降。近年来,DNA甲基化在肿瘤研究领域受到了极大的关注,特别是CpG岛高甲基化所导致的抑癌基因转录失活及异常低甲基化所致原癌基因的激活已成为肿瘤研究中的热点问题,除此之外DNA甲基化还与印记缺陷、精神分裂症、抑郁狂躁型忧郁症等复杂疾病有一定相关性。 目前常见的甲基化检测方法主要有测序、甲基化特异性PCR、荧光定量PCR等方法。相比之下,质谱DNA甲基化检测,在引物设计、检测成本及数据分析等方面更加便捷、快速和准确。其主要检测步骤可分为4个部分,第一步是通过亚硫酸氢盐反应对基因组DNA进行处理,目的是将序列中未甲基化的C转化为U,而甲基化的C保持不变。第二步是利用5′末端带有T7启动子序列的引物对目标CpG岛区域进行PCR扩增,并在扩增后加入虾碱性磷酸酶处理残余dNTP。随后,利用RNA转录酶对扩增产物进行转录并在第四步对转录产物进行尿嘧啶特异性酶切处理。上述步骤完成后,样品中未甲基化的C最终变为A,而甲基化的C最终变为G,然后质谱可根据G和A之间16 Da的分子量差异检测出甲基化和未甲基化的C并通过各自的峰面积计算该CpG位点甲基化比例,并估算整个检测片段内的平均甲基化水平。由质谱带来的这种快速、准确、定量甲基化检测新技术有助于推进肿瘤发生机制的研究,提升临床诊疗水平。质谱平台灵敏度高,可检测低至5%的甲基化水平,特异性良好。 4.基因拷贝数鉴定: 人类基因组中很多时候会出现由于一段基因序列缺失或拷贝数增加而导致基因表达产物减少或增加的情况,这种表型上的差异就是拷贝数变异(CNV)。CNV所涉及的DNA片段大小通常介于1 kbp~3 Mbp之间,并在基因组中分布广泛。CNV在临床上除了与罕见病和单基因病相关外,还与肿瘤等复杂疾病相关,因此对CNV变异的研究可促进对多种疾病发病机制的认知,从而指导疾病的分子诊断和新治疗方法的开发。 MALDI-TOF MS可通过单核苷酸多态性等位基因比例(SAR)检测技术对待测样本中目标基因的拷贝数进行定量分析,其原理是检测待测拷贝片段中存在的SNP,计算峰面积,得出该位点两种基因型的比值,然后推测含不同SNP基因型拷贝的相对比值。 5.高通量检测结果验证: 高通量测序随着时间的推移已经逐步在临床开展检测服务,但何种技术最适合用于其结果的验证工作至今尚未达成共识。由于高通量测序的检测灵敏度可达1%~5%,因此对验证平台的检测灵敏度也提出了很高的要求。虽然此前曾有研究小组将一代测序用于NGS的验证工作,但其灵敏度对于低于15%的突变无法进行有效检测,因此当二者结果不一致时,质谱多用于检测结果的进一步验证。 质谱基因检测影响因素 1.引物设计: 质谱基因检测本质上是一种基于PCR基础之上加入单碱基延伸步骤的方法,因此相关引物设计需遵循PCR引物设计原则。引物长度范围多为20~35 bp,PCR扩增产物长度为100~200 bp之间,GC含量以40%~60%为宜并尽量避免引物本身产生发卡结构及5个以上的嘌呤或嘧啶核苷酸的连续排列。另外,由于质谱检测采用的是多重PCR方法,同一反应体系内引物数量多,因此要格外注意引物间出现互补,需要绝对避免SNP延伸引物3′端与其他引物超过3个碱基的互补,否则会出现非特异性延伸,极大干扰检测结果。此外,所设计的引物应与基因组中其他序列无明显同源性,防止出现错误的检测结果。 2.PCR及其他污染因素: 由于样本处理需要进行PCR扩增,因此需要严格执行临床实验室PCR检测的流程。PCR污染的主要来源有标本间交叉污染,PCR试剂污染,气溶胶污染等,所以开展质谱基因检测的临床实验室应具备标准PCR实验室,建立试剂准备、标本制备及PCR扩增等3个独立分区,并注意各个区域的气压设置,并定期进行消毒去除污染。实验过程中,操作人员应严格按照标准操作流程进行样本处理,将污染风险降至最低。另外,样本检测时应同时进行阴性和阳性对照实验,及时发现问题。 3.图谱采集: 质谱的数据分析均基于质谱峰图之上,因此谱图质量的优劣直接影响最终的检测结果。待检样品与基质的结晶程度对谱图的质量影响很大,如果形成的结晶不好,则意味着样本和基质之间的作用还不充分,难以获得理想的灵敏度和谱图,因此在进行质谱检测前应确认样本已完全结晶,并选取结晶均匀的区域进行检测。除此之外,质谱每次通过激光照射所采集到的图谱可检测的离子有限,所以多数情况下每个样品应进行100次左右的数据采集形成独立图谱加和的最终谱图。 4.数据分析: 以实验室自建方法进行SNP数据分析时要注意杂合型样本的判断,理论上杂合型两峰之间的峰面积比例应为1∶1,实际检测中两峰间峰面积的差异应不超过1∶2,低于此比例有可能代表存在污染,需通过阴性对照进行确认。另外,在建立突变检测数据分析方法时要格外注意低突变比例的检测峰与谱图基线之间的差异,若检测峰小至难以判断是否是真实突变时,建议与阴性对照的基线进行对比并对该样品进行复检。 5.提高检测质量的方法: (1)前处理样本的选取:目前常用于单核苷酸多态性基因检测的前处理样本主要有全血样本、干血斑样本、口腔拭子样本,用于基因突变检测的前处理样本主要有石蜡包埋组织样本和血浆样本。全血样本一般抽取后在室温下不超过6 h进行下一步提取或检测,在2~8 ℃环境下不超过1周,-20 ℃环境下不超过1个月,-80 ℃环境可长期保存,抗凝剂的选取与后续实验相关。干血斑样本一般为6 h内的全血或直接从受体取血滴至血卡上制备,干血斑样本可在干燥环境下保存6个月~1年。口腔拭子样本一般直接从口腔内采集,干燥后在-20 ℃可保存1年。石蜡包埋组织建议4 ℃保存1周,长期保存可放置在低温环境下。血浆样本一般在血样采集1 h内离心,取上清立即进行提取或冷冻保存。(2)DNA质量控制:提取后的DNA质量控制有两种手段,第一种为常规的电泳手段,通常基因组DNA使用1.5%~2%的琼脂糖进行电泳检测,选取合格的DNA标准带(Marker)作为参考,可根据Marker上不同条带的亮度估算DNA的量,跑出的条带必须单一,清晰可见。第二种就是使用DNA浓度测定仪器,测定的DNA浓度在最低检测限以上,吸光度(A260/280)在1.5~2.0之间。提取后的DNA在2~8 ℃不超过1周,-20 ℃保存不超过1个月,-80 ℃可长期保存,尽量减少冻融次数。(3)反应和纯化:MALDI-TOF MS进行核酸检测通常是通过多重PCR的方法,通过单碱基延伸的质量差来分析延伸的碱基,因此选取适合的酶和程序来保证实验产物的量,在节约时间成本的前提下尽可能地提高延伸效率,可以通过选择更高活性的酶或增加循环数来实现。随反应设置空白对照和质控,在最终实验结果中可以分析反应中是否有污染干扰或样本存在问题导致实验结果出现问题。由于实验反应过程中,反应液带有大量的盐离子,如Na+、K+等,盐离子易与核酸链结合,使得反应的核酸产物多出1个或多个盐离子的质量,造成峰偏移,不利于结果分析,更甚会使得整体峰图杂乱,基线抬高,所以需要在反应结束后将实验产物进行纯化,去掉盐离子,纯化方式可选择阳离子吸附树脂纯化。(4)产物及芯片点样及保存:经过反应和纯化后的样本建议在2~8 ℃保存不超过1 d,在-20 ℃保存不超过1个月,-80 ℃保存1年,期间避免反复冻融。产物与基质点结合的样品点最好在干燥后马上进行数据采集,若需进行保存可在干燥箱或干燥器内保存1 d,由于核酸检测的芯片为一次性芯片,不建议对某一基质点的样品进行重复数据采集。(5)仪器质量校准:在拆卸仪器零件或维护仪器后可使用标准物质进行仪器校准。一般情况的校准可使用已知分子量的合适分子量范围内的物质进行仪器质量校准,一般校准准确度要求在400 ppm及以下,分辨率在400及以上即可。(6)自动及手动采集:MALDI-TOF MS具备手动采集数据及自动采集数据的功能。两者的区别主要是手动采集数据可根据样本的实际情况相应地调整仪器内参数,采集到尽可能多的理想数据,适用于样本量较少的情况,而自动采集方式主要是将仪器内部参数固定,针对所有样本全部使用相同采集位置、激光强度、谱图采集数等进行数据采集,不考虑样本的结晶及浓度等问题,速度快,自动化程度高,不需人工看守,适用于大样本量的情况。通常可首选自动采集方法,再针对未能得到结果或结果较差的样本采用手动采集方法,尽可能节省时间和人为成本。(7)结果判读标准:根据产物的分子量与延伸引物之间的质量差判断延伸的碱基种类,若出现两个延伸产物峰则为杂合突变或基因突变,针对杂合与纯合的结果判定两个产物峰之间的比例,依据不同仪器可根据峰高比例或峰面积比例判别。 总结 质谱是一种功能强大的综合性技术平台,除可以进行蛋白质多肽检测、微生物鉴定、糖基化检测外,还可进行基因的SNP、突变、甲基化及CNV分析。在临床检验领域,质谱技术用于耳聋基因检测、表皮生长因子受体(EGFR)突变检测、液体活检、高血压易感基因多态性检测等方面也具有广阔的应用前景。迄今为止临床上还鲜有其他检测平台可以兼顾多种组学层次的检验分析。与质谱的蛋白质多肽检测功能相比,其基因检测的功能还基本未在临床应用中进行开发,独特的多重PCR技术,稳定准确的检测结果,经济的检测成本可满足临床越来越多对中等通量位点SNP及基因突变等定性和定量检测的需求,再加上方便快捷的DNA甲基化及CNV检测,更使得质谱在基因检测领域具有自己的特色和极大的竞争力。随着临床实验室对质谱的了解和应用不断的加深,未来该 |