背景:英国生物样本库(UK Biobank)采取前瞻性流行病学策略,在中老年人群中研究基因、环境和生活方式与常见病的关系。本库收集的资料和生物样本来自于500000位捐献者(年龄:40-69岁)。众所周知,生物样本的采集、处理和存储方案将会对后续的科学研究产生重大影响。 目的:本方案的目的是阐明在额定的经费支持下获取最大的科研价值的建库,本库所采用的样本采集、处理和存储方法,来确保样本质量,为后续开展的现有或可预判研究实验服务。 方法:本方案的制定借鉴了大量已有文献、咨询了相关专家并进行了同行评议。本方案内容涉及样本的采集种类、处理方法和时间以及存储条件等问题,来确保样本长期存储的质量。本方案的可靠性目前已经过了大量实验的证实。对于每位捐献者,本样本库采用真空采血管采集45ml的血液和9ml的尿液,并在现场进行最小程度的处理。对于样本保护剂、抗凝剂和促凝剂的选择将根据预期的用途来选定。本样本库也在部分捐献者中收集了头发、指甲、唾液和粪便等样本。血液和尿液样本将在24小时之内从现场运送到存储中心。样本将在那里进行处理,处理后的尿液、血浆、血清、白细胞和红细胞会存储在超低温容器中。全血的部分分样也进行了保存,即保留其潜在的细胞系。部分样本用于标准的血检(因为这些检测项目必须使用新鲜血样)。最终,将收集到15000000份样本,其中9500000份样本存储在-80℃自动化设备中,另外的5500000份样本存储在-180℃液氮中。基于研究中涉及的样本数量巨大,本方案中采用了大量的自动化手段。其中涉及的流程、技术、设施和设备等都采用了最佳实践。鉴于记录样本采集、处理和存储的数据量是繁琐的,本方案采用商业化的LIMS系统来统一管理这部分资料。 结论:本库采用的样本采集、处理和存储方案不仅满足了本研究的需求(样本量巨大),并最大限度的确保了样本的质量。从第一批次40000人次的实践来看,已展示这套方案是合适的、可靠的。 介绍 英国生物样本库(UK Biobank)采取前瞻性流行病学策略,在中老年人群中研究基因、环境和生活方式与常见病的关系。本库将于2007年4月到2010年底期间,在500000捐献者(年龄:40-69岁)中采集基线资料。将在现场收集初始资料,包括问卷、身体与认知检查和样本留样。这些资料将会与捐献者的其他医疗信息关联在一起,这将有助于后续的跟踪随访(包括疾病的产生、甚至死亡)。本库采取的样本采集、处理和存储方案的制定借鉴了大量已有文献、咨询了相关专家并进行了同行评议,而且其可靠性已在大量的实验中被证实。本方案具体规定了样本采集的种类、前处理和存储的温度、样本运输的工具、样本处理的方式、分管情况和长期存储条件等。本方案已经公布于网站(www.ukbiobank.com)。 方法 注意事项 建立生物样本的长期存储的生物样本库,其中最重要的一点是能够为后续广泛的科学研究提供高质量的样本,而不是局限于单一的病种(例如,如果仅仅关注于糖尿病,那么就只需要收集空腹血样)。鉴于研究项目的要求(见框1),在有限的资金情况下,开发一套样本采集、处理与存储的方案就势在必行。 框1:英国生物样本库对样本采集、处理和存储采取的原则 结合上述项目要求,就需要考虑到下面以下注意事项: 经济与过程 项目发展过程中,首先要考虑的就是经济与效益。鉴于有限的资金支持,本库采取的每一项措施都要经过深思熟虑,其中就有一些早期的提议因不符合经济原则而被否定。如果一些要求因为技术性的原因不能够实现,方案中也会适当的修改来尽可能的满足。例如,在现场进行大量快速地收集晨尿和24小时尿很难实现,方案中就采用了随机尿来替代。 技术 在500000位捐献者中收集血液和其他样本是一下非常创新的项目。也没有非常成熟的解决方案来满足本项目。本库借鉴工业上的最佳实践并采用高通量的操作原则。本库采取的技术手段都是建立已经成熟的技术上,并且要求能够满足高通量和高质量的原则,而不会采用不成熟的技术。如果将来有提高效率的新技术出现,本库也只会在这项技术经过完整的评估之后再添加进来。 中心处理VS现场处理 已有的生物样本库均没有本库的规模大,因此其采取的样本采集、收集和存储的方案并不适用与本库。正如框1所述,本库的原则之一就是采用标准化的操作流程,确保每一份样本的采集、处理和收集均采用相同手段,并经过严格的质量保证和质量控制。鉴于本库的情况,就有现场处理和中心处理两种途径。现场处理能够快速地处理和冷冻保存样本,这能够高质量的保存样本中不稳定的分子。但是,现场处理在保证信息的完整性和严格的执行质量控制方面是很难做到。在预实验中显示,一个现场每天接待80位捐献者,5、6位技术人员是能够保证样本质量的。超过这个数量,信息的完整性很难保证,时常出现错误,并会出现延时现象。对于本库来说,高质量的样本和数据是压倒一切的。另外,现场处理需要更多的人员、设备及场地,粗率估计其花费将是中心处理的两倍。本研究采取最少的现场处理,并在采集样本后尽快的运送到中心进行处理。采取中心处理,样本在离体后就没有得到尽快的处理和冷冻保存,这将可能导致不稳定的分子发生改变。另外,细胞的溶解也将对分离血清或血浆造成困难。因此,本库采用大量实验来验证中心处理对样本的影响,并证实这种方案是可靠的。 样本种类、稳定剂和抗凝剂 基线调查期间收集的样本种类是非常重要的,同时要考虑采用何种稳定剂来处理,并且要在可控的经济水平上。本库的原则是收集便于采集并且富含生物信息的样本(血液和尿液)(见框2)。 框2 样本种类用和排除条件 在基线调查期间,本库收集了45ml的血液和9ml的尿液。本库还考虑了其他的样本种类(如粪便、头发、指甲和唾液,见框2),鉴于其附加信息不足、收集不方便及花费大等情况,并没有在所有500000人中进行收集。例如,粪便样本中细菌的“副产品”(如氢化物、甲烷、烷烃、甲基烷烃、酚类和有机酸等)虽然是很多肠道疾病(如肠易激综合征和克罗恩氏病)的标志物;但是这些物质也可以在尿液中进行检测。另外,肠道微生物可以采用核磁共振技术在尿液中检测。头发和指甲虽然能够用来测量中毒重金属中毒,但是一份汞代谢的研究显示,头发总的汞含量作为身体或器官中汞含量的指示物是不准确的。另外,砷化物(如砷甜菜碱及其他常见化合物)并不在头发中富集。更重要的是,在头发或指甲中测量环境中的砷化物会受到外界环境的影响(如空气、水、香皂和洗发水等),这些东西更容易在尿液中测量。 样本采集条件 我们收集了全血中各种生化分子与细胞在不同抗凝剂、不同温度和不同运输条件下的稳定性情况。各种生化分子可以分为两类:1)、已知的种类(如DNA、已知的蛋白质和代谢物、血常规和细胞种类等);2)、未知的种类(如血清或血浆中的蛋白组等)。如果有可能,我们会将已知生物物质的保存条件推广到未知的物质上面,并进行相关的验证性实验。 保存生化物质中重要的因素有:抗凝剂、稳定剂、温度、延迟处理时间(从离体到处理的时间间隔)和内源性溶解物(如酶和细胞死亡)等。样本的无菌条件也是非常重要的。另外,我们还会不去做重复的收集,以降低不必要的花费。比如,我们没有采用全血,在纸质介质上来存储DNA(尽管有研究表明这种方法的DNA回收率很高);而是用白细胞来存储大分子DNA,B细胞来作为DNA的补充。 抗凝剂 保护剂等添加剂的选择对于样本下游的研究是至关重要的。例如在含有抗凝剂的管子中采集的全血会产生细胞因子,导致其浓度上升。对于一些分析,抗凝剂不必不可少的;对于另外一些研究,是一定不能添加抗凝剂的。例如,如果后续研究中需要使用白细胞,从中提取永生细胞系的话,那么枸橼酸葡萄糖就必须的。肝素稳定后的血液会影响T细胞繁殖能力、能结合于特定的蛋白质、并影响DNA的聚合酶链式反映。添加有肝素锂的血液是非常适合代谢组学的研究的。添加有柠檬酸盐的血液是非常适合提取RNA和DNA的,并能适合淋巴细胞的培养。如果要进行功能凝血因子测定,柠檬酸钠是合适的;如果要通过免疫反映来检测纤维蛋白原抗体,乙二胺四乙酸(EDTA)是合适的。尽管乙二胺四乙酸会影响镁离子的含量和细胞的功能(如增加姐妹染色体的交换、减少有丝分裂指数等),但是其稳定的血液非常适合于以DNA和蛋白质为基础的分析。因此,本库采用乙二胺四乙酸和肝素锂作为抗凝剂。另外,本库还采用了枸橼酸葡萄糖保存一份血液,以备后续淋巴细胞的研究。 促凝剂 与血浆、血细胞相比,血清更适应与另外一些研究(如大部分临床生化分析和代谢研究等)。全血在室温中存储于玻璃容器中会自动凝固,但这种方法是不可行的,因为玻璃容器非常有可能破损。鉴于全血在不经过处理时只会部分凝固或凝固很慢,因此在塑料管中收集血清就必须添加促凝剂。目前,有两种促凝剂:二氧化硅和促凝酶。促凝酶能够快速促进血液凝固(一般用于心血管手术中),但是其价格是非常昂贵的,并不适用于本库。因此,我们采用二氧化硅作为促凝剂。实验显示,二氧化硅处理血液中的血清是能够满足后续研究需求的。 降解情况 酶的降解会影响到很多生物标志物。例如,乙二胺四乙酸和维生素C能够稳定血液中的叶酸,因此如果后续需要检测叶酸的项目就必须在血液离体后尽快的添加这些稳定剂。蛋白质会受到细胞中蛋白酶的影响而降解,特别是当细胞的完整性被破坏后;虽然可以通过尽快添加蛋白酶的抑制剂来解决上述问题,但是这些抑制剂对于活细胞来说都是有毒性的(如果需要检测细胞的活性,就一定不能添加),并会影响到后续抗原性实验和功能性实验。RNA酶是广泛存在的,因此RNA特别不稳定;RNA的完整性就有赖于操作中无RNA酶的,并需要添加RNA酶抑制剂。然而,添加了RNA酶抑制剂,就会影响到样本的其他用途。本库中并没有采用任何能够快速阻止酶活性的试剂,因为这些试剂会干扰到后续的其他研究及其对细胞的毒性,特别是在长期冷冻保存中会影响到RNA的完整性、个体间的差异和其自身的不稳定性。另外,如果在整个人群中都采用RNA酶抑制剂的话,花费将是巨大的;因此我们只在部分人群中采用。另外,代谢组学的研究可以通过枸橼酸葡萄糖管中收集的淋巴细胞来进行(虽然其中含有B细胞可能会产生一定的影响)。对于尿液样本,可以添加保护剂(如硼酸)来降低细菌的污染。然而本库中并没有添加硼酸(这与其他样本库是不同的),因为这会在尿液样本中产生其他化学物质。虽然叠氮化合物也能够保存尿液并不会产生其他物质,我们也没有采用这种方法,因为这会增加现场操作的困难和质量的不稳定性、稀释血液。更重要的是叠氮化合物是有毒的,并会对代谢物产生影响。 温度及延迟处理时间(从离体到处理的间隔) 温度会影响到样本的稳定性,特别是在样本离体后到处理前之间。活细胞虽然能够在室温下稳定性的保存48小时,但必须尽快进行细胞培养或存储在液氮中。细胞分离后再存储与不分离后存储相比,其细胞更容易存活(因为细胞的存储需要添加二甲基亚砜,不然的话细胞会破裂)。对于生化分子来说,如果不能够尽快的进行分析,样本需要保存在低温中,因为室温中不稳定的分子很容易降解(如细胞因子、抗氧化物(维生素c、尿酸和维生素e等)和其他的物质(叶酸和维生素B12等)等)。理想情况下,不同的生化分子需要不同的保存温度,然而这对于一个大的项目来说是不可能实现的。4℃是一个很好的选择:细胞能够保持其活性(相比于室温,活性会有一定的降低),同时样本也能够在一定程度上对抗酶的降解作用。有一项研究表明,相比于各种方案的选择(包括抗凝剂、稳定剂、保护剂、运输温度、延迟时间和条件等),各种细胞因子(如肿瘤坏死因子、α干扰素、γ干扰素、白细胞介素Iα、白细胞介素Iβ和白细胞介素6等)的保存条件最好是在4℃中。同时在该研究中,相比于各种抗凝剂,乙二胺四乙酸是最稳定的。本库中进行了一项研究表明,在4℃和18℃中,样本的稳定性能够保持至少24小时,细胞的活性能够保持至少36小时。 样本采集方案 本库采用表1的方案来采集血液和尿液。在静脉穿刺过程中,皮下注射针头与含有稳定剂的真空采血管直接相连,通过压力来采集血液。在尿液的运输过程中,通过一个相同的装置将尿液从采集管中收集到运输管中。 表1 样本稳定剂、采集优先级和数量 现场样本的处理过程 前面已经提出,会在现场进行最小程度的处理。当血液收集到采血管中后,将进行10次的上下反转,使血液与抗凝剂或保护剂混匀。通过采用含有肝素锂的血浆分离管和含有促凝剂的血清分离管来降低延迟分离对样本的影响(可能会使钾离子或和同型半胱氨酸的含量增加)。这些管子中含有一项专利物品(惰性并含有胶塞)能够阻止细胞等物质通过,使血清和血浆通过,从而在低速离心后能够使样本产生分离的效果。每一个采集管上均含有其与众不同的条形码,并在扫描入库后与捐献者的ID号码想关联。这个条形码不是提前分配给捐献者的,这样做,捐献者就不容易弄混其ID号码并能阻止没有血液的管录入到LIMS系统中。在扫面如果的过程中,会自动引发一个内置的计时器,用来准确地记录血清分离管中血液的凝集时间。血浆分离管中的血液会立即在现场进行离心(离心力:2500g;时间:10min;温度:4℃),并录入信息系统中。血清分离管中的血液允许在离心前室温下保存25-30min;离心时间会记录在信息系统中。所有的采血管将保存在4℃(含有枸缘酸的采血管保存在18℃),在白天工作结束后将通过商业物流运送到中心(其运送盒均经过温度控制)。 中心样本的处理过程 在第二天白天,样本会运送到中心进行尽快的处理,并按如表2的方式进行分装。处理过程中,所有的样本将处于4℃,并会尽快进行长期保存,确保所有的样本在24小时之内入库。 表2:样本的分装方案 采集管上的条形码会再次扫描,并与LIMS系统中的数据对照,确保其正确无误,然后与捐献者的其他数据相关联。鉴于本库每天的存入量是巨大的(每天达到5000份血液和尿液),我们采取自动化的处理方式,所有的操作时间、温度及人员都将记录在LIMS系统中: |