包含基因组DNA和cDNA两者的总核酸的富集和新一代测序的制作方法_5

文档序号:9382599阅读:来源:国知局
寡核苷酸接头上以产生易于测序的文库。在一些实施方案中,克隆 的cDNA序列包含允许区分同一混合物中的基因组DNA序列与cDNA序列的索引。
[0105] 可以以预定比率来混合基因组DNA文库和cDNA文库。在一些实施方案中,核酸 混合物中基因组DNA文库和cDNA文库的重量比为约以下的任意一个:100 : 1、90 : 1、 80 : 1、70 : 1、60 : 1、50 : 1、40 : 1、30 : 1、20 : 1、10 : 1、9 : 1、8 : 1、7 : 1、6 : 1、 5 : 1、4 : 1、3 : 1、2 : 1、1 : 1、1 : 2、1 : 3、1 : 4、1 : 5、1 : 6、1 : 7、1 : 8、1 : 9、 1 : 10、1 : 20、1 : 30、1 : 40、1 : 50、1 : 60、1 : 70、1 : 80、1 : 90 或 1 : 100。在一 些实施方案中,核酸混合物中基因组DNA文库和cDNA文库的重量比为约10 : 1、约5 : 1、 约 2 : 1、约 1 : 1、约 1 : 2、约 1 : 5或约 1 : 10。
[0106] 在一些实施方案中,可直接使用样品中含有DNA和RNA两者的总核酸来产生核酸 混合物。可使用总核酸进行逆转录反应,产生cDNA群。或者,可在移除核糖体RNA之后产 生cDNA群。可在逆转录过程中添加索引,例如,通过使用用于逆转录反应的随机引物的突 出端(overhang),使得可将由此产生的cDNA序列与基因组DNA序列区分开来。然后可以产 生包含基因组DNA序列及cDNA序列两者的单一文库。
[0107] 在一些实施方案中,分别富集来自测试样品的基因组DNA和cDNA,然后将其混合 在一起以提供富集的基因组DNA和cDNA的单一混合物。
[0108] 富集目的核酸
[0109] 在一些实施方案中,本文所述的方法包括目的核酸的富集。所述方法通常包括使 核酸混合物(或本文所述的基因组DNA文库或cDNA文库)与一组探针在足以使所述核酸与 所述探针杂交的条件下接触,其中所述探针与存在于混合物中的目的核酸互补。本文所述 的富集方法减少了待分析核酸序列的复杂度并使得目的核酸更好地呈现于库(pool)中。
[0110] 因此,在一些实施方案中,提供了在测试样品中获得富集的目的核酸群的方法,其 包括:(a)使核酸混合物与一组探针在足以使所述核酸与所述探针杂交的条件下接触,其 中所述探针与共同存在于核酸混合物中的目的核酸互补,其中所述核酸混合物包含获自测 试样品的基因组DNA序列和cDNA序列;以及(b)将与所述探针杂交的核酸与未杂交的那些 分离;从而获得富集的目的核酸群。
[0111] 在一些实施方案中,提供了在测试样品中获得富集的目的核酸群的方法,其包括: (a)使从测试样品产生的基因组DNA文库与第一组探针在足以使所述基因组DNA与所述第 一组探针杂交的条件下接触,其中所述第一组探针与存在于所述基因组DNA文库中的目的 核酸互补;(b)使与所述第一组探针杂交的基因组DNA与未杂交的那些分离;从而获得富集 的目的基因组DNA群;(c)使从测试样品产生的cDNA文库与第二组探针在足以使所述cDNA 与所述第二组探针杂交的条件下接触,其中所述第二组探针与存在于所述cDNA文库中的 目的cDNA互补;(d)使与所述第二组探针杂交的cDNA与未杂交的那些分离;从而获得富集 的目的cDNA群;(e)使所富集的目的基因组DNA和所富集的目的cDNA混合以获得目的核 酸群。
[0112] 在一些实施方案中,所述方法包括在使探针组与混合物接触之前,使核酸混合物 (或本文所述的基因组DNA或cDNA)变性。在一些实施方案中,所述方法包括在使探针与混 合物接触之后,使核酸混合物(或本文所述的基因组DNA或cDNA)变性。然后使混合物经 受使得探针与富集的目的核酸群杂交的退火条件。
[0113] 在一些实施方案中,目的核酸包含原癌基因所在的一个或更多个期望的区域。在 一些实施方案中,目的核酸包含肿瘤抑制物所在的一个或更多个期望的区域。在一些实施 方案中,目的核酸包含酪氨酸激酶所在的一个或更多个期望的区域。在一些实施方案中,目 的核酸包含磷酸酶所在的一个或更多个期望的区域。在一些实施方案中,目的核酸包含血 管基因所在的一个或更多个期望的区域。在一些实施方案中,目的核酸包含遗传突变所在 的一个或更多个期望的区域。
[0114] 在一些实施方案中,目的核酸包含指示疾病的单核苷酸变异。在一些实施方案中, 目的核酸对应于在疾病样品中差别表达的基因转录物。在一些实施方案中,目的核酸反映 疾病样品中的易位事件。在一些实施方案中,目的核酸对应于疾病样品中拷贝数变异的核 酸。在一些实施方案中,目的核酸包含同时具有一种以上本文所述的特性的核酸。例如,在 一些实施方案中,目的核酸包含至少一种携有单核苷酸变异的核酸和至少一种对应于差别 表达之基因转录物的核酸。在一些实施方案中,目的核酸包含至少一种反映易位事件的核 酸和至少一种涉及拷贝数变异的核酸。在一些实施方案中,目的核酸包含但不限于,基因组 的单一序列、基因组内的基因、编码区、外显子、内含子、基因间区域、内含子/外显子接合 点、差别表达的基因转录物、易位位点等。
[0115] 可基于样品材料的复杂度和测序所需的序列长度来选择探针的数量。可使用单个 探针或多个(即至少2个、至少5个、至少10个、至少50个、至少100个、至少500个、至少 1000个、至少10, 000个、至少100, 000个或更多的混合物)不同的探针完成本文所述的方 法。这些探针可用于富集核酸序列上多个(即至少2个、至少5个、至少10个、至少50个、 至少100个、至少500个、至少1000个、至少10, 000个、至少100, 000或更多)不同的区域。
[0116] 在本文所述的方法中使用的探针组是根据所期望的目的核酸而选择的。在一些实 施方案中,使用本发明的方法富集目的核酸需要设计与预定的这些序列的群互补的探针, 并在将它们用作亲和结合物来使核酸混合物内目的核酸与不期望的序列分离。
[0117] 可使用获自多种来源的核酸序列信息和本领域公知的方法来设计与预定的核酸 部分互补的探针。例如,可从任何本领域技术人员公知的多种来源获得核酸序列,包括基因 组序列。这样的来源包括,例如,用户导出的、公共的或私人的数据库,订阅来源和在线公共 的或私人的来源。例如,用于获得基因组和基因序列的示例性公共数据库包括,例如,UCSC 人基因组数据库、dbEST-人、UniGene-人、gb-new_EST、Genbank、Gb_pat、Gb_htgs、Ref Seq、 Derwent Geneseq和Raw Reeds数据库。此外,核酸序列信息可由用户产生并直接使用或存 储(例如)在本地数据库中。对于基因组和转录组信息,还存在本领域技术人员公知的多 种其他来源,并且同样可用于产生探针。
[0118] 在本文所述的方法中使用的探针可以是任何长度,包括但不限于,约10个至约50 个、约50个至约100个、约100个至约120个、约120个至约140个、约140个至约160个、 约160个至约180个、约180个至约200个、约200个至约300个、约300个至约400个或 约400个至约500个核苷酸长。在一些实施方案中,所述探针是约100个、约105个、约110 个、约115个、约120个、约125个、约130个、约135个、约140个、约145个、或约150个核 苷酸长。在一些实施方案中,提供了与待富集的核酸相比过量的探针。例如,在一些实施方 案中,所述探针为待富集的核酸的量的至少约1倍、2倍、5倍、10倍、IO 2倍、10 3倍、10 4倍或 更多倍。在一些实施方案中,所述探针不超过待富集的核酸的量的约10倍、IO2倍、10 3倍或 IO4倍。在一些实施方案中,使用与目的核酸相比摩尔过量(例如,至少约2倍、5倍、10倍、 15倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或1000倍或更多倍)的探 针。
[0119] 在一些实施方案中,至少一种探针与存在于基因组DNA序列中的目的核酸和存在 于cDNA序列中的目的核酸互补。例如,在一些实施方案中,探针与在基因组DNA序列和cDNA 序列两者上发现的基因的外显子互补。在一些实施方案中,探针是单链的。在一些实施方 案中,探针是双链的,因此包含与目的核酸的两条链都互补的序列。在一些实施方案中,探 针包含与例如原癌基因、肿瘤抑制物、激酶、磷酸酶、细胞周期基因、生长因子基因、受体基 因和/或血管基因的区域互补的序列。在一些实施方案中,探针包含Elim Right0n?1000 癌基因的组。
[0120] 可以在没有固体支持物的液相方法中进行接触步骤。或者,可以用固定化的样品 核酸或用固定化的探针进行接触步骤。在与探针接触之前或在添加探针之后,使核酸的混 合物经历变性以使得探针与核酸进行杂交。
[0121] 使本文所述的探针与本文所述的核酸混合物在足以使所述核酸与所述探针杂交 的条件下接触。虽然可使用不同的严格条件,但是本发明中的杂交条件通常是如本领域已 知的高度严格的条件。例如,在Sambrook等,Molecular Cloning :A Laboratory Manual,第 3版?(2001)或在 Ausubel 等,Current Protocols in Molecular Biology(1998)中已经描 述了严格的条件。高度严格的条件有利于增加杂交的保真度,而降低的严格性使得保真度 较低。严格的条件是序列依赖性的并且在不同情况下不同。较长的序列在较高温度下特异 性杂交。核酸杂交的扩展指南参见 Tijssen"0verview of principles of hybridization and the strategy of nucleic acid assays',,在 Techniques in Biochemistry and Molecular Biology 8212 中;Hybridization with Nucleic Acid Probes (1993)。通常, 对于在确定的离子强度和pH下的特定序列,选择比热熔点(Tm)低约5°C至10°C的严格条 件。Tm是(在确定的离子强度、pH和核酸浓度下)50%与靶标互补的探针与靶序列的杂交 处于平衡状态的温度(即,当靶序列过量存在时,在Tm下,在平衡时50%的探针被占据)。 也可通过添加螺旋去稳定剂(例如甲酰胺)来达到严格的条件。可通过改变热力学变量的 步骤参数(例如温度)或甲酰胺的浓度、盐、离液盐、pH和/或有机溶剂来控制严格性。如 在美国专利No. 5, 681,697中所概述的,也可使用这些参数来控制非特异性结合。因此,可 能需要在较高的严格条件下执行某些步骤以减少非特异性结合。
[0122] 在一些实施方案中,所述探针包含允许识别和分离探针以及杂交于其上的核酸的 标签。在某些情况下,所述标签特异性地与配体结合从而促进分离。示例性的标签/配体对 包括但不限于,抗体/抗原、抗原/抗体、抗生物素蛋白/生物素、生物素/抗生物素蛋白、 链霉亲和素/生物素、生物素/链霉亲和素、谷胱甘肽/GST、GST/谷胱甘肽、麦芽糖结合蛋 白/直链淀粉、直链淀粉/麦芽糖结合蛋白、纤维素结合蛋白/纤维素、纤维素/纤维素结 合蛋白等。可将识别标签的配体与支持材料(直接地或间接地)偶联,这进而提供了用于 分离的物理或化学手段。
[0123] 在一些实施方案中,在探针与核酸混合物接触之前或之后,将其(直接地或通过 标签)附接于固体支持物上。然后,可通过洗涤将未与所述探针杂交的核酸分开,随后通过 洗脱步骤回收与所述探针杂交的那些核酸。
[0124] 合适的固体支持物包括但不限于,平板、管、瓶、烧瓶、珠、磁珠、磁片、多孔基质或 任何固体表面等。可通过例如过滤、分离、磁场、离心、洗涤等实现物理分离。
[0125] 在一些实施方案中,所述固体支持物是珠、膜、筒、滤器、微量滴定板、试管、固体粉 末、铸型或挤出模制模块、网、纤维、磁性颗粒复合物或任何其他固体材料。固体支持物可 包被有以下物质,例如聚乙稀、聚丙稀、聚(4-甲基丁稀)(poly(4-methulbutene)、聚苯乙 烯、聚丙烯酸酯、聚对苯二甲酸乙二醇酯、人造丝、尼龙、聚(丁酸乙烯酯)、聚偏二氟乙烯 (PCDF)、硅酮、聚甲醛、纤维素、醋酸纤维素、硝化纤维素等。在一些实施方案中,固体支持物 可包被有配体或者浸渍有配体。
[0126] 可在本文所述的方法中使用的其他固体支持物包括但不限于,明胶、玻璃、琼脂糖 大珠、葡聚糖微载体例如CYTODES_? (Pharmacia,Uppsala,Sweden)。还包括多糖(例 如琼脂糖、藻酸盐、角叉菜胶、壳多糖、纤维素、葡聚糖或淀粉)、聚丙烯酰胺、聚苯乙稀、聚 丙烯醛、聚乙烯醇、聚甲基丙烯酸酯、全氟化碳、无机化合物(例如二氧化硅、玻璃、硅藻土 (kieselquhr)、氧化铝、氧化铁或其他金属氧化物)或由两种或更多种天然存在的聚合物、 合成聚合物或无机化合物的任意组合组成的共聚物。在一些实施方案中,固体支持物是柱 (例如Sepharose柱)。
[0127] 可通过本领域中已知的许多方法将探针附接到固体支持物上。这样的方法包括, 例如,通过直接的化学合成附接到固体支持物上、化学附接、光化学附接、热附接、酶促附接 和/或吸收。在一些实施方案中,探针共价地附接到固体支持物。在一些实施方案中,探针 通过共价键附接到固体支持物。在一些实施方案中,探针非共价地附接到固体支持物上,例 如,通过配体/标签的相互作用。
[0128] 通过富集方法获得的复杂度降低的水平可使初始核酸库的复杂度降低10%、 20 %、30 %、40 %、50 %、60 %、70 %、80 %、90 %、95 %、99 %、99. 5 %、99. 9 %、99. 99 %、 99. 999%或更高,或可能涉及仅选择百分之几的核酸,或甚至几千个碱基对。例如,取决于 初始基因组和转录组的大小以及所需降低的水平,核酸的复杂度可以从30亿碱基对降低 至1千万个碱基对或更少。使用这种方法,可以从复杂的群中快速而有效地去除包含例如 40%的人基因组DNA的高度重复DNA序列。
[0129] 在一些实施方案中,所述方法还包括在分析之前,例如通过PCR扩增目的核酸。例 如,可在将目的核酸从如上所述的固体支持物上洗脱之前或之后进行这样的扩增。
[0130] 分析核酸
[0131] 可对包含本文所述的基因组DNA序列和cDNA序列的核酸混合物进行进一步的分 析。可直接对核酸混合物进行分析,或者在本文所述的富集方法后对富集的目的核酸群进 行分析。
[0132] 分析可包括但不限于,核酸测序、突变分析、多态性测定等。本文所述的方法可特 别用于鉴定核酸样品中的突变,预测个体对药物的响应性;预测药物在个体中的药代动力 学,预测治疗在个体中的治疗结果。该方法也可用于遗传检测,例如产前筛查的遗传检测。
[0133] 可通过任何
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1