探针及其用图

文档序号:9838634阅读:873来源:国知局
探针及其用图
【技术领域】
[0001] 本发明涉及生物技术领域,尤其是目标基因高通量测序技术领域。具体地,本发 明涉及探针及其用途,更具体地,本发明涉及--组探转、构建高通量测序文库的方法、确定 待测样本阿X;基因编码区核酸序列的方法、构建高通量测序文库的装置W及擁定待测样本 FLG基因编码区核酸序列的系统。
【背景技术】
[0002] 寻嘗型鱼鱗病(Ichthyosis vulgaris)是-----'种常染色体显性遗传病,该疾病的发 病率为1:250-1:1000。主耍输床症状包括皮肤损害呈"鱼鱗"或"蛇皮"状,毛囊角乾丘疹, 毛孔呈点状,手纹和脚纹多、深、乱。与该疾病精关的基因是位于lq2i. 3的编码丝聚蛋白 (Filaggrin)的円X;基因,该基因是表皮分化末麗编码结掏蛋白的基因簇的一部分。FLG基 因全长12. 7 - 14. 7化,包含3个外症子巧xon) ,Exonl (巧bp)是非编妈序列,Exon2(巧9bp) 包含起始编码序列,Exoii3 (12-14陆)包括N末端和编码丝聚蛋白的iO-12个长度达Ik的重 复序列。目it,FLG基因检测方法主要是迸行长P邸,然后对长PCR产物迸行巢式扩增,得到 特异性的目的序列后,结合sanger测序解读FLG序列。然而,送段序列不仅组合复杂,还具 有个体特异性,使羯该方援时常会出现未得到特异性序列或测序失败,实验过程摄不稳定, 导致不能彻底解读FLG。另:邦,第一代测序仪同时测序的样本数少,畳需耍先经过PCR过程, 工作量大,通量小,检出率不到30%。
[000幻因而,目前的FLG基因检测方法仍有待改进。

【发明内容】

[0004] 本发明旨在至少解决现有技术中存在的技术詞题之一。为此,本发明的一个目的 在于提出一种能够廣效检测特异性序列、彻底解读円X;基因,且实验过程稳定、工作量小, 通量大的FLG基因检测方法。
[0005] 需耍说明的是,本发明是基于发明入的T列工作而完成的:
[0006] 发明人利羯目标区域捕获技术,使用特异的外显子補获芯片捉入FLG基因迸行高 通量测序。该技术的基本原理是使用一套寡核巧酸探针来捕获基因组上的目标序列,然后 使用通用引物对送些搞获到的序列迸行PCR扩增,再对送些扩增产物迸行高通量测序,从 而识别日NA样品中的碱基序列,通过生物信息分析方法捉测序所得序列信息迸行分析,从 而找到目标序列的变异信息,包括单核巧酸变异,插入/缺失,重复等,该方法两大幅提高 円石基因的检出率,约为83 %。
[0007] 迸而,根据本发明的一个方面,本发明提供了一组探针。根据本发明的实施例,所 述一组探针特异'註识别FLG基因编码区的至少一部分,且所述探针满足选自下列条粹的至 少之一:
[0008] (1)所述探针的长度为巧bp ;
[000引 城所述探钟特异性识魏阿怎基因编妈区上游IObp至下游IObp么间的序歹ij;
[0010] 城特异性识蔚j GC含量高于0. 6及低于0. 3的区域的探针,乘数大于2 ;
[0011] (4)所述探针与目标序列的烙解温度为60--10摄氏度,优选80摄氏度;
[0012] 减所述探钟不包舊发夹结构;
[0013] ㈱所述探针与参考基因组上的至多2个位点匹配;
[0014] (7)所述探针选择时的窗口滑动大小为!0bp。
[0015] 发明人假奇蛙发现,本发明的-一组探针,对其特异性识别的FLG基因编码区的至 少--詔分的捕获特异性好、灵敏度和覆盖度非常高,能够有效用于迸行FLG基因编码区的 捕获检测。稷据本发明的实施例,刮用本发明的一纽探軒能够灌确育效地補获探针轉异性 识别的目标序列-------------FLG基因编與区的至少一講分,从而能够有效构建获得目标序列的核 酸测序文库,迸一步,将该核酸测序文库用于高通量测序,能够有效确定円.G基因编码区的 至少一部分的序列信息,并且目标序列的测序深度高,数据利羯率高,迸而能够实现对阿X; 基因的检测。此外,利馬上述方法构建高通量测序文库,并迸而用于FLG基因检测,特异性 好、灵敏度和覆盖度高,可重复性好,从而能够成功解读松G基因,发现突变,且该方法实验 过程稳定、成本低、操作简单、.卫作量小、易推广。
[0016] 根据本发明的另一方面,本发明提供了一种构建高通量测序文库的方法。根据本 发明的实施例,该方法包括F步骤;将基因组DNA片段化,W便获得DNA片段;将所述DNA 片段迸行末端修复,巧便获得经过末端修复的DNA片段;在所述经过末端修复的DNA片段的 3'末端添加碱基A,W便获得具有粘性末端A的MA片段;蒋所述具有粘性末端A的DNA片 段与接头相连,W便获得连接产物;利用前面所述的一组探钟对所述连接产物迸行筛选,W 便获得肖的片段,所述旨的片段构成所述高通量测序文库。
[0017] 根据本发明的实旌例,本发明所采用的一组探转捉其特异性识别的FLG基因编與 区的至少一部分的捕获特异性好、灵敏度和覆盖度非常高,能够有效用于进行FLG基因编 码区的捕获检测。迸而,利用本发明的方援能够准确有效地捕获探转特异性识别的目标序 列--FLG基因编码区的至少一部分,构建旨标序列的核酸测序文库,遥而将该核酸测序文 悚用十局通黨测斤后,能够有效满巧FLG基因编码梭的至少一帯;分的序列倍息,并且目柄; 序列的测序深度高,数据利用率高,进而能够实现超FLG基因的检测。此外,利用本发明的 方法构建高通量测序文庫,遥而用于FLG基因检测,特异性好、灵敏度和覆盖度高,可重复 性好,从而能够成功解读FLG基因,发现突变,且该方法实验过程稳定、成本低、操作簡单、 工作量小、易推广。
[0018] 根据本发明的又-一方画,本发明提供了一种确定待测样本FLG基因编码区核酸序 列釣方法。根据本发明的实施例,该方法包括W下步骤;稷据前面所述的构建高通量测序文 库的方法,构建特测样本的高通量测序文库,所述高通量测序文库包含FLG基因编码区核 酸序列;牺所述待测#本的高通量测序文库迸行测序,W便获得测序结果;茲及基于所述 汲賠结果,确定所述特测样本FLG基因编码区的核酸序列。
[001引发明人发现,本发明所采用的一组探钟对其特异性识别的FLG基因编码区的至少 ----部分的捕获轉异性好、灵敏度和覆盖度非常高,能够育效用于FLG基因编码区的搞获检 巧ij。迸而,利羯本发明的方法能够准确有效地捕获探针特异性识别的目标序列-------------FLG基因 编码区的至少一部分,构建目标序列的核酸测序文库,并迸行高通量测序,从而能够有效确 定FLG基因编码区釣至少一郭分的序列信息,并畳目标序列釣测序深度高,数据利羯率高, 迸而能壌实现对FLG基因的检测。此外,利用本发明的方法构建高通量测序文库,并滿定待 测样本FLG基因编码区核酸序列,轉异性好、灵敏度和覆盖度廣,巧重复性好,结果推确可 靠,从而能够成功解读FLG基因,发现突变,且该方法实验过程稳定、成本低、操作筒单、工 作量小、易推广。
[0020] 根据本发明的再一方面,本发明提供了一种构建高通量测序文库的装置。根据本 发明的实施例,该装置包括:片段化单元,所述片段化单元羯于将基因组MA片段化,W便 获得日NA片段;末端修复单元,所述末端修复单元与所述片段化单元指连,用于将所述DNA 片段迸行末端修复,W便获得经过末端修复的DNA片段;碱基A添加单元,所述碱基A添加 单元与所述末端修复单元相连,用于在所述经过末端修复的DNA片段的3'末端添加碱基A, W便获得具有粘性末端A的MA片段;接头连接单元,所述接头连接单元羯于蒋所述具有粘 性末端A的DNA片段与接头相连,W便获得连接产物;化及筛选率元,所述筛选阜元与所述 接头连接单元相连,并设置有前面所述的一组探针,屬于利用所述一组探针对所述连接产 物进行歸选,W便获得目的片段,所述目的片段构成所述高通量测序文库。
[0021] 根据本发明的实施例,本发明所采用的一组探转捉其特异性识郭的円石基因编码 区的至少一部分的搞获特异性好、灵敏度和覆盖度非常高,能够有效用于遥行FLG基因编 码区的顯获检测。进而,利用本发明的装置能够准确有效地捕获探转特异性识别的肖栋序 列-----------FLG基因编與区的至少一部分,并构建目标序列的核酸测序文库,迸而蒋该核酸测序 文库用于高通量测序后,能够有效确定FLG基因编妈区的至少一轟分的序列信息,并豆目 标序列的测序深度高,数据利羯率高,迸而能够有效实现对FLG基因的检测。赔外,利用本 发明的装置构建高通量测序文库,迸而用于FLG基因检测,轉异性好、灵敏度和覆盖度高, 可重复性好,从而能壌成功解读FLG基因,发现突变,且该装置结构簡单,适用的实验过程 稳定、生产成本低、操作简单、易推广。
[0曰创根据本发明的另一方面,本发明还提供了…-种确定待测样本阿怎基因编码区核酸 序列的系统。根据本发明的实施例,该系统包括;文库构建装置,所述文库构建装置为前面 所述的构建高通量测序文库的装置,用于构建特测样本的高通量测序文库,所述高通量测 序文库包含FLG基因编码区核酸序列:测序装置,所述测序装置与所述文库构建装置相连, 用于对所述待测样本的高通量测序文库迸行测序,W便获得测序结果;W及分析装置,所述 分析装置与所述测序装置相连,屬于基于所述测序结果,确定所述待测样本FLG基因编码 区的核酸序列。 的0巧]发明人发现,本发明所采用的--组探针对其特异性识割的円X;基因编码区的至少 --郭分的捕获特异性好、灵敏度和覆盖度非常高,能够有效用于FLG基因编妈区的搞获检 巧ij。迸而,利屬本发明的系统能够准确有效地補获探针特异性识副的目标序列--FLG基因 编码区的至少一部分,构建目标序列的核酸测序文库,并迸行高通量测序,从而能够畜效擁I 定化G基因编码区的至少--部分的序列信息,并畳目标序列的测序深度高,数据利羯率廣, 迸而能够实现对FLG基因的检测。此外,利用本发明的系统构建高通量测序文摩,并擁定待 测样本FLG基因编码区核酸序列,轉异性好、灵敏度和覆盖度高,巧重复性好,结果灌确可 需,从耐能够成巧鮮读FLG蟲因,发现炎变,瓦该系统结构简毕,馈用的实验过程據巧、生产 成本低、操作简单、易推广。
[0024] 本发明的附加方面和优点蒋在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[002引本发明的上述和/或附加的方面和优点从结合T面附图对实施例的摇述中将变 得明显和容易理解,其中;
[0026] 國1显示了根据本发明一个实施例,本发明的构建高通量测序文库的装置的结构 示意图;
[0027] 图2显示了稷据本发明一个实施例,本发明的确定待测样本FLG基因编码区核駿 序列的.巧统的结构可;意图;
[0028] 图3显示了根据本发明--个实施例,插入片段的大小和分布情况;
[002引图4显示了根据本发明一个实施例,测序数据亂质量分布图;
[0030] 图5显示了根据本发明一个实施例,单个碱基的平巧测序错误率评估结果图; [003U 图6显示了根据本发明一个实施例,样本的GC含量分布情况;
[0032] 國7显示了根据本发明--个实施例,较差的reads的拭:(AT)含量分布情况;
[0033] 图8显示了根据本发明一个实施例,信息分析结果报告文件截取图;
[0034] 图9显示了根据本发明一个实施例,肖标基因 FLG的各个CDS的深度、覆盖度的缓 计结果; 防035] 图10显示了根据本发明一个实施例,样本的阜碱基深度複松分布图;
[0036] 图11显示了 1畏据本发明一个实施例,经生物信息分析后样本FLG部分数据截图; 贿巧图12墨示了根据本发明一个实施例,数据解读的流程示意图;
[0038] 图13显示了很据本发明一个实施例,突变检测的结果;
[0039] 國14显示了根据本发
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1