适用于多样本的扩增子文库构建的引物、扩增子文库及其构建方法_3

文档序号:8375970阅读:来源:国知局
实施例中,采用上述序列的引物对环境中的微生物的16SV4、18S V4或ITS1的多样本扩增子文库进行构建时,所构建的多样本扩增子文库测序质量高且产 出的有效数据量也较高。
[0032] 在本发明另一种典型的实施方式中,提供了一种多样本的扩增子文库的构建方 法,该构建方法包括:利用目标区域扩增引物分别对多个不同样本的目标区域进行扩增,得 到多个样本的目标片段;对多个样本的目标片段进行接头连接,得到多样本的扩增子文库; 其中,目标区域扩增引物为上述任一种引物;或者目标区域扩增引物为上述任一种引物和 由样本标签序列和保守区扩增序列组成的引物。
[0033] 本发明的上述扩增子文库构建方法,通过采用上述任一种带有错位碱基序列的引 物作为目标区域扩增引物,使得扩增得到的文库在测序时能够大大减低测序仪的出错几 率,提高测序质量,而且增加了目标片段的多样性,减少了平衡文库的添加比例,提高有效 数据量。同样,当将上述任一种带有错位碱基序列的引物与现有技术中的由仅含有保守区 扩增序列的引物同时用于多个样本的扩增子文库构建时,现有技术中的引物所扩增的样本 的目标片段与本发明所改进后的引物所扩增的样本的目标片段混合,同时进行后续的文库 构建流程,得到的多样本的测序文库,由于具有相同保守区域序列的样本数目相对降低,目 标片段的多样性大大增加,因而所构建的文库的测序质量和测序数据有效量也得到大大提 尚。
[0034] 上述当目标区域扩增引物为上述任一种带有错位碱基序列的引物和由现有技术 中的样本标签序列和保守区扩增序列组成的引物时,多样本的扩增子文库中含有的错位碱 基序列中的碱基数为〇~5。当所构建得到的扩增子由现有技术的引物扩增而成时,因其中 不含有错位碱基序列,也可以认为是错位碱基序列中含有〇个碱基,因而所形成的多样本 的扩增子文库中所含有的错位碱基序列中碱基的数目涵盖了 〇~5的6种情况。
[0035] 本发明的上述构建方法中,除了所使用的引物与现有技术不同外,其余步骤与现 有技术相同。这样既解决了所建文库测序质量差和有效数据量少的缺陷,又能与现有的测 序平台接轨,采用通用的接头和扩增引物即可完成后续文库构建的工艺流程。因而在上述 接头连接的步骤中,在多个样本的目标片段两端分别连上P5和P7接头,得到本发明的上述 多样本的扩增子文库。
[0036] 在本发明又一种典型的实施方式中,还提供了一种多样本的扩增子文库,该扩增 子文库采用上述任一种构建方法构建而成。采用上述构建方法所构建的多样本的扩增子文 库,由于在现有通用的保守区扩增序列之前增加了不同碱基数目的错位碱基序列,提高了 目的扩增子的序列多样性,减少了平衡文库的占比,进而使得测序质量和有效数据量大大 提尚。
[0037] 下面结合具体的实施例来进一步说明本发明的有益效果。
[0038] 需要说明的是,下列实施例1~3中斜体部分的序列表示样本标签序列;黑体部分 表示错位碱基序列,黑体部分后面的序列表示保守区扩增序列。
[0039] 实施例1 :一种应用于16SV4扩增子文库构建的引物设计如下:
[0040] 正向引物:(5'一3,)
【主权项】
1. 一种适用于多样本的扩增子文库构建的引物,其特征在于,所述引物包括错位碱基 序列和保守区扩增序列;所述错位碱基序列是一个或多个碱基排列形成的序列,且 当所述多样本的数量小于4时,所述多样本的所述错位碱基序列在相同位置上的碱基 类型各不相同; 当所述多样本的数量为4n,且n为大于等于1的自然数时,所述多样本的所述错位碱基 序列在相同位置上的碱基类型为A、T、C和G均匀分布; 当所述多样本的数量为4n+m,且n为大于等于1的自然数,m为1、2或3时,其中,所述 多样本中的4n个样本的所述错位碱基序列在相同位置上的碱基类型为A、T、C和G均匀分 布;剩余m个样本的所述错位碱基序列在相同位置上的碱基类型按照m的不同分别为A、T、 C和G中的任意1种、2种或3种。
2. 根据权利要求1所述的引物,其特征在于,所述错位碱基序列中碱基的数目小于等 于5。
3. 根据权利要求1所述的引物,其特征在于,当所述多样本的数量小于等于5时,任意 两个样本之间的所述错位碱基序序列中的所述碱基的数目至少相差1个。
4. 根据权利要求1所述的引物,其特征在于,当所述多样本的数量大于5时,至少两个 样本的所述错位碱基序序列中的碱基数目相同。
5. 根据权利要求1至4中任一项所述的引物,其特征在于,所述引物还包括样本标签序 列,所述样本标签序列为6~12个碱基随机排列所形成的序列。
6. 根据权利要求5所述的引物,其特征在于,所述引物为16SV4、18SV4或ITSl多样 本扩增子文库构建的引物; 当所述引物为16SV4多样本扩增子文库构建的引物时,所述引物包括: 16SV4 正向序列:SEQIDNO:1、SEQIDNO:2、SEQIDNO:3、SEQIDNO:4 和SEQID NO:5 ; 16SV4 反向序列:SEQIDNO:6、SEQIDNO:7、SEQIDNO:8、SEQIDNO:9 和SEQID NO:10 ; 当所述引物为18SV4多样本扩增子文库构建的引物时,所述引物包括: 18SV4 正向序列:SEQIDN0:11、SEQIDN0:12、SEQIDN0:13、SEQIDN0:14 和SEQ IDNO:15 ; 183¥4反向序列:5£〇10勵:16、5£〇10勵:17、5£〇10勵 :18、5£〇10勵:19和5£〇IDNO:20 ; 当所述引物为ITSl多样本扩增子文库构建的引物时,所述引物包括: ITSl正向序列:SEQIDNO:21、SEQIDNO:22、SEQIDNO:23、SEQIDNO:24 和SEQ IDNO:25 ; ITSl反向序列:SEQIDNO:26、SEQIDNO:27、SEQIDNO:28、SEQIDNO:29 和SEQ IDNO:30〇
7. -种多样本的扩增子文库的构建方法,其特征在于,所述构建方法包括: 利用目标区域扩增引物分别对多个不同样本的目标区域进行扩增,得到多个样本的目 标片段; 对所述多个样本的目标片段进行接头连接,得到所述多样本的扩增子文库; 其中,所述目标区域扩增引物为权利要求1至6中任一项所述的引物;或者所述目标区 域扩增引物为权利要求1至6中任一项所述的引物和由样本标签序列和保守区扩增序列组 成的引物。
8. 根据权利要求7所述的构建方法,其特征在于,当所述目标区域扩增引物为权利要 求1至6中任一项所述的引物和由样本标签序列和保守区扩增序列组成的引物时,所述多 样本的扩增子文库中含有〇~5个碱基排列形成的错位碱基序列。
9. 根据权利要求7所述的构建方法,其特征在于,所述接头连接的步骤中,在所述多个 样本的目标片段两端分别连上P5和P7接头,得到所述多样本的扩增子文库。
10. -种多样本的扩增子文库,其特征在于,所述扩增子文库采用权利要求7至9中任 一项所述的构建方法构建而成。
【专利摘要】本发明公开了一种适用于多样本的扩增子文库构建的引物、扩增子文库及其构建方法。该引物包括错位碱基序列和保守区扩增序列;错位碱基序列是一个或多个碱基排列形成的序列,且多样本的错位碱基序列在相同位置上的碱基的类型如下:当多样本的数量小于4时,各不相同;当多样本的数量为4n,n为≧1的自然数时,为A、T、C和G均匀分布;当多样本的数量为4n+m,n为≧1的自然数,m为1、2或3时,4n个样本为A、T、C和G均匀分布;剩余m个样本按照m的不同分别为A、T、C和G中的任意1种、2种或3种。上述引物中增加了错位碱基序列,所构建的文库测序时能将相似性较高的不同样本的序列分开,有效提高测序质量和有效数据量。
【IPC分类】C40B40-06, C12N15-11, C40B50-06
【公开号】CN104694540
【申请号】CN201510152710
【发明人】李宗文, 胡政, 王大伟, 蒋智, 李明洲, 刘运超, 朱海浩
【申请人】北京诺禾致源生物信息科技有限公司
【公开日】2015年6月10日
【申请日】2015年4月1日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1