用于在纳米孔隙装置中定位特征的逻辑驱动多核苷酸扫描的制作方法

文档编号:30012451
研发日期:2022/5/13

本申请要求2020年3月31日提交的美国临时专利申请号63/003,129;2019年8月6日提交的62/883,449;和2020年1月17日提交的62/962,838的优先权,这些申请的每一个通过引入整体并入本文。

引言

在高度异质的样品中,分子基序的结合位置沿着长的、单个dsDNA链的精确定位是“超出”测序的广泛基因组学应用的核心。一种用于分子特征定位的候选方法是基于测量当双链DNA(dsDNA)被电驱动通过固态纳米孔隙(ss-纳米孔隙)时产生的离子电流的调制。纳米孔隙是有吸引力的,因为它们具有纯电子读数,从而导致占地面积小并显著降低成本。存在(1)对移位分子的一致线性化的需要,(2)对降低引入随机误差的分子波动的影响的需要,和(3)对开发进行准确的基因组距离校准的策略的需要。



技术实现要素:

本公开提供了定位靶多核苷酸的一个或多个特征的自动化方法。本公开还提供了用于对多核苷酸序列进行测序的自动化方法。本公开还提供了在纳米孔隙装置中扩展再捕获多核苷酸的方法。本公开还提供了用于执行本公开的方法的装置和系统。

本公开的方面是用于在纳米孔隙装置中部分或完全再捕获先前捕获的多核苷酸的方法,所述方法包括:a)提供具有至少一个纳米孔隙的装置,所述装置包含:(i)位于腔室和第一流体体积之间并流体连接所述腔室和第一流体体积的第一孔隙,所述第一流体体积是几何约束的外壳,(ii)包含用于流体填充和电极接入的入口和出口的第一流体体积,其中所述第一孔隙在所述入口和出口之间的位置连接到所述第一流体体积,(iii)位于第一流体体积内的至少一个电极和位于腔室内的至少一个电极,(iv)传感器,其被配置以提供:在所述第一流体体积内的电极与所述腔室内的电极之间的电压,以及检测所述多核苷酸的捕获并使其移位进入并通过第一孔隙的电流测量值;b)将所述多核苷酸加载到所述装置的腔室中;c)施加第一电压以捕获所述多核苷酸并在第一方向上从所述腔室使其移位通过第一孔隙并进入第一流体体积中;d)当所述多核苷酸在第一方向上移位通过第一孔隙时在第一传感器电流中检测;e)当所述多核苷酸包含在所述第一流体体积内时施加等于0mV的第二电压一个时间段;f)施加第三电压以从所述第一流体体积再捕获所述多核苷酸并使其部分或完全移位通过第一孔隙并进入腔室中;和g)当所述多核苷酸已经部分或完全移位通过第一孔隙时在第一传感器电流中检测。

在一些实施方案中,所述纳米孔隙装置还包含第二孔隙。

在一些实施方案中,所述第一流体体积是流体通道。

在一些实施方案中,所述多核苷酸在执行步骤(e)之前被捕获并移位通过第一孔隙的所述检测步骤(d)期间表现出最小持续时间,其作为多核苷酸超过最小长度的指示。

在一些实施方案中,当最小持续时间长于阈值时将多核苷酸鉴别为靶标,并且当持续时间短于阈值时将多核苷酸鉴别为非靶标。

在一些实施方案中,在第一电压下捕获所述多核苷酸并使其移位通过第一孔隙的步骤(d)中的所述检测,将第一电压维持30ms至500ms或更长的时间段。

在一些实施方案中,将步骤(e)中等于0的第二电压维持10ms至5sec或更长的时间段。

在一些实施方案中,将步骤(e)中等于0的第二电压维持足以允许分子熵松弛(entropically relax)到平衡构型的时间段。

在一些实施方案中,所述多核苷酸的第一末端位于远离所述至少第一孔隙的5微米至5毫米或更大的距离处。

在一些实施方案中,所述多核苷酸的第二末端位于远离所述至少第一孔隙的2微米至5毫米或更大的距离处。

在一些实施方案中,所述方法还包括重复步骤c)至g)。

在一些实施方案中,所述腔室位于至少第一孔隙上方。

在一些实施方案中,所述腔室连接到相对于第一电压的公共接地。

在一些实施方案中,所述纳米孔隙装置还包含第二孔隙。

在一些实施方案中,所述第二孔隙流体连接到第二流体体积,其中第二流体体积是具有第二入口和第二出口的几何约束的外壳,并且第二孔隙在所述入口和出口之间流体连接到第二流体体积。

在一些实施方案中,所述第二流体体积是第二流体通道。

在一些实施方案中,所述第二孔隙连接到腔室和第二流体体积。

在一些实施方案中,所述腔室位于第一孔隙和第二孔隙上方。

在一些实施方案中,所述第一电压施加在第一流体体积和腔室之间。

在一些实施方案中,所述纳米孔隙装置包含位于第二流体体积内的至少一个电极,其中所述至少一个电极被配置以在第二孔隙处提供电压,所述电压可独立于第一孔隙处的电压控制。

在一些实施方案中,所述纳米孔隙装置包含配置用于第一孔隙和第二孔隙处的电压控制和电流测量的双放大器电子器件。

在一些实施方案中,所述方法还包括检测第二传感器电流。

在一些实施方案中,所述方法还包括在检测第二传感器电流后,调节第一孔隙处的第一电压并设定第二孔隙处的第一电压,使得所述多核苷酸的至少一部分移动通过第一孔隙和第二孔隙。

在一些实施方案中,所述第二孔隙处的第一电压高于所述第一孔隙处的第一电压。

在一些实施方案中,所述第二孔隙处的第一电压高于所述第一孔隙处的第三电压。

在一些实施方案中,所述第三电压高于所述第一电压。

在一些实施方案中,所述第二电压为0mV。

在一些实施方案中,所述第一电压范围为50-900mV。

在一些实施方案中,所述第一电压范围为50-900mV。

在一些实施方案中,所述第三电压范围为50-900mV。

在一些实施方案中,所述第二孔隙处的第一电压范围为50-900mV。

在一些实施方案中,所述第一孔隙处的第一电压、所述第一孔隙处的第三电压和第二孔隙处的第一电压独立地为50mV至900mV的大小。

在一些实施方案中,作为几何约束的外壳的第一流体体积在第一孔隙的相对侧上。在一些实施方案中,作为几何约束的外壳的第二流体体积在所述第二孔隙的相对侧上。

在一些实施方案中,所述多核苷酸是基本上线性化的。在一些实施方案中,多核苷酸通过调节第一电压、第二电压、第三电压或其组合的操作而基本上线性化。

在一些实施方案中,所述多核苷酸在步骤f)中在第二方向上移动,其中第二方向是从第一流体体积通过第一孔隙。

在一些实施方案中,所述方法还包括调节第一孔隙处的第三电压、第二孔隙处的第一电压或两者,以改变多核苷酸的方向,使得所述多核苷酸的至少一部分在第一方向上从第二孔隙移动通过第一孔隙。

在一些实施方案中,所述调节第一孔隙处的第三电压、第二孔隙处的第一电压或两者,使得多核苷酸的至少一部分在第一方向和/或第二方向上移动被重复30ms至5分钟或更长的时间段直到多核苷酸离开所述装置。

在一些实施方案中,第一电压施加在装置的腔室和第二流体体积之间。

在一些实施方案中,第一电压在30ms至500ms或更长的时间段内施加。

在一些实施方案中,所述方法还包括当多核苷酸在第一方向上处于两个孔隙中时,检测多核苷酸上的第一组特征。

在一些实施方案中,所述方法还包括当多核苷酸在第二方向上同时处于两个孔隙中时,检测多核苷酸上的第二组特征。

在一些实施方案中,所述方法包括调节第一电压,使得多核苷酸移动通过第一孔隙30ms至500ms或更长的时间段。

在一些实施方案中,所述多核苷酸经过第一孔隙、腔室和第二孔隙。

在一些实施方案中,所述方法还包括当多核苷酸在第一方向或第二方向上处于两个孔隙中时,检测第一孔隙处的第三传感器电流和第二孔隙处的第四第二电流。

在一些实施方案中,所述方法还包括当多核苷酸在第一方向或第二方向上处于两个孔隙中时,检测第一孔隙处的第五传感器电流和第二孔隙处的第六传感器电流。

在一些实施方案中,第一电压产生跨第一孔隙并沿着第一流体体积的长度的电压梯度。

在一些实施方案中,第三电压产生跨第二孔隙并沿着第二流体体积的长度的电压梯度。

在一些实施方案中,第一流体通道的阻力与第一流体通道宽度成反比。

在一些实施方案中,第二流体通道的阻力与第二流体通道宽度成反比。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的体积成比例。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的体积成比例。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的半径成比例。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的截面半径成比例。

在一些实施方案中,多核苷酸是基本上线性化的。

在一些实施方案中,多核苷酸通过调节第一电压、第二电压,第三电压或第一电压、第二电压和第三电压的组合的操作而基本上线性化。

在一些实施方案中,所述方法还包括当所述多核苷酸需要第二次或第三次重新扫描多核苷酸的一个或多个特征时,利用控制器控制。

在一些实施方案中,第一流体通道和/或第二流体通道包含几何约束的体积。

在一些实施方案中,所述控制器确定在第一方向和/或第二方向上对多核苷酸的一个或多个特征中的哪一个执行一个或多个特征的额外再捕获。

在一些实施方案中,所述方法还包括从已经再捕获的多核苷酸的一个或多个特征移开。

在一些实施方案中,第一电压、第二电压和第三电压的范围为0mV至1000mV。

在一些实施方案中,第一电压、第二电压和第三电压的范围为0mV至100mV。

在一些实施方案中,第一电压、第二电压和第三电压的范围为100mV至200mV。

在一些实施方案中,第一电压、第二电压和第三电压的范围为200mV至300mV。

在一些实施方案中,第一电压、第二电压和第三电压的范围为300mV至400mV。

在一些实施方案中,第一电压、第二电压和第三电压的范围为400mV至500mV。

在一些实施方案中,第一孔隙的第一电压低于第二电压。

在一些实施方案中,第一孔隙的第一电压高于第二电压。

在一些实施方案中,第一孔隙的第一电压和第二孔隙的第二电压是相同的。

在一些实施方案中,在第一方向上,第一孔隙的第一电压和第一孔隙的第二电压是相同的。

在一些实施方案中,在第二方向上,第一孔隙的第一电压低于第一孔隙的第二电压。

在一些实施方案中,在第三方向上,第一孔隙的第一电压低于第二孔隙的第三电压。

在一些实施方案中,在第四方向上,第一孔隙的第一电压高于第二孔隙的第三电压。

在一些实施方案中,所述方法还包括经由控制器、处理器和非暂时性计算机可读介质控制多核苷酸通过第一孔隙和/或第二孔隙的方向,所述非暂时性计算机可读介质包括使处理器改变靶多核苷酸的方向的指令。

在一些实施方案中,所述处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器是微控制器。

在一些实施方案中,所述再捕获提供对包含长度范围为300个碱基对至约3,000,000个碱基对的多核苷酸序列的多核苷酸的检测。

在一些实施方案中,第一流体通道和/或第二流体通道具有从入口到出口约0.05mm至约8mm的长度。

在一些实施方案中,第一流体通道和/或第二流体通道具有20-500μm的宽度。

在一些实施方案中,第一流体通道和/或第二流体通道具有0.5μ.至约2约m的深度。

在一些实施方案中,所述传感器还被配置以提供:在所述第二流体体积内的所述电极和腔室内的所述电极之间的电压,和检测所述多核苷酸的捕获并使其移位进入并通过第一孔隙和第二孔隙的电流测量值。

在一些实施方案中,多核苷酸的长度是第一孔隙与第二孔隙之间、腔室与第一流体体积之间和/或腔室与第二流体体积之间的距离的至少2倍、至少3倍、至少4倍或至少5倍。

在一些实施方案中,第一电压维持0-1000毫秒、0-20毫秒、20-50秒、50-100秒、100-500秒或500-1000秒的时间段。

在一些实施方案中,第一电压维持20ms或更多、50ms或更多、120ms或更多、150ms或更多、300ms或更多、500ms或更多、1000毫秒或更多、20秒或更多、60秒或更多、120秒或更多、150秒或更多、300秒或更多、500秒或更多或1000秒或更多的时间段。

在一些实施方案中,第一电压在靶多核苷酸捕获并移位通过第一孔隙后维持一段时间。

本公开的方面包含用于定位靶多核苷酸的一个或多个特征的方法,所述方法包括以下步骤:a)提供用于控制所述靶多核苷酸同时通过第一孔隙和第二孔隙移动的装置,所述装置包含:(i)位于腔室与第一流体体积之间并且流体连接所述腔室和第一流体体积的第一孔隙,所述第一流体体积是几何约束的外壳,(ii)位于腔室和第二流体体积之间并且流体连接腔室和第二流体体积的第二孔隙,所述第二流体体积是几何约束的外壳;(iii)各自包含用于流体填充和电极接入的入口和出口的第一流体体积和第二流体体积,其中所述第一孔隙在所述入口和出口之间的位置连接到所述第一流体体积的几何约束的外壳,并且其中所述第二孔隙在所述入口和出口之间的位置连接到所述第二流体体积的几何约束的外壳,(iv)位于第一流体体积内的至少一个电极、位于第二流体体积内的至少一个电极以及位于腔室内的至少一个电极,(v)传感器,其被配置以提供:在所述第一流体体积内的所述电极与所述腔室内的所述电极之间的电压;在所述第二流体体积内的所述电极与所述腔室内的所述电极之间的电压,以及检测所述多核苷酸的捕获及其部分或完全移位进入并通过第一孔隙的电流测量值;以及检测所述多核苷酸的捕获及其部分或完全移位进入并通过第二孔隙的电流测量值;b)加载所述靶多核苷酸到所述装置的腔室中;c)在所述第一孔隙处施加第一电压并在所述第二孔隙处施加第一电压以捕获所述靶多核苷酸并使其移位通过第一孔隙和进入第一流体体积中;d)在所述第一孔隙处施加第二电压并在所述第二孔隙处施加第二电压以从所述第一流体体积再捕获所述靶多核苷酸并使其部分或完全移位通过第一孔隙;e)在所述第一孔隙处施加第三电压,并在所述第二孔隙处施加第三电压,使得所述靶多核苷酸的至少一部分被所述第二孔隙捕获,同时保留在所述第一孔隙中;f)在所述第一孔隙处施加第四电压并在所述第二孔隙处施加第四电压以控制所述靶多核苷酸的运动方向;和g)当每个特征经过第一孔隙时,在第一传感器电流中检测多核苷酸上的第一组特征,并且当每个特征经过第二孔隙时,再次在第二传感器电流中检测。

在一些实施方案中,所述方法还包括h)在所述第一孔隙处施加第五电压并在所述第二孔隙处施加第五电压以逆转所述靶多核苷酸的运动方向;和i)当每个特征经过第二孔隙时,在第二传感器电流中检测多核苷酸中的第二组特征,并且当每个特征经过第一孔隙时,再次在第一传感器电流中检测。

在一些实施方案中,作为几何约束的外壳的第一流体体积在第一孔隙的相对侧上。在一些实施方案中,作为几何约束的外壳的第二流体体积在第二孔隙的相对侧上。

在一些实施方案中,所述腔室位于装置的第一孔隙和第二孔隙上方。

在一些实施方案中,步骤(e)中第二孔隙处的第三电压大于第一孔隙处的第三电压。

在一些实施方案中,步骤(e)中第一孔隙处的第三电压为0mV。

在一些实施方案中,步骤(d)中的靶多核苷酸从第一流体体积部分移位通过第一孔隙。

在一些实施方案中,步骤(d)中的靶多核苷酸从第一流体体积完全移位通过第一流体孔隙。

在一些实施方案中,所述方法包括在步骤(e)之前重复步骤(c)和(d)。

在一些实施方案中,第一孔隙处的第四电压的大小大于第一孔隙处的第三电压的大小以控制靶多核苷酸的方向。

在一些实施方案中,第一孔隙处的第四电压的大小小于第二孔隙处的第四电压的大小,使得靶多核苷酸继续移向第二孔隙,其中第一孔隙处的第四电压的极性使得电压将靶多核苷酸从腔室拉向第一流体体积,并且第二孔隙处的第四电压的极性使得电压将靶多核苷酸从腔室拉向第二流体体积。

在一些实施方案中,步骤(f)中第一孔隙处的第四电压的大小小于第二孔隙处的第四电压的大小。

在一些实施方案中,步骤(h)中第一孔隙处的第五电压的大小大于第二孔隙处的第五电压的大小。

在一些实施方案中,步骤(c)中第一孔隙处的第一电压的极性使得所述电压将靶多核苷酸从腔室拉向第一流体体积。

在一些实施方案中,在步骤(c)中靶多核苷酸移位期间,所述流体体积相对于腔室具有正极性。

在一些实施方案中,步骤(d)中第一孔隙处的第二电压的极性使得所述电压将靶多核苷酸从第一流体体积拉向腔室。

在一些实施方案中,在步骤(d)中靶多核苷酸部分或完全移位期间,所述腔室相对于第一流体体积具有正极性。

在一些实施方案中,在步骤(c)中,靶多核苷酸在30ms至500ms或更长的时间段内从腔室部分或完全移位通过第一孔隙并进入第一流体通道中。

在一些实施方案中,在步骤(d)中,靶多核苷酸在30ms至500ms或更长的时间段内在第一方向上从第一流体通道部分或完全移位通过第一孔隙并进入腔室中。

在一些实施方案中,所述方法包括,在每个检测步骤之前,扫描多核苷酸的一个或多个特征。

在一些实施方案中,所述方法还包括在步骤g)中当每个特征经过第二孔隙时检测多核苷酸上的一个或多个特征,所述特征在经过第一孔隙时未检测到。

在一些实施方案中,所述方法包括,在步骤c)和d)之间,扫描靶多核苷酸上的一个或多个特征,并且当靶多核苷酸经过第一孔隙时检测第一组特征。

在一些实施方案中,步骤c)至i)包括在两个方向上的特征检测的第一循环。

在一些实施方案中,所述方法还包括在两个方向上的特征检测的第二循环中重复步骤c)至i)以检测第三组和第四组特征。

在一些实施方案中,第一孔隙处的第一电压施加在第一流体体积和腔室之间,并且第二孔隙处的第一电压施加在装置的腔室和第二流体体积之间。

在一些实施方案中,第一流体体积是第一流体通道,并且第二流体体积是第二流体通道。

在一些实施方案中,多核苷酸在30ms至500ms或更长的时间段内从第一流体通道部分或完全移位通过第一孔隙并进入腔室中。

在一些实施方案中,靶多核苷酸的一部分在30ms至500ms或更长的时间段内从第一孔隙移动通过第二孔隙。

在一些实施方案中,靶多核苷酸的至少一部分在30ms至500ms或更长的时间段内从腔室移动通过第二孔隙并进入第二流体通道中。

在一些实施方案中,靶多核苷酸移位通过第一孔隙、通过第二孔隙或通过第一孔隙和第二孔隙。

在一些实施方案中,多核苷酸的特征组的检测是利用来自第一孔隙、第二孔隙或两者的离子电流事件来完成的。

在一些实施方案中,所述检测包括在步骤(g)中当一个或多个特征在第一方向上经过第一孔隙时检测第一离子电流事件,和在步骤(g)中当一个或多个特征在第一方向上经过第二孔隙时检测第二离子电流事件。

在一些实施方案中,所述检测包括在步骤(h)中当一个或多个特征在第二方向上经过第一孔隙时检测第三离子电流事件,和在步骤(h)中当一个或多个特征在第二方向上经过第二孔隙时检测第四离子电流事件。

在一些实施方案中,多核苷酸的第一末端位于第一流体通道中,其与第一孔隙相距5微米至5毫米或更大的距离。

在一些实施方案中,靶多核苷酸的第二末端位于第一流体通道中,其与至少第一孔隙相距5微米至5毫米或更大的距离。

在一些实施方案中,靶多核苷酸从第二孔隙移动到第二流体通道中。

在一些实施方案中,靶多核苷酸的至少一部分从第二流体通道移动通过第二孔隙并进入腔室中5ms至500ms的时间段。

在一些实施方案中,靶多核苷酸的第一末端位于第二流体通道中,其与第二孔隙相距5微米至5毫米或更大的距离。

在一些实施方案中,靶多核苷酸的第二末端位于第二流体通道中,其与第二孔隙相距2微米至5毫米或更大的距离。

在一些实施方案中,第一孔隙处的第一电压维持0-1000毫秒、0-20毫秒、20-50秒、50-100秒、100-500秒或500-1000秒的时间段。

在一些实施方案中,第一孔隙处的第一电压维持20ms或更多、50ms或更多、120ms或更多、150ms或更多、300ms或更多、500ms或更多、1000毫秒或更多、20秒或更多、60秒或更多、120秒或更多、150秒或更多、300秒或更多、500秒或更多或1000秒或更多的时间段。

在一些实施方案中,第一电压维持靶多核苷酸捕获并移位通过第一孔隙后的时间段。

在一些实施方案中,所述方法还包括,在步骤c)和d)之间,调节第一电压至0mV的中间电压0-1000毫秒、0-20毫秒、20-50秒、50-100秒、100-500秒或500-1000秒的时间段。

在一些实施方案中,所述方法还包括,在步骤c)和d)之间,将所述第一电压调节至0mV的中间电压10ms至5秒或更长的范围内的时间段。

在一些实施方案中,所述方法还包括,在步骤c)和d)之间,将所述第一电压调节至0mV的中间电压10ms至5秒或更长、5秒至50秒或更长、50秒至60秒或更长、60秒至120秒或更长、120秒至180秒或更长、180秒至240秒或更长或240秒至300秒或更长的时间段。

在一些实施方案中,所述将第一电压调节至0mV的中间电压维持足以允许多核苷酸熵松弛至平衡构型的时间段。

在一些实施方案中,多核苷酸在第一流体体积或第二流体体积的几何约束的外壳内10ms至5秒或更长、5秒至50秒或更长、50秒至60秒或更长、60秒至120秒或更长、120秒至180秒或更长、180秒至240秒或更长或240秒至300秒或更长的时间段。

在一些实施方案中,多核苷酸在第二流体体积的几何约束的外壳内10ms至5秒或更长、5秒至50秒或更长、50秒至60秒或更长、60秒至120秒或更长、120秒至180秒或更长、180秒至240秒或更长或240秒至300秒或更长的时间段。

在一些实施方案中,第一孔隙处的第一电压、第二电压、第三电压和/或第四电压各自独立地为0mV至900mV的大小;并且第二孔隙处的第一电压、第二电压、第三电压和/或第四电压各自独立地为0mV至900mV的大小。

在一些实施方案中,步骤(e)中第一孔隙处的第三电压为0mV。

在一些实施方案中,步骤(e)中第二孔隙处的第三电压为25mV至600mV。

在一些实施方案中,所述方法还包括利用处理器从第一孔隙和第二孔隙中一种或多种特征的检测之间的时间差以及第一孔隙和第二孔隙之间的已知距离计算所述多核苷酸的一个或多个特征的速率。

在一些实施方案中,所述方法还包括利用处理器通过使用多核苷酸特征的所计算的速率,从第一孔隙的传感器电流、第二孔隙的传感器电流或两者中检测到的一个或多个特征之间的时间计算所述一个或多个特征的距离。

在一些实施方案中,多核苷酸在所述检测步骤(g)和检测步骤(i)期间显示其被捕获并部分或完全移位通过第一孔隙和/或通过第二孔隙的最小持续时间,作为多核苷酸超过最小长度的指示。

在一些实施方案中,当最小持续时间长于阈值时将多核苷酸上的特征鉴别为靶标,而当持续时间短于阈值时将特征鉴别为非靶标。

在一些实施方案中,所述方法还包括利用处理器对于每次扫描计算靶多核苷酸的一个或多个特征的速率。

在一些实施方案中,所述方法还包括利用处理器对于每次扫描使用速率的分布计算关于一个或多个特征的速率的统计。

在一些实施方案中,所述方法还包括利用处理器使用给定扫描和给定扫描方向上的所有特征的速率计算靶多核苷酸的速率的时间历程。

在一些实施方案中,靶多核苷酸是基本上线性化的。

在一些实施方案中,第一流体通道和/或第二流体通道具有约0.01mm至约5mm的长度。

在一些实施方案中,第一流体通道和/或第二流体通道具有约0.05μ.至约2约m的深度。

在一些实施方案中,第一流体通道和/或第二流体通道具有50-500μm的宽度。

在一些实施方案中,靶多核苷酸通过调节第一电压或第二电压或两者的操作而基本上线性化。

在一些实施方案中,第一电压产生跨至少第一孔隙并沿着第一流体通道的长度的电压梯度。

在一些实施方案中,第二电压产生跨至少第二孔隙并沿着第二流体通道的长度的电压梯度。

在一些实施方案中,第一流体通道的阻力与第一流体通道宽度成反比。

在一些实施方案中,第二流体通道的阻力与第二流体通道宽度成反比。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的体积成比例。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的体积成比例。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的半径成比例。

在一些实施方案中,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的截面半径成比例。

在一些实施方案中,靶多核苷酸通过调节在第一孔隙、第二孔隙或两者处的第一电压、第二电压、第三电压和/或第四电压的操作而基本上线性化。

在一些实施方案中,第一流体通道和/或第二流体通道包含几何约束的体积。

在一些实施方案中,所述控制器确定在第一方向和/或第二方向上对靶多核苷酸的一个或多个特征中的哪一个执行一个或多个特征的额外再捕获。

在一些实施方案中,所述方法还包括从已经再捕获的多核苷酸的一个或多个特征移开。

在一些实施方案中,所述方法还包括利用控制器控制:a)待扫描的特征的数量;b)待重新扫描的特征的数量;c)待扫描或重新扫描的特征的类型;d)待扫描或重新扫描的循环的次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;或h)其组合。

在一些实施方案中,所述方法还包括控制待扫描的特征的数量。

在一些实施方案中,所述控制器确定对一个或多个特征中的哪一个执行额外的扫描。

在一些实施方案中,所述方法还包括从已经扫描的一个或多个特征移开。

在一些实施方案中,所述方法还包括扫描多核苷酸上尚未被扫描的区域。

在一些实施方案中,所述方法还包括利用处理器构建每个多核苷酸的一致性图谱(consensus map)。

在一些实施方案中,所述构建包括机器学习算法,其基于训练数据和概率模型被训练以检测一个或多个特征。

在一些实施方案中,所述方法还包括利用处理器实时构建每个多核苷酸的局部图谱。

在一些实施方案中,所述方法还包括重复步骤c)至i)直到所述靶多核苷酸离开所述孔隙装置。

在一些实施方案中,所述方法防止靶多核苷酸从装置的腔室离开5ms至5分钟的时间段。

在一些实施方案中,所述方法防止靶多核苷酸从装置的第一流体通道或第二流体通道离开5ms至5分钟的时间段。

在一些实施方案中,所述一个或多个特征包含:a)与所述多核苷酸结合的一个或多个有效负荷分子;b)与所述多核苷酸杂交的一个或多个有效负荷分子;c)结合至多核苷酸基因组中的一个或多个有效负荷分子;d)所述靶多核苷酸的多核苷酸序列上的分子基序;或e)其组合。

在一些实施方案中,所述方法还包括确定靶多核苷酸的一个或多个特征的每个特征之间的距离。

在一些实施方案中,所述方法还包括确定靶多核苷酸的第一组特征中的每个特征之间的距离。

在一些实施方案中,所述方法还包括确定靶多核苷酸的第二组特征中的每个特征之间的距离。

在一些实施方案中,第一循环包括由处理器执行的一次或多次扫描以检测第一组特征。

在一些实施方案中,第一循环包括两次或更多次扫描、三次或更多次扫描、四次或更多次扫描、五次或更多次扫描、六次或更多次扫描、七次或更多次扫描、八次或更多次扫描、九次或更多次扫描或十次或更多次扫描。

在一些实施方案中,第二循环包括由处理器执行的一次或多次扫描以检测第三组特征。

在一些实施方案中,第二循环包括两次或更多次扫描、三次或更多次扫描、四次或更多次扫描、五次或更多次扫描、六次或更多次扫描、七次或更多次扫描、八次或更多次扫描、九次或更多次扫描或十次或更多次扫描。

在一些实施方案中,所述方法还包括对于第三循环、第四循环和第五循环;或当所述多核苷酸离开所述装置时,重复步骤c)至i)。

在一些实施方案中,第一组特征是一个或多个特征、两个或更多个特征、三个或更多个特征、四个或更多个特征、五个或更多个特征、六个或更多个特征、七个或更多个特征、八个或更多个特征、九个或更多个特征或者十个或更多个特征。

在一些实施方案中,第二组特征多于第一组特征。

在一些实施方案中,组合跨扫描组的特征组以产生每个靶多核苷酸的特征之间的位置和距离的图谱。

在一些实施方案中,所述一个或多个特征包含:DNA结合蛋白;多肽;抗DNA抗体;链霉亲和素;转录因子;组蛋白;肽核酸(PNA);DNA-发夹;DNA分子;适体;5-甲基胞嘧啶(5mC)区域;5-羟甲基胞嘧啶(5hmC)区域;核苷酸碱基;两个或更多个核苷酸碱基;或其组合。

在一些实施方案中,多核苷酸序列具有5个碱基对至约3,000,000个碱基对的长度。

在一些实施方案中,靶多核苷酸选自双链DNA、单链DNA、双链RNA、单链RNA和DNA-RNA杂合体。

在一些实施方案中,所述方法还包括经由控制器、处理器和非暂时性计算机可读介质控制靶多核苷酸通过第一孔隙和第二孔隙的方向,所述非暂时性计算机可读介质包括指令以使处理器在检测到第一组特征时,改变靶多核苷酸的方向。

在一些实施方案中,所述调节第一电压和第二电压实时发生,其中所述调节由使用硬件和软件的有源反馈控制器执行。

在一些实施方案中,所述方法还包括利用反馈控制器基于第一或第二或两者的离子电流测量的反馈来控制第一或第二电压。

在一些实施方案中,所述处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器是微控制器。

在一些实施方案中,FPGA或ASIC执行控制逻辑以改变:a)待扫描的特征的数量;b)待重新扫描的特征的数量;c)待扫描或重新扫描的特征的类型;d)待扫描或重新扫描的循环的次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些实施方案中,第一组特征和第二组特征是相同的。

在一些实施方案中,第一组特征和第二组特征是彼此不同的。

在一些实施方案中,所述控制器被配置以在第一方向、第二方向或两者上执行多核苷酸的控制电压频率扫描。

在一些实施方案中,所述控制器被配置以在第一方向、第二方向或两者上执行多核苷酸的控制电压振幅扫描。

在一些实施方案中,所述控制器被配置以调节多核苷酸的速率。

在一些实施方案中,速率范围为每毫秒0.1个碱基对至每毫秒10个碱基对。

在一些实施方案中,所述控制器被配置以调节第一电压和第二电压以便以多个速率执行多核苷酸的多次扫描。

在一些实施方案中,所述以多个速率执行多核苷酸的多次扫描提高了一个或多个特征的检测的准确性。

在一些实施方案中,所述方法包括以多个速率对多核苷酸执行多次扫描。

在一些实施方案中,所述控制器被配置以控制多核苷酸在第一方向、第二方向或两者上的速率范围。

在一些实施方案中,所述控制器被配置以当多核苷酸在第一方向、第二方向或两者上移动通过第一孔隙和第二孔隙时控制第一孔隙和第二孔隙的电压范围。

在一些实施方案中,所述控制器被配置以确定多核苷酸在第一方向、第二方向或两者上的最佳速率范围,其中多核苷酸的最佳速率范围降低了布朗运动对多核苷酸的影响。

在一些实施方案中,控制多核苷酸的速率范围包括确定用于测序的最佳多核苷酸速率。

附图说明

图1描绘了λ-DNA分子的基于DNA的标记。所描述的标签位于如同单-链霉亲和素的相同位置。DNA用相同的切口酶切割。不是在切口位点处掺入生物素标记的dUTP,而是掺入N3-dUTP。通过过滤去除过量的dUTP。具有5’DCBO基团的90-核苷酸寡聚物与DNA反应过夜(例如,使用无铜点击反应)。5’DBCO核苷酸包含核苷酸序列AAA AAA AAA AGG GAA AGG GAA AGG GAA AGA AAA AAA AAA AAA AAA AAA AGG GAA AGG GAA AAA AAA AAG AGA GAG AGA GAG AGA GAA GAG(SEQ ID NO:1)。

图2描述了通过改变DNA附着的尺寸和形状来调制纳米孔隙阻抗。

图3描述了随时间测量离子电流作为单孔隙中DNA分子的检测参数和用一种或多种探针标记DNA分子的验证的实例。

图4描述了读取标记分子的区域,并且然后将所述分子平移/滑动到不同的区域进行检测的实例。在这一非限制性实例中,在分子的一个或多个特征的定位中所涉及的算法包括以下:(a)初始化扫描计数=0;(b)双系统最初检测Ntag(在该实例中Ntag=2)个标签并启动拔丝(flossing);(c)每次新扫描开始时增加扫描计数;(d)在一定数量的拔丝扫描Nscan(在该实例中Nscan=4)之后,系统扫描第Ntag+1个标签用于下一次扫描;(e)所述系统保持基于Ntag的拔丝;扫描计数从0重新开始;(f)重复步骤(b)至(e)直到分子离开。

图5描绘了处理器的步骤的流程图,突出显示了重新扫描和滑动中涉及的步骤8和15-19,其中以粗体文本示出的状态是与重新扫描和滑动密切相关的关键状态。

图6描绘了基本缩放的实例,其描绘了生物分子(DNA)上的多个标签(例如多个探针)的双向扫描和检测。在这一非限制性实例中,分子的一个或多个特征的定位中所涉及的算法包括以下:(a)初始化扫描计数=0;(b)双系统最初检测Ntag(在该实例中Ntag=2)个标签并启动拉丝;(c)每次新扫描开始时增加扫描计数;(d)在一定数量的拉丝扫描Nscan(在该实例中Nscan=4)之后,系统增加触发标签的数目Ntag=Ntag+1。将扫描计数复位为0;(e)所述系统基于新Ntag继续拉丝;和(f)重复步骤(b)至(e)直到分子离开。

图7描绘了具有以下算法的终止缩放的非限制性实例:(a)初始化扫描计数=0;(b)双系统最初检测Ntag(在该实例中Ntag=2)个标签并启动拉丝;(c)每次新扫描开始时增加扫描计数;(d)在一定数量的拉丝扫描Nscan(在该实例中Nscan=4)之后,系统增加触发标签的数目Ntag=Ntag+1。将扫描计数复位为0;(e)所述系统基于新Ntag继续拉丝;(f)重复步骤(b)至(e)直到Ntag达到Nmax(在该实例中Nmax=4);(g)所述系统基于Nmax继续拉丝;(h)停止递增扫描计数。维持基于Nmax的拉丝直到分子离开。

图8描绘了双孔隙装置的3D示意图。将两个纳米孔隙置于相同的膜上。在玻璃上检查两个“V”形微通道,然后整个表面用SiN膜覆盖。所述两个通道将缓冲引导到中心,这里是分隔所述两个通道的微米桥。在通道的尖端上钻出纳米孔隙。相同的DNA分子可以跨越在两个纳米孔隙中以实现双孔隙控制。C、D、E是不同放大倍数的装置顶视图。C显示了8mm×8mm足迹尺寸的整个芯片。D是显示v通道的弯处的放大视图。E是显示2个纳米孔隙的聚焦离子束图像。F为显示材料的侧视图:玻璃基材和SiN膜。为了清楚起见,左侧描绘为通道1和孔隙1,右侧描绘为通道2和孔隙2。G是同时将相同分子拉入通道的电极设置。这种设计能够容易地单独进入两个孔隙,因为电极可以放置在角落和中心公共接地中的接入端口。

图9描绘了在双孔隙装置中具有竞争电压力的拉丝DNA。(a)在DNA共捕获后,使用电压V1<V2(V1和V2分别是跨孔隙1(左)和孔隙2(右)的电压)将DNA分子从左到右(L到R)穿过。在该固定极性期间DNA运动的单次通过被称为“扫描”。在自动检测预定数量的标签之后,DNA运动的方向使用触发以使分子从右到左(R到L)移动的电压V1>V2逆转,从而得到第二扫描。以循环方式重复所述过程,直到分子随机离开共捕获状态。(b)使用预定标签测定数为2的逻辑,来自孔隙2的记录多扫描电流轨迹I2,此后控制器触发方向的改变。来自30-150ms的信号被截断用于可视化。该实例显示来自多扫描事件的原始数据,其显示每次扫描时从孔隙1→2和孔隙2→1移动的两个检测到的单-链霉抗亲和素(MS)标签,直到50+次扫描后DNA逃逸。

图10显示了在用MS标记的DNA进行拉丝实验期间产生的代表性双电流信号和扫描计数统计。(a)对于代表性的多扫描拉丝事件显示I1、V1、I2和V2的完全信号轨迹。I1信号中的垂直轴中断允许在较低和较高V1值期间在低和高范围上的垂直缩放。(b)第一循环的放大,其中双标签逻辑在两个信号中显示可分辨的标签A和B。(c)第41和最后循环的放大,其显示由于未检测的标签而导致的共捕获的结束。(d)对于使用的装置所有共捕获事件的总拉丝时间(平均值±标准偏差)和概率分布与扫描计数(箱(bin)宽度=4)。概率数据上的红线是拟合模型方程(1),其中p=0.89是每次扫描中正确检测两个标签的概率。使用的芯片具有0.61μm的孔隙到孔隙距离,孔隙1的直径为27nm和孔隙2的直径为25nm。

图11显示了拉丝增加了双孔隙装置中DNA的线性化。(a)单孔隙事件的典型I1轨迹,其包含未折叠和折叠实例。在随后的概率计算中仅包含导致最终共捕获的单孔隙事件(图16中的pre-i步骤事件)。(b)多扫描事件的典型I2轨迹,其中扫描1示出折叠,而随后的扫描没有。(c)当分子R到L移动时,折叠部分(最初仅在I2中)被第二扫描去除的机制的图示,如文中所述。(d)概率P(±95%误差棒)是对于不同移位类型的未折叠事件的分数。总计309个事件按顺序经历了所有4种类型。

图12描述了根据在多扫描实验期间产生的双电流信号估计标签间分隔距离。(a)L到R和(b)R到L的图示有助于可视化由扫描信号揭示的相对标签位置。(c)L到R和(d)R到L信号来自共捕获分子的相邻扫描,所述共捕获分子被扫描48个循环。在L到R中,所述孔隙1是标签的进入孔隙,而孔隙2是离开孔隙。在R到L中,所述孔隙2是标签的进入孔隙,而孔隙1是离开孔隙。因此,进入和离开是相对于标签从一个孔隙传递到另一个孔隙的运动方向。绘制了孔隙之间的公共腔室中标签的信号和推断数量与时间的曲线。图示(ai)显示了当A和B在公共腔室中的时间段,而(aii)显示了B离开之后但C进入公共腔室之前的时间段,等等。速率曲线显示了在进入和离开孔隙处计算的标签速率,其基于分割成膜厚度的标签持续时间,以及计算为孔隙之间的已知距离除以孔隙到孔隙时间的标签孔隙到孔隙速率。通过将扫描内的平均孔隙到孔隙速率乘以检测到的标签对之间的时间,并添加膜厚度作为校正(正文),计算标签间分隔距离预测。电压对于L到R设定为V1=250mV,对于R到L设定为600mV,而V2=400mV维持恒定。FPGA监控N=2个标签的I2(离开信号L到R,进入信号R到L),尽管在两个方向上I1中3个标签可见。

图13描述了具有至少30次循环的五个不同多扫描事件的表1。所述表报告了等于在每个方向上的扫描次数的循环次数,以及对每个分隔距离估计有贡献的标签对的数量。

图14描述了DNA甲基化可以用蛋白vs抗体基序进行标记和差异检测。多阅读一致性意味着标签细胞特异性的高置信度。

图15描述了利用HpaII(泳道1-3)和Msp1(泳道4-6)温育0、30、60分钟的甲基化λ-DNA的限制酶分析。(b)与λ-DNA上5mC位点结合的MeCP2和抗体的双孔隙重新扫描数据,具有100s的扫描。(c)比较与生物素结合的MS蛋白(间隔301bp、323bp的3个标签)[19]和与5mC结合的MeCP2和抗体的标签信号。~50kDa尺寸的蛋白产生类似的阻断,而150kDa抗体产生较深的阻断,其可用于多路复用。

图16描述了一个拔河(tug-of-war)事件的完整过程。(a)各步骤的图示。(b)来自孔隙1和孔隙2的电流轨迹。I1为红色,而I2为蓝色。孔隙1的y轴断裂三次以将不同的值配合到一个图中。插图显示当触发发生时的放大图。(c)不同V1的平均持续时间和单孔隙事件持续时间。(d)在V1=200mV下λDNA的一个拔河事件的电流轨迹对。

图17描述了多扫描实验的FPGA逻辑。(a)来自图10所示事件结束时的I2信号和FPGA状态。红色和黑色虚线分别表示标签和事件的触发阈值。(b)FPGA逻辑流程图。蓝色框表示系统状态,品红色数字表示(a)中的FPGA状态。黑色框表示决策。绿色框表示操作。框之间的箭头指示系统如何在不同步骤之间流动。

图18描述了FPGA未能捕捉更多扫描的四种主要情况。曲线是最后循环中来自FPGA的状态和I2的信号。状态的定义在图17b中。(a)标签显示在第n次扫描的维持(18)状态中。带箭头的线标记第(n-1)次和第n次扫描。(b)第n-1次扫描中的假阳性尖峰。(c)第n次扫描中的假阴性尖峰。(d)在第n次扫描的延迟(17)状态中,离开孔隙2的分子。

图19描绘了具有三标签触发的多扫描实验。(a)I1、V1、I2和V2的完全信号轨迹。在事件V1=200mV(用于L到R扫描)和V1=800mV(用于R到L扫描)期间,V2设置为V2=400mV。V1设置为(b)第2次循环的放大图。(c)理论拟合下每事件扫描计数的分布。

图20描述了标签对齐过程。(a)具有两个标签的事件的标签位置与扫描次数的实例(蓝色圆圈,在每次扫描中最接近扫描开始测量的标签,离扫描开始最远观察到的红色方形标签)。(b)标签之间的间距作为(a)中事件的扫描次数的函数。(c)(a)中事件的对齐标签位置。对(a)中事件的校准和对齐标签位置与最终平均标签位置的距离(这里蓝色圆圈对应于标签A的相关测量值,红色方形对应于标签B的相关测量值)。(e)具有三个标签的事件的标签位置与扫描次数的实例(蓝色圆圈,最接近事件开始的标签位置,中间距离处的红色方形标签,离事件开始最远观察到的品红色三角形标签)。(f)(e)中事件的标签之间的间距。

图21描述了显示与来自九个多扫描事件的标签分隔估计相关的统计的表S3。

图22描绘了本公开的纳米孔隙装置的几何构造的非限制性实例。

图23显示了描述具有不同几何构造的装置的通道阻力和通道宽度之间的相关性的曲线图。

图24显示了描述具有不同几何构造的装置的通道体积和通道宽度之间的相关性的曲线图。

图25显示了描述多核苷酸递送时间和通道宽度之间的相关性的曲线图。

图26描述了图20A-20C中所示的“捕获前”期间的等待时间段的非限制性实例,其中“pre-i”中的靶多核苷酸包含约30ms的等待时间段,从而允许靶多核苷酸在第一方向上进一步推入第一流体通道中;和第二等待时间段“pre-ii”,其中在改变靶多核苷酸的方向之前将电压调节至0mV“OFF”约20ms。总时间段为约50ms。

图27显示了在有和没有通道的情况下移位后靶多核苷酸的非限制性实例分布。

图28显示了当靶多核苷酸被推动通过第一孔隙约30ms的时间段,然后当装置包括通道时和当装置不包括通道时,第一电压调节到0mV“OFF”的非限制性实例。

图29显示当装置包括通道时和当装置不包括通道时多核苷酸检测/捕获时间的非限制性实例。

附图仅出于说明的目的描绘了本发明的实施方案。本领域技术人员将从以下讨论中容易地认识到,在不脱离本文所述的本发明的原理的情况下,可以采用本文所示的结构和方法的替代实施方案。

定义

本文可互换使用的术语“多核苷酸”和“核酸”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)的聚合形式。因此,所述术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂合体,或包括嘌呤和嘧啶碱基或其它天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。

杂交和洗涤条件是众所周知的,并且在Sambrook,J.,Fritsch,E.F.和Maniatis,T.Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(1989),特别是其中第11章和表11.1;以及Sambrook,J.和Russell,W.,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor(2001)中举例说明。温度和离子强度的条件决定了杂交的“严格性”。

术语“肽”、“多肽”和“蛋白质”在本文中可互换使用,并且是指任何长度的氨基酸的聚合形式,其可以包含编码的和非编码的氨基酸、化学或生物化学修饰的或衍生的氨基酸,以及具有修饰的肽骨架的多肽。

“切割”是指靶核酸分子(例如RNA、DNA)的共价主链的断裂。切割可通过多种方法引发,包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割两者都是可能的,并且双链切割可以作为两个不同单链切割事件的结果而发生。

“核酸酶”和“核酸内切酶”在本文中可互换使用,是指对核酸切割具有催化活性(例如核糖核酸酶活性(核糖核酸切割),脱氧核糖核酸酶活性(脱氧核糖核酸切割)等)的酶。“基因组编辑核酸内切酶”是可用于编辑细胞基因组的核酸内切酶(例如,通过在细胞基因组DNA内的靶向位置切割)。基因组编辑核酸内切酶的实例包括但不限于2类CRISPR/Cas核酸内切酶,例如:(a)II型CRISPR/Cas蛋白,例如Cas9蛋白;(b)V型CRISPR/Cas蛋白,例如Cpf1蛋白、C2c1蛋白、C2c3蛋白等;和(c)VI型CRISPR/Cas蛋白,例如C2c2蛋白。

核酸酶的“切割结构域”或“活性结构域”或“核酸酶结构域”是指核酸酶内具有核酸切割的催化活性的多肽序列或结构域。切割结构域可以包含在单个多肽链中,或者切割活性可以由两个(或更多个)多肽的结合产生。单个核酸酶结构域可由给定多肽内的多于一个分离的氨基酸延伸段组成。

在一些情况下,组分(例如,核酸组分;蛋白质组分;等)包括含标记部分。本文所用的术语“标记”、“可检测标记”或“标记部分”是指提供信号检测的任何部分,并且可根据测定的具体性质而广泛变化。感兴趣的标记部分包含可直接检测的标记(直接标记)(例如荧光标记)和可间接检测的标记(间接标记)(例如结合对成员)。荧光标记可以是任何荧光标记(例如,荧光染料(例如,荧光素、德克萨斯红、罗丹明、标记等),荧光蛋白(例如,绿色荧光蛋白(GFP)、增强型GFP(EGFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)、青色荧光蛋白(CFP)、樱桃、番茄、橘及其任何荧光衍生物)等)。合适的可检测(直接或间接)标记部分可包括可通过光谱、光化学、生物化学、免疫化学、电、光、化学或其它方式检测的任何部分。例如,合适的间接标记包括生物素(结合对成员),其可与链霉亲和素蛋白(其本身可直接或间接标记)结合。标记还可以包括:放射性标记(直接标记)(例如,3H、125I、35S、14C或32P);酶(间接标记)(例如,过氧化物酶、碱性磷酸酶、半乳糖苷酶、荧光素酶、葡萄糖氧化酶等);荧光蛋白(直接标记)(例如,绿色荧光蛋白、红色荧光蛋白、黄色荧光蛋白及其任何方便的衍生物);金属标记(直接标记);比色标记;结合对成员;等等。“结合对的配偶体”或“结合对成员”是指第一和第二部分之一,其中第一和第二部分彼此具有特异性结合亲和力。合适的结合对包括但不限于:抗原/抗体(例如,地高辛/抗地高辛、二硝基苯基(DNP)/抗DNP、丹磺酰基-X-抗丹磺酰基、荧光素/抗荧光素、荧光素黄/抗荧光素黄及罗丹明/抗罗丹明),生物素/抗生物素蛋白(或生物素/链霉亲和素)及钙调蛋白结合蛋白(CBP)/钙调蛋白。任何结合对成员可适合用作间接可检测的标记部分。

任何给定的组分或组分的组合可以是未标记的,或者可以用标记部分可检测地标记。在一些情况下,当标记两种或更多种组分时,它们可以用彼此可区分的标记部分进行标记。

分子和细胞生物化学中的一般方法可以在诸如以下的标准教科书中找到:Molecular Cloning:A Laboratory Manual,第3版。(Sambrook等,HaRBor Laboratory Press 2001);Short Protocols in Molecular Biology,第4版.(Ausubel等.eds.,John Wiley&Sons 1999);Protein Methods(Bollag等,John Wiley&Sons 1996);Nonviral Vectors for Gene Therapy(Wagner等.eds.,Academic Press 1999);Viral Vectors(Kaplift&Loewy eds.,Academic Press 1995);Immunology Methods Manual(I.Lefkovits ed.,Academic Press 1997);以及Cell and Tissue Culture:Laboratory Procedures in Biotechnology(Doyle&Griffiths,John Wiley&Sons 1998),其公开内容通过引用并入本文。

进一步描述本发明之前,应理解,本发明不限于所描述的特定实施方案,因此,当然可以变化。还应理解,这里使用的术语仅用于描述特定实施方案的目的,而不旨在是限制性的,因为本发明的范围将仅由所附权利要求限制。

在提供数值范围的情况下,应理解,在该范围的上限和下限之间的每个中间值至下限单位的十分之一(除非上下文另有明确说明),以及在该规定范围内的任何其它规定或中间值,都包含在本发明内。这些较小范围的上限和下限可以独立地包含在较小范围内,并且也包含在本发明内,但受制于所述范围内任何具体排除的限制。在所述范围包含一个或两个限制的情况下,排除那些包含的限制之一或两个的范围也包含在本发明中。

除非另有定义,本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。尽管在本发明的实践或测试中也可以使用与本文所述类似或等同的任何方法和材料,但现在描述优选的方法和材料。本文提及的所有出版物通过引用并入本文,以公开和描述与所引用的出版物相关的方法和/或材料。

应注意,如本文和所附权利要求中所使用的,单数形式“一个”、“一种”和“所述”包含复数指示物,除非上下文另有明确规定。因此,例如,提及“核糖核蛋白复合物”包含多个此类复合物,提及“突变型肌营养不良蛋白基因”包含提及一种或多种突变型肌营养不良蛋白基因及其本领域技术人员已知的等同物等等。还应注意,权利要求书可以撰写为排除任何可选的要素。因此,该陈述旨在作为在记述权利要求要素时使用如“单独地”、“仅”等的排他性术语或使用“否定”限制的先行基础。

应理解,为了清楚起见,在单独实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合地提供。相反地,为了简洁起见,在单个实施方案的上下文中描述的本发明的各种特征也可以单独地或以任何合适的子组合来提供。关于本发明的实施方案的所有组合都被本发明具体地包含,并且在此被公开,就像每个组合都被单独地和明确地公开一样。此外,各种实施方案及其要素的所有子组合也被本发明具体地包含并在此公开,就像每个这样的子组合在此被单独地和明确地公开一样。

提供本文所讨论的出版物仅仅是为了在本申请的申请日之前对其进行公开。本文中的任何内容都不应解释为承认本发明由于在先发明而无权早于此类公开。此外,所提供的公开日期可能与实际公开日期不同,实际公开日期可能需要独立确认。

具体实施方式

本公开提供了定位靶多核苷酸的一个或多个特征的自动化方法。本公开还提供了用于对多核苷酸序列进行测序的自动化方法。本公开还提供了用于差异检测多核苷酸序列中的甲基化和未甲基化区域的方法。本公开还提供了在纳米孔隙装置中的扩展再捕获多核苷酸的方法。还提供了用于对纳米孔隙装置中的多核苷酸进行测序的方法。本公开还提供了用于执行本公开的方法的装置和系统。

系统和装置

本公开包含用于执行本文所公开的方法的装置和系统。本公开提供了用于定位通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列的一个或多个特征的装置和系统。本公开还提供了用于捕获靶多核苷酸的装置和系统。本公开还提供了用于对通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列进行测序的装置和系统。

本公开的方面包含用于测序通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列的双孔隙、双放大器装置。在一些情况下,所述装置包含(i)经配置以在所述装置的第一孔隙处提供第一电压,并且在所述装置的第二孔隙处提供第二电压的电极;(ii)第一孔隙;(iii)第二孔隙;其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动;(iv)一个或多个传感器,其能够鉴别:在第一循环中,在靶多核苷酸在第一方向上移动通过第一孔隙和第二孔隙期间,来自靶多核苷酸的第一组特征,和在第一循环中,在靶多核苷酸在第二方向上移动通过第二孔隙和第一孔隙期间,来自靶多核苷酸的第二组特征;(v)处理器;以及(vi)非暂时性计算机可读介质,其包括指令使所述处理器执行以下操作:a)从一个或多个传感器确定所述靶多核苷酸同时存在于两个孔隙中;b)扫描靶多核苷酸的一个或多个特征;c)在第一方向上对第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,以产生作用于所述靶多核苷酸上的第一力和相反的第二力,其中所述第一力和第二力改变所述靶多核苷酸的移动方向和速率,使得所述靶多核苷酸的至少一部分在第二方向上从第二孔隙移动到第一孔隙;和d)在第二循环中重复步骤a)至c)以检测第三组和第四组特征。

在一些实施方案中,所述装置包含第一腔室。如本文所用,术语“上腔室”与术语“流体通道”可互换使用,例如第一流体通道。在一些实施方案中,所述装置包含中腔室。如本文所用,术语“中腔室”与术语“所述腔室”可互换使用。在一些实施方案中,所述装置包含连接上腔室和中腔室的第一孔隙。在一些实施方案中,所述装置包含连接中腔室和下腔室的第二孔隙。如本文所用,术语“下腔室”与术语“流体通道”可互换使用,例如第二流体通道。在一些实施方案中,所述装置包含下腔室。在一些实施方案中,所述装置包含第二流体通道。在一些实施方案中,第一流体通道、第二流体通道和/或腔室包含用于连接到电源的一个或多个电极,使得可以建立在腔室之间跨各孔隙的单独的电压。在一些实施方案中,所述装置包含连接到电源的电极,所述电源被配置以在装置的第一流体通道和腔室之间提供第一电压,并且在装置的腔室和第二流体通道之间提供第二电压。在一些实施方案中,所述腔室位于第一孔隙和第二孔隙上方。在一些实施方案中,所述腔室位于第一流体通道和第二流体通道上方。在一些实施方案中,所述腔室位于第一孔隙和第二孔隙下方。在一些实施方案中,所述腔室位于第一孔隙和第二孔隙之间。在一些实施方案中,所述腔室位于第一流体通道和第二流体通道之间。

在一些实施方案中,第一孔隙和第二孔隙被配置以使得靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动。在一些实施方案中,双孔隙装置包含一个或多个传感器。在一些实施方案中,一个或多个传感器能够从靶多核苷酸鉴别第一组特征。在一些实施方案中,在靶多核苷酸在第一方向上移动通过第一孔隙和第二孔隙期间(其中第一方向是从第一孔隙到第二孔隙),传感器能够在第一循环(例如具有一次或多次扫描的第一循环)中鉴别第一组特征。在一些实施方案中,在靶多核苷酸在第二方向上移动通过第二孔隙和第一孔隙期间,一个或多个传感器能够在第一循环中从靶多核苷酸中鉴别第二组特征。在一些实施方案中,第一方向是从第一孔隙到第二孔隙。在一些实施方案中,第二方向是从第二孔隙到第一孔隙。在一些实施方案中,双孔隙装置包含处理器。在一些实施方案中,双孔隙装置包含非暂时性计算机可读介质,其包括使处理器从一个或多个传感器确定靶多核苷酸同时存在于两个孔隙中的指令。在一些实施方案中,所述指令使处理器扫描靶多核苷酸的一个或多个特征。在一些实施方案中,所述指令使处理器在第一方向上对第一循环中的第一组特征计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,以产生作用于所述靶多核苷酸的第一力和相反的第二力。在一些实施方案中,第一力和第二力改变靶多核苷酸移动的方向和速率,使得靶多核苷酸的至少一部分在第二方向上从第二孔隙移动到第一孔隙。在一些实施方案中,所述过程在第二循环中重复以检测第二组特征。在一些实施方案中,所述过程在第二循环中检测第三组和第四组特征。在一些实施方案中,重复这些步骤直到多核苷酸离开双孔隙装置。

本公开的方面包含用于定位通过第一孔隙和第二孔隙的靶多核苷酸的一个或多个特征的装置,所述装置包含:(i)位于腔室和第一流体体积之间的第一孔隙,其中所述第一孔隙流体连接到所述腔室和第一流体体积,并且其中所述第一流体体积是在第一孔隙的相对侧上的几何约束的外壳,(ii)位于腔室和第二流体体积之间的第二孔隙,其中所述第二孔隙流体连接到所述腔室和第二流体体积,并且其中所述第二流体体积是在所述第二孔隙的相对侧上的几何约束的外壳;(iii)各自包含用于流体填充和电极接入的入口和出口的所述第一流体体积和第二流体体积的外壳,其中所述第一孔隙在所述入口和出口之间的位置连接到所述第一流体体积的几何约束的外壳,并且其中所述第二孔隙在所述入口和出口之间的位置连接到所述第二流体体积的几何约束的外壳,(iv)位于第一流体体积内的至少一个电极、位于第二流体体积内的至少一个电极以及位于腔室内的至少一个电极,(v)经配置用于在各孔隙处进行独立的电压控制和电流测量的一个或多个传感器;(vi)处理器;以及(vii)非暂时性计算机可读介质,其包括指令使所述处理器执行以下操作:a)在所述第一孔隙处施加第一电压并在所述第二孔隙处施加第一电压以捕获所述靶多核苷酸并使其移位通过第一孔隙并进入第一流体体积中;b)在所述第一孔隙处施加第二电压并在所述第二孔隙处施加第二电压以使所述靶多核苷酸从所述第一流体体积中再捕获并部分或完全移位通过第一孔隙;c)在所述第一孔隙处施加第三电压,并在所述第二孔隙处施加第三电压,使得所述靶多核苷酸的至少一部分被所述第二孔隙捕获,同时保留在所述第一孔隙中;d)在所述第一孔隙处施加第四电压并在所述第二孔隙处施加第四电压以控制所述靶多核苷酸的运动方向;e)当每个特征经过第一孔隙时,在第一传感器电流中检测所述多核苷酸上的第一组特征,并且当每个特征经过第二孔隙时,再次在第二传感器电流中检测;f)在所述第一孔隙处施加第五电压并在所述第二孔隙处施加第五电压以逆转所述靶多核苷酸的运动方向;g)当每个特征经过第二孔隙时,在第二传感器电流中检测靶多核苷酸中的第二组特征,并且当每个特征经过第一孔隙时再次在第一传感器电流中检测。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤a)之后,当靶多核苷酸的至少一部分经过第一孔隙时,扫描靶多核苷酸的一个或多个特征;并且当靶多核苷酸经过第一孔隙时检测第一组特征。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤b)之后扫描,当靶多核苷酸的至少一部分经过第一孔隙时,扫描靶多核苷酸的一个或多个特征。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤d)之后,当靶多核苷酸的至少一部分经过第一孔隙时,扫描靶多核苷酸的一个或多个特征,并且当每个特征经过第二孔隙时再次扫描。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤f)之后,当靶多核苷酸的至少一部分经过第二孔隙时,扫描靶多核苷酸的一个或多个特征,并且当每个特征经过第一孔隙时,再次扫描。

在一些实施方案中,在步骤b)中施加电压响应于当靶多核苷酸的至少一部分经过第一孔隙时检测的多个特征。

在一些实施方案中,调节步骤c)中的电压响应于当靶多核苷酸的至少一部分经过第一孔隙时检测的多个特征。

在一些实施方案中,在步骤f)中施加电压响应于当靶多核苷酸的至少一部分经过第一孔隙并且再次靶多核苷酸的至少一部分经过第二孔隙时检测的多个特征。

在一些实施方案中,还包括使处理器重复步骤c)至g)的指令。

在一些实施方案中,还包括使处理器在步骤e)中当每个特征经过第一孔隙时检测靶多核苷酸上的一个或多个特征,并且再次当尚未检测到的每个特征经过第二孔隙时检测的指令。

在一些实施方案中,步骤c)至g)包括两个方向上的特征检测的第一循环。

在一些实施方案中,还包括在两个方向上的特征检测的第二循环中重复步骤c)至g)以检测第三组和第四组特征。

在一些实施方案中,指令进一步使处理器重复c)直到靶多核苷酸离开所述装置。

在一些实施方案中,所述装置包含位于第一流体通道内的至少一个电极和位于第二流体通道内的至少一个电极。

在一些实施方案中,所述一个或多个传感器包含被配置以用于在第一孔隙和第二孔隙处进行电压控制和电流测量的双放大器电子器件。

在一些实施方案中,独立地控制第一孔隙处的第一电压和第二孔隙处的第二电压,其中第一电压和第二电压的范围为0mV至1000mV。

在一些实施方案中,第一孔隙和第二孔隙彼此相距约10nm至2μm。

在一些实施方案中,所述装置是双纳米孔隙芯片,其包含2mm或更大、3mm或更大、4mm或更大、5mm或更大、6mm或更大、7mm或更大或8mm或更大的长度;以及2mm或更大、3mm或更大、4mm或更大、5mm或更大、6mm或更大、7mm或更大或8mm或更大的宽度。

在一些实施方案中,所述孔隙的直径为约2nm至约50nm。

在一些实施方案中,所述孔隙的直径为约20nm。

在一些实施方案中,第一孔隙和第二孔隙彼此相距约500nm。

在一些实施方案中,第一孔隙具有将第一通道和腔室分开至少约0.3nm的深度,并且第二孔隙具有将腔室和第二通道分开至少约0.3nm的深度。

在一些实施方案中,所述腔室连接到相对于第一孔隙处的第一电压和第二孔隙处的第二电压的公共接地。

根据前述权利要求中任一项所述的装置,其中所述装置还包含控制器。

在一些实施方案中,所述控制器被配置以改变待扫描的多核苷酸的特征数量。

在一些实施方案中,所述控制器被配置以改变扫描次数。

在一些实施方案中,控制器被配置以控制被扫描的多核苷酸的位置。

在一些实施方案中,所述控制器被配置以改变被扫描的多核苷酸的区域。

在一些实施方案中,所述控制器被配置以控制:a)待扫描的特征的数量;b)待重新扫描的特征的数量;c)待扫描或重新扫描的特征的类型;d)待扫描或重新扫描的循环的次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些实施方案中,所述处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器包含现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器是微控制器。

在一些实施方案中,FPGA或ASIC执行控制逻辑以改变:a)待扫描的特征的数量;b)待重新扫描的特征的数量;c)待扫描或重新扫描的特征的类型;d)待扫描或重新扫描的循环的次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些实施方案中,所述控制器被配置以控制多核苷酸的移动方向。

在一些实施方案中,还包括使处理器基于扫描构建含有一个或多个特征的多核苷酸区域的局部图谱的指令。

在一些实施方案中,还包括使处理器基于扫描构建含有一个或多个特征的多核苷酸区域的一致性图谱的指令。

在一些实施方案中,其中所述构建包括机器学习算法,其基于训练数据和概率模型训练以检测一个或多个特征。

在一些实施方案中,还包括使处理器根据第一孔隙和第二孔隙中的特征的检测之间的时间差以及孔隙一和孔隙二之间的已知距离计算靶多核苷酸的特征的速率的指令。

在一些实施方案中,还包括使处理器根据靶多核苷酸的特征的速率,从第一孔隙、第二孔隙或两者的电流信号中检测到的特征之间的时间计算特征之间的距离的指令。

在一些实施方案中,还包括使处理器对于每次扫描计算靶多核苷酸的特征的速率,并通过使用速率分布计算关于特征的速率的统计的指令。

在一些实施方案中,还包括使处理器组合所有特征的速率并计算多核苷酸在给定扫描和给定扫描方向上的速率的时间历程的指令。

在一些实施方案中,还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行频率扫描的指令。

在一些实施方案中,还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行振幅扫描的指令。

在一些实施方案中,还包括使处理器调节多核苷酸速率的指令。

在一些实施方案中,速率范围为每毫秒1个碱基对至每毫秒10个碱基对。

在一些实施方案中,还包括使处理器调节第一电压和第二电压以便以多个速率执行多核苷酸的多次扫描的指令。

在一些实施方案中,所述以多个速率执行多核苷酸的多次扫描提高了一个或多个特征的检测的准确性。

在一些实施方案中,还包括使处理器以多个速率对多核苷酸执行多次扫描的指令。

在一些实施方案中,还包括使处理器控制多核苷酸在第一方向、第二方向或两者上的速率范围的指令。

在一些实施方案中,还包括当多核苷酸在第一方向、第二方向或两者上移动通过第一孔隙和第二孔隙时使处理器控制第一孔隙和第二孔隙的电压范围的指令。

在一些实施方案中,还包括使处理器确定多核苷酸在第一方向、第二方向或两者上的最佳速率范围的指令,其中多核苷酸的最佳速率范围降低了布朗运动对多核苷酸的影响。

在一些实施方案中,控制多核苷酸的速率范围包括确定用于测序的多核苷酸的最佳速率范围。

本公开的方面包含用于执行本文所述的方法的系统。本公开的方面包含一种系统,所述系统包含:a)用于定位通过第一孔隙和第二孔隙的靶多核苷酸的一个或多个特征的装置,所述装置包含:(i)位于腔室和第一流体体积之间的第一孔隙,其中所述第一孔隙流体连接到所述腔室和第一流体体积,并且其中所述第一流体体积是在第一孔隙的相对侧上的几何约束的外壳,(ii)位于腔室和第二流体体积之间的第二孔隙,其中所述第二孔隙流体连接到所述腔室和第二流体体积,并且其中所述第二流体体积是在所述第二孔隙的相对侧上的几何约束的外壳;(iii)各自包含用于流体填充和电极接入的入口和出口的所述第一流体体积和第二流体体积的外壳,其中所述第一孔隙在所述入口和出口之间的位置连接到所述第一流体体积的几何约束的外壳,并且其中所述第二孔隙在所述入口和出口之间的位置连接到所述第二流体体积的几何约束的外壳,(iv)位于第一流体体积内的至少一个电极、位于第二流体体积内的至少一个电极以及位于腔室内的至少一个电极,(v)经配置用于在各孔隙处进行独立电压控制和电流测量的一个或多个传感器;(b)处理器;以及(c)非暂时性计算机可读介质,其包括指令使所述处理器执行以下操作:i)在所述第一孔隙处施加第一电压并在所述第二孔隙处施加第一电压以捕获所述靶多核苷酸并使其移位通过第一孔隙并进入第一流体体积中;ii)在所述第一孔隙处施加第二电压并在所述第二孔隙处施加第二电压以从所述第一流体体积中再捕获所述靶多核苷酸并使其部分或完全移位通过第一孔隙;iii)在所述第一孔隙处施加第三电压,并在所述第二孔隙处施加第三电压,使得所述靶多核苷酸的至少一部分被所述第二孔隙捕获,同时保留在所述第一孔隙中;iv)在所述第一孔隙处施加第四电压并在所述第二孔隙处施加第四电压以控制所述靶多核苷酸的运动方向;v)当每个特征经过第一孔隙时,在第一传感器电流中检测多核苷酸上的第一组特征,并且当每个特征经过第二孔隙时,再次在第二传感器电流中检测;vi)在所述第一孔隙处施加第五电压并在所述第二孔隙处施加第五电压以逆转所述靶多核苷酸的运动方向;vii)当每个特征经过第二孔隙时,在第二传感器电流中检测靶多核苷酸中的第二组特征,并且当每个特征经过第一孔隙时,再次在第一传感器电流中检测。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤i)之后,当靶多核苷酸的至少一部分经过第一孔隙时,扫描靶多核苷酸的一个或多个特征;并且当靶多核苷酸经过第一孔隙时检测第一组特征。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤ii)之后,当靶多核苷酸的至少一部分经过第一孔隙时,扫描靶多核苷酸的一个或多个特征。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤iv)之后,当靶多核苷酸的至少一部分经过第一孔隙时,扫描靶多核苷酸的一个或多个特征,并且当每个特征经过第二孔隙时再次扫描。

在一些实施方案中,还包括指令以使处理器执行以下操作:在步骤vii)之后,当靶多核苷酸的至少一部分经过第二孔隙时,扫描靶多核苷酸的一个或多个特征,并且当每个特征经过第一孔隙时再次扫描。

在一些实施方案中,在步骤ii)中施加电压响应于当靶多核苷酸的至少一部分经过第一孔隙时检测的多个特征。

在一些实施方案中,调节步骤iii)中的电压响应于当靶多核苷酸的至少一部分经过第一孔隙时检测的多个特征。

在一些实施方案中,在步骤vii)中施加电压响应于当靶多核苷酸的至少一部分经过第一孔隙并且再次当靶多核苷酸的至少一部分经过第二孔隙时检测的多个特征。

在一些实施方案中,还包括使处理器重复步骤iii)至vii)的指令。

在一些实施方案中,还包括使处理器当每个特征经过第一孔隙时检测靶多核苷酸上的一个或多个特征和再次在步骤e)中当尚未检测的每个特征经过第二孔隙时检测的指令。

在一些实施方案中,步骤iii)至vii)包括两个方向上的特征检测的第一循环。

在一些实施方案中,还包括两个方向上的特征检测的第二循环中重复步骤iii)至vii)以检测第三组和第四组特征。

在一些实施方案中,所述指令进一步使处理器重复iii)至vii)直到靶多核苷酸离开所述装置。

在一些实施方案中,所述装置包含位于第一流体通道内的至少一个电极和位于第二流体通道内的至少一个电极。

在一些实施方案中,所述一个或多个传感器包含被配置以用于在第一孔隙和第二孔隙处进行电压控制和电流测量的双放大器电子器件。

在一些实施方案中,独立地控制第一孔隙处的第一电压和第二孔隙处的第二电压,其中第一电压和第二电压的范围为0mV至1000mV。

在一些实施方案中,第一孔隙和第二孔隙彼此相距约10nm至2μm。

在一些实施方案中,所述装置是双纳米孔隙芯片,其包含2mm或更大、3mm或更大、4mm或更大、5mm或更大、6mm或更大、7mm或更大或8mm或更大的长度;以及2mm或更大、3mm或更大、4mm或更大、5mm或更大、6mm或更大、7mm或更大或8mm或更大的宽度。

在一些实施方案中,所述孔隙的直径为约2nm至约50nm。

在一些实施方案中,所述孔隙的直径为约20nm。

在一些实施方案中,第一孔隙和第二孔隙彼此相距约500nm。

在一些实施方案中,第一孔隙具有将第一通道和腔室分开至少约0.3nm的深度,并且第二孔隙具有将腔室和第二通道分开至少约0.3nm的深度。

在一些实施方案中,所述腔室连接到相对于第一孔隙处的第一电压和第二孔隙处的第二电压的公共接地。

根据前述权利要求中任一项所述的装置,其中所述装置还包含控制器。

在一些实施方案中,所述控制器被配置以改变待扫描的多核苷酸的特征数量。

在一些实施方案中,所述控制器被配置以改变扫描次数。

在一些实施方案中,所述控制器被配置以控制被扫描的多核苷酸的位置。

在一些实施方案中,所述控制器被配置以改变被扫描的多核苷酸的区域。

在一些实施方案中,所述控制器被配置以控制:a)待扫描的特征的数量;b)待重新扫描的特征的数量;c)待扫描或重新扫描的特征的类型;d)待扫描或重新扫描的循环的次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些实施方案中,所述处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器是微控制器。

在一些实施方案中,FPGA或ASIC执行控制逻辑以改变:a)待扫描的特征的数量;b)待重新扫描的特征的数量;c)待扫描或重新扫描的特征的类型;d)待扫描或重新扫描的循环的次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些实施方案中,所述控制器被配置以控制多核苷酸的移动方向。

在一些实施方案中,还包括使处理器基于扫描构建含有一个或多个特征的多核苷酸区域的局部图谱的指令。

在一些实施方案中,还包括使处理器基于扫描构建含有一个或多个特征的多核苷酸区域的一致性图谱的指令。

在一些实施方案中,其中所述构建包括机器学习算法,其基于训练数据和概率模型训练以检测一个或多个特征。

在一些实施方案中,还包括使处理器根据第一孔隙和第二孔隙中的特征检测之间的时间差以及孔隙一和孔隙二之间的已知距离计算靶多核苷酸的特征的速率的指令。

在一些实施方案中,还包括使处理器根据靶多核苷酸的特征的速率,从第一孔隙、第二孔隙或两者的电流信号中检测到的特征之间的时间计算特征之间的距离的指令。

在一些实施方案中,还包括使处理器对于每次扫描计算靶多核苷酸的特征的速率,并通过使用速率分布计算关于特征的速率的统计的指令。

在一些实施方案中,还包括使处理器组合所有特征的速率并计算在给定扫描和给定扫描方向上多核苷酸的速率的时间历程的指令。

在一些实施方案中,还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行频率扫描的指令。

在一些实施方案中,还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行振幅扫描的指令。

在一些实施方案中,还包括使处理器调节多核苷酸速率的指令。

在一些实施方案中,速率范围为每毫秒1个碱基对至每毫秒10个碱基对。

在一些实施方案中,还包括使处理器调节第一电压和第二电压以便以多个速率执行多核苷酸的多次扫描的指令。

在一些实施方案中,所述以多个速率执行多核苷酸的多次扫描提高了一个或多个特征的检测的准确性。

在一些实施方案中,还包括使处理器以多个速率对多核苷酸执行多次扫描的指令。

在一些实施方案中,还包括使处理器控制多核苷酸在第一方向、第二方向或两者上的速率范围的指令。

在一些实施方案中,还包括当多核苷酸在第一方向、第二方向或两者上移动通过第一孔隙和第二孔隙时使处理器控制第一孔隙和第二孔隙的电压范围的指令。

在一些实施方案中,还包括使处理器确定多核苷酸在第一方向、第二方向或两者上的最佳速率范围的指令,其中多核苷酸的最佳速率范围降低了布朗运动对多核苷酸的影响。

在一些实施方案中,控制多核苷酸的速率范围包括确定用于测序的多核苷酸的最佳速率范围。

本公开的方面包含用于使用本文描述的装置来执行所述方法的系统。所述系统的方面包含:a)用于定位通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列的一个或多个特征的双孔隙、双放大器装置,所述装置包含:(i)连接到电源的电极,所述电极被配置以在所述装置的第一流体通道和腔室之间提供第一电压,并且在所述装置的腔室和第二流体通道之间提供第二电压;(ii)第一孔隙;(iii)第二孔隙;其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动;(iv)一个或多个传感器,其能够鉴别:在第一循环中,在靶多核苷酸在第一方向上移动通过第一孔隙和第二孔隙期间,来自靶多核苷酸的第一组特征,和在第一循环中,在靶多核苷酸在第二方向上移动通过第二孔隙和第一孔隙期间,来自靶多核苷酸的第二组特征;c)处理器;以及d)非暂时性计算机可读介质,其包括指令以使所述处理器执行以下操作:i)从传感器确定所述靶多核苷酸同时存在于两个孔隙中;ii)扫描靶多核苷酸的一个或多个特征;iii)在第一方向上对第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,以产生作用于所述靶多核苷酸上的第一力和相反的第二力,其中所述第一力和第二力改变所述靶多核苷酸的移动方向和速率,使得所述靶多核苷酸的至少一部分在第二方向上从所述第二孔隙移动到所述第一孔隙;和iv)在第二循环中重复步骤i)至iii)以检测第三组和第四组特征。

本公开的方面包含用于在纳米孔隙装置中捕获多核苷酸,并且然后在延长的距离和/或时间段后,部分或完全在纳米孔隙装置中再捕获多核苷酸的装置,所述装置包含:(i)位于腔室和第一流体体积之间的第一孔隙,其中所述第一孔隙流体连接到所述腔室和第一流体体积,并且其中所述第一流体体积是在第一孔隙的相对侧上的几何约束的外壳,(ii)包含用于流体填充和电极接入的入口和出口的所述第一流体体积的外壳,其中所述第一孔隙在所述入口和出口之间的位置连接到所述第一流体体积的几何约束的外壳,(iii)位于第一流体体积内的至少一个电极和位于腔室内的至少一个电极,(iv)传感器,所述传感器被配置以提供:在所述第一流体体积内的所述电极与所述腔室内的所述电极之间的电压,以及检测捕获所述多核苷酸和其移位进入并通过第一孔隙的电流测量值;v)处理器;以及vi)非暂时性计算机可读介质,其包含指令以使所述处理器执行以下操作:a)施加第一电压以在第一方向上从所述腔室捕获所述多核苷酸和使其移位通过第一孔隙并进入第一流体体积中;b)当所述多核苷酸已经在第一方向上移位通过第一孔隙时在第一传感器电流中检测;c)在所述多核苷酸包含在所述第一流体体积内时施加等于零的第二电压一段时间;d)施加第三电压以使所述多核苷酸从所述第一流体体积中再捕获并部分或完全移位通过第一孔隙并进入腔室;以及e)当所述多核苷酸已经部分地或完全地移位通过第一孔隙时在第一传感器电流中检测。

本公开的方面包含用于在纳米孔隙装置中捕获多核苷酸,然后在延长的距离和/或时间段后部分或完全再捕获多核苷酸的系统,所述系统包含(a)纳米孔隙装置,其包含:(i)位于腔室和第一流体体积之间的第一孔隙,其中所述第一孔隙流体连接到所述腔室和第一流体体积,并且其中所述第一流体体积是在与所述第一孔隙相对的一侧上的几何约束的外壳,(ii)所述第一流体体积的所述外壳包含用于流体填充和电极接入的入口和出口,其中所述第一孔隙在所述入口和出口之间的位置中连接到所述第一流体体积的几何约束的外壳,(iii)位于第一流体体积内的至少一个电极和位于腔室内的至少一个电极,(b)传感器,其被配置以提供:在所述第一流体体积内的所述电极与所述腔室内的所述电极之间的电压,以及检测所述多核苷酸捕获和移位进入并通过第一孔隙的电流测量值;(c)处理器;以及(d)非暂时性计算机可读介质,其包括指令以使所述处理器执行以下操作:i)施加第一电压以在第一方向上从所述腔室捕获所述多核苷酸并使其移位通过第一孔隙和进入第一流体体积中;ii)当所述多核苷酸已经在第一方向上移位通过第一孔隙时在第一传感器电流中检测;iii)在所述多核苷酸包含在所述第一流体体积内时施加等于零的第二电压一段时间;iv)施加第三电压以从所述第一流体体积中再捕获所述多核苷酸并使其部分或完全移位通过第一孔隙和进入腔室中;和v)当所述多核苷酸已经部分或完全移位通过第一孔隙时在第一传感器电流中检测。

纳米孔隙装置

在一些实施方案中,双孔隙纳米孔隙装置包含至少一个纳米孔隙(如图8所示),其在将纳米孔隙装置的内部空间分隔成两个体积的结构中形成开口。纳米孔隙装置还包含至少一个传感器,所述传感器与开口电连通并被配置为鉴别经过纳米孔隙的物体(例如,通过检测指示物体的电信号参数的变化)。可用于本文所述的方法和系统的纳米孔隙装置还被公开于PCT公开号WO/2013/012881和WO/2018/236673,美国申请公开号2017/0145481和美国专利号9,863.912中,其通过引用整体并入本文。可用于所述方法和系统的纳米孔隙装置中的放大器和电路也被公开于美国申请公开号2017/0145481中,其通过引用整体并入本文。

在一些实施方案中,所述纳米孔隙装置中的纳米孔隙关于特征性的特征尺寸为纳米级或微米级。在一个方面,各孔隙具有允许小或大分子(例如,核酸分子或片段)或微生物通过的尺寸。在实例中,纳米孔隙的直径可以为1nm至100nm;然而,在实例的变型中,纳米孔隙的直径可以小于1nm或大于100nm。在一些实施方案中,所述孔隙的直径为约2nm至约50nm。在一些实施方案中,所述孔隙的直径为约20nm。在变型中,纳米孔隙具有1-10,000nm的深度;然而,在其它变型中,纳米孔隙可具有小于1nm或大于10,000nm的深度。此外,在实验运行期间,纳米孔隙尺寸可以变化(在合适的范围内),如下文进一步详细描述的。

在一些实施方案中,双孔隙装置中的各孔隙独立地具有深度。在一个实施方案中,各孔隙具有至少约0.3nm的深度。在一些实施方案中,各孔隙具有至少0.6nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、11nm、12nm、13nm、14nm、15nm、16nm、17nm、18nm、19nm、20nm、25nm、30nm、35nm、40nm、45nm、50nm、60nm、70nm、80nm、或90nm的深度。在一些实施方案中,各孔隙具有不大于约100nm的深度。或者,深度不超过约95nm、90nm、85nm、80nm、75nm、70nm、65nm、60nm、55nm、50nm、45nm、40nm、35nm、30nm、25nm、20nm、15或10nm。在一些实施方案中,所述孔隙的深度为约1nm至约100nm、或约2nm至约80nm、或约3nm至约70nm、或约4nm至约60nm、或约5nm至约50nm、或约10nm至约40nm、或约15nm至约30nm。在一些实施方案中,第一孔隙具有将第一流体通道与腔室分开至少约0.3nm的深度,并且第二孔隙具有将腔室与第二流体通道分开至少约0.3nm的深度。

在一些方面,所述双孔隙装置中的各孔隙独立地具有允许小或大分子或微生物经过的尺寸。在一些实施方案中,各孔隙的直径为至少约1nm。或者,各孔隙的直径为至少约2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、11nm、12nm、13nm、14nm、15nm、16nm、17nm、18nm、19nm、20nm、21nm、22nm、23nm、24nm、25nm、26nm、27nm、28nm、29nm、30nm、35nm、40nm、45nm、50nm、60nm、70nm、80nm、90nm或100nm。

在一些方面,孔隙的直径为约1nm至约100nm、或约2nm至约80nm、或约3nm至约70nm、或约4nm至约60nm、或约5nm至约50nm、或约10nm至约40nm、或约15nm至约30nm。

在一些实施方案中,所述纳米孔隙装置的纳米孔隙具有基本上圆形的形状。本文所用的“基本上圆形”是指至少约80或90%为圆柱体的形状。然而,在可选的实施方案中,纳米孔隙装置可以包含为正方形、矩形、三角形、椭圆形、六角形或另一形态的纳米孔隙。

在一些实施方案中,所述纳米孔隙延伸通过膜。例如,孔隙可以是插入到脂质双层膜中的蛋白质通道,或者其可以通过钻孔、蚀刻或以其它方式形成通过固态基材(如二氧化硅、氮化硅、石墨烯或由这些或其它材料的组合形成的层)的孔隙来工程化。

在一些实施方案中,装置的纳米孔隙可以以5-15000nm的距离间隔开。在一些实施方案中,装置的纳米孔隙可以以10至1000nm的距离间隔开。然而,在其它变型中,纳米孔隙可以间隔小于5nm或大于15,000nm。此外,纳米孔隙可以设置在任何位置,只要它们允许腔室之间的流体连通并且具有规定的尺寸和它们之间的距离。在一些实施方案中,第一孔隙和第二孔隙彼此分隔约10nm至500nm。在一些实施方案中,第一孔隙和第二孔隙彼此分隔约500nm。在一个变型中,所述纳米孔隙被设置以使得它们之间没有直接的阻断。此外,在一个方面,所述孔隙基本上是同轴的。

在一些情况下,所述孔隙的直径为约2nm至约50nm。在一些情况下,所述孔隙的直径为约20nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约2nm至约50nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约2nm至约8nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约10nm至约20nm。在一些情况下,孔隙的直径为约20nm至约30nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约30nm至约40nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约40nm至约50nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约2nm、约4nm、约6nm、约8nm、约10nm、约12nm、约14nm、约16nm、约18nm、约20nm、约22nm、约24nm、约26nm、约28nm、约30nm、约32nm、约34nm、约36nm、约38nm、约40nm、约42nm、约44nm、约46nm、约48nm、或约50nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约19nm。

在一些情况下,第一孔隙和第二孔隙具有相同的直径。在一些情况下,第一孔隙和/或第二孔隙的直径为约21nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约22nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约23nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约24nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约25nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约27nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约29nm。在一些情况下,第一孔隙和第二孔隙具有不同的直径。在一些情况下,孔隙的直径为约20nm。

在一些实施方案中,所述装置包含几何约束的流体体积。在一些情况下,几何约束的流体体积是流体通道。在一些情况下,所述装置包含第一流体通道。如本文所用,术语“上腔室”与术语“流体通道”和“几何约束的流体体积”可互换地使用,例如第一流体通道。在一些实施方案中,所述装置包含中腔室。如本文所用,术语“中腔室”与术语“腔室”可互换使用。在一些实施方案中,所述装置包含连接上腔室和中腔室的第一孔隙。在一些实施方案中,所述装置包含连接中腔室和下腔室的第二孔隙。如本文所用,术语“下腔室”与术语“流体通道”和“几何约束的流体体积”可互换地使用,例如第二流体通道。在一些实施方案中,所述装置包含下腔室。在一些实施方案中,所述装置包含第二流体通道。在一些实施方案中,第一流体体积、第二流体体积、第一流体通道、第二流体通道和/或腔室包含用于连接到电源的一个或多个电极,使得可以跨腔室之间的各孔隙建立单独的电压。在一些实施方案中,所述装置包含连接到电源的电极,所述电源被配置以在所述装置的第一流体通道和腔室之间提供第一电压,并且在所述装置的腔室和第二流体通道之间提供第二电压。在一些实施方案中,所述腔室位于第一孔隙和第二孔隙上方。在一些实施方案中,所述腔室位于第一流体通道和第二流体通道上方。在一些实施方案中,所述腔室位于第一孔隙和第二孔隙下方。在一些实施方案中,所述腔室位于第一孔隙和第二孔隙之间。在一些实施方案中,所述腔室位于第一流体通道和第二流体通道之间。

在一些情况下,第一流体通道和/或第二流体通道的形状可以是圆形、正方形、矩形、六边形、三角形、椭圆形、多边形、V形、U形或任何其它合适的形状。在一些情况下,第一流体通道和第二流体通道各自具有V形,并且各自在V形的任一端上具有开口,第一流体通道和第二流体通道的V形彼此相对设置在芯片上,V形的点彼此相邻,并且其中第一纳米孔隙位于第一流体通道的V形的点处,并且第二纳米孔隙位于第二流体通道的V形的点处。在一些实施方案中,每个流体通道具有不同的形状。流体通道不限于本文所述的形状和/或尺寸,并且可以是根据其预期用途规定的条件所需的任何形状和/或尺寸。

在一些情况下,所述纳米孔隙装置的流体通道包含在第一孔隙和/或第二孔隙的相对侧上的一个或多个开口。在一些情况下,所述纳米孔隙装置的流体通道包含在第一孔隙和/或第二孔隙的相对侧上的两个开口。

在一些实施方案中,所述纳米孔隙装置具有位于流体通道、几何约束的体积或室中的电极,并与一个或多个电源耦合以施加跨纳米孔隙的电压。在一些方面,电源包含电压钳或膜片钳,其可以提供跨各孔隙的电压并独立地测量通过各孔隙的电流。在这方面,电源和电极配置可以将腔室设置为用于两个电源的公共接地。这样,每个纳米孔隙可以具有其自身各自的施加电压。

在一些方面,纳米孔隙装置的不同纳米孔隙的第一电压V1和第二电压V2是可独立调节的。在一个方面,在多个纳米孔隙通过腔室连接的情况下,可以将腔室调节为相对于两个电压的接地。在一个方面,所述腔室包含用于各孔隙和腔室中的电极之间提供电导的介质。在一个方面,所述腔室包含用于各个纳米孔隙和腔室中的电极之间提供电阻的介质。维持这样的电阻相对于纳米孔隙电阻足够小而可用于解耦跨孔隙的两个电压和电流,这有助于电压的独立调节。

电压的调节可用于控制所述腔室中带电颗粒的运动。例如,当两个电压被设置为相同的极性时,适当带电的颗粒可以顺序地从第一流体通道移动到腔室和到第二流体通道,或相反地移动。在一些方面,当两个电压被设置为相反的极性时,带电颗粒可以从第一流体通道或第二流体通道移动到腔室并维持在那里。

所述装置中电压的调节可特别用于控制大分子如带电聚合物的运动,所述大分子足够长以同时跨过两个孔隙。在这样的方面,分子运动的方向和速率可以通过如下所述的电压的相对大小和极性来控制。

在一些情况下,第一初始电压的范围为0mV至1000mV。在一些情况下,第一初始电压范围为100-200mV、200-300mV、300-400mV、400-500mV、500-600mV、600-700mV、700-800mV、800-900mV、900-1000mV或1000或更高mV。在一些情况下,第一初始电压为100mV、200mV、300mV、400mV、500mV、600mV、700mV、800mV、900mV或1000mV。在一些情况下,第二初始电压的范围为0mV至1000mV。在一些情况下,第二初始电压范围为100-200mV、200-300mV、300-400mV、400-500mV、500-600mV、600-700mV、700-800mV、800-900mV、900-1000mV、或1000或更高mV。在一些情况下,第二初始电压为100mV、200mV、300mV、400mV、500mV、600mV、700mV、800mV、900mV或1000mV。

在一些情况下,本公开的方法包括调节第一电压和/或第二电压以控制靶多核苷酸在装置的第一孔隙、第一流体通道、第二孔隙、第二流体通道和/或腔室中的移动。在一些情况下,在靶多核苷酸从腔室移动通过第一孔隙并进入第一流体通道后,将第一电压调节至0mV。在一些情况下,在移位通过第一孔隙之前,将第一电压调节至0mV,其中靶多核苷酸的至少一部分位于腔室中并且靶多核苷酸的至少一部分位于第一流体通道内。在一些情况下,当靶多核苷酸的至少一部分位于腔室中并且靶多核苷酸的至少一部分位于腔室中时,将第二孔隙处的第二电压调节至500mV。在一些情况下,在第一方向、第二方向、第三方向和/或第四方向上将第一电压调节至0mV、50mV、100mV、150mV、200mV、250mV、300mV、350mV、400mV、450mV、500mV、550mV或600mV。在一些情况下,在第一方向、第二方向、第三方向和/或第四方向上将第二电压调节至0mV、50mV、100mV、150mV、200mV、250mV、300mV、350mV、400mV、450mV、500mV、550mV或600mV。在一些情况下,在第三方向上,将第一电压调节至0mV的中间电压,并且将第二电压调节至500mV(例如,当靶多核苷酸的至少一部分被共捕获在第一孔隙和第二孔隙中时)。在一些情况下,将第一电压调节至400mV,并且第二电压在第三方向上被调节至500mV(例如,当靶多核苷酸的至少一部分被共捕获在第一孔隙和第二孔隙中时)。在一些情况下,将第一电压调节至200mV的电压,并且第二电压在第三方向上调节至500mV的电压(例如,当靶多核苷酸的至少一部分被共捕获在第一孔隙和第二孔隙中时)。

在一些实施方案中,带电聚合物(如多核苷酸)的长度长于包含两个孔隙的深度加上两个孔隙之间的距离的组合距离。例如,1000bp dsDNA的长度为约340nm,并且将显著长于由20nm分隔的两个10nm长度孔隙跨越的40nm。在第一步骤中,将多核苷酸加载到第一流体通道或第二流体通道中。在第一步骤中,将多核苷酸加载到装置的腔室(例如中腔室或公共腔室)中。由于其在生理条件(~pH 7.4)下的负电荷,多核苷酸可以跨过施加电压的孔隙移动。因此,在第二步骤中,向孔隙施加相同方向和相同或相似大小的两个电压,以诱导多核苷酸顺序地跨两个孔隙的移动。大约在多核苷酸到达第二孔隙时,可以改变一个或两个电压。由于多核苷酸比覆盖两个孔隙的距离更长,当多核苷酸到达第二孔隙时,它还在第一孔隙中。因此,第一孔隙处电压的方向的迅速变化将产生将多核苷酸拉离第二孔隙的力。

在一些实施方案中,本公开的双孔隙装置可用于进行分子或颗粒的分析,所述分子或颗粒由于施加在孔隙上的受控电压而在装置内移动或维持在装置内。在一个方面,分析在任一孔隙或两个孔隙处进行。每个电压钳或膜片钳系统测量通过各孔隙的离子电流,并且该测量的电流用于检测经过的带电颗粒或分子的一个或多个特征,或与经过的带电颗粒或分子相关的任何特征。

如上所述,可以通过具有相同方向的两个电压将多核苷酸加载到两个孔隙中。在该实例中,一旦施加在第一孔隙的电压的方向逆转,并且新的电压诱导的力在砂眼上比施加在第二孔隙处的电压诱导的力稍小,多核苷酸将继续在相同的方向上移动,但是以明显较低的速率。在该方面,提供跨第二孔隙电压的放大器还测量经过第二孔隙的电流,并且然后离子电流确定正经过孔隙的核苷酸的身份,因为每种不同核苷酸的经过将产生不同的电流印记(例如,基于离子电流大小的偏移)。因此,多核苷酸中每个核苷酸的鉴别揭示了多核苷酸的序列。

在一些实施方案中,分步调节的第一电压和第二电压在大小上是所述两个电压之间的差值的约10倍至约10,000倍。例如,两个电压分别为90mV和100mV。在一些实施方案中,电压的大小(~100mV)是它们之间的差值(10mV)的约10倍。在一些实施方案中,电压的大小是它们之间的差值的至少约15倍、20倍、25倍、30倍、35倍、40倍、50倍、100倍、150倍、200倍、250倍、300倍、400倍、500倍、1000倍、2000倍、3000倍、4000倍、5000倍、6000倍、7000倍、8000倍或9000倍。在一些方面中,电压的大小不超过它们之间的差值的约10000倍、9000倍、8000倍、7000倍、6000倍、5000倍、4000倍、3000倍、2000倍、1000倍、500倍、400倍、300倍、200倍或100倍。

在一些方面,用于重新测序多核苷酸的重复受控递送进一步提高了测序的质量。对于各方向上的受控递送,每个电压交替地变大。

所述装置可包含适于容纳液体样品(特别是生物样品)的材料,和/或适于纳米制造的材料。在一个方面,此类材料包括介电材料,例如但不限于硅、氮化硅、二氧化硅、石墨烯、碳纳米管、TiO2、HfO2、Al2O3或其它金属层,或这些材料的任何组合。在一些方面,例如,约0.3nm厚的单片石墨烯膜可用作孔隙承载膜。

作为微流体器件的纳米孔隙装置可通过多种方式和方法制成。聚焦的电子或离子束可用于钻出穿过膜的孔隙,自然地对齐它们。通过施加聚焦于每层的正确束,孔隙也可以被雕刻(收缩)成较小的尺寸。考虑到对于给定方法可能的钻孔深度和膜的厚度,任何单一纳米孔隙钻孔方法也可用于在两个膜中钻出孔隙对。将微孔隙预钻至规定的深度,和然后通过膜的剩余部分钻出纳米孔隙,也可以进一步优化膜的厚度。在一个实例中,单个束可用于在纳米孔隙装置的膜中形成一个或多个纳米孔隙(例如,同心纳米孔隙)。或者,在另一个实例中,可以将不同的束施加到膜的每一侧上的每一侧,以产生对齐或非对齐的纳米孔隙。

更具体地,可以使用具有5-100nm厚的硅、氮化硅或二氧化硅窗口的透射电子显微镜(TEM)网格来制备纳米孔隙承载膜。间隔物可用于分隔所述膜,其使用绝缘体(例如SU-8、光致抗蚀剂、PECVD氧化物、ALD氧化物、ALD氧化铝或蒸发金属材料(例如Ag、Au或Pt))并在中腔室(例如腔室)的其它含水部分内占据小体积来实现。

通过装置的孔隙处存在的电压,带电分子可以移动通过腔室之间的孔隙。运动的速率和方向可以通过电压的大小和极性来控制。此外,因为可以独立地调节两个电压中的每一个,因此可以在每个腔室中精细地控制带电分子的移动方向和速率。例如,当在第一循环中在第一方向上检测到第一组特征时,可以对第一孔隙和第二孔隙调节第一电压、第二电压或两者,以改变靶分子在第二方向上从第二孔隙移动到第一孔隙的方向。

在一些方面,纳米孔隙装置还包含使聚合物跨孔隙移动的手段和/或鉴别经过孔隙的物体的手段。在一些实施方案中,所述聚合物是多核苷酸或多肽。在一些方面,所述聚合物是多核苷酸。多核苷酸的非限制性实例包含双链DNA、单链DNA、双链RNA、单链RNA和DNA-RNA杂合体。

在一些方面,所述双孔隙装置可用于鉴别聚合物的一个或多个特征。在一些实施方案中,一个或多个特征是一个特征、两个特征、三个特征、四个特征或五个特征。在一些实施方案中,一个或多个特征是两个或更多个特征、三个或更多个特征、四个或更多个特征、五个或更多个特征、六个或更多个特征、七个或更多个特征、八个或更多个特征、九个或更多个特征或十个或更多个特征。在一些实施方案中,一个或多个特征的范围为1-5个特征、5-10个特征、10-15个特征、15-20个特征、20-25个特征、25-30个特征、30-35个特征、35-40个特征、40-45个特征或45-50个特征。在一些实施方案中,一个或多个特征的范围为50个特征至100个特征、100个特征至1,000个特征、1,000个特征至10,000个特征、10,000个特征至100,000个特征、100,000个特征至200,000个特征。在一些实施方案中,一个或多个特征为50个特征或更多、100个特征或更多、1,000个特征或更多、10,000个特征或更多、100,000个特征或更多或200,000个特征或更多。

本公开的方面包含一个或多个特征,其中每个特征彼此相距大约约100个碱基对、300个碱基对、500个碱基对、1千碱基对、5千碱基对、10千碱基对、20千碱基对或其组合。在一些实施方案中,每个特征彼此间隔约25个碱基对或更多、约50个碱基对或更多、约100个碱基对或更多、约300个碱基对或更多、约500个碱基对或更多、约1千碱基对或更多、约5千碱基对或更多、约10千碱基对或更多、约20千碱基对或更多或其组合。在一些实施方案中,每个特征彼此间隔约25个碱基对或更少、约50个碱基对或更少、约100个碱基对或更少、约300个碱基对或更少、约500个碱基对或更少、约1千碱基对或更少、约5千碱基对或更少、约10千碱基对或更少、约20千碱基对或更少或其组合。

在一些方面,所述双孔隙装置可用于鉴别第一组特征、第二组特征、第三组特征、第四组特征、第五组特征、第六组特征、第七组特征、第八组特征、第九组特征和/或第十组特征。在一些情况下,每组特征包含范围为1-5个特征、5-10个特征、10-15个特征、15-20个特征、20-25个特征、25-30个特征、30-35个特征、35-40个特征、40-45个特征或45-50个特征的一个或多个特征。在一些实施方案中,第一组特征与第二组特征重叠。在一些实施方案中,第三组特征与第四组特征重叠。在一些实施方案中,第一组特征与第二组特征部分重叠。在一些实施方案中,第三组特征与第四组特征部分重叠。在一些实施方案中,第一组特征与第二组特征相同。在一些实施方案中,第三组特征与第四组特征相同。在一些实施方案中,第一组特征不同于第二组特征。在一些实施方案中,第三组特征不同于第四组特征。

在一些实施方案中,特征组(例如,第一组、第二组、第三组、第四组、第五组、第六组、第七组、第八组、第九组和/或第十组)分别与第一循环、第二循环、第三循环、第四循环、第五循环、第六循环、第七循环、第八循环、第九循环和/或第十循环相关联。在一些情况下,第一循环包括由处理器执行的一次或多次扫描以检测第一组特征。在一些情况下,第一循环包括两次或更多次扫描、三次或更多次扫描、四次或更多次扫描、五次或更多次扫描、六次或更多次扫描、七次或更多次扫描、八次或更多次扫描、九次或更多次扫描或十次或更多次扫描。在一些情况下,第一循环包括两次或多次更扫描、四次或更多次扫描、六次或更多次扫描、八次或更多次扫描、十次或更多次扫描、十二次或更多次扫描、十四次或更多次扫描、十六次或更多次扫描、十八次或更多次扫描、或二十次或更多次扫描。在一些情况下,第一循环包括五次或更多次扫描、十次或更多次扫描、十五次或更多次扫描、二十次或更多次扫描、二十五次或更多次扫描、三十次或更多次扫描、三十五次或更多次扫描、四十次或更多次扫描、四十五次或更多次扫描或五十次或更多次扫描。

在一些情况下,第二循环包括由处理器执行的一次或多次扫描以检测第三组特征。在一些情况下,第二循环包括两次或更多次扫描、三次或更多次扫描、四次或更多次扫描、五次或更多次扫描、六次或更多次扫描、七次或更多次扫描、八次或更多次扫描、九次或更多次扫描、或十次或更多次扫描。在一些情况下,第二循环包括两次或更多次扫描、四次或更多次扫描、六次或更多次扫描、八次或更多次扫描、十次或更多次扫描、十二次或更多次扫描、十四次或更多次扫描、十六次或更多次扫描、十八次或更多次扫描、或二十次或更多次扫描。在一些情况下,第二循环包括五次或更多次扫描、十次或更多次扫描、十五次或更多次扫描、二十次或更多次扫描、二十五次或更多次扫描、三十次或更多次扫描、三十五次或更多次扫描、四十次或更多次扫描、四十五次或更多次扫描、或五十次或更多次扫描。在一些情况下,第一循环和第二循环一起包括50次或更多次扫描、100次或更多次扫描、150次或更多次扫描、200次或更多次扫描、250次或更多次扫描、300次或更多次扫描、350次或更多次扫描、400次或更多次扫描、或500次或更多次扫描。在一些实施方案中,第一循环、第二循环、第三循环、第四循环和第五循环一起包括50次或更多次扫描、100次或更多次扫描、150次或更多次扫描、200次或更多次扫描、250次或更多次扫描、300次或更多次扫描、350次或更多次扫描、400次或更多次扫描、或500次或更多次扫描。

本公开的方面包含处理器和计算机可读介质,所述计算机可读介质包括使处理器重复以下操作的指令:确定靶多核苷酸在两个孔隙中的存在,扫描一个或多个特征,以及改变电压以控制多核苷酸的移动(例如在任一方向上),持续第三循环、第四循环和第五循环;或当所述多核苷酸离开所述装置时。

在一些方面,所述双孔隙装置可用于鉴别聚合物的一个或多个特征。在一些实施方案中,所述聚合物是多核苷酸。在一些实施方案中,所述多核苷酸的一个或多个特征包含与多核苷酸相关联的一个或多个特征。与多核苷酸相关联的一个或多个特征的非限制性实例包括但不限于转录因子、核小体或对特征的修饰,其包括对组蛋白尾的修饰。在一些实施方案中,多核苷酸中的一个或多个特征包含一个或多个序列或结构变异。

在一些实施方案中,多核苷酸的一个或多个特征包含与多核苷酸结合的一个或多个有效负荷分子。在一些实施方案中,多核苷酸的一个或多个特征包含与多核苷酸杂交的一个或多个有效负荷分子。在一些实施方案中,多核苷酸的一个或多个特征包含结合至多核苷酸的基因组中的一个或多个有效负荷分子。在一些实施方案中,多核苷酸的一个或多个特征包含靶多核苷酸的多核苷酸序列上的分子基序。在一些实施方案中,一个或多个特征包括靶多核苷酸的多核苷酸序列上一个或多个CpG;或一个或多个甲基化位点和CpG的位置。在一些实施方案中,一个或多个特征包括靶多核苷酸上一个或多个组蛋白的位置。在一些实施方案中,一个或多个特征包括选自以下的分子:核酸、TALEN、CRISPR、肽核酸和化学化合物。在一些实施方案中,一种或多种特征包括DNA结合蛋白、多肽、抗DNA抗体、链霉亲和素、转录因子、组蛋白、肽核酸(PNA)、DNA-发夹、DNA分子、适体或其组合。

与多核苷酸结合的有效负荷分子的非限制性实例可以在美国专利公开号2018/0023115中找到,其通过引用整体并入全文。例如,有效负荷分子可包含树枝状大分子、双链DNA、单链DNA、DNA适体、荧光团、蛋白质、多肽、纳米棒、纳米管、富勒烯、PEG分子、脂质体或胆固醇-DNA杂合体。在一些实施方案中,多核苷酸和有效负荷通过共价键、氢键、离子键、范德华力、疏水相互作用、阳离子-π相互作用、平面堆叠相互作用或金属键直接或间接连接。有效负荷增加了靶多核苷酸或扩增子的尺寸,并且有助于检测,其中结合到有效负荷的扩增子在经过纳米孔隙时具有与背景分子显著不同的电流印记。在一些实施方案中,有效负荷分子包括用于连接至引物的叠氮化物化学柄。在一些实施方案中,引物与生物素分子结合。在一些实施方案中,有效负荷分子可与另一分子结合以影响分子的体积,从而增强纳米孔隙中扩增子检测的灵敏度。在一些实施方案中,引物结合或包含用于结合生物素分子的结合位点。在一些实施方案中,生物素进一步被链霉抗亲和素蛋白结合以增加有效负荷分子的尺寸,从而增强纳米孔隙中相对于背景分子的检测。增加的体积可以在包含靶序列的扩增子和背景分子之间产生更明显的印记差异。

在该实施方案中,有效负荷与引物或扩增子的连接可以通过多种方式实现。例如,引物可以是二苯并环辛炔(DBCO)修饰的引物,从而用DBCO化学基团有效标记所有扩增子以用于通过无铜“点击”化学与叠氮化物标记的扩增子或引物缀合的目的。

在一些方面,引物包括引起或促进有效负荷分子的识别和结合的化学修饰。例如,甲基化的DNA序列可被转录因子、DNA甲基转移酶或甲基化修复酶识别。在其它实施方案中,生物素可以被结合到抗生物素蛋白家族成员中并被识别。在这些实施方案中,生物素形成融合结合结构域,并且抗生物素蛋白或抗生物素蛋白家族成员是融合体上的聚合物支架结合结构域。由于其结合互补性,引物/扩增子上的有效负荷分子结合结构域和有效负荷分子上的引物结合结构域可以颠倒,使得有效负荷结合结构域变成引物结合结构域,反之亦然。

能够特异性识别核苷酸结合基序的分子,特别是蛋白质是本领域已知的。例如,已知蛋白结构域(如螺旋-转角-螺旋、锌指、亮氨酸拉链、翼状螺旋、翼状螺旋-转角-螺旋、螺旋-环-螺旋和HMG-盒)能够结合核苷酸序列。这些分子中的任何一种都可以作为与扩增子或引物结合的有效负荷分子。

在一些方面,有效负荷结合结构域可以是锁核酸(LNA)、桥接核酸(BNA)、所有类型的蛋白质核酸(例如bisPNA、γ-PNA),转录激活因子样效应核酸酶(TALEN)、成簇规则间隔的短回文重复序列(CRISPR)或适体(例如DNA、RNA、蛋白或其组合)。

在一些方面,有效负荷结合结构域是DNA结合蛋白(例如锌指蛋白)、抗体片段(Fab)、化学合成的结合剂(例如,PNA、LNA、TALENS或CRISPR)或合成聚合物支架(例如硫醇盐、生物素、胺、羧酸盐)中的化学修饰(即反应性部分)中的一种或多种。

在一些实施方案中,一个或多个特征包含多核苷酸中的一个或多个特征。在一些实施方案中,多核苷酸中的一个或多个特征包含对多核苷酸的一个或多个修饰。在一些实施方案中,一种或多种修饰包含DNA甲基化(例如,5mC、5hmC,例如在CpG二核苷酸处,5mA等)。

在一些实施方案中,多核苷酸中的一个或多个特征包含序列变异、突变或较大的结构变异。在一些实施方案中,多核苷酸中的一个或多个特征包含对多核苷酸序列的重排、缺失、插入和/或移位。

在一些实施方案中,一个或多个特征包含多核苷酸上的一个或多个特征。在一些实施方案中,多核苷酸上的一个或多个特征包含对多核苷酸的修饰。在一些实施方案中,所述修饰包含与单体结合的分子。在一些实施方案中,多核苷酸上的一个或多个特征包含与多核苷酸结合的一个或多个分子。在一些实施方案中,所述修饰包含分子与多核苷酸的结合。例如,对于DNA分子,结合的分子可以是DNA结合蛋白,如RecA、NF-κB和p53。在一些实施方案中,所述修饰是与特定单体或片段结合的颗粒。例如,为了基因分型或DNA定位的目的,结合到特定DNA位点的量子点或荧光标记可被所述装置检测到。

在一些实施方案中,多核苷酸序列包含一个或多个切口位点。作为非限制性实例,切刻限制性核酸内切酶在用于条形码的识别序列处引入切口。该序列多次出现在基因组中。在切口位点处引入单个叠氮化物叠氮N3标记的核苷酸。过滤反应物以去除未掺入的核苷酸。将用DCBO标记,5'、3'或体标记的DNA分子添加到反应中。DNA分子通过无铜点击化学共价连接于切口位点处。可以使用1000-10000倍过量的DNA分子。在另一个非限制性实例中,Cas9 D10A切口酶可用于位点特异性标记。Cas9-D10A靶向特定位点并引入单链切口。去除Cas9 D10A。通过切口平移在切口位点处引入单叠氮化物N3核苷酸。过滤反应物以去除未掺入的核苷酸。将用DCBO标记,5'、3'或体标记的DNA分子添加到反应中。DNA分子通过无铜点击化学共价连接于切口位点。可以使用1000-10000倍过量的DNA分子。

在一个实施方案中,纳米孔隙装置包含多个腔室,每个腔室通过至少一个孔隙与相邻腔室连通。

在一些实施方案中,纳米孔隙装置可以是具有多于一个孔隙的多孔隙装置。在一些实施方案中,纳米孔隙装置可以包含两个纳米孔隙,其中第一纳米孔隙相对于第二纳米孔隙以允许靶多核苷酸的至少一部分移出第一纳米孔隙并进入第二纳米孔隙的方式定位。在一些实施方案中,纳米孔隙装置在每个纳米孔隙处包含一个或多个传感器,其中相应的传感器能够在跨至少一个纳米孔隙的运动期间识别靶多核苷酸。在一些实施方案中,识别需要鉴定靶多核苷酸的单个组分。在一些实施方案中,识别需要鉴定与靶多核苷酸结合的有效负荷分子。当使用单个传感器时,单个传感器可以包含放置在孔隙两端的两个电极以测量通过孔隙的离子电流。在另一个实施方案中,单个传感器包含除电极之外的组件。

在一些实施方案中,纳米孔隙装置包含通过两个孔隙连接的三个腔室。具有多于三个腔室的装置可容易地设计为在三腔室装置的任一侧上或在三个腔室中的任何两个之间包含一个或多个另外的腔室。同样,装置中可以包含多于两个的纳米孔隙以连接所述腔室。在一些实施方案中,所述腔室连接到相对于两个电压的公共接地。

在一个方面,在两个相邻腔室之间可以存在两个或更多个孔隙,以允许多个聚合物支架同时从一个腔室移动到下一个腔室。这种多孔隙设计可以提高装置中靶多核苷酸分析的通量。对于多路复用,一个腔室可以具有一种类型的靶多核苷酸,并且另一个腔室可以具有另一种靶多核苷酸类型。

在一些方面,所述装置还包含将靶多核苷酸从一个腔室移动到另一个腔室的手段。在一个方面,所述移动导致同时跨第一孔隙和第二孔隙加载所述靶多核苷酸(例如,包含靶序列的扩增产物或扩增子)。在另一个方面,所述手段还能够使靶多核苷酸以相同方向移动通过两个孔隙。

虽然上面描述了纳米孔隙装置的一些变体,但是纳米孔隙装置可以如美国申请公开号2013-0233709、美国专利号9,863,912和PCT申请公开号WO2018/236673中所述进行配置,其全部内容通过引用并入本文。

系统和装置-传感器

如上所述,在各个方面,纳米孔隙装置还包含一个或多个产生与经过纳米孔隙的材料对应的电信号的传感器。

在纳米孔隙装置中使用的传感器可以包含适合于识别与有效负荷分子结合或未结合的靶多核苷酸扩增子的任何传感器。例如,传感器可被配置以通过测量与聚合物相关的电流、电压、pH值、光学特征或停留时间来识别靶多核苷酸。在其它方面中,传感器可被配置以识别靶多核苷酸的一个或多个单独组分或结合或附着到靶多核苷酸的一个或多个组分。所述传感器可由被配置为检测可测量参数的变化的任何组分形成,其中所述变化指示靶多核苷酸、靶多核苷酸的组分,或在一些情况下,结合或附着于靶多核苷酸的组分。在一个方面,传感器包含置于孔隙两侧的一对电极,以在分子或其它实体,特别是靶多核苷酸移动通过孔隙时测量跨孔隙的离子电流。在某些方面,当经过孔隙的靶多核苷酸片段与有效负荷分子结合时,跨孔隙的离子电流可测量地改变。这种电流的变化可以对应于例如存在的靶多核苷酸分子的存在、不存在和/或尺寸以可预测、可测量的方式变化。

在一个实施方案中,传感器包含施加电压并用于测量经过纳米孔隙的电流的电极。分子经过纳米孔隙的移位提供电阻抗(Z),其根据欧姆定律V=IZ影响通过纳米孔隙的电流,其中V是施加的电压,I是通过纳米孔隙的电流,并且Z是阻抗。相反地,监测电导G=1/Z以发出信号并定量纳米孔隙事件。当分子在电场中(例如,在施加的电压下)移位通过纳米孔隙时的结果是电流印记,其可以在进一步分析电流信号时与经过纳米孔隙的分子相关。

当使用来自电流印记的驻留时间测量时,可基于经过传感装置所花费的时间长度将组件的尺寸与特定组件相关联。

在一个实施方案中,在纳米孔隙装置中提供传感器,其测量聚合物、聚合物的组分(或单元)、或结合或附着于聚合物的组分的光学特征。这种测量的一个实例包含通过红外(或紫外)光谱识别特定单元特有的吸收带。

在一些实施方案中,传感器是电传感器。在一些实施方案中,传感器检测荧光特征。在孔隙出口处的辐射源可用于检测所述印记。所述纳米孔隙装置中的传感器电路的非限制性实例可以在PCT申请公开号WO/2018/236673中找到,其通过引用整体并入本文。

系统和装置-处理器、控制器和其他元件

如上所述,本公开的实施方案系统被配置以与该组的一个或多个纳米孔隙装置接口,并且包含用于接收来自该组纳米孔隙装置的传感器的电信号和用于例如实时地(例如,通过调制跨纳米孔隙施加的电压,以及扫描和监察分子上的各个区域)创建分子的一个或多个特征的局部图谱、全局图谱和/或一致性图谱的电子子系统。电子子系统可以包含信号处理元件(例如,放大器、滤波器、信号预调理元件等)和/或用于控制施加在不同纳米孔隙上的电压的元件,以便能够自动检测和定位纳米孔隙装置中分子的不同区域上的一个或多个特征。

本公开的方面包括含有处理器的装置。在一些实施方案中,所述装置包含非暂时性计算机可读介质,其包括使处理器从一个或多个传感器确定所述靶多核苷酸同时存在于两个孔隙中的指令。在一些实施方案中,所述指令使处理器扫描靶多核苷酸的一个或多个特征。在一些实施方案中,所述指令使处理器在第一方向上对第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,以产生作用于所述靶多核苷酸的第一力和相反的第二力。在一些实施方案中,第一力和第二力改变靶多核苷酸移动的方向和速率,使得靶多核苷酸的至少一部分在第二方向上从第二孔隙移动到第一孔隙。在一些实施方案中,所述过程在第二循环中重复以检测第二组特征。在一些实施方案中,所述过程在第二循环中检测第三组和第四组特征。在一些实施方案中,重复这些步骤直到多核苷酸离开双孔隙装置。

在一些实施方案中,计算机可读介质还包括使处理器基于扫描构建含有一种或多种特征的多核苷酸区域的局部图谱的指令。在一些实施方案中,计算机可读介质还包括使处理器基于扫描构建含有一种或多种特征的多核苷酸的区域的一致性图谱的指令。在一些实施方案中,构建包括机器学习算法,其基于训练数据和概率模型训练以检测一个或多个特征,这将在下面进一步详细描述。

本公开的方面包含含有控制器的装置。在一些实施方案中,所述控制器是现场可编程门阵列(FPGA)。在一些实施方案中,所述控制器被配置以控制待扫描的特征数量。在一些实施方案中,所述控制器被配置以控制待重新扫描的特征数量。在一些实施方案中,所述控制器被配置以控制靶多核苷酸的移动。在一些实施方案中,所述控制器被配置以控制靶多核苷酸的方向。在一些实施方案中,所述控制器确定对一个或多个特征中的哪一个执行额外的扫描。在一些实施方案中,所述控制器确定何时从已经检测的一个或多个特征移开。在一些实施方案中,所述控制器确定何时扫描多核苷酸上尚未被扫描的区域。在一些实施方案中,FPGA执行控制逻辑以改变:a)待扫描的特征数量;b)待重新扫描的特征数量;c)所述靶多核苷酸的移动或方向;d)所述靶多核苷酸的方向;或e)其组合。

在一些实施方案中,所述处理器和包含指令的计算机可读介质使得处理器执行由控制器指示的功能(例如,待扫描的特征数量;重新扫描的特征数量;所述靶多核苷酸的移动;所述靶多核苷酸的方向;和/或其组合)。在一些实施方案中,所述处理器是现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

在一些实施方案中,所述控制器、处理器和非暂时性计算机可读介质,所述非暂时性计算机可读介质包括指令以使处理器执行以下操作:当检测到第一组探针时,改变靶多核苷酸的方向。在一些实施方案中,实时调节第一电压和第二电压,其中所述调节由使用硬件和软件的有源反馈控制器来执行。在一些实施方案中,所述控制器被配置以基于第一或第二或两者的离子电流测量的反馈来控制第一或第二电压。

所述装置和系统的实施方案还可以包含处理器,其包含具有用于实现一组操作模式的逻辑的架构,其包括:第一操作模式,其用于测量和评估来自与分子的一个或多个特征相关联的所接收的电信号的度量组;第二操作模式,其用于在处理所述度量组的值时生成对一个或多个特征的评估;以及第三操作模式,其用于执行一个或多个操作以继续扫描分子的相同区域以搜索额外特征,继续扫描分子的相同区域以重新扫描已经检测的相同探针,改变在相同区域中待扫描的探针的数量,或基于所述评估移动到分子的不同区域用于扫描。这样,系统可以包含用于实现以下更详细描述的方法的实施方案的结构。

装置和系统还可以生成用于提供给系统操作员的通知。通知可以包含描述以下一项或多项的内容:系统的状态、与系统的控制元件接口的一个或多个纳米孔隙装置的状态、一个或多个纳米孔隙的状态、调节系统操作的说明、进行与纳米孔隙/纳米孔隙装置状态有关的实验方案的说明和其它内容。通知可以由系统以可视格式(例如,使用显示器),可听格式(例如,使用扬声器),触觉(例如,使用触觉装置)和/或另一种其他合适的格式呈现。

所述装置和系统还可以产生用于在与纳米孔隙/纳米孔隙装置状态有关的不同的系统操作模式之间转换的计算机可读指令(例如,转换到空闲模式,转换到“停止实验”模式,转换到“恢复实验”模式,转换到校准模式,转换到涉及使用仍然具有合适质量的纳米孔隙的子集的模式,等等)。可以将计算机可读指令发送到系统的控制器,以便在操作模式之间转换系统。

与所描述的系统和方法的实施方案相关的机器学习架构的实施方案“学习”何时从靶多核苷酸上的一个位置移动到另一个位置,何时连续扫描一个或多个特征,何时改变待扫描的特征数量,以及何时从连续扫描一个或多个特征切换到从已经扫描的一个或多个特征进一步移离以进一步达到尚未被监察/扫描的位置。自动化目标是产生足够信息的数据集,以便构建每个分子(即多核苷酸)的一致性图谱。例如,具有控制逻辑的机器学习架构可以在一段时间内扫描分子的区域,实时构建所述区域的局部图谱,并且然后移动到尚未被扫描的不同位置以构建分子的一致性图谱。在一个实例中,可以使用贝叶斯优化,其可在具有有限处理能力的硬件(其需要实时/近实时地作出反应)上运行。虽然描述了贝叶斯优化,但是可以使用其他统计和/或机器学习方法用于自动搜索和监察分子图谱的生成。在变型中,这些模型可以实现包括无监督学习(例如,使用K均值聚类)、监督学习(例如,使用回归、使用反向传播网络)、半监督学习、强化学习或任何其他合适的学习样式的学习样式。

所述装置和系统可以另外地或替代地实施以下中的任何一个或多个:回归算法(例如,最小二乘、逻辑、逐步、多元自适应等),基于实例的方法(例如,k-最近邻、学习矢量量化、自组织图谱等),正则化方法(例如,脊回归、最小绝对收缩和选择算子、弹性网络等),决策树学习方法,核方法(例如,支持矢量机、径向基函数、线性判别分析等),聚类方法(例如,k-均值聚类、期望最大化等),关联规则学习算法(例如,Eclat算法等),神经网络,深度学习算法,降维方法(例如,主成分分析、偏最小二乘回归等),集成方法(例如,提升、引导聚集、自适应提升、堆叠泛化、梯度提升机器法、随机森林法等),以及任何合适形式的算法。

下面将更详细地描述这些用于自动搜索和监察分子的图谱生成的算法的应用。

在一些方面,本公开的装置和系统包含非暂时性计算机可读介质,其包括指令以使处理器执行以下操作:i)从传感器确定所述靶多核苷酸同时存在于两个孔隙中;ii)扫描靶多核苷酸的一个或多个特征;iii)在第一方向上在第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,以产生作用于所述靶多核苷酸上的第一力和相反的第二力,其中所述第一力和第二力改变所述靶多核苷酸的移动方向和速率,使得所述靶多核苷酸的至少一部分在第二方向上从所述第二孔隙移动到所述第一孔隙;和iv)在第二循环中重复步骤i)至iii)以检测第三组和第四组特征。

在一些方面,本公开的装置和系统包含控制器。在一些实施方案中,所述控制器是现场可编程门阵列(FPGA)或专用集成电路(ASIC)。

本公开的方面包含用于执行本文所述的方法的功能的装置。本公开包含用于定位通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列的一个或多个特征的装置,所述装置包含:(i)连接的电极,其被配置以在装置的第一孔隙处提供第一电压,并且在装置的第二孔隙处提供第二电压;(ii)第一孔隙;(iii)第二孔隙;其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动;(iv)一个或多个传感器,其能够鉴别:在第一循环中,在靶多核苷酸在第一方向上移动通过第一孔隙和第二孔隙期间,来自靶多核苷酸的第一组特征,和在第一循环中,在靶多核苷酸在第二方向上移动通过第二孔隙和第一孔隙期间,来自靶多核苷酸的第二组特征;(v)处理器;以及(vi)非暂时性计算机可读介质,其包括指令以使所述处理器执行以下操作:a)从一个或多个传感器确定所述靶多核苷酸同时存在于两个孔隙中;b)扫描靶多核苷酸的一个或多个特征;c)在第一方向上在第一循环中对第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,以产生作用于所述靶多核苷酸上的第一力和相反的第二力,其中所述第一力和第二力改变所述靶多核苷酸的移动方向和速率,使得所述靶多核苷酸的至少一部分在第二方向上从所述第二孔隙移动到所述第一孔隙;和d)在第二循环中重复步骤a)至c)以检测第三组和第四组特征。

在一些情况下,所述指令进一步使处理器重复c)直到靶多核苷酸离开所述装置。在一些情况下,第一孔隙和第二孔隙彼此相距约10nm至约2μm。

在一些情况下,孔隙的直径为约2nm至约50nm。在一些情况下,孔隙的直径为约20nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约2nm至约50nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约2nm至约8nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约10nm至约20nm。在一些情况下,孔隙的直径为约20nm至约30nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约30nm至约40nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约40nm至约50nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约2nm、约4nm、约6nm、约8nm、约10nm、约12nm、约14nm、约16nm、约18nm、约20nm、约22nm、约24nm、约26nm、约28nm、约30nm、约32nm、约34nm、约36nm、约38nm、约40nm、约42nm、约44nm、约46nm、约48nm或约50nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约19nm。在一些情况下,第一孔隙和第二孔隙具有相同的直径。在一些情况下,第一孔隙和/或第二孔隙的直径为约21nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约22nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约23nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约24nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约25nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约27nm。在一些情况下,第一孔隙和/或第二孔隙的直径为约29nm。在一些情况下,第一孔隙和第二孔隙具有不同的直径。在一些情况下,孔隙的直径为约20nm。

在一些情况下,第一孔隙和第二孔隙彼此相距约500nm。在一些情况下,第一孔隙具有分隔第一通道和腔室的至少约0.3nm的深度,第二孔隙具有分隔腔室和第二通道的至少约0.3nm的深度。在一些情况下,所述腔室相对于两个电压连接到公共接地。

在一些情况下,所述装置还包含控制器。在一些情况下,控制器被配置以改变待扫描的多核苷酸的特征数量。在一些情况下,控制器被配置以改变扫描次数。在一些情况下,控制器被配置以控制被扫描的多核苷酸的位置。在一些情况下,控制器被配置以改变被扫描的多核苷酸的区域。在一些情况下,控制器被配置以控制:a)待扫描的特征数量;b)待重新扫描的特征数量;c)待扫描或重新扫描的特征类型;d)待扫描或重新扫描的循环次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些情况下,处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,控制器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,控制器是微控制器。

在一些情况下,FPGA或ASIC执行控制逻辑以改变:a)待扫描的特征数量;b)待重新扫描的特征数量;c)待扫描或重新扫描的特征类型;d)待扫描或重新扫描的循环次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些情况下,控制器被配置以控制多核苷酸的移动方向。在一些情况下,所述装置还包括使处理器基于扫描构建含有所述一种或多种特征的多核苷酸区域的局部图谱的指令。在一些情况下,所述装置还包括使处理器基于所述扫描构建含有所述一种或多种特征的多核苷酸区域的一致性图谱的指令。在一些情况下,构建包括机器学习算法,其基于训练数据和概率模型训练以检测一个或多个特征。在一些情况下,所述装置还包括使处理器根据第一孔隙和第二孔隙中特征的检测之间的时间差以及孔隙一和孔隙二之间的已知距离计算靶多核苷酸特征的速率的指令。

在一些情况下,所述装置还包括使处理器从靶多核苷酸的特征的速率,从第一孔隙、第二孔隙或两者的电流信号中检测到的特征之间的时间计算特征之间的距离的指令。在一些情况下,所述装置还包含使处理器对于每次扫描计算靶多核苷酸的特征的速率,并通过使用速率分布计算关于特征的速率的统计的指令。在一些情况下,所述装置还包括使处理器组合所有特征的速率并计算多核苷酸在给定扫描和给定扫描方向上的速率的时间历程的指令。

在一些情况下,所述装置还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行频率扫描的指令。在一些情况下,所述装置还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行振幅扫描的指令。在一些情况下,所述装置还包括使处理器调节多核苷酸速率的指令。在一些情况下,其中所述速率为每毫秒1个碱基对至每毫秒10个碱基对。

在一些情况下,所述装置还包括使处理器调节第一电压和第二电压以便以多个速率对多核苷酸执行多次扫描的指令。在一些情况下,所述以多个速率执行多核苷酸的多次扫描提高了一个或多个特征的检测的准确性。在一些情况下,所述装置还包括使处理器以多个速率对多核苷酸执行多次扫描的指令。在一些情况下,所述装置还包括使处理器控制多核苷酸在第一方向、第二方向或两者上的速率范围的指令。在一些情况下,所述装置还包含当所述多核苷酸在第一方向、第二方向或两者上移动通过第一孔隙和第二孔隙时使所述处理器控制所述第一孔隙和第二孔隙的电压范围的指令。在一些情况下,所述装置还包括使处理器确定多核苷酸在第一方向、第二方向或两者上的最佳速率范围的指令,其中多核苷酸的最佳速率范围降低了布朗运动对多核苷酸的影响。

在一些情况下,控制多核苷酸的速率范围包括确定用于测序的最佳多核苷酸速率范围。

在一些情况下,靶多核苷酸是基本上线性化的。在一些情况下,靶多核苷酸通过调节第一电压或第二电压或两者的操作而基本上线性化。

本公开的方面包含用于执行本文所公开的方法的系统。所述系统包含:a)用于定位通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列的一个或多个特征的双孔隙、双放大器装置,所述装置包含:(i)连接到电源的电极,所述电源被配置以在装置的第一孔隙处提供第一电压,并且在装置的第二孔隙处提供第二电压;(ii)第一孔隙;(iii)第二孔隙;其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动;(iv)一个或多个传感器,其能够鉴别:在第一循环中,在靶多核苷酸在第一方向上移动通过第一孔隙和第二孔隙期间,来自靶多核苷酸的第一组特征,和在第一循环中,在靶多核苷酸在第二方向上移动通过第二孔隙和第一孔隙期间,来自靶多核苷酸的第二组特征;c)处理器;以及d)非暂时性计算机可读介质,其包括指令以使所述处理器执行以下操作:i)从传感器确定所述靶多核苷酸同时存在于两个孔隙中;ii)扫描靶多核苷酸的一个或多个特征;iii)在第一方向上对第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,以产生作用于所述靶多核苷酸上的第一力和相反的第二力,其中所述第一力和第二力改变所述靶多核苷酸的移动方向和速率,使得所述靶多核苷酸的至少一部分在第二方向上从所述第二孔隙移动到所述第一孔隙;和iv)在第二循环中重复步骤i)至iii)以检测第三组和第四组特征。

在一些情况下,所述装置还包含控制器。在一些情况下,控制器被配置以改变待扫描的多核苷酸的特征数量。在一些情况下,控制器被配置以改变扫描次数。在一些情况下,控制器被配置以控制被扫描的分子的位置。在一些情况下,控制器被配置以控制:a)待扫描的特征数量;b)待重新扫描的特征数量;c)待扫描或重新扫描的特征类型;d)待扫描或重新扫描的循环次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些情况下,处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,控制器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,控制器是微控制器。在一些情况下,FPGA或ASIC执行控制逻辑以改变:a)待扫描的特征数量;b)待重新扫描的特征数量;c)待扫描或重新扫描的特征类型;d)待扫描或重新扫描的循环次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些情况下,控制器被配置以改变被扫描的分子的方向。

在一些情况下,所述系统还包括使处理器基于扫描构建含有一种或多种特征的多核苷酸区域的局部图谱的指令。在一些情况下,所述系统还包括使处理器基于扫描构建含有一种或多种特征的多核苷酸区域的一致性图谱的指令。在一些情况下,构建包括机器学习算法,其基于训练数据和概率模型被训练以检测一个或多个特征。

在一些情况下,所述系统还包括使处理器根据第一孔隙和第二孔隙中特征的检测之间的时间差以及孔隙一和孔隙二之间的已知距离计算靶多核苷酸特征的速率的指令。在一些情况下,所述系统还包括使处理器从靶多核苷酸的特征的速率,从第一孔隙、第二孔隙或两者的电流信号中检测到的特征之间的时间计算特征之间的距离的指令。在一些情况下,所述系统还包含使处理器对于每次扫描计算靶多核苷酸的特征的速率,并通过使用速率分布计算关于特征的速率的统计的指令。在一些情况下,所述系统还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行频率扫描的指令。在一些情况下,所述系统还包括使处理器在第一方向、第二方向或两者上对多核苷酸执行振幅扫描的指令。在一些情况下,所述系统还包括使处理器调节多核苷酸速率的指令。

在一些情况下,速率范围为每毫秒1个碱基对至每毫秒10个碱基对。

在一些情况下,所述系统还包括使处理器调节第一电压和第二电压以便以多个速率对多核苷酸执行多次扫描的指令。在一些情况下,以多个速率执行多核苷酸的多次扫描提高了一个或多个特征的检测的准确性。

在一些情况下,所述系统还包括使处理器以多个速率对多核苷酸执行多次扫描的指令。在一些情况下,所述系统还包括使处理器控制多核苷酸在第一方向、第二方向或两者上的速率范围的指令。在一些情况下,所述系统还包含使处理器当多核苷酸在第一方向、第二方向或两者上移动通过第一孔隙和第二孔隙时控制第一孔隙和第二孔隙的电压范围的指令。

在一些情况下,所述系统还包括使处理器确定多核苷酸在第一方向、第二方向或两者上的最佳速率范围的指令,其中多核苷酸的最佳速率范围降低了布朗运动对多核苷酸的影响。在一些情况下,调整电压以创建多个不同速率的多次扫描提高了定位特征的数据的全面性。例如,在高速下(即,当电压差较大时),分子(例如,多核苷酸、有效负荷分子等)更可能是确定性的,并且分子较少受布朗运动影响(例如,布朗运动将较少地“污染”扫描数据)。在一些情况下,系统确定在分子逃离装置或逆转方向之前可以检测到一个或多个特征的最佳速率。在一些情况下,所述系统还包括使处理器确定布朗运动对分子影响最小的最大速率(例如,布朗运动降低的最大速率)的指令。在一些情况下,一个或多个特征是带电的,使得当多核苷酸经过孔隙时它们干扰力并因此干扰运动。

在一些情况下,控制多核苷酸的速率范围包括确定用于测序的最佳多核苷酸速率范围。

在一些情况下,所述系统还包括使处理器组合所有特征的速率并计算多核苷酸在给定扫描和给定扫描方向上的速率的时间历程的指令。

在一些情况下,靶多核苷酸是基本上线性化的。在一些情况下,靶多核苷酸通过调节第一电压或第二电压或两者的操作而基本上线性化。

本公开的方面包含用于测序通过第一孔隙和第二孔隙靶的多核苷酸的多核苷酸序列的双孔隙、双放大器装置,所述装置包含:(i)连接的电极,其被配置以在装置的第一孔隙处提供第一电压,并且在装置的第二孔隙处提供第二电压;(ii)第一孔隙;(iii)第二孔隙;其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动;(iv)一个或多个传感器,其能够鉴别:在第一循环中,在靶多核苷酸在第一方向上移动通过第一孔隙和第二孔隙期间,来自靶多核苷酸的第一组引物,和在第一循环中,在靶多核苷酸在第二方向上移动通过第二孔隙和第一孔隙期间,来自靶多核苷酸的第二组引物;(v)处理器;以及(vi)非暂时性计算机可读介质,其包括指令使所述处理器执行以下操作:a)从一个或多个传感器确定所述靶多核苷酸同时存在于两个孔隙中;b)扫描与所述靶多核苷酸杂交的一种或多种引物;c)当靶多核苷酸在第一方向上处于两个孔隙中时,检测第一循环中的第一组引物;d)重新扫描与所述靶多核苷酸杂交的一种或多种引物;e)当在第一循环中在第一方向上检测到第一组引物时,调节第一孔隙和第二孔隙的第一电压、第二电压或两者,以改变靶多核苷酸的方向,使得靶多核苷酸的至少一部分在第二方向上从第二孔隙移动到第一孔隙,f)当靶多核苷酸在第二方向上同时处于两个孔隙中时,检测第一循环中第二组引物的存在;g)通过测量当核苷酸经过该孔隙时跨孔隙的离子电流来鉴别经过孔隙之一的多核苷酸的每个核苷酸;和h)在第二循环中重复步骤a)至g)以检测第三组和第四组引物。

本公开的方面包含系统,其包含:a)用于定位通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列的一个或多个特征的双孔隙、双放大器装置,所述装置包含:(i)连接的电极,其被配置以在装置的第一孔隙处提供第一电压,并且在装置的第二孔隙处提供第二电压;(ii)第一孔隙;(iii)第二孔隙;其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动;(iv)一个或多个传感器,其能够鉴别:在第一循环中,在靶多核苷酸在第一方向上移动通过第一孔隙和第二孔隙期间,来自靶多核苷酸的第一组引物,和在第一循环中,在靶多核苷酸在第二方向上移动通过第二孔隙和第一孔隙期间,来自靶多核苷酸的第二组引物;c)处理器;以及d)非暂时性计算机可读介质,其包括指令使所述处理器执行以下操作:i)从一个或多个传感器确定所述靶多核苷酸同时存在于两个孔隙中;ii)扫描与所述靶多核苷酸杂交的一种或多种引物;iii)当靶多核苷酸在第一方向上处于两个孔隙中时,检测第一循环中的第一组引物;iv)重新扫描与所述靶多核苷酸杂交的所述一种或多种引物;v)当在第一循环中在第一方向上检测到第一组引物时,调节第一孔隙和第二孔隙的第一电压、第二电压或两者以改变靶多核苷酸的方向,使得靶多核苷酸的至少一部分在第二方向上从第二孔隙移动到第一孔隙,vi)当靶多核苷酸在第二方向上同时处于两个孔隙中时,检测第一循环中第二组引物的存在;vii)通过当核苷酸经过孔隙之一时测量跨孔隙的离子电流来鉴别经过该孔隙的多核苷酸的每个核苷酸;和viii)在第二循环中重复步骤i)至vii)以检测第三组和第四组引物。

分子中一个或多个特征的图谱生成

关于自适应逻辑,目标是鉴别靶多核苷酸的一个或多个特征并产生靶多核苷酸的一个或多个特征的局部和/或全局一致性图谱。自适应控制器可以改变待寻找的特征数量,重新扫描(例如,使用双向扫描)分子上的哪些特征和位置,和/或何时移动到还没有近实时地监测的不同位置。自适应控制器可以产生一个或多个特征的实时局部图谱,并产生用于产生整个分子的一致性图谱的数据集。在实施机器学习算法时,可以用与以下度量(如上所述)相关联的训练数据来训练模型:IRMS、基线漂移、基线上下运动、LFNP和其他度量。然后,所述模型可用于确定度量的组合,从而指示何时响应于检测到分子特征的通过而改变分子的移位方向,及为不同类型的特征性偏离自动产生最佳干预作用的概率。使用基于现场可编程门阵列(FPGA)或专用集成电路(ASIC)的有源逻辑,可以响应于检测分子特征的通过而改变分子的移位方向。这使得能够来回地重新扫描局部DNA区域,其可以用于通过平均来增加精度。

所述系统可以使用机器学习技术来生成针对特定类型的实验/试剂的“事件”的先验分布,生成针对所有类型的分子检测的表征(例如,与度量值相关),并且生成针对其他偏离(例如,随时间变化的试剂的性质的偏离等)的表征。训练数据可以从例如每个分子基序的事件特征的实时反馈、模型准确度、分子调用的假阳性/假阴性、每个分子正确调用的CpG的分数、CpG距离/定位预测性能、5hmC相对5mC的分数预测、基因组距离预测、分子基序之间的距离和分子基序密度中导出。所述模型可以用监督学习方法来开发,该方法使用算法来处理训练数据中的标记偏差或其他方面,并将它们归入偏移类型。系统还可以收集关于哪些介入操作适合于哪些特征性偏离/事件的数据。

一旦使用经训练的模型检测到分子基序(例如多核苷酸上的一个或多个特征和/或多核苷酸中的一个或多个特征)事件,则系统可实施一个或多个校正操作,包含以下中的一个或多个:切换电压的极性,以特定电压(和/或以特定数量或速率的变换事例)施加电刺激,改变电压以改变分子的方向用于再扫描,改变进行监测/扫描的分子的位置,改变分子基序的数量以进行测量/扫描,或不进行操作(例如,通知操作实体)。

具有深度学习的一致性定位

另一种方法是使用信号处理卷积神经网络来鉴别电子上不同的分子基序,以及不同分子基序之间的位置和间隔,并将其反馈到深度Q学习算法中以开发连续改进的自适应逻辑和一致性定位。该技术通过自动搜索和监测分子以生成图谱的系统改进了未来决策。

另外的考虑因素

已经出于说明的目的给出了本发明的实施方案的以上描述;其并不旨在穷举或将本发明限制为所公开的精确形式。相关领域的技术人员可以理解,根据上述公开内容,许多修改和变化是可能的。

本说明书的某些部分根据算法和对信息的操作的符号表示来描述本发明的实施方案。数据处理领域的技术人员通常使用这些算法描述和表示来有效地向本领域的其他技术人员传达其工作的实质。虽然在功能上、计算上或逻辑上描述了这些操作,但是这些操作被理解为由计算机程序或等效电路、微代码等来实现。此外,在不丧失一般性的情况下,有时将这些操作安排称为模块也被证明是方便的。所描述的操作及其相关联的模块可以以软件、固件、硬件或其任何组合来实现。

本文所描述的任何步骤、操作或过程可单独地或与其它装置组合使用一个或多个硬件或软件模块来执行或实施。在一个实施方案中,利用计算机程序产品来实现软件模块,所述计算机程序产品包含含有计算机程序代码的计算机可读非瞬态介质,所述计算机程序代码可由计算机处理器执行以用于执行所描述的步骤、操作或过程中的任一个或全部。

本发明的实施方案还可涉及由本文所述的计算过程产生的产品。这样的产品可以包含由计算过程产生的信息,其中所述信息被存储在非瞬态的有形计算机可读存储介质上,并且可以包含在此描述的计算机程序产品或其他数据组合的任何实施方案。

方法-多核苷酸在纳米孔隙装置中的扩展的再捕获

本公开提供了用于在纳米孔隙装置中再捕获多核苷酸的方法。本公开的系统和装置执行用于再捕获靶多核苷酸的方法。

本公开的方面包含用于在纳米孔隙装置中再捕获多核苷酸的方法,所述方法包括提供用于控制多核苷酸移动通过一个或多个孔隙的纳米孔隙装置。在一些情况下,所述装置至少包含位于腔室和第一流体体积之间的第一孔隙,所述第一孔隙流体连接到所述腔室和第一流体体积,所述第一流体体积是在与所述第一孔隙相对的一侧上具有开口的几何约束的外壳。在一些情况下,所述装置包含位于第一流体体积内的至少一个电极,其中所述一个电极被配置以在所述第一孔隙处提供第一电压。在一些情况下,所述装置包含经配置用于第一孔隙处的电压控制和电流测量的一个或多个传感器(例如放大器)。在一些情况下,所述方法包括将多核苷酸加载到装置的腔室中。在一些情况下,所述方法包括将多核苷酸加载到装置的几何约束的流体体积中。在一些情况下,所述方法包括跨第一孔隙施加第一电压,用于在第一方向上从腔室移动多核苷酸,以在第一孔隙中捕获多核苷酸并允许多核苷酸经过第一孔隙进入第一流体体积。在一些情况下,所述方法包括当多核苷酸在第一方向上经过第一孔隙时检测第一孔隙中的第一离子电流。在一些情况下,所述方法包括在多核苷酸包含在第一流体体积内时将电压调节至零一段时间。在一些情况下,所述方法包括施加第二电压以逆转位于第一流体体积中的多核苷酸的方向,其中所述第二电压使多核苷酸的至少一部分在第二方向上从第一流体体积移动以将多核苷酸的一部分再捕获在第一孔隙中,使得多核苷酸维持在第一孔隙内。在一些情况下,所述方法包括当多核苷酸被再捕获在第一孔隙中时检测第一孔隙中的第二离子流。在一些情况下,所述装置被配置以使多核苷酸从腔室经过第一孔隙并从第一流体通道经过第一孔隙。在一些情况下,所述方法还包括重复本文所述的步骤,直到多核苷酸离开所述装置。

在一些情况下,所述纳米孔隙装置还包含第二孔隙、第三孔隙、第四孔隙、第五孔隙、第六孔隙、第七孔隙、第八孔隙、第九孔隙或第十孔隙。在一些情况下,纳米孔隙装置包含两个或更多个孔隙、三个或更多个孔隙、四个或更多个孔隙、五个或更多个孔隙、六个或更多个孔隙、七个或更多个孔隙、八个或更多个孔隙、九个或更多个孔隙、或十个或更多个孔隙。

在一些情况下,纳米孔隙装置包含几何约束的第一流体体积和几何约束的第二流体体积。在一些情况下,第一几何约束的体积和第二几何约束的体积是第一流体通道和第二流体通道。在一些情况下,纳米孔隙装置包含一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、或十个或更多个几何约束的体积。在一些实施方案中,第一流体通道的几何约束增加了维持在第一孔隙处施加的第一电压的时间段。在一些实施方案中,第一流体通道的几何约束相对于空腔的几何约束增加了维持在第一孔隙处施加的第一电压的时间段。在一些实施方案中,将捕获多核苷酸并将其移位通过第一孔隙(例如从装置的腔室通过第一孔隙)的在第一孔隙处施加的第一电压维持0-1000毫秒、1-20毫秒、20-60毫秒、60-120毫秒、120-150毫秒、150-300毫秒、300-500毫秒、500-1000毫秒、1-20秒、20-60秒、60-120秒、120-150秒、150-300秒、300-500秒或500-1000秒的时间段。在一些实施方案中,将在第一孔隙处施加的用于捕获多核苷酸并将其移位通过第一孔隙(例如,从装置的腔室通过第一孔隙)的第一电压维持20毫秒或更多、60毫秒或更多、120毫秒或更多、150毫秒或更多、300毫秒或更多、500毫秒或更多、1000毫秒或更多、20秒或更多、60秒或更多、120秒或更多、150秒或更多、300秒或更多、500秒或更多、或1000秒或更多。在一些实施方案中,在检测到多核苷酸捕获和通过第一孔隙后,将第一电压维持如本文所述的时间段。在一些实施方案中,在将第一孔隙处的第二电压设定为0mV之前,将第一电压维持如本文所述的时间段。

在一些情况下,第一流体体积是第一流体通道。在一些情况下,第二流体体积是第二流体通道。在一些情况下,第一流体通道和/或第二流体通道的形状可以是圆形、正方形、矩形、六边形、三角形、椭圆形、多边形、V形、U形或任何其它合适的形状。在一些情况下,第一流体通道和/或第二流体通道各自具有V形并且各自在V形的任一端上具有开口,第一流体通道和第二流体通道的V形彼此相对地设置在芯片上,其中V形的点彼此相邻,并且其中第一纳米孔隙位于第一流体通道的V形的点处并且第二纳米孔隙位于第二流体通道的V形的点处。在一些实施方案中,每个流体通道具有不同的形状。所述流体通道不限于本文所述的形状和/或尺寸,并且可以是根据其预期用途规定的条件所需的任何形状和/或尺寸。在一些情况下,第一流体体积包含V形通道。在一些情况下,第一流体通道和/或第二流体通道包含几何约束的体积。

在一些情况下,其中第一流体通道和/或第二流体通道具有约0.05mm至约5mm的长度。在一些情况下,其中第一流体通道和/或第二流体通道具有约0.05mm至约4mm的长度。在一些情况下,第一流体通道和/或第二流体通道具有约0.5mm、1mm、1.5mm、2mm、2.5mm、3mm、3.5mm、4mm、4.5mm或5mm的长度。

在一些情况下,其中第一流体通道和/或第二流体通道具有50-500μm的宽度。在一些情况下,其中第一流体通道和/或第二流体通道具有50-100μm、100-150μm、150-200μm、200-250μm、250-300μm、300-350μm、350-400μm、400-450μm或450-500μm的宽度。在一些情况下,第一流体通道和/或第二流体通道具有约50μm或更大、100μm或更大、150μm或更大、200μm或更大、250μm或更大、300μm或更大、350μm或更大、400μm或更大、450μm或更大或500μm或更大的宽度。

在一些情况下,其中第一流体通道和/或第二流体通道具有0.5μm至约2μm的深度。在一些情况下,第一流体通道和/或第二流体通道具有0.5-1μm、1-1.5μm或1.5-2μm的深度。在一些情况下,第一流体通道和/或第二流体通道具有约0.5μm或更大、1μm或更大、1.5μm或更大、2μm或更大、2.5μm或更大或3μm或更大的深度。

在一些情况下,第一流体体积和第二流体体积各自包含分别在第一孔隙和/或第二孔隙的相对侧上的开口。在一些情况下,第二孔隙流体连接到第二流体体积,其中第二流体体积是在与第二孔隙相对的一侧上具有开口的几何约束的外壳。在一些情况下,第一流体体积和/或第二流体体积包含在第一孔隙和/或第二孔隙的相对侧上的两个开口。在一些情况下,第一流体通道中的两个开口在同一平面上并且彼此平行。在一些情况下,第二流体通道中的两个开口在同一平面上并且彼此平行。在一些情况下,第一流体体积和/或第二流体体积的一个或多个开口被配置以允许多核苷酸通过一个或多个开口离开所述装置。在一些情况下,第一流体体积被配置以允许多核苷酸通过开口离开所述装置。在一些情况下,第二流体体积被配置以允许多核苷酸通过开口离开所述装置。

在一些情况下,多核苷酸从腔室移动通过至少第一孔隙并进入第一流体体积中30ms至500ms或更长的时间段。在一些情况下,多核苷酸从第一流体体积移动通过至少第一孔隙并进入腔室中30ms至500ms或更长的时间段。在一些情况下,多核苷酸的第一末端位于远离所述至少第一孔隙5微米至5毫米或更大的距离处。在一些情况下,多核苷酸的第二端位于远离所述至少第一孔隙5微米至5毫米或更大的距离处。

在一些情况下,当第一电压调节至零0至1000毫秒或0-1000秒的时间段时,多核苷酸维持在第一流体体积中。在一些情况下,将第一电压调节至0mV的中间电压用于多核苷酸松弛至其平衡构象。

在一些情况下,所述方法防止多核苷酸从装置中离开5ms至5分钟的时间段。在一些情况下,所述方法防止多核苷酸从装置的腔室中离开5ms至5分钟的时间段。在一些情况下,所述方法防止多核苷酸从装置的第一流体体积和/或第二流体体积离开5ms至5分钟的时间段。

在一些情况下,腔室位于第一孔隙上方。在一些情况下,第一孔隙位于腔室和第一流体体积之间。在一些情况下,第二孔隙位于腔室和第二流体体积之间。在一些情况下,第二孔隙连接到腔室和第二流体体积。在一些情况下,腔室位于第一孔隙和第二孔隙上方。在一些情况下,所述腔室连接到相对于所述第一电压的公共接地。

在一些情况下,其中第一孔隙的直径为约2nm至约50nm。在一些情况下,其中第一孔隙的直径为约15nm至约30nm。在一些情况下,第二孔隙的直径为约2nm至约50nm。在一些情况下,其中第二孔隙的直径为约15nm至约30nm。

在一些情况下,第一电压施加在第一流体体积和腔室之间。在一些情况下,纳米孔隙装置包含位于第二流体体积内的至少一个电极,其中该至少一个电极被配置以在第二孔隙处提供第三电压。

在一些情况下,纳米孔隙装置包含经配置用于第一孔隙和第二孔隙处的电压控制和电流测量的双放大器电子器件。

在一些情况下,所述方法还包括,在检测第二离子电流后,调节第一孔隙处的第一电压并设定第二孔隙处的第三电压,使得多核苷酸的至少一部分在第三方向上移动通过第一孔隙和第二孔隙,第三方向是从第一孔隙到第二孔隙。在一些情况下,第三电压高于第一电压。

在一些情况下,其中第一电压为0mV。在一些情况下,第一电压范围为0-1000mV。在一些情况下,第一电压、第二电压、第三电压范围和/或第四电压各自独立地为0mV至1000mV。在一些情况下,调节第一电压、第二电压、第三电压和/或第四电压各自独立地为0-1000mV。

在一些情况下,多核苷酸是基本上线性化的。在一些情况下,多核苷酸通过调节第一电压、第二电压,第三电压或其组合的操作而基本上线性化。在一些情况下,多核苷酸是基本上线性化的。

在一些情况下,所述方法还包括调节施加第一孔隙的第一电压、第二孔隙的第三电压或两者,以改变多核苷酸的方向,使得多核苷酸的至少一部分在第四方向上从第二孔隙移动通过第一孔隙,所述第四方向是从第二孔隙到第一孔隙。在一些情况下,所述调节施加第一孔隙的第一电压、第二孔隙的第三电压或两者使得多核苷酸的至少一部分在第三方向和/或第四方向上重复移动一段时间,直到多核苷酸离开所述装置。在一些情况下,第三电压施加在装置的腔室和第二流体体积之间。在一些情况下,在5ms至5分钟的时间段内施加第三电压。在一些情况下,所述方法还包括当多核苷酸在第三方向上处于两个孔隙中时,检测多核苷酸上的第一组特征。在一些情况下,所述方法还包括当多核苷酸在第四方向上同时处于两个孔隙中时,检测多核苷酸上的第二组特征。

在一些情况下,所述方法包括调节第一电压,使得多核苷酸移动通过第一孔隙5ms至5分钟的时间段。在一些情况下,其中多核苷酸经过第一孔隙、腔室和第二孔隙。在一些情况下,其中多核苷酸部分经过第一孔隙、腔室和第二孔隙。

在一些情况下,所述方法还包括当多核苷酸在第三方向上处于两个孔隙中时,检测第一孔隙处的第三离子电流和第二孔隙处的第四离子电流。在一些情况下,所述方法还包括当多核苷酸在第四方向上处于两个孔隙中时,检测第一孔隙处的第五离子电流和第二孔隙处的第六离子电流。

在一些情况下,第一电压跨第一孔隙并沿着第一流体体积的长度产生电压梯度。在一些情况下,第三电压跨第二孔隙并沿着第二流体体积的长度产生电压梯度。

在一些情况下,第一流体通道的阻力与第一流体通道宽度成反比。在一些情况下,第二流体通道的阻力与第二流体通道宽度成反比。在一些情况下,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的体积成比例。在一些情况下,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的体积成比例。在一些情况下,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的半径成比例。在一些情况下,第一流体通道和/或第二流体通道的阻力与第一流体通道和/或第二流体通道的截面半径成比例。

在一些情况下,多核苷酸不被熵捕捉(entropically trapped)在第一流体体积和/或第二流体体积内。在一些情况下,多核苷酸被熵捕捉在第一流体体积和/或第二流体体积内。

在一些情况下,所述方法还包括当所述多核苷酸需要第二次或第三次重新扫描多核苷酸的一个或多个特征时,利用控制器控制。在一些情况下,所述控制器确定在第一方向和/或第二方向上对所述多核苷酸的一个或多个特征中的哪一个执行一个或多个特征的额外再捕获。

在一些情况下,所述方法还包括从早已再捕获的多核苷酸的一个或多个特征移开。

在一些情况下,第一电压、第二电压和第三电压的范围为0mV至1000mV。在一些情况下,第一电压、第二电压和第三电压的范围为0mV至100mV。在一些情况下,第一电压、第二电压和第三电压的范围为100mV至200mV。在一些情况下,第一电压、第二电压和第三电压的范围为200mV至300mV。在一些情况下,第一电压、第二电压和第三电压的范围为300mV至400mV。在一些情况下,第一电压、第二电压和第三电压的范围为400mV至500mV。在一些情况下,第一孔隙的第一电压低于第二电压。在一些情况下,第一孔隙的第一电压高于第二电压。在一些情况下,第一孔隙的第一电压和第二孔隙的第二电压是相同的。在一些情况下,在第一方向上,第一孔隙的第一电压和第一孔隙的第二电压是相同的。在一些情况下,在第二方向上,第一孔隙的第一电压低于第一孔隙的第二电压。在一些情况下,在第三方向上,第一孔隙的第一电压低于第二孔隙的第三电压。在一些情况下,在第四方向上,第一孔隙的第一电压高于第二孔隙的第三电压。

在一些情况下,所述方法还包括经由控制器、处理器和非暂时性计算机可读介质控制多核苷酸通过第一孔隙和/或第二孔隙的方向,所述非暂时性计算机可读介质包括指令以使处理器执行以下操作:改变所述多核苷酸的方向。在一些情况下,其中处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,其中控制器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,其中控制器是微控制器。

在一些情况下,其中所述再捕获提供对包含长度范围为5个碱基对至约3,000,000个碱基对的多核苷酸序列的多核苷酸的检测。

方法-一个或多个特征的拉丝和重新扫描

本公开提供了用于定位通过孔隙的与多个探针结合的靶多核苷酸的多核苷酸序列的一个或多个特征的方法。本公开还提供了用于差异检测混合样品中5mC和5hmC区域的方法,所述混合样品包含分别移动通过纳米孔隙装置的第一孔隙和第二孔隙的一种或多种多核苷酸序列。

本公开提供了定位靶多核苷酸的一个或多个特征的自动化方法。本公开还提供了用于对多核苷酸序列进行测序的自动化方法。本公开还提供了用于差异检测多核苷酸序列中甲基化和未甲基化区域的方法。本公开还提供了用于执行本公开的方法的装置和系统。

本公开的方面包含用于定位靶多核苷酸的一个或多个特征的方法,所述方法包括以下步骤:a)提供用于控制所述靶多核苷酸同时移动通过第一孔隙和第二孔隙的双孔隙、双放大器装置,所述装置包含:(i)第一孔隙,(ii)第二孔隙,(iii)电源,其被配置以在所述第一孔隙处提供第一电压,并且在所述第二孔隙处提供第二电压,每个电压是可独立调节的,以及(v)双放大器电子器件,其被配置以用于在各孔隙处进行独立的电压控制和电流测量,其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动,b)加载所述靶多核苷酸到所述装置中;c)设定第一孔隙处的初始第一电压和第二孔隙处的初始第二电压,使得所述靶多核苷酸的至少一部分在第一方向上移动通过第一孔隙和第二孔隙,第一方向是从第一孔隙到第二孔隙;d)扫描靶多核苷酸的一个或多个特征;e)当靶多核苷酸在第一方向上处于两个孔隙中时,检测第一循环中的第一组特征;f)当在第一循环中在第一方向上检测到第一组特征时,调节第一孔隙和第二孔隙的第一电压、第二电压或两者,以改变靶多核苷酸的方向,使得靶多核苷酸的至少一部分在第二方向上从第二孔隙移动到第一孔隙,第二方向是从第二孔隙到第一孔隙,g)当靶多核苷酸在第二方向上同时处于两个孔隙中时,检测第一循环中第二组特征的存在;和h)在第二循环中重复步骤c)至g)以检测第三组和第四组特征。

在一些情况下,第一孔隙连接到装置的第一通道和腔室。

在一些情况下,第二孔隙连接到装置的腔室和第二通道。

在一些情况下,在装置的第一通道和腔室之间施加第一电压,并且在腔室和第二通道之间施加第二电压。

在一些情况下,靶多核苷酸特征的检测是利用来自第一孔隙或第二孔隙或两者的电流测量来完成的。

在一些情况下,所述方法还包括利用处理器根据第一孔隙和第二孔隙中特征的检测之间的时间差以及第一孔隙和第二孔隙之间的已知距离计算靶多核苷酸的一个或多个特征的速率。

在一些情况下,所述方法还包括利用处理器通过使用所计算的靶多核苷酸特征的速率,从第一孔隙、第二孔隙或两者的电流信号中检测到的一个或多个特征之间的时间计算所述一个或多个特征之间的距离。

在一些情况下,所述方法还包括利用处理器计算每次扫描的靶多核苷酸特征的速率。

在一些情况下,所述方法还包括利用处理器使用每次扫描的速率分布计算关于特征的速率的统计。

在一些情况下,所述方法还包括利用处理器使用给定扫描和给定扫描方向上所有特征的速率计算多核苷酸速率的时间历程。

在一些情况下,靶多核苷酸是基本上线性化的。

在一些情况下,靶多核苷酸通过调节第一电压或第二电压或两者的操作而基本上线性化。

在一些情况下,所述方法还包括利用控制器控制:a)待扫描的特征数量;b)待重新扫描的特征数量;c)待扫描或重新扫描的特征类型;d)待扫描或重新扫描的循环次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;或h)其组合。

在一些情况下,所述方法还包括控制待扫描的特征数量。在一些情况下,控制器确定对一个或多个特征中的哪一个执行额外的扫描。在一些情况下,方法还包括从已经扫描的一个或多个特征移开。在一些情况下,所述方法还包括扫描多核苷酸上尚未被扫描的区域。

在一些情况下,方法还包括利用处理器构建每个多核苷酸的一致性图谱。在一些情况下,所述构建实时发生。在一些情况下,所述构建包括机器学习算法,其基于训练数据和概率模型训练以检测一个或多个特征。在一些情况下,所述方法还包括利用处理器实时构建每个多核苷酸的局部图谱。在一些情况下,所述方法还包括重复步骤c)至g),直到所述靶多核苷酸离开所述孔隙装置。

在一些情况下,所述一个或多个特征包含:a)与所述多核苷酸结合的一个或多个有效负荷分子;b)与所述多核苷酸杂交的一个或多个有效负荷分子;c)掺入多核苷酸基因组中的一个或多个有效负荷分子;d)所述靶多核苷酸的多核苷酸序列上的分子基序;或e)其组合。

在一些情况下,一种或多种有效负荷分子酶促结合至多核苷酸的基因组中。在一些情况下,一种或多种有效负荷分子化学结合至多核苷酸的基因组中。在一些情况下,使用点击化学将一种或多种有效负荷分子化学结合多核苷酸的基因组中。在一些情况下,所述方法还包括确定靶多核苷酸的一个或多个特征的位置。在一些情况下,所述方法还包括确定靶多核苷酸的一个或多个特征的每个之间的距离。在一些情况下,所述方法还包括确定靶多核苷酸的第一组特征中的每个特征之间的距离。在一些情况下,所述方法还包括确定靶多核苷酸的第二组特征中的每个特征之间的距离。

在一些情况下,所述一个或多个特征包含以下各项的位置:靶多核苷酸的多核苷酸序列上的一个或多个甲基化位点;一个或多个CpG;或一个或多个甲基化位点和CpG。在一些情况下,一个或多个特征包含靶多核苷酸上一个或多个核小体的位置。在一些情况下,所述一个或多个特征包含从其天然染色质状态结合至靶多核苷酸的一个或多个核小体的位置,其没有或有化学固定。在一些情况下,所述一个或多个特征包含靶多核苷酸上的一个或多个核小体内包含的一个或多个组蛋白的位置;或靶多核苷酸上一个或多个核小体内包含的一个或多个组蛋白的修饰状态和位置。

在一些情况下,组蛋白的修饰状态包含在组蛋白的尾部内,其包含:可乙酰化、甲基化或偶联至泛素(大多肽链)的赖氨酸残基;可甲基化的精氨酸残基;可磷酸化的丝氨酸残基;或对包含在核小体中的组蛋白中包含的尾部的其它修饰。

在一些情况下,所述方法还包括通过在多个探针经过所述孔隙时测量通过孔隙之一的离子电流来鉴别所述靶多核苷酸的一个或多个特征。

在一些情况下,第一循环包括由处理器执行一次或多次扫描以检测第一组特征。在一些情况下,第一循环包括两次或更多次扫描、三次或更多次扫描、四次或更多次扫描、五次或更多次扫描、六次或更多次扫描、七次或更多次扫描、八次或更多次扫描、九次或更多次扫描、或十次或更多次扫描。

在一些情况下,第一循环包括两次或更多次扫描、四次或更多次扫描、六次或更多次扫描、八次或更多次扫描、十次或更多次扫描、十二次或更多次扫描、十四次或更多次扫描、十六次或更多次扫描、十八次或更多次扫描或二十次或更多次扫描。在一些情况下,第一循环包括五次或更多次扫描、十次或更多次扫描、十五次或更多次扫描、二十次或更多次扫描、二十五次或更多次扫描、三十次或更多次扫描、三十五次或更多次扫描、四十次或更多次扫描、四十五次或更多次扫描或五十次或更多次扫描。在一些情况下,第二循环包括由处理器执行以检测第三组特征的一次或多次扫描。在一些情况下,第二循环包括两次或更多次扫描、三次或更多次扫描、四次或更多次扫描、五次或更多次扫描、六次或更多次扫描、七次或更多次扫描、八次或更多次扫描、九次或更多次扫描或十次或更多次扫描。在一些情况下,第二循环包括两次或更多次扫描、四次或更多次扫描、六次或更多次扫描、八次或更多次扫描、十次或更多次扫描、十二次或更多次扫描、十四次或更多次扫描、十六次或更多次扫描、十八次或更多次扫描或二十次或更多次扫描。在一些情况下,第二循环包括五次或更多次扫描、十次或更多次扫描、十五次或更多次扫描、二十次或更多次扫描、二十五次或更多次扫描、三十次或更多次扫描、三十五次或更多次扫描、四十次或更多次扫描、四十五次或更多次扫描或五十次或更多次扫描。在一些情况下,第一循环和第二循环一起包括50次或更多次扫描、100次或更多次扫描、150次或更多次扫描、200次或更多次扫描、250次或更多次扫描、300次或更多次扫描、350次或更多次扫描、400次或更多次扫描或500次或更多次扫描。

在一些情况下,所述方法还包括对于第三循环、第四循环和第五循环;或当所述多核苷酸离开所述装置时重复步骤c)至f)。在一些情况下,第一循环、第二循环、第三循环、第四循环和第五循环一起包括50次或更多次扫描、100次或更多次扫描、150次或更多次扫描、200次或更多次扫描、250次或更多次扫描、300次或更多次扫描、350次或更多次扫描、400次或更多次扫描或500次或更多次扫描。

在一些情况下,第一组特征是一个或多个特征、两个或更多个特征、三个或更多个特征、四个或更多个特征、五个或更多个特征、六个或更多个特征、七个或更多个特征、八个或更多个特征、九个或更多个特征或十个或更多个特征、在一些情况下,第二组特征是两个特征、三个特征、四个特征或五个特征。在一些情况下,第二组特征多于第一组特征。在一些情况下,组合跨扫描组的特征组以产生每个靶多核苷酸的特征之间的位置和距离的图谱。

在一些情况下,所述一个或多个特征包含DNA结合蛋白。

在一些情况下,所述方法还包括在靶多核苷酸的一个或多个5-甲基胞嘧啶(5mC)区域、一个或多个5-羟甲基胞嘧啶(5hmC)区域或一个或多个5mC和5hmC区域使用有效负荷分子标记多核苷酸。在一些情况下,所述一个或多个特征包含:DNA结合蛋白;多肽;抗DNA抗体;链霉亲和素;转录因子;组蛋白;肽核酸(PNA);DNA-发夹;DNA分子;适体;5-甲基胞嘧啶(5mC)区域;5-羟甲基胞嘧啶(5hmC)区域;核苷酸碱基;两个或更多个核苷酸碱基;或其组合。

在一些情况下,所述方法还包括确定靶多核苷酸上的一个或多个5-甲基胞嘧啶(5mC)的位置。在一些情况下,所述方法还包括确定靶多核苷酸上的一个或多个5-羟甲基胞嘧啶(5hmC)的位置。在一些情况下,所述方法还包括确定靶多核苷酸上的一个或多个5-甲基胞嘧啶和一个或多个5-羟甲基胞嘧啶的位置。在一些情况下,所述方法还包括确定靶多核苷酸上的一个或多个CpG。在一些情况下,多核苷酸序列具有5个碱基对至约2,000,000个碱基对的长度。在一些情况下,多核苷酸序列具有100个碱基对至500个碱基对的长度。在一些情况下,多核苷酸序列具有1兆碱基(Mb)至约2Mb的长度。在一些情况下,DNA分子用DCBO标记。在一些情况下,DNA分子共价连接于靶多核苷酸上的切口位点。在一些情况下,多肽是结合到多核苷酸序列上的切口位点中的单-链霉亲和素(MS)。

在一些情况下,所述方法还包括区分多核苷酸上的5mC和5hmC区域。在一些情况下,一个或多个特征包含选自以下的分子:核酸、TALEN、CRISPR、肽核酸和化学化合物。在一些情况下,一个或多个特征包含选自以下的分子:脱氧核糖核酸(DNA)、核糖核酸(RNA)、肽核酸(PNA)、DNA/RNA杂合体、多肽或任何化学衍生的聚合物。

在一些情况下,靶多核苷酸选自:双链DNA、单链DNA、双链RNA、单链RNA和DNA-RNA杂合体。

在一些情况下,所述方法还包括经由控制器、处理器和非暂时性计算机可读介质控制靶多核苷酸通过第一孔隙和第二孔隙的方向,非暂时性计算机可读介质包括指令以使处理器执行以下操作:当检测到第一组探针时,改变靶多核苷酸的方向。在一些情况下,调节第一电压和第二电压实时发生,其中所述调节由使用硬件和软件的有源反馈控制器执行。

在一些情况下,所述方法还包括利用反馈控制器基于第一或第二或两者的离子电流测量以反馈来控制第一或第二电压。在一些情况下,处理器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,控制器包括现场可编程门阵列(FPGA)或专用集成电路(ASIC)。在一些情况下,控制器是微控制器。在一些情况下,FPGA或ASIC执行控制逻辑以改变:a)待扫描的特征数量;b)待重新扫描的特征数量;c)待扫描或重新扫描的特征类型;d)待扫描或重新扫描的循环次数;e)所述靶多核苷酸的移动;f)所述靶多核苷酸的方向;g)所述靶多核苷酸的速率;h)第一孔隙和第二孔隙的电压;或i)其组合。

在一些情况下,其中第一组特征和第二组特征是相同的。在一些情况下,第一组特征和第二组特征是不同的。当第一组特征和第二组特征不同时的非限制性实例包括当在第二组特征中发现不在第一组特征中的一个或多个额外特征时。在一些情况下,第三组特征和第四组特征是相同的。在一些情况下,第三组特征和第四组特征是不同的。在一些情况下,第二组特征多于第二组特征。

在一些情况下,每个特征彼此间隔约100个碱基对、300个碱基对、500个碱基对、1千碱基对、5千碱基对、10千碱基对、20千碱基对或其组合。在一些情况下,多核苷酸序列包含一个或多个切口位点。在一些情况下,每个特征彼此间隔开约1个碱基对或更多、约2个碱基对或更多、约3个碱基对或更多、约4个碱基对或更多、约5个碱基对或更多、约6个碱基对或更多、约7个碱基对或更多、约8个碱基对或更多、约9个碱基对或更多、约10个碱基对或更多、约25个碱基对或更多、约50个碱基对或更多、约100个碱基对或更多、约300个碱基对或更多、约500个碱基对或更多、约1千碱基对或更多、约5千碱基对或更多、约10千碱基对或更多、约20千碱基对或更多或其组合。在一些情况下,每个特征彼此间隔约25个碱基对或更少、约50个碱基对或更少、约100个碱基对或更少、约300个碱基对或更少、约500个碱基对或更少、约1千碱基对或更少、约5千碱基对或更少、约10千碱基对或更少、约20千碱基对或更少或其组合。

在一些情况下,所述方法还包括通过当核苷酸经过该孔隙时测量跨孔隙的离子电流来鉴别经过孔隙之一的多核苷酸的每个核苷酸。

在一些情况下,所述方法还包括对所述多核苷酸测序。

在一些情况下,控制器被配置以在第一方向、第二方向或两者上执行多核苷酸的控制电压频率扫描。在一些情况下,控制器被配置以在第一方向、第二方向或两者上执行多核苷酸的控制电压振幅扫描。在一些情况下,控制器被配置以调节多核苷酸的速率。在一些情况下,速率范围为每毫秒0.1个碱基对至每毫秒10个碱基对。在一些情况下,控制器被配置以调节第一电压和第二电压以便以多个速率执行多核苷酸的多次扫描。在一些情况下,所述以多个速率执行多核苷酸的多次扫描提高了一个或多个特征的检测的准确性。在一些情况下,所述方法包括以多个速率对多核苷酸执行多次扫描。在一些情况下,控制器被配置以控制多核苷酸在第一方向、第二方向或两者上的速率范围。在一些情况下,控制器被配置以当多核苷酸在第一方向、第二方向或两者上移动通过第一孔隙和第二孔隙时控制第一孔隙和第二孔隙的电压范围。在一些情况下,控制器被配置以确定多核苷酸在第一方向、第二方向或两者上的最佳速率范围,其中多核苷酸的最佳速率范围降低了布朗运动对多核苷酸的影响。在一些情况下,多核苷酸的速率范围包括确定用于测序的最佳多核苷酸速率。

本公开的方面包含用于差异检测混合样品中的5mC和5hmC的方法,所述混合样品含有分别移动通过第一孔隙和第二孔隙的一种或多种多核苷酸序列,所述方法包括:a)用结合部分标记一个或多个靶多核苷酸的一个或多个靶多核苷酸序列上的5mC和5hmC区域;b)使所述一种或多种靶多核苷酸与有效负荷分子接触,其中所述有效负荷分子被配置以结合至一种或多种靶多核苷酸的结合部分;c)提供用于控制与有效负荷分子结合的靶多核苷酸同时移动通过第一孔隙和第二孔隙的双孔隙、双放大器装置,所述装置包含:(i)第一通道、腔室和第二通道,(ii)第一孔隙,(iii)第二孔隙;(iv)电源,其被配置以在所述第一孔隙处提供第一电压,并且在所述第二孔隙处提供第二电压,每个电压是独立可调节的,以及(v)双放大器电子器件,其被配置以在各孔隙处进行独立的电压控制和电流测量,其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在任一方向上同时跨两个孔隙移动,d)将含有一种或多种靶多核苷酸的样品加载到所述装置中;e)施加初始第一电压和初始第二电压,使得所述一种或多种靶多核苷酸的至少一部分移动通过第一孔隙和第二孔隙,其中所述第一电压和第二电压单独地对于以下各项中的每项诱导所述一种或多种靶多核苷酸移位通过第一孔隙和第二孔隙:一个或多个多核苷酸序列上的标记的5mC区域;一个或多个多核苷酸序列上的标记的5hmC区域;f)产生由一个或多个靶多核苷酸移位通过第一孔隙和第二孔隙产生的多个事件印记,g)识别与一个或多个多核苷酸序列上标记的5mC区域相关的第一事件印记的量和与一个或多个多核苷酸序列上标记的5hMC区域相关的第二事件印记的量,以区分一个或多个多核苷酸序列上的5mC区域和5hmC区域。

在一些实施方案中,本公开的方法包括在第一方向上检测(例如捕获)靶多核苷酸的至少一部分的一个或多个特征的离子流,所述第一方向为从腔室通过第一孔隙并进入第一流体通道中。在一些情况下,所述方法包括在第二方向上再检测(例如再捕获)靶多核苷酸的至少一部分的一种或多种特征的第二离子流,所述第二方向是从所述第一流体通道通过第一孔隙并进入腔室中。在一些情况下,所述方法包括在第三方向上共检测(例如共捕获)靶多核苷酸的至少一部分的一个或多个特征的第三离子流和第四离子流(例如当一个或多个特征经过第一孔隙时的第三离子流,并且同时当一个或多个特征通过第二孔隙时的第四离子流),所述第三方向是从第一孔隙到第二孔隙(例如靶多核苷酸的至少一部分从第一孔隙移动通过腔室并进入第二孔隙中)。在一些情况下,所述方法包括在第四方向上再检测(例如再捕获)靶多核苷酸的至少一部分的一种或多种特征的第四离子流,所述第四方向是从第二流体通道通过第二孔隙并进入腔室中。

在一些情况下,靶多核苷酸的至少一部分在0.01ms至200ms的时间段内移动通过第二孔隙。在一些情况下,靶多核苷酸的至少一部分在约165ms内移动跨过第二孔隙。在一些实施方案中,然后将第一电压调节至约400mV以在相反方向(例如第二方向、第三方向或第四方向)拉动靶多核苷酸的另一端,在第一孔隙和第二孔隙之间达到拔河状态。在一些情况下,靶多核苷酸包含相对于第一孔隙的力增加的朝向第二孔隙的力。在一些情况下,靶多核苷酸包含相对于第二孔隙的力增加的朝向第一孔隙的力。在一些情况下,靶多核苷酸包含在第一孔隙和第二孔隙之间的拔河状态0.01ms至1000ms的时间段。在一些情况下,分子在200ms至1000ms的时间段内离开所述装置。

在一些实施方案中,靶多核苷酸包含扩散系数。在一些情况下,靶多核苷酸的扩散系数为0.01mkm2/s至3mkm2/s。在一些情况下,靶多核苷酸的扩散系数为约0.10、约0.15、约0.20、约0.25,约0.5、约0.55、约0.60、约0.65,约0.70、约0.75、约0.8,约0.85、约0.9、约0.95、约1.0、约1.5或约2.0mkm2/s。在一些情况下,靶多核苷酸的扩散系数为约0.47mkm2/s。在一些情况下,扩散系数可以由A.爱因斯坦公式,D=K.T/6πηr导出,其中K是玻尔兹曼常数,T是热力学温度,η是动态粘度,并且r是颗粒半径。

在一些情况下,靶多核苷酸被加载到纳米孔隙装置上。在一些情况下,靶多核苷酸被加载在装置的腔室中。在一些情况下,靶多核苷酸被加载在装置的第一流体通道中。在一些情况下,靶多核苷酸被加载在装置的第二流体通道中。在一些情况下,将含有靶多核苷酸的样品加载到腔室中以提供不同试剂的交换。在一些情况下,在第一方向上(例如,从腔室通过第一孔隙并进入第一流体通道中)和/或第二方向上(从第一流体通道通过第一孔隙并进入腔室中)扫描和/或检测多核苷酸的一个或多个特征以筛选出多核苷酸序列的短片段。在一些情况下,靶多核苷酸在第一方向上移动较长的持续时间提高了在第一方向上检测靶多核苷酸的一个或多个特征的效率。

在一些实施方案中,拔河状态包含靶分子在第一孔隙和第二孔隙之间前后移动。在一些情况下,靶多核苷酸共捕获在第一孔隙和第二孔隙中。在一些情况下,一旦共捕获发生,控制逻辑在第一孔隙和第二孔隙处打开恒定竞争电压,从而导致“拔河”。在一些情况下,相反的力被施加到穿过孔隙的靶分子区域。在一些情况下,力对共捕获的靶多核苷酸同时施加构象和速率控制。在一些情况下,所述力去除折叠并降低靶多核苷酸的移位速率。在一些情况下,当调节第一电压和第二电压以使施加到第一孔隙和第二孔隙的电泳力达到平衡时,拔河状态的寿命受到靶多核苷酸在第一孔隙和第二孔隙之间的扩散性滑动的限制。在一些情况下,第一孔隙和第二孔隙中的每一个的离子电流提供独立的传感器,其同步测量相同多核苷酸的不同区域,使得能够对一种或多种特征进行顺序检测。在一些情况下,控制逻辑是控制器。在一些情况下,控制器包括FPGA或ASIC电路以实现有源反馈控制。在一些情况下,控制逻辑经配置以促进靶多核苷酸在第一孔隙和第二孔隙两者中的共捕获。在一些情况下,控制逻辑经配置以在共捕获的靶多核苷酸上进行竞争电压拔河直到靶多核苷酸离开第一孔隙和第二孔隙。在一些情况下,一个或多个特征的检测和靶多核苷酸离开进入第一孔隙中仅影响在第一孔隙处检测到的第一离子电流。在一些情况下,一个或多个特征的检测和靶多核苷酸离开进入第二孔隙中仅影响在第二孔隙处检测的第二离子电流。

本公开的方面包含用于定位靶多核苷酸的一个或多个特征的方法,所述方法包括以下步骤:a)提供用于控制所述靶多核苷酸同时移动通过第一孔隙和第二孔隙的双孔隙、双放大器装置,所述装置包含:(i)位于腔室和第一流体通道之间的第一孔隙,(ii)位于腔室和第二流体通道之间的第二孔隙,(iii)位于第一流体通道和第二流体通道内的一个或多个电极,其中所述一个或多个电极被配置以在所述第一孔隙处提供第一电压,并且在所述第二孔隙处提供第二电压,每个电压是独立可调节的,以及(iv)经配置在各孔隙处进行独立的电压控制和电流测量的一个或多个传感器,其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在任一方向上跨第一孔隙、跨第二孔隙和同时跨两个孔隙移动,b)将所述靶多核苷酸加载到所述装置的腔室中;c)在所述第一孔隙处施加第一电压并且在所述第二孔隙处施加第二电压,使得所述靶多核苷酸的至少一部分在第一方向上从所述腔室移动,以在所述第一孔隙中捕获所述靶多核苷酸,并且允许所述靶多核苷酸经过至少第一孔隙进入第一流体通道中;d)扫描靶多核苷酸的一个或多个特征;e)当靶多核苷酸经过第一孔隙时,检测第一循环中的第一组特征;f)当在所述第一循环中在第一方向上检测到第一组特征时,调节第一孔隙和第二孔隙的第一电压、第二电压或两者以改变所述靶多核苷酸的方向,使得所述靶多核苷酸的至少一部分在第二方向上从所述第一流体通道移动,以在所述第一孔隙中再捕获所述靶多核苷酸,使得所述靶多核苷酸维持在所述至少第一孔隙中,g)重复步骤d);h)当靶多核苷酸的至少一部分被再捕获在所述第一孔隙中时,在所述第一循环中检测所述第一组特征;i)当在第一循环中在第二方向上再捕获第一组特征时,调节第一孔隙和第二孔隙的第一电压、第二电压或两者,使得靶多核苷酸的至少一部分同时在第三方向上移位通过第一孔隙和第二孔隙,第三方向是从第一孔隙到第二孔隙;j)重复步骤d);k)当靶多核苷酸的至少一部分处于两个孔隙中时,检测第一循环中的第一组特征;1)当在第三方向上检测到第一组特征时,调节第一孔隙和第二孔隙的第一电压、第二电压或两者,以改变靶多核苷酸的方向,使得靶多核苷酸的至少一部分在第四方向上同时移位通过第二孔隙和第一孔隙,第四方向是从第二孔隙到第一孔隙,m)当靶多核苷酸的至少一部分在第四方向上同时处于两个孔隙中时,检测第一循环中第二组特征的存在;以及n)在第二循环中重复步骤c)到m)以检测第三组和第四组特征。

本公开的方面包含方法,用于在纳米孔隙装置中捕获靶多核苷酸的方法,所述方法包括:a)提供用于控制靶多核苷酸移位通过一个或多个孔隙的纳米孔隙装置,所述装置包含:(i)至少第一孔隙,其位于腔室与第一流体体积之间,所述第一孔隙流体连接到所述腔室和第一流体体积,所述第一流体体积是在与所述第一孔隙相对的一侧上具有开口的几何约束的外壳,(ii)至少一个电极,其位于第一流体体积内,其中所述一个电极被配置以在所述第一孔隙处提供第一电压,以及(iii)放大器,其经配置以用于所述第一孔隙处的电压控制和电流测量;b)将所述靶多核苷酸加载到所述装置的腔室中;和c)跨第一孔隙上施加第一电压用于使所述靶多核苷酸在第一方向上从所述腔室移动,以在第一孔隙中捕获所述靶多核苷酸并允许所述靶多核苷酸通过第一孔隙进入第一流体体积中;d)当靶多核苷酸在第一方向上通过第一孔隙时,检测所述第一孔隙中的第一离子流;e)在所述靶多核苷酸包含在所述第一流体体积内时将电压调节至零一段时间;f)施加第二电压以逆转位于第一流体体积中的所述靶多核苷酸的方向,其中所述第二电压使所述靶多核苷酸的至少一部分在第二方向上从所述第一流体体积移动以将所述靶多核苷酸的所述部分再捕获在所述第一孔隙中,使得所述靶多核苷酸维持在所述第一孔隙中;以及g)当靶多核苷酸被再捕获在所述第一孔隙中时,检测所述第一孔隙中的第二离子流。

本公开的方面包含用于定位通过第一孔隙和第二孔隙的靶多核苷酸的多核苷酸序列的一个或多个特征的装置和系统,所述装置包含:(i)流体地位于腔室与第一流体通道之间的第一孔隙;(ii)位于腔室和第二流体通道之间的第二孔隙,其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在任一方向上跨第一孔隙、跨第二孔隙和同时跨两个孔隙移动;(iii)一个或多个电极,其被配置以在装置的第一孔隙处提供第一电压,并且在装置的第二孔隙处提供第二电压;(iv)经配置用于在各孔隙处进行独立的电压控制和电流测量的一个或多个传感器,其一个或多个传感器能够鉴别:在第一循环中,在靶多核苷酸的至少一部分在第一方向上从腔室通过第一孔隙,在第二方向上从第一流体通道通过第一孔隙,在第三方向上从第一孔隙通过第二孔隙;以及在第四方向上从第二孔隙通过第一孔隙移动期间,来自靶多核苷酸的第一组特征;(v)处理器;以及(vi)非暂时性计算机可读介质,其包括指令以使所述处理器执行以下操作:a)在所述第一孔隙处施加第一电压并且在所述第二孔隙处施加第二电压,使得所述靶多核苷酸的至少一部分在第一方向上从所述腔室移动,以在所述第一孔隙中捕获所述靶多核苷酸并且允许所述靶经过至少第一孔隙进入第一流体通道中;b)扫描靶多核苷酸的一个或多个特征;d)从一个或多个传感器确定在第一方向上所述第一孔隙中所述靶多核苷酸的一个或多个特征的存在;d)在第一方向上对第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,使得所述靶多核苷酸的至少一部分在第二方向上从所述第一流体通道移动,以在所述第一孔隙中再捕获所述靶多核苷酸的所述部分,使得所述靶多核苷酸维持在所述第一孔隙中;e)重复步骤b);f)从一个或多个传感器确定在第二方向上所述第一孔隙中所述靶多核苷酸的一个或多个特征的存在;g)在第二方向上对第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,使得所述靶多核苷酸的至少一部分在所述第三方向上同时移动通过第一孔隙和第二孔隙;h)重复步骤b);i)从一个或多个传感器确定在第三方向上所述靶多核苷酸的一个或多个特征在第一孔隙和第二孔隙中的同时存在;j)在第三方向上对第一循环中的第一组特征进行计数,并且响应于该计数,调节第一电压和第二电压中的一个或两个,使得所述靶多核苷酸的至少一部分在第四方向上同时移动通过第二孔隙和第一孔隙;k)重复步骤b);l)从一个或多个传感器确定在第四方向上所述靶多核苷酸的一个或多个特征在第一孔隙和第二孔隙中的同时存在;以及m)在第二循环中重复步骤a)到l)以检测第三组和第四组特征。

本公开的方面包含用于确定靶多核苷酸的序列的方法,所述方法包括以下步骤:a)提供用于控制所述靶多核苷酸同时移动通过第一孔隙和第二孔隙的双孔隙、双放大器装置,所述装置包含:(i)第一孔隙,(ii)第二孔隙;(iii)电源,其被配置以在所述第一孔隙中提供第一电压,并且在所述第二孔隙中提供第二电压,每个电压是独立可调节的,以及(v)双放大器电子器件,其被配置以用于在各孔隙处的独立电压控制和电流测量,其中第一孔隙和第二孔隙被配置以使得所述靶多核苷酸能够以受控的方式在第一方向或第二方向上同时跨两个孔隙移动,b)加载所述靶多核苷酸到所述装置中;c)设定所述第一孔隙中的初始第一电压和第二孔隙中的初始第二电压,使得所述靶多核苷酸的至少一部分在第一方向上移位通过第一孔隙和第二孔隙,其中所述第一方向是从第一孔隙到第二孔隙;d)扫描与所述靶多核苷酸杂交的一种或多种引物;e)当靶多核苷酸在第一方向上的两个孔隙中时,检测第一循环中的第一组引物;f)重新扫描与所述靶多核苷酸杂交的所述一种或多种引物;g)当在第一循环中在第一方向上检测到第一组引物时,调节第一孔隙和第二孔隙的第一电压、第二电压或两者,以改变靶多核苷酸的方向,使得靶多核苷酸的至少一部分在第二方向上从第二孔隙移动到第一孔隙,h)当靶多核苷酸在第二方向上同时处于两个孔隙中时,检测第一循环中第二组引物的存在;i)通过当所述核苷酸经过孔隙时测量跨孔隙的离子电流来鉴别经过孔隙之一的所述多核苷酸的每个核苷酸;和j)重复步骤c)至i)以在第二循环中检测第三组和第四组引物。

最后,说明书中使用的语言主要是出于可读性和指导性的目的而选择的,并且可能不是为了描绘或限制本发明的主题而选择的。因此,本发明的范围不限于所述详细描述,而是由基于本申请的任何权利要求来限制。因此,本发明的实施方案的公开旨在说明而非限制本发明的范围,其在所附权利要求中阐述。

本公开的非限制性方面的实施例

上述本主题的方面(包含实施方案)单独或与一个或多个其他方面或实施方案组合是可能是有益的。在不限制前述描述的情况下,下文提供编号为1-171的本公开的某些非限制性方面。如所属领域的技术人员在阅读本公开内容后将了解的,各个单独编号的方面中的每一个可与先前或后续单独编号的方面中的任一个一起使用或组合。这旨在为所有这些方面的组合提供支持,并且不限于以下明确提供的方面的组合:

实施例

提出以下实施例以便向本领域普通技术人员提供关于如何制备和使用本发明的完整公开和描述,并且不旨在限制发明人认为的发明范围,也不旨在表示以下实验是全部或唯一进行的实验。已努力确保所用数字(例如,量、温度等)的准确性,但应考虑一些实验误差和偏差。除非另有说明,份为重量份,分子量为重均分子量,温度为摄氏度,并且压力为大气压或接近大气压。可以使用标准缩写,例如bp,碱基对;kb,千碱基;pl,皮升;s或sec,秒;min,分钟;h或hr,小时;aa,氨基酸;kb,千碱基;bp,碱基对;nt,核苷酸;i.m.,肌内(肌内地);i.p.,腹膜内(腹膜内地);s.c.,皮下(皮下地);等等。

实施例1:双纳米孔隙装置中的纳米孔隙拉丝DNA

在此提出了一种称为“拉丝”的主动控制技术,其使用双纳米孔隙装置来捕捉蛋白质标记的DNA分子并在几秒钟内进行多达100次分子的来回电扫描。与48kbλDNA结合的蛋白基序用作双向控制的主动触发的可检测特征。通过对多扫描数据进行平均来抑制分子噪声,以产生与其已知值相当的平均标签间距离估计。由于纳米孔隙特征定位应用需要在经过孔隙时DNA线性化,因此拉丝的关键优点是,与同组分子的单个纳米孔隙通过的35%相比,通过第二扫描,跨孔隙线性化增加到>98%。与条形码方法协同,双孔隙拉丝技术能够进行基因组作图和结构变异应用,或定位表观遗传相关的位点。

已经表明,与基序结合相关的高度准确的空间信息可以从单一标记的载体dsDNA链通过重复的来回扫描纳米孔隙装置中捕捉的分子获得。使用称为“拉丝”的新的主动控制技术,本发明人能够在几秒内对给定的捕捉分子进行高达100次扫描。在此使用由48.5kbp双链λ-DNA和一组化学结合的序列特异性蛋白质标签组成的模型系统展示拉丝。该研究的方法通过提高从单个捕捉分子提取的信息的质量来补充现有的载体-链DNA纳米孔隙技术。通过进行大量统计等效扫描,通过扫描平均减少随机波动,并且显示了与已知标签间距离相当的平均标签间隔估计,即使在允许扫描子集中丢失标签时也是如此。

本公开的装置采用双孔隙架构。通过使双孔隙足够接近,DNA被两个孔隙同时捕获并以“拔河”状态存在,其中在孔隙处施加竞争电泳电压力。在拔河期间,维持分子的取向和同一性,调节分子速率以促进标签感测,并且与使用单孔隙数据的30%相比,通过孔隙发现线性化构象的分子的可能性增加至70%。拉丝的优点在于,通过第二次扫描,通过孔隙的线性化进一步增加到>98%,这又增加了纳米孔隙特征作图应用的通量。

所提出的方法的另一个显著特征是,有源控制器通过对另一个孔隙的感测电流的实时反馈来循环调制一个孔隙处的电压。具体地,在控制过程中,通过周期性施加不平衡竞争电压力来驱动分子在一个方向上的运动,然后在实时检测一定数量的标签之后,在相反方向上驱动分子的运动,从而体现DNA“拉丝”的概念。将DNA与一定阶段耦合在分子通过固态孔隙运动的过程中产生速率控制和可挖掘的数据生成,但代价是复杂的仪器、较高的感测噪声和较低的通量。在所提出的拉丝控制方法中,从孔隙中喷出待探询的DNA分子,并且以相同的通量和任何基于单纳米孔隙的测定的简易性捕获新的DNA,而无需要分子的束缚。

结果和讨论

DNA拉丝概念

图9引入了一般的拉丝概念,其用图片和实际记录的数据显示了在双纳米孔隙装置中共捕获的分子的循环双向扫描。使用已知方法制备双纳米孔隙装置,其中电压V1和V2分别独立地施加在孔隙1和2处。在孔隙处也独立地测量两个电流(I1和I2)。标记的试剂以沿着DNA结合的单价链霉抗亲和素(MS)蛋白为特征。

图9a显示了多扫描循环中的每个步骤。由于运动控制是双向的,因此将具有固定方向的单次通过定义为“扫描”,并且将逆转极性的两次顺序扫描定义为“循环”。按照惯例,左侧孔隙定义为孔隙1,并且右侧孔隙定义为孔隙2。在多扫描控制逻辑序列期间,跨孔隙2的V2维持恒定,而V1以步进方式调制。信号I2作为V1变化的逻辑触发被实时监控,如下所述。

拉丝控制逻辑开始于最初在两个孔隙中共捕获标记的DNA以达到拔河状态。一旦发生共捕获,跨孔隙1施加比孔隙2更低的电压(V1<V2)以引导分子朝向孔隙2运动(左到右,或“L到R”)。在监测I2的同时,控制逻辑重新调节孔隙1处的电压,使得在检测到一定数量N的标签移位通过孔隙2之后V1>V2。重新调整引导分子运动回到孔隙1(R到L)。在检测到相同数量N的标签移位通过孔隙2之后,逻辑复位V1<V2以启动另一个L到R扫描,从而开始新的循环。图9b显示了标签号设置为N=2的I2信号的前两次循环和最后循环的记录实例。在该实例中,多扫描循环开始于分子在前9ms内从L到R移动,并持续直到172ms,此时DNA刚好在V1调制之后逃离(逃离模式在下面讨论并在SI中详细描述)。在表S1-S2(图18-19)中提供了在本研究中使用的双孔隙芯片组和电压设置的细节。已经描述了一般拉丝概念,下面更详细地介绍所述方法和使用所述方法获得的结果。

初始化拔河和鉴别扫描电压

图9所示的使拉丝过程自动化的控制逻辑在此详细描述。拉丝方法首先使用主动控制来自动初始化单个分子上的共捕获和拔河。控制逻辑在现场可编程门阵列(FPGA)上实时(MHz时钟速率)运行。修改所设计的拔河控制过程以允许在两个纳米孔隙上方的公共流体腔室中加载试剂并筛选出短片段(SI第2节,图16)。一旦实现共捕获,V1和V2处的竞争电压力导致拔河并降低感测期间的DNA速率。在维持V2恒定的同时,在一组不同的V1值中的每一个下计算所有共捕获事件的平均持续时间,以显示了具有峰值的钟形曲线,其揭示了使共捕获持续时间最大化的力平衡电压。图16c显示了峰值平均持续时间为110ms,V1和V2两者都设置为500mV的实例装置。该数据是用没有标签的裸DNA生成的。

当在双孔隙拔河中捕获分子引入速率和构象控制时,裸双链DNA不提供用于监测分子运动的可检测特征。为了实现原位特征监测,开发了MS标记的DNA作为模型试剂,在DNA上标记多达7个位点(SI第3节,图21)。使用标签特征来推断每次扫描的速率和方向,这使得能够鉴别扫描电压,如下所述。

扫描电压是在为给定芯片确定了最大化共捕获持续时间的力平衡电压之后发现的。具体地,选择V1的扫描电压值高于和低于其力平衡值,以便分别促进未干扰的DNA向孔隙1和孔隙2运动,同时维持V2处于其力平衡值。使用以下指南启发式地选择V1扫描值。工作扫描速率应当能够在记录带宽(即,不太快)下稳健地感测标签阻断,同时确保足够高的Peclet数,以便移位时间分布被明确限定(即,不太慢)。也就是说,宽的移位时间分布增加了波动的概率,这可能破坏后面部分中描述的标签间时间-距离定位目标。实际上,对于宽范围的扫描V1电压,实现了不太快和不太慢的扫描速率。对于本文中的数据,所述范围与力平衡电压相比低至150mV和高至500mV。具有蛋白标记的DNA的代表性拉丝事件

一旦鉴别了扫描电压值,就可以应用完整拉丝多扫描逻辑。FPGA实现的逻辑的全部细节在补充材料中提供(SI第4节,图17)。逻辑的输出在这里由代表性拉丝数据传达[10]。图10a显示了来自典型拉丝事件的I1、V1、I2和V2的完整信号轨迹。在事件中,tV2维持在V2=300mV不变。对于L到R运动,V1设定为V1=100mV,并且对于R到L运动,V1设定为V1=850mV。应注意,当调整V1时,即使V2恒定,I2基线也会变化。该效应由先前表征的孔隙1和孔隙2之间的串扰引起。尽管基线发生了改变,但I2中相对于DNA基线的标签的可检测性仍然是稳健的。如前面部分所详述的,在V1和V2之间选择足够大的电压差,以促进在感测期间在每个方向上的受控运动。

图10b、c给出了包含第1次和第2次扫描的第一循环以及包含第81次和第82次扫描的最后循环的信号的放大视图。按照惯例,由于多扫描逻辑在L到R方向上开始,奇数扫描对应于L到R移动,而偶数扫描对应于R到L移动。图10a中的事件包含41个循环和总共82次扫描,全部在小于0.66秒内。如图1所述,FPGA逻辑被设计为一旦在I2内检测到两个标签就切换V1。当I2下降到未标记的DNA基线以下至少70pA持续至少0.012ms时,FPGA检测到标签。图2中的数据显示了当分子在9ms至19ms从L到R移动时,在I1和I2两者中的两个标签A和B。在检测到标签B之后的1.5ms延迟之后,FPGA设置V1=850mV,驱动分子在19ms至25ms从R到L移动。以相反的顺序在I1和I2两者中检测到相同的标签B和A。相同的逻辑继续,直到FPGA在最后一个循环中未能检测到标签B(图10c),这是由于标签看起来对于电压变化太接近而导致FPGA无法检测到它。

每事件的总拉丝时间和扫描次数分布如图10d所示。实验中总共309个拉丝事件,其包含图10a中的82个扫描事件。总拉丝时间随着更多的扫描而增加,而所有事件在少于几秒内终止,即使对于该数据的最大扫描计数157。当单次扫描持续5-10ms时(图9b和10b-c),总时间数据显示通过使用拉丝方法探询每个分子所花费的时间显著增加(高达100X以上)。

根据图10d中的概率图,37%的事件少于5次扫描,并且具有较高扫描计数的事件的可能性较小。检查了遇到特定扫描总数n的概率P(n),其中任何中间扫描的概率具有正确的检测概率p和漏检概率(1-p)。具有n次总扫描的事件表明系统成功捕获初始(n-1)次扫描,但未能捕获第n次扫描。从而其概率P(n)为:

P(n)=pn-1(1-p). (1)

将数据拟合到等式(1)导致该特定数据集的p=0.89(图10d)。为了确定为什么分子离开共捕获,对最后的循环进行了研究并发现四种常见的情况:在第n次扫描中丢失标签(图18a);在第(n-1)次扫描中检测到假阳性尖峰(图18b);在第n次扫描中检测到假阴性尖峰(图18c);并且在FPGA延迟状态期间分子离开孔隙(图18d)。关于如何增加每事件的扫描总数的讨论可以在SI第5节中找到。自然地,改变电压设置将影响标签之间的事件持续时间,这又将影响标签检测概率。

在图10a-c中观察到标签幅度对扫描方向的依赖性,其中MS标签在以两者中较高的电压经过孔隙时显示相对较浅且较快的尖峰。在较高电压下看到较快和较浅的标签事件与单孔隙结果一致,并且部分地是低通滤波器(10kHz带宽)的伪影,其防止标签事件达到全深度(即,事件越快,越浅)。

还执行了使用三个标签触发设置的多扫描实验(图19)。使用三个标签触发比使用两个更难得到更高的扫描计数。部分原因是较少的分子(<20%)显示三个或更多个标签。而且,即使当系统在两个孔隙中共捕获具有三个标签的一个分子时,所有三个标签的正确检测的概率较低(图19c),并且未能检测到任何一个标签则将分子移动到新的区域,从而降低了原始扫描的三标签区域的扫描计数。为了产生具有更高扫描计数的更多数据,因此实验集中在该初始呈现中的双标签触发。

拉丝增加了具有可定位数据DNA的分数

纳米孔隙特征定位应用要求DNA在经过感测孔隙时线性化。因此,研究了可以通过拉丝技术线性化的DNA的部分,其中线性化是指当初始化共捕获时去除最初在孔隙中的DNA折叠。例如,图10a-c中的分子在第一循环中在约10ms处部分折叠(图10b),其在第2次循环和之后被消除,这证明了拔河控制以诱导和维持DNA线性化的趋势。检查在通过孔隙2的扫描循环内完全线性化的概率作为扫描次数的函数,以查看图10a-c中的趋势是否是群体典型的。实际上,图11显示,通过第二次扫描,线性化的概率增加到98%。在数据中,如果电流阻断大于未折叠阻断量的1.5倍,并且持续多于180μs,则鉴别折叠事件。图11a、b示出具有可观察的折叠实例的代表性单孔隙和多扫描事件。

提出了图11c中拉丝期间未折叠进程的定性机制。从L到R,孔隙2处的运动和场力被对齐,这促进折叠最终移动通过孔隙2并进入通道2中。随后,尽管在孔隙2处存在相反的场力,但R到L运动仅将处于张力下的DNA区域通过拔河拉回通过孔隙2,而不处于拔河张力下的折叠仅经历场力,因此保留在通道2中并远离孔隙2。图11d显示了309个事件中的每一个所经历的移位进展类型的未折叠事件的比率。因此,每列中的统计来自完全相同的分子组,并且是与图10相同的数据。通过初始单孔隙捕获(装置中的孔隙1)的35%的未折叠概率与其他单孔隙研究一致。共捕获后,第一次扫描的66%是未折叠的,这与无拉丝的拔河数据一致[28]。通过第二次扫描,309个分子中只有6个(2%)维持折叠,并且到它们的最后一次扫描,仅5个维持折叠。因此,拉丝过程以高概率通过纳米孔隙传感器有效地使DNA分子线性化。

标签数据分析:单扫描视图

多扫描数据集(构成各孔隙的L到R和R到L扫描)包含关于下层标签结合谱和移位物理的丰富信息。从两个孔隙中进行的每次单个扫描提供了被扫描的DNA部分的移位过程的快照。有两种方法评估标签的移位速率。第一种方法是量化标签移动通过单孔隙时的速率(“停留时间估计”),其基于将标签阻断持续时间(半峰宽度)被膜厚度(35nm)除。第二种方法是于双纳米孔隙技术独特的,并且是在标签从第一孔隙(入口)移动到第二孔隙(出口)时评估标签速率。这一进入到离开时间是指标签位于两个孔隙上方的公共腔室中的时间,并且也被称为孔隙到孔隙时间。在孔隙到孔隙速率估计中,所述孔隙到孔隙时间对于每个芯片被孔隙之间的测量距离所除。根据定义,孔隙到孔隙方法利用两个电流信号I1和I2之间的相关性,因为时间从标签离开入口孔隙开始,并随着标签进入出口孔隙而结束。在所施加的电压下,预计公共储器中的DNA在孔隙之间完全伸展(0.34nm/bp)。

图12显示了多扫描事件中的相邻扫描对的实例,并且展示了可以如何从每次扫描来估计标签间分隔距离。对于L到R扫描(图12a、c),标签A然后标签B移动通过孔隙1,并且约1ms后它们移动通过孔隙2。信号图案显示标签A和B在空间上比孔隙之间的距离(0.64μm)更接近。FPGA在控制逻辑期间监测两个标签的I2。在I2中检测到A和B之后的等待期间,第三标签C经过孔隙1。从视觉上看,A和B的孔隙到孔隙通过时间也很清楚,标签B和C的距离是孔隙之间的距离的约两倍远。在改变V1以促进在反方向R到L上的运动时(图12b、d),I1中第一个可观察的标签是C,其经过孔隙1返回。再次,逻辑检测I2中的A和B,并且这次在逻辑触发V1以促进L到R运动之前,两个标签都经过孔隙1。看到I1内的三个标签是三个物理标签分离的结果,其足够接近以容纳I2的2-标签孔隙2检测时间窗口内的3标签孔隙1通过,如在FPGA上实现的。更常见的是在两个孔隙中可靠地看到两个标签,如在下一节中详述的。

对于L到R扫描,I2中的标签阻断对应于离开公共储器的标签,使孔隙2成为L到R的出口,而移动R到L意味着I2中的标签进入公共储器。虽然I2显示了两个标签,但是对于两个扫描方向存在于I1中的第三标签产生了量化两个标签对分离距离的机会。对于所示的信号,绘制了孔隙之间的标签数量,还绘制了基于停留时间和孔隙到孔隙速率的标签速率。这些速率值与时间的关系提供了分子在共捕获拔河过程中如何移动的简要说明,以及为可视化而添加的阐述(图12a、12b)。R到L方向的孔隙至孔隙速率稍快(0.8相对0.6μm/ms),这与R到L运动(V1=600mV,V2=400mV)与L到R运动(V1=250mV,V2=400mV)相比的更大电压差一致。

标签到标签分离距离(图12c、d底部)通过将扫描中的平均孔隙到孔隙速率乘以该扫描中记录的标签到标签时间并加上膜厚度来估计。加入膜厚度以考虑增加的空间分离,其相当于任一标签经过孔隙的长度,因为从检测的标签阻断的上升沿到下一个检测的标签阻断的下降沿计算标签到标签时间。显示了L到R扫描和R到L扫描的标签到标签距离估计。结果表明,每个分离预测将在两个不同的扫描方向上变化。对于给定的孔隙,标签对分离距离预测也将由于标签孔隙到孔隙速率和在标签到标签时间期间的真实速率分布之间的差异而变化。即,标签之间的速率是恒定的并且等于孔隙到孔隙的速率的假设不是完全正确的。当标签到标签的时间短于孔隙到孔隙的时间时,该假设可能更好,这是图12中标签A和B而不是标签B和C的情况。在任何情况下,如果DNA以恒定的孔隙到孔隙速率行进的假设平均而言是真实的,则许多再扫描的平均值有望预测任何两个连续标签之间的准确分离距离。接下来计算多次扫描预测的平均值并进行测试,以观察预测与来自模型标记DNA试剂的已知分离的一致性如何。

组合扫描以改进标签到标签距离预测

检查了在多扫描事件中对从单个扫描获得的距离平均的误差降低性能。表1中报告了至少30次循环的5个不同多扫描事件。对于每个事件,显示了每个扫描方向的平均距离估计,并且单独使用孔隙2估计以及合并孔隙1和孔隙2估计。表报告了等于每个方向上的扫描次数的循环次数,以及对每个分离估计有贡献的标签对的数量。在所有情况下,距离估计比扫描少。例如,对于在每个方向上具有65次扫描的事件(v),并且对于R到L方向,57次扫描在I2中产生可检测的标签对,而在I1中检测到62个标签对,总共119个分离估计。损耗是因为在任何一次扫描中丢失标签的概率随着循环计数而增加,如等式(1)所述。

评估了表1中的平均分离距离与可能来自位置图谱的已知标签间分离的对应性。使用转化0.34nm/bp计算已知的距离,其假定在公共储器中的DNA在孔隙之间完全伸展。对于事件(i),仅合并R到L扫描方向并对于事件(i)报告,因为L到R数据显示孔隙到孔隙速率的显著变化(在SI第11节描述)。注意图4所示的两次扫描来自事件(i),由于所述图中描述的原因,该事件在病理上在孔隙1电流中产生两个标签对估计。如果假设是分子不存在标签6并且存在标签4、5和7,则事件(i)的相邻标签对分离在根据位置图谱可能的所有可能的相邻标签对排列中具有其最接近的匹配。具体地,所述图谱显示标签4-5和5-7之间0.1和1.5μm的相邻距离。假设标签(即标签6)不存在是合理的。

当比较孔隙2结果与组合结果时,表1中的事件(ii-v)显示出在两个扫描方向上以及在两个孔隙之间非常一致的结果。对于这些事件,仅产生单个分离距离估计,这对于在I2中使用N=2个标签检测来触发方向切换的控制逻辑是最常见的。关于比较平均分离距离和已知标签间分离,事件(ii)和(iii)分别最接近地对应于5-7和6-7之间的1.5μm和1.3μm距离,如果对于事件(ii)的分子假定标签6位置是空的,则1.5μm值是可能的。并且事件(iv)和(v)分别最接近地对应于4-6和5-6之间的0.3μm和0.2μm距离,如果对于事件(iv)的分子假定标签5位置是空的,则0.3μm值是可能的。

距离估计和图谱可能的排列之间的对应性对于单个扫描(例如,图12)而言通常不如平均扫描那样清楚,并且对于标签丢失的扫描是不可能的(代表性实例在图30、32和33中示出)。这通过对每个分子产生的多扫描数据组进行平均而显示了误差减少值。表1中事件(i-v)的速率谱的额外数据和四个额外多扫描事件的数据在表S3中报告(图21)。每个分离估计上的误差作为所述估计组的平均值的误差而获得,通过平均实现误差的显著减小。

表1中的数据(图13)显示了当事件在I2中具有标签到标签时间时的拉丝方法的能力(power),这明确地归因于相同物理标签组(在图26-33中提供了具有I1和I2信号两者的代表性扫描)。然而,在其它数据中,当扫描中标签在I2中丢失时,双标签扫描逻辑将弹出分子或随后转移到同一分子上的新物理标签配对,这在标签到标签时间数据中产生寄存器移位。这种情况的实例是表S3(图21)中具有寄存器移位扫描信号的事件(vi)。虽然这种复杂性可以在数据中视觉观察到并且可以手动调节,但是接下来寻求开发一种能够检测和自动分析这种寄存器移位的替代方法。

接下来提出的替代方法是基于在时域中基于标签阻断邻近度对齐信号,其目的是使标签对时间的分箱(binning)自动化,特别是在跨扫描分配这种时间中存在较大模糊性的情况下。

在时基信号对齐方法中,首先计算每个标签相对于每次扫描的开始时间的时间位置。为了便于对齐,所述方法必须允许标签事件形状中的潜在的大差异,因此标签分析过程被修改并且基于将模型函数拟合到基于具有高斯函数的盒的卷积的每个峰(SI第10节)。这一模型可以表征字符宽/矩形或窄/高斯样的标签阻断。

为了以系统的方式对齐扫描,所述算法自动地分组标签并去除扫描上的平移偏移。图14c、f显示了对齐事件的实例,标题为“标签对齐过程”的SI部分提供了对所述方法的详细描述。基本上,所述算法通过假设在两次连续扫描之间交换至少两个标签来发挥作用。为了鉴定共享或“公共”标签之一,所述算法通过将一个扫描相对于另一次扫描移位,使两次扫描中的每个潜在标签对对齐。注意,仅应用平移偏移,即,时间尺度没有整体扩张。对于这些可能的测试对齐中的每一个,所述算法基于测试对齐中不同标签对之间的平方和差异计算对齐误差的度量。所述算法将产生最小误差的配对鉴别为真正的公共标签,并实现使该对对齐的平移移位。注意,这一方法产生扫描之间的平移偏移和扫描之间的共享标签的对应表。在组中的所有扫描上迭代地工作,可以将在扫描上观察到的标签分组在一起,并且去除平移偏移。具有最大扫描组的标签组被定义为原点标签,并且每次扫描被移位,因此该原点被设置为零。这一算法为每组单分子扫描输出最终条形码或平均相对标签位置组。

输出的条形码以时间为单位。为了将扫描校准到距离单位,首先使用对应于扫描组的总移位速率。总移位速率计算为在多扫描事件内测量的孔隙到孔隙速率的子集的平均值,其仅使用扫描在两个孔隙中显示保守标签数量的那些速率。然后通过乘以平均孔隙到孔隙速率以距离为单位校准条形码。报告的最终校准标签位置的误差包含速率误差和通过标准传播的分离的误差。注意,平台的锐度表示通过多次扫描的平均获得的精度。特别地,当按尺寸对提取的标签进行分类时,发现数据显示出与图谱中的预期分离相对应的不同的平台。偏离预期间距的分离可能由非特异性结合(例如,在λ-DNA中非特异性存在的随机切口处附着的标签)引起,或由标签阻断分析算法中的缺陷引起的偏移。

在单孔隙工作中,包裹基于PNA的基序(15bp足迹)的亚4nm直径膜基的孔隙已显示100bp的标签间距离分辨率,而基于移液器的孔隙以低至200bp解析。观察到,对于300bp分离的峰得到了很好的解析(例如,图11轨迹中的标签之间的可见空间),并且由于较慢的通过和较高的带宽是可以在此设置中转动的旋钮,因此下限低于300bp应该是可实现的。原则上,应该可以解析比膜厚度间隔适当更远的标签(对于当前芯片为~105bp)。

结论

本发明人开发了一种方法,所述方法首先捕捉并线性化双纳米孔隙装置中的单个长DNA分子,并且然后使用在双纳米孔隙电流感测期间来回移动分子的自动“拉丝”控制逻辑提供多阅读覆盖数据。从双孔隙技术发展的角度来看,本研究的重新扫描方法克服了关键挑战:尽管通过平衡各孔隙处的竞争力可以实现最长的捕捉时间,但是当速率降低时,亚扩散动力学将持续存在,从而破坏了依赖于检测到标签的时间和它们沿DNA的物理位置之间的对应关系的基于定位的方法。在本研究方法中,通过使用允许可靠的标签检测同时足够高以避免宽的移位时间分布的速率,在分子的双向扫描期间避免了亚扩散动力学。基因组缩放有可能超出使用短DNA构建体的实验,并且解决复杂的异质样品(含有从Gbp规模基因组中提取的兆碱基尺寸的片段)。对于基因组缩放,单分子阅读必须具有足够的质量(例如,包含足够低的系统性和随机误差),以使其能够与参考基因组对齐,并从共享基因组区域提取的重叠阅读构建重叠群。这是鉴定由短阅读方法(即,经由NGS)掩盖,并且在一些情况下甚至由长阅读测序掩盖的长程结构变化的唯一方式。所述方法可以应用于具有更复杂标记模式的更长分子,可能使用在靶区域的重复扫描以逐渐探索条形码结构。在表观遗传学的应用背景中,本研究的技术组合了序列特异性标记定位,在此使用相同的化学或每个标签具有低空间足迹的其他纳米孔隙相容的方案,具有甲基化特异性的标签检测。

材料和方法

单-链霉亲和素标记的λDNA试剂的制备

将5μg商业制备的λDNA(New England Biolabs)与0.025U的Nt.BbvC在终体积100μL的1X CutSmart缓冲液(New England Biolabs)中温育以在λDNA中引入序列特异性切口。切刻反应在37℃下温育30分钟。切刻核酸内切酶Nt.BbvC1具有识别序列5’-CC↓TCAGC-3’并且在λDNA中存在7个Nt.BbvC1位点。通过添加5μl的250μm的生物素-11-dUTP(ThermoFisher Scientific)和1.5U的大肠杆菌DNA聚合酶(New England Biolabs),并在37℃下再温育20分钟引发切口平移。通过添加3μl的0.5M EDTA淬灭反应。通过Sephadex G-75旋转柱过滤去除未结合的生物素-11-dUTP。为了产生单-链霉亲和素标记的λDNA复合物,将单-链霉亲和素添加到G-75纯化的生物素标记的DNA中至最终浓度为50nM,并在室温下温育5分钟以使生物素-单-链霉亲和素相互作用至饱和。然后将单-链霉亲和素标记的λDNA复合物直接用于纳米孔隙实验。

双孔隙芯片的制备工艺

先前已经描述了制备方案。简言之,分别在玻璃基材上制备微通道,并在Si基材上制备SiN膜。全绝缘架构使系统电容最小化。从而优化了噪声性能。首先,在8mm×8mm模具中将形状干蚀刻成两个“V”形,1.5μm深的微通道,其中“V”的尖端彼此相距0.4μm。接下来,在Si基材上沉积400nm厚的LPCVD SiN,100nm厚的PECVD SiO2和30nm厚的LPCVD SiN。为了将3层膜堆叠从Si基材转移到玻璃基材,将两个基材阳极接合,其中玻璃上的微通道面向Si上的3层膜堆叠。为了去除Si基材,首先在Si的背面上干蚀刻掉430nm的SiN。然后使用热KOH蚀刻掉Si基材,露出玻璃上的3层膜堆叠。3层膜堆叠提供机械支撑以覆盖玻璃上的微通道,同时其对于纳米孔隙感测来说太厚。因此在纳米孔隙的中心打开窗口。为了实现这一点,在中心通过400nm厚的SiN掩膜将10μm×10μm的窗口干蚀刻到100nm厚的SiO2缓冲层中。然后用氢氟酸蚀刻掉剩余的100nm厚的SiO2层,露出单个35nm厚的SiN膜层。最后,在两个“V”形通道的尖端使用聚焦离子束钻出通过膜的两个纳米孔隙。

纳米孔隙实验

所有纳米孔隙实验在2M的LiCl、10mm的Tris、1mM的EDTA、pH=8.8缓冲液中进行。将两孔隙芯片组装在自制微流体块中,其将缓冲液引至通道1、通道2和中心公共腔室。将Ag/AgCl电极插入缓冲液以施加电压并测量电流。电流和电压信号由Molecular Device Multi-Clamp 700B收集,并由Axon Digidata 1550数字化。在250kHz下对信号取样并在10kHz下过滤。在National Instruments Field Programmable Gate Array(FPGA)PCIe-7851R上构建了标签感测和电压控制模块,并开发了控制逻辑和通过Labview在FPGA上运行。

数据分析

使用Matlab(2018,MathWorks)中编写的自定义代码执行所有数据处理。从FPGA状态信号(SI)中提取每次扫描和事件的开始和结束用于离线分析。在FPGA上的实时标签检测期间,如果任何样品低于基线以下70pA并持续至少12μs,则在控制逻辑中检测到标签的存在。在离线分析期间,对于图4和表1中所报告的分析,每次扫描期间的标签阻断量化如下进行:使用500μs的无事件样品计算开放孔隙基线标准偏差(σ);使用100个无标签阻断样品的平均值确定DNA共捕获基线IDNA;检测标签阻断候选物,其中至少一个样品低于IDNA-6σ,即充分低于DNA共捕获基线;对标签阻断进行定量,其中阻断候选物具有在IDNA以下1σ内返回的样品,并且将标签持续时间计算为半峰全宽(FWHM),其中半峰位于DNA基线以下的最低样品与DNA基线之间的一半。SI第12节中描述了通过最小二乘拟合的替代标签谱表征用于图5中的对齐策略数据。使用FWHM时间转换(边缘)点从上升沿到下降沿计算标签到标签的时间,并且孔隙到孔隙的时间使用入口孔隙处的标签阻断的上升沿到出口孔隙处的相应标签阻断的下降沿计算。通过分配进入标签于一个匹配的离开标签,利用先前未分配的并在10ms的时间限制内的第一离开标签计算孔隙到孔隙时间。分析中的缺失标签产生不正确分配的孔隙到孔隙时间的情况发生在~9%的时间(参见表S3中的标签对和孔隙到孔隙时间计数;图21),并且手动修整。孔隙到孔隙时间被用于在每次扫描的基础上计算孔隙到孔隙的速率(图4、表1、表S3;图21)。V1中的阶跃变化之后I1中的瞬态衰减的补偿是。

补充材料

1.使用λDNA的拔河实验

图16显示了使用λDNA进行的拔河实验的细节。事先用λDNA分子进行拔河实验以校准2孔隙装置。图16a显示了具有图16b中相应的电流轨迹I1和I2的拔河实验的全部步骤。最初用20pM的λDNA填充公共腔室。系统的空闲状态(状态pre-i,0-50ms)被设置为V1=300mV,V2=300mV。一旦在15ms时I1中显示出向下的尖峰,FPGA就测量所述尖峰。如果尖峰跳到基线以下至少70pA并持续至少0.5ms,则系统将其视为完整分子并准备好进入状态pre-ii。否则,系统维持在状态pre-i以准备下一个触发。当标记的λDNA被制备时,可能由在一些DNA片段或游离剩余蛋白引起假阳性尖峰。然后将电压在状态pre-ii(50-70ms)设置V1=0mV以使λDNA分子松弛至其平衡构象。之后,将电压1设定为V1=-200mV,以驱动分子以状态pre-ii回到孔隙1中。注意在状态pre-i出现尖峰30ms后,V1维持在V1=300mV不变。目的是推动分子离开纳米孔隙一段距离。因此,所述分子将不会快速返回以显示在指数衰减基线中,该基线隐藏在约70ms的轴断裂中。因为难以触发漂移基线中的移位。当分子回到孔隙1时,其产生约80ms的向上尖峰(参见插图)。在移位完成之前,在状态i中,V1在0.3ms内关闭,以使λDNA的头部在公共腔室处悬垂,等待被孔隙1捕获,同时维持λDNA的其余部分锚定在孔隙1中。V2在状态i中也增加至500mV以产生较强的力以捕获λDNA的头部。在约165ms时,λDNA分子的头部到达孔隙2,从而产生另一个向下尖峰(参见插图)。然后将V1设定为400mV以将分子的另一端拉向相反的方向,达到拔河状态ii。因为孔隙1中的拉力仍然弱于孔隙2中的拉力,分子仍然滑向孔隙2。在状态iii,分子最后在约215ms时顺序离开孔隙1和孔隙2。然后系统回到空闲状态i进入另一次循环。I2基线没有回到状态i中的原始值,这是由两个孔隙之间的串扰引起的。I1在每次改变其值之后每次显示出巨大的尖峰和指数衰减基线,这是由芯片的电容引起的。添加三个状态pre-i、pre-ii和pre-ii提供了两个优点。首先,与在通道1中填充试剂相比,在公共腔室中填充试剂节省了将试剂泵送通过通道的一个步骤,这使得我们能够更有效地交换不同的试剂。其次,在pre-i状态中的单孔隙移位筛选出短片段。拔河实验在状态i、ii和ii中进行,分子在状态pre-i中显示出足够长的持续时间,这提高了抓取完整分子的效率。

如在正文中所述的,拔河持续时间被定义为在状态ii所花费的时间。V2在状态ii中维持在V2=500mV不变,并调节V1以测量持续时间。图16c显示了具有误差棒的平均持续时间。持续时间(ms)相对V1(mV)显示钟形曲线。在平衡电压V1=500mV时,持续时间达到其最大值110ms,而在不平衡电压时,持续时间显示出小一个数量级的值。

因为当来自孔隙1和孔隙2的净力较大时,分子移动较快。单孔隙持续时间也在状态pre-i中测量,并在灰色区域绘制其平均持续时间,3.4ms,这说明与拔河相比,相同的分子在单孔隙移位中显示出短超过一个数量级的持续时间。考虑到状态ii是过程中最关键的状态,电流轨迹对通常在该状态下显示。图16d显示了在V1=200mV、V2=500mV的电压设置下λDNA的事件实例。

2.多扫描实验的FPGA逻辑

图17显示了多扫描实验的FPGA逻辑。图17a显示了正文图2a中的事件的最后循环的I2的信号和FPGA状态。I1在这里被隐藏,因为FPGA仅触发I2中的尖峰。在研究设计中,孔隙2用作传感器,而孔隙1用作控制器。FPGA状态是FPGA报告的整数,以显示其内部状态。图17b显示了FPGA逻辑流程。所述流程旨在控制两个主要状态之间的系统切换:当分子从左到右移动时,L到R(8),和当分子从右到左移动时,R到L(15)。尖峰中(In Spike)(16)、延迟(16)和维持(18)是过渡状态。FPGA将基线计算为多达10ms的I2平均值,而尖峰中(16)期间的I2样品被排除。一旦主要状态(8或15)改变,FPGA刷新基线值。I标签和I事件是与基线相比触发尖峰和事件结束的相对值。系统在637ms至642ms期间处于状态15。I2在638ms跳到I标签以下,从而当系统开始计数持续时间时触发系统进入状态16。一旦I2跳回到I标签以上,系统就切换回状态15。如果标签持续时间在用户设置的最小值(7μs)和最大值(2ms)之间,则内部标签计数增加1。当标签计数再增加1时,类似的过程发生在641ms。一旦标签计数增加超过用户输入N(在本实验中设置为N=2),系统就进入切换到另一个主要状态(8)的过程。为了避免尖峰在状态切换后太快显现,设计延迟状态17用于延迟1.5ms以推动最后的标签进一步移动离开纳米孔隙,这在642ms和652ms中示出。系统一切换主要状态,标签计数器就被重置为0,以准备新的触发。注意,当在切换电压之后立即禁用触发时,存在另一个0.5ms长的维持状态(18),该切换电压在信号中为约643ms和654ms。因为系统需要时间来计算基线值。作为结果,系统丢失了654ms中的尖峰。因此,即使在两个标签已经显现之后,标签计数器也没有达到N。结果,I2最终在661ms时跳到I事件以上,这表明分子离开孔隙2。然后事件结束。

3.多扫描实验中最后循环的总结

正文中的图2d显示了系统以p=0.89的概率捕获扫描,这是相当高的。尽管研究最后的循环以找出分子逃离多扫描的原因。图18显示了包含第(n-1)次和第n次扫描的最后循环的FPGA状态和I2的信号。

图18A显示了第n次扫描中丢失的标签。FPGA在维持(18)状态计算基线。因为当V1由于串扰而改变时基线改变其值。在状态18期间出现的任何尖峰将不会被检测到。丢失该标签,标签计数器不能达到用户设定值N。因此,系统不会触发切换主要状态以继续多扫描。分子在11ms时离开孔隙。

图18b显示了当FPGA在第(n-1)次扫描中检测到假阳性时的另一种情况。1.8ms附近的微小尖峰可能是由在一些游离蛋白而不是沿DNA的真正标签引起的。因此,系统在第(n-1)个状态切换主要状态而不达到标签计数N=2。结果,在第n个状态中将没有第二标签触发。分子在12.5ms离开孔隙。

图18c显示了第n次扫描中的假阴性尖峰。有时,标签卡在孔隙中并产生长的尖峰。一旦其持续时间超过设置中的最大值(2ms)。FPGA不会将其读数为有效的一。如果不能转换到另一主要状态,分子在约15ms时离开。

图18d显示了在FPGA切换到另一主要状态之前,分子在延迟(17)状态离开孔隙。在FPGA在6ms切换到另一主要状态之前,分子在约5.5ms离开孔隙。

设置经验值以优化系统,从而最大化每个事件中扫描的总计数。尖峰持续时间设定为最小7μs和最大2ms,延迟1.5ms并且维持0.5ms。图18d中,状态17中的过长延迟时间将导致更多失败情况,而短延迟时间将导致图18a中的更多失败情况。因为如果标签太接近孔隙,标签往往过快地被驱回。在状态18中太长的维持时间导致图18a中更多的失败情况,而太短的维持时间增加了基线值的计算。错误的基线值将导致更多的假阳性或阴性尖峰检测,这增加了图18b和图18c中的失败情况。

4.具有三标签触发的多扫描实验

图19显示了具有三标签触发的实验。图19a显示了来自6循环事件的信号轨迹。图19b显示了第二循环的放大信号。图19c显示了每事件的扫描计数的分布。

5.标签位置图谱

对于标签位置图谱,切口位点位置是沿着λDNA。NbBbvCI切口酶定位“CCTCA↑GC”的序列并切割一条链。然后生物素化的dNTP结合切口位点。因此,认为单-链霉抗亲和素标签位于切口位点。任何两个结合位点之间的距离从短到长为:d 45为301bp:102nm,d 23为323bp:110nm,d 56为614bp:209nm,d 46为915bp:311nm,d 67为3982bp:1354nm,d 57为4596bp:1563nm,d 47为4897bp:1665nm,d 12为10135bp:3446nm,d 13为10458bp:3556nm,d 34为12451bp:4233nm,d 35为12752bp:4336nm,d 24为12774bp:4343nm,d 25为13075bp:4446nm,d 36为13366bp:4544nm,d 26为13689bp:4654nm,d 37为17348bp:5898nm,d 27为17671bp:6008nm,d 14为22909bp:7789nm,d 15为23210bp:7891nm,d 16为23824bp:8100nm,d 17为27806bp:9454nm。

发现了沿着λDNA的切口序列。了解两个相邻位点之间的碱基对距离。使用0.34nm/bp计算标签之间的距离。

6.通过最小二乘拟合的标签分布表征

在本节中,描述了使用模型标签阻断分布的最小二乘拟合来获得峰值位置和半峰宽的研究方法。首先,原始多扫描事件被分解为所有成分L到R和R到L扫描。然后,倒转数据(通过逆转电流值的符号),并使用Matlab的findpeaks算法来鉴别对应于单个标签阻断的局部最大值。对于孔隙1(L到R极性的入口孔隙),在扫描终止时电压改变以实现方向逆转,从而在电流中引起电容瞬变。这些瞬态xacare拟合指数模型。注意,在拟合瞬态之前,去除每个鉴别标签周围400μs的固定区域,以确保标签阻断不干扰背景拟合。去除孔隙1通道的拟合的瞬时背景,然后将每个标签阻断拟合到模型分布。虽然大部分瞬变被去除,但是在扫描开始的约1ms内存在小的残留,因为指数不是精确的模型。不存在将该残留误认为标签阻断的风险,因为其对应于基线以上的电流增加并且对于每次重新扫描都发生在相同的位置。

该模型分布具有以下函数形式:

该形式基于宽度Δt和高度I0的盒与宽度σ的归一化高斯的卷积。在Δt>>σ的限制下,该模型具有一个加宽盒的形式;在Δt<<σ的限制下,其具有高斯函数的形式。为了标签-分布表征的目的,该模型具有的优点是,它可以描述具有加宽的盒形状的长持续时间的标签通过和具有更高峰形状的快速标签通过。半峰宽可以作为Δt和σ的函数获得(在Δt>>σ的限制中,宽度是Δt,在σ<<Δt的限制中,宽度是高斯函数的宽度,在中间情况下,半峰宽作为Δt/σ的函数进行数值计算,然后使用插值从Δt和σ的任意组合获得宽度)。此外,发现如果添加线性函数以考虑未被指数拟合捕获的任何残余背景变化,则拟合更稳健。在实践中,这种拟合是使用Matlab的Isqcurvefit对每个标签在以findpeaks鉴别的初步标签位置的定位为中心的固定持续时间的范围(通常~0.5-1ms)内执行的。确定线性背景的参数(Ib1和Ib2)是通过在标签中心区间的开始和结束处将平均超过60μs的背景来确定的(在背景平坦的情况下,注意Ib2≈0)。对于孔隙2(L到R上的出口孔隙),应用相同的程序,除了不需要去除电容瞬态,因为孔隙2处的电压维持恒定。注意,所述模型可以适应标签阻断的峰值高斯形状和阻断的较平坦的盒状形状。

7.标签对齐过程

这里描述了标签对齐算法的细节。每个连续扫描代表在分子的某一区域上的标签的基础结合模式的测量。在每个固定极性系列(即L到R或R到L)中的扫描具有相对平移偏移,这是由于在每次扫描中观察分子的不同部分的事实导致的。标签位置也存在由布朗波动引起的随机变化(参见图16a、16e,这些事件对应于原稿图5中所示的结果)。这些效应使标签在多次扫描中的正确关联变得复杂(即如何确保扫描i中观察到的标签对应于扫描j中的相同标签,“相同”意味着标签对应于相同序列位置处的单个标签?)。该算法的目的是通过在连续扫描之间鉴定正确的相应标签对,然后去除扫描对之间的平移偏移,来引入用于在给定系列(孔隙1或孔隙2的L到R或R到L)中对齐扫描的系统过程。

所述算法的核心是函数pairalign,其基于给定扫描组中第i次和第j次扫描之间的平方差计算对齐误差的度量。该函数假设在第i次和第j次扫描之间至少两个标签是共享的或“公共的”。为了证明该假设对于多扫描数据是有效的,可以计算和比较每次扫描中的标签之间的间隔。所观察到的典型情况是每次扫描中的间隔围绕固定平均值波动的情况(见图20b),或者偶尔观察到两个平均间隔值的双峰情况(见图20f)。在双峰情况下,间隔通常在观察到三个标签的扫描处交换。因此,假设在连续扫描对(扫描i和j=i-1)之间存在两个公共标签是合理的。

为了鉴别扫描对中的公共标签,pairalign计算在两次扫描的所有潜在对齐上的对齐误差的量度。通过在扫描i和j之间选择标签对,然后以正确的时间间隔移位扫描I以使这一选择的标签对对齐(该标签对称为“对齐对”),来确定这些潜在的或测试对齐中的每一个。然后,省略对齐对,计算对于可在扫描之间形成的所有可能的标签对的平方距离。通过平方差对这些可能配对的列表进行排序,并获得具有最小平方差的不同配对(注意,不同配对的数量等于min(n标签,i,n标签,j),其中n标签,i是第i次扫描上的标签数量,和n标签,j是第j次扫描上的标签数量)。对于给定的对齐对选择,总的对齐误差是具有最小平方差的这些不同配对的平方差之和。作为两次扫描之间正确的公共标签的对齐对是产生最小总对齐误差的对齐对。作为鉴定扫描中标签之间的一组配对的过程的结果,可以在扫描i和扫描j中的标签之间构建对应表,以产生在扫描之间共享的所有公共标签对。蓝色圆圈是仅观察到两个标签的扫描的间隔(其仅有一个间隔)。当观察到三个标签时,红色正方形和品红色三角形代表两个不同的最近邻间隔。(g)对齐标签位置;数据颜色和形状方案的意义与(e)相同。(h)对齐和距离校准标签位置:数据颜色和形状方案现在反映了组分配并且对应于真实物理标签(标签A,蓝色圆圈;标签B,红色正方形和标签C,品红色三角形)。黑色圆圈是对应于标签A、B和C的最终平均标签位置。注意,第一次扫描对应于误差超过阈值的对齐,并且从平均标签位置的计算中去除(由叉号表示)。

在扫描组中的连续扫描对之间应用Pairalign。反复应用的对应表使得能够将每次扫描中观察到的标签关联到与分子上存在的真实物理标签相对应的组中(图20d、20h)。组的初始数量对应于第一次扫描中标签的数量。如果扫描i比扫描j具有更多的标签,则引入新的组。

当扫描只有一个标签时出现问题。如果扫描i具有一个标签,则选择j=i-1中的公共标签作为与扫描i中的一个标签间隔最小的标签。如果扫描j=i-1仅具有一个标签,则算法试图使第i次扫描与第i-2次扫描对齐。另一个问题是对应于不同组的标签可能被无意地关联在一起,特别是如果在与组接界的扫描中丢失了第三标签。代码试图以下述方式防止这种情况。如果第i次和第i-1次扫描的总对齐误差大于预设阈值,但是与连续标签的对齐低于阈值,则这表示被不正确地分组在一起的两个不同标签组之间的连接。代码将检查第i次扫描和第i-1次扫描之前的扫描之间的对齐,其产生大的对齐误差。假设所有还产生超过阈值的误差的对齐属于不同的组,并分配新的组号。通过将扫描与所有其他扫描相关联,进一步检查仅对应于一次扫描的组;如果发现对齐产生低于阈值的误差,则合并这些组(例如图20h中的扫描15)。如果单个超阈值扫描不能与另外的扫描相关联,即是仅对应于一次扫描的组,则将其作为异常值从分析中去除(一个实例是图20h中所示的事件的第一次扫描)。此时,最大的组被定义为原点标签。将所有扫描移位使原点标签为零所需的量。对于不包含原点标签的扫描i,所述扫描通过公共标签对与包含原点标签的扫描j相关联。然后移位扫描I以将公共标签带到与扫描j中相同的位置。该步骤消除了残余平移偏移。最后,通过将属于给定组的所有标签测量一起平均来构建最终的单分子条形码(图20d、20h)。给定标签位置的误差可以作为所述组平均值的标准偏差获得。

孔隙到孔隙速率变异系数(CV,其等于标准偏差除以平均值)提供了可用于评估距离估计有多可靠的度量,因为它是扫描与扫描之间运动非均匀性的度量。对于事件(i)(也是正文表1中的事件(i)),孔隙到孔隙速率CV对于L到R扫描高达83%,对于R到L扫描更合理地为20%。如在正文的图3中所述的,对于事件(i),在I2中仅有较短的标签-对距离估计可用,因此仅使用来自I1的数据对第二较长的标签对间隔(图3中的B-C)进行平均并在表S3中报告。

来自9个多扫描事件的标签到标签分离统计

表S3显示了9个不同多扫描事件的数据,其中5个在正文中总结为表1(独特的循环数显示了对应性)。观察到更多的数据可以来自一个孔隙而不是另一个孔隙,或者可以在两个孔隙的体积中平衡。两个扫描方向之一也将产生比另一个更多的数据,并且这表现为依赖于装置和/或依赖于电压设置。通过孔隙2数据的实例,(iii)和(iv)来自一个实验,该试验产生的L到R的数据多于R到L的数据,而(viii)和(ix)来自另一个实验,该试验产生的R到L的数据多于L到R的数据。

孔隙到孔隙速率变异系数(CV,等于标准偏差除以平均值)提供了可用于评估距离估计有多可靠的度量,因为它是扫描与扫描之间的运动非均匀性的度量。对于事件(i)(也是正文表1中的事件(i)),孔隙到孔隙速率CV对于L到R扫描高达83%,对于R到L扫描更合理地为20%。如在图3的正文中所描述的,对于事件(i),在I2中仅有较短的标签对距离估计可用,因此仅使用来自I1的数据对第二较长的标签对间隔(图3中的B-C)进行平均并在表S3中报告。

实施例2:用于分子的图谱生成的自动搜索和监测

DNA甲基化对于哺乳动物的发育和疾病至关重要。事实上,DNA甲基化的失调几乎是所有癌症类型的明确特征。最常见的甲基化是在胞嘧啶的第五个碳上(5-甲基胞嘧啶(5mC)),并且在真核生物中主要在对称CpG二核苷酸的情况下发现。虽然哺乳动物的CpG二核苷酸比其基因组的核苷酸组成所预期的少约5倍,但70-80%的CpG被甲基化。在CpG处的5mC修饰与转录抑制相关,并且已经涉及基因组印记和X-染色体失活的表观遗传现象。修饰5-羟甲基胞嘧啶(5hmC),频率仅次于5mC,在细胞分化、发育、老化和神经障碍中发挥重要作用,并且5hmC的全基因组谱在患有癌症的成年患者中提供强有力的诊断生物标志物。

虽然5mC和5hmC在理解发育和疾病中的重要性已被充分认识,但在许多情况下,这些表观遗传修饰所起的精确作用尚未完全理解。标准工具(NGS,微阵列)不足以检测甲基化中的长程变化,并且时间解析DNA甲基化分析在成本和时间上具有实验挑战性。感兴趣的时间解析过程包含:复制依赖性甲基化变化,时间解析的有丝分裂和减数分裂DNA甲基化事件,由化学暴露诱导的DNA变化,以及与转录和核小体组装和重塑相关的甲基化和去甲基化速率和过程。需要新的工具通过跟踪甲基化状态及其在DNA中的位置以单分子分辨率有效和全面地监测DNA甲基化和去甲基化的动态过程。

本公开所述的双孔隙方法可在>10X缩短的时间内对较长阅读(Mb)进行全基因组和多重甲基化分析。时间减少是预期的,部分地由于双孔隙可以通过去除通过每个碱基的棘轮的负荷而产生显著更高的每个纳米孔隙的甲基位点能量。具体地,1kb的1D纳米孔隙测序阅读将包含多达100个CpG调用并花费~2秒(中值~450碱基/秒),而双孔隙产生50kb的100+阅读,其在小于2秒内包含高达500CpG调用(初步数据)。时间减少也是可能的,因为双孔隙数据计算要求低于纳米孔隙序列组装,如在“5mC和5hmC标记方法作为在双孔隙仪器上使用模型试剂的单重测定”方法中所讨论的。注意,100bp分辨率是使用30nm长度孔隙的副产物,并且探索了较薄的膜(例如,对于~30bp分辨率为10nm)以推动空间分辨率限制,对当前制备工艺进行适度调节。最后,单个分子到分子差异可以通过多阅读双孔隙方法进行解卷积,而蛋白-孔隙测序限于1D阅读,因此在~10bp分辨率下产生一组分子的平均CpG调用。纳米通道中长片段(>100kb)的光学定位是非测序方法,其分析基序(GCTCTTC)用于基因组定位,主要用于通过组装产生的支架重叠群和发现大的(>500bp)结构变体和倒位。未甲基化的CpG同时使用次级荧光报道分子测定。尽管高通量(100X覆盖范围下3.2Gb/12小时),但商业价格高($5k/轮)且CpG分辨率低(1调用/kb)。本公开描述的100bp分辨率落在~10bp(纳米孔隙测序)至~1kb(光学定位)分辨率之间,其分别提供了有价值的表观遗传学见解。因此,在长DNA中以~100bp的分辨率实现高精度CpG调用提供了一种可实现的表观遗传学研究工具。

本公开描述的仪器包含以下特征:

1.5mC和5hmC的多路复用分析;

2.在长DNA阅读(100kb至2Mb)中以100bp分辨率定位CpG的甲基化状态;

3.单分子内CpG状态调用(>90%)和位置定位(10%误差)的高精度;

4.高通量和成本有效-在4小时内靶向50X单倍体基因组覆盖率。

所述技术能够实现单分子控制和多阅读感测,并且已经应用于50-150kb DNA,且已经显示了序列特异性蛋白标签在DNA上的准确定位。初步数据显示,在48kb DNA的双孔隙扫描过程中可检测到5mC结合蛋白,并且可差异检测到50kDa蛋白和150kDa抗体,表明多路复用的途径。使用条形码标记既可以鉴别DNA分子又可以定位CpG-调用位点在异质样品中的相对位置。

双孔隙方法提供了在单个长DNA分子中以无比的准确度报告粗略的甲基化状态和位置。双孔隙法的准确度使能特征是,通过使用实时反馈控制逻辑,每个分子可以根据需要进行多次电扫描,以达到所需的准确度水平(初步数据)。使得能够达到全局情况是重要的:在单个、连续的Mb-长度DNA分子中可以获得高达10,000CpG。另外,通过利用基于硅的制备流程工艺,所述装置可以以晶圆等级和廉价地大批量生产,其包含50个双孔隙阵列。

目的:使用模型可甲基化序列,建立可以用仪器缩放的5mC和5hmC蛋白结合测定,并根据分子的分数(±CI)和使用双孔隙技术正确标记、检测和定位的每个分子的位点建立测定效率和性能。

背景:固态纳米孔隙是在膜中形成的纳米级孔。经过在电场下的孔隙的DNA在跨孔隙离子电流中产生瞬时阻断,其包含关于分子的化学和构象状态的信息。由于其较大的尺寸,固态孔隙可以靶向比蛋白孔隙更多样化的分析物池。

初步数据:双纳米孔隙平台通过实现以所需的准确度对每个分子重新扫描,以增强特征的定位解决了单纳米孔隙技术的局限性。双孔隙平台的特征在于全绝缘体、基于光刻的构造,其具有直径为20nm且间隔开500nm的两个固态纳米孔隙,并且具有在各孔隙处独立的电压-力偏置和电流感测的能力。使用该平台证明了λ-DNA的双孔隙捕获。现场可编程门阵列(FPGA)执行主动控制逻辑以在75%的捕获DNA分子上形成拔河线性化。主动逻辑控制扩展用于双向“重新扫描”控制(图9)。在该方法中,λ-DNA用结合在Nt.BbvC1切口核酸内切酶的切口位点处的单-链霉亲和素(MS)蛋白标签进行标记。然后标记的λ-DNA在拔河状态下被双捕获。蛋白标签产生在dsDNA阻断水平的显著的阻断“尖峰”。FPGA实现双向控制,其对通过孔隙2的一定数量的可检测标签进行计数(通过电流I2),然后通过在感测期间改变净力偏置(通过电压V1改变)来触发DNA方向的改变。在图9b中,当在I2中检测到2个标签时发生方向变化。对于不同的标签检测数量和间距,显示了100s的这种多扫描。

通过将平均标签到标签时间乘以平均标签速率来实现标签到标签距离的定位,所述平均标签速率通过将孔隙之间的已知距离除以从孔隙到孔隙的标签飞行时间计算。基因组距离预测与该模型系统的预期标签间距非常一致,其包含(301bp、323bp、614bp、915bp),发散在5kb或1.6μm以上明显地增长。

合成一组模型试剂。(a)建立了包含TERT基因的启动子区域的200bp模型,其位于具有21个CpG的外显子1的ATG上游,以探索与癌发生相关的CpG间距。创建了一个未甲基化版本和四个甲基化版本:(i)仅间隔~100bp的3个CpG为5mC;(ii)所有CpG为5mC;(iii-iv)与(i,ii)相同,但用5hmC代替5mC。(b)将每个200bp变体在两个末端与20kb非甲基化DNA片段连接(总共40.2kb),在200bp模型的两端外侧500bp具有对称的可检测序列-地标(地标之间1.2kb)。

度量:模型200bp序列和甲基化变体可商业订购(IDT)。通过凝胶电泳和纳米孔隙分析评价连接产物,目标产率为95%。

模型寡核苷酸合成、双链体形成和评价。含有合适的位点特异性5mC或5hmC的互补200bp寡核苷酸在用于合成模型的每个合适的CpG上化学合成,具有5’磷酸基团以制备它们用于连接。

评估退火DNA寡核苷酸通过甲基化敏感限制性酶HpaII的切割,其与Msp1不同,对甲基化状态敏感。使用M.ssp1甲基化酶转移酶产生在CpG位点含有5mC甲基化的λ-DNA。结果显示作为甲基化反应时间的函数,甲基化的λDNA难以被HpaII切割(图15a)。

长DNA双孔隙甲基化构建体的产生。通过加热至95℃,然后冷却至25℃持续20分钟,对每个模型使互补寡核苷酸退火。使用Klenow聚合酶和dATP对寡核苷酸进行A-加尾。用限制性酶制备平端的λDNA片段,该酶仅切割λ一次并留下平端。SnaB1、Nae1和Sfo1产生适于T-加尾的平端片段。使用末端转移酶和ddTTP对SnaB1片段进行T-加尾。然后使用T4 DNA连接酶在12℃下12-18小时将退火的和加尾的寡核苷酸双链体连接至20kb片段。

结果和评估。仅互补T-A克隆末端将产生全长分子(40.2kb)。连接期后全长分子的量将指示效率。如果效率太低,可以采用使用逆转录酶加尾方法的替代连接策略。使用凝胶电泳评估效率,目标是95%产率。单纳米孔隙可用于评估DNA长度,单分子事件持续时间对于40kb vs 20kb明显地加倍。

5mC和5hmC标记方法作为在双孔隙仪器上使用模型试剂的单重测定(4-10个月)。(a)使用不同尺寸的结合蛋白和抗体以建立每个基序的纳米孔隙可区分检测能力。(b)在双孔隙探询期间使用序列地标触发内部200bp可甲基化区域的重新扫描。

度量:通过凝胶电泳评估200bp模型的甲基结合,并且应超过90%产率。重复双孔隙数据(每个试剂组>10次实验)证明用至少10次扫描探询75%的分子,并以95%CI匹配确认甲基化状态;双孔隙定位性能达到10%平均相对位置误差/分子。5mC和5hmC与结合蛋白相互作用的生物化学测定。为了证实抗体和蛋白质的稳定和高度特异性结合,使用200bp模型片段进行电泳迁移率变动分析(EMSA)。使用天然聚丙烯酰胺凝胶进行和评估双链寡核苷酸的结合蛋白滴定。使用South-Western技术证实了连接模型中的甲基化。在该技术中,将DNA转移到尼龙膜上,随后用对5mC或5hmC特异性的抗体探测。

初步数据:检测5mC抗体和蛋白质结合的双孔隙实验。作为基于抗体的5mC检测的概念验证,将甲基化的λDNA与可商购的多克隆抗体(Thermo Fisher Scientific PA1-30675)一起温育。抗体以低化学计量(1μl的1:50,000稀释)与DNA结合,以确保与甲基化DNA的低结合频率。在双孔隙拔河和重新扫描实验中直接测试结合反应(图15b-c),结果55%的DNA具有1个或多个可检测的抗体标签,并且10%具有4个或更多个标签。这些结果证明,在双孔隙重新扫描探询过程中,抗体标签稳定地结合到含有5mC的DNA上。预期抗5mC和5hmC的单克隆抗体比所测试的多克隆抗体表现更好。为了测试纳米孔隙可区分检测能力的潜力,选择MeCP2甲基结合蛋白,这是因为它比抗体(150kDa)小(50kDa)。单孔隙研究表明,当与DNA分子结合时,可以检测到这种尺寸差异,而其它已经测试了与短DNA中甲基化CpG二核苷酸结合的MeCP2。在概念验证中,甲基化DNA与MeCP2蛋白(1:50化学计量)结合并在双孔隙装置上测试。结果(图15b-c)确信MeCP2具有可分辨的电子印记,其与作为类似尺寸的蛋白质的MS相当,并证明与DNA上的甲基化CpG结合的不同尺寸的蛋白质可以在双孔隙探询过程中电子检测。

双孔隙方法:

使用已知程序制备装置。30nm厚的氮化物膜设置了空间感测足迹(~100bp),并且FIB研磨产生了~20nm直径的纳米孔隙。

将双孔隙芯片安装在3D打印流通池中,进入端口通过O形密封圈与芯片连接。双通道电压钳放大器(MultiClamp 700B,Molecular Devices)施加跨膜电压并测量离子电流(过滤器设置在30kHz)。数字转换器(Digidata 1440A,Molecular Devices)以250kHz采样数据,并且放大器通过Labview(NIPCIe-7851)中编程描述的控制方案接口到FPGA。

使用化学标记将5hmC与5mC电子区分。T4噬菌体酶T4葡糖基转移酶催化葡萄糖部分从尿苷二磷酸葡萄糖(UDPG)转移到DNA中存在的5-hmC以形成葡糖基-5-羟甲基胞嘧啶(葡糖基-5-hmC)。该酶不修饰胞嘧啶或5-mC,因此代表特异性检测5hmC的方法。使用两步标记方法,其中将含有叠氮部分的尿苷类似物(尿苷二磷酸-6-叠氮葡萄糖)转移至5hmC的羟基(点击化学)。利用这一方法,可以连接含有烯烃的电子可检测部分,例如蛋白、聚乙二醇(PEG)和寡核苷酸。使用该标记方案,开发了不同于5mC标记位点的用于5hmC的电子可检测标签。

数据分析方法:开发了用于抗体相对蛋白以及与DNA结合时不同尺寸的PEG结构的差异检测算法。利用主成分分析和支持向量机以可缩放的方式自动化基于训练数据和概率模型的纳米孔隙事件印记的分类。这些方法用于自动分类5mC标记状态和5hmC标记状态。

“5mC和5hmC标记方法作为在双孔隙仪器上使用模型试剂的单重测定”的实验产生了用于模型构建的必要训练数据,以及用于测试所述方法性能的交叉验证集。性能度量包括:模型准确性、分子调用的假阳性/假阴性、每个分子正确调用的CpG分数以及CpG距离/定位预测性能。在单重形式中,双孔隙Yes/No CpG-状态调用仅寻找基线移位,所述移位表示在100bp感测足迹内存在与甲基化CpG位点结合的蛋白。在多路复用形式中,算法用于差异检测。当200bp模型是以100bp间隔进行CpG甲基化时,预期数据是用于分析的其最简单的形式。因为标签相隔100bp而不是300bp,所以三联体标签阻断将显得更密集。确保这些阻断维持可分辨(即,作为3个不同的向下尖峰)的方法具有两部分:1)使用较高的带宽(图4示出10kHz,以及30kHz)用于纳米孔隙信号中较快的时间响应-这将给出较快的上升/下降响应;和2)如[18-19]中所述的使用拔河电压减慢DNA速率下降-当电压达到力平衡时,DNA运动变得更加随机并且分子减慢至1000X。使用低于力平衡值的电压确保DNA运动方向均匀(即,避免运动抖动),但足够接近该值以确保3个标签模型试剂的清晰CpG标签阻断分辨率。在相同的实验中,在鉴别电压以解析3个CpG标签模型后,将探索完全甲基化的模型(200bp上21个CpG,图3)。这些将产生CpG-标签分布的(限定)排列的分布,这与CpG标签相距100bp的三标签对照模型不同。具体地,间隔小于~100bp的2个标签将同时存在于纳米孔隙中,假定纳米孔隙长度为30nm。为了解析标签密度和标签间距离,利用机器学习算法对得到的化合物信号进行分类。然而,该目的的成功不依赖于这种解卷积。该实施例的目的是正确地调用100bp“片段”大小内的5mC和差异地调用5hmC CpG位点。也可以从完全甲基化的数据中挖掘更精细的特征,这由双孔隙重新扫描功能的多阅读特征来获得。

结果和评估。初步数据证明检测到与5mC结合的抗体,并为使用针对Aim1中概述的200bp TERT启动子模型中存在的目标5mC和5hmC位点的抗体的建议策略提供了充分的信心。通常,较大的结合分子将产生较大的信号,而较小的结合分子(结合的或化学连接的)将产生较小的和不同的信号。特定“5mC和5hmC标记方法作为在双孔隙仪器上使用模型试剂的单重测定”的主要预期结果是1)用于将电子可检测标签附接到5mC和5hmC的生物化学方法,和2)产生区分5mC和5hmC的电子印记的标签(虽然在不同分子中)。

使用双孔隙仪器同时进行5mC和5hmC检测和定位。检查了5mC:5hmC阳性试剂的等量(1:1)和有限(9:1)混合物,并且具有未甲基化背景。度量:重复双孔隙数据(每个试剂组>10次实验)应匹配各试剂的比例确认的甲基化状态和比率,其中以95%CI在重复中具有2%的平均绝对调用误差(例如,50%的未甲基化、5%的5hmC、45%的5mC混合物=48-52%的未甲基化、3-7%的5hmC、43-47%的5mC),同时重演了“5mC和5hmC标记方法作为在双孔隙仪器上使用模型试剂的单重测定”对每个分子进行10次或多次扫描的定位性能。在长DNA分子上5mC和5hmC的双孔隙区分。在具体的“使用双孔隙仪器同时进行5mC和5hmC检测和定位”中,建立了以单分子精度检测5mC和5hmC的多路复用测定的基础。最初测试模型基质的1:1混合物,其使用电子不同标签对5mC或5hmC进行标记,间隔为~100bp(先前描述的“合成一组模型试剂”)。在5mC背景中5hmC的相对检测。在人类基因组中,约4%的胞嘧啶被甲基化,并且这些中的大多数存在于CG二核苷酸序列处。相反,5hmC的存在低一个数量级。通过以1:5、1:10和1:100稀释度将5hmC标记的DNA连续稀释到5mC标记的DNA中来模拟这种分布。在双纳米孔隙装置上测量该混合物,并利用逻辑将5hmC相对5mC的分数预测与已知的定量比较。

结果和评估。清楚鉴别使用5mC标记的分子群体和使用5hmC标记的分子群体。

开发了(I)具有阵列双孔隙功能性的原型芯片、外壳和仪器,以及分子条形码方案,以从混合物中鉴别长DNA用于较高通量分析;(II)单分子内5mC和5hmC的增强的多路复用分析;和(III)探索有效的概率甲基化分配的算法,其目的是实现更高水平的准确度。仪器特征#4在4小时内实现了靶向50X单倍体基因组覆盖率。就覆盖率和时间而言,每双孔隙每2秒外推100X/50kb,并考虑每10秒捕获新分子,即在64分钟内以100X的3.2Gb。

虽然已经参考本发明的特定实施方案描述了本发明,但是本领域技术人员应理解,在不脱离本发明的真实精神和范围的情况下,可以进行各种改变并且可以替换等同物。此外,可以进行许多修改以使特定情况、材料、物质组成、工艺、工艺步骤或步骤适应本发明的目的、精神和范围。所有这些修改都在所附权利要求的范围内。

当前第1页1 2 
猜你喜欢
网友询问留言