分析病毒核酸的方法与流程

文档序号:22766622发布日期:2020-10-31 11:39阅读:516来源:国知局
分析病毒核酸的方法与流程
交叉引用本申请要求于2018年1月12日提交的美国临时申请号62/617,079和于2018年8月13日提交的美国临时申请号62/718,290的优先权,其全部内容通过引用并入本文。发明背景鼻咽癌(npc)是中国南部和东南亚最常见的癌症之一(tang等人.cancerlett2016;374:22-30)。npc的发病机制可能与eb病毒(ebv)感染密切相关。在流行地区,几乎所有患者的npc癌细胞中都可以检测到ebv基因组。血浆中的循环无细胞ebvdna可以作为npc的生物标志物(lo等人.cancerres1999;59:1188-91)。血浆ebvdna分析可用于npc的检测、监测和预测。然而,样品中ebv无细胞dna(cfdna)的量可能会根据各种与受试者相关的因素(例如,当前的吸烟习惯)和与受试者无关的因素(例如,环境温度)而变化。需要可以考虑影响ebvcfdna水平的因素并且可以将该信息纳入对npc存在的筛查中以减少npc检测的假阳性率的改进的方法、系统和计算机可读介质。技术实现要素:本文公开了一种筛查受试者中肿瘤存在的方法,所述方法包括:a)确定来自所述受试者的生物样品中来自病毒的无细胞核酸的量;b)基于选自受试者年龄、受试者吸烟状态和环境温度的属性确定无细胞核酸的阈值;以及c)将来自所述病毒的无细胞核酸的量与所述阈值进行比较,从而筛查所述受试者的肿瘤。所述阈值可基于所述受试者的吸烟状态确定。如果所述受试者的吸烟状态是吸烟者,则可将所述阈值设置成高于如果所述受试者的吸烟状态不是吸烟者的阈值。所述阈值可基于所述受试者的年龄确定。所述阈值可包括与受试者年龄的正相关。所述阈值可基于环境温度确定。所述阈值可与环境温度负相关。所述环境温度可以是在从所述受试者获取所述样品的位置的50km以内的位置处测量的温度。所述环境温度可以是从所述受试者获取所述样品的当天的平均环境温度。所述阈值可以是基于所述受试者的年龄和所述受试者的吸烟状态确定的。所述阈值可以是基于所述受试者的年龄和环境温度确定的。所述阈值可以是基于所述受试者的吸烟状态和环境温度确定的。所述阈值可以是基于所述受试者的年龄、所述受试者的吸烟状态和环境温度确定的。在一些实施方案中,所述阈值不是基于所述受试者是否患有糖尿病、饮酒、运动、患有高血压、患有高脂血症或患有缺血性心脏病确定的。相对于将无细胞核酸的量与不基于所述属性的阈值进行比较,将来自所述病毒的无细胞核酸的量与基于所述属性的所述阈值进行比较可降低所述筛查的假阳性率。所述量可包括每毫升中来自所述病毒的无细胞核酸的拷贝数(拷贝/ml)。所述方法可进一步包括如果所述生物样品中来自所述病毒的无细胞核酸的量高于所述阈值,则对所述肿瘤的存在进行第二次筛查。所述第二次筛查可包括确定来自第二生物样品中的所述病毒的无细胞核酸的大小。所述第二生物样品可与所述生物样品相同。所述第二生物样品可不同于所述生物样品。所述第二次筛查可包括确定来自所述受试者的所述第二生物样品中的来自所述病毒并且具有给定范围内的大小的无细胞核酸的量。确定来自所述病毒并且具有给定范围内的大小的所述无细胞核酸的量可包括对所述第二生物样品中的所述无细胞核酸进行大规模平行测序以产生序列读取。所述生物样品可包括血浆或血清。确定所述量可包括扩增所述无细胞核酸。所述扩增可包括聚合酶链反应(pcr)。所述pcr可包括定量pcr(qpcr)。所述肿瘤可以是鼻咽癌。所述病毒可以是eb病毒(ebv)。所述方法可进一步包括当所述筛查指示所述受试者中存在肿瘤时,针对所述肿瘤对所述受试者进行治疗。本文进一步公开了计算机产品,其包含计算机可读介质,所述计算机可读介质存储用于控制计算机系统以执行本文所述的任何方法的操作的多个指令的计算机可读介质。另外,本文进一步公开了系统,其包括本文所述的任何计算机产品以及一个或多个处理器,所述处理器用于执行存储在所述计算机可读介质上的指令。援引并入本说明书中所提到的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请均通过引用并入。附图说明本发明的新颖特征在所附权利要求书中具体阐述。通过参考以下对其中利用到本发明的原理的说明性实施方式加以阐述的详细描述和附图,将会获得对本发明的特征和优点的更好理解,在这些附图中:图1示出了年龄与非npc受试者中血浆eb病毒(ebv)dna的可检测性之间的相关性。图2示出了筛查日的平均环境温度与非npc受试者中血浆ebvdna的可检测性之间的相关性。图3示出了可以被编程或以其他方式配置为实现本文所提供的方法的计算机系统。图4示出了基于从样品中检测到的ebv无细胞核酸水平来检测npc的方法的流程图。图5描绘了本公开内容的示例性方法的流程图,其包括进行第一qpcr测定,并可能进行第二基于下一代测序(ngs)的测定。具体实施方式概述本文公开了用于筛查肿瘤例如鼻咽癌的存在的方法、系统和计算机可读介质,其包括确定来自受试者的生物样品例如血浆中来自病毒例如eb病毒(ebv)的无细胞核酸例如dna的量,基于选自受试者年龄、受试者吸烟状态和环境温度的属性来确定无细胞核酸的阈值;以及将来自所述病毒的无细胞核酸的量与阈值进行比较,从而筛查所述受试者的肿瘤。本文所述的方法可以基于一个或多个属性来确定或调整无细胞核酸的阈值。相对于不基于一个或多个属性来确定或调整阈值,基于一个或多个属性(在本文中也称为特征)确定或调整阈值可降低筛查的假阳性率。假阳性可以指受试者不具有病况(例如,肿瘤),但通过本公开内容的筛查或方法或另一种测定被鉴定为具有该病况。确定阈值在本文提供的方法、系统和计算机可读介质中,阈值可以是指示受试者中的肿瘤或肿瘤风险的病毒来源的无细胞核酸的量。该阈值可以部分地如在pct公开号wo2018081130或美国专利申请公开号20180237863中描述,其通过引用并入本文。可通过分析训练集来确定阈值,该训练集包括来自一个或多个已知患有肿瘤(例如鼻咽癌)的受试者的一组生物样品,以及来自一个或多个已知未患有肿瘤(例如鼻咽癌)的受试者的一组生物样品。可以设定阈值,使得来自已知患有肿瘤(例如鼻咽癌)的受试者的100%、至少99%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至少65%、至少60%、至少55%或至少50%的生物样品具有高于阈值的病毒(例如ebv)来源的无细胞核酸的量。可以建立基线阈值,并且可以基于选自受试者年龄、受试者吸烟状态和环境温度的属性来调整基线阈值。阈值可以是无细胞核酸的量。无细胞核酸的量可以是美国专利申请公开号20180237863中描述的核酸(例如,病毒核酸、ebv核酸)的量。例如,阈值可以是血浆ebvdna的量,例如血浆ebvdna浓度。该量可以从样品中确定。无细胞核酸可以是病毒来源的无细胞核酸。病毒来源的无细胞核酸的量可以指示样品的病毒量。病毒来源的无细胞核酸的量可以指示受试者中的肿瘤或肿瘤风险。病毒来源的无细胞核酸的量可以是指示肿瘤存在的量。该量可以是每一定体积(例如毫升)中病毒来源的无细胞核酸的拷贝数(拷贝/ml)、每一定体积(例如毫升)中病毒来源的无细胞核酸的特定序列的拷贝数、病毒来源的总无细胞核酸与非病毒来源的总无细胞核酸的比例或者病毒来源的无细胞核酸的特定序列与非病毒来源的总无细胞核酸的比例。无细胞核酸的量可以是无细胞核酸的数量、质量(例如克、纳克)、分子数(例如1、2、3、4个)、水平、归一化量、浓度(例如拷贝/ml)、百分比或比率。无细胞核酸的量可以是例如样品中病毒无细胞核酸与非病毒无细胞核酸的比率,样品中一定大小范围内的病毒无细胞核酸与相同或不同大小比率的非病毒无细胞核酸的比率。大小比率的实例可以在例如美国专利申请公开号20180237863中找到。该量可以是样品中病毒来源的无细胞核酸的比例。病毒来源的无细胞核酸的比例可以是在一定大小范围内的病毒来源的cfdna的比例。该比例可用于确定无细胞核酸的大小比例。大小比率可以是在一定大小范围内的病毒来源的无细胞核酸的比例相对于在该大小范围内的常染色体无细胞核酸的比例。在一个实例中,ebvdna大小比率是大小为80-110bp的ebvdna的比例相对于大小为80-110bp的常染色体无细胞dna的比例。在另一个实例中,ebvdna大小比率是小于180bp的ebvdna的比例相对于小于180bp的常染色体无细胞dna的比例。在一个实例中,ebvdna大小比率是小于150bp的ebvdna的比例相对于小于150bp的常染色体无细胞dna的比例。病毒来源的特定序列可以是编码潜伏膜蛋白(lmp)、eb病毒核抗原(ebna)、eb病毒编码的小rna(eber)、ebv聚合酶(pol)、ebv聚合酶辅助蛋白、bamhi片段或其组合的序列。阈值可约为1个拷贝/ml、5个拷贝/ml、10个拷贝/ml、50个拷贝/ml、100个拷贝/ml、200个拷贝/ml、300个拷贝/ml、500个拷贝/ml、1000个拷贝/ml、10,000个拷贝/ml或100,000个拷贝/ml。阈值可为0至4000个拷贝/ml。阈值可为至少50个拷贝/ml。阈值可为50至500个拷贝/ml。阈值可为100至500个拷贝/ml。阈值可为200至500个拷贝/ml。阈值可为50至200个拷贝/ml。阈值可多达500个拷贝/ml。备选地,阈值可为20,000至50,000个拷贝/ml。在一些情况下,阈值可以是调整的基线,或是初始阈值,其中基于一个或多个与受试者相关或与受试者无关的属性来调整预定基线阈值。在一个实例中,基线阈值是基于受试者年龄、受试者吸烟状态、收集样品时的温度或其组合进行调整的。在一些情况下,可以例如使用算法,基于至少一个与受试者相关或与受试者无关的属性来确定阈值。属性可以是与受试者相关的属性或与受试者无关的属性。与受试者相关的属性的实例包括年龄、当前吸烟状态、当前饮酒状态、运动习惯和共病状态。与受试者无关的属性的实例包括环境温度。在一些情况下,阈值是基于受试者的年龄确定的。在一些情况下,血浆ebvdna浓度的阈值是基于受试者的年龄确定的。例如,与较年长的人相比,较年轻的人可以使用更低的截止值(阈值)。在另一个实例中,与较年轻的人相比,较年长的人可以使用更高的截止值(阈值)。受试者的年龄可以是收集生物样品时受试者的年龄。受试者的年龄可以是例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119或120岁。受试者的年龄可以是12岁或更小、13岁至19岁、20岁至35岁、36岁至45岁、46岁至59岁、60岁至79岁或80岁以上。阈值可包括随着年龄的正相关(参见例如图1)。在一些情况下,与较年轻的受试者(例如,未患有npc的较年轻的受试者)相比,较年长的受试者(例如,未患有npc的较年长的受试者)的生物样品中可具有更大量的来自ebv的cfdna。例如,在未患有npc的受试者中,年龄增加5岁可与血浆ebvdna的阳性率增加0.6%相关(参见例如,图1)。在一些情况下,将受试者的年龄与基线年龄进行比较。基线年龄可以是预定的年龄,从该年龄可以进行任何后续调整。在一些情况下,如果受试者的年龄超过基线年龄,则对于受试者比基线年龄每大一岁,将阈值提高至少约1%、2%、3%、4%、5%或10%。在一些情况下,如果受试者的年龄低于基线年龄,则对于受试者比基线年龄每小一岁,将阈值降低至少约1%、2%、3%、4%、5%或10%。在一些情况下,如果受试者的年龄超过基线年龄,则对于受试者比基线年龄每大5岁或10岁的年龄段,将阈值提高至少约1%、2%、3%、4%、5%或10%。例如,如果基线年龄为50岁,受试者的年龄为62岁,并且阈值每5年提高2%,那么与50岁时的阈值相比,该受试者的阈值可提高6%。在一些情况下,如果受试者的年龄低于基线年龄,则对于受试者比基线年龄每小5岁或10岁的年龄段,将阈值降低至少约1%、2%、3%、4%、5%或10%。在一些情况下,阈值是基于受试者的吸烟状态确定的。在一些情况下,血浆ebvdna浓度的阈值是基于受试者的吸烟状态确定的。受试者的吸烟状态可以是吸烟者或不吸烟者。如果受试者是吸烟者,则可将阈值设置为高于不吸烟者的阈值。在一些情况下,吸烟状态指示受试者是否是当前吸烟者。当前吸烟者可以是在过去的一天、一周、一个月或一年内参与吸烟(例如,吸食至少一支、10支或100支香烟)的受试者。吸烟可以是吸食任何烟草或大麻产品。烟草或大麻产品可以是例如雪茄、大麻雪茄(blunt)、小雪茄烟(cigarillo)、小雪茄、香烟或丁香香烟(kretek)。可通过诸如电子烟的手持电子设备来促进吸烟。电子设备可产生包含尼古丁的气溶胶或蒸气。在一些情况下,当前吸烟者或先前吸烟者平均每天吸食/曾每天吸食约1、约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70或约75支香烟。在一些情况下,当前吸烟者/先前吸烟者每天吸食/曾每天吸食约1至约10、约10至约20、约20至约30、约30至约40、约40至约50、约50至约60或约60到75支香烟。在一些情况下,当前吸烟者或先前吸烟者每天吸食/曾每天吸食超过75支香烟。在一些情况下,如果受试者是吸烟者,则将阈值提高至少约1%、2%、5%、10%、20%或25%。在一些情况下,如果受试者是不吸烟者,则将阈值降低至少约1%、2%、5%、10%、20%或25%。不吸烟者可以是在过去的一天、一周、一个月或一年内没有参与吸烟(例如,吸食至少一支、10支或100支香烟)的受试者。在一些情况下,阈值是基于环境温度确定的。在一些情况下,血浆ebvdna浓度的阈值是基于环境温度确定的。例如,与在较暖天收集的样品相比,在较冷天收集的样品可以使用更高的阈值。在另一个实例中,与在较冷天收集的样品相比,在较暖天收集的样品可以使用更低的阈值。环境温度可以是从受试者获取生物样品时的温度。可以在收集样品的位置或附近确定环境温度。在收集样品的位置附近的位置可以是在获取样品的位置的1千米(km)、10km、100km、200km、300km、400km或500km之内的位置。环境温度可以是在收集样品当天,在收集样品的位置或附近的环境温度。环境温度可以是平均环境温度。平均环境温度可以是样品收集当天的平均环境温度、样品收集前24小时的平均环境温度或样品收集前一周的平均环境温度。环境温度可以是在收集样品当天,在收集样品的位置或附近的高温或低温。环境温度可以是在一天中的特定时间(例如,早晨、中午、下午、晚上),在收集样品的当天,在收集样品的位置或附近的温度。可以在获取样品的城市或国家的官方气象台确定环境温度。环境温度可以由美国国家气象局或香港天文台确定。可以使用模拟或数字温度计确定环境温度。阈值可以包括与环境温度的负相关(参见例如图2)。在一些情况下,将环境温度与基线温度进行比较。基线温度可以是预定温度,从该温度可以进行任何后续调整。在一些情况下,如果环境温度高于基线温度,则对于环境温度比基线温度每高一度(摄氏度),将阈值降低至少约1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。在一些情况下,如果环境温度低于基线温度,则对于环境温度比基线温度每低一度(摄氏度),将阈值升高至少约1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。在一些情况下,如果环境温度低于基线温度,则对于环境温度比基线温度每低2、3、4或5度的温度段,将阈值升高至少约1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。例如,如果基线温度为24℃,从受试者获取样品的当天的平均环境温度为19℃,并且阈值可以每3度降低1%,受试者的阈值可以比温度为24℃时的阈值升高2%。在一些情况下,如果环境温度高于基线温度,则对于温度比基线温度每高2、3、4或5度的温度段,阈值可降低至少约1%、2%、3%、4%、5%、6%、7%、8%、9%或10%。在一些情况下,阈值是基于受试者的年龄和受试者的吸烟状态确定的。在一些情况下,阈值是基于受试者的年龄和环境温度确定的。在一些情况下,阈值是基于受试者的吸烟状态和环境温度确定的。在一些情况下,阈值是基于受试者的年龄、受试者的吸烟状态和环境温度确定的。在一些情况下,阈值不是基于受试者的共病状态、受试者的当前饮酒状态、受试者的运动习惯或其任何组合确定的。在一些情况下,受试者的当前饮酒状态指示受试者是否是当前饮酒者。当前饮酒者可以是在过去的一天、一周、一个月或一年内参与饮酒(例如喝酒)的受试者。在一些情况下,受试者的运动习惯指示受试者是否定期参加运动。定期参加运动的受试者可以是每周至少一天、两天或三天进行至少15分钟(分钟)、30min、45min或60min的中度运动的受试者。在一些情况下,定期参加运动的受试者可以是每周至少两天进行至少30分钟的中度运动的受试者。在一些情况下,受试者的共病状态是受试者是否存在一种或多种合并症。一种或多种合并症可包括糖尿病、高血压、高脂血症、缺血性心脏病或其组合。本文提供的筛查肿瘤存在的方法可以进一步包括将来自病毒的无细胞核酸的量与阈值进行比较。将来自病毒的无细胞核酸的量与阈值进行比较可用于筛查受试者的肿瘤。可以将所确定的阈值(例如使用训练集确定的阈值)与来自一个或多个具有未知肿瘤状态的受试者的一个或多个生物样品的病毒无细胞核酸的量进行比较。在一个实例中,如果受试者的ebv血浆cfdna的量超过阈值,则确定该受试者患有npc或存在患上npc的风险。在另一个实例中,如果受试者的ebv血浆cfdna的量低于阈值,则确定该受试者未患有npc或不存在患有npc的风险。在图4中示出了用于将检测到的ebv无细胞核酸的量与阈值进行比较以确定受试者是否患有npc的示例性工作流程。确定来自病毒的无细胞核酸的量可以例如如美国专利申请公开号20180237863中所述来确定来自病毒的无细胞核酸的量。在一些情况下,确定来自病毒的无细胞核酸的量包括扩增来自病毒的无细胞核酸。扩增可包括聚合酶链反应(pcr),例如定量pcr(qpcr,也称为实时pcr)。扩增可包括逆转录-pcr、实时pcr、定量实时pcr、数字pcr(dpcr)、数字乳液pcr(depcr)、克隆pcr、扩增片段长度多态性pcr(aflppcr)、等位基因特异性pcr、装配pcr、不对称pcr(其中针对选定链可以使用大量过量的引物)、链置换扩增、多重置换扩增、滚环扩增、菌落pcr、解旋酶依赖性扩增(hda)、热启动pcr、连接酶链反应、反向pcr(ipcr)、原位pcr、长pcr(dna的延伸大于约5千碱基)、解旋酶依赖性扩增、分支扩增法、多重pcr、巢式pcr(使用多于一对引物)、单细胞pcr、降落pcr、环介导的等温pcr(lamp)、重组酶聚合酶扩增(rpa)或基于核酸序列的扩增(nasba)。扩增可包括全基因组扩增或靶向扩增。在一些情况下,在扩增之前,从生物样品中分离无细胞核酸。可以通过选择给定大小的无细胞核酸片段,从生物样品中分离无细胞核酸。可从生物样品中分离出长度小于150个碱基对(bp)、200bp或300bp的无细胞核酸。在一些情况下,分离出150bp至300bp的无细胞核酸。在一些情况下,分离出150bp至200bp的无细胞核酸。在一些情况下,分离出180bp至200bp的无细胞核酸。在一些情况下,分离出80bp至110bp的无细胞核酸。来自病毒的无细胞核酸的量可以通过例如分光光度测定法(例如uv分光光度法,例如nanodrop)、荧光测定法(例如使用quantifluor染料)、微阵列(例如dna微阵列)、质谱分析、测序(例如下一代测序)来确定。测序可包括链终止测序、杂交测序,454序列(roche)、使用可逆终止染料的测序(illumina测序)、半导体测序(thermofisheriontorrent)、质谱分析法测序、大规模平行特征测序(mpss)、maxam-gilbert测序、纳米孔测序(例如,使用oxfordnanopore或genia的技术)、单分子电子检测测序(例如,当核酸(dna/rna)穿过纳米间隙时,测量通过纳米电极的隧道电流并计算电流差;例如,使用来自quantumbiosystems的quantumsequencing)、微滴单分子序列(例如,使用焦磷酸解(例如,使用base4的技术))、聚合酶克隆测序、焦磷酸测序、鸟枪法测序、单分子实时(smrt)测序(pacificbiosciences)、来自genapsys的genapsys基因电子纳米集成超灵敏(genius)技术、来自qiagen的genereader,或solid测序。方法可包括在测序之前从样品富集来自病毒的无细胞核酸。富集可以包括使用杂交探针捕获来自病毒的无细胞核酸。在一些情况下,方法不需要在测序之前从样品中富集来自病毒的无细胞核酸。方法可包括组装测序文库。例如,可以如前所述构建测序文库(参见例如,lam等人.procnatlacadsciusa.2018年5月29日;115(22):e5115–e5124)。可以使用例如来自roche的seqcap来富集一个或多个靶标。核酸,例如dna,例如基因组dna,可以例如通过声波处理来片段化。片段化的dna可退火以捕获探针。捕获探针可被标记。探针可以结合到固体支撑物,例如涂有链霉亲和素的磁珠。可以释放、扩增和测序所捕获的靶标。可以使用例如来自agilienttechnologies的haloplex靶标富集系统来富集一个或多个靶标。核酸,例如dna,例如基因组dna,可以例如通过限制酶消化来片段化。在存在索引引物盒的情况下的探针可用于产生dna片段,该dna片段是环化的并掺入一个或多个索引并且任选地具有一个或多个可用于测序平台(例如illumina测序)的测序基序。探针可包含标记,例如生物素,其可以例如通过生物素化添加。可以例如使用链霉亲和素包覆珠(例如,磁珠)捕获标记探针。可以例如通过pcr扩增所捕获的靶标,并且例如通过测序(例如下一代测序)来分析捕获的靶标。可以使用一个或多个捕获探针(例如使用来自agilenttechnologies的sureselect靶标富集)来富集一个或多个靶标。核酸,例如dna,例如基因组dna,可以例如通过声波处理来片段化。可使用具有约10至约200个碱基、约20至约175个碱基、约25至约150个碱基或约120个碱基的一个或多个探针(例如一个或多个crna探针)来富集一个或多个靶标。一个或多个探针,例如一个或多个crna探针,可以用标记例如生物素来标记,并且该标记可通过结合部分例如链霉亲和素而结合到固体支撑物,例如珠子(例如磁珠)。可例如使用磁体捕获固体支撑物,例如珠子,例如磁珠。可将一个或多个捕获的靶标从固体支撑物释放(例如,通过消化crna探针),例如通过pcr扩增,并且例如通过测序(例如,下一代测序)进行分析。可以例如使用转座酶(例如使用nextera标签化(tagmentation))来富集一个或多个靶标。一个或多个靶标可以通过经由转座添加衔接子,然后使用与衔接子退火的引物通过pcr进行扩增来富集。可以使用来自nugen的单引物富集技术(spet)富集一个或多个靶标。衔接子可连接至核酸片段。包含3’衔接子的引物可以与靶序列退火并进行延伸。可使用衔接子序列的引物来扩增延伸的产物,并且可通过测序(例如下一代测序)来分析扩增的产物。确定来自病毒的无细胞核酸的量可包括确定来自病毒的无细胞核酸的拷贝数。例如,可确定每一定体积(例如,ml)的生物样品中特定病毒无细胞核酸(例如cfdna)序列的拷贝数。确定来自病毒的无细胞核酸的量可包括确定每一定体积(例如毫升)的生物样品(例如血浆)中病毒(例如ebv)基因组的拷贝数。确定来自病毒的无细胞核酸的量可包括扩增至少一个病毒序列。病毒序列可来源于eb病毒(ebv)。ebv序列可以是编码潜伏膜蛋白(lmp)、eb病毒核抗原(ebna)、eb病毒编码的小rna(eber)、ebv聚合酶(pol)、ebv聚合酶辅助蛋白(例如,bmrf1)、bamhi片段或其组合的序列。lmp的实例包括lmp-1、lmp-2a和lmp-2b。ebna的实例包括ebna-1、ebna-2、ebna-3a、ebna-3b和ebna-3c。eber的实例包括eber-1和eber-2。bamhi片段的实例包括bamhi-a、bamhi-c和bamhi-w。在一些情况下,确定来自病毒的无细胞核酸的量包括确定一个、两个、三个、四个、五个或五个以上病毒序列的量。在一些情况下,确定无细胞核酸的量包括对来自病毒的无细胞核酸进行测序。测序可产生序列读取。序列读取与人类基因组或病毒基因组的比对可区分源自人类基因组(例如,受试者的基因组)的序列和源自非人类基因组(例如,病毒的基因组)的序列。测序可包括全基因组测序或靶向测序。靶向测序可包括扩增例如如本文所述的至少一个病毒序列。测序可以是大规模平行测序。测序可包括对核酸片段的克隆扩增或非扩增的单分子进行测序。测序可包括链终止测序、杂交测序、测序(例如,使用可逆终止染料)、iontorrenttm(例如,半导体)测序、质谱分析法测序、大规模平行特征测序(mpss)、maxam-gilbert测序、纳米孔测序、聚合酶克隆测序、焦磷酸测序、鸟枪法测序、单分子实时(smrt)测序、测序(例如,使用荧光标记的双碱基探针)、通用测序或其任意组合。在一些实施方案中,扩增可包括数字pcr。可使用nextseq500平台或nextseq550平台进行测序。病毒和肿瘤病毒可以是与癌症有关的病毒。可引起受试者中的癌症或与受试者中的癌症相关的病毒的非限制性实例包括人乳头瘤病毒(hpv)、eb病毒(ebv)、乙型肝炎病毒(hbv)、丙型肝炎病毒(hcv)、人免疫缺陷病毒(例如,与卡波西肉瘤、宫颈癌、非霍奇金淋巴瘤、肛门癌、霍奇金病、肺癌、口癌、口咽癌、皮肤癌和肝癌相关)、人疱疹病毒8(例如,与卡波西肉瘤、血癌、原发性渗出性淋巴瘤和卡斯尔曼病(castlemandisease)相关)、人t淋巴细胞病毒-1(例如,与淋巴细胞白血病、非霍奇金淋巴瘤和成人t细胞白血病/淋巴瘤相关)和梅克尔细胞多瘤病毒(例如,与皮肤癌如梅克尔细胞癌相关)。病毒可以是eb病毒(ebv)。肿瘤可以是由病毒引起或与病毒相关的肿瘤。肿瘤可以是由eb病毒引起或与eb病毒相关的肿瘤。由ebv引起或与ebv相关的肿瘤的实例包括鼻咽癌、淋巴瘤(例如burkitt淋巴瘤或霍奇金淋巴瘤)和胃癌。在一些情况下,肿瘤是鼻咽癌(npc)。生物样品和核酸生物样品可以是全血、血浆、血清、尿液、胸膜液或淋巴液。在一些情况下,生物样品是血浆。生物样品可包括外周血淋巴细胞(pbl)、外周血单核细胞(pbmc)。生物样品可包含无细胞核酸,其可以是在生物样品中发现的未包含在完整细胞中的任何核酸。无细胞核酸可以是无细胞dna(cfdna)或无细胞rna。无细胞核酸可以是循环核酸,例如循环dna或rna。生物样品中的至少一部分无细胞核酸可以是病毒来源的和/或可来自肿瘤。血流中发现的源自肿瘤的无细胞核酸可称为循环肿瘤核酸,例如循环肿瘤dna(ctdna)。无细胞核酸的实例可以是血浆dna。来源于病毒的无细胞核酸的实例可以是血浆ebvdna。受试者生物样品可获取自受试者。受试者可以是人类。备选地,受试者可以是非人类的灵长类动物(例如大猩猩、黑猩猩、倭黑猩猩、猿、猩猩、狐猴或狒狒)、狗、猫、山羊、豚鼠、仓鼠、老鼠、猪、羊、牛、骆驼或斑马鱼。受试者可以是被筛查肿瘤的受试者。可以侵入性地(例如,手术手段)或非侵入性地(例如,抽血、拭子或收集排出的样品)从受试者获得样品。其他测定在一些实施方案中,本公开内容的方法包括进行两种测定或更多种测定(例如,第一测定和第二测定)。测定(例如,第一测定和/或第二测定)可以是美国专利申请公开号20180237863中描述的测定(参见例如图5)。例如,可从受试者获取血液样品,并可以从含有无细胞dna(cfdna)的血浆中去除细胞,例如,通过执行连续两次离心5202。离心可在2000×g下进行10分钟以从血浆样品中耗尽血小板和细胞。可使用来自收集的两个血液样品之一的大约0.8毫升血浆进行qpcr分析以检测样品中肿瘤衍生的dna(ebvdna)的拷贝数5203。可对血浆样品进行cfdna提取5204以富集血浆样品的cfdna,并制备样品用于qpcr分析。可确定qpcr分析的变性、退火和延伸温度5205(例如,基于所用引物的长度/gc含量,和/或样品中的总cfdna的浓度),并且可进行qpcr分析5206以检测样品中肿瘤衍生的cfdna的量。为了检测ebvdna,可使用在基因组的bamhi序列侧翼的引物。可基于受试者的年龄和/或吸烟状态和/或从受试者收集样品时的环境温度来建立阈值。如果检测到的ebvdna的量低于阈值5207,则可提供阴性结果并且在一些情况下,不进行第二测定。如果检测到的cfdna的量等于或高于阈值5208,则可使用来自收集的第二血液样品的血浆进行第二测定。例如,可将大约4毫升的血浆用于下一代测序5209,以确定样品中cfdna的大小分布。可对第二血浆样品进行cfdna提取5210以富集血浆样品的cfdna,并制备样品用于下一代测序分析。可进行文库制备5211以将衔接子寡核苷酸连接到待测序样品中的cfdna片段。可使cfdna被片段化为用于下游平台的最佳长度。在一些情况下,dna片段化不产生均匀的平端片段;末端修复可用于确保每个分子没有突出端,并含有5’磷酸和3’羟基基团。可以进行称为da加尾的过程,即将非模板化的脱氧腺苷5’-单磷酸(damp)掺入平端化的dna片段的3’端。可进行ebvdna的靶向富集5212;ebvdna的靶向富集可使得能够对特定感兴趣的区域而不是整个基因组进行测序。可对富集样品进行下一代测序5213。可获得对应于富集血浆样品中的测序cfdna的序列读取,并任选地与参考基因组进行比对。可进行分析,例如可评估ebv数量并可生成ebvdna片段的大小谱5214。可输出指示从中获得样品的受试者是否患有鼻咽癌的报告5215。在一个实例中,可在施用疗法之前进行第一测定以设置受试者的病毒来源核酸的基线量,而可在施用疗法之后对来自同一受试者的样品进行第二测定。在另一个实例中,第一测定可以是对来自受试者的样品的定性测定,以确定受试者是否具有来自病毒的无细胞核酸,而第二测定可以是对来自同一受试者的样品的定量测定,以确定受试者对于所检测的肿瘤是否为假阳性(例如,在给定本文所述的受试者不相关或受试者相关属性的情况下调整阈值之后,无细胞核酸的量是否可能低于阈值)。在又一个实例中,可以对来自受试者的样品进行第一测定以确定受试者是否对于检测的肿瘤为假阳性(例如,在给定本文所述的受试者不相关或受试者相关属性的情况下调整阈值之后,无细胞核酸的量是否可能低于阈值),同时可对来自受试者的样品进行第二测定,以确认肿瘤的存在。在一些情况下,在第一测定中使用生物样品的第一部分,并在第二测定中使用生物样品的第二部分。在其他情况下,在第一测定中使用生物样品,并在第二测定中使用第二生物样品,其中在不同于从同一受试者收集第一生物样品的时间点收集第二生物样品。第二生物样品可以在第一生物样品之后至少1天、2天、3天、4天、5天、6天、1周、2周、3周、1个月、2个月、3个月、4个月、5个月、6个月、1年、2年、3年、4年或5年后收集。在一些情况下,方法进一步包括如果无细胞核酸的量指示受试者患有或疑似患有肿瘤,则对肿瘤进行第二次筛查。例如,如果血浆ebvcfdna的量高于阈值,则受试者可能疑似患有肿瘤。第二次筛查可以是第二测定法,用于确定样品中来自病毒的无细胞核酸的量,例如通过扩增来自病毒的无细胞核酸。第二次筛查可包括对受试者进行内窥镜检查、鼻腔镜检查、活检、x射线、计算机断层(ct或cat)扫描、磁共振成像(mri)、超声、骨扫描、神经学检查、听力测试、正电子发射断层(pet)扫描或pet-ct扫描或其组合。第二次筛查可确认受试者中是否存在肿瘤。治疗在一些情况下,本文提供的方法还包括当筛查、第二次筛查或其组合指示受试者中存在肿瘤时针对肿瘤对受试者进行治疗。针对肿瘤对受试者进行治疗可包括施用疗法。疗法可以是化学疗法、放射疗法、手术、靶向疗法或其组合。在一些情况下,使用近距离放射疗法来施用放射疗法。在一些情况下,手术是鼻咽癌切除术。靶向疗法可以是单克隆抗体。单克隆抗体可以是靶向表皮生长因子受体(egfr)的抗体。单克隆抗体可以是贝伐单抗、西妥昔单抗或纳武单抗。靶向疗法可以是检查点抑制剂,例如抗pdl1抗体或抗pd1抗体。在一些情况下,本文提供的方法还包括向受试者施用预防疗法。在一些情况下,本文提供的方法进一步包括将受试者置于针对肿瘤的额外监视下。当受试者具有肿瘤的风险因素,筛查指示存在高于阈值的ebvdna,并且第二次筛查没有指示肿瘤存在时,可向受试者施用预防疗法,或者可将受试者置于针对肿瘤的额外监视下。npc的风险因素可以是亚洲血统、饮酒、吸烟、有亲戚患有npc及其组合。对肿瘤的额外监视可包括如本文所述的第二次筛查。可以每五年一次、每四年一次、每三年一次、每两年一次、每年一次、每年两次、每年三次、每年四次、每年五次或每年六次对受试者进行额外监视。额外的监测可结合本文所述针对肿瘤存在的筛查来进行。减少假阳性率如本文所述,可通过基于受试者相关或受试者不相关的属性调整指示肿瘤的病毒来源的无细胞核酸的阈值水平,来降低肿瘤检测的假阳性率。在一些情况下,肿瘤是鼻咽癌,并且可以基于高于阈值的血浆ebvdna的存在来筛查鼻咽癌。在一些情况下,不调整阈值会导致约5.5%的假阳性率。在一些情况下,不调整阈值会导致大于5.5%的假阳性率。在一些情况下,调整阈值会导致约0.5%、约0.6%、约0.7%、约0.8%、约0.9%、约1.0%、约1.1%、约1.2%、约1.3%、约1.4%、约1.5%、约1.6%、约1.7%、约1.8%、约1.9%、约2.0%、约2.1%、约2.2%、约2.3%、约2.4%、约2.5%、约2.6%、约2.7%、约2.8%、约2.9%、约3.0%、约3.1%、约3.2%、约3.3%、约3.4%、约3.5%、约3.6%、约3.7%、约3.8%、约3.9%、约4.0%、约4.1%、约4.2%、约4.3%、约4.4%、约4.5%、约4.6%、约4.7%、约4.8%、约4.9%、约5.0%、约5.1%、约5.2%、约5.3%或约5.4%的假阳性率。在一些情况下,调整阈值会导致小于0.5%、小于0.6%、小于0.7%、小于0.8%、小于0.9%、小于1.0%、小于1.1%、小于1.2%、小于1.3%、小于1.4%、小于1.5%、小于1.6%、小于1.7%、小于1.8%、小于1.9%、小于2.0%、小于2.1%、小于2.2%、小于2.3%、小于2.4%、小于2.5%、小于2.6%、小于2.7%、小于2.8%、小于2.9%、小于3.0%、小于3.1%、小于3.2%、小于3.3%、小于3.4%、小于3.5%、小于3.6%、小于3.7%、小于3.8%、小于3.9%、小于4.0%、小于4.1%、小于4.2%、小于4.3%、小于4.4%、小于4.5%、小于4.6%、小于4.7%、小于4.8%、小于4.9%、小于5.0%、小于5.1%、小于5.2%、小于5.3%或小于5.4%的假阳性率。在一些情况下,调整阈值会导致小于5.5%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约1.5%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约2.0%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约2.5%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约3.0%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约3.5%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约4.0%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约4.5%至约5.0%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约1.5%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约2.0%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约2.5%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约3.0%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约3.5%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约4.0%至约4.5%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约4.0%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约4.0%的假阳性率。在一些情况下,调整阈值会导致约1.5%至约4.0%的假阳性率。在一些情况下,调整阈值会导致约2.0%至约4.0%的假阳性率。在一些情况下,调整阈值会导致约2.5%至约4.0%的假阳性率。在一些情况下,调整阈值会导致约3.0%至约4.0%的假阳性率。在一些情况下,调整阈值会导致约3.5%至约4.0%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约3.5%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约3.5%的假阳性率。在一些情况下,调整阈值会导致约1.5%至约3.5%的假阳性率。在一些情况下,调整阈值会导致约2.0%至约3.5%的假阳性率。在一些情况下,调整阈值会导致约2.5%至约3.5%的假阳性率。在一些情况下,调整阈值会导致约3.0%至约3.5%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约3.0%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约3.0%的假阳性率。在一些情况下,调整阈值会导致约1.5%至约3.0%的假阳性率。在一些情况下,调整阈值会导致约2.0%至约3.0%的假阳性率。在一些情况下,调整阈值会导致约2.5%至约3.0%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约2.5%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约2.5%的假阳性率。在一些情况下,调整阈值会导致约1.5%至约2.5%的假阳性率。在一些情况下,调整阈值会导致约2.0%至约2.5%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约2.0%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约2.0%的假阳性率。在一些情况下,调整阈值会导致约1.5%至约2.0%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约1.5%的假阳性率。在一些情况下,调整阈值会导致约1.0%至约1.5%的假阳性率。在一些情况下,调整阈值会导致约0.5%至约1.0%的假阳性率。在一些情况下,调整阈值会导致约3.8%至约4.5%的假阳性率。在一个实例中,基于环境温度调整指示肿瘤的病毒来源的无细胞核酸的阈值水平可导致约4.5%的假阳性率。当温度超过30℃的时期收集样品时,可实现约4.5%的假阳性率。在另一个实例中,基于年龄调整指示肿瘤的病毒来源的无细胞核酸的阈值水平可导致约3.8%的假阳性率。当从年龄小于或等于45岁的受试者收集样品时,可实现约3.8%的假阳性率。可使用不同的策略来降低血浆ebvdna筛查的假阳性率。可以在高温的时期(例如,夏季)安排筛查期。可根据环境温度导致的预测假阳性率的差异来调整分析费用。一种实施方式可以是在冬季收取较低的检测费用,而在夏季收取较高的检测费用,因为冬季的假阳性率较高,以应对因准确性较低导致的冬季的较低需求。一种替代实施方式可以是在冬季收取较高的测试费用,而在夏季收取较低的测试费用,以鼓励更多的人在夏季接受筛查,从而提高测试的整体准确性。可以建议要接受筛查的受试者在接受筛查测试之前数天内要保暖或避免在低温下暴露。例如,可以针对一年或一个月中的时间,或者针对进行测试的当天或当周的实际温度进行调整。也可以根据测试地点的地理位置来调整安排,例如,在靠近赤道的地区收取较低的测试费。可将定量阈值应用于血浆dna的水平。定量阈值可根据环境温度进行调整。例如,当环境温度较低时,可使用较高的阈值(例如,需要较高浓度的血浆ebvdna来定义阳性结果),而当环境温度较高时,可使用较低的阈值(例如,需要较低浓度的血浆ebvdna来定义阳性结果)。鉴于受试者的年龄与受试者血浆中的ebvdna浓度之间存在正相关关系,可制定策略以提高筛查程序的成本效益。例如,可通过降低测试费用来鼓励年龄较小的人群参加筛查。当进一步研究的费用(例如鼻内窥镜检查或磁共振成像)可以报销给那些血浆ebvdna检测呈阳性的受试者时,这种安排可能会有用。报销可以与保险有关。可将定量阈值应用于血浆dna的水平。定量阈值可以根据被筛查受试者的年龄来调整。例如,较高的阈值(例如,需要较高的血浆ebvdna浓度来定义阳性结果)可用于年龄较大的人群,而较低的阈值(例如,需要较低的血浆ebvdna浓度来定义阳性结果)用于年龄较小的人群。可使用类似的策略来调整吸烟者与非吸烟者之间的测试费用。可向吸烟者收取更高的检测费以补偿更高的假阳性率。当进一步研究的费用可以报销给血浆ebvdna检测呈阳性的受试者时,这种费用安排可能会有用。可将定量阈值应用于血浆dna的水平。定量阈值可以根据被筛查受试者的吸烟习惯来调整。例如,较高的阈值(例如,需要较高的血浆ebvdna浓度来定义阳性结果)可用于吸烟者,而较低的阈值(例如,需要较低的血浆ebvdna浓度来定义阳性结果)可用于非吸烟者。计算机系统在一些情况下,本文公开了计算机产品,其包含计算机可读介质,该计算机可读介质存储用于控制计算机系统以执行本文所述的任一种方法的操作的多个指令。在某些情况下,本文进一步公开了系统,其包括本文所述的计算机产品和一个或多个处理器,所述处理器用于执行存储在计算机可读介质上的指令。图3示出了计算机系统301,其被编程或以其他方式配置为与本公开内容的计算机系统通信并调控本公开内容的计算机系统的各个方面。计算机系统301可调控本公开内容的各个方面,例如确定或调整指示受试者中肿瘤的病毒来源dna的阈值。计算机系统301可以是用户的电子装置或者是相对于该电子装置远程定位的计算机系统。电子装置可以是移动电子装置。计算机系统301可包括中央处理单元(cpu,本文也称为“处理器”和“计算机处理器”)305,其可以是单核或多核处理器,或者是用于并行处理的多个处理器。计算机系统301还可包括存储器或存储位置310(例如,随机存取存储器、只读存储器、闪存)、电子存储单元315(例如,硬盘)、用于与一个或多个其他系统通信的通信接口320(例如,网络适配器)、外围装置325,诸如高速缓存存储器、其他存储器、数据存储和/或电子显示适配器。存储器310、存储单元315、接口320和外围装置325可通过诸如主板的通信总线(实线)与cpu305通信。存储单元315可以是用于储存数据的数据存储单元(或数据存储库)。计算机系统301可以借助于通信接口320而可操作地耦合到计算机网络(“网络”)330。网络330可以是互联网、因特网和/或外联网和/或与互联网通信的内联网和/或外联网。在一些情况下,网络330是电信网络和/或数据网络。网络330可以包括一个或多个计算机服务器,其能够分布式计算,诸如云计算。在一些情况下,借助于计算机系统301,网络330可实现点对点网络,该点对点网络可以使耦合到计算机系统301的装置能够发挥客户端或服务器的作用。cpu305可以执行一系列机器可读指令,该指令可体现在程序或软件中。指令可以储存在存储器位置,诸如存储器310中。指令可以指向cpu305,其可以在随后编程或以其他方式配置cpu305以便实现本公开内容的方法。cpu305所执行的操作的实例可以包括提取、解码、执行和回写。cpu305可以是诸如集成电路等电路的一部分。在该电路中可以包含系统301的一个或多个其他组件。在一些情况下,该电路是专用集成电路(asic)。存储单元315可以存储文件,诸如驱动器、库和保存的程序。存储单元315可以储存用户数据,例如,用户偏好和用户程序。在一些情况下,计算机系统301可以包括在计算机系统301外部的一个或多个其他数据存储单元,诸如位于通过内联网或互联网与计算机系统301通信的远程服务器上。计算机系统301可以通过网络330与一个或多个远程计算机系统通信。例如,计算机系统301可以与用户的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式pc)、平板或平板计算机(例如,ipad、galaxytab)、电话、智能电话(例如,iphone、支持android的装置、)或个人数字助理。用户可以经由网络330访问计算机系统301。本文所述的方法可通过存储在计算机系统301的电子存储位置上(例如,存储器310或电子存储单元315上)的机器(例如,计算机处理器)可执行代码实施。该机器可执行或机器可读代码能够以软件的形式提供。在使用期间,代码可由处理器305执行。在一些情况下,可以从存储单元315检索代码并将其储存在存储器310上,以便于处理器305访问。在一些情况下,可以取消电子存储单元315,并且在存储器310上储存机器可执行指令。代码可以预编译和配置用于与具有适于执行该代码的处理器的机器一起使用,或者可以在运行时期间编译。代码可以以可选择的编程语言提供以使代码能够以预编译或即时编译的方式执行。本文提供的系统和方法的方面,如计算机系统301,可以在编程中体现。技术的各个方面可被认为是“产品”或“制品”,其形式通常为承载或体现于某种类型的机器可读介质上的机器(或处理器)可执行代码和/或关联数据。机器可执行代码可以储存在电子存储单元上,诸如存储器(例如,只读存储器、随机存取存储器、闪存)上,或者硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器或者其关联的模块,诸如可在任何时刻为软件编程提供非暂时性存储的各种半导体存储器、磁带驱动器、磁盘驱动器等。整个软件或部分软件可在任何时刻通过因特网或各种其他电信网络进行通信。这样的通信例如能够将软件从一台计算机或处理器加载到另一台计算机或处理器,例如,从管理服务器或主机加载到应用服务器的计算机平台。因此,可承载软件元素的另一类型的介质包括光波、电波和电磁波,诸如跨本地设备之间的物理接口、通过有线和光陆线网络以及通过各种空中链路而使用的光波、电波和电磁波。携载这样的波的物理元件,诸如有线或无线链路、光学链路等,也可被认为是承载软件的介质。如本文所使用,除非限制于非暂时性、有形“存储”介质,否则诸如计算机或机器“可读介质”的术语是指参与向处理器提供指令以供执行的任何介质。因此,诸如计算机可执行代码等机器可读介质可采取许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质例如包括光盘或磁盘,诸如任何计算机等中的任何存储设备,例如其可用于实现附图中所示的数据库等。易失性存储介质包括动态存储器,例如这样的计算机平台的主存储器。有形传输介质包括同轴线缆;铜线和光纤,包括在计算机系统内构成总线的电线。载波传输介质可采取电信号或电磁信号的形式,或者采取声波或光波的形式,诸如在射频(rf)和红外(ir)数据通信期间生成的那些。因此,计算机可读介质的常见形式例如包括:软盘、柔性盘、硬盘、磁带、任何其他磁介质、cd-rom、dvd或dvd-rom、任何其他光介质、穿孔卡片纸带、任何其他具有孔洞图案的物理存储介质、ram、rom、prom和eprom、flash-eprom、任何其他存储器芯片或存储器盒、传输数据或指令的载波、传输这样的载波的线缆或链路,或者计算机可从中读取编程代码和/或数据的任何其他介质。这些形式的计算机可读介质中的许多介质可参与将一个或多个指令的一个或多个序列加载到处理器以供执行。计算机系统301可以包括电子显示器335或与电子显示器335通信,电子显示器335包括用户界面(ui)340,该用户界面340用于提供例如选择感兴趣的种类和来自感兴趣种类的感兴趣基因的能力。ui的实例包括但不限于:图形用户界面(gui)和基于网络的用户界面。本文提到的任何计算机系统都可以利用任何合适数目的子系统。在一些情况下,计算机系统包括单个计算机设备,其中子系统可以是计算机设备的组件。在其他情况下,计算机系统可以包括多个计算机设备,每个计算机设备是具有内部组件的子系统。计算机系统可包括台式计算机、膝上型计算机、平板电脑、移动电话、可穿戴设备或其任何组合。子系统可以经由系统总线互连。附加子系统可包括打印机、键盘、存储装置和可耦合到显示适配器的监视器。可耦合到输入/输出(i/o)控制器的外围装置和i/o装置可以通过本领域已知的任何数目的连接如输入/输出(i/o)端口(如usb,)连接到计算机系统。例如,i/o端口或外部接口(例如,以太网、wi-fi等)可用于将计算机系统连接到广域网如因特网、鼠标输入装置或扫描仪。经由系统总线的互连可允许中央处理器与每个子系统通信并控制来自系统存储器或存储装置(例如,固定磁盘如硬盘驱动器或光盘)的多个指令的执行,以及子系统之间的信息交换。系统存储器和/或存储装置可以体现为计算机可读介质。另一子系统可以是数据收集装置,如相机、麦克风、加速度计等。本文提到的任何数据都可以从一个组件输出到另一组件,并且可以输出给用户。实施方案的各方面可以以控制逻辑的形式,使用硬件(例如,专用集成电路或现场可编程门阵列)和/或使用计算机软件,借助一般可编程处理器以模块化或集成的方式来实现。如本文使用,处理器可包括单核处理器、同一集成芯片上的多核处理器或者单个电路板上或联网的多个处理单元。基于本文提供的公开内容和教导,本领域普通技术人员将知道并理解使用硬件以及硬件和软件的组合来实现本文所述的实施方案的其他方式和/或方法。本申请中描述的任何软件组件或功能可以实现为由处理器执行的使用任何合适的计算机语言(例如,java、c、c++、c#、objective-c、swift或脚本语言如perl或python)的使用例如常规或面向对象技术的软件代码。软件代码可以作为一系列指令或命令存储在计算机可读介质上以供存储和/或传输。某些术语本文使用的术语仅出于描述特定情况的目的,而非意在限制。讨论以下术语以说明在本说明书中使用的术语除了本领域技术人员对这些术语的理解之外的含义。除非上下文另有明确说明,否则如本文和随附权利要求中所用的,单数形式“一个”、“一种”和“该”包括复数指代物。应当进一步指出,权利要求可撰写为排除任何可选的要素。因此,本声明旨在作为与对权利要求要素的记载一同使用排他性术语如“只”、“仅”等的在先基础,或作为使用“否定性”限制的在先基础。本文通过在数值前面带有术语“约”来示出某些范围。术语“约”在本文中用于对其后的准确数字提供字面支持,以及提供与该术语之后的数字接近或近似的数字。在确定一个数字是否接近或近似于某个具体列举的数字时,接近或近似的未列举的数值可以是这样的数值,该数值在其出现的上下文中与所具体列举的数值基本上等同。当提供数值范围时,应当理解,在此范围的上限与下限之间的每个中间值(精确到下限单位的十分之一,除非上下文另外明确地指出)以及在所述范围内的任何其他所指出的或中间的值都包含在本文所述的方法和组合物中。这些较小范围的上限和下限可独立地包括在较小范围中,而且也包含在本文所述的方法和组合物中,除了所述范围内任何具体排除的限值。当所述范围包括限值中的一个或两个时,排除这些所含限值中的任何一个或两个的范围也被包括在本文所述的方法和组合物中。术语“个体”、“患者”或“受试者”可以互换使用。这些术语均不要求或限于以医护人员(例如医生、注册护士、从业护士、医生助理、护理员或临终关怀工作者)的监督(例如,持续或间歇性)为特征的情况。进一步地,这些术语可以指人类或动物受试者。“治疗”或“疗法”可以指治疗性治疗和预防性或防范性措施,其中目的可以是预防或减慢(减轻)目标病理病况或病症。需要治疗的患者可包括已经患有该疾病的那些患者,以及易患该疾病的那些患者或要预防该疾病的那些患者。例如,如果受试者(例如,哺乳动物)在接受治疗后显示出以下一项或多项的可观察和/或可测量的降低或消失,则可能成功地“治疗”了受试者的肿瘤:癌细胞数的减少或癌细胞的缺失;肿瘤大小的减小;抑制(即,在某种程度上减缓并优选停止)癌细胞浸润到周围器官中(包括癌症向软组织和骨骼的扩散);抑制(即,在某种程度上减慢并优选停止)肿瘤转移;在某种程度上抑制肿瘤生长;和/或在某种程度上减轻与特定癌症相关的一种或多种症状;降低发病率和/或死亡率,以及改善生活质量问题。以下实施例提供了本发明某些方面的非限制性说明。实施例实施例1.影响非npc受试者中血浆ebv基因的可检测性的因素的确定研究了可能影响未患有npc的参与者中血浆ebvdna的阳性率的因素。这组受试者可经历随访以进一步的研究,并代表在npc筛查中的假阳性筛查案例。在非npc受试者中鉴定与可检测的血浆ebvdna相关的因素可用于减少假阳性筛查结果的数目。在这项研究中,对参加npc筛查研究但在筛查后3年内未患有npc的20,138名参与者(40至62岁的男性)进行了分析。分析了他们的人口统计学数据、合并症以及筛查当天的平均环境温度。环境温度是从香港天文台获得的。首先进行单变量分析,然后进行多变量逻辑回归以鉴定与可检测血浆ebvdna独立相关的因素。进行单变量分析以研究各个因素对血浆ebvdna可检测性的影响。单独测试的因素是年龄、当前吸烟状态、当前饮酒状态、运动习惯、糖尿病状态、高血压状态、高脂血症状态和缺血性心脏病。年龄与可检测的血浆ebvdna之间存在正相关(p<0.001,r=0.651,线性回归;见图1)。年龄每增加5岁,血浆ebvdna的阳性率就会增加0.6%。当前的吸烟状态与可检测的血浆ebvdna之间存在统计学上显著的关系(p<0.001,卡方检验;表1)。优势比为1.48。表1.基于当前吸烟状态,检测不到血浆ebvdna和可检测到血浆ebvdna的个体的数目当前吸烟者非当前吸烟者检测不到血浆ebvdna374815312可检测到血浆ebvdna286792饮酒量与可检测的血浆ebvdna之间无统计学上显著的关系(p=0.9086,卡方检验;表2)。表2.基于当前饮酒状态,检测不到血浆ebvdna和可检测到血浆ebvdna的个体的数目当前饮酒者非当前饮酒者检测不到血浆ebvdna127616299可检测到ebvdna720358运动习惯与可检测的血浆ebvdna之间没有相关性(p=0.7441,卡方检验;表3)。定期运动定义为每周有至少两天进行至少30分钟的中度运动。表3.基于运动习惯,检测不到血浆ebvdna和可检测到血浆ebvdna的个体的数目定期运动没有定期运动检测不到血浆ebvdna133755683可检测到血浆ebvdna751327糖尿病与可检测的血浆ebvdna之间存在统计学上显著的影响(p=0.012,卡方检验;表4)。表4.基于糖尿病状态,检测不到血浆ebvdna和可检测到血浆ebvdna的个体的数目未患有糖尿病患有糖尿病检测不到血浆ebvdna179291131可检测到血浆ebvdna99385高血压与可检测的血浆ebvdna之间存在统计学上显著的关系(p=0.009,卡方检验;表5)。表5.基于高血压状态,检测不到血浆ebvdna和可检测到血浆ebvdna的个体的数目高脂血症与可检测的血浆ebvdna之间无统计学上显著的关系(p=0.18,卡方检验;表6)。表6.基于高脂血症状态,检测不到血浆ebvdna和可检测到血浆ebvdna的个体的数目未患有高脂血症患有高脂血症检测不到血浆ebvdna167882272可检测到血浆ebvdna935143缺血性心脏病与可检测的血浆ebvdna之间无统计学上显著的关系(p=0.06,卡方检验;表7)。表7.基于缺血性心脏病状态,检测不到血浆ebvdna和可检测到血浆ebvdna的个体的数目温度与可检测的血浆ebvdna之间存在负相关(p<0.001,r=0.651,线性回归;图2)。平均环境温度每降低5℃,血浆ebvdna阳性率就会增加0.85%。为了进一步研究这些因素是否与可检测血浆ebvdna独立相关,进行了多变量逻辑回归分析。在多变量逻辑回归分析中,只有年龄、当前吸烟状态和环境温度与血浆ebvdna的可检测性增加独立相关(表8)。糖尿病和高血压对血浆ebvdna的影响可能会随年龄而混淆,因为这两种情况在老龄人群中更为普遍。根据多变量分析,吸烟者比非吸烟者检测到血浆ebvdna的可能性高1.59倍。表8.影响非npc受试者中血浆ebv基因的可检测性的因素的多变量逻辑回归回归系数标准误差p值年龄0.0330.005<0.001当前吸烟状态0.4630.072<0.001环境温度-0.0220.006<0.001糖尿病0.1520.1210.207高血压0.0960.0820.243非npc受试者中血浆ebvdna的阳性率的增加可能是由于瞬时病毒复制的存在。在npc筛查的背景下,非npc受试者中可检测的血浆ebvdna的存在可代表假阳性筛查结果,并且可能需要通过鼻内窥镜检查和mri进行研究。因此,降低非npc受试者中血浆ebvdna的检测率可提高筛查程序的成本效益。参见chan等人.(2018)ambienttemperatureandscreeningfornasopharyngealcancer.nejm378:962-963)。实施例2.血浆ebv的检测血浆样品取自一名有吸烟习惯的60岁女性,她疑似患有鼻咽癌(npc)。血浆样品中ebvdna的浓度通过使用对ebv基因组的bamhi-w区的实时定量pcr(qpcr)进行测量。还对β-珠蛋白基因进行了实时定量pcr以作为对照。每个qpcr反应进行三次重复。使用来自ebv阳性细胞系的dna作为标准,平行地对每个qpcr运行校准曲线。确定血浆ebvdna的浓度,并表示为每毫升血浆中ebv基因组的拷贝数。基线阈值血浆ebvdna水平设置为100,000个拷贝/ml。然而,考虑到该女性是吸烟者,将该阈值设置得高10%,达到110,000个拷贝/ml。该女性中检测到的血浆ebvdna量为100,500个拷贝/ml。考虑到这低于调整后的阈值,该女性未被怀疑患有npc,并不会进行进一步的筛查。虽然本文已经示出并描述了本发明的优选实施方案,但是对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下现将想到多种变化、改变和替换。应当理解,本文所述的本发明实施方案的各种替代方案均可用于实践本发明。以下述权利要求旨在限定本发明的范围,从而覆盖这些权利要求范围内的方法和结构及其等同项。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1