使用时间图来进行井下钻探估计以用于自动钻探操作的系统和方法与流程

文档序号:20167051发布日期:2020-03-24 21:46阅读:315来源:国知局
使用时间图来进行井下钻探估计以用于自动钻探操作的系统和方法与流程
相关申请的交叉引用本申请要求保护2017年7月11日提交的美国临时申请no.62/531,191的权益并且作为其非临时专利申请,其全部内容通过引用并入于此。本发明涉及井下钻探系统,并且更具体地,涉及使用时间图的自动井下钻探系统。
背景技术
:钻探是一种危险的职业,并且因机械故障和破损而造成人身伤害的风险导致了对自主钻探操作的推动,这将使操作人员可以在距钻头设备相对较远的地方作业,并且最小程度地与系统进行交互。理想情况下,自主钻探设备将减少操作员因长时间工作而造成的疲劳所导致的错误,并使钻头能够执行自我诊断,从而在人类操作员能够看到警告标志之前很久就确定何时可能发生钻头的潜在危险的或灾难性的问题。然而,自主钻头还必须能够获知当前正在执行的内容(这可能与被告知要执行的内容或认为正在执行的内容有所不同)。已经进行了至少一种尝试来开发自主钻探系统。tichel等人(参见引入的参考文献列表,参考文献no.1)使用有线钻管、高速井下数据以及闭环钻探自动化技术来驱使对跨多口井的性能改善。他们的系统使用井下传感器和有线钻管将传感器信息发送到地表,在地表,通过地表上与钻探环境的控制有关的计算环境中的算法来对该传感器信息进行处理。他们的系统中的自动化遵循“计划、检查、调整”环路(即,闭环控制),这可使钻柱振动、自动化导向得到控制以及控制井下钻压(weight-on-bit(wob))。然而,他们的系统的关键缺点是它不是真正自主的;该系统需要监督,并且偶尔需要操作员的输入。此外,他们的系统无法检测井下的故障和潜在问题。因此,人类操作员的角色从主动参与者变为没有从环路中移除的半被动参与者。所有关键决策仍然需要操作员来做出。另外,由于传感器数据不是在井下处理的,而是使用有线钻管传送至地表,因此他们的方法受到与有线钻管相关联的成本的限制。因此,持续需要一种仅使用井下传感器就可以执行钻头的自主控制的系统。还需要这样一种系统,该系统能够快速适应变化的井下状况,以避免潜在的故障状况,同时避免与安装相关联的成本(比如能够将传感器数据发送至地表以进行处理的有线钻管)。技术实现要素:描述了一种使用井下传感器来确定钻头的当前状态的系统。在各个方面,在钻柱上近钻头地安装传感器套件。此外,在钻柱上接近所述传感器套件地安装计算机。所述计算机具有训练过的分类器并且在能够上能够执行下面的操作:从所述传感器套件接收在线传感器数据;以及基于所述在线传感器数据将所述钻头分类为处于多种预训练的钻头状态中的一种钻头状态。在另一方面,包括钻头控制器。所述钻头控制器具有一个或更多个处理器以及存储器,所述存储器是编码有可执行指令的非暂时性计算机可读介质,使得在执行所述指令时,所述一个或更多个处理器执行基于所述钻头状态分类来修改所述钻头的操作的操作。在又一方面,所述分类器是基于从先前的钻探操作记录的离线传感器数据来训练的,所述离线传感器数据被转换成离线时间图。此外,所述在线传感器数据被转换成在线时间图,并且所述钻头状态是通过将所述在线时间图与相似的一组离线时间图进行匹配来分类的。另外,所述在线时间图是通过使所述传感器套件中的各个传感器的自由度与该传感器自身在所述在线时间图中的节点相关联来创建的,提供了总计九个节点。此外,在所述节点之间存在边,使得所述在线时间图中的所述节点中的任两个节点之间的边(u,v)∈et的权重按时间系列中的给定的固定宽度时间窗口,根据传感器u与传感器v之间的统计关系来限定。最后,本发明还包括一种计算机程序产品和计算机实现方法。所述计算机程序产品包括存储在非暂时性计算机可读介质上的计算机可读指令,该计算机可读指令能够由具有一个或更多个处理器的计算机执行,使得在执行所述指令时,所述一个或更多个处理器执行本文列出的操作。另选地,所述计算机实现方法包括使计算机执行这种指令并且执行所得操作的行为。附图说明根据下面结合参照附图对本发明各个方面的详细描述,本发明的目的、特征以及优点是显而易见的,其中:图1是描绘根据本发明的各个实施方式的系统的组件的框图;图2是具体实施本发明的一个方面的计算机程序产品的例示图;图3a是描绘“钻头滑动”状态的传感器阵列信号的图形;图3b是描绘“钻头旋转”状态的传感器阵列信号的图形;图4是描绘边的权重随时间的演变的例示图,在时间图中示出了顶点的数量保持不变,但是可使这些顶点之间的边的权重发生改变;图5是有关特征矢量的k均值聚类的直方图;图6是钻头状态的直方图;图7是按多折(fold)的分类错误的直方图;图8是描绘根据本发明的各种实施方式的系统的离线组件和在线组件的例示图;以及图9是描绘根据各种实施方式的装置的控制的框图。具体实施方式本发明涉及井下钻探系统,更具体地,涉及使用时间图的自动井下钻探系统。呈现以下描述以使本领域普通技术人员能够制造和使用本发明并将其并入特定应用的背景中。各种变型例以及不同应用方面的多种用途对于本领域技术人员来说是显而易见的,并且本文定义的一般原理可以被应用于广泛的方面。因此,本发明不旨在限于所呈现的方面,而是符合与本文所公开原理和新颖特征相一致的最广范围。在下面的详细描述中,阐述了许多具体细节,以便提供对本发明的更详尽理解。然而,本领域技术人员应当明白,本发明可以在不受限于这些具体细节的情况下来实践。在其它情况下,公知结构和装置按框图形式而不是按细节示出,以便避免模糊本发明。将读者的注意引向与本说明书同时提交的所有文件和文档,并且所述文件和文档可以利用本说明书开放以供公众查阅,所有这些文件和文档的内容通过引用并入于此。本说明书中公开的所有功能(包括任何所附权利要求、摘要以及附图)可以用服务相同、等同或相似目的的另选特征来代替,除非另有明确说明。因此,除非另有明确说明,所公开的每个特征仅仅是通用系列的等同或相似特征中的一个例子。而且,权利要求中没有明确陈述“用于执行指定功能的装置”或“用于执行特定功能的步骤”的任何部件不解释为如在35u.s.c.112节第6款中指定的“装置”或“步骤”条款。特别地,在本文的权利要求中使用“…的步骤”或“……的动作”不旨在援引35u.s.c.112节第6款的规定。在详细描述本发明之前,首先提供了引用参考文献的列表。接下来,提供了对本发明各个主要方面的描述。随后,向读者进行了介绍,使得能够对本发明有个总体上的理解。最后,提供本发明各个实施方式的具体细节以取得对具体方面的理解。(1)引入参考文献列表贯穿本申请引用以下参考文献。为了清楚和方便起见,这些参考文献在此被列为读者的中心资源。下列参考文献通过引用并入于此,就像在此完全陈述的一样。这些参考文献通过参照如下对应文献参考号而在本申请中加以引用:1.trichel,d.k.,isbell,m.,brown,b.,flash,m.,mcray,m.,nieto,j.,&fonseca,i.(2016).“usingwireddrillpipe,high-speeddownholedata,andclosedloopdrillingautomationtechnologytodriveperformanceimprovementacrossmultiplewellsinthebakken,”iniadc/spedrillingconferenceandexhibition.societyofpetroleumengineers。2.bishop,christopherm.(2006)“patternrecognitionandmachinelearning,”informationsciencesandstatistics.springer-verlag,newyork2006,pages242-428。(2)主要方面本发明的各种实施方式包括三个“主要”方面。第一主要方面是用于自主井下钻探的系统。该系统通常采用计算机系统操作软件的形式或采用“硬编码”指令集的形式。该系统可以并入提供不同功能的各种各样的装置中。第二个主要方面是通常采用软件的形式的方法,其利用数据处理系统(计算机)进行操作。第三个主要方面是计算机程序产品。计算机程序产品通常表示存储在诸如光学存储装置(例如,光盘(cd)或数字通用盘(dvd))或磁存储装置(例如,软盘或磁带)的非暂时性计算机可读介质上的计算机可读指令。计算机可读介质的其它非限制示例包括:硬盘、只读存储器(rom)以及闪存型存储器。这些方面将在下面进行更详细描述。图1中提供了描绘本发明的系统(即,计算机系统100)的示例的框图。计算机系统100被配置成执行与程序或算法相关联的计算、处理、操作和/或功能。在各个方面,本文所述的计算机系统100是钻柱上接近传感器套件安装的并且被配置成执行本文所述的操作的计算机。在一个方面,本文讨论的某些处理和步骤被实现为驻留在计算机可读存储器单元内并由计算机系统100的一个或更多个处理器执行的一系列指令(例如,软件程序)。在执行时,所述指令使计算机系统100执行特定动作并展现特定行为,如本文所描述的。计算机系统100可以包括被配置成传送信息的地址/数据总线102。另外,一个或更多个数据处理单元(例如处理器104(或多个处理器))与地址/数据总线102联接。处理器104被配置成处理信息和指令。在一方面,处理器104是微处理器。另选地,处理器104可以是不同类型的处理器,例如并行处理器、专用集成电路(asic)、可编程逻辑阵列(pla)、复杂可编程逻辑器件(cpld)或现场可编程门阵列(fpga)。计算机系统100被配置成利用一个或更多个数据存储单元。计算机系统100可以包括与地址/数据总线102联接的易失性存储器单元106(例如,随机存取存储器(“ram”)、静态ram、动态ram等),其中,易失性存储器单元106被配置成存储用于处理器104的信息和指令。计算机系统100还可以包括与地址/数据总线102联接的非易失性存储器单元108(例如,只读存储器(“rom”)、可编程rom(“prom”)、可擦除可编程rom(“eprom”)、电可擦除可编程rom(“eeprom”)、闪存等),其中,非易失性存储器单元108被配置成存储用于处理器104的静态信息和指令。另选地,计算机系统100可以执行从诸如“云”计算中的在线数据存储单元取得的指令。在一方面,计算机系统100还可以包括与地址/数据总线102联接的一个或更多个接口,例如接口110。所述一个或更多个接口被配置成使得计算机系统100能够与其它电子装置和计算机系统连接。由所述一个或更多个接口实现的通信接口可以包括有线(例如,串行电缆、调制解调器、网络适配器等)和/或无线(例如,无线调制解调器、无线网络适配器等)通信技术。在一个方面,计算机系统100可以包括与地址/数据总线102联接的输入装置112,其中,输入装置112被配置成将信息和命令选择传送至处理器100。根据一个方面,输入装置112是字母数字输入装置(如键盘),其可以包括字母数字键和/或功能键。另选的是,输入装置112可以是除字母数字输入装置之外的其它输入装置。在一方面,计算机系统100可以包括与地址/数据总线102联接的光标控制装置114,其中,光标控制装置114被配置成将用户输入信息和/或命令选择传送至处理器100。在一方面,光标控制装置114是利用诸如鼠标器、轨迹球、轨迹板、光学跟踪装置或触摸屏的装置来实现的。前述尽管如此,但在一方面,例如响应于使用与输入装置112相关联的特殊键和键序列命令,光标控制装置114经由来自输入装置112的输入而被引导和/或启用。在另选方面中,光标控制装置114被配置成通过语音命令指引或引导。在一方面,计算机系统100还可以包括一个或更多个可选的计算机可用数据存储装置,例如与地址/数据总线102联接的存储装置116。存储装置116被配置成存储信息和/或计算机可执行指令。在一个方面,存储装置116是诸如磁或光盘驱动器(例如,硬盘驱动器(“hdd”)、软盘、光盘只读存储器(“cd-rom”)、数字通用盘(“dvd”))的存储装置。依据一个方面,显示装置118与地址/数据总线102联接,其中,显示装置118被配置成显示视频和/或图形。在一方面,显示装置118可以包括:阴极射线管(“crt”)、液晶显示器(“lcd”)、场发射显示器(“fed”)、等离子体显示器,或者适于显示视频和/或图形图像以及用户可识别的字母数字字符的任何其它显示装置。本文所呈现的计算机系统100是根据一方面的示例计算环境。然而,计算机系统100的非限制示例并不严格限于作为计算机系统。例如,一个方面提供了计算机系统100表示可以根据本文所述各个方面使用的一类数据处理分析。此外,还可以实现其它计算系统。实际上,本技术的精神和范围不限于任何单一数据处理环境。因此,在一方面中,使用通过计算机执行的计算机可执行指令(例如程序模块)来控制或实现本技术的各个方面的一个或更多个操作。在一个实现中,这样的程序模块包括被配置成执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件和/或数据结构。另外,一个方面提供了通过利用一个或更多个分布式计算环境来实现本技术的一个或更多个方面,例如,在该计算环境中,任务由通过通信网络链接的远程处理装置执行,或者例如,在该计算环境中,各种程序模块位于包括存储器-存储装置的本地和远程计算机存储介质中。图2中描绘了具体实施本发明的计算机程序产品(即,存储装置)的例示图。计算机程序产品被描绘为软盘200或诸如cd或dvd的光盘202。然而,如先前提到的,该计算机程序产品通常表示存储在任何兼容的非暂时性计算机可读介质上的计算机可读指令。如关于本发明所使用的术语“指令”通常指示要在计算机上执行的一组操作,并且可以表示整个程序的片段或单个分离的软件模块。“指令”的非限制示例包括计算机程序代码(源或目标代码)和“硬编码”电子装置(即,编码到计算机芯片中的计算机操作)。所述“指令”被存储在任何非暂时性计算机可读介质上,例如存储在计算机的存储器中或者软盘、cd-rom以及闪存驱动器上。无论如何,这些指令被编码在非暂时性计算机可读介质上。(3)介绍如上文提到的,钻探是一种危险的职业,从而导致了对自主钻探的推动。本公开通过提供使用时间图进行自主井下钻探的系统和方法来致力于解决该问题。所述系统根据来自传感器套件的井下传感器数据来创建特征空间,该特征空间可以被用于在任何给定的时间仅使用井下数据(即,在没有来自地表的帮助的情况下,并且无人参与)来确定当前钻探状态。该特征空间使用时间图,并在由加速度计和磁力计组成的传感器套件或阵列上运行,以对传感器之间的信息流进行建模,以确定钻头状态,从而可使自主控制钻头;这样的传感器阵列或套件的非限制性示例是如美国专利公报no.2018/0080310中所公开的,其通过引用并入于此。与现有技术不同,本系统在任何时候都不需要人工输入,这通过将现有人员远离钻柱而减少了所需的钻探人员数量并提高了安全性。本文所述的系统可使钻机仅使用来自井下传感器的输入(来自地表的输入为零)就自动确定这些钻机的当前状态。所述方法被设计成在井下实时工作,以立即确定钻头的状态并在问题变得难以处理之前纠正这些问题。该方法还可以被用于在潜在故障发生之前自动进行预报,使得可以在发生设备损坏或现场人员受伤之前停止钻头运转。本系统提供的信息甚至可以被用于通过填补因缺失或损坏的数据而造成的间隙并估计无法观察到的和潜伏的状态(这可能对应于在工程数据中未明确描述的故障前或危险的状况)来改善现有地表数据的质量。因此,本文所述的系统包括几个独特的方面,例如:(1)为井下传感器数据创建特征空间,以使用标准分类器来确定钻头状态;(2)该特征空间采用时间图来对传感器数据中的随着时间的信息流进行建模;(3)包括该特征空间和机器学习算法(即,svm)的系统可以使用来自井下传感器的数据对钻头状态进行分类;(4)该系统的操作在任何时候都不需要任何人工参与;以及(5)该系统可以识别钻机中当前钻头技术无法量化的“隐藏状态”。这些方面消除了对地表交互和有线钻管的需求(这是昂贵的);比地表计算方法快(自主需要实时操作);允许识别故障或其它问题(通过识别隐藏状态或潜伏状态);并且改善情况感知并提高钻探性能。除了被用于确定钻头的状态并控制此类钻头之外,本文所述的方法还可以用于改善地表数据集的质量(通过使用机器学习算法和井下数据)。通过理解来自井下传感器的信号,可以填补地表数据中缺失或损坏的区域,在这样的区域中,间隙是常见的。另外,融合的井下地表数据表示可以被离线用于数据发现任务(即“大数据分析”)以及对无法观察到的变量和潜伏的状态的估计,例如钻孔速度(rate-of-penetration(rop))和机械比能(mse)。最后,该方法可以被扩展成使用井下数据来执行异常检测和预警指示。这将改善自主导引并且警告可能导致钻头损坏和对钻探人员造成伤害的潜在的危险状况。这可以结合井下状态跟踪来执行,从而确定哪些状态是因意外行为而被错误分类的,并且通过引入先前运行的历史数据来根据井下数据对系统的未来行为进行预测。下面提供关于本发明的具体细节。(4)各个实施方式的具体细节如上文提到的,本公开提供了涉及使用时间图的自动井下钻探系统。自主钻头必须能够获知当前正在执行的内容(这可能与被告知要执行的内容或认为正在执行的内容有所不同)。这需要一种用于提取信息特征的轻量级方法以及一种可以在井下对钻柱上的嵌入式硬件进行操作的分类器方法。本发明提出了这样的一种特征生成和状态分类的方法,即,该方法仅采用来自传感器阵列(例如,多个传感器,例如陀螺仪、加速度计以及磁力计)的井下数据,并可使在井下通过钻柱中的嵌入式处理器来执行分类;这避免了对昂贵的有线钻管的需求,并且与使用地表传感器相比,可使更快地进行分类。(4.1)方法(4.1.1)传感器数据本文所述的系统和方法使用任何合适的传感器阵列。理想的是,所述传感器套件或阵列包括:陀螺仪、加速度计以及磁力计,所述陀螺仪、加速度计以及磁力计中的每一者都返回三个自由度(即,x轴、y轴和z轴)的信息,总计达九个信号。如图3a和图3b所示,根据钻头正在执行的操作,这些信号可能具有不同的“形状”。具体地,图3a和图3b分别提供了针对“钻头滑动”状态和“钻头旋转”状态的传感器阵列信号的图形比较。在十秒钟的窗口内进行的快速傅立叶变换表明,在这些不同的钻探阶段期间,传感器所生成的信号在这些信号的频谱中具有不同的“形状”,从而可以被用于识别所述状态。目的是使用来自这九个信号的数据来确定钻头的当前操作状态(例如,旋转、滑动、测量、脱扣(trip)、滑移(slip)等),使得整个操作在井下进行。对于“真值(groundtruth)”,可以使用任何合适的历史传感器数据。作为非限制性示例,使用pason状态数据,这是有关在地表上汇集的钻头的信息。真值状态数据被用于创建将井下传感器读数与特定钻头状态相关联的训练数据。例如,pason状态数据是从位于6130thirdstreet,se,calgary,abt2h1k4,canada的pason获得的。(4.1.2)机器学习机器学习本身是以两种形式来表现的:无监督学习和有监督学习。每种形式都有不同的用途和益处。无监督的机器学习是指这样的一类算法,即,该类算法的目标是发现未标记数据中的结构并且识别所述数据内的要素之间的相似性和模式。在这类算法内,学习模式是聚类-将一组要素划分成多个集合的任务,其中,单个集合的成员彼此类似,但与其它集合的成员不同。因为没有向聚类算法提供有标签的示例,所以这些聚类算法对用于输入数据的表示非常敏感。在本系统中,使用k均值聚类算法作为无监督学习的一种形式,该k均值聚类算法在逻辑上将相似的数据点隔离成多个组的固定集合,并且可以在所述数据中找到隐藏的信号和结构。有关该算法的细节,参见bishop在第9章的内容(参见参考文献no.2)。与无监督学习相比,有监督学习使用外部确定的标签来限定数据集中的“真值”。有用的是,将这种学习模式想像为具有指导机器有关特征的真实分类(例如,“真”或“假”、“a”或“b”、“滑动钻探”或“旋转钻探”)的老师,并且该机器确定特征与标签之间的恰当关联。对于有监督学习,通常将数据划分成训练集和测试集;该机器使用规定的学习算法(例如支持矢量机(svm))来确定输入的特征与训练集中的真值之间的关系。然后,针对测试集验证训练过的算法的性能;这是评估机器概括以前从未见过的数据的能力的公认方法。(4.1.3)对训练数据进行预处理在可以应用任何特征提取或学习算法之前,必须清空并对准传感器套件或阵列数据与pason状态数据。目的是将来自pason状态数据的钻头状态指派给井下传感器数据中的每个数据点集。该过程涉及去除与物理上不可能的配置相对应的错误数据,例如传感器读数或pason钻头状态。因为大量的pason状态数据显然是手动输入的,所以必须纠正一些印刷上的错误和不一致的速记;例如,一些未对准是由于这两个数据集之间的时钟/时间戳未同步的缘故。该对准过程需要使来自传感器套件中的传感器的各个数据流彼此同步,并且将传感器套件和pason数据集两者的时间方面对准。例如,该对准可以由操作员手动完成。预处理的最后阶段涉及对时间数据流的多个区段的钻头状态进行识别。这是通过创建具有一些基于手调谐阈值的规则的决策树来完成的,这些规则最终给出“真值”标签,这些标签指示在任何给定时间的钻头/钻机的状态(例如,旋转、滑动、扩孔、测量等)。将这些标签指派给对应的井下数据,并且随后在有监督学习(分类)实验和评估无监督学习(聚类)实验中加以使用。这种手动标记需要领域专业知识(domainexpertise);即,熟悉钻探过程。例如,如果观察到钻头正在旋转并靠近地表,那么这将被识别为“扩孔”操作。(4.1.4)特征提取(4.1.4.1)实验no.1:原始数据作为第一步骤,该任务尝试将原始的井下传感器数据用作可以用作机器学习算法的输入的特征。在前述预处理步骤之后,将该数据直接馈送到训练算法中。在这种范式下,特定时间点的特征是在那个时刻由来自加速度计、磁力计以及陀螺仪三者的x轴、y轴以及z轴的读数组成的九维矢量。针对该数据的机器学习因该信号中的高噪声而无法提供足够的类分离。(4.1.4.2)实验no.2:频谱特征在徒劳无功地使用原始数据并且相信能够通过查看传感器数据的频谱内容来找到有关钻探状态的大量信息之后,该任务对落入固定宽度的时间窗口内的数据使用短时傅立叶变换来检查井下传感器的时变频谱。频谱分析表明,在仅查看传感器的频率数据时,能非常容易地辨别对基本的旋转钻头状态和滑动钻头状态的识别。如果是这样,则可以以机器学习算法可以利用的方式来捕获该信息。为了使系统实时运行(或者至少足够快,以便钻探人员能采取行动),可以将窗口宽度限制成从几秒钟到几分钟的值。然而,这项工作的结果表明,这些窗口的尺寸太小而无法使井下传感器数据中存在的噪声的影响最小化。(4.1.5)解决方案:时间图在尝试使用原始数据和频谱表示来训练机器学习算法但未成功之后,尝试使用时间图来对传感器套件信息进行编码。网络图是由边连接的一组节点,网络图提供一组实体以及这些实体之间的关系的静态快照。所述图中的任两个节点之间的连接的强度是由权重来指示的,所述权重是随着所述节点之间的连接的强度的增加而增加的某一正非零值。时间图以类似于电影如何扩展照片的方式来扩展静态图结构。在时间图中,节点不变,但是节点之间的边会以某一更新频率随时间演变;节点之间的连接可能会增强或者减弱,甚或完全消失。如果伪造了节点之间的新关系,则以前未见过连接的节点之间也可能呈现新的边。图4中例示了时间图的描述。图形g=(v,e)是由一组节点v与一些边限定的离散对象,所述节点和边提供了要素的集合以及这些要素之间的连接的静态快照,该图被表示为每条边(u,v)∈e上的非负权重。时间图通过引入时间要素402扩展了静态图400(及其节点401和边403);设g=(v,e1,e2,…,et)指示通过对一系列静态图g1=(v,e1),g2=(v,e2),…,gt=(v,et)进行“动画处理”而获得的时间图。wt(u,v)被用于指示针对t∈{1,…,t}的边(u,v)的权重。应注意,该表示在gt的所有不同值中使用公共的顶点集v,使得只有边会随时间变化。本公开的系统使用时间图,以通过使每个传感器(例如,加速度计、磁力计以及陀螺仪三者的x轴、y轴以及z轴)的自由度与该传感器本身在该图中的节点(提供了总计九个节点)相关联,来表示传感器套件传感器数据。所述图中的这些节点中的任两个节点之间的边(u,v)∈et的权重是根据按时间序列中的给定的固定宽度时间窗口的传感器u与v之间的统计关系来限定的,所述固定宽度的时间窗经过实验被优化成5秒的宽度(但本发明不限于此,并且可以使用任何期望的固定宽度的时间窗)。在该示例中,两个相邻的静态快照之间的最佳实时时间差异(即,电影的“帧速率”)被确定为0.1秒或10赫兹。给定时间窗口的时间图中的节点之间的权重是被传递到机器学习中的特征。最后,对两个节点之间的权重wt(u,v)的不同函数进行测试:协方差和互信息。由于来自传感器中的每个传感器的信号的内容在任何给定时刻都是不可预测的,因此可以将它们视为“随机变量”,并通过对两个随机信号之间的关系进行量化的统计度量来限定网络图中的节点之间的权重。在这种情况下,将协方差和互信息尝试作为边权重,以确定这些度量是否可以提取与机器学习算法可能利用的钻探状态有关的信息。出于参考目的,信号的方差表示该信号的各个测量值相对于该信号的总体平均值(均值)偏离了多少。因此,协方差度量是一种对一对信号共同相对于该对信号各自的均值偏离了多少进行测量的方式。信号x与信号y两者之间的协方差在形式上被限定如下:cov(x,y)=e[(x-e[x])(y-e[y])],其中,e[.]指示“期望值”运算符,其概念上类似于平均值或均值(尽管是不相同的)。为了确定互信息,必须首先确定单个随机变量的信息,然后扩展出去。有关以概率p(x)出现的随机变量x的信息被限定为:i(x)=-log(p(x)),并且被用于对该随机变量的“不可预测性”进行量化。类似地,关于协方差如何将方差概念扩展至多个变量,互信息度量将变量的信息内容的概念(即,其“不可预测性”)扩展至多个维,从而对从一个信号“传递”到另一信号的信息进行量化。x与y之间的互信息被限定如下:其中,p(x)和p(y)指示与变量x以及y相关联的概率。为了确定协方差和互信息是否编码了有关钻头状态的任何信息,将k均值无监督学习算法应用至所述特征,以查看是否出现任何模式。图5通过示出每个时间步的快照自然聚集在突出的钻头状态周围来例示时间图特征的可表达性。每个聚类(x轴)500的直方图对于所指示的钻头状态502中的每种状态都有一个彩色柱条。柱条的高度对应于在该聚类的点当中表示给定的钻头状态的点的数量(即,时间步的数量)504。由于k均值是一种无监督学习算法,因此各个聚类总体上与单个钻探状态相对应的倾向表明,特征矢量独立地编码了有关钻探状态的大量信息,并因此应当在机器学习算法中提供良好的分类能力。可以通过使用时间图对数据中的潜伏状态(即,不直接对应于钻头状态的状态)进行识别,然后针对观察到的(即,钻探)状态建立隐马尔可夫模型(hmm)来进一步扩展该方法,这可使更好地根据井下传感器数据来推断钻探状态。这种hmm方法以两种重要的方式建立于现有方法上。首先,聚类不再需要划分钻头状态的集合;相反,从聚类到钻头状态的映射将是概率性的(即,发射概率)。第二,相邻的点之间的时间连续性将保留在hmm中。(4.1.6)对算法进行训练为了教导所述算法以根据传感器数据正确地确定钻探状态,该系统采用了支持矢量机(svm)的多类版本。标准svm是一种广为人知且被广泛使用的二元分类器,该二元分类器将输入分类成两个类中的一个类,但是是能够被用于本发明的分类器的类型的非限制性示例。然而,该任务需要一种可以将输入特征分类成多个类中的一个类的算法。幸运地,有几种方法可以将多个二元分类器聚合成单个多类分类器。一种这样的方法涉及训练二元分类器以将输入分类为是在类中还是不在该类中。这通常被称为“一对多(one-versus-all)”方法。所需的二元分类器的数量等于整个问题中的类的数量。这种二元分类的聚合可以被看作代码,其中,每个类只有一个二元分类器用信号通知正值。例如,对于三个类,需要三个分类器(学习者):类学习者1学习者2学习者3a100b010c001另一种方法涉及训练分类器以将一个状态相对于另一状态进行分类(即,一对一分类器)。属于任何其它状态的数据点将被丢弃以训练特定的分类器。对于n个类,这种多类分类器训练全体二元分类器,这些二元分类器的大小基于可以从大小为n的全体中取得的对的组合数量。和前面的情况一样,尽管只是多个二元分类器可能给出正值的普遍情况,这种聚集也可以被看作二元分类器的编码。类学习者1学习者2学习者3a11xb0x1cx00该表中的x表示未利用该类中的数据点对学习者进行训练。多类决策只是三个二元分类的总和(在这种情况下:a=2、b=1、c=0)。因为这种多类分类的编码性质,所以这些方法被共同称为纠错输出代码(ecoc)。可以将这些方法推广至更多的学习者,并且可以在二元分类的子集有错误时将所述代码设计成在非理想情况下使性能最大化。对于这项工作,实施了使用一对一的二元svm的ecoc学习方法。(4.2)付诸实践评估训练过的分类器的性能的直接方法是对学习算法在训练期间未见过的数据进行测试。如先前提到,这涉及将数据划分成训练集和测试集。交叉验证是对这种简单划分的改进,该交叉验证通过将数据集分割成相等的部分(称为折(fold)),并且在已经对该数据集中的剩余的折进行了训练之后迭代地对每个折进行测试。与简单的单个训练/测试划分相比,对有关每个折的测试的性能求平均提供了泛化错误的更好估计。自举是另一种利用替换来对所述折进行采样的方法,相比简单的均等划分允许有更多的折,因为这些折可能会交叠。这项工作采用了自举和交叉折验证两者来对钻头状态分类器的训练进行验证。分类器学习的有多好取决于所提供的数据的量以及学习模型中可用的自由度有多少。更多的“节(knob)”需要更多的数据才能正确识别设定的各个组合的效果。考虑到对所述模型进行简化,这项工作在62小时到86小时的时间窗内,仅针对来自所选择的传感器数据中的与通过pason加标签的四个最主要的钻机或钻探状态(“滑动”、“旋转”、“添加管道”以及“未分类”)相对应的特征来进行训练,如图6所示。图6是钻机或钻探状态的直方图,其中,为了确定用于该实验的钻头状态,查看了24小时的钻探数据,并计算了每种状态下所花费的时间的量(沿横坐标指派的整数),并且用数字1、2、5以及11指示的最经常发生的状态对应于“滑动”、“旋转”、“添加管道”以及“未分类”。使用基于互信息的时间图作为特征,在前述钻头状态下对多类ecomsvm进行训练的初步结果表明总体分类准确度约为85%。为了进一步例示,图7是按多折的分类错误的直方图,其中,k折分析中的所述折中的每个折的分类误差往往非常低,在大多数情况下保持在15%之下,并且在实验中最常见的错误率约为7%。对所述折中的每个折如何测试的直方图提供了对分类器如何概括的更好了解。应注意,所述折中的大多数折的分类错误表现在10%到15%之间,其中少数异常值使总体平均表现产生歪斜。错误的可能解释是,与pason标签状态相比,进行分类的比率更高。输入数据分类器每秒钟一次钻头状态,但该分类器每0.1秒执行一次分类。可以设想的是,实际的钻头状态转变发生在一秒钟的间隔之间,但是真值并不能立即显示出这种转变。(4.3)离线组件和在线组件如图8所示,本文所述的系统包括离线组件800和在线组件802。离线组件802包括利用来自先前的钻探操作的历史传感器数据806对分类器804进行预训练,以创建钻探状态的标签。在操作期间,启用具有传感器套件810的钻柱808,以使对应的钻头812开始和/或继续其钻探操作。具有分类器804的计算机814也安装在钻柱808上接近传感器套件810的位置,以从传感器套件810接收传感器数据。当从传感器套件810接收到在线传感器数据时,计算机814基于在线传感器数据将钻头812分类为处于多种预训练的钻头状态中的一种钻头状态。然后,可以将所述分类传送至钻头控制器,该钻头控制器可以基于该分类来改变或者以其它方式修改钻头812的性能。(4.4)装置的控制。如图9所示,可以将处理器900(即,钻头控制器)用于基于确定钻头状态来控制装置902(例如,钻头齿轮(drillgear)和对应的钻头)。如本领域技术人员所理解的,钻头控制器包括一个或多个处理器、存储器以及对钻头的钻探操作进行控制所必需的任何其它合适的硬件和/或软件。对装置902的控制可以用于使钻机或齿轮改变实际钻头的速度、轨迹或位置。换句话说,钻头控制器基于钻头状态分类来修改钻头的操作。例如,如果钻头状态是位于钻井的底部,并且检测到一些异常颠簸,那么这可能指示破裂的钻头的早期发作,在这种情况下,钻头控制器可以通过将钻头拉出井的底部以做出响应。作为另一示例,如果分类器按比操作员愿意促成的速率更快的速率在多种钻头状态之间快速振荡,那么这种不稳定性可能表示即将发生的硬件故障(例如,失效的钻头),在这种情况下,控制器可以通过将钻头拉出井的底部并降低其转速以做出响应。或者,如果检测到钻头反弹,则控制器可以调整旋转速度和/或钻压以减轻该行为。最后,虽然已经根据几个实施方式对本发明进行了描述,但本领域普通技术人员应当容易地认识到本发明在其它环境中可以具有其它应用。应注意到,可以有许多实施方式和实现。而且,所附的权利要求绝不是旨在将本发明的范围限制成上述具体实施方式。另外,“用于…的装置(means)”的任何陈述都旨在唤起对部件和权利要求的装置加功能的解读,而不具体使用陈述“用于…的装置(means)”的任何部件不是旨在被解读为装置加功能部件,即使权利要求以其它方式包括了“装置(means)”一词。而且,虽然已经按特定次序陈述了特定的方法步骤,但这些方法步骤可以按任何期望的次序发生并且落入本发明的范围内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1