一种基于卷积自编码器的船舶AIS轨迹聚类方法和装置与流程

文档序号:22323797发布日期:2020-09-23 02:12阅读:2906来源:国知局
一种基于卷积自编码器的船舶AIS轨迹聚类方法和装置与流程

本发明涉及软件工程技术领域,特别是涉及一种基于卷积自编码器的船舶ais轨迹聚类方法和装置。



背景技术:

卫星ais(automaticidentificationsystem,船舶自动识别系统)是一种船舶定位技术,通过低轨道的卫星接收船舶发送的ais报文信息,卫星将接收和解码ais报文信息转发给相应的地球站,从而让陆地管理机构掌握船舶的相关动态信息,实现对远海海域航行船舶的监控。

为了提升船舶航运的能力和效率,现有技术对从ais中获取的船舶航行轨迹信息数据进行聚类,从而可以根据聚类结果来预测出航行方案。

轨迹聚类算法是解决实际问题的关键和基础,轨迹聚类算法被广泛用于众多现实应用中,例如:异常检测、移动对象行为预测、活动理解、3d结构重建和交通监视等。目前许多研究学者已经提出了许多轨迹聚类方法,它们使用某些轨迹相似性测量方法来量化轨迹相似性,然后应用一些经典的聚类算法,例如,k-均值,高斯混合模型以及基于密度的应用程序空间聚类等来对轨迹进行聚类分析。

传统的轨迹聚类方法通常需要根据相关数据量和轨迹类型,计算复杂度,噪声和其他影响因素来选择时空轨迹度量方法,其主要问题在于最佳相似性度量公式的选择需要大量的先验知识和广泛的实验,从而导致浪费了大量的计算资源和时间。



技术实现要素:

基于此,本发明的目的在于,提供一种基于卷积自编码器的船舶ais轨迹聚类方法和装置,以实现不需要人为选择时空轨迹相似度测量公式,从而可以避免使用传统相似度度量方法所带来的基于轨迹距离的相似度计算偏差。

第一方面,本申请实施例提供了一种基于卷积自编码器的船舶ais轨迹聚类方法,包括如下步骤:

获取船舶的连续轨迹,并将所述连续轨迹划分为若干子轨迹;

对若干所述子轨迹进行特征工程提取,得到子轨迹特征矩阵,其中,矩阵中第i行表示第i条子轨迹的特征值;

将所述子轨迹特征矩阵输入多特征融合自编码器,通过所述多特则会那个融合自编码器对位置、速度、航向的船舶特征向量进行特征提取,获得位置特征向量、速度特征向量和航向特征向量;

对所述位置特征向量、所述速度特征向量和所述航向特征向量进行拼接操作,获得船舶轨迹的潜在特征向量;

对提取后的船舶轨迹特征向量进行轨迹聚类操作,得到船舶轨迹聚类结果。

可选的,将所述连续轨迹划分为若干子轨迹,包括:

当所述连续轨迹中,某轨迹点相对于前一轨迹点的经度差或者纬度差的变化小于设定阈值,且其该轨迹点的速度接近于0时,将该轨迹点确定为一子轨迹的起点;

将所述连续轨迹中下一个相对于前一轨迹点的经度差或者纬度差的变化小于设定阈值,且速度接近于0的轨迹点确定为该子轨迹的终点。

可选的,对若干所述子轨迹进行特征工程提取,得到子轨迹特征矩阵后,还包括:

根据如下公式,对所述子轨迹特征矩阵中的特征进行归一化操作:

其中,δ表示需要被归一化的特征,min和max分别表示该特征的最大值和最小值,δ′表示经过归一化处理后得到的特征。

可选的,对所述子轨迹特征矩阵中的特征进行归一化操作后,还包括:

以最长的子轨迹点的数量作为标准,对其他轨迹数据进行0填充,使得船舶轨迹特征向量的长度相同。

可选的,所述多特征融合自编码器包括:

第一卷积自动编码器,用于学习船舶轨迹的位置类型特征;

第二卷积自动编码器,用于学习船舶轨迹的速度类型特征;

第三卷积自动编码器,用于学习船舶轨迹的航向类型特征。

可选的,所述位置类型特征包括经度和纬度;

所述速度类型特征包括速度和加速度;

所述航向类型特征包括航向和转弯速率。

可选的,针对每个卷积自动编码器,其结构包括:

输入层,用于获取到每条船舶轨迹特征数据的特征矩阵,将子轨迹数据展开成为子轨迹向量,并将其传递给编码器部分;

编码器,由卷积层和池化层组成,激活函数设置为relu函数,用于对子轨迹向量进行卷积运算,并输出提取到的船舶轨迹特征;

解码器,用于使用卷积层和上采样层的组合来实现反卷积功能,将低维的特征向量调整为高维的特征向量并传输到输出层;

输出层,用于将高维特征向量转换为原始轨迹特征向量大小,以使与输入层输入数据的纬度相同。

可选的,使用均方误差来衡量输出层数据和输入层数据之间的相似性,公式如下:

其中,mse表示均方误差,observedm表示真实的轨迹数据,predictedm表示预测的轨迹数据,n表示所有船舶的子轨迹总数。

可选的,还包括:

采用f1值方法对聚类效果进行评估,公式如下:

其中,tp表示正确地预测为正例的轨迹,fp表示错误地预测为正例的轨迹,fn表示错误地预测为反例的轨迹。

第二方面,本申请实施例提供了一种基于卷积自编码器的船舶ais轨迹聚类装置,所述装置包括:

轨迹获取模块,用于获取船舶的连续轨迹,并将所述连续轨迹划分为若干子轨迹;

特征工程模块,用于对若干所述子轨迹进行特征工程提取,得到子轨迹特征矩阵,其中,矩阵中第i行表示第i条子轨迹的特征值;

特征提取模块,用于将所述子轨迹特征矩阵输入多特征融合自编码器,通过所述多特则会那个融合自编码器对位置、速度、航向的船舶特征向量进行特征提取,获得位置特征向量、速度特征向量和航向特征向量;

拼接模块,用于对所述位置特征向量、所述速度特征向量和所述航向特征向量进行拼接操作,获得船舶轨迹的潜在特征向量;

聚类模块,用于对提取后的船舶轨迹特征向量进行轨迹聚类操作,得到船舶轨迹聚类结果。

在本申请实施例中,将船舶ais原始轨迹进行轨迹分割操作,获得分割后的船舶ais子轨迹,对每条船舶子轨迹进行特征工程操作得到ais船舶子轨迹特征矩阵,其中矩阵中第i行即代表第i条子轨迹的特征值;使用多特征融合自编码器对位置、速度、航向的船舶特征向量进行特征提取,获得三种类型特征向量,之后对三种类型的特征向量进行拼接操作,获得船舶轨迹的潜在特征向量,并使用主流的聚类算法对提取后的船舶轨迹特征向量进行轨迹聚类操作,可以实现不需要人为选择时空轨迹相似度测量公式,从而可以避免使用传统相似度度量方法所带来的基于轨迹距离的相似度计算偏差,还可以保留不同船舶特征类型的数据的分布,改善了计算性能。

为了更好地理解和实施,下面结合附图详细说明本发明。

附图说明

图1为本申请一个实施例中的一种基于卷积自编码器的船舶ais轨迹聚类方法流程图;

图2为本申请一个实施例中将连续轨迹划分为若干子轨迹的步骤流程图;

图3为本申请一个实施例中的一种基于卷积自编码器的船舶ais轨迹聚类方法流程示意图;

图4为本申请一个实施例中的一种基于卷积自编码器的船舶ais轨迹聚类方法应用的模型结构示意图;

图5为本申请一个实施例中的一种基于卷积自编码器的船舶ais轨迹聚类装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。

在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

接下来对本说明书实施例进行详细说明。

针对传统技术中的通常需要根据相关数据量和轨迹类型,计算复杂度,噪声和其他影响因素来选择时空轨迹度量方法,浪费大量的计算资源和时间的技术问题,本申请实施例提供了一种基于卷积自编码器的船舶ais轨迹聚类方法,如图1所示,在一个实施例中,所述方法包括如下步骤:

s101:获取船舶的连续轨迹,并将所述连续轨迹划分为若干子轨迹。

在本申请实施例中,首先需要将一艘船舶连续轨迹tr划分为若干子轨迹:即tr={tr1,tr2,...,trj},其中trj是船舶子轨迹,j表示一艘船舶的子轨迹总数。

本申请实施例将整条船舶轨迹tr分成一系列的船舶子轨迹,使得每条船舶的子轨迹可以准确地表示从一个港口到另一个港口的可行且单一的子轨迹,需要计算轨迹的两个连续点之间的经度差或纬度差,以标识船舶子轨迹的起点和终点。从理论和经验上讲,当船舶靠近目的地的时候其速度接近于0,并且其经纬度变化较小。

在一个具体的例子中,如图2所示,将所述连续轨迹划分为若干子轨迹,包括如下步骤:

s201:当所述连续轨迹中,某轨迹点相对于前一轨迹点的经度差或者纬度差的变化小于设定阈值,且其该轨迹点的速度接近于0时,将该轨迹点确定为一子轨迹的起点;

s202:将所述连续轨迹中下一个相对于前一轨迹点的经度差或者纬度差的变化小于设定阈值,且速度接近于0的轨迹点确定为该子轨迹的终点。

s102:对若干所述子轨迹进行特征工程提取,得到子轨迹特征矩阵,其中,矩阵中第i行表示第i条子轨迹的特征值。

在本申请实施例中,首先定义几个概念:给定一个数据集a={a1,a2,a3,…,an},其中n是船只的数量,ai是一个船只轨迹的样本点的时间序列数据点。也就是说,ai=(p1,p2,p3,...,pm),其中m是子轨迹中点的数量,pm其定义为元组(t,lat,lon,speed,cog,rot,ac)的点,其中t是时间戳,lon是船舶轨迹点的经度,lat是船舶轨迹点的纬度,cog是船舶轨迹点的航向,speed是船舶轨迹点的瞬时速度,rot是船舶转弯速率,ac是船舶在时间t时刻的加速度。

假设在某些情况下只能获取轨迹点的时间,经度和纬度,但是仍然可以使用船舶轨迹特征工程公式从原始数据中计算特征提取结果,公式如下:

△latap=latap-latap-1

△lonap=lonap-lonap-1

△tap=timeap-timeap-1

h=hav(△latap)+cos(latap-1)*cos(latap)*hav(△lonap)

其中,△latap,△lonap,△tap分别表示轨迹a的第p个点的纬度差,经度差和时间差。rot为轨迹a第p个点的转向率,courseap为一个分段函数用来计算轨迹a第p个点的航向值。h和haversin(θ)使用haversing公式来计算地球上任意两条轨迹之间两点的距离,r为地球半径,平均值为6371km。speedap是轨迹两点之间的距离除以时间差计算的出轨迹点的瞬时速度speed。acap表示通过轨迹相邻两个点的速度差和时间差计算得出的加速度ac。

在一个实施例中,为了使不同轨迹特征缩放为(0,1)之间的数值,使得数据提取过程更加快速准确的效果,对若干所述子轨迹进行特征工程提取,得到子轨迹特征矩阵后,还包括如下操作:

根据如下公式,对所述子轨迹特征矩阵中的特征进行归一化操作:

其中,δ表示需要被归一化的特征,min和max分别表示该特征的最大值和最小值,δ′表示经过归一化处理后得到的特征。

在一个实施例中,为简化训练过程,将不同长度的船的轨迹转换为固定长度,对所述子轨迹特征矩阵中的特征进行归一化操作后,还包括:

以最长的子轨迹点的数量作为标准,对其他轨迹数据进行0填充,使得船舶轨迹特征向量的长度相同。

s103:将所述子轨迹特征矩阵输入多特征融合自编码器,通过所述多特则会那个融合自编码器对位置、速度、航向的船舶特征向量进行特征提取,获得位置特征向量、速度特征向量和航向特征向量。

所述多特征融合自编码器用于将高维度的船舶轨迹特征数据进行数据降维,得到低纬度的船舶轨迹特征数据。

具体的,本申请实施例中所述的多特征融合自编码器包括三个相同结构的卷积自动编码器,分别为:

第一卷积自动编码器,用于学习船舶轨迹的位置类型特征;

第二卷积自动编码器,用于学习船舶轨迹的速度类型特征;

第三卷积自动编码器,用于学习船舶轨迹的航向类型特征。

在一个例子中,所述位置类型特征包括经度和纬度;所述速度类型特征包括速度和加速度;所述航向类型特征包括航向和转弯速率。

s104:对所述位置特征向量、所述速度特征向量和所述航向特征向量进行拼接操作,获得船舶轨迹的潜在特征向量。

s105:对提取后的船舶轨迹特征向量进行轨迹聚类操作,得到船舶轨迹聚类结果。

在本申请实施例中,通过上述三个卷积自编码器的特征提取后将会得到的船舶轨迹位置类特征向量z1,船舶轨迹速度类特征向量z2和船舶轨迹航向类特征向量z3,最后将获得的三种类型的轨迹特征向量拼接成一个特征向量z。并将特征向量z作为所有的船舶轨迹的特征表示,最后对提取后的船舶轨迹特征向量进行轨迹聚类操作,得到船舶轨迹聚类结果。

在一个例子中,可以使用基于ais船舶轨迹低维特征向量z对轨迹进行聚类,并采用f1值方法对聚类效果进行评估,公式如下:

其中,tp表示正确地预测为正例的轨迹,fp表示错误地预测为正例的轨迹,fn表示错误地预测为反例的轨迹。

在本申请实施例中,将船舶ais原始轨迹进行轨迹分割操作,获得分割后的船舶ais子轨迹,对每条船舶子轨迹进行特征工程操作得到ais船舶子轨迹特征矩阵,其中矩阵中第i行即代表第i条子轨迹的特征值;使用多特征融合自编码器对位置、速度、航向的船舶特征向量进行特征提取,获得三种类型特征向量,之后对三种类型的特征向量进行拼接操作,获得船舶轨迹的潜在特征向量,并使用主流的聚类算法对提取后的船舶轨迹特征向量进行轨迹聚类操作,可以实现不需要人为选择时空轨迹相似度测量公式,从而可以避免使用传统相似度度量方法所带来的基于轨迹距离的相似度计算偏差,还可以保留不同船舶特征类型的数据的分布,改善了计算性能。

在一个实施例中,针对上述的每个卷积自动编码器,其结构包括:

输入层,用于获取到每条船舶轨迹特征数据的特征矩阵,将子轨迹数据展开成为子轨迹向量,并将其传递给编码器部分。

在一个例子中,获取到每条船舶轨迹特征数据的维度为(30,2)的特征矩阵,其中30表示船舶子轨迹点的数量也是子轨迹长度,而2表示单个轨迹点的所包含的每种类型的特征信息,包括:位置,速度或者航向类型特征。同时,为了确保轨迹序列的时序关系并使卷积核过滤器完全覆盖所有的轨迹点,将子轨迹数据展开成为长度为60*1的子轨迹向量,并将其传递给编码器部分。

编码器,由卷积层和池化层组成,激活函数设置为relu函数,用于对子轨迹向量进行卷积运算,并输出提取到的船舶轨迹特征。

在一个例子中,编码器是由卷积层和池化层组成。卷积层1由4个(4,1)卷积核组成,后面是用于下采样的池化层,池化层模型使用了最大池化。激活函数设置为relu函数,步长设置为2,因为要一次卷积两个轨迹点从而使得卷积层设置的网络结构可确保留两个轨迹点之间的时序关系。模型输入的船舶轨迹输入为(60,1)经过卷积运算后提取的船舶轨迹特征输出维度为(1,4)其中1表示1个特征,4表示4个过滤器。一维卷积公式如下:

其中,f和e表示轨迹特征向量和卷积核。α表示特征向量的长度,β表示卷积核大小。该卷积核一次卷积运算可以进行两个轨迹点的特征提取,就保证了轨迹点的时序关系,可以保存关于船舶轨迹的局部和上下文信息,有利于分析船舶局部轨迹的异常情况。

解码器,用于使用卷积层和上采样层的组合来实现反卷积功能,将低维的特征向量调整为高维的特征向量并传输到输出层。

在一个例子中,在解码器部分,使用卷积层和上采样层的组合来实现反卷积功能,可以保证运算后的结果输出的维度不会减小,其中卷积层2由4个(4,1)大小的卷积核过滤器组成。激活函数为relu函数,卷积步长设置为1。最终反卷积的作用是将低维特征向量z调整为(60,4)维的特征向量并传输到输出层。

输出层,用于将高维特征向量转换为原始轨迹特征向量大小,以使与输入层输入数据的纬度相同。

在一个例子中,将(60,4)特征向量转换为原始轨迹特征向量大小(60,1),输出层使用了同样使用了一层卷积层,其维度为1个(4,1)的卷积核组成,通过卷积来实现对输出数据维度调整,最终实现与输入层输入数据的纬度相同的目的。

在一个例子中,为了实现量化和评估输出层数据和输入层数据的误差,使用均方误差来衡量输出层数据和输入层数据之间的相似性,公式如下:

其中,mse表示均方误差,observedm表示真实的轨迹数据,predictedm表示预测的轨迹数据,n表示所有船舶的子轨迹总数。

如图3和图4所示,图3和图4为本申请实施例一种基于卷积自编码器的船舶ais轨迹聚类方法的流程图和应用的模型结构示意图。

在一个例子中,本申请的基于卷积自编码器的船舶ais轨迹聚类方法首先将一艘船舶连续ais轨迹tr划分为若干子轨迹:即tr={tr1,tr2,...,trj},其中trj是船舶子轨迹,j表示一艘船舶的子轨迹总数;对每条船舶子轨迹进行特征工程操作并进行归一化,最后得到归一化后的ais船舶子轨迹特征矩阵,其中矩阵中第i行即代表第i条子轨迹的特征值;将该矩阵进行轨迹填充,使各条子轨迹向量的长度相等,便于后续特征提取操作;使用多特征融合自编码器对位置、速度、航向的船舶特征向量进行特征提取,获得三种类型特征向量;之后对三种类型的特征向量进行拼接操作,获得船舶轨迹的潜在特征向量,并使用主流的聚类算法对提取后的船舶轨迹特征向量进行轨迹聚类操作。

图5为本申请实施例提供的一种基于卷积自编码器的船舶ais轨迹聚类装置的结构示意图,如图5所示,所述基于卷积自编码器的船舶ais轨迹聚类装置50包括:

轨迹获取模块51,用于获取船舶的连续轨迹,并将所述连续轨迹划分为若干子轨迹;

特征工程模块52,用于对若干所述子轨迹进行特征工程提取,得到子轨迹特征矩阵,其中,矩阵中第i行表示第i条子轨迹的特征值;

特征提取模块53,用于将所述子轨迹特征矩阵输入多特征融合自编码器,通过所述多特则会那个融合自编码器对位置、速度、航向的船舶特征向量进行特征提取,获得位置特征向量、速度特征向量和航向特征向量;

拼接模块54,用于对所述位置特征向量、所述速度特征向量和所述航向特征向量进行拼接操作,获得船舶轨迹的潜在特征向量;

聚类模块55,用于对提取后的船舶轨迹特征向量进行轨迹聚类操作,得到船舶轨迹聚类结果。

在一个示例性的实施例中,所述轨迹获取模块51包括:

起点确定单元,用于当所述连续轨迹中,某轨迹点相对于前一轨迹点的经度差或者纬度差的变化小于设定阈值,且其该轨迹点的速度接近于0时,将该轨迹点确定为一子轨迹的起点;

终点确定单元,用于将所述连续轨迹中下一个相对于前一轨迹点的经度差或者纬度差的变化小于设定阈值,且速度接近于0的轨迹点确定为该子轨迹的终点。

在一个示例性的实施例中,所述基于卷积自编码器的船舶ais轨迹聚类装置50还包括:

归一化模块,用于对若干所述子轨迹进行特征工程提取,得到子轨迹特征矩阵后,根据如下公式,对所述子轨迹特征矩阵中的特征进行归一化操作:

其中,δ表示需要被归一化的特征,min和max分别表示该特征的最大值和最小值,δ′表示经过归一化处理后得到的特征。

在一个示例性的实施例中,所述基于卷积自编码器的船舶ais轨迹聚类装置50还包括:

轨迹数据填充单元,用于对所述子轨迹特征矩阵中的特征进行归一化操作后,以最长的子轨迹点的数量作为标准,对其他轨迹数据进行0填充,使得船舶轨迹特征向量的长度相同。

在一个示例性的实施例中,所述多特征融合自编码器包括:

第一卷积自动编码器,用于学习船舶轨迹的位置类型特征;

第二卷积自动编码器,用于学习船舶轨迹的速度类型特征;

第三卷积自动编码器,用于学习船舶轨迹的航向类型特征。

在一个示例性的实施例中,所述位置类型特征包括经度和纬度;

所述速度类型特征包括速度和加速度;

所述航向类型特征包括航向和转弯速率。

在一个示例性的实施例中,针对每个卷积自动编码器,其结构包括:

输入层,用于获取到每条船舶轨迹特征数据的特征矩阵,将子轨迹数据展开成为子轨迹向量,并将其传递给编码器部分;

编码器,由卷积层和池化层组成,激活函数设置为relu函数,用于对子轨迹向量进行卷积运算,并输出提取到的船舶轨迹特征;

解码器,用于使用卷积层和上采样层的组合来实现反卷积功能,将低维的特征向量调整为高维的特征向量并传输到输出层;

输出层,用于将高维特征向量转换为原始轨迹特征向量大小,以使与输入层输入数据的纬度相同。

在一个示例性的实施例中,所述基于卷积自编码器的船舶ais轨迹聚类装置50还包括:

相似性评估单元,用于使用均方误差来衡量输出层数据和输入层数据之间的相似性,公式如下:

其中,mse表示均方误差,observedm表示真实的轨迹数据,predictedm表示预测的轨迹数据,n表示所有船舶的子轨迹总数。

在一个示例性的实施例中,所述基于卷积自编码器的船舶ais轨迹聚类装置50还包括:

聚类效果评估单元,用于采用f1值方法对聚类效果进行评估,公式如下:

其中,tp表示正确地预测为正例的轨迹,fp表示错误地预测为正例的轨迹,fn表示错误地预测为反例的轨迹。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1