本发明属于智能楼宇微网用电技术领域,涉及一种智能楼宇微网用电行为的识别方法。
背景技术:
随着智能电网的不断建设和发展,用户用电数据逐渐积累成大数据,虽然这些用电大数据中看似十分混乱,但是却隐藏着用户用电行为方式,并且数据之间也存在着一定联系。对散乱的海量数据进行挖掘并识别出用户用电行为类型,可以帮助电网了解用户的个性化、差异化服务需求,为电网对智能楼宇微网用电负荷调度提供依据和参考,进而促进居民生活节约用电减少费电行为。
目前,一些研究人员将用户用电负荷分解为基本负荷和季节性负荷,采用基于自适应模糊c均值聚类算法对用户基本负荷和季节性负荷进行聚类分析,但是在实际应用中某些用户使用用电总负荷一样,然而基本负荷和所用设备也不尽相同,进行用户用电行为不能做到高精度识别分类;另外其他学者采用熵权法计算用户用电特征信息熵和权重,然后在通过聚类算法对用户进行聚类分析,但是该方法不能从总体上计算用户用电行为的概率,在判断用户用电行为准确性上存在着不足。
核主元分析法是一种非线性数据处理方法,核主元分析法在主元分析的基础上借助核函数来完成非线性变换,将原始数据映射到高维线性特征空间,在特征空间中利用主元分析方法进行特征提取。与其他非线性主元分析方法相比,核主元分析法具有标准主元分析简单的特点,求解过程中没有非线性优化,只需利用线性代数求解特征值问题,目前已经在入侵检测、图像处理、过程监控、故障诊断等领域得到了成功应用。多变量多尺度样本熵在多变量随机序列的mmse值在高尺度上急剧下降,而多变量混沌序列在高尺度上仍具有很高的mmse结果,自其提出以来,mmse已在物理、生理等多种领域中获得应用。模糊c-均值算法,是大数据应用最广泛的模糊聚类方法之一,该算法的优点是理解简单,收敛速度快,局部搜索能力强,适用于大型数据集。本发明在模糊c均值聚类模型中引入多变量多尺度样本熵权的权重,从而提高模型的精确度和降低算法运行时间。
技术实现要素:
针对上述智能楼宇微网用电大数据中用电设备电气特征参数提取,对用户用电行为进行识别判定,本发明公开了一种智能楼宇微网用电行为的识别方法,该方法通过对智能楼宇微网用电数据采集终端获的用电大数据进行家用电器设备负荷特征参数提取,特征分析选择及权重计算,便可以降低特征维度,从而提高模糊聚类分析模型的精确度和降低算法运行时间,该方法有效的识别出用户用电行为。
本发明的特点首先是对通过wifi楼宇微网用电数据采集终端获得用电大数据进行标准化处理,然后对预处理后的数据样本运用核主元分析法提取各用电器设备的负荷特征参数,不同的用电器设备用电功率、电压、电流等各不相同并表现出不同的特征。从用电数据样本中区分各用电设备,具体提取电气特征参数包括:电压谐波特征、电流谐波特征、电流谐波畸变率、功率曲线特征、启动时产生的负荷和启动时间的特征、温度、湿度、空气指数等特征参数;然后利用多变量多尺度样本熵权方法确定用户各用电行为特征的环境因素和不同用电设备的贡献率(即为模糊c-均值聚类的各影响因素的特征权重),最后通过模糊c均值聚类法对获得的特征数据组进行聚类分析,提高了用户用电行为识别的准确性和快速性。
本发明的具体通过如下方案实现:
1)通过wifi用户采集终端模块获取智能楼宇微网用电设备用电大数据,主要包括:实时电压、电压有效值、实时电流、电流有效值、实时功率、功率因数、启动电压和电流、启动时产生的负荷、启动时间、用电设备的温度等大数据;通过各传感器监测外界环境数据,主要包括:环境温度、环境湿度、空气指数、风速、气压、用户用电习惯、用户生活水平等数据。
2)对上述步骤1)中所获得的各个用电设备的用电数据进行预处理,并对不同属性数据构建子阵xi,进而对采集到的用电大数据构建出数据增广矩阵x(m):
然后按列分解成(n+1)个子阵,即包含n+1个设备的用电数据。
3)运用核主元分析法提取各用电设备特征向量组集t(n),其中特征向量组集矩阵包括电压、电流、电压谐波特征、电流谐波特征、电流谐波畸变率、有功功率、无功功功率、功率曲线特征、功率因数、启动时产生的负荷、启动时间的特征、温度、湿度、空气指数。
核主元分析模型把预处理后的用电数据矩阵x(n)经过核函数一一映射到更高维度的特征空间,在特征空间内对输入用电数据的各子阵进行线性核主元分析,并提取用电器设备的非线性特征参数,获取各用电器设备识别能力强的主要特征参数。
4)利用相关性分析模块对步骤3所得到的特征数据组集采用多变量多尺度样本熵法计算熵权。
将步骤3)中提取的状态量的特征参数进行标准化并获得时间序列向量xm={xm1,xm2,...,xmn,…,xmn},m=1,2,…,m,m代表不同通道获得的特征状态量,n为检测数据的数量。根据尺度因子τ对各特征状态量时间序列进行粗粒变换,由式(2)得不同尺度的时间序列
式中1≤i≤n/τ,对m个状态量粗粒化后的时间序列yim进行多维时延嵌入重构,得复合延迟向量:
式中d=[d1,d2,…,dm,…,dm]是嵌入维数向量,λ=[λ1,λ2,…,λm,…,λm]是时间间隔向量用于压缩监测状态量的数据,
由式(4)得每一个向量与所有向量
由式(5)计算得不同距离
式中r为两两向量之间相似性系数。
根据式(6)计算不同状态量之间的相似概率
根据式(7)计算得智能微网多通道监测数据的多变量多尺度样本熵权值为
在一定的智能微网用户用电行为条件下同一时间的多变量多尺度样本熵权权重ma越高,该用电行为对应的多通道数据复杂度和相关性越强,进而确定用电行为特征的环境因素和不同用电设备贡献率。
4)利用多变量多尺度样本熵权的模糊c-均值聚类算法建立多变量多尺度样本熵权的模糊c均值聚类模型,根据此模型进行智能楼宇微网用电行为进行分类识别
多变量多尺度样本熵权的模糊c-均值聚类模型将经过步骤3)核主元分析提取的各用电设备状态量的特征向量组数据样本划分为若干个模糊类,通过多变量多尺度样本熵权的模糊c-均值聚类模型,根据上述步骤4)求得的多变量多尺度样本熵权ma确定各影响因素的贡献率,增加可分性好的属性权重,并运用模糊c-均值聚类算法得到的最优聚类中心、各个特征属性的熵值和权重、隶属度矩阵;通过模糊c均值聚类模型并引入多变量多尺度样本熵权权重不断迭代步骤完成对用电行为进行聚类识别。
本发明提出的基于核主元分析和多变量多尺度样本熵权模糊c-均值聚类的智能楼宇微网用电行为识别方法具有以下优良的效果:
1)通过智能楼宇微网多通道用电信息实时采集平台获取各个用电设备用电大数据,充分考虑了多变量因素对用户用电行为的影响,提高了用户用电行为识别的准确度。
2)运用核主元分析方法在特征提取方面的优势,对智能楼宇微网用户用电行为的影响因素进行处理,并提取各影响因素的特征数据。
3)利用多变量多尺度样本熵权方法确定用户各用电行为特征的环境因素和不同用电设备贡献率,基于上述所求的多变量多尺度样本熵权贡献率作为模糊c-均值聚类的各影响因素的特征权重,提高了模糊c-均值聚类结果的准确性和快速性。
附图说明
图1是本发明智能楼宇微网用电行为识别方法的结构框图
图2是本发明智能楼宇微网用电行为识别方法的原理框图。
具体实施方式
以下结合附图和具体实施过程对本发明进一步的说明。
如图1所示通过智能楼宇微网用电数据采集终端和环境各传感器监测获得用电大数据;然后对获得数据进行预处理(数据整合、数据填充、特征规范化);利用核主元分析法对预处理后的数据样本提取各用电设备的负荷特征参数,不同的用电器设备用电功率、电压、电流等各不相同并表现出不同的特征,进而可以从提取的用电数据特征中区分各用电设备;然后利用多变量多尺度样本熵权方法确定用户各用电行为特征的环境因素和不同用电设备的贡献率(即为模糊c-均值聚类的各影响因素的特征权重);最后通过模糊c均值聚类法对获得的特征数据组进行聚类分析,提高了用户用电行为识别的准确性和快速性。
如图2所示本发明的智能楼宇微网用电行为的识别方法的具体实施过程如下:
1)智能楼宇微网用电设备和环境因素的大数据采集
通过wifi用户采集终端模块获取智能楼宇微网用电设备用电大数据,主要包括:实时电压、电压有效值、实时电流、电流有效值、实时功率、功率因数、启动电压和电流、启动时产生的负荷、启动时间、用电设备的温度等大数据;通过各传感器监测外界环境数据,主要包括:环境温度、环境湿度、空气指数、风速、气压、用户用电习惯、用户生活水平等数据。
2)针对上述步骤1)获得的数据进行预处理,主要包括对原始数据中用户用电若干特征的数据缺失(为空值)或明显异常的数据(如用电量为负数)进行数据填充;对原始数据进行数据规范化处理。
对各个用电设备的用电数据建立组成子阵xi,进而对采集到的用电设备用电大数据构建出数据增广矩阵x(m)
然后按列分解成m个子阵,即包含m个设备的用电数据,p为用电设备的状态量。
3)利用核主元分析法对经步骤2)预处理后的数据提取各用电设备特征向量组集t(k),其中特征向量组集矩阵包括电压有效值、电流有效值、电压谐波特征、电流谐波特征、电流谐波畸变率、有功功率、无功功功率、功率曲线特征、功率因数、启动电压和电流、启动时产生的负荷、启动时间的特征、用电设备温度等。
核主元分析法是主元特征分析的非线性推广,通过一个非线性变换ф,将输入数据空间中的m个子阵的样本xi(k=1,2,…,,m),映射到高维特征空间f中,得到高维空间的样本点ф(x1),ф(x2),…,ф(xm),然后在高维空间使用主元分析提取更好的可分性的非线性主元特征,实现非线性数据降维,进而实现各用电设备特征参数的提取,获取各用电设备分类的主要特征向量组集。
根据式(1)数据预处理得到的增广矩阵x(m),然后按列分解成(m+1)个子阵,然后计算每个子阵各自的核矩阵(k1,k2,…,km+1)
映射后数据的协方差矩阵cf为:
其中ф是映射函数,s是个状态量数据个数,
根据式(3)对cf进行特征分解并标准化特征向量
求解式(3)中的特征值λ(λ≥0)和特征向量v,并将映射后的每个样本与式(3)做内积处理,进而有
式(4)中的v可用线性组合表示如下:
其中αi是相关系数,将(2),(5)带入式(3)中得:
定义对称核矩阵k为:
因k是对称矩阵,上式可简化为:
sλα=kα(8)
本发明选择高斯径向基核函数即:
通过上述的求解,可得到所要求的的特征值和特征向量,归一化特征向量,确定各子阵的主元数目,取li的最大值l作为主元数目,根据式(10)计算各个子阵特征向量vi(i=1,2,…,p)在各自特征空间上的投影,即得各子阵的主元矩阵(t1,t2,…,tm),
进而通过核主元分析所提取的各用电设备特征向量组数据为(t1,t2,…,tm)
4)利用相关性分析模块对步骤3所得到的特征数据组集采用多变量多尺度样本熵法计算熵权,在一定的智能微网用户用电行为条件下同一时间的多变量多尺度样本熵权权重ma越高,该用电行为对应的多通道数据复杂度和相关性越强,进而确定用电行为特征的环境因素和不同用电设备贡献率。
将步骤3)中提取的状态量的特征数据参数进行标准化,并进行时间序列向量tm={tm1,tm2,...,tmn,…,tmn},m=1,2,…,m,m代表不同通道获得的特征状态量,n为获得特征数据的数量。根据尺度因子τ对各特征状态量时间序列进行粗粒变换,由式(11)得不同尺度的时间序列
其中1≤i≤n/τ,对m个状态量粗粒化后的时间序列yim进行多维时延嵌入重构,得复合延迟向量:
其中d=[d1,d2,…,dm,…,dm]是嵌入维数向量,λ=[λ1,λ2,…,λm,…,λm]是时间间隔向量用于压缩监测状态量的数据,
由式(13)得每一个向量
由式(14)计算得不同距离
式中r为两两向量之间相似性系数。
根据式(15)计算不同状态量之间的相似概率
根据(16)式计算得智能微网多通道监测数据的多变量多尺度样本熵权值为
5)利用模糊c-均值聚类算法建立模糊c-均值聚类模型,然后运用该模型识别用户用电行为:
根据上述步骤3)得到的智能楼宇微网各用电设备特征向量组数据矩阵
fcm算法的目标函数建立如下:
本发明引入拉格朗日乘子的目标函数如下:
其中,
模糊聚类第j组样本的聚类中心选择
通过不断迭代调整使目标函数小于类别区分精度ε,进而完成对所有智能楼宇微网用户用电行为的识别分类。
本发明构建的基于核主元分析和多变量多尺度样本熵权模糊c-均值聚类相结合的智能楼宇微网用户用电行为识别模型训练实施步骤如下:
step1选取wifi智能楼宇微网用电数据采集终端和环境各传感器监测获得用电样本大数据,并对样本数据进行数据预处理。
step2对各个用电设备的用电数据建立组成子阵xi,利用公式(1)对经过预处理后的用电设备用电大数据构建出数据增广矩阵x(m)。
step3利用式(9)计算各个子阵核矩阵(k1,k2,…,km+1),并根据式(2)进行中心化得(k*1,k*2,…,k*m+1)。
step4根据式(8)分别对各个中心化后子阵的核矩阵进行特征分解,并标准化特征量α。
step5根据式(10)计算各个子阵特征向量在各自特征空间上的投影,得到各个子阵的主元矩阵
step6利用式(16)多变量多尺度样本熵权算法计算用户用电行为特征的环境因素和用电设备的多变量多尺度贡献率ma。
step7确定用电行为类的个数c,初始化聚类中心v0、模糊权重指数n和隶属度矩阵u0
step8将聚类中心vj和step6求得的多变量多尺度影响因素的贡献率ma带入公式(19)得到新的隶属度矩阵uij。
step9将上述得到的隶属度矩阵uij和step6求得的多变量多尺度影响因素的贡献率ma带入式(20)得到新的聚类中心vj。
step10根据式(18)计算目标函数值,通过不断迭代调整使目标函数小于类别区分精度ε>0,并计算相邻两聚类中心的距离e,若原聚类中心与更新后的聚类中心之间的距离e小于ε,则迭代停止,否则转至step8。
通过上述步骤不断迭代,运用核主元分析法和多变量多尺度熵权模糊c-均值聚类模型进而可以精准的完成对智能楼宇微网用户用电行为的识别。