基于电力设备的用户画像构建方法与流程

您所在的位置:网站首页 knn算法优点包括 基于电力设备的用户画像构建方法与流程

基于电力设备的用户画像构建方法与流程

2023-03-12 04:38| 来源: 网络整理| 查看: 265

基于电力设备的用户画像构建方法与流程

1.本发明涉及数据处理技术领域,具体的,涉及基于电力设备的用户画像构建方法。

背景技术:

2.大数据是我国社会经济发展大环境下的技术革命,而随着智能电网建设工程的不断扩大,电力大数据也逐步演变成智慧城市创建与发展的基石。而如何获取电力设备或电力用户等特征来生成用户画像,成为了电网智能化发展的一个迫切需要解决的问题。随着信息化的深入推进和高速发展,现有的数据量不断增加,促使对当前数据进行深度挖掘并充分利用数据进行分析,从而得到可靠依据这一手段成为了电网企业创新发展的重要环节之一。通过对电力设备的用户画像研究,可以对数据分析后的结果进行差异化处理,同时可以提供设备维护预警等服务策略。针对不同厂家、不同型号、呈现不同供电特征和规律的设备进行画像刻画,采用“定制化”服务,全方面提高设备的使用寿命以及降低设备运维成本。3.目前用户画像的构建方法一般仅针对于用户,且基本只简单地采取一层k-means算法进行聚类操作,并未充分考虑不同数据指标之间的标准化问题,这导致聚类效果一般,不能准确的对数据进行分类和分层。而将这类方法套用于电力设备画像,更会直接导致画像分类误差极大,异常分析达不到良好结果。4.在所述背景技术部分公开的上述信息仅用于加强对本技术的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现要素:

5.本发明的目的是针对电力设备用户画像因聚类误差较大导致的异常分类结果准确率低以及实用性较差的问题;提出了基于电力设备的用户画像构建方法,实现电力设备数据与二次knn聚类的融合,通过建图的方式对电力设备随用电情况变化进行精准的分类刻画,从而为电力设备的维护优化及电价调节提供丰富的决策依据,提高了画像的准确度。6.第一方面,本发明实施例中提供的一种技术方案是,基于电力设备的用户画像构建方法,包括步骤如下:s1、获取各个电力设备的设备属性数据;s2、根据设备属性数据确定电力设备的特征类型,对设备属性数据进行预处理得到特征样本集合;s3、基于特征样本集合,对电力设备进行k-means++分析,得到分类簇;s4、基于分类簇中的电力设备,采用图神经网络和最近邻算法连接各电力设备,基于异常设备对其余正常设备进行评分得到用户画像簇;s5、根据生成的用户画像簇,对设备的隐患等级进行划分,得到隐患依据分数。7.作为优选,s1中,通过多源数据接口采集多源电力设备数据,以相同日期和相同型号为标志对获取的电力设备数据进行整合得到设备属性数据。8.作为优选,所述设备属性数据包含的设备运行状态信息、配变最大负荷统计信息、公变负荷统计信息、设备类型信息、额定容量信息、电压等级信息、测量时间信息、最大负荷信息、最小负荷信息。9.作为优选,述对设备属性数据进行预处理得到特征样本集合,包括:对设备属性数据进行数据去重、缺失补充和数据清洗得到数据样本集;对样本集进行特征提取与特征处理,获取电力设备的对应的特征数据作为设备状态数据;将同样具有特性表征的设备状态数据描述词通过word2vec embedding转化为特征向量,经过归一化操作得到电力设备重要特征投影结果。10.作为优选,s4包括如下步骤:从任意簇vi中得到任一初始化样本点,通过探索每个对象的邻居,对近似对象进行局部连接;给定一点v,它的邻居集合为在上的局部连接是计算每一对不同的p和q的相似性并且根据相似性更新邻居的相似度。11.作为优选,s5中,通过二次分类得到的knn同构图的根到叶结点的路径和各结点的特征相似度;将各个电力设备根据异常情况沿路径发散,获得相应的异常分数,通过异常分数进行电力设备异常判断。12.本发明的有益效果:基于纵向联邦学习技术为电力设备数据的价值挖掘提供了一种基于改进k-means++模型的用户画像生成方法,将传统机器学习的k-means++聚类算法改造成一种适用于电力设备聚类分析模型训练的算法,实现电力设备数据与二次knn聚类的融合,能够在首次粗略聚类的情况下,充分结合二次聚类建图后的数据进行联邦聚类分析,在保证初次聚类的准确性前提下,通过联合二次knn聚类分析挖掘数据特征的潜在价值,通过建图使电力设备在分类后的聚类情况用更精确的轨迹进行表示,对其电力设备随用电情况变化进行精准的分类刻画,从而为电力设备的维护优化及电价调节提供丰富的决策依据,提高了画像的准确度,并提高了电力设备负荷分析的建模效率。13.上述发明内容仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。附图说明14.通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。15.图1为本发明的基于电力设备的用户画像构建方法的流程图。具体实施方式16.为使本发明的目的、技术方案以及优点更加清楚明白,下面结合附图和实施例对本发明作进一步详细说明,应当理解的是,此处所描述的具体实施方式仅是本发明的一种最佳实施例,仅用以解释本发明,并不限定本发明的保护范围,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。其中λ1为计算出关系矩阵的任意一个特征值,φ为关系矩阵的特征向量,在此可以将pca降维问题转换为最优化24.word2vec embedding操作是一种将已有数据和文本信息从高维空间投影至低维空间中的方法,采用skip-gram对目标特征做embedding操作,利用余弦相似度计算距离:其中a,b表示两个不同的特征。25.步骤s3中,针对上述操作的结果,采用欧式距离作为相似度依据,利用改进的k-means++算法按照不同线路进行聚类处理,初步形成简单的分类数据集。26.具体的,采用了自适应聚类,并不会因为不一致的聚类中心点选取,导致分类出现误差。具体步骤如下:步骤s3.1:随机选一个设备作为初始化聚类中心样本点,记为c1;步骤s3.2:选出其余聚类中心,记为ci(i=2、、4...),计算出各个样本点与初始化聚类中心的距离,并选中其中最短距离记为di;步骤s3.3:重复步骤s3.2直到k个聚类中心点都被确认,最终用k-means算法计算k个初始化聚类中心的最终聚类中心。27.s4中,利用用knn(k近邻搜索)对已经分类的电力设备离散点进行建图,分区后得到电力设备用户画像简化图,以便进行搜索和二次标记;生成设备图后,标记高负荷的异常设备,采用近邻搜索算法,根据电力设备不同特征的相似度,给可能或即将产生异常的电力设备给予评分,进而判断电力设备的异常可能性。最后根据用户不同用电特征,按照用户群体进行划分,得到用户画像和异常分数。28.具体的,步骤s2所述的采用knn对已经聚类的不同簇进行邻近建图并生成同构图,方便异常检测和近似邻近查找。具体步骤如下:步骤s4.1:vi={v1,v2,...,vn}表示k-means聚类后的分类数据集,n表示数据集的尺寸为n=|v|,bk(vi)表示数据集中某样本点vi的k个最近邻,rk(vi)表示vi的k个反向最近邻;和分别表示bk(vi)和rk(vi)的近似。本算法将样本特征压缩至256维,采用欧氏距离进行相似性计算,公式如下:其中i和j分别代表两个数据集中的样本索引,都对应着256维的特征向量。29.knn的具体步骤如下:步骤s4.2.1构造根节点,选择所在维度为坐标轴,以vi中所有样本点的v(1)的中位数为切分点,在vi点引入一超平面切分该特征空间,并将vi设为当前树的根节点。30.步骤s4.2.2由当前根节点生成深度为1的左、右子树分别对应在维度上小于该点和大于该点的子区域。然后在各子区域中并行地重复步骤s4.2.1,直至两个子空间中都没有实例存在为止,构图完毕。31.其中,每轮被切分的特征维度索引j的计算公式如下:其中,r为切分轮数,k为上述的特征维度。32.设定k值,对给定的样本点a,寻找其k近邻的具体步骤为:步骤s4.3.1从当前树的根结点(设为r)出发,若无子结点,则该点也是叶子结点,进入步骤4.3.2;否则,比较r和a在维度序号为d(当前树的深度)上的值,小于则进入左子树,大于则进入左子树,然后递归地执行本次步骤,直至访问到叶结点。33.步骤4.3.2将当前叶节点设为a的“最近点”,并暂存,然后回退至父节点f,比较dfa和dra,若前者大于后者,将“最近点”更新为父节点,并暂存;否则,如另一侧存在子结点r1,进行相同的距离比较和更新点的操作。递归地执行步骤4.3.2直至回退到根节点。34.步骤4.3.3从暂存的所有样本点中,取出最近加入的k个,这些点即为a的k近邻。35.步骤s4.4:从任意簇vi中得到任一初始化样本点,通过探索每个对象的邻居,对近似对象进行局部连接。给定一点v,它的邻居集合为在上的局部连接是计算每一对不同的p和q的相似性(p,q∈b(v)),并且根据相似性更新邻居的相似度;步骤s4.5:为了不错过k近邻的最优比例,我们设置了一个ρ(ρ∈(0,1])。在进行采样之前,根据该超参数进行调整,从标记为true的k近邻中取样ρk个对象,每一次迭代仅将被取出的数据标记为false,由此进行更新knn的graph。36.步骤s5中,通过二次分类得到的knn同构图的根到叶结点的路径和各结点的特征相似度,可以将各个电力设备根据异常情况沿路径发散,获得相应的异常分数,通过异常分数进行电力设备异常判断;获得二次聚类后的类簇近邻图之后,通过异常分数可以对与异常点近邻的供电设备进行标记,对其采取维护或告警处理。37.以上所述之具体实施方式为本发明基于电力设备的用户画像构建方法的较佳实施方式,并非以此限定本发明的具体实施范围,本发明的范围包括并不限于本具体实施方式,凡依照本发明之形状、结构所作的等效变化均在本发明的保护范围内。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3