数据聚类方法的综述类毕业论文文献都有哪些?

您所在的位置:网站首页 psi数据库 数据聚类方法的综述类毕业论文文献都有哪些?

数据聚类方法的综述类毕业论文文献都有哪些?

2023-04-20 03:41| 来源: 网络整理| 查看: 265

本文是为大家整理的数据聚类方法的综述主题相关的10篇毕业论文文献,特此筛选出以下10篇期刊论文,为数据聚类方法的综述选题相关人员撰写毕业论文提供参考。

1.【期刊论文】基于广义线性模型的混合属性数据聚类方法

期刊:《科学技术与工程》 | 2021 年第 004 期

摘要:针对混合属性数据聚类难度高的问题,提出一种基于广义线性模型的混合属性数据聚类方法.首先,构建低阶多元广义线性模型处理海量数据聚类问题,考虑数据属性的时间特性,获取属性时间序列矩阵;然后,基于优化K-prototypes聚类方法处理混合属性数据时,考虑属性的时间序列矩阵;最后,在考虑样本同聚类中心距离基础上兼顾已知样本信息内容,采用优化方法计算数据相异度、样本与聚类集间距离,当聚类结果趋于平稳时终止运算,输出聚类结果.为验证基于广义线性模型的混合属性数据聚类方法的有效性展开实验分析.结果显示,该方法经过较少次迭代即可优化划分混合属性数据聚类集,聚类适应度值为0.88~0.94,适应度优,可准确体现样本间差异,是一种准确度高的混合属性数据聚类方法.

关键词:广义线性模型;混合属性;数据;时间序列矩阵;K-prototypes聚类;迭代

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_science-technology-engineering_thesis/0201288763385.html

---------------------------------------------------------------------------------------------------

2.【期刊论文】基于分组模型的引力搜索智能大数据聚类方法

期刊:《计算机工程与设计》 | 2021 年第 006 期

摘要:提出一种基于分组的引力搜索算法实现数据聚簇.与标准引力搜索不同,分组引力搜索设计一种特定的解编码策略,即分组编码,可将数据聚簇的相关结构映射为解的一部分;对于特定编码,新的引力搜索机制在位置和速度更新策略上设计适合分组编码的更新规则,使分组引力搜索可类似于传统引力搜索进行迭代寻优.在多种经典测试数据集下对算法性能进行评估,其结果表明,与同为智能群体算法的标准引力搜索算法、智能蜂群算法、粒子群算法和萤火虫算法相比,该算法的数据分类效率更高.

关键词:数据聚簇;分组编码;引力算法;分类失误比率;数据对象距离

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_computer-engineering-design_thesis/0201290100683.html

---------------------------------------------------------------------------------------------------

3.【期刊论文】基于k-means聚类方法的曲线按比伸缩置换缺失数据补全法

期刊:《电气自动化》 | 2021 年第 002 期

摘要:电力负荷预测的准确度与负荷历史数据质量密切相关.现在,负荷数据一般由SCADA系统提供,所提供数据常常出现缺失现象.研究了一种缺失数据补全方法,基于k-means聚类方法的曲线按比伸缩置换法.利用电力负荷具有时间周期相似性的特点,把某一处负荷的历史数据以日负荷向量为单位进行分类.缺失的数据通过把其日负荷向量所属类的质心向量的相应数据按照一定的比例伸缩变换,替换到空缺数据部分,完成补全.与传统线性插值法和平均日负荷曲线补全法相比,补全准确度高.与支持向量机负荷预测相配合,可以一定程度上提高预测准确度.

关键词:负荷预测;k-means聚类;置换法;线性插值;支持向量机预测

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_electrical-automation_thesis/0201289461867.html

---------------------------------------------------------------------------------------------------

4.【期刊论文】基于文本聚类的档案数据全自动分类方法研究

期刊:《电子测试》 | 2021 年第 014 期

摘要:大数据时代下,档案文本数据规模海量递增,增加了聚类分析的难度,如何准确、高效的实现档案数据全自动分类.而针对以往PSI算法在高纬度、稀疏特征中易于陷入局部最优,本文引入GWO算法,通过对种群精英个体的克隆和变异,及基于DE算法的个体更新算法创新,来规避早期收敛和局部最优的问题,而后,引入FastText有监督快速分类方法,基于softmax分层技术完成海量档案数据的全自动化分类,以提升档案分类的可靠性和效率.

关键词:聚类分析;GWO算法;档案数据;局部最优

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_electronic-test_thesis/0201290787313.html

---------------------------------------------------------------------------------------------------

5.【期刊论文】基于统计信息聚类边界的不平衡数据分类方法

期刊:《计算机工程与设计》 | 2021 年第 008 期

摘要:为解决不平衡数据在传统处理方法中容易出现数据的过拟合和欠拟合问题,提出基于统计信息聚类边界的不平衡数据分类方法.去除数据中噪声点,根据数据对象的k距离设定邻域半径,利用对象邻域范围内的k距离统计信息寻找边界点与非边界点;将少数类中的边界点作为样本,采用SMOTE算法进行过采样,对多数类采用基于距离的欠采样删除远离边界的点,得到平衡数集.通过实验结果对比,验证了该算法的G-mean值与F-value值都有提高.

关键词:不平衡数据;聚类;边界点;非边界点;采样

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_computer-engineering-design_thesis/0201290794594.html

---------------------------------------------------------------------------------------------------

6.【期刊论文】基于顺风车数据和聚类方法的都市圈区域划分与层级结构研究

期刊:《交通运输系统工程与信息》 | 2021 年第 004 期

摘要:都市圈已经逐渐成为国家新型城镇化发展的主体形态之一,在区域经济一体化建设中起着十分重要的作用.本文基于顺风车数据,使用聚类分析方法,围绕北京都市圈区域划分与层级结构展开相关研究.首先,通过网格模型将研究区域网格化处理并作为基本处理单元,匹配获取的顺风车数据与POI数据到网格中,利用基于网格的改进K-means++聚类算法,并结合使用手肘法与轮廓系数法确定最佳聚类数量,对北京都市圈主要功能区进行划分.通过分析不同功能区域内的居民通勤出行特征,提出通勤强度、通勤时间、功能区独立性、功能区可达性等区域通勤特征评价指标,结合上述指标使用层次聚类方法对北京都市圈层级结构划分展开进一步研究.研究结果表明:本文采用的改进聚类方法能克服传统聚类算法随机选取聚类数目所带来的影响,有效划分并得到19类北京都市圈主要功能区域,聚类效果更佳;聚类结果显示北京都市圈主要功能区域与北京市现有行政区域划分存在差异性,在都市圈规划建设当中应当主动破除行政区域壁垒,实施面向都市圈范围的整体规划;根据不同功能区域的居民通勤特征与地理区位特征,北京都市圈还可进一步划分为核心层、近郊层、远郊层3个圈层;应当根据北京都市圈圈层特性与功能区自身属性制定相应发展策略,通过规划建设市郊铁路或轨道交通改善不同圈层间的通勤现状,提高北京都市圈整体通勤可达性.研究结果为制定相应规划与管理政策提供依据,有利于都市圈功能与结构进一步完善,促进都市圈良性发展.

关键词:城市交通;都市圈区域划分;聚类算法;都市圈;顺风车数据

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_journal-transportation-systems-engineering-information-technology_thesis/0201290829486.html

---------------------------------------------------------------------------------------------------

7.【期刊论文】基于关系结构的面板数据聚类方法研究

期刊:《统计学与应用》 | 2020 年第 005 期

摘要:本文研究面板数据聚类方法,提出从面板数据变量之间影响与响应的结构关系上进行聚合分类的聚类方法,分别讨论了线性关系,非线性关系,基于轨迹特征和基于形状特征的多指标面板数据聚类方法。将相同结构关系的数据划分到相同的类中,不同关系结构的数据划分到不同的类中,使得类内有相同或相似结构关系与轨迹特征,类和类之间数据的结构关系与轨迹特征差异较大。

关键词:线性结构关系;非线性结构关系;形状相似性

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_statistics-applications_thesis/0201280755633.html

---------------------------------------------------------------------------------------------------

8.【期刊论文】基于机器学习的云存储数据分段聚类方法仿真

期刊:《计算机仿真》 | 2020 年第 006 期

摘要:针对传统的云存储数据分段聚类方法存在运行效率较低、聚类结果不够平滑等问题,提出一种基于机器学习的云存储数据分段聚类方法.从云存储数据库中合理抽取多个小数据集,小数据集包含云存储数据库中的所有自然簇,根据相似度定义构建相似度矩阵.采用非线性核主成分算法实现对相似度矩阵中数据相似度的测度,通过相似度测度将具有相同特征的数据归为一类,采用混合高斯分布概率密度模型计算不同类别数据的后验概率,通过对概率大小的比较实现云存储数据分段聚类.实验结果证明,所提方法能够缩短聚类运行时间,将聚类变化度降低到29%,有效提高了聚类结果的平滑度.

关键词:自然簇;相似度矩阵;非线性核主成分算法;混合高斯分布概率密度模型

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_computer-simulation_thesis/0201280156582.html

---------------------------------------------------------------------------------------------------

9.【期刊论文】三路数据聚类方法综述

期刊:《统计与信息论坛》 | 2012 年第 011 期

摘要:三路数据主要包含面板数据、纵向数据和三模数据三种立体数据格式.三路数据在社会科学和自然科学研究中受到越来越广泛的关注和应用.传统的聚类分析理论和方法主要基于两路平面数据而建立,对于三路数据,这些理论和方法则显得无能为力.在对传统的两路数据聚类方法做概要回顾的基础上,对国内外主流的三路数据聚类方法做了简要综述和总结.

关键词:三路数据;面板数据;纵向数据;三模数据;聚类方法

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_statistics-information-forum_thesis/0201242676793.html

---------------------------------------------------------------------------------------------------

10.【期刊论文】高维数据聚类方法综述

期刊:《计算机应用研究》 | 2010 年第 001 期

摘要:总结了高维数据聚类算法的研究现状,分析比较了算法性能的主要差异,并指出其今后的发展趋势,即在子空间聚类过程中融入其他传统聚类方法的思想,以提高聚类性能.

关键词:高维数据;聚类;子空间

链接:https://www.zhangqiaokeyan.com/academic-journal-cn_application-research-computers_thesis/0201242050690.html

---------------------------------------------------------------------------------------------------



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3