【数据挖掘】第8章 聚类分析: 基本概念和算法

您所在的位置:网站首页 简述算法设计规则 【数据挖掘】第8章 聚类分析: 基本概念和算法

【数据挖掘】第8章 聚类分析: 基本概念和算法

2024-07-17 19:09| 来源: 网络整理| 查看: 265

8 聚类分析: 基本概念和算法

目录 一、聚类分析概述1)什么是聚类分析2)不同的簇类型3)聚类算法的分类 二、K-均值聚类算法1)基本K均值算法2)k-中心点聚类方法 三、凝聚层次聚类1)基本的凝聚层次聚类算法2)如何计算簇之间的邻近性3)层次聚类的主要问题

一、聚类分析概述 1)什么是聚类分析

聚类分析仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是, 组内的对象之间是相似的(相关的),而不同的组中的对象是不同的(不相关的)。 组内的相似性(同质性)越大,组间差别越大,聚类就越好。 在这里插入图片描述 聚类分析的应用 在这里插入图片描述

2)不同的簇类型

簇(Cluster)的定义是不精确的 在这里插入图片描述 不同的簇类型

Well-separated clusters(明显分离的簇)Center-based clusters(基于中心的簇)Contiguous clusters(基于邻近的簇)Density-based clusters (基于密度的簇)Property or Conceptual (概念簇) 在这里插入图片描述 3)聚类算法的分类

大体上,主要的聚类算法可以划分为如下几类:划分方法、层次方法、基于密度的方法、基于网格的方法

1–划分方法 ▪ 给定一个有N个元组或者记录的数据集,划分方法将构造K个分组,每一个分组就代表一个聚类,K



【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3