评定数据之间的相似度指标

您所在的位置:网站首页 怎么判断两组数据的相似度 评定数据之间的相似度指标

评定数据之间的相似度指标

2024-03-06 21:37| 来源: 网络整理| 查看: 265

文章目录 前言一、基础距离曼哈顿距离(Manhattan)欧几里得距离(Euclidean) 二、高级距离马氏距离(Mahalanobis Distance)2.余弦距离(cosine distance) 三,类内距离和类间距离

前言

检测点到目标的的距离通常作为算法的分类或判别依据,被用作评定数据之间的相似度指标

提示:以下是本篇文章正文内容,下面案例可供参考

一、基础距离

假设两点如下图所示: 在这里插入图片描述

曼哈顿距离(Manhattan)

在这里插入图片描述 在这里插入图片描述

欧几里得距离(Euclidean)

在这里插入图片描述 在这里插入图片描述

二、高级距离 马氏距离(Mahalanobis Distance)

马氏距离是度量学习中一种常用的距离指标,同欧氏距离、曼哈顿距离、汉明距离等一样被用作评定数据之间的相似度指标。

马氏距离(Mahalanobis Distance)是一种距离的度量,可以看作是欧氏距离的一种修正,修正了欧式距离中各个维度尺度不一致且相关的问题。 举例:欧式距离近就一定相似?

先举个比较常用的例子,身高和体重,这两个变量拥有不同的单位标准,也就是有不同的scale。比如身高用毫米计算,而体重用千克计算,显然差10mm的身高与差10kg的体重是完全不同的。但在普通的欧氏距离中,这将会算作相同的差距。

再例如:像下图一样,A与B相对于原点的距离是相同的。但是由于样本总体沿着横轴分布,所以B点更有可能是这个样本中的点,而A则更有可能是离群点。这种情况下,欧几里得距离显然不是一个好的度量方式。在这里插入图片描述 马氏距离只需要将变量按照主成分进行旋转,让维度间相互独立,然后进行标准化,让维度同分布就OK了

由主成分分析可知,由于主成分就是特征向量方向,每个方向的方差就是对应的特征值,所以只需要按照特征向量的方向旋转,然后缩放特征值倍就可以了,可以得到以下的结果:

在这里插入图片描述 离群点就被成功分离,这时候的欧式距离就是马氏距离。

在这里插入图片描述

2.余弦距离(cosine distance)

余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。 在这里插入图片描述

三,类内距离和类间距离

一、定义 类内距离(intra-class):同一类各模式样本点间的均方距离 类间距离(inter-class):顾名思义不同类间的距离 在Triplet loss中会遇到 intra-class distances 是指同一个个体在不同摄像机下的距离 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述 在这里插入图片描述



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3