机器学习——欧式间隔、闵氏间隔、马氏间隔、曼哈顿间隔、切比雪夫间隔(自用)
间隔度量方式:在机器学习和数据分析中,间隔度量衡量特征空间中的两个实例之间的相似度,常用的间隔计算方式:欧几里得间隔(欧式间隔)、闵氏间隔、马氏间隔、曼哈顿间隔、切比雪夫间隔。①欧几里得间隔公式(Euclidean Distance)
其定义为多维空间中两点间的直线间隔
其公式为:
https://i-blog.csdnimg.cn/direct/8410bb8322814663b58673c00b0cb5c9.png
其缺点是对异常值敏感,当出现各个特征的量纲差异较大时,容易出现分类准度下降,故在使用之前需要对数据标准化(Z-score用于消除数据量纲(单位)差异,使得差别特征的数据具有可比性)
②闵氏间隔(Minkowski Distance,又称闵可夫斯基间隔)
其定义为欧式间隔的泛化情势,通过参数p调节间隔计算方式
其公式为:
https://i-blog.csdnimg.cn/direct/bc3b8c99704645459c4b9b3eff4323ec.png
这个公式相当锋利,将其他范数都囊括进来了,好比通过一个p参数就实现将曼哈顿间隔、欧式间隔、切比雪夫间隔包含在内。
当p=1时,其为曼哈顿间隔公式,用于做路径规划、网格路径计算
当p=2时,其为欧式间隔公式,
当p->无穷时,其为切比雪夫间隔公式,用于棋盘游戏
③马氏间隔(Mahalanobis Distance,又称马哈拉诺比斯间隔)
其定义考虑数据协方差结构的标准化间隔,消除特征干系性和量纲的影响
其公式为:
https://i-blog.csdnimg.cn/direct/05723e45140348899a6eba68f33bbfef.png
可以看出当Σ 为协方差矩阵为单位矩阵(样本各特征之间相互独立且方差为1)时,其就酿成了欧式间隔公式。
其常用于分类使命(LDA)、异常检测、多元统计分析
补充知识:协方差是衡量两个变量之间的线性关系的统计量,正值表现正干系,负值表现负干系,零表现无线性干系。即反映两个变量的变化趋势是否同等。
https://i-blog.csdnimg.cn/direct/391be177b6b449b69b5e0c2a67290d43.png
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]