机器学习——欧式间隔、闵氏间隔、马氏间隔、曼哈顿间隔、切比雪夫间隔(自 ...

打印 上一主题 下一主题

主题 1975|帖子 1975|积分 5925

间隔度量方式:在机器学习和数据分析中,间隔度量衡量特征空间中的两个实例之间的相似度常用的间隔计算方式:欧几里得间隔(欧式间隔)、闵氏间隔、马氏间隔、曼哈顿间隔、切比雪夫间隔
    ①欧几里得间隔公式(Euclidean Distance)
  其定义为多维空间中两点间的直线间隔
  其公式为:
  

  其缺点是对异常值敏感,当出现各个特征的量纲差异较大时,容易出现分类准度下降,故在使用之前需要对数据标准化(Z-score用于消除数据量纲(单位)差异,使得差别特征的数据具有可比性)
    ②闵氏间隔(Minkowski Distance,又称闵可夫斯基间隔)
  其定义为欧式间隔的泛化情势,通过参数p调节间隔计算方式
  其公式为:
  

  这个公式相当锋利,将其他范数都囊括进来了,好比通过一个p参数就实现将曼哈顿间隔、欧式间隔、切比雪夫间隔包含在内。
  当p=1时,其为曼哈顿间隔公式,用于做路径规划、网格路径计算
  当p=2时,其为欧式间隔公式,
  当p->无穷时,其为切比雪夫间隔公式,用于棋盘游戏
     ③马氏间隔(Mahalanobis Distance,又称马哈拉诺比斯间隔)
  其定义考虑数据协方差结构的标准化间隔,消除特征干系性和量纲的影响
  其公式为:
  

  可以看出当Σ 为协方差矩阵为单位矩阵(样本各特征之间相互独立且方差为1)时,其就酿成了欧式间隔公式。
  其常用于分类使命(LDA)、异常检测、多元统计分析
    补充知识:协方差是衡量两个变量之间的线性关系的统计量,正值表现正干系,负值表现负干系,零表现无线性干系。即反映两个变量的变化趋势是否同等
  


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

三尺非寒

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表