Oracle和达梦:相似度函数:UTL

打印 上一主题 下一主题

主题 907|帖子 907|积分 2721

Oracle和达梦的:相似度函数:UTL

函数:UTL_MATCH.edit_distance_similarity


  • UTL_MATCH.edit_distance_similarity是Oracle数据库中的一个函数,用于计算两个字符串之间的相似度。它基于编辑距离算法,该算法用于衡量两个字符串之间的相似程度。
  • 编辑距离是通过计算将一个字符串转换为另一个字符串所需的最少编辑操作次数来衡量的。这些编辑操作可以是插入、删除或替换字符。
  • 函数UTL_MATCH.edit_distance_similarity返回一个介于0和100之间的相似度分数,表示两个字符串之间的相似程度,其中0表示完全不相似,100表示完全相似。
  • 通过使用UTL_MATCH.edit_distance_similarity函数,您可以比较两个字符串的相似程度,并根据需要进行进一步的处理或决策。例如,您可以在搜索引擎中使用它来提供与用户查询相关的最佳匹配结果,或者在数据清洗过程中使用它来查找相似的字符串并进行合并或去重操作。
使用

1、第一个参数是要匹配的字符串,第二个参数是要与之进行匹配的字符串
  1. SELECT UTL_MATCH.edit_distance_similarity ('param1', 'param2') AS similarity
复制代码

  • 返回:84
☆2、第一个参数可以是查询表的列,您可以将表的列名作为第一个参数传递给该函数,以计算该列中每个值与指定字符串之间的相似度。
  1. SELECT UTL_MATCH.edit_distance_similarity (列名, '6') AS similarity
  2. SELECT UTL_MATCH.edit_distance_similarity ("列名", '6') AS similarity
复制代码
实践


  • 查询表TABLE_1的C2_VARCHAR2字段的值和6匹配的相似度,并且取相似度大于2的值
  1. SELECT
  2.   *
  3. FROM
  4.   (
  5.   SELECT
  6.     UTL_MATCH.edit_distance_similarity (C2_VARCHAR2, '6') AS similarity
  7.   FROM
  8.     TABLE_1
  9.   ORDER BY similarity DESC) AS a
  10. WHERE
  11.   similarity >= 2
复制代码
返回:


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

老婆出轨

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表