运维.售后
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
博客
Blog
ToB门户
了解全球最新的ToB事件
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
物联网
›
物联网
›
基于Spark计算网络图中节点之间的Jaccard相似性 ...
基于Spark计算网络图中节点之间的Jaccard相似性
愛在花開的季節
金牌会员
|
2024-8-26 18:58:01
|
显示全部楼层
|
阅读模式
楼主
主题
903
|
帖子
903
|
积分
2709
基于Spark计算网络图中节点之间的Jaccard相似性
Jaccard 相似度是一种较为常用的衡量两个聚集相似性的指标,用于计算两个聚集的交集与并集的比率。具体来说,它的计算公式为:
在网络图中同样经常使用Jaccard来计算节点之间的相似性,对于图中的每个节点,收集其邻人节点作为一个聚集,然后差异节点之间使用对应的聚集计算节点之间的相似性。这种计算方式考虑的是节点的局部结构,即节点的直接邻人关系。如果两个节点具有较高的 Jaccard 相似度,意味着它们有较多的共同邻人,表明它们在图中的局部结构上非常相似。
Jaccard计算简单,易于理解和实现,在推荐系统(在社交网络或电商平台中,可以使用 Jaccard 相似度来推荐挚友或商品。比方,在社交网络中,具有共同挚友的用户可能更容易成为朋侪。)或是社区发现(在网络图中,相似度较高的节点可能属于同一社区或群体。通过计算节点对之间的 Jaccard 相似度,可以辅助发现社区结构或群体。)等领域都有广泛应用。
一、使用Jaccard相似性计算网络图中节点相似性的实现流程
收集全部指向节点的邻人节点(in-degree)
收集全部由节点指出的邻人节点(out-degree)
拼接in-degree和out-degree,获取节点全部的邻人节点
词袋模子编码,为每个节点天生一个特征聚集,方便后续使用Spark自带的MinHashLSH方法加快节点相似度的计算
MinHash计算节点之间的相似度,得到最终计算结果
二、什么是MinHashLSH
什么是MinHashLSH
三、完整代码(基于Scala)
完整代码(基于Scala)
总结
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
正序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
发新帖
回复
愛在花開的季節
金牌会员
这个人很懒什么都没写!
楼主热帖
【网络进阶】网络问题排查实例集锦(实 ...
流批一体开源项目ChunJun技术公开课— ...
Socket的长连接和短连接
HA启动Advanced SSH & Web Terminal 提 ...
Redis 原理 - Hash
RadonDB MySQL Kubernetes 2.2.0 发布 ...
一次服务器被入侵的处理过程分享 ...
SpringBoot
数据库设计的步骤
如何基于 ZEGO SDK 实现 Flutter 一对 ...
标签云
存储
服务器
快速回复
返回顶部
返回列表