联邦学习中的非独立同分布Non-IID

罪恶克星  金牌会员 | 2024-6-10 00:25:26 | 来自手机 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 534|帖子 534|积分 1602

在联邦学习Federated Learning中,出现的很高频的一个词就是Non-IID,翻译过来就黑白独立同分布,这是一个来自于概率论与数理统计中的概念,下面我来简单介绍一下在Federated Learning中IID和Non-IID的概念。
何为IID(独立同分布)

IID是数据独立同分布(Independent Identically Distribution,IID),它是指一组随机变量中每个变量的概率分布是相同的,且这些随机变量互相独立。下面介绍IID中的“独立”和“同分布”这两个概念:


  • 独立性:采样样本之间相互独立,互不影响。用数学公式表达:假如随机变量X和Y独立,那么它们的团结概率分布可以分解为                                        P                            (                            X                            ,                            Y                            )                            =                            P                            (                            X                            )                            ∗                            P                            (                            Y                            )                                  P(X,Y)=P(X)*P(Y)                     P(X,Y)=P(X)∗P(Y)。
   例如抛骰子,我抛两次,上一次抛的结果并不会影响到下一次的结果,这两次采样样本之间就是独立的。但是假如说我想要两次结果之和大于8,那么这时间两次抛就不独立了。
  

  • 同分布:全部采样样本均来自同一个分布。
   还是抛骰子,每次采样的样本都来自于同一个分布,即每次抛都会随机得到一个1~6的点数,每个点数的概率为1/6。
  如今许多呆板学习中的方法都是基于数据IID的假设,这是一种理想情况,由于在实际中往往是Non-IID的
何为Non-IID(非独立同分布)

首先要明确一个概念,Non-IID是非·独立同分布,解释来说就是,Non-IID可以分为三类:非独立但同分布、独立但非同分布、非独立也非同分布。上述的任何一种我们都可以称之为Non-IID。


  • 非独立:两个或多个随机变量之间存在肯定水平的关联,一个随机变量的值可能受到其他随机变量的影响。
   比如要求两次抛骰子结果之和大于8、不放回地摸黑球白球。
  

  • 非同分布:样本并不是从同一个分布中采样得到的。
   来自差别的分布,一个样本我从抛骰子中获取16,另一个样本我从扑克中抽AK。
  联邦学习中的Non-IID

在呆板学习中,有特征Features标签Labels这两个概念。由这两个概念,我们就能引申出FL中的5种Non-IID情况:

  • Feature Distribution Skew 特征分布偏差
  • Label Distribution Skew 标签分布偏差
  • Same Label,different features 相同标签,差别特征
  • Same Feature,different labels 相同特征,差别标签
  • Quantity skew or unbalancedness 数量倾斜或不平衡
在FL中,数据是存储在差别的设备上的,而各个设备可能收罗差别范例的数据、数据量差别、数据质量差别、数据收罗的时间和所在也差别,因此差别设备之间的数据可能黑白独立或非同分布的。
由于数据Non-IID,在联邦学习模型训练时,可能会受到的影响:

  • 模型收敛困难:当各设备的当地数据分布差别或数据质量差别较大时,全局模型收敛会受到影响,由于差别设备间的当地模型更新归并起来不太容易。
  • 性能不稳定:由于数据Non-IID,全局模型可能在某些设备上表现精良,而在另一些设备上表现很差。
在FL中,Non-IID通常伴随着异构性Heterogeneity一起出现。我们通常以为,Non-IID是异构性Heterogeneity的一种表现,而异构性Heterogeneity在概念上更为广泛。
在FL中,异构性Heterogeneity一样平常分为三种:

  • 设备异构性:差别的设备有差别的硬件性能,如cpu、gpu、内存等,导致计算本领差别。此外网速和稳定性方面也各有差别;
  • 统计异构性:设备的数据可能来自于差别的数据源、收罗方式、时间段、情况等,导致数据的统计性子存在差别;
  • 数据异构性:设备的数据可能是差别的范例(文本/图像/音频等);

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

罪恶克星

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表