qidao123.com技术社区-IT企服评测·应用市场

标题: 并行计算——绪论 [打印本页]

作者: 金歌    时间: 2023-6-18 13:07
标题: 并行计算——绪论
一、绪论

1.1 基本概念

1.2 求和案例

1.2.1 分配流程

PE = 1:即为串行。
PE = 2:PE#0分1半任务给PE#1,分别计算,PE#1将求和后数据汇聚到PE#0。

PE = 4:

1.2.2 分发时间计算

以PE = 2为例
共计 3 + 511 + 3 + 1 个时间单元
通用表达式
使用\(p=2^{q}\)个处理单元,以及\(n=2^{k}\)个输入整数
则共 \(T(p,n)=T(2^{q},2^{k})=3q+2^{k-q}-1+3q+q=2^{k-q}-1+7q\)
1.2.3 扩展性分析

强扩展性分析:改变处理器的数量,并行计算时间、加速比、开销和效率变化规律;
弱扩展性分析:改变处理器的数量,同时改变数据量,并行计算时间、加速比、开销和效率变化规律;
上述算法不是强扩展性,是弱扩展性。
1.2.4 一般情形计算

$\alpha $:执行一次单独的假发操作需要的时长
$\beta $:传输一批整数需要的时长;
运行时间:\(T_{\alpha,\beta }(p,n)=T(2^{q},2^{k})=\beta q+\alpha(2^{k-q}-1)+\beta q+\alpha q=2\beta q +\alpha (2^{k-q}-1 + q)\)
加速比:$S_{\alpha ,\beta } (2^{q}, 2^{k})=\frac{T_{\alpha ,\beta }(2^{0}, 2^{k})}{T_{\alpha ,\beta }(2^{q}, 2^{k}) }=\frac{\alpha(2^{k}-1)}{2\beta q + \alpha(2^{k-q}-1+q)} $
通信比:\(\gamma=\frac{\alpha}{\beta}\)
求解最优单元:\(2^{q}={\frac{\gamma\ln2}{2+\gamma}}2^{k}\)
比如,对于\(\gamma=\frac{1}{3},n=1024\),加速比最大可求\(p=1000\)
当处理数据规模固定,并行效率和加速比依赖于计算单元个数和计算通信比;
1.3 并行计算基础

1.3.1 分布式内存

特点:每个PE只能访问自己的本地内存,如果跨PE访问,需要一个显式的通信步骤。
数据划分是分布式内存系统编程的关键。

1.3.2 共享内存系统

通过一个共享总线或者纵横交换机,所有的CPU都能访问同一块公共内存空间。

1.4 并行程序设计考虑因素

求和案例

1.5 不同层次的并行


参考:《并行程序设计》

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/) Powered by Discuz! X3.4