论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
软件与程序人生
›
云原生
›
【SOC】SoC架构体系总线的QoS管理——QoS generator ...
【SOC】SoC架构体系总线的QoS管理——QoS generator
一给
论坛元老
|
2025-1-25 15:20:06
|
来自手机
|
显示全部楼层
|
阅读模式
楼主
主题
1843
|
帖子
1843
|
积分
5529
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
#工具文档明确#
QoS——Quality of Service
目次
一、概念
Master对于Latency的敏感性
流量控制和事件级概念
Splitting
Pending order IDs
数据包创建和传输的QoS
序列化
一、概念
这一部分描述了QoS机制如何平衡不同发起者的流量访问,以适应互连的有限可用资源。公道组织互连资源,如缓冲区、连线、NIU(网络接口单元)上下文等,通常会提高整体体系性能,并使满足个别流量的QoS要求变得更容易。
Master对于Latency的敏感性
将Master端分为三种类型:
及时性或延时关键性 :由时钟源举行采样的initiator,对延迟非常的敏感,如果超过缓冲的容量,那么传输就会fail。
例:调制解调器的帧,Video的线频场频发生器是对延迟极其关键的初始端,视频表现的流量通常使用一样平常的视频线举行缓冲,有几微秒的容忍度,视频解码器可以缓冲好几个帧,所以可以容忍长达数百毫秒的延迟。
延时敏感的:在这一组中的master由于延迟会导致较低的性能
例:单线程CPU是对延迟敏感的master,硬件多线程以及推测性的访问会屏蔽掉他们的敏感性。
最佳性能:对延时不敏感的,可以容忍其他master造成的delay。
流量控制和事件级概念
QoS受到流量交互和访问共同下游目的地的竞争的影响。
NoC技能包罗多个特性,如burst的切分,限制挂起事件的数量等来防止master垄断共享资源。
Splitting
切分可以提高QoS由于当initiator发出长写哀求数据包或者长读响应数据包时,切分会淘汰多路复用时间,当数据包被一个仲裁器选择时,其他多路复用器的输入就会被生存,等候下一个仲裁周期。因此,如果不举行分割,其他initiator的QoS就会低沉。
Pending order IDs
具有相同ID值的事件必须按照其哀求的次序举行响应,initiator NIU必须在收到响应之后根据哀求重新关联它们,这就必要一个挂起事件的页表,此中链表指向具有相同ID的先前挂起事件的上下文,支持大量的挂起ID在逻辑延迟和面积上的花销是巨大的,一样平常情况下,建议将initiator端NIU配置为支持不超过所需挂起次序ID的数量,以制止限制所连接的IP的性能。
数据包创建和传输的QoS
一旦NIU处理了事件,产生的数据包通过FlexNoc传输拓扑由多路复用器路由,并在多路复用器上举行仲裁。
并发性
并发性是互联的一种属性,它允许多个访问同时发生,并发的级别取决于互连拓扑的类型。
下面是一个2x2的共享总线拓扑和交织开关拓扑
在互联A中,initiator会仲裁访问目标的总线时间,并发的访问是不可能的。在具有来自多个initiator的高累计吞吐量的体系中,总线共享会导致限制性能的瓶颈。还要注意在互联A中,如果通过共享链路的流量被阻止向下游前进,那么其他必要通过共享链路的流量也会被阻断,因此,通过共享链路的流量之间存在很强的耦合效应,无论是在带宽上还是在流量控制上。
在互联B中,initiator根据每个目标仲裁访问,多个initiator可以并发访问多个目标,由于并发访问消除了瓶颈,因此全交织是理想的NoC拓扑,可以满足发起者的QoS
要求。
然而,QoS必须与芯片物理实现的实用性相平衡,由于多路复用器逻辑和布线的数量随initiator和target数量而变化,对于大量的initiator或target,crossbar的资源花销太大,相比之下,共享总线拓扑的成本就比较低。
多路复用级别
通过互连传输的事件可以在多个级别上举行多路复用,多路复用的级别会影响每个事件的可用吞吐量,从而影响到QoS
仲裁多路复用器息争路复用路由器在互联中的位置称为拓扑,如串行化、时钟速率、缓冲等。
在下图中,两个拓扑(A和B)都有上游的源,在多路复用器符号的左边,这些源要经过仲裁才能访问右边的下游目的地。
在图中,A有个单级多路复用,因此全部源都获得了吞吐量的三分之一,拓扑B有两级多路复用,假设连续哀求和全部仲裁的优先级相同,:
两个源在第一级多路复用器举行仲裁时接收1/4的可用吞吐量。
在第二级多路复用器仲裁的源获得更大的吞吐量,吞吐量的一半,提供给源的吞吐量变化随着源数量的增加而增加
由于流量可以在每一级多路复用上被壅闭,因此最初沿着多路复用器树进一步争夺仲裁的源具有较低的平均延迟。
多级多路复用不必要比单个多路复用器更多的逻辑面积或延迟,因此引入多级多路复用是分配吞吐量和将延迟分配给不同源的有用方法。
序列化
序列化包罗配置物理链路的字节宽度和用于携带包头部信息的时钟周期的数量,可以在NoC拓扑中的任何位置举行配置序列化。
序列化计谋
为了低沉逻辑和布线成本,序列化可以低带宽链路上窄化,但是窄序列化会导致头部开销丧失,并且必要更多的数据传输周期,从而增加延迟。当延迟很严肃并且完成数据传输所需的周期数很大时,更宽的序列化可以产生更好的QoS,在某些情况下,与第一个数据字并行传输报头可以淘汰一个时钟周期的延迟,但代价是额外的物理资源,当数据包中的字数与总事件相比很小时,序列化对延迟的影响可以忽略不计,因此,应该只根据必要配置序列化,以提供所需的带宽。
序列化例子
下图是对一个8个字的传输的两种序列化的配置,
配置A,它由一个周期的报头和四个周期的数据双字组成,一共必要5个周期来传输数据包。
配置B,使用窄序列化,包含了两个周期的报头和9个数据字组成,一个必要10个时钟周期传输完成,是配置A的双倍。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
一给
论坛元老
这个人很懒什么都没写!
楼主热帖
手把手教你如何使用kali破解wifi密码( ...
3.2操作系统(基本分页存储管理的基本 ...
C++面试八股文:std::array如何实现编 ...
嵌入式 Linux 内核驱动开发【The first ...
零基础入门 Java 后端开发,有哪些值得 ...
你真的了解二叉树吗?(上篇) ...
Wireshark学习笔记(一)常用功能案例 ...
Kubernetes(K8S) Deployment 升级和回 ...
上古神兵,先天至宝,Win11平台安装和配 ...
当“超融合”邂逅“奥 ...
标签云
AI
运维
CIO
存储
服务器
浏览过的版块
移动端开发
IOS
物联网
运维.售后
Mysql
开源技术
容器及微服务
快速回复
返回顶部
返回列表