首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
SAAS
ToB门户
了解全球最新的ToB事件
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
微博
Follow
记录
Doing
博客
Blog
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
排行榜
Ranklist
相册
Album
应用中心
qidao123.com ToB IT社区-企服评测·应用市场
»
论坛
›
软件与程序人生
›
云原生
›
ARM N2微架构先容
返回列表
发新帖
ARM N2微架构先容
[复制链接]
发表于 2025-5-9 11:31:54
|
显示全部楼层
|
阅读模式
简介
之前在“ARM V2处理器微架构先容”一文中先容了面向
服务器
、云计算等应用的ARM V2处理器微架构,V系列具有更强
性能
,N系列强调
性能
和功耗等方向的平衡,本文就将先容一下ARM N2处理器微架构相比较前代的一些提升。尽管ARM还具备一代N1/V1的
服务器
端处理器,但严格意义讲N2是ARM相对成熟的第一代
服务器
端处理器IP。
前端Front-End
前端的计划相比较前代可以说是巨大提升,预测和取指依然是解耦计划,本代CPU对预测器做了重点的升级。
预测器方面,原来的8instrs/cycle提升为2x8instrs/cycle,每个周期可以处理2个分支,相对应的分支执行也是每个周期处理2个分支。这个特性属于一个相对复杂的实现,AMD的Zen4 Epyc也是同样实现了这个特性,详细的实现方案没有查到更多的资料,最近亦安有渴望会写文章讨论一下。
BTB方面,NanoBTB是由原来的16 entries提升到64 entries,早期的快速重定向能力有比较大的提升。Main BTB的大小由6K entries提升到8K entries,而且延迟更低,分支目标tagged关联了上下文以强化
安全
问题。
ICache是64KB,4路组相联,依然是VIPT构造结构,校验方式是奇偶,Cache line是64bytes。值得一提的是Mop Cache,这个是初次在服务器端使用该特性,在手机端是A77开始具有该特性,主要为了绕过decode快速进入下一个模块。具有1536 entries,4-way skewed组相联,VIVT的构造结构,Cache替换算法PLRU,公开资料显示Mop Cache命中率有85%,命中率还不错。不过不管是服务器还是移动端,这个特性都被舍弃了,服务器是N3/V3放弃的,移动端应该是X4放弃的。
Fetch Queue从原来的12 entries提升到16 entries,decode宽度4(ICache)5(Mop Cache)
Mid-Core & Back-End
rename宽度由4instrs提升到5instrs,增加了checkpointing,ROB也由128提升到160,ALU从3提升到4,低落了分支预测错误惩罚,从11cycle降到10cycle。
L1 Dcache 64KB,4-way组相联,使用VIPT的构造方式,校验方式是ECC,替换算法是PLRU,后面一代的N3改为RRIP。具有2-LD/ST和1-LD。L2的带宽翻倍,变为64B读+64B写。预取引擎也有所优化,例如Temporal预取器可以预取恣意的、重复的访问模式,以加速使用时间流的工作
负载
。
关于CCS
N2的一个别的重点就是加入CCS,对用户而言搭建复杂体系更加便捷,不过这不是本文的重点,简单描述。互联体系升级为CMN700,各种连接口实际都升级到下一代,但互联属于核心关键技术。
总结
ARM N2还是属于比较经典的一代CPU,不少的公司都在使用,其很多微架构的计划都比较有趣,很多特新大家也可以参考相关的论文研究。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
回复
使用道具
举报
返回列表
浏览过的版块
向量数据库
杀鸡焉用牛刀
+ 我要发帖
登录后关闭弹窗
登录参与点评抽奖 加入IT实名职场社区
去登录
微信订阅号
微信服务号
微信客服(加群)
H5
小程序
快速回复
返回顶部
返回列表