转向 3 纳米工艺技能代表着半导体制造的庞大飞跃,在性能、功耗和芯片密度方面均有明显改善。这一变革使 Arm 能够提供更强盛、更高效的处理器,能够高效处理最苛刻的应用步伐。
3 nm 工艺的重要优势之一是它能够在更小的面积内封装更多晶体管,从而提高性能并降低功耗。这对于移动和便携式设备至关重要,因为电池寿命和热管理是关键思量因素。3 nm 工艺还使 Arm 能够在 Cortex X925 内核上提高时钟速率,确切地说最高可达 3.8 GHz。这可以实现更快、相应更快的盘算体验,并将整体 IPC 性能推向逾越现有水平。
Arm 声称,更新后的 Armv9.2 架构、全新 CSS 平台以及 3 纳米制程技能的结合,旨在全面提升性能和服从。从理论上讲,这应该能够为所有范例的设备实现其参考 CPU 焦点集群计划,现在两个 Cortex X 焦点已成为常态,而去年的参考计划只有一个。Arm 举行并展示的基准测试和实际测试(不应全盘担当)显示,单线程和多线程性能都有了明显提升,使得这些新解决方案成为各种应用的理想选择。Arm 乃至宣称,其最大焦点 Cortex X925 在单线程 IPC 方面处于领先职位,逾越了英特尔和 AMD 的本事,这是一个大胆的说法。
至于电源服从,新内核旨在提供更高的每瓦盘算本事,从而降低能耗并延长电池寿命。这对于移动设备来说尤其重要,因为用户必要更长的电池寿命,同时又不影响性能。电源服从的提高还意味着更好的热管理,确保设备纵然在繁重的工作负载下也能保持凉快和相应迅速。
除了性能和服从的提升,新解决方案还带来了增强的安全性和AI功能。Armv9.2架构的内存标记扩展(MTE)和秘密盘算架构(CCA)可针对各种安全威胁提供强盛的保护,确保数据和应用步伐的安全。
新内核和 GPU 增强的 AI 功能也值得关注。随着 AI 在现代应用中的重要性日益提高,新解决方案旨在加速 AI 工作负载,提供更快、更高效的 AI 处理。这是通过专用的 AI 加速器和优化来实现的,这些加速器和优化充实使用了新架构和工艺技能的潜力。
工艺技能向 3 nm 迁移为半导体制造带来了很多机遇和挑战。对于软 IP,更大、更复杂的微架构必要更强的电压调节和缓解功能,以确保稳定性和性能。关键目的是优化目的节点上的精确 PPA(功率、性能、面积)。对于物理 IP,工艺复杂性带来了自身的挑战,包罗扩展限定和支持更宽动态电压和频率缩放 (DVFS) 频谱的要求。别的,在极端功率密度下,这应该可以缓解热标题,并确保设备高效运行,这在移动设备中非常重要
为了应对这些挑战,Arm 全面审阅 RTL 和物理实现的共同开发。这确保了其盘算 IP 能够满意性能预期,同时降服先辈工艺技能的挑战。
Armv9.2、CSS 和 3 nm 技能的进步为各种应用开发了新的可能性,包罗开发人员访问新的 Arm Kleidi 库。在移动领域,这些解决方案使更强盛、更高效的智能手机宁静板电脑能够处理复杂的任务,比方 AI 驱动的摄影、游戏和生产力。
新的解决方案以便携式外形尺寸为 PC 市场提供台式机级性能,使其成为笔记本电脑和二合一设备的理想选择。改进的性能和服从也有利于专业内容创作,从而实现更快的渲染、编辑和多任务处理。
Arm 硬件的进步得益于一个复杂的软件生态系统,该生态系统旨在充实发挥其处理器的潜力。这个生态系统的焦点是新的 Kleidi 库,它在优化人工智能 (AI) 和基于盘算机的应用步伐方面发挥着至关重要的作用。这些库为开发人员提供了量身定制的工具,以最大限度地提高 Arm 最新内核的性能和服从。
KleidiAI 是专注于加速 AI 工作负载的关键组件。它包罗一套针对 Arm 架构优化的全面盘算内核,能够高效执行各种 AI 任务,比方机器学习、天然语言处理和数据分析。通过为常见的 AI 操纵提供高度优化的例程,KleidiAI 可让开发人员在保持能源服从的同时实现显着的性能提升。随着 AI 应用在移动设备、智能家居系统和工业自动化中变得越来越普遍,这一点变得越来越重要。
另一方面,KleidiCV 则针对盘算机视觉工作负载。该库为图像处理、对象检测和场景识别等任务提供了优化的功能。将 KleidiCV 与 Arm 的架构集成可确保应用步伐能够快速高效地处理视觉数据,使其成为增强现实、自动驾驶汽车和智能监控系统的理想选择。通过使用这些优化的库,开发人员可以构建在基于 Arm 的硬件上流畅运行的复杂应用步伐,充实使用 3 nm 工艺技能带来的性能和能效改进。
除了 Kleidi 库之外,Arm 还提供了一套强盛的开发工具宁静台。Arm 盘算子系统 (CSS) 平台包罗参考软件堆栈和性能优化工具,如 Arm Performance Studio,它提供有关应用步伐性能的详细看法,并帮助开发人员微调其软件以实现最高服从。这个全面的支持系统确保开发人员能够快速有效地将创新应用步伐推向市场,充实使用 Arm 最新的架构进步。
在接下来的几页中,我们将分解 Arm 在其 2024 CPU 集群中的改进,包罗新的 Cortex X925 和 Cortex A725 内核以及使用最小内核 Cortex A520 所做的改进。