AI芯片架构体系综述:芯片范例CPU\GPU\FPGA\ASIC以及指令集CSIS\RISC先容

[复制链接]
发表于 2026-2-20 07:43:03 | 显示全部楼层 |阅读模式
大模子的发展意味着算力变的越发紧张,由于大国间科技竞争的关系,国内AI从业方在将来的一段时间存在着算力不确定性的题目,与之而来的是很多新型算力替换方案的产生。怎样从架构关系上很好的明确盘算芯片的种类,而且从盘算范例、生态、流片本领等多角度评估算力需求,正在成为AI方向负责人的焦点竞争力。
正由于这个缘故原由,近来几个苏息日我不绝在看相干范畴的文章和论文,试着理整理力根本架构关系,由于已往积累不敷深,大概有禁绝确的地方,还望指出。

PART01 AI芯片架构体系
学习芯片架构,起首必要有一个体系架构图,怎样评价一款AI芯片,可以从芯片范例、指令集范例、指令集架构、代表公司以及制程几个角度来看。
差别的芯片范例决定了芯片的用途和筹划理念,以是这方面肯定是相识芯片最关键的一点。指令集范例和指令集架构,跟芯片的生态痛痒相干,由于一款好的芯片,不光要具备强盛的盘算性能,也要有广泛、机动的开辟者生态体系,做到软硬团结。末了一点是公司以及制程,公司的市占率以及芯片的制程是否富足先辈,关系到芯片的商用成熟度以及供货保障程度。接下来会详细睁开以上几个方向。
PART02AI芯片根本范例



CPU、GPU、FPGA、ASIC是现在AI盘算过程中最主流的四种芯片范例,他们的紧张区别体现在盘算服从、能耗和机动性上面。

  •         CPU:CPU是冯诺依曼架构下的处理处罚器,遵照“Fetch (取指) -Decode (译码) - Execute (实行) - Memory Access (访存) -Write Back (写回)”的处理处罚流程。在实行盘算使命过程中,数据必要先获取并存入RAM,然后解码得到指令,然后在ALU盘算模块盘算,终极将盘算效果返回RAM。整个流程更夸大控制和决定,在并行盘算服从上有较大提升空间
  •         GPU:GPU最早用于图像处理处罚范畴,镌汰了大量数据预取和决定模块,增长了盘算单位ALU的占比,从而在并行化盘算服从上有较大上风。
           
           

  •         FPGA:FPGA的筹划使得盘算逻辑非常机动,它不像CPU和GPU那样只能实行编译和汇编的内容,FPGA由于险些没有控制模块,全部模块都是ALU盘算模块,而且全部模块都可定制开辟。但这也是FPGA的紧张缺陷,由于具备很强的机动度,导致筹划难度和复杂度较高。
           

  •         ASIC:ASIC是专门针对某一范畴筹划的芯片,好比神经网络盘算芯片NPU、Tensor盘算芯片TPU等。由于是针对特定范畴定制,以是ASIC通常可以体现出比GPU和CPU更强的性能,ASIC也是现在国表里很多AI芯片筹划公司紧张研究的方向,可以预见将来市面上会渐渐有大量AI范畴的ASIC芯片出现。

PART03AI芯片指令集和架构
接着说下AI芯片的指令集,起首要相识指令集是什么。盘算机实行使命的过程可以看作是把步调编译成硬件可以明确的语言,再有硬件完成终极的盘算工作。指令集可以明确是为编程和编译服务的一种盘算机硬件可以明确的语言。
指令集分复杂指令集(CSIC)和精简指令集(RISC)。

CSIC紧张用于传统的CPU芯片范畴,他的筹划模式是把用一个指令完成较复杂的使命,好比”帮我选个餐厅“。RISC是精简指令集,把使命举行拆解,好比”先相识我喜好什么“,再”查查附近有什么餐厅“,”做一个匹配“。由于精简的筹划,RISC在优化编译方面有很大的空间,现在深度学习紧张盘算都在RISC指令集的英伟达GPU芯片,以是现在在盘算的编译优化方向,有很大空间,也是行业聚焦的技能方向。
接下来看下指令集架构(ISA),在AI范畴必要重点关注ARM、RISC-V,国表里很多厂商也有在探索自研指令集架构,但是也是基于ARM大概RISC-V的筹划思绪。
ARM架构则是由英国的ARM Holdings公司开辟的,它是为嵌入式体系和移动装备而筹划的。ARM架构的紧张特点是低功耗、高性能和可扩展性,它可以支持移动装备、嵌入式体系、智能家居等应用。
RISC-V是近些年非常盛行的指令集架构,RISC-V与 ARM 和 MIPS 最大的差别照旧在于其为 RISC-V 基金会举行尺度的订定和维护工作而非商业公司,任何人可以无偿使用该指令集开辟本身的 CPU ,大概往本身已有的芯片中集成开源免费的 RISC-V IP Core,这是比力吸引电子装备厂商的紧张缘故原由。
PART04总结
近来有几个大事故,一个是NV收购ARM进军CPU范畴,别的就是美国强化了对国内的高端芯片制裁。从这些动作来看,AI芯片的新一轮竞争暗潮汹涌,随着各个厂商都在镌汰本身的芯片生态体系,将来在编译优化、异构芯片调治、冯诺依曼内存墙突破等方向肯定会有更多新的工作,这些也必要连续探索。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表