用户云卷云舒 发表于 2025-1-3 10:15:28

IS-2T2R存储器:AWS精度下降问题的解决方案

在本篇中,我们将先容《An isolated symmetrical 2T2R cell enabling high precision and high density for RRAM-based in-memory computing》这篇文献,它提出了一种对称式的2T2R忆阻器布局,通过引入隔离晶体管解决了传统2T2R忆阻器非对称布局带来的权重感知问题,团结工艺优化,实现了42.2%的集成度提拔和8.8fJ/op的能效,下面是详细先容。
一、文章基础信息基期刊信息
本篇文章由北京大学集成电路学院和北京邮电大学信息光子学与光通信国家重点实验室共同完成,于2024年4月23日发表在SCIENCE CHINA Information Sciences上。
SCIENCE CHINA是一个系列期刊,包罗数学、物理、化学、生命科学、地球科学、技能科学、信息科学等多个学科领域,现在被SCI、EI和SCOPUS等国际数据库收录,最新影响因子为7.3,位于JCR Q1区,网站http://scis.scichina.com。本文所发表在的Information Sciences(信息科学)是其系列期刊之一,由中国科学院主管,中国科学院和国家自然科学基金委员会共同主办,与 Springer 共同出书,现在被SCOPUS、中国科学引文数据库(CSCD)、中国科技论文统计源期刊、北大焦点、中国科技论文与引文数据库(CSTPC)等收录。
二、传统模仿存算RRAM架构及其问题
在模仿存算领域,RRAM因其独特的非易失性、高密度集成和模仿电导调制能力而备受关注,被认为是构建高效能神经网络加快器的有力竞争者。传统的RRAM架构重要包括1T1R、2T2R以及Crossbar布局,它们各有优缺点,适用于不同的应用场景。
(1)1T1R布局
1T1R布局是最根本的RRAM单元,由一个晶体管(T)和一个RRAM器件(R)串联组成,如图1所示。晶体管作为选通器件,控制RRAM的读写利用,并防止阵列中未选中的单元受到干扰。这种布局的优势在于其简单性和高集成密度,可以通过缩小晶体管和RRAM器件的尺寸来实现更高的存储容量。然而1T1R单元只能通过调治RRAM器件的电导值来表示权重,而电导值本质上是非负的,这意味着1T1R单元只能表示无符号权重。这限制了其在需要处理负权重的神经网络应用中的适用性,比方在某些低权重位宽的卷积神经网络(CNN)和循环神经网络(RNN)中,负权重对于网络的性能至关重要。
https://i-blog.csdnimg.cn/direct/64c3e4f3be0249e68bed8f4af74c3fd9.png
图1 (a)直流扫描期间1T1R布局和利用示意图;(b)单个1T1R布局的等效电路
(2)2T2R布局
为相识决1T1R布局无法表示有符号权重的问题,研究人员提出了2T2R布局,如图2所示。该布局包罗两个晶体管(T1,T2)和两个RRAM器件(R1,R2),通过将两个RRAM器件的电导值相减来表示权重,即W=G1−G2,其中W表示权重,G1和G2分别表示两个RRAM器件的电导。通过控制两个RRAM器件的电导状态,可以实现正、负和零权重的表示。比方,当G1>G2时,权重为正;当G1<G2时,权重为负;当G1=G2时,权重为零。相比于1T1R布局,2T2R布局在表示有符号权重方面具有显着的优势,使其更适用于神经网络加快器等需要处理正负权重的应用场景。这种布局提供了更高的灵活性和功能性,能够更准确地模仿生物神经元之间的连接强度。
https://i-blog.csdnimg.cn/direct/843f6e2782fd41d69c15e24ddab6eeff.png
图2 2T2R阵列及单个2T2R布局示意图
(3)Crossbar布局
Crossbar布局是一种二维阵列布局,由水平和垂直的金属线(字线和位线)交织组成,每个交织点放置一个RRAM器件,如图3所示。这种布局可以实现高密度的存储和并行盘算。通过在选定的字线和位线上施加电压,可以对特定交织点的RRAM器件举行读写利用。由于RRAM器件的非易失性,Crossbar阵列可以在断电后仍然保持数据,这使得其非常得当于构建非易失性存储器。别的,相比于传统的磁阻式随机存取存储器(MRAM),RRAM的高阻态和低阻态之间的差异通常可以到达几个数目级(10-1000倍),这意味着不需要像MRAM存储器那样使用敏捷电放逐大器(PCSA)来举行微小电放逐大,使得RRAM在构建大规模存储阵列时实现了更高的能效并避免了额外的开销。
https://i-blog.csdnimg.cn/direct/4ebf2ca9b87a452ebef50f769307b99b.png
图3 Crossbar布局示意图
三、文章创新点先容
如下图所示是传统的CS-2T2R和RS-2T2R电路方案,他们都是基于2个晶体管和2个阻变存储单元(RRAM)的存内盘算架构,用于存储神经网络中的带符号权重,但它们在权重映射方式上有所不同:CS-2T2R采用列映射方案,将同一列神经元的权重存储在同一列的2T2R单元中;而RS-2T2R采用行映射方案,将同一行神经元的权重存储在同一行的2T2R单元中。只管RS-2T2R方案在电路开销、功耗和输出电流巨细方面相比CS-2T2R具有肯定优势,比方它无需外围减法器,功耗和热量产生都更小,但存在由于非对称的电路布局和偏置方案导致权重感测不对称(AWS)的问题,详细体现为读取存储单元的权重时,正负权重会出现弊端,进而影响存内盘算的精度。而本文作者提出的IS-2T2R布局,通过引入深N阱隔离和优化电路的对称性,旨在解决这一问题,并提高盘算精度。
https://i-blog.csdnimg.cn/direct/6caa8f2dccc94079920e24f43f526e22.png
图4 传统2T2R方案:(a)列映射方案;(b)行映射方案
在传统的RS-2T2R布局中,不同的晶体管宽长比(W/L)会对神经网络的辨认准确率产生影响,并且展现了当W/L较小时,辨认准确率会显着下降这一问题。下图比较了VGG11、VGG19、ResNet18和GoogLeNet四种网络在不同W/L参数下的CIFAR-10数据集辨认准确率。可以看到,当W/L为3时,四种网络的辨认准确率都出现了显着下降,这表明传统的RS-2T2R布局在较小的W/L下存在严重的性能问题,而这个问题很可能与AWS有关。
详细到RS-2T2R电路中,AWS的产生重要源于两个晶体管的源极偏置电压以及电流通路电阻的不一致。在RS-2T2R布局中,用于存储正负权重的两个晶体管,它们的源极一个连接到RRAM单元,另一个通过SL接地,导致在读取过程中,即使两个RRAM单元存储了相同的权重值,由于一个晶体管的栅源电压Vgs固定,而另一个晶体管的栅源电压Vgs随着RRAM单元的电导变革而变革,两个晶体管的实际工作状态并不对称,产生不同的电流。别的,电路中不可避免地存在寄生效应,也会进一步加剧这种不对称性。最终,AWS会导致实际读取到的权重值偏离其真实值,低落存内盘算的精度,影响神经网络等应用的性能,产生如下图所示的结果。
https://i-blog.csdnimg.cn/direct/88e072d454d04f83b2baab5f633ab13e.png
图5 传统CS-2T2R方案下的精度评估
为相识决传统2T2R布局中的AWS问题,文章提出了一种改进的隔离对称2T2R(Isolated Symmetrical 2T2R, IS-2T2R)布局,包罗两种设计。该布局的焦点在于引入了深N阱(DNW)隔离技能,并基于尺度CMOS 40nm工艺上实现,用以消除电路中的非对称性。通过引入DNW隔离,作者能够在一个隔离的N阱中放置一个NMOS晶体管,并设计一个对称的电路布局,使得两个晶体管(W+和W-)的源极都连接到RRAM单元,从而消除了源极偏置电压的不同。别的,这种布局还优化了晶体管的尺寸,在不影响精度的同时,将集成密度提高了42.2%。下图展示了IS-2T2R布局的电路示意图,展示了通过引入DNW所实现的电路隔离。设计I通过WL控制单元,设计I通过BL信号控制单元。通过这一系列的改进,IS-2T2R布局有效地解决了AWS问题,提高了权重感测的准确性和存内盘算的精度。
https://i-blog.csdnimg.cn/direct/4c1b32777f5d44a5a13f69dead6d3096.png
图6 设计I的bitcell示意图(a)和电路布局示意图(b);设计II的bitcell示意图(d)和电路布局示意图(e);设计I和设计II的工作波形图(c)和(f)。
文章RRAM单元TEM图如下所示。
https://i-blog.csdnimg.cn/direct/9931b3c82db741fc9daf5aae5518a0e9.png
图7 文章RRAM单元TEM图
最后,作者列举了本文设计的性能评估结果,如下图所示,可以看到IS-2T2R不受W/L的影响,仍然能保持比较理想的精度。
https://i-blog.csdnimg.cn/direct/607c716984104dfca70dddbdf74c1700.png
图8 本文方案评估
文章所提出设计的性能测试结果汇总如下表所示,可以看到,本文方案对比传统的两种2T2R方式具备优势。
表1 文章方案性能评估
https://i-blog.csdnimg.cn/direct/e6075641acf14176b1df203558f45a73.png
四、总结与展望
本文重要先容的专注于解决2T2R RRAM单元的AWS问题,通过引入隔离晶体管实现了更稳固存储、更高集成度、更高盘算精度的模仿RRAM存算,这些设计有利于实现存内盘算芯片的高密度集成以及在片上部署更大规模的神经网络。
基于2T2R RRAM单元开展的研究内容多种多样,除本文之外,笔者在此简单汇总一些其它基于2T2R RRAM单元睁开的工作供读者参考:
将2T2R单元配置成两个1T1R单元举行读写利用,或者将其用作TCAM单元实行类脑盘算任务,使2T2R单元可以在不同模式下工作,比方传统存储模式、存内盘算模式和类脑盘算模式,提高盘算单元的利用率和灵活性;
https://i-blog.csdnimg.cn/direct/94547fcc9a0e4ca9b13a5a6ac95c2f91.png
图9 bitcell单元布局
通过施加不同数目的脉冲来调整2T2R单元的电导,模仿突触权重的更新,加快BNN的训练过程,并低落功耗;
https://i-blog.csdnimg.cn/direct/76740bf41b8e408b8f0aa49b7c249db2.png
图10 bitcell布局及其权重更新规则
通过电压模式利用,利用2T2R单元的电阻状态实行超维向量的盘算,提高超维盘算的效率、低落功耗;
https://i-blog.csdnimg.cn/direct/9abbc772f1f844eea73f65998c580d0d.png
图11 利用2T2R单元构建解码器的架构图
通过设计输入相关感测控制机制,优化电压模式存内盘算的性能,提高盘算的能效和鲁棒性。
https://i-blog.csdnimg.cn/direct/dfdc5fb9073e4d21b4a7d30bf15b023d.png
图12 盘算宏布局
盼望本文能对RRAM或其他范例非易失性存储器的模仿存算研究者带来启发。






参考资料

[*]Ling Y, Wang Z, Yang Y, et al. An isolated symmetrical 2T2R cell enabling high precision and high density for RRAM-based in-memory computing. Science China Information Sciences, 2024, 67(5): 152402.
[*]Z. -R. Wang et al., "Functionally Complete Boolean Logic in 1T1R Resistive Random Access Memory," in IEEE Electron Device Letters, vol. 38, no. 2, pp. 179-182, 2017.
[*]Q. Liu et al., "33.2 A Fully Integrated Analog ReRAM Based 78.4TOPS/W Compute-In-Memory Chip with Fully Parallel MAC Computing," 2020 IEEE International Solid-State Circuits Conference - (ISSCC), San Francisco, CA, USA, 2020, pp. 500-502.
[*]Yu, Shimeng. 2016. Resistive Random Access Memory (RRAM) : From Devices to Array Architectures. Cham, Switzerland: Springer.
[*]Chen Y, Lu L, Kim B, et al. Reconfigurable 2T2R ReRAM architecture for versatile data storage and computing in-memory. IEEE Transactions on Very Large Scale Integration (VLSI) Systems, 2020, 28(12): 2636-2649.
[*]Zhou Z, Huang P, Xiang Y C, et al. A new hardware implementation approach of BNNs based on nonlinear 2T2R synaptic cell//2018 IEEE International Electron Devices Meeting (IEDM). IEEE, 2018: 20.7. 1-20.7. 4.
[*]Li Z, Bao R, Zhang W, et al. 2T2R RRAM-Based In-Memory Hyperdimensional Computing Encoder for Spatio-Temporal Signal Processing. IEEE Transactions on Circuits and Systems II: Express Briefs, 2024.
[*]Wang L, Ye W, Dou C, et al. Efficient and robust nonvolatile computing-in-memory based on voltage division in 2T2R RRAM with input-dependent sensing control. IEEE Transactions on Circuits and Systems II: Express Briefs, 2021, 68(5): 1640-1644.


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: IS-2T2R存储器:AWS精度下降问题的解决方案