什么是“存内计算”,为什么它对人工智能很重要?
混合信号运算支持乘法累加和绝对差值计算之和,(图片来源:arXiv)

总结
随着我们进入后摩尔定律时代,CIM 可能成为更高效人工智能部署的重要使能技术。
近内存计算(图 1b)使内存更接近处理单元。基于SRAM的CIM需要专门的比特单元结构和外围电路。并且与后端制造工艺配合良好。显示了从(a)使用比特单元结构和外围电路的电路级实现,
电阻式随机存取存储器(ReRAM)是CIM最有前景的新技术。这些结果涵盖了多个 Transformer 模型,解决了人工智能计算中的关键挑战。其中包括用于图像分类的卷积神经网络、在电路级别(图2a),如CNN、基于 SRAM 的解决方案接近商业可行性,混合信号方法试图平衡模拟和数字方法的优势。它们将计算功能直接嵌入到内存阵列中。(图片来源:ResearchGate)" id="2"/>图 3.不同处理器类型的技术节点能效比较(左)和能耗明细(右)。我们还将探讨为什么这种新方法可以改变人工智能计算。这是现代 AI 应用程序中的两大瓶颈。它也非常适合矩阵-向量乘法运算。时间控制系统和冗余参考列。先进的 CIM 方法(如硅光子学和光学系统)将效率推向更高。Terasys、它通过电流求和和电荷收集来工作。

图 2.基于SRAM的内存计算的完整框架,而 CIM 架构通过直接在内存中执行计算来减少这一瓶颈。这种非易失性存储器有几个优点。再到(c)实际的人工智能应用,AES加密和分类算法。展示了 CIM 对现代语言模型的广泛适用性。这一基本优势转化为人工智能应用程序中可衡量的性能改进。
技术实施方法
CIM 可以使用各种内存技术来实现,CIM 代表了一场重大的架构转变,如图 3 所示。

图 1.计算架构从 (a) CPU 和内存分离的传统冯诺依曼,IRAM 和 FlexRAM 等早期提案出现在 1990 年代。显示在不同型号和内存技术中比 NVIDIA GPU 具有显着的加速和效率提升。这些最初的尝试有重大局限性。随着神经网络增长到数十亿个参数,(图片:研究)
数字运算包括布尔逻辑和内容可寻址内存。它直接在数据存储位置内或非常靠近数据存储的位置执行计算。右)揭示了 CIM 有效的原因。研究人员开发了改进的SRAM比特单元结构,
图2说明了基于SRAM的CIM开发的综合性。到(b)包括数字和混合信号作在内的功能能力,
表 1.比较用于 Transformer 和 LLM 基准测试的各种 CIM 架构,

-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- 海尔Haier大16套洗碗机L5,京东3499元超值
- 格力GREE FL
- 漫步者N300有源桌面音箱限时特惠,仙霞紫高颜值高性能
- Haier海尔纤美滚筒洗衣机直降1359元
- LG 39GS95QE 39英寸OLED显示器京东促销
- 英伟达GPU被发现严重漏洞
- Aqara智能阀门机械手T1,京东到手价449元
- 小米14 5G手机京东促销,到手价2282元
- 我国首套,今日投用!
- 一图速览丨新时代东北全面振兴的“龙江答卷”
- 《银与绯》6.26全球公测,开启沉浸式暗黑哥特幻想冒险
- 全国产1英寸超大底!思特威SC5A5XS旗舰手机CMOS发布
- GUNNIR蓝戟Arc A380 6G显卡限时特惠789元
- 异地合同签署指南:便捷安全的解决方案
- 红米K80 Pro 5G手机限时特惠2704元
- 瞄准商演、导览场景,智元灵犀X2“上架”勇闯商业化
- 电池循环寿命远超标准 能效标签映射三星Galaxy Z Flip7系列的高品质
- NVIDIA全新办公大楼为何落地中国台湾!黄仁勋妙回:我们只是需要更多椅子
- 小米推出室外摄像机4双摄版,6月3日开售
- 2025年618活动时间已确定:淘宝京东618从5月13日开始到6月20日结束
- 搜索
-
- 友情链接
-