存算一体芯片:AI时代的最佳答案?

发布于:2022/8/15 9:14:43 | 3001 次阅读

    近日,存算一体(存内计算)芯片设计公司苹芯科技宣布于数月前完成千万级美元A轮融资。中国工程院院士邬贺铨在2022中国算力大会上表示,对自动驾驶等场景产生的热数据(实时性数据),存算分离会使数据在存储和计算之间来回输入,此时存内计算更适合热数据的处理。
    在冯诺依曼架构中,计算和存储功能分别由中央处理器和存储器完成。而处理器在跟随摩尔定律逐年提升性能的过程中,将对制程工艺不敏感的存储器甩在了后面,两者的性能差距形成了“存储墙”。相比之下,存算一体能够避免数据来回搬运所造成的功耗损失和时间延迟。在AI技术不断释放数据洪流和算力场景需求的大趋势下,存算一体芯片越来越受到产业界和资本市场的关注。
    冯诺伊曼架构
    
    来源:《中国科学:信息科学》
    绕过存储墙是AI时代刚需
    早在1969年,斯坦福研究所的William Kautz就提出了存算一体的概念。Kautz提出在芯片的存储单元中加入逻辑电路,并将多个单元连接起来组成阵列,这样能够打造更加灵活、速度更快、耗能更低的数字电路,以更好地适应当时大规模集成电路的需求。然而,早期的存算一体研究并没有取得明显的突破,以冯诺依曼架构为蓝本、按照摩尔定律的步伐提升芯片性能,逐渐成为产业界的共识。
    但近几年来,存算一体又回到了业界的视野,并被视为重要的技术方向。
    知存科技创始人兼CEO王绍迪向《中国电子报》指出,过去几十年是摩尔定律快速发展的时期,加上开发新的架构需要高昂的投入,因此在摩尔定律还能往下走的时候,产业界对存算一体这类架构创新的需求还不高。但近十年以来,算力需求的增长使存储墙的问题越来越凸显。
    “到2010年以后进入后摩尔时代,行业内日益增长的算力需求和几乎走到极限的摩尔定律之间越来越突出的矛盾已经成为人工智能发展的巨大瓶颈。因此,能解决存储墙问题的存算一体技术受到了越来越多的关注,近几年在产业界得到了非常快速的发展。”王绍迪说。
    尤其在2016年人工智能Alpha Go在围棋对弈中战胜世界冠军李世石之后,以深度学习为代表的统计学习理论与方法促动了整个人工智能行业的发展。OpenAI的分析显示,自 2012 年以来,人工智能训练任务中使用的算力每 3.5 个月翻一倍。计算需求的突飞猛进,对算力芯片的效能提出了更高的要求和新的挑战。
    从2013到2019年AI算力实现了30万倍的提升
    
    来源:OpenAI
    九天睿芯董事长兼CEO刘洪杰向《中国电子报》表示,在冯诺依曼架构中,处理器从处理单元外的存储器提取数据,搬运时间往往是运算时间的成百上千倍。
    “深度学习加速的最大挑战就是数据在计算单元和存储单元之间频繁的移动,市场急需可实现超高能效并且可以快速迭代的智能计算芯片来满足日新月异的市场变化。我们推出的新型类脑计算的存内计算体系架构就是面向AI发展的算力瓶颈,核心技术是解决AI算力能效比偏低的核心刚性需求。算力堆叠带来能耗问题,存算一体就是很好的解决方案。”刘洪杰说。
    多种技术架构待产学研共同探索
    面向智能化时代的算力需求和计算服务业态变革,英特尔、三星等IDM厂商和新锐的算力芯片厂商都在探索存算一体芯片,并衍生出不同的架构和技术路线。
    刘洪杰表示,目前全球存算一体仍处于蓬勃发展阶段,没有一种技术架构占据绝对主导地位。2017年,第一批存内计算公司兴起,目前存内计算中有一些技术已经可以落地,需要产业界加大投入,研发质量过关的产品。
    “存内计算本身也有一个类似摩尔定律的发展过程,包括代工厂针对存内计算专用的工艺提升。其次是先进的材料,目前能够量产的存内计算存储器中,Flash和SRAM新型存储器更适合做存内计算,需要更多在新型存储器件上的研究。另外,存内计算从算法到供应链生态上也需要产学研结合,相互融合促进发展。” 刘洪杰说。
    作为多年来DRAM市场份额的冠军,三星于2021年推出了结合DRAM的高带宽内存-内存内处理 (HBM-PIM),将AI计算能力引入内存。通过将经过DRAM优化的 AI 引擎置于每个存储子单元内,将处理能力直接引入到数据的存储位置,从而实现并行处理并尽可能减少数据移动。相较三星此前的高带宽内存方案,新架构能够提供超过两倍的系统性能,并降低 70% 以上的能耗。
    英特尔的神经拟态计算芯片Loihi也采用了存算一体的架构,使之更加容易扩展。Loihi芯片的裸片包含128个小核,每个核里面模拟1024个神经元的计算结构,每个神经元又有1000个突触连接,这意味着768个芯片连接起来可以构建接近1亿神经元的系统。
    国内聚焦存算一体芯片的企业则大多采用SRAM(静态随机存取存储器)和Flash路线。
    九天睿芯基于“模拟特征提取+模数混合电荷域SRAM”架构实现存内计算,第一颗感存算一体芯片ADA100于2021年回片。后摩智能第一代芯片基于SRAM、第二代芯片基于PRAM。苹芯科技的两款产品也基于28nm SRAM。
    知存科技主要采用嵌入式Flash工艺,于2020年发布第一代存算一体芯片产品WTM1001,2022年实现存算一体SoC芯片WTM2101量产并落地应用。
    “近年来,随着新兴非易失存储器的发展,国内开始出现做存算一体大算力的公司,同时不断有新玩家涌入。但距离大规模应用,还有约10年的时间,从工艺、材料、算法、工具链到生态,都需要产业界和学术界的不断投入与共同推进。”王绍迪说。
    产品性能和行业生态有待升级
    虽然存算一体芯片的技术前景和应用场景逐渐明晰,但现阶段存算一体芯片还没有实现规模化的量产和部署,产品性能和产业生态有待进一步的提升和完善。
    在性能方面,存算一体芯片还有较大的提升空间。刘洪杰表示,存算一体芯片还需要从三个方向提升性能。一是工艺迭代。随着自动驾驶等应用场景算力需求的提高,后摩尔时代存算一体芯片需要紧跟工艺迭代的红利,进一步提高能效比、面效比。二是提升精度,更多诸如飞行器航姿估计等对运算精度有较高要求的应用对存算一体架构的精度提出了一定的挑战。三是算法适配,在更广阔的消费领域,AI应用呈现碎片化的趋势,带来了算法模型的多样化,为适应应用落地需求,存算一体仍需进一步扩充计算架构的适配能力。
    以九天睿芯为例,接下来将从工艺、架构等维度继续深化模数混合存算一体芯片的开发部署。据悉,九天睿芯规划了从55nm到6nm的产品路线,55nm产品主要面向TinyML(采用资源受限低功耗微控制器实施机器学习)等低功耗唤醒场景;22nm产品面向AR/VR SLAM(即时定位与地图创建)协处理、移动机器人、ADAS等场景;6nm主打面向联邦学习(带有安全加密技术的机器学习框架)、元宇宙、空间AI等应用。
    此外,存算一体芯片需要强化上下游协同以加速产业化进程。王绍迪指出,存算一体芯片要实现大规模的量产、应用,涉及到上下游产业链的共同配合。包括行业标准化,以更好地实现产品落地;生态的建立,以拓展更多的应用场景。
    据王绍迪介绍,接下来知存科技会从产品和生态层面进行升级,在初步构建存算一体开发小生态的基础上,随着芯片算力、计算容量、计算速度的不断增加,打造更丰富更便捷的开发工具链,稳定架构、打磨标准化产品、拓宽应用场景逐渐从端侧发展到边缘测或云端。
参与讨论
后参与讨论

//评论区

推荐阅读

关于印发《四川省推进电动汽车充电基础设施建设工作实施方案》的通知

四川省发改委印发关于《四川省推进电动汽车充电基础设施建设工作方案》的通知,明确到2025年,全省建成充电设施20万个,基本实现电动汽车充电站“县县全覆盖”、电动汽车充电桩“乡乡全覆盖”。 以成都为代表的充电基础设施示范地区,公(专)用充电设施与电动汽车比例不低于1:6,居住社区充电设施与私人电动汽车比例不低于1:5,城市he心区公共充电设施服务半径不大于1公里。 以德阳、绵阳、南充、宜宾、眉山

0215jiejie | 发布于:2022-11-28 0评论 0赞

长鑫存储技术有限公司董事长兼首席执行官朱一明:集成电路产业全球化发展“润物细无声”

由工业和信息化部、安徽省人民政府共同主办的2022世界集成电路大会在安徽省合肥市召开。长鑫存储技术有限公司董事长兼首席执行官朱一明在主旨演讲中表示,在“润物细无声”的全球化发展驱动下,集成电路实现了持续发展。 朱一明在演讲中首先回顾了集成电路产业链的全球化发展历程。20世纪60年代,集成电路得以发明,集成电路产业总体销售规模较小,数额尚不及5亿美元。经过数十年来的发展,现阶段,参与

0215jiejie | 发布于:2022-11-21 0评论 0赞

Flex Power Modules推出8:1非隔离式总线转换器

FlexPowerModules现已推出BMR320,这是一款非隔离、非稳压的DC-DC中间总线转换器,具有固定8:1输入/输出电压比,外形紧凑。 该产品在40-60VDC输入电压范围下运行,产生5至7.5VDC输出电压,非常适宜在较低中间总线电压下为负载点转换器供电,以优化系统效率。在输入电压为54V时,BMR320额定为400W/60A,可以在27x18x6.4mm的小尺寸下出

0215jiejie | 发布于:2022-11-17 0评论 0赞

三大处理器巨头迎战“内存墙”

在最近推出的96核EpycGenoaCPU的发布会期间,AMD谈到了现代计算面临的最大挑战之一。在过去的几年里,处理器变得更强大的速度已经超过了为这些内核提供数据的内存子系统的速度。 “任何使用非常大内存占用的东西都需要大量带宽来驱动内核,”Gartner分析师蒂姆哈维告诉TheRegister。“如果你随机访问这些数据,那么你会丢失很多缓存,因此能够非常快速地提取数据将非常有用。” 这绝不是

0215jiejie | 发布于:2022-11-15 0评论 0赞

苹果CEO库克:招聘将会很谨慎 制造产品需要员工回归

据报道,经济前景不确定,硅谷出现裁员潮。苹果CEO蒂姆?库克(TimCook)透露道,苹果已经放缓了招聘节奏。 库克在苹果总部接受采访时表示:“在这个非常时间,我们对招聘变得更加谨慎。我们会继续招人,但并不是公司的每个地方都会招。” 美国经济正在趋向疲软,Lyft、亚马逊等美国科技企业要么开始裁员,要么冻结招聘。Meta上周也说要裁员11000人,这是Meta历史上规模zui大的裁员。 库克

0215jiejie | 发布于:2022-11-15 0评论 0赞

长扬科技汪义舟:以高质量服务工业现场,保障国家关键信息基础设施安全

世界互联网大会会员代表座谈会在浙江乌镇举行。中国联通董事长刘烈宏作为参会企业代表之一,与来自特斯拉、高通、诺基亚、卡巴斯基、京东、搜狐、网易、360、快手、大唐西市等10家企业的负责人,围绕全球互联网发展机遇与挑战、世界互联网大会未来发展等议题深度交流。 座谈会上,刘烈宏表示,“5G+工业互联网”作为实现工业化与数字化、网络化、智能化“融合”的粘合剂和催化剂,为加速中国新型工业化进程提供了新的工

0215jiejie | 发布于:2022-11-15 0评论 0赞

京东方入主华灿光电,唱响MLED“二重协奏曲”

在新型显示产业,两家企业强强联合,会擦出怎样的新火花? 11月6日,全球半导体显示龙头企业京东方发布公告称,拟以不超过21亿元的自筹资金认购华灿光电股份有限公司(以下简称“华灿光电”)向特定对象发行的A股股票,认购完成后将以23.08%持股比例成为该公司第一大股东。 消息一出,迅速引发了行业的广泛关注。那么,作为产业链主导企业的京东方,为何选择控股上游芯片企业?又为何要加速布局MLED产业生态

0215jiejie | 发布于:2022-11-09 0评论 0赞

SEMI:预计今年全球硅晶圆出货量同比增长4.8%

国际半导体产业协会SEMI今天(7日)在其半导体行业年度硅出货量预测报告中指出,今年全球硅晶圆出货量将同比增长4.8%,达到近14700百万平方英寸的历史新高。 SEMI预计,明年硅出货量增速将放缓。但未来几年,随着数据中心、汽车和工业应用对半导体需求强劲,硅晶圆出货量增速将反弹。

0215jiejie | 发布于:2022-11-08 0评论 0赞

宁德时代限制理想汽车使用第二供应商? 理想汽车、宁德时代双方回应:纯属谣言

近日,有消息称,宁德时代为保持自己行业龙头老大的位置,对合作车企作出种种限制条款,其中,与理想合作时,宁德时代限制其选择其他电池供应商。若选择其他企业作为第二供应商,宁德时代就停止对其供货。 针对此传言,《证券日报》记者独家向宁德时代和理想汽车求证。作为当事方,宁德时代回应称,该消息不属实。理想方面则表示,理想汽车和宁德时代合作不断深化,将有好消息与大家分享,所谓“限制第二供应商”的“霸王条款”

0215jiejie | 发布于:2022-11-07 0评论 0赞

“细品”:从全球十个运营商五年数据,看5G对ARPU影响

近日,市场研究公司Omdia的最新报告称,从2022年到2027年,移动服务和固定宽带服务的收入将增长14%,但ARPU值将下降4.2%。此报告在业内引发5G是否陷入增长困境的讨论。 商用5G后,运营商ARPU值呈现怎样的变动?原因有哪些?在全球5G发展不平衡的情况下,5G的价值在哪? ARPU值变动:三类情况 截至2022年10月,全球已有230多家运营商推出了5G商用服务,共部署了300

0215jiejie | 发布于:2022-11-07 0评论 0赞