AI芯片,FP8是大势所趋

发布于:2022/7/8 11:26:42 | 6686 次阅读

    3 月,英伟达推出了其 GH100,这是第一款基于全新“Hopper”架构的 GPU,它同时针对 HPC 和 AI 工作负载,并且对于后者而言更重要的是,它支持 8 位 FP8 浮点处理格式。两个月后,竞争对手英特尔推出了其第二代 AI 训练芯片Gaudi2,该芯片也采用 FP8 格式。
    FP8 格式之所以重要的原因有很多,其中最重要的是,到目前为止,AI 推理之间存在一种分裂,以整数格式(通常为 INT8,但有时为 INT4)以低精度完成,与 AI 训练以 FP16、FP32 或 FP64 精度完成,HPC 以 FP32 或 FP64 精度完成。Nvidia 和 Intel 都认为 FP8 不仅可以用于推理,在某些情况下还可以用于 AI 训练,从而从根本上提高其加速器的有效吞吐量。
    这很重要,因为在浮点格式和整数格式之间来回切换是一件令人头疼的事情,而让所有内容都停留在浮点中要容易得多。此外,在未来的某个时候,如果推理转移到 8 位 FP8 甚至可能是 4 位 FP4 格式,这意味着专用于整数处理器的宝贵芯片空间可以被释放并用于其他用途。
    在后摩尔定律的世界里,每一个晶体管都是非常重要,每一个时钟周期都值得珍惜。在处理速度的进步与过去一样快的时候,公司正在寻找更有效的方法来运行 AI 作业。组织需要弄清楚如何利用当前可用的能力来提高处理能力——尤其是 训练能力。较低精度的数据格式会有所帮助。
    人工智能芯片制造商正在看到这些优势。6 月,Graphcore 发布了一项长达30 页的研究,该研究不仅展示了低精度浮点格式相对于类似大小的缩放整数的卓越性能,而且还展示了降低训练计划中功耗的长期好处,包括快速增长的模型尺寸。
    研究人员写道:“低精度数字格式可能是大型机器学习模型的关键组成部分,它提供了最先进的准确性,同时减少了对环境的影响。” “特别是,通过使用 8 位浮点算术,相对于 float-16 算术,能量效率可以提高多达 4 倍,相对于 float-32 算术可以提高多达 16 倍。”
    现在 Graphcore 正在鼓动 IEEE 采用供应商为 AI 设计的 FP8 格式作为其他所有人都可以使用的标准。该公司本周进行了宣传,Graphcore 联合创始人兼首席技术官 Simon Knowles 表示,“8 位浮点的出现为 AI 计算提供了巨大的性能和效率优势。这也是行业确定单一开放标准的机会,而不是引入竞争格式的混乱组合。”
    AMD 和高通也支持 Graphcore 的计划,Qualomm 产品管理高级总监 John Kehrli 表示,该提议“已成为 8 位浮点计算的一种引人注目的格式,为推理和计算提供了显著的性能和效率提升。可以帮助降低云和边缘的训练和推理成本。”
    AMD 预计将在即将推出的 Instinct MI300A APU中支持 FP8 格式,它将 AMD GPU 和 Epyc 7004 处理器塞进一个封装中。我们预计也会有普通的 MI300 独立 GPU,并且它们也将支持 FP8 数据和处理。
    它还将使包括 SambaNova、Cerebras 和 Groq 在内的一系列 AI 芯片制造商受益。
    Graphcore 认为,使用较低精度和混合精度的格式(例如同时使用 16 位和 32 位)在 AI 中很常见,并且在摩尔定律和登纳德缩放速度放缓之际在准确性和效率之间取得了良好的平衡。
    FP8 让 AI 行业有机会接受“AI-native”标准以及跨系统的推理和训练互操作性。在 IEEE 正式制定标准之前,Graphcore 还将向业内其他人提供其规范。
    “随着深度学习应用程序复杂性的不断增加,机器学习系统的可扩展性也变得不可或缺,”Graphcore 研究人员在他们的论文中写道。“大型分布式模型的训练带来了许多挑战,依赖于有效使用不同节点之间共享的可用计算、内存和网络资源,并受到可用功率预算的限制。在这种情况下,使用有效的数字格式至关重要,因为在处理单元之间交换数据时,它可以提高计算效率和通信效率,从而提高功率效率。
    一段时间以来,芯片制造商一直在评估低精度格式的使用。2019 年, IBM 研究院推出了一款基于 7 纳米 EUV 技术的四核 AI 芯片,支持 FP16 和混合 FP8 格式的训练和推理。
    “这种新的混合训练方法在更广泛的深度学习模型中完全保留了模型的准确性,”IBM Research 专家在一篇博文中写道。“混合 FP8 位格式还克服了之前在 MobileNet (Vision) 和 Transformer (NLP) 等模型上的训练精度损失,这些模型更容易受到量化信息丢失的影响。为了克服这一挑战,Hybrid FP8 方案在前向路径中采用了一种新颖的 FP8 位格式以实现更高分辨率,而在后向路径中采用另一种 FP8 位格式用于更大范围的梯度。”
    两年后,IBM向2021 年 ISSCC 活动展示了一款支持 16 位和 8 位训练以及 4 位和 2 位推理的测试芯片。
    IBM 研究人员当时写道:“人工智能模型的复杂性和采用率正在迅速扩大,现在被用于药物发现、遗留 IT 应用程序的现代化以及为新应用程序编写代码。” “但人工智能模型复杂性的快速发展也增加了技术的能源消耗,一个大问题是在不增加碳足迹的情况下创建复杂的人工智能模型。从历史上看,该领域只是简单地接受了,如果计算需求很大,那么为其提供燃料所需的功率也将如此。”
    现在,所有人聚集在一起,并有望创建一个标准。
参与讨论
后参与讨论

//评论区

推荐阅读

TXGA ——JL23印制电路连接器,严苛环境下实现稳定可靠的信号传输

 产品速览  TXGAJL23印制电路连接器,触点镀金0.1μm。插孔采用双曲面线簧结构,公母头对插后,插针与插孔形成多个接触点,可在各类严苛环境下为设备实现稳定可靠的信号传输。  JL23印制电路连接器   抗振动  在振动频率为10Hz-2000Hz,加速度147m/s?的振动测试中,产品瞬断时长≦1μs。满足高频振动环境下,设备对连接器公母端子间的接触稳定性要求。  抗冲击  产品在加速度9

0215jiejie | 发布于:2024-06-21 0评论 0赞

全球占比 0.5%,英国已经错过了半导体?

根据下议院委员会的一份报告,英国正在错失对半导体行业的投资,该报告称,随着其他国家寻求在自己的供应链中建立更大的弹性,这使该国的企业面临风险。 报告发现,虽然英国工业在某些领域具有优势,但该国没有完整的端到端供应链,很容易受到未来全球供应中断的影响。它呼吁政府制定其半导体战略,并制定一项新的行业协议,为英国半导体投资提供资金。 正如Reg读者所熟知的那样,半导体是现代电子系统中的重要组成部分,

0215jiejie | 发布于:2022-12-01 0评论 0赞

同志:请“打开”5G开关!

精彩的世界杯,吸引着亿万球迷的注意力。相比以往的电视观赛,本届世界杯,更多的人是用手机看球。高清的画质、及时的弹幕、个性的回放、解说的选择、即时的分享、互动的猜球,手机观赛倍增放大了足球的魅力、世界杯的精彩。 是的,对于四年一次的全球顶级赛事,这届世界杯对中国手机用户而言,无疑是一场前所未有的视听盛宴。而支撑这场色香味俱全的饕餮大餐的,不是某位米其林大厨,而是全球规模最大、质量最好的5G网络。

0215jiejie | 发布于:2022-12-01 0评论 0赞

新能源车出口大热 中国品牌到欧洲“华山论剑”

今年1-10月,汽车企业出口245.6万辆,同比增长54.1%。其中,新能源汽车出口49.9万辆,同比增长96.7%。与之前我国燃油汽车主要出口至亚太、拉美、中东等市场不同,新能源汽车主要出口至欧洲等发达汽车市场,同时产品溢价能力得到显著提升。图为比亚迪亮相2022年巴黎车展。视觉中国供图 随着中国新能源汽车产销量节节攀升,中国品牌乘势出海同样令人欣喜。值得一提的是,如今汽车出口不仅有“量”的增

0215jiejie | 发布于:2022-12-01 0评论 0赞

1-9月中国手机出货量同比下降21% 上市新机型同比下降13.8%

报告指出,9月,中国国内市场手机出货量2092.2万部,同比下降2.4%,其中,5G手机1510.4万部,同比下降0.1%,占同期手机出货量的72.2%。 1-9月,国内市场手机总体出货量累计1.96亿部,同比下降21.1%,其中,5G手机出货量1.53亿部,同比下降16.4%,占同期手机出货量的78.2%。 图1国内手机市场出货量及5G手机占比 9月,国内手机上市新

0215jiejie | 发布于:2022-12-01 0评论 0赞

三星申请自助维修助理专利 用户修手机或将进入DIY时代

近期有消息称,三星在美国申请了一项自助维修助理(SelfRepairAssistant)的专利,这可能意味着三星将进一步地扩大用户可自助维修的设备范畴。 据《SamMobile》报道,三星将这项专利描述为“用于智能手表、平板电脑、手机,以及耳机”的自行安装与维护手机应用程序,这款应用程序将可以提供各种移动设备的自行安装与修复相关的资讯与信息服务。 简单来说,三星可能正在开发一款可

0215jiejie | 发布于:2022-12-01 0评论 0赞

康宁公司总裁兼首席运营官孟安睿:深化本土合作,助力中国显示产业和数字经济取得更大成功

由四川省人民政府、工业和信息化部共同主办的2022世界显示产业大会于11月30日—12月1日在四川成都举行。在开幕演讲中,康宁公司总裁兼首席运营官孟安睿(EricS.Musser)指出,政府的支持、中国不断壮大的显示产业和宝贵的客户关系是康宁显示科技业务在中国不断深化投资合作的重要原因。中国是康宁全球显示玻璃销量最高的市场,康宁将与中国合作伙伴同心协力,致力于显示产业的繁荣发展

0215jiejie | 发布于:2022-12-01 0评论 0赞

国内首个光伏发电与主粮项目首季水稻迎来大丰收

近日,国家能源集团广西公司光伏发电与主粮生产融合发展试验项目种植的首季水稻迎来大丰收。至此,国内首个光伏发电与主粮(水稻)生产融合发展的保粮供能创新模式试验项目取得阶段性成果。 该项目位于广西南宁市横州市峦城镇新兴村、格木村,是国家能源集团广西公司与南京农业大学联合推进的光伏发电和主粮生产保粮供能创新试验项目,通过对非基本农田的旱地改造满足水稻种植条件。项目总装机容量30.16兆瓦,占地约500

0215jiejie | 发布于:2022-11-28 0评论 0赞

人工智能“入侵”芯片制造

目前人工智能(AI)正在变革多个行业。有一个很有趣的现象:人工智能正在帮助推动人工智能芯片的进步。早在2021年6月,谷歌就利用AI来设计其TPU芯片。谷歌表示,人工智能可以在不到6小时的时间内完成人工需要数月时间完成的芯片设计工作。《Nature》的一篇评论称这项研究是一项“重要成就”,并指出此类工作可以帮助抵消摩尔定律的终结。除此之外,英伟达已经开始使用人工智能来有效地改进和加速GPU设计;三

0215jiejie | 发布于:2022-11-28 0评论 0赞

国家发改委等五部门:提升三类LED灯具能效水平

近日,国家发展改革委、工业和信息化部、财政部、住房城乡建设部、市场监管总局联合发布了《重点用能产品设备能效先进水平、节能水平和准入水平(2022年版)》的通知(以下简称《通知》)。 《通知》明确,参考相关重点用能产品设备现行能效强制性国家标准,综合考虑我国相关产业技术水平和发展阶段,对标国内外同类产品设备先进能效水平,将有关产品设备能效水平划分为先进水平、节能水平、准入水平三档。

0215jiejie | 发布于:2022-11-28 0评论 0赞