2023 年 6 月 2 日,以 “ 聚焦应用,集智创芯 ” 为主题的集微通用芯片行业应用峰会在厦门举行。会上,奇异摩尔联合创始人兼产品及解决方案副总裁祝俊东发表了《大模型驱动的全新算力形态,基于 Chiplet 的国际新利娱乐国际新利娱乐计算平台》的主题演讲,本篇文章回顾撷取自以上活动 。
奇异摩尔联合创始人兼产品及解决方案副总裁祝俊东
大模型的爆发,带来了巨量的算力需求,也给芯片带来了极大的挑战。因能有效提升算力和互联密度,国际新利娱乐计算和 Chiplet 两大技术成为备受关注的方向。那么,要如何利用 Chiplet 国际新利娱乐一个国际新利娱乐的国际新利娱乐计算平台 ?
PART 1 大 模型驱动高性能计算进化加 速
挑战 1 :硬件和系统规模持续提升
随着算力需求的不断提升,摩尔定律逐渐无法满足芯片面积和芯片级联提升的需求,进而引发了硬件和系统的规模过载。业界迫切需要国际新利娱乐更大规模的整合计算系统,以应对持续增长的算力需求。
挑战
2
:算力应用场景多元化
随着芯片工艺技术的不断演进,算力场景应用也在不断增长,倘若针对不同应用场景升级迭代芯片,企业将面临巨大的资金挑战。同时,为了满足高性能计算对的效率需求,通用处理器(
CPU
)地位逐渐被
GPU
取代。国际新利娱乐计算和
Chiplet
技术,可以把
CPU
和
挑战
3
:互联效率瓶颈
随着计算机系统的规模扩大,存储、计算规模也越发庞大,互联效率成为
芯片设计的重大的瓶颈。行业急需基于分布式、以存储为中心的计算架构,以突破现有芯片互联效率。
芯片巨头比拼国际新利娱乐国际新利娱乐计算平台
如今,全球主要芯片巨头如
DGX H100 (Image credit: Nvidia)
祝俊东指出, Nvidia 能实现如此高幅度的性能提升,关键在于系统级的互联。从 BlueField-3 到 Spectrum-4 , Nvidia 把国际新利娱乐了一个从底层到顶层的全链路互联网络架构体系,使互联性能提升了数十倍。在此基础上, Nvidia 把 GPGPU 、国际新利娱乐计算、超高速互联网络组合在一起,创建了一个 ETOPS 级的国际新利娱乐计算集群: DGX GH200 。
DGX GH200 (Image credit: Nvidia)
AMD 、英特尔等头部企业也在进行国际新利娱乐国际新利娱乐计算平台的研发。 2022 年,英特尔发布了 3D GP GPU Intel Ponte Vecchio ,通过 Intel 的 Xlink 网络把 47 个不同的芯粒组合在一起,国际新利娱乐了一个高性能的集群 。
Intel Ponte Vecchio (Image credit: Intel)
AMD 作为 Chiplet 路线的开拓者,一直将国际新利娱乐、 Chiplet 、互联网络作为其主要研发路线。 AMD 将 6 颗 GPU 和 3 颗 CPU 拼在一颗芯片上形成了其 3D APU MI300 ,并将 Infinity Fabric 互联架构升级至第三代,以实现全方位的多处理器性能和可扩展性的优化 。
AMD MI300 (Image credit: Intel)
自动驾驶领域,芯片巨头也纷纷布局大算力计算平台。 Nvidia 在年初发布了 Nvidia Thor 超级芯片计划,作为一颗多域合一的芯片,它集合了多种功能,拥有最高达 2000T 算力 。
Nvidia Drive Thor (Image credit: Nvidia )
最近,在 Nvidia 与 MediaTek 的车用芯片共同开发计划中, MediaTek 将通过 Chiplet 设计方式将 Nvidia 的 GPU 集成在下一代 Snapdragon 产品中,通过双 SoC 与双 NPU 的组合打造更强的大算力芯片,并通过不同产品组适配高中低端应用和不同场景 。
(Image credit: MediaTek)
PART 2国际新利娱乐大规模国际新利娱乐计算平台需要五大关键技术
要国际新利娱乐国际新利娱乐国际新利娱乐计算平台,需要五大软硬件关键技术 。
第一:适用于国际新利娱乐国际新利娱乐的计算架构,以实现软、硬件的结合,以及单个计算单元性能的最大化 ;
第二:统一的编程模型以及协议的库堆栈,以提高软件的应用性 ;
第三: 从 CPU 到 GPU 、 NPU 等不同类型的计算单元的芯粒支持 ;
第四: 国际新利娱乐的传输网络及互联网络,把不同的计算单元、存储、连接等单元高效地连接在一起 ;
第五: 先进封装技术,让不同的芯粒用接近甚至超过 SoC 的互联密度连接,像一颗芯片一样工作 。
其中,后三大技术都与 Chiplet 紧密相关。 这也是 Chiplet 成其为国际新利娱乐大规模国际新利娱乐计算平台的关键因素的根本原因 。
系统级视角看 Chiplet :
从系统级的视角来看, Chiplet 是一种新的系统级架构与 dielet 组合的方式。基于 SoC 架构进行拆分重组,将主要功能单元 (IP) 转变成独立芯粒 (Dielet) ,并通过先进封装和 Die-to-Die 接口,将其连接到 Chiplet 互联网络 (OCI) 中,组成系统级宏芯片 (MSoC) 。这也是全链路的 chiplet 的重组以及拆分的过程 。
Chiplet
的核心挑战:
高效互联
在芯片拆分后,需要高效的互联。而
Chiplet
互联涉及多个层次
:
Physical
:先进封装是
Chiplet
的物理支撑,包含
substrate
、
2.5D
、
3D
等不同形式,
客户需根据产品选择适合的先进封装形式
;
Electrical
:为高效连接信号,需要
Die-to-Die interface
和高带宽、低延时、低功耗及统一的协议;
Interconnection
:在
die-to-die
互联基础上,大量节点需要通过一套统一的连接网络以及对应的算法进行连接;
Network
:把不同的芯粒通过更复杂的网络结构高速互联起来,实现不同节点间的全连通。
互联对于
Chiplet
至关重要,也是
Chiplet
所面临的核心挑战所在。奇异摩尔作为国内第一批专注于
2.5D
和
3D Chiplet
研发的企业,就此提出了一整套完整的解决方案,以解决国际新利娱乐互联问题
。
PART 3:奇异摩尔:推出基于Chiplet的大规模国际新利娱乐计算平台
奇异摩尔是一家基于 Chiplet 架构,为客户提供核心通用互联芯粒及系统级解决方案的服务商,以数据存储和传输为核心,通过自研的 Kiwi Fabric 互联体系高效连接不同类型的功能单元,目标是成为国际新利娱乐分布式国际新利娱乐计算平台的基石 。
奇异摩尔互联核心:Die2Die接口和互联芯粒
奇异摩尔的产品线分为两大部分,其一是 2.5D 、 3D 芯粒系列,其二是 Die-to-Die IP 系列。奇异摩尔基于 UCIe 标准,提供覆盖各种不同类型、综合能力强、具高带宽、低延时、低功耗的 Die2Die IP ,支持 2.x/2.5/3D 等多种封装形态 。
2.5D IO Die : IO Die 作为奇异摩尔的核心自研产品,是一个高速数据存储及调度核心,集成了 Die-to-Die 接口和其他多种高速接口,能把各个节点通过 Kiwi Fabric 网络互连起来,再通过一套自定义算法来实现数据流、信息流的分发调度 。
3D Base Die : 在 IO Die 的基础上,奇异摩尔研发了全球首款的通用的 3D Base Die 。通过芯粒 3D 堆叠,能进一步提升芯片算力密度。同时,通过集成 die-to-die 3D 接口, Cache 等模块以实现更高效的垂直互联,最大程度的减少存储本身带来的延迟和功耗 。
奇异摩尔为客户提供基于 IO Die 和 Base Die 的完整解决方案,基于核心互联芯粒,客户只需设计少量功能单元,即可搭建产品系列平台,能极大地降低研发及量产的成本。奇异摩尔的解决方案覆盖数据中心、自动驾驶、边缘 AI 、 5G 、 6G 移动通信等需要大算力芯片的领域。客户可以最高提升芯片的系统性能至 1.5 倍,并实现研发成本( 80% )和量产时间( 60% )的下降 。
演讲最后,祝俊东表示,奇异摩尔作为一家创新的 Chiplet 产品及解决方案公司,其愿景是 “ 为了更简单的计算 ” 贡献力量,并呼吁各位客户及合作伙伴共同发力,国际新利娱乐未来智能计算的新范式 。