英特尔展示AI火力 Hot Chips 2024发表四篇论文
不让NVIDIA专美於前,英特尔(Intel)也在Hot Chips 2024中发表四篇论文,分享该公司在资料中心、云端和网路,到边缘和PC等各种AI应用场景的最新进展。其中包括业界最先进、用於高速AI资料处理的首款全面整合光学运算互连(Optical Compute Interconnect, OCI)小晶片。英特尔也公布预计於2025年上半年推出的Intel Xeon 6 SoC(代号Granite Rapids-D)最新细节。
英特尔网路暨边缘运算事业群技术长Pere Monclus指出,随着AI工作负载加重,英特尔持续为消费性和企业AI应用推出各类平台、系统和技术,创造新的可能。虽然更高效能的晶片和更大的平台频宽至关重要,每个工作负载都面临独特挑战,专为资料中心设计的系统无法轻易地直接挪到边缘使用。因此,英特尔於Hot Chips 2024发表4篇技术论文,分别介绍Intel Xeon 6 SoC、Lunar Lake客户端处理器、Intel Gaudi 3 AI加速器和OCI小晶片。
新一代Intel Xeon 6 SoC锁定边缘应用场景
英特尔院士暨网路与边缘运算晶片设计工程师Praveen Mosur说明Intel Xeon 6系统单晶片(System-on-Chip ,SoC)设计的新细节,以及它如何克服不稳定网路连接以及有限空间和功率等边缘应用情境中出现的挑战。基於全球超过9万次1边缘布署所累积的知识经验,这款SoC将成为英特尔目前为止最符合边缘应用的最佳化处理器。从边缘装置扩展到边缘节点,透过单系统架构和整合的AI加速功能,企业能更轻松、更有效率、更保密地管理从资料撷取到推论的完整AI工作流程,有助於改善决策、提升自动化程度,为客户创造价值。
Intel Xeon 6 SoC结合Intel Xeon 6处理器的运算小晶片以及基於Intel 4处理技术打造的边缘最佳化I/O小晶片,使这款SoC的效能、能源效率和电晶体密度与先前相比都有显着改善。其他特色包括:
‧高达32个通道的PCI Express(PCIe)5.0
‧高达16个通道的Compute Express Link(CXL)2.0
‧双埠100G乙太网路
‧4个和8个记忆体通道,采用相容的BGA封装
‧强化边缘应用的功能,包括扩大工作负载温度范围和提升工业级可靠度,成为高效能强固型装置的理想选择
Intel Xeon 6 SoC还有专为提高边缘和网路工作负载效能和效率的设计,包括新媒体加速,强化即时OTT、VOD和广播媒体的视讯转码和分析能力;提高推论效能的Intel Advanced Vector Extensions和Intel Advanced Matrix Extensions;可实现更有效率网路和储存效能的Intel QuickAssist技术;降低虚拟化RAN功耗的Intel vRAN Boost;此外,还支援Intel Tiber Edge Platform,使用者可利用此平台在标准硬体上进行如云端般简易的建构、布署、执行、管理并扩充边缘和AI解决方案。
Lunar Lake打造下一代AI PC
客户端CPU SoC资深设计工程师Arik Gihon探讨了Lunar Lake客户端处理器,以及其设计如何提升x86处理器的能源效率,并提供领先的核心、绘图处理与客户端AI效能。全新P-core和E-core有着惊人的效能,与上一代产品相比,系统单晶片功耗可降低高达40%。新的神经元处理单元(Neural Processing Unit,NPU)速度最多可提升4倍,执行生成式AI任务的表现优於上一代产品。此外,新的Xe2 GPU核心也将游戏和绘图效能提高到上一代的1.5倍。Lunar Lake的更多详细资讯将在9月3日的Intel Core Ultra发表会中分享。
英特尔为下一世代AI PC打造的Lunar Lake处理器
Intel Gaudi 3 AI加速器:专为生成式AI训练和推论所打造
AI加速器首席设计工程师Roman Kaplan介绍了需要大量运算能力的生成式AI模型训练和布署。随着系统从单节点扩充到数千个节点的大型丛集,也带来了巨大的成本和能耗挑战。
Intel Gaudi 3 AI加速器运用最佳化的架构改善运算、记忆体和网路架构,解决了上述的问题;透过采用高效率的矩阵乘法引擎(Matrix Multiplication Engines ,MME)、双阶层(two-level)快取整合和广泛的RoCE(RDMA over Converged Ethernet)网路通讯等策略,Gaudi 3 AI加速器能够实现显着的效能和能耗效率表现,使AI资料中心的运作更具成本效益与永续性,解决布署生成式AI工作负载时的可扩充性问题。Gaudi 3 AI加速器和未来Intel Xeon 6产品的相关资讯将在9月的发表会中分享。
Intel Gaudi 3 AI加速器
每秒4TB的光学运算互连小晶片实现XPU互连
英特尔整合光学解决方案(Integrated Photonics Solutions, IPS)事业部展示业界最先进的首款全面整合光学运算互连(OCI)小晶片,能与英特尔CPU共同封装并处理即时资料。
英特尔於Hot Chips 2024上展示首款全面整合光学运算互连(OCI)小晶片
首席工程师暨光学整合(Photonics Integration)负责人Saeed Fathololoumi介绍了OCI小晶片,其设计可在长达100公尺的光纤上双向支援64个通道、32 Gbps资料传输。Fathololoumi也说明了OCI小晶片如何满足AI基础设施对更高频宽、更低功耗和更大覆盖范围日益增加的需求。英特尔的OCI小晶片使高频宽互连获得重大进展,可实现未来CPU/GPU丛集连接的可扩充性和新式运算架构,包括资料中心和高效能运算(HPC)应用的新兴AI基础设施,也可达到一致的记忆体扩充和资源分散。
AI提供了一条便捷路径,让企业和消费者能将各种想法提升到前所未有的高度。举例来说,消费者现在可选择具备智慧功能的AI PC,提升生产力、创造力、游戏体验、娱乐享受和安全性;企业则可运用边缘运算和AI的强大能力来改善决策过程、提高自动化程度、从专有资料中获得更多价值。