英特尔亚太暨日本区总经理庄秉翰指出,随著AI需求激增,资料中心正面临可扩充性、成本效益及能源效率的挑战。为应对市场需求,英特尔推出搭载P-core的Xeon 6处理器和Gaudi 3 AI加速器,结合强大的x86架构与开放生态系,协助企业以最佳总体拥有成本(TCO)构建高效AI系统,满足复杂工作负载。
搭载P-core的Xeon 6处理器专为边缘运算、资料中心及云端环境设计,支援超高记忆体及I/O频宽,可加速AI运算、高效能运算(HPC)及资料服务工作负载。该平台最高支援128个核心、12个记忆体通道及96条PCIe通道,相较前一代效能提升高达两倍。Xeon 6处理器还嵌入AI加速功能,并有效调度GPU运行资源,进一步巩固其在市场的领导地位。
Xeon 6处理器支援DDR5技术与MRDIMM,传输速度达每秒8,800百万次(8,800 MT/s),实现高频宽、低延迟的运算环境。此外,其为业界首款支援CXL 2.0技术的伺服器处理器,提升记忆体容量与频宽,满足高效率资料传输需求,进一步优化AI和HPC的处理效能。
Gaudi 3 AI加速器则针对大规模AI运算设计,可支援大型语言模型、多模态应用及企业RAG等AI工作负载。相较前一代,Gaudi 3的BF16运算能力提升4倍,记忆体与网路频宽分别提升1.5倍与2倍,大幅优化AI训练和推论效率。此外,Gaudi 3与PyTorch无缝整合,并支援Hugging Face模型库,提供更高的开发效率。
英特尔与IBM携手合作,将Gaudi 3 AI加速器布署于IBM Cloud,Inflection AI也选用此加速器作为其商用AI系统的核心技术,以提供更具竞争力的每瓦效能,满足企业对大规模布署的灵活性及扩充性需求。
英特尔也展示多项AI应用,包括能处理图片和文字资讯的BridgeTower视觉语言模型、生成图片描述的LLaVA-Llama3语言助手,以及业界首款生成式3D模型LDM3D,让用户能轻松生成高精度360度影像。在医疗领域,英特尔的Bio-Mistral模型可进行医学问答,而CheXNet则运用AI辅助X光影像判读,提高诊断效率并降低医疗成本。
英特尔并展示先进散热解决方案,包括应用于浸没式冷却及水冷板技术的超流体散热技术,搭配新开发的介电液,有效防止漏液对伺服器的损害。此技术仅需调整冷却液分配装置设计,即可支援超过1500W的晶片散热需求,助力资料中心达成高效能与永续性目标。