英特尔执行副总裁暨资料中心与AI解决方案总经理Justin Hotard指出,「AI需求带动资料中心大规模转型,产业因此开始在软硬体和开发工具上寻求更多选择。英特尔推出搭载效能核心(P-core)的Xeon 6和Gaudi 3 AI加速器将促进开放生态系发展,使我们的客户能以更佳的效能、效率和安全性,满足所有工作负载。」
Intel Xeon 6处理器,专为运算密集型工作负载设计,并搭载效能核心(P-core),提供相较上一代处理器2倍的效能提升。这款处理器具备更高的核心数、倍增的记忆体频宽,并将AI加速功能嵌入每个核心,满足从边缘到资料中心及云端环境的AI效能需求。
Intel Gaudi 3 AI加速器则是针对大规模生成式AI进行最佳化,配备64个张量处理器核心(TPC)与8个矩阵乘法引擎(MME),并内建128 GB HBM2e记忆体及24个200 Gb乙太网路连接埠,能加速深度神经网路运算。Gaudi 3与PyTorch框架、Hugging Face Transformer模型和diffuser模型无缝相容。英特尔与IBM合作,将Gaudi 3作为服务部署至IBM Cloud,期望客户在AI使用与扩展上,既能提升效能,又能降低总持有成本(TCO)。
大规模部署AI涉及多种考量因素,包括灵活弹性的部署选项、具竞争力的价格效能比以及可用的AI技术。英特尔凭借其强大的x86架构和广泛的开放生态系,支援企业建构具备最佳化总持有成本(TCO)与每瓦效能的高价值AI系统。值得注意的是,市场上多达73%的GPU加速伺服器使用Intel Xeon系列处理器作为伺服器处理器(host CPU)。英特尔与领导OEM伙伴如戴尔科技、美超微合作,开发共同设计的系统,以满足客户在AI部署中的特定需求。其中,戴尔科技与英特尔正合作设计适用于Gaudi 3和Xeon 6的解决方案,并以检索增强生成(RAG)技术为基础。
Intel Tiber产品组合为企业提供解决方案,专门应对横跨AI、云端与边缘环境的挑战,涵盖存取、成本、复杂性、安全性、效率与可扩充性。Intel Tiber Developer Cloud现已提供英特尔Xeon 6的预览系统,供技术评估与测试使用,特定客户还可抢先体验英特尔Gaudi 3,以验证AI模型布署。Gaudi 3丛集将于下一季开始推向市场,支援大规模量产布署。新的服务产品如Seekr推出的端到端AI平台SeekrFlow,专为开发可信赖AI应用程式而设计。平台更新包括Gaudi软体新版本、整合PyTorch 2.4的Jupyter Notebooks、英特尔oneAPI及AI工具2024.2版,这些更新提供全新的AI加速功能,并支援Xeon 6处理器。