近日,英特尔前总裁Renee James创立的服务器CPU设计公司AmpereComputing宣布,其AmpereOne芯片家族明年将增至256个核心。该公司还将与高通合作开发云人工智能加速器。
James介绍,该公司即将推出的全新AmpereOne平台宣布,12通道256核CPU已准备好在台积电的N3制造工艺节点上使用。 Ampere 设计芯片并与外部代工厂合作制造。 2023 年5 月发布的上一款芯片有192 个核心。它于去年投入生产,现已上市。
James强调,公司不仅关注核心数量,还关注平台的整体性能,包括内存、缓存和AI计算能力。她提到,Ampere的256核CPU将采用与现有产品相同的冷却系统,将热设计功耗保持在350瓦左右,同时提供比市场上任何CPU高40%的性能。
与高通的合作也成为焦点,共同开发高性能人工智能(AI)基础设施。与高通的合作也是Ampere发展路线图的重要组成部分。两家公司计划基于Ampere的CPU和高通的Cloud AI 100 Ultra加速器构建大型语言模型(LLM)推理平台。此次合作旨在解决行业面临的最大挑战之一:人工智能快速发展带来的能源问题。 Ampere 和高通的联合解决方案将提供一种创新方法,以更有效的方式处理人工智能推理任务。
高通AI 100 Ultra加速器以其150W的低功耗和高效的性能而备受关注。尽管外形较小,高通声称该加速器能够运行多达1000 亿个参数的模型,并且可以连接两个加速器以支持GPT-3 规模模型。高通的AI 100 Ultra 能够在INT8 精度下实现870 TOP 的性能,并由128GB LPDDR4x 内存和548GB/s 带宽提供支持。
此外,Ampere 还推出了一项新的FlexSKU 功能,允许客户使用相同的SKU 来解决横向扩展和横向扩展的用例。这种灵活性将进一步推动Ampere在AI领域的应用。
总体而言,我们期待看到更多创新的人工智能解决方案,不仅可以提高性能,还可以降低功耗,为未来的数据中心基础设施提供可持续的解决方案。