AMD 发布 Ryzen AI Max 400:x86 首次冲上 192GB 统一内存,本地可跑 3000 亿参数大模型
5月21日,AMD 正式发布了代号 "Gorgon Halo" 的锐龙 AI Max 400 系列处理器。虽然是对现款 Strix Halo 的 Refresh 式升级,但它在 x86 平台上首次实现了最高 192GB 的统一内存配置——这意味着,你不再需要数据中心级 GPU 集群,也能在本地跑起上千亿参数的大模型。
三款 PRO 商用型号:从 8 核到 16 核全覆盖
本次发布的三款全部是 PRO 商用系列,面向企业、工作站和专业市场。不带 PRO 后缀的消费版本预计今年晚些时候推出。
| 规格 | PRO+ 495 | PRO 490 | PRO 485 |
|---|---|---|---|
| CPU 核心/线程 | 16C / 32T | 12C / 24T | 8C / 16T |
| 最高加速频率 | 5.2 GHz | 5.0 GHz | 5.0 GHz |
| 集成显卡 | Radeon 8065S | Radeon 8050S | Radeon 8050S |
| GPU 计算单元 | 40 CU | 32 CU | 32 CU |
| NPU 算力 | 55 TOPS | 50 TOPS | 50 TOPS |
192GB 统一内存:x86 平台的里程碑
Ryzen AI Max 400 最大的突破在于内存。它支持最高 192GB 的统一内存,并且其中最多 160GB 可以划拨给集成显卡作为显存。这在 x86 客户端处理器上是史无前例的——此前 Strix Halo 的容量上限还停留在 128GB。
统一内存架构的核心优势在于,CPU、GPU、NPU 三者共享同一内存池,无需在芯片之间反复搬运数据。对于大模型推理来说,这意味着大幅降低延迟、提升吞吐,同时也绕过了传统 dGPU 显存容量的物理瓶颈。
AMD 宣称,Ryzen AI Max 400 是全球首款能在本地端运行 3000 亿参数以上超大语言模型的 x86 客户端芯片。内存速度支持到 8533 MT/s,足以喂饱三个计算引擎的带宽需求。
架构延续:Zen 5 + RDNA 3.5 + XDNA 2
CPU 端依然是 Zen 5 架构,GPU 端是 RDNA 3.5,NPU 端是 XDNA 2。三者的协同已经在前代产品中得到验证,这次主要是通过内存扩容来释放更大模型的潜力。
NPU 算力方面,旗舰 PRO+ 495 达到 55 TOPS,PRO 490 和 PRO 485 为 50 TOPS。虽然单看 NPU 数字并不惊艳,但配合 192GB 统一内存的整体方案,才是这套平台真正的竞争力所在。
市场定位与竞争格局
值得注意的是,AMD 首发 PRO 商用版,而非消费版。这释放了一个清晰信号:Ryzen AI Max 400 的首要目标不是游戏玩家或普通用户,而是需要本地运行大模型的企业开发者、AI 研究人员和数据科学家。
AMD 同步公布了第一方 AI 开发迷你主机——锐龙 AI Halo 升级版,定价 3999 美元(约合 27276 元人民币),将于 6 月晚些时候开始接受预订。华硕、惠普、联想等 OEM 厂商的终端设备预计 2026 年第三季度起陆续上市。
在竞争侧,英特尔的 Lunar Lake 和 Arrow Lake 聚焦于轻薄本的 AI 加速,英伟达则在数据中心 GPU 领域独占鳌头。AMD 的策略是用超大统一内存 + APU 一体化设计,在两者之间撕开一个缺口——为那些不愿为云端推理持续付费、又需要运行超大模型的用户,提供一个端侧解决方案。
当一台工作站就能在本地跑起 3000 亿参数的语言模型,AI 基础设施的游戏规则正在被悄然改写。
当前文章标题:AMD 发布 Ryzen AI Max 400:x86 首次冲上 192GB 统一内存,本地可跑 3000 亿参数大模型
当前文章地址:https://www.2109.top/3652/
来源:2109博客 地址:https://2109.top 文章版权归作者所有,未经允许请勿转载。
转载及其他合作需求请微信联系博主