AMD 发布 Ryzen AI Max 400:x86 首次冲上 192GB 统一内存,本地可跑 3000 亿参数大模型

2T超大容量网盘!点击领取 >> 原画质高清备份,上传下载不限速

5月21日,AMD 正式发布了代号 "Gorgon Halo" 的锐龙 AI Max 400 系列处理器。虽然是对现款 Strix Halo 的 Refresh 式升级,但它在 x86 平台上首次实现了最高 192GB 的统一内存配置——这意味着,你不再需要数据中心级 GPU 集群,也能在本地跑起上千亿参数的大模型。

三款 PRO 商用型号:从 8 核到 16 核全覆盖

本次发布的三款全部是 PRO 商用系列,面向企业、工作站和专业市场。不带 PRO 后缀的消费版本预计今年晚些时候推出。

规格 PRO+ 495 PRO 490 PRO 485
CPU 核心/线程 16C / 32T 12C / 24T 8C / 16T
最高加速频率 5.2 GHz 5.0 GHz 5.0 GHz
集成显卡 Radeon 8065S Radeon 8050S Radeon 8050S
GPU 计算单元 40 CU 32 CU 32 CU
NPU 算力 55 TOPS 50 TOPS 50 TOPS

192GB 统一内存:x86 平台的里程碑

Ryzen AI Max 400 最大的突破在于内存。它支持最高 192GB 的统一内存,并且其中最多 160GB 可以划拨给集成显卡作为显存。这在 x86 客户端处理器上是史无前例的——此前 Strix Halo 的容量上限还停留在 128GB。

统一内存架构的核心优势在于,CPU、GPU、NPU 三者共享同一内存池,无需在芯片之间反复搬运数据。对于大模型推理来说,这意味着大幅降低延迟、提升吞吐,同时也绕过了传统 dGPU 显存容量的物理瓶颈。

AMD 宣称,Ryzen AI Max 400 是全球首款能在本地端运行 3000 亿参数以上超大语言模型的 x86 客户端芯片。内存速度支持到 8533 MT/s,足以喂饱三个计算引擎的带宽需求。

架构延续:Zen 5 + RDNA 3.5 + XDNA 2

CPU 端依然是 Zen 5 架构,GPU 端是 RDNA 3.5,NPU 端是 XDNA 2。三者的协同已经在前代产品中得到验证,这次主要是通过内存扩容来释放更大模型的潜力。

NPU 算力方面,旗舰 PRO+ 495 达到 55 TOPS,PRO 490 和 PRO 485 为 50 TOPS。虽然单看 NPU 数字并不惊艳,但配合 192GB 统一内存的整体方案,才是这套平台真正的竞争力所在。

市场定位与竞争格局

值得注意的是,AMD 首发 PRO 商用版,而非消费版。这释放了一个清晰信号:Ryzen AI Max 400 的首要目标不是游戏玩家或普通用户,而是需要本地运行大模型的企业开发者、AI 研究人员和数据科学家。

AMD 同步公布了第一方 AI 开发迷你主机——锐龙 AI Halo 升级版,定价 3999 美元(约合 27276 元人民币),将于 6 月晚些时候开始接受预订。华硕、惠普、联想等 OEM 厂商的终端设备预计 2026 年第三季度起陆续上市。

在竞争侧,英特尔的 Lunar Lake 和 Arrow Lake 聚焦于轻薄本的 AI 加速,英伟达则在数据中心 GPU 领域独占鳌头。AMD 的策略是用超大统一内存 + APU 一体化设计,在两者之间撕开一个缺口——为那些不愿为云端推理持续付费、又需要运行超大模型的用户,提供一个端侧解决方案。

当一台工作站就能在本地跑起 3000 亿参数的语言模型,AI 基础设施的游戏规则正在被悄然改写。

2T超大容量网盘!点击领取 >> 原画质高清备份,上传下载不限速
这是一个持续运营的鼓励
如果真的对你有用的话,感谢支持服务器及作者运营
THE END