AMD CEO苏姿丰现身引爆全场!“一人一组智能体”时代来了!AMD锐龙AI Max+系列开创AI智能体新范式

梦想是金 2026-05-22 阅读数 10951 #证券指南
5月19日, AMD公司在上海举办的AMD AI 开发者大会 (AMD AI DevDay 2026),吸引了超过两千名开发者到场参加,这是这一面向AI 开发者的AMD技术盛会首次登陆中国。AMD董事会主席及首席执行官苏姿丰博士现身峰会外场的展台区时,引来众多现场开发者、媒体等追捧,瞬间点燃现场气氛。

 

在主题演讲中,苏姿丰博士表示,AMD一直是致力于打造开源繁荣的AI生态。AMD作为高性能与AI计算的领导者,通过覆盖云边端的计算产品组合,和我们开源的Rocm软件平台,为我们的开发者提供开放的全栈式算力支持。同时,不断优化我们的开发环境、扩展工具链,为我们的开发者构建高效灵活的创作空间。依托开放的平台和我们完善的工具,AMD助力每一个开发者的 创意孵化和创新的落地,全面提升个人与企业的生产力。此外,通过开发者社区与校园计划,AMD积极推动人才的培养和生态共建,把人才和行业的未来紧密地连接在一起。

 

AMD董事会主席及首席执行官苏姿丰博士

 

她还重点提到AMD 高度重视大中华区市场布局。中国是全球最具活力的 人工智能产业生态圈。我们将中国视为企业技术路线布局的核心阵地,涵盖芯片研发、人工智能软件、平台架构搭建等全领域。坐落于上海的研发 中心,也是 AMD 全球规模最大的研发基地之一。我们深耕本土市场,只为深度对接国内顶尖人工智能技术从业者,携手国内头部云厂商、大型企业搭建深度合作桥梁,全力扎根中国本土产业生态。

 

人工智能进入“多智能体协同”新时代

苏姿丰博士认为,如今的人工智能不再局限于单一 问答交互,而是依托多智能体协同运作模式。每个人都可搭载数个、数十个甚至上百个智能体协同办公,办公与生产效率将实现质的飞跃。

新时代人工智能技术,不仅需要核心大语言模型作为基底,更要具备自主逻辑推理、自主学习迭代、高效数据流转能力,实现持续推理运算、海量数据处理与自主深度学习,而这些功能都依托智能体完成。

 

未来高性能显卡算力将全面普及,不再局限于云端机房,而是覆盖全产业生态。除却显卡算力,高性能中央 处理器算力同样不可或缺,唯有集齐全链路算力,才能支撑完整智能体高效运转,这正是 AMD 的核心发力点,打造端到端全场景完整算力体系。

零一万物 CEO 李开复博士在对谈中表示:“过去,一个人对应一个工具;未来,一个人将拥有一个 AI 团队。未来企业的基础单元,将不再只是‘人’,而是能直接闭环责任的个人‘DRI(Directly Responsible Inpidual)+ AI Agent Sw arm’。企业最终的组织形态是高判断力的人+大量 AI agents+实时AI操作系统。人类负责战略、目标与关键判断,越来越多执行、协同与流程性工作,将由多个 AI Agents 持续运行与自主协作完成。AI 将第一次让越来越多中小企业拥有属于自己的‘专业团队’,这也是零一万物与 AMD 合作的意义,让越来越多中小企业第一次具备与大型组织同台竞争的能力,让更多的开发者实现 AI Agent 自由。”

 

零一万物 CEO 李开复博士

以AMD锐龙AI Max+系列开创AI智能体新范式

随着AI智能体的兴起,AMD率先在业界提出了“智能体主机”新概念。作为PC的一个新品类,智能体主机对 CPU的推理性能提出了更多的需求,让本地端侧AI计算正在逐步走向系统级协同。本地部署,持续运行并能提供个性化体验的智能体主机,需要强大的CPU+ GPU双引擎算力,以及高带宽、大容量的统一内存,以运行复杂本地大模型——这正是AMD锐龙AI Max+ 系列处理器的优势所在。

 

AMD高级副总裁、计算与图形总经理 Jack Huynh表示,智能体AI的时代,胜负从来不取决于谁堆砌的算力最多,而在于谁能把算力用得更高效。这正是行业全新的发展风向。未来五年脱颖而出的团队,绝不会是一味囤积云端GPU算力资源的玩家,而是从项目之初就深耕高效算力架构的实践者。

 

一套适配 AI 产业、高效务实的全新发展路径究竟该如何搭建,在 AMD看来,AI研发部署路径分为三大阶段:本地开发、规模化测试、落地部署。

 

如今算力不再是唯一的决定性制约因素。算力对模型预训练固然重要,可内存的作用早已远超以往。内存容量决定可承载的模型参数大小以及上下文长度,内存带宽则直接决定模型解码运行速度。

 

这也是AMD打造锐龙 AI MAX的核心初衷,它搭载 128GB 统一内存,可原生支持高达200B参数的模型。依托这套架构,开发者可在本地终端运行顶级大模型,将完整模型部署在统一内存池中,无需数据拆分、无需云端分流,实现随身携带式全流程本地开发部署。依托该硬件能力,可本地流畅运行千问3.5千亿参数大模型,同时还支持26万超长上下文窗口。整套智能体运行环境仅需96GB专属显存即可顺畅运转,便携终端就能轻松承载。

 

得益于广泛的生态伙伴创新支持,基于AMD锐龙AI Max+ 系列处理器的智能体主机已形成完整的产品形态,涵盖一体机、笔记本、Mini AI工作站等,全面覆盖不同使用场景与 操作系统应用生态,展现出独特优势。目前,惠普、华硕、联想、宏碁及众多本地新兴创新品牌已推出超过35款相关产品设计。

 

进入第二阶段规模化测试场景,研发逻辑将全面转变。如今 AI 系统早已不是单一指令运行,而是多链路联动运作。代码智能体可自主生成代码、自查纠错、迭代运行;服务智能体可自主调用 接口、整合信息、生成应答,全程多步骤、多接口、多智能体协同运转。

这就要求研发端必须保障量产级运行速度,效率滞后就无法完成高效迭代,而Radeon AI Pro R9700 专业显卡正是为此而生。很多开发者既有本地开发需求,又暂未搭建完整量产部署基建,这款高性能专业显卡完美适配研发场景,满足模型微调、本地推理、项目实测等全流程需求,精准 模拟产业级实际运行性能。

当然显卡性能离不开整机平台加持,AI 工作负载不只是简单矩阵运算,还包含数据调度、信息流转、工具联动、多智能体同步运行等复杂操作,这就需要强劲主机平台全程适配。

Thre adripper Pro 9000 系列作为全球顶级工作站级处理器,完美解决这一痛点。其配备 128 条 PCIe5.0 高速通道,单主机可稳定搭载多块RadeonAI Pro 显卡,全程无性能瓶颈,台式机即可变身专业级 AI 研发节点。

开发者可全程本地搭建项目、实测调试、模拟规模化运行、完成性能优化,最后再低成本完成落地部署,研发全程自主可控、高效省心。

仅有硬件远远不够,打通全链路的软件生态体系才是核心根基,更是开发者选择 AMD 平台的底气所在。

 

过去 18 个月,我们全力迭代升级 ROCm 开源软件生态,兼容全行业开源技术标准,适配全品类硬件设备。精简软件架构,实现从产品开发、项目上线到落地部署全流程一键适配。

ROCm是支持所有AMD GPU的统一软件平台,可以实现从笔记本、工作站到数据中心的互联互通,打通AI部署的全路径。通过对HIPCC等编译器,ROCm库、PyTorch等AI框架和OpenClaw等智能体框架的支持,让代码实现“一次编写,全路径运行”,显著增强开发体验,提升测试、微调和部署效率,从而赋能开发者和开源社区。

简单来说,一套统一软件生态,可无缝适配笔记本终端到大型数据中心全场景:锐龙 AI MAX 主打轻量化本地开发,Radeon AI Pro+ Threadripper Pro 承接规模化实测,彻底摆脱云端算力额度、算力资源限制。

Jack Huynh说道,二十年前, 电脑实现一人一机独立办公;未来二十年,将会迎来全新格局 —— 一人统筹调度数百个智能体协同作业,智能体就近部署、即时响应。研发迭代速度更快、算力资源稳定可控,创意想法诞生即刻就能落地测试。

 

生态合作成果显著

本次大会,许多生态系统合作伙伴展示了与AMD联合研发的最新成果。

在现场,江波龙重点展示了在端侧AI存储优化成果,基于AMD锐龙AI Max+ 395智能体主机,在128GB内存场景下,成功实现397B超大参数AI模型的本地部署,打破大模型本地运行的硬件壁垒;在6 4GB内存场景中,不仅可稳定实现122B大模型本地部署运行,还能顺畅适配80B、122B等中大型模型,同时优化长上下文场景表现,有效降低端侧AI运行中的内存占用,大幅提升计算效率与经济性,为开发者提供更高效益的端侧AI部署参考。

目前,江波龙正依托SPU(Storage Processing Unit)存储处理单元与iSA( Intelligent Storage Agent)存储智能体,面向AMD锐龙AI Max+ 395智能体主机,对最新版本大模型开展新一轮存储调优工作。

据介绍,江波龙 SPU 是专为智能存储架构打造的处理单元,采用5nm先进制程工艺,单盘最大容量可达128TB。其核心优势在于具备存内无损压缩和 HLC ( High Level Cache )高级缓存技术,能够大幅节省 S SD 容量成本,并有效降低 DRAM 容量需求。而作为 SPU 的"大脑", iSA 存储智能体则是面向端侧 AI 推理的智能调度引擎。针对 MoE 大模型参数庞大、 KV Cache 膨胀快等问题,iSA 通过专家卸载、智能缓存管理与预取 算法,高效优化了存储调度。

此外,零一万物与 AMD 联合发布了全新的“万智智算节点”Cube01。作为一款多智能体时代的企业级私有化智算产品,Cube01 基于强大的 AMD 锐龙 AI Max+ 395 旗舰处理器与零一万物万智智能体平台打造,旨在通过“算力 + 模型 + 多智能体协同”的软硬一体化能力,为企业和开发者构建真正自主可控的 AI 基础设施,让越来越多小团队第一次拥有过去只有大型组织才具备的智能协作能力。

 

李开复表示,我们在 AMD 硬核硬件基础上,搭载自研万智智能中台,打造全栈式智能中枢。不仅整合国内海量主流开源大模型,更可无缝对接企业知识库与核心业务流程。零一万物自研多智能体框架可实现毫秒级响应,以往需要整个团队耗时完成的文档审核、数据分析等工作,如今依托本地多智能体集群即可瞬时完成,这正是我们献给全球开发者的实用落地答案。

小结:

近年来,中国人工智能产业飞速发展,大模型迭代速度快,开源生态繁荣生长。AMD 专注打造人工智能领域顶级算力产品,持续巩固算力技术领先优势,携手广大开发者依托 ROCm 开源平台共建产业生态,也尤其重视对中国市场的投入与支持,让人工智能算力服务落地各行各业,共赴AI智能体时代的到来。

热门