2026世界杯实时比分 一台手掌大小、300克的AI主机,为什么能跑122B模子?

来源:开云2026世界杯官方授权平台 作者: 发布时间: 浏览:50

2026世界杯实时比分 一台手掌大小、300克的AI主机,为什么能跑122B模子?

“当AI原生开辟成为Agent新物种主力,底层算力也正在加快重构。”

作家丨包永刚

裁剪丨林觉民

把一台能运行122B大模子的AI主机塞入口袋,需要付出什么代价?

昔时泰半年,端侧AI硬件的逻辑正在发生变化。

两个月前,国内掀翻一场风光级的土产货部署Agent怡悦,无数AI酷爱者运转“养虾”,让正本偏小众的Mac mini随机出圈,一度出现溢价和缺货。在更硬核的开发者圈子里,三四万元的DGX Spark一样热度不低,因为它依然大约在土产货运行千亿参数模子。

Mac mini和DGX Spark同期走红,背后其实指向的是团结个趋势:Agent正在赶快举高端侧AI硬件的门槛。

此前,40TOPS级别的AI PC,仅能完成对话、生成等轻量任务。但参加Agent期间后,开发者运转追求更大的模子、更万古分的土产货推理,以及真合法约承担坐蓐力任务的端侧AI开辟。

问题随之出现。Mac mini弥散舒坦、低功耗,却很难懂救更大的土产货模子;DGX Spark领有强悍性能,但价钱、功耗与散热,又很难着实走向宇宙化。大算力、低功耗与小体积之间,似乎长久难以兼得。

Agent期间着实穷乏的,不再仅仅一台更强的AIPC,而是一种大约7×24小时运行、低功耗、舒坦,并具备土产货扩展技艺的新结尾。

一种介于AI PC与AI责任站之间的Agent Computer出现了。最近发布的联想AI主机P7,仅300克、30W功耗的开辟,领有190TOPS端侧AI算力,能在土产货运行122B参数模子。

01

AI 2.0期间,

需要怎样的Agent Computer?

传统AI更多如故一问一答式交互,任务结束后,模子也随之住手运行。但Agent不同,它需要经久在线、执续调用模子、自主拆奉命务,并在土产货完成回顾、推理、扩展等一整套经由。

这意味着Agent开辟比拼的,不再仅仅瞬时性能,而是经久踏实运行技艺。

换句话说,AI 2.0期间着实需要的不是AIPC的浅薄升级版,而是一种介于AI PC与AI责任站之间的新结尾,它既要具备运行大模子的技艺,又必须兼顾低功耗、静音、小体积,以及7×24小时执续责任的踏实性。

联想AI主机P7,恰是在AI 2.0需求下出生的Agent Computer新物种。它既尝试接近DGX Spark的大模子坐蓐力技艺,又保留了近似Mac mini的低功耗与静音特质。

P7领有190TOPS异构AI算力(dNPU+SoC),其中160TOPS来其后摩漫界M50 dNPU,30TOPS来自此芯P1 SoC。整机最高支执122B参数模子土产货部署,最高可树立80GB RAM,并支执128K陡立文窗口。

在无网环境下,P7土产货自主推理速率最高可达50 Tokens/s,不错已毕7×24小时团结扩展Agent任务。

围绕Agent经久在线需求,博亚体育app官方网站P7的机身惟有手掌大小,分量约300克,以致不错径直通过充电宝供电运行。为了在小体积下已毕执续踏实运行,P7还将整机功耗结束在30W以内,并将运行杂音压低至35分贝以下。

这意味着,联想AI主机P7依然运转着实具备土产货坐蓐力价值。

更紧迫的是,与传统PC+AI的念念路不同,P7并不是在原有开辟中加多AI功能,而是围绕Agent场景再行界说结尾逻辑。

举例,P7秉承了一机双模筹划,在智能体模式下,土产货运行天禧Claw,将复杂任务尽可能留在土产货扩展;在大模子模式下,则通过灵通API Key接入各样AI哄骗与智能体,径直承担土产货推理与Token生成技艺。

P7的推出代表着昔时惟有高功耗责任站才能承担的大模子土产货推理技艺,运转有契机参加更低功耗、更低资本的微型开辟。

而惟有当大模子推理大约在低功耗、小体积条目下经久运行,Agent才有可能着实从少数开发者开辟,逐步走向更无为的花费级与行业结尾场景。

解救这种Agent Computer形态成立的,是P7背后一套不同于传统GPU道路的新算力决策。

02

千亿模子装入口袋之后,

算力逻辑也变了

联想在P7立项初期就依然明确,要作念一台能放入口袋、又能土产货运行大模子的AI主机。这意味着它的芯片必须同期无礼三个竟然互斥的条目:大算力、低功耗、小体积。

传统AI芯片很难同期兼顾这些需求,中枢在于数据搬运——计算单位与存储单位物理区分,2026世界杯即时比分数据在两者之间闲居流动,带来罕见的能耗与延长。

AI芯片行业因此不断探索新的架构旅途,其中一个正在被越来越多厂商探索的主义便是存算一体,存算一体让数据在存储侧就近完成计算,从而减少搬运支拨,普及全体能效。

联想选用引入存算一体架构芯片,手脚P7的主要AI算力来源,也便是dNPU(Discrete NPU),它近似于零丁GPU的定位,领有更强的AI性能。

HJC黄金城官方首页入口

这颗dNPU,恰是后摩智能在2025年推出的存算一体AI芯片——后摩漫界M50。

后摩漫界M50秉承存算一体架构筹划,具备160TOPS物理算力,配备最高48GB内存与153.6GB/s带宽,典型功耗仅10W,能效达到传统架构芯片的5~10倍。

雷峰网了解到,M50在筹划阶段就针对大模子部署进行了优化,通过SRAM与48GB LPDDR5的组合决策,在兼顾性能的同期,普及了千亿参数模子的可部署性与资本可控性。

着实的挑战不啻于芯片,而是如何让千亿参数模子在一台300克级别的开辟上经久踏实运行。这需要联想与后摩智能在土产货Agent系统、推理框架以及软硬件协同层面进行深度合作。

尤其是在Agent扩展链路、模子颐养与端侧资源解决上,联想需要一套全新的系统技艺来解救执续运行的AI任务。

从2025年下半年相貌稳妥启动运转,联想与后摩智能组建纠合团队,围绕硬件筹划、软件适配与推理框架伸开了长达十多个月的纠合攻坚,最终已毕了在后摩漫界M50上运行千亿参数大模子。

当今,P7依然支执千问、智谱、DeepSeek等主流模子,并可已毕新模子的Day0适配,即模子发布今日即可完成运行支执。对于用户而言,这使得P7不再仅仅演示型开辟,而是一台可经久运行Agent任务的土产货AI结尾。

从芯片到系统,再到Agent扩展技艺,联想与后摩智能正在共同考据一种新的AI主机形态。

跟着端侧大模子执续演进,这种兼顾性能、功耗与经久运行技艺的Agent Computer,正在成为AI 2.0期间最具试验落地后劲的结尾主义之一。

03

Agent 波浪重构硬件功令,

存算一体迎来推理黄金期间

AI芯片的竞争逻辑,正在发生一场静默的翻转。

昔时几年,行业的中枢方针是峰值算力,比拼的是谁能检会更大的模子,GPU也因此成为系数AI期间的中枢基础要领。

但当AI从1.0期间的生成一次回报走向2.0期间的经久运行、执续扩展任务的Agent形态后,芯片的评价体系运飘浮化:能效比、执续推理技艺、土产货扩展复杂任务的踏实性,逐步与峰值算力同等紧迫。

这一变化并不是传统AI芯片的上风方位,却为新的架构旅途掀开了窗口。

一个显豁的信号来自行业巨头。英伟达重金收购初创公司 Groq 中枢期间财富,将其 LPU (Language Processing Unit)话语处理单位用于高性能推理场景。后摩智能与Groq皆是存算一体期间道路,皆是基于SRAM筹划居品,减少数据搬运、普及推理能效,仅仅居品叫法不同。

后摩智能在成立之初就专注于存算一体期间的研发与产业化,2024年推出针对大模子推理优化的后摩漫界M30,支执运行60亿参数模子,并得到了中国挪动等客户。

当今,基于后摩漫界M50,后摩智能依然搭建起M.2卡、DM.2卡、Pcie卡,最高 640TOPS 算力的无缺居品矩阵,并完成了从期间原型到界限化商用的关节进步。如今后摩漫界M50已全面落地联想AI主机P7、 AI PC、桌面机器东谈主、Agent Box、智能语音结尾、AI 网关等多元端边场景。

后摩智能也在研发下一代芯片,主义是进一步普及能效比与大模子推理技艺,以适配改日更复杂的Agent期间。

这是一个记号性的转机点,GPU 界说了大模子检会期间,而 Agent 的全面爆发,正将算力竞争从云霄检会中心,推向海量的端侧、旯旮推理节点。在这场算力样式迁徙中,以存算一体为代表的 AI 原生架构,不再仅仅 GPU 的补充或替代,更在冉冉诞生端侧 Agent 期间的全新硬件门径。

跟着Agent运转向更多土产货开辟浸透,行业对于低功耗、高能效端边推理芯片的需求也会执续加多。

改日,围绕端侧大模子推理,还会出现更多新的芯片形态与架构道路。

在这场Agent驱动的AI硬件范式切换中,AI原生的芯片成为竞争的关节,像后摩智能这么起原完成存算一体交易化落地的公司,正在参加更大的增长通谈。

更多对于推理期间算力需求的深度疏浚宽贷添加作家微信BENSONEIT。