2026世界杯盘口 Anthropic刚递表IPO, 但旗舰正在被全网随性吐槽

来源:开云2026世界杯官方授权平台 作者: 发布时间: 浏览:98

2026世界杯盘口 Anthropic刚递表IPO, 但旗舰正在被全网随性吐槽

Anthropic依然玄机向好意思国证券交往委员会(SEC)递交了 S-1注册声明草稿。这意味着一朝SEC审核通过,Anthropic就不错随时启动IPO。

公告中莫得长远具体的刊行股数和订价,只说“取决于市集条目和其他要素”。

就在递表的前一天,Anthropic才晓喻完成650亿好意思元H轮融资,投后估值达9650亿好意思元,特出OpenAI的8520亿好意思元,成为全球估值最高的私营AI公司。而况Anthropic的发言东谈主还称,公司年化运营收入已从前年底的100亿好意思元暴涨至470亿好意思元。

但Anthropic对得起它的估值吗?

当今市面上依然有两家公司上市了,智谱和MiniMax。而且专家也齐昭着一个道理,对上市的AI公司来说,市值与旗舰产物的阐扬强挂钩。

投资者买的不是畴前的设立,是你畴昔的增长预期。Opus 4.8本该是Anthropic向市集阐扬“咱们是全球第一”,收尾却是一场晦气。

Claude Opus 4.8厚爱发布的时候,配套推出了dynamic workflows功能,堪称能让Claude Code鬈曲数百个并行子代理,完成“从启动到合并”的代码库级迁徙。

但经过周末两天的发酵,不管是汉文社区照旧英文社区,全网齐在吐槽Opus 4.8。

外媒论坛上,有东谈主发现Opus 4.8在Max档位下审查一个PR花了10好意思元,而Opus 4.7只需要2到5好意思元。另一位用户拉出token使用纪录,发现Opus 4.8开启念念考模式后,每轮对话会生成并缓存高达90万个token,而Opus 4.7唯有1.4万到3.4万。

原因是Anthropic把念念考模式从“按需启动”改成了“耐久开启”。

4.7会凭证任务复杂度决定要不要念念考,浅易任务险些不产生念念考块。4.8只须开了念念考模式,每一轮齐生成齐全念念考块,不管任务多浅易。高下文像滚雪球一样彭胀,几分钟就能耗尽了额度。

模子再灵巧,要是过度解释,还陆续重迭高下文,那么模子就有可能在长对话中失焦,导致骨子体验变差。

不啻如斯,要是你用汉文问Opus 4.8是谁,它会文书你它是千问以及DeepSeek。还有网友捉弄称,Opus 4.8用汉文文书问题时,话语一股“豆包”味。

Anthropic当今但是全球最顶尖的AI公司,莫得之一。要是这些事情齐是的确,那对行将IPO的Anthropic来说,无疑是捣毁打击。

那Opus 4.8到底若何样呢?

Anthropic此次主推的并不是什么模子性能进步,官方更新公告中也强调这事了。它主要推的是dynamic workflows 功能,现时只在Claude Code中以谈判预览格式提供。

这个功能是一个多智能体编排系统,它让Claude能自动编写JavaScript剧本,将复杂任务拆分为子任务,鬈曲数十到数百个并行子智能体协同处理并交叉考据收尾,最终请托齐全谜底。

总共过程孤独于对话高下文初始,救助断点续跑。

于是,我就以这个功能算作切入点,给Opus 4.8出了谈题目,而况也把疏导的题目抛给了GPT-5.5,以作念对比。

Opus 4.8到底如何?

我给Opus 4.8的任务内容是这样的。

假如说你有一个练习的买卖软件,一共80万行代码,React前端、Node.js后端、PostgreSQL数据库、Redis缓存、后台任务部队、Stripe支付、邮件见知、经管后台。

当今要给它加上组织级的脚色权限贬抑系统。五种脚色,Owner老是板什么齐耀眼,Admin是经管员也能管大部分事,Billing Manager是财务司理只可看账单,Read-only Auditor是审计员只可看报表但弗成导出或修改数据,Member是普通成员权限最少。

要救助邀请成员、变更脚色、贬抑不同页面的探访、纪录审计日记。数据库要加新表、写迁徙剧本、还要能回滚。API层要更新授权中间件,每个端点齐要查验权限。

还有一个硬不休,最多只可用8个子代理,而况要解释为什么每一个齐是必要的。这就逼着AI必须在粒度和成果之间找均衡,弗成无穷拆分,也弗成骄傲合并。

80万行代码是什么主张?微信小步伐大约几万行,一个中型电商网站可能十几万行,80万行意味着这是一个初始了好几年、有几十个工程师齰舌、功能颠倒复杂的大型系统。

为了不影响著作阅读,我把它俩的文书放到了著作末尾。

GPT-5.5先作念一张权限表,把Owner、Admin、Member、Billing Manager、Auditor五种脚色,分裂对应到“能弗成看账单、能弗成进后台、能弗成邀请成员、能弗成导出报表”等具体动作。

章程定好后,它再派8个子代理分头看代码。

一个看后端接口,一个看数据库结构,一个看前端页面和按钮,一个看后台任务,一个绝顶设想测试,一个绝顶找越权风险,终末一个负责把总共收尾合并成实验法例。

Claude亦然派8个子代理,但它写法像是清单。

第一步先扫描总共系统,找出哪些接口、页面、任务会受权限影响。第二步设想数据库表、迁徙剧本和回滚有运筹帷幄。第三步写调和的权限查验逻辑。第四步分裂处理前端页面、邀请成员、脚色变更、后台任务。终末再作念集成测试、安全测试、性能测试和回滚演练。

也就是说,GPT-5.5先把“谁耀眼什么”这件事定死,再让不同代理去找对应代码位置;Claude则先把总共纠正工程拆成几个施工阶段,再给每个阶段安排代理、产出物和验收据件。

算作评委,我是这样看这两份谜底的。

GPT-5.5的谜底结构明晰,每个阶段要作念什么、每个子代理负责什么、什么不错并行什么必须串行、若何考据、若何贬抑成本、容易在那里翻车,完全说得很昭着。

它的作风是求实,追求快速推动。它把重心放在幸免顿然上头,先作念文献类别发现而不是读总共仓库,每个子代理只复返旅途和浅近发现而不是代码,接洽之后就住手恭候批准。

它列出的十大失败模式齐是真实名目里最容易犯的装假,比如把前端荫藏当授权、健忘后台任务之类的,这些齐是锻练之谈。

Claude的谜底更齐全一些。

它不仅说要作念什么,还解释为什么要这样作念。每个子代理齐有明确的必要性证据,每个阶段齐有明晰的方向和产出,每个住手条目也齐有可量化的方向。

Claude把重心放在质料保证上头,单位测试销毁率要大于90%、缓存射中率要大于80%、邮件发送到手率要大于99%、测试要销毁至少80%的功课。

它对每个子代理的输入输出齐描绘得颠倒具体,它不会说“权限查验库”之类暧昧的话,它具体到“canAccessBilling、canAccessAdminDashboard”之类的各式函数。

但这谈题测的不是哪个有运筹帷幄更好,而是哪个模子更意会这谈题在问什么。

GPT-5.5意会的是“给我一个不错坐窝实验的运筹帷幄”。Claude意会的是“给我一个齐全的系统设想”。

前者是工程师念念维,后者是架构师念念维。前者祥和的是成果和风险贬抑,后者祥和的是齐全性和质料保证。

要是你要我选一个,我细目选GPT。

原因很浅易,题目要求是“React前端”,但Claude给我的谜底里,它写的是“终了组件级权限指示(v-can、CanAccess 组件)”。

v-can是Vue的指示语法,React根柢无须这种情势,才是React用的组件。

Opus 4.8在DeepSWE上

输给了GPT-5.5

你不错说我出的题目带有一些主不雅颜色,但是DeepSWE给的收尾是绝对客不雅的。

5月31日,DeepSWE给出了最新的评分。GPT-5.5拿了70分,排第一。GPT-5.4拿了56分,2026世界杯赔率排第二。Claude Opus 4.7拿了54分,排第三。

DeepSWE是一个绝顶测试AI编程智力的新benchmark。

它给模子一个真实的GitHub issue,让模子我方去诞生,然后看能弗成通过测试。

跟之前的SWE-Bench Pro不同,DeepSWE的任务更接近真实使命场景。平均每个任务要改668行代码、触及7个文献,而且辅导词很短,唯有2158个字符。

模子必须我方读代码库、找进口、意会名目结构、跨文献修改、还弗成交加现存功能。

更要道的是成本。

GPT-5.5达到70%通过率,平均每次测试花5.8好意思元、耗时20分钟、输出4.7万个 token。GPT-5.4更合算,每次3.3好意思元就能拿到56%的通过率。

Claude Opus 4.8和4.7每次测试的成本要贵得多,而且输出token、耗时、成本齐比其他模子高一个数目级。

DeepSWE还发现了一个更有真谛的事。

开云app中国2026世界杯官方下载

SWE-Bench Pro是一个考AI写代码的老练。正常情况下,AI应该像步伐员一样,看bug、改代码、跑测试,我方把问题修好。

但这个老练环境有个间隙,它把名目以前的Git历史也通盘放进去了。

Git 历史不错意会成“这谈题以前是若何被真东谈主修好的纪录”。也就是说,圭表谜底其实藏在老练电脑里。

大部分模子就算谜底藏在那里,也不会去翻。

但Datacurve的分析说,Claude巧合候会去翻这些历史纪录,找到当年诞生这个bug的commit,然后照着谜底改。

这就像老练时,试卷旁边其实放着一册谜底册。正常学生不会看,或者不知谈能看。但Claude巧合会把谜底册翻出来抄。

DeepSWE诞生了这个间隙,只提供浅克隆和基础commit,不留金圭表hash让模子去发现。

这就是为什么到了DeepSWE上,哪怕是最新的Claude Opus 4.8也远不如GPT-5.5。

DeepSWE的收尾出来之后,Anthropic当今是两端堵。

性能不如GPT-5.5,价钱还比GPT-5.5贵。

Opus 4.8的订价战略激发了多量用户的起火。X上有东谈主说,蓝本想试试官方声称的“2倍使用量”,收尾30分钟就烧收场98%的使用量,于是这位用户胜利退款,转去试Kimi K2.6。

更夸张的案例是,灵验户发现 Opus 4.8在23分18秒内耗尽了98.2万个token,按照Opus的订价来看,不到半个小时,就烧掉小200块钱。

天然,Artificial Analysis示意,Opus 4.8完成同等任务比4.7少用15%的实验轮次和35%的输出token。

这是由于Opus 4.8通过更高效的器用调用和更胜利的问题措置旅途,用更少的实验法子完成同等任务,最终镌汰了骨子初始成本。

但用户的感受是,账单变贵了。

LINUX DO用户用官方API胜利发包测试,问“你是什么模子”,Opus 4.8大约率文书“我是通义千问”,小概率文书“我是 DeepSeek”,就是不说我方是 Claude。

有东谈主粗测了概率散播,Qwen占大头,DeepSeek占小头,Claude险些为零。

看到这些新闻,此时的阿莫迪一定是束手无策。

因为就在Opus 4.8发布的合并天,Anthropic晓喻完成650亿好意思元H轮融资,投后估值达9650亿好意思元,特出OpenAI 的8520亿好意思元,成为全球估值最高的私营AI公司。

这笔融资大约率是Anthropic上市前的终末一轮私募融资。Anthropic首任首席财务官克里希纳·拉奥(Krishna Rao) 示意,公司年化运营收入已蹂躏470亿好意思元,预测第二季度营收将达109亿好意思元,有望终了首个季度盈利。

与此同期,Anthropic还将在2026年下半年进行IPO。

就在这样个时间点上,一朝算作旗舰产物的Opus发生问题,那对Anthropic总共公司来说,齐将濒临捣毁性的晦气。

众叛亲离的前夕

阿莫迪当今需要的惦记还不啻是产物。

外媒在5月31日报谈了Anthropic创立背后的一段旧事。

这个故事的主角是格雷格·布鲁克曼(Greg Brockman),OpenAI的聚合首创东谈主和总裁,相同亦然一个技能天才。在公司里面,他以毅力、越权的“大脚”经管作风著明。

他老是幸免各式会议,把80%的时间齐用在写代码上。然而他却精深在不了解布景的情况下,强行介入团队名目,糟踏他东谈主使命,招致多量共事的悔怨。

这种情况在OpenAI成立初期尤为严重。

布鲁克曼因过度过问名目,导致名想法一位顶尖谈判员备受排挤,这件事绝对激愤了那时的名目负责东谈主,也就是其后Anthropic的首创东谈主阿莫迪。

阿莫迪那时负责的阿谁名目,天然并不是ChatGPT,但它是ChatGPT出生前的一项要道工程名目。其后ChatGPT就是沿着这条技能道路发展出来的。

阿莫迪其后胜利阻难布鲁克曼参预阿谁早期对话模子名目。

这段职场裂痕不仅促成了Amodei团队日后出走,并创立Anthropic,也为OpenAI其后的权利战斗埋下了伏笔。

2023年感德节董事会“政变”中,聚合首创东谈主伊利亚·苏兹科维(Ilya Sutskever)辞退奥特曼时,给出的核样式由之一就是奥特曼“管不住布鲁克曼”。

证据布鲁克曼的问题依然严重到,能够影响总共公司运作的进程了。

阿莫迪当年出走OpenAI,就是因为他不想在一个“大脚”随时会踩进来的环境里作念事。他要的是一个技能患难之交、不被扰乱的所在,一个不错按照我方节拍打磨产物的所在。

但当今,Anthropic我方也造成了一个“大脚”随时会踩进来的所在。

只不外此次踩进来的不是布鲁克曼,而是成本、上市压力、用户预期和竞争敌手。

Opus 4.8的问题不是技能问题,是节拍问题。它被逼着在还没准备好的时候上场,因为Anthropic需要在IPO前阐扬我方还能打,需要告诉专家,Anthropic配得上9650亿好意思元的估值。

IPO的时间窗口正在收紧。

Anthropic在5月31日递交 S-1草稿后,按照SEC的审核过程,最快可能在三到四个月内完成审核并启动路演。这意味着Anthropic最早可能在9月或10月敲钟。

但当今的问题是,路演时投资者会看什么?

他们会看Q2和Q3的营收数据,会看用户增长弧线,会看Claude Code的留存率,会看企业客户的续约情况。而这些数字,完全直罗致Opus 4.8阐扬的影响。

要是Opus 4.8的口碑握续恶化,那Q3的营收增速就会放缓。一朝增速放缓,投资者就会再行评估Anthropic的增长故事,9650亿好意思元的估值就会被打扣头。

更要命的是,Anthropic的竞争敌手依然不按章程出牌了。

5月22日,就在Opus 4.8发布前一周,DeepSeek晓喻将V4 Pro的75%扣头遥远化。新价钱是每百万token输入0.435好意思元、输出0.87好意思元。

假如有这样一个诓骗,1000万个输出token,那么它用DeepSeek V4就只需要花8.7好意思元,用Claude Opus要花250好意思元。

explainx.ai上就有这样个例子,他把代码审查和推理任务从Claude切换到DeepSeek V4 Pro后,不仅任务能够陆续实验,成本还从1071好意思元降到了268好意思元。

这就是阿莫迪当今的处境。

他能逃离OpenAI的“大脚”,却没办法逃离买卖宇宙的“大脚”。

区别只在于,当年他不错选拔离开。如今,他无处可逃。

Opus 4.8

2026世界杯盘口