行业分类:
加载中...
头条分类:
加载中...
Token经济时代,AI公司如何“反脆弱”?
3月中旬,在英伟达GTC 2026大会上,黄仁勋围绕Token的爆发式增长,做了一番令人振奋的发言:数据中心不再是文件仓库,而是生产Token的工厂。 “在Token工厂里,你的吞吐量和Token生成速度,将直接转化为明年的精确收入。”他说。 这番话并非虚无缥缈的畅想,而是对AI行业商业模式跃迁的精准总结——Token正在成为新时代的电力和石油,极具战略价值,且需求极为刚性;AI公司卖API、卖会员、卖广告,都不如卖Token有前途。 这套逻辑随后被冠以“Token经济”的名头,迅速席卷全球,并在AI行业激发广泛而深远的回响。 Token经济最直接的影响之一,是让AI公司售卖Token的基本商业模式,披上了充满想象力的外衣,并撑起了全球资本的热情。 今年以来,国内外许多头部AI公司完成上市,或拿到规模空前的新一轮融资,背后都有新概念加持的影子。 但在企业与资本的狂欢背后,隐忧开始浮现:Token经济,正在被简单地传导为“Token需要涨价。” 随着智能体取代Chatbot,AI服务的算力成本指数级上升。绝大多数AI公司倾向于把Token卖得更贵,以搭建一套符合逻辑、可持续运转的商业模式。 相对应地,各路资本追捧AI公司,同样基于这样的假设:Token经济时代,普通企业的Token消耗量一路飞升,而这会给AI公司创造源源不断的收入,稳定推升后者的长期价值。 Token涨价,似乎成为必然。 就在全行业大笔融资的同时,国内一些AI平台宣布涨价,或取消了较便宜的基础套餐,既包括字节、阿里、腾讯等老牌云服务,也有智谱这样的新贵。国外的OpenAI多次涨价,Anthropic也变相大幅提高了Claude Code的收费标准,引发大量吐槽。 然而在旺盛需求面前,AI公司通过涨价可以获得立竿见影的回报,也有可能造成供需两侧的矛盾:AI公司和普通企业都是Token经济的参与者,但一个雄心勃勃要涨价,一个却越来越不堪重负,期待价格平稳甚至下滑。 越来越贵的Token,正成为不少企业无法弃用,却又难以负担的“AI负重”。而AI公司依靠强势地位,强行涨价、逼迫客户多花钱,显然是一种非常脆弱的商业模式。只有在静如止水的理想竞争环境中,这种模式才有可能持续下去。 但日新月异的变化,恰恰是AI这条时代河流的最大特征。管理学大师纳西姆·塔勒布在《反脆弱》一书中指出:世界充满不可预测的“黑天鹅”事件。ChatGPT横空出世后的三年多里,AI行业的“黑天鹅”已经屡屡扇动翅膀,每一次都在全行业掀起变革浪潮。 AI公司不能祈求环境一成不变,依靠一套脆弱的商业模式赚钱,而是必须培育出“反脆弱”的能力,以适应变化、对冲波动,保持稳健的增长势头。正如《反脆弱》所言,脆弱者在波动中毁灭,强韧者仅能复原,而反脆弱者能从混乱、压力与不确定性中获益、变得更强。 AI公司需要回答一道难题:当Token经济时代全面到来时,该如何“反脆弱”,建立更有韧性的商业模式? 1 现阶段,Token到底是贵还是便宜? 一些AI公司的答案是“便宜”,还有上涨空间。 以智谱为例,它在今年2月宣布GLM Coding Plan涨价30%,原因是用户规模和调用量快速提升,市场需求持续强劲增长。其他公司在调价时大都采用了类似话术。 但对于任何一门生意而言,“因为不愁卖,所以要涨价”的商业逻辑,并不能长久运转下去。 充分竞争的行业终归会走向供需平衡,Token和AI也不例外。跑得更快的公司可以吃到先发红利,甚至暂时掌握“涨价权”;但当市场步入成熟期后,AI公司涨价的难度将越来越大,直至搁浅。 越卖越贵的Token,还掩盖了不少AI公司业务单一的短板。 这些公司把生产和销售Token作为唯一要务。企业除了购买API和MaaS,还需要自己搭建Agent矩阵、编排Skills,做业务适配和流程嵌入。 只知道卖Token的AI公司,很难培养起客户忠诚度,也无法构建用户生态。一旦别家Token更便宜、模型性能更强,客户就很可能流失。 也有一些AI公司认为,Token还是太贵了。 DeepSeek就持有这样的观点。 它在4月底发布V4预览版,各项技术指标十分出色,尤其是支持100万Token上下文,在长文本问答、减少幻觉等方面优势明显,完全有理由像同行一样涨价。 但出乎不少人意料,DeepSeek V4甚至比V3版本还便宜。发布48小时后,DeepSeek又将V4 Pro和Flash的输入价格(缓存命中)降低90%。 DeepSeek V4性价比惊人。根据OpenRouter的数据,处理相同长度的文本任务,DeepSeek V4的输出价格比GPT、Claude、Gemini等便宜了99%。 与此同时,DeepSeek还引入新技术,比如全新的混合注意力架构等,大幅降低了Token消耗量。据测算,在百万Token上下文设置下,V4-Pro每处理一个Token的算力消耗只有V3.2的27%,KV缓存占用只有10%。 以原生多模态大模型技术见长的商汤科技,也采取了类似策略。 不久前,商汤科技推出日日新SenseNova 6.7 Flash-Lite,一款全新的轻量化多模态智能体模型。与DeepSeek V4类似,商汤的新模型通过使用商汤科技的多模态大模型技术实现了Token消耗的大幅降低;在信息搜索等场景中,降幅可达60%。 同时,商汤还开启了免费试用活动。开发者选用SenseNova Token Plan,首月可免费获得无门槛调用配额,每5小时1500次调用额度。 商汤目的明确:既要降低Token单价,让企业用得起;又要降低Token消耗,让企业不担心一不留神“超标”。这两家AI公司采取的是“技术降本”策略,即通过迭代AI技术,以达到Token的大幅消耗,来降低企业使用成本,而非提价Token。 道理很简单:只有企业愿意用、用得起,AI公司才能玩转Token经济,才能“反脆弱”。只靠卖得贵来赚快钱,显然不是长久之计。 2 把Token成本打下来,是定价问题,更是技术问题。 一些公司选择追求SOTA,比如OpenAI、Anthropic,不仅要做到地表最强,还要比一比谁能首先实现通用人工智能,站在全人类的最前沿。 但也有许多公司的策略有所不同。 没兴趣刷榜的DeepSeek,把更多注意力放在了“AI+生产力”上。 根据DeepSeek的说法,V4在智能体任务、知识处理与推理能力方面表现突出,并针对Claude Code等主流AI编程工具进行了专项优化。 那么优化效果有多好?大模型评估平台Vals AI的测评结果显示,在代码生成方面,V4大幅领先所有其他开源模型。 可以说,DeepSeek做到了生产力场景下的SOTA。 商汤也采取了类似策略,选择了办公技能集(Skills)作为突破口。 它除了不断迭代新模型,还配套开发了全系列的办公Skills,且原生支持主流智能体框架。这样做的好处是,企业在应对不同场景、不同需求时,都可以快速搭建专属Agent,组成适合自身的AI工具箱,低成本快速部署和使用。 以SenseNova 6.7 Flash-Lite为例,这款轻量化多模态智能体模型原生支持OpenClaw、Hermes Agent等智能体框架,配合SenseNova-Skills,可以覆盖大多数办公场景,让企业快速形成端到端的复杂工作流,一键开启全自动办公。 比如,一家大型蔬菜企业希望让AI分析销售数据。SenseNova 6.7 Flash-Lite先是对连续3年的近90万行销售记录进行“数据审计”,确认数据正确后,再进行收入、成本、利润等财务指标分析,最终提供了“建立动态定价机制”和“调整品类结构”等五项精准建议,直接辅助企业管理层决策。 与DeepSeek相比,商汤对于生产力场景的理解更深入,打法也更有节奏:先抓住“稳”的高频场景,再探索“热”的场景。 “稳”的场景,就是打工人每天都在用的数据分析、深度研究、PPT创作、搜索等。这类场景业务流程清晰、容错率高、即时性较低,非常适合作为AI的首选“登陆场”。能够迅速打穿这类场景,来自于商汤在办公场景沉淀的知识和流程经验,以及在To B服务中积累的客户信任,当客户顺应AI势能而衍生新的技术赋能需求,商汤很快就抓住了。 “稳”的场景更高一层的则是“热”的场景,如视频生成、智能营销、具身智能等,与日常办公相比,其难度和要求上了一个数量级。再往上,则是金融、教育等要求极高的场景。 抓住这些从易到难的场景,就抓住了“AI+生产力”的本质。 同时,这也是AI公司接下来必须走的路。 AI大模型发展至今,“生产力”已经越来越重要。各类智能体取代Chatbot,成为核心落地场景。无论是个人还是企业用户,都希望用AI来干活、帮忙解决问题,而非只能聊聊天。 这也意味着,要想构建足够强韧的商业模式,AI公司必须以生产力为出发点,构建一整套低门槛、高上限的技术体系。 与单纯比拼大模型能力相比,手握这样一套“干活儿”的产品矩阵,AI公司才能尽可能抵消行业波动的影响,长期立于不败之地。 3 Token经济时代,AI公司需要改变经营范式和发展重心,而资本市场也正在调整对AI公司的估值逻辑。 过去四年间,资本更喜欢看哪家公司的大模型“刷榜”,谁的算力储备更多,哪家的AI App用户多等。 但如今,与生产力结合紧密的AI公司,越来越受到追捧。特别是在B端市场建立竞争优势的企业,堪称“当红炸子鸡”。 两大头部玩家仍在高歌猛进:OpenAI以8520亿美元的估值,完成了惊人的1220亿美元融资。最大对手Anthropic不甘示弱,最近被曝出融资300亿美元,市值达9000亿美元,首度反超OpenAI。在不少人看来,以AI编程见长的Anthropic,后劲比OpenAI更强。 “AI+生产力”,已经成为Token经济时代的企业价值催化剂。在这一块,DeepSeek和商汤已经站稳了脚跟,并逐渐得到认可。 5月初,DeepSeek被曝出寻求融资超500亿元人民币,有望刷新国内AI公司单轮融资纪录;投后估值更是突破3500亿元。 在许多投资者心目中,DeepSeek显然会比许多明星公司走得更远、飞得更高。 与一再震撼全球AI圈的DeepSeek相比,商汤低调了不少,但也具备自己的独特优势。商汤的“三位一体”战略包括了:算力基础设施(大装置)-大模型研发(日日新大模型)-AI应用,是AI行业不多见的全栈公司。 从2020年开始发力大模型,商汤一边推动模型和应用的研发,一边长期投入智算中心AIDC建设,打造了覆盖算力、模型与垂直应用的体系,实现了AI场景全栈覆盖,软硬协同,让商汤AI的综合实力位列行业一流。 而这一AI全栈能力,为商汤降低Token成本与价格奠定了根基。 与DeepSeek类似,商汤并非强行把价格打下来,而是“技术降本”,从源头上革新技术范式,为低成本Token创造空间。 以最新发布的SenseNova 6.7 Flash-Lite为例,它没有采用传统的“语言+视觉”拼接设计,而是通过原生多模态架构,取消了视觉转文本中间层。这样它能以更小的参数量完成任务,还可大幅降低推理过程中的Token消耗。在第三方权威机构Claw-Eval最新发布的测试中SenseNova 6.7 Flash-Lite进入全球TOP10,成为排名最高的轻量级模型。 此外,商汤具备一个独特优势:长期深耕B端。这让它拥有了应对不同层级客户、不同复杂场景的丰富经验。这些年来,尽管具体的业务形态发生了巨变,但商汤此前积累的行业认知和经营范式依然有效,为AI落地生产力场景奠定了良好的基础。 一个合理的判断是:商汤存在一定程度的低估,尚需具备长远眼光的投资者去真正“看到”。 再回到一开始的问题:AI公司该如何“反脆弱”? DeepSeek和商汤展现了“反脆弱”的禀赋。他们靠技术把Token价格降下来、帮助企业控制AI成本,同时又把“AI+生产力”作为出发点和目的地,跑出了一条独具特色的发展路径。由此产生的“反脆弱”能力,正在逐渐释放价值。 如今,DeepSeek的估值潜力刚被释放,就迸发出惊人光芒。与之类似,商汤虽然目前处于价值洼地,但随着“AI+生产力”场景愈发宽广,商汤也将释放行稳致远的增长潜力。AI行业的“反脆弱”,刚刚拉开序幕。
苏姿丰谈AI:在科技行业30余年,从未像今天这样为AI感到兴奋
凤凰网科技讯 (作者/许婧)5月19日,在今日举行的AMD AI开发者日活动上,AMD董事长兼首席执行官苏姿丰表示,当前人工智能的发展正处在令人振奋的历史节点。她坦言自己在科技行业已工作超过30年,但从未有过比今天更令人激动的时刻。 苏姿丰预测,未来五年内全球将有50亿人每天使用AI。而支撑这一规模的关键在于拥有合适的应用场景。她指出,不存在某一种单一应用或工作流能够满足所有人的需求,行业需要多样化的模型与工作流,才能真正利用AI改变生活和商业的方方面面。 她观察到,近几个月来AI的发展显著加速,大语言模型持续演进的同时,推理型AI也变得更加普及。企业界对AI的关注空前高涨,“每个国家的每一位CEO,无论企业规模大小,都在讨论如何利用AI更有效地影响业务。” 在技术层面,苏姿丰认为AI正在不断演变。开发者不仅需要处于核心位置的大语言模型,还必须赋予AI推理能力、学习能力以及数据流处理能力,使其能够持续推理、处理更多数据并不断学习迭代,这正是智能体的价值所在。 展望未来,苏姿丰判断GPU将无处不在,渗透整个生态系统,同时海量的CPU处理能力同样不可或缺。开发者需要完整的端到端计算体系,而这正是AMD的战略重点——提供从底层硬件到上层应用的全面计算能力。
学生用AI做作业行不行?清华这门课给出答案
快科技5月19日消息,现在很多学生写作业、写作文都爱用AI帮忙,到底能不能用、该怎么用,清华大学用一门必修课给出了答案。 清华写作与沟通课是全校大一新生都要上的通识必修课,今年春季学期,学校正式出台了AI使用指南,分成教师版和学生版,不直接禁止学生用AI,而是主动引导大家合理用好这个工具。 学校认为,与其强行禁止学生接触AI,不如主动规范用法。AI虽然能快速写出完整文章,但很容易让人产生能力幻觉,看似完成了作业,自身的逻辑思考和写作能力并没有真正提升。 这门课的核心不是凑出一篇文章,而是锻炼独立思考、整理思路、甄别信息的本事,这些都不能让AI全权代劳。 指南划定了清晰底线,要求学生坚守学术诚信,使用AI必须主动说明用途和使用环节,还要自己核实AI给出的资料和观点,不能照搬照抄。 老师也会刻意设计教学环节,让学生对比AI多篇文章,找出内容漏洞、文献虚构等问题,慢慢培养辨别能力。 课堂上老师也鼓励把AI当成参谋和助手,可以用来开拓写作思路、模拟访谈、拓展选题角度,但关键思考、查阅资料、论证观点必须自己完成。 不少学生会记录和AI的对话过程,方便老师判断是合理借用工具,还是直接偷懒让AI代做任务。 老师们也看得很清楚,AI随手就能写出及格水平的文章,但真正有思想深度、有独立见解的内容,还是要靠人自己沉淀和思考。 清华这门课的做法,就是让学生学会驾驭AI,而不是被AI替代,守住独立思考的能力。
杨立昆的一个转推,宣布Meta AI“已死”
文 | 象先志 前几天,Julia Kempe在X上发了一条告别帖:宣布即将离开Meta,下个月起加入牛津的Ellison Institute of Technology,继续做foundation models(基础模型)的基础研究。 但在杨立昆几小时内转推了她。 也许这位研究员并不为人所熟知,只要知道,他是杨立昆离职后,Meta内部研究方向最接近他的人,是纽约大学数学系Silver Professor(最高荣誉教席)就够了。 注意一个细节——杨立昆的页面上一直挂着一条签名式声明,第一句话是“I do not write posts on X.”(我不在 X 上发帖。)他几乎不原创发帖,一个月也转不了几条。但是这次他迅速转发了这条Meta的人事信息,似乎带有一种复仇的意味。 回到去年,小扎砸了 143亿美元请来的AI 急救方案亚历山大・王,加一个新建的Meta Superintelligence Labs(MSL)让杨立昆这样的传奇研究员不得不向一个 28 岁的年轻人汇报,从而导致了他从Meta愤然离职。而今天Kempa的离职,几乎已经宣判了小扎选择亚历山大・王的发展路径,已经走向绝路。 杨立昆的,就像给小扎和Meta下了一道判决:Meta的基础模型研究,永远也做不起来。 挖来的研究员,悉数离场 2025年6月,在Llama 4大模型发布后市场反响不佳的两个月后,Meta CEO马克・扎克伯格敲定了公司史上最大一笔对外投资:以143亿美元收购AI数据服务商Scale AI 49%的无投票权股份。此次交易对Scale AI 的整体估值为290亿美元,其创始人亚历山大・王(Alexandr Wang)个人所持股份对应价值约50亿美元。 此次收购案本质是一次人才收购,花143亿买王这一个人。Scale AI仍然独立运营,亚历山大・王保留原公司CEO身份,同时入主Meta 任新设立的 Chief AI Officer,直接向 Zuckerberg 汇报。 亚历山大・王只有28岁。 同步动作是大规模挖人。从OpenAI、Google、Anthropic、Thinking Machines Lab各家抢——光从Mira Murati的Thinking Machines Lab就一口气挖走5个创始人,包括传说中那个15亿美元的ghost engineer(业内多次报道,Meta 从未公开姓名)。 新成立的MSL被拆成4个组:亚历山大・王自己带的TBD Lab 做LLM、Rob Fergus带的 FAIR 改成MSL子团队做长期研究、Friedman带的 Products做消费集成、Aparna Ramani带的Infra做基础设施。 蓝图画得很大。Zuckerberg在2025年6月30日发的全员备忘录里把亚历山大・王称作 “this generation's most impressive founder”(这一代最让人印象深刻的创业者)。 然后9个月就走样了。 第一刀是2025年10月——亚历山大・王接手仅4个月,MSL砍掉 600个岗位。 第二刀是2026年1月——Reality Labs 准备裁员,让位给 AI。 第三刀是2026年3月——Meta 内部从“集中领导”改成“冗余领导”结构。新建Applied AI Engineering单元,由 Maher Saba 带,直接向CTO Andrew Bosworth汇报,不归王管。媒体当时的判断写得很直接:这一动作“ effectively strips Wang of absolute autonomy”(实质上剥夺了 亚历山大・王的绝对自主权)。 入主 9 个月,Zuckerberg自己开始收回授权。 接下来是 4 月。Muse Spark模型发布,被Wall Street描述为“有潜力,但投资者想看到战略”。然后是4月30日的Q1 earnings call——Bloomberg当天的报道标题:“Meta CEO Mark Zuckerberg Vague on Earnings Call About AI Revenue Plans.”(扎克伯格在财报电话会上对 AI 营收计划含糊其辞。)CEO自己也讲不清AI怎么变现。 到5月,出走潮开始。 至少8个MSL成员自去年7月以来已经离开。几个具体名字——Avi Verma:原OpenAI人,被Meta 高薪挖来,在MSL待不到一个月就跑回了OpenAI。 Ethan Knight:也回了OpenAI。 Rishabh Agarwal:在Meta 5个月后离开,去了Periodic Labs。 Julia Kempe也就是杨立昆转推的这位研究员:5月16 日宣布离开,下个月去牛津Ellison Institute做foundation models基础研究。 业内观察的原话是——越来越多前MSL员工正在对手公司浮出水面,OpenAI是常见目的地。 翻译一下:Zuckerberg斥巨资挖来的人,根本呆不住。Meta和小扎的急功近利,让所有专注研究的人都水土不服。 Kempa为什么重要? 简介来自纽约大学官网。 Julia Kempe是纽约大学数学系Silver Professor(最高荣誉教席),伯克利数学博士,2024年全职进Meta之前带过NYU数据科学中心五年。这种学术身份在硅谷工业实验室里是稀缺品。Meta把她挖进MSL,本身就是对外姿态——MSL不只是亚历山大・王的产品作坊,也有顶级学者愿意来。 她在MSL领导的是 Foundations of Reasoning Team(推理基础研究团队),专门给Llama装“会思考”的底子。Llama 3.3和Llama 4在推理上的能力提升,她是核心贡献者。 这个位置不能轻易换人——市场上不缺研究学者,缺的是同时具备学术声望、产品配合度、学术圈背书的人。她和LeCun同属一个学派,同在NYU Courant楼里,同样的欧洲数学背景,同样的研究品味。杨立昆年离开Meta之后,Kempe是Meta内部最接近他的那个替代者。 所以她离职不是一个研究员跳槽,而是Meta基础模型研究的崩塌。 她去的地方否决了亚历山大・王的整套打法,已经无法做成OpenAI、Anthropic那种工业实验室加规模扩张的路线,这是用自己的去向公开宣布:她不是放弃AI,她是放弃Meta的AI路线。 把她放回过去10个月MSL至少8个出走者的名单,她是沉没成本最大的那一个——其他人有的不到一个月就回OpenAI,可以解释为“水土不服”。Kempe待了将近两年,是看完内部运作之后做的判决。她都走了,剩下还在观望的研究骨干,门槛已经被她踩低了。 而Zuckerberg自己也在动摇。3月亚历山大・王已被部分削权,4月30日财报电话会被Bloomberg形容为“对 AI营收计划含糊其辞”。Kempe 5月16日离职,4天后Meta启动8000人裁员——这一切,很难被看作是巧合。 Llama 4开始,Meta就输了 回顾Meta的溃败,在去年初就已经开始了。 2025年1月,DeepSeek R1出来了性能逼近GPT-4,训练成本据称不到600万美金。硅谷震动。Meta慌了。 3个月后,2025年4月,Meta仓促发布Llama 4。当时业内的判断很直接:这是Meta对DeepSeek的回应。海外媒体当时的标题就是 “Meta's answer to DeepSeek is here.” Scout加Maverick两个模型先发,2T参数的Behemoth还在训练,号称做完会用蒸馏把能力下放给前两个。 然后Llama4翻车了。 Llama 4 Maverick在aider polyglot编码评测上只得了16%——同期Claude Sonnet 3.7 是60%上下。开源社区里Zvi Mowshowitz写了一篇推文标题就叫“Llama Does Not Look Good 4 Anything.”(Llama 啥都不行。)业内评价更直接:“Scout and Maverick feel like rushed responses to China, not tools for developers.”(Scout 和 Maverick 像是对中国的仓促回应,不是给开发者的工具。) 更难看的还在后面。Meta给LMArena提交的是一个叫 “Llama-4-Maverick-03-26-Experimental”的特殊版本——专门为human preference投票调过——一上线就刷到了LMArena 第一。社区识破后,LMSYS直接修改了leaderboard规则反制Meta。Meta自家的生成式 AI副总裁Ahmad Al-Dahle还得专门出来辟谣,但这个刷榜事件又让Meta再度抬不起头。 Llama 4不是技术失败,是节奏失败。 Meta想DeepSeek出来3个月就追上,做不到,所以选择刷榜。但刷榜被抓现行,比追不上更难看。 然后就是“牛油果计划”,但Meta在这个项目上的最新进展是:宣布延期。毫无疑问,难产的事实也完全做实。 更不必说最近Meta 对Manus的收购中止,整体看下来,虽然小扎对AI始终是望眼欲穿,但AI好像在追着Meta杀。所有的内部路线,几乎都走向了终结。 写在最后 横向对比来看——OpenAI、Anthropic、Google DeepMind 这三家,过去三年里没有任何一家用砸天价救场。OpenAI从Y Combinator时代慢慢长起来,Anthropic从OpenAI出走的几个人慢慢建队伍,DeepMind在Google内部默默搞AlphaFold搞了11 年。 只有Meta,一直在想花钱买条快路。现在这条路也接近终结。 这条路9个月就走不下去了。 更深一层的事是——Kempe这种人,离开MSL去牛津做基础研究,月薪可能不到她在 MSL package 的零头。学者用脚投票投的不是钱,是尊严。MSL给得起天价package,但给不出做研究的尊严。Kempe在 Meta 最后干的活是consumer agents,离她NYU实验室做的那种推理基础研究,已经相去甚远。 亚历山大・王接手后的MSL不是研究院,是一家急着出产品的公司。这种地方留不住有自己研究品味的学者。 这也不只是Meta一家的事。2025到2026这一年半里,整个硅谷都在抢人、砸钱、改名,所有公司都在向“应用导向 + scaling”靠拢。但有意思的是——最有水平的研究者反而在悄悄离场。 他们都不是去更大、更有钱的地方。他们是去更小、更安静、更纯粹研究的地方。 杨立昆用一个简单的转推,宣判了Meta AI模式的彻底死亡。 这一下转推,等于一封没有正文的离职信——离开 Meta 的不是 Kempe 一个人,是LeCun代表的整个纯研究派给扎克伯格交的一份联署信。 只有钱,买不来 AI 。
被曝花20亿,Anthropic收购Agent工具企业,断供谷歌OpenAI
智东西 作者 | 杨京丽 编辑 | 李水青 智东西5月19日消息,今天凌晨,Anthropic宣布已收购开发者工具初创公司Stainless。 此前,StAInless的软件被包括OpenAI和谷歌在内的多家公司广泛使用,收购完成后,其工具将只对Anthropic可用,不再向竞争对手开放。 Anthropic宣布收购Stainless(图源:X) Anthropic和Stainless均未披露交易条款。据The Information上周报道,Anthropic正洽谈以超过3亿美元(约合人民币20.42亿元)收购Stainless,Stainless的投资方包括红杉资本和Andreessen Horowitz。 该收购意味着,Anthropic获得了一个长期支持其官方SDK生成的团队,将这家曾服务多家AI公司和开发者平台的基础设施供应商收入囊中。随着Agent不断优化任务执行能力,API、SDK和MCP服务器等连接工具的重要性正在上升。 一、曾支持Anthropic生成所有官方SDK,可自动维护多语言开发工具包 Anthropic在官网公告中称,AI前沿正在从“回答问题的模型”转向“能够行动的Agent”,而Agent的能力取决于它们能够触达哪些系统。Anthropic收购Stainless,希望进一步扩展其AI产品的触达能力。 Stainless成立于2022年,总部位于纽约,创始人亚历克斯·拉特雷(Alex Rattray)毕业于宾夕法尼亚大学,曾任美国支付基础设施公司Stripe工程师。Stainless的主营业务是自动生成和维护软件开发工具包(SDK)、命令行工具(CLI)和MCP服务器,这些工具可以帮助开发者和Agent调用API。 Anthropic称,从公司早期推出API起,Stainless就一直支持每个Anthropic官方SDK的生成,数百家公司依赖Stainless生成SDK、CLI和MCP服务器。 Stainless可将API规范转换为TypeScript、Python、Go、Java、Kotlin等语言的SDK。Anthropic称,这些SDK快速、可靠,用起来像是对应语言中的原生工具。据外媒TechCrunch报道,Stainless之所以成为热门工具,是因为该平台可以随着API变化自动更新SDK,省去了手动维护这一耗时流程。 Stainless创始人兼CEO拉特雷称,Anthropic是最早与Stainless合作的团队之一。过去几年,Stainless一直在关注开发者基于Claude构建出的产品,这促使了双方团队走到一起。 Stainless创始人兼CEO亚历克斯·拉特雷 二、Stainless将关闭托管产品,OpenAI、谷歌后续无法创建新SDK Stainless在官方博客中称,随着团队把重点转向Claude平台能力以及连接Agent与API,公司将逐步关闭所有托管的Stainless产品,包括SDK生成器。从公告当天起,新用户注册、新项目和新SDK将不可用。 Anthropic发言人称,Stainless客户仍将拥有截至目前已生成的SDK,并拥有按自己意愿修改和扩展这些SDK的完整权利。 TechCrunch称,Stainless的技术对Anthropic、OpenAI、谷歌、Replicate、Runway和Cloudflare等公司价值较高。这些公司正在构建能够连接外部软件、并帮助用户完成任务的AI Agent。Stainless的SDK工具是构建和维护这些连接的一种便捷方式,但今后,这些工具将只对Anthropic可用,不再向其竞争对手开放。 Stainless称,全球约四分之一的专业软件开发者,曾使用过由Stainless生成的SDK,或访问过由Stainless创建的文档网站。Anthropic称,公司创建MCP是为了让Agent连接成为可能。随着Stainless加入Anthropic,Claude平台将继续提升开发者体验,完善Agent连接能力。 结语:Anthropic完善Agent外部连接能力 这是Anthropic近半年来的又一次收购。2025年12月,Anthropic收购JavaScript运行环境及开发工具Bun,用于提升Claude Code的速度和稳定性;今年2月,Anthropic收购计算机使用Agent初创公司Vercept,推进Claude在真实应用中的多步骤操作能力;今年4月,Anthropic又收购生物技术AI初创公司Coefficient Bio,补强医疗和生命科学方向。 本月月初,Anthropic还与云服务提供商Akamai签成18亿美元(约合人民币122亿元)计算服务协议,满足其激增的软件服务需求。此次收购Stainless,则补强了Claude平台的SDK、CLI和MCP服务器等开发者工具能力,进一步完善Agent与外部系统的连接。 这一系列动作显示,Anthropic正在围绕Claude加速补齐从底层算力、开发者工具、Agent执行能力到垂直行业应用的关键环节,其业务版图正从基础模型扩展到AI基础设施等更广泛的领域。
体验完腾讯发布的 Marvis 助手,我发现个人 AI 的尽头是操作系统
1995 年,微软内部搞过一次颇具乌托邦色彩的尝试。 他们觉得当时的 Windows 系统操作太复杂,于是想把电脑桌面直接做成一个普通人看得懂的「房间」。你想打字就点桌上的笔记本,想看时间就点墙上的挂钟,不用思考那些反直觉的操作路径。 这个产品叫 Microsoft Bob,结果上市没多久就光速下架了。原因五花八门,但究其根本,它并没有真正渗透进系统底层,只要用户的需求稍微复杂一点,就只能无能为力了。 三十年后,很多 AI 助手依然没有完全走出这个困境。 最近我体验到了腾讯新的 AI 助手 Marvis 马维斯 ,终于看到了一些不同。 相比于别人都在卷谁是 AI chatbot,Marvis 想干的是直接把整台电脑变成你可以随意使唤的搭档。官方给它的定位也正儿八经,叫「操作系统层级的个人 AI 助手」(官网:marvis.qq.com)。 不过,当我知道它背后是那个做了 14 年应用宝的团队时,就不觉得意外了:这种长期在 PC 和移动端底层生态里打拼的出身,恰恰意味着它不仅懂 AI,更懂设备和系统。 目前,Marvis 已率先覆盖 Windows PC 与 Android 手机端,iOS 和 macOS 版本也在推进中。APPSO 也在评论区准备了一些福利邀请码,手慢无。 六个 Agent,一支随时待命的私人 AI 团队 安装过程不算复杂,但对设备有点要求。Windows 端最低门槛是 8 核 CPU、16GB 内存加上固态硬盘。而且据官方透露,未来还会逐步兼容 6 核。 市面上很多 Agent 产品动辄让用户自己去搭工作流、安插件,Marvis 则是开箱即用,六个 Agent 零配置上手,对普通用户非常友好。刚进界面,里面已经有六个 Agent 在 7×24 小时待命了。 六个 Agent 都有自己的工位。没接到任务的时候,有的在打盹,有的在办公室里闲逛,有的在健身,有的在喝咖啡,还有一个直接去上厕所,一旦你发出指令,任务就会拆解分配给对应的成员。 这是一个分工明确的团队:PM 负责听懂你的需求,拆解任务往下派活;File Agent 处理文件的搜索、阅读和格式转换;Computer Agent 专门对付系统配置、查硬件、调夜间模式;APP Agent 负责在各种软件里代为操作,比如查个机票或者电商比价;Search Agent 负责快速从公开资源中定位答案并给出关键引用;最后是个 Browser Agent,定位是网页交互专家,进行网页交互与数据抓取。 任务链比较长的时候,看看这些动画也是别有一番趣味。 最有意思的是,这些 Agent 可以并行工作。举例而言,我先抛出一个需求:「电脑开机太慢了,帮我看看哪些自启动程序没用,帮我关掉。」 注意看,界面上还会实时显示字符消耗量,其实也就是 Token 消耗量,每天的免费额度是 2000 万 Token,堪堪够用。 结果显示,它给每个程序配了「人话版」说明,建议你哪些是可以按需、保留的第三方软件。重点是,涉及这种核心配置修改的操作,它会主动和你确认一下,才会执行。这种「AI 不会自作主张」的机制,稳得让人心安。 电脑用久了,总会碰到几个反复折磨人的小问题。「查看电池健康状况」「网速感觉变慢了,帮我测一下现在的上传下载和延迟。」「想玩个新游戏,帮我检测一下硬件配置,对比最低要求看看差在哪。」 以前遇到这些事,要么去开始菜单里找设置,要么去网上搜教程。现在,说一句话就行了。 Marvis 深度对接了系统信息和配置入口。它能看到硬件参数,也能直接修改系统设置。它不是帮你打开「控制面板」然后让你自己找,而是直接把事情办了。对于那些不熟悉电脑设置的人来说,这块的体验是最直观的。 举个例子:你想关掉 Windows 锁屏上的广告,你知道它在设置里叫什么吗?叫「关闭 Windows 聚焦」,有多少用户知道这个术语是关广告的? 但 Marvis 能帮你一句话关掉。 本地文件时代,迎来 AI 入口 为了测它的能力,我还翻出了一件困扰已久的事:两个月前从某个群里下载的一张截图,只记得内容是关于《黑神话:悟空》,文件名完全忘了。 我输入:「帮我找一下关于《黑神话:悟空》的图片或截图,大概是一个月前的事儿。」 说实话我没抱太大希望。 但 Marvis 接单后,首先根据 Skill 指引,按文件名关键词和时间范围筛选出 1000 张照片,然后用 Python 快速筛选整个结果文件,并最终找到 8 张候选图。 第一张正是我要找的那张。 而且它的搜索范围极其宽泛:文件名、文档内容、图片里的景、截图里的字,全覆盖。哪怕描述模糊,它也都能捞出来。这个能力,比 Windows 自带的搜索确实强出了一大截。 当然,一听到「扫描图片」,可能会有人担心隐私。首次使用时你可以自己设定扫描范围。如果在生成的图谱里看到不想被索引的内容,右键一键屏蔽即可。而且端侧模型本身自带基础过滤,不是无差别的扫描。 除了找文件,Marvis 还能对本地的文档、表格等多种类型文件做深度理解和分析——支持内容优化、图表生成、文案润色、格式转换,帮原本费时费力的事情变得顺手。 比方说,下载了一批学术论文,摞在那里不知道从哪里读起。直接问 Marvis:「扫一遍这几篇 PDF,告诉我每篇的研究问题、方法和主要结论。」几分钟内,哪几篇值得细读、哪几篇可以先放着,心里就有数了,不用一篇一篇翻摘要。 再比如读完《三体》,笔记记了好几页,马上要在课上分享,手动整理提纲、挑内容、套 PPT 模板,少说也要折腾一两个小时。 但让 Marvis 根据读书笔记,生成一份 PPT,它能读懂笔记里的逻辑和层次,不需要手动复制粘贴再套模板,理解内容之后直接生成。 手机接管电脑,随时随地都能干活 手机遥控操作电脑,则是非常实用的跨端体验。去官网下了 Windows 客户端,再给手机安上 Marvis App,用同一个微信或 QQ 登录,还能直接连通两端。 具体来说,手机 App 连上电脑后,可以在手机上实时看到电脑桌面,并用触屏直接操控。哪怕电脑处于锁屏状态,手机依然可以接管,不需要电脑一直保持解锁状态。 比如我人在外面,突然听到朋友说前阵子新出了一款《洛克王国:世界》游戏,这时我就可以掏出手机输入:帮我在电脑上安装《洛克王国:世界》,回到家就能玩上了。 连接微信 ClawBot,也是没问题的,微信扫码登录后就能开启对话。 但我认为最实用的场景,是给家里长辈远程排查电脑问题。爸妈说「QQ 打不开了」,以前要么电话里盲猜,要么回家处理。现在直接接管他们的桌面,扫一眼就知道问题出在哪。前提是你的手机端 Marvis 马维斯,要能连接爸妈家里的电脑端马维斯,手机端是支持连接多个 PC 设备的。 而如果电脑断网了,手机端会自动切到云 Marvis 模式,支持独立调用云端能力,大部分任务依然能跑。并且这里还有一个独家绝活:在电脑上直接操控手机里的 App。同花顺、飞常准等应用已经在对接合作,这也得益于应用宝团队多年的跨端引擎积累。现在应用宝在移动端、pc 端、车载上都有支持,跨端研发经验充足。 和其他桌面 Agent 一样,Marvis 也支持自定义自动任务。 比如设置一个「深圳厚德品园二手房均价提醒」,填好任务说明——「查询最新二手房均价并通知用户」,再指定执行时间为每周一上午 10 点,之后什么都不用管,到点自动运行任务,并直接推送结果。 另一个值得单独说的功能,是技能(Skill)的自定义扩展。Marvis 支持一键安装专属技能包,提供了不少第三方 Skill,当然,你也可以导入自己常用的 Skill 文件,把它改造成更贴合个人工作流的样子。 有特定行业需求的用户,比如内容创作,理财投资、学术研究等等,不用依赖官方迭代,自己就能把对应的知识库和操作逻辑装进去。 最后,主打出活的 Agent 都绕不开最关键的问题:安全。 Marvis 马维斯提供了两种模式:效率模式和隐私模式。 设置里切到「隐私模式」,Marvis 会加载本地端侧模型,无论是文档还是图片的检索、解析、识别等,全部在本地运行,文件不会出你的电脑,甚至断网了都可以使用。官方所说的「数据不出域」,在拔掉网线的那一刻,有了最真实的体现。 不过,体验「隐私模式」的门槛比较高,要求 16 核以上的处理器、32GB 内存、16GB 显存起步,固态还得匀出 35GB 空闲。 所以平时日常使用切回「效率模式」即可,理解和规划由云端大模型(混元和 DeepSeek V4)完成,执行在本地,速度更快。两种模式按需切换。 让 PC 真正开始「理解」人 我们现在用电脑的方式,本质上还是上世纪八十年代的逻辑:一个需求对应一个软件,你要去找它、打开它、学习它的规则来完成任务。四十年来,软件更多,设置更复杂了,但这套逻辑并未改变,普通用户和电脑之间的距离,也没有真正缩短。 Marvis 的逻辑反过来了:先理解这台电脑里有什么,再决定为你做什么。 拿我爷爷来说,他用了几年电脑,至今不知道「控制面板」在哪。但他知道电脑开机慢,知道想找一张老照片。过去,这个解法是打电话求助子女;现在,就算他不会打字,也可以直接在微信 Clawbot 或者手机马维斯上,把需求说出来,电脑就会帮他做。 文件搜索、系统设置、跨端控制、自动任务、隐私模式、Skill 扩展,看上去是几个不同功能,背后指向的其实是同一个方向:个人 AI 不应该只是一个问答入口,而应该成为设备里的任务调度层。 多说一句,我觉得 Marvis 是有审美的。虚拟办公室动画、任务进度呈现等细节,让它不像冷冰冰的 AI 工具,更像一个有秩序、有分工、也有生活气的小型工作室。 它尤其适合几类人:文件多且乱的本地重度用户;重视数据隔离的财务、法律、医疗从业者;喜欢自定义工作流的效率玩家。和需要靠「养」才能用好的「虾」和「马」,Marvis 初始内置 Agent 和自然语言指令,也足够覆盖多数日常电脑操作,对于很多 AI 焦虑不知道怎么用的人,Marvis 都更加的平权、无门槛、开箱即用。 未来的个人 AI 会像搜索、截图一样,自然地成为操作系统的一部分。三十年前,Microsoft Bob 试图让用户更容易理解电脑;三十年后,Marvis 试图让电脑反过来,真正理解用户。 Marvis 马维斯能走到这一步,和这个有十四年应用商店生态积累和四年跨端跨系统技术积累有关。庞大的用户基数让他们更懂用户在不同设备上需要什么、怎么使用。这种积累很难被纯 AI 公司在短期内平替——他们可以快速训练一个更聪明的模型,却没法快速建立起对 PC 底层和移动生态的控制力。 至此,一个能用自然语言驱动的系统级 AI 助手,在中文生态里终于有了真正可用的样本。 所谓个人 AI 重点从来不只是 AI,更是个人。Marvis 终于让我们看到,当技术选择与每一个具体的需求并肩同行时,它所释放出的力量,既润物无声,又重塑天地。 这是个人 AI 真正开始变得有用的时刻。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。