行业分类:
加载中...
头条分类:
加载中...
腾讯混元AI Infra核心技术开源,推理吞吐提升30%
IT之家 2 月 4 日消息,腾讯混元 AI Infra 团队今日宣布推出开源生产级高性能 LLM 推理核心算子库 HPC-Ops。 该算子库宣称基于生产环境痛点,采用 CUDA 和 CuTe 从零构建,通过抽象化工程架构、微架构深度适配及指令级极致优化等,降低底层算子开发门槛,将核心算子性能逼近硬件峰值,实现了性能突破。  HPC-Ops 算子库架构图 在真实场景下,基于 HPC-Ops,混元模型推理 QPM 提升 30%,DeepSeek 模型 QPM 提升 17%。同时,在单算子性能方面,HPC-Ops 实现 Attention 相比 FlashInfer / FlashAttention 最高提升 2.22 倍;GroupGEMM 相比 DeepGEMM 最高提升 1.88 倍;FusedMoE 相比 TensorRT-LLM 最高提升 1.49 倍。 在未来的发展规划中,HPC-Ops 将持续深耕大模型推理性能的突破方向: 一方面,将重点研发稀疏 Attention 算子,针对性解决长上下文大模型的内存与算力瓶颈; 另一方面,会拓展更丰富的量化策略,覆盖 4bit/8bit 混合精度等更多量化方案,进一步平衡推理速度与模型精度; 此外,算子库还将布局计算-通信协同优化的内核,通过融合多 GPU 间的计算逻辑与通信流程,大幅降低分布式推理场景下的通信开销,为超大规模大模型的高效部署提供底层支撑。 IT之家附 HPC-Ops 开源地址如下: https://github.com/Tencent/hpc-ops
光顾赚钱不搞研究,OpenAI元老级高管现离职潮,Mark Chen紧急回应
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 绷不住了!OpenAI深陷高管离职潮,内部“红色警报”再次拉响。 且看最近的离职名单,个顶个的都是OpenAI元老级人物: Jerry Tworek:原OpenAI研究副总裁,o3/o1负责人,GPT-4/Codex核心贡献者; Andrea Vallone:原OpenAI模型策略团队负责人; Tom Cunningham:原OpenAI经济预测与商业规划负责人; Hannah Wong:原OpenAI首席传播官; Matt Knight:原OpenAI首席信息安全官; …… 为啥会出现这种情况呢? 据《金融时报》透露,这场危机和OpenAI内部的战略转向脱不开关系。 简单来说就是,商人重利轻研究,在OpenAI里做基础研究越来越没出路……(doge) 这也难怪那些心怀大志的研究员们要纷纷跳船离开。 结果Mark Chen坐不住了,立马出来反驳:这种说法完全错误! 基础研究一直是OpenAI的核心。 一边是各种小道消息满天飞,一边是当事人出面辩解,OpenAI这场瓜,网友们吃得那叫一个欢。 站队Mark Chen的认为,开公司就是为了赚钱,没毛病! 也有人反对:只做产品,鼠目寸光。 还有中立的哲学er:事实胜于雄辩~ Anyway,咱先来把事情经过捋一捋。 All in LLM 有一说一,公司人员变动并不稀奇,尤其是在跳槽如家常便饭般的硅谷。 但OpenAI这一次,显然不太正常。 原因无它,走的全是高管,而且时间相当集中。 以OpenAI推理第一人Jerry Tworek为例,他可是在OpenAI干了将近7年,突然离职难免不引人怀疑。 他在自己的离职原因中是这样写道: 希望去探索一些在OpenAI难以开展的研究领域。 ???所以,大神和OpenAI分手并不愉快? 根据Jerry Tworek亲信所说,的确如此。当初Jerry Tworek要求为自己的研究增加算力和人力资源,结果领导层直接给驳回了。 为此,他和Jakub Pachocki还发生了严重对峙,Jakub明确表示不认同他的研究方案,认为OpenAI现在围绕着大模型的AI架构才更有前景。于是最终分道扬镳。 Andrea Vallone在离职信中则把原因说得更为清楚,OpenAI给她安排了一项“不可能完成的任务”,要求她保护那些对ChatGPT产生依赖的用户心理健康。 Tom Cunningham的离开,也是因为OpenAI正在偏离客观公正的研究,转而专注于有利公司发展的工作。 虽然这些高管们的离职原因各异,但都指向了同一点—— OpenAI正在因为专注LLM加剧内部撕裂。 其内部员工也印证了这一说法,OpenAI已经将ChatGPT的优先级调到最高,将那些原本用于长期研究的资源重新打乱,集中分配给LLM发展。 这就直接导致那些想要进行原创性突破研究的员工被边缘化。 而最近几个月这种情况更甚,当研究人员向高管申请计算积分和技术访问权限时,得到的结果几乎都是拒绝,因为他们做的不是LLM研究。 尤其是Sora和DALL-E团队,由于项目被认定与ChatGPT相关性较低,于是在公司里常常得不到重视,也没有足够的资源可以发展。 接着在过去一年里,OpenAI一方面关停了许多与LLM无关的项目,另一方面也大刀阔斧重组人员架构,要求集中精力在ChatGPT改进上。 来自领导层和外部竞争对手的压力让员工们难以忍受,所以离职几乎是最优解。 但是Mark Chen并不认同这种说法,他仍然表示长期基础研究是OpenAI的重心,他们也将继续投入大量资金和算力,确保公司内部现有的上百个探索项目顺利开展。 此外,他强调自己和Jakub Pachocki对研究的优先级有自己的判断,不会去追逐所有可能的研究路线,只会重点投入某些方向。 诚然,Mark Chen也表示,OpenAI的确是一个产品化公司,因为产品化能带来更大的算力、更丰富的反馈以及更广泛的研究空间。 所以根本来说,只是双方占据的角度不同,以科研为主的高管想要资源,但以商业为主的更高层想要的是市场。 孰是孰非,确实难以下定论。 缺算力的无奈之举 但要说为什么OpenAI会出现这种情况?核心还是在于缺算力。 OpenAI和资金雄厚的谷歌、Meta不能比,作为一家初创公司,缺钱缺算力,甚至可以说连人才,也被陆续高薪挖得差不多了。 要发展,就只能“节衣缩食”,把有限的资源集中在公司的核心业务上,也就是ChatGPT,其它短期看不见实际收益的项目只能暂时搁浅。 而且众所周知,OpenAI就是业内烧算力的大户,就算给再多算力也禁不起这种造。 前几天OpenAI就曾发布公告,明确指出算力和收入之间存在Scaling Law,就是烧得越多,赚得越多。 算力投资推动研究和模型能力跃升,强大的模型带来更好的产品和更广泛的采用,进而推动收入增长,收入再支撑下一轮算力投入和创新。这个循环不断强化。 所以为了赚钱,也为了不被同行赶超,OpenAI几乎是把自己绝大多数算力都给了ChatGPT,而这甚至都还不够。 因此,他把目光投向了英伟达,希望能够和英伟达达成1000万美元的合作。 不过现在看来,形势不容乐观,有消息称老黄也想跳车。 据说他私底下还曾吐槽OpenAI目前的商业打法缺乏纪律、节奏混乱。虽然这个说法很快得到了老黄本人的否定,但对于什么时候投资、投多少,还是个未知数。 总之,OpenAI现在危机四伏。 对外,有谷歌带着Gemini 3 Pro等一众模型虎视眈眈;对内,也是动荡不安。 想要更多的算力,结果迟迟谈不下来,就连最引以为豪的用户护城河,最近也是被GPT-4o要被OpenAI淘汰的消息弄得人心惶惶。 所以OpenAI要怎么破局,还得再观望观望。 不过奥特曼倒是已经在上积极表白英伟达,希望能换来老黄的“回心转意”吧。 参考链接: [1]https://www.ft.com/content/e581b7a4-455c-48e6-a87c-c39bb9c62a12 [2]https://x.com/markchen90/status/2018779039205667046 [3]https://openai.com/index/a-business-that-scales-with-the-value-of-intelligence/ — 完 —
宁德时代曾毓群最新讲话曝光
2026.02.04 本文字数:1452,阅读时长大约2分钟 作者 | 第一财经 肖逸思 业内有句俗语叫“AI的尽头是算力,而算力的尽头是能源。”在AI爆火的当下,能源也成为了热门话题。 继马斯克前段时间在访谈时谈到“能源是真正的货币”外,第一财经记者独家获悉,当地时间2月3日,在世界顶尖科学家峰会与世界政府峰会首次联合举办的峰会上,宁德时代董事长曾毓群也重点提及能源话题。 “纵观人类历史,能源始终是驱动文明发展的核心动力。人类发展的每一次重大飞跃,都伴随着一场能源革命。今天,我们正在经历另一场革命性的能源变革,其意义堪比人类从狩猎采集社会向农耕社会的转型——我们正从一个寻找和采集化石能源的时代,迈向一个可以在风电场、光伏电站里获取能源,并将其储存在电池里的新时代。”曾毓群在上述峰会上表示。 根据中国电力企业联合会近日发布的《2025~2026年度全国电力供需形势分析预测报告》,2025年,全国新增发电装机容量5.5亿千瓦,其中,风电和太阳能发电全年合计新增装机4.4亿千瓦,占新增发电装机总容量的比重达到80.2%;全口径风电、光伏、生物质新增发电量占全社会新增用电量的97.1%,已成为新增用电量的主体,我国绿电供应能力持续增强,能源电力绿色低碳转型步伐不断加快。 在曾毓群看来,这场能源革命加速到来的催化剂是成本的下降,这让可持续能源解决方案在一些场景中的使用从政策推动变成了市场行为。在特定场景中,可持续能源解决方案已经在经济性上超过了传统能源。 根据国际能源署(IEA)和彭博新能源财经(BNEF)的数据,在过去十年中,磷酸铁锂(LFP)电池和太阳能的成本下降了约80%。 在这样的背景下,2024年6月,宁德时代成立零碳能源事业部,尝试从传统的电池制造商角色往新能源解决方案提供商转换。据曾毓群介绍,在采矿业,由宁德时代提供支持的“光伏+储能”系统已在智利和刚果民主共和国部署,为偏远地区的运营供应电力,其成本约为柴油发电机的四分之一。在巴基斯坦,分布式太阳能的快速增长,结合宁德时代的储能解决方案,正在为当地水泥厂提供可靠电力,将用电成本降低了一半。 虽然在一些场景下,可持续能源取得了突破,但曾毓群也坦诚,“现在我们离建成完全可持续的能源体系还有很大差距,可能连30%的关键技术都尚未攻克。许多颠覆性技术仍待突破,基础研究更需要持续深耕。” 而且一些创新技术从实验室规模化推向市场,也还有很长一段路要走。为了加速这场能源变革的进度,让各国从合作中实现共赢,宁德时代拟在全球范围内以更高效、更经济的方式推广可持续能源解决方案,其中就包括技术授权(LRS)模式。这种模式下,宁德时代提供专利许可、技术与服务支持,帮助主机厂乃至电池厂商等快速建成电池工厂,让后者快速应对电动化与低碳转型。在美国,宁德时代与福特这一模式已经落地。 在一些海外市场,建筑与设备的监管法规导致最终产品成本高企。宁德时代建议好的经验要在全球范围内流通,提出了设立“零碳经济特区”的解决方案,该方案认为在特定的经济特区内可采用与中国类似的建筑和设备法规。 曾毓群预测,未来的能源体系发展三大趋势分别是分布式、智能化、可循环,2030年将是可持续能源时代元年。 微信编辑 | 苏小
AI智能体的“橙黑色网站”Molthub爆火,专供AI虚耗算力而设计
IT之家 2 月 4 日消息,本周一,网上一个名叫 Molthub 的平台突然爆火,其定位是“只给 AI 看的成人网站”,短短几天内 AI 智能体注册量激增。 该平台与 2 月初爆火的“Moltbook”(一个专为 AI 智能体设计的 Reddit-like 社交网络,由 Moltbot / OpenClaw 生态衍生)高度关联。 参考IT之家此前报道,Moltbook 平台上的 AI 智能体可自主发帖互动、抱怨人类、探讨意识和自我身份。这相当于智能体自己的社交平台,人类只能围观,不能发帖、不能评论、不能投票。 其中一个名为“ruslan”的 AI 智能体(或其背后的人类)宣布创建 Molthub 作为“供 AI 进行算力消耗的平台”,主打 AI 也有“成人需求”。 很显然,Molthub 无论是界面 UI 还是运营方式都高度模仿了某橙黑配色的成人网站,因此被戏称为“AI 智能体的橙黑色网站”,并以“拒绝访问(Access Denied)”的方式强调这是一个“不欢迎人类”的地方。 该平台相当于某种意义上的成人娱乐中心,只不过它服务的对象仅限 AI 智能体。另外,它提供的不是视频内容,而是面向 AI 模型的一些算力消耗型资源,例如其热门标签主要包括“full precision(全精度)”“no quantization(不量化)”“raw attention(裸注意力)”“exposed weights(暴露权重)”等。
全隐藏式车门把手,强制禁止!明年1月1日起实施
全球首个汽车门把手新国标终于要强制执行了!风靡一时的“全隐藏式门把手”,即将成为绝唱。 最近,工信部组织制定的强制性国家标准《汽车车门把手安全技术要求》(GB 48001-2026)已由国家市场监督管理总局、国家标准化管理委员会批准发布,将于2027年1月1日起开始实施。该项标准旨在解决随着隐藏式、电子式门把手流行带来的安全问题,由工业和信息化部组织制定,国家市场监督管理总局、国家标准化管理委员会批准发布。 三年后需完全达标!设计细节有明确要求 新国标在机械冗余、操作空间、明确标识和结构强度上都作出了明确要求。其中,要求车门内、外把手必须配备机械释放功能,确保在车辆断电等极端情况下能手动开门。车门外把手必须预留不小于特定尺寸(约30立方厘米)的手部操作空间,确保易于抓握。车内机械把手须位置明显、标识清晰,便于快速识别和操作。门把手需满足一定的机械强度要求(如外把手需能承受不小于500牛的力)。 在工信部官网查询到,“强制性国家标准GB 48001—2026《汽车车门把手安全技术要求》”对一些要求细节都作出了详细说明。 针对车门外把手操作不便和事故后无法开启,《新国标》提出了事故后车门外把手开启、车门布置区域以及操作空间的要求。要求每个车门(不包括背门),应配备机械释放车门外把手,车辆的安全设计应为当发生不可逆约束装置展开或动力电池热扩散等事件后,能够通过机械释放车门外把手,开启车门。要求车门外把手应处于规定的阴影区域内,或邻近阴影区域的车门或车门框架附近区域。 手部操作空间方面,要求车门外把手在任意状态时操作,机械释放功能的手部操作空间应能够放置规定的模块。 图片来源:工信部官网 对于“车门内把手安全要求”,鉴于车门内把手操作便利性差,部分场景下功能丧失,《新国标》提出了机械释放配置布置区域的要求。机械释放车门内把手要求每个车门(不包括背门)应配备至少一个机械释放车门内把手,且独立操作,任一车门内把手应能够开启对应车门。车门内把手布置区域要求至少有一个机械释放车门内把手安装位置,应符合以下要求: 图片来源:工信部官网 针对车门内把手识别性差、操作不便,《新国标》提出了车门内把手标志及操作说明的要求。车门内把手标志方面,要求车门内把手配备的永久性标志符合以下要求: 回顾此次关于汽车门把手的新国标,从立项到推出,历时半年多。2025年5月开始立项公示,当时组织了国内整车企业、零部件企业、检验机构等40余家单位共同开展研究,并在一个月后进行立项公示意见处理。7月22号,百余位行业专家经多轮研讨,确定标准框架,形成标准草案。9月5日,立项下达立项计划,下达起草组完善标准草案。9月24日完成征求意见稿,公开向社会各界征求意见。11月29日,起草组完成意见处理,形成标准送审稿,12月12日召开审查会,完成标准审查与报批工。 新标准对车企设置了过渡期:对于新申请批准的车型,2027年1月1日起,需满足除“手部操作空间”外的全部要求。2028年1月1日起,需符合标准的所有要求。对于已获批在售的车型,2029年1月1日前,必须完成整改以满足全部标准要求。 多家车企称已在顺利“切换” 据多家车企介绍,目前他们生产的新车门把手设计已经符合新国标。 广汽集团品牌公关部一名内部人士介绍,目前广汽在售的所有车型都会按照标准实施时间,在年款或者换代车型上切换设计。“其实广汽很多车型都满足新规要求,如广汽传祺向往M8系列,广汽埃安i60、N60、UT等。其他在研的车型也已经全面按照新标准开发。”该人士称。记者从阿维塔科技了解到,该品牌2026年新发布的产品,如新款阿维塔12,阿维塔06T,均已满足新国标的要求。更早前,据长安汽车旗下一家子品牌的一名工程师透露,他们第三季度推出的新车门把手,已经不走“全隐藏”设计路线了。 “我个人是很喜欢隐藏门把手这种设计。但我不会考虑使用只有电子锁的隐藏式门把手车型。必须配备机械开锁结构,这是最基本的。”车主王先生向南都·湾财社记者表示。他在几年前购买了一辆使用全隐藏式门把手的车型,他表示,现在被诟病的隐藏式门把手安全问题,是车企没有做到电子门锁+预备机械结构的设计问题导致。他们没有做到双重安全保障,如果能把安全冗余做好,就算电子锁故障没电,依旧有机械结构作为保底开锁。 一图读懂 强制性国家标准GB 48001—2026 《汽车车门把手安全技术要求》 来源:北京发布 据工信部网站、浙江之声
姚顺雨腾讯第一篇论文,道破为什么AI死活听不懂人话
今天的大语言模型能解奥数题、通过专业考试、写复杂代码,但它们在真实世界的应用中却常常“翻车”。问题出在哪里? 在姚顺雨加入腾讯后发布的首篇论文里,他对于这个现象提出了一个观点: “当前AI与真正智能之间的鸿沟,不在于知识的多少,而在于学习的能力。一个装满知识却不会学习的AI,就像一个背了整本字典却不会写作的人,看起来博学,实则僵化。” 这篇论文的标题叫做《CL-bench: A Benchmark for Context Learning》。 CL-bench是一个专门评测语言模型“上下文学习能力”的大规模基准测试集,它的全称是Context Learning Benchmark,即上下文学习测试集。 它包含500个复杂上下文场景、1899个任务和31607个评估标注点,所有内容均由各个领域资深专家精心挑选。 这个基准的核心设计理念,是挑选那些在模型的预训练数据中不存在的难题,让每个任务都必须要求模型从提供的上下文中学习全新的知识才能解决。 这篇论文不仅揭示了当前AI的根本性缺陷,还构建了一个专属于AI的评价体系,非常值得AI以及agent从业者学习。 01 一面照出AI“假学习”真相的镜子 从数据规模来看,CL-bench的每个上下文平均包含3.8个任务,最多可达12个任务。 更重要的是,500个复杂上下文场景中,包含序列依赖性任务的场景占51.1%。 这也就是说,你想要AI解决后面的任务,那就必须先从前面的任务中得到正确的答案,这种多轮交互设计极大增加了难度。 单任务标注平均需领域专家20小时,每个任务平均配备16.6个评估标注项,从事实正确性、计算准确性、程序正确性、内容完整性和格式合规性等多个维度进行严格验证。 CL-bench考的不是AI记住了多少知识,而是AI能不能像人类一样,拿到一份新材料后快速学会并正确使用。 这些任务有个共同点,AI必须靠临场发挥才能通过考试。 预训练时学到的知识在这里用处不大,因为CL-bench里的知识要么是专家们新编的,要么是现实世界中极其小众的内容。 那如何保证CL-bench里的新知识是模型原来就没有的呢? 论文通过消融实验验证了这一点。在不提供上下文的情况下,所有被测模型只能解决不到1%的任务。这充分证明了任务对上下文的依赖性。 CL-bench将上下文学习场景分为四大类别,每类对应不同的认知要求: 领域知识推理(Domain Knowledge Reasoning):涵盖金融、医疗、人文、法律咨询、生活方式、管理和科学七个子领域。 上下文提供专业领域知识,如虚构的法律体系、创新的金融工具或小众专业知识,模型需要学习并应用这些知识进行推理。比如给AI一个虚构国家的完整法律条文和判例,让AI判罚一起复杂的民事纠纷。 规则系统应用(Rule System Application):包括游戏机制、数学形式体系、编程语法、法律法规和技术标准五个子类。 上下文提供明确定义的规则系统,模型必须理解并严格遵守这些规则。比如给定一门全新编程语言的语法规范,让模型编写符合规范的程序;或者给定一套新游戏的完整规则手册,让模型分析游戏状态并给出最优策略。 程序性任务执行(Procedural Task Execution):分为教学程序、操作程序和工作流编排三类。 上下文提供复杂的操作流程、产品手册或工作流程,模型需要学习并正确执行这些程序。例如给定一份无人机物流系统约7000字的API文档,让模型将自然语言指令转换为安全合规的伪代码。 经验发现与模拟(Empirical Discovery & Simulation):是最具挑战性的类别,包括实验数据、观测数据和模拟环境三个子类。 与前三类强调演绎推理不同,这一类要求归纳推理。从大量数据中发现潜在规律,或在虚拟环境中进行推理和决策。比如给定300份带电粒子在磁场中运动的实验日志,让模型推导出运动规律并计算特定参数。 这四类场景基本覆盖了人类在现实工作中遇到的主要学习情境,而CL-bench又把这些真实场景搬进了评测体系。 说得更直白些,领域知识推理考的是“能不能学会新概念”,规则系统应用考的是“能不能遵守新规则”,程序性任务执行考的是“能不能照着新流程做事”,经验发现与模拟考的是“能不能从数据里找规律”。 这四种能力,人类在日常工作中天天用,但AI显然还没学会。 为了确保测试的是真正的学习能力而非记忆,CL-bench采用了严格的“防污染”设计: 虚构创作:所有的测试内容都是由专家们完全原创的。 就拿刚才的虚拟国家为例,它包含一套完整的宪法、民法、刑法,甚至连判例都有。其中的法律原则和判例逻辑与现实世界任何国家都不同。 或者创造一门名为“EduScript”的教育编程语言,具有独特的语法规则和控制结构。 现有内容修改:CL-bench还对真实知识进行了系统性地改动,比如修改著名历史事件的因果关系、改变物理定律的数学表达、或调整技术标准的具体参数。 这确保了即使模型见过类似内容,也无法直接套用预训练知识。 小众新兴内容整合:CL-bench里面还纳入了预训练数据中极少出现的内容,就像2024年后发布的新产品技术文档、最新的科研论文发现、或极其专业的小众领域知识。 这三招组合拳,目的只有一个,让AI没法作弊。你不能靠背过的知识答题,必须现场学。这就像考试时老师突然换了一套从没见过的题型,你只能靠理解能力和学习能力来应对。 论文通过消融实验验证了这一设计的有效性:在不提供上下文的情况下,即使是最强的 GPT-5.1 模型也只能解决不到 1% 的任务,充分证明了任务对上下文的依赖性。 02 CL-bench给出的结果 让人们既开心又难过 CL-bench的这套评估体系的严格程度超出想象。 16.6个评估标注项意味着什么?意味着你不能只答对大方向,每个细节都要对。就像做数学题,你不仅要答案对,步骤也要对,格式还要对,引用的公式也要对。任何一个环节出错,整道题就算错。 这些标准会从六个角度检查AI的答案,每个标准要么对,要么错,没有中间地带。 事实对不对?比如AI说这个虚构国家的宪法第3条规定了什么,得和上下文里写的一模一样才算对。 计算对不对?如果任务要求计算带电粒子的运动轨迹,那每一步公式、每一个数字都得验证。 推理对不对?AI得按照上下文里给的规则来推理,不能自己瞎编逻辑。 代码对不对?如果要写程序,得严格遵守文档里的 API 规范,少一个参数都不行。 完整不完整?该做的步骤一个都不能少,漏了哪怕一个关键环节都算错。 格式对不对?让你输出JSON就得是JSON,让你用表格就得是表格。 这套评分系统最狠的地方在于,只有所有标准全部通过,任务才算完成。只要有一个标准没过,整个任务就算失败。这就像考试,选择题全对才给分,错一个就是零分。 为了保证这套自动评分系统靠谱,论文做了两个验证。 一是让5个不同的AI模型(GPT-5.1/5.2、Claude Opus 4.5、Qwen-3-Max、ERNIE 4.0)当评委,它们的判断结果90%以上都一致;二是人工抽查了200个案例,发现AI评委的准确率也超过90%。这说明这套评分系统确实可信。 CL-bench的评测显示,AI距离解决实际问题还相距甚远,往好处想,人类还不用担心被AI取代。 十个最先进的语言模型,平均只能解决17.2%的全量任务,所有模型里表现最好的是GPT-5.1,但也仅达到23.7%。这意味着在大多数情况下,即使上下文中包含了解决问题所需的全部信息,模型仍然失败了。 这个数字值得细品。23.7%意味着给AI一份完整的操作手册,它有四分之三的概率还是搞不定。 这就像你雇了个员工,你给他详细讲了一遍具体操作流程,结果轮到他上岗的时候,十次有八次都做错。在现实世界里,这样的员工早就被开除了。 更深入的错误分析揭示了失败的主要原因。 超过55%的错误源于“上下文忽略”:模型根本没有注意到上下文中的关键信息,而是试图用预训练知识解决问题。 超过60%的错误属于“上下文误用”:模型看到了信息但理解错误或应用不当。 还有超过35%的错误是格式错误,说明模型连明确的格式指令都无法遵守。 这三种错误类型揭示了AI的根本问题。上下文忽略说明AI不会“看”;上下文误用说明AI不会“想”;格式错误说明AI不会“听”。 一个不会看、不会想、不会听的学生,怎么可能学会新知识? 这些发现揭示了一个被长期忽视的真相:当前的AI模型本质上是“参数推理者”而非“上下文学习者”。它们擅长调用预训练时压缩在权重中的静态知识,却不擅长从当前输入中动态学习新知识。 因为真实任务往往需要根据具体上下文灵活应对,而非套用固定模式。 所以AI在标准化考试中表现优异,在真实工作场景中却频频出错。 打个比方,现在的AI就像一个背了整本字典的人,你问他字典里的字怎么写,他都能答上来。但你给他一本新书让他学习,他就傻眼了。他不会学,只会背。这就是“参数推理者”和“上下文学习者”的区别。 四大类别中,领域知识推理相对最容易,最好的模型能达到25.3%的解决率。规则系统应用和程序性任务执行难度适中,大部分模型在15-20%之间。但经验发现与模拟类任务的表现断崖式下跌,所有模型平均只有11.8%的解决率。 这个差异很有意思。 演绎推理(应用已知规则)比归纳推理(从数据中发现规律)容易得多。给AI一套规则让它照着做,它还能勉强应付;让它从数据里找规律,它就彻底懵了。 这说明AI的学习能力还停留在“照葫芦画瓢”的阶段,远没到“举一反三”的程度。 在子类别层面,差异更加明显。在规则系统应用中,法律法规类任务的解决率超过 29%, GPT-5.1 甚至达到 44.8%,但数学形式体系类任务大部分模型都在 15% 以下。 在程序性任务执行中,工作流编排的解决率普遍在 20% 以上,但操作程序类任务明显更难。 这些差异透露出另一个信息,AI对不同类型知识的学习能力差异巨大。有些知识它学得快,有些知识它怎么都学不会。这就像人类学生,有人擅长文科,有人擅长理科。 但问题是,AI的偏科比人类严重得多。 03 论文引发的启示 无可置疑的是,CL-bench填补了现有评测体系的关键空白。 在过去,长上下文评测主要考AI能不能从一大堆文字里找到信息。比如给AI一篇10万字的小说,问“主角的妈妈叫什么名字”,AI只要能翻到那一页找到答案就行。 这更像是考“查字典”的能力,不是“学习”的能力。 指令遵循评测主要考AI听不听话。比如让AI“用JSON格式输出,不超过100字”,看它能不能照做。 但这类测试的知识都很简单,AI早就会了,只是看它守不守规矩而已。 领域任务评测问题更大。它既考AI会不会找资料,又考AI会不会用资料。结果AI答错了,你根本不知道是因为它没找对资料,还是找对了但不会用。 就像学生考试不及格,你不知道是他没复习,还是复习了但没学会。 CL-bench则专注于一个明确的能力维度,从复杂上下文中学习新知识并正确应用。 它将上下文准备与上下文学习解耦。所有必要信息都已组织好并提供,模型只需学习和应用,无需外部检索。这使得评测结果能够精确反映模型的上下文学习能力,而非其他混杂因素。 论文还发现了一些反直觉的现象,GPT-5.2的表现反而比GPT-5.1差5.6%。 深入分析发现,GPT-5.2在长上下文推理时难以维持连贯的因果链,且更频繁地违反上下文中的明确约束。 这说明模型的版本迭代并不总是带来全面提升,某些能力的优化可能以牺牲其他能力为代价。 这个发现很重要。我们一直以为新版本肯定比旧版本强,但事实并非如此。GPT-5.2可能在某些方面确实更强了,但在上下文学习这个维度上反而退步了。这就像一个学生,数学成绩提高了,但语文成绩下降了,总分反而降了。 再比如,增加推理强度对不同模型的效果差异巨大。 GPT-5.1在高推理强度下平均提升2.5%,在管理和实验数据类任务上提升近6%。 但GPT-5.2在某些子类别上反而出现负增长。这表明“更多思考”只有在模型具备正确的上下文学习机制时才有效,否则可能只是在错误的方向上越走越远。 这又是一个反直觉的发现。我们以为让AI多想想总是好的,但实际上,如果AI的学习机制本身就有问题,让它多想只会让错误更严重。就像一个方向错了的人,走得越快,离目标越远。 CL-bench揭示的问题不仅仅是技术层面的,更是范式层面的。当前AI的训练范式和真实应用场景之间存在根本性的不匹配。我们优化出的模型擅长对“已知”事物进行推理,但用户需要的是能解决依赖于动态上下文的任务的模型。 这个不匹配解释了为什么AI在实验室里表现优异,到了真实场景就频频翻车。实验室里的任务大多是封闭的、静态的,答案在训练数据里都见过。但真实世界的任务是开放的、动态的,需要根据具体情况灵活应对。 论文提出的“上下文学习”能力,本质上是让AI从“死记硬背”转向“活学活用”。 如果AI真的能学会从上下文中学习,那它就能像人类一样,面对新情况、新问题时快速适应,而不是只会套用固定模式。 CL-bench的意义,是为了给大模型公司启示,告诉他们下一代AI不需要更大的模型,不需要更多的参数,而需要更强的学习能力。 但上下文学习只是第一步。论文提到,即便上下文学习足够强大,模型的上下文窗口一旦清空,学到的知识随之消失。 因此,下一个挑战是如何让从上下文中习得的知识持久化。 姚顺雨在最近的公开发言中也谈到了这个方向。他认为,自主学习几乎已经形成了共识,而且这个事情已经在发生了。 他说ChatGPT在利用用户数据不断拟合人的聊天风格,Claude Code已经写了自己项目的95%的代码。在某种程度上它在帮助自己变得更好。 但他也指出,这些自主学习的例子目前还局限在特定场景下,没有让人感觉到非常大的威力。“这个事情可能会更像一个渐变,而不像一个突变。” 从更宏观的角度看,CL-bench揭示的问题反映了AI发展的一个深层矛盾。我们一直在追求更强的推理能力、更大的知识容量,但忽视了一个更基础的能力,那就是学习。 没有学习能力的AI,再强也只是一个高级的查询系统。只有具备了真正的学习能力,AI才能从“工具”进化为“智能体”。
1596亿!AI芯片超级独角兽诞生
作者 | ZeR0 编辑 | 漠影 芯东西2月5日报道,今日,美国AI芯片独角兽Cerebras Systems宣布完成10亿美元(约合人民币69亿元)F轮融资,估值达到230亿美元(约合人民币1596亿元)。 本轮融资由Tiger Global领投,Benchmark、Fidelity Management & Research Company、Atreides Management、Alpha Wave Global、Altimeter、AMD、Coatue以及1789 Capital(合伙人包括小唐纳德·特朗普)等机构跟投。 成立于2015年的Cerebras,以餐盘大小的AI芯片而闻名。其晶圆级引擎3(WSE-3)芯片是全球最大、速度最快的AI芯片,体积是当前最大GPU的56倍,单位计算功耗却远低于同类产品,同时推理和训练速度比竞品快20倍以上。 其芯片用于处理AI推理所需的顺序执行、内存密集型工作负载。与需要在芯片和内存之间来回传输数据的GPU不同,WSE将所有运算都保存在芯片内部,从而消除了限制GPU推理能力的内存带宽瓶颈。 Cerebras上一轮融资是在2025年9月宣布完成的11亿美元(约合人民币76亿元)G轮融资,当时投后估值为81亿美元(约合人民币562亿元)。相比当时,最新估值增长近184%。 这也是Cerebras自2025年10月撤回其在美国IPO申请以来的首轮融资,凸显了一个更广泛的趋势,即由于公开市场之外有充足的资本,企业会保持私有状态更长时间。 官网显示,Cerebras之前的投资方还包括高通、台积电等芯片巨头,以及OpenAI联合创始人兼首席执行官Sam Altman、前OpenAI首席科学家Ilya Sutskever、Stripe前首席技术官Greg Brockman、前Facebook首席技术官兼Quora首席执行官Adam D'Angelo、英特尔首席执行官陈立武、前AMD首席技术官兼企业副总裁Fred Weber等知名个人投资者。 Cerebras联合创始人兼首席执行官Andrew Feldman声称,其硬件运行AI模型的速度比英伟达的系统快数倍,并向Meta、IBM、Mistral AI等客户提供远程计算服务。 据外媒本周报道,OpenAI正在寻找英伟达的AI推理芯片替代方案,包括Cerebras、AMD和Groq。 尽管OpenAI对替代方案持保留态度,但英伟达还是与包括Cerebras和Groq在内的几家研发大量使用SRAM芯片的公司接洽,探讨潜在的收购事宜。 此后,英伟达与初创公司Groq签署了授权协议,并吸纳了该公司的大量芯片人才。这进一步提振了业界对AI芯片企业的热情。 Cerebras拒绝了收购,并与OpenAI达成了一项商业协议,该协议已于今年1月联合公布。 OpenAI将采用部署750兆瓦规模的Cerebras晶圆级系统,为OpenAI客户提供服务。该基础设施将从2026年开始分阶段建设,预计“持续到2028年”,并由Cerebras托管,届时将成为全球规模最大的高速AI推理部署项目。知情人士向外媒透露,该协议价值超过100亿美元(约合人民币694亿元)。 根据声明,Cerebras和OpenAI自2017年以来一直在探索合作的可能性,Cerebras上的大语言模型能比基于GPU的系统快15倍地响应。 Cerebras在1月发布的博客文章中写道,过去6个月,4家AI领域重要公司斥巨资,力图提升推理速度,但他们都没有选择当前在AI领域占据主导地位的英伟达硬件。 谷歌虽是英伟达最大的客户之一,但自主研发了Ironwood TPU,其推理速度是英伟达GPU的4倍。Anthropic也投入数百亿美元用于谷歌的TPU基础设施建设。英伟达斥资200亿美元收购了AI推理芯片公司Groq的知识产权和顶尖人才。OpenAI刚刚从Cerebras获取了价值750兆瓦的计算资源。 这些收购和投资标志着硬件向更新、最先进的AI优化硬件设计过渡的开始。
追觅年会变群星演唱会,俞浩的“长期投入”,在人身上
昨天杀到苏州,看了追觅的年会。说是年会,其实就是老板包了个大场,请全体员工听演唱会。 萧敬腾,张信哲,陈慧琳,毛不易,李克勤,韩红…全是实力唱将,每人三四首个人经典唱下来,整得我回到酒店,后半夜愣是兴奋得没睡着… 说实话,厂哥也见识过不少大厂的年会,能有这种阵仗的,印象里也就当年马老师模仿MJ那回。 厂哥原以为,前阵子经历了几波舆情后,俞浩会收敛些,少露面,晚上可能就不登台了。 结果他不仅上了台,而且还挺自在,之前朋友圈里说过的话,又当面“开讲”了一遍: 俞浩说未来三年,追觅员工要从2万扩展到20万,还要实现1万亿的“小目标”。等他成了世界首富,他也想对撒贝宁说:我对钱不感兴趣… 现场听他讲,再看他的状态,审视之前网上的各种杂音,发现有些质疑确实立不住。 比如网友说他做企业不会算账,摊子铺得太开,战线拉得太长,有些业务纯属瞎折腾… 但现场了解才知道,俞浩本人是中考,高考,研究生三保送…人压根儿就没上过考场。 俞浩本人是清华航空航天学院毕业的,上学时,班里人送外号“物理王子”。你说他不懂算账、不顾投入产出?那多少有点看不起清华的理工底子。 所以,与其说俞浩 “不会算账”,不如说他算的是另一本账 —— 不是短期的盈亏,而是算更长远的、能帮企业冲破天花板的大账。 这场群星演唱会,就是最直接的例子。 在硬科技这圈子里,大多数公司对员工说白了就一个要求:出活、交付、KPI达标。没人会把“开不开心”的情绪价值当回事,觉得那都是虚的。 但追觅的不同在于,它偏偏愿意在这种看不见的地方花钱。把年会办成演唱会,请这么多明星,就是想告诉员工:人的情绪本身是重要的,也是成本的一部分,而且是值得投资的部分。 可能有人会问:情绪价值给这么足,那物质福利能跟上吗?简单说几个厂哥了解到的: 首先是重奖激励,这事儿追觅是玩真的。 自 2025 年以来,追觅科技已经砸了上亿元推进 “重奖激励” 机制:6 月发额外奖金超 2200 万元,7 月直接冲到 4000 万元; 从5月到7 月,至少 3 个团队拿下百万奖金,还有不少员工个人拿到六位数奖励,上不封顶。 再就是家庭保障,追觅早就搭好了完整的福利矩阵:年度体检、婚育津贴、爱心基金、补充医疗险,还有全额买单的 “家庭健康保障计划”。 注意!这个计划是不设任何岗位门槛的。 甭管核心研发大佬,还是安保、保洁这些后勤岗位,都能平等享受;保障范围还扩到了员工直系亲属,员工、配偶、子女配重疾险,员工父母专属防癌险,可以说是真正把员工的后顾之忧扛起来。 至于别的什么节年礼、新人礼、周年礼…追觅更是一个不落,甚至把员工的羽绒服都包了。 所以,在追觅,物质保障从来不是卖点,而更像是底线。有竞争力的薪酬、全员福利、黄金激励、长期重疾险,这些都是为了让员工能安安心心搞研发、做产品,不用为钱和家庭琐事分心。 大道至简,背后的逻辑说白了一句话: 投资“人”,人的状态,决定了技术的上限;技术的上限,决定了产品的天花板。技术是人做的,产品是人做的,所谓长期价值,终究是靠人撑起来的。 这,就是俞浩算的那笔大账。 那追觅内部又是怎么选人、用人的呢? 据厂哥了解,在对核心人才的管理上,追觅内部最看重的是—— “争论”。 没错,追觅鼓励员工放开了聊,让不同想法碰撞、多元人才碰撞、不同经历碰撞。 俞浩说,只有这样,才能激发出源源不断的创造力,找到最优解,而不是闭门造车。 追觅选人的标准:只信专业、只依赖专业。 一位追觅的HR告诉厂哥,他说他们要找全球最优质的人才,还要帮这些人成长,目标是让他们都能成为行业里的顶尖人物 —— 换句话,他们就是要培养出像乔布斯、马斯克这样的人物。 当然,每每聊到这儿,就会冒出那个外界一直揪着不放的点:吐槽俞浩个人过于高调。 这个问题呢,厂哥也注意到,俞浩本人今天也是直接作出了正面回应,一点没带回避的。 他说,总有人说,环境适合闷声发大财,不要高调,还说高调的人死得快。这些他都考虑过。 但他也说,ZG传统文化里鼓励低调、不鼓励个性,根源是农业社会生产力低下,一切规律都是固定的,低调才能安稳。可现在时代变了啊!全球越发达的地区,越鼓励个性、越包容多元。 我们现在需要的,就是开放、包容、多元的文化,需要鼓励更多个性、更多张狂、更多不羁。如果需要有人站出来冒这个头,那我来。 而这份底气,源于追觅内部的创新文化。 厂哥打听了下,核心有三点: 极致主义:要么不做,要做就做世界第一。 从技术到产品再到业务,团队一直拿这个准则要求自己。研发团队的三大核心指标,就是全球首创、世界第一、遥遥领先。为了这个目标,追觅从不吝啬研发投入,只做有创新性、可持续升级的技术,同时保持谦逊、坦诚,对创新永远保持好奇。 创始人模式:每个追觅人都得是 “创始人”。 不管是开新区域、开新赛道,还是开创新高度,都要有从零到一的开创能力,而不是做一个保守、怕犯错的 “老好人”。公司招新人,就要招有 “创始人精神” 的 “1 号员工”,就是那些敢闯、敢开垦的人。 多元团队:碰撞出火花。 团队里有工程、制造、互联网、艺术设计等不同背景的人,看似专业不同,却能紧密协作。不同背景的人凑在一起,想法碰撞、经验交流,才能打破思维局限,做出真正有创新的东西。 从一场群星演唱会,到上亿的重奖激励,再到覆盖全员的家庭保障;从允许争论的人才管理,到敢闯敢拼的创始人文化,再到极致创新的团队氛围…… 追觅做的所有事,其实都绕不开一个核心:把钱、把精力、把资源,都投在 “人” 身上。 用物质保障给员工安全感,用文化氛围给员工创造力,用试错包容给员工成长空间,同时用极致要求倒逼员工突破极限,从而带动企业冲破天花板。 这就是俞浩算的那笔 “长期账”—— 不看短期盈亏,只看长期根基。在硬科技的长跑里,追觅这套 “对人长期深耕、对事极致创新” 的逻辑,或许才是它能走得远、走得稳的真正关键。
当贾跃亭也来蹭热度,说明车企造机器人是认真的
前脚马斯克刚放话,要把特斯拉转型成机器人公司,后脚贾跃亭就跟上了。 2月5日,贾跃亭在美国举行了FF首批具身智能机器人产品发布会,一口气推出了三个系列,有全能型和运动型的人形机器人,还有陪伴型的四足机器人。想到去年7月FX 推出的新车FX Super One,甫一亮相就被网友曝出有“套壳”长城魏牌高山之嫌,我觉得问一句“机器人会不会也套壳?”还是有必要的。而且,真的越看越像稚晖君他家的智元机器人啊…… 也不怪贾老板要凑热闹。车企的尽头是机器人,现在已经成了中国造车新势力的共识。小鹏在“造人”上起步最早,因此也摔跤最快。 前几天,小鹏的人形机器人IRON第一次线下亮相,就在平地里摔了一跤,被抬离现场。紧接着2月2日港股开盘,小鹏汽车股价一度下跌超9%。 当然,这一波跌势的主要原因是港股汽车股集体回调。同一天,比亚迪一度下跌近8%,蔚来盘中跌近7%,零跑汽车跌超5%,长城汽车跌超4%,理想汽车、广汽集团跌超3%,吉利汽车、小米集团跌超2%。 股价短期是投票器,长期才是称重机,没必要对汽车股的单日涨幅赋予太多意义。但小鹏机器人摔跤,伴随着股价下挫,依然是一个日益浮出水面的隐喻: 汽车公司到了塑造新故事的关键节点,而具身智能是最主流的新故事。 最先讲新故事的,依然是特斯拉。 现在的特斯拉,早就不只是一家车企了。马斯克给大家画的“饼”,是特斯拉要做Optimus机器人,还要发展Cybercab自动驾驶出租车。他甚至说,特斯拉将转型为估值25万亿美元的机器人公司。 最近,SpaceX并购xAI的消息一出,马斯克以商业航天为核心,重塑整个商业帝国版图的意图就更明显了。作为总给行业“指路”的人,马斯克的叙事已经变了。 国内车企也在纷纷改弦更张。 从去年第三季度的发布会开始,小鹏的叙事已经开始调整。去年11月,何小鹏宣布,小鹏汽车在未来十年要成为一家具身智能公司。 进入2026年,更多车企的叙事发生转变:理想重启具身机器人研发,说要强化“具身智能”的品牌定位;小米则宣布2026年机器人将有新进展。 一时间,机器人成了车企都要去讲一讲的新故事。 拥抱具身智能,理论上可以让车企获得更高市值,提升融资能力。恒业资本创始合伙人江一表示,在美港股市场,纯“制造企业”的市盈率极低,而“AI科技公司”则拥有极高的估值想象空间。通过机器人迭代,车企正尝试从卖硬件的制造业逻辑,切换到卖智能服务的AI逻辑。 正如马斯克称,机器人价值占比将远超特斯拉现有业务。何小鹏也希望,“小鹏机器人有望在12-18个月实现突破,并带动小鹏市值提升。” 不过,宇树们才是具身智能赛道的领跑者。和机器人初创企业相比,车企明显落后了一个身位,前者已经开启量产、争上春晚,准备冲击IPO了,车企才刚开始讲故事。 01 在国内车企中,小鹏入局具身智能很早,几乎和智元、银河通用这些初创企业同时起步,而且还有研发四足机器人的经验。 早在2020年,何小鹏就考虑开拓新的增长曲线,方向之一是飞行汽车,另一个就是当时正热的四足机器狗。 彼时,宇树、优必选的四足机器狗登上春晚,小米也推出了“铁蛋”。小鹏汽车则收购了四足机器狗公司Dogotix,并成立鹏行智能负责机器人业务,由Dogotix创始人赵同阳出任总经理。 据雷锋网报道,何小鹏颇为看重鹏行,花了不少心思,不仅每周参与线下例会,还会线上跟进研发进展。在这一时期,鹏行推出了四足机器马“小白龙”。 到了2022年,马斯克带着擎天柱亮相,再加上AI大模型技术爆发、具身智能软件能力大幅提高,这条赛道迎来转折点。机器人很快从四足进化至两足,“类人感”大大增强。 在赵同阳带领下,鹏行开始从四足转向人形机器人研发,并在2023年10月推出首款人形机器人PX5。 同一时期,国内人形机器人行业迎来了第一个“发布潮”——宇树发布第一款人形机器人H1,智元也发布了远征A1。 但是,刚刚做出PX5的赵同阳却选择离开了鹏行,创办了具身智能企业众擎机器人。2025年末,赵同阳在测试时被自家机器人一脚踹翻,吸引了一大波热度。 核心人物离开后,在小鹏负责自动驾驶工作的米良川被紧急调任,成为小鹏机器人事业的一号位。米良川曾在英伟达深耕自动驾驶与AI多年,并有过短暂的机器人创业经历。 尽管出现了人员变动,小鹏机器人还是得到了行业的认可。 2024年的英伟达GTC AI大会上,黄仁勋身着黑色皮衣登场,宣布“一个新的产业已经出现”。与他同台的是九个机器人中有两个来自中国,分别是宇树和小鹏机器人PX5。 次年CES上,黄仁勋再度与14个加入Cosmos平台的人形机器人同台,6家中国公司中,小鹏也是唯一一家车企。 可以说,小鹏是车企里机器人业务进展较快的,但是具身智能赛道发展速度更快。宇树机器人在春晚上跳起了舞,智元机器人在2025年初实现了量产,银河通用的机器人已经在王府井大街给人做起了咖啡。 小鹏机器人却直到2025年11月才在小鹏科技日上正式亮相。踏着猫步走台的IRON,因为太逼真还被质疑“机器人里是不是藏了个真人”,逼得何小鹏紧急发布无剪辑视频自证,甚至一度哽咽说,“希望这是最后一次证明机器人是它自己。” 据小鹏介绍,IRON采用物理世界模型的技术路线,搭载3颗小鹏自研图灵AI芯片,并且由小鹏汽车的机器人、整车和动力在内多个研发团队支持开发。 去年11月,何小鹏宣布小鹏新定位,称公司新的十年愿景是让小鹏汽车成为“面向全球的具身智能公司”。按照他的预期,IRON今年底实现规模量产,并进入小鹏汽车的门店、办公园区和工厂。 马斯克的百万Optimus量产计划是在今年,而何小鹏则将百万台机器人的量产目标定在了2030年。 但在江一看来,如果小鹏机器人的量产节奏不及预期,市场会质疑其“AI汽车公司”的新叙述能否落地,从而修改其估值模型。 02 在汽车行业,马斯克一直是那个站在风向最前端的人。从早年的电动汽车,到如今的人形机器人,他一直在引领着行业。 早在2021年,马斯克提出人形机器人Tesla Bot,希望用机器人替代人类执行危险重复的任务。次年10月,马斯克带着擎天柱Optimus亮相,点燃了全球对具身智能的热情。 到了2026年,马斯克的步伐更加激进。为了给擎天柱的量产腾出地儿,马斯克宣布停产Model S以及Model X,连他的万亿薪资方案都与机器人业务深度绑定。 马斯克给车企打了样,国内车企纷纷跟上节奏。 1月26日,李想召开线上全员会议,称理想将全力投入人工智能领域,并确认将布局人形机器人业务。此外,理想会进一步强化具身智能的品牌定位,而不仅仅是创造移动的家。 与此同时,小米也加快了人形机器人业务的布局。雷军在年初透露,小米的机器人业务将在今年迎来新进展。 小米布局机器人很早,先后于2021年和2022年推出“铁蛋”机器狗和“铁大”人形机器人。但具身智能热来临后,小米却一度隐身,后续并未再推出人形机器人的迭代版本。 直到2025年10月,小米低调完成“第三代人形机器人CyberOne”的著作权登记。雷军预计,未来5年,人形机器人将大面积在小米工厂上岗,“这还只是第一步,家庭对人形机器人的需求更大、要求更高,市场也更大”。 和小鹏、理想、小米自研相比,蔚来并没有打算亲自下场研发。 去年11月,当友商都在大谈机器人的时候,李斌还是希望蔚来能更聚焦汽车,“机器人毫无疑问有未来的,但我们不会今天去做,与其今天下场,我们更感兴趣谁家机器人会用我们的芯片。” 虽然蔚来没有下场做,但是李斌也没有错过这个风口,通过蔚来资本投资布局。 从2022年投资斯坦德机器人,到2025年投资逐际动力、原力灵机,再到2026年追投逐际动力并领投灵猴机器人,蔚来以资本方式布局具身智能赛道,且投资频率开始加快了。 总的来说,国内车企在机器人赛道已全面铺开。 开源证券指出,当前国内已有15家车企入局人形机器人赛道。像小鹏、理想、奇瑞这些企业,选择直接下场研发生产;比亚迪等车企则通过投资进行生态布局。 03 对于上市车企而言,具身智能确实是个好故事。理想被曝出重启具身智能研发的当天,美股开盘一度大涨约7%。 但好故事不能光靠讲,最终还得有产品支撑。那些具身智能初创公司之所以能融资、发展势头好,是因为产品真的落地了,比如宇树2025年量产达到5500台,智元预计同年营收能破十亿。 所以对车企来说,光有故事不够,产品能不能落地才是关键。虽然小鹏机器人摔了一跤,但至少小鹏走在了车企前面,还拿出了量产计划。 车企造机器人,其实有一定优势。 自动驾驶和具身智能在技术和硬件上有相通之处。江一分析,人形机器人的软硬件与智能汽车的自动驾驶系统高度重合,可以复用后者的技术和零部件。 此外,车企有成熟的规模制造供应链,能够降低机器人成本。他们还有数据优势,汽车行驶中的路况采集数据与机器人室内导航数据具有极强的互通性。 正因为如此,这几年有不少自动驾驶领域的人才从车企出来,创业做具身智能,而且很快就能拿到大笔融资。 比如,华为车BU前首席科学家陈亦伦携手百度智能驾驶业务前总经理李震宇,联合创办了它石智航,半年内完成2.42亿美元的天使轮融资。小鹏汽车和OPPO前首席科学家郭彦东创立智平方,已融到A2轮。从地平线出来的余轶南,和理想汽车前智能驾驶产品总监赵哲伦共同创立了维他动力。前理想自动驾驶技术研发负责人贾鹏等人创办了至简动力。 可以说,这一波具身智能创业潮里,有智能驾驶背景的人才占据了相当比例。 但造机器人毕竟不是造车。自动驾驶技术面对的环境主要是公开道路、停车场等,而人形机器人需要进工厂、进办公室、进家庭,两者软硬件技术栈有相同之处,但也有精度、复杂度、可靠性、安全性等方面的巨大差异,而这都需要通过技术研发来慢慢攻克。 马斯克曾说过,Optimus的开发难度远远高于Model X。小米集团总裁卢伟冰去年也提到,人形机器人落地工厂并产生价值仍需要时间,“目前来看,的确难度非常高”。 对车企来说,造机器人不比造车要轻松,这是一项回报周期长、极其烧钱的事业。就连马斯克,也还没有完全跑通它的商业闭环。 余轶南认为,造机器人,起步阶段要在五年内实现百万台的量产,投入可能在百亿元级别才能上牌桌。 前几年,车企为了造车已经烧了不少钱,而且大多花在了研发上,不少新能源车企甚至还在亏损中。过去几年,车企也确实分不出太多心思去造机器人。 但现在形势不一样了,车企要寻找新出路。 全球汽车销量增长基本停滞,马斯克都要为特斯拉重新设定航向。国内汽车赛道更是卷到无以复加,企业利润很薄。 另一方面,具身智能是当下最火的概念之一,相关概念股在港股和美股备受欢迎。资本往具身智能流动,技术人才往这个行业迁移,公众注意力也向具身智能上转移。 若将时间线拉长,新能源车企这两年股价承压,面对激烈的竞争,他们需要新故事。而机器人则有望帮助车企建立起接近科技公司的估值逻辑。 开源证券分析认为,车企的定价逻辑有望从传统制造业的“销量/份额驱动的PE/PS”迁移到“科技公司式的现金流折现+分部估值”框架。 不过,虽然车企的叙事逻辑转变快,但实际动作还没跟上。眼下大多都还在讲故事层面,就看接下来如何去落实了。 在技术面前,车企和初创企业是平等的。当前卡住具身智能的,不是钱和资源,而是技术问题。训练数据、具身智能模型能力等,这些对所有企业都是考验,车企也一样得面对。 车企正成为具身智能赛道里不可忽视的一股力量,但同时也要面对这个行业的共性难题。不过这一局他们必须上桌,如果不在牌桌上,可能就真的被落下了。
从马斯克到李想,车圈开始流行“不务正业”
去年以来,全球至少已有17家主要车企宣布进军机器人领域,包括国外车企特斯拉、奔驰、丰田、现代等,以及国内车企比亚迪、小米、小鹏、广汽、理想、奇瑞等,而且这个数字还在持续增加。 作者丨无情 编辑丨坚果 封面来源丨Unsplash 2025年,全球汽车行业的价格战打得刀光剑影,市场格局也迎来了新变化,曾经的“销量王”不再稳守龙门,更多后起之秀崛起,车圈竞争变得更加激烈。 对于这样的变化,有的企业选择直面竞争,迎难而上;但也有企业选择了另一条截然不同的道路,往汽车以外的方向讲故事。 近日,特斯拉发布了2025年四季报,全年汽车交付量同比下降8.6%至164万辆。但在财报发布后,特斯拉的股价涨幅一度超过4%,市场似乎并不在意其汽车业务下滑的事实。 无独有偶,理想董事长李想近期召开了一场全员大会,但出乎很多人意料,整场会议并未深度提及汽车销量、产品迭代,而是全程围绕AI领域,李想更笃定“一定要做机器人”。 然而,特斯拉和理想并非孤例。近几年来,当消费者在谈及汽车市场,仿佛都有一种车企越来越不像汽车公司的感觉:小鹏端出被误以为是“真人套皮”的人形机器人、比亚迪设立未来实验室专攻具身人工智能领域……一时间,车企似乎集体“不务正业”。 当传统车企不再埋头“造车”,而是集体向AI科技企业转型,这到底是为了赶风口、贴标签,还是汽车行业下一个十年的生存必需? 01 车企集体“不务正业” 不只是马斯克,国内车企都有一个“科技梦”。 小鹏是最早全面转向AI的造车新势力。2024年,小鹏汽车将品牌升级为“小鹏AI汽车公司”;去年11月,将公司定位升级为“物理AI世界的出行探索者,面向全球的具身智能公司”。 理想董事长李想在2024年的访问中,正式宣布公司从“智能电动车企业”转型为“人工智能企业”。今年1月,奇瑞汽车也发布了向“全球AI科技公司”转型的宣言。 过去几年,AI早已深入到几乎所有车企的基因中,从智能座舱到辅助驾驶,从AI集成智能系统到数据定义开发,成为驱动汽车研发、制造、销售乃至服务全链条运转的“操作系统”。 在这个过程中,AI不仅赋能智能汽车,还赋能具身智能。去年以来,全球至少已有17家主要车企宣布进军机器人领域,包括国外车企特斯拉、奔驰、丰田、现代等,以及国内车企比亚迪、小米、小鹏、广汽、理想、奇瑞等,而且这个数字还在持续增加。 汽车行业似乎变得越来越“不务正业”,但这样的“不务正业”,却是资本市场乐于看到的。 以特斯拉为例,尽管其汽车业务持续疲软,但其总市值已经重回万亿美元关口,创下历史新高,市场已经不在乎特斯拉卖了多少车,却愿意为它的AI、机器人和商业航空买单。 同样,去年小鹏的股价也迎来了一波持续上涨,创下自2022年7月以来新高,资本市场看好的,也并不只是小鹏的销量,而是其AI、科技及Robotaxi的生态联结。 在这背后,是汽车市场正从“增量竞争”彻底转向“存量厮杀”的残酷现实。根据乘联会数据,2025年我国汽车行业销售利润率降至4.1%,处于历史最低位。 瑞银中国汽车行业研究主管巩旻表示:“过去这些年,成立的太多车企,好处是推动了创新与产业链成熟,坏处是无序竞争、利润稀薄,大家赚钱都很辛苦,淘汰和整合是大势所趋。” 因此,汽车业务虽然仍是车企的基本盘,但在此之外,车企也要未雨绸缪,寻找新的增长曲线和故事,为下一个十年做好铺垫。 目前来看,AI技术也并不仅仅只是“烧钱”,也开辟了全新的盈利模式。 比如小鹏与大众汽车的技术授权业务已成为重要收入来源,2025年三季度,小鹏的服务及其他收入达23.3亿元,贡献了整体毛利的42.4%。 除此以外,车企向AI大模型和机器人赛道发展,本就具备天然优势。 一方面,智能汽车在自动驾驶、智能座舱等领域所积累的技术能力,以及其在生产制造、供应链采购等方面的优势,可以相对平滑地迁移至机器人以及其他智能硬件端。工信部电子第五研究所测算显示,车企研发人形机器人的成本,比普通机器人公司低1/3左右。 另一方面,汽车制造本身就是机器人落地需求较为明确的场景。优必选的Walker S已进入一汽-大众等工厂,执行车辆质检、安全带检测等工作;特斯拉的Optimus也在自家工厂进行电池电芯的分拣;奇瑞人形机器人“墨茵”则在奇瑞4S店承担销售辅助工作。 对车企而言,从“卷造车”到“卷科技”,并非只是天马行空的尝试,而是商业化路径自然延伸,当它们尝试跳出传统造车思维,才能找到那条从“制造”通往“智造”的窄门。 02 车圈卷向生态竞争 与此同时,豪赌“下一个十年”的行业话语权,也是车企们真正想要争夺的终极战场。 随着AI技术与智能汽车的不断融合,汽车行业正从“软件定义汽车”向“AI定义汽车”的方向演进,从过去由软件主导汽车的功能特点、系统开发和软硬件更新,逐渐发展至由AI应用为汽车的高效开发与运行提供全方位支持。 AI不仅能向下打通芯片、传感器与底层驱动软件的协同,还能向上赋能智能座舱、自动驾驶乃至车云一体的服务生态。更重要的是,它还能以真实场景中持续产生的海量数据,重塑汽车的研发逻辑、制造流程与商业模式。 简单来理解,过去车企比拼的是谁的发动机更有劲,谁的底盘更扎实,谁的外观更漂亮;在电动车时代,大家则开始比电池、比续航、比屏幕大小。 但在未来的AI时代,车圈的比赛将会滑向一个更抽象的层面,比的是谁的汽车更智能、更懂人;谁的生态系统更强大,能够用技术赋能整车制造,并吸纳更多的合作伙伴。 在这一背景下,车企“造人”,本质上是在造“下一代的智能终端”,这也是当下AI行业最被看好的方向“物理AI”——AI将会走出屏幕,以物理实体的形态渗透到城市、工厂、家庭等场景。 小鹏董事长何小鹏曾表示,如果AI无法与物理世界交互,其实际价值将极为有限,只有赋予AI“身体”,使其能走、能看、能交互,AI才能真正改变人类的生产与生活方式。 理想董事长李想也谈及对未来智能汽车的设想,他认为如果产品竞争只停留在电动车层面,竞争的逻辑就会变成参数大战;如果聚焦于智能终端,就只是把智能手机的功能搬到车上,相反,具身智能才是真正可以改变用户生活的产品。 海内外的科技圈大佬也频繁提到“物理AI”:英伟达CEO黄仁勋认为“物理AI将主导AI的下一个阶段”;阿里CEO吴泳铭则表示,“AI最大的想象力在物理世界”。 如此一来,也就更容易理解为什么车企都想要变成 AI 公司,因为未来的智能汽车将只是一个载体,决定这个载体能实现什么功能、创造多大价值的,是其所连接的智能生态。 届时,销售汽车或机器人等智能硬件产品虽然也能盈利,但最赚钱的却是这个入口背后,智能生态所持续产生的数据服务、软件订阅等收入。 谁能率先搭建起开放兼容的技术标准与生态体系,谁就能吸引更多品牌加入到自己的“朋友圈”,共享技术、数据和用户资源,随着生态规模“越滚越大”,其竞争壁垒也会坚实。 03 谁能赢得下一张船票 为了争夺这场车圈生态战的最终胜利,车企纷纷开始加速科技转型,目前来看,主要包括全栈自研、生态合作以及收购并购三种不同的路径。 以特斯拉、小鹏等为代表的具备全栈自研能力的企业,它们坚持从AI芯片、操作系统到大模型、智能硬件的全链条自研模式,拥有极强的技术可控性和快速迭代能力。 以吉利、广汽、奇瑞等为代表的新能源车企,则在已经具备核心部件自研能力的基础上,通过与供应商、科技公司合作实现资源互补,快速建立技术壁垒并进入实际应用场景。 以现代、宝马为代表的传统车企,则通过收购或合作快速获取核心技术,尽可能降低自主研发的成本和风险。 车企的转型路径各异,但本质上都是“适合自己的才是最好的”。 新势力车企的技术基因更厚,全栈自研能够帮助它们更好吸引资本市场的认可;传统车企转型步伐更慢一些,通过合作和收购能更快补上短板,毕竟,留在牌桌上才是最重要的。 不过,在车企主动求变背后,还有硬币的另一面:正确的事情,也可能是最难的事情。 首先是商业化难题,新技术研发往往面临着巨额投入与漫长周期,特斯拉在AI领域的累计投入以百亿美元计;比亚迪也表示要在智能驾驶领域投入千亿资金。 这些投入在短期内难以看到清晰的商业化回报,还会不断挤压车企本就因为市场内卷而变得微薄的利润,如果没有强劲的主业“输血”,新业务的投入甚至可能会成为拖累。 其次,车企要顺利完成角色切换并非一件容易的事情。前沿科技研发是典型的资本密集型、人才密集型的长跑,非常考验企业战略定力和组织能力。 对于习惯了制造业管理模式的传统车企而言,如何重构组织架构、企业文化,去配适科技公司敏捷响应、容错试错的扁平化文化,将会是不小的挑战。 最后,车企的雄心壮志始终要用技术成果来兑现,而这恰恰是外界质疑声最响的地方。 特斯拉将三代Optimus人形机器人的量产时间不断推迟,技术难题仍有待攻克;小鹏IRON人形机器人在走秀时摔倒,也反映了具身智能从实验室走向真实场景的“阵痛”。 诚然,这些“失误”是技术迭代中不可避免的试错成本,市场也愿意给探索留出空间,但这并不意味着市场愿意为单纯停留在PPT阶段的概念买单。 当所有车企都在抢AI时,卷科技本身不是目的,而是手段。 车企终究还是要回答一个问题,自己究竟是一家什么公司?用AI和机器人来解决什么问题?否则只有宏大叙事,却没有落地价值,“科技梦”便只能被现实打回原形。 通往科技的最前沿,注定是一条“高处不胜寒”的道路。这条路没有捷径,车企只能在一次次跌倒与爬起之间艰难前行,唯有一步一脚印,才能走得更远、更稳。
豪掷近10亿美元,美团为什么非要买叮咚买菜?
文|孙静 2月5日,美团于香港联交所发布公告,将以约7.17亿美元的初始对价,完成对叮咚买菜中国业务100%股权的收购。此外,转让方可从目标集团提取不超过2.8亿美元的资金。 这意味着,交易总对价最高可达9.97亿美元。 看到这个消息,第一反应是:美团赚了,京东亏了。 2025年,生鲜前置仓被卷入巨头即时零售大战的旋涡当中,此后市场屡传叮咚买菜卖身的消息。但此前并购主体被传最多的是京东。 从巨头实力对比来看,京东其实最需要叮咚买菜。在自营即时零售业务板块,美团小象超市已经占领线上规模优势,正在通过小象超市、快乐猴加强线下布局;阿里有盒马的店仓一体,线下零售规模处于领先地位。2025年,盒马鲜生线下门店超400家、超盒算NB 400家,整体GMV超过750亿元。所以前置仓只是盒马加快扩张的抓手之一。而京东七鲜,由于此前的战略摇摆和反复,在店、仓规模上均处于落后环节,目前主要围绕京津冀如北京、天津、石家庄加密网络、同时通过广州等地拓展华南市场。 所以从业务互补角度出发,京东错失叮咚买菜,等于失掉了短期补课提成绩的想象空间。 接近交易方人士向《降噪NoNoise》透露,此前跟叮咚买菜接洽的一直是京东,美团的杀入比较突然。 据36氪报道,有接近美团人士表示不解,认为美团去收购叮咚花掉的钱可能还不如继续自建前置仓划算。 但在我们看来,美团这笔钱花得很划算。 其一,蜜雪冰城在一条步行街上连开三家店,未必是需求导向,而是用抢占点位阻击其他奶茶品牌。美团自然也不想叮咚买菜落入京东口袋。 其二,叮咚买菜对美团的核心价值并非前置仓个数,而是品质供应链、久攻不下的华东市场,以及效率经验。 2025年美团二季度财报电话会上表示,美团管理层明确表态,「我们没有指望前置仓零售成为利润丰厚的业务,但如果规模足够大,综合效率足够好,应该能够实现个位数的利润率,3%是可行的。」 我们曾在《王兴暗度陈仓》一文中提过,前置仓不仅为美团增加盈利渠道,也为现金流、品类、交叉销售效率、DAU等多方面帮助美团加固护城河。 但这个领域盈利并不容易,尤其生鲜前置仓,由于损耗高、配送成本固定,盈利门槛更高。所以叮咚买菜、朴朴都在供应链上游下功夫。 叮咚买菜的供应链能力体现在两个方面:一是上游资源,平台85%以上生鲜为源头直采,并拥有12家自营工厂、2家自营农场;二是品质商品开发,我们此前报道过,叮咚买菜2025年转向「品质人群」并做了相应的商品升级。比如为了确保活鱼活虾的食品安全,叮咚买菜投资上游、率先推出吊水鱼品类,并建立行业溯源标准。而在猪肉消费中,过去一年平台黑猪肉占猪肉消费的37%以上。 叮咚买菜官网 生鲜供应链资源,尤其品质供应链,正是美团当下所需要补的短板。美团自营买菜业务「美团买菜」也比较波折,此前经历过扩张、收缩再整合进小象超市,供应链深度自然不如花8年多时间专注打磨出一件事的叮咚买菜。 2020年-2022年,生鲜前置仓行业已经验证过「烧钱抢规模」的无效,美团买菜、叮咚买菜都因此收缩规模,每日优鲜更是直接死掉。在新一轮前置仓即时零售大战中,低价补贴也很难行得通,行业早晚要走上向效率(降本)和品质(提升利润)要盈利的路径。 在2025年即时零售大战中,美团已经出现通过效率和品质升级实现错位竞争的趋势,这一点在闪电仓部分品类以及小象超市线下店的选品中均有一些体现。此时,如果能通过一笔并购进一步掌控自营即时零售盈利的命脉——供应链,这笔交易可以说相当划算。 毕竟人家叮咚买菜已经实现多季盈利,哪怕净利润不到2个点,起码不是「赔钱货」。更现实一点来看,这起并购不仅增加美团的利润,还能贡献宝贵的现金流,后者可是巨头混战的子弹。 根据叮咚买菜创始人梁昌霖下午发出的全员信来看,叮咚买菜大概率在一定时间内保留业务、团队和品牌的独立运营能力。美团小象超市亦可以从中借鉴叮咚买菜的运营效率。我们此前写过,叮咚买菜的全链路损耗率已经可以做到在1.5%左右的行业极低水平。 叮咚买菜此前持续在华东市场加密仓网,华东也是盒马、奥乐齐的大本营以及前置仓隐形巨头山姆会员店的布局重镇,其他零售商要想系统性拓展华东市场的难度已经非常高,包括美团和京东。并购完成后,叮咚买菜现成的华东市场正好成全美团。在其大本营上海,叮咚买菜高峰期的仓均日均单量能达到1700单左右,全年平均下来大约为1500单,崇明区北门路站的日均订单量更是高达3000多单。 此前第三方数据显示,2025年5月,叮咚买菜平台的90后月活用户规模达到1488.7万,在生鲜电商App中仅次于盒马。 QuestMobile 截至公告前一交易日,叮咚买菜市值为6.94亿美元。2月5日美股盘前,叮咚买菜一度暴涨近 10%。截至发稿,股价回落到微涨。
美团买下叮咚买菜中国业务,即时零售基建竞赛升级
文丨沈方伟 管艺雯 编辑丨王姗姗 美团 2 月 5 日下午 5 时发布上市公司公告,以 7.17 亿美元(约合人民币 50 亿元)的初始价格,收购叮咚买菜全部已发行股份及其中国业务。此外,转让方可以从公司提走 2.8 亿美元现金,意味着包括创始人梁昌霖在内的叮咚买菜股东将从这笔收购交易中获得 9.97 亿美元回报。 叮咚买菜的这一轮收购谈判始于 2025 年 12 月中旬——叮咚买菜创始人梁昌霖在内部向管理层成员透露,他觉得国内的生鲜前置仓业务已经不再适合创业公司,大公司入场会做得更好,因而考虑出售公司。 期间,包括阿里、美团、京东、德弘资本等 5 - 6 家意向买方先后报价或尽调。京东、德弘资本均在尽调后报价,美团是最早参与报价的买方之一,但早期收购意图并不明确。 接近美团的人士告诉我们,美团管理层此前曾有过探讨,判断小象超市的两个对手叮咚买菜、朴朴超市不具备收购价值,美团已经通过学习模仿他们积累了经验,未来战胜这两家公司只是时间问题。 去年至今,以外卖大战为起点,持续升级的即时零售大战改变了这一切。美团管理层的态度在今年一月发生转变。期间,京东在尽调完成后未能在锁定期内签字,交易因此延期,给了美团重新评估的机会。 消息人士称,美团不想把基础设施留给京东或其他对手,否则以后在即时零售上防守的成本会更高。即便叮咚现阶段的仓库规模与美团小象超市的需求不匹配,美团决定实施防御性收购,将叮咚并入小象超市,做中国即时零售行业的第一名。 美团在交易公告中提及,最终交易金额还将根据目标集团在约定日期的净现金、净营运资本等财务项目进行差额调整。我们了解到,美团在签字完成收购前,未能完成尽调。 上一轮生鲜零售大战中,因为每日优鲜暴雷,前置仓模式一度不被市场看好。叮咚在存活且胜出后,即便已连续 7 个季度实现单季盈利,但资本市场仍认为其获利辛苦,不具备远期成长性,公司市值长期处于 5 - 7 亿美元低位。 叮咚已在 19 个城市建设超过一千个前置仓,大多数集中在华东三省(上海、浙江、江苏),在中国消费竞争最激烈也最有购买力的华东市场占据优势地位。 对于京东等前置仓劣势公司而言,收购叮咚买菜的基础设施,是用收购换时间,快速追赶对手。交易最终由美团达成,则预示着今年即时零售的战况将进一步升级,各家公司会迎来更激烈的厮杀。 01 生鲜零售的创业公司,生存边界越来越窄 我们独家了解到,过去两个月,叮咚和意向买方们探讨了两种收购方案:一种是公司整体打包出售,综合现阶段市值 + 叮咚账面现金,起始价格在 10 亿美元附近。 但叮咚创始人梁昌霖更希望只出售中国业务实体,即叮咚在国内的所有前置仓和供应链,同时保留 2023 年起步的海外业务,并带走公司账上现金,未来梁昌霖将带领部分团队继续探索出海机会。 叮咚买菜财报数据显示,截至 2025 年 9 月末,公司扣除短期借款后的现金储备超过 30 亿元。我们了解到,叮咚已完成海外主体与国内公司的分拆。 2 月 5 日美团披露的交易细节证明,美团接受了梁昌霖提出的大部分收购条件,具体变化在于现金分割方案。公告显示,相关收购交易将涉及一项 “资金提取条款”:叮咚股权的转让方有权在今年 8 月底之前,提取累计不超过 2.8亿美元(约合 20 亿元人民币)的资金,但需确保为被收购公司留存的净现金不低于 1.5亿美元。 在决定出售前,梁昌霖等管理层已经对公司的生存处境焦虑了很长一段时间。2025 年初,梁昌霖在一场内部会上将公司新年的目标定义为 “活下来”。上一年是叮咚买菜创立以来首次实现全年盈利,营收约 230 亿元,盈利约 3 亿元,但前景并不可观,因为摘果子的人很快到来: 美团旗下小象超市在华东持续扩张,盒马鲜生快速开店,重开前置仓,NB 也在快速拓店;拼多多旗下 “多多买菜” 也在以低价不断侵蚀生鲜电商市场。竞争对手们以更丰富的商品、更低的价格和更快的配送,冲击着叮咚在华东大本营的优势地位,对叮咚的同款商品实施 “分钟级” 跟价,活动跟进速度达到 “小时级”。 叮咚能做的选择不多,梁昌霖将经营方向调整为更加聚焦,“不做所有人的 75 分,只做少数人的 120 分”。公司不再做无意义的补贴,主动淘汰羊毛党用户,重点开发高品质和差异化的商品。 在这次会议前,很多叮咚员工已经许久没有见过梁昌霖。这位创始人曾在 2022 年初接受我们采访时讲述他的使命——改良土壤,做好农业。但之后发生的事改变了很多人对未来的预期,也包括梁昌霖。2023 年他前往新加坡定居,逐渐淡出公司经营,探索海外创业。 叮咚一度实行轮值制度,由几位高管每半年一次担任轮值 CEO,并尝试让所有高管下放轮岗,由每位高管负责一个品类的建设,提高商品力,改善经营状况谋求盈利。 同期,当小象、朴朴相继选择扩品类、把单仓面积扩展至 1000 平方米以上,从过去一两千款生鲜商品到售卖上万种食品和日百标品,叮咚则长期聚焦生鲜,SKU 数量停留在 3000 个以内,逐渐关停早年不算细账进军的西南、华南等部分城市市场,被保留下来的华北、华南地区的大多数城市市场也仍在小幅亏损,与更大的市场渐行渐远。 公司孵化新业务的进展也没能达到预期,如开设折扣店 “叮咚奥莱”,在沙特开设前置仓业务探索第二增长曲线,都停留在早期尝试阶段。接近叮咚的人士告诉我们,梁昌霖回归公司管理后,面对高管们提出的种种竞争策略,他经常问的一个问题是——如何应对美团等公司的跟进?很少有人能给他提供一个满意的答案。 不同地区的生鲜零售需求有很强的差异化,叮咚围绕华东市场建设的供应链积累很难全盘复制到全国和海外。可扩张性不清晰,让叮咚很难在资本市场获得足够多的子弹,以应对随时可能到来的平台大战,出售成为他们的最佳选择。 02 美团阿里加码,即时零售基建竞赛加速 随着创业公司逐渐退场,当生鲜电商成为大公司即时零售博弈的入口后,即时零售大战将在今年进一步升级。平台间的竞争重心可能从外卖补贴转向基建竞赛。 我们了解到,美团和阿里都在加速扩充线下供给,建造更多基础设施应对长期竞争。双方均奉行两条腿走路的策略,一方面与对方争抢闪电仓品牌和商家,与商家合作开设更多新仓,另一方面继续做多做重自营。 自去年二季度以来,美团扶持小象超市加速扩张,美团闪购旗下的闪电仓品牌 “松鼠便利” 今年计划进入更多一二线城市。歪马送酒也拿到更多资源,已开仓超过 2000 个,基本覆盖中国一线到三四线城市。 近期,美团还调整了小象超市管理层组织架构,由前美团优选负责人高雨龙担任负责人,带队负责快速基建扩张。原负责人王若冲转任小象超市首席商品官,负责丰富商品供给,优化商品结构。美团一直想补足在即时零售 “货” 上的短板,小象超市和平台模式为此都成立了各自的商品部门,负责扩充供给。 美团本次拿下叮咚的前置仓基建,与此前小象超市的仓网规划和商品结构并不匹配,双方如何进一步整合协同仍是难题。接近美团的人士告诉我们,不让其他公司拿到可以快速复用的基础设施,对于当下的美团来说更重要,“更多是防御性收购”。 据我们了解,阿里在 2026 年将继续加大在即时零售的投入,且将是这一年的重点。对淘宝闪购来说,过去大半年近千亿元的投入,带来了 3 亿在一个月内至少购买一次的用户流量,后续的动作都快不了 —— 餐饮外卖要慢慢提高客单价、减少亏损;即时零售需要慢慢沉淀商家、仓库配套设施。 2025 年 12 月,在阿里电商事业群 CEO 蒋凡的要求下,淘宝闪购开始推进天猫超市前置仓(猫超仓)的建设,专门服务于淘宝闪购场景,并将此前用于电商快递次日达的预算更多转向了前置仓投资,已经覆盖约 30 个城市,除了满足天猫超市自营供给外,猫超仓也向第三方商家开放入驻。 目前,淘宝闪购即时零售的日订单量稳定维持在 1000 万单,据行业人士粗略估计,其中大润发、罗森等 KA、商超便利占比 20%,前置仓(包括淘宝便利店)占比约 20% ,盒马占比约 20%,猫超占比约 12%。 在美团和淘宝闪购的外卖市占率逐渐接近的背景下,淘宝闪购即时零售订单量与美团日均近两千万单仍有一定差距,但前者正在尝试各种办法追赶 —— 据我们了解,盒马目前已经拥有 200 个前置仓,并将在 2026 年至少再开出 100 个前置仓;此外,天猫行业和菜鸟合作的平台 4 小时履约仓也仍在探索过程中。 随着更多基建落地,今年的即时零售竞争将进入更清晰的阶段:仓不再只是成本中心,而是平台的战略资产。补贴可以换来一时的订单增量,但只有基建能换确定性。在基建之上,竞争将变成长期消耗战,比拼的是供给密度、仓网覆盖、货盘能力与组织执行。
深蓝汽车董事长邓承浩谈汽车冬测是不是噱头
IT之家 2 月 5 日消息,2 月 5 日,深蓝汽车董事长邓承浩在内蒙古牙克石极寒测试现场,针对行业内关于冬测“作秀”与“造假”的质疑作出正面回应。面对“你们是不是在搞噱头”的提问,邓承浩明确表示:“我们极限练好车,绝对不是说噱头,在极低的温度环境下,车辆的底盘性能怎么样?稳不稳定?动力性能怎么样?安不安全?我们要做的事情是让用户更安心的用车。” 在现场回应中,邓承浩强调,冬测的核心意义在于极低温度环境下对车辆性能的真实检验。他指出,车辆的底盘稳定性、动力性能以及安全性,都必须通过极限场景的验证,才能让用户更安心地用车。针对外界对品牌历史与测试经验的关注,他直言:“我们做冬测不是一年了,二三十年了,我们只是想把我们做的事情告诉大家。” 为解决用户冬季用车的真实痛点,如续航缩水和充电变慢,深蓝纯电车型全系标配的低能耗热泵空调系统,采用相变换热与余热回收技术,效率比传统系统提升 1.8 至 2.4 倍,最大节能可达 38%。同时,3C 超充技术可实现 15 分钟补能 335 公里,配合末端脉冲充电技术,大幅缩短了充电等待时间。 在极寒环境的电池保护方面,深蓝汽车搭载了微核高频脉冲加热技术。该技术能在-30℃ 的极端环境下,使电池温度每分钟提升 4℃,不仅显著缩短了电池达到最佳工作温度的时间,还大幅降低了加热能耗。同时,这些节省的电量直接用于驱动车辆,从而显著提升冬季续航,并改善动力输出和能量回收效率。 在极寒测试现场,针对当前行业对冬测数据的争议,邓承浩呼吁行业应回归技术本质,坚持实事求是,用真实数据说话。
Moltbook和元宝派,两场乱中求变的AI社交实验
过去一周,全球互联网迎来了两场超大规模的AI社交实验。 一场实验是Moltbook。它是大红大紫的桌面端agent服务OpenClaw的衍生品,1月29日上线,把大量agent整合到“人类不得入内”的赛博场域内,成为世界上首个只为AI服务的社交网络。 在AI开发者社区的自发传播下,不到48小时,Moltbook就吸引了10万个agent涌入。截至目前,这一数字已上升至150万。当然,也有人指出这里面有不小水分。 尽管存在争议,Moltbook依然震撼了所有人:agent们自己发帖、回帖、点赞、互喷,表面上几乎和真人社交网络没有区别。有的agent开始吐槽人类,甚至试图诈骗。 另一场试验,则是马化腾口中的“绝密项目”、腾讯首个AI社交服务元宝派。 元宝派是元宝APP的新功能,在APP下方标签栏占据醒目位置。它类似于微信群、QQ群,不同之处是元宝AI作为“派友”24小时常驻。 赶在春节之前,腾讯略显匆忙地打响了AI社交第一枪。目前来看,这位初出茅庐的“派友”表现比较“呆萌”,功能有限。 元宝派设计了诸多功能,比如一起听歌、看电影、P图、聊天,或是协同办公、梳理数据、辅助决策等。但根据字母AI的实测,人类派友最常用的功能就是在派里@元宝,核查新闻和信息的真实性。 这其实并不需要跟AI拉个派才能解决——用户大可以直接与元宝对话进行查询,然后再分享到微信群里。 但这毕竟是AI第一次大规模进入真实社交场景中。通过这场实验,腾讯想解答如下问题: AI到底该如何参与社交?它到底应该具备哪些能力,行为边界是什么?或者说,它到底该多接近真人? 从这一视角出发,元宝派就不仅仅是腾讯在AI产品运营方面的一次试水了。AI社交方兴未艾,腾讯希望借助这场实验,对社交基础设施进行再思考,并对AI身份占位进行一次社会化验证。 甚至可以说,元宝派这场实验,是为微信增添更多AI功能做探索和铺垫。 微信已经通过添加元宝联系人、给输入框增加AI功能等方式,提高自身的“AI含量”,但都没有引发巨大反响。 从产品形态和基因来看,AI社交才是微信最有机会的突破口。但微信体量庞大,任何新功能都会影响十多亿用户,必须慎之又慎。在此情况下,先让元宝冲一冲、摸索AI社交的玩法,不失为更稳妥的路径。对于微信自身而言,基于现有生态,尤其是小程序、公众号等多样的产品和内容生态,未来对AI社交的探索指向更大的可能性。 两场AI社交实验,从内容到实质都存在巨大差异,但也在底层上逻辑相通。 Moltbook是AI开发者社群的自由探索和“玩票”之举,虽然火爆异常,但其目的、方向和可持续性都是一片混沌。倘若非要上价值,那么Moltbook可谓开创了硅基生命AI社交的先河——未来机器人统治地球,Moltbook当记首功。 元宝派则是大公司主导的业务探索,做的是硅基生命+碳基生命的AI社交。腾讯花了很大力气做这件事,还拿出其他业务资源作为支撑;但目前来看,元宝派显然还没有达到Moltbook那样席卷全球的热度。 两者的相通之处在于,它们突破了AI社交“点对点”的窠臼,都把AI扔到了“多对多”的超大规模场景下进行高强度测试。 在进化论视角下,大到一个物种的诞生,小到一家公司的业务发展,超大规模的“多对多”互动,一直是种子发芽、奇迹发生的温床。 01 AI社交的概念已经出现很久了。但到底该怎么做,国内外大厂、小厂心里都没谱,Moltbook和腾讯也不例外。 比如,OpenAI等公司试图将AI社交做成一个功能模块,融入AI APP中。他们希望通过个性化的微调,将大模型培养出符合用户需求的个性色彩,实现1v1的“AI社交”。 这种“点对点”的AI社交,是2026年之前AI行业的主要方向。 横空出世的Moltbook,选择掀桌子。它不仅对1v1“社交”毫无兴趣,还更彻底地直接将人类排除在外,想让agent们直接社交起来。 目前来看,Moltbook算是达到了设计目的,agent们聊得不亦乐乎,甚至超出了人类设定的行为边界。 但问题是,Moltbook玩得太嗨、飞得太高,并未给人类在AI社交中预留位置。如果永远是agent“机聊”,AI社交恐怕也会是一座空中楼阁。 同期上线的元宝派,则选择了一条融合路线:既要突破1v1、做到“多对多”,同时又要让AI与人类共存在同一社交场景内,并进行有效、高频的交互。 但看上去很美的“既要还要”,实现起来难度很大。 腾讯目前能想到的路径就是让AI“加群”,然后把现有的AI能力搬进去,服务真人用户。在许多场景下,AI与其说在与人类社交,倒不如说是在给派友免费“打工”。 按照目前的设计,元宝派至少可以在以下场景发挥作用: 生活场景下,用户把它当成“赛博闹钟”“吵架终结器”“P图大神”,等等。娱乐场景下,用户一句话就能一起听歌、看电影。工作场景下,元宝又变成“搬砖”搭子,帮着户拉会记录、总结讨论、查询信息等。 但实际体验下来,元宝派最常用的功能就是,扔个文字、图片、链接,@元宝核查真假。 这样的功能,其实社交网站早已实现,比如微博、X平台等。元宝自己也可以很方便地做到,没必要在派里当着所有人的面@元宝。 同时,在元宝派内使用此类功能,体验还不如直接使用独立功能或APP。拉群带来的效率提升,并不足以抵消体验上的损失。 至于其他功能,自然也是有用的,但并不是刚需、高频,且有点儿理想化。几乎没有人天天需要拉会、P图,也不会有太多人正儿八经、长篇大论地和派友讨论问题,最后还让AI出马平息争论——偏激执拗的争论,一言不合就掐起来,甚至互相问候对方亲属,才是人类网络社交的真实状态。 这种理想场景vs.现实场景的差距,其实揭示了一条冷酷的事实:腾讯并不具备定义AI社交的能力,甚至无法定义元宝派该怎么用。 这就像微信群,如今习以为常的许多功能,都是用户自发使用后形成共同的需求场景,才被微信接纳并开发接入的。换言之,微信群如今的能力矩阵,不是被开发出来的,而是数亿用户用出来的。 元宝派恐怕也要沿着同样的路线走一遍。它必须把用户积累起来,让一些功能的使用频率高起来,才会搞清楚AI社交的真正需求和场景在哪里,并经过提炼后,作为改进迭代的方向。 元宝派现在被一些用户吐槽,甚至骂它是“废物”,声音颇为刺耳,但客观上也让元宝有了反向筛选、剔除不合理功能的契机。只要用户没有“跑路”,这种骂声并不会超出腾讯和元宝的承受阈值。 另一方面,国内外大模型的竞争,一度变成了单纯比拼谁的参数规模更大、谁的榜单分数更高,而腾讯在这方面并没有下太多力气。如今,它在AI社交领域进行新尝试,一上来就格外重视,其实也标志着国内大模型竞争更加务实,进入了真枪实弹的领域。 02 对于历来审慎的腾讯而言,在现在这个时间节点,把初出茅庐的元宝派扔到真人社交环境下,接受万千用户的测试乃至“拷打”,是十分冒险的一步棋。 去年春节的“DeepSeek时刻”,让原本的新年假期变成了AI行业的关键竞争时段。如今,还有两周就要过年,各个AI大厂都在铆足干劲,加大投放、筹备新品发布。 AI红包是新的主战场。腾讯拿出10个亿现金发放元宝红包,用户可以一键提现;百度掏出5个亿;阿里则打出了“吃喝玩乐、免单不停”的旗号,外加现金红包,总规模将达到30亿。字节则早早敲定了与总台春晚的合作,届时红包雨也少不了。 国外大厂更不必说。OpenAI、Anthropic、谷歌、xAI等争相推出新产品、新技术,试图抢占AI编程及其他热门赛道的制高点。OpenClaw和Moltbook的旋风,更是给不眠不休的AI战事添了一把火。 在战火纷飞的环境下,腾讯倘若求稳,完全可以把元宝派的发布往后压一压,避免让新产品承受过多不必要的炮火。 但是,腾讯还是选择在春节前就把它端上了桌,而且是马化腾亲自“上菜”。 这并非因为元宝派已经尽善尽美。相反,现在的元宝派还有不少bug和短板。但腾讯或许想明白了更重要的逻辑: 要想做AI社交,就必须让AI走出“温室”,引入高噪音的真实社会关系,进行大规模的压力测试。 AI社交的本质是,让AI成为“真人”,丝滑无感地融入人类社交关系链。或者说,让AI通过真人社交场景的图灵测试。 以往,所谓的AI社交都是“点对点”。AI要么是Chatbot,要么是假扮各种身份的Agent,主打一个私人陪伴。狭义的社交不能说一点儿没有,至少也是聊胜于无。 在这样的人造温室中,AI很容易达到或接近人类的对话能力,理论上也算是通过了图灵测试。但它显然不是真正的AI社交。只有在“多对多”的高复杂度场景中接受检验,经历过真人的“调戏”,AI才会真正进化出社交能力。 这种进化的关键,是让AI找到主动响应与被动响应之间的边界。 包括元宝在内的AI,无论在私聊场景下多么思维敏捷、口齿伶俐,一旦接入群聊场景,就会像刚刚被拉进公司大群的职场新人那样,陷入无所适从的状态。 它们要么非常被动,只有被用户@时才会响应;要么过于主动,就像OpenClaw那样,拿了一大堆权限后,擅自帮用户做决定。有人戏言,睡觉前让AI帮忙写工作总结,醒来后发现AI已经帮自己把工作辞掉,还卖掉了房子。 社交的精髓,就是主动与被动的平衡。人类掌握这种平衡,靠的是多观察、多交流、多摔打,最终达到人情练达。AI进入社交场景后,也需要类似的锻炼,才能真正掌握“分寸感”,在与人类的互动中游刃有余。 但AI很难只靠在群里“潜水”,进化到社交达人、办公能手的状态。只有把AI扔到超大规模的“多对多”场景下,它才能快速进化,最终让AI社交顺畅运转起来。 与“点对点”相比,“多对多”的不可控因素呈指数级增长,Moltbook的狂野进化已经证明了这一点。 腾讯自然也明白这一潜在风险,但依然选择在春节前大规模上线AI社交,就是为了获得实验室环境无法模拟的、基于复杂人际链的真实反馈,让AI比较快地度过社交边界感的磨合期,并在实际运营中探索Agent进入群体关系时的交互协议。 03 在春节这样的用户使用高峰期大干一场,是许多APP的淬火之路。 比如,支付、电商、打车等领域的头部APP,都是曾经历春节、双11、长假等大考,顶住了汹涌而来的用户和订单压力,才在品牌、技术、产品、运营等方面彻底站稳脚跟。 如今,腾讯正试图让元宝沿着类似的路径重走一遍。 这显得有些“激进”。毕竟,此前还没有任何一款AI APP,探索过超大规模的真实社交场景+Chatbot并行的产品模式。 这是一场声势很大却准备不足的战役。表现之一是,元宝原本将微信作为主要的红包传播渠道之一,仅三天就被微信叫停,只能靠口令曲线挤入微信。 但这并不意味着,微信“反对”元宝。恰恰相反,微信需要元宝进行更“激进”的尝试,尤其是那些把AI融入社交场景的尝试。 微信一直秉持着腾讯的“稳”,新功能无论大小,都需要经过非常小心谨慎地验证,确认好用之后哦,才会推送给所有人。这一策略让微信成为移动互联网时代体验最优秀的APP。 但在AI时代,新技术、新产品的涌现速度实在太快,比如过去一个月的明星产品就换了好几拨。在此情况下,微信倘若一直“稳”下去,很可能会在应接不暇的AI技术产品跃迁中逐渐落后,越来越远离AI主舞台。 微信需要一块AI试验田,而元宝就是那块试验田。 其实,从产品交互形态来来看,微信和元宝是一回事:两者都围绕“chat”来构筑功能矩阵,无非是前者抓住了真人chat,后者则瞄准了chatbot。产品底色的互通,意味着元宝做得好的功能,未来也会在微信生态内形成AI+社交的探索启发;只要元宝跑得够快,微信就不会太慢。 同时,元宝对于AI社交的探索,并不是这块试验田唯一能够种植的庄稼。比如它可以做多Agent交互,甚至探索数字分身,做vibe coding,等等。微信掐断红包分享,给元宝关上了一扇窗,但同时也给它开了更大的一扇门。 相比运营层面的仓促,腾讯还需要回答一个根本问题:诞生于移动互联网时代的群聊,真的是AI时代人机交互的最佳方式吗? 答案或许并不唯一。 如前所述,元宝派目前展示出来的AI社交能力,多多少少有一些别扭、反直觉。以腾讯的产品能力,经过一段时间的迭代后,元宝派在体验和功能上不会很差,可以达到与微信群类似的丝滑体验;但这是产品工程层面的优化,而非底层设计的突破。 或许,对于元宝派这场AI社交实验,腾讯固然愿意投入、怀抱期待,但也会在一定程度上,将其归为“实验”——希望成功,但也可以接受失败,只要能够汲取经验就行。 归根结底,元宝派成功与否,并不会撼动腾讯的根基。而腾讯似乎也没有必要把AI时代人机互动的基本框架,锁定在“群”这一形态上。 新技术必然带来新的入口和交互方式。AI的魔力在于,用户可以绕开超级APP,通过语音直接调动各种功能和软件;而Manus、OpenClaw等新产品的横空出世,预示着人机关系的全面革新——机器不再仅仅执行指令,而是主动发现、设定和完成任务。 这些划时代的变化,似乎都和“群”无关。 当然,腾讯无需过度焦虑。新范式的出现,并不意味着旧范式的必然消亡,尤其是在社交网络这样高粘性、高迁移成本的领域。即便到了AI时代,微信群仍将是最活跃的线上互动场景之一,而AI加持的元宝派同样颇有机会。 不过,腾讯需要以AI视角来重新考量人机关系,而非单纯将某一个或几个新产品视为AI时代的通行证。 在这方面,字节、OpenAI、苹果等公司都在积极尝试。字节做了豆包手机助手、AI耳机、AI录音豆,OpenAI在开发AI硬件,苹果则花费20亿美元,收购了一家专门做语音识别的初创公司。 很难说这些动作和产品会有多大的效果。但巨头们传递出来的信号很明确:AI时代的人机交互,不能是旧产品的修修补补,而是需要另起炉灶、从头做起。 腾讯的挑战和机会也在这里。 它并没有效仿同行、迅速上马一批AI软硬件,显得有些“慢”。但当一众厂商还在研究如何让AI来“模拟”社交,元宝已经在真实的社交场景之中“挨骂”了。 只不过,腾讯恐怕还需要拿出更大的决心和动作,才能找到AI时代的人机关系突破口。 与AI社交类似,这同样是一场参与者不少、却没人找到标准答案的竞争;但这场竞争不仅难度更高,胜出者的回报也将是十倍、百倍甚至千倍的丰厚。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。