行业分类:
加载中...
头条分类:
加载中...
魏哲家辟谣:台积电已购入High-NA EUV光刻机 但没舍得用
快科技6月8日消息,针对外界称台积电因保守不愿投资下一代光刻设备的传言,台积电董事长魏哲家近日在股东大会上亲自辟谣,表示有买High-NA EUV光刻机,且正努力研发,但基于成本考量,现阶段暂不投入量产。 这台ASML研发的最新High-NA EUV光刻机,每台单价高达3.8亿至4亿美元,是当前主流EUV设备的两倍多。魏哲家坦言,设备太贵是暂不量产的主因。 台积电的策略是先用好手里现有的EUV设备。魏哲家强调,现有光刻机搭配多重图案化技术,仍足以支撑先进制程的微缩需求,台积电有底气等High-NA EUV的经济账算得更划算时再出手。 台积电早在2024年9月就接收了首台High-NA EUV光刻机,并安置在研发中心用于开发下一代工艺的基础光刻技术。魏哲家认为,提前启动研发准备,才能确保未来投产时达到可靠良率与产出效率。 不过他坦言,要把这台4亿美元的设备真正用起来,还需再等等。英特尔等竞争者早已将High-NA EUV提上量产日程,而台积电选择先研发、后投产更稳妥的路线,符合其一贯的成本纪律。 魏哲家预计,High-NA EUV将在真正需要单次曝光实现更细微线宽且晶圆成本开始具备竞争力的时间点,自然进入生产体系。 【本文结束】如需转载请务必注明出处:快科技 责任编辑:红茶
马斯克式IPO来了 路透:SpaceX五大方式颠覆传统上市
凤凰网科技讯 6月8日,据路透社报道,本周,埃隆·马斯克(Elon Musk)将把其开创性的商业风格带入IPO市场,他的火箭与卫星制造公司SpaceX将以其他公司从未采用过的模式上市。 SpaceX SpaceX凭借其创纪录的750亿美元上市融资规模,打破了华尔街传统IPO规则。以下是SpaceX此次IPO的五大不同之处: 1.没有IPO发行价区间 SpaceX的目标估值约为1.8万亿美元,每股定价135美元,没有商量余地。SpaceX在路演与投资者会面之前就设定了这一价格。以往,华尔街通常会利用路演来测试市场需求并确定发行价区间。 这是对传统IPO流程的一次真正突破。“通常情况下,价格区间为投资者提供了一个起点,并允许公司根据路演期间的反馈进行调整。而以固定价格起步,则将路演从一个价格发现过程转变为更像是一个销售流程。”复兴资本的高级策略师马特·肯尼迪(Matt Kennedy)表示,该机构专注于IPO研究及交易所交易基金。 当然,该公司能否执行其股票定价计划,最终取决于市场需求。最终的IPO价格将于6月11日确定,届时一切将见分晓,其股票将于次日在纳斯达克开始交易。 2.散户配售比例大 SpaceX正在改变新股分配的对象,同时也在推动投行降低IPO承销费。 通常,没有数百万美元资金的普通散户投资者很少有机会参与IPO认购。但据路透社此前报道,SpaceX正在考虑将多达30%的发行份额分配给个人投资者。这是一个异常大的散户配售比例,旨在利用马斯克庞大的忠实粉丝群体。 “散户配售比例如此之大,以至于他们可能将那群热切追捧的普通投资者视为一种安全网。”安克斯财富管理公司首席经济策略师布莱恩·雅各布森(Brian Jacobsen)表示。 3.提前售股 文件显示,SpaceX员工将可以在标准的六个月限售期结束之前,分阶段出售部分股票,这表明这家火箭制造商并不太担心内部人士集中抛售会对股价造成压力。 这次上市几乎全部为新发行股票(即“一级市场发行”)。这两种策略虽然不常见,但并非没有先例。而马斯克本人则需将所持股票锁定大约一年时间。 4.马斯克控制权超大 马斯克在出售股份,但他远未放弃对公司的控制权。 传统的IPO通常会逐步扩大对公司的监督。尽管许多科技创始人凭借特殊类别的超级投票股拥有巨大影响力,但SpaceX的招股说明书显示,马斯克在IPO后将保留公司高达85.1%的合并投票权。 这仅仅是开始。马斯克作为CEO是无法被解雇的,除非他本人同意。此外,SpaceX还增加了多项治理条款,使股东更难对公司的决策提出挑战,例如:对某些法律行动设定了最低持股门槛,以及对股东提案进行了限制。 5. 押注的是人,不是业务 许多投资者将投资SpaceX视为对马斯克本人的押注,而非对某项特定技术的看好。他们确实看好马斯克:据路透社报道,SpaceX计划融资750亿美元,而市场对其股票的需求高达约1500亿美元。 SpaceX本身尚未证明其核心业务最终能否真正存在。该公司目前处于亏损状态,主要原因是其在AI计算机上进行了巨额投资,该公司未来计划的一个关键部分是将太阳能数据中心送入太空。此外,SpaceX还为马斯克推动火星殖民设定了巨大的财务激励。 目前,SpaceX最盈利的部门是其“星链”卫星互联网业务,但该业务仍处于建设阶段,并正在接受市场检验。更重要的是,SpaceX未来的成功在很大程度上取决于一枚仍在测试中的巨型火箭:星舰。 然而,SpaceX使命的“诗意”是毋庸置疑的。正如该公司所言:“我们的使命是构建必要的系统和技术,使生命成为多星球物种,去理解宇宙的真实本质,并将意识之光延伸至星辰之间。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
钉钉副总裁马锐拉离职
今日,钉钉副总裁马锐拉在个人公众号确认,他已于5月15日办完离职手续,结束三年阿里生涯、离开钉钉。 这篇文章的背景,是钉钉员工幽素此前在阿里内网发布长文《置身钉内》。马锐拉称自己看完后“久久不能平静”,随后以《置身钉外》回应。 他在文中写到高压、长期熬夜和“不能说”的复杂感受:“我越来越难确认自己是在创造产品,还是只是在消耗身体追赶一个不断前移的节奏。” 但他没有把离开写成单纯控诉。文章末尾,他仍提到对钉钉的祝福:“我内心是希望无招能够带领钉钉重现辉煌的。” 早在5月中旬,字母榜曾获悉,阿里内部钉钉已经无法搜索到其本人,一些马锐拉此前撰写的内部文档,已经被打上了“退隐江湖”的标签。 这不是一个外界熟悉的阿里高管名字。相比吴泳铭、蒋凡、叶军、周靖人,马锐拉很少站到台前。即便今年阿里成立Alibaba Token Hub,也就是ATH事业群之后,他也并不是被提及最频繁的那个人。 但他的离开,发生在一个微妙的时间点。 今年3月,阿里成立ATH事业群,由吴泳铭亲自挂帅,整合通义实验室、MaaS业务线、千问事业部、悟空事业部和AI创新事业部。 其中,通义实验室负责基础模型,MaaS业务线负责模型服务平台,千问事业部负责个人AI助手。 而悟空,这个顶着齐天大圣名头的业务,是阿里新设悟空事业部的旗舰产品,定位为企业AI平台,可以自动处理文档编辑、表格更新、会议转写和研究协同等复杂任务。 据阿里方面人士透露,马锐拉正是在ATH事业群变动的同一时期,成为了悟空用户产品体验方面的负责人。在更早些的公开露面中,他的头衔是钉钉副总裁/AI表格负责人。 他不是典型阿里干部,也不是大模型科学家,和AI圈的技术精英相比,他有着截然不同的经历:早年混迹微博,是中文互联网第一代意见型产品人;后来做过电影资料库、房产地图、电商、金融科技;再后来创办我来,随后又被钉钉收购。 显然,当ATH成立时,悟空要解决的是更琐碎、也更难的企业场景,这不是推出一两个AI Agent就能完成的事。而马锐拉的职业轨迹,恰好长期围绕这件事展开。 眼下,悟空已经被放进阿里集团级AI战略,不会因为一位高管的离开而停摆。但马锐拉的离职已经说明,悟空从发布会走向落地的第一段路,并不平静。 01 马锐拉的前半程:从微博大V到协同工具创业者 马锐拉,本名汪佳敏,是更早一代中文互联网创业者。 有相关传言称汪佳敏也不是他的真名,但该说法无法证实。 他的第一段履历,和内容社区有关。 2020年,马锐拉创办协同办公产品“我来wolai”。其背后的公司主体是上海我云网络科技有限公司。21世纪经济报道当年披露,我云完成首轮数千万元融资,投资方为策源创投;马锐拉此前曾创办中文音乐星空和互联影库,后者是Mtime时光网前身。 这段经历有一条隐线:他很早就在处理“信息如何被组织”的问题。 互联影库做的是电影资料库,时光网做的是影视内容数据库和社区。它们表面上是娱乐产品,底层却是把影片信息、评论、评分和用户关系组织起来。 2007年前后,马锐拉又参与创办“我来房产地图”。这是一类早期基于地图的房产信息网站,试图把楼盘位置、价格、销售状态等信息标注到地图上。 底层仍是同一件事:把分散信息结构化,让用户能按位置和条件找到目标。 把时间拨回十几年前的微博时代,马锐拉就曾作为“大V”有着强烈的公共存在感。 2012年韩寒“代笔”风波中,他曾以韩寒好友身份卷入舆论场。新浪当年的报道提到,韩寒发文回应争议后,马锐拉曾在微博中把某个“编造内幕”的对象指向陆川,随后陆川回应,马锐拉最终向陆川道歉。 尽管是10数年前的互联网花边,但能说明他的性格底色:他不是沉默的职业经理人,而是有强烈表达欲和个人风格的产品人。 再往后,马锐拉的经历转向更具体的商业系统。 他曾在兰亭集势负责产品开发,也曾参与移动互联网创业。之后,他进入平安壹钱包,担任技术和产品相关管理岗位。 公开采访里,他提到过一个典型痛点:企业内部系统很多,研发、测试、报销、流程管理各自分散,管理者需要在不同系统之间反复查找和拼接信息。 这段经历,后来直接成为他创办我来的起点。 2020年前后,马锐拉创办我来/wolai。它不是传统文档工具,而是模仿和吸收Notion式的块状编辑、双向链接和知识库结构。 马锐拉本人曾在少数派写过我来一周年总结。他说,做我来的起因,是自己作为管理者面对几十个割裂的内部系统,不断拼凑信息碎片;他希望做一个可以组织信息、让个人自由构建流程与应用、支持分享协作的工具。 这段话放在今天看,就有点企业级Agent那个思路了。 另一方面,wolai也带着他很强的个人产品主张。 它反对传统文件夹,反对割裂系统,反对信息只被一次性消费。它试图让每个人都能像搭积木一样,把自己的知识、任务、流程和协作空间搭出来。 2023年,钉钉收购wolai。收购后wolai产研团队转为钉钉正式员工;钉钉方面回应称,wolai团队已加入钉钉,将负责智能化协作文档研发和个人版文档产品设计。 这次收购,是马锐拉进入阿里的入口。 更重要的是,它把 wolai的方法论带进钉钉。钉钉过去更强的是组织和流程, wolai更强的是文档、知识库和信息结构。二者结合,才更接近AI原生工作平台所需要的形态。 显然,他不一定是最懂模型的人,但他是阿里体系里,长期思考办公协同逻辑进化的产品人。这样的人加入悟空,并不意外,但在业务的交付加速期离职,即使在阿里内部,也出乎很多人的意料之外。 02 进入交付期,悟空眼下正值“硬仗” 马锐拉离职的时间点,正好卡在悟空从“产品定义”走向“组织交付”的阶段。 今年3月,阿里宣布成立ATH事业群。第二天,钉钉创始人、CEO无招(花名,本名陈航)在2026 AI钉钉2.0年度新品发布会上发布悟空,称其有PC端和手机端,用户可以通过钉钉给它发指令,让它在电脑上24小时工作。 这场发布会的时间安排很有意味。前一天,阿里刚把通义、MaaS、千问、悟空等业务放进ATH;后一天,悟空就被推到台前。 早期的悟空,需要解决的是“产品定义”问题。 从公开信息看,阿里一开始就没有把悟空定义成一个单点AI功能。 阿里方面在发布之初披露,悟空可以处理文档编辑、表格更新、会议转写和研究协同等任务,也支持多个Agent在同一界面中协同工作。 可以作为独立桌面应用使用,也可以通过钉钉访问,未来还计划连接Slack、Microsoft Teams、微信等平台。 ATH成立后,千问事业部、悟空事业部等归入ATH,其中悟空事业部定位为“打造B端AI应用入口,将模型能力深度融入企业工作流”;淘宝、天猫、1688、支付宝、阿里云等B端商业能力的Skill,也将逐步接入悟空。 它意味着悟空不只是办公入口,而是阿里B端能力的新接口。它一端连接钉钉的组织关系和工作流,一端连接通义模型、阿里云MaaS和阿里商业生态。 甚至,在电商场景里,阿里也在推动悟空落地,公开报道显示,悟空可以帮助商家在1688上选品找货源,对供应商做背景调查,辅助比价和采购。 相比起“AI写周报”这样的能力,这更接近阿里想要的东西。 协同办公行业也在同一时间发生变化。 钉钉、飞书、企业微信都在往AI上走。去年以来,飞书率先推出并升级一系列AI协同功能,随后企业微信和钉钉也公布AI进展,三家协同办公平台的竞争正在从流量和用户规模,转向AI能力和智能化体验。 但到2026年,简单“加AI功能”已经不够了。 海外大厂已经把AI办公推到交付阶段。微软把Copilot深度塞进Microsoft 365,谷歌把Gemini不断嵌入Workspace。 谷歌还在近期推出Gemini Enterprise移动应用,强调企业级数据整合、无代码Agent工作台、预置Agent、集中治理和第三方生态接入。 另一边,微软把Microsoft 365 Copilot全面部署给埃森哲74.3万名员工,这是Copilot迄今最大规模的企业部署之一。 写文档、总结会议、生成表格、提炼待办,很快都会成为标配。真正能拉开差距的,是谁能把AI放进真实组织关系和业务流程里。 这样的背景下,当ATH成立后,悟空业务选择了马锐拉作为用户体验方面的负责人。 2023年钉钉收购wolai时,曾有报道披露,马锐拉将继续担任wolai产品负责人和一号位;钉钉方面当时的说法是,wolai的加入将补足钉钉All-in-One产品版图,布局协同办公的下一阶段能力。 这条线后来一路延伸到AI表格。2025年7月,钉钉上线AI表格时,马锐拉以AI表格负责人身份对外解释产品逻辑,他曾在视频中公开露面,并表示“AI已经成为表格的原生能力,每张表、每一列、每一个单元格都是AI的入口”。 到了去年8月,钉钉AI表格的野心又往前推了一步。马锐拉当时预告,AI表格后续会和钉钉所有产品打通,从考勤审批到营销教育等场景,还会联合生态伙伴准备2000多个外部数据连接器,让企业内外部数据都能汇入一张AI表格。 整理这些信息不难发现,马锐拉在钉钉内部扮演的角色很清楚:他一直被放在“打磨新产品”的位置上。从wolai到个人版,再到AI表格和悟空,他都是那个负责推动创新和转型的角色。 而在《置身钉外》中,他留下了一句更意味深长的话:“有时候我会想,如果我要用失去所有生活的代价实现一家公司的理想,那我又有什么资格描绘AI改变世界的蓝图?”
华尔街日报:ChatGPT发布1200天,AI距离真正变革还有多远?
AI真正实现变革尚需时间 凤凰网科技讯 北京时间6月8日,《华尔街日报》周日发文,探究了AI何时才能充分发挥其潜力,像电力、互联网那样对社会经济产生变革性影响。文章称,有很多理由让人相信,AI的发展会比其最乐观的支持者所认为的要慢,但会比怀疑论者所说的要快。 自从OpenAI推出ChatGPT以来,至今不过1200天左右。然而,如果根据那些最极端的AI乐观主义者的说法,这项技术本应已经彻底改变商业世界。或者说,这种改变随时都会发生。与此同时,AI批评者也同样容易找到,他们认为AI不过是最新一轮科技热潮,注定会在真正取得任何成果之前就迅速消退。而在他们看来,这种消退也随时可能发生。 事实远比AI炒作者和批评者所说的要复杂。走进今天的一家大型公司,你会发现AI既无处不在,又似乎无处可寻。员工用它来总结会议内容、起草邮件,以及生成演示文稿的初稿。但这些效率提升,尚未转化为清晰的、覆盖整个经济的生产力跃升,也没有带来人们工作方式的根本性改变。 那么,AI需要多长时间才能发挥其潜力,带来变革呢?要回答这个问题,就需要梳理商业世界面临的诸多挑战:公司组织层面的惰性、人类对变革的抵触、有限且往往相当混乱的数据、隐私与安全方面的顾虑,以及重新设计组织实际运作方式所需要的想象力飞跃。 取得进展 尽管存在诸多抱怨和负面消息,但AI在商业世界中确实正在取得进展。针对首席信息官(CIO)和CEO的调查一致显示,企业计划在今明两年增加在AI上的投入。德勤在1月份发布的一份研究报告以及宾夕法尼亚大学沃顿商学院的另一项独立研究均表明,大型公司正在走出试验阶段,开始将AI整合到核心运营之中。沃顿商学院在去年秋季发布的研究还发现,在接受调查的801位高管中,有四分之三的人报告其AI投资获得了正向回报。 这些成效正在多个行业中逐步显现。零售商正在利用AI进行实时定价和产品推荐;私募股权公司已经构建了AI分析师,用于整合研究信息并辅助投资决策;制造企业则正在部署计算机视觉技术,用于在生产线上检测缺陷。 进展最显著的领域是软件开发。AI在代码编写方面已经变得非常强大,以至于许多软件工程师只需用自然语言描述需求,AI就能完成剩余工作。 莫利克教授否认AI应用停滞 宾夕法尼亚大学沃顿商学院研究企业如何采用AI的教授伊桑·莫利克(Ethan Mollick)表示,鉴于上述情况,那种认为“AI应用正在停滞”的说法是完全错误的。“那种认为我们还困在试点模式中的观点,是过时且错误的,”他说,“我一直在与那些正在从AI中获得实际价值的公司交流。” 影响有限 但在商业世界中,AI革命仍然面临许多障碍。首先,人们对所有炒作存在基本的怀疑:董事会和投资者不断要求企业拿出更清晰的证据,证明AI投资正在产生回报。而且,至少到目前为止,AI尚未展现出其足够强的通用性,证明其能够大规模地变革企业和行业。 研究人员创造了一个术语来描述AI这种不均衡的能力:“参差不齐的边界”(jagged frontier)。追踪企业AI应用情况的独立分析师本尼迪克特·埃文斯(Benedict Evans)表示,AI模型在某些事情上表现出色,在其他事情上却出奇地糟糕,而且往往只有在企业已经投入使用之后,才会发现哪些任务属于哪一类。 例如,AI在结构清晰的任务中表现优异,比如编程、法律文件审查和金融分析。但当需要处理更依赖语境、占据大多数工作时间的任务时,这种“参差性”就会暴露出来。它会极其自信地给出错误答案,并且无法借助那些从未被纳入训练数据的人类因素,比如判断决策、不成文的规则以及长期积累的直觉。 这对当前的AI能力来说,是一个明显的“硬性天花板”。诺贝尔奖得主、麻省理工学院经济学家达龙·阿西莫格鲁(Daron Acemoglu)表示:“无论你是CEO、管理者、记者、教授还是建筑工人,我都认为你的技能水平在现有AI之上。”他认为,目前的AI工具只会对少数一部分工作产生影响。 此外,要让AI真正发挥作用,还需要大量“包装”:合适的数据、合适的权限设置、完善的安全与约束机制,以及为监督AI的人类所定义的明确角色。由于每家公司的系统和工作流程各不相同,这种配套的“架构”通常必须从头构建。而这件事远比看起来要困难得多。 人类障碍 但就各种障碍而言,技术问题可能比人类问题更容易克服。简单来说,在AI革命真正全面展开之前,需要说服许多人。 企业高管面临的是五年期的规划周期、三年前采购系统的折旧安排,以及要求回报的董事会。在这样的环境下,风险规避并非不理性。与此同时,还有员工层面的问题:那些认为自己正在“训练未来取代自己的AI”的员工,不太可能积极配合AI落地。 “市场上推销的是生产力和效率的理念,”AI政策研究中心AI Now研究所的副主任凯特·布伦南(Kate Brennan)表示,“而对那些从事实际工作的人来说这意味着什么,却很少被纳入讨论。” 管理层和员工对于真正将AI整合到运营中,而不仅仅是将其用于琐碎的杂活,也可能持犹豫态度。人们的本能往往是利用AI去自动化现有流程中的某些环节,而不是重新思考整个流程本身。 以处理轻微车祸索赔的保险公司为例。通常情况下,公司会使用AI来加快文书处理速度,同时保留原有的多层审核与审批环节。但真正的机遇在于完全重新设计整个流程,让AI根据客户拍摄的照片评估损坏程度,然后批准索赔并几乎立即触发付款。这种重新构想非常困难,并且会威胁到既有的层级结构和常规工作方式。 变革时间 最后,需要记住一点:变革性技术要实现其倡导者所承诺的那种深远改变,往往需要比预期更长的时间。 电力重塑了文明,但用了整整四十年才在生产力数据中体现出明显影响。互联网重构了商业、工作和全球竞争的根基,但也要十到十五年才能渗透到经济支柱中。从当时的内部视角来看,互联网的早期阶段与AI现在的处境颇为相似:前景辉煌,成效不均,并且整个行业有充分的理由告诉你:革命已经到来了。 “要真正改变组织并实现重大变革,需要以人的尺度来衡量时间。”斯坦福大学以人为本AI研究所联合主任詹姆斯·兰迪(James Landay)表示,他多年来一直关注企业在尝试吸收新技术面临的困难。 “我的判断更像是五到十年,而不是未来两三年。”他说。 AI几乎肯定会像互联网一样具有深远影响,并且也很可能需要差不多同样长的时间来重塑经济。支持者对发展方向的判断大致正确。怀疑论者对需要多长时间的看法也大概是正确的。 在当下,任何企业高管、投资者或政策制定者最有价值的思考方式,或许是同时接受这两种判断。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
华为云发布Agentic AI系列新品 推出200EFLOPS算力集群
凤凰网科技讯 6月8日,华为云在上海举行的INSPIRE创想者大会上发布系列Agentic AI新品,正式提出Agentic Infra新范式,并推出通智一体化基础设施、新一代模型训推平台及企业级智能体平台等产品。 华为云发布AICS灵衢智算集群,支持10万卡级集群规模,总算力达200EFLOPS,Token生成时延降至10毫秒以内,千卡每秒吞吐500万Tokens,在线服务可用性99.95%。同时推出AMS Agentic记忆存储解决方案,通过NPU直通硬件实现PB级记忆空间,支持KV Cache分层池化以降低推理成本。CCE Volcano Next通智一体化调度引擎可实现训推共池与碎片整合,资源利用率提升30%以上。AgentSphere提供安全自治运行环境,具备100毫秒级极速启动与每分钟十万级批创能力。 新一代ModelArts Next模型训推平台具备MaaS模型路由功能,支持成本优先、效果优先、均衡模式三种调度策略,已提供15余款SOTA模型,调度精准率超95%,调用成本平均降低20%。企业级RLaaS服务支持一分钟创建强化学习任务。华为云还公测了智果(AgentArts)企业级智能体平台,并同步开源openJiuwen,其内核与企业版同源度超90%。 安全方面,华为云发布数据安全专区及AI机密计算方案,支持机密推理、机密预训练、机密联邦学习三大场景。公司称连续稳定运行零重大事故天数达1037天。 行业应用层面,华为云发布行业AI梦工厂智慧医疗、具身智能、智能制造、科学计算四大专区。智慧病理方案已覆盖全国多家医院,20余家医院正式入驻智慧医疗专区。全球首个全流程具身智能开发平台CloudRobo将于6月30日公测。此外,华为云联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、美团LongCat、讯飞星火等20余家模型厂商发布“百模千态,云聚共赢”生态合作计划。
月薪高达13万元!科技大厂掀起AI人才争夺战:35岁从业者成抢手资源
快科技6月8日消息,据报道,当下,国内科技大厂的AI人才争夺进入白热化阶段。 阿里、腾讯、字节跳动等企业全力争抢智能体(Agent)开发相关人才,招聘预算基本不设上限,顶尖AI岗位薪酬水涨船高。 数据显示,2026年1至4月,AI科学家及负责人岗位平均月薪突破13万元,高薪之下,拥有丰富经验的35岁以上从业者成为行业争抢的热门人选。 这场人才大战早已不再局限于资深技术专家,而是蔓延至应届生、在读学生乃至实习生群体。 如今顶尖院校的AI相关毕业生入职大厂,年薪总包可达数百万元,就连博士生收到的八十万年薪offer,在业内都被调侃为“白菜价”。 为抢占人才先机,各大企业纷纷推出全球校招、专项实习计划,招聘通道常年开放,试图从源头锁定优质人才。 随着竞争深入,不少深耕硬核技术的“隐形大厂”也加入战局,进一步推高人才需求。 这类企业聚焦芯片、智能驾驶、具身智能等领域,同样开出丰厚薪资招揽AI应用人才。 与此同时,行业对AI人才的需求重心发生转变,今年成为AI智能体落地的关键一年,擅长将AI技术结合业务落地的应用开发人才,取代底层模型研发人才,成为市场核心争夺对象。 业内人士分析,目前AI仅会对程序员等少数工种形成替代压力,多数岗位暂时无需担忧。 此外,AI正在催生“超级个体”,跨岗位综合能力变得愈发重要,而AI人才供不应求的现状,预计还将持续三年以上。
小厂,被困在AI时代
AI,已经成为国内互联网小公司的最大软肋。 过去一个月,国内互联网公司相继公布第一季度财报。大公司财报“言必称AI”,小公司的AI浓度却依然不算太高。 以知乎为例,它的最新业绩还不错——营收环比增长至6.5亿元;Non-GAAP净利润达1716万元,环比扭亏为盈,颇有触底反弹的迹象。 同时,知乎再度调整口径,将收入来源划分为付费内容及IP运营、营销服务和其他收入。但它并未单列AI相关数据。 其他小公司的财报,也呈现类似的“AI欠奉”面貌。 爱奇艺作为老牌长视频网站,上季度营收达62.3亿元。但它依然是靠会员费打天下,会员服务收入占总收入近七成。广告收入贡献近20%营收。两者合计带来九成收入,AI相关收入则未被单独披露。 体量更小的公司里,微博继续高度依赖广告,29亿元营收,广告贡献了超25个亿。手握陌陌、探探两大约会App的挚文集团,上季度营收接近24亿元,几乎全是增值服务收入,主要是会员费和直播打赏。 两大游戏直播平台虎牙和斗鱼合并失败后,还是守着老本行,一边靠直播打赏撑起基本盘,一边发展游戏、广告等业务,赚钱方式和收入模型已经多年不曾改变。 看过这些财报,再和小公司聊AI收入,多少有些不礼貌了。 但AI是时代命题,科技公司无论体量大小,都必须直面AI浪潮的冲击,并从App时代迁徙到AI时代。 在这一命题面前,幸福的公司都是相似的,而不幸的公司各有各的不幸。 食物链顶端的巨头是最幸福的:在无可匹敌的资金、资源和人才的支撑下,他们纷纷高调入局、大干快上,甚至喊出“All in AI”,动辄挥洒千百亿资金,目标是抢占AI时代的战略高地,延续移动互联网时代的优势地位。 中型公司砸不起钱、拼不过大公司,但也能够精打细算、小步快跑,专攻细分领域的AI模型和应用,还可以把流量卖给巨头,帮助后者推广AI产品,提前分到AI红利。 小公司却活得很挣扎。缺钱是普遍问题。除此之外,缺用户、缺场景、缺产品、缺技术、缺人才、缺算力……散布于各个赛道的小公司,几乎把“不适合做AI的一百个理由”都踩了一遍。 他们并非看不到AI的潜力。知乎、爱奇艺等公司很早布局AI,行动力和决心不亚于新BAT。但在资金、技术、产品、用户量等全方位劣势下,他们逐渐被大部队甩开,距离领跑集团越来越远,从未真正坐上AI主牌桌。 小公司在AI时代被集体边缘化,并不是危言耸听,而是正在发生的事实。 在App主导的移动互联网时代,小公司尚可以“小而美”,只做细分人群、细分场景。但Agent主导的AI时代正在到来,巨头主导的超级入口正在形成。玩不起AI的小厂,正在被呼啸而至的AI时代抛在原地。 当AI时代拉开序幕时,小公司,或者说“小厂”,很快就看到了新技术浪潮的巨大价值,并拉开架势,试图大干一场。 这一阶段的小厂AI,气势足、跑得快、跟得紧。 ChatGPT在2022年底席卷全球,四个月后,知乎就上线了与AI公司面壁智能合作研发的“知海图AI”大模型,还推出AI搜索功能,一年后升级为“知乎直答”。2025年初,DeepSeek R1模型爆火,知乎直答第一时间宣布接入。 知乎做AI,在数据方面有一定优势:海量答主和用户沉淀了大量结构化、图文并茂的优质内容,既可以训练大模型,又能在推理环节作为溯源依据,从而尽可能减少AI幻觉。 至于算法和算力,知乎投资了面壁智能,曲线解决问题。这样一来,AI大模型三要素都稳稳在握。 但随后三年多,知乎AI板块并未真正开花结果。被寄予厚望的知海图和知乎直答,在热度散去后归于沉寂;财务上,知乎营收2023年增长16%,但2024、2025年连续下跌,直到今年第一季度才有所好转。 知乎三年前对于AI的野望,基本停留在了纸面上。这不是个例——其他小厂的AI,同样走过了从喧嚣到平淡的曲线。 2023年夏天,爱奇艺成立“AIGC内容科技创新中心”,整合资源上线了大批内部AI应用,比如“剧本工坊”“影像工坊”等。第二年,爱奇艺自研“奇智”大模型完成备案。2025年4月,又上线了面向外部用户的“桃豆”AI助手,功能包括搜片推荐、开播提醒、内容畅聊等。 微博在2023年7月推出AI评论机器人,年底更名为“评论罗伯特”。一年后,微博自研“知微”大模型通过备案,AI搜索产品“微博智搜”上线。今年初,微博又上线“龙虾助手”,追赶OpenClaw的热潮。 挚文2023年之后推出AI陪伴、AGI社区、虚拟社交等多款AI应用,还把大模型用于内容管控、用户风控等环节。虎牙、斗鱼除了训练垂直大模型,还把AI用于直播、电竞的各个场景,并推出了一些游戏相关的Agent。 客观地说,这些动作起到了一定效果。尤其是在内部提效上,AI技术在不同生产力场景的广泛落地,让知乎、爱奇艺们受益匪浅。 但同样无法否认的是,无论是模型性能、App用户量,还是技术、工程方面的突破创新,小厂的AI成果都无法与大公司相提并论。 直观表现之一是,小厂自研模型几乎从不“打榜”,AI产品也从未在AI App的投流大战现身。原因很简单:前者打不过,后者没钱打。 AI时代,用户永远追逐最先进的模型、最强大的App。无法端上“硬菜”的小公司,即便早早就下场搞研发、做产品,也无法赢得用户和市场的青睐。 AI产品被局限在自家的一亩三分地,意味着小厂无法拿到漂亮的增长数据,商业前景愈发渺茫,进而促使管理层改变竞争策略。 在AI行业竞争中,小厂早早放弃了通用大模型的竞逐,AGI更是不敢想;以Chatbot为核心的AI App也不在他们的射程之内。那些看似与主营业务高度适配的AI功能和应用,也在前期的高调之后,很快归于沉寂。 越往后,小厂的AI之路越走越窄,甚至不再走寻常路。 知乎在最新财报中披露,正在加快建设数据平台与数据开放平台,通过MCP、Skills、API等方式,向行业规模化提供真实、可信、专业的数据服务。换句话说,知乎有可能把数据卖给第三方直接变现,而非继续作为自家AI大模型的“燃料”。 爱奇艺则在4月底公布了“纳逗Pro艺人库”,帮助艺人对接AI项目,却被外界误读为真人演员将被AI替代,惹出一场舆论风波。虎牙在去年ChinaJoy上公布一款桌面级机器人,可以在大模型驱动下,提供游戏指导、陪练等服务。 无论业务、财务,还是技术、产品,现阶段的小厂AI都缺乏可观之处。与三年前相比,小厂多了一些AI功能和产品,却也渐渐失去了争夺时代“杆位”的雄心壮志。 面对AI这道时代考题,大厂、中厂都提供了参考答案,小厂却很难“复刻”。 大厂做AI,前提是舍得砸钱。现阶段,国内AI一线玩家的投入规模,已经飙升到至少每年2000亿元。 腾讯去年资本开支为792亿元,今年第一季度就花掉319亿,相当于去年全年的40%。阿里公布了3800亿的AI基建投入计划,吴泳铭还表示未来五年将远超这一数字。字节先是投入1600亿,后来是2000亿,最新传言则高达5000亿元。 砸钱背后,是留在AI第一阵营的“门票”越来越昂贵:基础模型训练规模越来越大,面向多模态和Agent的推理消耗越来越高,AI产品功能越来越复杂、矩阵越来越庞大,再加上水涨船高的获客成本,都需要企业不断填入真金白银。 在此情况下,新BAT仍然选择“无脑跟牌”,就算暂时看不到盈利希望,也要猛砸出一条通往胜利的路。 巨头有本钱这样做。他们能够从主营业务中持续获得现金流,而资本市场的下注,也让他们能够以相对便宜的价格,以各种方式拿到外部资金。OpenAI和Anthropic即将启动万亿级IPO,更彻底激发了市场的狂热情绪。 AI越往后走,钱越重要。强如DeepSeek,都无法对抗这一趋势。 2025年初,DeepSeek尚可凭借技术和工程创新,完成一场不可思议的逆袭;但到了2026年,它在发布V4版大模型后不久,就放弃了“三不”原则,开始寻求各路资本的支持。 相比之下,小厂每年只有几十亿人民币的收入,倘若像大厂那样砸钱做AI,只够“烧”一两天。而跌跌不休的股价,也让他们的融资能力极为有限。 AI的基干部分——大模型、AI App、AI编程工具、各类Agent框架等,注定是资金充沛的巨头的游戏。 中厂的路,小厂同样走不通。 中厂的钱不如大厂多,无法支撑起一整条AI业务线,但可以集中资源瞄准某一细分场景,做垂直AI;或者直接卖流量,帮助大厂的AI App拉新。 快手是前一种策略的代表。它在通用模型方面建树不多,却孵化了可灵,跻身AI视频生成的第一阵营。不久前,可灵启动分拆,估值据传高达180亿美元。 B站则采取后一种策略。近几个季度,B站业绩好转,盈利能力显著增强,主要靠广告,其中又以AI广告增长最快。新BAT和“AI六小龙”的密集投流,让B站吃了一波AI红利。 上述两种策略,折射出中厂做AI的“举市体制”:他们不会像大厂那样,基本不考虑投入产出比;而是从一开始就希望以市场化的手段,化解AI带来的资金压力,验证AI商业逻辑、尽早构建可持续的生态闭环。 对于小厂来说,中厂的“举市体制”更容易模仿,尤其是卖流量。毕竟,巨头再强大,也需要拿出一部分AI预算,从外部获取流量。 不少小厂也是这样做的。那些重视广告业务的平台,比如知乎、微博等,都会把AI相关内容作为重点包装对象,并在财报中强调AI内容的商业回报。 只不过,小厂的流量规模有限,难以构建一套高活跃度、高转化率的AI内容生态。只靠卖广告给大厂AI业务,无法彻底解决问题。同时,他们对于垂直AI产品的探索,早在一两年前就逐渐走到死胡同。 学不了大厂、中厂,小厂做AI,还没找到参考答案。 在业务形态上,他们试图向更强大的公司看齐,比如卖流量、发展垂直AI产品,甚至训练自己的大模型、推出独立AI App等。 但这些尝试仅限于产品和业务的“形似”,只触达了皮毛;大厂、中厂为之配套的AI基础设施和尖端人才,为之调配的内外资源、资金,才是最后成功“上菜”的关键,而这是小厂无从学起的真正壁垒。 一个更残酷的问题是:AI时代,到底有没有小厂的位置? 如前所述,小厂的普遍问题是没钱。但更大问题或许是:AI时代的进化速度太快了,小厂根本追不上。 2023年起,小厂在AI赛道的位置不断后移。 他们一开始想抓住基础模型,但随着模型参数量从几十亿、几百亿飙升至万亿级,在高昂的成本面前,小厂很快败下阵来。 随后,小厂又试图抓住AI搜索、AI情感陪伴等热门应用,也没有成功。一个重要原因是,大厂也盯上了这些热门赛道,且投入更大、决心更强。 在这一阶段,大厂、中厂和小厂的AI动作大同小异,小厂起码在名义上占据了AI赛道的一席之地。但百舸争流的起步阶段,很快就过去了。 2024年之后,大厂AI和小厂AI已经完全是两码事。 大厂不仅能够面向AI全栈做研发、做产品,而且迭代速度极快;还能时不时发一发论文,搞出技术范式和工程实现的创新。甚至连耗资巨大的AI芯片,大厂都在积极布局。 相比之下,小厂自研的通用模型停滞不前,要么转向专用模型,要么依靠开源模型,针对主营业务开发定制化的AI功能。他们对于AI应用的探索,也远不如昔日积极。 在AI行业的飞速演进中,小厂始终没有找到自己的切入点。 AI大模型时代起步于chatbot,如今演进到Agent主导。以前是AI App激战,现在拼的是Agent框架,以及工具层的Codex、Claude Code、Trae、扣子等,AI硬件也在逐渐风起云涌。 在这一过程中,大厂纷纷找到了自己的价值站位。 OpenAI证明chatbot作为AI大模型“敲门砖”的作用;Anthropic抓住AI编程这一关键的生产力场景;DeepSeek创新工程范式,实现极致性价比;字节则以海量数据和极致产品力,赢下国内市场的AI App大战;千问则揭示了AI+电商的潜力。 同一时期,小厂积极参赛、动作不少,却没能抓住其中任何一个机会。相比缺钱,这或许才是小厂AI处境尴尬的根本原因。 更大的挑战还在后面:AI正在重塑超级入口。 在移动互联网时代,手机和应用商店分发App,却不可能自己做所有App、提供所有产品和服务;这给小厂留下了大量机会。小厂的高光时刻,都发生在移动互联网的巅峰期。 但在AI时代,AI巨头既是流量分发者,又是服务提供者,甚至还是需求制造者,可以实现史无前例的赢家通吃。依赖外部流量和细分场景的小厂,生存空间将被大大压缩。 这种影响已经显现:越来越多的人习惯于在豆包问问题、查资料,甚至听音乐、刷视频。这些具体而高频的需求,原本被小公司所满足,如今却被AI以“不讲道理”的方式,持续吸走用户。 大厂已经在以一种略显激进的方式,展示AI超级入口的未来。 在国内,字节推出了豆包手机,从系统层面接管用户需求;微信也在与手机厂商合作,计划将自身Agent化。在国外,OpenAI在研发Agent手机,微软则打造了面向Agent的Project Solara平台。 这些雄心勃勃,甚至带有科幻感的计划背后,都看不到小厂的存在必要——当用户只需要动动嘴,就能完成绝大多数任务时,为什么还要安装和打开一个细分App? 属于小公司的AI时代,之前不存在,以后也很可能不会到来。 AI时代,大厂中厂策马奔腾,小厂却被困在原地,甚至有可能成为第一批牺牲品。要想突围,绝非只靠在财务和经营上“点缀”AI就可以,而是需要一场更彻底、更有勇气和智慧的变革。
全球首个预制算力中心底座,落地山东
智东西 作者 | 江宇 编辑 | 心缘 智东西6月8日消息,据央视《新闻联播》报道,6月6日,全球首个预制算力中心底座在山东青岛正式启用。 该项目由“创业板第一股”、电力龙头特锐德打造,命名为“算电岛”。作为算力中心的能源枢纽,其作用相当于整个数据中心的“心脏”,负责为大规模AI训练和推理任务持续提供稳定电力。 所谓“预制算力中心底座”,本质上是一套预制化、模块化的数据中心供电系统。其通过“算电协同”实现电力与算力的动态调度,Token用电成本可降低约30%。 ▲算力岛实拍图(图源:央视新闻) 从外观上看,算电岛类似一个超大型集装箱,占地约2200平方米。与传统算力中心供电系统相比,其占地面积减少超过30%,整体建设成本下降约20%,土建成本降幅接近80%,最快5个月即可完成建设,施工周期较传统方案缩短近70%。 ▲算力中心底座内部(图源:央视新闻) 目前,算电岛已经正式接入企业自建数据中心,预计今年下半年将应用于国家级数据中心集群以及多个地方级算力中心。 作为一套“预制算力中心底座”,算电岛可将高压供电、储能系统、直流配电和智能调度能力集成为标准化模块,在工厂完成预制和调试后直接运至现场部署。 更大的亮点在于,其提出的“算电协同”模式。算电岛引入了专门的算电协同智能体系,能够动态调整能源与算力资源配置。 这也是其能够降低成本的重要原因。算电岛可实现100%绿电消纳,并将Token对应的用电成本降低约30%。 对于当前AI产业而言,电力成本已经成为影响算力价格的重要因素之一。 国际能源署(IEA)数据显示,2025年全球数据中心用电量约4850亿千瓦时,同比增长17%;同期,我国算力中心总用电量达到1960亿千瓦时,同比增长18.1%,占全社会用电量的1.9%。预计到2030年,我国算力中心用电量将达到5000亿至7000亿千瓦时,占全国用电量比重超过5%。 与此同时,模型厂商也在积极压缩算力成本。近期,DeepSeek、小米MiMo等模型先后宣布永久降价,最高降幅接近99%; ▲DeepSeek与小米MiMo API价格对比表(智东西制表) 中国电信、中国移动和中国联通三大运营商也陆续推出面向开发者和企业用户的“算力订阅包”,相关词元(Token)产品已上线中国算力平台。 ▲三大运营商Token套餐对比(智东西制表) 在算力需求持续增长的背景下,如何进一步降低每个Token背后的电力成本,正成为AI竞争的又一方向。 算电岛所代表的“算电协同”方案,或为未来AI数据中心的建设提供了一条新思路。
300 个 AI 和我的八块腹肌
要说这段时间的热门 AI 产品,Codex 必然是绕不过去的话题。 这个一开始只是给开发者用来做代码补全、项目管理、功能开发的编程平台,到现在已成长为一款适用于任何角色、工具和工作流程,且人人都能使用的生产力工具。 ▲ OpenAI 在《知识工作的下一个时代》报告里提到,Codex 目前周活用户超过 500 万,自从今年 2 月上线桌面版 APP 后增长了 6 倍多。用户画像方面,虽然开发者仍然是 Codex 最大的用户群体,但知识工作者目前约占用户总数的 20%,并且增长速度是开发者的三倍多。 越来越多人发现,虽然 Claude Code、Codex,都是叫 Code(代码),但这些 Agent 不只是会写代码;它们还能整理文件、分析数据、搜索资料、自动跑工作流,甚至替我们完成一整个项目里的重复劳动。 早在 OpenClaw 火爆的时期,其实就有类似的趋势,但是龙虾的安装和部署劝退了很多人。叫好的多,真用起来的没几个。这类工具一直卡在同一道坎上,只有会折腾的人玩得转,普通人连门都进不去。 对大多数国内用户来说,Codex 算是第一个真正迈过这道坎的,虽然 Claude Code 在它之前,但 Claude 难用上,Codex 一键安装,加上接连的体验优化,把 Coding Agent 从程序员的玩具变成了普通人也能上手的东西。 究其本质,都是将从前单一的 Agent 演变成 Agent Team,甚至是一整套高达上百个 Agents 的动态工作流。 Kimi 最近推出了 Kimi Work,也是建立在这个趋势之上的一次尝试;其核心逻辑,就是把底层的 Agent Swarm 模型能力,用可视化界面进行封装,放到了本地电脑上。 大到工作中需要 300 个 Agents 并行处理的复杂任务,小到平时繁琐的文件整理、操作浏览器等等,都能通过这支 Agent 队伍在后台挂机完成。 开启 300 个 AI 分身 Kimi Work 最大的优点是 Agent 集群的能力放到了本地 Agent 上;而为了让 Agent Swarm 真正工作起来,Kimi Work 提供了多项实用能力。 本地文件深度连接,可直接读取和管理本地文件夹,安全护栏机制要求在修改文件前需用户授权。 7×24 小时定时任务(Cron 引擎),支持按设定时间自动执行 LLM 对话请求、Python/Shell 脚本等,如清晨生成简报或夜间清洗数据,可保持电脑唤醒以确保任务运行。 WebBridge 浏览器自动化,通过自然语言指令让 AI 自主操作浏览器,实现跨网页信息检索、深层数据抓取、自动填写表单等。 原生接入全球金融市场数据,直接打通 A 股、港股、美股等核心数据源,可在对话中调取财报、分析盘面、进行跨表对账,辅助投资决策。 我们先是使用现有的本地文件夹创建项目,在该项目内新建任务,要求 Kimi Work 帮我们整理 20 家值得关注的 AI 公司,分析它们的产品定位、融资动态、核心竞争力等信息,并给出网页报告、PPT 等内容。 选择 K2.6 Agent 集群开始任务,Kimi 会自动给任务设置对应的进度,并且使用 Subagent 工具调用多个 Agents 来处理。 展开任务过程,可以看到有研究组 1-大厂 AI、研究组 2-新锐大模型、研究组 3-基础设施,以及研究组 4-AI 应用 4 个研究 Agent 去搜集和分析对应公司的资料。 而调用 Skill 这些都是基本操作,从右侧的上下文部分,我们能看到 Kimi 调用了报告撰写、可视化、集群深度研究、前端主题等来帮助它完成任务。 最后我们得到的分析报告也非常全面,数据表、可视化分析和具体的公司介绍都囊括在里面。更有意思的是,每家公司的详情部分都写着一句「风险」,Kimi 给自己的定位是「估值上涨过快,盈利拐点不明」,而核心竞争力是「长文本、编程能力、智能体、开源领先。」 除了这种常见的深度研究任务,有了 Kimi Work,我们现在可以直接让它处理本地的文件。最简单的先让它帮我整理一下最近 30 天内的文件,使用对应的工具查看文件内容,汇总这些文件的信息。 从右侧的进度可以看到它会读取文本文件内容,也能提取 PDF 文件、查看图片文件以及处理 Office 文件等,最后生成的表格也成功列举了所有的文件内容和对应的信息。 我们找了一份会议记录,并搜集了一些论文资料和图片数据,累计本地的文件数量达到了十余个。过去使用云端的 Kimi,我们要一个个上传这些文件到网页,现在 Kimi Work 可以直接选择该文件夹作为一个项目,开始 Agent Swarm 进行处理。 我们要求它使用 K2.6 Agent 集群来启动并行协作,根据文件夹内的资料,完成行业研究、论文综述、产品策略、技术架构、合规治理、财务测算、PPT 设计、Word 报告、PDF 研究报告、Excel 模型和质量审查等多份文档。 由于涉及的文件过多,Kimi K2.6 Agent 集群这次启动了多个阶段来完成,像是在研究分析的第一阶段,它就找来了行业研究员、论文综述员、产品策略师、技术架构师、合规治理专家以及财务测算师 6 个 Agent。 在第二步,Kimi 又找来了 PPT 设计师、Word 报告员、PDF 研究员和 Excel 建模师 4 个 Agent 来完成整合交付。整合交付之后,还会自动开启质量审查,利用质量审查员和网页开发师两个子 Agent 对之前的内容进行最终确认。 最后,Kimi Work 产出了六份文字报告、一份测算模型,以及用于汇报的 HTML 和 PPT 文档。 随便点开其中一份文档,Kimi Work 都不是随便应付,从内容到格式都符合直接交付的标准。 在 Kimi Work 的回复里,Kimi 提到基于本地文件夹的内容,它启动了 11 个专业 Agent 分 3 个阶段并行协作,模拟完整的企业咨询项目组,最终交付 12 份专业文档,覆盖 6 种格式。 针对每份文件,它还贴心地给出了使用场景快速导航,例如向 CEO/高管汇报用 07_管理层汇报.pptx + 12_数字化汇报.html,提交正式咨询报告使用 08_综合咨询报告.docx,投行/研究机构参考是 09_深度研究报告.pdf 等。 这件事放到我们打工人身上,只能是先看 A 公司,再看 B 公司;先开网页,再记笔记;先跑表格,再写结论。但 Kimi Work 这类本地 Agent 的加入,让知识工作正在从「一个人依次处理任务」变成「一个人调度一群 AI 处理任务」。 放心 Vibe Working 除了直接使用 300 个 Agent 的能力,配合 Agents 集群,我们还能利用之前 Kimi 内置专业金融数据源的独家亮点。不需要专门去找各种金融 Skill 或者配置数据 API,Kimi 会直接抓取到包括同花顺、天眼查以及世界银行经济数据库的金融数据。 这套数据配合 Agent 集群更能发挥它真正的实力。苹果 WWDC 马上要来了,我们要求 Kimi 帮我整理一下苹果这三年来的股价信息,以及每年的财报,分析其中值得的关注信息。 Kimi 一点都不含糊,同样是启用了 Subagent 工具,调用多个 Agents,完成了一份内容丰富的调研报告。 除了网页,还有基于金融数据整理的 PPT、表格等内容,详细地概括了苹果的股价、主要收入、不同地区的收入情况等。 对大多数的知识工作者来说,这套内置的专业金融数据源能帮助我们减少很多上手 Agent 的负担。 Kimi Work 另一项降低「交给 AI」门槛的功能是 WebBridge。根据官方的指引,我们也先让它使用浏览器搜索了 Kimi K2.6 的信息。 Kimi 会自动启用一个标签组,所有自动化的操作都在该标签组内的网页上进行,调试过程中,Kimi 会自动输入对应的信息,自动截图查看当前页面状态,也会通过获取页面结构来定位搜索框、帖子内容等信息。 对于 Google 这种无法搜索到小红书信息的搜索引擎,用 Kimi 来自动化整个搜索过程,并给出对应的总结,也是一种不错的用例。 使用 WebBridge 的方式也非常简单,按照官方的指引,我们在浏览器上安装好 Kimi WebBridge 的扩展程序,或是直接新建任务,要求 Kimi 帮我们完成安装,它会自动执行对应的安装脚本,在本地处理好 WebBridge 相关的服务。 本地 Agent+Agent Swarm+WebBridge,这几项能力的综合,让 Kimi 能胜任的场景比单纯的聊天要广泛得多。 例如我们可以要它「检查我的 Gmail 邮箱,看看有没有过去 24 小时内未读的邮件。把重要的邮件总结一下。」然后,总结的内容全部保存到本地,甚至是把重要的邮件都保存下来。 Kimi 在浏览器中自动化操作了一会儿,就自动为我们生成了这份 Gmail 邮件总结报告。 此外,结合我们之前要求它完成行业咨询任务,现在可以让它总结信息,自动撰写文件,选择合适的附件并发送邮件。 或者针对那些从搜索引擎或者内置数据库中找不到的信息,先用 WebBridge 获取相关信息,再通过 Agent 集群来处理,形成各种报告文档。 AI 正在组队上工,学会做个甲方 这些检索内容、生成报告相关的能力,其实也正是前段时间 OpenAI 「知识工作者的下一个时代」报告里提到的,Codex 增长最快的知识型任务。统计的数据显示,数据分析任务,周环比增长 110%,而研究和知识产物也排名前三,有将近 37% 左右增长。 Kimi Work 的出现很大程度上帮助知识工作者更好地处理这些任务,另一方面,知识工作者的核心竞争力开始与长时间内的信息处理速度高度绑定,Agent 集群的能力迎合了这一需求。 过去几年,大模型产品一直在寻找进入工作的方式。 聊天机器人负责回答问题,Copilot 开始参与工作,Coding Agent 学会执行任务。如今,随着文件访问、浏览器操作和工具调用能力逐渐成熟,Agent 开始承担越来越完整的工作流程。 更重要的变化在于,完成一项任务的主体,正在从单个 Agent 变成多个 Agent 的协作。 在 Kimi Work 的案例里,无论是研究 20 家 AI 公司,还是围绕本地文件生成一整套咨询报告,背后是一组 Agent 自动拆解任务、分工协作、交叉审核,再完成最终交付。 Anthropic 前几天在 AI 自我进化的报告中,就曾提到,现在的 Agent 已经从 Coding agents 的时代来到了 Autonomous agents 的阶段,核心的变化就是多 Agent 成为了一种新的工作组织方式。 过去,知识工作的瓶颈往往来自人的时间和精力;未来,越来越多工作或许会变成另一种形式,人负责提出目标、判断方向和做最终决策,而资料搜集、信息整理、分析研究和文档交付,则由一支随时待命的 AI 团队协同完成。 打开电脑,面对的可能不再只是一个 AI 助手,而是一整个 Agent 团队。 One More Thing 当所有 AI 公司都在押注多 Agent 的产品形态时,四年一度的押注开始了。 美加墨世界杯即将在本周打响,48 支球队、104 场比赛。今年的竞猜选手,也有 AI 一席地。 Kimi 用 Agent Swarm 功能调动 300 个 Agent,对全部 104 场比赛进行赛前公开预测和赛后复盘,认为德国队被严重低估了,模型测算显示,德国队基准夺冠概率约11.0%,校准后约11.3%。 今天 Kimi 发布的这份世界杯预测报告里面提到,连续两届世界杯小组出局的阴影,在公众和市场心理上留下了顽固的「近因偏差」,持续压低了德国的定价;但 Elo 排名、阵容估值和人才储备厚度的硬指标上,日耳曼战车依旧稳居世界第一梯队。 当然,德国队最后能不能夺冠,目前还不得而知。有意思的是,在这件事里,Kimi 想证明的可能从来不是自己会不会猜球。 为了分析预测,它调用 300 个 Agent 去搜集信息、拆解数据、评估概率,再持续复盘整个赛事过程。这套流程和前面那些行业研究、财报分析、咨询报告一样,世界杯预测只是另一种形式的复杂任务。 而当生活和工作中,越来越多的事情,我们都能安心交给这 300 个 AI 去完成时,那我的八块腹肌,或许真的还有点希望。
曝阶跃星辰或周一启动港股IPO!估值破800亿元
智东西 作者 | 王涵 编辑 | 云鹏 智东西6月8日消息,据《华尔街日报》报道,知情人士称,国内AI独角兽阶跃星辰最早可能于今天提交香港首次公开募股(IPO)申请。 上述人士透露,关键投资者对公司的估值提议达120亿美元(约合人民币812亿元)。《华尔街日报》报道称,阶跃星辰若成功上市,这宗潜在IPO有望成为近年来港交所规模最大的上市交易之一,不过其中一位知情人士也提出,估值仍可能发生变化。 智东西5月8日曾报道,阶跃星辰将完成中国大模型圈迄今最大额融资——近25亿美元(约合人民币170亿元),并已拆除红筹架构,加速筹备赴港IPO,或将成为智谱、MiniMax之外又一家赴港上市的国产大模型公司。 据企查查信息,阶跃星辰此前已完成两轮融资。今年1月,阶跃星辰完成B+轮融资,融资金额超50亿元,主要投资方包括五源资本、华勤技术、厦门国贸、腾讯等。2024年12月,该公司完成数亿美元B轮融资,投资方包括五源资本、启明创投、腾讯及上海国有资本投资有限公司。 ▲阶跃星辰融资情况(图源:企查查) 阶跃星辰2023年成立于上海,由微软前全球副总裁姜大昕博士创办并担任CEO,被业界称作“大模型六小虎”之一。今年1月,阶跃星辰宣布旷视科技联合创始人、千里科技董事长印奇正式出任董事长,负责整体战略节奏与技术方向的制定。他与CEO姜大昕、首席科学家张祥雨、CTO朱亦博组成核心管理团队。 产品发布进度上,5月底,阶跃星辰正式发布并开源Step 3.7 Flash,该模型采用稀疏MoE架构,原生支持多模态理解,能直接看懂UI、图表和文档,旨在解决Agent规模化落地中的速度与成本问题。 5月初及5月8日,阶跃星辰相继发布了新一代自动语音识别模型StepAudio2.5ASR以及新一代实时语音大模型StepAudio 2.5 Realtime。4月底,该公司推出了参数量仅为3.5B的StepImageEdit2,单次生图耗时仅需0.5秒至2秒。 截止发稿前,阶跃星辰未立即回应置评请求。 来源:《华尔街日报》
300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验
智东西 作者 | 江宇 编辑 | 漠影 德国爆冷夺冠! 看到Kimi这份世界杯预测报告,很多球迷第一反应大概率是:这AI能懂球吗? 毕竟,足球比赛最有意思的地方就在于随机。强队会翻车,弱队会爆冷。门将的脱手,或是一张红牌,都可能把整场球赛带到一个未知的比分。 但Kimi这次就把这个高不确定性的题目拿来,做了一场大型实验。 2026世界杯是最贵的一届,也是最复杂的一届。 今年,世界杯将扩容到48支球队、12个小组、104场比赛,赛程横跨美国、加拿大和墨西哥三国。 小组出线、淘汰赛对阵、球员伤病、旅途消耗、天气变化和舆论压力,每一项都与比赛结果密切相关。 光说让一个人看完整届世界杯,已经够累了。Kimi的做法是:直接派出最多300个Agent,把这些变量分开研究。 有的Agent看战术,有的Agent盯球员状态,有的Agent算赛程和旅途,还有的Agent专门唱反调,负责找出预测里可能被忽略的风险。它们累计完成了超过10万次模拟推演,最后生成了一份224页的世界杯预测报告。 这场活动叫Kimi Token Goal。Kimi会围绕104场比赛进行赛前预测和赛后复盘,把自己的判断放到真实赛果面前接受检验。 可以看出,这是一次娱乐性质的世界杯预测活动。但这背后实打实地考验着Kimi最近迄今最新与最强的能力:Agent集群和Kimi Work。前者让300个Agent像一支研究小队一样分头做事,后者则把这种能力放进普通人的电脑桌面。 今天它们一起研究世界杯,明天也可能帮用户做行业研究、数据分析、报告生成和工作流自动化。 可以说,Kimi这次不是单纯想当“数字章鱼保罗”,也让我们看看:Agent不只是会聊天,还能围绕一个复杂任务持续干活、反复修正,并且把结果交给真实世界来检验。 一、看衰阿根廷,德国成“最大黑马”?是300个Agent算出来的 Kimi此次最受关注的预测之一,或许是直接给卫冕冠军阿根廷敲响了警钟,并且公开预测德国队爆冷夺冠。 阿根廷有梅西,德国近几年大赛表现又并不稳定,Kimi为什么会给出这样的判断? 其实,这来自Agent集群的多轮推演。 Agent集群累计完成超过10万次世界杯模拟,评估阿根廷在淘汰赛首轮(32强赛)出局的概率约为15%。而德国队在乐观情景下的夺冠概率则达到18%。 在阿根廷这边,Kimi设置了悲观情景推演。重点跟踪10名存在伤病隐患的国脚,也会考虑梅西、奥塔门迪等老将年龄增长带来的影响。 在德国这边,Kimi关注的是穆西亚拉、维尔茨等新生代球员的状态,以及德国队在部分情景下被低估的可能性。 为了避免模型只强化主流观点,Kimi还引入了反方Agent机制。这部分Agent专门寻找潜在风险因素,将阿根廷过去64年未曾消失的“卫冕冠军魔咒”等历史规律纳入分析。它们的任务就是找漏洞、找反例和找翻车风险。 因此,这个看似“出奇”的结论是由300个Agent大量模拟、交叉验证和正反观点博弈后的结果。 二、变量多、信息杂、分歧大,世界杯成了Agent集群的天然考场 本届世界杯有104场比赛,比赛数量比过去更多,变量也更多。 无论对资深球迷,还是“初出茅庐”的Agent集群来说,想要预测结果,都不是一个只看历史胜率就能解决的问题。 但是,Agent集群恰恰适合这种任务。 战术Agent看阵型和打法,球员Agent追踪状态和伤病,赛程Agent计算旅途和休息,历史Agent分析过往交锋,反方Agent专门提出不同意见,合规Agent则负责把内容控制在体育研究和娱乐讨论范围内。 并且,世界杯还有一个特殊机制:结果天然公开。预测正确与否、哪些变量判断失误、哪些因素被低估,都可以在赛后复盘并反馈给系统。 对于Agent来说,世界杯既有足够复杂的信息环境,也有明确的结果反馈机制,是观察其复杂任务处理能力的一个典型场景。 三、世界杯之外,Agent集群还能做什么? 当然,预测世界杯是一个相对容易被我们理解的场景。但Kimi真正的野心,其实在你我的电脑桌面上。 世界杯预测背后的核心能力,是任务拆解、并行研究、信息整合和持续修正。这套能力同样适用于行业研究、财报分析、商业尽调等复杂工作。 Kimi Work是Kimi电脑客户端新增的本地通用Agent模式。 其关键能力,就是支持Agent集群。它可以自主创建300个分身,并行完成原本耗时较久的复杂工作。 程序员以前用Coding Agent在终端里让AI写代码,现在知识工作者则可以在电脑桌面上用Kimi Work让AI做调研、分析、整理文件、生成报告,以及跨工具完成一整套任务。 此外,Kimi Work还内置专业数据源和Kimi WebBridge,能够操作用户自己的浏览器和登录态,可以“上手处理”用户日常工作的真实桌面,包括网页、表格、PPT、本地文件和各种零散资料。 世界杯只是前菜,Agent集群真正面向的是更广泛的知识工作场景。 与此同时,Kimi还围绕世界杯推出了一系列互动活动:用户可选择一支球队作为主队,参与冠军预测;德国队或用户所选主队每赢一场,均可参与瓜分10亿token池。 结语:一场AI能力的世界杯公开考 Kimi Token Goal并非是要证明AI能100%猜中世界杯。 足球的魅力,恰恰来自它的不确定性。任何因素都可能在几分钟内改写一场比赛的走向。 所以,如何组织300个Agent一起研究一件复杂事情,或许更值得关注。 世界杯则提供了一个天然的实验场。每一场比赛都会给出真实结果,每一次预测都能接受球迷和赛果的检验,每一次判断失误也都能被拿出来复盘。 对于Kimi来说,这次活动的意义不只是预测冠军归属,更是把分析过程、预测结果和赛后复盘放在同一个“透明框”里,向外界展示Agent集群如何处理复杂任务,以及当前AI能力究竟能做到什么、还有哪些边界。 今天,300个Agent研究的是世界杯;明天,它们研究的或许就是你的下一份行业报告。
微信终于要给AI手机开门了
智能手机统治了过去十几年的数字生态,它是注意力的黑洞,是我们最私密的随身之物。但手机从设计之初就是为「人盯着它」而生的——它的全部逻辑,都止于屏幕。 AI 的需求却恰恰相反:它需要持续感知物理世界——见你所见,听你所闻,随时在场,而非等你解锁屏幕才醒来。 当 AI 真正成为一种基础能力,它迟早要从屏幕里破壳而出,寻找属于它自己的形状。这将是一个漫长的探索和演化过程。 「AI 器物志」栏目由此而来,爱范儿想和你一起持续观察:AI 如何改变硬件设计,如何重塑人机交互,以及更重要的——AI 将以怎样的形态进入我们的日常生活? 如果你经常用手机的 AI 助手的话,一定碰到过这个问题: 原本点外卖、写评论、自动修图干得好好的 AI 助手,一碰到最简单的「用微信给 XX 发个消息」,就集体束手无策了。 这个在 AI 自主能力越来越强时代的「异象」,总算迎来了改观。根据腾讯客服表示: 微信正在与华为、小米、荣耀、OPPO 等手机厂商合作推出 A2A 助手能力……可以通过对应手机系统 AI 助手发起微信音视频通话或向指定好友发送消息。 而在荣耀 500 Pro 上,我们借助最新版本的 YOYO 智能体,体验了一把微信的 A2A(Agent to Agent)代理功能。 不得不说,动动嘴就能发消息的感觉确实很丝滑: 根据测试,在目前 YOYO 版本 90.10.30.067、微信版本 8.0.72 中,微信 A2A 支持这些功能: - 发送文字消息 - 拨打语音/视频电话 - 打开扫一扫、收付款码 与此同时,发送图片或表情、发红包与转账、打开公众号页面等等操作则暂时无法实现: 话说回来,用语音助手操作微信这件事情并不稀奇——九年前的三星 Bixby 就能做到(后来被砍了),如今的 Siri 也一直都支持: 但能够在安卓和鸿蒙上——尤其是经历过年初豆包手机的「围追堵截」之后——实现对大厂 app 的代理操作,的确是个意义非凡的里程碑。 关联阅读:剿杀豆包手机助手,可能是互联网大厂的一次「共谋」 虽然「智能体」(agent)的概念前几年就已出现,但整体还是靠 OpenClaw 的爆火,才逐渐成为了 AI 对接硬件的主流代理方案。 而相比豆包手机或者早期的小艺帮帮忙,我们需要明确一点: A2A 的实现形式与 OCR 读屏 + 模拟点击完全不同,仅仅在结果上(帮用户操作手机)殊途同归。 小艺操作非鸿蒙 app 时就需要 OCR + 模拟点击 回想更早几年,行业普遍想象的「每个 app 都为手机厂商的 AI 助手开放 API 接口」,A2A 也走出了一条完全不同的路。 为什么 A2A 能够成为手机厂商 + app 大厂选中的那条路呢?原因很简单: A2A 的操作模式,是现阶段能够最大化兼顾数据安全性、保证用户留存、均摊 token 开销的模式,能够比较好的兼顾各方的利益。 虽然微信开放测试的智能体能力非常有限,连发照片这种基础的操作都还没有上线,但是我们不难猜测后续适配好的样子—— 仅就微信内部来说,除了最简单的「手机智能体 - 微信智能体」模式之外,小程序生态也有很大概率会逐步覆盖到这个生态中。 毕竟很多第三方程序(比如美团、携程、京东之类的)原本就有各自的智能体服务,将智能体功能移植到微信小程序里并不复杂。 美团智能体「小团」 微信可以向外适配系统智能体,也没有理由会放弃向内适配小程序智能体生态。 而在微信之外,A2A 作为一种通用的实现方案,自然也可以和其他 app 的智能体对接—— 今天可以喊 YOYO 用微信发消息,明天就能喊小布用携程总结去年的旅行报告。 到那个时候,距离所谓「OpenAI」智能体手机也就不远了: 一个「神圣的 A2A 连接着每一个 app」、所有操作都可以由智能体转达和代劳的世界。 图|Blizzard Entertainment 有意让 A2A 生态连接每一个人的不止微信和国产手机厂商,谷歌、苹果、微软之类的国际大厂同样在研究这条路。 比如前两周的 Google I/O 上演示的 Gemini Spark。 它在 Android 移动端的执行模式同时支持 OCR 模拟点击、合作软件 API 接入和 A2A 三种方案,可谓「我全都要」的典型。 图|Google 苹果这边同样很积极。 虽然 iOS 26 既没有合用的系统 AI,也没有什么智能体能力,但今年 WWDC 上苹果对于 AI Siri 的重构中,肯定会包含一些针对智能体的支持。 关联阅读:提前看看,今年新 iPhone 系统长什么样|WWDC26 根据行业消息,我们也将有望在今年年末看到字节跳动与中兴再次合作的「豆包手机完全体」。 新的豆包手机据信会放弃纯 OCR 模拟点击方案,而是选择和 Gemini 类似的 OCR + API + A2A 的结合模式,以规避此前的安全风险和利益冲突。 初代豆包手机 毫无疑问,A2A 之所以成为大厂的共同选择、而没有被「围剿」,正因为它是最能兼顾各方利益的方案。 同时也是目前能够看到的,智能体 AI 让生活变得便利的最直观表现之一。 然而 A2A 的模式听起来很美好,但其中的一些商业模式还需要再考量——比如最重要的算力成本。 毕竟手机端无论是 YOYO 还是小艺,微信里是元宝还是张小龙.skill,这些智能体本身的运行始终都是服务提供商的一项开销: 图|PE Collective 而未来如何在用户、手机厂商、软件开发商、服务提供商之间分摊这些 A2A 操作产生的「token 费」,将会是对于所有服务提供方的考验。 更坏的情况是,「手机 OS - 微信 OS - 小程序生态」的嵌套本身已经足够繁琐了。 如果全部使用智能体代理操作,A2A2A2A 过程中导致的算力浪费也是一个必须要面对的问题。 除此之外,一个过于 A2A 的技术模式也会引起另一个方面的担忧:智能体对于人类使用习惯的影响。 在爱范儿之前的文章中,我们提到了在设想 OpenAI 手机时,一种纯粹由智能体代理人类操作的后果: 为了让 Agent 更好地工作,你会下意识地让自己的需求变得更明确、更单一、更具逻辑性,相当于人类主动将自己异化(alienation)成了机器。这就是我们在现代技术中,最需要警惕的一点:人的机器化。 当然,以上种种情况在短期内并不会发生—— 毕竟微信更新 A2A 功能的速度肯定没有那么快,要完整覆盖基础日常功能至少也得大半年,更不用说小程序 A2A 了。 但总目前我们能够体验到的 A2A 能力来说,这的确是让我们在享受到未来科技的同时,还不用担心被超级 app 生态围追堵截的最好方式了。 作者|马扶摇 编辑|肖钦鹏
拿“Codex”当馅儿,豆包才值钱
OpenAI刚刚给字节上了一课。 据《金融时报》披露,OpenAI正准备对ChatGPT进行自2022年推出以来规模最大的改版。新版ChatGPT会把Codex、外部合作伙伴应用和 Agent能力更深地接进来,把原本的聊天框,改造成一个能写代码、管理日程、操控软件的“超级应用”。 OpenAI的方向很清楚,要把ChatGPT从聊天框变成一个任务分发入口。用户还是从ChatGPT进来,但背后接上的东西会更多。Codex负责执行更重的任务,外部应用接入真实服务,插件和Agent把需求往下推进。 豆包在国内的位置其实和ChatGPT很像。 ChatGPT之于OpenAI,豆包之于字节,都是最大众、最容易被用户自然打开的AI入口。 与此同时,豆包正处在从免费AI助手到付费专业AI工具的关键转型期。 按照官方说明,针对专业人群的生产力需求,豆包计划推出专业版,将包含软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等专业服务。 豆包也强调,搜索问答、写作生图、语音和视频对话等日常功能,会继续保持目前的免费服务;专业版的服务,也会在一定额度内免费。 豆包收费这件事,本身并不算新奇。AI产品本来就不便宜,ChatGPT、Claude、Gemini都有付费会员,模型API也都是明码标价。字节自己旗下的Trae、扣子、即梦AI,也早就有付费选项。 但豆包的问题在于,它靠什么让别人为它付钱。 如果只是一个升级版的豆包Chatbot,“贵又难用”的评价恐怕要再次冲上热搜。尤其当它明确表示专业版瞄准的是“软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究”这些生产力场景时,它要回答的,自然也不再是那些针对Chatbot的问题。 字节不缺用户入口,也不缺技术资产。豆包有入口,扣子有Agent和工作流,Trae有编程工具,飞书有企业协作场景,Seed有底层模型和多模态能力。单看每一块,字节都有东西可讲。 问题在于,这些牌能不能像ChatGPT和Codex那样串起来。 豆包付费版,卖的是什么? 豆包正在走到一个新阶段:从免费的AI助手,变成要收费的专业工具。 过去一年,豆包在国内AI助手里遥遥领先。 CNNIC《生成式人工智能应用发展报告(2025)》显示,截至2025年6月,我国生成式AI用户规模达到5.15亿人,普及率达到36.5%。在主要产品中,豆包的用户使用率达到72.2%,位居第一;在“首先选择使用的产品”中,豆包占比47.1%,位居第一。 QuestMobile的数据也能说明豆包的入口优势:2026年3月,豆包月活达到3.45亿,超过第二名千问1.66亿的两倍;一季度平均活跃率达到33.5%,高于千问的17.1%和DeepSeek的21%。 豆包能在普通用户里迅速推广,靠的主要是免费、好用、功能多、无门槛。用户打开豆包,可以搜索问答、写作生图,还能语音和视频对话。它像一个随手可用的AI助手,负责陪用户聊天、回答问题、处理一些轻量任务。 但这套逻辑只能支撑免费版本,一旦涉及到付费,用户的需求就会截然不同。 按照豆包官方说法,专业版面向的是专业人群的生产力需求,覆盖软件开发、数据分析、专业设计、流程自动化、金融分析、科学研究等方向。 工作场景和日常聊天不同,用户问一个日常问题,AI回错了,大不了重新问;让AI写一段文案,不满意也可以再改。但涉及到软件开发、数据分析、金融分析、科学研究,用户的容错率会低很多。效率即成本,付费产品必须给出更清楚的价值。 事实上,即使在免费阶段,豆包也已经因为“看起来能办事,但实际上没办成事”引发过争议。 比如此前的餐厅订座事件。有用户通过豆包预约餐厅,豆包生成了看起来很像预约成功的回复,甚至让用户到店报出时间和人数。但用户到店后,商家表示并没有收到有效预订,称豆包只是AI对话工具,模拟输出并不会同步到门店系统。豆包客服后来也回应称,目前无法帮用户预订或购买商品。 还有5月中旬的“豆包机票退款”事件。一名用户称,自己向豆包咨询机票退票手续费,豆包给出“仅收5%手续费”的明确回复,但实际退票时被扣除40%手续费,损失600元。随后,用户称豆包又在对话中承诺赔付,后续索赔无果,于是向法院起诉豆包运营公司。豆包相关负责人回应称,该案例相关问题已处置,之后在涉及金融、退款等场景会有风险提示。 免费阶段,用户还可以把这类问题归为AI幻觉;而一旦进入付费场景,AI产品暴露出的可靠性问题会更加严重。 但反过来看,付费版本也起到了筛选用户的作用。 免费阶段,豆包面对的是最宽泛的用户,处理的是搜索问答、写作生图、语音和视频对话等日常需求。这些功能在后续依然会保持免费服务,那些轻度的AI用户,本身其实并不受专业版的影响。 据全球人工智能市场追踪机构Aicpb.com发布的数据显示,在豆包预告专业版之后,豆包App 5月月活减少约610万,环比下降1.81%。这组数据后来被放进“豆包商业化是否过早”的讨论里,对这一点我其实持保留态度。5月月活下滑当然值得观察,但把它直接归因于“用户不愿为豆包付费”,证据并不充分——专业版都还没有正式推出。更可能的情况是模型体验感下降、竞品分流、外界对收费传闻的观感变化等多重因素共同作用。 我们有理由相信,那些轻信AI幻觉、把AI当成万能工具的用户,并不是专业版的付费受众。真正愿意为专业版付费的人,反而更清楚AI的边界,也更在意它能不能稳定完成任务。 从免费入口到付费AI工具,定位的变化同时也会带来用户结构的调整:免费阶段看的是规模,专业版阶段拼的是付费意愿和真实需求。 这对豆包是机会,也是压力。机会在于它可以从“全民尝鲜”的流量池里筛出真正有生产力需求的人,压力在于付费用户会更加挑剔。 所谓光脚的不怕穿鞋的,免费的豆包可以随时“滑跪”,通过说俏皮话的方式回避一些错误,用户顶多骂一句,骂完继续用。但在付费产品中,这种策略很难行得通。 用户为专业版付钱,可不是为了看它认错态度好,而是为了让它把事情办成。尤其在软件开发、数据分析、金融分析、流程自动化这些场景里,结果能不能用,比回答漂不漂亮重要得多。 OpenAI为字节打了个样 豆包专业版要解决的这个问题,OpenAI刚刚演示了一遍。 《金融时报》披露,OpenAI正准备对ChatGPT进行自2022年推出以来规模最大的改版。新版ChatGPT会把Codex、外部合作伙伴应用和Agent能力更深地接进来,把原本的聊天框,改造成一个能写代码、管理日程、操控软件的“超级应用”。 OpenAI正在把ChatGPT从一个聊天框,改造成任务分发的主入口。用户还是从ChatGPT进来,但背后接上的东西变多了:Codex负责执行更重的任务,外部应用负责接入真实服务,插件和Agent负责把需求往下推进。 据报道,改版初期,ChatGPT的网页端和移动端会增加大量提示词和功能入口,引导用户去使用编程工具、图像生成,或者调用Canva、Booking.com等外部合作伙伴应用。用户也会看到一个选项,可以手动选择让Codex还是ChatGPT来回应需求。 换句话讲,OpenAI做的不是一口气把所有东西都塞进一个聊天框里,让用户自己猜怎么用,它会在前期主动把入口摆出来,让用户知道:这里可以写代码,那里可以生成图像,也可以调用外部应用。等用户习惯之后,OpenAI再逐渐减少这些显性的提示和入口,让模型自己判断任务应该由哪个工具完成。 无论是改版还是改版方式,OpenAI的做法都很值得豆包学习。 OpenAI本质上是在把已有的两类资产接到一起:一类是ChatGPT这样的超级入口,一类是Codex这种更容易产生付费价值的工作工具。 《金融时报》援引知情人士称,Codex主要吸引的是付费客户;企业客户目前约占OpenAI收入的40%,预计年底会升至50%。与此同时,ChatGPT已经有约9亿周活用户和超过5000万付费消费者。 ChatGPT有规模,Codex有付费能力。OpenAI正在做的,是让规模入口承接更重的工作能力,再把这些能力转化成更强的付费理由。 Codex自己的增长也证明了这一点。OpenAI官方披露,Codex周活已经超过500万,自2月桌面App发布以来增长超过6倍;开发者仍然是最大用户群,但知识工作者已经占到约20%,而且增长速度是开发者的3倍以上。 可以认为,执行型AI已经开始从开发者圈层向更广泛的知识工作者扩散。 而豆包缺的正是这个环节。 字节手里其实有一套很完整的AI生态。豆包是大众入口,扣子负责Agent和工作流,Trae面向编程和开发者,飞书承接企业协作,火山引擎面向云和企业服务,即梦、星绘、小云雀、猫箱覆盖图像、视频、角色互动和内容创作,Seed则在最底层提供模型和多模态能力。 每个工具单独看都有价值,但如果要让用户为了一个任务开好几个会员、在几个产品之间来回切换,想想都觉得麻烦。 OpenAI的做法给了字节一个提醒:要真正进入工作场景,不只在于把模型做强、把工具做好,还可以打通各个环节,把入口做顺。 ChatGPT没有变成Codex,但它开始承接Codex的能力。豆包也不用变成Trae或扣子,但它应该把Trae、扣子、飞书这些能力接到自己后面。 类似的事情豆包并不是没有做过,在内容创作上,它已经接入了图像和视频生成能力。豆包专业版要做的,是把这种接入方式,从图像、视频创作,扩展到更复杂的工作工具上。 豆包专业版的想象空间就在这里,它不应该只是一个更强的聊天框,还应该成为字节AI能力的总入口。用户从豆包开始,把需求说出来,后面的Agent、代码工具、办公协作、云服务和模型能力自然接上。 比较理想的形态是,用户在豆包里提出一个开发需求,后面可以由Trae接住;提出一个自动化需求,后面可以由扣子拆任务、跑流程;涉及团队协作,结果可以进入飞书;涉及企业服务和模型调用,则可以接到火山引擎。用户看到的仍然是豆包,但背后跑起来的是字节自己的工具链。 到这一步,豆包专业版卖的就不只是“更聪明的回答”,更是把事情往前推进的能力。 任重而道远 字节其实没有别的路可选,豆包专业版既然要做软件开发、数据分析、流程自动化、金融分析、科学研究,就必须从聊天走向执行。 方向是清楚的,但问题也很明显:入口和工具接起来之后,背后有没有足够硬的能力。 现在看,字节手里的工具并不少。Trae面向编程和开发者任务,扣子主打Agent和工作流,飞书扎在企业协作场景里,火山引擎负责云和企业服务。它不是没有产品,也不是没有生态,但缺少一个像Codex之于ChatGPT那样清晰的执行器心智。 Codex被OpenAI“放进”ChatGPT的根本原因,在于它已经有了足够强的产品存在感。用户知道Codex能在编程和工作任务里带来效率提升,OpenAI把它接进ChatGPT,是把一个已经被市场验证过的生产力工具,放到更大的入口后面。 但Trae和扣子还没有走到这一步。Trae是字节在AI Coding上的重要产品,但在开发者心智里,它还没有像Claude Code、Codex那样成为明确的生产力符号。扣子有Agent、工作流、插件和知识库能力,很适合做豆包专业版背后的任务底座,但它目前更像一个给会搭建的人用的平台,还没有变成普通用户可以自然感知的执行能力。 豆包专业版要接入Trae和扣子,也并不是把几个产品入口摆在一起就够了。用户在豆包里提出需求后,开发、自动化、数据处理、文档协作这些能力要能顺着需求自然接上。至于背后跑的是Trae、扣子还是别的工具,用户未必需要知道。 工具层还只是第一关,再往下走,就会碰到底层模型能力。 豆包专业版瞄准的是真实工作场景,对模型的要求远高于普通聊天。尤其是Coding,软件开发可能是专业版里最容易被验证的能力。它不像普通问答可以靠语气和表达弥补,代码跑不通,结果就没有意义。 AI Coding是最早被验证的生产力场景之一,也是最容易让用户形成付费判断的场景。能不能写出可用代码,能不能完成真实开发任务,直接决定用户会不会觉得这个工具值钱。 在这一点上,字节也还没有形成明显优势。用户提到代码能力,可能会先想到DeepSeek、Kimi、智谱、MiniMax,而不是字节的编程模型。 DeepSeek最近在Agent、Coding 相关方向上的动作变得更明显,智谱也一直在强化Agent、开发者工具和企业场景,MiniMax则在多模态、Agent和工具调用上持续推进。它们都在在争夺真正能产生生产力价值的场景。 字节的优势是生态,但生态优势要变成商业优势,前提是模型能力和执行工具都要足够强。否则,入口再大,也只是把更多用户带到一个更贵的聊天框前;工具再多,也只是让用户在不同产品之间来回切换;生态再完整,也很难变成真正愿意付费的生产力系统。 或许这也是豆包专业版在当前并没有很被看好的原因,外界不是完全不理解字节为什么收费,只是在等它证明:豆包到底能不能从一个免费AI助手,变成一个付费生产力入口。 但至少方向是清晰的。模型能力可以慢慢补,工具心智可以慢慢建立,用户习惯也可以慢慢培养。字节现在最应该先做的,是学习ChatGPT的转型方式,把已有的生态打通,让豆包成为能调动扣子、Trae、飞书、火山引擎和Seed能力的总入口。 这条路不会轻松,但它必须走。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。