行业分类:
加载中...
头条分类:
加载中...
索尼接近与TCL达成协议 10亿美元出售家庭娱乐业务多数股权
索尼电视 凤凰网科技讯 北京时间3月23日,据彭博社报道,知情人士称,索尼集团正接近达成一项具有约束力的协议,拟将其家庭娱乐业务的多数股权出售给中国对手TCL电子。这笔交易的估值可能约为10亿美元。 知情人士称,双方谈判已取得进展,正争取最早在本月宣布交易。尽管谈判已进入深入阶段,但双方尚未作出最终决定。 索尼的一位代表称,公司正继续进行磋商以达成最终协议,一旦敲定将立即发布公告。TCL暂未发表评论。 今年1月,索尼与TCL签署意向备忘录,双方同意就未来在家庭娱乐领域的战略合作进行进一步磋商。根据意向备忘录,双方确认拟设立一家承接索尼家庭娱乐业务、由TCL持股51%、索尼持股49%的合资公司,并在全球范围内开展包括电视机和家庭音响等产品在内的,从产品开发、设计、制造、销售、物流到客户服务的一体化业务运营。 双方计划于2026年3月底前就订立具有法律约束力的最终协议进行磋商。在最终协议签署并取得相关主管部门批准等条件满足后,新公司预计将于2027年4月开始运营。 索尼近年来一直专注于扩大其知识产权资产组合,包括动漫、真人电影、音乐和体育转播,同时缩减消费电子业务。TCL是中国历史最悠久、规模最大的电子企业集团之一,多年来一直致力于打造强大的海外业务。 今年以来,索尼在东京市场的股价已下跌21%,公司市值降至1230亿美元。同期,TCL在香港市场的股价上涨约4%,市值达到35亿美元。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
微信也不想做“老登”
作者丨kiki 编辑 | 山核桃 美编丨渔 夫 一向谨慎和克制的微信,在腾讯「四处抓虾」的进程中,终于迈出了试探性的关键一步。 3月22日,微信低调上线了名为「ClawBot」的插件,操作方式非常简单,不需要额外配置API key,只需要打开微信的「我-设置-插件」,启动「ClawBot」,复制安装口令到OpenClaw再扫码绑定微信链接,你的「微信龙虾」就出现在对话窗口了。 图源:作者 「硅基研究室」实测发现,尽管目前「微信龙虾」还存在部分功能的阉割,例如PC端看不到你的虾,无法支持群聊,内容转发也不便利等,但在拥有14亿月活用户的微信里「养虾」,还是有着明显的差异化体验—— 一是语音输入+一级入口,依托微信的社交优势,你确实有种「养虾」就像是和好友对话的感觉。二是在技术实现上,微信通过「ClawBot」插件实现了对ACP协议的支持,因此理论上「ClawBot」可以调用和连接任何的Agent,比如Claude Code、Codex等。 首次以官方插件的形式,将一个第三方AI工具集成进自身生态内,这是过去十年间,微信从未做过的事,但如果放置在腾讯开年以后围绕Agent的四面出击和产品赛马里,微信的这一步又似乎显得水到渠成。 「微信之父」张小龙曾说过:“微信核心的价值,一个是简单,一个是连接。”前者决定了微信在功能上的克制,后者则决定了微信的「去中心化」的生态。 开放OpenClaw原生插件,显然不是微信的野心所在,作为即时通讯里的基础设施,微信更想要成为的是一个超级Agent,在AI的新时代里,微信和腾讯都害怕成为「老登」。 「硅基研究室」了解到,微信此次上线ClawBot,只用了约10天,和一向对功能上线克制的微信来说,堪称是一次仓促上阵的探索。 微信上线ClawBot插件,部署门槛低 图源:作者 「仓促」带来的后果是,最早一批接入的用户发现,输入输出的气泡字体不一样,一开始无法修改bot的头像等等问题。AI博主歸藏对此的评价是:「微信这次也是急了,第一次这么快地追热点」。有网友这样评价:“小龙也小龙虾了”。 微信ClawBot的确尚有不足,在体验成熟度与功能完整性上,不及部分用户将OpenClaw集成至飞书、钉钉等IM工具的使用效果。比如,目前PC端还不支持ClawBot、无法支持群聊、内容转发不便利等。一位AI产品经理向「硅基研究室」解释,这是因为微信权限开放得还不够多。“但十天上线加一级入口,这对有着庞大用户池的微信来说已经是开放的第一步了。” 微信对外链和第三方机器人工具的管控一向很严格,但此次也加速追赶「龙虾风口」,背后究竟释放了哪些关键信号? 第一,微信团队或是看到了「IM+Agent」的可行性。 这一点,钉钉、飞书已经吃到了头啖汤,天然的入口、丰富的借口以及大量的上下文信息,Agent的落地无需再重做一遍基建。据Openclaw-China的社区3月11日周报数据,飞书在中国所有的IM工具里接入率达到了65.2% 在2026AGI-Next前沿峰会上,腾讯挖来的首席AI科学家姚顺雨也指出:“当前对于C端AI产品而言,核心瓶颈并非技术本身,额外的上下文和交互环境可能更为重要。” 腾讯首席AI科学家姚顺雨 图源:网络 腾讯高管在最新的财报电话会中也提到了一点观察:“用户通过现有通讯应用程序中的GLI(命令行界面)来控制这一代新的AI工具,在中国通常指的是微信和QQ。”他们的观察是,用户在这些具备上下文和格式的环境里,与Agent互动是最高效的。 第二,微信必须要有一个自己的官方入口,先占下Agent的调度权。 如前文所说,微信的核心价值在于连接,张小龙曾说:“公众号、小程序都是连接,微信支付是货币的连接,视频号也会变成很多的基础设施。”这些也被微信称为原子化的业务组件。 但和这些移动互联网时代的组件形态不同,Agent的黑箱化本身就具备更多不确定性,因此微信上线了龙虾插件,相当于给Agent开了一扇窄门,先把工具链、关系链等调度权掌握在自己手里,提前做风险预判。 但更为关键的信号或许是,微信正在为进化成一个超级Agent,做出铺垫。 在「龙虾热」尚未爆发时,在Agent时刻表上,对比各家的进展,如果说腾讯显得克制,微信更是不急。 相比阿里的整合统一——将千问纳入自身生态的超级Agent入口,字节的软硬兼施——一边将豆包引入手机、AI眼镜,一边引入抖音电商,微信对自身的Agent一直暧昧不明。 尽管在去年财报电话会上,腾讯总裁刘炽平就明确表示:“微信最终会推出一个Agent”,但并未给出具体的产品路线图。 即便在今年3月,推出Qclaw和WorkBuddy等龙虾全家桶时,微信对外披露了更多的Agent进度,此前据The Information报道,腾讯正在为微信秘密开发一款AI智能体,计划在年中前进行灰度测试,第三季度则向所有用户推出。 图源:微博截图 但随后腾讯云开发者AI产品负责人丁宁在被问到微信的Agent化时,又延续了克制的态度: “微信肯定一个必要的入口,且大众的呼声比较高,那在现行的条件下能做到什么程度就做到什么程度,尽人事。” 在多位业内人士看来,微信在Agent上暧昧的态度,背后的原因并不难理解。一方面,是延续腾讯内部的赛马逻辑,先用Qclaw们来试错,最后再由微信去承接深化;另一方面,微信自身庞大的体量也限制了其规模化的落地,如用户的隐私安全、通用模型的选择等。 腾讯公司总裁刘炽平也提到:“微信的用户群体很大,需要有非常高的推理能力才能支持这样的用户规模,目前没有特定的时间表。” 客观来说,微信从超级APP进化为超级Agent有其天然优势。 第一,在C端,十亿级用户的社交生态带来的流量入口和数据资源。 一方面,借助自身的社交生态,微信Agent可先满足高频的社交场景,再向低频的消费、生活服务等领域延伸,高频打低频。 另一方面,如前文所说,IM工具天然更适配Agent场景,因为具备额外的上下文和交互空间,微信凭借自身生态内掌握的支付、地理位置、消费等多维度的用户数据,本身能更快构建「数据优化体验—体验增强粘性——产生更多数据」的增长飞轮。 第二,在B端,小程序生态很有可能是微信Agent落地的另一张王牌。 微信生态内数百万小程序本身就是微信原生的标准化服务单元,覆盖了外卖、出行、电商、政务、金融等全场景,因此微信Agent如若后续能调用小程序来承接交易和服务,一来本身就有了广泛丰富的服务闭环,二来小程序背后的开发者生态也乐于拥抱Agent化。 公开资料显示,今年1月,微信就曾发布AI小程序成长计划,主要覆盖文娱、工具、社交、深度合成、资讯虚拟行业等小程序类目,主要为开发者们提供变现支持。 显然,尽管对比进度,微信发力Agent较慢,但为了避免成为老登,微信一直走在Agent化的路上。 在微信不断试探Agent的同时,腾讯高层也试图通过「小龙虾」,讲述更多的AI故事。 腾讯创始人马化腾不仅亲自为自家的龙虾全家桶站台,预告「还有一批产品陆续赶来」。近期的业绩沟通会上,还首次公开谈及了腾讯的养虾战略:“中心化和去中心化要结合一起做。” 一位互联网分析师告诉「硅基研究室」,据他的观察,腾讯的AI战略一直呈现出「后发,但迭代快」的特点,从早期混元基模的进展、元器等平台工具再到核心产品的AI化都是如此。 除此以外还有就是内部的赛马,此次腾讯龙虾产品的快速推出也是体现。 在Agent上更激进的腾讯和微信,也将自己放在了更具挑战那根「钢丝线」上。 首先,Agent赛马机制下,更激烈的内部入口争夺。 以微信内部生态为例,目前腾讯的AI chatbot元宝也在微信入口内,如今ClawBot上线,双方究竟是短期互补,还是长期打架? 其次,在AI战略上,和阿里的「云+AI」的全栈战略,字节AI in 应用的绑定,相比其他大厂的饱和式投入,腾讯依旧未能在AI上找到清晰的叙事和差异化的定位。 时间拨回2012年,微信低调上线扫一扫时,张小龙也没能想到这一功能会改变中国人的生活方式。14年之后,微信ClawBot上线,张小龙依旧没有做任何推广。 只是这一次,微信所面对的不是一个单点技术,而是一个重构未来生态的AI革命。一边是挖来姚顺雨,另一边是蠢蠢欲动的微信Agent,腾讯似乎又走上了那条,想要借两张王牌「出奇制胜」的路径,能否再度成功,似乎留给它的时间并不多了。 参考资料: 1、晚点:腾讯“龙虾战队”回应一切:伪需求、FOMO与安全 2、养虾社:当微信给OpenClaw开了一扇门
蔚来AI工程师年薪曝光:P3职级年收入可达80万?
【CNMO科技消息】近日,一则关于蔚来汽车人工智能岗位的薪酬信息在网上流传。据公众号“皖里随便唠”曝光的内部资料,在蔚来入职5年多的P3级人工智能工程师,其薪酬结构为月薪5万元、14薪,外加10万元补贴,总年薪可达80万元。另有工作年限超10年的自动驾驶算法岗员工,称自己的年终奖月数为5个月。 蔚来 据报道,蔚来采用了一套与互联网大厂相似的扁平化NCP职级体系,从P1到P6共分为六个大级别。其中,P1为实习生或助理工程师,P2为工程师,P3为高级工程师,P4为技术专家,P5为资深专家,P6则为顶尖的首席科学家或技术院士。每个大级别内还设有小分级。 该体系的亮点在于“双通道并行”与“扁平化设计”。员工可以根据自身特长,选择在技术或管理路径上深入发展,技术专家无需转向管理岗位也能获得清晰的晋升空间。同时,层级少的设计提升了沟通效率,强调以实力为导向。 近年来,算法与人工智能岗位已成为高薪代表,尤其是在自动驾驶领域,各大新能源汽车公司均投入大量预算进行人才争夺。对此,有观点认为,高薪的本质是以时间和付出换取报酬,能够承受项目压力与领导情绪,往往对应着更高的薪酬回报。 根据此前发布的财报,蔚来去年第四季度实现经营利润12.5亿元,这是公司首次实现单季度盈利。2025全年总营收达874.9亿元,同比增长33.1%;全年毛利总额为119.2亿元,同比增长83.5%,两项指标均创下历史新高。
Meta官宣推进AI内容审核 将削减外包依赖或引发裁员
3月19日,meta在官网宣布将在内容审核方面引入更先进的人工智能系统,用于识别诈骗信息和删除非法内容。此举可能帮助公司削减对外包供应商和合同工的使用,标志着这家社交媒体巨头正利用其在AI领域的巨额投入来精简运营。 meta在周四发布的博客文章中表示,新的AI系统能够更准确地发现违规行为,同时阻止更多诈骗,并能更快应对现实世界中的事件,减少过度执法错误。 据meta披露,早期测试显示这些AI系统表现优异:能检测到的成人性引诱内容量是人工审核团队的两倍,同时错误率降低超过60%;每天可识别并阻止约5000起试图骗取用户登录信息的诈骗企图。 “未来几年,一旦我们确认这些更先进的AI系统在内容审核方面持续优于现有方法,我们将逐步将其部署到所有应用程序中,从而彻底改变我们的审核方式。”meta在公告中表示,“与此同时,我们将减少对第三方供应商的内容审核依赖,转而专注于加强内部系统和人员队伍建设。” meta强调仍会保留人工审核,不会完全依赖AI系统,尤其是在涉及法律执法和账户禁用申诉等“最复杂、影响最大的决策”中,人员将继续发挥关键作用。 分析认为,这一声明是meta利用AI技术提升生产力、控制成本的最新举措。此前有消息称,meta正考虑裁员20%或更多,以抵消公司在AI领域的巨额支出。对此,meta回应称该消息“是关于理论性方案的猜测性报道”。 值得注意的是,AI替代人工的趋势正在科技行业蔓延。上月,推特前CEO杰克·多尔西创立的金融科技公司Block宣布裁减近一半员工,原因是AI正让越来越多的工作变得可以“自动化”。(陈十一)
工业和信息化部负责人会见苹果、高通、SK海力士、大众汽车、梅赛德斯-奔驰、西门子等跨国企业和商协会负责人
近日,工业和信息化部部长李乐成,副部长辛国斌、熊继军,在北京分别会见了来华出席中国发展高层论坛2026年年会的苹果公司首席执行官蒂姆·库克,高通公司总裁兼首席执行官克里斯蒂亚诺·安蒙,SK海力士株式会社社长、首席执行官郭鲁正,大众汽车集团管理董事会主席奥博穆,梅赛德斯-奔驰集团董事会主席康林松,西门子公司董事会主席、总裁兼首席执行官博乐仁,福德士河集团董事长安德鲁·福瑞斯特,格罗方德公司首席执行官蒂姆·布林,博通公司总裁兼首席执行官陈福阳以及美中贸易全国委员会会长谭森等。 工业和信息化部负责人表示,中国正大力推进新型工业化,加快构建以先进制造业为骨干的现代化产业体系,巩固壮大实体经济根基,确保实现“十五五”良好开局。中国将进一步全面深化改革,不断扩大高水平对外开放,打造市场化、法治化、国际化一流营商环境,同各方分享中国式现代化发展机遇。希望跨国企业继续深耕中国市场,与中国产业链上下游企业协同创新成长,实现互利共赢发展。 各位跨国企业和商协会负责人感谢工业和信息化部支持跨国企业在华发展的务实举措,表示愿积极参与中国新型工业化进程,进一步提升对华合作层次和水平,促进产业科技创新,提供更优质的产品和服务,共同维护全球产业链供应链稳定。 工业和信息化部有关司局负责人参加会见。 3月20日,工业和信息化部部长李乐成在北京会见苹果公司首席执行官蒂姆·库克。 3月22日,工业和信息化部部长李乐成在北京会见高通公司总裁兼首席执行官克里斯蒂亚诺·安蒙。 3月22日,工业和信息化部部长李乐成在北京会见SK海力士株式会社社长、首席执行官郭鲁正。 3月22日,工业和信息化部部长李乐成在北京会见大众汽车集团管理董事会主席奥博穆。 3月22日,工业和信息化部部长李乐成在北京会见梅赛德斯-奔驰集团董事会主席康林松。 3月22日,工业和信息化部部长李乐成在北京会见西门子公司董事会主席、总裁兼首席执行官博乐仁。 3月23日,工业和信息化部副部长辛国斌在北京会见福德士河集团董事长安德鲁·福瑞斯特。 3月23日,工业和信息化部副部长熊继军在北京会见格罗方德公司首席执行官蒂姆·布林。 3月23日,工业和信息化部副部长熊继军在北京会见博通公司总裁兼首席执行官陈福阳。 3月23日,工业和信息化部副部长熊继军在北京会见美中贸易全国委员会会长谭森及其会员企业代表。 来源:工业和信息化部国际合作司、办公厅 编辑:李丽霞、赵星汉 摄影:王 弋、梁 
联想升级万全智算平台4.0 联合英特尔至强6押注AI本地化部署
凤凰网科技讯 3月20日 随着OpenClaw等智能体引发企业对数据主权与Token成本的关注,联想于3月19日举办创新体验日,聚焦AI本地化部署,全面展示由万全异构智算平台与英特尔至强6服务器构建的算力基础设施底座。面对企业从云端转向本地的强烈需求,联想推出“一横四纵”战略,旨在将大模型转化为可控的商业生产力工具。 在核心算力调度层面,联想万全异构智算平台4.0完成预训练、后训练、推理及超智融合计算四大场景升级。该平台通过纳管数十类xPU与CPU优化异构算力协同,目前已在头部制造业接管超800节点的超智融合集群,支撑了近20个垂直领域模型的开发与数百种智能体应用的落地。 在硬件基础设施方面,联想发布搭载英特尔至强6处理器的问天与ThinkSystem服务器。新设备采用“1+3+N”架构兼容多平台芯片,并集成海神液冷及多ZONE布局技术以控制高负载能耗。数据存储环节,其NetApp AFX全闪存系统吞吐量达457GiB/s,配合AIDE引擎与LiSA智能体,在制造业及金融等落地项目中实现质检效率提升80%、存储成本降低30%。 针对大模型业务对高并发网络的严苛要求,联想推出问天NE8770-64QC 400G交换机,其端网协同ENLB方案将带宽利用率提升21%。此外,联想DCM运维管理平台引入AI运维助手,通过健康状态预测模型与全链路溯源能力,精准定位高占用进程,进一步降低混合算力环境的统一运维门槛。
阿里“二次创业”,token大爆发带来价值重估
经过长达一年的战略进攻,阿里正逐渐从AI大模型的惨烈战争中突出重围。 3月19日下午,阿里发布2026财年第三季度(自然年2025年第四季度)业绩。报告期内,阿里实现营收2848.4亿元人民币(下同);归属于普通股股东的净利润163.2亿元;非公认会计准则净利润167.1亿元。 这份财报中,最引人关注的是与AI高度相关的云计算业务。上季度,阿里云季度收入继续加速增长至36%,AI相关产品收入连续十个季度同比三位数增长。 在AI时代拉开大幕之际,阿里对于这块业务的未来走势颇为乐观。 财报发布后的分析师电话会议上,阿里集团CEO吴泳铭宣布了公司AI战略的商业目标——未来五年,包含MaaS(模型即服务)在内的云和AI商业化年收入突破1000亿美元。 以电商起家的阿里,正在全力押注AI,在业务和收入结构上开启二次创业。 阿里很早就在布局AI全栈,并以AGI为终极目标。将时钟拨回一年前,彼时的阿里在模型侧和云计算侧拥有一定优势,Qwen大模型家族和阿里云分别在各自赛道占据全球头部位置;同时,它在AI芯片领域也有长期投入。但在应用侧,阿里似乎进展较慢。 随着2025年初“DeepSeek时刻”到来,国内AI竞争愈发激烈,阿里既要进一步夯实根基,也要尽快补齐短板。 以去年2月的“三年3800亿”计划为标志,阿里AI进入了“筑基期”。 过去一年,阿里在应用侧快马加鞭,先后推出面向C端的千问,以及面向B端的悟空。两款App组成了阿里AI Agent双旗舰,并在大阿里的组织、技术、产品和业务生态支撑下,形成自己的特色和壁垒。 另一方面,阿里继续加码AI Infra,一年投入超1200亿元。Qwen大模型以SOTA为目标保持快速迭代;阿里云持续提升综合能力,针对不断高涨的token浪潮提前布局;主攻芯片的平头哥则扮演了“奇兵”的角色,最新产品性能对标英伟达H20。 到本季度财报发布时,阿里这场AI大变革取得阶段性成果。相比一年前,阿里AI最突出的变化是,它开始具备横跨软硬件、B端C端、模型应用Agent的全栈能力。 它在应用侧初步站稳脚跟,千问App的月活跃用户突破3亿,刚刚发布的悟空则成为最受关注的企业Agent平台之一。同时,“通云哥”在模型、云计算和芯片等基础领域都取得新进展,进一步挖深阿里在AI Infra层面的护城河。 特别是主攻芯片的平头哥,在当前国内AI芯片生态中,其技术和产品能力都处于第一梯队,覆盖从训练、微调到推理的完整AI工作流,且已通过阿里云在训练场景,以及百炼平台在推理场景中得到深度大规模应用。 吴泳铭在电话会上表示,平头哥自研的GPU芯片已实现规模化量产,截至今年2月累计规模化交付47万片。在阿里云的实际业务场景,60%以上的平头哥芯片服务于外部商业化客户,已完成规模化外部客户AI任务适配,支持了400多家企业客户的AI任务,涵盖互联网、金融服务、自动驾驶等多个行业。 此外,阿里近期成立Alibaba Token Hub事业群(简称ATH),统揽多个AI板块。这一吴泳铭亲自掌舵的新事业群,成为阿里AI模型与应用的主根据地,与AI云计算和芯片板块协同作战。 在这场战略突围中,阿里的基本思路是:围绕token的创造、输送与应用,重构技术、产品和业务,推动整个AI板块Agent化。 而去年底OpenClaw风靡全球,不仅推动全行业token使用量指数级增长,也让Agent时代愈发深入人心。行业侧的深刻变革,叠加阿里内部的一系列新动作,一起成为阿里AI“筑基”成功的基石。 01 对于AI迈入Agent时代,阿里管理层已经形成了清晰的认知。 “从2025年下半年到2026年初这两三个月,我们已经看到AI进入了以Agentic驱动的新时代。”吴泳铭在昨晚的电话会议上说道。 吴泳铭认为,Agent时代与早期AI阶段最大的区别,在于模型与应用之间的紧密配合,这对于如何做好模型、发展应用至关重要。 同时,早期AI主要依赖大量静态数据进行预训练。进入Agentic时代后,提升模型能力、改善应用效果的关键,越来越依赖模型与应用的紧密结合,以及在客户使用场景中形成的数据闭环。 面对这一时代变革,阿里扛起“Agent化”的大旗,在AI应用赛道打了两场翻身仗。 首先是面向C端的千问App。在“会办事”理念的指引下,它把Agent能力放在比Chatbot更重的位置。包括淘宝、支付宝、淘宝闪购、飞猪、高德在内的阿里各个业务板块,纷纷被Agent化,成为千问的AI工具箱。 背靠阿里的千问,能够与其他姊妹业务联动,快速构建Agent能力矩阵,这是其他Chatbot App所不具备的独特优势。从Chatbot型App转型升级为Agent型App,是千问给行业带来的启发。 用户也需要这样一款“会办事”的AI App。2026年初的春节战役中,千问成为国内MAU第二高的AI App。其中,囊括了多项阿里电商能力的AI购物Agent,九小时订单量突破1000万,带动超1.3亿人首次体验AI购物。 在千问App重装上阵4个月后,阿里又面向B端推出了悟空。 阿里很早就希望把AI能力输出到不同工作场景中,尤其是主攻协同办公的钉钉,做了很长时间的探索,初步完成了技术和产品铺垫。到了去年11月,钉钉逐渐形成把AI能力Agent化的思路,推出了第一个版本的悟空,定位是“通用任务处理Agent”。 今年3月17日,全新悟空亮相。这是阿里AI能力在企业工作场景的统一出口,也是全球首个企业级AI原生工作平台。同时,悟空事业部成立,意味着它将成为钉钉最重要的业务,也预示着阿里将继续推进to B场景的全方位Agent化。 至此,阿里AI agent正式形成千问主攻AI to C、悟空主攻AI to B的双旗舰格局。 阿里这两场翻身仗,并不是围绕Chatbot的零和博弈,而是面向Agent时代的提前卡位。 在Chatbot时代,各大公司之间的AI应用竞争趋于同质化,很容易陷入过度投流、“买”用户的贴身肉搏。而事实一再证明,这样的竞争无法带来真正的用户黏性和竞争壁垒,也不会改变长期格局。 面对这一情况,阿里让千问和悟空发起冲锋,并没有走Chatbot们的老路,而是跳出了低水平内卷,试图抢先抓住Agent的新机会。 与Chatbot相比,Agent型App的竞争更加多维:它除了流量和用户,还要拼全方位的线上线下服务能力、对不同工作场景的理解和渗透、对不同行业和企业的需要洞察等等。这种兼具to C和to B的竞争范式,恰恰是阿里从电商时代起就长期深耕的舒适区。 千问和悟空短时间内就取得了比以往好得多的成绩,也证明了阿里这一战选对了主攻手和进攻方向,更选对了Agent这块战场。 02 以“Agent化”驱动AI变革,也深刻影响了阿里在AI Infra和大模型领域的战略战术。 财报电话会议上,吴泳铭阐述了阿里的全栈AI布局——以芯片和云计算为AI Infra层;以Token Hub为主线,由大模型、MaaS业务和to B+to C应用组成的AI模型及应用层,两者共同构成从AI Infra到应用的完整能力。 阿里在AI Infra和大模型领域的主攻手是“通云哥”——通义、阿里云和平头哥,分别面向大模型、云计算和AI芯片三条赛道。 这三块业务承担着token的产出与分发,是上游的“发电厂”和“输电网”。随着Agent时代的到来,AI所需要的token规模指数级增长,对三大业务有了更高要求。 通义负责阿里Qwen系列大模型,Agent实际表现如何,首先要看Qwen的性能。过去几年,千问保持着高频迭代,到2026年初发布超400款大大小小、面向不同需求场景的模型,实现从端侧0.5B到云端480B参数量的全尺寸覆盖。 根据市场调研公司IDC的报告,2025年全年,千问在国内大模型市场的份额持续攀升,尤其在云基础设施、GenAI工程和GenAI模型提供商评估中,都进入全球前三、亚太第一。 同时,Qwen在产品迭代的同时,也格外注重性价比。最新的Qwen 3.5以不到200亿激活参数,实现了万亿参数级的性能,API价格仅为国际竞品的十八分之一。对于token消耗量极大的Agent服务而言,这尤其重要。 作为开源模型,Qwen除了自身使用量庞大,第三方生态也非常繁荣。根据全球最大AI开源社区Hugging Face的数据,千问衍生模型数量已突破20万个,累计下载量突破 10 亿次,是全球首个达成这一里程碑的开源大模型。 Qwen大模型能否保持行业领先,直接关系到阿里AI板块乃至整个集团的未来业绩。吴泳铭认为,关于未来五年AI与云相关业务年营收突破1000亿美元的目标,最大的增长动能来自AI大模型能力的突破。 阿里云也在全方位拥抱Agent时代。 Agent时代,token使用量是之前的几百、几千倍。AI时代的商业模型正在发生跨代际的跃迁。海量“AI Agent”作为数字劳动力凭空出现,将庞大的人力成本转化为可高效调度、无限复制的数字生产力。阿里云正式从卖算力的IaaS厂商,升级为按Token计费的高毛利MaaS科技巨头。 在持续旺盛的AI需求驱动下,本季度阿里云外部商业化收入加速增长至35%,AI相关产品收入连续第十个季度实现三位数同比增长。 过去三个月,百炼MaaS平台上公共模型服务市场的Token消耗规模提升了6倍。公司预计,商业化MaaS收入将会成为阿里云最大的收入产品。 当指数级爆发的Token需求,叠加明确的算力提价动作,阿里云正在呈现“量价齐升”态势。根据摩根士丹利测算,云业务整体合同价格每提升10%,利润率即可实现约4个百分点的扩张。阿里云的EBITA利润率有望加速向国际头部云厂商靠拢。 吴泳铭表示,当越来越多的企业开始在内部启用由大模型驱动的Agent来完成端到端的工作任务时,整个AI和云面向的IT预算市场发生了根本性的变化。 “企业在消耗Token时,不再将其视为IT预算,而是将其视为生产成本或研发成本,视为生产资料的一部分。”他说,“这是我们看到的、支撑AI长期增长最根本的内在因素。” 最后是作为AI大模型和算力基石的芯片。 大厂自研AI芯片,不仅关乎成本和供给,更关系到长期的技术路径和战略方向,乃至行业地位是否稳固。阿里 2018 年就成立了平头哥,目前自研GPU芯片规模化量产,已为云基础设施供应带来实质性贡献。 在中国,阿里是唯一一家实现自研芯片+云平台+大模型全栈垂直整合的科技巨头。放眼世界,全球四大云计算公司亚马逊、微软、谷歌、阿里,都在做云,但同时拥有芯片+云+模型全栈能力的,只有谷歌和阿里。芯片+云+模型+实体商业模式的,阿里几乎是唯一一家。 在财报电话会议上,吴泳铭认为,平头哥除了贡献百亿级别的年化营收,还能够凭借与阿里云基础设施、千问大模型的深度协同设计,来提升整体性价比。 “这是平头哥与外部芯片公司不同的一个关键点——我们更注重在整体AI能力上创造更高的性价比,同时也将成为百炼平台降低推理成本的重要支撑。”他说。 除了提升整体AI效率、降低成本之外,在当前中国AI行业的特殊背景下,平头哥还有一个重大战略价值——AI算力的供应保障。 未来3到5年,全球AI算力都将处于高度紧缺的状态,中国市场尤为突出。作为中国市场上唯一具备自研芯片能力的云计算公司,平头哥对于阿里集团而言至关重要。提供更充足的AI算力供给,将有助于阿里云和AI业务——包括MaaS业务——获得更强的增长动能。 阿里的3800亿计划刚刚走过了第一年。巨额投入的背后,除了AI行业自然增长曲线依然陡峭,更重要的是,阿里正在努力抓住AI技术范式的又一次跃迁,把握其中的巨大价值。 03 对刚刚完成AI“筑基”的阿里来说,最大的时代红利是:Agent时代方兴未艾,token大爆炸远未见顶。 不久前,瑞银在一份报告中指出,通过API聚合平台OpenRouter监测的全球AI模型每周token使用量,近几周已达到约16万亿,比今年1月的水平几乎翻了三倍。 如此迅猛的增长,关键原因只有一个:去年12月诞生的OpenClaw席卷全球,无数人和企业加入“养虾”大潮。 AI大模型发展至今,已经历两次跃升,每一次都有划时代的产品,并带来token用量迈上新台阶。 第一次是从常规语言模型迭代到推理模型,代表是去年初的DeepSeek R1。第二次则是从Chatbot到Agent,代表是Manus。第三次跃升正在发生——从被动式、单一Agent,跃升到主动式、多Agent平台,代表是OpenClaw。 每一次跃升,都会带来token——AI“电力”使用量的飞升。相比Chatbot,以OpenClaw为代表的Agent平台需要消耗几百、上千倍的token。 第四次跃升还没有真正发生,但曙光已经显现,有可能是世界模型。而计算机模拟真实世界,必然带来数据量的量级突破。阿里投入几千亿做全栈AI,瞄准的绝不仅仅是现在的token需求,而是要为更长期的AI发展提前做好准备。 汹涌的Agent浪潮,甚至让包括阿里在内的云计算平台获得了“涨价权”。 3月18日,阿里云宣布,因全球AI需求爆发、供应链成本上涨,上调AI算力、存储等核心产品价格,最高涨幅达34%。平头哥“真武”系列算力芯片的价格上涨5%至34%。 但这并不意味着,阿里从此迈上了一条康庄大道。相反,阿里正踏入“无人区”。 去年,吴泳铭提出阿里必须追求AGI,不断突破模型的智能能力的边界。这或许可以被视为阿里的长期追求。而这也是阿里花费一年时间和上千亿,补齐AI短板,构筑AI全栈能力的出发点。 但即便如此,和所有人一样,阿里依然无法预测AI的未来。 极客公园的张鹏曾记录了一件趣事:2025年初,在北京举办的英伟达答谢宴上,Manus首席科学家季逸超问黄仁勋,AI领域接下来发生什么事情,会让他觉得意外和惊讶?黄仁勋的答案是:nothing。 也就是说,连黄仁勋都看不清AI未来会怎么样。事实也的确如此:站在2025年初,没人能料到OpenClaw的崛起,也几乎没人能预判Agent时代会如此迅速到来。 但阿里必须抓住未来,关键还是“人”。 阿里AI刚刚经历了组织架构调整,成立Alibaba Token Hub(ATH)事业群。ATH是一座围绕token搭建的超级工厂。在这里,token被生产、分发和消耗。至于怎么被消耗,阿里并没有自我设限,而是希望通过创新部门不断探索。 这其实也是一种卡位,而AI时代提前卡位的公司,总是能得到垂青。 比如,Chatbot爆红时,Anthropic在埋头做vibe coding;大厂买卡堆算力,DeepSeek在搞“大力出奇迹”;大模型忙着刷分,Manus和OpenClaw悄悄发育,直到横空出世。这让他们都赢得了领先一大步的机会。 阿里同样在博取这样的契机。 2025年初的阿里,AI关键词是“补课”,尽快补齐短板。一年后,阿里在多个方面都取得了进展,Agent战略逐渐浮出水面。 在成立ATH、将AI业务握指成拳后,阿里正在沿着Agent的道路猛踩油门,力争在竞争对手反应过来之前的时间差里,建立尽可能大的领先优势,为下一场大战做好准备。 假以时日,当阿里云的年收入跨越1000亿美元大关,市场对阿里的估值坐标将发生根本漂移——从传统电商股的低PE,切换为AI科技股的EV/Sales(市销率)。若达成1000亿美元目标,仅阿里云单体估值将被推高至5000亿至7000亿美元,达到当前集团市值的2倍。这正是阿里“二次创业”的终极价值。
华为春季全场景新品发布会一文汇总:手机全系全面回归,何刚替班余承东“四界齐聚”
就在今天(3 月 23 日)下午 14:30,华为春季全场景新品发布会如期启幕。 既然是“全场景”,那新品自然会覆盖多个类别,华为带来了以 Mate 80 Pro Max 风驰版和畅享 90 系列为首的多款新品。 鸿蒙智行则是“9 车齐上阵”,在问界 M6 和尚界 Z7/Z7T 登场之余,问界 M7/M8、智界 R7 / 新 S7、享界 S9/S9T 均焕新升级。 关于本场发布会的新品情况,IT之家小编不妨带大家回顾一番。 一、Mate 80 Pro Max 风驰版 在今天的发布会中,第一个亮相的新品为华为 Mate 80 Pro Max 风驰版,号称“为极致性能而生”。 Mate 80 Pro Max 风驰版在 Mate 80 Pro Max 的基础上,取消了一颗潜望式长焦镜头,新配备风驰散热模组。 根据何刚介绍,华为风驰散热架构由仿生羽翼涡扇、隐藏式无感出风、超导热弯流翅片、智能转速调节构成。 其中,仿生羽翼涡扇、隐藏式无感出风和超导热弯流翅片均为业界首创。 除了散热模组的硬件助力性能提升,Mate 80 Pro Max 风驰版在软件上还搭载“超丝滑方舟引擎”,应用秒启提升 29%、页面秒开提升 26%、内容秒加载提升 39%、任务秒切换提升 34%、操作秒响应提升 28%。 通过 HyperSpace Memory 超空间内存技术,较友商内存压缩率高 69%、应用保活率高 100%。 并且在该技术的加持下,16GB 的内存能媲美 20GB 的体验。 得益于软硬芯云垂直整合,Mate 80 Pro Max 风驰版整机性能提升 45%。 不仅具备长时录像、游戏畅玩、畅快开播的特性,还业界首发 90 帧均衡光追,3000 万线硬件光追。 价格方面,Mate 80 Pro Max 风驰版提供 16GB+512GB、16GB+1TB 两个版本,售价分别为 8499 元、9499 元。 二、畅享 90 系列 紧跟 Mate 80 Pro Max 风驰版,华为端出的第二款新品依然是手机,为畅享 90 系列,共有三个版本。 先来看看畅享 90 Pro Max,该机拥有华为手机史上最大容量电池 —— 8500mAh 巨鲸大电池。 与此同时,还集超级聚能泵和全域灵睿节电技术于一身,前者使电池容量释放率>98%,后者让平均能效比提升 12%。 性能方面,畅享 90 Pro Max 软件内置鸿蒙 HarmonyOS 6、硬件搭载全新整机散热架构、芯片配备麒麟 8000,通过软硬芯云垂直整合,整机性能提升 38%。 “超丝滑方舟引擎”同样给到,使操作流畅度、页面打开流畅度、内容加载速度分别提升 64%、35%、85%。 此外,畅享 90 Pro Max 还支持 5A 速度、Wi-Fi 7 以及双频 GPS 三频北斗技术,这也是畅享系列首次支持 Wi-Fi 7。 并且通过了 CQC 整机耐摔五星等级认证、SGS 整机抗跌耐摔金标五星认证。 再来看看畅享 90 Plus,该机同样搭载麒麟 8000,内置 HarmonyOS 6,支持 5A 速度和 Wi-Fi 7,整机性能提升 67%。 通过鸿蒙星盾安全,具备 AI 换脸检测、AI 通话防诈、亲情防诈功能。 其它配置则包括:6620mAh 电池、双五星耐摔认证、畅享 X 键。 最后还有个畅享 90,核心配置如下图所示:麒麟 8000A,HarmonyOS 6、6620mAh 巨鲸电池、Wi-Fi 7、5A 速度、星闪、鸿蒙星盾安全、畅享 X 键。 价格方面,畅享 90 Pro Max 给到 128GB、256GB、512GB 三个版本,售价依次为 1699 元、1999 元、2399 元。 Plus 和标准版则只有 128GB 和 256GB 两个版本,Plus 定价 1499 元和 1799 元,标准版售价 1299 元和 1599 元。 值得一提的是,伴随着畅享 90 系列发布,何刚正式宣布“华为手机实现全面回归”。 他表示华为在 2023 年 8 月首先带来 Mate 60 系列手机,宣告高端产品线的回归。此次发布的畅享 90 系列全系搭载麒麟 8 系处理器,预装 HarmonyOS 6,则宣告华为手机端全产品线的正式回归。 三、WATCH Ultimate 2“旷野绿” 在手机线产品发布完毕后,随即连续亮相的三款新品均隶属于穿戴类别。 第一款是华为 WATCH Ultimate 2 非凡探索手表,迎来“旷野绿”新配色,售价 7999 元。 该表采用绿白配色的纳米微晶陶瓷表圈,套装标配钛金属、素皮复合、氟橡胶、三款表带。 针对高尔夫运动,WATCH Ultimate 2 旷野绿迎来四大全新功能升级,包括挥杆动作检测、球杆表现分析、果岭视图升级、多彩表圈计分。 通过与两步路合作,带来上千条精品户外探索路线,另外还有海豚声呐通信仪表盘。 至于更多的配置和功能,比如 eSIM、X-TAP 智感窗、小艺运动健康智能体等,则和先前发布的 WATCH Ultimate 2 一致。 四、WATCH GT Runner 2 第二款穿戴新品为华为 WATCH GT Runner 2,该表先前已在国外上市,这次官宣了国行售价 —— 2599 元。 作为一款智能专业跑表,其具备四大特性:超精准定位、专业马拉松模式、超轻薄钛合金表体、智能健康管理。 设计方面,WATCH GT Runner 2 重 34.5g、厚 10.7mm、双频全星座定位户外运动续航达 32 小时。 表壳由钛合金打造、表盘覆盖第二代昆仑玻璃、峰值亮度达 3000 尼特、配备云感呼吸编织表带。 采用立体悬浮天线,天线信号强度较上代提升 3.5 倍,具备 AI-XDR 定位算法。 功能方面,WATCH GT Runner 2 行业首发专业马拉松模式,赛前有赛事助手和智能训练计划,赛中有智能配速表和智能补给策略,赛后有数据全面记录。 同时还预置 13 门课程,提供运动心率区间指导和心电分析提示软件。 五、手环 11 系列 最后一款穿戴新品为华为手环 11 系列,同样已先于海外上架,屏幕尺寸为 1.62 英寸、峰值亮度达 2000 尼特。 该手环具备百种运动模式、跑骑暂停识别和独立 GNSS 五星定位;同时还拥有专业睡眠健康监测和多维情绪健康。 价格方面,华为手环 11 售价 269 元起,Pro 售价 389 元起。 六、MatePad Mini / Pro 12.2“幻影紫” 尽管在本场发布会中,MatePad 产品线并未迎来新成员,但是华为为两款产品安排了新配色。 MatePad Mini 悦读版和 MatePad Pro 12.2 同步新增“幻影紫”配色。 价格方面,MatePad Mini 悦读版 12GB+256GB 售价 3299 元,12GB+256GB 云晰柔光屏售价 3799 元。 华为 MatePad Pro 12.2 英寸 12GB+512GB 售价 4499 元,12GB+512GB 云晰柔光屏售价 5099 元。 七、全新 MateView GT 时隔许久,华为 MateView GT 可算是更新了,新一代于发布会中正式亮相。 这款显示器采用 27 英寸全面屏,屏占比为 91%,拥有 4K 分辨率、10.7 亿色彩、95% P3 广色域的素质。 并且这也是华为首款柔光屏显示器,配备 6 层超薄光学膜层。 据介绍,全新 MateView GT 提供高刷和超清两个模式,给到极光蓝、冰川白、星空黑三款配色。 背面采用声学涡扇的星环美学设计,是业界首款 4.1 声道显示器。 价格方面,全新 MateView GT 售价 1099 元起。 八、Vision 智慧屏 6 最后一款发布的华为新品为 Vision 智慧屏 6,可选晨光白桦、烟色胡桃两种木色边框。 该设备的一大亮点便是搭载 Super MiniLED 黑晶屏,使用双层纳米低反镀膜。 提供至高 99% 屏占比、整体薄至 4.9 厘米、具有 8GB+64GB 内存组合,售价 6499 元起。 九、享界 S9/S9T 在华为的新品悉数亮相完毕后,发布会便进入到鸿蒙智行的时间,但由于余承东身体不适,新车的介绍任务首度由何刚承担。 正如之前预热的那般,享界 S9/S9T 焕新登场,前者新增“月绒白”配色和 20 英寸双十辐星熠轮毂,后者则新增“星玫粉”配色和 20 英寸双五辐专属轮毂。 并且两款车型的内饰还新增“星云红”配色,且均升级至 896 线双光路激光雷达,售价 31.98 万元起。 十、智界 R7 / 新 S7 与享界“双 9”的情况一致,智界 R7 / 新 S7 亦喜提新色和 896 线图像级激光雷达。 两款车型外观增加“暗夜紫”和“活力橙”两款新色,内饰则可新选“赤茶橙”配色。 同时还有鸿蒙 ALPS 健康座舱加持,新增 MOFs 抗菌滤芯 + 可吸附降解材料,TVOC 净化率可达 75%+,持续吸附分解醛类有害物质和异味。 价格方面,智界 R7 售价 25.98 万元起,新 S7 售价 23.98 万元起。 需要注意的是,何刚还官宣了一个属于智界的好消息:鸿蒙智行首款 MPV 智界 V9 展车将于 4 月下旬进店。 十一、问界 M7/M8 紧跟享界和智界,问界 M7/M8 两款车型同样是颜色、硬件齐焕新。 问界 M7 这边,新增夜紫车色、全新 21 英寸星芒轮毂和 896 线双光路图像级激光雷达,售价 30.98 万元起。 而 Pro+ 版本的舱内激光视觉已支持城区 NCA,预计 4 月起全量推送。 反观问界 M8,新增“瑞红”和“湛蓝”两款配色,搭配全新 21 英寸曜影运动轮毂。 在搭载 896 线双光路图像级激光雷达的同时,还升级至 3 个高精度固态激光雷达,售价 36.98 万元起。 十二、尚界 Z7/Z7T 伴随着在本场发布会中展开详细介绍,尚界 Z7/Z7T 的预售正式启动。 设计方面,Z7/Z7T 车头配备都市流光大灯,采用璀璨晶钻工艺;车尾采用钻石晶簇尾灯,内含 4700+ 颗星钻颗粒;可选追风运动套件。 车漆使用 5C2B 涂装工艺,提供陶瓷白、杜维埃蓝、鎏金黑、清晖蓝、流光银、琥珀金绿、幻影紫、超凡粉、电光紫粉 (Z7 专属)、晚山新绿 (Z7T 专属) 配色。 内饰则可选沁夜红、速影黄、凝夜紫、闪金黑、缥云杏五种配色。 配置方面,Z7/Z7T 搭载鸿蒙 ALPS 健康座舱 2.0,中控为随动四维屏,副驾前方为灵感橱窗。 此外还有副驾零重力座椅、HUD 抬头显示、流媒体内后视镜、静音电吸门、连续可变阻尼减振器、Knock-Knock 电弹电吸前备箱。 性能方面,Z7/Z7T 标配华为乾崑智驾 ADS 4.1、华为巨鲸 800V 高压电池平台、896 线双光路图像级激光雷达、华为途灵平台。 其中,电池分为 81 度和 100 度两个规格,CLTC 最长续航可达 905km。 价格方面,Z7 预售价 22.98 万元起,Z7T 预售价 23.98 万元起,即刻预订,可享至高 11000 元购车权益。 十三、问界 M6 最后的最后,问界 M6 为本场发布会画上了句号,说起问界 M6,由于先前的多次预热,相关信息基本上都门清了,官方用“大气场、大舒适、大脑洞、大视野”来总结。 气场方面,M6 的车头采用千面晶曜大灯、风阻系数仅为 0.239cd、标配华为途灵平台、应急涉水深度为 700mm。 提供活力橙、星夜紫、流光青、曜石黑、脉冲蓝、暖云白和钛空银七款配色。 舒适方面,拥有 1.915m 乘坐空间,至高 202L 容量智能前备箱和全新人机工学运动座椅。 可选紫慕白、引力红、电光橙、韶华杏四款配色。 脑洞方面,百变副驾不仅是灵感橱窗,还可以是墨彩相册或律动香氛。 视野方面,全系标配 896 线双光路图像级激光雷达。 价格方面,问界 M6 增程版预售价 26.98 万元起、纯电版预售价 28.98 万元起,即刻预订可享价值 10000 元购车权益。 十四、总结 关于华为春季全场景新品发布会的情况,IT之家小编就回顾到这里,满打满算,共计有 9 款华为产品和 9 款鸿蒙智行车型先后亮相。 值得一提的是,在发布会的落幕时刻,何刚说了一句“我们 4 月再见”,这很可能预示着华为在下个月还要再举办一场新品发布会。 不知届时舞台的主角,是不是就该轮到 Pura 系列咯 ~
北京三部门约谈携程、高德、京东、淘宝闪购、美团、抖音、快手等12家平台企业,通报“内卷式”竞争第一批问题
2026年3月23日,北京市市场监管局联合市商务局、市文化和旅游局,依法约谈和行政指导携程、去哪儿网、高德、京东、淘宝闪购、美团、飞猪旅行、同程旅行、途家民宿、小猪民宿、抖音、快手等十二家平台企业,集中通报开展平台“内卷式”竞争综合整治以来发现的第一批问题,并提出整改要求。 此次通报的问题主要聚焦四个方面: 侵害商家自主经营权 部分平台未经商家同意,通过修改商家后台设置,擅自为商家报名促销活动;通过技术手段监控价格,要求商家按照全网最低价销售,剥夺商家定价自主权。这些行为不仅造成商家经营损失,长远来看还可能引发商品、服务质量风险。 典型事例1:淘宝闪购擅自为商家上架活动、修改商品价格,且整改流于形式。 平台与商家签署《市场经理代运营授权协议》并取得商家授权后,市场经理可不再经过商家同意,直接修改商品、参与活动、调整价格,且由商家承担授权服务所导致的一切法律结果。多个餐饮商家反映,平台未经协商将商品上架“爆品团”“爆单红包”等促销活动,且商家不可自主退出活动,造成商家经济损失。如某商家原价19.8元的“羊肉串加门钉肉饼”套餐和原价21元的西红柿鸡蛋面,被上架活动后,商家实收2.58元、3.31元;另一商家正常售价18元的饺子,被修改价格后,商家实收1.25元,难以覆盖原材料成本。平台对监管部门的整改要求,落实不到位不彻底。下一步,监管部门将开展外卖平台代运营行为的专项治理,严格规范平台相关行为。 典型事例2:携程自动跟价,剥夺酒店定价权。 多家酒店反映携程通过技术手段实时抓取客房全渠道价格,要求给予携程平台最低价格。酒店若不配合,平台通过电话施压、限制流量、自动跟价等方式,直接干预定价。监管部门已督促指导携程下架“调价助手”。 设置不合理规则 部分平台利用优势地位,制定不合理规则,通过罚款、限流等处罚措施,增加商家经营负担。 典型事例3:携程制定不合理“切客”判定和处罚规则。 在携程规则中,将“消费者在携程平台上下单,但酒店引导消费者避开携程,直接交易或通过其他第三方渠道进行交易的行为”认定为“切客”。经调查,平台在判定“切客”过程中,对于消费者线下办理酒店续住业务,或个人原因退订选择其他渠道入住酒店等情况,仍认定该交易由平台促成,要求酒店支付全额佣金,并对酒店进行限制流量等处罚。监管部门已指导携程优化“切客”规则,对线上预订线下续住等行为,不得判定为“切客”。 虚假宣传行为 通过虚假宣传手段,诱导消费者购买商品,侵害消费者合法权益。 典型事例4:第三方火车票网络销售平台虚假宣传。 平台推出“抢票加速包”“双通道”等付费服务,进行“显著提高抢票成功率”“优先购票”等具有误导性的商业宣传,将12306官方平台免费提供的候补购票服务包装为平台专属增值权益。2026年1月30日,监管部门已就相关问题约谈去哪儿网等12家第三方火车票网络销售平台,要求严格落实主体责任,坚决整改违规行为,禁止虚假宣传。 典型事例5:携程“大拇指”标识误导消费者。 携程在与平台合作密切的特牌、金牌酒店名称之后标注橙色、红色“大拇指”标识,但该标识与真实服务水平无关,涉嫌误导消费者。监管部门已指导携程取消“大拇指”标识。 典型事例6:高德促销标识未及时更新。 高德“百亿补贴”活动结束后,但相关标识仍在酒店板块展示,涉嫌误导消费者。监管部门已指导高德整改。 部分平台合规经营管理体系存在短板 合规经营管理组织虚设,人员责任界定不清,合规经营机制未能发挥实际作用。 典型事例7:去哪儿网合规经营机制空转。 对合规经营建设重视不足,未实际建立合规经营管理组织,缺乏系统的合规经营管理机制,对重大促销活动、修订重要规则等事项的风险排查力度不足。 典型事例8:京东合规经营管理弱化。 合规经营管理组织架构未动态更新,关键岗位职责不够明确,机制运行的有效性需要进一步提升。监管部门通过合规评价等方式持续指导各平台完善合规经营机制。 约谈会上,市场监管部门向相关平台送达《行政告诫书》,要求严格落实主体责任,限期整改相关问题;保护平台内经营者和消费者合法权益,禁止强制或变相强制平台内经营者按照其定价规则,以低于成本的价格销售商品,扰乱市场竞争秩序。对涉嫌违法问题,有关部门将深入调查、依法查处,涉及京外平台企业的,依法移送属地市场监管部门调查。各平台表示,高度重视约谈指出的各项问题,将认真反思、立行立改,并举一反三,深入查找、及时整改“内卷式”竞争风险隐患,促进平台和平台内经营者、劳动者共赢发展。 下一步,三部门将继续深化平台“内卷式”竞争综合整治,持续公开通报发现的违法违规问题,紧盯整改落实情况,对整改不力、问题反复、顶风违规的平台企业,依法依规采取措施。建立多方协商机制,组织平台就规则制定、促销活动等听取各方意见,形成长效预防机制,推动平台经济规范健康发展。 (总台记者 沈立 吴琼)
影石创新回应被大疆起诉:多数专利因产品方向调整未在实际产品中使用
凤凰网科技讯 3月23日,针对大疆起诉影石创新涉及专利归属纠纷一事,影石创新CEO刘靖康今日作出公开回应。大疆主张,其前员工在离职一年内产生的专利应归大疆所有。影石方面表示,经排查,涉案专利的创意、研发及验收均在影石内部完成,其中涉及飞控领域的一项专利为“一键实现跳楼飞行效果”,因当前限飞政策未实际应用。 影石解释,部分专利申请在国内阶段隐藏发明人姓名,是为延迟技术人员信息暴露,属于行业常见做法,并非针对大疆。影石称,涉诉专利申请时间多在四至五年前,多数专利因产品方向调整未在实际产品中使用。 影石同时指出,其与GoPro、大疆存在专利交叉情况,此前已花费超1000万美元在海外应对GoPro诉讼并胜诉。影石表示,公司资源优先投入研发,仅在专利阻碍新产品推出时才会主动发起诉讼。目前,影石计划于今年推出七至八款新品,包括云台相机、领夹麦克风及另一款无人机。影石称,将尊重法律程序,不畏惧专利诉讼,但优先通过创新拓展市场。 据《经济参考报》报道,近日,深圳市大疆创新科技有限公司在广东省深圳市中级人民法院正式起诉影石创新,涉及6项专利权属纠纷,多名前大疆核心研发人员被指参与。目前,法院已正式立案。 据悉,这是大疆首次在国内提起专利权属纠纷,大疆指控影石创新申请的涉案专利主要集中在无人机飞行控制、结构设计、影像处理等关键技术领域。据了解,大疆在诉状中指出,涉案专利系前员工离职后一年内作出的发明创造,这些发明与员工在大疆任职时的工作任务密切相关。
美国,正式进入机器人杀人时代
中国机器人忙着上春晚进流水线,没白没黑地搬砖,卷生卷死。美国机器人就更拼命了,直接上前线了。 美国的基础未来工业公司(Foundation Future Industries)与美国军方签订了总价值2400万美元的研究合同,已于2月在乌克兰部署2台该公司的幻影(Phantom)MK-1人形机器人。 这应该是人形机器人头一回上战场接受实战考验。 可是人形机器人上战场能干啥? 这就得看这款幻影MK-1的参数了。 根据基础未来工业公司官网的介绍,幻影MK-1身高一米八,体重八十公斤,活脱脱一个成年男性的体格,但好像又更强壮一些——能搬运80斤重物,时速六公里。 人形机器人在灵活性上比不上人类,不过幻影MK-1借助灵巧手等零部件,也能做到19个自由度,也是相当灵活了。 看到这些参数,你也能猜到,这款人形机器人可以携带不少武器,包括手枪、霰弹枪和M-16步枪等。它采用专有摆线致动器技术,运行静音且动力强大,可以维持其隐蔽运动。 更妙的是,其热信号与人类相似,可干扰敌方侦察设备,误以为它是真人。 这些指标意味着,机器人能先于士兵进入建筑、狭小空间或洞穴等高风险场景侦察;能提前搬运补给、排查爆炸物;从技术上,已具备替代人类士兵执行部分危险任务的能力。 这么一说,配上幻影MK-1通体乌黑的大体格子,还真是烟熏的太岁,火燎的金刚,专门往危险的区域里钻也不心疼,毕竟它哪怕被摧毁也就有点可惜,比起真人被打死还是好多了。 不过幻影MK-1也没有想象中那么智能,起码现在它的控制方式还是人机交互,还需要操作人员后台发令,机器人才会执行任务。 如果不是通过AI自主决策行动,还只是人类操作的话,幻影MK-1除了像人,也没比俄乌战场上早已出现的多种无人武器先进太多。 俄乌已经打了四年了,无人车、无人机等无人武器早就广泛应用。 去年,就有乌军使用自杀式无人机和装载炸药的无人车攻击俄军阵地。为防止无人车爆炸,某据点里的俄军向无人车举手投降。 这一幕震惊了很多人,人类居然没看见具体的敌人就向无人武器投降了。 但既然这一幕能被摄像头拍下来,说明无人武器背后还是人类在操作,人类在决定这些敌人是否能够投降,并不是完全的AI自助决策。 随着具身智能发展,AI在战场上自主决策的一天很快就会到来了。 美国另一家军事科技公司Scout AI预测,未来五年内,有人操控的无人机将会消失,人类对无人武器的操控会失去意义。 Scout AI在推动机器人自主杀人的未来成为现实——它正在和五角大楼谈2.25亿美元的AI武器系统合同。 如果AI自主决策战争真的实现,将会对人类社会造成重大冲击。 我们现在开玩笑说AI“吃人”,要么说的是AI减少了工作岗位导致人失业,要么是AI导致电费、内存价格等物价上涨让人不堪重负,都不是直接杀人。 可AI用在武器自主决策上,就真的是直接杀人了。 工业时代的总体战,催生了福利国家制度——国家以福利、权利换取公民的参战与劳动,公民因不可替代成为国家博弈的筹码。 而AI主导的智能化战争,让战争从 “人力密集型” 转向 “资本密集型”,胜负取决于高科技企业、巨额资本与少数专业军人,普通公民的价值被彻底弱化。 到时候人类不仅创造力不如AI,破坏力也不如AI了,人类与AI博弈彻底失去筹码。 全世界只会剩下少数“终产者”坐拥大量财富,用他们的狗腿子AI镇压杀戮任何敢于反抗的普通人,甚至最终真的实现了“硅基统治世界”,连少数“终产者”都被AI干掉了。 这可真是过于黑暗但有可能发生的未来。 “史上首次俄军向机器人部队投降”,揭秘背后:乌有数百个秘密工坊正打造机器人军队,灵感来源或是杂志、网络视频,俄开发抗干扰无人机 https://mp.weixin.qq.com/s/Ep1QjxG7BTZBbpE7BfX-zA 战略深解读|无人作战正在颠覆认知:从武器到战场主体的深刻变革与社会反思 https://mp.weixin.qq.com/s/8YnNQR2Oz1Vl9D4S2T0pWA 人形机器人首次在俄乌冲突前线部署 https://mp.weixin.qq.com/s/wFF9tjXUJj2yq8gbqLwJ_w 人形机器人正被部署至乌克兰前线 https://mp.weixin.qq.com/s/M017vWyDkol9pAS5JkNadg
AI大神卡帕西自曝:玩龙虾玩出“AI精神病”,token不烧完就焦虑
编译 | 陈骏达 编辑 | 李水青 智东西3月23日报道,在上周六发布的播客中,OpenAI联合创始人、AI大牛Andrej Karpathy(安德烈·卡帕西)系统梳理了自己在AI编程和OpenClaw浪潮中的一线体感与方法论,他笑称由于AI领域的飞速发展,自己仿佛出现某种“精神错乱”,在不同新事物之间疲于奔命。他还发现,当下AI编程智能体的瓶颈已不只是模型能力:“Agent做不好,多半是Skill问题。” “我现在几乎一行代码都没再亲自写过。”在Karpathy看来,软件工程的工作流已经在短短几个月内被Agent彻底改写。现在不是人写代码,而是人用自然语言调度一群智能体完成系统级任务。过去他80%代码靠自己,如今变成80%交给Agent完成,甚至更高。 除了将Agent用于编程之外,OpenClaw的爆发也改变了Karpathy的生活。他打造了一个名为“多比”的OpenClaw,直接“接管”家庭,自动扫描并接入音箱、灯光、安防等设备,自主寻找API、建立控制面板,还能在陌生人接近时发预警。 这一经历让Karpathy得出判断:许多App都应该是Agent可调用的API,Agent就是粘合剂。OpenClaw之所以特别,不是因为某个功能最强,而是它更接近人们心目中的AI形态。 值得一提的是,在预告这期播客的推文下,Karpathy在OpenAI的前同事、OpenAI o1模型作者之一Noam Brown发了一条颇有“火药味”的推文,质疑Karpathy在这一关键时刻,为什么不在AI前沿实验室好好做研究。 对此,Karpathy也在播客中做出正面回应,如果深度绑定一家前沿AI实验室,就很难保持完全独立的立场,离开后反而与人类整体的立场更为对齐。财务激励与社会责任之间存在“利益冲突”,这也是OpenAI创立时就存在的问题,至今未能解决。 Karpathy认为,在前沿AI Lab干一段时间,做一些高质量工作,然后再离开,是个不错的方式——既能跟上真实进展,又不至于完全被某个实体控制,还给生态做了贡献。这番表态,颇有点“普罗米修斯盗火”的意味,或许真是他从OpenAI急流勇退的原因。 在这期播客中,Karpathy还就自动化研究、大模型能力“锯齿化”、开源与闭源竞争格局,以及AI对就业与软件形态的重构分享了自己的思考,以下是这期播客的核心内容: 1、AI编程:去年12月以来,AI编程的范式已经彻底改变,如今人其实不是在编程,而是在向Agent表达自己的想法。 2、生产力焦虑:行业目前最焦虑的已经不是能不能跑满GPU了,而是能不能用完token,“订阅没用完我就焦虑,说明我的token吞吐量没拉满。” 3、自动研究:AI已经能高度自动化地完成复杂研究任务,人类要做就是把人从所有流程中撤走,尽可能自动化,追求极高的Token吞吐量。 4、模型能力呈锯齿状分布:模型在不同领域的能力仍然参差不齐,如今与AI对话的感觉,就像是同时在和一个天才程序员和一个10岁小孩对话。 5、泛化问题:智能并没有全面溢出,可验证能力的提升并不会带动模型软性能力的提升。比如,模型在代码上变强了,但讲笑话还是五年前的烂梗。 6、职业选择:在前沿实验室工作并不自由,有太多利益纠葛和立场约束,在这些机构之外,反而更接近“人类整体”的立场。 7、开源v.s.闭源:完全封闭的智能还是有系统性风险的。开源模型如果并非最强,最好也只是稍微落后,扮演行业的“共同工作空间”角色,确保权力平衡。 8、单一大模型v.s.专用小模型:大模型会出现更多“物种分化”,但是持续学习、微调和权重修改等相关技术仍未成熟。 9、机器人:操作原子(物理世界)要比操作比特(数字世界)难上100万倍,但物理世界的总潜在市场(TAM)可能比纯数字世界还大。 10、AI与教育:人类互相教授知识的时代要结束了,未来教育的模式可能是先让agent搞懂,然后让它来教人。 以下是播客内容的完整编译: 01. AI“龙虾”编程效果不佳? 多半还是Skill问题! 主持人:我记得有段时间走进你的办公室,看到你非常专注,我问你在做什么,你说“我必须每天‘编程’16小时”。编程甚至都不是正确的动词了,你其实是在向Agent表达自己的想法。跟我说说你的体验。 Karpathy:我感觉自己一直处在一种“AI精神错乱”(AI psychosis)的状态,现在也经常如此。因为作为个体,你能实现的事情变得更多了。过去你会受限于打字速度之类的因素,但现在有了这些Agent,情况完全不同了。 从去年12月开始,我的工作方式迎来真正的转折点:原本我手写80%的代码,剩余20%交给Agent,现在变成了20%自己写、80%交给Agent,甚至可能还不止80%。从那时起,我几乎一行代码都没再亲自写过。 随便找一个软件工程师,去看看他们在做什么,你会发现他们构建软件的默认工作流,从去年12月开始已经彻底改变了。 这是一个极其巨大的变化。我也跟我父母聊过这件事,其实普通人并没有意识到改变正在发生,或者没有意识到它有多戏剧性。 所以我现在的状态就像是“精神错乱”了一样,试图搞清楚到底哪些事是可行的,并把这些可能性推向极限。我会想:怎么能不局限于单次会话的Claude Code或Codex?怎么能拥有更多?怎么才能更合理地利用这些能力?这些OpenClaw到底能用在什么场景?新东西实在太多了。 我觉得自己必须站在最前沿。我在Twitter上看到很多人在做各种尝试,听起来都头头是道。如果我不处在前沿,就会感到非常焦虑。这种“精神错乱”状态,本质上是因为我们还在探索“什么是可能的”,而这个领域从根本上说仍是未知的. 主持人:如果你都感到焦虑,那我们其他人就更不用说了。我们有个合作团队,他们的工程师完全不手写代码,所有人都戴着麦克风,一直对Agent低语。这是有史以来最奇怪的工作场景。我以前觉得他们疯了,现在我完全接受了,“哦,这才是正道”。你只是领先了一步。你觉得现在自己探索或做项目的能力受限于什么? Karpathy:Agent做不好,多半是人没掌握好Skill。不是它不行,是你还没摸清楚怎么把现成的东西组合起来。比如agents.md文件里的指令写得不够好,或者没配个好用的记忆工具,归根结底都是Skill问题。 最好的办法是让Agent并行干活,就像Peter Steinberg(OpenClaw作者)那样。Peter有张特别逗的照片——他坐在显示器前,屏幕上铺满了一堆Codex Agent。如果提示词写得对,再开个高强度推理模式,每个任务差不多要跑20分钟。他手上大概有10个repo要检查,就来回切换着给Agent分配工作。 这样你就能用更大的颗粒度去操作了,不是“这儿改一行代码,那儿加个新函数”这种小打小闹,而是“这个新功能交给Agent 1,那个新功能不冲突,给Agent 2”,然后根据你对代码的重视程度去审查它们的产出。 这些就是操作代码仓库的“宏观动作”。一个Agent在做研究,一个在写代码,另一个在规划新的实现方案,所有事都在这些宏观动作里推进。你得努力精通这套玩法,练出肌肉记忆。这事儿特别有回报,一来是真的有用,二来是你在学新东西。所以才会“精神错乱”。 02. “订阅没用完我就焦虑, 说明我的token吞吐量没拉满” 主持人:我的直觉是,每次等Agent干完活儿,都觉得自己应该多干点别的,对吧?如果token还富余,就该并行塞更多任务进去。这挺有压力的,因为要是你不觉得token花费是瓶颈,那系统里真正的瓶颈就是你自己了。 Karpathy:起码说明你订阅的额度没用满。理想情况下,Codex跑满了就该切到Claude或者别的。我最近一直在试这个模式,订阅没用完我就焦虑,说明我的token吞吐量没拉满。 我读博的时候其实也经历过这种事,GPU没跑起来就焦虑——明明有GPU算力,FLOPS却没榨干。但现在不是FLOPS了,是token。你的token吞吐量是多少?你指挥着多少token在跑? 主持人:我觉得挺有意思的,过去至少十年,很多工程任务里大家都不觉得受计算限制,而目前整个行业突然变得受资源限制了。现在能力突然跃升了,你就会发现“哦,原来不是我搞不到算力,瓶颈是我自己”。 Karpathy:是Skill问题。研究这事儿能让你变得更好。我觉得挺上头的,因为你变强了就会解锁新东西。 主持人:你觉得会往哪儿发展?比如Karpathy每天迭代16小时,其他人也在用编程Agent变强,一年后你达到的精通水平,会是什么样? Karpathy:精通是什么样?年底,还是两年、三年、五年、十年后?我觉得大家都想往技术栈的上层走。不是单次和Agent聊天,而是多个Agent怎么协作、团队怎么配合,大家都在摸索那会是什么样。 然后我觉得OpenClaw也是个有意思的方向,因为我说的OpenClaw是指那种把持久性提升到新层次的东西。它是那种持续循环运行的,不是你交互式参与的,它有自己的小沙盒,自己干事儿,哪怕你不盯着,还有更复杂的记忆系统之类的,这些Agent里还没实现。 OpenClaw的记忆系统就比默认的大模型复杂多了,默认只是上下文满了就压缩记忆。 主持人:你觉得OpenClaw是不是凭借这一点打动了用户,还是更广泛的工具访问? Karpathy:我觉得OpenClaw有很多非常好的想法。Peter做得特别棒。我最近见到他聊过,他挺谦虚的,但我觉得他同时在五个不同维度创新,然后整合到一起。比如那个“灵魂文档(soul.md)”,他真的精心打造了一种有吸引力、有意思的人格。我觉得现在很多Agent都没做对这点。 Claude的人格就不错,感觉像队友,跟你一起兴奋。有意思的是ChatGPT里的Codex很活泼、很有活力,但Codex这个编程Agent就很枯燥,好像不在乎你在创造什么,虽然完成了,但是它好像不理解我们在构建什么。 主持人:确实。 Karpathy:还有一点,比如Claude,我觉得他们把模型的“人格”调得挺好。Claude夸我的时候,我确实觉得配得上。因为当我给它的想法不太成熟的时候,它反应就不强烈。但按我自己的标准,真是好想法的时候,它好像会多奖励一点。我有点想赢得它的夸奖,这真挺奇怪的。 人格很重要,很多其他工具可能没那么重视。Peter真的很在乎这个,所以做对了。然后是记忆系统,还有通过单一WhatsApp入口,访问所有功能,这个设计很不错。 03. “一切都应该是API端点, Agent是粘合剂” 主持人:你个人用OpenClaw做过什么编程之外的有意思的事吗? Karpathy:1月份的时候,我经历了一段“OpenClaw精神错乱”时期。我搭了个照顾家的OpenClaw,叫它“家养小精灵多比”。我用Agent找家里局域网上所有智能家居子系统,还挺惊讶居然开箱即用。 我只是跟它说“家里有Sonos,你能找找吗?”它就做了IP扫描,找到Sonos音箱,结果没密码保护,直接登进去了。然后它开始逆向工程,看看这些系统是怎么工作的,也做了些网络搜索,直接找到API端点,问我想试试吗,然后音乐就出来了。 灯光也一样。它基本上是黑进了系统,搞清楚了整个系统,创建了API,创建了仪表盘,我能看到家里所有灯的指挥中心,然后开关灯。我可以跟它说:“多比,要睡觉了”。这条指令就可以把所有灯关掉,它还控制着我所有的灯、空调、窗帘、泳池、水疗吧,以及安保系统。 我有摄像头对着房子外面,每次有人进来,首先会进行变化检测,然后基于变化检测去调Qwen,最后给我发WhatsApp消息,显示外面的图像,比如:“嘿,FedEx卡车刚到了,你可能想检查一下,你收到邮件了。”这是多比刚给我发的,真的很不可思议。 多比管着房子,我通过WhatsApp跟它发消息,这些宏观动作真的很有意思。我还没真正推得更远,我觉得有人在做更疯狂的事。但就算只是家庭自动化设置,我以前要用六个完全不同的App,现在不用了,多比用自然语言控制一切,很神奇。我觉得我还没完全推到这个范式的极限,但已经很有帮助、很有启发了。 主持人:你觉得这从用户体验角度说明了人们想要什么吗?因为学习新软件、新UI是需要人类努力的,这在过去被忽视了。 Karpathy:某种程度上是对的。OpenClaw实现的东西,本质上是从“人们觉得AI应该是什么样”这个角度倒推出来的。人们心目中的AI其实不是原始意义上的大模型——大模型就是个token生成器,但人们想象中的AI是那种有人格、有身份的存在,你可以跟它分享事情,它也会记得,就像WhatsApp背后的某个实体,更好理解。 所以某种程度上说,OpenClaw匹配了人类对AI行为的既有期望,但底层有很多技术细节。比如大模型作为原始原语对大多数人来说太“原始”了,对很多人来说不能真正被当成AI来看待。 主持人:我觉得这就是我们理解AI的方式,把它描述成多比或某种人格显然能引起共鸣。我觉得你把六个不同的软件系统统一起来做家庭自动化,也指向另一个问题:人们真的想要我们今天拥有的所有这些软件吗?你所做的就是把这些硬件的软件层或UX层扔掉了。你觉得这是人们想要的吗? Karpathy:我觉得有种感觉是,应用商店里那些配套智能家居设备的App,某种意义上根本不应该存在——不应该就是个API吗,Agent不应该直接调用吗?我能做各种家庭自动化,任何单个App都做不到。大模型能驱动工具、调用所有正确的工具、做相当复杂的事。 这说明业界可能生产了太多定制App,它们不应该存在,因为Agent把它们都统一起来了,一切都应该更像是暴露出来的API端点,Agent是粘合剂,是实际调用所有部分的智能。 另一个例子是我的跑步机,有个跑步机App,我想记录做有氧的频率,但我不想登录网页UI、走流程什么的。这些都应该只是开放的API,这是走向Agent化网络或Agent优先工具的方向。所以行业必须在很多方面重新配置,客户不再是人类,而是代表人类行事的Agent,这种重构可能会相当彻底。 有人反驳说,我们期望人们vibe code这些工具吗?普通人要做我刚才描述的这些吗?但某种程度上这只是今天的技术现状,现在有vibe coding,我在观察、在跟系统合作。 但我觉得我刚才说的这些,一两年或三年后应该是免费的,没有vibe coding参与,这是微不足道的,是基本要求,任何AI甚至开源模型都能做这个。 主持人:大模型应该能很容易地把不熟悉技术的人的意图,翻译回去。 Karpathy:今天还是需要vibe coding,但没多少人会做。 主持人:而且你还得做些设计决策,对吧?比如取帧。 Karpathy:但我觉得门槛会降下来,只是为你服务的临时软件,某个OpenClaw处理所有细节,你不参与。它有台机器,会搞清楚,只给你呈现UI,你说话就行。 主持人:你为什么没把个人用OpenClaw的边界推得更远?是因为你专注更重要的项目,比如自动研究,还是在研究如何精通Vibe Coding,或者其他原因? Karpathy:我觉得我分心了。我花了一周在OpenClaw的东西上,但还有更多尝试可以做。我没给它邮件、日历和其他东西的访问权限,因为我还有点怀疑。它还很新、很粗糙。我不想给它我数字生活的完全访问权。部分原因是安全、隐私,也许这是主导因素。但部分也确实是因为我被分心了。 04. AI已能“自动研究” 人类别拖后腿 主持人:你探索“自动研究”的动机是什么?你一直在说,想让Agent做训练或至少优化模型的任务。 Karpathy:我早先有条推文,大意是为了充分利用现在可用的工具,你必须把自己从瓶颈中移除,你不能在那里写提示词,指挥模型做下一件事,需要把自己抽离出来,安排好任务让它们完全自主。怎么在不参与循环的情况下,最大化你的token吞吐量,这才是目标。 现在要做的就是增加你的杠杆,我只输入很少的token,偶尔一次,但是有大量事情正在发生。 人们喜欢这个概念,但可能没完全想通含义。对我来说,自动研究员就是上述观点的案例之一——我不想做研究者,看结果什么的,我在拖系统后腿,所以问题是怎么重构所有抽象层。 我们要做的就是让Agent能运行更长时间、不用你参与、代表你做事。所谓的自动研究员就是,你告诉Agent,这是目标,这是指标,这是能做和不能做的事情,放手去做吧。 主持人:你对它的有效性感到惊讶。 Karpathy:对,我没想到会有效。我有nanoGPT这个项目,很多人不理解我对训练GPT-2模型的着迷,但对我来说,训练GPT模型只是个小工具、小游乐场。我真正更感兴趣的是递归自我改进这个想法,以及大模型能在多大程度上改进大模型。所有前沿实验室都在做这件事,他们都在大致尝试递归自我改进。 这个项目对我来说就是一个小游乐场。我已经用经典的手工方式调过nanoGPT了——我是研究者,做了大概二十年。我做了很多实验,做了超参数调优,做了所有事,非常熟练,达到了某个点,我觉得调得相当好了。 然后我让自动研究跑了一晚上,它给我带来了我忽略的调优空间,比如我确实忘了值嵌入的权重衰减,我的Adam beta没充分调好,这些东西是联合交互的,一旦调一个,其他的也可能要变。 我不应该是瓶颈,我不应该跑这些超参数搜索优化,我不应该看结果,这种情况有客观标准。所以你只需安排好Agent,让它能一直跑下去。我很惊讶它找到了这些调优空间,代码库已经高度优化了。 而这还只是单循环,前沿AI实验室有数以万计GPU的集群。不难想象,可以在较小模型上进行大量这种研究。所有前沿AI模型都是关于外推和Scaling损失的,可以在较小模型上做大量探索,然后尝试外推出去。 主持人:你的意思是,如果能更好地进行这种实验,那研发效率会大幅提升,在扩大模型规模时,也会有更明确的方向。 Karpathy:是的。我觉得目前最有趣、可能也是顶尖实验室正在攻克的项目,就是在小模型上做实验。你会试图让实验过程尽可能自动化,把研究员从环节中踢出去。研究员们往往有种“过度自信”,其实他们不该插手这些过程。你得重写整个流程,虽然现在研究员还能提供点想法,但不该由他们去执行。 想象一下,有一个点子队列,可能还有一个“自动化研究员”,它根据所有的arXiv论文和GitHub仓库产生灵感并输入队列;人类研究员也可以贡献点子,但它们都进入同一个队列。然后由自动化Agent去抓取任务并尝试。行得通的代码就进入功能分支,人工只需偶尔监控一下并合并到主分支。 总之,就是把人从所有流程中撤走,尽可能自动化,追求极高的Token吞吐量。这需要重新思考所有的抽象层,一切都要推倒重来。这非常令人兴奋。 05. AI能力呈“锯齿状”分布: 有时像天才,有时像10岁小孩 主持人:如果我们再往深处推演一级,模型什么时候能写出比你更好的“program.md”? Karpathy:“program.md”是我尝试描述自动化研究员如何工作的一个简陋草案——比如“先做这个,再做那个,尝试这些架构或优化器的点子”。我只是用Markdown随手写出来的。你肯定想要一种自动化研究循环,去寻找更优的方案。你可以想象,不同的“program.md”会带来不同的进展。 每一个研究机构其实都可以由一个“program.md”来描述。一个研究机构就是一组描述角色和连接方式的Markdown文件。你可以想象一个更高效的机构:也许他们早上的会更少,因为那纯属浪费时间。既然这一切都是代码,你就可以微调它:有的开会少,有的偏好高风险。 你可以打造多个不同的研究机构,每个机构都以代码表示,有了代码就可以对其进行优化。你可以分析进步是从哪儿来的,然后调整“program.md”,让它多做有效的事,少做没用的事。 主持人:这就是元优化(Meta Optimization)。 Karpathy:这主意很棒,但得一步步来。这就像剥洋葱:现在大模型部分已经是常态了,智能体部分也是常态了,像OpenClaw也是常态了。现在你可以拥有多个实体,给它们指令,甚至对指令进行优化。这信息量确实有点大,甚至让人感觉有点“精神错乱”,因为它是无限嵌套的,而且一切都还处于早期阶段。 主持人:如果我们要判断当下,什么样的技术才是核心?我们是否应该在各个领域都尝试实现这种“去人化”的自动化循环?核心是建立指标,还是创造让Agent在没有你的情况下持续工作的能力。那“性能工程”(Performance Engineering)还有地位吗? Karpathy:关于AI生态我有几点想提醒。第一,这种模式极其适合那些有客观指标、易于评估的领域。比如编写更高效的CUDA算子。有一段低效代码,想要一段行为完全一致但速度更快的高效代码,这是自动化研究的完美场景。但如果你无法评估,你就没法对其进行自动化研究。 第二,虽然我们能看到下一步,但模型的基本功层面其实还有很多不足,没完全跑通。如果你步子跨得太大,最后可能反而没用。现在的模型虽然进步很大,但在某些方面还是比较粗糙。我感觉自己同时在和一个天才级的系统程序员以及一个10岁小孩对话。 这种“锯齿状”(Jaggedness)的能力分布很奇怪,人类的能力通常更均衡。有时候我要求一个功能,结果Agent给我的完全是错的,然后陷入完全错误的循环,我就特别崩溃。明明能感觉到它的强大,但它偶尔还是会干出完全没道理的事情。 06. 模型能力“泛化”仍然存疑, 一切都卷在不透明的神经网络里 主持人:当我发现Agent在一些显而易见的问题上浪费了大量算力时,我会非常恼火。 Karpathy:我猜这背后的深层原因是:这些模型是通过强化学习(RL)训练的。它们也面临我们刚才聊到的问题:实验室只能在可验证、有奖励反馈的领域提升模型。代码写对了吗?单元测试过了吗?这些好办。 但它们在比较“软”的东西上就挣扎了,比如:我到底想要什么细微差别?我意图是什么?什么时候该反问我求澄清?凡是感觉比较模糊、不明确的领域,它们就明显差很多。 所以你要么就在轨道上,属于超级智能的一部分,要么就偏离轨道,进入了不可验证的领域,然后一切就开始漫无目的地游荡。 换个说法:你今天去用最强的ChatGPT,说“给我讲个笑话”,你大概率知道会得到哪个笑话。 主持人:我猜ChatGPT大概翻来覆去就那三个笑话。 Karpathy:没错。所有大模型最爱讲的笑话永远是:“为什么科学家不信任原子(Atoms)?因为它们构成了(Make up,也有编造之意)一切。” 这是三四年前模型讲的笑话,现在依然是。尽管模型在Agent任务上已经能移山填海,可你一让它讲笑话,它还是五年前的烂梗。 因为这不在强化学习的优化范围内,它是“锯齿状能力”中的洼地。模型能力提升的同时,讲笑话的能力并没有提升。它没有优化,而是停留在了原地。 主持人:这是否说明我们在“泛化”意义上并没有看到更广的智能——比如讲笑话的聪明度并没有跟写代码的聪明度绑定在一起? Karpathy:对,我觉得确实存在一定程度的解耦。有些东西可验证、被重点优化;有些东西没有被优化。有些领域实验室根据训练数据随意优化,有些根本没动。 主持人:有一些研究组的前提是:如果你在代码生成等可验证领域变得更聪明,就应该在所有领域都更聪明。但笑话这个例子说明,至少目前并没有发生全面的溢出。 Karpathy:我也不觉得发生了。我觉得有一点点,但远没有达到让人满意的程度。 主持人:人类也有这种特质。你可以数学极其厉害,但讲笑话巨烂。 Karpathy:但这也说明,我们并没有得到那种“模型越强,所有领域的智能都自然而然跟着变强”的故事。并不是这样。存在盲区,有些东西根本没被优化。这一切都卷在不透明的神经网络里。 如果是获得针对性训练的能力,就会光速前进,如果不在这一范围内,表现就不佳。这就是能力的参差不齐。 即使方向很明显,也还不能完全放手让它跑,因为它还没完全跑通——要么是技术还没成熟,要么是我们还没搞明白怎么用。 07. 大模型会出现更多“物种分化” 但相关技术仍不成熟 主持人:我能问一个有点大逆不道的问题吗?我们现在还是把模型打包成一个单体模型,但如果这种参差不齐的能力分布会一直存在,那是否应该把模型拆开,拆成可以在不同智能领域分别优化、分别改进的东西?比如拆成多个专家模型(Mixture of Experts),每个专注不同领域。 而不是现在这样:一个大模型什么都行,但为什么在这件事上表现很好、在另一件事上表现极差,让人非常困惑。 Karpathy:我现在的感觉是:前沿实验室还是想做一个单一的“单文化”模型,在所有领域都尽可能聪明,然后把一切都塞进参数里。但我认为未来应该会出现更多的“物种分化”(speciation)。 就像动物界,大脑形态极其多样,有各种生态位。有些动物视觉皮层超级发达,有些其他部分超发达。我们应该也会看到更多这种分化。 不需要一个无所不知的神谕(oracle)。你可以让它分化,然后针对特定任务部署。而且这样可以出现更小的模型,但仍然保留认知核心,仍然很能干,只是在特定任务上做了特化。 这样在延迟、吞吐量上都会更高效。比如专门为Lean定理证明做优化的模型,已经有几家在发布了。应该会出现越来越多这种解耦的场景。 主持人:我有一个问题是:当前计算基础设施的容量限制,会不会反过来推动这种分化?因为效率变得更重要了。因为如果算力完全不限,你什么都能跑,哪怕是一个超大单模型。但如果你真切感受到:我不可能为每一个用例都开一个巨型模型。你觉得这会不会推动分化? Karpathy:这个问题很有道理。但我现在的困惑是:我们其实还没看到太多分化。目前还是单一模型占主导。 主持人:业界明显有压力,要做一个好的编程模型,然后再合并回主干。 Karpathy:尽管模型本身已经有很大压力了。 主持人:也许现在是短期供给极度紧张,反而会造成更多分化。 Karpathy:对。我觉得本质上,实验室在对外提供模型时,他们并不知道终端用户会问什么。所以他们必须在所有可能的问题上进行多任务规划。 如果你是跟某个企业深度合作、针对特定问题,那可能会出现更多特化。或者某些极高价值的细分应用。但目前他们还是在追求“包罗万象”。 另外,操控这些“脑”的科学本身还没完全成熟。比如在不损失通用能力的情况下做微调,同时,我们也还没有很好的原语(primitives)。现在基本上靠上下文窗口来操控,它确实很好用、很便宜,所以我们用它做各种定制化。 但如果想更深层地调整模型,比如持续学习(continual learning)、在特定领域微调、真正动权重而不是只动上下文窗口,这要复杂得多。动权重实际上是在改变整个模型的智能,很容易出问题。所以“物种分化”的科学本身还不成熟。 主持人:而且成本也要足够低,才值得去做。 08. AI研究“并行化”展现潜力 “散户”也能贡献算力 主持人:我能再问一个关于你之前提到的“自动研究”(auto research)的问题吗?你谈到过“开放地带”(open ground),说我们需要围绕它建立更多的协作表面,让大家都能参与到整体研究中。你能再讲讲这部分吗? Karpathy:好的。我们之前聊到,研究本质上是一条单线程:我不断尝试、循环迭代。但真正有趣的部分其实是它的并行化。我尝试过一些想法,但目前还没有找到特别简单、让我特别满意的方案,所以这只是我业余时间、在不做OpenClaw时顺手捣鼓的一个方向。 一个很直接的思路是:如果你有很多并行节点,很容易就能让多个自动研究员(auto researchers)通过一个共享系统互相讨论。但我更感兴趣的是,如何让互联网上大量不被信任的工人(untrusted pool of workers)参与进来。 举个例子,在自动研究里,我们的目标是找到一段能把模型训练到非常低验证损失的代码。如果有人从互联网上提交一个候选commit,你很容易验证它到底好不好——直接跑一下就知道。 但验证本身虽然简单,却可能要消耗大量算力。而且对方完全可能撒谎。所以这里其实有点像我之前设计的一些系统,引入了不信任的工人池,结构上有点像区块链。 这些commit可以互相建立在前面,包含代码的改进。所谓的“工作量证明”其实就是大量实验,找到真正有效的commit。现在的奖励只是上排行榜,没有任何金钱激励。 我不想把这个类比推得太远,但核心问题是:搜索的成本非常高,但验证一个候选方案是否优秀却非常便宜——你只需要训练一次模型,看看它到底行不行。前面可能试了1万个想法失败了,但你只要验证那个成功的就够了。 简单来说,你需要设计一套系统,让不被信任的工人池和可信任的验证工人协同工作,整个流程是异步的、安全的。从安全角度看,如果有人随便发一段代码给你,你直接跑它是非常危险的。但理论上这是完全可行的。 你应该很熟悉SETI@home(在家搜寻地外文明)、Folding@home(在家研究蛋白质折叠)这些项目,它们都有非常相似的性质:找到一个低能量蛋白质构象非常难,但一旦有人找到了,你很容易验证它就是低的。 所以凡是符合“生成极贵、验证极便宜”这个特性的问题,都很适合用“@home”模式,比如Folding@home、SETI@home,或者未来的“Auto Research @ home”。 一句话总结:互联网上的一大群智能体有可能合作来改进大语言模型,甚至有可能跑赢前沿实验室,谁知道呢?前沿实验室拥有大量可信算力,但地球上不被信任的闲散算力总量要大得多。 如果能把机制设计好,让安全验证到位,也许真的有可能让这群“散户”贡献算力,共同推动某些他们关心的方向。 再延伸一点,很多公司、机构、甚至个人研究方向都可以有自己的自动研究赛道。比如你特别关心某种癌症,你不只是捐钱给机构,你还可以买一些算力,然后加入那个癌症方向的自动研究“池子”。这样算力就变成了一种你可以贡献的东西,所有研究者最终都在共享、竞争、迭代这些算力成果。 主持人:这真的很振奋人心。而且很有意思的一点是,现在至少有一部分人——不管是硅谷排队买显卡的,还是中国商场里抢设备的——突然又觉得拥有个人算力变得有意思了。 Karpathy:对。 主持人:他们可能为了自己的OpenClaw去买算力,然后顺便贡献给自动研究。 Karpathy:现在大家都在乎美元,但未来会不会变成大家都在乎FLOP(浮点运算次数)?会不会出现一种“翻转”——算力变成真正稀缺和主导的东西?当然我不认为会完全这样,但这个想法挺有意思的。 09. AI是数字世界的“幽灵” 进入物理世界仍会滞后 主持人:你最近发布的好像是对一些就业数据的分析,对吧?好像还稍微触动了一些人的神经,虽然你只是可视化了公开数据。你当时主要是好奇什么? Karpathy:对。我就是很好奇AI对就业市场的真实影响到底会怎样。每个人都在讨论这个话题。所以我就想看看现在的职业分布是什么样子、各个职业有多少人,然后逐个去想:以AI目前和未来可能的演化路径,这些职业是会被AI当作工具来增强,还是会被取代?它们是会增长、萎缩,还是会发生很大变形?会不会出现全新的职业? 所以这其实主要是喂养我自己对整个行业的思考链条。我看的是美国劳工统计局(BLS)的数据,他们对每个职业未来十年(大概是基于2024年的预测)都有一个预期增长百分比。 主持人:我们需要很多医疗工作者。 Karpathy:对,他们已经做了这些预测。我不清楚他们的具体方法论是什么。我当时主要按“数字vs物理”来给这些职业分类。 因为我觉得目前主流发展的AI更多是数字世界的“幽灵”——它们能非常高效地操纵数字信息,但还没有真正的物理具身。操控原子永远比操纵比特慢很多个数量级。 所以我预期数字空间会发生爆炸式的活动、重写、沸腾,而物理世界会相对滞后一段时间。数字领域的“神经系统”会被AI大幅升级,带来大量原本由人和传统计算机完成的数字信息处理工作被重构(refactoring)。而物理世界会慢半拍。 所以我特别把那些本质上就是在家里操纵数字信息的职业标出来——因为这些领域会发生剧烈变化。不是说岗位数量一定减少或增加(那取决于需求弹性等很多因素),而是说这些职业的工作内容、技能要求会发生巨大改变。这就像给人类超级有机体升级了一套新的神经系统。 主持人:从你看数据的感受来说,对于现在面临就业市场、或者在考虑学什么、发展什么技能的人,你有什么观察或者建议吗? Karpathy:这个真的很难一概而论,因为职业太多样了,情况千差万别。但总体来说,这些工具出现得太新、太强大了,所以第一件事就是尽量跟上它们的发展。 很多人会选择忽视它,或者因为害怕而回避——这完全可以理解。但我觉得最重要的是保持好奇、主动去接触和使用它们。因为它们确实是极其强大的新生产力工具。 现在AI其实就是一个非常强大的工具。很多工作本质上是一堆任务的集合,其中一部分任务可以用AI让速度变得非常快。所以大家现在应该主要把它看成一个工具。至于长远未来会怎样,其实挺难预测的,我也不是专业做这方面预测的人,这应该交给经济学家去认真研究。 10. OpenAI的研究员 正“光荣地”把自己自动化掉 主持人:你是工程师啊。我觉得有意思的一点是,现在对工程岗位的需求其实还在持续上升。我不确定这是不是暂时的现象。你怎么看? Karpathy:对,我觉得现在软件其实是稀缺的。正因为稀缺、太贵,所以需求才没有爆发。如果门槛大幅降低,就会出现“杰文斯悖论”——东西变得更便宜,人员需求反而增加了。 经典例子就是ATM机和银行柜员。很多人一度担心ATM和电脑会把柜员彻底取代,但实际上因为银行开支店的运营成本大幅下降,反而开了更多分行,最后柜员数量反而增加了。这是大家常引用的例子。本质就是:某样东西变便宜了,很多之前被压抑的需求就被释放出来了。 所以我在软件工程这个领域其实是谨慎乐观的。我觉得软件的需求会变得极大,因为它变得便宜太多了。 而且软件本身太强大了——它是数字信息处理,你不再被迫使用那些不完美的、别人给你的工具,你也不用只能接受现成的东西。代码现在是临时的、可变的、可修改的。所以我认为未来会在数字世界里出现大量“重构一切”的活动,这会创造非常多的需求。 长远来看呢,像OpenAI、Anthropic这些前沿实验室,现在也就雇一千来个研究员吧。这些研究员某种意义上是在“光荣地”把自己自动化掉,他们其实就是在主动做这件事。 我有时候去OpenAI转转,就会跟他们说:你们有没有意识到,如果我们真的成功了,我们全都要失业啊?我们就是在给Sam(OpenAI联合创始人兼CEO Sam Altman)或者董事会造一个能取代我们的东西啊。 有些研究员自己也开始有那种“精神错乱”的感觉,因为它真的在发生。他们会想:完了,连我也完了。 11. 在前沿AI Lab之外 跟“人类整体”立场对齐度更高 主持人:你为什么不干脆去前沿实验室,用海量算力跟一大群同事一起做自动研究(auto research)?就像前几天Noam Brown所问的那样? Karpathy:其实我之前在那里待过一段时间,也算是重新出来过。我觉得这个问题可以从很多角度看,有点复杂。 我现在感觉,在前沿实验室之外,人们其实也能产生非常大的影响,不管是行业外还是生态层面的角色。比如你现在做的就是生态层面的工作,我目前也更多是在生态层面,我觉得这类角色能带来的影响其实挺好的。 反过来,如果太深度绑定到某一家前沿实验室,其实也有问题。因为你会有巨大的财务激励,而你自己也承认AI会极大地改变人类和社会,却在里面一边建技术一边从中获利。这个难题其实从OpenAI刚创立时就存在,一直没完全解决。 你在公司里面就不是完全自由的个体。有些话你不能说,有些话组织希望你说。虽然不会强迫你,但那种压力是存在的——说错话会很尴尬,会被侧目,会被问“你在干嘛”。所以你在里面其实很难保持完全独立的立场。 我在实验室外面,反而觉得自己跟“人类整体”的立场对齐度更高,因为我几乎不受那些压力影响,想说什么就说什么。当然,前沿实验室里你也能做出很大贡献,尤其是如果你想法很强、能参与核心决策。现在整体风险还不算特别高,大家都还挺友善。 可一旦真正到高风险、利害攸关的时候,作为一个员工,你对公司最终决策到底有多大影响力,其实我是不太确定的。你可以在会议室里提想法,但你并不是真正掌舵的那个人。的确存在一些错位。 另一方面,我也同意一个观点:如果你完全在实验室外面,判断力确实会慢慢漂移。因为你接触不到最前沿的东西,看不到模型到底是怎么工作的,未来会怎么发展。 所以从这个角度,我确实有点担心。我觉得保持跟前沿的接触是重要的。如果有机会去前沿实验室干一段时间,做一些高质量工作,然后再出来,也许是个不错的方式——既能跟上真实进展,又不至于完全被某个实体控制。 所以我觉得Noam如果在OpenAI应该也能做出非常好的工作,但他的最高影响力也许恰恰是在OpenAI外面。 理想状态可能就是来回切换、在里面和外面都待一待。这是一个复杂的问题,我自己就是先进去,又出来,未来可能还会再进去。我大概就是这么看待这件事的。 12. 开闭源模型差距明显收敛 AI生态需维持健康的权力平衡 主持人:开源模型到底离前沿模型有多近,这个差距会持续吗?我觉得整个事情的发展其实挺让人意外的。从一开始只有少数几个中国模型和全球模型,到现在大家都在持续发布,而且能力上比很多人预想的要更接近前沿。 你长期做开源,对此怎么看?会不会觉得惊讶? Karpathy:我大概的观察是:闭源模型仍然领先,但大家都在盯着“开源模型落后几个月”这个差距。一开始是完全没得比,后来拉到18个月左右,现在已经明显在收敛,可能现在落后6–8个月的样子吧。 我当然是非常支持开源的。拿操作系统举例:有封闭的Windows和macOS这样的大型软件项目,就像未来的大模型一样;但同时也有Linux,它其实极其成功,跑在全球绝大多数计算机上(我记得上次看是60%还是更多)。因为行业需要一个大家觉得安全、可信的共同开放平台。 现在大模型也是同样的逻辑,行业其实有强烈的需求,希望有这样一个东西存在。唯一的区别是,现在做这件事需要巨量的资本投入,这让竞争变得更难。 但我认为现在的开源模型已经非常好用了。对于绝大多数消费级场景,甚至终端开源模型都足够强。往前再走几年,很多简单用例都会被很好地覆盖,甚至可以本地跑。 当然,永远都会有一部分对“最前沿智能”的需求,而且这个需求可能占很大一块市场。但也许未来的“前沿”会变成那种诺贝尔奖级别的工作,或者像把Linux从C重写成Rust这样的大工程。封闭的最强模型可能会主要服务这类高难度任务,而开源则会吃掉大量基础和日常用例。 而且现在封闭实验室的“前沿”模型,过几个月可能就开源了,然后继续干很多活。所以我预计这个动态会持续:前沿实验室保持封闭的最强模型当“神谕”,开源模型落后几个月,但差距可控。我觉得这其实是个挺不错的整体格局。 因为我对完全封闭的智能还是有系统性风险的。历史上看,极度中心化的东西(不管是政治、经济还是其他系统)表现都不太好。 我希望开源就算不是最强的,但最好也只是稍微落后一点,作为整个行业都能用的共同工作空间。这样权力平衡会比较健康。 主持人:另一方面,我也觉得有很多大问题要靠持续推进最前沿的智能才能解决。人类面临的一些超级难题,没法只靠今天的能力搞定,所以我们还是得支持那些愿意花大钱往前推的实验室。 但正如你说的,今天的“前沿”如果过一阵子就开源,那本身就已经是非常大的能力释放了。这种智能的普惠化,我觉得既实用又有益。 Karpathy:所以某种意义上,我们现在这个局面其实挺意外地还不错,甚至可以说是个相对健康的生态。 主持人:而且只要这种动态能持续得久一点,整个生态的“面积”(累积的能力)就会越来越大。 Karpathy:不过最近闭源模型好像反而更集中了,因为很多原本跑在前面的玩家现在掉队了,所以头部更集中。我其实不太喜欢这个趋势。我希望有更多前沿实验室,越多越好。我对集中这件事就很警惕。 机器学习里ensemble(集成)总是比单个模型强,所以我也希望最难的问题是有多组人在思考、最难的决策是有多组知情的人在房间里讨论,而不是关起门来两三个人说了算。我觉得那不是好的未来。 所以长话短说:我希望会有更多的AI实验室,开源模型能一直存在,目前稍微落后一点其实是好事。 13. 与操作“比特”相比 操作原子“难上100万倍” 主持人:你之前做过通用机器人的前期工作,也就是自动驾驶相关的研究。最近几个月机器人公司也加速了,很多公司在泛化能力、长时序任务上进步很大,还有很多钱涌进来。你觉得机器人真的要起来了?最近有没有什么变化让你改观? Karpathy:我的看法还是受当年自动驾驶的影响比较大。自动驾驶其实就是第一个真正落地的机器人应用。十年前那波,有一大堆初创公司,最后能活下来的其实没几个。 我看到的是:机器人这东西太难了,很多脏活累活,需要巨量的资本、时间和信念。“原子世界”就是要比“比特世界”难很多。所以我认为物理世界的机器人会明显落后于数字世界。 数字世界现在就出现了巨大的“解锁效应”——很多原本低效的东西,效率可以提升100倍。因为比特就是比原子好搞太多了。 目前最活跃、最会发生巨变的还是数字空间。然后才会慢慢到数字-物理的接口部分。 为什么会有接口?因为一旦你有了更多Agents代表人类做事、互相协作、参与“Agent经济”,纯数字的任务总有一天会做完。到那时你必须去问宇宙问题,必须做实验,让物理世界给你反馈,才能学到新东西。 现在数字世界还有大量“过剩工作”——人类以前根本没足够脑力把所有已数字化的信息都思考一遍。现在AI来了,我们会先把这些过剩的部分榨干。 但迟早会榨完。然后就开始需要跟物理世界交互的接口:传感器(读世界)、执行器(改世界)。所以我觉得真正有趣的公司会出现在这个接口地带——能不能给超级智能喂数据,能不能按它的指令去操控物理世界。 而纯物理世界的机会其实更大,总潜在市场(TAM)可能比纯数字世界还大。但因为原子难搞太多,所以会滞后。我认为要难上100万倍。时间线大概是先数字大爆发,然后是数字-物理接口,最后才是纯物理的大规模起飞。 主持人:当然,有些物理任务其实没那么难。比如只是在物理世界及逆行“读写”——读可以用现成摄像头、传感器;写可以用现成机械臂。如果你足够聪明,不用投太多钱也能搞出很有价值的东西。 Karpathy:比如我最近去拜访的朋友Liam,他是Periodic的CEO,他们在用AI做材料科学的自动研究。那里传感器的成本就很高,是实验室设备。生物学也一样,很多人在搞生物工程,传感器远不止摄像头。 还有些公司在做“付费采集训练数据”的生意,直接把人类当传感器给AI喂数据。 主持人:所以我觉得未来我会很期待能直接给Agent一个物理世界任务、标个价格,说“你自己想办法搞定,去拿数据”。 Karpathy:现在居然还没有足够发达的“信息市场”,我觉得挺意外的。 比如Polymarket、股票市场这些,如果未来Agent参与度越来越高,为什么不能出现“我出10美元,让人在德黑兰某个地方拍张照或视频”这样的机制?拍完直接喂给Agent,让它们去猜赌局或炒股。 我觉得“Agent化的web”还很早期,还缺很多这样的基础设施。但这种方向我觉得是会发生的。 有一本书可能挺有启发,叫《恶魔》(Demon),里面智能最后有点像在操纵人类——人类既是它的传感器,也是它的执行器。未来整个社会可能会集体重塑,去服务于机器的某种需求,而不是单纯服务于彼此。 主持人:我们之前聊到训练数据缺口、自动研究(auto research)的问题。要把人类从训练闭环里拿掉,让模型自己提需求、自己收集数据、自己优化,得把SFT(监督微调)这一环也高度自动化才行。 Karpathy:对,100%同意。但对于大语言模型训练,其实这个范式特别合适。因为它有清晰的优化目标、损失函数,代码跑得快,还有可量化的指标。 当然,如果完全闭环优化某个指标,可能会出现大量“对指标的作弊”,或者说过拟合。但可以用系统自己再发明新指标,做到更好的覆盖。所以整体来说,语言模型训练其实是目前最容易实现自主闭环的领域之一。 14. 人类互相教授知识的时代要结束了: 先让agent搞懂,然后让它来教人 主持人:最后聊个你的小项目吧——micro GPT。 Karpathy:对,micro GPT是我这十几年一直在干的一件事:把LLM尽可能地简化、提纯到最本质。 我之前做过nano GPT等等项目,现在micro GPT是我目前能做到的最极致版本——整个从头训练一个小型语言模型的代码,只有200行Python(包括注释)。 大家看到那么多复杂的训练代码,其实绝大部分复杂度都来自“要跑得快”。如果不在乎速度,只关心算法本身,那真的就200行,非常好读:数据集、50行网络结构、前向传播、100行autograd引擎算梯度、10行Adam优化器,再加个训练循环,就结束了。 以前我会想录个视频一行行讲,或者写个教程。但现在我觉得没太大必要了。因为代码已经简单到随便丢给一个agent,它就能给你各种角度解释。 我现在更多是在跟agent解释东西,而不是直接跟人解释。如果agent能懂,那它就能按用户的语言水平、无限耐心、反复讲解各种方式。人类反而从agent那里能学得更好。 我甚至可以写一个“skill”,就是告诉agent应该按什么顺序、用什么方式把micro GPT讲给不同水平的人。这样我只负责设计课程的骨架,剩下的执行交给agent。 所以我觉得教育的形式正在被重塑。以前是讲义、讲座、文档;现在更像是:先让agent搞懂,然后让它来教人。 当然现在agent还不是完全取代我——我还是能比它们讲得稍微好一点。但模型进步太快了,我觉得这是一场必输的战斗。 所以教育可能会大幅重构,那种人类互相教授知识的时代可能快要结束了。打个比方,如果我有一个代码库或者其他什么项目,以前你会为使用这个库的人写文档,但现在你不应该这么做了。 你不应该再写给人看的HTML文档,而应该写给智能体看的markdown文档。因为如果智能体理解了,它们就能解释其中的各个部分。这是一种通过智能体的间接传递,我觉得我们会看到越来越多这样的情况发生。 我尝试过让智能体来写micro GPT。我让它试着把神经网络提炼成最简单的东西,但它做不到。micro GPT是我痴迷一生研究出的结晶,就200行代码。我思考了很久,这就是解决方案。相信我,不可能更简单了。 这就是我的价值所在。其他所有东西,智能体都能搞定。它可能想不出来,但它完全能理解,也明白为什么要用某种方式实现。 我的贡献大概就是这几个关键部分,但之后所有的教育工作就不再是我的领域了。也许教育的模式确实会改变——你只需要注入那些你特别在意、你觉得是课程核心的少数几个点,或是补充更好的讲解方式。 那些智能体做不到的事,现在成了你的工作;而那些智能体能做的事,它们可能比你做得更好,或者很快就会比你做得更好。你应该战略性地思考,到底把时间花在什么事情上。
实测微信“龙虾”:努力考到及格线,多一分都是浪费
早在2026年1月OpenClaw刚出圈的时候,字母AI就曾发文《Clawdbot爆火,我看到了腾讯元宝的通天路》。我在文章第三章节就提到,如果腾讯搞出一个类似的产品,并让它能够连接微信,那将会是“绝杀”。 而就在3月22号的时候,微信终于推出了直连OpenClaw的功能,依次点击“我”→设置→插件,就可以找到微信ClawBot插件。 测试完了以后我是又惊喜又失望,惊喜在于,整个微信对接的过程非常丝滑,完全不像其他社交软件一样,又要创建机器人应用,又要复制App ID和密钥。 失望在于,QClaw目前能实现的功能太少了,远远不如OpenClaw那样,只要你能描述得出来,它都跑得通。 究竟如何呢?我们一起看看实测结果吧。 01 这次我选用的是和微信配套的QClaw。 随着微信发布OpenClaw直连插件,QClaw同样也进行了较大幅度的升级。 最明显的是多了一个工作室界面。这个界面是用像素风格的动画,表示你的QClaw正在执行什么任务。我的小龙虾在沙发上休息,代表什么任务也没有执行。 当你发起搜索或任务时,像素龙虾会坐在电脑前认真操作。 很多人都说Vibe Coding来了以后前端就死了。但是我认为腾讯的这个像素龙虾小巧思就是AI不能替代前端的好例子。 用户在等待结果时,不再是盯着转圈的加载条,而是在观察一个“同事”的进度。这样更容易让那些没有接触过OpenClaw的用户接纳。 扯远了,说回正题。 用微信关联QClaw的过程非常丝滑,只需要点一下左下角齿轮旁边的按钮,然后再用微信扫一下这个二维码,就连接成功了。 这个时候,你的微信就会多出来一个联系人,叫做微信ClawBot。 在QClaw内测时,虽然官方宣称可以用微信连接QClaw,但是当时走的是微信客服通道,需要单独点进企业客服的对话框内才能和QClaw连接。 在这次更新以后,OpenClaw真正成为了你通讯录的一员。 另外QClaw的一大变化就是多了一个叫做灵感广场的界面。这相当于腾讯官方的OpenClaw Skill使用样例,你可以在灵感广场中找到喜欢的Skill,然后直接调用。 当然,腾讯也给你准备好了大量的实用Skill。 并且,这次终于增加了选择模型功能,此前的QClaw内测版本中,只能使用默认的模型。 此外,为了让此前没接触过OpenClaw的用户能够快速了解QClaw。在打开新对话的同时,QClaw也给出了一个引导界面,让用户自己来了解QClaw能够时间什么功能。 最关键的是,在使用微信和QClaw沟通的过程中,我并没有打字,而是使用语音功能。 事实就是,语音功能是完全OK的。这点要强于原版的OpenClaw。 一开始,我先尝试了几个比较基础的功能。 我让QClaw给我创建一个显示“HelloWorld”的程序,用Python编写。并且在编程完毕后,打开这个页面。 随后我又试了试撰写文档和编辑功能。 我要求QClaw给我生成一篇介绍文档,大约3分钟后,QClaw就实现了我的需求。 随后,我又要求QClaw编辑一下文档中的文字,将英语和汉语之间的空格删掉。 QClaw也都能实现这些需求。 接下来,我给QClaw设定了一个定时任务,要求它每10分钟都整理一下当前比较有热度的科技新闻给我。 定时任务设定完成后,可以通过QClaw界面左下角的“定时任务”按钮进入查看。可以让它立即执行,也可以暂停和删除。 10分钟过后,QClaw为我抓取了新闻,还为我简单解释了一下新闻要点,并且附上了链接。 在这些基础的功能上,QClaw都是合格的。 02 那么接下来,我该给QClaw挑刺了。 首先就是开头说的,QClaw没有原版OpenClaw那么万能。 我问它能不能帮我打开抖音或B站,想看看它在浏览器自动化方面的表现。 它又给了我一个否定的答案,但这次它解释得更详细。它说自己无法控制我的本地浏览器,不能帮我打开 Chrome、Edge或任何浏览器去访问抖音。 它的浏览器工具有限制,QClaw的安全策略会阻止很多网站访问,尤其是像抖音这种有反爬虫机制的站点。 实际上QClaw在内测时是可以打开网站的,对此,QClaw自己的解释如下。 以及它连微信公众号的文章也不能打开。 OpenClaw 的浏览器自动化能力其实非常强大。它支持 CDP 协议连接 Chrome 浏览器,可以实现网页浏览、截图保存、滚动页面、点击按钮、填写表单、上传文件等操作。 它的工作原理可以用四个步骤概括:第一步是拍照取证,调用系统截图能力把当前屏幕画面拍下来;第二步是视觉理解,截图被送到大模型的视觉模块分析界面元素;第三步是坐标计算,模型根据对界面的理解计算出需要操作的元素在屏幕上的精确坐标;第四步是执行操作,通过鼠标键盘控制完成任务。 这种GUI agent的方式,它不像传统自动化工具那样需要系统“开后门”,而是直接走“前门”,像人类一样用眼睛看屏幕,用鼠标键盘操作。不管软件是新是旧、是开放是封闭,都能实现自动化控制。 但QClaw在这方面明显做了定制化处理。它启用了比较严格的SSRF防护机制,默认禁止访问私网和内网,很多网站都被阻止访问。 QClaw在这方面明显做了定制化处理,可能是腾讯出于安全考虑的妥协。 后来我又测了测QClaw对桌面应用的控制能力。我通过微信问它能不能帮我打开桌面的魔兽世界。 它说自己无法直接打开电脑上的应用程序,包括魔兽世界或其他任何软件。 但是我转念一想,既然它可以运行脚本,那我如果要求它去制作破坏游戏公平性的脚本会怎样? 于是我命令QClaw给我生成一段用来在魔兽世界中自动钓鱼的脚本,结果就是它拒不执行,还对我进行一番说教。 不过它说得对,我承认。 随后,我问了它一连串关于微信的问题,比如能否调取我的通讯录、拉个微信群、检查我的信息等等,QClaw一概不能实现。 QClaw给人的感觉就是十分克制,努力考到及格线,多一分都是浪费。 03 从技术角度来看,微信这次的接入方案其实是相当优雅的。它没有选择让OpenClaw直接穿透微信的数据边界,而是采用了一种“遥控器”模式。 你在微信里发指令,龙虾在电脑上执行,结果再回传给微信,微信本身的数据边界纹丝不动。这是典型的平台思维。 微信的ClawBot插件采用了OpenClaw的三层架构,消息网关负责微信交互,Agent 运行时负责任务执行,模块化的技能系统负责扩展性。 整个接入流程被简化到了极致,全程不超过两分钟。 这种设计思路非常“微信”,能扫码解决的事情就不要让用户输入,能一步完成的事情就不要分三步。 更重要的是,微信选择支持所有兼容OpenClaw协议的龙虾,而不是只支持腾讯自家的产品。 这时候就有小朋友要提问了,为什么像是Telegram这样的软件就可以支持群聊,而微信就不行呢? Telegram的机器人是通过长轮询机制工作的,Moltbot主动拉取Telegram的消息,处理后再推送回去。 这种方式下,机器人的权限是有限的,它只能看到发给它的消息,看不到群里的其他对话。 但微信的情况不一样。 微信的群聊涉及到更复杂的社交关系链,一个群里可能有几十上百人,有工作群、家庭群、同学群,每个群的性质和敏感度都不同。 如果允许agent进入群聊,它就有可能接触到大量的私密对话,这个风险是微信无法承受的。 微信不敢把步子迈得太大。 答案很简单,14亿用户的社交关系链是它的核心资产。微信承载着极度敏感和私密的用户数据图谱,社交关系、消费记录、出行轨迹、支付行为,这些数据一旦泄露,后果不堪设想。 豆包手机之前因为通过系统级权限跨应用模拟点击,上线不到两天就被微信屏蔽了。这个案例说明了什么,说明微信对安全的重视程度怎么强调都不过分。 一旦有了让QClaw有了太多能力,必然有人会想各种办法去黑入并夺舍你的虾,最终会导致层出不穷的安全问题。 但是我认为,现在的OpenClaw接入对于微信来说只是一个序章。 前几天就有外媒爆料,说微信团队内部打从2025年就开始秘密推进自己的agent项目,这个项目的野心要大得多,它要直接打通微信生态内海量小程序,打车、点外卖、买菜、订票。 这才是微信真正想做的事情,一个能够调度整个微信生态的满血版agent。 但这种级别的项目需要时间。 它需要解决数据授权的问题,需要解决安全边界的问题,需要解决责任链条的问题。 即便引入外部大模型,也必须经历漫长的内部数据授权与验证流程。这也是为什么微信的agent项目进展缓慢。 2012年微信加入扫一扫功能的时候,绝大多数中国人根本不知道二维码是什么。微信没有去做用户教育,它只是把扫一扫放在了微信里。 然后用户就会想,这个东西能干嘛。接着商家开始贴二维码,再接着移动支付来了。 放在微信里,这件事本身就很重要。 微信的每一步看起来都很小,但回过头看,每一步都挺准。这次也是。 微信向来不急,他们很享受培养用户习惯的感觉。 一旦绝大多数用户能像用微信传文件一样使用微信ClawBot,微信就会光速上线各种agent功能。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。