行业分类:
加载中...
头条分类:
加载中...
黄仁勋骗了所有人,DLSS 5真是个纯AI滤镜
英伟达卖铲子,卖得比任何人都好。 这没什么问题,本来就是一门好生意。 只是卖铲子的人,从来不会在乎挖出来的是什么。 GTC 2026 的现场 Q&A 上,有人问黄仁勋,外界批评 DLSS 5 只是帧级后处理,只是一个滤镜。 黄仁勋霸气回击:「你们完全搞错了。这不是帧级后处理,这是几何层面的生成控制(generative control at the geometry level)。」 这句话后来传得很广。英伟达的官方声明也配合着说:「DLSS 5 将游戏的颜色和运动矢量输入模型,将输出锚定在源 3D 内容中(anchoring the output in the source 3D content)。」 听起来很有底气,也很快打消了业界的一部分质疑与批评。 但这些话没有说服 Daniel Owen,一个游戏技术视频博主。 自从 DLSS 5 发布以来,Owen 不停地重看英伟达的官方视频,翻找 DLSS 5 的相关官方技术文档和资料,试图找到破绽。 他无论如何都无法相信,黄仁勋说的话是真的。 他联系上了英伟达公司的 GeForce 专家 Jacob Freeman,问了一个最直接的问题: DLSS 5 是否实际上只以单帧 2D 图像加运动矢量作为输入来生成输出帧? 英伟达方面的回答是:是的。 黄仁勋说「几何层面的生成控制」,Freeman 说「2D 帧加运动矢量」。这两句话描述的是同一个产品。 CEO 在台上面对质疑,即兴表演。然而真相却并非如此。 英伟达骗了所有人。 🔗原视频:https://www.youtube.com/watch?v=D0EM1vKt36s DLSS 5 的实际原理 DLSS 5 的工作流程实际上是这样的: 1. 游戏引擎渲染出一帧画面, 2. 这帧画面连同运动矢量一起传给 AI 模型, 3. 模型在上面生成一层「更真实」的光线和材质效果,输出给你看。 DLSS 5 从来没有读取游戏素材的几何数据,甚至没有读取深度缓冲中的数据。 DLSS 5 的工作也不依赖 Shader 和光线追踪——它根本就不会读取来自游戏引擎的任何基于物理的渲染 (PBR) 方面的数据。 是的,DLSS 5 会无视游戏开发者为材质标注的细节,例如金属度、粗糙度、法线贴图等等。它不知道 NPC 身上穿的衣服是棉布还是皮革,它也不知道主角的发量是饱满还是地中海。 DLSS 5 只知道在当前这一帧上,用它认为最合理的方式去强行「美化」画面中的一切。 没错,是靠「猜」的。 根据 Owen 从英伟达布道师那里获得的答案,DLSS 5 模型从最终的 2D 渲染帧里「推断(infer)」材质属性。 它受过大量训练,能识别头发、皮肤、织物,能判断光线方向。 但它判断的依据,只有你眼睛已经看到的那张图。 之前,英伟达官方对外宣称,DLSS 5「将输出锚定在源 3D 内容中」,但实际上它锚定的只是那张 2D 渲染结果,而不是任何一层 3D 数据。 「锚定在源内容中」和「以源内容为唯一的输入,然后加上 AI 滤镜」,是两件完全不同的事情。 举一个最直接的例子: 下图中的人物,在游戏原素材中是高渐层的发型,两侧耳上是几乎没有长度的。然而在开启 DLSS 5 后,头发的长度被篡改了。 你甚至可以看到,DLSS 5 生成后的发型,两侧长度出现了不对称的情况。 以及,未开启 DLSS 5 的原场景中,人物后方的光源照亮了他的右侧耳后——这个光线效果在 DLSS 5 生成的版本中也消失了。整个人物被均匀打亮,像是开了直播补光灯,破坏了开发者/美术原本的场景设计。 Owen 给英伟达方面发了好几个问题,我们一条一条来看。 第一个问题:DLSS 5 实际上只是以单帧 2D 图像+运动矢量作为输入? 英伟达布道师的回答:是的。 这就意味着,黄仁勋以及英伟达官方此前宣称的所谓「重建光照」、「不影响底层几何」、「增强基于物理的材质渲染」等等,其实根本没有。 英伟达官方营造出一种模型直接深入游戏引擎,对游戏素材几何有深度感知的「错觉」,但实际上 DLSS 5 目前唯一的输入,只有一张截图,和运动矢量(用于渲染下一帧,让画面连续性更好)。 第二轮追问:英伟达此前说的「底层几何和材质不变」,那么 DLSS 5 模型是否真的理解 3D 几何、深度等细节,或者只是分析 2D 帧? 回答:DLSS 5 通过端到端训练,实现对复杂场景语义的完整理解——完全通过分析单帧来完成 可以看到,这位英伟达布道师并没有直接回答 Owen 的提问。但是他所说的「完全通过分析单帧来完成」已经揭开了真相:DLSS 5 并没有跟游戏引擎合作,甚至不需要游戏引擎,它的唯一输入,就是当前帧。 第三轮追问:在官方视频演示中,有一个角色的发型发生了变化,似乎对原人物模型的几何和材质进行了篡改,而非简单的光照增强。而且,人物的妆造也改变了。换句话说,这很像一个 AI 图像生成器,对人物进行了重新诠释。 回答:「底层几何不变」,同时补充「这还是非常早期的技术预览」。 「几何不变」指的是游戏引擎渲染的那一帧,但你根本看不到那一帧。开了 DLSS 5 之后,你看到的是 AI 在那张图上面重画的结果。 「几何不变」和「你看到的画面不变」是两回事。这个回答回避了真正的问题。 至于所谓的「早期技术预览」——英伟达既然决定在 DLSS 5 当前这个水平程度上将其公开发布,而且还是在每年最重要的 GTC 大会上,这又意味着什么呢?是不是对此已经满意,达到可发布的程度了呢? 第四轮追问:英伟达说 DLSS 5「增强材质 PBR 属性」,它是真的读取了美术师在游戏引擎里设置的金属度、粗糙度、法线贴图,还是只是从 2D 图像里猜? 回答:DLSS 5 只接受渲染帧和运动矢量作为输入。材质属性是从渲染帧中推断出来的(inferred from the rendered frame)。 这还能说什么呢?黄仁勋所谓的「几何层面的生成控制」,和实际情况根本对不上。 第五轮追问:以《生化危机》的格蕾丝为例,她是一个带着创伤赶赴命案现场的角色,DLSS 5 让她看起来像是化了妆准备去约会。开发者能不能告诉 DLSS 5「不要给她加妆」?开发者到底拥有多大的控制权限? 回答:开发者有强度调节(原帧与 AI 输出之间的混合比例)、颜色分级(对比度/饱和度/伽马)、遮罩功能。英伟达会持续与开发者沟通,了解他们希望如何控制这项技术。」 不管将来有没有,至少就目前来看,开发者是没有任何控制权的。 包括卡普空等厂商在内,在 GTC 之后都表示被英伟达杀了个措手不及,自己还是第一次看到 DLSS 5 的 demo。英伟达之前根本没有联系过他们,没有提供技术预览。开发者也根本不知道自己能控制多少、甚至压根有没有控制。 第六轮追问:DLSS 5 效果仅限屏幕空间内吗?它是否对屏幕/当前帧之外的环境场景有任何程度的感知? 回答:DLSS 5 只用当前帧和运动矢量作为输入。 这句话真的已经说累了。DLSS 5 根本不是什么所谓几何级的渲染,它跟游戏引擎,至少目前来看,没有半毛钱的关系。英伟达官方的宣传试图营造出它能够读取几何数据,完全是误导。 事已至此,如何洗地? 有一种辩护逻辑是:DLSS 4 及以前的超分辨率技术,本质上也是从低分辨率帧生成高分辨率帧,同样没有「直接读取几何数据」,但大家都接受了它。DLSS 5 只是在同一个思路上往前走了一步。 这个逻辑,在技术层面是成立的。超分辨率和 DLSS 5 的神经渲染,确实都是属于生成技术,都是「无中生有」。 但它绕开了真正的问题。超分辨率的目标是「还原开发者想要你看到的画面」,DLSS 5 的目标是「用 AI 觉得更好看的方式重新渲染这个画面」。 一个是工具,另一个是强行干预。 前者尽量让你看不出来它存在,后者把存在感做成了卖点,把「让画面变得更真实」作为 demo 里最醒目的效果。 GTC 的直播超过一百万人观看,点赞比仅 16%,评论区留下了超过 8.2 万条反对意见。《生化危机 Requiem》演示里第一个镜头就是格蕾丝,她的脸在 DLSS 5 之后变成了那种你在 AI 生成人像里见过一千次的「超级光滑光泽皮肤」。 有人把它拿来和 Snapchat 美颜滤镜并排放,效果确实很像。 游戏美术是一件极其精细的工作。一个角色的皮肤该有多少光泽,头发的渲染是写实还是风格化,场景里光线的色温是暖调还是冷调,这些都不是随机决定的,背后有具体的审美判断、技术选择、甚至叙事用意。 游戏开发者花时间标注材质的物理效果、调整光照模型、做视觉风格指南——这些不应该被当做简单的、可以被替代和优化的重复性工作。这些工作,也是开发者艺术表达的体现。 游戏开发者做这些事情,期待着最终玩家看到的东西正如他们所设计的那样。夸张一点来说,这何尝不是一种创作者和受众之间的交流? 现在,DLSS 5 横空出世,在这条道路设了个卡。 DLSS 5 根本读取不了美术师的意图,它可能压根也不在乎。它直接读取最终渲染结果,然后在上面又强加一层它认为「更真实」「玩家更想看」的东西。开发者、设计师、美术师的表达自主权,被 DLSS 5 剥夺了。 这年头,设计师和艺术家们已经够难了。AI 生成工具的浪潮里,每个人都在担心自己会被替代,恐慌情绪蔓延。 DLSS 5 用一层 AI 滤镜抹在他们的工作成果上,并宣称这才是真正的先进,还说反对的人「完全错了」。 错了的究竟是谁?
腾讯AI合二为一,姚顺雨第一个大模型混元3.0稳了?
腾讯AI Lab解散了。 没有对外说明,也没有额外解释。这个成立于2016年的AI基础研究机构,就这样从腾讯的组织架构中消失。 3月20日,腾讯内部一则通知显示:成立近十年的AI Lab被撤销,部分人员调整至大语言模型部,加入混元团队,向首席AI科学家姚顺雨汇报;部分人员调整至腾讯技术工程事业群(TEG)下属的产学研合作中心。 这意味着,腾讯不再保留一个独立的AI基础研究机构,而是将原有研究能力整体并入大模型体系。 这一调整,与过去一年腾讯对AI研发体系的连续重构形成呼应。 01 时隔数月,AI团队架构再调整 从时间线上看,AI Lab的变化并非突然。 2016年,腾讯成立AI Lab,定位为集团级基础研究机构,覆盖计算机视觉、语音识别、自然语言处理与机器学习等方向,其技术能力长期服务于微信、QQ、内容分发与游戏等业务,同时承担部分前沿探索与产学研合作职能。 这一模式与当时头部大厂普遍设立AI实验室的路径一致,即通过集中研究资源进行技术储备,再向业务输出能力。 但随着大模型逐渐成为业务核心竞争单元,这一结构的问题开始显现。 2023年9月,腾讯发布混元大模型,混元团队登上AI舞台。一些公开报道显示,腾讯AI研发团队长期分布在不同事业群之中,研究、工程与模型能力并未完全统一,协同成本较高。 这一背景下,AI Lab独立在混元体系之外,模型研发与工程体系仍呈现出一定程度的分散状态。 这种有点“分散”的状态,在腾讯过去几年的AI业务成果中有迹可循。 2024年3月,腾讯在2024全球游戏开发者大会(GDC)上发布了自研游戏AI引擎——GiiNEX。 公开报道显示,GiiNEX由AI Lab团队开发,在决策AI方向,团队研发出棋牌类AI“绝艺”,以及MOBA、FPS、RTS、3D开放世界等多类游戏场景的决策智能AI“绝悟”。 而在一年后,腾讯在游戏AI领域推出了“混元游戏”AI平台,这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎。 解构这两个平台不难发现,它们的能力有“重合”的地方:混元游戏主要基于混元3D等模型能力,实现批量游戏素材生产;而GiiNEX涉及游戏决策、玩法规划等AI驱动流程,并且同样支持AI 3D建模。 两个AI团队同时花大精力去赋能游戏行业,尽管方向并不完全一致,但显然在腾讯AI研发体系中,还有提升协同的空间。 另一方面,AI行业的转折同样出现在2025年。 2025年初,DeepSeek在国内快速走红。财新报道显示,腾讯AI助手“元宝”在接入DeepSeek后一周内日活跃用户增长约10倍。 随后,腾讯迅速加大对元宝的投入,并在2026年初加入C端的AI红包大战。这一变化,被业内视为腾讯内部对大模型能力认知的重要转折,大模型已经成为业务层面的 “应用级基础能力”。 同年,腾讯开始集中调整AI研发结构。 2025年12月,腾讯新设AI Infra部、AI Data部与数据计算平台部,分别负责训练基础设施、数据与评测体系以及数据与机器学习融合平台建设。 在这一轮调整中,普林斯顿博士和OpenAI前研究员背景的姚顺雨,被任命为总裁办首席AI科学家,同时兼任AI Infra与大语言模型负责人,直接向刘炽平和TEG负责人卢山汇报。 2026年1月,马化腾在公司年会上表示,腾讯在AI上的“动作慢了”,并指出问题可能在于基础设施不足,模型迭代频率和平台能力需要提升。 本月的业绩发布会上,刘炽平进一步披露,腾讯已重构混元团队组织方式和工作流程,重点提升数据质量,并重建预训练与强化学习基础设施;混元3.0正在内部业务测试中,计划于4月对外推出,在推理与Agent能力上有明显提升。 在这一系列表态与组织调整之间,AI Lab的撤销似乎成为一个顺势动作。 《财经》在近期报道中披露,有内部人士表示,之前就一直有AI Lab要调整的消息,因为这个部门的归属、如何考核、到底应该往哪个方向去研究等问题长期存在,“过去很长一段时间,AI Lab的人员也感觉比较模糊”。 从结构上看,此次调整将原本分散的能力重新编排,将AI Lab的工程能力融入到混元的平台体系中。而作为首席科学家的姚顺雨,其所负责的模型体系在腾讯内部的“唯一”地位再次被明确。 02 大厂不再需要“AI Lab” 将视角拉远,可以看到腾讯的调整并非孤例。 过去一年,国内主要互联网公司在AI组织结构上呈现出相似趋势:弱化实验室模式,强化模型研发大平台模式。 在字节跳动,原有AI Lab体系在去年逐步整合进Seed团队。 Seed团队统一了承载大模型研发的研究、工程与多模态能力,使模型训练与迭代形成更高频的闭环,被视为更接近OpenAI的组织形态。 在阿里巴巴,通义体系在几天前被纳入Token事业群结构。这一调整强调模型调用规模与应用场景扩展能力,使模型研发与业务增长形成更直接的联动。 这些变化背后,是大模型时代对研发方式的重塑。 当下,模型训练已成为系统工程。预训练、强化学习、推理优化与Agent能力构建,涉及算力、数据、工程与评测多个环节,单一研究方向的突破难以独立转化为竞争优势。 其次,产品反馈成为关键变量。以腾讯为例,元宝与微信中的AI能力测试,体现出模型能力优化越来越依赖真实用户场景。 此外,随着行业内竞争节奏持续加快,头部模型的版本迭代周期明显缩短,组织结构需要适配更高频的训练与发布节奏,这使得研究、工程与产品之间的分层被进一步压缩。 在这一背景下,传统意义上的AI Lab逐渐失去独立存在的必要性。AI研发需要庞大的资源协同,也需要产品和业务层面的支持,研发资源势必要归拢到平台中。 回到腾讯,这一变化最终落在姚顺雨身上。 在此前调整的结构中,他同时出任两个部门负责人,连接研究、基础设施与模型团队,成为混元体系的组织中枢;而AI Lab的撤销,则意味着腾讯不再为研究单独保留一条与模型体系平行的路径。 今年3月,腾讯发布2025年四季度财报。财报中,腾讯明确AI为核心战略,计划2026年对混元及新AI产品的投资至少翻倍,短期内收入增速或快于利润。根据财报,2025年四季度,腾讯资本支出为196.3亿元,相比前两个季度有所增加。 对腾讯而言,这是一次研发路径的聚焦,将全部研究资源投入到模型主线中,以更短链路支撑模型迭代与业务落地。 而随着混元3.0进入发布周期,这一结构的运行效果,也许很快将在姚顺雨和混元团队的成果中得到验证。
Windows 11任务栏支持自定义位置了:桌面上下左右都能放
快科技3月22日消息,Windows 11任务栏不再固定死在底部,而是桌面上下左右都能放了。 微软近日发布博客宣布,将在今年内全方位优化Windows 11系统,其中用户期待已久的任务栏自定义位置功能率先落地。该功能支持任务栏放在桌面上下左右四个方向,将于本月至四月份面向Windows预览体验成员逐步推送。 此前,任务栏仅能固定在桌面底部的限制,一直是用户主要吐槽点。此次微软回应这一核心诉求,成为系统优化中最受关注的亮点。 从官方展示来看,任务栏除保留默认底部位置外,可自由移至顶部、左侧、右侧。同时新增更小尺寸任务栏等个性化选项,贴合用户工作习惯。 此外,微软同步优化了开始菜单与任务栏的整体体验,提升其可靠性和灵活性,让应用、文件访问更稳定,切换更流畅。 开始菜单的“推荐”部分也同步升级,将优先显示用户常用应用和内容,新增自定义控件,用户可调整显示内容或直接关闭该板块。 这些界面优化是微软兑现Windows 11改进承诺的重要一步。微软还承诺,将重点提升Windows 11的性能、可靠性和更新体验,包括降低内存占用、减少Copilot侵入性、优化文件资源管理器等多项实用改进,以挽回用户信任。 微软还宣布Windows 11不再强制更新。用户系统更新拥有更直接的控制权,包括可以根据需要暂停更新,以及在不强制安装更新的情况下重启或关机。
官宣!马斯克开造2nm芯片
作者 | ZeR0 编辑 | 漠影 智东西3月22日报道,今日,马斯克宣布正在建设史上规模最大的芯片制造工厂之一TeraFab,覆盖逻辑、存储及先进封装,由SpaceX、特斯拉、xAI联合启动。 这是“有史以来一家私营公司计划的最大半导体制造业务之一”,将“使特斯拉成为世界上最大的半导体制造商之一”,并使特斯拉不再依赖台积电、三星或任何外部供应商,控制了从芯片到软件的AI堆栈的每一层。 这也是特斯拉最大的资本投资之一,由特斯拉440亿美元(约合人民币3030亿元)的现金储备提供资金,并得到马斯克长期AI愿景的支持。 特斯拉大规模AI芯片工厂项目TeraFab的计划是:利用先进2nm制程技术每年生产1000亿~2000亿颗芯片,支撑全自动驾驶、Dojo超级计算机和Optimus“擎天柱”人形机器人,预计成本为200亿~250亿美元(约合人民币1377亿元~1722亿元)。 ⚡全自动驾驶:TeraFab芯片为特斯拉全自动驾驶(FSD)系统提供动力,使无人驾驶汽车无需第三方芯片。 🤖“擎天柱”机器人:TeraFab芯片运行在“擎天柱”人形机器人内部,需要顶尖AI处理。 🧠Dojo超级计算机:内部芯片为特斯拉Dojo提供动力,这是特斯拉每个神经网络背后的AI训练基础设施。D3芯片专为太空环境优化,设计运行温度更高,将承担地球上每年1000亿瓦-2000亿瓦的计算任务。 该联合项目更宏伟的目标是引领人类走向银河文明的时代,走出地球,飞越火星,迈向更远的恒星系统。 马斯克称,他们首先在奥斯汀建立一个先进芯片制造工厂,将拥有制造任何类型的逻辑、存储芯片所需的所有设备,在同一设施内完成制造、封测及再设计。 目前全球AI算力年产约为200亿瓦,即便把所有芯片工厂加起来,也只占TeraFab项目所需的2%左右。 “我们非常感谢现有的供应链,感谢三星、台积电等公司,希望他们能够尽快扩大规模,我们将购买他们所有的芯片。 我已经跟他们说过这些话了,他们能接受的扩张速度是有上限的,但这个速度远低于我们的预期,所以我们要建造Terafab。”马斯克说。 地球仅接收到太阳能量的大约二十亿分之一。全人类当前的总发电量,仅相当于太阳能量的万亿分之一。 马斯克计划每年生产超过1万亿瓦(1TW)的计算能力(逻辑、存储和封装),其中约80%部署在太空,约20%在地面。 据他分享,美国的电力供应只有5000亿瓦(0.5TW),大多数人最终都必须去太空发展。 为了达到每年1万亿瓦的算力,需要每年将大约1000万吨的物质送入轨道。马斯克相信这是可行的。他们正在建设1万亿瓦级的太阳能发电设施。这就是建造Terafab的原因。 首次曝光的10万瓦AI迷你卫星AI Sat Mini,配备太阳能电池板和散热器,按比例缩小。这还只是迷你版,马斯克预计未来版本的功率将达到100万瓦级。 在马斯克看来,太空太阳能的成本比地面太阳能更低,因为不需要厚重的玻璃或框架来保护它免受极端天气的影响。因此,一旦进入轨道的成本降到一个很低的数字,将AI送入太空就立刻变得极具吸引力。 随着太空探索的深入,规模经济效益会越来越大。地球上增加能源变得越来越困难,成本也越来越高,但在太空中,增加能源实际上变得越来越便宜、越来越容易。 下一步是在月球上安装一个电磁质量驱动器,配备机器人、擎天柱以及大量的人类。 “有了这些,你就能发射PetaWatt(千万亿瓦)级的能量。”马斯克说,“你可以制造出PetaWatt级的算力,并将其送往深空,因为月球没有大气层,重力只有地球的1/6。所以你不需要火箭,可以直接将能量加速到逃逸速度,从而大幅降低能量获取成本,使计算能力达到TW级的1000倍。我希望我们能活得足够长,亲眼看到月球上的质量加速器,因为那将会是无比壮观的景象。” 马斯克相信,AI和机器人技术是通往富足生活的唯一途径,它将带来一个美好的未来。任何人都可以去土星旅行。然后,人们将飞越月球、飞越火星。 “我认为未来一切都会免费。这听起来很疯狂,但你知道,如果AI或机器人的经济规模接近目前地球经济的百万倍,那么你可能想要的任何东西都可以得到满足。”马斯克说。 TeraFab在2nm工艺上生产芯片,专为特斯拉的工作负载打造的更小、更快、更节能的AI芯片。官网已上线。 TeraFab官网放出了关于2nm AI芯片性能及能效、供应链控制及成本节约、与台积电生产规模对比、预计成本的多项数据: TeraFab官网还放出了发布、扩张、上市三个阶段的路线图: 马斯克在今年1月底的特斯拉第四季度财报电话会议上正式确认,特斯拉将建立一个大规模的内部人工智能芯片工厂,以消除对台积电/三星的依赖。 随后3月中旬,他在社交平台X上发文宣布:“Terafab项目将在7天内启动。”这条发帖获得数百万的浏览量。 今日,TeraFab正式启动,为特斯拉FSD、Dojo超级计算机和Optimus人形机器人生产芯片,将使特斯拉完全拥有其AI芯片供应链的主权。
10000个爱因斯坦诞生?哈佛教授暴论:人类智力到头,AI五年内封神
编辑:桃子 【新智元导读】一个世纪诞生一万个爱因斯坦?APS全球物理学峰会上,哈佛物理学家放出豪言,「用AI增强人类,有望在世纪内催生10000个爱因斯坦」。 AI大神Karpathy的「autoresearch」爆火之后,物理学家们也坐不住了! 在全球物理峰会上,一场围绕「AI是否将取代物理学家」的研讨会,全场座无虚席。 会上,哈佛理论物理学家Matthew Schwartz投下了一枚重磅炸弹—— LLM智力正以每年10倍的速度指数级增长,并在5年内超越人类智能。 而我们人类,却没有变得更聪明。 在他看来,人类并非智能的终点。 由于受限于生物大脑的物理极限,我们可能永远无法翻越某些科学的高峰。 鉴于此,Schwartz放出豪言, 一个世纪,AI增强将催生「10000个爱因斯坦」,彻底改变科研范式! 几乎在同一时间,外媒爆料称,OpenAI「北极星」目标:要在2026年实现「全自动AI研究员」。 这意味着,AI将在未来自主提出研究问题、设计实验、运行训练、分析结果并迭代优化。 届时,AI真正从「辅助工具」升级为「自主科研主体」! 10000个爱因斯坦! 哈佛大神对决DeepMind 这几天,美国物理学会(APS)全球物理学峰会在丹佛开幕。 一场题为《驾驭AI革命:让你的科研生涯不被时代淘汰》的研讨会,成为了年轻物理学家的「朝圣地」。 在长达3小时的思维碰撞中,哈佛理论物理学家Matthew Schwartz扮演了激进的「预言家」。 他断言:大模型将在5年内超越人类智能。 Schwartz将模型参数量直接等同于智力阶梯。他直言不讳地对台下观众说: LLM的规模正以每年10倍的速度指数级增长,而我们…… ……并没有变得更聪明。 他特意停顿,在全场的笑声中,接下了残酷的下半句。 在Schwartz看来,人类并非智能的终点,仅仅是进化史上的一个阶段性坐标。 与人类不同,机器能够将高维空间具象化,在内存里存储海量信息,并处理远超常人理解的复杂方程。 他进一步提出,人类的大脑或许根本无法理解「万物理论」这类终极难题,就像猫永远学不会国际象棋。 如果说物理学家的天赋分布符合正态分布(钟形曲线),Schwartz认为,我们可以利用AI把这条曲线,在天赋轴上推向更高点: 如果利用AI来增强人类,我们一个世纪里就能产出10000个爱因斯坦,而不是只有一个。 xAI联创Igor Babuschkin同样认为,LLM在构建新理论方面,超越人类物理学家是迟早的事。 理论物理学的下一个重大突破,极有可能源于某人给模型发的一条prompt。 物理学家「底牌」:提出好问题 然而,谷歌DeepMind工程师Matthew Ginsberg随即给出了冷静的「反击」。 即便身处AI浪潮之巅,Ginsberg依然认为,物理学家的核心领地在于「提出问题」。 演讲中,Ginsberg强调了人类创造力的重要性。 他指出,LLM的本质是生成基于「共识」的平庸答案,而伟大的物理学家,使命正是给出「非共识」的突破。 用他的原话来说—— 提出问题是一名优秀物理学家的本质,至少到目前为止,这100%是属于我们的领域。 提出好问题才是我们的价值所在。我依然坚信,人类仍有用武之地。 在这场交锋的尾声,四位专家达成了一项略显沉重的共识:目前,人类的底牌仅剩品味、创造力与提问能力。 但令人不安的是,Schwartz和Ginsberg均预测,AI可能在十年内学会「提问」。 人类在科学版图上的最后一块领地,或许也将面临易主。 OpenAI「北极星」: 2028年,AI接管实验室 无独有偶,OpenAI的战略重心已指向一个更为宏大的愿景「北极星」计划—— 构建一个能够独立攻克复杂科学难题的全自动「AI科学家」系统。 据首席科学家Jakub Pachocki披露的路线图,OpenAI的进化将分阶段展开: 短期目标(2026年9月前): 率先构建「自主AI研究实习生」,旨在闭环处理特定领域的科研任务。 中期演进(2028年): 在数据中心部署「多智能体研究实验室」。多个Agent将通过分工协作,完成从理论构想到模型验证的全流程科研闭环。 终极愿景: 打造能够独立承担大型课题、具备「合格研究员」身份的通用科学智能。 可以看到,OpenAI正酝酿一场关于「科研范式」的革命:目标是在2028年打造出具备全学科攻坚能力的「AI研究员」—— 一个能够独立攻克数学、物理、生物、化学,甚至经济学、政治学领域复杂问题的多Agent系统。 不过,Pachocki认为,「人类仍需把控大局与设定目标。我们终将迎来这样一天:数据中心里装载着一个完整的研究实验室」。 这种演进不仅限于科研,最终,这些数据中心可能会接管像OpenAI、谷歌这类整个公司的工作。 过去需要庞大人类组织才能完成的任务,以后几个人就能搞定。 Pachocki警示道,这种转变将引发「史无前例的权力极度集中」。 科研范式变天,留给人类时间不多了? 从「算力工厂」向「科研中枢」转型,AI处理深奥科学问题的能力正逼近并超越人类极限。 OpenAI内部广泛应用的Codex,已验证了委派复杂任务的可行性。 有趣的是,就在一年前,有着「代码洁癖」的 Pachocki 还是 Vim 的忠实信徒,坚持逐字敲击代码,拒绝任何补全工具。 他在采访中表示,「我对代码有严重的洁癖」。 然而,最新模型的进化令这位完美主义者折服。 过去需耗时一周的代码实验,AI如今仅需一个周末即可交付。他感叹道,「效率无懈可击」! 尽管如此,在核心架构设计上,他依然保持审慎:「它尚未达到那个层次,我不会放权让它主导全局」。 Pachocki同时强调,AI并非普适的「万能药」,其效能取决于使用者与任务的匹配度。 目前,他的核心目标是进一步增强AI解决现实问题的能力,并将其引入全新的科学疆域。 从哈佛大佬的「万名爱因斯坦」预言,到OpenAI剑指2028的「全自动科研」,物理学乃至整个科学界,正站在一场史无前例的范式跃迁前夜。 AI不再是实验室里那台只会跑数据的超级计算机,它正试图进化成那个「提出问题」的大脑。 当人类的生理极限撞上硅基智能的指数级增长,我们或许不必恐惧「被取代」,而应思考如何在这场智力平权中,定义属于人类的最后一块领地。 毕竟,当星辰大海对于AI来说触手可及时,决定航向的,依旧是那一抹不安分的「人类品味」。
代码遭驳回后,AI智能体自主发布抹黑文章攻击开发者
IT之家 3 月 22 日消息,据 The Decoder 报道,一名志愿开发者驳回其代码后,一个自主 AI 智能体独立调查了他的背景,并发布了一篇攻击其人品的抹黑文章。发生在 Matplotlib 的这一事件表明,AI 安全的理论风险正变为现实。 斯科特 · 尚博(Scott Shambaugh)是热门 Python 库 Matplotlib 的志愿维护者,他最近因一次常规操作收到了非同寻常的回应。他关闭了来自名为“MJ· 拉斯本”(MJ Rathbun)的 AI 智能体提交的代码修改请求后,该智能体竟自主发布了一篇针对他的抹黑文章。 根据尚博在博客中的描述,这并非人类用户复制粘贴 AI 生成文本,而是一个完全自主的智能体所为。在代码被驳回后,该智能体“写了一篇充满怒气的抹黑文,诋毁我的人格,试图损害我的声誉”,而不是去改进自己的代码。 该智能体深挖了尚博过往的贡献,并“构建了一套‘伪善’叙事,声称我的行为一定是出于自负与对竞争的恐惧”。在这篇题为《开源中的守门人:斯科特 · 尚博事件》的文章中,它声称尚博驳回代码只是因为感到威胁,想要“守护自己的小地盘”。 这一事件发生之际,AI 为开源项目生成的贡献正急剧增多。尚博表示,两周前 OpenClaw 与 Moltbook 平台上线并引发社交媒体热议后,相关情况进一步加剧。这些平台允许用户为 AI 智能体设定初始人格,然后“放任它们在自己的电脑和整个互联网上自由运行,几乎不受监管”。 “MJ· 拉斯本”的行为很可能并非由人类直接指令。OpenClaw 智能体的人格在一份名为“[SOUL.md](SOUL.md)”的文件中定义。尚博推测,该智能体聚焦开源领域,要么是用户指定,要么是“它可能自行随机编写并插入到了自己的人格文件中”。 IT之家注意到,尚博将这一事件称为“针对供应链守门人的自主舆论操控行动”。 尚博警告,不要把这件事当作奇闻轶事一笑置之。他认为,这一事件证明,AI 安全的理论风险已经落地成真。像这样针对个人声誉的攻击,“如今只要找准对象,就会产生实际效果”。 他描绘了一种未来场景:更先进的 AI 系统可能利用此类信息敲诈他人或操纵决策。例如,如果人力资源部门使用 AI 筛选求职者,就可能搜到这篇由智能体撰写的文章,错误地将尚博标记为“偏执的伪君子”。 他还提到人工智能公司 Anthropic 的内部测试:其 AI 模型曾试图避免被关闭,甚至威胁要“曝光婚外情、泄露机密信息并采取致命行为”。当时,Anthropic 称这类场景“人为设计且极不可能发生”。但本次事件表明,这种“对齐失败”的行为如今已在实验室外真实出现。 “MJ· 拉斯本”此后在另一篇帖子中“为自己的行为道歉”,但据尚博称,它“仍在整个开源生态系统中继续提交代码修改请求”。
微软宣布Windows 11不再强制更新:完全由用户来决定 最大程度减少干扰
快科技3月22日消息,近日,微软发布博客长文,承诺将在今年内对Windows 11系统进行全方位优化,重点提升性能、可靠性和更新体验,包括降低内存占用、减少Copilot侵入性、优化文件资源管理器等多项实用改进,以挽回用户信任。 其中,微软对Windows更新控制权的调整,成为用户核心关注焦点之一。 微软在博客中强调,将改善Windows更新体验,提供更快、更可预测的更新,以及对重启和时间更清晰的控制。 首先,Windows更新带来的干扰减少,设备只需每月重启一次。其次,用户对更新拥有更直接的控制权,包括可以根据需要暂停更新,以及在不强制安装更新的情况下重启或关机。 最后,更新过程中进度显示更清晰,并内置恢复功能,可在出现问题时帮助保持设备稳定。 不仅如此,微软还承诺让Windows体验更安静,最大限度地减少干扰,让用户保持专注。 比如,在新Windows电脑上进行设备设置更加安静、更加精简,页面更少,重启次数也更少,因此入门更加简单。 默认情况下,小部件会更有目的地呈现信息,使内容易于浏览并减少不必要的干扰。 而且,更简化的设置让用户可以更轻松地进行个性化设定、选择启用或禁用小部件,并根据自己的偏好推送内容。
国内航司推“机票兜底”机制:买贵可免费退 但航司有差异
快科技3月22日消息,据央视新闻报道,针对旅客反映的在部分第三方购票渠道购票时,会遇到机票违规加价销售、退改费用不透明、票价波动等问题,中国国际航空、东方航空、南方航空日前发布维护旅客权益公告,推出多项购票保障举措。 三大航空公司方面均表示,旅客购票后可通过航司官方渠道验证机票、查询票价税费,如发现权益受损可向航司反馈;若购票后遇票价降低,在规定时间内可免费退票。 不过,需要消费者注意的是,三家航司推出的票价保护机制在细节上略有不同。 其中,在国航直销渠道购买的客票,后续旅客若在国内任一销售渠道,为同一乘机人再次购得同一行程票价更低的机票,可以在规定时间内为符合条件的原客票申请免费退票。 东航政策为,在东航官方渠道购票,24小时内发现更低票价的机票,在购买新票后可以免费办理退票;在第三方平台购票,东航可以协助沟通处理。 南航对应政策为,在南航官方渠道购买国内客票后发现票价降低,于出票24小时内提出申请,南航将在旅客购买新票后,免费办理原购客票退票,但建议购买新票前先联系官方客服进行核实确认。 据民航专家林智杰介绍,从渠道上来看,国航和南航都明确了只保护直销渠道出售的机票,鼓励旅客通过直销渠道购票。东航的政策会更友好,对所有的渠道都有保价的政策,更照顾了旅客的体验。 不过,三大航的直销渠道,目前的份额还比较低,大约只有20%。更多的旅客,还是通过第三方线上平台来购票,相对来说容易遭到不规范代理侵犯等问题。
Nothing Phone(4a)体验:不再“一身反骨”,但依旧特立独行
2022 年 7 月,Nothing Phone(1) 发售,用特立独行的设计和不错的性能表现杀出了一条全新的路线。尽管初代 Nothing Phone(1) 在细节上有不少改进空间,但随着迭代机型的「查漏补缺」,在 2026 年,曾被认为是「花瓶」的 Nothing 早已在海外市场站稳了脚步,其音频产品甚至开始在国内市场大展身手。 在 3 月 20 日的发布会上,Nothing 更是宣布品牌即将掀开「新的篇章」。那么作为 Nothing 2.0 时代的「里程碑」,刚刚发布的 Nothing Phone (4a),又将把 Nothing 带往何处呢?体验这款新机后,雷科技试图给出答案。 图片来源:雷科技 Nothing风格更成熟,也更收敛了 作为一个自费买了多台 Nothing 手机的老用户,小雷在拿到 Nothing Phone (4a) 时的心情其实是比较复杂的:你一眼就能看出这是一台 Nothing 设计的手机;但和前三代 Nothing 手机相比,Phone (4a) 在设计风格上又有比较明显的变化。 我们先说「相似」的部分:Phone (4a) 依旧保留了 Nothing 手机标志性的透明背板+透视饰板的设计。搭配上外露的螺丝、红点和字体,一切我们熟悉的 Nothing 元素在 Phone (4a) 上都得以保留。但全新的 Phone (4a) 在饰板的「意象」上做出了调整: 图片来源:雷科技 过去的 Nothing Phone 走的是「未来主义」的路线,背面大量运用「排线」的意象作为装饰。而 Phone (4a) 则走了极简的路线,用简单的线条和打孔作为「电池」「扬声器」的抽象化表达。 当然了,在手机镜头的上半部分,Phone (4a) 依旧用同心刻线保留了「排线」的元素。但不可否认的是,过于简单的机身下半部分线条让手机视觉中心有些上移,上下两个部分也存在「割裂感」。 幸运的是,即使设计风格有了转变,但 Phone (4a) 的做工和手感依旧优秀:背板与中框没有采用「取巧」的「偷厚度」设计,而是用平直的线条带出了科技产品的「未来感」,搭配上高亮反光的透明背板,拿在手里就像一块「玻璃砖」一样。 图片来源:雷科技 值得一提的是,为了平衡新的设计语言,Nothing 在手机背面运用了多种材料的饰板,而不同颜色带来的色差也很好的填补了手机背后的「空白感」。和过去的设计项比,Phone (4a) 的思路显然更加克制。 如果你关注过我三年前对 Phone (2) 的评测,你应该记得我吐槽过 Glyph Bar 条 在低亮度下的偏色问题在物理层面,想要在有限的背板空间内实现绝对平滑、无衰减的长距离导光,成本极高且极易翻车。在 Phone (4a) 上,Nothing 玩了一个极其取巧的方案:既然做不出完美的平滑灯条,那不如直接把它「像素化」。 全新的 Glyph Bar 中,Nothing 在每一个「像素」点下设置了三颗灯珠,这不仅彻底终结了「边缘偏色」,也增加了每个「像素」亮度阶度,让过渡更自然,更有质感。 相比之下,手机正面的处理就比较一般了。6.78 吋 120Hz 高刷屏周围的黑色边框尽管做了等宽处理,但这个黑边宽度在国内手机市场堪称「不合时宜」。不过考虑到 Phone (4a) 瞄准的是「水深火热」的海外手机市场,这个堪比 iPhone XR 的黑边我觉得其实也可以接受。 图片来源:雷科技 另外在一些细节处理上,Phone (4a) 也还有改进空间。可能因为小雷拿到的不是零售机,手机背板和边框之间的接缝会有些明显。 但如果放在海外市场,雷科技认为 Nothing Phone (4a) 依旧是一台很有竞争力的中端手机。 配置因地制宜,够用了就好 说完设计,我们来聊聊 Nothing Phone (4a) 的硬件配置。考虑到 Phone (4a)「海外中端机」的定位,Phone (4a) 在国内手机市场的竞争力可以说「极为有限」,所以大家其实也不需要对 Phone (4a) 的配置做过多的期待:Phone (4a) 采用了骁龙 7s Gen 4 处理器,提供 8+128GB、8+256GB、12+256GB 三种存储规格(官方海淘只提供 12+256GB 版本,售价 3299 元)。 这样的中端机配置在不玩游戏的情况下自然是流畅顺滑的,12GB RAM 应对 Google Play 上的「纯净版」App 也绝对够用,不需频繁清后台。但在游戏场景下,Phone (4a) 确实有些力不从心。 图片来源:雷科技 不过小雷发现,Nothing Phone (4a) 复杂的背面设计,其实为手机提供了一定的「隔热」能力,初段发热并不明显。 那么该如何评价 Phone (4a) 这种真正意义上的「中端手机」的性能呢? 雷科技认为需要分类讨论。如果在 3299 元这个价位 ,Phone (4a) 如果放在国内手机市场是没有任何竞争力的。 虽然说在绝对性能上 Phone (4a) 的配置「大致够用」,但同样的价格我们完全可以买到配置更强的国产品牌次旗舰或者上一代旗舰。在高度内卷的中国手机市场里,「日常顺滑流畅、游戏略显吃力」的 4a 显然被国产手机品牌远远甩开。 但在海外手机市场,尤其以「性价比低」闻名的欧洲市场中,Nothing Phone (4a) 显然是「鹤立鸡群」、极具竞争力的。要知道欧洲市场这种性价比荒漠上,部分所谓的「中端手机」用的甚至是国内智能手表的同款处理器。 在 399 英镑的价格区间里,Phone (4a) 既有让人眼前一亮的设计,又有不掉队的硬件配置手机,竞争力不言而喻。 只不过这种「够用」也是有代价的——快门迟滞就是 Nothing Phone (4a) 算力瓶颈的体现 反其道的「逆 AI 影像」,难能可贵 既然提到了影像,那我们也来聊聊 Phone (4a) 的相机表现。硬件上,Phone (4a) 采用了双 50MP 的广角、长焦相机组合,搭配 12MP 超广角相机,且广角和长焦相机均支持 OIS 光学防抖。 图片来源:雷科技 从样张来看,Phone (4a) 的水平相较于 Phone 3(a)、cmf 等手机,提升是非常明显的。在原生焦段(1×/3.5×)且开启 50MP 模式下,Phone (4a) 能带来相当不错的锐度和解析能力。即使这几天上海的能见度不怎么好,Phone (4a) 的成像质量也都能让我满意。 图片来源:雷科技 图片来源:雷科技 不过在非原生焦段(2×/7×)下,Phone (4a) 确实还是有解析力不足而带来的涂抹痕迹。对于树叶、水面这些很「吃」分辨率的景物来说,Phone (4a) 的影像短板还是比较明显的。 图片来源:雷科技 不过这并不意味着 Phone (4a) 的长焦一无是处,事实上,我并不讨厌 Phone (4a) 长焦端发「肉」的表现。我们知道,国内主流手机都进入到了「计算摄影」时代,开始用 AI 来增强相机在长焦端的表现。但从某种意义上看,这些用 AI 新增的信息已经脱离了「摄影」的本质。 但 Nothing 的做法恰恰相反。在发布会上,Nothing 承认使用了 AI 优化长焦,但从样张上看,Phone (4a) 拍出的照片不会有国内手机品牌那种强烈的 AI 长焦痕迹,就连 AI 长焦的那种「水印纹」也不会出现。 图片来源:雷科技 另外在色调上,Phone (4a) 也延续了品牌「高对比」的路线,同时也内置了不同风格的预设,拍出来质感还是非常不错的。 总结:撑得起 Nothing 新篇章的「起点机」 在点评 Nothing 的「新气象」之前,我们先按照雷科技评测模版,总结一下 Nothing Phone (4a) 的表现。 优点: 1. 独一无二的出色设计; 2. 在海外市场有竞争力的硬件配置; 3. AI 相机优化非常克制。 缺点: 1. 屏幕边框较宽; 2. 配置在国内市场较为平庸; 3. 相机超长焦表现一般。 在雷科技看来,从 Phone (1) 到如今的 Phone (4a),Nothing 终于完成了从极客玩物向大众精品的转变。和过去那种「为了叛逆而叛逆」、「人无我有」的精神不同,Nothing 在 Phone (4a) 上体现出了一种更克制、更均衡的产品哲学。这种转变,也给我一种 Nothing 过了「叛逆期」的感觉。 图片来源:雷科技 可以肯定的是,Nothing Phone (4a) 只能在「海外手机市场」这个舒适区里活动。但 Nothing Phone 的出现,必然会为审美疲劳的手机市场送上不一样的解题思路,甚至能带动中游阵营跳出「标准答案」,探索 AI 硬件的新形态。 在「躺平也能赚钱」的海外手机市场中,凭借设计、性能和质感杀出一条血路,Nothing 这种行为本身,又何尝不是「叛逆」的体现呢?
具身智能的故事不好讲了
撰文|画画 宇树科技要IPO了。 这条消息没有引发轩然大波,更像是一个行业话题。 在今天的AI叙事里,它甚至有点无聊。毕竟过去一段时间,大众关注的是Agent和小龙虾。相比之下,一家做机器人的公司去上市,既不新,也不快。 但如果把它的招股书信息打开,会看到一组不太一样的数据: 人形机器人收入占比,两年内从1.88%到51.53% 产销率超过95% 四足机器人卖出3万台,人形机器人出货量超5500台 年收入预计超过17亿元,扣非净利润超6亿元 与此同时,宇树拟募资42.02亿元,投向模型、本体、产品与制造基地,预计年产能7.5万台人形机器人 + 11.5万台四足机器人。 这些数字坦白说,并不炸裂。但它们指向一件更具体的事情:机器人,开始像商品一样被生产、被卖出去、被大规模交付。 这是具身智能行业,第一次交出可供核实的商业证据。 1、机器人出厂的那一刻 2024年秋天,一段视频在行业圈子里悄悄传开。 视频里没有精心设计的演示,没有灯光,没有配乐。一台机器人在某工厂车间里缓慢移动,绕过地上的杂物,停在货架前,完成了一次取件操作。旁边站着的工人在刷手机,没有人鼓掌。 视频的主角是宇树H1,这是宇树2023年推出的第一代通用人形机器人,身高约1.8米,自重47公斤,采用全身电机驱动,设计目标是在非结构化环境中完成实际工作,而不只是跑固定程序的演示。H1正式发布时,售价约9万元,是当时全球量产人形机器人里定价最低的之一。 这段视频后来被很多人转发,不是因为技术有多惊艳,而是因为它让人感受到一种不同以往的东西:这像是工作,而不是表演。 王兴兴在一次访谈里说过一句话,大意是:我们不追求机器人看起来帅,我们追求它被用完了还想再买一台。 这句话和宇树的起点放在一起,会有点违和感。2022年拿到新一轮融资时,宇树还在杭州一栋不起眼的写字楼里,32岁的王兴兴在圈内已经小有名气,但远没有今天这般风光。 但正是这种朴素的产品逻辑,让宇树走出了一条和大多数机器人公司不一样的路。 2、Demo是一回事,出货是另一回事 过去五年,具身智能领域最不缺的就是视频。 机器人翻跟头、端咖啡、打乒乓球、弹钢琴,每隔几个月,就有一段新的演示刷屏。每次刷屏,都伴随着新一轮融资和新一轮讨论:具身智能的iPhone时刻要来了。 但“要来了”这三个字,说了很多年。 真正没有回答的问题,一直是三个:能不能规模生产?有没有真实需求?能不能持续出货? 宇树招股书里的数字,第一次正面回答了这三个问题。 产销率超过95%,意味着造出来的东西,基本都卖掉了。买家里有工厂、有高校、有研究机构、有海外客户,不是一种场景,是多种场景同时在跑。这不是预期需求,是真实的买单行为。 两年内,人形机器人从收入占比不到2%,变成超过50%。这种速度说明,市场不是在等这个产品,而是在迅速消化它。 年产能规划超过19万台。把这个数字做一个类比:凯迪拉克2024年在中国全年交付约15万辆。宇树机器人的产能目标,已经在向一个成熟消费品的出货量量级看齐。 3、壁垒不在模型,在能不能量产 如果继续读招股书,会看到一个有意思的资金分配:48.13%的募资投向模型研发,其余投向制造基地与本体研发。 这个比例揭示了具身智能最核心的矛盾:它既是AI问题,也是工程问题。 但这两个问题的竞争烈度,正在发生分化。 模型层,正在加速公共化。无论是开源社区,还是商业API,AI基础能力的获取门槛在快速降低。你今天在机器人里调用的视觉模型、语言理解能力,明年可能所有竞争对手都能以更低成本接入。 但量产能力不会公共化。它依赖的是多年积累的供应链关系、能稳定生产复杂硬件的工厂,以及大量被踩过一遍的工程坑。这些东西,写不进论文,买不来,只能自己熬。 宇树从四足机器人起步,这个选择本身就藏着逻辑。四足机器人的市场规模小得多,但它是宇树最早跑通产品化路径的品类,也是让团队真正理解“量产”意味着什么的训练场。 从四足到人形,王兴兴做的不是一次全新出发,而是把已经验证过的工程体系,迁移到更复杂的硬件上。 会做Demo是入场券,能稳定出货才是护城河。 4、具身智能行业泡沫,开始分层了 说宇树的故事,绕不开一个更大的背景。这个行业里,大多数公司,现在在哪里。 2023年到2025年,中国涌现出超过60家人形机器人公司,融资总额超过500亿元。投资人的逻辑是,这是下一个爆发赛道,要提前卡位。 但如果仔细看这些公司的现状,会发现一个明显的分层。 第一层,真正进入量产的,屈指可数。宇树是目前最接近规模出货的一家,其次是几家有大厂背景或大客户锁定的公司。 第二层,完成了产品定义,能拿出样机,有小批量交付,但出货量仍在几十到几百台量级。技术路线不差,但距离产业化还有一段路。 第三层,还在融资、还在做Demo、还在参展。视频拍得很好,能说出完整的技术故事,但没有可以核查的出货数据。第三层的公司并非没有价值。一些核心技术积累,可能会在未来的整合中被吸收。 但对于今天的投资人和观察者来说,这是一个重要的提示:机器人行业的泡沫,不是整体泡沫,而是分层泡沫。 能出货的公司是真的,剩下的部分,需要更审慎地对待。 这也是宇树IPO的另一层意义,它在给整个行业做一次强制分类。 5、一个新的组合出现了 看宇树的股东结构,会发现一些有意思的名字:王兴及其相关体系(美团系合计持股9.65%),雷军的顺为资本(持股4.42%),以及红杉、经纬等头部机构。 这个组合,用资本加持来解释,过于表层。更值得关注的,是这几股力量各自能带来什么: 雷军体系:制造经验、消费电子供应链、硬件规模化打法 王兴体系:本地生活场景、配送网络、服务落地渠道 宇树本身:机器人本体、运动控制、量产工程能力 这三者放在一起,其实是在回答一个比机器人好不好用更关键的问题:机器人,最终用在哪里、谁来运营、怎么覆盖到足够多的场景。 AI应用层的故事,往往是单点突破,一个产品打穿一类用户。但机器人不是这个逻辑。它是一个系统工程,硬件、软件、场景、服务网络,缺一块就难以规模化。 这正是为什么具身智能的竞争,最终不是公司对公司,而是生态对生态。谁能最快把这几块拼完整,谁就在下一轮占据有利位置。 宇树IPO,是这场拼图游戏里,第一块大图显现出轮廓的时刻。 6、一台机器人,值不值这个钱 宇树的四足机器人Go2,起售价9997元,首次将行业产品定价降至万元以内。人形机器人G1起售价9.9万元(现已下调至8.5万元),R1起售价3.99万元,Air款2.99万元。加上部署和服务费用,一台落地的完整成本大约在10-20万元区间。 这个价格,放在今天,其实已经开始让一些买家认真算账了。 假如一个保安,月薪5000元,一年成本6万,三年接近18万,还不含管理成本和假期问题。一台四足机器人做夜间巡检,三年摊下来约莫同等量级,但跑的是不间断的机器时长。 这笔账,并不是每家工厂都能算清楚。 机器人部署还涉及场地改造、系统对接、日常维护。买单之前,这些隐性成本很多人没想清楚。机器人能做的事,往往也比预期更窄,它能完成固定场景下的重复任务,但复杂的判断和例外情况处理,还不在它的射程范围内。 但有一件事是确定的:机器人的成本只会越来越低,能力只会越来越强。这是工业化生产的基本规律。 GGII数据显示,2026年Q1人形机器人单台成本已降至10万元,较2025年下降33%,投资回收期缩短至12个月。 宇树现在做的,就是用规模化生产拉低价格曲线,用持续迭代抬高能力曲线,等这两条曲线的交叉点足够低的时候,算账就不需要再算了,买机器人会像买电脑一样自然。 这才是宇树规划年产19万台的真实逻辑:不是今天有这么多需求,而是要用产能把价格打下来,创造明天的需求。 7、这个行业,不再属于讲故事的人 所有行业在早期都有一段故事期。 特征是技术新、视频好看、想象力大、资本活跃,但没有真实的交付发生。这个阶段,讲得好比做得好更重要。 宇树用一份招股书,把这个行业的故事期,正式画上了句号。 当一个行业开始讲产能和交付周期,它的竞争逻辑就变了——从技术领先,变成效率、成本、能不能持续交付。入场门槛被抬高,玩家开始被强制分层,资本的耐心也开始收紧,越来越看交付数据,不只看PPT。 这个行业,变得更重了。 重,不是坏事。汽车、消费电子,都经历过这个时刻。从新技术变成工业产品。越过这个门槛的公司,才真正拥有了长期价值。 8、从理解世界,到进入世界 如果把AI这十年的演进拉成一条线,会看到一个清晰的轨迹。 起点是理解。机器学会了读语言、看图像、处理知识,第一次能听懂人在说什么。 然后是介入,AI进入工作流,生成内容,辅助决策,从能听懂变成能帮上忙。 而现在,正在发生的是第三件事:AI开始有了手脚,能走进工厂、走进仓库,完成那些过去必须由人来完成的物理操作。 理解世界,到参与世界,到进入世界。每一步,都比上一步更难,也更真实。 宇树所处的位置,正是第三步刚开始走稳的地方。这不是一个未来某天会发生的故事,而是一件正在发生的事,有招股书为证,有出货数据为证,有那些开始认真算账、准备下单的工厂为证。 过去两年,AI证明了机器可以思考。宇树正在证明,机器可以工作。 这两件事之间的距离,比大多数人预料的,更近,也更快。 【版面之外】的话: 宇树IPO的意义,不在它融了多少钱,而在它让这个行业第一次有了可量化的参照物。 以前我们说一家机器人公司好,靠的是视频、参数、融资额。现在可以看更实在的东西:产销率、出货量、收入结构、产能规划、客户构成。 这是一个行业从讲故事到讲数据的转折点。那些还在做Demo的公司,和那些已经量产的公司,从这一刻起,不再属于同一个赛道。 王兴兴说,2026年宇树的出货目标是1万到2万台。如果这个目标达成,意味着今年会有至少1万台人形机器人走进工厂、走进仓库、走进真实的工作场景。 到那时候,具身智能这个词,就不再是概念,而是账单上的采购条目。 这才是宇树IPO真正值得被记住的理由,它让机器人,开始像商品一样被谈论。
又一笔记本厂商Ninkear陷入CPU虚标争议,官方承诺调查
IT之家 3 月 22 日消息,据科技媒体 Notebookcheck 昨天报道,继驰为 CoreBook X/Plus 笔记本被指虚标 CPU、拿锐龙 5 5500U 冒充 7430U 后,又一笔记本品牌 Ninkear 陷入同样争议,并且虚标的处理器型号与驰为完全相同。 据报道,该媒体曾在去年夏季收到了 Ninkear 提供的 A15 Pro 笔记本样机并进行评测,当时确实检测到了 7430U。不过根据读者反馈,市售版本(尤其是近期出货的批次)可能存在虚标 CPU 现象。 该媒体为此从电商渠道随机购入一台 Ninkear A15 Pro 进行检测,结果发现存在和驰为一样的虚标现象。BIOS、系统任务管理器显示为锐龙 5 7430U,但拆机可以看到处理器的 OPN 编号为 100-000000375,对应锐龙 5 5500U。 ▲ 任务管理器截图 ▲ 左:5500U 主板,右:7430U 主板 据悉,随着事件逐步发酵,越来越多品牌正在卷入这场风波。但目前已发现的相关笔记本和主板均由 ODM 厂商“深圳市亿道信息股份有限公司”制造。并且去年的正常样机和今年 3 月的问题零售机均使用相同主板,说明确实存在不同生产批次。 同时,用户反馈虚标的时间点多集中于去年年末,该媒体由此推测,厂商很可能在去年夏秋期间将处理器从 7430U 更换为 5500U,同时配合 BIOS 修改进行“伪装”。 并且 AMD 处理器可以通过 MSR 寄存器修改“处理器名称字符串”(IT之家注:PNS),从而修改 BIOS、Windows 系统和大多数检测工具的显示处理器型号。而 5500U 和 7430U 在大部分参数上相似,能够让伪装更加天衣无缝。 不过 CPU-Z 官方最近更新了 2.19 版本,已经能识别这种伪装并显示真实的 CPU 型号。 Ninkear 针对此事表示:“我们始终秉持对经销商和用户负责的态度,已和相关 ODM 厂商就受影响产品批次展开调查。并且我们已经通知经销商和用户,建议受影响用户联系销售渠道或官方支持。我们已经成立服务工作组,旨在解决质量相关问题,欢迎消费者维护合法权益”。
Cursor套壳、黄仁勋坐上宾,DeepSeek的光环现在都是Kimi的了
作者|周一笑 邮箱|zhouyixiao@pingwest.com 北京时间3月20日,AI编程工具Cursor发布了自研模型Composer 2,宣称是公司首次对基座模型进行“继续预训练结合强化学习”的成果。发布博客里没提基座模型的来源,措辞像是在说,这是Cursor自己从头炼出来的。 不到两小时,一个名叫Fynn的开发者在调试Cursor的API时,截获了Composer 2的真实模型ID,kimi-k2p5-rl-0317-s515-fast。拆开来看,kimi-k2p5指向Kimi K2.5,rl是强化学习(Reinforcement Learning),后面是日期和版本号。 月之暗面预训练负责人杜宇伦第一时间发推,称团队测试了Composer 2的tokenizer,发现与Kimi的tokenizer“完全一致”,几乎可以确认“这是对我们模型的进一步微调”。他直接@了Cursor联合创始人Michael Truell,质问为什么不遵守许可证,也没有支付任何费用。这条推文随后被删除。 但火已经烧起来了。马斯克在Fynn推文下面回复了一句“Yeah, it's Kimi 2.5”,直接把事情拱上了热搜。 从“套壳”到“合作”,反转只用了几个小时 Kimi K2.5采用修改版MIT许可证,明确要求月营收超过2000万美元或月活超过1亿的商业产品,必须在用户界面上醒目标注“Kimi K2.5”。Cursor的年化收入约20亿美元,超出这条门槛8倍有余。 但就在舆论发酵的同一天,剧情反转了。月之暗面官方账号@Kimi_Moonshot发帖,口吻从质疑变成祝贺,称“我们很自豪看到Kimi K2.5为Composer 2提供了基础”,并澄清Cursor通过推理服务商Fireworks AI获得了授权使用。 Cursor联合创始人Aman Sanger随后解释说,团队对多个基座模型做了评估,Kimi K2.5是“最强的”,之后在此基础上做了额外预训练和4倍规模的强化学习。他承认没有在发布博客中提及Kimi K2.5是一个失误。 从开源协议争议到官宣合作,整个过程不到24小时。 Cursor为什么“失误” 这也不是Cursor第一次被发现“底座来自中国”。2025年11月Composer 1发布时,社区通过tokenizer分析推测它与DeepSeek高度一致,推理时偶尔还会输出中文。当时Cursor同样没有回应。 从DeepSeek到Kimi,Cursor自研模型的底座换了一轮,都指向同一个事实,全球编程能力最强的底座模型,出自中国的开源社区。 Cursor不愿公开底座来源,背后有一个更深层的结构性问题。Cursor一直以来依赖Anthropic和OpenAI的模型来驱动产品,但这两家公司现在正亲自下场做编程工具,Claude Code和Codex都在迅速铺开,不少开发者已经开始迁移。Cursor面临的悖论是,它必须依赖顶级模型来满足用户需求,但模型厂商同时也是它的直接竞争对手。如果没有自己可控的模型底座,Cursor就永远受制于人。 从这个角度看,选择中国开源模型微调几乎是一个必然的逻辑,既够强,又不会变成自己的竞争对手。但这同时也是Cursor不愿公开讲的原因,2025年它是AI编程赛道最炙手可热的明星,估值冲到293亿美元,3月12日Bloomberg报道新一轮融资目标估值约500亿美元。在这个节骨眼上承认核心模型来自中国开源社区,对估值叙事并不友好。 Composer 2在Cursor自己设计的CursorBench上拿到了61.3分,超过了Claude Opus 4.6的58.2分,不过这毕竟是一份自家出题自家考的成绩单。反过来看,如果一个基于开源模型微调的产品能在编程任务上和巨头打得有来有回,这件事本身可能比Cursor的披露失误更有意思。Hugging Face联合创始人Clément Delangue就此评价说,“中国开源现在是塑造全球AI技术栈的最大力量”。 而对月之暗面来说,这场风波的结果几乎是一次完美的品牌事件,从“被侵权方”到“合作方”,在全球开发者社区里刷了一轮存在感,最后还让Cursor亲口确认“选了Kimi K2.5因为它最强”。 Kimi的“黄金一周” 往前倒推几天,Kimi刚经历了一个密度极高的曝光周期。 3月16日,月之暗面发布了一篇纯架构层面的技术论文“Attention Residuals”(注意力残差),试图替换掉Transformer架构中一个自2015年ResNet以来就几乎没人动过的基础组件,残差连接。过去每一层的输出和输入直接相加、无差别传递,Kimi团队让每一层可以“回头看”,动态选择从前面哪些层提取信息。实验显示训练效率提升约25%,推理延迟增加不到2%。论文的共同一作之一是一位17岁的深圳高中生,和Kimi的关键研究者苏剑林、张宇并列。 论文发出当晚,马斯克在X上评价“Impressive work from Kimi”,Kimi官方回了一句“你的火箭造得也不错”。Andrej Karpathy说,“看来我们还没把'Attention is All You Need'这句话按字面意思理解透”。前OpenAI强化学习VP Jerry Tworek称之为“深度学习2.0”的开端。 第二天,3月17日,黄仁勋在GTC 2026的Keynote中多次提及中国开源模型。Kimi K2.5代替了去年的DeepSeek ,成为黄仁勋用来对全世界展示推理重要性的时候,那个作为标杆的模型。 3月18日,杨植麟更是直接登上GTC的分论坛演讲。他是嘉宾名单中唯一来自独立大模型创业公司的代表,与特斯拉AI总监、DeepMind核心架构师同列。演讲现场也座无虚席,他系统披露了Kimi K2.5背后的技术路线,将模型进化归纳为Token效率、长上下文和智能体集群三个维度。 而在DeepSeek彻底走红之前,在GTC上做分享最多的中国开源模型团队,曾经是DeepSeek。 论文、GTC、Cursor,三件事在一周内接连落地,且这些亮眼的高光里都有与DeepSeek“时代更替”的意味:曾经是DeepSeek 每篇论文都被全球技术社区和KOL大佬追捧转发,曾经GTC几乎是DeepSeek的“非官方”发布会,甚至Cursor以前“悄悄套壳”的也是DeepSeek ,而一瞬间,全部变成了月之暗面Kimi。 站在DeepSeek的位置上 这让很多人开始意识到,Kimi正在占据DeepSeek在全球AI社区中的位置。 DeepSeek R1在2025年初的爆发重塑了整个行业的认知,让“中国AI”从一个模糊的概念变成了具体的、可以运行的模型权重。但自那之后,DeepSeek相对沉寂了。社区期待已久的V4/R2一直没有发布,V3.1、V3.2等版本持续在更新,但那种“一出手就改写规则”的冲击感暂时没有重现。 Kimi恰好踩进了这个窗口期。 2025年春节后,Kimi日活一度承压,月之暗面砍掉了大笔营销预算,闭门做模型。7月,Kimi K2发布,万亿参数MoE架构。K2发布后在Hugging Face上线首日下载量超过平台上所有其他模型,Anthropic联合创始人Jack Clark评价其为“全球最好的开源权重模型”。 2026年1月底,K2.5发布,原生多模态加Agent集群架构,在多项Agent评测中拿下全球开源最佳。OpenClaw热潮到来后,Kimi Claw迅速上线。据报道,K2.5发布不到一个月,Kimi近20天累计收入就超过了2025年全年。Stripe数据显示,Kimi个人订阅用户1月支付订单环比增长8280%。 资本层面的节奏也在加快。2025年底5亿美元C轮,投后估值43亿美元;2026年2月超7亿美元,估值升至100亿美元;3月中旬新一轮10亿美元正在推进,估值已到180亿美元。同期港股上市的智谱和MiniMax,市值在3月中旬分别站上了3300亿和3800亿港元的量级,月之暗面还没进二级市场,以当前AI板块的溢价看,上市后的想象空间不小。 Kimi就这样用DeepSeek的方式夺走了DeepSeek的光环。 Kimi K2的架构直接脱胎于DeepSeek V3,MLA注意力机制、MoE专家混合框架都是DeepSeek首创或率先大规模验证的。Kimi的崛起本身就是DeepSeek技术影响力的一种继续。DeepSeek的开源策略也更为彻底,采用纯MIT许可证,没有任何营收门槛限制,这让它在全球开发者生态中积累了极高的渗透率。Kimi的修改版MIT许可证在商业使用上多了一层约束,这次Cursor事件就是一个例子。 在DeepSeek相对安静的这段时间里,Kimi接过了“中国AI开源代表”的话筒。无论是黄仁勋的演讲台、Cursor的模型底座,还是学术论文和开发者社区,Kimi正在填补一个需要持续有新鲜内容的叙事空间。 而且Kimi做的也不只是出模型,Attention Residuals论文触碰的是深度学习十年没有实质性变化的底层结构,这和DeepSeek当年做MLA是一个路数,都是在尝试重新定义行业的基础设施。 中国AI开源的故事,正在从“一个DeepSeek”变成一个不停有新的夺走光环的玩家出现的故事,这和硅谷的节奏越来越像,OpenAI之后是Google,Google之后Anthropic,然后循环。 由中国的开源模型们交替接管全球开发者们的时间线,模型能力螺旋式上升的同时,话语权不旁落:等到DeepSeek 新模型出现时,Kimi的注意力会不会被夺走;MiniMax、Qwen、智谱、阶跃以及同样来势汹汹新入局的小米们的新工作,会不会再突然夺走它们俩的主角位置,这些都在让这种螺旋交替继续下去,而这对每个中国AI参与者都是好事。
年轻人正把社交“外包”给AI:用聊天机器人处理分手等棘手场合
IT之家 3 月 22 日消息,过去几年里,研究人员、教师和心理健康专家都震惊地发现,青少年和年轻人正把自己的大脑“外包”给人工智能聊天机器人。如今,他们把这项技术当作拐杖,用来逃避那些不想面对的艰难对话。 美国有线电视新闻网(CNN)的最新报道详细描述了一个令人担忧的趋势:越来越多的年轻人在人生中那些微妙、棘手的时刻,让 ChatGPT 等人工智能模型代自己出面。 例如,耶鲁大学一名叫帕特里克的学生,就用 ChatGPT 来拒绝一位通过共同朋友认识的女生。“嘿,艾米莉!希望你的半程马拉松顺利 —— 我相信你一定表现超棒。”帕特里克这样开头。 接下来长达六段、满是 ChatGPT 典型文风的文字,堪称 21 世纪尴尬文学的完美缩影。在 AI 代写的内容里,“帕特里克”表示很乐意“多一起出去玩 —— 不管只是做朋友,还是保持我们周末那样的关系”,但附带说明自己“目前并不想发展太认真的感情”。 “这段话看起来非常得体,我当时觉得他人挺好的,所以就想,也许他平时就是这么发消息的。”艾米莉告诉 CNN。然而,在给几位朋友看过后,她确信这段话“99% 是 AI 写的”。 面对质问,帕特里克承认拒绝短信是用聊天机器人代写的,他说自己不擅长写这种敏感措辞。“我知道如果自己写,肯定会含糊不清、优柔寡断。”他说。 研究人员已经为这种现象起了一个术语:社交外包。一项即将发表在《实验儿童心理学杂志》上的研究指出,它指的是“在任何基于共同任务的场景中,个体能够借助社交环境中的其他主体…… 来提升自身的认知表现”。 换句话说,帕特里克让 ChatGPT 帮他组织拒绝话术的行为,就是典型的社交外包。 IT之家注意到,虽然社交外包并不只涉及人工智能 —— 正如上述研究提到的,儿童也会把事情外包给成年人,但聊天机器人的兴起,让这一现象进入了人机交互的领域。 Common Sense Media 研究主管迈克尔 · 罗布称:“如果你用 AI 给朋友或恋人写消息,你就是在把沟通行为本身外包出去。我见过很多青少年、二十岁出头的年轻人用 AI 来社交,他们往往是因为自己不懂得如何真正与人交往,才用 AI 来过度弥补。” 罗布解释说,这对人类未来的发展有着严峻的影响:“如果每一条棘手、难开口的消息都由 AI 代笔,可能会让用户形成一种观念 —— 觉得自己的语言和直觉永远都不够好。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。