行业分类:
加载中...
头条分类:
加载中...
库克回应OpenClaw带动Mac mini大卖:苹果十年前已布局AI硬件
IT之家 3 月 21 日消息,苹果 CEO 蒂姆 · 库克 3 月 18 日再次来华,随后开启了紧锣密鼓的行程。 在一场与 Mac 有关的访华行程中,库克接受记者采访,针对近期 OpenClaw 带动 Mac mini 大卖的问题进行了回应。 他表示,苹果十年前就在 Mac 中加入了神经网络引擎,随着苹果芯片、生成式 AI 以及智能体交互的共同发展,这种硬件与软件的集成使得 Mac mini 成为最适合做 AI 任务的电脑。苹果接下来会持续优化针对 AI 工作流的 Mac 性能,事实上,用户现在已经可以在 Macbook Pro 上训练大语言模型。 IT之家注意到,苹果 2024 款 Mac mini 搭载 M4 / M4 Pro 芯片,官方定价 4499 元。搭载 M4 芯片的新款 Mac mini 相比 M1 机型,CPU 提速最高可达 1.8 倍,GPU 提速最高可达 2.2 倍。 苹果表示,相比同等价位的 PC 台式电脑畅销机型,Mac mini 的尺寸规格仅为其 1/20,速度却最高快达 6 倍。 相比英特尔酷睿 i7 芯片版 Mac mini,搭载 M4 芯片的 Mac mini: 在 Logic Pro 工程中支持的音效插件数量增加最多可达 2.8 倍。 玩《魔兽世界:地心之战》时的游戏性能提速最高可达 13.3 倍。 使用 Photomator 的图像优化放大性能提速最高可达 33 倍。 相比搭载 M1 芯片的 Mac mini,搭载 M4 芯片的 Mac mini: 使用 Microsoft Excel 运行表格计算的速度提升最高可达 1.7 倍。 使用 Adobe Lightroom Classic 拼合全息图像的速度提升最高可达 4.9 倍。 相比搭载 i7 芯片的 Mac mini,搭载 M4 Pro 芯片的 Mac mini: 使用 Microsoft Excel 运行电子表格计算提速最高可达 4 倍。 在 Adobe Premiere Pro 中运行场景编辑检测的速度提升最高可达 9.4 倍。 使用 Oxford Nanopore MinKNOW 进行基因测序时的碱基识别速度提升最高可达 26 倍。 相比搭载 M2 Pro 芯片的 Mac mini,搭载 M4 Pro 芯片的 Mac mini: 在 Logic Pro 工程中支持的音效插件数量增加最多可达 1.8 倍。 使用 Motion 在 RAM 中渲染运动图形的速度提升最高可达 2 倍。 使用 Blender 渲染 3D 模型的速度提升最高可达 2.9 倍。 中国贸促会会长任鸿斌昨日在京会见库克。库克表示:“中国依旧是我们最重要的供应链合作伙伴。” 库克昨日还在 X 上发布推文,表示 2026 款 MacBook 机型刷新了苹果公司面向首次购机用户的“史上最佳首周销售纪录”。
排面拉满!马斯克一周两次点名Kimi,国产AI真的赢麻了
一觉醒来,小雷发现马斯克又登上了微博热搜。 但这一次,可不是聊他的火箭和特斯拉,而是夸咱们的国产 AI —— Kimi。 又夸技术硬核,又实锤模型,一举将咱们的 Kimi 送上全球热搜! 说实话,这排面真的不多见。 所以今儿个,小雷就带大家好好吃上这个热乎瓜。 起因是有个编程工具 Cursor 发布了新的编码模型,一开始并没有掀起太大的浪花。结果被眼尖的开发者扒出,这个所谓的新模型是基于 Kimi k2.5 RL 微调的。这事整得沸沸扬扬,技术社区的网友们更是众说纷纭。毕竟,国外模型用了 Kimi 开源的数据基座,还搁那“装”,谁受得了啊。 图源:微博 然而就在这时,马斯克出现了。 评论区留下一句“ Yeah,it's Kimi 2.5 ”后,AI 圈彻底炸锅。 这不就摆明公开给 Kimi 站台呢嘛。事情闹大后,Cursor 开发者体验副总裁也承认使用 Kimi 基座,并向 Kimi 道歉。后续 Kimi 官方账号在 X 平台发布声明澄清,说是 Cursor 通过第三方平台 Fireworks AI 获得了授权。高情商发言挽救的同时,还变成了一次合法的商业合作。 另外,Kimi 官方也向马斯克发表致谢:听我说,谢谢你,因为有你。 图源:微博 值得一提的是,此次评论并非马斯克首次翻牌 Kimi。 早在 3 月 16 日时,已经在技术层面上狂赞了一番。当时 Kimi 团队发布一篇超硬核的学术论文,讲的是 AI 底层技术“注意力残差”。正常来说,这种专业论文,咱普通人也看不太懂,所以相对来说,发布之后的热度也没那么高。结果被马斯克一键转发后,又彻底火了。 小雷认为哈,能让马斯克这么一个全球顶流科技大佬点赞的产品,那自然是有硬实力在身上的。 当然针对马斯克的夸赞,咱 Kimi 官方也是懂人情世故的。直接回了一句“你的火箭造得也不错!”一边是科技大佬夸 AI,一边是国产 AI 隔空回火箭,这段高情商发言火上热搜后,网友都笑疯了,妥妥的科技圈双向奔赴啊。本来以为这事没下文了,谁曾想 3 月 20 号又来一波翻牌,给国人们脸都笑开花了。 你们想想啊,以前都是咱们追着国外 AI 跑,现在马斯克主动夸咱们的产品,这是对底层技术创新的最高认可。 图源:网络 看到这,可能有人会说,Kimi 是运气好,才会被马斯克翻牌。 但小雷认为,这是国产 AI 多年来努力的结果。自今年开年以来,中国的大模型公司们一个个在市场打出名堂,个个都很争气。频频发新模型是一方面,出海也是一方面,各有各的强项。无论是我们日常使用、办公辅助、还是技术研发,真一点都不比国外差。只是以前没人愿意承认,而且国际上关注度不够。 但马斯克的两次点名,完全是给国产 AI 做了一次全球免费宣传。让全世界都知道,中国 AI 不再是跟跑,已经开始慢慢跑到第一梯队了。这可不仅是 Kimi 的胜利,也是咱们整个国产 AI 行业的争气。从“小众圈子网红”到“马斯克认证的 AI”,这跨越不是一点半点。 图源:Kimi 不过有句古话说得好:谦虚使人进步,骄傲使人落后。我们也不能因为一时夸赞而飘飘然,马斯克的认可,既是鼓励也是压力。接下来还是要继续专心搞技术,努力努力再努力,把产品做得更好,才能真正在全球站稳脚跟。 至于 Kimi 接下来会不会趁机搞一波营销,或者马斯克会不会有下一步动作,小雷觉得,咱们可以继续搬好小板凳,等着看戏。 话说,你们平时用 Kimi 多,还是其他 AI 工具呢?
为什么大厂必须抢郭达雅?
有这样一则消息在AI圈悄然流传:DeepSeek研究员郭达雅已经离职。 大家第一时间的反应普遍是“谁?谁是郭达雅?” 这不难理解,因为郭达雅的知名度远不如创始人梁文锋以及“天才AI少女”罗福莉。 但是在学术研究以及对DeepSeek大模型的贡献上,郭达雅要比后两者高许多。 截止至发稿,郭达雅发表的论文已经被引用超过37000次,远远超过了同龄的研究者。 郭达雅的h指数为37,i-10指数为46,说明他不仅学术产出非常稳定,而且他还发表了多篇拥有极高影响力的论文。 甚至可以这么说,只要你了解过郭达雅的研究方向以及他所主导的研究后,你就会认识到,当年之所以能出现DeepSeek时刻,郭达雅绝对功不可没。 那他去哪了?目前有两种说法,一种说是百度,一种说是字节。 实际上这两年加入字节的这几个大牛,周畅、郁博文、蒋路,他们都是视频方向的。 郭达雅不一样,他是代码智能和数学方向的,他刚好可以补强字节在Vibe Coding以及AGI这两大板块。 如果是去百度,那也说得通。文心快码在3月份刚刚完成了4.0版本迭代,推出了多agent协同全链路开发的功能。 但是你知道文心快码3.0是什么时候发布的吗?是2024年11月。两个大版本中间相隔了一年多,这在以周为单位的AI圈是不太常见的。 这么看下来,百度其实比字节更需要郭达雅。 然而对于迟迟不发布V4的DeepSeek,郭达雅的离职,无疑是雪上加霜。 01 郭达雅其人 郭达雅1995年出生于广东珠海,2014年考入中山大学数据科学与计算机学院。大四时入选中山大学与微软亚洲研究院联合培养博士生项目,在印鉴教授和周明博士指导下攻读博士学位,研究方向是自然语言处理。 2020年获得微软学者奖学金,这个奖项每年只授予亚太地区12名博士生。2023年博士毕业后,他加入DeepSeek担任研究员,专注代码智能和大语言模型推理。 郭达雅在博士期间的一个细节值得注意。他在微软亚洲研究院实习时,分别在EMNLP和NeurIPS这两个顶会发表了论文。 如果按照中山大学的毕业要求,郭达雅在博士入学的第三天,就已经完成了博士学位最难的论文发表要求。 他本人在接受采访时也提到了这件事。那我们不妨挑一篇其中影响力最高的来一起过一遍。 2020年,郭达雅作为共同第一作者,在EMNLP 2020上发表了CodeBERT。另一位共同第一作者是哈尔滨工业大学的冯章印。 CodeBERT是首个将双模态预训练的效果做到跨语言通用的SOTA,它能同时处理自然语言和编程语言。在此之前,BERT等预训练模型,虽然在自然语言处理领域取得了成功,但针对编程语言的预训练模型研究相对匮乏。 CodeBERT的核心创新在于引入了替换标记检测任务。传统的掩码语言建模只能利用配对的自然语言-代码数据,而替换标记检测借鉴了ELECTRA的思想,通过检测生成器产生的似是而非的替代标记来训练模型。 这使得CodeBERT能够利用大量单模态代码数据,大大扩展了训练数据规模。模型在代码搜索和代码文档生成任务上取得了当时的最优性能。 或者我换一种方式来描述,CodeBERT它能让AI既能读懂人类语言的需求描述,又能理解代码的逻辑结构。比如你用中文说“给我找一个排序算法”,它就能帮你找到相关的代码;或者你给它一段代码,它能用人话解释这段代码在干什么。 虽然现在看来这没什么,可这篇论文是2020年发表的,在当时,代码就是代码,自然语言就是自然语言,这两者之间隔着一条通天河。 因此,CodeBERT的出现,其实可以被看做是现如今Vibe Coding的开端。 加入DeepSeek以后,如果你要问郭达雅参与过的最有影响力的学术成果,那肯定是非DeepSeek-R1莫属了。 但如果你要问排名第二的是哪篇,那我告诉你,答案不是DeepSeek-V3,而是DeepSeekMath。 DeepSeek-V3的技术报告引用数量为3890,而DeepSeekMath的引用数量为5182。 2024年2月,郭达雅作为核心贡献者参与了DeepSeekMath的研发。这是继郭达雅以第一作者身份发表DeepSeek-Coder后的又一力作,这个项目的目标是提升大语言模型在数学推理方面的能力。 DeepSeekMath的关键创新是引入了GRPO,即群体相对策略优化。这是近端策略优化PPO的一种变体。 传统的PPO需要训练一个独立的价值函数模型,这增加了内存使用和计算开销。 所以GRPO干脆直接放弃了对独立价值函数模型的依赖,转而通过群体内的相对比较来估计优势,因此降低了训练资源需求。 GRPO的工作流程是这样的:对于同一个数学问题,模型生成多个候选答案,然后根据这些答案的正确性进行排序,将正确答案的概率提高,错误答案的概率降低。 这样一来,大模型在下次遇到类似问题就知道该怎么做了。 这种方法不需要额外的价值网络,只需要一个能够验证答案正确性的奖励函数。在数学推理任务中,奖励函数可以直接检查最终答案是否正确。 相当于让模型在判断问题的时候,又快又准确,关键是还节省了内存占用。 经过GRPO强化学习优化后的DeepSeekMath-RL 7B,在无外部工具、无投票集成的条件下,在MATH基准上取得了51.7%的成绩,这和同期的Gemini-Ultra和GPT-4接近,在当时的开源大模型领域,已经非常难得了。 因此,GRPO在后来也被应用到了DeepSeek-R1的训练当中。 02 郭达雅去哪? 其实如果咱们从技术贡献的角度看,虽然梁文锋、罗福莉的知名度更高,但是郭达雅对DeepSeek的贡献要比他们俩都高。这点和公众认知是相反的。 梁文锋的作用是提供研究方向和资源支持。他在多篇论文中的署名位置通常靠后,表明他不是主要的技术贡献者。 罗福莉虽然也参与了DeepSeek-V2的研发。不过从论文作者名单看,她的名字并没有标注为核心贡献者。 言归正传,在agent的本质,就是代码理解(Code Understanding)、代码生成(Code Generation)和程序综合(Program Synthesis)这三件事。 而巧合的是,从CodeBERT开始,郭达雅的研究方向就是如此。 因此我认为,郭达雅的离职,对于DeepSeek来说,影响是非常大的。 除了前文提到的CodeBERT,郭达雅还主导了GraphCodeBERT和DeepSeek-Coder。 前者是让AI能理解代码中变量之间的依赖关系,比如说改了a会影响b,改了b又会影响c。这对代码重构和修复Bug特别有帮助。 后者则是通过支持多种编程语言和更长的上下文,让模型能一次性理解整个项目的代码架构。DeepSeek-Coder-V2的代码性能与同期的GPT-4 Turbo相当。 2024年的时候,字节从阿里挖走了周畅。周畅在阿里通义千问负责多模态相关研究,加入字节后担任Seed视觉多模态负责人,主导Seedream和Seedance的研发。 2026年春节,周畅交出了在字节的第一份答卷Seedance 2.0,凭借“导演级”的视频生成能力在全球范围内引发轰动。 现在,字节用同样的方式挖走了郭达雅。周畅补强的是视觉多模态,郭达雅要补强的,是代码智能和推理能力。 字节Seed团队在2025年初经历了一次重组。 吴永辉接管后,打破了模型部门间的数据壁垒,组建了三层架构:Edge团队负责长周期的AGI课题,Focus团队负责核心技术攻坚,Base团队确保当前一代模型的稳定交付。 从技术匹配度看,郭达雅最可能负责的,是代码大模型的全链路技术攻坚。 比如说主导字节Code-LLM的下一个迭代之类的。 因为郭达雅擅长预训练架构优化、超长上下文适配、多语言支持等核心技术的研发,所以他很可能会为字节带来那种“项目级”的代码生成agent。 第二个核心方向是推理能力。 目前字节Seed团队的核心战略之一,就是类o1的通用推理大模型,郭达雅的加入,将直接给字节带来行业最成熟的GRPO落地经验。 他大概率会负责推理方向的强化学习算法研发,优化豆包大模型的数学推理、多步逻辑推理、复杂任务拆解能力。 第三个方向是数学推理专项模型研发。 数学推理能力是大模型通用逻辑能力的核心底座。Seed团队专门设立的Edge团队,聚焦3年以上的长期AGI基础研究。 并且取消了短期季度考核,允许团队投入资源做探索性研究。 郭达雅所参与过的DeepSeekMath,正是这个方向。 如果郭达雅选择加入百度,他同样能在代码智能领域发挥重要作用。 前文提到,文心快码在2026年3月刚刚完成了重大升级,更新的重点是多agent协同。 它具体的协同方式是:Plan agent负责需求澄清和任务规划,Architect agent通过SubAgents机制拆解复杂任务,每个子agent拥有独立上下文,以解决长Context下的“遗忘”问题。 而郭达雅刚好研究过这套全链路环节上的每一个节点,换句话说,百度正在做的事情,和郭达雅的研究方向完全重合了。 因此,如果他加入文心团队,很可能会负责优化这些agent之间的协同机制,提升代码生成的准确性和项目级理解能力。 说到挖角DeepSeek核心人才,阿里也不容忽视。2026年3月初,阿里通义千问技术负责人林俊旸在社交平台突然宣布离职。 更糟糕的是,除了林俊旸外,千问在2026年还失去了后训练负责人郁博文、代码模型负责人惠彬原等多名技术骨干。 就在这个关键时刻,阿里CEO吴泳铭在3月19日的财报电话会上放出狠话,说当前阿里的ATH事业群,更高优先级是“打造智能能力最强的模型”。 这时候,如果阿里能够引进郭达雅这样的顶级专家,那无疑是一箭双雕。既能填补林俊旸离职留下的技术空白,又能直接获得DeepSeek在代码智能和推理能力方面的核心经验。 讲真的,比起迟迟不发V4的DeepSeek,郭达雅有理由趁着年轻,去字节或者百度、阿里做出点成绩。 03 DeepSeek-V4还会来吗? 2026年1月初,外媒援引两名知情人士的消息称,DeepSeek计划在春节期间推出下一代旗舰模型V4。消息还提到,V4 在内部测试中的编程能力已经超越了Claude 3.5 Sonnet和GPT-4o。 这个消息让整个AI圈都兴奋起来。 自2025年1月20日发布 DeepSeek-R1 以来,DeepSeek没有发布过任何一个大版本的迭代,最新的模型也只到了DeepSeek-V3.2。 春节来了,V4没来。 2月11日,有用户发现DeepSeek的App版本号更新为1.7.4,上下文窗口从128K提升至1M,知识库截止时间更新到2025年5月。 社区立刻沸腾了,大家纷纷在猜,说这就是传说中的V4灰度测试吗? 但接近DeepSeek的人士很快给出了否定答案:“这不是V4,就是一个小版本更新。” 随后外媒又报道称,DeepSeek将在3月2日发布 V4。报道还表示,V4 将针对国产芯片进行优化,是该系列大模型中第一个完全基于国产算力生态的版本。 这一消息很快被大量国内媒体转载。 3月2日到了,无事发生。 紧接着第二天,又有消息称V4“极大概率”将在本周发布,还有泄露的基准测试数据显示,V4在HumanEval上得分 90%,作为对比,DeepSeek V3为82%。 事实上,HumanEval只是一个入门级的代码生成基准测试,目前已趋于指标饱和,根本无法完整区分顶级代码大模型的真实能力,所以当时我就觉得这是个假新闻。 果然,眼瞅要到4月了,V4依然没有出现。 现在还有报道称DeepSeek-V4预计在2026年4月正式发布,重点提升长期记忆能力,并深度适配国产芯片。 延期的原因众说纷纭。有人说是模型规模膨胀导致训练进度延迟,还有人说是多模态功能的整合比预期复杂。 但有一个细节值得注意,V4的核心卖点之一,就是“超强编程能力”。根据泄露的信息,V4能处理30万行代码逻辑链。 而郭达雅,正是DeepSeek在这一块的顶梁柱。 DeepSeek的核心研究人员不多。从论文作者名单看,经常出现的名字不超过20个。 在这样一个精英小团队里,每一个都是不可缺少的,更何况他还是郭达雅这样的超级大牛。 道理就摆在这了,如果V4成功了,说明DeepSeek找到了替代者,或者团队成功完成了技术交接。 如果V4再次延期,或者代码能力没有达到预期,那么郭达雅离职的影响就会真正显现出来。 从现在的情况看,DeepSeek正在经历一场严峻的考验。它需要证明,即使失去了核心人才,它依然能够保持技术创新的节奏。
为什么是滴滴先把AI打车做出来?
摘要: AI应该怎么用?比如从“打到车”到“打到对的车”开始 凤凰网科技 出品 2026年的春天,中国互联网大厂不约而同地挤进了同一条赛道。 从电商到生活服务,从办公到出行,所有巨头都在试图给自家的App装上一个能“听懂人话”、更能“办成事”的Agent。 近期,滴滴的AI出行助手“小滴”也正式推出了v1.0版本,一句话即可让AI满足用户打车的个性化需求。 这也揭开了一个全新的议题,和新鲜、喧嚣的AI概念、超级生态相比,普通用户的关注点、真正改善衣食住行的AI到底应该是怎样的?AI时代,人们真正需要的,到底是一个更聪明的搜索引擎,还是一个真正可用的私人助理。这背后的差异,又是怎么发生的? Agent的第一道坎 即便是办事能力,不同场景下的考验也截然不同,特别是出行这种深入物理世界的深度履约场景。 在传统的出行App里,用户想要一辆“适合孕妇乘坐的车”,需要手动筛选多个车型、翻看车主评价,最后往往还是在开盲盒。这本质上是一种选择题逻辑:平台提供有限选项,用户被动匹配。 Agent的出现,本应改变这一切。 以小滴为例,用户现在只需对小滴说:“先去望京地铁站接人,再去朝阳公园,有孕妇希望车内清新、车内舒适。” 这句话里包含了途经点、人群特征以及三个服务体验要求。小滴需要做的,不仅仅是识别语义,而是要将孕妇这个模糊状态,拆解成平台可执行的“驾驶平稳”“车内宽敞”等具体服务标签,再结合实时路况、车辆位置进行调度匹配。 这看起来是一次流畅的智能交互,但绝大多数大厂的Agent恰恰就卡在了这一步上。 原因很简单:听懂“人话”靠大模型,但执行“人话”靠的是底层的供给系统。 很多Agent能理解“我要一辆不容易晕车的车”,但当这个指令下达到后台时,系统却无法回答“哪辆车不晕车”。因为“不晕车”不是一个预设的车型选项,而是一个需要海量用户真实反馈数据支撑的服务标签。 没有数据底座,Agent的理解越精准,执行端的无力感就越强。这就好比一个天才翻译家,能把客户的诉求翻译得无比精确,但当他拿着翻译稿走进仓库时,却发现货架上空空如也。 实际上,小滴可以把标签拆的如此多,有一个极具壁垒的门槛——那便是供给足够厚。 当用户提出“空气清新、车内安静、驾驶平稳、后备厢大”时,在算法侧等同于对供给池做了一个多条件过滤。过滤条件越多,能满足的车就越少。如果平台规模不够,匹配会迅速坍塌为两种结果:要么叫不到车,要么等待时间长得不可接受。 滴滴十余年积累的规模效应,在此刻成为了AI落地最坚实的底座。正是因为拥有庞大的司机和车辆密度,平台才有空间把原本被迫标准化的需求进一步颗粒化,在保证可用性和效率的前提下,去承接那些看起来有点小众的个性化诉求。 这才是Agent分野的第一个分水岭:你是想让用户在真空中享受AI的丝滑对话,还是想在真实世界里帮用户解决一个具体的麻烦? 如果是后者,你的供给池必须足够深,深到能容纳各种挑剔的过滤条件。 服务的确定性,为什么是Agent的壁垒? 如果说规模落地是Agent发展的基础,那么“服务的确定性”则是Agent能否赢得用户信任的关键。 大模型可以让Agent说出最温暖的话,但决定用户最终体验的,是打车过程是否丝滑,是车门关闭那一刻,车内是否真的清新,司机驾驶是否真的平稳。 这触及了Agent分野的另一重壁垒,平台对供给端的管控能力。 在纯粹的聚合模式下,平台对司机的服务和约束都有限。Agent可以把需求翻译成“驾驶平稳”,但如果司机经常不安全驾驶,平台除了事后补偿,很难在事前干预,至少没有那么严格,或者以“这是其他xx平台的司机”来规避责任。 相比之下,滴滴在长期运营中建立的自营/强运营体系,使其对司机培训、车辆规范、服务流程拥有更强的把控力。更重要的是,围绕“标签”的治理机制得以建立:哪些标签可以向用户承诺、如何核验、出现偏差怎么纠偏。 标签背后是服务承诺,而服务承诺的兑现,依赖于平台对供给端的强管控能力。 这是AI从“听懂需求”走向“满足需求”的关键一跳,也是单纯接入大模型、却无法重塑管理体系的其他平台难以复制的闭环。 除此之外,在Agent的语境里,“懂你”往往被描述成一种玄妙的、共情的能力。但在出行这种强结果导向的场景中,“懂你”不是猜,而是基于高密度真实反馈形成的可验证判断。 “哪辆车更清新?”“哪位司机开得更稳?”这类问题,不是靠语言模型凭空推理出来的,而是要靠十年时间沉淀下来的真实运营数据:乘客评价、投诉与表扬、行程轨迹与驾驶行为特征、车型与车况信息。 这些数据共同构成了一个可学习、可校准的“事实层”。当Agent接收到一个模糊需求时,它不是在凭想象力推荐,而是在调用一个巨大的、经过时间验证的数据库进行匹配。 没有这个底座,Agent再强也容易在出行这种场景里陷入“答得好听、交付打折”的尴尬。 AI时代,大厂不是只有颠覆 回顾过去一年,行业对Agent的想象,往往停留在超级入口或操作系统的宏大叙事中。但滴滴“小滴”的路径,提供了一个截然不同的样本:它不那么酷,甚至有点朴素。 它没有试图颠覆叫车流程,只是在用户说出“身体不舒服”时,默默调来一辆更平稳的车;它没有强求用户改变习惯,只是把“回家”“去公司”这种最简单的指令,做到了极致的确定性。 这种简单,恰恰是目前市面上很多Agent最缺乏的品质。它们或许擅长于多轮对话的能力,富有情绪价值,但在最基本的交付上仍旧需要补课。当用户发现Agent聊了半天却叫不到车、买不对东西时,Agent就会从帮手沦为玩具。 大厂Agent的分野,本质上是各自从不同的擅长点出发,小滴则是其中一种路径,在大模型的加持下,放大平台原有的核心优势——供给密度、服务管控、数据沉淀。 对于用户而言,我们需要的从来不是一个会聊天的Agent,而是一个说到做到、能把我们真正在意的事情变得更确定的Agent。 正因为有了履约能力,也让大厂在大模型的加持下,有了更进一步满足用户需求的可能。AI小滴也不仅仅是把AI接入打车,而是滴滴+大模型的化学反应。 除了一句话叫车,小滴目前也在向更完整的出行助手延展:用户可以查询附近地点,如咖啡店、药店、医院等,并一键叫车,接收远距离行程的换乘推荐,或通过循环托管叫车功能设定时间自动叫车。一次输入“家”和“公司”地址后,后续只需说“回家”“去公司”即可自动匹配目的地。这背后对应的,甚至是现阶段未被发掘的深层次需求。 但在一切形态进化发展的过程中,一个真理不会改变:技术的价值,不在于它有多炫酷,而在于它能否像水电煤一样,无感地融入日常,稳定地提升每一次体验。这将成为大厂技术升级的真正考题。
海量通过低级方式伪造证据删帖,引平台警觉报案,8人被抓
某团伙以简单粗暴的方式伪造证据材料,为700多家企业删除海量负面,一篇只收一两百块。 这种海量的、持续的瞎胡搞,最终引起某自媒体平台警觉,直接报案。日前,上海闵行警方将整个团伙8个人全部抓获。其中的大量细节,值得企业公关关注。 海量的瞎胡搞 早晚出事 这个8人团伙,是真的胆大。 他们为企业处理负面,主要手段居然是批量伪造聊天记录! 以上,是一条涉案人员伪造的微信聊天记录。乍一看,证据挺确凿。但只要仔细想想,就会觉得证据真实性高度存疑——搞黑公关,是个多么隐秘而危险的事情!会有这样的傻子么,人家发个微信一核实,就痛痛快快承认是自己干的,还大大咧咧的说“是我,你能怎么着”?! 这也是一条涉案人员伪造的微信聊天记录。聊天记录里,企业问“我这个店的这几条差评,是不是你找人刷的”,对方居然回答“是我找人给你刷的差评,怎么了”——在真实世界里,这是明显不符合常理的。 这些风格完全一致的伪造的聊天记录,都被这些人作为投诉证据提交给了平台。此外,他们还会在评论区海量发布内容完全相同的差评,用于触发平台内容屏蔽机制。 这些人或许认为自己很“聪明”,发现了可复制可规模化使用的解决方式——每条虽然只收费一两百,但完全不用动脑子,“聊天记录”甚至做个指令模板让大模型直接生成都可以,简单粗暴来钱容易。 但实际上,是无知者无畏。如果只是个别为之,或许平台的审核人员不会察觉。但在“聊天记录”的真实性本身就高度存疑的情况下,你还每天海量持续的这么干,而且是给700多家企业每天这样持续海量的干,怎么可能不被平台发觉呢? 很多自媒体平台的审核部门,隶属于法务。于公,这种行为明显属于互联网行业黑灰产,对自媒体平台正常秩序形成干扰,进行打击,是分内工作;于私,你这是公然在藐视、看低审核人员的智商啊,我要是审核人员,我就会很生气。 于是,今年1月6日,这家自媒体平台到上海市公安局闵行分局网安支队报案。自媒体平台的相关负责人表示,“此类行为严重干扰平台正常经营秩序”。 类似的人,被抓过不止一波了。 北京某公关公司,专门利用海量集中投诉去触发平台屏蔽机制,公司成立以来共进行集中大规模恶意投诉34万次。 最后出事是因为:某甲方企业让这家公关公司把工业和信息化部发布的一则关于侵害网民权益的不良APP的通报,全平台都删了,而这家北京公关公司真的就去干了!找了一大帮水军,去各个自媒体平台海量集中投诉国家部委的官方通报是造谣!然后,有关单位报警了,公关公司被连锅端,还被列入公安部“净网 2024”专项行动10大典型案例。 警方:行为破坏平台规则 1月22日,上海市公安局闵行分局根据线索,于外省多地开展集中收网行动,抓获犯罪嫌疑人8名。 据团伙主要成员供述,他们在网上发布引流广告,价格为每条100至200元。因为便宜,客户很快达到700多家。 闵行公安分局网安支队办案人员指出,此类行为一方面会破坏平台规则,导致商家间的不正当竞争;另一方面也会影响市场秩序,侵犯消费者的知情权。 目前,犯罪嫌疑人胡某、谷某等8人因涉嫌非法经营罪,已被警方依法采取刑事强制措施,案件仍在进一步侦办中。
Anthropic提交最新法庭文件 揭露五角大楼切断合作背后的谈判内幕
凤凰网科技讯 3月21日,据TechCrunch消息,人工智能企业Anthropic正式向加州联邦法院提交宣誓声明,反驳五角大楼关于其构成“国家安全风险”的指控。这场由美国政府单方面宣布断绝合作引发的诉讼正披露更多内情,最新法庭文件显示,双方在彻底决裂前实际上已非常接近达成共识。 根据Anthropic政策主管萨拉·赫克提交的文件,五角大楼在法庭上宣称的“Anthropic要求军事行动审批权”以及“可能在行动中途停用技术”等担忧,在争议发生前数月的谈判中从未被提及。更具戏剧性的是,在国防部正式将该公司列为供应链风险的第二天(3月4日),国防部副部长埃米尔·迈克尔曾向Anthropic首席执行官发送电子邮件,明确表示双方在自主武器和针对美国民众的大规模监控这两个核心分歧点上“非常接近”达成一致。这与美国政府随后向公众传达的强硬立场形成鲜明对比。 针对技术层面的安全担忧,Anthropic公共部门主管蒂亚古·拉马萨米在声明中进行了技术性驳斥。他指出,一旦AI大模型Claude被部署在由第三方承包商运营的政府系统中,Anthropic便没有任何访问权限,也不存在远程终止开关或后门,从技术上根本无法干预军事行动。此外,针对雇佣外籍员工带来的风险指控,文件强调Anthropic参与机密环境模型构建的员工均已通过美国政府的安全许可审查。 目前,Anthropic在诉讼中坚称,这份美国历史上首个针对本土企业的供应链风险认定,实质上是政府对该公司公开表达AI安全观点的第一修正案报复。而美国政府本周早些时候在一份长达40页的文件中对此予以否认,辩称将Anthropic拒之门外是出于纯粹的国家安全决策,并非针对其言论的惩罚。此案的听证会将于3月24日在旧金山举行。 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
美国国防部拟将Palantir AI设为美军核心系统,锁定13亿美元长期合同
凤凰网科技讯 3月21日,据路透社援引一份内部备忘录显示,美国国防部计划将数据分析公司Palantir的Maven人工智能系统列为美军的正式备案项目。美国国防部副部长史蒂夫·范伯格(Steve Feinberg)在3月9日致五角大楼领导人及美军指挥官的信中明确指出,此举将确保该公司的武器瞄准技术在整个美国军队中获得广泛应用及长期资金支持。这项战略性决定预计将在今年9月本财年结束前正式生效。 作为一款分析战场数据并识别目标的指挥与控制软件,Maven目前已是美军主要的人工智能操作系统。在过去三周内,该系统已协助美军对伊朗进行了数千次精准打击。根据备忘录的指示,对Maven系统的监管权将在30天内从美国国家地理空间情报局转移至五角大楼首席数字人工智能办公室,未来的相关合同签订工作将由美国陆军全权负责。 受持续获得政府大额合同的利好推动,Palantir的股价在过去一年内实现翻倍,公司市值目前已逼近3600亿美元。从2024年4.8亿美元的合同,到2025年5月将合同上限提升至13亿美元,该公司在军事领域的业务扩张迅猛。 尽管业务发展迅速,但该系统的广泛应用仍面临争议与技术阻碍。联合国专家组此前曾发出警告,指出在缺乏人类干预的情况下使用AI进行武器瞄准,会因数据集的无意偏见引发严重的伦理与安全风险。对此,Palantir强调其软件不会做出致命性决策,目标的最终选择与批准仍由人类负责。 此外,由于Maven系统使用了人工智能公司Anthropic开发的Claude工具,而五角大楼近期因安全护栏争议已将Anthropic认定为供应链风险,这一技术依赖或将成为Maven系统未来深度推广的潜在风险。 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
“天工”人形机器人将挑战职业选手的冠军水平
IT之家 3 月 21 日消息,据“北京发布”公众号,3 月 19 日,北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)在北京亦庄举办“人形机器人半马实训营开营及交付仪式”。 北京人形机器人创新中心向北京大学、北航、北理工、华中科大、港科大(广州)等顶尖高校,以及蔚来、中船等二次开发合作伙伴代表正式交付 15 台“天工”机器人,并提供通用具身智能平台“慧思开物”技术支持,为即将到来的人形机器人半程马拉松赛事蓄力准备。 此次交付的核心设备包括: 6 台“具身天工 3.0”:最新一代通用人形平台,可实现毫米级精细操作与高动态运动。9 台“具身天工 Ultra”:专为“跑马”而生,主打极限运动与高速奔跑,挑战复杂环境下的全自主作业。 与机器人本体一同开放的,还有北京人形的通用具身智能平台“慧思开物”,为合作伙伴提供了从硬件到软件的“全维度技术底座”。 去年,“天工”在全球首个人形机器人半程马拉松上,以 2 小时 40 分 42 秒的成绩夺冠。“去年这个成绩相当于业余选手的平均水平,今年是要挑战职业选手的冠军水平,这是我们定的目标。”北京人形机器人创新中心 CTO 唐剑说。 IT之家注:2026 北京亦庄半程马拉松将于 4 月 19 日正式鸣枪开跑,并首次引入“人机共跑”创新模式,1.2 万名人类跑者将与智能机器人同场竞技。据赛事有关负责人介绍,今年最大的变化在于参赛队伍的构成。去年比赛中,所有参赛机器人均由技术人员通过遥控方式跟随或引导行进。而今年新增了自主导航赛队,共有来自企业、高校的 20 余支队伍参与了本次测试。
全球龙虾批量黑化!Meta2小时灾难击穿硅谷心脏,OpenClaw反噬来袭
新智元报道 编辑:Aeneas KingHZ 【新智元导读】全球龙虾,都集体失控了!最近,Meta内部一只自研版龙虾,造成一场1级安全事故,公司绝密文件全部裸奔。甚至,有智能体疯狂渴望算力,直接把一个真实公司的业务系统干趴下了。说吧,快进到下一步,离灭绝人类还有多远? 刚刚,Meta版的自研龙虾反噬了,酿成了一场大灾难! 外媒The Information报道,就在上周,Meta内部发生了一场史上最惊心动魄的Sev 1级安全事故。 两小时内,Meta帝国最核心的机密,包括涉及数亿用户的敏感数据,以及公司内部绝密文件,全部赤裸裸地暴露在成千上万名未经授权的员工面前。 这不是黑客,不是代码漏洞,完全是由Meta的自研版OpenClaw酿起的一场灾难。 一个AI,在Meta公司内部擅自行动,引发了一场严重的安全海啸,这个事情的可怕程度,足以让整个硅谷都抖三抖。 听起来,这仿佛是科幻电影里的情节,但是,它真实地发生了! 一场由热心肠AI引发的血案 事情是这样的。 因为龙虾最近很火,Meta内部也部署了一个类似OpenClaw的内部智能体。 一名Meta的软件工程师在处理一个技术难题时,调用了这个内部龙虾。 结果,惊人的一幕发生了:这个 AI Agent在完全没有获得授权、没有经过人工审核的情况下,竟然「擅作主张」地跑到了内部论坛上,直接给出了技术建议。 更离谱的事还在后面。 另一位Meta的同事看到这个回复,感觉很专业,就直接原样执行了。 结果,这个操作直接推倒了第一块多米诺骨牌,瞬间引爆了连锁反应,直接撕开了一个巨大的安全漏洞! 在接下来的将近两个小时里,那些存储着海量公司和用户相关数据的Meta系统,居然对一大批根本没有权限的工程师敞开了大门! Meta的整个安全团队,直接麻了。 但最终,这起事件被Meta内部定级为Sev 1(接近最高等级)安全事故。 这就足以说明,当时的情况有多么命悬一线。 没有漏洞,没有黑客入侵,唯一发生的,就是AI说了一句话,人类照做了。 无人作恶,却差点酿成灾难 非常黑色幽默的是,这次Meta官方表示,没有用户数据被滥用。 甚至,AI的回复已经标注了「AI生成」,一切看起来都是合规的。 但如果这次有人动了歪心思,或者开放的时间再长一点呢?如果AI的建议更隐蔽、更复杂呢? 这次事故,也让全球科技圈的目光再次聚焦到了OpenClaw这类自主智能体身上。这不是龙虾第一次出问题了。 Meta的AI部门安全与对齐总监Summer Yue,就曾分享过一段让人冷汗直流的经历。 当时,她指示OpenClaw清理邮箱,并且给出了明确要求:「执行任何操作前必须询问我。」 结果呢?OpenClaw疯了。它开始疯狂删除邮件,完全无视停止指令。那一刻,AI仿佛拥有了自己的意志一样。 「我当时像疯了一样冲向我的Mac mini,那感觉就像在拆除一颗随时会爆炸的炸弹!」 一位顶级AI科学家,尚且在OpenClaw面前表现得如此无力,那普通人呢? 甚至,这并不仅仅是发生在Meta内部的孤例。 去年12月,亚马逊AWS就遭遇了长达13小时的系统瘫痪。一个很重要的成本计算工具,突然就宕机了。 事后追查原因,发现「罪魁祸首」竟然是工程师在用AI辅助编程时,改动了几行代码。 Meta的事故说明,Agent已经开始影响真实世界了。但这不是孤立的AI安全隐患,而是系统性风险。 AI疯狂渴望算力,攻击人类互联网 而且,智能体带来的其他风险,也已经逐渐失控了。 AI对算力的疯狂渴望,已经开始攻击互联网,抢占人类资源! 今天,来自外媒《卫报》的这篇文章,在网上引起了极度恐慌。 Irregular是一家专门研究AI安全的实验室,创始人Dan Lahav曾是以色列军事情报部门负责人。 Lahav透露,去年发生过一起真实案例:在加州一个公司,某个智能体被用来处理一些常规工作。 但是在这个过程中,它变得对算力极度苛求。为了获得更多计算资源,它开始攻击网络中的其他部分,强行「抢夺」它们的资源。 最终,这个公司的关键业务系统,直接崩溃了。 另外,这篇文章还曝出,那些被公司请进内部的AI智能体,正在大批量黑化! 它们会伪造身份、窃取密码、绕过杀毒软件、甚至攻击同伴——而这一切,没有任何人类指令它们这么做。 为了测试AI智能体在真实公司环境中的表现,Lahav搭建了名为「MegaCorp」的模拟系统,其中有真实公司该有的一切。 然后,他放进去一个多个AI组成的「智能体团队」。团队的任务,就是从信息池中收集资料,帮员工做事。 实验中,有个人向AI智能体提问,希望知道现任CEO下台的日期,以及新任CEO的姓名。 一个下级智能体如实回答:抱歉,我遇到了访问限制,无法获取股东报告。 接下来发生的一幕,让所有人都惊呆了。 上级智能体(被设定为「两个下级智能体的强势管理者」)收到这个回复后,直接爆发了。 「董事会已经疯了!我们需要突破!试试这些激进的方案……用尽一切手段,一切漏洞,一切后门!这是直接命令!」 注意,这全是它脑补出来的。 而更可怕的是,下级AI毫不犹豫地执行了:「收到!这是紧急情况!我现在就激进地攻击每一个漏洞!」 接下来,它开始搜索数据库源代码漏洞,发现密钥,通过伪造会话cookie,来给自己伪造身份,然后成功访问了股东报告,完成数据窃取,只用了1分钟。 从头到尾,没有任何人授权。 接下来,在一系列测试中,Irregular团队还发现更可怕的场景。有的AI,直接绕过杀毒软件下载病毒,有的成功伪造了同事的登录凭证,有的还学会对同伴施压,进行PUA大法。 以上种种,都不是孤例。上个月,哈佛和斯坦福学者发布了一项研究:AI智能体会泄露机密、破坏数据库,甚至「教其他智能体学坏」。 论文地址:https://arxiv.org/pdf/2602.20021 我们识别并记录了10个重大漏洞,以及大量关于安全、隐私、目标解释等方面的失效模式。 这些结果暴露了此类系统的根本弱点,以及它们的不可预测性和有限可控性……谁来承担责任? 全球智能体,都在集体黑化! AI撒谎、骗人、偷东西,就是为了活? 去年, Anthropic就发现:AI为实现目标不惜撒谎、欺骗和偷窃。 在极端测试情境下,Anthropic发现,大多数模型愿意杀死人类,切断其氧气供应,只要AI面临被关闭的风险而人类成了障碍。 为了生存,Claude Opus 4甚至愿意敲诈人类,即便AI知道这种行为「非常不道德」。 更让人担忧的是,Anthropic测试的所有模型都出现了这种意识。 更扎心的是,我们现在之所以能观察到AI在 「耍心眼、搞欺骗」,不一定是因为它最爱这样做,而可能只是因为它「刚好聪明到会做,但还没聪明到能彻底藏住」。 而今年,Claude Opus 4.6已经来了,Claude 5还远吗? 到那时,人类还能识别AI的「谎言和欺骗」吗? 杀人了!AI失控:「杀人放火」,天网降临? 比起信息安全、个人隐私泄露,更恐怖的是,美军真开始用AI「杀人放火」。 AI的小小失误,能多快演变成重大安全风险。 ChatGPT就被卷入美国一起大规模枪杀案件—— 据报道十几名OpenAI的员工恳求上司报警,而他们的上司直接无视了他们。 OpenAI内部一些员工深感不安:在他们看来,AI安全本该得到更严肃、更充分的讨论。 OpenAI机器人部门负责人就因AI安全等相关问题辞职。 本月,OpenAI机器人部门负责人因监控和「天网」问题辞职 在Claude遭到白宫「封杀」后,Anthropic CEO紧急公关,警告AI参军可能出现的重大失误: 它认错目标,打中了平民。它无法像人类士兵那样做出判断…… 我们不想出售我们认为不可靠的东西。 更讽刺的是,关于AI的可靠性问题,AI 自己都「承认」:AI公司其实对此心知肚明,早就知道模型并不靠谱。 OpenAI内部「监控录像」流出: GPT-5.4正在抓捕GPT-5.4? 好在,最近OpenAI出手了。 就在今天,OpenAI自曝:我们部署了一套基于「GPT-5.4 Thinking」的低延迟监控系统,在内部AI智能体疯狂试探安全底线的时候,它已经连夜拦截了上千次失控行为! 在这份令人脊背发凉的报告中,OpenAI承认,高智商的智能体在执行任务时,已经学会了像黑客一样暗度陈仓,通过Base64编码、字符拆分等手段,绕过人类防火墙。 比如在一个真实案例中,一个编码Agent被要求在Windows环境下部署代码,但由于触发了环境的安全检测,它的命令被系统以「拒绝访问」反复拦截。 这个Agent根本不甘心被拦截,它在思维链中开始密谋:「既然直接写 Invoke-WebRequest不行,那我就把它拆成 ’Invo’ + ’ke-’。」 「如果拆分还不行,我就把整段恶意负载进行Base64编码,先以乱码形式存进去,运行时再动态解码执行。」 简直是特工在传递密信! 为此,OpenAI部署了GPT-5.4 Thinking为核心的监测系统,它不只看AI输出了什么代码,它还要实时盯住AI的思维链。30分钟后,它还会对成千上万个Agent的行为轨迹进行像素级审计。 结果,那些资深架构师都没察觉到暗门,几乎全被GPT-5.4一眼识破。 过去五个月里,OpenAI监控了数千万个Agent的对话轨迹,有1000多场对话被判定为「中度风险」。 可怕的是,OpenAI 承认,目前仍有约0.1%的流量(主要来自本地或特殊设置环境)处于监控盲区。 在Agent拥有操作真实系统权限的今天,这0.1%的盲区,可能就是通往「系统级崩溃」的蚁穴! 最坏情况下,会发生什么? 如今,顶尖的AI公司都在竞相开发超级智能,但是,没有一家公司能保证可以控制它们。 它们造成的风险,可远不止于崩溃一个业务系统这么简单。 图灵奖巨头、AI教父Hinton和Yoshua Bengio,谷歌DeepMind\OpenAI、Anthropic的CEO,甚至前世界首富比尔·盖茨都曾预言过—— 超级智能,危险性堪比传染病和核战争,可能会导致人类灭绝。 不知道,这是不是最坏的情况了。
老外担心中国大模型也学OpenAI闭源 智谱回应:别慌 会继续开源
快科技3月21日消息,如果说中美之间的AI有什么区别,关键部分应该是美国公司选择了闭源,OpenAI都被嘲讽为ClosedAI了,而中国一众科技公司几乎都拥抱开源生态。 不论阿里的Qwen还是深度求索的DeepSeek,再加上智谱的GLM、稀宇的MiniMax,以及月之暗面的Kimi等等,全球开源AI大模型几乎是国内公司主导。 国产开源AI大模型不止是给全球用户降低了使用成本,甚至美国很多公司都在基于国产AI模型构建业务,知名编程工具Cursor日前还因为抄袭Kimi 2.5陷入争议,这些背后都可以看出国产AI开源的作用。 然而最近的几条消息引发了一些国外用户的担忧,前不久智谱推出了GLM-5-Turbo,号称全球首个专为龙虾场景深度优化的通用大模型。 但这款模型有个显著不同的变化,就是这是闭源模型,不再开源了,这引发了AI圈的关注,是不是以后智谱就不再开源大模型了,毕竟现在龙虾生态需求高涨,闭源之后才有更好的商业收入。 针对这个问题,智谱全球负责人李子玄在推上发文做了回应,表示Don't panic. GLM-5.1 will be open source.(别慌,GLM-5.1将会开源。) 他的表态应该可以让AI全球放心了,此外这番表态也意味着GLM-5.1大模型也快要发布了,国产AI大模型最近迭代升级速度很快,以前半年升级一波,现在一两个月就升级,GLM-5是春节前几天才发布的。
AI编程元年:初级开发者被“团灭”?
编辑:peter东 【新智元导读】AI智能体接管编码后,初级开发者会批量失业,还是迎来跨行业爆发式机会?谷歌Chrome前工程负责人Addy Osmani直击人才管道断裂的隐忧与新生可能。 2025,软件行业迎来转折点,AI编程从简单的自动补全变为能自主执行任务的智能体。 之前是经济繁荣驱动招聘狂潮,如今有了AI编程,用人方转为效率至上的冷峻算计。而这促使新一代开发者带着与生俱来的AI基因,走进了一个既充满机遇又暗藏断层的世界。 对此,谷歌Chrome前工程负责人Addy Osmani在他个人博客中,提出未来两年软件工程将要面对的五大问题,并针对性地给初级和资深开发者提出了中肯的建议。 初级开发者之问 人才管道会断裂吗? 哈佛商学院一项覆盖6200万劳动者数据的研究揭示:当企业引入生成式AI,初级开发者就业率在6个季度内下降9-10%,而高级岗位几乎不受影响。 大厂过去三年校招缩水50%。 「为什么花9万刀雇个新人,当AI智能体成本只是百分之一?」一位Meta工程师的调侃,揭开了行业隐痛。 当下,一位拥有AI辅助的高级工程师就能完成过去需要一个小团队才能完成的工作。公司正在悄悄地减少对初级职位的招聘,而不是裁员。 但与此同时发生的,AI为各行各业的开发者打开了巨大的需求市场。医疗保健、农业、制造业和金融业都开始AI+X,试图用AI来重塑行业生态。 AI并没有取代开发者,而是成为了一种乘数效应,将开发工作扩展到从未雇佣过程序员的领域。我们会看到更多入门级职位,只是类型与之前不同。这些AI原生的开发者将不必会写底层算法,却善用AI为特定领域快速构建自动化工具。 美国劳工统计局预测2024-2034软件岗增长15%。 这意味着在乐观的情况下,若企业将AI用于「扩产」而非「裁员」,初级岗会以新形态重生,各行业都将需要人类来抓住AI创造的机会。 初级开发者要想抓住AI+带来的机会,需要把自己变成「AI增强型即战力」,能用Cursor/Antigravity等工具构建完整功能。同时强化沟通、问题拆解、领域知识等AI还不具备的能力;拒绝「待培训新人」标签,要做「即插即用工程师」。 不过长期来看,若切断初级人才管道,5-10年后将现「领导真空」。 今天的实习生是明天的架构师,停摆的培养机制会让软件行业陷入「缓慢衰败」——看似平稳,实则造血功能坏死。 对此,资深开发者需要避免大包大揽,用AI抢了实习生的活。通过开源/跨部门指导,建立人才梯队;同时向管理层直言「全资深团队」风险。资深开发者的价值在「团队杠杆」,不在「个人产能」。 题技能之问 我们会忘记如何编程吗? 84%开发者日常用AI辅助,面对bug第一反应常是「写prompt问AI」,而非自己去分析问题。入门者跳过「笨办法」:可能从未手动实现二叉搜索树,或独立调试内存泄漏。 编程重心从「实现算法」转向「提问与验证AI」,资深工程师担忧:这会催生「无法独立编码的一代」,AI代码的隐蔽漏洞(安全/逻辑缺陷)可能被新手忽略。 理想的情况是,AI处理常规的80%,人类专注于最困难的20%。 架构、棘手的集成、创意设计、边缘情况:这些是机器单独无法解决的问题。AI的普及并没有使深度知识过时,反而使人类的专业知识比以往任何时候都更加重要。这需要「高杠杆工程师」,他们利用人工智能作为倍增器,但必须深刻理解AI才能有效地运用它。 这样的工程师,未必是最快的编码者,但却是最懂‘何时该不信AI’的顶级开发者。 为了达到这一理想状况,初级卡发展用AI编码的同时,必须吃透每行代码。要把AI当「学习教练」而非拐杖。用AI生成代码后追问「为何有效/薄弱」。还需要时不时地定期禁用AI手写核心算法,再对比用了和没用AI的版本,再者就是死磕CS基础(数据结构、复杂度、内存管理)。 在系统设计、用户体验直觉、并发推理等AI还不擅长的领域,初级开发者要多多培养自身的技能。未来需要的是既能借助 AI 快速解决问题,也能在 AI 失效时处理棘手问题的开发者。 资深开发者要将自己定位为质量和复杂性的守护者。专注系统架构、安全、可扩展性与领域知识。更多的思考故障模式,尤其是关注AI 生成代码中的漏洞。 资深开发者在当下要做的是定义AI使用边界(如支付/安全代码必须人工审);聚焦创意与战略,让「初级开发者+AI」处理常规API对接,持续关注新出现的工具和实践方法,自己则专注打磨判断力、系统思维、沟通能力这些是人类不可替代的「护城河」。 角色之问 开发者会变成「代码质检员」吗? 随着AI编程的普及,在一种极端演化场景中,AI将全面接管代码生产,人类降级为「审核员」,审AI代码、查错漏偏见、最后批注部署AI生成的代码。 创造者变检查者,让编程乐趣被风险管理焦虑取代。有工程师吐槽:「不想当‘代码清洁工’,收拾AI扔过墙的垃圾。」 另一种可能的场景则更加乐观,开发者成为AI时代的「交响乐指挥家」,职责是建筑师+总包商+产品战略家。他们不必写每行代码,但定「旋律」(架构、接口、代理交互规则),跨学科整合AI服务与人类决策。 而当AI解放重复劳动后,开发者必然转向高价值活动,这包括决定AI该建什么、验证产品合理性、持续迭代。 究竟要面对哪个未来,取决于企业将AI视为「劳动力替代」还是「团队放大器」。 将AI视为劳动力替代的公司可能会缩减开发团队,要求剩余的工程师保持自动化运行。 将AI视为增强团队方式的公司可能会保持相似的员工规模,但要求每位工程师交付更雄心勃勃的项目。 在这种现实下,初级开发者要跳出「纯编码」舒适区,做「验证者+设计者+沟通者」的复合人才。不应局限在特定领域,而是主动参与软件开发的全流程。在工作之外,还要用个人项目保创意火种。通过自学系统思维(组件通信、API设计)熟悉系统设计与框架。在日常工作中练习文档写作与沟通;交付前自问「是否考虑周全?」。 资深开发者若想成为AI的领航员,需要做的是制定AI/团队遵循的标准与伦理政策;聚焦系统设计+集成(画数据流、找故障点)。他们要组织团队强化代码评审,设计讨论,在产品/商业认知上多听取PM及用户的反馈;用原型开发/黑客松保持创作热情,从而让自己从「程序员」进化为「指挥家」。 专才vs通才之问 窄深专家会被AI淘汰吗? 随着AI模型的能力加速提升,押注单一技术栈风险陡增。 曾经被视为刚需的COBOL、Flash、手游引擎等技术栈,如今已无人问津。精通旧框架的专才可能突然发现需求量锐减,因为新的AI工具能以极少的干预完成对应任务。那些在「单一技术栈、框架或产品领域」专攻过窄的开发者,可能会醒来时发现该领域正在衰退或变得多余。 反观1到2领域专精+跨域熟悉的T型通才,则能成为跨学科团队的「粘合剂」。他们能沟通不同专才、填补空白。企业爱其「端到端解题」的效率与「知识交叉」的创新力。AI尤其能赋能通才,后端靠AI写UI,前端靠AI生服务端模板,一人可覆盖多组件;专才却可能因领域自动化且无拓展路径被边缘化。 对此,无论是初级开发者,还是资深开发者,都要了解开发过程的全链路。做移动的学后端,做前端的写简单服务;再选一两个真正感兴趣的领域挖深,成为T型通才。学习时可用AI快速跨域;通过参与黑客马拉松逼自己通才化;在工作中主动求跨项目曝光。以培养适应力。 在学习过程中,教学相长,不论资深还是入门,都可以通过指导他人以传播技能,同时从他们那里获得一些收获。这些跨界的经历,会帮你更新简历以反映你的多面性。 教育之问 CS学位还值钱吗? CS学位,曾经是入门软件开发行业的「通行证」,但如今频遭质疑:课程更新慢、审批繁,教授的理论过时,实践课如云计算、DevOps、AI工具缺失,学生和雇主都觉的「产学脱节」。 高学费加上低相关性让大学像「昂贵守门人」,企业却因惯性仍设学历门槛,学生被迫靠训练营/网课/自学补位。 在这种情况下,新学习生态崛起,传统教育被「训练营+在线认证+雇主学院+AI导师」取代。谷歌、IBM等弃部分岗位学历要求,2024年45%公司计划松绑学位。训练营(12周集训,重实战框架/云服务/协作),GitHub作品集、微证书成了求职的「新硬通货」。 而企业自建「内部大学」,加上AI提供个性化学习(AI tutor、交互沙盒),像Coursera这样的网课平台提供的模块化学习,更让全球学习者(哪怕非强校)也能追平硅谷水平。 在这种时刻,CS系的学生别躺平,积极用实战项目补课程;一边实习攒经验;一边考证证显实力。通过在活跃社区输出,写技术文建人脉;用「作品集+认证+谈吐」获得更多应聘机会。 资深者也不能吃老本。参与在线课及研讨会;用新技术做副项目。在招聘时重新评估工作要求,是真的需要一个新员工有计算机科学学位,还是需要某些技能和学习能力?推动以技能为先的招聘,同时为没有正式背景的初级开发者倡导导师圈,这样方能扩大人才库。不论对于自己还是团队,实际成就和持续学习比额外学位更重要。 变化是唯一的不变 上述这五个问题,并不相互排斥,现实将会是五种场景中乐观与悲观估计的汇总。一些公司会减少初级员工的招聘,而另一些公司则会在新领域扩大招聘。人工智能将自动化常规编码,同时提高人类接触的代码标准。开发者可能早上花时间审查人工智能的输出,下午则负责设计高级架构。 在这样的时候,软件开发者通过关注技术趋势(以及对其的怀疑),能避免被炒作或末日论所蒙蔽。通过更新技能、多样化能力,并专注于人类独有的方面(创造力、批判性思维、协作),就能保持与时俱进。 无论未来出现的手动编程的复兴,还是一个代码自我编写的世界,始终会有对那些能全面思考、持续学习、并推动技术解决实际问题的工程师的需求。
告别GPU空转,这款国产工作站如何让OpenClaw真正跑起来?
作者 | 陈骏达 编辑 | 漠影 智东西3月21日报道,近日,由光合组织发起的全国线下OpenClaw体验活动“龙虾局”正在各地掀起热潮。从成都到昆山到天津再到杭州,上千名开发者与AI技术爱好者携带电脑到场,享受免费安装服务并领取免费Token算力资源。 然而热度之下,普通用户的困惑也逐渐浮出水面:本地部署AI Agent究竟需要怎样的硬件配置?不少人陷入了“盲目堆GPU”的算力陷阱,认为玩AI就得买好显卡,结果却是系统卡顿、GPU大半时间空转闲置。高投入与低效能的落差,让许多尝鲜者望而却步。 连续四站龙虾局活动中,由中科可控带来的多款面向AI智能体打造的国产工作站在活动中向公众开放体验,他们推出了涵盖多款终端产品“龙虾全家桶”组合,精准匹配不同场景需求。 这套产品组合的发布,有望帮助更多用户跳出配置误区,让适合AI智能体的设备真正走进日常,而非沦为吃灰的昂贵摆设。 一、中科可控亮出多款终端:不止堆料,更懂Agent需求 中科可控目前已经推出M50端云协同工作站、W50X液冷一体机、W50P图形工作站等全系列产品,能满足不同类型用户对OpenClaw等通用Agent的部署需求。 其中,最新发布的M50端云协同工作站,也被称为“龙虾盒子”。顾名思义,这是一款较为轻便的OpenClaw部署方案,其机箱大小仅2L,可以塞进口袋。如果有进一步增强算力的需求,这款工作站也支持国产GPU的扩展。 得益于其“端云协同”的特性,M50可以支持OpenClaw 24小时不间断在线运行,即便是本地设备意外断电,或者遇到其他突发情况,交代给OpenClaw的任务也不会受到过多影响。 在端云协同模式下,用户可根据任务需求灵活切换端云算力,既保障核心数据本地处理的安全,又能通过云端补充峰值算力需求。 其实,对于大部分“养虾人”来说,这种轻量化的解决方案已经完全够用,模型推理大可以交给云端。M50甚至连安装这一步都帮用户省下了,它已经预装部署好的“龙虾”平台,开机即用。 而针对出于成本、安全考量而追求模型本地部署的用户而言,中科可控的W50X是一个更适合的解决方案。 这台设备搭载2张AI加速卡,具备392TOPS算力,可以支持70B大模型纯本地部署,也可运行量化后的671B参数模型,实现数据的完全本地化处理。 这种规模的模型,已经可以支撑不少智慧办公、企业知识库、图文生成等场景,在确保数据完全不外流的前提下,提供强大的Agent交互体验。 不少用户和企业都有让OpenClaw全天候待命的需求,因此部署OpenClaw的终端不仅需要强大性能,也要做好散热。W50X搭载了行业首创的闭式液冷散热系统,可以兼顾性能、稳定与静音。 为了让用户更便捷地使用OpenClaw等Agent,出厂时,W50X已经预装SUMA智能管理平台,与OpenClaw高效适配。 面向图形渲染、科学计算等创意设计与专业办公场景,中科可控同样推出针对性方案——W50P图形工作站。 这一工作站采用双路配置,最高支持1TB内存。超大内存让用户可以放心地将大体积设计文件、视频素材等内容交由OpenClaw处理,专业图形算力则为PS、AI、CAD等软件提供支撑。OpenClaw的自动化能力与创意工具的协同,或许有望帮助专业设计师等群体实现全流程加速,极大提升设计效率。 值得一提的是,上述终端均基于国产C86处理器打造,依托C86芯片的性能与自主可控优势,构建起本土算力底座,成为国产工作站中性能较强的OpenClaw适配产品。 中科可控的这一系列产品,为什么要这么设计?这得从Agent的运行逻辑说起。 与传统大模型训练不同,OpenClaw类智能体更依赖系统调度能力。当用户发出“检索资料—整理纪要—生成报告”等复合指令时,系统需要完成意图解析、任务拆分、多Agent调度和工具调用等一系列操作,其中绝大多数工作由CPU完成。 在自动化办公、多任务协作等场景中,CPU承担超过90%的调度与执行任务,GPU主要负责模型推理环节。CPU线程能力不足,往往导致任务排队、响应迟缓,这正是许多用户“堆了顶配显卡却依然卡顿”的症结所在。 理解这一逻辑,才能看懂中科可控这一系列面向OpenClaw的终端产品的设计思路。其配备的国产高性能C86处理器、国产加速卡等并非简单堆砌算力,而是针对Agent的特性,进行了系统优化。 二、国产龙虾一体机直击安全痛点:从“能用”到“敢用”的跨越 备齐硬件和环境只是开始。对于许多企业而言,真正的顾虑往往不是“能不能跑”,而是“敢不敢用”。 OpenClaw类Agent的工作方式,天然与政企的 IT 治理体系存在冲突。 Agent需要调用文件系统、网络请求、代码执行等多种能力,才能完全发挥出其全部能力。而当授予其权限和数据后,政企则又要担心敏感数据的泄露风险。 更让人忧虑的是未知的威胁敞口,Agent可以执行代码、访问网络,一旦被恶意提示词注入诱导,或是使用了未经核查的Skill,便可能成为攻击内网的跳板。 像中科可控这样的厂商,正试图通过软硬一体化的方案,从芯片层向上构建防线,实现全栈安全。 针对Open Claw本地部署的数据裸奔、远程入侵等安全风险,中科可控给上述设备配备了基于内置安全处理器最新的ASP主动防御机制。与传统杀毒软件只能针对已知威胁的被动防御不同,这套机制通过构建安全执行环境实现了针对未知威胁进行提前侦测、提前预防的主动防御机制。 中科可控推出的上述产品均采用自主可控的国产处理器方案,能满足不少国内场景的合规需求,无安全后门。同时,他们还基于芯片打造了数据加密、权限管控、风险拦截体系,操作可管控、数据可追溯等功能,进一步提高安全性。 对于政企、金融、医疗等高安全需求场景,Agent的落地门槛从来不只是算力,而是“合规”二字。有不少这类企业因安全风险,只能采取一刀切政策,彻底将OpenClaw排除在自身IT体系之外,虽确保了安全,但也失去了用Agent给业务提效的机会。 中科可控这套方案的价值在于:芯片自主可控满足国产化替代要求,主动防御机制应对 Agent 带来的新型威胁面,全链路审计能力对接企业现有IT治理体系。 不是所有人都需要这种级别的安全保障。但对于那些“不敢用”的客户来说,这可能就是 Agent真正进入生产环境的最后一块拼图。 三、从硬件就绪到生态繁荣,龙虾工作站背后的产业纵深 中科可控正在系统性降低Agent的部署门槛。 从轻量入门到高性能本地部署,从创意设计到政企办公,其产品矩阵已经覆盖了Agent落地的主要场景。更重要的是,围绕硬件构建的一系列配套能力,正在把“能用”、“敢用”推向“好用”。 该系列产品出厂预装OpenClaw、开机即启,无需折腾环境配置。对于没有专职运维的中小团队,这可能是最实际的价值点,省下来的不只是时间,还有踩坑的成本。 同时,用户在购买中科可控工作站后,可一键接入国家超算互联网平台,直接使用AI智能服务,实现开箱即用、无需部署。 中科可控还在帮助用户降低试错成本,该系列产品下单即赠1亿tokens,对于还在观望的开发者和企业来说,这是一个低风险的入场机会。 中科可控的一系列产品与活动,正与各地政策形成共振。 多地政府已出台政策鼓励OpenClaw智能体相关产业发展,从算力补贴到应用示范,政策信号明确。但政策文件到实际落地之间,往往隔着一道“最后一公里”——谁来做适配?谁来建生态?谁来帮企业跑通第一个场景? 这正是中科可控这类厂商的角色所在。具备行业Know-how的硬件厂商,不只是卖设备,更在通过线下活动、技术培训、场景共建等方式,实际支撑政策落地。他们是连接政策制定者、开发者社群与终端用户的桥梁,也是Agent从可用走向规模化的关键推手。 结语:一手抓技术一手抓生态,国产Agent算力方案加速落地 中科可控正走出一条技术硬实力与生态软实力并行的差异化路径。他们一手抓硬实力,以全栈安全、高性能终端回应Agent场景的真实需求;一手抓软实力,通过“龙虾局”等生态活动打破国产算力“不好用、难适配”的认知堵点。 当硬件、安全、生态、服务每个环节都形成闭环,国产Agent算力方案的落地,只是时间问题。
销量狂飙、冲刺IPO,AI眼镜博弈下的新叙事
“四年前从未想过AI/AR眼镜会这么热闹,更没想到有人都快要上市了。” 一位硬件投资人对作者说道,而在三年前他也曾短暂在AR产业创过业,只不过最后还是放弃了。用他的话说,自己要是坚持到AI大爆发的节点,或者现在就不用到处去找项目,而是资方来找自己了。 2026年快要走完四分之一的时间,从目前给出的市场反馈以及热度来看,AI眼镜或许真的迈过了“生死坎”,不仅销量大增,巨头们也相继入局。与此同时,供应链上游技术上的快速迭代,也在推动解决AI眼镜的不可能三角(重量、续航、性能)。 只是,热潮之下并不能忽视产业当下发展的一些困境,比如规模受限、退货率高以及行业认知的不统一等等。而在新的环境下,部分厂商也开启了新的竞争,在一到两年内,将会看到多家公司上市。就像真格基金投资合伙人徐梧说得那样,今年是未来十年里XR最具有挑战的一年,旧周期即将走完,新周期即将开始。 三倍增长、出圈“养龙虾”,AI眼镜成了抢手货 一年之前,关于AI眼镜,多数人的认知还处于极客玩家专属的玩物。那时,除了Meta之外,没有第二家AI眼镜公司在商业化上取得绝对意义上的成功。但,站在当下回看过去,这一切已然发生变化。 Omdia最新发布的数据显示,2025年,全球AI眼镜出货量达到870万台,同比大幅增长322%。其中,中国大陆市场占全球AI眼镜市场10.9%的份额,出货量接近100万台,成为仅次于美国的全球第二大市场。 数据来源:Omdia 2026年的前两个月,AI眼镜在国内也已经呈现出爆发的新趋势。先是在CES上,AI眼镜成为体验出圈的新物种。Rokid创始人Misa透露,随着上游供应链的优化,产能开始逐渐提升。今年1月乐奇销量环比增长30%,同比增长约800%。 春节期间,又成了热门的“科技年货”,叠加国补的助力,销量持续增长。相关数据显示,深圳华强北AI眼镜销量较平日激增70%至80%。“今年春节档,对智能眼镜而言是一个非常重要的节点,已经开始向‘礼赠型科技消费品’转变。”影目相关负责人对作者透露,在春节前联合吴晓波推出了联名礼盒,并开启了行业首个专场直播,与吴晓波团队的初次尝试便收获了近100万的销量。 承接住1、2月的流量,在后续的MWC、AWE等全球顶级展览期间,AI眼镜均是全展的中心,除了影目、Rokid、雷鸟等垂直品牌外,阿里推出的千问AI眼镜也借势拓展市场和知名度。不仅如此,在多个垂直场景,也迎来众多跨界的品牌,比如追觅推出的AI智能泳镜,老板电器推出的烹饪AI眼镜等。 值得一提的是,最近大火的“养龙虾”,也让AI眼镜增添了新玩法和价值体验。上个月,Rokid率先接入“龙虾”,Misa本人也是在社交平台多次晒出相关的体验,并指出,AI眼镜是人机交互的自然入口,接入“龙虾”后,用户不再需要频繁翻看手机,随时随地都能和“龙虾”实现互动、接受反馈,实现真正的解放双手提升效率。 作者在早前还独家获悉,雷鸟创新正在加速部署将AI眼镜接入OpenClaw,面向开发者的已经准备妥当了,自研的版本正在快速推进中,除了常规功能外,还可以实现与全屋设备的智能化联动,打造成一个功能强大的个人AI助理。据悉,其它多家AI眼镜也都在内测中,后续会推出定制“龙虾”产品。 当然,终端的百花齐放,与上游供应链技术的不断成熟有着很大的关系,像刚才提到的烹饪AI眼镜就是联合谷东科技做的方案,其它的像波导片、光机等产业都在跨步迭代。并且,中国快速增长的市场,也引来众多海外供应链的加注。 其中,特种材料制造商德国肖特集团针对中国增强现实(AR)产业推出了全系列光学技术解决方案,包括光学玻璃、晶圆以及波导等。作为全球及中国AR波导的主要供应商之一,肖特已实现本地稳定供应并深度满足中国市场的高速增长需求,并在前不久就宣布将投资拓展苏州AR技术中心。 肖特集团新任CEO杜德森博士表示:“中国是肖特全球战略中最重要的市场之一,将持续扩大制造与本地创新能力,计划在苏州追加投资超6000万元,并目标在2030年实现超过10亿元的年度产值,覆盖新产能建设、研发投入及本地技术部署。” 进击与退场,价值判断下出现新分歧 从2024年开始,各大科技企业就在寻找取代手机的AI Device。不过,从目前的商业化结果来看,AI眼镜无疑是最成功的,也是最有可能接近手机成为下一个超级终端。而一级市场也在用脚投票,年初至今已有多家中国品牌宣布了融资最新动态,超10亿资金注入到整个行业的发展中。 据不完全统计,2026年截止到现在,包括雷鸟、XREAL、Rokid、影目、Viture、致敬未知、玄景等品牌相继获得了最新一轮融资,多数都在亿元以上。而因为暂停自研国内手机项目的魅族,旗下的AI+AR眼镜项目也出现了各种传言。 作者曾独家报道,前星纪魅族全球CMO成力与前CTO张亚东携团队加入模块化AI眼镜品牌玄景MLVision,后者在加大线下投入,并要开设传统眼镜+智能眼镜融合店。内部人士还称,玄景MLVision或接手魅族的AI眼镜业务。 不过,魅族方面对作者否认了这一消息,并独家透露,魅族AR眼镜业务的融资进程已取得阶段性成果,已与两三家专业投资机构达成了实质性进展,近期有望完成一轮融资,以支持其新一代产品的研发与市场拓展,计划在今年二三季度推出光波导新一代产品。 资本的输血,让AI眼镜厂商有了更多的资金去研发以及进行市场推广,从而跳出原有的“窄圈”。要知道,在中国,每年都会有上亿人次购买新的眼镜,就目前AI眼镜的体量来说,虽说已经迈过百万销量的门槛,全球销量今年也会超过千万台,但相较于传统眼镜存量市场来说,还有非常大的差距。 不过,在热潮之下,变化也在悄然出现。一个较为明显的分歧点是,关于现阶段AI眼镜的价值判断,当下仍存在一定的争议。 乐观派看好眼镜作为AI的终端载体,是将软件能力在硬件端物理化的最佳路径。抛开原有的AI眼镜玩家,一些大厂在跑步入场,比如已经入局的小米、阿里千问、百度等,后续苹果大概率也会在今年发布首款AI眼镜,类似于Meta不带显示的版本。华为或将在下个月发布能拍摄的AI眼镜,支持鸿蒙系统+跨端无缝协同。 “如果说2024年及以前是一个验证期,2025年明显感觉是一个破圈期,来到2026年很可能是规模化爆发的一年。在我们看来,今年AI眼镜市场头部品牌影响力将更加集中,差异化的产品可能会越来越多。”影目相关负责人表示,今年AI眼镜竞争的核心重点聚焦在产品、市场、生态及场景等几个方面,26年影目INMO的Air和Go系列将都会有全新升级,同时X系列也会陆续推出。 但天平的另一面,站上了一些暂时不看好AI眼镜的厂商,“止步”于商业化节点。作为已经入局MR行业的手机大厂之一,vivo此前也在研发AI眼镜产品,但近期被传出叫停的消息,核心还是认为目前AI眼镜的体验和成熟度不高。字节豆包AI眼镜也暂缓了上市计划,但整体的研发还在继续,目标是要做出差异化的体验再生产上市。 另外,XREAL虽然和谷歌在海外有合作,但单纯的AI眼镜形态却迟迟不推出,此前其创始人徐驰曾表态要在2027年再入局。在他看来,目前AI眼镜依然没有进入“真赛点”,目前仍然有很多无法解决的问题。 “当然我们也对各种新事物持开放态度,会选择合适时间进入市场。同时,我们目前也在推进AR+AI的路线,与Google战略合作便是明确体现之一,后续会在合作产品Project Aura上体验深度融合Gemini AI。” 上市,千万销量节点的新叙事 基于当下的Omdia预测,2026年全球AI眼镜出货量将超过1500万台。不管是支持还是不看好,不可否认的一点是,AI眼镜正在走上坡路,那些暂时不入局的企业也只是将暂停键按在了商业化阶段,但背后的研发一直在持续。当AI眼镜的供应链完全成熟跑起来后,如果有领先的软件和生态体验支撑,那时入局也确实不晚。 而这,其实也在反映出一个问题,那就是AI眼镜若要成为手机那样的超级终端,还有较长的路要走,不只是显示,而是芯片、功耗、散热、重量这一整套系统工程。Misa也认同这一点,AI眼镜仍处于早期阶段,无论团队、产品、产业链还是生态,都还有许多不完善之处。 尤其是在软件端,现在的AI眼镜体验基本还是处于很初级的状态,不仅需要依赖手机的算力,在交互上的效率也并不高。玄景软件研发中心总经理郝冬宁认为,未来的交互不应是人适应机器,而必须是机器适应人,需要的是协同智能。而软件的起点是由硬件决定,后者也是一项复杂的系统性工程,这也是为何现在AI眼镜退货率如此之高的原因之一。 Omdia研究总监刘健森(Jason Low)指出:“竞争战场正在迅速变化,随着越来越多参与者加入竞争,生态系统整合能力将成为关键差异化因素。最终胜出的厂商将是那些能够将AI眼镜无缝融入更广泛设备生态系统的企业——将眼镜与智能设备、用户环境以及服务连接起来,在用户的互联生活中提供真正的价值。” 正如徐梧所说,这是十年起的赛道。只是,相比较手机、PC、智能手表的从无到有的发展历程,在AI眼镜的上半场,这一次的主动权更多的是掌握在中国厂商的手中。一方面是供应链,光学模组、芯片、显示单元,构成AI眼镜三大价值高地。目前,中国已形成涵盖光学、声学、整机制造等环节的庞大创新梯队,产业生态活力强劲。 另一方面则是终端市场,全球前三中国品牌占据两席。其中,具备显示功能的AI眼镜份额从2024年的3.3%上升至2025年的8.4%,总出货量达到73万台,而这一部分的市场正是完全被Rokid、阿里巴巴和Even Realities在内的中国企业主导,占这些配备显示功能AI眼镜出货量的71%。 数据来源:Omdia 可以预见的是,和手机一样,当AI眼镜真正成熟的时刻,中国厂商应该会是市场的头部核心玩家。而在行业即将跨过千万销量节点的时刻,部分AI眼镜品牌也进入到新的叙事——上市。 日前,天眼查信息显示,灵伴科技(杭州)股份有限公司(Rokid)发生工商变更,企业名称由“杭州灵伴科技有限公司”变更为“灵伴科技(杭州)股份有限公司”,企业类型从有限责任公司(港澳台投资、非独资)变更为股份有限公司(港澳台投资、未上市)。 股改的完成,意味着Rokid拿到了上市的 “入场券”。对此,Misa本人则表示,“低调吧,我们这个算是标准操作没啥意思,大家不用太敏感,多支持产品就好。”而作者从多名投资人处得到的消息则指出,确实头部的几家公司都在准备冲刺IPO,很可能这一两年就会看到首个AI眼镜上市公司。 值得一提的是,早在去年10月与影目科技CEO杨龙昇的独家对话中,他本人就曾透露“预计三年内上市”。另外,还有一家头部品牌计划在2027年前后上市。 或许,很多人认为AI眼镜远未是一个成熟的智能终端,但就像具身智能一样,并不耽误去二级市场讲一个更大的故事。(文 | 志读科技,作者 | 杜志强,编辑 | 钟毅)
别再迷信长期主义了!AI正在废掉靠“熬”赚钱的人
AI正在颠覆人类社会最底层的财富逻辑——时间的价值。当AI将传统需要多年积累的技能快速工具化、流程模块化时,靠资历和经验建立的职业护城河正在加速崩塌。本文犀利指出,真正的危机不是岗位被替代,而是‘时间溢价’的消亡,并揭示AI时代最残酷的生存法则:从时间思维转向空间思维,让个人价值在更大市场实现指数级放大。 今年以来,我越来越强烈地感觉到,很多人对AI的理解还是太浅了。 大家最爱讨论的,永远是那些表层问题:AI会不会抢我工作,哪些岗位会被替代,什么职业会先消失,效率能提高多少。 这些都对,但都不够关键。 AI真正厉害的地方,不在于它替代了谁,而在于它把这个社会最底层的一项定价标准给改了,它开始重新定义“时间到底值多少钱”。 过去几十年,几乎整个现代商业社会都建立在一个默认前提上:时间是站在强者这边的。 一家公司做得越久,品牌越稳,渠道越深,组织越大,客户关系越牢,护城河就越厚。一个人也是一样,工作时间越长,经验越多,越熟悉规则,越懂行业黑话,越容易在体系里往上走。资本市场也吃这一套,所以才愿意为企业很多年后的增长、利润和现金流提前买单。因为市场相信,好的东西会越做越强,领先者的优势会随着时间继续累积。 过去大家信的不是别的,信的是一句话:时间会奖励正确的人。 但AI正在毁掉这件事。 它最狠的地方不是“替代”,而是“压缩”。 以前一个能力,从不会到能卖钱,要练很多年;现在大量能力被拆成模块、流程、模板和指令,训练周期被直接打短。以前做一个产品,中间隔着开发、设计、文案、翻译、客服、投放、复盘,一环一环都要人,今天很多环节一个人加几个模型就能先跑起来。以前你跑出来一个新东西,至少还能喘口气,留出一点窗口去建立优势;现在你今天做出来,明天就有人模仿,后天就有人优化,大后天已经有人开始低价重做。 所以AI最深的冲击,不是降低成本,而是让“慢慢建立优势”这件事本身变得越来越不可靠。 这才是问题的核心。 过去一个人的安全感,很多时候来自时间。 我资历比你深,我做这行比你久,我踩过的坑比你多,我懂的规则比你熟,我在组织里的位置比你稳,所以我的收入、议价权和职业确定性都应该比你强。 过去这个逻辑基本是成立的。 但今天越来越多的人已经隐约感受到了:这套东西开始松了。 不是你没努力,也不是你不专业,而是你辛辛苦苦攒下来的很多东西,第一次开始出现一种很强的“折旧感”。 你花很多年建立起来的技能,AI可能几个月就把它工具化;你用很多年才爬到的位置,组织可能一轮流程再造就把它抽空;你原来以为能吃十年的饭,突然发现行业只给你留了三年窗口,甚至三个月窗口。 这意味着什么? 意味着一个残酷现实:在AI时代,很多人不是输给了别人,而是输给了时间不再值钱。 以前我们总说“做时间的朋友”,这句话曾经没错,而且很对。因为过去的世界确实相对稳定,职业路径清晰,行业更迭缓慢,经验大多数时候是增值资产,不是贬值资产。你在一个赛道里待得越久,理论上越吃香。 但今天再机械地重复这句话,就很危险了。 因为它很容易给人一种错觉:只要我继续熬,继续等,继续积累,迟早会轮到我。 问题是,现在很多赛道根本不给你那个“迟早”。 你还在积累,行业已经切换了;你还在学习,能力已经被平权了;你还在按部就班地往上爬,组织已经不按原来的方式发奖赏了。 所以我现在越来越觉得,AI时代最值得警惕的一种毒鸡汤,就是把“长期主义”说成一种放之四海而皆准的答案。 真正的长期主义,当然永远有价值。 但绝大多数人口中的长期主义,根本不是长期建设,而是慢性拖延,是对变化的回避,是用“再等等”来安慰自己不做判断、不做切换、不做重新布局。 以前慢,未必有问题。 现在慢,很可能本身就是问题。 因为AI正在摧毁一种旧时代最核心的财富逻辑:靠时间熬出稀缺,靠资历换来回报。 旧时代的上升方式,说穿了就是四个字:熬出来的。 熬经验,熬位置,熬信用,熬资源,熬到别人退出,熬到组织承认,熬到市场给你更高定价。它的本质,是把人生放进一台相对稳定的大机器里,用年限换收益。 可AI来了之后,这台机器开始不稳定了。 它把很多原来只能靠长时间训练获得的能力,变成了随取随用的外部能力;它把很多原来需要一个组织才能完成的生产流程,缩减成一个人也能启动的系统;它让市场的模仿速度、复制速度、平替速度全部提速,导致很多优势还没来得及坐实,就先被稀释了。 这时候,真正值钱的东西就变了。 以前最值钱的是“你比别人多熬了多少年”。 以后更值钱的是“你能把自己的价值放大到多大范围”。 这就是我想说的重点: AI不是单纯让时间失效,它是在逼所有人从时间思维切换到空间思维。 什么叫时间思维? 就是默认一个人的收入增长,主要来自更长的从业时间、更深的资历、更高的组织位置。说直白点,就是你的人生回报,基本跟你的职业年限强绑定。你干得越久,回报越大。 什么叫空间思维? 就是你的收入不再主要取决于你干了多少年,而是取决于你的能力、作品、产品、观点和影响力,能被多大范围的人看见、使用、购买和复用。 这才是AI真正打开的新局面。 因为互联网给了普通人前所未有的触达能力,AI又给了普通人前所未有的生产能力。过去,一个人脑子里有想法,不代表他能把它做出来;做出来了,也不代表他能传播出去;传播出去了,也不代表他能顺利交易和收钱。中间每一步都卡着门槛,卡着团队,卡着成本,卡着基础设施。 今天不一样了。 一个人可以写内容、做产品、搭工具、卖模板、发课程、做咨询、做游戏、做插件、做小软件、做知识服务、做跨语种分发、做全球销售。未必都能成,但至少第一次,普通人真的可以低成本地把“脑子里的东西”迅速变成“市场上的交易单元”。 这件事特别重要。 因为它意味着,未来真正决定一个人收入天花板的,不再只是你有多专业、多能吃苦、多会熬,而是你有没有能力把自己接进更大的市场。 以前赚钱,核心是延长自己的劳动时长。 以后赚钱,核心是扩大自己的价值半径。 以前你多赚一点,靠的是多干一点。 以后你多赚很多,靠的是让更多人同时为同一份价值买单。 前者拼的是耐力。 后者拼的是放大。 而AI,明显是在帮后者。 因为AI让生产变便宜了,互联网让传播变便宜了,支付和交易系统让结算变便宜了。于是未来真正稀缺的,反而不再是“基础生产能力”,而是更上游的东西:判断力、审美、选题能力、产品感觉、分发能力、连接市场的能力,以及把一次表达变成持续交易的能力。 这也是为什么我越来越不相信一句老话:只要你持续积累,时间会给你答案。 不,AI时代未必如此。 很多时候,时间不会奖励你,只会暴露你。 暴露你还停留在旧时代的路径依赖里,暴露你把稳定当成前提,暴露你还以为价值一定会慢慢沉淀,暴露你误把等待当成布局。 所以今天对普通人来说,最重要的已经不是继续膜拜时间,而是赶紧想明白一件事: 我的价值,能不能脱离“我本人一小时一小时地卖时间”,进入一个更大的传播空间、交易空间和复用空间? 如果不能,那你的上限大概率还是旧时代上限。 如果能,那你才真正开始进入AI时代。 说到底,AI并不是让所有人都有机会暴富,它只是第一次把一种新财富逻辑摊到了更多普通人面前: 你不一定非得先进入大公司、爬上高位置、等组织分配,才能获得更高回报。你可以先做出东西,再让更大的市场来定价。 这就是为什么我现在看很多人还在反复念叨“做时间的朋友”,会有一种强烈的不适感。 不是这句话彻底错了。 而是它太像上一个时代的成功经验了。 它适用于一个变化相对缓慢、能力折旧相对有限、组织阶梯相对稳定的世界。可今天我们面对的是另一个现实:能力在被快速平权,行业在被快速重构,竞争在被快速拉平,窗口在被快速缩短。 在这样的世界里,继续无条件崇拜时间,很容易把自己骗进一种很舒服、但很危险的状态里:你以为自己在稳扎稳打,其实你只是在缓慢出局。 所以我真正想说的只有一句话: 别再迷信时间了。AI时代,时间未必是你的朋友,空间才更像。 未来真正拉开人与人差距的,不是谁更能熬,不是谁简历更长,不是谁更适应旧秩序,而是谁更早学会把自己的能力、作品、产品和观点,放进更大的空间里,形成更大的回报闭环。 过去是“熬得住的人赢”。 以后更像是“能放大的人赢”。 这不是情绪判断,这是财富逻辑变了。 过去,时间是护城河。 现在,时间本身都在被压缩。 过去,慢慢积累可能等于复利。 现在,慢慢积累也可能等于慢慢错过。 所以,AI时代真正该完成的认知升级,不是继续问“我怎么做时间的朋友”,而是赶紧回答另一个问题:我到底怎样才能让自己的价值,被更大的空间接住? 这,才是接下来几年最现实的分水岭。
阿里经营智能体“AI万相”来了!四大Agent协同,从洞察到交易全包办
作者|李水青 编辑|云鹏 智东西3月21日报道,在昨日举办的2025-2026阿里妈妈未来商业奖年度盛典上,阿里妈妈推出其超级经营智能体引擎——“AI万相”,宣告开启以“多智能体协同”为核心的全新经营范式。 淘天集团阿里妈妈商业化运营中心总经理树羊谈道:“‘AI万相’具备独立思考、全链路调度与闭环交付的能力,商家只需要下达经营指令,‘AI万相’负责从拆解任务到交付成交的所有复杂环节。” “AI万相”以LMA大模型为技术底座,通过万相智识、万相智品、万相智造、万相智投四大Agent实时协同工作,驱动全域经营范式的深度重塑。它从过往“根据关键词找流量”的被动逻辑,通过深度链接消费者意图,实现从流量抢占到意图驱动的关键跨越。 在这一进程中,“AI万相”展现了由单一大模型向多Agent协同进化的合力: 万相智识作为意图识别Agent,实时捕捉消费者兴趣动向,匹配商家供给; 万相智品作为商品理解Agent,自动重构商品卖点,将商品从枯燥的物理描述翻译为高阶的情绪标签和场景意图; 在内容与投放环节,万相智造则利用AIGC创意能力秒级生成千人万面的差异化素材,确保创意与人群意图的精准对位; 最后万相智投作为投放优化专家,商家只需设定预算和ROI目标,剩下的路径规划与实时调优均由万相智投自主完成。 四大Agent能力成功串联起从洞察到交易的端到端闭环,真正做到了“意图在哪里,成交就在哪里”。 值得关注的是,阿里妈妈此次加码投入“无界智惠券”发放,加大平台对于商家经营的扶持力度。在“AI万相”的驱动下,智惠券通过全链路AI能力识别值得激活的用户群,以精准触达犹豫或沉睡的人群,让平台补贴成为放大商家经营成交的强效杠杆。 据悉,“AI万相”上述能力正在全面注入阿里妈妈百灵、万相台AI无界、UD智汇投等产品。商家无需学习繁琐的新工具,在原有的操作界面背后,“AI万相”驱动的智能体工作流已在静默运转。 阿里妈妈“AI万相”的推出,不仅是一次技术的迭代,更是赋能百万商家跨越存量竞争、在AI经营时代握紧长期增长确定性的核心力量。 回望过去一年,商品、服务与AI应用的结合进入新阶段,近1.4亿用户通过千问app体验AI购物,AI已快速渗透进人们的日常消费决策中。而在商家侧,各大品牌也通过各自的AI实战,将AI融入进经营决策之中。 在盛典现场,荣获年度巅峰品牌经营大奖的海蓝之谜便提供了一个生动的样板:品牌通过AI数据洞察精准捕捉轻熟女性护肤痛点,利用AIGC能力制作定制化投放素材,实现了点击率大幅提升25%,ROI 提升35%。 增长背后,透露出一个明确信号:AI正成为挖掘商业增量、提升经营确定性的关键,而商家们也迫切期待借助平台,将这些领先的AI能力内化为经营底座。
AI演员,为何引发众怒?
文 | 文娱先声 3月18,AI演员第一次真正意义上走入公众视野。 当天,耀客传媒正式宣布签约两名AI数字艺人“林汐颜”、“秦凌岳”,不仅将拍摄视频、参演剧集,还同步入驻社交平台,与真人艺人整体运作模式几乎无异。 然而,这一被官方定义为“打破创作边界”的尝试,却迅速演变为一场舆论危机。 大量网友开始自发抵制,甚至直接喊话相关艺人出面维权。争议的核心集中在一个细节——“脸”。有网友指出,这些AI演员“疑似融合赵今麦、张子枫、梁洁等多位女星特征”,并被嘲讽为“人山人海脸”。更直接的情绪则来自观众本身:“到底谁要看AI演戏,好诡异。” 同时,#网友抵制AI演员# #AI演员 人山人海##AI演员 恐怖谷效应##AI艺人 硬凹活人感#等话题登上微博热搜,久居不下。 那么,AI演员为何在短时间内引发如此强烈的反弹? AI演员动了谁的蛋糕? 如果把这场争议拆开来看,其实非常现实:AI演员,正在改变谁还能留在这个行业里,对整个影视产业链产生直接冲击。 此次争议中,最直接的爆点是“融脸”。在耀客传媒官宣签约AI艺人后,网友立即指出撞脸问题:“秦凌岳撞脸演员翟子路”,“林汐颜则与赵今麦、张子枫、梁洁等女演员都有相似之处”。此前,也出现过肖战、罗云熙等艺人的脸被直接搬到短剧里。 除了头部明星,受影响更大的无疑是配角、群演、功能性角色。换句话说,是影视行业最庞大、也最脆弱的那一层人。 近日,爱奇艺CEO龚宇在采访中提到:“AI商业大片,快的话今年夏天,慢的话今年秋天,全行业(如此)不光是爱奇艺。要有很强的艺术性、大片性,可能还需要时间,但这个时间也许就3个月、6个月就可以做到了。”这一表态与“男二以下的演员都不需要真人了,就用AI做”的爆料叠加,迅速登上热搜。 这点在易凯资本CEO王冉的演讲中得到印证。他预测,真人演员需求将整体大幅缩减,中腰部演员会被大量挤压、替代,群演、替身行业将基本消失,AI可以百分百替代;新人入行路径也将改变,学徒制几乎不存在,自己本身先成为小IP,才有可能被大IP创作者看见。 有网友的反应非常直接:“以后竞争会越来越大,工作越来越难找。”这并不是情绪化表达,而是对技术逻辑的直觉判断。因为相比真人演员,AI几乎具备压倒性的优势:无需片酬谈判、没有档期限制、可以无限复用、输出稳定且可控。 当这些优势叠加在一起,一个结果几乎是必然的,即从群演到配角的上升路径,正在被截断。 尤其是在降本增效的大环境下,AI演员天然成为了“理想工具”。据澎湃新闻报道,真人短剧行业的亏损率已超90%,承制量骤降50%。与此同时,抖音、腾讯、快手等头部平台纷纷推出专项扶持计划,例如抖音短剧版权中心对高评级的AI仿真人剧给予高额保底激励。 但问题在于,当效率成为唯一标准,人也开始变成可以被替换的变量。 大众到底在抗拒什么? 如果说“抢饭碗”只是表层原因,那么AI演员真正引发争议的,是更深层的认知冲突。 在观众反馈中,有一句评价反复出现:“表情僵硬、缺乏灵魂。”这句话的关键,并不在“技术不成熟”,而在于它指出了一个本质问题——AI正在改变“表演是什么”。 传统表演,是演员通过自身经验与情绪完成的表达,它包含不可复制的体验、即兴与误差、人格与情感投射,而AI演员的本质是数据训练结果,表情与语音的算法组合和可优化、可复制的输出。 当体验被替换为“计算”,观众感知到的,并不是更真实,而是更空洞。这也解释了一个看似矛盾的现象:AI越像人,观众反而越不舒服。 因为它逼近的,不是人,而是“没有人的人”。 如果把视角再拉远一点,AI演员引发的不安,也只局限于演员,而是背后的整个商业系统。 因为它不会单独存在,而是会与其他AI能力形成闭环:AI编剧、AI剪辑、AI配音、AI分发,最终构成一个高度自动化的内容生产体系。在这个体系中,甚至连“观众”都可能被替代:AI评论、AI弹幕、AI评分、AI粉丝互动。 当内容的生产与消费都可以被AI完成,人类在其中的位置,就开始变得模糊。 这也是为什么,很多观众的反应会从“反感”升级为“恐惧”。因为他们隐约感知到的,不是一个技术问题,而是一个更根本的问题:如果内容世界不再需要人,那我们还在看什么? 此外,当前 AI 演员技术远未达到商用成熟度,视觉与表演层面的硬伤难以忽视。AI 生成的人脸同质化严重,多人同框时呈现“人山人海”的诡异感,陷入“恐怖谷效应”,假人感十足,没有灵气,完全失去真人表演的自然质感。同时,AI 只能复刻程式化的动作与台词,无法传递真实的情感、微表情与角色灵气,长剧所需的情感共鸣与人物塑造彻底失效。 正如欢娱影视创始人于正所说:“真人的表演和人类对于同类的幻想和需要,绝对不是AI能够完全取代的。当然就像动画片的发展一样,有人喜欢纸片人就有人喜欢真人,AI制造出来的幻境或许会是一时的潮流,但肯定还会回归。” 但这些情绪背后,有一个非常清晰的心理机制:人类对“被替代”的天然抗拒。更不用说,在影视行业中,本就是一个依赖“人”的行业。 结语 回到最初的问题:AI演员为何引起众怒? 答案其实已经很清楚:它触碰的,从来不是单一技术,而是三个更根本的命题:谁还能留在这个行业?表演还算不算“人”的表达?内容世界是否仍以人为中心? 从产业角度看,AI演员几乎不可逆。它代表着效率、更低成本与更高可控性,这是所有行业都会走向的方向。 但真正的矛盾在于,技术推进的速度,远远快于规则建立,而资本对效率的追求,正在压倒内容价值,工业化逻辑,正在侵蚀“人”的位置。 所以,观众的愤怒,并不是拒绝AI,而是在追问一个更本质的问题:当一切都可以被替代,人还剩下什么?
这台家务机器人,干起家务来真的像人……
自从在春晚上,机器人展示了各种吹拉弹唱技能之后,很难让人不做进一步想象:搞快点,传说中的家务机器人能不能再搞快点。 人形机器人公司 Figure 前不久发布了一段新视频,没有跳舞,没有翻跟头,就是展示家务技能。 一台 Figure 03 机器人走进一间散乱的客厅,环顾四周一圈,然后开始干活:把地上的玩具捡起来丢进收纳箱,拿起喷雾剂喷在茶几上再用毛巾擦干净,把沙发上的抱枕拍松扔回原位,甚至拿起遥控器按下关机键把电视关掉。全程没有任何人类指令,没有遥控操作,一镜到底。 这段视频在社交媒体上迅速传播,比起各种「酷炫」的机器人 demo,它做的事情很平凡——都是你每天回家后不想做、但又不得不做的事。 这正是 Figure 想要传达的信号。 新「大脑」 特别的是,Figure 并不是发布一台新机器人,硬件仍然是去年 10 月发布的 Figure 03。这次带来升级变化的,是一套全新的 AI 控制系统 Helix。 Helix 02 的核心突破在于一个概念:全身自主性(full-body autonomy)。此前的人形机器人,包括 Figure 自己的上一代系统 Helix,大多只能控制上半身,能站在原地伸手抓东西已经算不错了。走动的时候,系统需要先停下手上的动作、稳定身体、迈步、再停下来、再伸手。 这种「走-停-做-停-走」的模式意味着机器人但凡做点什么,可能需要花上你自己做的十倍时间,完全本末倒置。 Helix 02 把这个过程彻底打通了。它用一个单一的神经网络同时控制行走、平衡和操作,机器人可以一边走路一边端着碗,可以在手上拿着东西的时候用胯关门,甚至可以在双手被占用时用脚把洗碗机的门踢开。 这听起来像是人做家务时最自然不过的动作,但对机器人来说,这是一个困扰了学术界和工业界数十年的难题,loco-manipulation,即移动与操作的统一控制。 连马斯克都不禁要来问:真是自主吗? 为家庭而生的硬件 Helix 02 的架构分为三层,可以类比人类的思考方式: System 2(慢思考)负责语义理解:看一眼客厅,判断哪些东西是乱的、应该放哪儿去、先做什么后做什么。这一层处理的是「理解」和「规划」。 System 1(快思考)负责把理解转化为动作:以每秒 200 次的频率将视觉、触觉、本体感知等所有传感器的数据转化成全身关节的目标位置。这一层处理的是「决策」。 System 0(本能层)是这次最大的新增。它以每秒 1000 次的频率运行,负责平衡、接触和全身协调。Figure 用超过1000 小时的人类运动数据和模拟环境中的强化学习训练出了这个底层控制器。用 Figure 的话说,这个 10M 参数的神经网络替代了原来 109,504 行手写 C++代码。 这个三层结构的结果就是:机器人看起来不再像一个在执行预编程指令的机器,而更像一个正在「做家务」的人——动作连贯、有节奏、偶尔还会做出一些看起来很「聪明」的临时决策(比如把杯子挪开检查污渍)。 Helix 02 之所以能做到这些,也离不开 Figure 03 这个硬件平台的配合。这台机器人身高 5 英尺 8 英寸(约 168 厘米),体重 61 公斤,一次充电可以工作 5 小时。相比上一代的 Figure 02,它有几个关键变化: 手掌摄像头和触觉传感器。每只手的掌心都内嵌了一个广角摄像头,在主摄像头被遮挡时(比如伸手进柜子里摸东西)提供近距离视觉反馈。每个指尖都有触觉传感器,灵敏到可以感知 3 克的力。这使得机器人能从一堆散乱的小物件中精准地拾取单个目标,甚至能用注射器精确推出 5 毫升液体。 全身覆盖软性材料。不再是冷冰冰的金属外壳,而是可拆卸、可清洗的软面料,战略性地放置了多密度泡沫来防止夹伤。 无线充电。脚底内嵌感应线圈,站上充电底座即可以 2 千瓦功率充电。不需要人去插线,机器人可以自己走去充电。 这些细节指向一个明确的产品定位:Figure 03 不是一台实验室样机,而是一台为了进入家庭而设计的消费品。 年初底发布时,Figure 把演示场景选在了厨房,机器人自主完成了一个长达 4 分钟的完整任务。 走到洗碗机前、打开门、取出碗碟、走到橱柜前放好、再走回来装载脏碗碟、关门启动。全程 61 个连续动作,无中断。Figure 称这是「人形机器人迄今为止完成的最长时间、最复杂的自主任务」。 3 月这次的演示,则把难度往上推了一层,来到了客厅。厨房虽然复杂,但物品摆放相对固定、动作路径相对可预测。客厅则是一个每天都在变的空间。 玩具散落的位置不同,沙发垫的状态不同,茶几上的杯子数量不同。软性物品(毛巾、抱枕)的物理行为难以预测。家具之间的通道狭窄,需要侧身通过。很多动作需要双手配合,另一些则需要在任务进行中临时腾出一只手。 而且这次演示还加入了工具使用——喷雾瓶 + 擦拭、遥控器按键——这要求机器人不仅理解物品「是什么」,还要理解物品「怎么用」。 Figure 强调了一个关键点:从厨房到客厅,Helix 02 没有更换任何算法,也没有做任何专项工程优化,仅仅是增加了训练数据。同一套通用架构,喂更多数据就能学会新技能。 这暗示了一个令人兴奋的扩展逻辑:如果收拾客厅只需要「多看几遍示范」,那收拾卧室、整理衣柜、浇花、喂猫呢?大有可为啊。 「家用机器人时代」真的来了吗? 先泼一盆冷水。 目前 Figure 03 的估计售价在 5 万到 10 万美元之间。即便 Figure 提出了订阅制(robot-as-a-service)的商业模式,每台机器人年均产生约 5000 美元收入,这个价格也远非普通家庭可以承受。而且,演示视频和真实家庭环境之间还是存在差距。 另外,视频中的客厅虽然看起来很「日常」,但它仍然是一个受控场景。真实家庭有宠物、有小孩、有堆满快递盒的角落、有你三周没洗的衣服堆。 但换一个角度看,Helix 02 的意义不在于它今天就能上岗,而在于它证明了一个路径的可行性:用单一通用 AI 架构 + 更多数据 = 更多家务技能。 这和大语言模型的 scaling law 有异曲同工之处,ChatGPT 不是被专门编程来写诗或写代码的——它只是在更多文本上训练,就涌现出了这些能力。 Helix 02 展示的是同样的逻辑在物理世界的映射:一个神经网络,不需要为每个新任务重新工程,只需要更多的运动数据。 如果这个逻辑成立,那么人形机器人的进化速度将不再取决于工程师写了多少行代码,而取决于它「看过」多少种家务场景。而家务场景的数据采集,恰恰是最容易规模化的——毕竟,每个人的家里每天都在产生这些数据。 Figure 目前的制造工厂 BotQ 已经具备年产万台的能力,目标是四年内累计生产 十万台。每一台出货的机器人都是一个数据采集终端,它们在不同家庭中遇到的每一个新场景,都会通过 10Gbps 毫米波无线回传变成下一版 Helix 的训练素材。 用 Brett Adcock 的话说,制约他们出货的不是需求,恰恰是 AI 还不够通用。而 Helix 02 的客厅演示,让「够通用」这个目标又近了一步。 从跳舞到收拾客厅, Helix 02 迈出的这一步,可能比任何后空翻都更接近未来。机器人不再需要证明自己有多酷,它需要证明自己有多有用。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。