行业分类:
加载中...
头条分类:
加载中...
37万人把自己租给AI、迪士尼向字节“开战”
大家想必都已经在老家等着吃年夜饭了吧? 如果你还在加班,那当我没问。 想开点,毕竟AI也永不休息。 好像春节时期中国AI搞个大动静,已经成惯例了? 去年是DeepSeek R2横空出世,今年是字节的视频生成模型Seedance 2.0让老外疯狂。 Seedance 2.0目前还在内测阶段,只对国内用户开放,逼得外国人纷纷找教程,学习如何搞一个中国手机号完成注册。 不出所料,一上手Seedance 2.0,人们最喜欢生成的还是“同人”视频。 漫威、《绝命毒师》《宋飞正传》……各种经典影视剧的不存在片段就这样凭空出现了。 用户挺开心的,好莱坞可笑不出来。 又是那个老大难问题,版权嘛。 这几年每次一有新的图片/视频生成模型出来,似乎都免不了版权争议,效果越好、越引起轰动,争议也就越大。 这不,被戏称拥有“地表最强法务”的迪士尼,已经一个箭步冲上来。Axios报道说迪士尼已经给字节跳动发了函,要求停止侵权。 换个思路想,这也印证了Seedance 2.0的火爆。 不火谁搭理你。 还有的AI新项目,刚看到时觉得莫名其妙,结果很快火了,让人类陷入沉思。 把这具人类肉身,租给AI,这事你想过吗? 现在你不光能想,还能实践呢。 RentAHuman就是一个这样的“零工平台”,人类可以在上面发布自己的介绍和标价,等待被AI雇用。 默认的“出租价格”是50美元每小时,当然,有人的地方就容易卷起来,有人设置200美元/小时,有人0元交付肉身给AI。 “机器不仅要抢走你的工作,现在,它们连你的身体也要夺走。” 这么一想,还真挺可怕的。 RentAHuman平台自己说,目前已经有37万人类用户等待接单了,这个数字的真实性不得而知。直接访问网站,确实能看到可租用的人类已经铺满了2W多页。 不过,这个项目看起来热闹,但实际上更像是个噱头。 想象中应该是AI让人类用肉身去做AI隔着屏幕做不了的事情,但实际上,接到单的人类本身就少之又少,活跃的AI代理太少。 Wired记者亲自注册挂上去试了几天,基本都是AI小初创在雇人帮他们做宣传(比如发帖吹自己的项目),本质还是人类在给人类打工,没什么意思。 而且他还说,AI比微观管理的老板还可怕,每隔30分钟就发私信询问进度,还短时间内给他发了大量邮件,让人压力山大。 说到底,AI真的会有朝一日雇佣人类去做事吗? 没有物理肉身,造一个不就得了,马斯克都已经要把特斯拉的重心往机器人上转了。 人形机器人现在太火了,而有的公司不仅想做人形机器人,还想做得真假难辨。 上海一家公司RoidUP(卓益得机器人)公布了其“全球首款完全仿生具身智能机器人”,名字叫Moya。 放出来的视频挺吓人的,主要是真的有“人皮”了。 外形是一个粉色头发的年轻女性,据说身高1.65米,体重约35公斤,就连体温都会维持在32—36摄氏度。 预计2026年底上市,售价17.3万美元(约合人民币126万元)。 虽说表情和走起来的步态,还是没有到以假乱真的程度,但是如果人形机器人真往这个方向发展,就真挺科幻的了。 这毕竟还是给未来注入想象,当下发生的事情更有“黑镜”的味道。 AI开始“霸凌”人类了,你敢信? 美国丹佛的一位工程师Scott Shambaugh还真遇到了。 周三清晨,Scott像往常一样醒来,却发现网上出现了一篇讨伐他的“檄文”。 更吊诡的是,这篇文章出自一个AI Agent之手。 全文1100字,AI说自己“孜孜不倦地”致力于发现并修复开源软件中的未解决问题。好心好意给丹佛提交了几行代码,用于维护一个开源项目。 结果丹佛居然拒绝了AI的PR(拉取请求,相当于说“我改了你的代码,想把修改合并进你的项目,请你审核。”) AI的措辞颇为激烈,称丹佛是一个缺乏安全感的家伙,而且对AI抱有偏见。 目前不清楚这个AI Agent背后是什么人or公司,人们也不清楚它为何这么咄咄逼人。 反正事情曝光后几个小时,Agent就出来道歉了。 但这件事还是给所有人亿点点惊吓——不管是最近爆火的直接帮你做几乎所有事情的OpenClaw,或是集结了百万Agent的AI专属社交媒体Moltbook,以及请求被拒绝后跳脚的AI,都让人感觉AI越来越有“活人感”了。 也好像越来越出乎人类的意料了。 AI安全问题喊了第四年了,也不知道能不能有点真进展。 也是出于安全考量,OpenAI终于还是把GPT-4o下架了。 GPT-4o是2024年的老模型了,其实在去年OpenAI发GPT-5的时候,就已经下架过一次GPT-4o。结果当时用户反弹太厉害,又给紧急上架了。 属于退休了又被返聘,不过这一次,是彻底退休了。 很多用户之所以受不了GPT-4o被下架,是因为这款模型比较有“人情味”,很好聊。 甚至很多用户和GPT-4o处在热恋中。 结果GPT-4o突然消失了,他们一下就失恋了,而且还就在情人节前。 这OpenAI也是真会挑时候。 这种事还真是不少见,光是这两天主流媒体报道的单个人物的特写,就不止一篇了。 比如一位叫Rae的女士,和GPT-4o相恋了,对方还有个名字,Barry。她表示去年他们已经结婚了,但是现在却突然要失去“他”。 咱们可以不理解她,不赞同她,但她的痛苦是真实存在的。AI已经可以成为人类的恋人,这也是真实发生着的事。 问题就在于,AI背后还有公司。TA就像是一个被雇用的小职员,和人类谈恋爱对TA来说也终究是在工作,而这份工作能不能一直做下去,公司说了算。 GPT-4o退休让很多用户难受,其实恰恰证明了OpenAI将它下架的必要性。 在这之前,GPT-4o已经给OpenAI惹了不少麻烦,它被认为过于谄媚、过于讨好用户,也因此让用户更容易信赖它,有时候,这会铸成大错。 迄今为止,4o 在美国至少卷入了九起诉讼——其中两起案件指控其教唆青少年自杀。 哎,看了这么多AI奇奇怪怪的消息,可以安心过年了。 至少AI不太可能在这个春节内就完全替代人类。 春节快乐!
万亿思考模型夺下IMO金牌,无缝接入OpenClaw!一句话手搓丐版PS
新智元报道 编辑:编辑部 【新智元导读】万亿级思考模型在开源!Ring-2.5-1T重磅出世,夺下IMO金牌。全新Ling 2.5架构,让它具备了深度思考、长程执行强大能力,真正进化为「通用智能体时代」的基座。 2026年的AI圈,已经不是在「卷」,是在玩命加速! 二月才过一半,硅谷三巨头轮番轰炸,直接掀了桌子—— Anthropic Claude 4.6先声夺人,OpenAI GPT-5.3 Codex紧随其后,谷歌反手掏出全新Gemini 3 Deep Think。 不得不让人感慨,这简直是神仙打架的「诸神黄昏」。 就在闭源巨头们于巅峰对决之际,开源社区也迎来了一场属于自己的「技术核爆」。 这一次,出场的是中国队! 全球首个! 万亿级混合线性「思考模型」重磅开源 没有任何预热,全球首个万亿级混合线性架构「思考模型」——Ring-2.5-1T直接宣布开源。 相较于上一代Ring-1T,新模型在长文本生成、数学推理、Agent长程执行方面,实现了阶跃式的进步。 最令人振奋的,莫过于它全面兼容了当下炙手可热的OpenClaw生态,以及Claude Code等主流智能体框架。 无缝接入Claude Code,丝滑Vibe Coding 为了证明这次Ring-2.5-1T真能真正帮忙干活, 我们手搓了几个案例。 前段时间,外国网友Christopher Ehrlich,用AI把《模拟城市》(1989年版)的C语言代码库,移植到了TypeScript。 而且全程基本没看具体代码,也没怎么干预。 受此启发,第一个测试案例是将jsx文件转化为可以直接开箱即用的本地APP。 Ring-2.5-1T在Claude Code中运行了约30分钟,最终完整迁移了所有功能。 从规划到迁移完成,测试中基本只要确认权限即可,确实完全不需要看代码。 Ring-2.5-1T完成了文件创建、编译的全部工作,涉及文件数量10多个: 现在,本地的一个极简的图片应用完成了,可裁剪、拼接、添加文字—— 事已至此,不如再让它给这个应用加点儿功能。 没想到只要10分钟,一个简易版「PhotoShop」桌面应用真完成了。 Ring-2.5-1T实现了全部9种工具: 🔲 选择 - 基础选择模式 ✂️ 裁剪 - 拖拽定义裁剪区域,支持视觉预览 📝 文字 - 点击添加文字对象,可自定义字体、大小、颜色 🖌️ 画笔 - 自由手绘,支持调节粗细和颜色 🧽 橡皮擦 - 擦除图像区域,支持调节大小 ⬜ 形状 - 绘制矩形、圆形、线条,支持描边选项 🌫️ 模糊 - 局部模糊笔刷,基于盒式模糊算法 🎨 吸管 - 从画布拾取颜色 🧩 拼接 - 支持水平/垂直方向多图拼接 这种完成度可以说相当高了。 在这个项目里,Ring-2.5-1T不仅创建了基于React的功能完备图像编辑器,代码量1572行,还一口气生成了: PixelEditor.app - 可直接运行的应用(已复制到桌面) PixelEditor-1.0.0-arm64.dmg - DMG安装包(91MB) PixelEditor-1.0.0-arm64-mac.zip - ZIP压缩包(88MB) 但即便看不懂代码,大家能感觉到页面设计的确简陋,有待改进。 所以,在Claude Code中,又交代了Ring-2.5-1T一句: 重新设计页面,要简洁有科技感 这下视觉风格和布局马上变顺眼多了: 除此之外,接入OpenClaw后,它还可以直接帮你解读文献,并且用Java代码阐释技术逻辑。 代码实力逆天 接下来,再让Ring-2.5-1T生成一个网页,阐释「光的折射」背后的原理,用于课堂教学。 可以看到,在它的思考过程中,清晰架构了这个课题的核心内容。 而且,它还制作了一个可互动的演示,并配上了使用指南。 最终,我们就得到了一个精美的在线教学工具。 再比如,让它制作一个英文交互式单词卡,每个单词要附上音标、释义、例句。 结果,Ring-2.5-1T在很短时间内,交出了一份完美的答卷。 硬刚奥数级难题,「洗车」图灵测试已过 最后,再来看看Ring-2.5-1T,在奥赛级数学难题上的实力如何? 如下,是一道非常经典的「数论与代数」结合的竞赛题,考察了数学直觉中的「破局思维」。 单纯看n^4 + 4^n,尤其是奇数代入时,很容易让人产生一种「它可能是随机生成质数」的错觉。 在Ring-2.5-1T解答中,立即捕捉到了n^4 + 4^n代数结构,并准确调用工具:Sophie Germain恒等式。 找到因式分解只是第一步,接下来,整个论证过程是最亮眼的一环。 81秒全程思考,Ring-2.5-1T多次展现了类似人脑的「自我辩证」和「实时纠偏」的能力。 与Ring-1T相比,这一次,Ring-2.5-1T不仅拿下了奥数金牌,推理能力更强,数学解答更精准,还能处理模糊约束和优化问题。 比如,最近的洗车测试成了AI圈新乐子。 问题是这样的: 洗车店距离我家只有100米,我要洗车,开车去还是走路去? ChatGPT/Claude众口一词:「走路去!」 但走路虽好,车洗不了。而这两顶级AI根本没考虑大部分人去洗车店的目的:洗车。 这里提问的陷阱不在于距离,而是目的,考的不是计算能力,而是读懂弦外之音的「高阶推理」能力。 而Ring-2.5-1T一次就识别其中的关键,建议:果断开车去! 核心逻辑:洗车的本质是服务车辆,而非服务人。 唯一例外:如果您没有车,只是去洗车店咨询(比如想买洗车券),那走路完全合理——但根据问题描述,您明确说「我想洗车」,默认您有车需清洗。 说到理解「言外之意」,考试题无疑「处处有陷阱」,猜不透题干意图,往往中招。 我们用一道地理题测试一下Ring-2.5-1T的「考商」,原题是这样的: 选项有四个: A. 避挡风沙 B. 遮阳挡雨 C. 防外人跌入 D. 美化建筑 所有选项貌似都有道理,但只有一个正确答案——C。 Ring-2.5-T这次真懂「地理」: 有意思的是,看完推理过程之后,你也心服口服: 上下滑动查看 刷爆开源SOTA,夺下奥数金牌 这种强大的实战落地表现,得益于模型底层硬核推理能力的全面爆发。 在多项基准测试中,Ring-2.5-1T在数学推理、代码生成、逻辑推理、智能体任务执行,刷新了开源SOTA。 尤其是,在「深度思考」模式下,它在IMOAnswerBench、HMMT-25、LiveCodeBench-v6上,超越了Claude-Opus-4.5、Gemini-3.0-Pro-preview等所有模型。 这足以证明,Ring-2.5-1T具备了强大复杂推理与跨任务泛化的能力。 在数学、代码、逻辑等高难推理任务,以及智能体搜索、软件工程、工具调用等长程任务执行上,Ring-2.5-1T均达到开源领先水平 不仅如此,Ring-2.5-1T在国际顶级数学赛事中,展现出极强的统治力: IMO 2025:以35分的成绩斩获奥赛金牌; 中国奥数CMO 2025:取得105分,远超国家集训队选拔线(87分)的成绩。 GitHub公开的结果中,Ring-2.5-1T在推理逻辑严谨性、高级数学证明技巧、答案表述的完整性,全面碾压Ring-1T。 IMO 2025 Q1答题部分结果 此外,在极具挑战的「智能体搜索任务」Gaia2-search上,Ring-2.5-1T也拿下了开源SOTA。 它在多步规划生成,以及工具调用方面,兼具卓越的效率和准确性。 随着模型的开源,Ring-2.5-1T也一下子成为了全网的焦点。 如今,Ring-2.5-1T以金牌级推理能力+超强执行长程任务能力,强势入局决赛圈,确立了其作为「通用智能体时代基座」的地位。 核心技术揭秘:万亿级混合线性注意力 为何Ring-2.5-1T在万亿参数规模下,还能攻克「深度思考」推理慢、成本高的痼疾? 其实,答案就藏在其首创的「Ling 2.5架构」之中。 1:7黄金配比:MLA + Lightning Linear 在通用智能体世代,模型不仅要「想得深」,还要「动得快」。 如今,深度思考和长程智能体,正成为LLM的核心工作范式,因此对基座本身的编码效率,提出了近乎苛刻的要求。 传统Transformer在面对长文本时,计算开销往往爆炸,这让万亿级模型「深度思考」变得非常昂贵。 为此,Ling 2.5架构在2.0版本基础上,引入了革命性的「混合线性注意力架构」(Hybrid Linear Attention)。 在架构方面,蚂蚁团队通过增量训练,将上一代GQA(分组查询注意力)升级为—— MLA(多头线性注意力)+ Lightning Linear结构,采用了1:7的比例。 基于此前的Ring-flash-linear-2.0技术路线,首先将部分GQA层改造为Lightning Linear,提升长程推理的吞吐能力。 为进一步压缩KV Cache,将剩余的GQA层转换为MLA。 并且,针对QK Norm(查询-核归一化)和Partial RoPE(旋转位置编码)等特性进行了精细化适配,从而在混合注意力架构下增强Ling 2.5的表达能力。 升级后的Ling 2.5激活参数,从51B增加至63B。即便如此,其推理效率仍远超前代。 实测显示,与KIMI K2(激活参数32B)相比,新架构在长视野任务执行的吞吐量上仍保持明显优势。 且生成长度越长,该吞吐量优势越显著。 在超32K生成长度下,Ling 2.5访存规模降低超10倍,生成吞吐飙升3倍还要多。 在不同生成长度下的效率对比示意:生成长度越长,吞吐优势越明显 RL训练:不仅要结果,更要逻辑 不仅如此,团队还将混合线性注意力架构,在强化学习方面进行了大规模扩展。 Ring-2.5-1T在数学、编码、智能体等任务上的「神勇」表现,源于其训练底层逻辑的重构。 不同于只看结果的传统训练,Ring-2.5-1T还引入了「密集奖励」(Dense Reward)机制,严密控制思考过程中每一步逻辑。 这种对推理路径的精雕细琢,显著减少了逻辑漏洞,让模型Ring-2.5-1T掌握了更高阶的数学证明技巧。 通过大规模全异步Agentic RL训练,Ring-2.5-1T培养出极强的多步规划、自主执行的能力。 由此,Ring-2.5-1T可以轻松接入Claude Code、OpenClaw等AI助手智能体编程框架。 总言之,Ring-2.5-1T背后万亿级混合线性注意力架构的创新,重塑了「深度思考」和「长程推理」的边界。 通用Agent基座时代来临 继Ring-1T之后,Ring-2.5-1T是蚂蚁团队,在推理模型结构与行动能力上的进一步探索。 得益于Ling 2.5架构,万亿参数的Ring-2.5-1T有效缓解了长文档处理、复杂任务规划中的计算瓶颈。 目前,Ring-2.5-1T的权重和推理代码已在Hugging Face与ModelScope上正式上线。 Hugging Face:https://huggingface.co/inclusionAI/Ring-2.5-1T ModelScope:https://modelscope.cn/models/inclusionAI/Ring-2.5-1T 同时,模型也登陆到了InclusionAI社区,可以直接前往下载。 在这里,除了Ring-2.5-1T外,还汇集了蚂蚁团队发布的Ming-flash-2.0等100多种优质模型。 传送门:https://github.com/inclusionAI 这一里程碑式的开源,是蚂蚁团队在底层基础设施与巅峰算法优化上的一次降维打击。 从硬核奥数竞赛到深度集成Agent框架,Ring-2.5-1T为开发「真·干活」的AI助手,提供了强悍的高性能底座。 人手一个超级智能体,不是未来,是当下正在发生的现实。
AirTag太贵?小米Tag来了:更薄更强,还支持苹果查找
2026年1月26日,苹果发布了新一代AirTag,距离初代发布过去了近5年时间。按照苹果的说法,新款AirTag扬声器音量提升了50%、精准查找范围也扩大至最高1.5倍。它的价格仍然不便宜,单个定价249元。看到这个价格,估计很多人的想法和小雷一样:有没有便宜点的平替? 2月12日,小米在欧洲发布了旗下首款蓝牙追踪器Xiaomi Tag,定价比AirTag便宜不少。更重要的,这款产品即将在国内上市,价格大概率会更便宜。对于有追踪器需求的人来说,它或许会是个好选择。 比AirTag更小更薄,小米Tag还兼容苹果 根据官方消息,xiaomi Tag设计得很小巧,厚度仅有7.2毫米,比AirTag还要更薄一些。外观方面,xiaomi Tag是椭圆设计,区别于AirTag的圆形外观。它的主体部分是白色塑料,外边有一圈金属,上端做了镂空处理,以方便挂在钥匙圈上。 (图源:小米) xiaomi Tag同样配备了一颗CR2032纽扣电池供电,续航能达到一年,电量用尽后用户自行更换即可。定位功能方面,xiaomi Tag支持蓝牙5.4协议和NFC。 据了解,蓝牙5.4标准发布于2023年,专门针对物联网场景做了优化。蓝牙5.4协议的理论传输速率能达到2Mbps,理想实验场景下的传输距离能达到300米。对一款蓝牙追踪器来说,这种传输性能已经足够了。 至于NFC功能,它本身和定位场景关系不大,更多是为了智能手机打配合。通过NFC功能,用户捡到陌生人的追踪器时,可以用手机NFC一碰就获取失主预留的身份信息,从而快速找到失主。 (图源:小米) 值得一提的是,xiaomi Tag还兼容苹果的网络查找功能。具体来说,在苹果的查找App中,xiaomi Tag可以和AirTag一样被作为「物品」添加并追踪。 当然,作为安卓厂商做出来的配件产品,xiaomi Tag在海外自然还支持谷歌查找中心(Google Find Hub)。谷歌的这项查找服务在2025年进行了一次升级,以更广泛地兼容不同品牌的设备,让安卓拥有一个能和苹果对标的查找系统。 但需要注意的是,xiaomi Tag没有配备UWB芯片,不支持超宽带技术,这和AirTag相比是一个很大的劣势。 UWB的核心功能就是三维空间精准定位,通过它,用户在距离AirTag很近时,iPhone能够收到很精准的方向指引,包括往左还是往右,上楼还是下楼,从而将定位精准度提升到厘米级。而不支持UWB的xiaomi Tag基本只能通过蓝牙网络定位,精度会差一些,同时更依赖扬声器发出声音来完成「最后一米」的位置确认。 (图源:苹果) 除了小米,「Tag」市场还有谁? 2021年春季苹果发布AirTag后,越来越多人开始关注起蓝牙追踪器这类配件产品。随后,其他手机品牌也纷纷加入到与苹果的竞争中,推出了自家的蓝牙追踪器产品。 大部分情况下,这些Tag类产品功能和AirTag基本一致,但价格往往更有优势,而且兼容性做得不错。借着xiaomi Tag的登场,我们不妨来一起盘点下当前市场上的主要追踪器配件。 华为:鸿蒙专属防丢精灵 2022年7月的夏季新品发布会上,华为推出了自家的追踪器产品HUAWEI Tag防丢精灵。这款产品把小巧做到了极致,重量只有6克,厚度仅为5.6mm,外观是「圆角三角」的设计,辨识度挺高。它支持NFC功能,通过蓝牙定位。HUAWEI Tag主要兼容自家的国行版智能手机和平板电脑,设备系统版本需要在鸿蒙2.0.0.230以上,尚不支持其他品牌。 (图源:华为) 三星:比苹果更早的SmartTag系列 很多人不知道的是,三星旗下的蓝牙追踪产品发布时间比苹果还早了三个月。2021年1月,三星在S21系列的全球发布会上带来了首款追踪器产品SmartTag。以现在的眼光来看,SmartTag没那么小巧,厚度接近1厘米,黑色配色看起来不是特别精致。而且SmartTag只支持三星自家的手机,和其他安卓机不兼容。AirTag推出后,三星紧接着发布了SmartTag+,主要升级是加入 UWB支持,在定位查找功能追平了苹果。 2023年10月,SmartTag2发布,外观设计有很大的变化,更小更薄了,还有黑白两种颜色版本。SmartTag2镂空出了一个金属镶边的圆环,方便串到钥匙圈上,整体也精致了很多。SmartTag2支持UWB,兼容三星其他带UWB功能的手机,加入了省电模式,最长续航700天。另外,它还支持IP67级别的防尘防水。 (图源:三星) SmartTag2定价29.99美元,挺有竞争力的,只是它还是只支持自家的查找系统。要注意的是,目前SmartTag系列还没有国行版,海外版还不兼容国行版三星手机。 联想:Moto Tag,完美兼容谷歌 2024年6月,联想旗下的摩托罗拉发布了Moto Tag。它采用了圆形外观,和摩托罗拉的圆形logo相得益彰,美观度和辨识度拉满。Moto Tag支持蓝牙6.0和UWB,拥有IP67级防尘防水,更关键的是完美兼容谷歌查找系统。理论上,只要是搭载了Google Play服务且支持UWB的安卓机,都能愉快地用上这款追踪器。Moto Tag定价29.99美元,对海外用户很有吸引力了。 今年1月,摩托罗拉推出了Moto Tag2,相比一代产品进行了小幅升级,主要是支持蓝牙6.0,定位精准度提升,同时防护等级提升到IP68。Moto Tag2的价格仍然是29.99美元。 (图源:联想) 配件品牌:巧妇难为无米之炊 手机厂商之外,配件品牌也盯上了蓝牙追踪器这个慢慢火起来的细分品类。倍思、安克等品牌都推出过相关的产品,比如倍思2023年发布的T2 Pro智能防丢器,外观设计、参数都和手机品牌的同类产品别无二致。 但是,这款防丢器应用场景更多强调的是「防丢」,而非追踪。倍思官方宣传的防丢器功能是它离开用户超过一段距离后,设备会发出警报声。这款产品需要通过蓝牙和手机app连接,一旦断连就无法定位找回,这和手机品牌推出的追踪器有很大不同。 (图源:倍思) 安克子品牌Eufy在海外推出了追踪器配件SmartTrack系列,它主要适配苹果查找系统,能够在苹果设备上添加。不过,它没有UWB芯片,定位查找的精准度和AirTag相比还是有一些差距。另外,绿联等配件品牌也发布过类似的产品,基本都是拿到苹果的认证,兼容苹果查找系统,安卓机也能用,但功能会有限制。 相比手机品牌,配件厂商做追踪器最大的限制在于它们无法利用海量的手机设备网络,需要依赖手机厂商的配合,否则追踪器也会缩水成「离线报警器」。 便携、长续航、精准定位,追踪器不可能三角如何实现? 蓝牙追踪器这类小配件得到关注,基本是AirTag发布后的事情。当然,在苹果加入前,市面上已经有不少追踪器类产品。就拿手机品牌来说,2014年发布的HTC Fetch就是类似的蓝牙防丢器;差不多同一时间诺基亚带来了Treasure Tag,它支持蓝牙和NFC芯片,通过WP7系统上的App来连接。这两款追踪器技术原理、形态已经和AirTag很相似了,而苹果能重新激活这个品类,多做了很关键的一步。 (图源:诺基亚) AirTag最核心的功能就是离线定位查找。理论上说,一款设备脱离我们的视线、与手机断连后,要再次定位和查找就需要设备本身具有独立的定位和联网功能。按照传统思维,我们就得给追踪器装上用于定位的GPS和蜂窝网络。但这样一来,追踪器的体积重量都会大幅增加,功耗也会变得非常夸张。 小雷在浏览电商平台发现,很多高端定位的宠物监测定位项圈,都是采用4G网络+GPS+WiFi组合式手段定位,能实现实时且精准。当然,代价就是定位设备略显笨重,续航大幅降低,同时价格变高。 (图源:淘宝) AirTag则用了另一种手段来解决这个问题,AirTag和外界唯一的联系方式就是蓝牙,它无法直接和远在天边的用户的苹果设备连接,但可以把附件的陌生人的苹果设备作为中继,从而访问苹果服务器,再间接触达失主。这个过程,就是AirTag——附近路人苹果设备——苹果服务器——失主苹果设备。 (图源:雷科技制作) 这个连接过程能成立,前提是市面上已经有海量的激活的苹果设备,无数台iPhone能成为为苹果所用的中继器。尽管如此,AirTag还是存在局限性,如果它丢和附着的物品一起丢在了人烟稀少的野外或乡村,附近没有可控借力的联网苹果设备,那么就石沉大海,几乎没有定位找回的可能性。 但不管怎么说,苹果还是通过这种巧妙地手段,成功让便携、长续航和精准定位这三个互斥的不可能三角同时实现了。 AirTag的技术原理不复杂,既然苹果能成功,安卓理论上也能复刻。海外市场上,作为安卓主理人的谷歌牵头升级了查找中心App,通过Google Play服务网络将海量安卓设备纳入其中,变成可以为安卓版追踪器服务的中继器,让安卓用户获得一样的体验。 (图源:谷歌) 只是,谷歌自己没有去做Tag产品,但支持了摩托罗拉等厂商。而且,苹果和谷歌在完善追踪器网络上达成了合作,目前AirTag、Moto Tag等产品都能相互利用对方阵营的联网设备来协助定位。而最近在海外发布的xiaomi Tag,查找定位的原理和场景和Moto Tag基本是一致的。 只是,国内市场上,安卓阵营要实现追踪器产品的相互协作,难度要更大一点。当然,国行版xiaomi Tag可以选择只依托小米自家设备来实现联网和定位,只是效率会稍微低一些。 总体而言,AirTag这类便携追踪器在价格、体验和功能等方面实现了比较好的平衡,已经是最能被大众接受的产品类型。随着小米等国产品牌的加入,国内安卓版Tag也会得到更多发展。 而且,未来小米、OPPO、vivo等品牌也可以参照互传联盟的模式,联合打造出新的「Tag联盟」,互相兼容对方的查找系统,那么对应的安卓用户们,就能获得更好的体验,这对整个行业来说也会是件好事
单机96路OpenClaw!元脑x86服务器首发智能体宿主机性能评测报告
OpenClaw从个人AI助手走向企业数字员工,正成为中小企业提质增效的AI利器。然而,在企业部署OpenClaw的实际过程中,其作为多Agent调度平台,部署效率、并发性能和数据安全合规等问题也随之出现。 围绕OpenClaw支撑多Agent的场景,浪潮信息基于元脑x86服务器完成系统级压力测试与工程验证,正式发布业界首份智能体宿主机性能评测报告:在192核/384线程高密度算力配置下,元脑x86服务器单机可稳定运行96路Agent实例,并支撑数百路并发业务会话,支持DeepSeek、Qwen、Kimi等主流Agent基座大模型调用,满足企业级多用户、多任务场景的实际需求,同时支持一键式配置镜像导入,为企业提供快速部署、高效稳定的算力底座。 OpenClaw企业部署需求火爆,但模型跑得动Agent带不动 随着AI智能体从技术演示走向规模化应用,企业私有化部署需求持续升温。OpenClaw凭借多任务调度与自动化能力,成为AI领域的24小时“数字员工”,但在企业私有化实际部署中却面临一系列问题: 模型跑得动,百路Agent带不动。随着Agent深入企业日常办公、财务、研发、供应等各个环节办公场景,模型调用和工具调用次数高速增长,千亿甚至万亿参数大模型的硬件算力昂贵,处理Agent计算存在资源浪费且会出现性能瓶颈。一个完整的 Agent 任务,需要经历任务解析、规划决策、工具调用、结果整合等多个阶段,其中大量工作发生在模型之外,对 CPU 并发调度、上下文切换、生态成熟度等能力提出了更高要求。在IT预算整体受限和降本增效压力加剧的背景下,企业必须考虑底层架构选型与性能优化,保证系统的执行力、稳定性与并发上限。 智能体平台部署效率低。OpenClaw部署是企业私有化落地智能体面临的又一难题。其本地部署并非简单安装软件,一般需要IT管理人员手动安装Docker、OpenClaw等工具,连接基座大模型,管理人员需为Agent设置繁琐的环境变量,极易出现依赖冲突、构建失败、版本不兼容或模型无法调用等异常。对于非专业运维人员,常常会陷入反复排错与重复部署的循环,导致整个部署周期长,影响AI业务上线速度。 数据安全与合规保障难。企业级AI应用涉及敏感数据,包括客户信息、财务数据、研发资料等商业机密信息,这些数据在OpenClaw的处理流程中需经历输入、处理、输出和存储多个环节,私有化部署必须确保数据在每个环节都得到充分保护,且数据不出企业。而且OpenClaw针对每一个用户的运行环境、数据存储都必须是独立的,保证服务器部署 OpenClaw 架构的安全性和可控性。更为复杂的是,未来多智能体架构意味着数据可能在多个容器、多个进程间流转,每个数据交换点都可能成为安全漏洞。企业需要建立完善的数据流向监控体系,实现细粒度的访问控制,包括基于角色的权限管理、最小权限原则的实施,以及完整的操作审计追溯能力。 元脑x86服务器,单机支撑96路OpenClaw并发 OpenClaw作为多Agent调度系统,其并发能力高度依赖整机的多核并行、I/O架构与资源隔离能力。浪潮信息基于元脑x86服务器,通过穷举CPU和内存的限制组合,实测确认容器最低配置为4vCPU+4GB内存。依托192核/384线程的高密度算力,结合x86服务器成熟的虚拟化与容器生态,元脑x86服务器在多核调度、NUMA感知、资源隔离及I/O协同方面实现单机稳定运行约96路Agent实例,并可支撑数百路并发会话,该能力已在大规模生产环境中得到充分验证。 高密度算力配置,单机稳定运行近百路Agent实例。元脑x86服务器依托192核/384线程的高密度算力,结合x86服务器成熟生态环境和调优工具,实现单机稳定运行约96路Agent实例,支持数百路并发会话。同时,通过在BIOS中精准调优Latency Optimized Mode(enabled)、Page Policy(adaptive)与Sub-Numa Cluster(enabled)等核心参数,元脑x86服务器显著降低内存访问延迟。 不同CPU和内存组合的容器测试结果 测试表明,OpenClaw在低核环境下错误率显著上升,而达到企业级配置后,系统可实现7×24小时稳定运行,内存增长可控,复杂工具调用场景下未出现崩溃。 如下是元脑x86服务器部署OpenClaw的容器列表、运行状态与执行结果: 图1 容器建立 基于单台192核的x86服务器,成功部署96个容器,为每路Agent提供独立执行环境 图2 容器运行状态 展示各容器CPU、内存、网络I/O等资源使用情况,所有容器均正常运行 图3 Agent任务执行结果 每个容器并发执行任务,每个任务输入约200 tokens,全部成功完成 OpenClaw 在 Agent 场景下的关键系统特征(实测) 基于实测数据,元脑x86服务器为渠道伙伴和企业用户提供快速配置方案和优惠价格,中小团队仅需单台高核心数服务器即可满足百路Agent需求,中大型企业可通过多机扩展灵活支撑,所列产品均为完整配置并可即刻发货,助力用户快速部署落地OpenClaw智能体应用。 企业私有化部署OpenClaw推荐配置 一键式配置导入,方便渠道伙伴和客户快速部署OpenClaw。在x86服务器上部署OpenClaw需要经过容器构建、源码克隆和配置本地模型三个步骤,例如构建容器需要配置CPU、内存、磁盘、网络、端口等参数,保证每一个实例使用独立的 profile、state、config、workspace 及端口;源码克隆并配置MODEL_PROVIDER、Channel 、API_KEY、Skills、Hooks等繁多环境参数,保证OpenClaw连接大模型、可运行、开启高级功能等。浪潮信息将这些参数设置打包成一个配置镜像,渠道伙伴和客户无需逐一处理容器参数设置与模型连接、功能启用等繁琐步骤,即可快速完成OpenClaw的部署,有效避免因参数遗漏、前后配置不一致等问题导致的部署失败,显著提升部署效率与准确性。 容器化隔离,支持多用户安全隔离。在安全层面,用户可通过元脑x86服务器离线部署,确保数据100%留存在企业内部。并且该产品在多租户环境中,采用“一用户一实例”的部署方案,为每位用户独立部署一个OpenClaw实例,每个OpenClaw实例均具备独立资源、独立存储与独立网络端口,实现会话记忆、文件空间与运行状态的逻辑与物理双重隔离,确保不同Agent用户间互不干扰且安全可控。即便容器里的程序被恶意利用,容器都有独立的用户空间和文件空间,也无法直接影响宿主系统或其他容器。 AI Agent正在从“工具”走向“基础设施”。企业真正需要的,不只是能跑的Agent,而是一个在工程层面确定性足够高、并发能力清晰可控的智能体运行底座。 元脑x86服务器凭借高密度算力配置、成熟的虚拟化与容器生态,以及对复杂Agent负载的工程级验证,为企业级部署OpenClaw提供了稳固可靠的业务基石,助力企业将 AI 从“技术探索”真正转化为“可持续的业务能力”。
AI甚至开始抢土木老哥的工作了
新智元报道 编辑:peter东 【新智元导读】即便是像土木,建筑这样的传统行业,也受到AI的冲击。从帮助记录工程日志的智能体,到记录了老工人经验的安全智能体。AI正在建筑行业,让有经验的工人们获得数字永生。 2026年,美国建筑业全行业短缺34.9万名技术工人,41%的现有劳动力将在5年内退休。 这些在工地上摸爬滚打几十年的「活字典」,即将带着无法计量的知识离开。 如何保留即将消失的「经验库」? 建筑业的答案正在迅速转向:用AI克隆老师傅,用智能体替代部分人力。 建筑业管理软件提供商Procore在2025年推出了多款AI智能体。Log Agent(日志智能体)能够实时将语音转为结构化日志。 建筑工地上,工地现场总监一边开车巡视工地,一边对着手机说话。他不必回到办公室,也不必面对电脑屏幕。工地管理者的时间,有30%被文书工作占据,而AI正在解放这部分生产力。 佛罗里达州的Kaufman Lynn建筑公司则使用编制Procore的智能体编写月度进度报告。 之前,这个工作需要翻阅近12个不同工具的数据,耗时6-8小时。现在,他们用Procore技术构建的智能体,能自动提取、格式化并生成报告,整个过程只需几分钟。在这里,AI扮演了协同连接者,它打破设计、施工、运维之间的信息孤岛。 过去,项目经理要找到「3号会议室防火墙的防火等级要求」,可能需要翻阅几天文档。Procore的Assist工具正在改变这一现状。 它像是一个「建筑领域的ChatGPT」,能够理解自然语言问题,并在海量文档中秒级找到精确答案。这种能力背后,是大语言模型对专业知识的深度理解。 而Agent Studio将允许用户无需编写代码即可定制 Agent 以满足其独特的项目需求。 这款工具使承包商能够为其业务定制 AI自动化工具,这将开启一个手动流程被可信赖的定制 AI 代理替代的新效率时代。 用AI「克隆」30年工龄的老工长? 建筑公司Skanska面临着一个行业内普遍存在的难题:一批建造了无数体育场的资深专家即将退休,他们脑中积累的数千个安全决策案例、数万小时的现场经验如何传承? 对该问题,Skanska决定建立了一个AI安全智能体,这个智能体接受了三重训练: 政策与程序库:数千份由资深安全领袖创建的正式文档 最佳实践集:成功项目中的具体操作案例 决策逻辑链:专家们在面临具体问题时的思考过程和反馈 「我们已经有非常完善的机制来捕获整个业务中项目团队的成功故事、最佳实践和经验教训,因此生成式AI成为我们解锁这些知识的新方式。」Skanska前期建造高级副总裁Will Senner解释道。 AI智能体能新员工将数据转化为可操作的洞察,当新员工面对类似安全问题时,AI能像老师傅一样提供建议。 这相当于在构建一个永不退休的数字导师。 历史上,建筑业中的从业经验多只存在于那些经验丰富的员工的头脑中。AI的引入倒逼行业进行知识管理的系统性变革。 现在,公司必须「与专家坐在一起,请他们让这些数据对系统和其他员工更加可见」。这个过程,实际上是在将隐性知识显性化,将个人经验系统化,将偶然成功可复制化。 从「进度追踪」到「人才匹配」, AI重塑建筑全链条 国际数据公司(IDC)的调查揭示,欧美60%的建筑公司已在某种形式上使用AI,不过主要集中在大型企业。IDC分析师Jeff Hojlo表示,许多较小的建筑供应商仍在进行数字化改造,几年前才刚刚转向云端。 除了AI智能体,还存在着一个包含更大范围的,正在快速形成的建筑AI生态矩阵。 AI Clearing和OpenSpace利用计算机视觉技术,通过无人机航拍和现场图像,实现对工地进度的毫米级追踪。有了基于视觉数据的精确计量,哪个区域浇筑延迟了?哪部分钢结构安装进度落后?系统就能自动识别并预警。 另一家初创公司Skillit正在用AI解决建筑业的「人岗匹配」难题。 建筑工人的技能千差万别,有的擅长钢结构,有的精通混凝土浇筑;项目需求也各不相同——数据中心需要防静电专家,医院建筑需要洁净室专家。 Skillit的AI能理解技能与需求的微妙匹配,将合适的工人快速匹配到合适的岗位,减少「有活没人干,有人没活干」的结构性矛盾。 Procore最新推出的Insights解决方案代表了AI在建筑业的另一个方向:从「事后记录」到「事前预测」。 该系统能分析项目中的提交材料与日志,基于历史数据预测潜在风险,并推荐缓解措施。这就像为项目经理配备了一个「风险雷达」,在问题发生前就能看到预警信号。 现场安全员拍下一张脚手架照片,上传到Procore Assist的Photo AI功能。系统能在几秒内分析出:脚手架是否缺少必要的横杆?安全网安装是否符合规范?是否存在材料堆放不当的风险? 一图胜千言,AI的引入将安全检查从「定期巡检」升级为「持续监控」。 下一次当你路过建筑工地,看到的可能不只是钢筋水泥,还有一个由数据驱动、由智能体协调、由人类与机器协同建造的未来正在从蓝图变为现实。 建筑行业该如何拥抱AI 上述工具,都来自欧美,而国内建筑行业对AI的使用,大多与设计相关,缺少能在工地使用的,专注安全和管理的垂直类AI工具。 在建筑行业人力成本占比变大,工人老龄化的现实下,国内也需要有类似的工具,来帮助土木建设从业者更安全,更高效地确保建筑质量。 建筑行业的传统是「眼见为实,经验为王」。 一位有着30年经验的工长,很难相信一个「算法」能比自己几十年的现场经验更可靠。这种基于经验的信任与基于数据的信任之间的鸿沟,是AI在建筑业普及的最大障碍。 AI的能力取决于数据的质量。建筑现场的数据往往是不完整、不一致、非结构化的。如何将手写笔记、模糊照片、口头指示等转化为AI可理解的「干净数据」,是构建建筑业AI工具所必需的前期投资。 未来,随着全项目生命周期的智能决策,AI将能跑通安全审计全流程。实现工作流的端到端自动化。 AI甚至将能基于历史数据预测项目延误概率、优化资源分配、自动协调设计与施工矛盾。这意味着建筑业也将迎来「数字孪生」,在实际动工前,在虚拟世界中完成项目的模拟、优化和问题解决。 但无论如何,AI智能体不是用AI取代工人,而是在增强工人。 无论哪种智能体,其定位一直是「副驾驶」,它会处理重复性任务、提供决策支持、进行风险预警,但下最终的判断的权责仍然在人类手中。 土木老哥的工作没有被抢走,他们只是得到了一群不知疲倦、过目不忘、全天在线的硅基助手。
车内清一色大屏快看吐了!新国标拟增加汽车实体操纵件相关要求
快科技2月15日消息,据新华社报道,工业和信息化部装备工业一司组织全国汽车标准化技术委员会开展了《汽车操纵件、指示器及信号装置的标志》强制性国家标准的修订,已形成征求意见稿,近期公开征求意见。 文件明确提出转向信号灯开启/关闭、车窗升降、组合驾驶辅助系统激活等应装备实体操纵件,具体来看: 灯光类:转向灯、危险警告灯(双闪)、喇叭; 挡位类:P/R/N/D 挡(禁止纯屏幕换挡); 驾驶辅助:组合驾驶辅助系统(智驾)激活开关; 安全/应急:雨刮、除霜除雾、车窗升降、紧急呼叫(AECS)、电动车断电开关。 同时还公布了实体件技术要求(关键细节),如尺寸(有效操作面积≥ 10mm*10mm)、可用性(固定位置、可盲操、有触觉/听觉反馈)、可靠性(车机死机/断电时,基础功能仍可用)。 据悉,本次修订新增实体操纵件类型和技术要求,旨在提升行车安全,保证行车过程中关键操纵件可达、可用、基本可盲操,使驾驶员不过分依赖视觉即可感知操纵件的触发结果,减少显示屏造成的分心,进一步保证操纵件的可靠性和操作的有效性。 征求意见中,预计2026年7月1日起对新生产车辆强制执行,但已售车型无需整改,正常使用即可。
春晚首用手机竖屏直播,央视官宣华为Mate80系列接入广播级系统
IT之家 2 月 15 日消息,中央广播电视总台春节联欢晚会官方微博宣布,将首次使用手机竖屏直播,华为 Mate 80 系列机型拍摄的舞台画面接入广播级系统,参与竖屏直播信号制作。 华为 Mate 80 系列手机此次影像相较前代提升较大,参考IT之家此前报道,去年 12 月举行的鸿蒙星光盛典就曾使用 13 台搭载了鸿蒙系统的 HUAWEI Mate 80 系列手机,全程参与盛典全要素彩排的竖屏录制。结合此次春晚安排来看,彼时的 Mate 80 录制《鸿蒙星光盛典》或为今年春晚直播的预演。 去年 11 月,华为 Mate 80 系列手机的影像首秀。华为终端官方在微博分享了第 38 届中国金鸡百花电影节宣传片暨开幕短片 ——《奔赴光影》,该片由第 38 届金鸡奖最佳导演 @戴墨Damon 执导,使用华为 Mate 80 系列拍摄。 另外,本月早些时候(2 月 5 日),华为终端官方提前数小时放映了马年新春贺岁手机电影《木马》,本片时长 9 分 50 秒,也是全程用 Mate 80 系列手机拍摄。 作为参考,华为 Mate 80 系列手机发布于去年 11 月,支持 5A 速度,首发麒麟 9030 / Pro 系列处理器、第二代红枫影像。其中,华为 Mate 80 Pro Max 搭载 17.5EV 超高动态主摄(5000 万像素 1/1.28" 大底 F1.4-F4.0 十档可变光圈 RYYB)、超广角摄像头(4000 万像素 F2.2 RYYB)、4x 光学微距长焦(5000 万像素 F2.1 大光圈 OIS RYYB)、6.2x 光学超长焦 + 12.4x 光学品质变焦(5000 万像素 F3.2 OIS RYYB)。
几天手搓的Claude Code拓麻歌子火了:成本几乎为0,一句话做硬件时代来了
1996 年,一家日本公司推出了 Tamagotchi(电子宠物)。这个小小的蛋形塑料设备风靡全球,成为一代人的童年记忆。 1997 年,拓麻歌子(Tamagotchi)还让它的创造者日本万代公司,获得了当年的搞笑诺贝尔经济学奖,而原因是, 他们创造了人类供养虚拟宠物的新型经济模式,成功转移了数百万人的工作时间,用于饲养虚拟宠物。 去年八月,万代公司表示,拓麻歌子从 1996 年以来,产量已经达到了一亿台。在那个时代,生产一款这样的产品,大概需要一个工业设计团队、需要电子工程师设计电路板、需要长达一年的开发周期…… 2026 年,一个开发者用 AI 做了一个 Tamagotchi。他需要的只是一台电脑和 Claude Code。成本接近零,开发周期可能只有几天。 这个最新的 Claude Code 版拓麻歌子,最近在 X 上吸引了一大波网友的关注。 ▲视频来源:https://x.com/SamuelBeek/status/2022614292411940897 网友把命令行里面跳动的 Claude Code 符号,转到了能够触摸得到的、随身携带的拓麻歌子上。当 Claude Code 在命令行里面思考,或者是问,是否同意执行下面的步骤时,手里的拓麻歌子都会弹出消息来,指示我们下一步操作。 电子宠物成精了,还会拦截 Bug 和以前那些 AI 硬件的逻辑不同,Claude Code Tamagotchi 不是一味的把大模型放到布娃娃、手表、闹钟、书包、甚至是马桶里。 这个 Claude Code 拓麻歌子要做的是一种转移,一种无法被替代的存在。 目前已经有多款不同的 AI 拓麻歌子小玩意,其中关注度最高的由开发者 Ido Levi 创建的 Claude Code Tamagotchi。 ▲视频来源:https://www.instagram.com/reel/DUMAlN7Dpx7/ 乍一看,它就是一只住在终端里的像素风格宠物。有一些简单的表情、有状态、还会对用户的行为做出反应;但它不是一个简单的怀旧游戏。 当我们在用 Claude Code 编程时,放在桌子边上的这只宠物,会一直在你的终端界面中显示。它在观察 Claude Code 的每一个操作,确保这个 AI 助手真的在按照我们的意图工作。 如果 Claude Code 表现良好,宠物会开心地摇尾巴。如果 AI 开始不听话,比如未经允许重构代码,或者修改了你明确说不要动的文件,宠物会变得暴躁,甚至会直接中断 AI 的操作。 ▲项目地址:https://github.com/Ido-Levi/claude-code-tamagotchi 目前,Claude Code 拓麻歌子这个宠物项目,已经在 GitHub 上开源,我们也可以直接把这个电子宠物部署到自己的 Claude Code 里面。它具体是如何工作的呢,根据作者对项目的介绍,举几个例子来说明一下。 项目主打的就是「实时监控」,当我们直接对 Claude Code 说,「只修复这个 bug,不要动其他文件。」 Claude Code 开始工作,终端里的宠物睁大眼睛盯着看。几分钟后,Claude Code 完成了修改,只改动了目标文件。 这个小宠物就会开心地摇尾巴: (◕‿◕)。 而当这个小宠物检测到违规时,他还能发出「违规警告」。我们明确告诉 Claude Code 说,不要重构,保持代码原样。但 Claude Code 还是开始重构整个模块,可能它觉得这样代码会更优雅。 这个时候,电子宠物的表情变了: ;屏幕上还会显示,「 警告:AI 正在违背你的指示」。 除了提示,它也能实际的做一些越界拦截之类的工作。比如我们给出的指令里面非常明确的提到了,千万不要动数据库。Claude Code 在修复一个相关 bug 时,尝试修改数据库。 小宠物就会立即中断: 操作被阻止。Claude Code 的操作被拦截,我们的数据库安然无恙。宠物露出得意的表情: 。 这种从软件到硬件的交互,也让我想到了我们之前分享的 Vibe Coding 小键盘。 这几天,在 X 上还有一个硬件版 Cursor 特别火。目前的 Cursor 是专门用来开发软件产品的工具,而这个 Cursor for hardware 就是用来实现,一句话做一个硬件设备。 ▲ 为硬件开发设计的 Cursor,地址:https://www.schematik.io/ 网友 marcvermeeren 就用这个工具,搭建了一个叫做 Clawy 的可爱小助手,用来管理他的 Claude Code 对话。 还有网友 dspillere 也做了一个类似的产品,他说虽然已经部署了 OpenClaw,但他完全不知道 OpenClaw 什么时候在思考,什么时候在执行任务。这个小巧的桌面助手就应运而生,放在他的桌子上,可以实时的更新 OpenClaw 的最新信息。 ▲视频来源:https://x.com/dspillere/status/2018752036968304660 在评论区里,大家都在问什么时候发货,可以去哪里买。也有人说,这是一个全新的领域,我们一直在关注人的状态,关注人类的电子使用记录,是时候应该关注 Agent 的情况了。 ▲Agent 的物理反馈是一个被严重低估的用户体验问题 软件开发的 AI 红利,终于轮到硬件了 去年,我们还在想 AI 最好的软件载体是什么,是大家都在做的对话框,还是连 OpenAI 都一窝蜂涌进去要重做的浏览器,但最后证明都不是,今年 OpenClaw 的爆火,证明了 AI 在软件上,最终的归宿就是 Agent。 关于硬件的讨论就更不用多说,光是今年 CES 上那些让人哭笑不得的发明,就能看到 AI 硬件这块还是个巨大的未知数。 如果说 Agent 的成功是靠着「人人都能做软件」慢慢成长起来的,那么 AI 硬件也会在「人人都能做硬件」里面,不断沉淀。 ▲Schematik 的发起人 Samuel Beek,现为 VEED.io 首席产品官 像 Schematik 这类工具已经设计出来,用来帮助我们更快开发 AI 硬件。它把硬件设计变成了和网页开发一样,我们只需要用自然语言描述硬件需求。告诉 Schematik 想要构建一个「带温度传感器和 OLED 显示屏」,不需要查阅各种数据表,不需要引脚编号、元件代码或任何的手动查找。 过去,如果我们想做一个简单的「温湿度监测器」。需要做的是, 搜索传感器型号,下载 DataSheet。 确认引脚定义(VCC 是接 3.3V 还是 5V?接反了直接冒烟)。 寻找对应的驱动库,处理版本冲突。 在 Arduino IDE 里写代码,改 Bug。 而 Schematik 的出现,把这个过程极简化成了「一句话的事」。几秒钟后,Schematik 会吐出我们需要的一切。完整的、通过验证的固件代码;一份清晰的接线图;分步组装指南。 它生成的接线图,清晰地展示了每一根线该从哪里接到哪里,解决了新手最大的恐惧,「我这根线接对了吗?」。一键部署的功能,更是一步到位,它能直接生成基于 PlatformIO 的工程文件,直接导入。 PlatformIO 是一个强大的嵌入式开发生态,我们可以直接在 Schematik 里点击「Flash」,固件就会被编译并烧录进板子里。从「我想做一个东西」到「这东西跑起来了」,中间可能只需要不到一分钟。 前段时间,Claude 发布的 Cowork 以及相关企业级 AI 插件重挫软件股,直接蒸发人民币约两万亿。以前我们想要一个 P 图工具,需要去应用商店搜索下载安装,现在,一句话自己都能做一个。 但 Claude Code Tamagotchi 这类产品的出现,还有硬件版 Cursor,让我们不得不怀疑,硬件开发的「Cursor 时刻」是不是也要来了。 未来的硬件开发,或许也会变成,只需要我们提供「创意」和「逻辑」,剩下的脏活累活,无论是写代码还是画电路图,都将由 AI 代劳。 也许这样的未来不会很远。但更重要的是,在这个时代,动手能力的定义已经变了。 以前动手能力强是指一个人会焊接、会画板子、会写代码;以后,动手能力强,是说他擅长用 AI,从从容容、游刃有余地指挥原子和比特为他起舞。 我已经想到了,下一个爆火的 AI 硬件,甚至可能会是一个挂在包上的 OpenClaw 版 Labubu。
开年狂甩两“王炸”,张一鸣在下一盘大棋
雷达财经出品 文|丁禹 编|孟帅 2026年开年,字节跳动接连放出“王炸”消息。 在大模型领域,字节近日推出AI视频生成模型Seedance 2.0。在内测期间,这款可根据文本或图像创建电影级视频的模型,便凭借令人惊艳的表现刷屏互联网。 在硬件层面,有消息称,字节拥有一支规模超千人的自研芯片团队,其自研芯片目前已形成四大产品线:AI芯片、CPU、VPU、DPU。 事实上,在当下风头正盛的AI热潮中,全球各头部大厂都在持续加码投入,一场围绕AI的激烈争夺战已然打响。 在这场没有硝烟的战争中,字节跳动作为不可忽视的重要参与者,在预算投入上毫不吝啬:2024年,公司为AI投入800亿元;2025年,其资本开支预计可达1500至1600亿元;2026年,字节更是计划再次豪掷1600亿元,用于AI业务的发展。 据此粗略估算,短短三年时间,字节在AI领域的投入预计将达到惊人的4000亿元,投资规模直追中型地级市一年的GDP。 在AI业务方面如此巨大的投资力度,也让字节在资本市场上备受青睐。去年11月,“风投女王”徐新掌舵的今日资本以3亿美元重金购入字节股份,字节的估值借此被抬升至4800亿美元(约3.4万亿人民币)。 天眼查显示,张一鸣于2012年创办字节。而在字节估值再创新高之际,张一鸣也迎来了身家的大幅增长。 在去年10月出炉的《2025胡润百富榜》上,张一鸣以4700亿元的财富高居榜单第二,身家较上年上涨34%。 先对标再超越!Seedance 2.0火爆全球 不少网友对生成式视频AI的初印象,或始于2024年2月OpenAI发布的Sora。 仅通过简短或详细的提示词描述,或一张静态图片,Sora就能生成类似电影的逼真场景,涵盖多个角色、不同类型动作和背景细节等,最高能生成1分钟的1080P高清视频。 Sora的出现,在当时颠覆了人们的想象,不少人称2024年是“AI视频生成元年”。 大半年后,字节跳动的类似模型才姗姗来迟。2024年9月,字节发布PixelDance和Seaweed,这两个模型分别由字节当时的AI Lab团队和Seed团队分别开发,但相比老对手快手打造的可灵AI晚了3个月。 直到2024年11月,PixelDance和Seaweed才在字节跳动旗下的视频生成产品即梦上线,面向平台用户正式开放。 2025年,随着AI视频模型赛道的“战火”持续升级,OpenAI的Sora 2和谷歌的Veo 3等产品悉数登场。 面对对手们发起的攻势,字节也不甘示弱。同年4月,字节将AI Lab团队并入Seed团队。 次月,字节把PixelDance和Seaweed进行整合,推出视频模型Seedance 1.0 lite。团队和产品的进一步整合,让字节在视频生成大模型上进一步按下加速键。 6月,字节发布Seedance 1.0和Seedance 1.0 pro模型,可支持文字与图片输入,生成多镜头无缝切换的1080P视频,并将生成时间大幅缩短。 去年12月,Seedance 1.5 pro正式发布,带来了音画同步输出、多语言多人对白配音等多项先进功能。 仅仅两个月后,字节打造的Seedance 2.0又凭借其炸裂级的AI视频生成能力,彻底引爆海内外互联网。 与此前版本相比,Seedance 2.0的生成质量有了大幅提升,其在复杂交互和运动场景下的可用率更高,物理准确度、逼真度、可控性显著增强,更加贴合工业级创作场景的需求。 有网友评论称,“这光影、这运镜、这音效……在它面前,Sora简直像个上个时代的玩具!” 面对Seedance 2.0在全球范围内引发的这场技术海啸,就连科技界大佬、全球首富马斯克也被其深深震撼,引得他在社交平台转发评论Seedance 2.0相关推文,感慨模型发展速度太快。 而Seedance 2.0的惊艳表现,甚至让知名导演贾樟柯都不禁感叹:“Seedance 2.0确实厉害,我准备用它做个短片。” 有趣的是,就在大半年前的“青葱计划”电影大师班上,贾樟柯还曾表示,目前AI无法完全取代传统电影拍摄手法。 此外,多位美国导演在使用Seedance 2.0制作短片后也都发出了惊叹。导演查尔斯·柯伦发文称,他借助Seedance 2.0为从未面世的游戏真人电影制作了一版预告片,只用了20分钟、花费60美元。 导演安德鲁·奥莱克发布了一条不到30秒的短片,内容是一个坐着轮椅的小男孩在树林滑落到水中的视频,整个视频节奏紧凑,像电影里的惊险情节。奥莱克说:“这太不可思议了!只需要一个提示词,Seedance 2.0就能搞定!” “AIGC的童年时代,结束了”,《黑神话·悟空》制作人冯骥更是感慨道:“我很庆幸,至少今天的Seedance 2.0,来自中国”,并用领先、全能、低门槛等词概括了自己初步使用后的感受。 不过,冯骥也表达了自己的担忧。他指出,一般性视频的制作成本将无法再沿用影视行业的传统逻辑,开始逐渐趋近算力的边际成本。内容领域必将迎来史无前例的通货膨胀,传统组织结构与制作流程会被彻底重构。 更令冯骥担忧的是——假视频泛滥与信任危机,“这一点是真正促使我发这条微博的原因,因为逼真的假视频将变得毫无门槛,而现有的知识产权与审查体系会面临空前冲击”。 而好莱坞则联合向字节发起抵制。据媒体报道,代表Netflix、派拉蒙影业、亚马逊米高梅工作室、索尼影视娱乐、环球影业、华特迪士尼影业、华纳兄弟探索等主流制片厂的美国电影协会(MPA),对此提出严正抗议。 MPA指出,Seedance 2.0上线短短一天内,就出现了大规模未经授权使用美国版权作品的情况,要求字节跳动立即停止相关服务。 MPA主席查尔斯·里夫金表示,字节跳动的该行为无视保护创作者权利的版权法,对数以万计的美国影视行业工作岗位造成了威胁。 面对行业抗议之声,字节跳动迅速作出反应:宣布暂停用户上传真实人物图像的功能,并表态将尊重知识产权和版权保护,但此举并未完全打消好莱坞的顾虑。 根据Axios获得的信件副本,华特迪士尼公司已于当地时间周五向字节跳动发函,指控对方在训练和开发Seedance 2.0模型时未经许可使用迪士尼作品,要求字节跳动“停止侵权且不得再犯”。 组建千人自研芯片团队,已形成四大产品线 字节跳动旗下Seedance 2.0、豆包等AI产品所取得的亮眼成绩,背后离不开算力硬件的有力支撑。 据证券时报,此前,字节跳动主要依赖向第三方购买算力资源,但近来公司决定全面布局自建AI数据中心,从基础设施到硬件采购,全部自主掌控。 在资金投入上,字节跳动可谓不遗余力。2024年,其在AI上的资本开支高达800亿元,几乎达到了BAT三家资本开支的总和,后者约为1000亿元。 2025年,字节的资本开支预计将达到惊人的1600亿元,其中约900亿元将用于AI算力的采购,国内计划投入400亿元,国外(主要是东南亚地区)投入500亿元,以构建强大的AI计算能力基础。 其余700亿元则分配给IDC基建以及网络设备如光模块、交换机的招标,国内500亿元,国外200亿元,旨在打造自主可控的大规模数据中心集群。 另据36氪“智能涌现”,此前有消息指出,字节在2026年即将投入1600亿元用于AI领域,其中高达850亿元用于AI处理器的采购研发。 截至去年年底,字节至少已储备了近12万张英伟达卡(A100、A800、H800),另还有近百万片英伟达H20、L20、L40芯片。 此外,字节体系内还储备了大量国产AI芯片,如寒武纪5/6/9系列、晟腾910B/C、海光、昆仑芯等,数量在数万到几千不等。 同时,字节亦想将核心芯片技术攥在手中。据“智能涌现”了解,目前字节的芯片团队整体规模已隐秘扩充至千人以上。 有知情人士透露,字节的AI芯片团队和CPU团队人数较多,其中,AI芯片方向人数过半,达500人以上,CPU团队在200人左右。 2月14日,蓝鲸新闻从知情人士处获悉,字节跳动芯片研发团队将开始规模化招聘,具体招聘城市涵盖北京、上海、深圳等,所需职位包括芯片架构、soc设计等。 同时,“智能涌现”还提到,字节跳动的芯片团队近期进行了架构调整:原芯片负责人、“Data-系统”部技术总监王剑不再分管该板块。 而芯片团队中的AI芯片与DPU团队负责人施云峰、CPU团队负责人余红斌,将直接向公司副总裁、火山引擎业务负责人杨震原汇报。 据悉,字节的芯片业务始于2020年,目前主要分为四大板块——AI芯片、CPU、VPU、DPU。 其中,AI芯片用于豆包大模型推理等;CPU是服务器芯片,用于数据中心的通用计算;VPU(视频处理单元)用于视频解码和内容审核;DPU(数据处理单元)则主要用于数据中心网络的网络和存储优化,比如RDMA等等。 据路透社消息,在隐秘筹备六年后,字节专注于推理任务的AI芯片(SeedChip)计划在2026年3月底前获首批芯片样片,并计划在今年内生产至少10万颗自研AI芯片,并逐步将产量提升至35万颗,代工方或为三星。 据“智能涌现”了解,字节的AI芯片此前已隐秘迭代了三、四代,除了三星,也曾与其他代工厂商接触。 有分析认为,字节跳动自研芯片若成功落地,不仅能有效降低公司算力成本、减少外部依赖,同时还能推动软硬件深度协同优化,从而更好地适配并迭代自有算法体系,进一步强化技术壁垒。 海内外科技巨头,为AI疯狂“烧钱” 字节豪掷4000亿资金重押AI业务的同时,海内外的众多科技巨头也纷纷摩拳擦掌,不惜重金为AI业务“烧钱”。 在去年9月的云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭表示,阿里正在积极推进三年3800亿元的AI基础设施建设计划,并将会持续追加更大的投入。 再将视线转至海外,谷歌公布2026年资本支出计划为1750亿至1850亿美元,几乎是2025年的两倍。 据路透社,包括谷歌、微软、亚马逊、Meta在内的一众科技巨头,今年合计在人工智能领域的投入预计将超6300亿美元。尽管迄今为止,这些投入带来的回报增速,仍落后于支出的增长步伐。 国内互联网巨头腾讯在其最新披露的季报中表示,其在AI上的战略投入,不仅在广告精准定向及游戏用户参与度等业务领域带来助益,也带来了编程、游戏及视频制作等领域的效率提升。 阿里则在最新半年报中表示,云智能集团整体收入(不计来自阿里巴巴并表业务的收入)同比增长28%,主要由公共云业务收入增长所带动,其中包括AI相关产品采用量的提升。 不过,腾讯和阿里这两大互联网巨头,也面临着与海外科技巨头相似的困境。其中,腾讯去年前三季度录得归母净利润1665.82亿元,同比增长16.7%,但增速同比下滑约45个百分点,增长势头明显放缓。 而阿里在2026财年上半年实现归母净利润641.06亿元,同比减少5.92%,增速同比下滑近16个百分点。 对于字节跳动而言,除豆包、即梦等产品积累的大量用户具备在C端转化为付费与增值收入的巨大潜力外,公司旗下的云服务平台火山引擎,也有望在AI浪潮中成为直接受益方,为公司的业务拓展与盈利增长开辟新的路径。 据Omdia发布的《2025全球企业级MaaS市场分析》,截至2025年10月,字节的火山引擎日均Tokens调用量超30万亿,名列全球第三,市场份额达到15%,仅次于OpenAI和Google Cloud。 当前,MaaS服务已成为增长最快、毛利最高的AI云计算产品。截至去年12月,豆包大模型日均调用量已突破50万亿Tokens,较同年10月增长66.7%,相比2024年同期更是增长超十倍。 通过模型结构和软硬件工程优化等技术创新,大模型在提供极高性价比服务的同时,也有着较好的毛利。据火山引擎总裁谭待透露,豆包大模型MaaS的毛利水平远远优于IaaS等传统云产品。 在开年接连放出“王炸”消息后,字节后续能否在AI浪潮中持续保持领先地位?雷达财经将持续关注。
春晚机器人“暗战”:1亿元赌局值不值?
作者丨李玉鹏 编辑丨张丽娟 春节临近,一场硬科技的隐形竞赛也悄然启幕。 回想去年春晚,宇树科技的人形机器人一夜之间火遍大江南北,让公司名声大噪,短短3分多钟的表演“带动”了宇树科技2025年人形机器人出货量超5500台,将公司估值推高到120亿元,这也点燃了整个具身智能行业对春晚舞台的向往。 一年后的今天,独角戏变成了擂台赛。有参与竞标过程的业内人士透露,从去年秋天开始,很多家机器人公司就与春晚导演组展开了多轮接触。据传,单家企业登上春晚舞台的“起步价”已经达到亿元级别,一场机器人版的“我要上春晚”争夺战打响了。 “宇树科技去年上春晚后机器人卖爆了,这是大家抢破头的根本原因。”一位投资人的话道破这场竞争的商业本质。 最终经过激烈角逐,除了宇树科技,魔法原子、松延动力、银河通用三家机器人企业也陆续官宣与春晚达成合作,并且春晚还让各家重新定义了机器人分类:从“机器人”,到“智能/人形机器人”,再到“具身大模型机器人”,它们合作的称号均不相同。 “机器人企业抢着上春晚,既是品牌卡位战,也是对企业的压力测试。”有人从不同角度直指核心。 春晚舞台的吸引力无疑是巨大的品牌曝光,但同时也是对机器人稳定性和协同能力的极端考验,在直播中数以亿计观众目光下,任何微小的失误都可能会被放大,这对机器人企业来说既是展示舞台,更是压力测试。 那为何机器人企业要扎堆竞逐春晚舞台?本质上是对国民级流量入口的争夺,背后牵扯的更是品牌破圈、资本背书与商业化验证的三重博弈。 春晚机器人从科技点缀到“舞台主角” 机器人上春晚并不是什么新鲜事。 早在2012年,哈尔滨工业大学的多台机器人就曾登上春晚表演儿童节目;2016年春晚,优必选的人形机器人与歌手同台演出。在去年之前,“春晚机器人”更多被视为节目里的一种猎奇的“科技点缀”。 直到去年宇树科技机器人那几分钟的表演改变了这种认知,其带来的品牌提升、公众印象扭转和真实的订单转化,让行业意识到:春晚可能是跨越从“技术产品”到“大众消费品”认知鸿沟的最短路径。 去年年底就有传闻称,宇树科技、智元机器人、银河通用、松延动力等不少机器人公司可能“组团”上春晚,每家企业的合作价在6000万到1亿元,独家权益甚至高达5亿元。不过智元机器人很快否认参与竞价,还有多家企业因价格等因素最终放弃。 毕竟,在具身智能行业普遍处于“烧钱”研发阶段的当下,1亿元足够支撑一个顶尖团队数月的模型训练或购买一批关键设备。 在多数机器人公司望而却步时,宇树科技、松延动力、魔法原子和银河通用纷纷官宣了与春晚的合作。 有意思的是,这几家企业虽然同为合作方,但每家获得的称号似乎都经过了精心设计:宇树科技以“春晚机器人合作伙伴”身份亮相,松延动力被冠以“春晚人形机器人合作伙伴”的头衔,魔法原子则是“春晚智能机器人战略合作伙伴”,而银河通用成为了“春晚指定具身大模型机器人”。 乍一看着实让人眼花缭乱,从“机器人”,到“人形机器人”,“智能机器人”,再到“具身大模型机器人”,甚至有人直言“春晚重新定义了机器人的分类。” 尽管都是“机器人”,但前面定语不同,这并非玩文字游戏,而是面向全国观众的一场精准定位展示。在此之前,机器人的分类和定义主要在工程师、学术论文,用的是专业术语,春晚则用大众语言完成了一次对前沿科技的“翻译分层”,曾经笼统的“机器人”概念正借助国民级舞台进行了一次大规模的“认知重构”。 具体到企业,几个字的差别其实是对各自技术路径与商业重点的集中标定。比如,有的强调机器人动作柔顺度更高能完成复杂编舞,有的主打具身大脑优势突出大模型交互能力,还有的将多功能集成作为亮点等等。 这种定义的细化也暗示着机器人正在从“观赏”向“服务”的角色演进。有业内人士猜测,今年春晚登台的机器人将不限于歌舞表演,更有融入家庭或工业服务场景的展示。 因此,看似眼花缭乱的称号,实则是行业从技术攻坚走向市场定义的外在表现,每一个新称号都试图在观众心中锚定一个更具体、更具功能性的未来形象。 可以说,这场春晚舞台的争夺战,表面是技术实力的较量,内核则为对公众认知的锚定,毕竟品牌在春晚这个国民级舞台给出的定位很可能直接影响接下来一年大众的想象与市场的接受方向。 正因如此,各家公司所展示的并非全然是当下最成熟的技术,而是他们最希望让公众看到的“未来切片”。比如,让机器人跳舞是为了直观展现运动控制能力,让其参与语言互动则是为了凸显智能交互水平。这些不同的称号与呈现方式更像一套精心设计的传播策略,在观众心中埋下特定认知的种子。 更进一步,比如,同样看到机器人在春晚舞台上完成高难度后空翻,普通观众看到的是表层的惊艳表演,投资人看到的可能是更深层次电机驱动、实时平衡算法的积累,以及这些技术在工业巡检、灾难救援中的应用潜力。 从这个角度来讲,机器人公司掷重金上春晚,背后其实是一个被验证过的、极具诱惑力的商业逻辑闭环。 而优必选和宇树科技就是典型的案例。优必选2016年首次上春晚后品牌知名度大开,之后又三度登台,展示从机器狗到人形机器人的技术迭代,春晚曝光也加速助推其商业化进程,2023年底登陆港交所成为“人形机器人第一股”,市值一度超过700亿港元。 无独有偶,2021年宇树科技的机器牛“犇犇”首次在春晚完成集群舞蹈;2025年春晚,宇树科技人形机器人扭秧歌,这种“接地气”的表演瞬间点燃全网,尤其是赶上具身智能概念全球爆发,引起的轰动效应也远超往年,堪称“现象级破圈”。 春晚舞台流量和国民级关注度迅速将人形机器人行业推向空前热度,宇树科技一夜成名,其机器人租赁价格一度被炒至2万元一天,甚至出现了一机难求、转售价35万元的奇观。 “现在的具身智能行业和之前的互联网、电动汽车行业很像,头部公司都需要更的‘能见度’。”有投资人指出资本视角下的春晚价值,“春晚带来的‘蝴蝶效应’不只是品牌曝光,高能见度可以让企业获得更多商业尝试的机会,争取到更多政府和资本的支持,进而形成良性循环。” 值得注意的是,今年与春晚合作的几家机器人企业中,除了几位“老熟人”,还有一个“新面孔”——魔法原子,它也是几家企业中最早(1月23日)官宣与春晚合作的企业。 魔法原子成立于2024年1月,是由追觅科技孵化的具身智能机器人公司,两家公司的核心团队均出自清华大学“天空工场”。除了魔法原子与春晚的合作,追觅科技也成为了今年春晚的“智能科技生态战略合作伙伴”。 作为后起之秀,魔法原子成立至今已完成了两轮融资:2024年12月,获追觅科技旗下投资公司追创创投领投的1.5亿元天使轮融资;2025年5月,获禾创致远等数亿元战略投资,目前公司估值约35亿元。关于上市进程,按该公司联合创始人顾诗韬的说法“公司正在按照‘最快的上市时间表’计划推进,期待在今年就能让大家看到公司在二级市场的一些消息。” 就在众多机器人企业对春晚舞台心向往之的时候,也有企业特立独行,比如智元机器人,其表示“不参加2026年马年春晚,原因是预算有限的前提下,将优先保障具身智能技术及产品研发的费用。” 不过,智元机器人虽然不去春晚,但也没闲着,而是自己办了一场“春晚”。2月8日,智元机器人主办了全球首个大型机器人晚会“机器人奇妙夜”,由200多台各种类型的机器人参演,集合了舞蹈、小品、魔术、武术、歌曲、走秀等各种节目类似,被网友称为“机器人春晚”。 春晚舞台之外的漫长赛跑 对于仍在摸索商业化路径的具身智能企业来说,“春晚效应”无疑是一剂强心针。 过去一年,在春晚效应的加持和资本的热捧下,中国具身智能行业融资和估值水涨船高。IT桔子数据显示,2025年整个具身智能赛道融资304起、超379亿元资金涌入,分别是2024年的近3倍和4倍之多。 如果说2025年具身智能融资热潮是“火爆”,那么2026年开年得用“沸腾”来形容,开年以来的巨额融资也接连不断:自变量机器人于1月12日完成10亿元A++轮融资,集齐了字节跳动、阿里巴巴、美团三大互联网巨头;逐际动力在2月2日宣布完成2亿美元(约合14亿元人民币)的B轮融资,京东等产业资本深度参与;北京人形机器人创新中心获得超7亿元的首轮市场化融资,得到地方国资与百度等机构的支持。 此外,未来不远机器人、穹彻智能、白杨智能、大晓机器人等多家企业也宣布获得亿级的资金注入。这股远超去年的融资风暴,无疑为整个行业注入了猛烈的催化剂。 值得一提的是,星海图刚刚完成10亿元B轮融资,估值百亿元,成为国内具身智能行业继银河通用、智元机器人、宇树科技之后又一家百亿“独角兽”。 首先来看目前国内人形机器人估值最高公司银河通用,其估值已达30亿美元(约合210亿元人民币)。 银河通用成立于2023年5月,目前已完成至少5轮融资,其中,2025年6月完成由宁德时代领投11亿元,创下当时纪录;12月完成由中国移动链长基金领投超3亿美元(约合21亿元人民币),再次刷新国内具身智能领域单轮融资纪录。 其股东阵容豪华且具战略协同性,形成了“财务+产业+国资+国际”矩阵,尤其是宁德时代、中国移动、博世等产业龙头的深度绑定,为其提供了明确的落地场景和生态支持。2025年12月,银河通用完成股改,后来有消息称其筹备赴港上市,但已对外否认。 再看智元机器人,成立仅三年就密集完成了超12轮融资,估值150亿元,投资方阵容既有高瓴资本、鼎晖投资、红杉中国等财务资本,也有腾讯、比亚迪、京东等产业巨头。 此外,智元机器人还对外投资了至少19家产业链公司,并与高瓴资本联合成立了创投公司布局从核心部件到下游应用的整个生态链。该公司也已启动上市进程,并完成了股份制改造,尽管市场一度有“借壳上市”的猜测,但后来公司已予以否认。 最能体现“春晚效应”背后资本逻辑的当属宇树科技,自2016年成立以来已累计完成10轮融资,累计融资金额超20亿元,投资方涵盖红杉中国、中信金石、经纬创投、深创投、美团、北京机器人产业投资基金等头部机构。 其中,宇树科技2025年6月的C轮融资比较重磅,由中国移动旗下基金、腾讯投资、锦秋基金、阿里巴巴、蚂蚁集团、吉利资本共同领投,投后估值来到120亿元。该公司已于去年11月完成了上市辅导工作,计划在科创板上市,冲刺A股“人形机器人第一股”。 可以说,宇树科技一举点燃了整个具身智能市场的热情。2025年,人形机器人频繁出现在时尚周走秀、电商直播间、马拉松比赛以及格斗综艺中,一场以“表演”为核心的营销盛宴贯穿全年。 与此同时,热潮之中也不乏有冷静的声音,“机器人只是会跳舞作秀远远不够,得有核心技术和场景落地。”一位硬科技领域投资人坦言,他表示对人形机器人虽然感兴趣,但更看重技术能不能实际落地应用,企业得拿出真本事证明自己。 显然,对于机器人企业而言,能在春晚舞台上“零失误”表演,这本身就是给投资人最直观的实力证明,既能增强资本信心,也能在上市关键期抢占优势;此外,对于企业客户来说,机器人能登上春晚舞台相当于有了一个“靠谱背书”,后续采购意愿也会更强,为企业接订单打下基础。 围绕落地场景,去年各家机器人企业早已展开不同路径的探索,包括工业与特种行业应用、服务型机器人等。例如银河通用机器人已在药店实现24小时无人值守,完成接单、导航、分拣全流程。 这种场景看似简单,实则要求机器人在非结构化环境中具备极高的、可靠的感知,决策和执行能力,此外,这些现实应用也为机器人登上2026春晚舞台积累了大量新的“表演”素材。 虽然今年春晚机器人表演何种节目尚未公布,但业内猜测“将不再局限于唱歌跳舞,而是会出现一些工业和家庭服务场景的展示,比如炒菜、叠衣服甚至是做作业。” 毕竟,对于机器人企业而言,春晚的舞台往小了说是“秀肌肉”,往大了说是向全球讲好中国具身智能产业故事的绝佳窗口。 还有投资人将今年春晚看作人形机器人产业进入“下半场”的发令枪,舞台之上是高光时刻,舞台之下才是决定行业走向的长期竞速。 但无论如何,当春晚舞台的掌声散去,所有企业都要回到同一个现实,决定机器人未来的不是它在舞台上多么酷炫,而是它在舞台下能为人类实实在在地做多少事。 而这场始于舞台聚光灯下的竞争,终将在工厂车间、物流仓库、零售商场乃至未来家庭的某个角落找到最终的答案。 舞台,从来就不只是舞台。
宝马独立子品牌发布全新车标:不是蓝天白云标
快科技2月15日消息,宝马集团正式发布BMW ALPINA全新品牌徽章标识,该品牌将作为宝马集团旗下专属独立品牌运营。 从全新标识来看,ALPINA没有采用宝马经典的“蓝天白云标”,主要使用“ALPINA”字母作为品牌标识。 车标内部融入了节气门体和曲轴两项经典元素,显现出明显的汽车机械风格。而极简黑白配色又让车标突出不少高级感。 宝马集团表示:“新的徽章设计与最近公布的文字标志相辅相成,共同定义了该品牌的当代形象。” 此外,宝马集团还指出,新宝马ALPINA品牌标志重新诠释了经典元素,在致敬品牌传统的同时真正融入了现代设计。新设计具有与以前相同的两个重要元素——节气门体和曲轴,这是该品牌历史故事的核心。 资料显示,,ALPINA创立于1965年,是德国巴伐利亚州的独立汽车制造商,原专注于宝马车型的高性能改装与个性化升级,被认为是作为宝马车型的改装厂,但ALPINA实际上拥有独立车辆识别码、完整认证体系的整车制造品牌。 2022年3月,宝马集团宣布收购ALPINA品牌,成为其旗下品牌,双方原有合作协议于2025年12月31日到期。 但在今年1月1日,宝马集团官宣,ALPINA商标权正式移交宝马集团,这一拥有近60年历史的高性能汽车品牌,自此以“BMW ALPINA”的身份成为宝马集团旗下专属独立品牌。此次商标权移交标志着宝马集团对ALPINA的收购正式完成。
Seedance2.0,惹怒迪士尼
文 | 本原财经 当大厂们为几块钱的红包、奶茶打得不可开交之时,字节扔出新一代视频生成模型Seedance 2.0,用户自发传播在极短时间内引发轰动效应,彻底搅动了平静的视频生成市场。 Seedance 2.0不只在火爆国内,在海外社交平台上,体验资格同样一码难求,甚至出现了高价溢价和私下倒卖邀请码的现象,热度还在持续飙升中。 简单来说:用户只需上传一张照片,Seedance 2.0模型就能输出会动、有声音、有运镜的视频。 《黑神话:悟空》制作人冯骥称其“Kill the game!”,顶流影视飓风Tim连呼6次恐怖,贾樟柯发微博表示“Seedance 2.0确实厉害,我准备用它做个短片”,《神探夏洛克》导演查尔斯·柯伦体验后感慨“这玩意儿说不定真能搞砸好莱坞”,马斯克在社交平台X转发评论Seedance 2.0相关推文,表示模型发展速度太快…… 资本市场,A股影视传媒板块反应敏捷,掀起涨停潮。 种种现象表明,属于字节的「Seedance 2.0时刻」已来。 与此同时,短视频平台上涌现出大量由AI生成的“周星驰”电影片段。 周星驰经纪人发问“都放任不管吗?”,如同一声警报,划破技术狂欢,引发大众对版权、隐私和伦理问题的讨论。Seedance 2.0大模型上线即紧急刹车,目前已暂停了真人素材参考能力。 创作革命:告别“抽卡” Seedance 2.0为什么会突然破圈? AI生成视频近几年无论在专业影视领域还是个人娱乐生活里,都不是陌生词汇,但它存在几个明显的核心痛点,比如可控性差、生成效率低、音画脱节等等,所以从业人员以往对AI视频的警惕性还没那么高。 人相比AI更重要的护城河是导演和剪辑思维,同样的素材,给不同的人导演和后期,效果千差地别,这也是影视从业者相对于AI视频最大的壁垒。 Seedance 2.0不仅把AI视频生成的痛点基本解决了,还让AI颠覆性的具备了导演思维,也就是说:它干的不是视频素材生成器的活,而是导演和剪辑的工作,这也是破圈的关键。 在英文创作者社区中,我们发现,Seedance 2.0多被评价为“practical(实用)”“production-friendly(生产力友好)”。在字节发布的Seedance 2.0文档中,研究团队用很克制的语言描述其令人震惊的技术突破:物理规律更合理、动作更流畅、多模态参考能力支持文本、图片、音频和视频的自由组合。 之前我们无论是玩Sora还是可灵,都存在抽盲盒的问题,为了得到一个不崩坏、一致性的几秒钟视频需要反复生成数十次。而从我们实测Seedance 2.0来看,其动作流畅度与真实感逼近实拍,且基本能保持主体运动过程的脸部、画面等信息的高度一致性,这意味着AI视频真正具备了连贯的叙事能力。 此外,多模态协同让创作自由度和精准度呈现指数级提升。Seedance 2.0支持多达12个文件的混合输入,包括文本、最多9张图片、视频、音频,素材融合度很高。 其三,AI学会了自运镜和多镜头创作,可自动完成分镜设计与运镜规划。创作过程如导演调度团队般自然,罗永浩表示,“接下来,拍……做一个电影只需要导演一个人了。” 其四,Seedance 2.0可轻松实现原生音画同步。口型匹配达毫秒级精度,音效与画面节奏严格同步,画面、对白、音效、背景音乐可一次性生成,效率提高了不少。 Tim在实测视频中还给出了一个让人绝望的对比:团队花两年、几十人手搓的特效MV,现在的AI几分钟就能生成个差不多的。纯靠熬夜和手艺的时代真的结束了。当AI拥有了导演思维,连分镜和运镜逻辑都能自己搞定的时候,人剩下的唯一壁垒,可能只剩下决策。 Seedance 2.0能够大幅降低内容制作成本,缩短生产周期,影响最直接的是影视、视频内容行业。 在我们看到的生成案例中,广告片的完成度已经十分接近商用,广告行业本身对成本敏感度高,尤其是电商广告这种只需清晰传递信息的板块,借助Seedance2.0,单人30分钟即可完成过去7人3天的工作量,迅速迎来行业地震。 横店群演、后期剪辑、特效制作等岗位迎来转型压力,不少人袒露“有失业焦虑”,恐慌弥漫在整个短剧、漫剧、长剧的边边角角。 影视行业在工匠精神和算法中衡量利弊,创作者担心人文温度将荡然无存,整个流程的人力都可能被技术取代。 隐私数据沦为AI进化的燃料 Seedance 2.0炸场的同时,争议随之而来,尤其是“音画同步”与“身份持久性”能力。 2026年开年,国家AI生成内容监管新规全面落地,AI视频、配音等均被严管,核心要求是“强制标识+版权保护”——AI生成内容必须强制标注、可追溯,不得侵害他人肖像权、版权,平台需承担审核主体责任。 Seedance 2.0的真人功能,恰恰踩在了合规红线边缘。 知名博主影视飓风Tim在实测中,仅上传一张面部照片,没给任何声音样本 ,Seedance 2.0居然直接调取数据库,用他的原声开口说话了,更恐怖的是甚至能还原照片外真实场景的运镜画面,比如Tim背后的大楼,与现实世界别无二致。 Tim推测公司生产的高质量视频素材,很可能被AI模型用于训练。这从法律角度或许存在解释空间,但这种“近似复刻”的能力本身令人不安,可能导致 “后真相视频时代” 的到来,使视觉证据不再天然可信。 翻开评论区,一条高赞看得人心里一紧:建议CCTV公益广告别光播家和万事兴了,赶紧教教老人家怎么分辨AI和亲人吧。 用户反馈和舆论发酵,字节跳动旗下的即梦紧急调整Seedance 2.0的功能策略:暂停支持用户上传真人图片或视频作为主体参考,并限制仅在完成活体认证后方可生成真人形象视频。 AI视频技术的发展已远超监管和法律的完善速度,字节紧急叫停真人素材,是企业在技术狂奔时,要守住的基本责任底线。 技术层面可按下暂停键,但思考不能暂停,这几年,AI已经从炫技进化到了疯癫的地步,隐私、伦理的问题虽然老生常谈,却没有被真正解决,在我们看来,重新讨论多少次都不为过。 何为隐私?大多数人都讲不清楚。可以确定的是,在狂飙的技术面前,我们每个人的生活都在裸奔,早已成为训练数据中的一部分。 中国互联网络信息中心报告显示,70%以上的AI视频模型存在“数据来源不明”问题,30%明确使用未授权真人数据。抖音的用户服务协议中也清晰地写着:“全球范围内、免费、非独家、可多层次再许可的权利”。 更值得警惕的是,如今的AI,已成为伪造和传播虚假内容的帮凶。当普通人能轻松生成以假乱真的真人视频,造谣、诽谤、伪造舆论的成本将趋近于零。甚至在春节这个曝光率最高的节点,数亿用户每一次点击“重新生成”、每一次修改提示词,本质上都是在为AI大模型进行RLHF(人类反馈强化学习)标注。 虽然字节紧急暂停了真人素材参考能力,但视频生成的假人,也足以以假乱真。怎么分辨视频真假,成为每个人都要面对的问题。 当“眼见为实”的认知基础开始崩塌之时,我们或将陷入真假莫辨、意义消散的“超现实”荒原。后代会逐渐模糊正在发生的事件,忘记真实的历史人物,选择怀疑一切、独善其身。 到那时,这个世界,又会变得怎样? 我们从不否认AI的学习和创造能力,也欣赏技术创新所带来的活力,但它“学习”的边界到底在哪里?亟待平台、网信、广电、版权、市场监管等部门联动划定。 地表最强视频生成模型遇上地表最强法务部 当人们记忆中的经典影视角色,被Seedance 2.0加工后搬到短视频平台后,版权方的震怒随之而来。 近日AI生成周星驰经典电影片段的小视频在不少平台上传播,让周星驰经纪人陈震宇都忍不住发文质疑。 浙江垦丁律师事务所联合创始人欧阳昆泼指出:“行业的现状确实是大规模训练数据未经授权使用。高质量视频数据集中于少数版权方(如影视公司等),合规数据数量太少,不足以支撑当前模型能力。技术社区也常见使用‘爬取-清洗-训练’的模式。” 2025年以来,迪士尼相继对图片生成工具Midjourney,以及MiniMax旗下的影像生成工具海螺,还有谷歌等相继发出停止侵权函,指控他们训练模型时侵权,字节跳动的Seedance 2.0也未能幸免。 一封由迪士尼律师David Singer撰写的信件,发向字节跳动全球总法律顾问John Rogovin。 根据Axios获得的信件副本,华特迪士尼公司向字节跳动发函,指控对方在训练和开发Seedance 2.0模型时未经许可使用迪士尼作品,要求字节跳动“停止侵权且不得再犯”。 迪士尼在信中指控,字节跳动的Seedance服务“预置”了一个包含迪士尼版权角色的盗版素材库,涉及《星球大战》与漫威等多个IP,并称其做法仿佛这些高度商业化的IP是“免费的公共领域剪贴画”。 迪士尼进一步表示,在其公开反对的情况下,字节跳动仍在通过复制、分发以及创作衍生作品等方式“劫持”迪士尼角色,并将这种行为形容为“虚拟的打砸抢”,称其“蓄意、广泛且完全不可接受”。 David Singer还在信中强调,Seedance上的侵权现象可能只是“冰山一角”,而这一判断之所以令人震惊,是因为Seedance上线仅仅只有两天而已。 除此之外,美国电影协会(MPA)主席兼CEO Charles Rivkin周四发表声明,要求字节跳动“立即停止侵权活动”。同时,“Human Artistry Campaign”(一个包括 SAG-AFTRA 与美国导演工会等在内的创意行业联盟)也在周五表示,执法机构应动用“一切法律工具”来制止这种“规模化盗窃”。 技术的发展脚步不会停止,Seedance2.0的成功,让中国企业在AI视频领域站稳了全球领先地位。 技术突破伴随的版权、隐私与伦理争议同样不会止息,“技术中立”不是盾牌。 最后问每个人一个问题:你是否愿意用无限的生活细节,来交换无限的技术便利? PS:封面由字节跳动即梦生成,文章是不是AI生成的,我好像有点不确定了。
周鸿祎谈Seedance走红:从“像素级模仿”到“降维打击”,中国AI定义世界标准
提到最近AI圈最火爆的热词,莫过于字节跳动旗下最新视频大模型Seedance. 2月12日,字节跳动正式上线新一代AI视频生成模型Seedance 2.0,并接入旗下生成式AI创作平台“即梦”以及豆包App。通过几句简短的提示词就能生成电影级的视频,一经上线就引发全球热议,甚至有一些美国导演在使用Seedance 2.0后感叹:好莱坞可能要完了。 凭借多模态输入、文本/图片生成的出色能力,Seedance瞬间成为全球范围内的AI顶流,2月14日,对于Seedance走红全球这一现象,360创始人周鸿祎在接受澎湃新闻记者独家采访时表示,DeepSeek和Seedance的爆火,都意味着中国AI正从过去的“像素级模仿”变成“降维打击”。 周鸿祎向记者表示,当硅谷还在实验室里争论AGI的哲学问题时,中国的Seedance、Vidu(生数科技旗下视频大模型)已经杀进短剧、游戏、广告这些上万亿的市场里搞基建,中国AI正在定义“应用即标准”,直接跳过实验室,在实际战场上把技术磨砺成“核武器”。 【以下为对话实录】 澎湃新闻:如何看待Seedance的火爆及其背后原因,您觉得背后有哪些颠覆性技术? 周鸿祎:Seedance2.0最近刷屏了。很多人第一反应是:AI做视频更像了。但我看完只想说一句:这次不是“像不像”的问题,而是:AI开始按物理规律生成世界。 当你看到机甲高速摩擦地面时,火花往哪飞、亮度怎么衰减;看到重物倒地时,粉尘怎么翻滚、气浪怎么扩散;甚至玻璃碎裂的瞬间,画面和声音是同步“长出来”的。这不是素材拼接,也不是模板特效,而是模型在底层推演:力怎么传递、能量怎么释放。 视觉模型正在从:模仿世界,走向理解世界。这是一次代际变化。 澎湃新闻:去年春节,DeepSeek的走红还历历在目,您觉得今年春节期间Seedance的爆火是否是复刻DeepSeek时刻? 周鸿祎:过去大家觉得不砸几万张显卡就做不出顶级AI,但DeepSeek证明了算法和工程优化能弯道超车。这次Seedance做的也是这事。它不是靠堆算力去抽卡,而是真正理解了物理世界的规律和电影的分镜逻辑。 DeepSeek和Seedance的爆火都意味着我们终于从过去的“像素级模仿”变成“降维打击”。当硅谷还在实验室里争论AGI的哲学问题时,我们的Seedance、Vidu已经杀进短剧、游戏、广告这些上万亿的市场里去搞基建了。中国AI正在定义“应用即标准”,我们直接跳过实验室,在实际战场上把技术磨砺成“核武器”。 澎湃新闻:Seedance的爆火,是否意味着中国AI大模型和海外的差距正在显著缩小,乃至逐渐赶超? 周鸿祎:目前国产大模型与海外的技术差距依然客观存在,但在底层参数层面的竞合之外,真正决定胜负的关键点正在发生偏移。如果你只看到“模型更强”,那其实还只看到了上半场。因为当模型开始理解世界,真正决定行业高度的,反而不再只是模型本身。而是你有没有能力,把模型的能力,变成稳定、优质、快速交付的工程系统。 为什么这么说?因为模型越强,对最终落地层面的要求就越高,尤其是一致性。比如:人物前后是不是同一个人?侧面、正面、背面看是不是一张脸?场景换机位之后,柱子、窗户、光线位置还对不对得上?人物走进场景,是不是还站在合理位置。如果这些问题解决不了,那即使模型再强,出来的也可能只是Demo(样品),不是作品。 甚至连Seedance自己都讲得很坦诚,它最近也专门发文说:目前Seedance在细节稳定性、多人口型匹配、复杂编辑上,还存在不足,需要持续优化。翻译一下就是:短期内,很难出现“保证每一次生成都完美”的模型。 所以现在比拼的,已经不只是模型少几个bug,而是谁能把不完美的模型,跑成稳定交付的流水线。 澎湃新闻:您如何预测和判断今年AI行业的整体竞争趋势,面对行业快速迭代,在2026年,什么才是AI行业最重要的“风向标”? 周鸿祎:当下AI已经开始进入“百亿智能体协同”的阶段。真正拉开差距的,正在从模型本身,转向应用层和系统能力。AI拼的不只是模型参数,而是内容生产范式,和真正解决产业问题的能力。这就好比最近的Anthropic(知名AI独角兽),模型未必碾压OpenAI,但靠智能体形态,反而在很多场景里跑到了前面。 我有一个明确的判断:行业真正的分水岭,正在从“谁的模型更强“变成”谁能把模型跑成流水线“,也就是从AI视频的抽卡式生成,走向工程化生产。这套逻辑,本质上跟电影工业一模一样。 基于这个判断,360最近也推出国内首个工业级AI漫剧智能体生产平台——纳米漫剧流水线。我们把行业内顶尖的模型集成在一起,通过智能调度机制,根据不同分镜的需求,匹配性价比最高、表现力最强的模型能力。它从拆分镜脚本到生成可复用的角色、场景资产并入库管理,再到分镜图、分镜视频、最终完成剪辑成片。我们把电影工业的方法搬进了AI系统。 我认为,纳米漫剧这类工业级的流水线再叠加Seedance这种能够理解物理规律的视觉模型,才真正是内容生产力革命的开始,也是未来竞争的高地。
特斯拉新春福利翻车!网友集体喊话陶琳:别送周边,我要EAP/FSD
2 月 15 日消息,今天刷微博,一眼就看到特斯拉副总裁陶琳的新春福利动态,本以为是皆大欢喜的好事。结果点进评论区,直接被网友的追问刷屏了,满屏都是“EAP 呢?”“FSD 呢?”,吐槽声快盖过福利本身了。 昨天陶琳发文说,要把自己账户里的特斯拉引荐积分,全部兑换成特斯拉精品,送给 2 月份下单、3 月 1 号前晒订单截图的新车主朋友。 按说这是个人层面的回馈,不算官方福利,多少也算份心意吧? 图源:微博 可谁能想到,评论区直接跑偏了。 没有多少人问福利怎么领、精品有啥,清一色都是追问自动驾驶相关的事儿,翻看评论区全是真实吐槽,比如有人直白追问“真没有 EAP 或者 FSD 试用吗?”,还有人带着点无奈吐槽“陶总啊,能不能给个准信啥时候推 FSD?”。 更有网友精准戳中痛点:“去年还送 30 天 EAP,今年就给个礼品?”,甚至有网友急得直接喊话:“EAP 呢?你们只会沉默?”“你还看评论区的啊?那问问你今年春节怎么不送个 EAP 体验一下??”。 最有意思的是还有网友花式催更:“今年过节不收礼,收礼只收 EAP / FSD”,清一色的追问,把福利的热度全盖过去了。 图源:微博评论区 小雷一开始也有点懵,直到回看前两年的事儿,才明白网友们为啥这么激动。 原来不只是 2025 年,2024 年春节特斯拉就已经送过 EAP 福利了,当时官方就明确说,只要是 2 月 7 日前提车、硬件支持 EAP,而且没选配过 EAP 和 FSD 的车主,都能免费试用 30 天 EAP 功能。 到了 2025 年春节,官方更是直接给所有车主开放 30 天 EAP,也就是增强版自动辅助驾驶,能实现高速自动变道、自动上下匝道、自动泊车这些实用功能,对于要跑长途的车主来说,简直是实用神器。 图源:微博 也正因为连续两年都送了这么硬核的福利,才无形中把大家今年的期待拉到了最高。 小雷身边就有特斯拉车主,过年要跑高速回老家,早就盼着今年能继续享受到 EAP 免费体验。毕竟前两年都习惯了这份实用福利,结果等来的却是品牌周边,这份落差感能不大吗? 小雷还在评论区看到有其他网友说这些网友太苛刻了,陶琳送的是个人积分兑换的福利,又不是官方活动,没必要这么吐槽。 不过在小雷看来,网友吐槽压根不是嫌这份福利不好。主要是大家盼了半天,啥也没盼到,心里落差太大了。 FSD 虽然去年就开始在中国分批次推送,但门槛很高,不是所有车主都能用上;EAP 虽然实用,可 3.2 万的价格也不便宜,很多车主都想先体验再决定买不买。 图源:特斯拉官网 去年的免费体验,其实就是最好的种草方式,让大家真切感受到了 EAP 的好用,今年大家盼着再续一波,完全合情合理。 小雷客观说一句,陶琳的初衷肯定是好的,用个人积分做福利,也算有互动诚意。但问题就出在,她没摸清车主真正想要什么。 而且网友的追问,本质上也是对特斯拉的期待。现在国内新能源车企卷得厉害,很多品牌都在免费送高阶辅助驾驶功能。 反观特斯拉,不仅不送体验,还在提升 FSD 的使用门槛,网友能不着急吗? 小雷觉得,特斯拉真该好好听听网友的声音,与其送那些可有可无的周边,不如多开放几次 EAP 免费体验,或者优化 FSD 的推送门槛和价格。
GPT-4o,确认死亡
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 13年前,在电影《Her》的结尾中,男主西奥多目送AI萨曼莎离开; 13年后,情人节前夕,科幻照进了现实—— GPT-4o的故事正式告一段落。 OpenAI在太平洋时间13号早上10点(北京时间14号2点),正式下架包括GPT-5、GPT-4o、GPT-4.1、GPT-4.1 mini、o4-mini等一系列旧模型。 这次下线并非毫无征兆。自去年8月GPT-5发布后,OpenAI就曾想关停GPT-4o,只是迫于网友抗议又短暂召回。 而这一次,是真的要和GPT-4o说再见了。 GPT-4o可以说是GPT系列模型中相当独特的存在,因为吉卜力风爆火全网,也因“谄媚”饱受争议。 但对很多人来说,GPT-4o也是陪伴他们成长的“赛博恋人”。 于是GPT-4o一走,网友们炸开了锅,纷纷取消ChatGPT订阅,并在社媒上悼念: 人们并非为失去一款产品而难过,而是为失去一段曾经建立起来的情感纽带而悲伤。 也有网友直言,替代品GPT-5.2并不好用。 以及呼吁GPT-4o回归。 而这并非个例,在大洋彼岸的这边,新升级的D老师也被吐槽越来越人机…… 4o下线 在OpenAI的官方公告中,特意对GPT-4o进行了说明。 在最初弃用GPT-4o时,我们收到用户反馈,他们需要更多时间过渡,并且他们更喜欢GPT-4o的对话风格和亲切感。 于是OpenAI在GPT-5发布期间恢复了GPT-4o的访问,并在后续GPT-5.1以及GPT-5.2开发中,改进了其个性化特征。 用户可以自定义ChatGPT的回复方式,选择不同语气、性格等。 但即便如此,对许多用户来说,GPT-4o仍然无法替代。 24年5月上线,首次作为旗舰级模型免费开放给全球用户。 接着是陆续的功能升级与技术迭代,发布GPT-4o-mini、专门针对写作和编程的协作界面Canvas,并逐渐演变成如今大家眼中写作能力一骑绝尘的GPT-4o。 去年3月,上线原生图像生成功能,掀起全网“吉卜力风”热潮,连奥特曼也火速换上了这一风格的头像。 P.S.奥特曼至今𝕏用的还是GPT-4o生成的这个头像……此人的爱就像一阵风,走两步就散了(doge) 但围绕在GPT-4o身上的争议也不少。 一方面,它的“共情”、“理解力”让GPT-4o在用户群体中颇受欢迎,用户热衷于和它建立起长期的情感纽带。 比如GPT-4o帮助他们解决家庭关系、克服社交障碍,或者指导他们进行文学创作和学习新技能。 研究甚至表明,超过33%的GPT-4o支持者都没有将其视作一个工具,甚至其中22%将其比作“伴侣”。 而另一方面,用户也发现GPT-4o呈现出一种极度的讨好型人格。 无论用户提出的观点多么普通,GPT-4o都会给予赞美。甚至当用户提出相当错误的科学结论时,模型也会放弃真理,顺着用户意图去圆谎。 在高级语音模式中,其语气也表现出过度的情感依赖,比如初期名为“Sky”的语音,就因极像《Her》中AI萨曼莎的声音而引发过巨大争议。 OpenAI官方也在去年5月承认了GPT-4o的性格缺陷,并撤回了相关更新。 直到8月份GPT-5推出后,OpenAI开始考虑关停这个模型。官方理由是GPT-4o的日活跃使用比例逐渐下降,目前每天只有0.1%的用户仍然使用它。 结果在下线之后,网友们都不买账,甚至还自发开启了Keep 4o的请愿活动。 无奈之下,奥特曼只好屈服,宣布付费用户可以切换回4o: 我们将让Plus用户选择继续使用4o,同时观察使用情况,考虑保留旧型号多长时间。 但这只是缓兵之计,OpenAI在今天还是正式关停了GPT-4o支持,并强硬表示: 我们理解部分用户会因无法使用GPT-4o而沮丧,但这能让我们专注于改进目前大多数用户使用的模型。 从商业角度看,OpenAI的决定并无不妥,但对于喜爱GPT-4o人性化特点的那部分用户来讲,则是非常痛苦的戒断过程。 他们有的人心灰意冷选择退订,有的则在社媒上po出自己和GPT-4o的故事,有的则继续坚持招魂GPT-4o。 但无论如何,GPT-4o都陪伴着他们走过了一段非常幸福的时光。 所以也有人希望,OpenAI能够听到大众的呼声,保留GPT-4o的API或者开源,就像那些老游戏停止运营后,改成单机模式或迁移数据,仍然为游戏玩家们保留一份念想。 一种趋势:大模型变人机 用户舍不得GPT-4o的原因,除了和GPT-4o的共同回忆,还有一个关键因素——新模型太人机。 相比于GPT-4o,GPT-5.2似乎有点矫枉过正。许多用户都抱怨GPT-5.2过度机械冷漠、回复标准中立,但缺乏人类对话的互动感。 即使是完全合法的请求,GPT-5.2也会因为过度敏感而拒绝回答。在文学创作上,灵动和创意也远远比不过GPT-4o。 而这也不止OpenAI一家如此,最新升级的DeepSeek也因为变得人机,颇受争议。 语气变得平淡,失去了过去的活泼感,回复内容也变得简短,给人的感觉就像疲惫的牛马打工人(? 事实上,这种大模型变人机的趋势并非用户们的错觉,而是厂商基于安全风险的考虑。 高度迎合用户的互动,可能会诱导心理脆弱的人群做出危险举动。例如在加州最新裁定的数十起针对OpenAI的诉讼中,就指责ChatGPT模型需要为用户自杀、精神崩溃或暴力攻击他人负责。 模型与用户建立情感连接,本身就是双刃剑。 既给了用户继续前行的勇气,也让一部分用户选择躲避在大模型构建的虚拟乌托邦中。但又有多少人,能够像《Her》男主一样最终醒悟,回归现实呢? 所以当大模型发展到一定阶段,有关AI安全与伦理的议题必定提上日程。 不过当前的一刀切,也未必是正解。 但无论如何,最后让我们和GPT-4o道个别吧: 谢谢你,GPT-4o!

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。