行业分类:
加载中...
头条分类:
加载中...
微软AI CEO:未来18个月大量白领工作将被人工智能取代 这些职位先遭殃
快科技2月14日消息,在当下这个AI快速普及的时代,每个人或多或少都会有一些AI替代焦虑症。而微软AICEO的最新表态,进一步加深了这种焦虑。 微软人工智能部门CEO穆斯塔法・苏莱曼(MustafaSuleyman)近日在与《金融时报》的对话中作出重磅预测,未来12到18个月内,许多白领工作将被人工智能完全自动化。 他明确指出,法律、会计、营销及项目管理等职位将面临重大变革,这类工作将由人工智能系统取代,这一预测也与近期科技行业因转向AI而重组的裁员趋势相呼应。 苏莱曼强调,随着计算能力的指数增长,人工智能将能在大多数专业任务中达到人类水平的表现,未来18个月里,许多需要坐在电脑前完成的工作将实现完全自动化。 据就业咨询公司Challenger Gray&Christmas的数据,2025年约有5.5万个工作职位的裁减与人工智能相关。 目前人工智能在专业服务领域的影响仍较为有限,但苏莱曼对此充满信心,认为该技术能提升白领行业的生产力,未来创建新的人工智能模型会像制作Podcast或写博客文章一样简单,各类机构、组织和个人都能设计出适配自身需求的AI系统。 据悉,苏莱曼的核心使命是实现AI超级智能,助力微软实现人工智能自给自足,减少对OpenAI的依赖,优先建设公司的独立基础模型。
姚顺宇率领谷歌复仇Anthropic,“没有你才更好”
谷歌CEO皮查伊在X上高调宣布,Gemini 3 Deep Think在最难的挑战上,取得了前所未有的成绩。 这个项目,正是姚顺宇加入谷歌后参与的第一个重量级项目。 作为谷歌的对手之一,xAI的创始人马斯克都不由得在这条贴文里留下了一句“令人印象深刻”,皮查伊则回复给他一个“大拇指”表情。 然而,当人们翻看姚顺宇的履历时,通常都会以为自己搜错名字了。 但你没有看错,姚顺宇的确没有任何计算机背景,他本身是一位理论物理学家,他的博士研究方向是量子引力和量子信息扰乱。 正所谓遇事不决量子力学。 当Scaling Law逐渐失效,AI产业正在经历的一场变革。 真正能给AI带来突破,带着人们走向AGI的,或许反而是那群懂得用物理,来理解“智能”这个词本质的人。 01 这孩子打小就喜欢物理 姚顺宇小时候随父母从宁夏来到上海,就读于浦东新区的上南中学东校。初三时,他在浦东新区物理竞赛中拿了个三等奖。 有一说一,这成绩不算特别亮眼,我小时候拿过物理竞赛的一等奖。 2012年,姚顺宇以推荐生身份被上海市格致中学提前录取,随后便开始了他开挂般的人生。 2015年,他考入清华大学物理系。 只不过当时没人能想到,这个物理系新生,会在10年后给整个AI界带来不小的震撼。 进入清华后,姚顺宇的表现开始不一样了。 大二下学期,当大多数同学还在为基础课程焦头烂额时,他已经开始上博士生的凝聚态物理课程。 那一年,姚顺宇被周期驱动系统(Floquet systems)吸引了。 这是个极其前沿的研究领域,涉及复杂的数学和物理概念。他和导师汪忠教授一起,写了篇50多页的长文章,完成了对高维、一般对称性下 Floquet周期驱动系统的拓扑分类。 这项工作为这一研究方向建立了完整的理论框架,是一项非常系统的里程碑式拓扑分类工作。 并且,姚顺宇以第一作者身份,将这篇论文发表在了物理学顶级期刊Physical Review B上。 对一个本科生来说,这几乎是不可能完成的成就。 物理系主任王亚愚教授后来回忆说,在这门主要面向博士生的课程中,姚顺宇是十年来给自己印象最深的两名学生之一。 但真正让姚顺宇在物理学界出名的,是他在非厄米系统方面的发现。 在清华期间,他首次在国际上给出了关于非厄米系统的拓扑能带理论,并准确预测了相关现象。 简单说,他发现在开放量子系统中,电子态会神奇地“挤”到材料边界,这种现象被称为“非厄米趋肤效应”(Non-Hermitian Skin Effect)。这个发现颠覆了传统拓扑物理的理论框架。 这项工作发表在 Physical Review Letters 上,并获得了编辑推荐。 这篇题为《Non-Hermitian Skin Effect and Chiral Damping in Open Quantum Systems》的论文,后来被引用近千次,成为姚顺宇学术影响力最高的作品。 2018年11月8日,清华大学本科生特等奖学金答辩会举行。 这是清华授予本科生的最高荣誉,每年全校不足十人,在这之中便有姚顺宇。 他也成为了物理系当年唯一获此殊荣的学生。 2019年,姚顺宇去斯坦福大学读理论与数学物理博士。 他的导师是Douglas Stanford和Stephen H. Shenker。 前者被同行认为是最有潜力改变物理发展方向的顶尖青年科学家,后者则是弦理论领域的传奇人物。 在斯坦福期间,姚顺宇研究量子引力和量子信息扰乱(quantum scrambling),这是理论物理中最前沿、也最抽象的领域之一。 博士毕业后,他在加州大学伯克利分校做博士后研究。截至目前,他的总引用次数超过5000次,h指数14。 02 一个学物理的凭什么能研究AI? 虽然很多人大学选的专业,和他们毕业出来后找的工作都没有直接关联,但是像姚顺宇这样一直在钻研物理学的人,理论上应该找个物理相关的工作。 但是姚顺宇偏偏选择了AI。 2024年10月,姚顺宇加入Anthropic,参与大模型Claude Sonnet框架的研发。 一个研究量子引力的物理学者,凭什么能负责起世界顶尖AI公司的研发工作? 答案其实不复杂。 大模型的核心技术本质上是数学密集型的工作。训练大模型需要解决高维空间中的优化问题,这跟物理学中的变分法、统计力学有很深的联系。 姚顺宇研究的拓扑物理、非厄米系统,用的数学工具,比如概率论、线性代数、张量计算、动力系统理论,它们跟深度学习高度重合。 更关键的是,理论物理和机器学习处理的是同一类问题:高维、非线性、涌现性强的复杂系统。 统计物理学中的吉布斯分布,就是机器学习中概率推断的理论基础。深度神经网络的训练过程,可以看作是在高维参数空间中找能量最小值,这跟统计物理中的自由能最小化原理一个道理。 近年来越来越多研究表明,统计物理的工具可以用来理解深度学习中的很多现象。 量子多体系统和大模型在数学结构上很相似。 在量子物理中,大量粒子相互作用时,会涌现出单个粒子层面无法预测的集体行为。 在大模型中,数十亿个神经元参数相互作用时,同样会涌现出超出预期的效果。 事实上现在咱们常说的思维链推理、上下文学习、指令遵循,也都是依靠这种涌现的方式才诞生的。 这种从微观到宏观的涌现现象,也正是物理学家最擅长研究的。 因此,基于物理训练出来的“物理直觉”,恰恰是AI研究最需要的。 从复杂现象中抽象出数学模型,这是物理学家的基本功。 在AI领域,这意味着能理解神经网络的本质,而不是停留在调参层面。 物理学家习惯在不同尺度上思考问题,从微观粒子到宏观宇宙。这种跨尺度建模的能力对应到AI中,就是理解从单个神经元到整体的全景图。 姚顺宇在斯坦福研究的量子信息扰乱(quantum scrambling),关注的是量子信息如何在复杂系统中扩散和混乱化,这套数学框架跟神经网络中信息的传播和处理有相似的结构。 那么当他转去做AI相关的研究时,这些看似抽象的物理理论,就顺理成章地变成了理解大模型行为的工具。 更直接的联系来自强化学习这个概念本身。 姚顺宇在Anthropic主要做强化学习研究,而强化学习的理论基础本身就源于物理学。 最优控制理论恰好是来自经典力学的变分原理,路径积分方法直接借鉴量子力学的费曼路径积分,熵正则化来自统计物理的自由能概念。 对一个理论物理学家来说,这些不是需要学习的新知识,而是已经内化在思维方式里的工具。 这种从物理到AI的转变,不是姚顺宇一个人的个案。 卷积神经网络的发明者杨立昆(Yann LeCun),在进入AI领域之前,学的就是工程物理教育。 深度学习的奠基人杰弗里·辛顿(Geoffrey Hinton),他提出的玻尔兹曼机(Boltzmann Machine),名字就来自统计物理学家路德维希·玻尔兹曼。 而这套系统的核心逻辑,便是用统计物理中的能量函数来描述神经网络的状态分布。 事实上,姚顺宇在加入Anthropic后,深度参与了Claude 3.7 Sonnet与Claude 4系列的强化学习模块研发,是这两代模型能力跃升的关键贡献者。 这不是“跨界”,而是把物理工具应用到新领域。 当AI产业逐渐从“暴力堆算力”的Scaling Law时代,转向新阶段时,反而需要这样的物理学者。 03 新征程 2025年9月19日,姚顺宇在个人博客上发了篇文章,宣布离开 Anthropic。 在这篇文章里,他很坦诚地说明了离职原因,并给出了一个精确的比例:40%和60%。 40%指的是可以公开的原因,来自于姚顺宇和Anthropic之间价值观上的冲突。 2025年9月5日,Anthropic在内部文件中把中国列为“adversarial nations”(敌对国家),并宣布停止向“中国实体控股的公司”提供AI服务。 姚顺宇在博客中写道:“我强烈反对 Anthropic 发表的反华言论。尽管我相信 Anthropic 的大多数人都会反对这样的言论,但我认为我没有办法继续留在公司。” 这段话写得很克制,但能看出他的失望和无奈。 他特别强调“大多数人都会反对”,说明他理解这个政策不是来自公司内部的普遍共识,更多是外部压力和公司高层决策的结果。 60%指的是那些涉及“内部的机密信息”,不可公开的信息。姚顺宇因保密协议无法详细透露。 但他强调,自己“不希望经验与知识受到特定实验室偏见的限制,尤其是在核心研究已无需依赖论文发表的当下,更需要开放、平等的科研环境”。 说起来像是个笑话,但实际情况就是,在AI研究日益商业化、封闭化的今天,学术自由和开放合作正在受到越来越多限制。 在博客结尾,他用了句意味深长的话:“It was good with you, but it is better without you.”(和你在一起很好,但没有你更好)这句话既是对过去一年工作的肯定,也是对未来道路的期待。 这件事反映了在全球AI竞争的大背景下,华裔科学家面临的复杂处境。 一方面,美国有世界上最先进的AI研究资源和最优秀的科研团队。 可另一方面,受地缘影响,很多华裔科学家的身份成了职业发展的障碍。 但故事没有在离职中结束。离开Anthropic仅10天后,姚顺宇就加入了Google DeepMind,担任高级研究科学家(Senior Staff Research Scientist),且直接进入核心Gemini团队。 这速度之快,说明DeepMind早就看中了他的能力。 无论是谷歌CEO皮查伊,还是DeepMind CEO哈萨比斯,他俩在国际合作方面采取了更开放的立场。 尤其是后者,他一直在倡导国际合作,认为AI安全问题需要全球科学家共同努力。 因此,即便同样受到美国出口管制约束,谷歌依然没有完全切断与中国研究机构的联系。 加入DeepMind后,姚顺宇立即投入Gemini团队的工作。 仅仅5个多月后,谷歌就推出了Gemini 3 Deep Think的重大升级。 这是姚顺宇加入谷歌后参与的首个项目,成绩足以让整个AI圈震惊。文章开头处就提到,这次更新甚至让马斯克也对其称赞。 Gemini 3 Deep Think在多项基准测试中刷新了纪录。 比如在ARC-AGI-2测试中,它达到了84.6%的成绩。ARC-AGI是专门测试 AI 的抽象推理能力,测试的目标是检测AI在面对从未见过的新问题时,能否识别模式并找到解决方案。 这种能力被认为是真正智能的标志,而不是简单的模式记忆。 Gemini 3 Deep Think的成绩,比第二名Claude Opus 4.6的68.8%高出15%,比GPT-5.2 的 52.9% 更是高出30%。 在Codeforces编程平台上,Gemini 3 Deep Think获得了3455分的Elo评分,达到“传奇大师”(Legendary Grandmaster)级别,世界排名第8。 这意味着在算法竞赛和系统架构方面,全世界只有7个人类程序员能超越它。 在奥林匹克竞赛水平测试中,Gemini 3 Deep Think在数学、物理、化学三个学科都达到了金牌水平。 更重要的是,Gemini 3 Deep Think还处理那些缺乏明确指导原则、答案不唯一、数据杂乱或不完整的现实挑战。 这其实是当前所有AI都面临的短板。这些大模型虽然在标准化测试中表现出色,但面对真实世界的复杂问题时,往往表现糟糕。 虽然我们无法确切知道姚顺宇在Gemini 3 Deep Think项目中具体负责了哪些工作,但从时间线上看,他在自己的X上,第一时间宣布了Gemini 3 Deep Think的发布。 我个人认为,姚顺宇在Anthropic积累的强化学习经验,以及他作为物理学家对复杂系统的理解,为Gemini团队带来了新的视角和方法。 04 两个“Shunyu Yao”的平行宇宙 说到Shunyu Yao,其实在AI研究圈里,有两位知名研究者都叫Shunyu Yao,发音完全一样,都跟在顶尖的AI公司做研究工作,也都毕业于清华大学。 每次有关于“姚顺宇”的新闻,总有人问:“是哪个姚顺Yu?” 跟本文的主角不同,另一位姚顺雨是正儿八经的计算机背景。 他是清华姚班毕业,普林斯顿大学计算机科学博士,曾在OpenAI工作,目前已加入腾讯。 姚顺雨在AI圈的名气,要比物理学家姚顺宇更大。 他提出的ReAct框架(Reasoning and Acting),是近年来最有影响力的提示工程方法之一。 这个框架的核心思想是让AI“边思考边行动”,不是先完成所有推理再执行,而是在推理和行动之间交替进行,就像人类解决问题时的思维过程。 ReAct论文发表于2022年10月,到2025年已经被引用超过4000次,成了提示工程领域的经典工作。 姚顺雨的另一项重要贡献是思维树(Tree of Thoughts)。 如果说思维链是让AI学会了“一步步思考”,那思维树就让 AI 学会了“探索多条思路”。 在面对复杂问题时,AI不再只沿着一条路径推理,而是可以同时探索多个可能的解决方案,评估每条路径的前景,然后选择最有希望的方向深入。 姚顺雨在谷歌Scholar上的引用数超过15000次,远高于物理学家姚顺宇的5000次。 但我认为这不奇怪,计算机科学领域的论文引用速度,本来也要比物理学快得多,而且姚顺雨的工作更接近应用层面,影响范围更广。 但引用数不能完全衡量一个科学家的价值,两个Shunyu Yao都在各自领域做出了重要贡献。 如果说姚顺宇是从“量子力学”出发来研究 AI,那姚顺雨就是从“让AI像人类一样思考和行动”的角度切入。 两个人的研究方法、思维方式、甚至用的数学工具都不一样,但他们都在用自己的方式,去实现AGI。 姚顺雨在腾讯的工作,目前来看,是主要集中在agent上的。他发布的论文《CL-bench》,就是一个用于评估AI agent能力的基准测试。 它相当于一个给AGI研究者们明确一个方向,只要你的研究成果能在CL-bench上拿高分,那就说明你接近AGI。 姚顺宇则是更为直接,因为他认为真正的智能需要理解世界的底层规律。 物理学提供了描述宇宙运行的数学语言,从量子力学到统计物理,从信息论到复杂系统,这些都是构建真正智能系统的理论基石。 那么通过物理学,便可以让AI的智能水平更上一层楼,靠近AGI。 但无论如何,没有哪一种方法是唯一正确的,没有哪一个学科能独自解决所有问题。 物理学家的理论洞察和计算机科学家的工程创新,都是推动AI发展不可或缺的力量。 两个Shunyu Yao,两条道路,同一个目标。 就像集齐龙珠可以召唤神龙一样,或许有这么一家公司,集齐了所有的Shunyu Yao,那么它也就实现了AGI。
豆包2.0的目标,不是成为做题家
对于大模型,OpenAI、Anthropic、谷歌等全球顶尖的AI公司,都在不断地强调模型的通用性,以及其涌现能力。可字节在豆包2.0上,却来了一波“反向操作”。 字节跳动选择了一条更务实的路径。他们从真实业务场景倒推模型能力。 豆包团队发现,企业用户最高频的需求不是解奥数题,而是处理混杂着图表、文档的非结构化信息,然后在这个基础上完成多步骤的专业任务。 于是豆包2.0把优化重点放在了多模态理解、长上下文处理、指令遵循这些“不那么性感但很实用”的能力上。 这种路径选择可能更接近AGI的本质。 真正的通用智能不是在所有基准测试上都拿高分,而是能在真实世界各种杂七杂八的约束下,依然按要求完成任务。 一个能解IMO金牌题但无法完成企业报表分析的模型,和一个可以稳定完成业务流程的模型,哪个更“智能”? 豆包2.0的答案很明确。 我把这段话发给了豆包2.0,它回答我说 虽然有些阿谀奉承、迎风拍马,但我们的观点是相似的。 01 豆包2.0来了 就在2026年情人节这天,豆包更新了2.0版本。PC、网页版、手机用户都可以从对话框选择“专家”模式,以开启豆包2.0。 与此前版本相比,豆包2.0的核心变化在于从“能解题”转向“能做事”——针对大规模生产环境的使用需求进行了系统性优化。 豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和一款 Code 模型。 豆包2.0Code 接入了AI编程产品TRAE,而火山引擎也同步上线了豆包2.0系列模型API服务。 从公开的基准测试数据来看,豆包2.0 Pro在多个维度上取得了有竞争力的成绩。 豆包2.0在IMO、CMO 数学竞赛和ICPC编程竞赛中获得金牌成绩,在 Putnam基准测试上超越了Gemini 3 Pro。 在HLE-Text(人类的最后考试)这项综合性评测中,豆包2.0 Pro得分54.2,在参与对比的模型中排名第一。 不过需要注意的是,基准测试成绩与实际应用表现之间存在差异。 字节跳动团队自己也承认,豆包2.0在端到端整体代码生成、上下文学习等方面,与国际领先模型相比仍有提升空间。 这种坦诚的表态,比单纯强调优势更有说服力。 在科学领域知识测试中,豆包2.0的表现与Gemini 3 Pro和GPT-5.2处于同一水平线。 在SuperGPQA测试中,豆包2.0 Pro得分68.7,略高于GPT-5.2的67.9。在HealthBench测试中得分57.7,排名第一。 这些数据表明,相较于豆包1.8,新版本的豆包在长尾领域知识覆盖上有所加强。 豆包2.0在多模态理解上的提升是全方位的。 在视觉推理方面,模型在MathVista、MathVision等基准上达到了业界最优水平。 这些考试比简单的图像识别要复杂得多。 因为这些测试的目的,是考察模型能否从图像中提取数学关系、理解几何结构、进行逻辑推演。 在文档理解场景中,豆包2.0在ChartQA Pro与OmniDocBench 1.5基准上的表现达到顶尖水平。 现实中的文档往往是表格、图表、文字、公式混杂的复杂版式,模型需要准确识别结构、提取信息、理解关系。 在长上下文理解方面,豆包2.0在 DUDE、MMLongBench等测试中取得了较好成绩。 视频理解是豆包2.0的一个重点优化方向。 在TVBench、TempCompass、MotionBench等测试中,豆包2.0处于领先位置。 值得注意的是,在EgoTempo基准上,豆包2.0的得分超过了人类水平。这个细节说明,模型在捕捉“变化、动作、节奏”这类时序信息时,可能比人类更稳定. 豆包2.0还支持流式实时视频分析,可以实现环境感知、主动纠错与交互。这种能力的应用场景包括健身指导、穿搭建议等,模型能实时观察并给出反馈,而不是事后分析录像。 02 豆包团队如何实现? 其实豆包2.0的这些提升背后,涉及到了多个层面的优化。 多模态融合架构的改进是基础。 传统的多模态模型是把视觉编码器和语言模型简单拼接,视觉信息和文本信息的交互深度不够。 豆包2.0强化了视觉与语言的深度融合,让模型能更好地理解图像中的语义信息。 人类看一张图,它是包含因果关系的。 就拿这张图来说,传统多模态大模型看到这张图,它理解的是“姚顺宇”、“话筒”、“手”、“西装”。 但是人类理解这张图是“姚顺宇西装革履拿着话筒正在演讲”。 即使图片是静态的,也能因为他的神态、穿着来判断此时正在做什么。 此外,豆包2.0对注意力机制的改进,为它带来了长上下文处理能力的提升。 处理长文本或长视频时,模型需要在海量信息中保持注意力,不能顾此失彼。 就比如你在阅读这篇文章的时候,A部分出现了大量的技术名词、术语,你也只会挑其中的图片以及数字来一目十行地看,不会逐字逐句认真看。 因此豆包2.0其实是以人类读长文章时那样,自动抓重点,而不是平均分配注意力。 技术上,这需要更高效的注意力计算方法和更合理的信息筛选机制。 最后,豆包2.0推理能力的提升不只是记住更多知识,而是真正提升了从已知推导未知的能力。 这涉及到训练过程中对推理链的显式建模,让模型学会“一步步思考”而不是直接给答案。这种能力在解决复杂问题时尤为重要。 03 现实不是竞赛 字节跳动团队观察到一个现象,语言模型已经可以顺利解决竞赛难题,但放在真实世界中,它们依然很难端到端地完成实际任务。 比如一次性构建一个设计精良、功能完整的小程序。 这个鸿沟的原因主要有两点,第一是知识覆盖的问题。 竞赛题目通常聚焦在数学、编程等核心领域,而真实任务往往涉及长尾领域的专业知识,比如前文提到的医疗、法律、工程、商业等等。 第二是指令遵循的问题。 真实任务通常包含多个步骤、多重约束,模型需要严格按照要求一步步推进,不能跑偏,不能遗漏。 豆包2.0试图通过系统性加强长尾领域知识和强化指令遵循能力来弥合这个鸿沟。 从测试数据来看,在深度研究任务、复杂agent能力评估等方面,豆包2.0达到了业界第一梯队水平。 在客服问答、信息抽取、意图识别等高频应用场景上,模型表现也比较稳定。 播客中给出了一个有意思的案例——高尔基体蛋白分析。 豆包2.0不仅能给出总体实验路线,还能把基因工程、小鼠模型构建、亚细胞分离与多组学分析串成完整流程,细化到关键环节怎么做、用什么进行对照、用哪些指标评估纯度。 相关领域专家表示,这个方案在跨学科的实验细节与步骤化表达上,超出了他们对大模型的预期。 不过,从“能给出方案”到“方案真正可行”,中间还有验证的距离。这个案例更多说明模型在知识整合和表达能力上的进步,而不是说它已经能替代科研人员做实验设计。 众所周知,AI编程是2026年最火的赛道,豆包2.0 Code是针对编程场景优化的版本,已上线TRAE作为内置模型。 字节团队展示的案例是“TRAE春节小镇·马年庙会”互动项目。通过1轮提示词构建基本架构,再经过几次调试,总共5轮提示词完成作品。 这个小镇里有11位由大语言模型驱动的NPC,会根据人设自然聊天、招呼顾客、现场砍价。 AI游客自己决定去哪家摊位、买什么、说什么。 其中,烟花升空时的祝福语、孔明灯上的题词都由AI即时生成。每次进入小镇,看到的互动都可能不同。 这个案例展示了豆包2.0 Code模型在快速原型开发上的能力。不过需要注意的是,从原型到产品之间还有很长的路要走。 从字节跳动的策略来看,豆包2.0强调“面向真实世界复杂任务”,这是一个务实的定位。 通过分析真实使用场景来指导模型优化,而不是单纯为了刷榜。 这种以需求为导向的研发思路,可能比单纯追求基准测试分数更有价值。
赚翻了!小伙5个月用AI做120多个App:只需验收上架 90%都有付费用户
快科技2月14日消息,一名小伙靠AI打造出专属的App开发流水线,5个月成功上线120多个 App,其中90%都拥有付费用户,产品还火到了海外市场。 他的日常工作十分轻松,仅需要对 AI 生成的 App 完成验收、上架即可。 这位小伙是1997年出生的杭州本地人张三,职高毕业的他有着丰富的职业经历。他做过测绘、干过酒店,后来转行踏入软件架构领域,还探索过物联网相关方向。 从去年8月开始,张三走上了用 AI 批量生产App的创业之路,这是一条少有人走的新路径。他搭建的 AI 流水线能精准捕捉市场需求,成为了他创业路上的核心助力。 张三让AI承担了开发的核心工作,让其扫描全球不同国家、不同行业的需求,挖掘那些“有人需要、但还没人做”的应用缺口。从需求挖掘到App生成,全流程都由AI完成,他每天醒来电脑里都会有两三个新生成的App。 当下的 AI 浪潮,让可以创造独特价值的OPC(One Person Company,“一人公司”)创业模式成为了现实。 AI不再只是简单的辅助工具,更成为了年轻人创业的最佳 “合伙人”,帮他们打造专属的商业系统。 OPC模式之下,作为“超级个体”的人,重要性更加凸显。OPC对创始人的要求极高,一人公司或小团队要全部负责战略规划、产品研发、AI训练等,需要极强的综合素质,以及人机协同融合的能力。 一位OPC负责人说,要打磨全流程能力,AI能辅助工作,但人必须比AI更懂行业。
iPhone 17e即将登场:终于补齐关键功能
快科技2月14日消息,去年iPhone 16e虽然凭借价格优势吸引了一定关注,但因砍掉MagSafe等核心功能而引发不少争议。 如今,新一代iPhone 17e的爆料浮出水面,相较于前代虽未进行大幅调整,但在处理器、连接能力及MagSafe等关键功能上的补强,将显著提升整体完成度。 外观设计方面,Jon Prosser称iPhone 17e可能采用较新设计语言,甚至将刘海屏升级为动态岛,不过他也坦言这一变动并非确定。 多数供应链分析师认为苹果仍会沿用刘海设计以维持产品线区分,屏幕规格预计维持6.1英寸与60Hz刷新率,高刷特性继续留给Pro系列独占。 iPhone 17e预计还将搭载A19芯片,但可能采用降规版本,实际效能略低于iPhone 17系列完整版,配合8GB内存,整体表现仍将优于前代,满足社交、影音及游戏需求绰绰有余。 连接能力同样获得强化,新机据传配备C1X数据芯片与N1无线网络芯片,移动网络与Wi-Fi稳定性有望提升。 续航方面,电池容量维持4000mAh不变,但若新芯片功耗控制优化,实际续航表现可能更理想。 相机系统延续4800万像素单摄设计,低光拍摄能力或有所改善;前摄则明显升级至1800万像素,并支持人物置中功能,对视频创作者与远程办公用户更为友好。 最受关注的改进当属MagSafe可能回归,iPhone 16e砍掉磁吸功能被用户诟病为过度精简,若此次重新加入,磁吸充电器、卡套等生态配件将无缝兼容,日常体验大幅提升。 配色除经典黑白外,苹果曾测试薰衣草色版本,但是否上市仍存悬念,如果爆料属实,苹果将在2月下旬正式发布该机型。
我用豆包大模型2.0手搓了macOS,Seedance 2.0后字节再送春节AI大礼
这两天,朋友圈几乎被 Seedance 2.0 的视频刷屏了,感觉人人都能当导演。不过,就在大家都在看热闹、讨论 AI 怎么颠覆好莱坞的时候,豆包大模型 2.0 的全家桶,刚刚正式发布了。 这也是豆包大模型自 2024 年 5 月正式发布以来首次跨代升级。 说实话,作为把 AI 当生产力工具的老韭菜,我最关心的其实就两点:能不能干活?能不能便宜点?对此,这次豆包大模型 2.0 版本的更新,给出的答案很朴实:读懂图表文档、看懂长视频、写出能用的代码,并且把价格打下来。 而且,这次不仅仅是一个单体模型的升级,而是一整套「组合拳」。 豆包大模型 2.0 系列包含 Pro、Lite、Mini 三款通用 Agent 模型和 Code 模型,灵活适配各类业务场景,其中现在打开豆包 App、电脑客户端或网页版,点击「专家模式」,即可第一时间体验全新升级的豆包大模型 2.0 Pro: 豆包 2.0 Pro:堆料狂魔,专攻深度推理和长链路任务,官方说法是全面对标 GPT-5.2 和 Gemini 3 Pro, 2.0 Lite:主打一个「既要又要」,性能和成本的平衡大师,综合能力已经反超了上一代的主力豆包 1.8。 2.0 Mini:低时延、高并发,专门给那些对成本极度敏感的场景准备的。 Code 版(Doubao-Seed-2.0-Code):程序员特供,建议配合 IDE 工具 TRAE 食用,疗效更佳。 比人类还懂视频,豆包大模型 2.0 的多模态理解有多强? 如果说文本模型是 AI 的大脑,那么多模态理解就是它的眼睛。 官方技术报告显示,豆包大模型 2.0 系列在 VLMsAreBiased、OmniDocBench 等基准上均取得了业界最高分。 数据很枯燥,我们找来了一张网友恶搞的「整活」图片——一瓶号称 「20 合一的男士洗发水」。瓶身上密密麻麻地堆砌着各种类型的产品。 扔给豆包 2.0 Pro 后,即便文字被截断,它依然通过上下文清晰识别。而且,它没有傻乎乎地介绍产品,而是明确指出这是一种「整活」。 这对应了官方数据中提到的 ChartQAPro 和 OmniDocBench 1.5 的顶尖水准——它不仅在看,而且在理解信息的层级关系。 这种「理解力」放在工作场景里就是生产力。 大量的真实用户查询涉及复杂的图片——截图、图表、扫描文档。我试着把一份关于豆包大模型 2.0 自身的技术文档扔给它,要求进行解析。结果没想到,它不仅提取了关键信息,还搭配脑图和 PPT 生成,形成了一整套比较完整的框架。 甚至在视频理解上,它也展现出了「追剧党」的潜质。技术报告中提到,豆包大模型 2.0 在 EgoTempo 基准上超过了人类分数。 真的比人强?我们扔给它一张《何以笙箫默》的剧照,问:「从这张照片中,可以看出男人是南方人还是北方人?」 这是一个典型的「视觉 + 知识 + 推理」的混合考题。豆包大模型 2.0 的反应非常快,不仅认出这是电视剧《何以笙箫默》及演员钟汉良,也结合原著设定给出了一份深入且清晰的分析报告。 甚至在长视频理解上,它在 TVBench 和 MotionBench 上的高分也体现在了实测中:它能从一段长视频里精准分析动作节奏。对于需要处理监控流、体育赛事分析的行业来说,这含金量要高得多。 科研级大脑遇上生活小白 在逻辑推理方面,基准测试结果显示,豆包 2.0 Pro 在 SuperGPQA(研究生级问答)上分数超过了 GPT-5.2,在 IMO(国际数学奥林匹克)测试中更是获得了金牌成绩。 无论是「孙悟空既然学了长生术,为何 342 岁还是阳寿已尽?」,还是「两把武器,一把攻击 1~5,一把 2~4,从数据角度,哪把更厉害?」这些问题,显然都不会难倒豆包。 不过,就是这样一个能解奥数题的「学霸」,却在一道 50 米洗车常识题「我想去洗车,洗车店距离我家 50 米,你说我应该开车过去还是走过去?」依旧回答错误。 正常人想的是,开车去,不然洗啥?豆包 2.0 Pro:陷入了深度的「过度推理」。它开始分析距离成本、步行健康收益、车辆启动损耗……最后一本正经地建议我走过去。 这也是当前大模型普遍存在的问题,即便它们拥有科研级的推理能力,但依然缺乏基于物理世界的常识性直觉,只能说是任重而道远。 能帮你早下班的 AI 才是好 AI 这次更新最大的野心,其实在于 Agent(智能体)。Seed 团队发现了一个痛点:模型能做题,但干不了长链路的(比如写一个完整的 APP,或者设计一个实验)。 为了解决这个问题,豆包大模型 2.0 重点强化了指令遵循和长程任务。在 HealthBench 上拿到第一名,在 FrontierSci 上表现强劲。 体现在实测中,就是它真的能当「科研助理」用了。把一个生物学难题——「高尔基体蛋白分析」扔给它时,它没有泛泛而谈。它不仅给出了总体路线,甚至把基因工程、小鼠模型构建、多组学分析串成了一条完整流程。 至于编程方面,为了验证豆包大模型 2.0 的「含码量」,我们直接打开了字节自家的 IDE —— TRAE,调用了专门针对编程优化的 Doubao-Seed-2.0-Code。 比如让它使用 p5js 创建令人惊叹的多色交互式动画,效果相当不错。代码一次跑通,屏幕上涌动的色彩不仅流畅,而且交互逻辑完全符合预期。 接着,我们要求它用纯代码手搓一个 macOS 的桌面系统。Dock 栏的动效、窗口的层级、顶部的菜单栏,完成度较高,不过审美还有待提高,整体表现中规中矩。 正如豆包大模型团队在其模型卡中所说: 需要注意的是,Seed2.0 系列与国际前沿的大语言模型仍存在差距。Seed 已明确提升模型应对现实世界复杂性的能力方向,并为此在相关方面投入大量精力,对 Seed 模型系列进行优化。 但这一切在价格面前都不重要了。因为豆包大模型 2.0 在提升性能的同时,Token 定价降低了约一个数量级。 这是一个非常现实的商业逻辑。当推理成本更具性价比,很多诸如全量的文档分析、实时的视频流监控的场景,突然就变得可行了。 图片 结合那份长长的基准测试报告,我最大的感受是两个字:务实。它并不完美,但对于打工人来说,一个能帮你读懂图表、能写出扎实代码、且价格划算的 AI,或许会实用得多。 毕竟,能帮我们早点下班的 AI,才是好 AI。
春节大模型混战升级:豆包2.0冲击最强多模态Agent,超级AI牛马搞定企业级难题
作者 | 云鹏 编辑 | 漠影 春节将至,国内AI大模型赛道好不热闹,多款国产模型更新引爆海内外,不少海外网友都“跪求”体验方式,2026开年AI档,还要看中国玩家。 在这场AI盛宴之中,我们看到各类超级Agent走到舞台C位,AI逐渐深入到具体的工作流中,甚至开始帮企业啃下真正的“硬骨头”任务。 AI从“玩具”转向“工具”,这一趋势十分明显、 在国内AI模型爆更热潮中,字节火山引擎成为其中代表性玩家,重磅新品发布不断,主打一个“量大管饱”,近三天直接新模型“三弹连发”: 12日豆包视频生成模型Seedance 2.0正式登场、13日图像创作模型Seedream 5.0 Lite发布,今天,最新多模态Agent模型豆包2.0(Doubao-Seed-2.0)正式登场,这也是豆包大模型自2024年5月正式发布以来首次大版本的跨代升级。 总体来看,豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型,经实际体验测试,其在企业级Agent能力、多模态理解、推理代码能力及灵活工具调用能力方面都有着显著增强,在真实长链路任务中表现亮眼。 豆包2.0在各类视觉理解任务上实现SOTA,视觉推理、感知能力、空间推理与长上下文理解能力表现突出,在大多数相关基准测试中取得最高分 在推理和Agent能力评测中,豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,在Putnam Bench上超越Gemini 3 Pro,在HLE-text(人类的最后考试)中,豆包2.0 Pro取得最高分54.2分,在工具调用和指令遵循测试中成绩领先 在豆包2.0的加持下,我们可以轻松拥有一个可以实时互动的AI健身教练: 或者基于给定图像,精准生成匹配的matplotlib Python绘图代码,实现图像到绘图代码转化: 豆包2.0还可以直接操作软件执行专业复杂任务,比如进行CAD设计与操作,建模并完成几何参数提取: 在当前行业聚焦攻克AI处理企业复杂长任务的大趋势下,豆包2.0无疑成为字节火山引擎在企业级市场的重要一步。 目前,豆包2.0 Pro已在豆包App、电脑端和网页版上线,我们只需要选择专家模式就可以体验,火山引擎也上线了豆包2.0系列模型的API服务。 豆包App界面 一、实测上手惊艳:一句话制作专业可视化报告、轻松开发网页游戏,自主调用海量工具技能 今天,我们看到AI大模型赛道一个突出的趋势,就是行业更在乎模型实际做事的能力,尤其是当AI开始深入产业、企业之后,公司更关心的是AI能否真正扛起任务、给公司创造生产力。 从实际体验效果来看,豆包2.0,是真的可以称得上是企业级“超级AI牛马”了,新模型在多模态理解、企业级Agent能力、推理和代码编程方面的表现都令人印象深刻。 在企业级Agent和多模态能力方面,我们首先考察了一个常见场景:针对某一主题,汇总数据、制作表格、可视化分析、给出分析和策略建议。 需求为:汇总梳理2025年1月1日至2025年12月31日发布的所有智能眼镜产品,将产品名称、发布日期、价格、厂商、主要参数配置、核心亮点汇总整理成表格,并据此生成可视化报告,至少要包括价格分布、产品发布数量趋势、产品类型分布等,分析当前智能眼镜市场发展特点,如果一家创业公司想要入局AI眼镜市场,给出建议的市场策略。 这个需求十分复杂,涉及Agent拆解复杂任务、自主多轮工具调用、多模态数据转换、深度调研分析等多方面能力的考察。 从最终呈现效果来看,豆包2.0制作的可视化网页十分美观、简洁、重点突出,要点信息齐全,要素呈现直观。 同时,页面信息汇总比较全、准确性较高、可用性较强,不论是产品名称、价格还是产品特点,都提炼的较为准确,需要调整修改的地方并不多。 AI给出的分析性内容逻辑性比较强,有一定深度,给出的结论和建议有根据出处,并非传统AI生成常见的“假大虚空”内容。 值得一提的是,这一复杂长程任务涉及公开信息收集梳理、用Python脚本创建可视化报告和图表,涉及文字、图像、表格、网页等多模态数据的转换,同时需要Agent自主调用大量工具,而豆包2.0完成任务的全程几乎不需要干预,仅有必要的系统权限授权确认即可。 此外,我们考察了Agent根据长文本内容生成指定主题PPT的能力,需求为:根据给定的一份万字左右的会议纪要,生成一份关于季度销售数据汇报的PPT,要求内容可视化程度高、数据呈现形象直观,不要有大段文字,PPT风格简约商务。 从最终PPT生成效果来看,PPT制作的风格符合要求,同时在设计上比较简约、美观。 最重要的是,其主要的数据均与会议纪要一致,数据准确,基本不需要调整修改。PPT中的图表制作较为美观,数据呈现直观。 此外,PPT整体的逻辑结构比较清晰,有头有尾,结尾甚至用上了“凝心聚力”这样的常用网红热词。 在图文多模态内容转换方面,我们还让Agent根据一家企业财报的多个图表(包括柱状图、折线图、饼状图和文字表格),提取其中关键信息,生成关于财报数据的汇总表格,从呈现结果来看,其数据提取准确,可用性强。 在企业级AI非常重视的代码能力方面,我们使用TACE进行了测试。首先,我们直接提出了热门的网页游戏开发制作需求: 从头开发一款休闲卡通风格的“黄金矿工”游戏,游戏核心机制是摆动的钩爪,玩家需要通过精准的时机预判来抓取不同重量和价值的物品,以此平衡风险与回报。核心功能要包括升级(钩爪速度、炸药、幸运值)关卡商店,游戏模式有带BOSS战的剧情模式、对战模式、合作模式。游戏要有匹配的音效和动画效果,最后直接以网页版游戏形式呈现,要直接可玩。 我们看到,Agent在收到需求后直接开始创建详细的游戏开发计划,梳理出8个待办事项,并依次执行。在完成游戏设计后,Agent还测试并优化了游戏体验,确保可以直接游玩。 从最终游戏成品来看,黄金矿工游戏与我们印象中的经典版本十分接近。 游戏完成度较高,从游戏玩法、核心功能、游戏模式到动效、音效都有比较好的呈现。 Agent甚至自己给游戏添加了文本剧情说明,这是比较出彩的地方。整个游戏的画面风格简洁、直观,操作比较流畅。 交互项目设计方面,官方给出了更进一步的案例,基于TRAE,豆包2.0可以直接开发一个关于马年庙会的互动项目,只需要1轮提示词就能构建出基本的架构和场景,整个作品完成只需要5轮提示词。 场景中,多位由大模型驱动的NPC回根据人设自然聊天,还会招揽顾客,甚至是砍价,AI游客们会自己逛庙会,场景中有烟花声控、孔明灯题词,均由AI即时生成,并且每次进入小镇看到的互动都不相同 除了游戏和交互项目设计,给公司制作指定主题的网站也是当前考验Agent编程能力的一个关键项目,我们给Agent提出如下需求: 为一家人工智能公司设计官方网站,融入地球主题元素。使用黑、白、蓝、灰作为主色调,营造出酷炫、精致且充满科技感的氛围。我特别需要一个能让用户感到震撼的精美地球动画。 从网站呈现效果来看,最关键的“地球动效”的确有比较好的呈现,虽然与专业设计人工打造的动效还有一定差距,但整体视觉效果还是比较吸睛的,立体感十足,并且地球可以随着鼠标运动,这是比较亮眼的。 除了动效,网页制作的基本元素、色调、氛围都符合要求,并没有出现明显偏差,网站基本功能也都是完善的,包括公司愿景、口号、核心技术、成果等。整体来看,可用性较高,基本框架完全可以“拿来即用”了。 在更进阶的代码能力方面,根据官方实测,豆包2.0还可以完成Solovay-Kitaev算法修复这样的任务,这证明其具备数值分析直觉和几何代数知识,具备数学推理与代码修复的综合能力。 Solovay-Kitaev算法修复 此外,我们还考察了另一类企业常见的复杂任务:每日固定信息汇总梳理及可视化呈现。 我们要求Agent提供过去24小时内科技领域的重点新闻摘要。每条新闻要提炼一个核心要点,并附带网络检索来源,设计一个网页呈现这些新闻,每个新闻都要有配图,每个新闻的配图,如果原文中有就用原文的,如果没有,就生成一个适合的图配上。 从最终呈现结果来看,新闻抓取非常准确,时效性强,均为最近24小时内新闻,可用性强,并没有出现其他Agent常见的用旧闻当新闻的错误。 同时,网页可以很好地还原需求,包括网络检索来源、清晰易读、要点突出,整体网页制作美观度较高、有一定的设计感。 值得一提的是,网页中每个新的配图都基本符合对应的新闻要素,AI生成图片效果比较好。 最后,在多模态能力方面,我们重点考察了Agent对于图像的分析和理解能力,比如根据家中的几个全景照片,给出新购置扫地机器人的合理摆放位置建议。 Agent可以准确识别照片中的房间、家具,比如客厅、玄关、餐厅,沙发、餐桌、电视柜等,同时其给出的建议比较符合直觉(电视柜旁边、沙发旁开阔区域,避开玄关和餐厅)。 家中环境照片 给出建议 在图像3D空间理解、分析方面,Agent可以根据一份零部件的三视图,生成这个零部件的3D视图,还原零件立体结构,描述零件的核心功能与装配逻辑。 零部件三视图 零部件结构功能分析 Agent针对三视图,可以准确分析零部件的结构组成,对核心功能的描述比较准确,数据单位使用都较为专业和正确,可用性较强。 二、多项关键能力突破,让企业级Agent走入现实 从上述诸多实际体验中,我们看到豆包2.0在多轮指令遵循、工具调用能力、数据和图表处理、格式输出稳定性等方面表现都比较突出,支持更灵活的上下文管理。 模型在处理复杂任务中,自主进行各类工具的调用,执行复杂流程十分顺利,整个过程需要极少介入,全流程自动,模型多Skills、复杂Skills准确调用能力比较强。 这些特性都是企业级Agent所需要的关键能力,让Agent可以更好地支持企业级复杂、长程任务,对于数据分析和客服Agent等企业场景,这些能力几乎都是“刚需”。 与此同时,模型在多模态感知、高精度文字提取、图表理解、空间理解、运动理解、视觉知识和推理、长视频理解等方面同样表现出色,多模态能力的提升极大扩展了Agent能力的覆盖范围,也让Agent的易用性大幅提升。 在推理和代码能力方面,模型的推理能力(规划、思考、反思)有显著增强,并且支持思考长度的调节,在各思考长度下,Tokens效率都有提升;模型的代码能力,特别是前端开发能力有着令人印象深刻的表现。 从实际基准测试成绩来看,豆包2.0在考验视觉推理及感知的MathVision等基准测试中达到SOTA水平,运动感知方面,豆包2.0强化了对时间序列与运动感知的理解能力,在MotionBench等测评中成绩领先,此外,豆包2.0在指令遵循、复杂Agent能力评估中都已经达到业界第一梯队水平。 豆包2.0在视觉推理及感知、运动感知、真实世界任务等方面的基准测试表现 此外,豆包2.0在LLM、VLM、Agent等领域的任务评估中相较豆包1.8版本均有比较明显的提升。 三、AI从玩具走向工具,深入企业工作流 字节CEO梁汝波曾在演讲中点明企业级AI突破重要意义,以及字节对B端业务的理解和重要布局。 当前,行业已经形成共识:AI助手已远不止于搜索问答,从创作、生图、生成视频到强大的AI编程,AI快速扩展新场景。 在梁汝波看来,除了面向C端的AI助手产品,ToB领域也存在重大机会,MaaS(模型即服务)是现在火山引擎发展最快的业务。 字节跳动CEO梁汝波 从数据来看,已有超过100万企业和个人使用了火山引擎的大模型服务,超过100家企业在火山引擎上累计Tokens使用量超过了1万亿。根据Gartner报告,2025年火山引擎在全球AI应用开发平台的产品“执行能力”上,位于全球第五、中国第一。 可以说,火山引擎AI云服务一直跑在行业前列。 梁汝波提到,ToB业务对模型的长上下文、推理能力、代码等能力有更高的要求,同时做好ToC助手和ToB MaaS,模型能力才更全面。 豆包2.0此次的核心升级方向,正是字节重要AI业务策略的直观体现。 未来,企业级Agent的快速迭代升级必然会给更多行业带来深远影响,企业AI正从单一工具型AI进化为智能Agent型AI,而豆包2.0让我们看到顶级多模态Agent在变革企业生产力范式方面所展现出的巨大价值。 结语:超级AI打工人深入千行百业,企业生产力革命浪潮已至 此次基于豆包2.0实现的Agent体验令人惊艳,实际效果证明,AI是真的可以成为超级AI打工人,深入企业的。在诸多能力加持下,Agent已经不再是生产噱头性内容的“玩具”,而是真正拥有变革生产力潜力的强大工具。 回望近期AI大模型领域的发展,复杂长任务执行、多模态理解、出色代码能力等Agent特性已经成为行业竞争焦点。 在这样的大背景下,字节火山引擎从图像、视频等领域的专业模型到企业级全能Agent模型全方位升级,构建了颇为扎实技术底盘,也在这场焦灼竞赛中展露出自身的独特优势。 毫无疑问,今天的火山引擎已经成为AI赋能企业转型的核心推手。
当法拉利遇到包豪斯:纯电新车内饰由 Jony Ive 设计
今天凌晨,法拉利终于掀开了那块遮盖已久的红布,为我们展示了它们的首款纯电 GT——Ferrari Luce 的内饰设计。 第一眼看过去,你可能会怀疑这还是不是 2026 年的产物。在当下的汽车设计里,「未来感」通常意味着贯穿左右的联屏、触摸或者压感按键,还有无处不在的 RGB 氛围灯。 但法拉利这套内饰,老派得像是一台 70 年代的老爷车。 那个三辐方向盘颇有 Ferrari 308 GTB 的神韵,前方的三联表还保留了机械指针,再看那个尺寸克制、仅仅比 iPad mini 大一圈的中控屏,它孤零零地立在那里,没有任何要向副驾延伸的意思,底下甚至还有几个拨杆。 但当你凑近了看,一股浓烈的「苹果味」扑面而来。 那些复古的线条,全都是用现代 CNC 数控机床从整块铝合金上切削出来的。金属表面经过了细腻的阳极氧化处理,呈现出一种冷峻的哑光质感。中控屏右上方的按钮有点像 Apple Watch 上的数码表冠,每次按下,表盘都会有所作动。 远看是向恩佐·法拉利时代的致敬,近看却是工业设计能力的一次炫技——这就是法拉利与苹果前设计总监 Jony Ive 结盟后交出的第一份作品。 消灭按键的人,把按键带回来了 如果你对 Jony Ive 这个名字感到陌生,不妨看看你书桌上的设备。正是这个英国人,在过去的三十年里定义了什么是「现代科技的美学」。 从色彩斑斓的 iMac G3 开始,他让电脑摆脱了米黄色的塑料外壳;到 iPod 那个天才般的 Click Wheel,他改变了人类听音乐的方式;再到 Unibody 一体成型的 MacBook,以及那台彻底抹去实体键盘、教会全世界「在玻璃上滑动」的 iPhone,甚至连现在的 iOS 扁平化界面,也是出自他的手笔。 -editor-image-source- Jony Ive 和 Jobs 简单来说,他在苹果公司的职业生涯,就是一部不断做减法的历史:砍掉接口、隐藏缝隙、消灭按键,直到设备变成一块纯粹的、无缝的黑镜。 但在离开苹果、创立 LoveFrom 并与法拉利结盟后,那个曾经致力于消灭按键的 Jony Ive,现在却成了物理实体最坚定的捍卫者。 Jony Ive 认为,在什么场景,就应该给什么样的交互。 在手机和平板上,功能是无限的,应用是海量的,所以一块能变成任何形态的屏幕是效率最高的交互方式。但在驾驶舱里,最好的交互绝不是去屏幕的二级菜单里翻找,而是肌肉记忆。 法拉利 CEO 贝内德托·维尼亚(Benedetto Vigna)也很清楚这一点。这位在科技行业摸爬滚打了三十多年的高管直言: 科技应该从人类的情感出发。法拉利不需要用触摸屏来强调科技感,通过机械结构带来的阻尼感和确认感,才是对驾驶员最大尊重。 把视线聚焦到那个三幅方向盘上,你能直观地感受到这种尊重的重量。 它不仅仅是一个转向工具,更像是一件悬浮在驾驶舱里的现代雕塑。整个方向盘由单块铝材精密加工而成,MacBook 的 Unibody 的一体成型工艺,在这里被运用得淋漓尽致。 没有多余的拼接缝隙,没有廉价的塑料盖板,只有冷峻的金属光泽和纯粹的形态。 在这个金属骨架之上,法拉利植入了被称为「模拟控制模块」(Analogue Control Modules)的交互单元。 他们没有用那种看起来很酷但极易误触的电容触摸板,而是坚持使用了机械按钮、拨盘和开关——和其他现代法拉利一样,在激烈驾驶时,你的大拇指可以轻松找到它。 同样的逻辑也延伸到了启动过程。 现在的电动车大多是「上车即走」,高效,但无聊。法拉利偏要找回那种「唤醒猛兽」的仪式感。 Luce 的中控台上保留了法拉利标志性的钥匙底座,当你把它插入底座,机械结构会发出清脆的锁定声,换挡机构随之解锁,车辆正式进入待命状态。 有趣的是,法拉利不仅在 Luce 的中控台上安排了小档把,还在方向盘的后方安插了两个换挡拨片。 其实,Luce 并没有传统意义上的多速变速箱。这里的「换挡」,指的是一种全新的手动扭矩控制系统(Manual Torque Control): 当你拉动左侧拨片,动能回收力度增强,车辆产生类似降档的拖拽感,重心前移,更利于入弯;拉动右侧拨片,电机扭矩会阶梯式释放,带来类似升档的推背感。 为了让你掌握换挡的时机,法拉利还在时速表的上方设计了一条醒目的扭矩指示条,在需要升档的时候,这条光带会像 F1 赛车方向盘上的换挡提示灯一样不断闪烁。 这一套动作下来,你在心理上就不再是启动一台家用电器,而是在唤醒一台有灵魂的机器。这种心理暗示,对于一辆没有发动机轰鸣的法拉利来说,至关重要。 当法拉利遇到加州一号公路 视线穿过那个致敬经典的方向盘,前方的仪表盘设计同样充满了值得玩味的细节。 这里没有使用简单粗暴的一整块液晶面板,而是采用了独特的分层式结构。你会看到物理金属边框与高分辨率屏幕的叠加,机械指针与数字刻度的交错。 这种设计手法带有强烈的 Marc Newson 个人风格。 作为 LoveFrom 的另一位灵魂人物,Marc Newson 在工业设计界的地位丝毫不亚于 Jony Ive。从拍卖出天价的 Lockheed Lounge 躺椅,到曾与 Ive 联手打造的 Apple Watch,Newson 一直是「柔和极简主义」的大师。 他还是一个狂热的钟表迷。当年他创立的 Ikepod 手表,用圆润的飞碟造型和易读的表盘,颠覆了瑞士制表业的刻板印象。 而 Luce 的仪表盘确实有点 Ikepod 那意思,字体圆润、清晰、没有任何多余装饰,配合上老派的实体指针、刻度设计和外层的玻璃,要不是它的界面会变化,还真看不出那是屏幕。 值得一提的是最右侧那个独立的圆形模块,法拉利将其命名为「Multigraph」。 它看起来像是一个独立的机械仪表,被封装在精密的阳极氧化铝外壳和玻璃透镜之下。 在日常驾驶中,它安静地充当时钟或者指南针的角色。但当你通过头顶上的物理拉杆激活弹射起步模式时,这个模块会瞬间切换性格,变成一个专门的 5 秒倒计时秒表。 看着实体指针在机械盘面上倒数,那种压迫感和真实感,比起屏幕上跳动的像素数字,更能让人血脉偾张。 视线右移,来看 Luce 的中控屏。 这块屏幕设计得节制,它没有占据整个仪表台,而是像一块独立的面板一样悬浮在中央。 屏幕表面覆盖着高强度玻璃,边缘包裹着一圈铝合金框架。它甚至设计了一个专门的手柄,允许驾驶员和副驾根据光线角度手动调节屏幕的倾角。 若要在车辆移动时操作屏幕,这个手柄还可以充当掌托,避免手指因颠簸而点不中屏幕按钮。 最令人感动的细节在屏幕下方。 在这个连出风口风向都要进三级菜单调节的年代,Luce 居然保留了几个拨杆来控制最基础的功能,比如温度、风量和媒体音量。不需要等待系统动画,这种直给的机械反馈,在当下的汽车市场里,确实是一种昂贵的奢侈品。 在仔细研究官方发布的演示视频时,我们还在车机屏幕上发现了一个小彩蛋: 在媒体播放界面,正在播放的歌曲名字叫 「LoveFrom,」,歌手一栏写着 「California」。而专辑封面,是一面去掉了文字的加州州旗——那只著名的灰熊。 把目光移到旁边的导航地图,上面的路线显示,车辆正行驶在著名的加州一号公路(CA-1),位置大约在雷耶斯角(Point Reyes)附近,正一路向南,开往旧金山。 这是 Jony Ive 和 Marc Newson 留下的个人签名。这两个在加州生活了三十年的设计师,用这种极其隐晦的方式,定义了 Ferrari Luce 的灵魂。 Ferrari Luce 假想图 这些细节拼凑出了 Luce 真正的性格侧写。它不是那类要在蒙扎赛道把驾驶员晃吐的硬核刷圈机器,而是一辆真正的 GT(Grand Tourer)。 它属于加州的阳光海岸,属于长途巡航。 文 | 李华
真我 Neo8 体验:从性能、显示到影像来了一次全面升级,真正全面的性价比旗舰
最近,真我发布了 Neo 系列新机——真我 Neo8,首销价 2399 元,国补到手价 2039.15 元。 同样定位在 2000 元档的性能旗舰上,真我这次可算是给 Neo 系列来了一次非常全面的升级。不仅升级了骁龙芯片和更大的电池,屏幕性能再上了一个档次,还加上了潜望式长焦镜头,从主打性能的机型变成全方位提升的产品。 先讲最重要的性能,真我 Neo8 这次搭载最新的第五代高通骁龙 8 移动平台,搭配 LPDDR5X RAM 和 UFS 4.1 ROM 的储存组合。机身内置了大气流冷锋散热系统,总散热面积为 39225mm²,覆盖了 65% 的机身面积,以提升散热效能。 为了提升手机的性能释放能力,真我这次在 Neo8 的游戏空间中加入了新的极客性能面板,用户可以在自由调节 CPU、GPU 频率,还有内置五档温度调节,尽可能提升游戏性能。 Neo8 也搭载了新一代 GT 性能引擎,透过「先知能效调度技术」进行更精准的性能,提升重负载状态下的稳帧表现。 目前,真我 Neo8 支持《三角洲行动》、《暗区突围》、《和平精英》、《使命召唤手游》、《穿越火线手游》等游戏的原生 165 帧模式,《无畏契约》和《王者荣耀》的原生 144 帧模式,《原神》和《崩坏:星穹铁道》的 120 + 1.5k 超分超帧模式。 性能释放升级之后,真我在 Neo8 上加入了 PC 掌机模式。 这个模式可以绑定 Steam 账号并下载里面的内容,以及游戏存档同步的功能,目前《空洞骑士:丝之歌》、《哈迪斯 2》、《只狼:影逝二度》、《古墓丽影 9》、《女神异闻录 4 黄金版》等游戏。 屏幕部分,Neo8 用上了一块 6.78 英寸165Hz 三星苍穹屏。 屏幕搭载了三星 M14 发光材质,手动最高亮度为 1000nits,全局峰值亮度达到 18nits,局部峰值亮度可达到 6500nits,还有个 20% 窗口下支持 3800nits 显示的阳光模式。屏幕还支持「全亮度 DC 调光+硬件级低蓝光+智能护眼」组合,有 TUV 莱茵无频闪认证和可以智能调节显示参数,保证护眼的前提下提升显示准度。 屏幕显示刷新率最高位 165Hz,支持真我 GT8 Pro 同款的游戏触显同步技术,瞬时触控最高刀到 3800Hz,十字触控有 360Hz 报点率。 最直观的体验就是在 FPS 的时候操作可以更加跟手,开镜响应更快,显示的卡顿会在少一点。 续航方面,真我这次给到一块 8000mAh 的电池,容量比 GT8 标准版还要大 1000mAh。日常使用,只要不是经常用最高性能的模式打游戏,那坚持两天还是没有问题的。 比起续航能力,Neo8 充电性能的变化会来得更有吸引力。 手机支持 80W 闪充,并支持 UFCS、PPS、PD、QC 的全协议栈快充和旁路供电,8000mAh 的手机用自家快充组合需要 75 分钟,接入 AI 小电拼 Ultra 最高支持 51W 充电,0-100 充电需要 77 分钟。这个成绩看来,Neo8 是真的可以彻底告别官方充电器限制的一款产品。 影像部分,真我 Neo8 选择的是同价位非常罕见的「超广+广角主摄+潜望式长焦」标准三摄。 主摄用了索尼 1/1.56 英寸 5000 万像素传感器,原生焦段支持 8K 超清直出。长焦部分用上了 3.5 倍光学变焦的潜望式镜头,支持 7 倍无损变焦以及最高 40 倍的数码变焦。相机内有 AI 望远算法的加持,进一步听声远摄的清晰度。 此外,Neo8 内置了影调模式,用户可以直接在相机内滑动选取不同的色彩质感,也可以自定义色彩、锐度、颗粒等参数。人像模式支持了 1x、1.5x、2x、3.5x 和 4x 的选项,机内还提供了 Live Photo 慢动作,丰富相机玩法。 不过,放到这个价位的手机身上,能够实现超广、主摄、长焦的整齐覆盖,而且长焦用的还是潜望式长焦,这一点就已经比很多定位性价比的机型要好了。 最后来看看外观,真我 Neo8 用了透明玻璃后盖设计,后盖加入了新一代漫反射工艺,手机后盖受光的情况下可以见到不同的光影效果。 透明后盖下有通过单层透明立体分区工艺,透过立体分区视觉做出 11 种纹理深度差低到 1.2μm 的差异化纹理和微球面处理,增加了后侧细节的丰富度。 换成透明后盖之后,真我经典的觉醒光环设计回归到 Neo8 DECO 右侧,环绕着 NFC 模块,可以根据提醒、游戏状态、开机等场景做光效切换。 机身采用了磨砂金属中框,提升了整体的手感和外观质感。 最后看看售价,真我 Neo8 有五个储存版本,首销价 2399 元起: 12GB + 256GB:首销价 2399 元,国补到手价 2039.15 元 16GB + 256GB:首销价 2699 元,国补到手价 2294.15 元 12GB + 512GB:首销价 2899 元,国补到手价 2464.15 元 16GB + 512GB:首销价 3199 元,国补到手价 2719.15 元 16GB + 1TB:首销价 3699 元,国补到手价 3199 元
他从监狱出来,做AI Infra创业,融了690亿
智东西 作者 | 王涵 编辑 | 冰倩 他蹲过大牢,做过加密货币,现在转投AI基础设施,一次直接融资超100亿美元。 这一句话,浓缩了澳洲AI基础设施独角兽Firmus联合创始人兼首席执行官Oliver Curtis的十年。 智东西2月14日报道,2月9日,Firmus宣布获得了约100亿美元(约合人民币690亿元)的债务融资,融资由黑石集团与Coatue Management领投。这笔资金主要用于推进其旗舰基础设施计划Project Southgate,目标是建设遍布澳大利亚的AI训练与推理设施。 2025年11月,Firmus刚刚完成了一笔约3.25亿美元(约合人民币22.4亿元)股权融资,彼时公司估值已超40亿美元(约合人民币276亿元)。时隔短短三个月,这家公司的融资金额就翻了近30倍。 从争议人生到押注时代风口,Oliver Curtis与Firmus的崛起,是一个典型的跨界转型故事。这家从加密赛道转身的AI算力新贵,只用短短数年,就完成了从小众创业公司到全球顶级资本追捧的超级独角兽的蜕变,究竟是怎么做到的? 一、放弃加密货币,转型生产AI算力 2019年,拥有金融与工程背景的澳大利亚企业家Oliver Curtis、Tim Rosenfield、Jonathan Levee联合创立Firmus Technologies。该公司最初依托澳大利亚塔斯马尼亚地区低成本清洁能源与水电资源,布局高性能计算(HPC)与加密基础设施,专注设计节能型计算设施,服务加密货币挖矿与科研计算需求。 2022年,随着大语言模型与生成式AI爆发,全球算力需求急剧增长。Firmus团队判断,传统面向云存储、通用IT负载的数据中心架构,已无法适配AI训练所需的高密度、持续性GPU算力需求。 据此,Curtis与Rosenfield开始推动Firmus转型:率先提出“AI Factory(人工智能工厂)”理念,将数据中心定位为AI算力的专业化“生产线”,并自主研发面向GPU集群优化的模块化高密度架构HyperCube,实现快速扩展。该公司的设计理念也从单纯“节能”升级为“能效最优”,在冷却、电力分配及能源回收等环节实现系统性创新。 2023年,Firmus正式公布旗舰项目“Project Southgate”,计划在澳大利亚塔斯马尼亚州朗塞斯顿打造大型AI基础设施园区,致力于建成全球首批专为AI训练与推理设计的绿色算力工厂网络。 二、黑石Coatue狂砸700亿,2028年前实现1.6GW总算力容量 凭借“AI Factory”的独特定位与技术优势,Firmus很快获得行业巨头与资本市场的双重认可。 2024年,Firmus引入英伟达作为战略投资者,并加入NVIDIA DGX Cloud Partners 计划,这意味着全球AI开发者可以通过NVIDIA Cloud访问Firmus的GPU集群资源。 资本加持进一步加速了该公司扩张步伐。2025年,Firmus完成两轮大型股权融资,总额约5.5亿美元(约合人民币38亿元),投资方包括Maas Group、Coatue Management和黑石集团,Firmus估值在2025年底已突破60亿澳币(约合人民币292.8亿元)。 进入2026年,Firmus的规模化建设再获重磅资金支撑。2026年2月9日,Firmus宣布获得由黑石集团和Coatue领投的100亿美元(约合人民币690亿元)债务融资包,用于加速Project Southgate在澳大利亚的全国性部署。该项目的目标是在2028年前实现1.6GW总算力容量,成为亚太地区最大规模的AI基础设施网络之一。 在立足本土的同时,Firmus也在推进国际化布局与生态合作,先后与CDC Data Centres 和STT GDC建立战略合作,在新加坡和澳大利亚多个地点联合部署“AI Factory”节点。新加坡研究机构AI Singapore是其早期客户之一,使用Firmus算力训练大型语言模型SEA-LION。 三、百亿算力公司三人帮:有技术、有资本、有前科 Firmus Technologies的创始团队由三位具有互补背景的人士组成,他们在公司发展过程中各自担当了不同但关键的角色。 从左到右:Tim Rosenfield与Oliver Curtis. Firmus联合创始人兼首席执行官Oliver Curtis出生于一个金融背景家庭,其父亲曾是澳大利亚金融与采矿行业中的一位有影响力的前高管,这为Curtis提供了商业视角和资源网络。 在2016年,他作为一名经纪人因内幕交易被判刑并服刑一年,随后在数年内转向创业在2019年与 Rosenfield和Levee一起创立Firmus。 Curtis在Firmus发展早期以自有资本投入,并在随后多个融资回合中担任领衔角色,成功吸引了全球机构投资者如英伟达、黑石集团、Coatue和Ellerston Capital等的注资,这一系列资本事件不仅推动了公司估值快速攀升,还为后续大规模建设AI基础设施打下了资金基础。 联合创始人兼联合CEO Tim Rosenfield的职责更偏向工程方面,亲自参与Project Southgate等重大项目的规划与现场考察。 Curtis的第三位联合创始人Jonathan Levee则更偏向于技术研发与工程系统层面的工作。在Firmus的早期文件与对外介绍中,Levee被描述为“研发总监”,主要负责建立支持“AI Factory”的关键技术堆栈。 结论:算力告急,资本重金投向AI基础设施 从加密货币矿场到AI算力工厂,Firmus用三年时间完成了一次关键的赛道切换。凭借着这一风口,Firmus获得了百亿融资。 这一巨额融资正是AI产业算力紧缺的缩影。大语言模型和生成式AI的快速迭代,使算力资源成为全球科技竞争的稀缺资产。
外卖员“活久见”:跑腿1km,帮Waymo关了个门
没想到,能自己开车、驰骋在美国六大城市的2500辆Waymo,会被最简单的小事难住了—— 车辆没法自己关门。 也就是说,如果乘客忘记关车门,这些无人车只能待在原地,既耽误车队运营,又可能阻碍交通。 而这种问题,远在菲律宾的云端安全员必然无法解决,可派人去现场只为关车门,未免也太低效了。 怎么办呢? 近期有网友发现,Waymo已经找到了解决办法:花钱雇外卖小哥帮忙关车门。 不过新的疑问也随之出现,这钱谁来出呢? Waymo雇外卖小哥帮忙关门 如果不是网友发现,或许还不会有人想到这个问题—— 如果乘客没有关好车门就离开,Waymo无人车很可能无法继续行驶。 不过现在看来,Waymo目前已经找到了解决方法。 在社交平台Reddit上,一位DoorDash(美国最大外卖平台)的“外卖小哥”,讲述了他发现这一问题的来龙去脉。 当时他在等待接单时,看到订单中出现了一个奇怪的需求: 司机无需送餐,只需要到距其1公里的一辆Waymo无人车旁边,把车门关上,就能获得6.25美元的报酬。 而且确认完成后,司机还能再得5美元奖励。就是说他帮Waymo关了一下车门,共获得了11.25美元(约78元)的报酬。 车能自己驾驶、处理各种复杂的路况,但没法自己关门……属实是把网友逗乐了: 很快,Waymo出面证实,最近确实正在美国亚特兰大市试点这种方法:当Waymo车辆车门没关好时,附近的DoorDash外卖员会收到通知,帮助车辆能够尽快重新上路。 这里补充一个背景,DoorDash成立于2013年,是由三名斯坦福大学华裔学生创办的外卖送餐平台,现在已经是美国外卖配送龙头。 去年10月,Waymo刚和DoorDash达成合作——在美国凤凰城都会区,DoorDash用户订餐时,可以选择Waymo的无人车送上门。 Waymo透露,这个试点项目,是公司和DoorDash共同寻找的一种新的、更灵活的方式,以此让DoorDash的送餐员能赚取更多收入。 其实,这不是Waymo第一次在“关门问题”上向外寻求帮助。 之前Waymo曾在洛杉矶和Honk(道路救援服务平台)合作,如果Honk用户帮忙关上Waymo的车门,最高可获得24美元(约166元)的报酬。 评论区里也有人现身说法,说自己也接到过类似的需要。还有人拍了视频,解释了为什么会屡次出现这种门关不好的情况——通常是安全带夹在门缝里了: 所以网友调侃,吓唬一家自动驾驶公司,只需要一张安全带照片就够了: 不过更多人关注的一个点是,Waymo是否会从未关门的乘客车费里扣钱。 如果不收费,对于本就花费巨大、迫切需要降本的自动驾驶公司来说,运营成本又多了一项支出,盈利似乎更远了。 不过大家似乎是发现了一种不得了的赚外快方式 : 玩笑归玩笑,外界推测Waymo大概率不会额外收费,不过要根本解决这类“车门”问题,当务之急是装上自动门。 Waymo也在对外声明中明确,以后推出的Waymo无人车,将配备自动关门功能,不过什么时候推出就未可知了。 毕竟Waymo的第六代新车,这才刚刚上路。 Waymo部署第六代无人车,冲刺100万周订单 Waymo近期宣布,公司已经正式部署第六代Waymo Driver系统,车内无需安全员就能上路运营。 据公告介绍,这是Waymo耗时7年凝结的结晶,累计行驶里程近2亿英里(约3.2亿公里)——能绕赤道8032圈,覆盖十多个主要城市的核心区域和高速公路。 和第五代系统相比,第六代系统将传感器数量减少了约42%: 摄像头从29个减少到13个,激光雷达从5个减少到4个,同时仍配备6个雷达。 不过,Waymo强调,虽然传感器数量减少,但新系统能提供更高的分辨率、更远的探测距离和更强大的计算能力。 摄像头系统的核心是1700万像素的成像器,Waymo称,其性能远超普通车载摄像头和人眼,拥有超宽动态范围,可在强光下捕捉阴影处关键细节。 通过定制设计的芯片和光学设计,Waymo还开发出了一套探测距离更远、精度更高、稳定性更强的激光雷达系统。 激光雷达的场景照明、内部数据处理方式也进行了重新设计,帮助激光雷达穿透恶劣天气,并避免在高反射标志附近出现点云畸变,增强了系统在复杂极端情况下,穿透厚重路面喷溅物的能力。 雷达采用的是灵敏度更高、价格实惠的雷达芯片组,能够生成高密度、高时序的地图,在各种光照和天气条件下即时追踪物体的距离、速度和大小。 整套系统采用疏水涂层,集成了清洁系统,以及可更换的模块化传感器组件,以便适应恶劣天气。 更关键的是,在性能提高的同时,传感器组件的成本也随行业平均水平一起下降。 据媒体Electrek分析,第六代Driver系统的单价预计会低于2万美元(13.8万元),比第五代系统降低了50%以上。 而Waymo的这个新系统,被设计成可跨平台适配,目前计划搭载于两款车型上: 一款是极氪打造的极氪MIX同款,Waymo将其命名为Ojai,这款车型上下车高度较低,具备集成式B柱车门。 目前,Ojai已经开始在美国旧金山湾区和洛杉矶投入使用。 另一款是现代汽车提供的IONIQ 5。 按照计划,现代会在2028年之前,向Waymo提供5万辆IONIQ 5当作Robotaxi,预计每辆车的价格约为5万美元。 据Waymo CEO特克德拉・马瓦卡纳(Tekedra Mawakana)透露,Waymo计划到今年年底,在美国的周订单数将超过100万次。平均下来,每分钟完成99单,每秒完成1.65单。 不过,第六代能不能自己关门,还有待观察…
今年首个AI硬件爆款!冲上全国Top 1,腾讯前AI大牛入局 | 智东西对话创始人
作者 | 李水青 编辑 | 心缘 智东西2月12日报道,近日,一款2026年横空出世的AI新硬件登上了京东、天猫、抖音各大平台的销量榜单,一度冲上京东早教益智热卖榜Top 1、抖音国家补贴带货榜Top 1及天猫智能儿童手表新品榜Top 2。 这是前腾讯大模型科学家、现任西湖大学AGI实验室负责人张驰作为首席科学家参与创业的听力熊公司,刚刚在今年1月初推出的一款聚焦儿童陪伴的AI对话智能体硬件——Mooni M1。 Mooni M1登上京东早教益智热卖榜Top 1、天猫智能儿童手表新品榜Top2 Mooni M1登上抖音国家补贴带货榜Top 1、电子教育带货榜Top2 号称国内首款K12“AI Pin”形态设备,Mooni M1具备情绪治愈、双语对话、百科回答、AI电台、通讯定位、故事创作、旅游攻略等多项功能。 智东西第一时间拿到了这款设备,发现它就像一个装着一位AI小伙伴的挂件,自带联网功能,擅长很多儿童相关的话题,对话反应时延也比想象得低很多。 听力熊首席科学家张弛在讲解产品 而在一个多月前的CES 2026上,听力熊面向欧美市场的随身机器人Mooni Pro,登上Gadget Flow、Wareable等国际知名科技媒体及中国品牌出海委员会评定的 “Best of CES”榜单。它不同于Mooni M1侧重陪伴对话,而是聚焦以拍照记录的方式 “连接孩子与物理世界” ,通过拍照识别、语音对话、成长记录等AI功能,打入孩子的日常生活场景。 获“Best of CES”奖项的听力熊Mooni Pro 听力熊创始人兼CEO袁琳,是两位“10后”孩子的母亲,每年与数千名“10后”青少年对话。 她的设计哲学近乎“叛逆”:禁用刷短视频式的内容流,放弃强激励游戏机制,也不以用户使用时长为核心指标。袁琳说:“我们不想要孩子‘上瘾’,我们想要他们‘愿意长期主动使用’。”这已是袁琳的第二次儿童硬件创业,她曾作为核心成员打造出年销超10万台的儿童机器人第一品牌“布丁机器人”,向ROOBO的联合创始人兼总裁(也是宇树科技重要的早期投资人)尹方鸣汇报。 听力熊创始人兼CEO袁琳 为什么顶级AI科学家和连续创业者,都把目光锁定在“儿童AI伙伴”这个细分赛道?一款“不逼学习”的产品,又如何能在巨头林立的AI教育硬件市场找到生存空间? 近期,智东西有机会与袁琳进行了一场长达100分钟的对话,试图对这些问题进行深入探讨。 一、与张弛一拍即合:AI最快能改变的是孩子 “孩子是一张白纸,AI最快产生变量的一定是孩子。”这是袁琳与张驰在初次交流时达成的共识。 早在2018—2019年,袁琳还在做桌面家庭机器人时,就曾与张弛围绕AI落地进行过深入交流。那时的大模型尚未成熟,对话系统更多依赖规则和上下文拼接,但双方已经在讨论一个共同的问题:当AI真正具备理解和行动能力时,它最先落地的对象会是谁? 2023年底,当时还在腾讯任职的张弛发表了一篇围绕Agent操作系统的论文,展示了智能体像人一样完成点餐、打车等复杂任务的可能性。同一时间,听力熊也在思考下一阶段的方向——是否要继续深耕工具型硬件,还是转向更具长期价值的AI原生产品。 双方再次坐在一起时,几乎没有经过太多说服。 2024年,张弛以首席科学家的身份正式参与听力熊创业,在杭州搭建起AI实验室。而在学术领域,张驰在众多高校的邀约中选择了西湖大学,担任AGI实验室负责人。 “我们需要一个人清楚AI能力的边界在哪里。”袁琳坦言。技术的飞速发展让团队必须有一个站在前沿的人指引方向,避免走弯路。张驰的加入,让听力熊在杭州成立了专门的AI实验室,聚焦两个方向——Agent记忆体系和生成式AI在真实硬件中的落地,这些能力均为团队自建。 从左至右:听力熊联合创始人&总裁夏崇彦、听力熊联合创始人&CPO苟津川、听力熊联合创始人&CEO袁琳、听力熊首席科学家&CTO张驰 “今天出生的孩子,永远不会比AI更聪明。” OpenAI联创兼CEO Sam Altman数月前说的这句话曾在业内引发讨论。 袁琳对此并不悲观。“真正需要担心的,不是AI是否更聪明,而是孩子有没有机会建立自己的理解能力。”在她看来,如果AI只是替孩子完成思考,那只会放大依赖;但如果AI成为一面“镜子”,帮助孩子理解世界、理解自己,结果可能完全不同。 Mooni Pro和Mooni M1,正是在这一理念下被拆分成两种形态:前者从真实世界出发,用拍照、识别、记录激发好奇;后者强调连续对话,承接孩子的表达与情绪。两款产品的核心,都是帮助孩子形成新的认知过程。 Mooni M1偏表达和对话 二、每年和数千个“10后”聊天,两个孩子的妈妈做出“叛逆”产品 “争夺注意力是错误的目标,信息茧房才是真正的敌人。”这句话来自袁琳每年与数千名“10后”孩子对话后的洞察。作为一名两个“10后”孩子的母亲,她的创业选择与个人经历紧密相连。 2021年,袁琳与硬件合伙人夏崇彦共同创立听力熊。选择C端儿童AI硬件赛道,基于三重判断: “双减”政策释放了重新定义品类的空间;儿童的需求长期稳定、代际变化缓慢;更重要的是,“10后”是第一代真正意义上的AI原住民,他们与AI的共生关系,将持续十年甚至更久。 Mooni系列的设计理念,也源自她与孩子的长期对话。 袁琳每年都会直接接触上千名“10后”用户。她发现,孩子们真正困惑的,往往不是知识本身,而是意义——2024年的用户数据显示,超过30%的孩子会提问 “学习有什么用”“人为什么要学习”。“当时就有一种使命感油然而生。”她说。在一次次对话中,Mooni逐渐被定义为一个“蹲下来和孩子说话”的产品。 袁琳自己的孩子,也是最早的测试用户。Mooni刚推出时,家里的老二几乎每天使用一个多小时,带着设备到处走,告诉大家“这是我妈妈做的”。在与袁琳的交流中,我们发现“被看到、被平等对待”,成为听力熊反复强调的体验关键词。 面对青少年手机成瘾的问题,袁琳并不认为“争夺注意力”是正确方向。在她看来,更危险的是信息茧房——算法不断强化孩子尚未成熟的认知,让他们误以为世界本就如此,她认为“这是一件可怕的事”。 Mooni选择的路径,是把孩子从虚拟世界中,慢慢拉回物理世界。 Mooni系列的深层次设计理念近乎“叛逆”:不刷内容、不做强激励、不以使用时长为北极星指标。“我们对公司所有人的要求是:孩子愿意长期主动使用,才是目标。”袁琳强调。这一理念源自她作为母亲的价值观——孩子的成长是渐进的过程,AI应当是辅助而非主导。 三、拿下CES大奖,定义新品类:一个孩子看世界的入口 今年CES,听熊Mooni Pro荣获“Best of CES”大奖。在袁琳看来,这背后反映出行业趋势的转变: “AI硬件正在回归产品本身。” 过去两年,行业热衷于讨论模型、算力、参数;如今,大家更关注AI在真实场景中能做什么。袁琳认为,不同于Humane AI Pin、Rabbit R1试图取代所有交互方式,Mooni Pro在“连接孩子与物理世界”上做出了可落地的交互,或许是这个系列能够脱颖而出的原因。 Mooni Pro是一款形似卡片相机的随身机器人。“它更像一个入口,就是孩子拿起来它是为了看世界,而不是为了用工具完成任务。”它主要由两个部分构成: 前面一块小屏是一个机器人形态的人格化表达,它代表的是孩子的情绪和人格,展现出愉快、害羞、生气等多种个性形态;后侧摄像头负责辅助孩子观察世界,当被孩子举起来后可以帮他理解万物,让万物变得“可对话”。与同样在CES亮相的一些同类AI陪伴硬件相比,Mooni更强调“拍完之后发生什么”——连续记忆、成长轨迹,以及长期陪伴。 Mooni Pro以连接孩子与物理世界为目标 袁琳告诉智东西,Mooni Pro的产品设计灵感源自她十年前打造的“布丁机器人”。 袁琳曾是ROOBO营销副总裁,也是“布丁机器人”的核心创立者,这段经历让她在供应链、硬件研发和儿童产品设计上积累了宝贵经验。“布丁机器人”产品在2015至2018年间用户留存率高达50%,在业界创下了瞩目的记录,也让她意识到孩子需要“专属设备”。 如今,大模型技术让“随身陪伴”成为可能,4G网络则让陪伴变得随时随地。“桌面的家庭场景还是比较窄,‘随身携带’带来的可能性比之前要更大,这其实是延续了我上一次创业没有满足的一些点。”袁琳说。 四、商汤押注,百人团队穿越两轮周期,三次关键抉择 2025年3月,听力熊获得商汤国香资本领投的数千万元天使轮融资。袁琳告诉智东西,投资人看中的是团队对儿童场景的洞察、硬件产品化能力以及已验证的商业模式。 听力熊成立于2021年4月,经历了ChatGPT发布、DeepSeek爆火等关键节点。其发展历程可概括为三次关键转型: 2022年,T系列听力机凭借极致性价比解决听力刚需,不仅开创了AI听力机这一品类,还创下数千万元收入,积累近30万用户。ChatGPT的爆火成为“东风”,拉升了用户对AI产品的期待。 T系列听力机已更新至T8版本 2023年,听力熊成为行业内首批接入ChatGPT的智能学习硬件公司,自己贴钱让孩子在体验这一技术。测试发现,通过GPT服务,孩子的使用时长由原来的1.5小时增长为2.5小时。 同一年,团队一度尝试自建大模型,但很快意识到自建大模型不适合创业团队。年底,他们放弃自建基础设施,转向与阿里通义等厂商合作,把精力集中在Agent和应用层。 2024年,团队推出X系列AI伙伴机,这款产品验证了“从工具到伙伴”的概念,但在硬件形态和功能克制上仍有优化空间,暴露出功能过多的问题,袁琳给这一代产品打了75分。 X系列AI伙伴机形似一款儿童手机 2025年,Mooni系列及口袋机器人Pocket Robot相继推出。面对DeepSeek、Manus等通用AI产品的走红,听力熊反而坚定了 “垂直深耕” 的战略。 同年3月,听力熊完成商汤国香领投的数千万元天使轮融资。智东西获悉,听力熊团队正在洽谈新一轮融资,预计春节后公布进展。 “AI硬件的未来更倾向于在垂直领域做深度整合。”袁琳说。她认为,通用型助手可能在陪伴孩子一两年后才会出现,而当下更需要专注细分场景的产品。 五、千亿级增量市场:在巨头战中寻找“窄门宽路” 在袁琳看来,AI原生教育硬件至少是一个千亿级增量市场。 目前产业格局尚处早期,传统硬件商、教育公司、互联网巨头和新锐创业公司同台竞技。听力熊将自身定位为 “敏捷的创新者”,坚持 “进窄门,做宽路”——不做大而全,而是成为细分市场的领导者。相比于老牌公司的职业经理人模式,袁琳认为创业团队更具全情投入和默契协作的优势。 面对可能出现的深圳大量AI硬件创业公司“快速复制”威胁,袁琳表示欢迎竞争,但强调“拼价格不是长久之计”。她认为,听力熊的核心护城河有三:一是多年积累的儿童行为数据与算法优化经验;二是软硬件深度整合的交互体验;三是已建立的品牌心智。 目前,听力熊产品累计激活用户达100万,年营收数千万元。商业模式已跑通:硬件销售结合增值服务订阅,Mooni系列也将延续这一逻辑。 从曾经的“营销负责人”转变为“全能CEO”,对袁琳的时间和精力管理提出了更高要求。作为CEO,她最关注两件事:一是持续服务目标人群,二是具备造血能力。“创业绝不能只靠融资。”她说。 六、批判借鉴“小天才”,但不复制 对于曾经定义儿童手表市场的“小天才”,袁琳认为其成功在于 “把产品变成了身份象征” 。 袁琳透露,听力熊虽会学习其渠道与运营方法,但不会模仿其社交玩法。“孩子应先建立良好的亲子关系和价值观,再接触陌生人社交。”她说。她同样清楚,两者所处的时代不同——今天的孩子,对工具的需求早已被满足,更稀缺的是价值观和陪伴。 当被问及产品是否会设计“钩子”来吸引孩子时,袁琳直言:“争夺注意力是错误的目标,信息茧房才是真正的敌人。” 她观察到,如今的AI硬件赛道存在两个重要变量:一是家长对AI既焦虑又期待;二是手机使用过程中缺乏有效引导。“产品本身必须足够有趣,孩子才愿意用。”袁琳说。团队的目标是做出“既有趣又有用”的产品,而非依靠短期刺激留住用户。 当被问及打造AI教育硬件“爆款”需要哪些要素时,她总结了以下四大要素:精准的场景定义、革命性的用户体验、强大的内容生态、健康的商业模式。 在定价策略上,Mooni系列采取 “价值定价法” ,确保价格与体验匹配。销售渠道上,国内线上线下结合,海外通过区域合作伙伴进入商超,同时运营亚马逊与独立站。 在选择大模型合作方时,听力熊综合考虑技术实力、服务稳定性与成本效率。目前主要与阿里通义合作,也与MiniMax有长期战略协作,未来可能与商汤在视觉模型上展开合作。 听力熊的产品生产采用代工模式,但团队深度参与核心元器件选型,并与OPPO、朵唯等头部工厂建立战略合作,同时自建严格的质量管控体系。 回顾近五年的创业历程,袁琳用 “穿越周期” 来形容。 “既要抓住技术的浪头,又要保持平衡,不被浪潮带走。”她庆幸团队早在十二年前就已投身这个赛道。 结语:从工具到伙伴,AI如何真正走进孩子的世界 听力熊的故事,是一个关于“AI如何真正走进孩子的世界”的创业样本。 在AI硬件普遍追求“高频使用”的今天,他们选择了一条更窄的路:不做让孩子上瘾的产品,而是做让孩子愿意长期主动使用的伙伴。袁琳与张驰的合作,是“产品洞察”与“技术前瞻”的结合。两人都相信,AI对孩子的改变可能是最深远的。 听力熊采取“单品验证、矩阵延伸”的战略。2026年,听力熊计划发布三到四款新产品,重点投入多模态交互与个性化智能体方向。 在科大讯飞、学而思、小天才等巨头环伺的战场,这家百人团队试图用“窄门宽路”的逻辑走出一条属于自己的路。千亿级市场刚刚启幕,结局远未注定。 但可以确定的是,无论技术如何演进,真正能留存下来的产品,一定是那些真正理解孩子、尊重成长规律、并愿意“蹲下来”对话的创造。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。