行业分类:
加载中...
头条分类:
加载中...
通义没有成为“阿里版Seed”
这两天,阿里宣布成立Token事业群(Alibaba Token Hub,ATH)的消息成为了业内关注的焦点,但在这一轮AI组织重排中,阿里方面一些选择显得有些与众不同。 过去一年,大模型竞赛持续升温,一些公司开始把模型研发团队提升为集团级技术中枢。例如字节将基础研究力量逐步收拢到Seed团队之下,腾讯也在2025年底重组AI架构,使混元逐渐演化为更接近集中式研发中枢的形态。 但在阿里方面的这一轮动作中,通义实验室并没有像Seed一样,被单独提升为类似“集团级研究中枢”的存在,而是被放进了一个以Token为核心的AI业务体系之中,成为ATH事业群的一部分。 据了解,该事业群还包括面向开发者的百炼MaaS平台、面向C端用户的千问App,以及面向企业场景的悟空AI工作平台。从组织架构上看,这是阿里近年来最大的一次AI业务整合。 按照阿里方面的规划,在这一体系中,通义实验室负责模型能力,百炼负责平台分发,而千问和悟空则承担应用落地。 事实上,阿里过去的AI能力长期分散在多个体系之中:达摩院负责基础研究,阿里云推动AI服务平台,电商和钉钉等业务线则各自发展算法与产品能力,模型研发、平台能力和业务场景之间往往跨越多个部门。 Token事业群的成立,本质上是一次将模型、平台与应用重新捆绑的组织重构,“强化协同”的意图十分明显。 从Token事业群这个名字也不难看出,阿里更关心的,似乎是这样一个问题:如何让AI能力成为各个业务体系的抓手,并迅速转化为Token调用规模。 01 吴泳铭亲自挂帅,阿里想用ATH解决“协同问题” ATH的官方目标被概括为三句话:“创造Token、输送Token、应用Token”。 也就是说,阿里成立这一个部门,首先想解决的是从模型研发到API平台,再到应用场景的应用链路问题。 通义实验室在这个过程中负责模型研发,MaaS负责平台分发,而千问和刚刚发布的悟空分别承担C端助手和B端Agent应用。 这一设计的直接目的,是打破过去几年阿里AI体系中的协同问题。此前通义实验室、阿里云、钉钉、千问等业务分属不同体系,模型研发、商业化落地和场景接入之间存在明显的跨部门成本。 以钉钉方面为例,“无招”陈航回归之后,钉钉团队在产品战略上大幅转向ALL in AI。过去一年里,钉钉陆续上线AI助手、AI文档、AI表格、AI会议纪要等功能。但在功能落地过程中,很多能力主要由钉钉团队内部推进。 自2023年“云钉一体”拆解之后,钉钉就一直在“自力更生”的状态。在那之后,钉钉、阿里云和通义实验室在组织上分属不同体系,各自拥有明确的业务目标。在这种结构下,不同团队往往会优先解决自己的产品问题,甚至可能会出现“重复造轮子”的情况。 据阿里内部人士透露,钉钉团队曾在产品内部尝试打通支付能力,希望让企业用户在钉钉直接完成付款操作,但这一尝试最终没有落地。 而在一段时间后发布的千问App,则直接在应用内打通了支付体系,千问方面依托支付能力直接开启了一波“请客喝奶茶”的30亿补贴活动,试图给大众留下千问“能办事”的产品形象。 但这也说明,阿里旗下的众多业务之间,一些同类资源此前并没能在组织内有效调用。从模型到产品功能落地的链路上,协同的问题一直存在。 因此,ATH的成立本质上就是把研发、平台、产品化全部放进同一组织,以缩短从模型到应用的路径。 吴泳铭的亲自挂帅,本身也是一个姿态层面的信号,这位CEO将更多参与AI业务间的协同和业务迭代。 自2023年接任阿里CEO以来,吴泳铭在内部多次强调AI是集团未来最重要的技术方向,并推动阿里重新集中资源投入基础模型和算力基础设施。 阿里此前披露,未来三年将在云计算和AI基础设施领域投入超过3800亿元人民币,这一规模超过过去十年相关投入总和。 昨天举行的钉钉2.0发布会上,阿里方面发布了企业级AI原生工作平台悟空。阿里方面披露的信息显示,未来阿里集团内部的商业能力将逐步接入这一平台:包括淘宝、天猫、1688、支付宝以及阿里云等B端能力,都将通过悟空向企业用户开放。 公开资料显示,钉钉目前服务约2300万企业组织、超过6亿用户,其工作流系统沉淀了数千种企业应用能力,这也意味着悟空上线后,阿里AI能力将直接嵌入一个现成的企业软件入口。 而钉钉此前打不通的支付环节,就这样在ATH成立的第二天被提上了日程。 从组织架构来看,ATH更像一个“AI产业链部门”。 这种结构意味着阿里在AI时代优先解决的问题并不是“强化模型技术路线”,而是AI能力如何快速转化为应用规模。 因此,ATH的核心逻辑是重建AI协作结构。通过将模型研发、平台分发和应用产品统一到一个事业群,阿里希望减少内部摩擦,让AI能力更快嵌入整个商业生态。 只是,这意味着作为模型研发的核心——通义实验室在这一轮变化中,并未像友商的Seed或者混元一般,作为独立的研发中枢存在。 02 通义不走Seed路线,拥抱“Token经济” Token这个词,在过去两个月的AI产业里,一直持续地被高频提及。 随着OpenClaw等AIAgent框架流行,模型调用量迅速上升。开发者平台OpenRouter的统计显示,LLMToken调用量在8周内从约5.5万亿增长到15万亿。 而据沙利文报告显示,2025年下半年中国企业级大模型日均调用量已达约37万亿Tokens,较上半年10.2万亿增长263%。 其中,Token消耗排名前三的模型体系分别为通义千问、字节豆包大模型和DeepSeek,占比分别为32.1%、21.3%和18.4%,合计超过七成。 这一行业变化趋势,可能是驱使阿里走上这条路的关键因素之一。如果按照这种逻辑竞争,相比起模型能力,更重要的是谁能创造更多Token消耗场景。 另一边,这也和阿里AI庞大业务版图有关。事实上,今天发布的悟空,并不是阿里第一次宣布AI业务和集团内其他生态的大协同。 就在几个月前,同样在这座杭州阿里西溪园区报告厅,在千问App的发布会上,就曾有淘宝、高德、飞猪等业务的负责人现身“站台”。 这种跨业务的集体亮相,本身就像是一种信号:阿里方面想要让AI进入整个集团生态。 淘宝的商品信息、支付宝的支付能力、钉钉的工作流以及高德的地理数据,都有可能通过千问和悟空,把阿里各个业务生态变成一个巨大的Token调用池。 “Token优先”模式,一方面正在不断强化阿里内部各板块间AI业务的协同,但同时也使得通义实验室的定位,逐渐和竞争对手们出现了一些偏差。 过去一年里,腾讯和字节已经逐渐走上“大研发中心”的路线:字节将原本分散在AILab等团队的模型与算法力量整合进Seed体系,由前GoogleFellow、DeepMind研究副总裁吴永辉牵头,负责基础模型与长期AGI研究。 腾讯则把AILab、优图实验室以及混元大模型团队等研发力量统一到混元体系,由普林斯顿博士、曾任OpenAI研究员的姚顺雨统筹推进。 Qwen技术负责人林俊旸离职时,业内曾传出通义/Qwen团队AI Infra 体系和研发协同上仍有短板。 而在随后的内部沟通会上,阿里云CTO、主导通义实验室的周靖人表示,团队处于“资源紧张状态”,内外差异有很多历史原因,未来正在做整体规划,但对此没有进一步展开说明。 Qwen系列模型本身拥有相当庞大的开源矩阵。从0.5B到几十B参数的不同规格模型,使其在开发者社区和企业部署场景中获得了较高关注度。 截至2026年初,Qwen模型在HuggingFace等平台累计下载量已超过7亿次,成为全球下载量最高的开源大模型体系之一。 但在主力模型的表现上,如Qwen3.5-plus等模型的表现上,似乎未能有效说服市场。 此前曾公开报道显示,有阿里内部人士称,Qwen在除夕当天开源的Qwen3.5Plus模型只能算是一个“半成品”。 有AI行业内部人士曾向字母AI表示,Qwen3.5在部分场景下的表现,已经被Minimax/智谱/月之暗面等独立模型公司拉开了差距。 而在AIInfra层,字节、腾讯近来也都在继续加码:相关报道显示,字节方面2025年资本开支计划超1500亿元,主要投向AI基础设施,并在马来西亚、泰国继续扩建数据中心。 而据SOSP(操作系统原理研讨会)2025上,字节方面披露的论文《Robust LLM Training Infrastructure at ByteDance》显示,字节大模型训练平台运行在超过20万张GPU的生产集群上。 腾讯则在2025年四季度单季资本开支达390亿元,新设AIInfra部门,同时其韶关智算中心项目已开工,承接混元等核心业务。 此前,在Qwen技术负责人林俊旸离职风波后,阿里CEO吴泳铭在内部信中回应称,公司将成立基础模型支持小组,由其本人牵头,与周靖人等高管共同协调集团资源,加大对通义大模型研发的投入与支持。 从目前的组织调整来看,阿里的方向已经相当明确:相比单点突破模型能力,更重要的是让模型更快进入真实业务场景,并通过大规模调用形成商业闭环。 而在ATH体系下,重组后的Qwen团队和通义实验室,能否在这样的结构下获得足够资源,并在模型能力上重新追赶行业节奏,仍然值得持续观察。
小米自研MiMo-V2-TTS语言合成大模型发布:能说会唱 河南话、粤语等样样精通
快科技3月19日消息,今日,小米发布Xiaomi MiMo-V2-TTS,这是小米自研语音合成大模型,不仅能说、能演,还会唱。 其基于自研Audio Tokenizer和多码本语音-文本联合建模架构,经过上亿小时语音数据的大规模预训练与多维度强化学习,实现高度可控的多粒度语音风格控制。 该模型支持从整体风格定调到局部情绪表达的精准调节,能在同一句话内完成语气转折和情感递变,真实还原人类说话的自然韵律,在唱歌时,也能准确表达音高和节奏,自然且富有表现力。 为进一步激发模型在大规模预训练中积累的高表现力语音生成潜力,小米还引入了多维度强化学习,兼顾稳定性与表现力。 模型在预训练阶段通过大量文本-语音对齐数据,学习了书面语与口语表达之间的映射关系,能智能识别文本中的各类格式信号——如标点符号、语气词、强调标记等,并将其自动转化为恰当、自然的语音表达,全程无需用户额外标注或手动干预。 MiMo-V2-TTS还支持多种方言的自然发音,包括东北话、四川话、河南话、粤语、台湾腔等,可进行角色扮演式的风格化演绎,还能实现高质量的歌声合成。 小米表示,MiMo-V2-TTS是其语音技术路线图上的重要里程碑,但绝非终点。 在小米的规划中:中英文之外更多语种的覆盖;以及与 MiMo-V2-Omni 多模态理解能力的深度融合——让 Agent不仅能看懂世界、理解世界,更能以富有表现力的人类声音去讲述这个世界。
小米发布全模态基座模型Xiaomi MiMo-V2-Omni:支持多模态感知、工具调用等
凤凰网科技讯 3月19日,小米发布面向Agent时代的全模态基座模型Xiaomi MiMo-V2-Omni。该模型从底层构建融合文本、视觉、语音的全模态架构,将感知与行动深度绑定,原生支持多模态感知、工具调用、函数执行及GUI操作能力。 在正式发布前,小米将一个早期测试版本以“Healer Alpha”为代号匿名上架OpenRouter。上线期间调用量持续攀升,在OpenClaw测评榜单PinchBench上取得均分第一。 据官方介绍,MiMo-V2-Omni在音频理解方面支持环境声分类、多说话人分离、音频-视觉联合推理及超10小时长音频理解,综合表现超越Gemini 3 Pro。图像理解方面,在多学科视觉推理与复杂图表分析任务中超越Claude Opus 4.6,逼近Gemini 3 Pro等闭源模型水平。视频理解方面支持原生音视频联合输入,具备情境感知与未来推理能力。 智能体能力方面,该模型可在与真实数字环境交互的评测基准上比肩Gemini 3 Pro。在Browser Use场景中,结合OpenClaw框架可实现浏览器操控,完成信息检索、比价、与客服交互及下单等任务。与金山办公合作,接入WPS Office后,模型可根据指令生成Word文档、结构化Excel、排版规范的PDF及PPT。 MiMo-V2-Omni已开放API服务,支持256K上下文长度,输入0.4元/百万tokens,输出2元/百万tokens。小米联合OpenClaw、OpenCode、KiloCode、Blackbox及Cline等五大Agent开发框架团队,为全球开发者提供为期一周的限时免费接口支持。
小米深夜全球发布MiMo-V2-Pro旗舰模型!总参数量突破1T 1M超长上下文
快科技3月19日消息,今日,小米正式发布面向Agent时代的旗舰基座模型Xiaomi MiMo-V2-Pro。 在全球权威大模型综合智能排行榜Artificial Analysis上,MiMo-V2-Pro位列全球第八,国内第二。 据介绍,该模型专为现实世界中高强度的Agent工作场景而打造,总参数量突破1T(激活参数42B),较前代MiMo-V2-Flash扩大约3倍。 模型沿用前代MiMo-V2-Flash的Hybrid Attention机制,混合比例从5:1提升至7:1,支持1M超长上下文。 小米表示,在各个衡量模型重要能力的基准测评中,MiMo-V2-Pro均表现优异,Coding Agent、通用Agent和Tool Use与Claude Sonnet 4.6、GPT 5.2、Gemini 3.0 Pro处于同一梯队。 值得一提的是,一周前,代号为Hunter Alpha的匿名模型上线全球最大API聚合平台OpenRouter,上线期间调用量持续上涨,多天登顶日榜,调用量已突破1T tokens。 小米透露,Hunter Alpha正是MiMo-V2-Pro的早期内部测试版本。 此外,在OpenClaw标准评测榜单PinchBench、ClawEval上,MiMo-V2-Pro效果处于全球顶尖。 同时,凭借1M的超长上下文窗口,MiMo-V2-Pro能从容支撑高强度的真实Claw复杂应用流。 在前端应用场景中,MiMo-V2-Pro展现出高度端到端完成能力,在OpenClaw里,其能一步生成设计精致、功能完备的网页,兼顾视觉质感与实际可用性。 MiMo-V2-Pro模型现已正式开放API服务,支持1M上下文长度,并根据使用量分段计价: 256K上下文以内:每百万输入Token 1美元,每百万输出Token 3美元。 1M上下文以内:每百万输入Token 2美元,每百万输出Token 6美元。
机器人,日租金自3万降至3000元
2026.03.18 本文字数:1055,阅读时长大约2分钟 作者 | 第一财经 吕倩 封图来源|擎天租官方平台 3月18日,机器人租赁平台擎天租宣布完成天使轮及天使+轮两轮融资,累计融资金额达亿元级,主要由大洋电机、慕华科创、敏卓机电等领投,乐华娱乐、复琢投资德国跟投。该轮融资将主要用于全国履约网络、机器人资产调度能力、中台平台技术等方面的建设。 另据第一财经记者了解,擎天租Pre-A轮融资正在进行。擎天租CEO李一言对记者表示,Pre-A轮融资进程已过半。 同日,擎天租举行城市合伙人战略发布会暨首期合作伙伴签约仪式。采访中,李一言进一步解释该模式:平台统一派单、合伙人负责履约,也支持合伙人自拓订单,整个生意链条全部在平台闭环。收益目前向合伙人倾斜,回报周期中位数约6 个月。 不同于传统招商加盟模式,城市合伙人模式不收取品牌加盟费,由平台提供资产、调度、结算、服务标准支撑。据官方透露,原计划招募约2000人,但目前报名已超2万人。 与机器人本体赛道一样,机器人租赁赛道今年热度也在上扬,除了擎天租,京东自营机器人租赁、万机易租等平台也加入赛道。伴随参与者的增加,机器人租赁价格也从2025年初1万—3万元的日租金高峰,降至3000-5000元的价位段。 对于近期机器人租赁市场的变化,擎天租CSO王明峰回应称,早期机器人一天能租到3万元,是由于信息不对称导致的,如今的行业价格回调属于市场健康度的体现。 另外,王明峰称,从擎天租经营数据来看,春节后整个机器人行业进入放量阶段,价格虽有所回调,但订单量快速爆发。机器人租赁行业与早期汽车行业相似,价格会理性回归但不会过低,因为存在研发、履约、资产调度等刚性成本。未来价格将由健康的市场机制决定,而非平台主导。 订单量与价格变动之外,出租形式也在发生变化。目前擎天租主要通过短租、长租、项目类三种形式对外出租机器人,今年一个明显变化在于原本短租的客户在春节后开始向长租方向转,尤其是餐饮行业从业者发现,通过机器人做揽客、互动等动作,可以成为一种常态化配置。如海底捞等企业过去会用玩偶、IP等方式提供情绪价值,现在行业尝试通过机器人去承载这些功能。 这项变化在王明峰看来,说明机器人租赁市场逐渐走向成熟,用户在轻量级场景里也开始感知到机器人的实际价值。目前平台主要侧重消费端、偏轻量级场景落地,逐步向对技术指标要求更高的工业端拓展。 微信编辑 | 雨林
小米汽车:新一代SU7将于3月20日开启试驾体验
IT之家 3 月 18 日消息,小米汽车深夜更新答网友问(第 214 集),主要涉及新一代 SU7 锁单、试驾、购车等各类内容。 根据介绍,新一代 SU7 小订用户可享受「优先排产」,并且提车可获赠价值 699 元「智能双表盘」,该车小订将于 3 月 19 日晚 19:00 截止。同时,新一代 SU7 会在3 月 20 日上午 8:00正式开启试驾体验。 IT之家附问答详细内容如下: 新一代 SU7 上市前先小订后锁单,和上市后大定再锁单,在权益上有什么区别? 新一代 SU7 的小订用户可享受「优先排产」,并且提车可获赠价值 699 元「智能双表盘」,新一代 SU7 小订将于 3 月 19 日晚 19:00 截止,建议大家提前锁定小订权益。 在哪可以观看新一代 SU7 发布会的直播? 本次小米春季新品发布会将在 3 月 19 日 19:00 正式开始,小米汽车、小米手机和小米公司等各大官方平台都会直播本次发布会全程,其他更多发布会直播渠道将在 3 月 19 日下午向大家公示,敬请关注小米汽车公众号。 我现在可以到店试驾新一代 SU7 么? 新一代 SU7 会在 3 月 20 日上午 8:00 正式开启试驾体验,小米汽车全国销售门店会为大家提供试驾预约和试驾体验服务,您可通过小米汽车 App 预约咨询,垂询您的销售顾问。建议大家提前小订,以获得更便捷的试驾体验。 我想尽早购买小米 SU7,购车之前做哪些准备会比较方便 首先建议大家在新一代 SU7 上市前小订,小订用户锁单可享「优先排产」权益;下面为大家介绍定购新一代 SU7 的步骤: 下载或升级「小米汽车 App」,确保 App 已在最新版本:2.3.2; 提前完成账号注册并登录小米汽车 App,在 App“我的”-“设置”-“账号与安全”里完成实名认证,完成认证后,检查账号绑定的手机号码是否正确; 预填购车信息,目前您可提前填写并保存购车时需要填写的信息,包括「购车人信息」和「车牌所有人信息」; 确认支付方式和余额充足,建议您提前绑定并验证好您计划用于支付定金的支付方式,并确认支付工具余额充足且支付限额满足定金要求; 使用性能较好的设备并确保其运行流畅,连接到稳定的 5G 网络或高速 Wi-Fi 网络,并确保设备电量充足;当您成功支付定金之后,仍需手动锁单,排产顺序以锁单时间为准。更多定购信息,发布会后请及时查看《新一代 Xiaomi SU7 定购指南》;购车过程中,遇到任何问题,请及时联系小米汽车官方客服 400-182-6888,我们将尽快为您处理。 更多定购信息,发布会后请及时查看《新一代 Xiaomi SU7 定购指南》;购车过程中,遇到任何问题,请及时联系小米汽车官方客服 400-182-6888,我们将尽快为您处理。 「小米蛟龙底盘」具体是指什么?有哪些特点? 在新一代 SU7 上,首次发布「小米蛟龙底盘」,这是一套软件、硬件深度融合的高性能智能底盘系统,希望为驾驶者带来更精准、更稳定、更安全的体验; 在底盘硬件层面,新一代 SU7 全系标配「前双叉臂独立悬架」+「后五连杆独立悬架」、265mm 后宽胎、前四活塞固定制动卡钳,带来出色的驾驶品质和制动信心;Pro 版 / Max 版还配备「闭式双腔空簧」+「CDC®阻尼可变减振器」,可实现悬架「可高可低」、「可软可硬」,让一套底盘拥有两种“风格”,兼顾满足「个人驾驶乐趣」和「家人乘坐舒适」的需求; 此外,赋予了相比于第一代 SU7 更加深度且精细的专业调校。在制动踏板上,参考了 SU7 Ultra 的「脚感调校」风格,同时优化了制动踏板制动点,让驾驶员每次踩刹车都更有信心;转向系统调校也有明显升级,更精准、更“跟手”;此外悬架系统整体更加精细化的调校,也带来了更好的「滤振性能」和「支撑性能」; 同时,还提供了软硬件深度融合的智能功能,例如搭载「防滑协同控制系统」,可大幅降低车轮在低附着路面上的打滑量;同时还搭载全新「湿滑模式」,显著提升在冰雪等湿滑路面的行驶安全性,并且还可通过 AI 多模态监测到路面环境,识别湿滑情况,并及时主动建议驾驶员切换到湿滑模式,更贴心、更安全; 更多关于「小米蛟龙底盘」的信息,敬请关注 3 月 19 日的上市发布会,上市后诚邀大家到店试驾体验。 新一代 SU7 相比上一代,主要有哪些升级? 小米汽车的设计理念是「做经得起时间检验的设计」,新一代 SU7 的外观传承了第一代 SU7 的经典设计,同时带来全新的外观颜色、全新的轮毂设计和细节优化,让大家可以一眼认出新一代 SU7; 在整车产品体验上,新一代 SU7 迎来了全面升级,其中包括「全新内饰设计」、「三电系统」、「安全架构」、「辅助驾驶」、「智能座舱」等多项大升级,体验全面提升: 电驱系统:全系标配 V6s Plus 小米超级电机,性能提升; 高压平台:标准版 / Pro 版升级 752V 碳化硅高压平台、Max 版升级 897V 碳化硅高压平台,充电速度更快; 安全性:全系标配 25 项安全辅助功能、2200MPa 小米超强钢、9 安全气囊、三重安全冗余门把手、电池底部「防弹涂层」等,安全性更强; 辅助驾驶:全系标配小米 HAD 辅助驾驶,全系升级「小米 XLA 认知大模型」,提升复杂场景理解推理能力,行驶更安心、更从容; 智能座舱:全系超级小爱深度语音控车、全系升级小爱陪伴,感知情绪自然对话、全系升级模糊语义导航,理解准确,规划合理、全系标配车外语音,支持声纹识别、还有磁吸萌宠带来更多情绪价值; 更多新一代 SU7 产品信息,敬请关注 3 月 19 日的上市发布会。 新一代 SU7 都有哪些颜色?还会有其他新增么? 新一代 SU7 共有 9 款外观颜色,现已全部亮相,包括三款全新颜色「卡布里蓝」「赤霞红」「靛石绿」,四款继承第一代 SU7 的经典颜色「霞光紫」「雅灰」「璀璨洋红」「珍珠白」,以及来自 SU7 Ultra 的「曜石黑」和小米 YU7 的「流金粉」,下面向大家介绍三款全新颜色: 卡布里蓝:这是一种纯粹干净的阳光蓝,灵感来自意式海岛的海蚀蓝洞;采用青蓝基底,搭配研磨至纳米级的钴蓝颜料,让蓝色具有高透明度与高饱和度,鲜活、干净、极具动感; 赤霞红:这是小米汽车首款「正红色」,灵感来自天空最炽烈、最具生命力的那一抹红色;以高纯度、高饱和度的正红为基底,并融入云母珠光,使色彩呈现流动感与立体光泽,热烈、奔放、极具生命力; 靛石绿:这是一种高级、冷峻而深邃的绿色,灵感来自墨绿色天然矿石的色泽与光感,充满自然魅力;以源自竹炭的炭黑打底,加入钴蓝与钛青绿,再加入来自天然孔雀石的珠光,不同角度下,靛石绿会展现「深绿」和「蓝绿」之间的渐变,拥有高级而不张扬的独特气质; 诚邀大家到店鉴赏实车。
一加创始人裴宇:智能机应用将消失 AI智能体会取而代之
裴宇 凤凰网科技讯 北京时间3月19日,据科技网站TechCrunch报道,一加联合创始人、Nothing CEO裴宇正在设想后iPhone时代。他认为,未来,设备将由AI智能体驱动,而不是运行应用程序。 裴宇周三在奥斯汀举办的西南偏南(SXSW)大会接受采访时发表了上述观点。“在软件领域的AI应用方面,我认为人们应该明白,应用将会消失,”裴宇表示,他的公司致力于制造独具特色的智能手机及其他配件,“因此,如果你是一位创业者或创业公司负责人,且你的核心价值寄托在应用上,那么无论你是否愿意,这种模式都将被颠覆。” 裴宇此前就谈过“AI优先设备”的概念,这一愿景也帮助公司在去年完成了2亿美元的C轮融资。当时,Nothing提出的是一种全新的智能手机理念:利用AI和个性化技术,让结果足够准确,使用户不再需要绕过AI去反复核对其输出。 在西南偏南大会上,裴宇进一步阐述了他对AI优先设备的愿景,以及实现这一目标所需的步骤。 目前,一些公司正在测试的第一步是让AI具备一项功能,能够代表用户执行指令,比如预订航班或酒店。然而,裴宇认为这一阶段“极其乏味”。 接下来的阶段将变得更加有趣,因为AI将开始长期学习用户的意图。例如,如果你想变得更健康,设备可以适时提醒你,帮助你实现目标。 “我认为,当系统开始主动为你提供建议时,它的功能会更加强大。你无需再手动构思……当系统如此了解我们时,它甚至会提出一些我们自己也未曾意识到想要的东西。”裴宇解释道,他将这一概念比作ChatGPT的记忆功能。 他说:“我们现在使用手机的方式其实很老派,甚至可以追溯到iPhone出现之前……那时候有Palm Pilot和各种PDA设备。如果你仔细想想,现在的用户体验其实还是很相似。你有锁屏、主屏幕、应用,你在不同的应用之间切换,每个应用基本都是一个全屏界面,还有应用商店让你下载更多应用。所以本质上,这套模式在过去大约20年里并没有真正改变。” 这种现状令他感到沮丧,因为消费者使用的技术已经取得了长足进步,但我们使用的产品却停滞不前。他解释说,即使是简单的任务,也需要我们经历多个步骤才能完成。 “在手机上办成一件事非常困难,”裴宇说道,“比如说,我们想去喝杯咖啡。这是一个意图。但为了实现这个意图,我们必须经历许多不同的步骤,打开许多不同的应用程序。要跟别人喝杯咖啡,可能得用到四个应用:某个通讯应用、某个地图软件、Uber,还有日历。” 他继续表示:“我认为智能手机或操作系统的未来应该是:‘我非常了解你,如果我知道你的意图,我就直接为你完成它’,而不需要你手动操作所有这些应用程序。” “它应该通过AI来完成这一切,”他表示。 这也意味着,设备的界面将不再是以人类操作为中心的应用程序界面,而是转而采用为AI智能体设计的交互界面。 裴宇提醒道,这并不意味着应用程序会在短期内消失。Nothing自家的操作系统甚至允许用户通过“氛围编程”来创建自己的小程序。但最终,AI需要能够以无缝的方式使用“应用”,而不是试图模仿人类在智能手机上通过层层菜单和点击选项的方式进行操作。 “那不是未来。未来不是让智能体使用人类界面。你需要为智能体创建一个可以使用的界面。我认为这才是更具未来性的做法。”裴宇表示。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
实测MiniMax M2.7 :上能拆英伟达,下能演我爸妈
总觉得MiniMax才发布M2.5,如今M2.7就上线了。查了一下,真的只隔了一个月(要知道,中间还隔了一个春节)。 MiniMax在官方微信公众号文章中表示:“MiniMax M2.7是我们第一个模型深度参与迭代自己的模型。” 这几年,“AI自我进化”几乎已经从一个略带科幻感的说法,变成了行业里默认成立的方向。 谷歌前CEO埃里克·施密特(Eric Schmidt)更是总结,目前已经形成了一个“硅谷共识”:随着人工智能推理能力和记忆系统的发展,它将重塑人类的运作方式。最终我们将达到所谓的递归式自我改进——届时,系统将以人类无法理解的速度进行学习。 目前,这件事已经被拆解成更具体的工程路径:用模型生成数据、用模型做评测,甚至让模型参与到代码修改和实验流程里。 模型被放进了一个可以不断试错、不断反馈的循环系统里。在这个系统中,模型既是执行者,也是部分决策者,而人更多退到设定目标和边界的位置。 M2.7这次强调的Agent Harness,也是把原本需要多人协作完成的一整套研发流程,尽可能压缩进一个可以持续运行的循环里,让模型去承担其中越来越多的环节。 MiniMax亮出的Benchmark成绩也相当亮眼: 这些benchmark对应不同的能力维度:SWE Bench和VIBE-Pro更接近真实的软件工程任务,而Toolathon和MM-ClawBench则强调模型在复杂流程中的执行能力;相比之下,MLE-Bench等测试则更偏向算法与研究能力。 从结果来看,M2.7在工程执行类任务中已经进入第一梯队,这一点在几个关键指标上体现得比较明显。 比如在SWE Bench Pro上,它的表现已经接近甚至超过部分一线模型,这类测试本质上是在真实代码库中定位问题并完成修复,更接近“线上排障”的场景; 而在VIBE-Pro这种端到端项目任务中,M2.7同样处在第一梯队,这意味着它不只是会补代码,而是具备从需求到交付完整产出的能力。 另一个比较值得注意的是MM-ClawBench这一类Agent测试。这里考查的不是单步能力,而是模型在长流程中的稳定执行能力,能不能在多步骤任务中持续调用工具、保持上下文、最终把事情做完。 M2.7在这一项上已经接近头部模型,说明它在“能不能把活干完”这件事上,确实已经跨过了一道门槛。 但如果切换到更偏研究和复杂推理的任务,比如MLE-Bench这一类测试,M2.7仍有进步空间。这类任务更接近算法工程或科研场景,要求模型具备更强的抽象能力和系统性建模能力,这一部分目前仍然是头部模型的优势区间。 好了,硬核的信息放在一边,拿到MiniMax M2.7内测API的那一刻,我们第一反应是:“能用它整点什么活?” 把它丢进一个真实的场景里,看它能不能满足我的需求,这最直观,也最接地气。 所以我们给M2.7设计了四场“考试”,难度从低到高,场景从荒诞到严肃:先让它同时扮演我爸妈和弟弟在微信群里聊天,再搭一个Agent Harness框架让它自主编程(做一个霓虹灯数字时钟热热身,再从零写一个贪吃蛇游戏),最后把英伟达的年报甩给它,让它像分析师一样输出研究报告、交互式仪表盘和演示文稿。 玩了一下午,只想说:M2.7,你有点东西。 01 让AI同时扮演我全家人 我们做的第一个测试,灵感来源于每个中国人手机里都有的那个东西——家族微信群。 你知道的,就是那种群名叫“相亲相爱一家人”的群,里面永远有人在转发养生文章,有人在发语音消息,有人在催你结婚,还有人在打游戏不回消息。 这个场景之所以适合测试AI,是因为它对“角色一致性”的要求极高。 群里每个人的说话方式、关注点,甚至打字习惯都完全不同,而且他们之间还会互相接话、抬杠、拌嘴。 我们用M2.7搭了一个高仿微信界面的网页应用,连手机外壳、状态栏、绿色气泡都做了出来,力求还原度拉满。一开始我想了很多人设,比如前文提到的爷爷奶奶等。 但是最后我敲定了一家四口,他们分别是: 老李(爸爸),55岁国企退休干部,性格暴躁但刀子嘴豆腐心,钓鱼狂热爱好者,最恨吃蔬菜尤其是西兰花,说话爱引用名人名言,动不动就“我当年……” 妈妈(王秀英),52岁社区居委会大妈,超级唠叨但满满都是爱,养生达人兼厨艺高手,打字疯狂用 emoji,喜欢用【】强调重点,三句话之内必催女儿找对象 李小龙(弟弟),24岁,大学毕业两年了还没找到正经工作,整天在家打原神和王者荣耀,嘴贫爱怼人,满嘴“yyds”“绝绝子”,最怕爸爸说教,一被骂就装可怜或者转移话题,经常找姐姐借钱但从不还。 页面如下: 在我并未详细要求界面具体呈现的情况下,模型返回的设计相当让人满意,于是我开始尝试发送第一句话。 发送失败?显示的是调用API失败。于是我让M2.7给我检查一下问题所在。 M2.7很快就发现了BUG,在修复后终于可以对话了,但是…… 设定上作为我的父亲,他却不认识我,很显然,这是一个人物设计上的BUG。于是我又让M2.7重新编排了一下角色身份,“我”被设定为家中的长女。 随后,一切正常,这个模拟器终于可以运行了。 虽然没有一上来就梦幻开局,但是Bug的发现和修复都非常丝滑。 M2.7的角色扮演能力很强。但我想强调的是,多角色群聊的难度远不止“给每个角色设定不同的语气”这么简单。 通过报错的那张图可以看到,对于不同角色,M2.7会分别调用模型,而不是说一次生成所有的对话。 它要求模型同时维持多个角色的人格状态、理解角色之间的关系(父女、母女、兄妹、夫妻),并且让这些关系在对话中自然地碰撞出火花。 一家四口,三个AI角色,每个人都有自己的小心思和说话习惯,还要让他们能和我互动起来。 M2.7做到了,而且做得相当自然。 02 一句话,从零造一个霓虹灯时钟 第二场开始,我决定上一点强度。 为了测试M2.7的Agent能力,我专门搭了一个Agent Harness测试框架。界面长得像一个深色主题的IDE:左边是 agent的思考轨迹面板,实时显示它每一步在想什么、打算做什么。 右边分成三块——任务配置区、虚拟文件系统(显示它创建了哪些文件)和实时预览窗口(直接渲染它写出来的 HTML)。 这个框架给M2.7提供了五个工具:write_file(创建/写入文件)、read_file(读取文件)、list_files(列出目录)、execute_js(在沙盒里跑 JavaScript)和 finish(宣布任务完成)。 除此之外,什么都没有。相当于把一个程序员扔进一间空屋子,只给他一台电脑和一个需求。 第一个任务,我让M2.7做一个霓虹灯风格的数字时钟。M2.7需要理解需求、规划方案、写代码、自己检查、最后交付。 点击“启动 Agent”之后,M2.7的ReAct循环开始转了。最后在第5轮的时候,M2.7执行完了命令,实际上第4轮就行了,当时我这里出现了一些网络波动,导致M2.7调用工具失败。 说实话,这个结果本身并不让我们特别惊讶。 一个数字时钟对于2026年的大模型来说确实不算什么。 真正让人感到惊喜的,是整个开发过程非常流畅。 从理解需求到规划方案到写代码到自检到交付,整个Agent工作流跑得行云流水,没有一步多余的操作。这说明M2.7对ReAct框架的适配相当成熟,它知道什么时候该想、什么时候该动手、什么时候该收工。 好,热身结束。接下来,继续上难度。 03 让AI自己写一个贪吃蛇游戏 时钟毕竟太简单了。没有交互逻辑,没有状态管理,没有边界条件。 我需要一个真正能考验Agent自主推理和调试能力的任务,比如贪吃蛇。 这回的需求复杂度完全不在一个量级:Canvas绘制、键盘事件监听、蛇的移动逻辑、食物随机生成、碰撞检测(撞墙和撞自己)、计分系统、游戏结束判定、重新开始功能。 同时我还要求M2.7用Word记录下来自己的开发过程。 结果如下: 在第1轮里,M2.7没有着急写代码,它是先创建了一个规划。“我要开发什么什么任务”,“这个任务需要用到什么工具”等等。 第2轮,进入正题。M2.7会创建一个完整的HTML文件,包含所有功能,包括画布渲染、键盘控制、随机食物生成、计分、碰撞检测以及开始 / 重新开始功能。 第3轮,检查文件有没有被正确创建。 第4轮,检查语法,并且检查游戏的完整性。 第5轮,检查所有任务是否已经完成。 整个任务只需要5轮,共消耗25882个token。 不过也要说说不足。 整个过程并不是一帆风顺的——Agent 在早期的几轮迭代中,JSON 格式的工具调用偶尔会出错,导致框架解析失败,返回一个红色的错误提示。 M2.7 看到错误后能自我纠正,下一轮就输出了正确格式的 JSON,但这种“先犯错再改”的模式在需要长时间自主运行的 Agent 场景中是一个隐患——如果连续几轮都格式错误,可能会耗尽最大轮次限制而任务失败。 但总的来说,从时钟的“一次过”到贪吃蛇的“写→查→修→再验证”,这两个任务放在一起看,恰好展现了 M2.7 作为 Agent 的两面:面对简单任务时的高效利落,和面对复杂任务时的自主调试能力。 这也正是 M2.7 官方最强调的核心能力——Agent Harness 能力,不仅能在给定的工具框架中完成任务,还能主动迭代和自我纠错。 04 第四场:2159 亿美元的投行级财报分析 前面三个测试,一个考“说”,两个考“做”。 最后一个测试,我们想换个方向。 现在有很多金融行业的人也在使用Claude Opus这样的大模型,原因很简单,它们能把复杂的数据制作成直观的图表形式。 我把英伟达FY2026的完整财报数据甩给了M2.7。 然后我给了它一个任务:基于这些数据,生成三个专业交付物。 第一个是深度研究报告,要求投行风格,包含财务全景、五大业务板块分析、FY2027 预测模型、风险评估和估值分析。 第二个是交互式财务仪表盘,要求是蓝绿色风格的深色主题,包含图表、可调动的滑块,以及五个功能标签页。 第三个是12页演示文稿,要求投行风格,支持键盘翻页,包含数据可视化图表。 当然,这里必须诚实地说一句,这个测试的“含金量”需要打个折扣。因为财报数据是我预先搜集好喂给它的,而不是让它自己去搜索和整理的。 M2.7在这个任务中,尽职扮演了一个“拿到所有原材料后进行加工和呈现”的分析师,如果我们让它自己搜集数据(这个对现在的模型来说并不难),那它完全可以扮演一个“从零开始做调研”的研究员。 但即便如此,它对复杂金融数据的理解能力、对多种输出格式的驾驭能力,以及生成专业级可视化内容的能力,都给我们留下了深刻印象。 这个测试直接对应了M2.7官方宣传的复杂Office自动化能力——“支持复杂 Excel/Word/PPT 办公任务及多轮编辑”。从实测来看,在金融分析这个场景上,M2.7 确实能输出接近专业水准的内容。 写在最后: 还有一点特别想分享,MiniMax也在做更多有趣的尝试,这一点也令人惊喜。 比如,MiniMax这次官宣的时候就提到,他们构建了一个 Agent 交互系统 OpenRoom(openroom.ai),它将 AI 互动置入一个万物皆可互动的 Web GUI 空间。有意思的是,原型项目已开源,这里面的代码大部分也是 AI 写的。 在这里,对话即驱动,实时产生视觉反馈与场景交互,角色可以主动地与环境交互。MiniMax希望能够随着模型 Agentic 能力的提升和社区的共建持续进化,探索出更多人与 Agent 之间全新的交互方式。 这次测下来,我最大的感受其实不是“它又变强了”,而是你开始能明显感觉到,一个模型不再只是等你提问的工具,而是可以被放进一个系统里持续运转的搭档。 我们评测挑选的场景是任何一个普通用户都可以上手用到的,从群聊模拟,到写代码,再到做分析报告,这些任务背后其实是同一件事:模型开始参与到一个完整流程里,而不是只负责某一个瞬间的输出。 当然,这一步还远远没有到终点。你依然能看到它在复杂推理、长流程稳定性上的边界,也能看到一些细节上的不稳定,比如工具调用格式错误、需要多轮修正才能收敛。这些问题在“单次对话”里可能不明显,但放进Agent这种长时间运行的框架里会被放大。 但有一点是比较直观的:当模型开始能在一个任务里自己往前推进、自己发现问题、再自己修正的时候,整个使用体验就变了。模型离“你问一句、它答一句”的形态越来越远,开始和你一起把一件事做完。 你的下一个生活、工作搭子,何必是人类?
曝华为MatePad Edge焕新升级:搭载麒麟X90+微泵液冷
【CNMO科技消息】3月17日,博主“超维界”爆料称,华为MatePad Edge预计将迎来焕新升级,核心变化包括芯片从麒麟X90A升级为麒麟X90、提供微泵液冷散热系统以及推出全新配色。这一升级或将进一步强化这款鸿蒙二合一平板在性能与体验上的竞争力。 华为MatePad Edge CNMO注意到,根据华为官网此前公开的信息,华为MatePad Edge在发布之初搭载麒麟X90系列处理器,其中液冷版采用麒麟X90、柔光版和标准版采用麒麟X90A。此次焕新版将标配升级为麒麟X90芯片,意味着将获得更高性能的算力支持。作为华为自研芯片,麒麟X90已在MateBook Pro、MateBook Fold非凡大师等鸿蒙电脑产品上搭载,性能表现获得市场认可。 据悉,华为MatePad Edge于2025年11月正式发布,是首款搭载鸿蒙系统的二合一平板电脑,支持平板/电脑双模式无缝切换。硬件配置上,该机配备14.2英寸OLED屏幕,屏占比高达94%,分辨率3120×2080,支持120Hz刷新率与1000nit峰值亮度。华为MatePad Edge内置的电池容量为12900mAh,机身重量约789克。 另外,华为MatePad Edge近期已开启HarmonyOS 6花粉Beta版尝鲜升级,新增“碰一碰”传输、AI文档比对、AI沾色、鸿蒙星河互联(支持与Apple设备互传)等功能,进一步提升跨设备协同效率与智慧办公体验。
Galaxy AI全面赋能 三星Galaxy S26系列携三星耳机亮相
【CNMO科技新闻】凭借在隐私保护、性能、影像以及Galaxy AI功能等方面的升级,三星Galaxy S26、Galaxy S26+和三星Galaxy S26 Ultra为用户在日常工作和生活带来了更加安心与便捷的使用体验。此外,三星Galaxy Buds4系列作为三星Galaxy S26系列的“绝佳拍档”,更凭借无缝衔接的Galaxy生态体验,为用户塑造了移动生活的新范式。 随着AI时代的到来,信息与个人隐私保护日益成为公众关注的焦点。在最新推出的三星Galaxy S26 Ultra上,三星将最新的屏幕防窥技术应用落地,为广大消费者带来了首款搭载内置式防窥显示屏的Galaxy手机。并且与市面上的防窥膜不同,三星Galaxy S26 Ultra通过硬件手段实现的物理防窥效果,还可确保屏幕保持明亮、通透的视觉体验,令高质量观感与可靠的防护两者兼得。 开启防窥模式后,三星Galaxy S26 Ultra能够精准调控屏幕像素的发光角度,从而实现全屏或局部防窥效果。具体而言,窄视角像素会向前方直线发射光线,这样既能确保用户从屏幕正面清晰查看内容,又能有效阻挡侧面视线的窥探;而宽视角像素则会将光线分散至更广的范围,使得用户在启用局部防窥功能时,屏幕其他区域的内容仍可正常与旁人共享。 影像方面,三星Galaxy S26 Ultra搭载了更大光圈的镜头,搭配升级的超视觉夜拍视频,让用户无论是在夜晚还是室内的暗光环境,都能排除生动、清晰的视频作品,除此之外,在拍摄视频时开启超级稳定模式的水平锁定功能,还可以让用户无需顾虑颠簸的拍摄环境,轻松记录下运动中的场景,收获堪比使用云台的稳定画面。 作为三星第三代AI手机,三星Galaxy S26系列在AI体验方面持续进阶,让Galaxy AI成为用户更贴心、高效的助理与伙伴。 为了更好满足AI时代下消费者对音频体验的需求,三星此次还同步发布了三星Galaxy Buds4系列智能耳机新品,在舒适度、音质、降噪等方面实现多项升级。系列包含开放式设计的三星Galaxy Buds4和入耳式设计的三星Galaxy Buds4 Pro,针对持久佩戴的用户和追求音质享受的音频发烧友提供不同选择。 三星Galaxy Buds4采用符合人体工学的流线型外观,通过尺寸小巧且贴合耳廓的耳塞头,带来牢固、稳定的佩戴感受,既可用于日常持久使用,也很适合运动时佩戴。用户可开启24-bit/96kHz的超高音质(UHQ)音频,体验Hi-Fi级声效,并通过主动降噪有效屏蔽噪音干扰,享受个人音乐世界。三星Galaxy Buds4 Pro搭载更大尺寸的宽幅极窄边低音单元和平面高音单元的增强型双路扬声器,还支持实时自适应主动降噪与增强型自适应均衡器,可以分析使用者的佩戴状态与耳形特征,为不同用户呈现契合个人听感偏好、精心调校的声音体验。
OPPO Find N6发布:重点升级铰链平整度与哈苏影像,9999元起
凤凰网科技讯 3月17日,OPPO今日正式发布全新折叠屏旗舰手机OPPO Find N6,该机搭载第五代骁龙8至尊版处理器,内置容量达6000mAh的电池,起售价定为9999元(12GB+256GB版本)。作为OPPO主打高端市场的最新机型,Find N6计划于3月20日起在全球范围内正式开售。 在外观设计与屏幕硬件方面,OPPO Find N6的机身厚度控制在8.93mm,采用钛合金中框材质。设备展开后的内屏尺寸达到8.12英寸,内外屏均支持1nit低亮度显示以满足护眼标准。针对折叠屏品类常见的折痕问题,该机型引入了采用3D打印技术制造的钛合金天穹铰链,配合天穹记忆玻璃,官方测试数据显示其铰链表面起伏降至0.1mm,以提升屏幕的整体平整度与使用寿命。 影像系统与通信能力也是该产品的核心迭代方向。Find N6配备了哈苏2亿像素四摄模组,并首次在折叠机型中搭载丹霞色彩还原镜头,支持哈苏人像及大师模式等专业拍摄功能。通信方面,该机支持高达66个网络频段,可适配全球多个国家和地区的网络环境。此外,手机支持80W有线及50W无线闪充,出厂预装ColorOS 16系统,兼容原生级苹果生态跨端互联,并可搭配专属的AI手写笔进行息屏速记、全局批改等商务创作操作。顶配的16GB+1TB版本还额外加入了卫星通信功能,售价为11999元。
AI大厂月薪3万疯抢文科生 文科就业率正在被AI拯救
快科技3月17日消息,据媒体报道,不久前,360创始人周鸿祎在接受采访时抛出一个惊人观点:随着AI技术的发展,文科生将比理科生更吃香。 在他看来,AI的快速迭代不仅催生出大量需要管理的智能体,也带来一系列伴随技术应用而产生的社会问题。要解决这些问题,恰恰需要文科生的人文社科储备,以及他们在管理与表达方面的能力。 相比之下,多数程序员的工作——用通用编程语言将市场需求翻译成代码——反而更容易被成熟的AI替代。 打开招聘软件,不难发现周鸿祎的观点正在被市场验证。AI大模型评估专家(写作方向)、AI叙事设计师、AI训练师……这些看似硬核的技术岗位,招聘要求里写明的却是中文、编剧、社会学、新闻学等文科专业。有大厂甚至用3万月薪来招揽人才,若求职者拥有理工与人文交叉学科背景,更是加分项。 这一趋势并非国内独有。在大洋彼岸的硅谷,AI浪潮催生出一种名为“首席讲故事官”(Chief Storyteller)的新型职业,年薪高达30万美元左右。 这一职位本质上是公关经理在AI时代的变种,许多从业者曾是资深媒体人。他们的核心任务,是用通俗易懂且充满张力的故事,让大众认知并接受一家公司的产品,将听起来唬人的技术进步包装进落地的叙事当中。 表面上看,AI带来的职业冲击确实强烈,但对于文科应届生而言,就业市场似乎仍保留着一片可以大有作为的蓝海。当技术日益强大,那些能用人文视角驾驭技术、用叙事连接大众的人,正变得愈发珍贵。
悟空问世,阿里重估:中国最“能打”的AI巨头仍被低估
3月17日,阿里巴巴推出全球首个企业级AI原生工作平台——悟空(Wukong),并同步启动全球企业用户邀请测试。这标志着阿里在B端AI应用领域落下关键一子。 悟空可以说是一款高安全、可商业交付的AI原生工作平台。为确保AI调用的原生性与高效,拥有超8亿用户的钉钉对底层代码进行了彻底的CLI化重构,确保所有企业级的原子能力均可被AI直接调用与操作。这一改造打通了其背后超过2000万家企业组织用户。未来,用户通过自然语言指令,即可让AI在安全边界内调用钉钉的各项能力。同时,该平台全面兼容OpenClaw等开源框架的Skill体系,展现出极强的生态开放性。 作为阿里AI能力的统一B端出口,悟空将逐步接入淘宝、天猫、支付宝、阿里云等集团核心业务的商家服务Skill。该平台可灵活部署于用户自有电脑、云电脑乃至钉钉Real AI硬件等终端,AI在本地沙箱中安全执行,用户可通过移动端远程指挥悟空完成复杂工作流。 依托钉钉十余年积累的企业服务经验,悟空原生具备统一账号、精细化权限管理、全链路数据安全及审计体系。结合钉钉Real AI硬件,悟空可实现企业级集群部署,成为Agent资源的统一调度与管理中枢。 事实上,透过此次发布,我们可以窥见这家科技巨头在AI领域的组织敏捷性。 就在悟空发布前一天(3月16日),阿里巴巴闪电成立Alibaba Token Hub(ATH)智能体事业群,由CEO吴泳铭亲自挂帅。该事业群整合了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部,构建起从基础模型研发、服务平台搭建到应用落地的完整闭环。换言之,悟空平台正是ATH事业群成立后打出的第一张牌,前后仅相隔一天,足见其战略推进之坚决。 在我们看来,除了悟空平台本身的技术突破,以钉钉此次重构为标志,阿里正在对其AI业务进行从底层逻辑到上层应用的“原子级重构”。作为全球一线AI大厂,它正在向世界展示其深厚的底牌。对于这一点,资本市场正逐渐认识到阿里的潜力。 摩根士丹利发布快评,明确指出ATH事业群的成立有望在现有分类加总估值(SOTP)框架之外,成为一个独立的估值构成部分。大摩继续维持对阿里的增持(Overweight)评级,并将阿里列为首选股(Top Pick),视其为"拥有顶级完整AI技术栈的中国AI赢家"。 01 ATH,阿里面向未来的组织战略校准 悟空的技术意义已有诸多展示,但在我们看来,更深层的意义在于:悟空的迅速发布,预示着阿里正以远超预期的行动强力,展现出在AI赛道上的战略决心。 事实上,回顾历史,组织重构是科技公司起飞的前哨。OpenAI在2024年经历奥特曼的戏剧性调整,随后推出了向Agent范式全面转型的GPT-4o系列。谷歌在2023年合并DeepMind与Google Brain,期间伴随激烈争论,最终在分歧中收敛共识,重返技术巅峰。 换言之,产品迭代与人才架构的重启,给OpenAI、谷歌的起飞奠定基础。这一点在全球资本市场已反复验证:两家公司的估值均在同期迅速增长。其背后的共通逻辑在于:当技术范式发生跃迁时,主动重构组织以适配新战场,往往比维持旧有结构更能抢占先机。 对今天的阿里而言,以悟空为标志,这种重构同样意味着其AI业务迈入了Agent新周期。 据公开信息,2026年3月,通义实验室召开内部会议,阿里高管明确表态:千问基础模型是集团当前最重要的事项,大模型的竞争不仅是技术团队的事,而是整个阿里集团的事。随后,由吴泳铭、周靖人、范禹组成的“基础模型支持小组”成立,在集团层面统筹资源调配。 更值得关注的是结构性调整:原千问团队按预训练、后训练、视觉理解等维度拆分,与通义实验室内其他团队(如通义万相、通义百聆)合并。这意味着阿里正在将过去“垂直整合”的强中心化模式,转变为多模块并行、多负责人协同的矩阵式架构。 事实上,千问也确实是变革之中嗅觉最敏锐的中国大模型之一:从早期All in Infra、模型高频迭代,到如今敏锐察觉产业竞争路径向多模态与Agent驱动的突变,并迅速组织调整、强化人才密度。这种变阵的逻辑十分清晰:当大模型竞争从单一模型能力转向“Infra-模型-Agent”的系统战,任何依赖单一个体技术判断的模式都无法支撑长期作战。 从这个意义上说,3月16日成立由吴泳铭挂帅的ATH,证明了阿里对大模型前沿战事的高度敏感性。正如风险投资大师马克·安德森所言:“在高速增长的环境中,重要的不是反思,而是迅速行动。” 从本次发布不难看出,阿里校准的方向,指向的是OpenAI、Anthropic、谷歌等最顶级的AI公司,而非国内的其他跟随者。其调整重点——强化代码能力对标Anthropic、推进多模态融合对标Gemini——已充分说明这一点。这种主动的战略校准,是其迈向全球第一阵营的关键节点。 以史为鉴,在技术变革的加速期,最早出现震荡的,往往正是最早敏锐发现问题、寻求解决、并最终胜出的领导者。 以ATH事业群成立和悟空发布为标志,今天的阿里AI,比以往任何时候都更具“国内最能打”的底气。与海外同行相比,中国资本市场对这场变动的深层含义尚未充分认知,但留给投资人的时间窗口不会太久。 02 以悟空为标志,以钉钉为底座,阿里正通往AI决赛圈 与全球一线选手相比,阿里AI的“原生”底色极为清晰,这一点将逐步被资本市场发现。 以投入规模为例:2025年2月,阿里宣布未来三年投入超3800亿元建设云和AI硬件基础设施,总额超过过去十年总和。2026年2月,阿里开源的新一代千问大模型Qwen3.5-Plus,以3970亿参数实现原生多模态突破,推理效率提升19倍,API成本仅为同类产品的1/18。 叠加本次悟空发布,阿里在芯片、基础设施、基础模型、Agent平台四个层面均站稳第一梯队。 其“原生”属性不仅体现在投入规模上,更体现在技术路径的完整性上:从自研芯片(倚天/真武)、云计算基础设施,到基础模型、开源生态,再到Agent平台,全部自主可控,形成闭环。这一生态厚度,是任何“次生路径”玩家短期内无法复制的护城河。 在原生路径上,有一个容易被忽视却至关重要的支撑节点——钉钉。在阿里AI的版图中,钉钉并非简单的应用层入口,而是悟空得以诞生的“母体”,是AI Agent在企业环境中安全、可控运行的底层操作系统。 理解这一点,需要回到一个根本问题:为什么这个全球首个企业级AI原生工作平台,会选择从钉钉的躯体中生长出来? 答案在于,在AI Agent时代,入口的定义正在发生根本性迁移。PC时代的入口是Windows,云时代的入口是浏览器,移动时代的入口是超级App。而在AI Agent时代,入口将变成能够承载Agent安全运行、调用企业核心系统的“运行时环境”。谁拥有最大的企业用户基座、最完整的组织数据、最丰富的业务场景,谁就有可能成为这个时代最大的流量入口。 以此标准衡量,今天的钉钉,服务着超过2000万家企业组织,覆盖了近八成A股上市公司。这意味着,中国最核心的商业主体及其内部的权限体系、组织架构、数据资产、文档知识,早已沉淀在钉钉的土壤之中。 悟空的核心突破,在于通过彻底的CLI化改造,实现了Agent对钉钉上千项能力的原生调用,做到“沟通即执行”。但这仅仅是技术表象。更深层的逻辑在于,这种调用必须深度嵌入一个已经沉淀了组织架构、权限矩阵、审批链与业务流的企业级环境。 换言之,钉钉能让Agent“天然地长在企业组织中”——自动继承角色权限、在安全沙箱内可审计地执行、并精确计量token消耗。缺了钉钉这个底座,也就失去了“企业级可信执行”这一根本差异化能力。 更重要的是,钉钉本身就是一张难以复制的企业级分发网络。超2000万家企业组织、数亿用户,意味着悟空无需经历艰难的拉新与配置过程,它直接内置在钉钉的最新版本中,即可瞬间触达数千万家企业的管理员与员工。从这个意义上说,钉钉就是阿里To B业务当之无愧的“入口火箭”。 正是基于这一不可替代的底座,悟空才得以在三个层面构筑起核心支撑。 第一层支撑:CLI化改造,让悟空成为AI的“肢体” 为了“炼出”悟空,钉钉做了一件在全球企业级产品史上罕见的事:在用户规模的顶峰,选择自我颠覆。 钉钉重写了底层代码,进行全面CLI化改造。这意味着,悟空Agent能够原生操作钉钉上千项核心能力,而非模拟人类点击图形界面——后者正是市面上大多数Agent类产品的技术路径。二者的本质区别在于:模拟点击是让AI像人一样“看”屏幕操作,效率低、易出错、无法规模化;而CLI调用是让AI直接接管系统的“神经”,指令直达、精准执行、可并发调度。 正如钉钉CEO陈航所言:“过去是人用钉钉来工作,未来是AI用钉钉来工作。”当钉钉将自己打碎、用AI重建,它实际上完成了从“给人用的工具”向“给AI用的操作系统”的蜕变。悟空之所以能实现“沟通即执行”,正是因为钉钉在底层为其铺设了可直接调用的能力管道。 第二层支撑:企业级基因,让AI在信任边界内运行 如果说CLI化解决的是“AI能不能调用”的问题,那么钉钉11年积累的企业级能力,解决的则是“企业敢不敢让AI调用”的问题。 市面上大多数AI Agent仍停留在“个人玩具”阶段——能写文案、搜资料,但放进企业真实业务里,权限管不住、操作查不到、成本算不清。悟空与它们的根本区别在于:它“天然就长在企业组织中”。 这得益于钉钉的底层积累。悟空深度打通了企业的钉钉账号体系、安全访问权限及应用系统。当Agent执行任务时,它会自动继承企业既有的权限规则——员工能看什么数据、能批什么流程、能花多少钱,Agent严格遵循同一套边界。所有操作在安全沙箱中运行,每一步都可追溯、可审计;Token消耗和成本清晰计量,企业可以像管预算一样管AI开支。 在陈航的表述中,这一点被反复强调:“别人解决的是让AI能干活,悟空解决的是让AI在企业里安全、可控、算得清账地干活。”这一定位,将悟空与个人向Agent清晰切割。后者的确在C端掀起热潮,但企业市场的门槛从来不在技术酷炫度,而在信任与合规。钉钉11年积累的组织关系数据、权限体系、审批流程,构成了悟空不可复制的护城河。 第三层支撑:生态枢纽,让阿里全系能力“原子化”接入悟空 悟空不仅是钉钉能力的出口,更是阿里巴巴全系ToB能力的统一入口。 根据ATH事业群的规划,淘宝、天猫、1688、支付宝、阿里云等B端商业能力的Skill将逐步接入悟空。这意味着,阿里二十余年积累的商业基础设施,正在以“技能包”的形式被原子化、可调用化,嵌入悟空的企业级运行环境。 以电商场景为例:商家在1688上选品找货源时,悟空可自动对供应商进行全景式背景调查,帮助店家自动排雷、锁定靠谱伙伴;商家开新网店时,悟空可基于1688官方分销供应链,通过AI自动经营,快速上架商品。这些能力过去分散在不同业务线、需要多个团队协同才能完成,现在被悟空以Skill的方式一体化串联。 悟空同步推出的OPT十大行业解决方案,正是这种能力的集中体现。与通用Agent框架不同,OPT交付的是“场景化Skill套件+预编排工作流+行业数据沉淀”——用户只需做决策和验收,AI负责执行。每一个Skill都绑定了具体场景、具体身份、具体SOP,不再是抽象的技术能力,而是开箱即用的“行业级能力模块”。 从这个意义上说,钉钉为悟空提供的不仅是数千万企业组织的流量基座,更是一个完整的企业级运行环境和生态连接器。当阿里内部越来越多的ToB能力以Skill形式接入悟空,当企业自身的工作流也被封装为可复用的AI技能包,一个以AI Agent为核心的企业服务新生态正在成形。这或许是比App Store更具颠覆性的平台机会,因为它交易的不是软件,而是“工作能力”本身。 当一家处于正确产业路径的公司,判断清楚最前沿的技术趋势,并通过组织调整进行针对性部署,极其敏捷地落子新生代战略产品,这一步的迈出,即意味着对其他竞争者形成了认知与技术的代际优势。因此,从常识判断,以悟空为标志,阿里正在通往AI决赛圈的战役中稳步前行。 03 最能打的开源大模型,越来越被系统性看好 以悟空平台为标志,我们认为,当下的投资人更应将阿里AI的能力逐一拆解,每一项能力都有其合理的对标标的,而在认真完成这些对标分析之后,阿里AI所隐含的价值,将是接下来市场不断看到的底牌。需要说明的是,以下分拆基于各部分相对独立的业务逻辑,虽存在协同效应,但在SOTP估值框架下可视为价值来源。 首先,以AWS为例:其“云计算+自研芯片”能力所隐含的AI云估值已远超万亿美元。今天的阿里AI基础设施与之高度相似:具备自研含光800/倚天710/真武PPU等芯片,叠加全球领先的云计算基础设施,并在AI时代快速完成体系重构。 阿里云同样受益于AI增长:2025年以来,AI相关产品收入连续多季度实现三位数增长。据沙利文报告,2025年上半年阿里云以35.8%的市场份额稳居中国全栈AI云市场第一,远超第二至第四名之和。考虑到中国市场体量及阿里在本土数据、主权算力、生态适配方面的天然优势,阿里云AI价值即使仅对标AWS AI估值的较小比例,也意味着一个千亿级别的隐含价值。 其次,是对千问的重估:OpenAI作为全球大模型标杆,2026年估值已攀升至数千亿美元级别。与之对标,通义千问在中国市场也展现出强劲追赶势头:截至2026年3月,千问MAU已突破2亿,成为全球第三大AI应用,并以超过550%的增速位居全球第一。在企业端,通义千问服务海量企业客户,覆盖金融、工业、政务等高价值场景。按能力对齐与可触达市场估算,千问若能在未来对应OpenAI估值的10%-15%,即意味着千亿级别的模型价值。 第三,加上今天的悟空工作平台——已集成多模态、工具调用、自主规划等特性,并在阿里内部及生态伙伴中启动大规模测试。这相当于阿里正式进入“AI Agent全面取代传统软件”的下一个入口。悟空作为打通钉钉协作、千问模型与云算力的Agent平台,其生产力平台的雏形已然显现。当前市场对Agent平台的估值溢价极高,悟空作为全球首发企业级平台,所对应的隐含价值同样不可忽视。 暂且不考虑阿里电商、即时零售等核心商业业务,仅将上述三者叠加——云+芯片、千问大模型、悟空Agent平台——合计隐含价值已具备相当规模。各部分独立估算,虽有协同但无重大重叠,可作为阿里AI资产价值的保守参照。 客观而言,隐含价值之所以“隐含”,在于距离最终兑现尚有路程。因此对投资人来说,对应的估值折扣也将是一个可大可小的过程,但这也正是今天阿里整体估值的弹性所在:它所蕴含的巨大势能,尚未被市场充分发现。以悟空发布与架构重构为标志,阿里正成为2026年最具性价比的AI核心资产之一。 04 结语 在技术范式革命的马拉松中,决定终局的根本因素是什么?是算力基座的厚度,是模型生态的广度,是组织对前沿的敏感与调整能力,是战略上的长期主义定力。在这些维度上,阿里没有掉队,反而在校准中持续强化优势。 悟空的使命,是在“infra-模型-Agent”的新周期中,紧紧咬住全球一线玩家的进化速度,持续创造认知壁垒、技术壁垒、数据壁垒。当那一天达成,它对阿里各个业务集群的赋能将是水到渠成之事。 一个付诸数千亿资本支出、面向人类更高阶文明的技术平台,其价值本应在高屋建瓴之处显现。阿里千问,依然是最能打的中国大模型,资本市场只是尚未完成定价而已。
全球首个机器人进家庭,自变量携手58到家开启家庭服务新模式
当58到家的保洁阿姨按下门铃时,她的身边多了一位新“同事”:一台由具身智能企业自变量研发的机器人,在深圳正式开始进入家庭服务。随着房门打开,全球首个机器人保洁员正式“上岗”,与保洁阿姨协同作业完成家庭清洁服务。 这不仅是家政服务模式的一次创新,更意味着在全球范围内,具身智能技术首次走进普通人的家庭,面向大众用户开放服务,迈出从实验室演示到规模化民生服务的关键一步。 同时,这也是行业内迄今为止最快的家庭场景商业化落地。自变量正逐步将具身智能的前沿技术探索转化为普通用户可感知、可预约、可评价的民生服务,打通“技术研发——场景验证——商业闭环”的关键路径,探索出一条从实验室通向千家万户的可行之路。 (全球首个机器人保洁员在深圳“上岗”) 深圳家庭迎来首位机器人保洁员 “确实很新奇,一开始还有点担心,怕机器人干不好。” 深圳市民陈果(化名)是该服务的首批体验者。她通过58同城APP预约了智能保洁服务,上门的不再是孤身一人的保洁员,而是由保洁阿姨和机器人组成的“黄金搭档”。 陈果回忆,在三个小时的服务中,她观察到,保洁阿姨承担了沟通、现场判断和更复杂的保洁工作,机器人作为得力助手,主要在客厅清理垃圾、收拾桌面等。“机器人干活还挺稳,这种人机配合很高效。” 此次率先落地深圳的智能保洁服务,是自变量机器人与58集团战略合作的首个成果。该服务由58到家平台随机调度阿姨与机器人组成搭档,协同作业,探索“人机协同”在家庭服务场景下的最优模式。 “目前主要在深圳开启,未来几个月计划进入更多城市提供服务。”自变量相关负责人透露,除了家政服务之外,未来双方还将在更广泛的生活服务场景中共同探索机器人在现实中服务的无限可能。 (自变量机器人与58到家保洁员协同作业)   强强联合让机器人进家庭干活 家庭环境具有极高的复杂性和非标准化特征,被认为是检验通用机器人的“终极考场”。让机器人走出实验室和结构化环境,在千差万别的真实家庭中稳定“干活”,是具身智能领域公认的难题。 自变量自成立之初便锚定这一目标,以完全端到端技术路线构建了物理世界基础模型-真机自主进化的技术闭环,模型的持续进化,让自变量的机器人在真实场景中体现了极强的适应力。同时,公司坚持软硬一体同步迭代,实现了多款机器人本体和核心零部件的全面自研与算法深度适配,促成整机成本的大幅下降,为具身智能机器人的规模化量产与商业化落地奠定坚实的基础。 (自变量机器人在深圳市民家中干活) 58到家方面表示,此次与自变量的战略合作,不仅是在“AI+生活服务”场景下的重要创新实践,更是其从“劳动力匹配平台”向“技术驱动的家庭服务解决方案提供者”战略升级的关键一步。通过开放真实的家庭服务场景与海量用户反馈,58到家将为机器人的技术迭代与能力进化提供持续的场景支撑,推动“人机协同”模式在家政服务领域的规模化落地与持续优化。 作为国内领先的家庭生活服务平台,58到家连接超过4500万家庭、拥有400万劳动者的领先家庭生活服务平台,其核心优势正在于构建了一个覆盖全国200余城、涉及20大类100多项服务的“数字家庭场景库”,也是因为这样的深厚积累,成为了具身智能技术落地的最佳试验场。   重塑未来家庭生活图景 此次创新服务的落地,恰逢国家层面大力推动具身智能产业发展的重要窗口期。在2026年的政府工作报告中,“具身智能”被明确列为需要培育壮大的未来产业之一。同期,工业和信息化部正式发布的《人形机器人与具身智能标准体系(2026版)》,为行业规范化、规模化发展提供了顶层设计。深圳作为前沿科技创新高地,也持续开放城市场景,鼓励具身智能技术的应用。 自变量与58到家的合作,正是响应国家号召、发展新质生产力、以科技创新服务民生的生动实践,将前沿的技术与千万家庭的日常需求相结合,为破解服务业劳动力结构性短缺、提升人民生活品质提供了新的解决方案。一个由人机协作共同构建的更高效、更舒适的未来家庭生活图景,正在徐徐展开。 初期,机器人主要帮助阿姨完成一些简单的任务,随着数据的积累和模型的迭代,它将能够承担更多、更复杂的任务。“与58到家的合作,让我们获得了真实宝贵的场景数据和用户反馈,这将极大加速机器人能力的提升。最终,我们的目标是让机器人成为每个家庭智能、可靠的新成员。”自变量表示。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。