行业分类:
加载中...
头条分类:
加载中...
谷歌高级副总裁曼尼卡:AI短期内不会摧毁就业市场
IT之家 5 月 21 日消息,据《商业内幕》21 日(今天)报道,谷歌高级副总裁詹姆斯 · 曼尼卡认为 AI 不会在短期内摧毁就业市场,也不认同“AI 将导致大规模失业”的激进说法。 面对达里奥 · 阿莫代伊此前提出“新技术可能很快推高失业率”的预测,曼尼卡表示:“不妨直接打个赌。两年前就有人说,两年内 50% 的岗位会消失。现在两年已经过去了,结果大家都看得到。谁要是再预测未来两年会出现这种情况,我依然愿意下注。” 据IT之家了解,曼尼卡长期研究 AI 与自动化问题。他拥有牛津大学 AI 与机器人学博士学位,曾联合领导联合国秘书长 AI 顾问机构,也曾在麦肯锡全球研究院研究自动化与未来就业趋势。目前,曼尼卡在谷歌负责研究、技术与社会相关事务。 2017 年,曼尼卡参与撰写的一份麦肯锡报告指出,自动化带来的结果不会只有“岗位消失”一种情况,而是同时包含岗位减少、新岗位出现,以及大量现有岗位被重新定义。 曼尼卡表示,这套判断至今依然成立。“研究本身并没有太大变化。现在真正有争议的,是这三种情况各自会占多大比例,而不是它们会不会发生。” 曼尼卡认为,AI 行业自己也在一定程度上放大了公众焦虑。科技企业一边反复谈论“大量岗位被消灭”,一边又没能充分解释 AI 基础设施是否会推高社区电力成本。“AI 行业不断讨论 50% 的岗位会被消灭,这样并不会带来任何帮助。坦白说,我们可能正在因为制造恐慌,而削弱这项技术真正产生巨大价值的机会,但这种恐惧本身并没有充分依据。” 曼尼卡同时也认为:“这并不意味着我们不需要关注 AI 对就业市场的影响。这类问题当然值得警惕,我只是认为,目前 AI 造成的影响,还没有达到外界担心的程度。” 在曼尼卡看来,AI 更大的影响并不是“让工作消失”,而是改变工作的内容与方式。“影响最明显的,其实是‘工作被改变’。工作的性质本身会发生变化。银行柜员如此,放射科医生也是如此。‘银行柜员’这个职业今天依然存在,但 1970 年的银行柜员和今天的银行柜员,工作内容早就完全不同了。”
逆转肌肉萎缩,中国科学家在可穿戴机器人领域取得新进展
IT之家 5 月 21 日消息,近日,北京航空航天大学机械工程及自动化学院机器人研究所冯仰刚副教授联合麻省理工学院与北京大学第三医院,在机器人领域取得新进展登上 Nature 官网头版头条。相关研究成果以加速预览 Article 形式发表于 Nature 杂志,题目为“Spinal neuromotor rehabilitation using a portable isokinetic training robot”。 IT之家从官方介绍获悉,脊髓性肌萎缩症(SMA)是一种常见的常染色体隐性遗传病(罕见病),目前,药物只能减缓疾病进程,无法逆转病情。传统的下肢辅助机器人大多提供助力,其原理是通过减少传出肌肉激活来主动辅助行走。北京航空航天大学冯仰刚副教授与合作者认为对于 SMA II 型等需要增加传出肌肉激活以维持神经肌肉功能的患者来说,这种被动“助力”可能会阻碍神经肌肉的长期发育。而传统的抗阻设备(如等速抗阻训练设备)往往体积庞大、价格昂贵,且提供的最小阻力对 SMA 患儿来说通常过高。 ▲ 图 1.穿戴式等速抗阻训练机器人运动神经康复原理 ▲ 图 2. 等张、等长与等速(本研究)训练模式下的肌肉激活程度 为了解决这一问题,研究者提出面向脊髓性肌萎缩症 II 型患儿的可穿戴等速抗阻机器人(仅 0.96Kg),它能够在安全的前提下确保肌肉在整个关节活动范围内产生最大张力,从而实现最佳的训练效果。该研究开展了为期 5.5 个月的临床试验(6 周观察期 + 6 周高强度训练 + 6 周低强度训练 + >30 天随访),其中,经过 6 周高强度训练,患儿不仅实现了不同角度下从坐到站的能力跨越,且下肢运动能力显著提升,肌肉与神经系统获得协同增长,甚至在脱离机器人,回归生活日常后,仍能维持已取得的康复效果。 此外,该研究明确了高激活等速训练在康复干预中的核心价值:相较于仅能维持现有肌肉水平的传统低强度干预,高激活等速训练能够带来显著的肌力提升与实质性的肌肉生长。这一最新成果为神经肌肉疾病的精准康复治疗提供了新的科学依据与希望。 ▲ 图 3. 便携式等速训练机器人与游戏化人机交互界面 ▲ 图 4. 6 例 SMA II 型患儿在训练前后的双侧伸膝峰值力矩变化 该研究共招募了 6 名 6-10 岁的 SMA II 型患儿(3 男 3 女)。在为期 6 周的高强度等速训练后,取得了良好的效果: 患儿们获得了在不同角度下手扶膝盖、无外部支撑的情况下完成坐到站转换的能力。平均坐位起立初始膝盖弯曲角度从 111° 改善至 104°,进步了 7°。 双侧膝关节生物力学功能提升,其中峰值扭矩平均提升了 130%,活动范围增加了 51%,做功增加了 97%。 肌肉实质性增长:核磁共振(MRI)和超声成像显示,股四头肌解剖横截面积(ACSA)增加了 12%,肌肉体积增加了 19%,生理横截面积(PCSA)增加了 21%。 神经传导与协调性增强:股神经传导评估显示,复合肌肉动作电位(CMAP)振幅增加了 19%。同时,基于肢体间 CMAP 对称性的双侧神经肌肉协调性改善了 35%。 最重要的一点是,在停止使用等速机器人训练并恢复常规物理治疗后,患儿依然保持了他们取得的康复成果。在后续的低强度等速训练阶段(6 周)和超过 30 天的无机器人随访期内,各项功能、形态和神经生理的改善均得到了稳固的维持。 这代表着一种与传统穿戴式机器人不同的训练范式:它不强调依靠外部协助来实现短期恢复,而是“反其道而行之”,通过在运动中主动增加难度来激发潜能。作为药物联合治疗的强力协同,该疗法旨在引导更为持久的神经肌肉恢复,最终让患者依靠自身的力量去重塑运动功能并提升生活质量。
AI Coding之后,视频模型正在跑通商业闭环?
作者|常远 编辑|重点君 过去一年,AI行业最成功的赛道,非AI Coding莫属。 从Cursor、GitHub Copilot,到Claude Code这类代码Agent,它们的价值非常直接:用户每天都要写代码,企业每天都要交付项目;只要AI能少写几行重复代码、少踩几个bug、少花几小时调试,价值就能被很快算出来。 但现在,另一个曾经被认为太烧钱、太炫技、太难赚钱的领域,也开始出现相同信号。很可能是第二个有望跑通商业闭环的赛道。 它就是AI视频模型。 最新的标志性事件是可灵AI。据公开报道,快手正评估可灵AI的资产重组与外部融资方案,市场传出的目标估值高达200亿美元。快手随后在港交所公告中确认,公司正在评估若干潜在交易方案,但也强调目前仍处于初步阶段,尚未签署最终协议。 资本市场开始用一家AI原生公司的逻辑,而不是一个短视频平台内部工具的逻辑,重估视频模型。 更关键的是,视频模型已经有了一批能算清楚账的场景。 快手2025年财报里披露,可灵AI在2025年第四季度持续进行多轮模型升级,方向包括模型能力、产品体验和商业化。快手还披露,AIGC营销素材在第四季度带动线上营销服务客户总消耗达到40亿元。 截至2025年12月,可灵AI服务全球超过6000万创作者,生成视频超过6亿条,并与超过3万家企业用户建立合作;2025年12月月度经营收入超过2000万美元,对应年化收入运行率达到2.4亿美元。 视频模型已经从秀Demo阶段,转变为了可计费的产品。 过去我们聊视频模型,可能习惯看一致性、运镜、时长、画质等,但现在,收入指标必须加上——钱从哪里来,能不能持续来。这也是本文真正想回答的问题:AI Coding之后,视频模型是否跑通了一条相似的商业闭环? 我们的判断是:视频模型已经完成了商业闭环,但还没实现利润闭环。 牌桌上的玩家:用户愿意付费比卷数据和打榜更重要 如果把AI视频生成看成一张牌桌,那么牌桌上的玩家名单是很容易被罗列出来的:可灵、Seedance、Veo、Runway、Vidu、海螺、通义万相、小马快跑、混元视频、Sora…… 按照目前的竞争格局,大厂靠数据和营收增长建立壁垒,创业公司则在夹缝中死磕迭代效率。 AI视频玩家大致可以分成四类: 第一类,是短视频平台型玩家。代表是字节Seedance和快手可灵。 它们不只有模型,还有海量视频数据、内容理解经验、创作者生态、广告投放系统和商业化入口。它们不需要从零教育市场,因为用户本来就在平台上生产视频、消费视频、投放视频。 可灵的优势在于启动早、产品化快、全球创作者心智更强。它已经从快手内部工具,变成面向创作者、企业和开发者的AI 视频基础设施。可灵如果进一步独立,想象空间也会从快手 App内部,延伸到广告、电商、短剧、游戏、动画、品牌营销等更宽的内容生产链条。但挑战也很现实:视频推理成本比文本、图片、代码都更高,真正难的是收入能不能覆盖推理成本、研发投入和获客成本。而这也是全行业面临的难题。 Seedance 2.0则代表了另一种更激进的打法。它背靠字节的抖音、剪映、即梦、巨量引擎和海外内容生态,天然拥有内容生产、编辑、分发、投放的完整链条。字节本身就是最懂视频流量和商业化的公司。今年2月,Seedance 2.0上线后即引爆市场,漫剧、短剧公司蜂拥而至,到3月底字节漫剧日消耗突破7000万元,首次超过真人短剧。 Seedance内部人士告诉我们:目前用户付费意愿极高,调用Seedance 2.0生成视频几乎处于供不应求状态;由于算力短缺,平台制定了排队规则,甚至有短剧客户愿意签订年度数千万、乃至上亿元级别的保底消费,以换取更高排队优先级。 这意味着AI视频的商业化,正在从单纯的ToC订阅(类似大模型的“会员+积分消耗”机制),大举进入ToB端。目前需求量最大的恰恰是短剧/漫剧/动画等影视公司、广告营销和互联网大厂,它们愿意为稳定产能买单,收费模式也直接进化为大B客户的“打包预付或后付(包含API/Token、积分调用)”。Seedance 2.0的爆火,正是平台能力、数据能力、工程能力和商业场景协同的结果。 第二类,是专业创作工具型玩家。代表是Runway、Vidu、海螺AI等。 Runway很早就把AI视频包装成专业创作者工具,强调可控性、镜头语言、角色一致性和工作流。对专业用户来说,单条视频惊艳并不够,真正难的是同一个人物、物体、风格,能不能跨镜头持续成立。 Vidu的优势更集中在参考生视频和行业落地上。Vidu在Q2参考生Pro中强调万物可参考,希望让人物、物体、风格在生成后更少依赖后期补救;Q3则把重点放在文生视频、图生视频的16秒音视频直出上。它的B端需求也更集中在漫剧、短剧动画、电商营销、文旅等行业。 海螺AI则走出了一条差异化路线。依托背后MiniMax的文本、语音、音乐与视频全模态矩阵,海螺AI升级了Media Agent,将核心壁垒建立在了人物微表情的细腻捕捉、动态情绪的自然转换以及声画同频的一键成片能力上。对于影视编导和短片创作者来说,物理一致性只是及格线,真正决定成片质感的是角色的“演技”与真实情感张力。正是切中了这块专业需求,截至2025年底,海螺 AI 视频模型不仅帮助全球创作者生成了逾6亿个视频,其面向企业客户的开放平台及服务收入更是迎来了197.8%的同比暴涨,证明了其在内容工业中的实力。 大平台更擅长把视频生成做成基础能力和流量入口,但专业创作工具可以在可控性、团队协作、素材管理、版权标记、API调用、行业模板上做得更细。它们未必拥有最多数据和最大流量,但如果能成为某类客户的生产系统,同样可以活得很好。 第三类,是云计算和生态型玩家。代表是Google Veo、阿里通义万相、HappyHorse、腾讯混元视频等。 它们未必会把AI视频做成独立App,而是嵌进云服务、广告系统、办公工具和开发者API。比如Google的Veo 4强调原生音频生成和物理真实感,背后连接Gemini、YouTube、广告和云API。这类玩家资源厚、生态宽,但视频模型只是它们多模态能力拼图的一块,未必是唯一主线。 第四类,是那些昙花一现的玩家。典型代表是Sora。 Sora曾红极一时,被视为视频领域的ChatGPT,但OpenAI官方在今年4月26日停用了Sora 网页和App体验,API也将在9月24日停用。 最具代表的AI公司选择撤退,说明了一个残酷现实:视频生成的商业化不能只靠技术震撼和社交传播。客户愿意付费,比卷参数和打榜更重要。 据行业信息,目前国内玩家中,按日消耗占比计算,Seedance已占据市场超八成份额,可灵约占14%,万相2.7约占4%,HappyHorse占比不足1%。Seedance以绝对优势领跑,可灵稳居第二梯队,阿里系双模型合计占比约5%,位列第三。 Seedance与可灵领跑:视频模型正在重复短视频格局? 过去很长时间,可灵都是国内AI视频的代名词。它发布早,声量高,也更早跑出商业收入。当Seedance 2.0突然形成强烈关注时,一个问题自然出现了: 这是一次偶然反超,还是一种必然? 具体到某一轮模型效果,谁领先几个月、谁在某个场景表现更好,都可能有阶段性偶然。但长期,大家比的还是数据、模型、工程和场景转成商业产能的综合能力。 这也是Seedance追赶可灵最值得看的地方。 视频模型和文本模型不一样。文本模型的高质量语料当然重要,但视频模型天然更依赖多模态数据:画面、镜头、动作、节奏、音频、字幕、用户反馈、完播率、互动率、投放效果。 短视频平台恰好掌握这些东西。 字节和快手的优势,不只是手里有很多视频。更重要的是,它们知道什么样的视频会被看完,什么样的开头能留住人,什么样的节奏适合信息流,什么样的素材能带动广告消耗,什么样的内容能转化成交易。 这些经验未必都能直接变成训练数据,但它们会进入产品设计、数据筛选、模型评估和商业化路径。 这就解释了为什么视频生成的竞争,很可能不像通用大模型那样只看参数、榜单和开源生态,而会越来越像短视频平台竞争:数据越多,反馈越快;反馈越快,模型和产品迭代越准;产品越准,客户越愿意付费;客户越多,又反过来带来更多真实使用数据。 这也是它和AI Coding最相似的地方。 AI Coding真正跑通商业闭环,是因为它嵌进了开发者每天都要用的工作流。它能被持续调用,效果能被持续验证,价值能被持续计费。 AI视频如果要跑通商业闭环,也必须进入类似位置:成为内容生产者、广告投手、电商运营、短剧团队每天都要用的生产工具,而不是偶尔拿来玩一条爆款视频的玩具。 所以,行业已经进入新阶段,拼的是谁能提供稳定产能,接下来拼的会是单位成本、交付稳定性、行业模板、版权合规、团队工作流和大客户锁单能力。 视频模型的护城河至少有以下方面: 数据。尤其是视频内容、用户反馈和商业投放数据。 模型能力。包括画质、运动、物理、运镜、多镜头、音视频同步和提示词理解。 工程效率。也就是更低成本、更快生成、更高并发、更稳定交付。 产品工作流。包括首尾帧、参考图、角色一致性、局部重绘、镜头控制、团队协作、素材管理和API。 客户预算。谁能进入广告、电商、短剧、游戏、品牌营销这些持续付费的行业,谁才有更硬的商业闭环。 单点模型领先很重要,但不够。尤其在商业化早期,90分但成本高十倍的方案,未必打得过75分但稳定、便宜、可批量的方案。 一个行业都关心的问题是,如果字节和快手已经是Top2,视频生成会不会格局已定? 这个判断有一定道理,因为视频生成和短视频平台存在天然的耦合。 包括,数据耦合,平台拥有海量视频和反馈;场景耦合,电商、直播、广告本来就是最容易落地的地方;商业耦合,广告主和商家本来就在平台上花钱,只要能提升效率就能切进预算;以及分发耦合,生成后能不能被看见、转化,决定了客户愿不愿意续费。 从这个角度看,字节和快手确实最像天然赢家。但这不等于其他玩家没有机会。 因为AI视频市场足够大,不同玩家都能找到自己的生态位: 如果把它理解成谁生成的信息流广告更多,那平台型玩家优势巨大;但如果把它理解成未来所有视频生产流程的基础设施,专业工具、云厂商、垂直模型和行业解决方案仍然有空间。 其他玩家可以聚焦自身优势,实现差异化竞争。 比如,专业可控性。影视、游戏、品牌大片对可控性要求极高。角色不能漂,商品不能变形,谁能做稳专业工作流,谁就能切下高价值市场。 成本和API。SaaS公司、设计平台未必需要最强画质,但极度需要便宜、稳定、高并发的API。 出海布局。中国的视频模型完全具备与世界级模型竞争的实力。无论是大厂还是创业公司,“全球化”已经是接下来的重中之重,其中日韩市场正被业界视为出海变现的核心阵地。 AI视频很可能形成一个双层格局:上层是平台型巨头,掌握最大规模的数据和广告预算,做基础生产力;下层是工具和行业公司,围绕专业创作、出海节点与企业工作流做深做细。 这就像AI Coding,通用大模型提供底层,Cursor变成工作流,企业再根据自己安全要求做集成。最后真正产生价值的地方,是“模型+工具+工作流+企业场景”的组合。 AI视频或许也会如此。底层模型会越来越强,但商业闭环发生在更靠近客户的地方:广告投放系统、短剧生产管线、电商素材工厂、游戏资产生成、品牌内容管理、创作者工作台。 视频模型要真正走向利润闭环,还需迈过三道坎 AI视频商业化最容易被误读的一点,是把它简单等同于C端产品的会员订阅,因此聚焦在活跃用户数等指标上。 创作者愿意为去水印、高额度付费,这当然重要。但这只是表现,视频模型的商业模式,更像广告技术、内容供应链和生产工具的混合体。 一个电商商家过去做短视频,拍摄剪辑耗时耗力,又贵又慢。如果AI能基于商品图和卖点一次生成几十版素材,再根据转化率快速筛选,它就是投放机器的一部分。短剧和小游戏买量也是同理。AI视频未必马上替代整部短剧,却可以先替代预告片、钩子片段和剧情测试素材。 所以,AI视频最早跑通商业闭环的地方,大概率不是电影工业,而是那些重复、批量、可评估的商业视频素材。这句话不够浪漫,但很真实。电影工业追求艺术上限,广告投放追求ROI。前者放大想象力,后者贡献现金流。 C端和创作者订阅,卖额度、速度、清晰度和高级功能;企业SaaS,服务广告、电商、品牌、MCN、短剧、游戏等客户;API和MaaS,给第三方应用、营销平台、设计工具调用;平台内部增收,把AIGC素材接入广告投放、电商经营、直播互动,最终带动广告主消耗和商家经营效率。 这几条变现路径里,最容易被高估的是单纯的C端订阅,最值得重视的是平台内部增收。普通人的需求是间歇性的,真正高频使用的是内容创作者、广告投手和互联网大厂运营。谁要批量投放,谁要稳定产能,谁愿意为优先级锁算力,谁才是更硬的付费方。 短剧客户愿意和Seedance签订亿级保底消费就是证据:视频模型已经成为了内容工业的产能入口。 当然,视频模型要真正走向利润闭环,还有一些难题需要解决。 比如,可控性。商业交付不能盲盒抽卡,广告客户和影视团队需要的是确定性的结果。 比如,成本控制。到底是AI 便宜还是找外包更稳?尤其是对创业公司而言,如何在算力高昂的生成成本与持续健康的营收之间寻找平衡,是跨越生死线的核心挑战。 再比如,合规风控。视频比文本更敏感,涉及人物肖像、深度伪造风险。目前国内业界对模型训练涉及的数据安全和版权问题关注仍相对较少,但随着商业化的深入,这块灰色地带亟待规范与严格监管,越接近核心商业与大IP,合规成本就会越高。 结语 回到最初的问题:AI Coding之后,视频模型正在跑通商业闭环吗? 答案是已经跑通了商业闭环,但跑通的是高频商业视频生产这条窄路。它的第一桶金,来自短剧、广告营销、电商这些对素材有持续需求、愿意为效率付费的场景。 接下来最关注的,是谁能让客户每天打开、每天使用、每天付费。这是AI Coding验证过的路径,也是视频模型能否跑通利润闭环的关键。
Ternus接班前夕,苹果芯片、显示与产品设计团队迎来重组
编译 | 刘煜 编辑 | 陈骏达 智东西5月21日消息,5月19日,据彭博社报道,知情人士透露,苹果新任硬件工程与技术业务负责人Johny Srouji已于本月启动硬件部门架构重组,旨在进一步打通自研芯片团队与终端产品研发团队,实现深度协同。此次调整是苹果高层大规模管理层改组的一环。 苹果官方发言人对此不予置评。 图为Johny Srouji(图源:彭博社) Srouji将部分原本由苹果硬件工程高级副总裁、新任CEO John Ternus直接管理的团队纳入其管理范围。 此前负责苹果家居及音频产品研发的Matt Costello,如今将领导新的Ecosystems Platforms and Partnerships团队;统筹机器人设备专项项目组的Kevin Lynch,也将直接向其汇报。 此外,Srouji的两位核心下属也被赋予更大职责,分别是芯片工程部门负责人Sribalan Santhanam与先进技术事业部主管、华裔陈宗健。 Santhanam原本负责苹果全系设备主力芯片的研发工作,陈宗健此前则主导蜂窝调制解调器等多项核心前沿项目。 此次调整,Santhanam将新增管理范围,接手苹果以色列芯片工程团队,同时统筹芯片封装以及模拟混合信号(AMS)技术相关团队。这些团队主要负责系统集成、功耗管理、信号处理及以及其他对苹果设备至关重要的底层芯片功能。 陈宗健则正式接管Myra Haggerty领导的传感器软件与原型开发工作,以及由Alan Gilchrist主管的电池与摄像头工程团队。这些团队此前均直接向Srouji汇报工作。由Victor Yin负责的显示屏工程部门,也划归陈宗健管辖。 此外,长期推进的无创血糖传感器研发项目也交由陈宗健接手。该项目在2023年时,曾由苹果芯片平台架构部门负责人Tim Millet监督管理,如今完成职权移交,Millet依旧保持直接向Srouji汇报的层级不变。 在苹果内部,产品设计团队与工业设计团队相互独立,工业设计由单独高管分管,直接向CEO汇报。其中,工业设计团队负责制定新品整体设计理念与外观风格,产品设计团队则负责将设计理念落地,打造可面向消费者正式发售的成品。 本次调整中,最大的变动是产品设计业务管理权更迭。该业务负责从工程层面敲定苹果设备的外观、手感及核心性能,此前由苹果主要产品设计负责人Kate Bergeron主管,如今将交由她的两位长期副手Shelly Goldberg与Dave Pakula接手分管。 其中,Goldberg已负责Mac产品线的相关工作,Pakula则主要负责Apple Watch、iPad以及AirPods的产品设计。 此外,Richard Dinh将继续负责iPhone的产品设计工作,他是Ternus的长期副手之一。 与此同时,Bergeron将全面负责苹果全品类设备的产品可靠性管控。该职位此前由Tom Marieb担任,他曾接替Ternus负责硬件工程,目前直接向Srouji汇报工作。 调任后Bergeron将向Marieb汇报,同时继续负责苹果产品所用材料的研发工作。知情人士称,此次调动实则属于晋升,因为其职业发展路径与Marieb此前的晋升路径类似。 Marieb将继续留任Ternus此前的一些核心下属,包括负责Apple Watch工程业务的Eugene Kim、主管电气工程的Deniz Teoman,以及执掌苹果视觉产品事业部工程业务的Paul Meade。 Meade负责的事业部是Vision Pro头显的研发主导部门,目前其研发重心已转向眼镜与AI设备。 结语:苹果重整硬件与芯片研发体系,新一轮组织调整将落地 据外媒所述,此次调整显示,苹果正在进一步整合硬件工程、自研芯片与终端产品研发体系。随着Ternus即将接任CEO,在Srouji主导下,苹果管理层正完成新一轮交接,产品设计、芯片工程、显示、电池以及传感器等核心团队的管理架构也同步发生变化,苹果内部硬件研发协同方式正在被重新梳理。 与此同时,此次重组也覆盖Vision Pro、AI设备、机器人以及健康传感器等多个新方向。伴随苹果持续推进自研芯片与下一代硬件产品布局,其底层技术团队与产品团队之间的协同效率,或将成为未来硬件研发的重要影响因素。
哈佛华人校友创立的AI搜索创企,融资2.5亿美元,YC掌门人力荐
编译|毕伟豪 编辑|漠影 智东西5月21日消息,刚刚,AI搜索引擎初创公司公司Exa宣布完成2.5亿美元(约合人民币17亿元)的C轮融资,本轮融资由a16z领投,Benchmark、Lightspeed、Y Combinator加倍投资。该轮融资过后,Exa估值达到22亿美元(约合人民币149.63亿元),相比去年的7亿美元翻了3倍。 这家公司致力于为AI时代打造专属搜索引擎,为OpenClaw、Hermes之类的AI工具提供网络搜索API,其客户名单包括Cursor、Cognition、HubSpot、OpenRouter、Monday.com等明星公司。 YC掌门人Garry Tan也是Exa的用户,他专门在社交平台上转发了这条融资消息并称“当Agent需要在网络上检索信息时,不接受任何替代品”。 YC掌门人Garry Tan发文(图源:X) Exa成立于五年前,最初目标是构建一个能完美搜索全球所有信息的平台。2023年初,团队发现AI对高质量搜索API的需求正在爆发,随即发布了首个面向AI的Web搜索API。 此后两年,Exa没有像大多数竞品那样,在其他搜索引擎外面套一层封装,团队从零自建了一整套搜索引擎基础设施,爬虫追踪了超过 5000 亿个URL,目前用户已覆盖超过5000家企业和40万名开发者。 一、从零自建搜索引擎:爬了5000亿URL,比太空项目还稀有 Exa区别于大多数搜索API公司的一点是,它不是包装别人引擎的中间商。该公司花了数年时间从零构建了一个网络级搜索引擎。其爬虫追踪超过5000亿个URL,研究团队在自建的GPU集群上训练专用嵌入模型,还为AI代理所需的高QPS场景构建了新的向量数据库。 Exa自己的说法是:“太空计划的数量都比独立搜索引擎多,这其中自有缘由。” 该公司声称,六个月前,Exa在代码搜索方面还不如Google,但现在几乎所有主流编程代理都在使用Exa的服务。 在延迟方面,Exa宣称其搜索API的响应速度低于200毫秒,并配有快速文本提取模型,可将Token消耗量减少20倍以上。 二、Highlights模型:500字符达到8000字符准确率,Token消耗爆降 Exa近期重点投入的一项技术叫Highlights,是一个从网页中提取最相关片段的文本提取模型。 它在每次请求时实时运行(不做缓存),在100毫秒内完成,针对当前查询从页面里抽取最相关的段落。在SimpleQA基准测试上,500个字符的Highlights输出就达到了完整8000字符页面的准确率水平,Token消耗是后者的1/16。 SimpleQA基准测试(图源:Exa) Highlights不只面向开发者提供独立API,还是Exa自身Agent产品线(/answer、 Deep、Websets)的检索基座,每一轮Agent循环读取的都是Highlights提取的摘要。公司在博客中表示,这是其产品在延迟、成本和准确率三个维度上同时领先竞品的核心原因。 三、牵手Google Gemini,团队挖来Meta和Yandex搜索负责人 本月早些时候,Google发布了“Grounding with Exa Web Search”功能,目前处于内部预览阶段。在Google Next大会上,Exa Agent作为首发合作伙伴,通过Gemini Enterprise 的全新Agent Marketplace推出了Exa Agent。 具体来说,Gemini Enterprise用户可以在工作空间内直接调用Exa Agent执行网络搜索、查找相似页面或抓取URL内容。 团队建设方面,Exa联合创始人Will Bryk和Jeffrey Wang都毕业于哈佛大学,Will Bryk此前在从事AI客服与智能交互事业的公司Cresta担任软件工程师,Jeffrey Wang曾在金融科技公司Plaid做了将近三年的软件工程师。 此外,Exa近期引入了多位重量级人物:来自Meta的检索基础设施负责人、来自Yandex的搜索后端负责人,以及一个来自Google的研究团队。市场侧,LaunchDarkly前总裁Marcus Holm将加入Exa担任首席营收官(CRO),负责全球市场推广。 结语:基础设施全栈自建,押注千倍于谷歌的搜索量市场 Exa这轮2.5亿美元融资背后,押注的是一个正在急速膨胀的市场,数万亿个AI代理接入互联网后,它们需要的是即时、精准、可被LLM高效利用的结构化检索结果。 Exa在官方博客中给出了一个判断:未来几年,AI代理的搜索量将是如今Google总搜索量的1000倍。 从爬虫、嵌入模型到向量数据库全栈自建,Exa选择了一条最重的路。但当AI代理的搜索量真正达到Google的千倍时,靠封装别人的引擎显然撑不住这种规模,随时会被人扼住咽喉。
智能产品潮玩化:企业增量,还是智能废物?
作者|娅沁 声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。 如今的智能产品,似乎都有一颗“潮玩的心”。 荣耀联名泡泡玛特推出潮玩手机,百度推出潮玩积木款智能音箱,华为推出毛绒款陪聊机器人……更有意思的是,连泡泡玛特自己也开始跨界家电,其推出的原价5999元一台的LABUBU冰箱,在二手市场被炒到9.9万元,溢价达到16倍。 一边是智能产品主动向设计、情感和可玩性寻求突破;另一边是潮玩品牌试图用玩具逻辑去重塑传统家电。两条路径方向相反,却指向同一个信号:智能产品,正集体潮玩化。 但这条由潮玩逻辑铺就的路,真的能走通吗?还是说,它只是下一个内卷的开始? 1 智能产品,卷不动了 智能产品刚出现那会儿,“智能”两个字本身就是最硬的卖点。智能手机颠覆了功能机的交互逻辑,智能手表重新定义了腕上设备,智能音箱让一台普通扬声器能够听懂指令并完成操作,以及后来的智能门锁、扫地机器人、洗碗机这些。 它们的共同点在于,一个设备突破了原本的物理边界:手机不再只是打电话的,手表不再只是看时间的,音箱不再只能播放音乐。智能,重新定义了一件东西能做什么。 等到智能产品真正走入千家万户,它的价值重心也从扩展能力转向了减少负担,意味着更高效、更便捷、更省心。然而不知从何时起,这个叙事开始失效了。 越来越多产品开始为了智能化而智能化,家电尤甚。盲目堆砌语音交互和APP操控的情况很普遍,而实际使用中,灯喊不亮、空调叫不动时有发生,网络一波动,所谓的智能就形同虚设,最终还得老老实实回到手动操作。 像洗碗机这类产品,APP远程控制听着新鲜,实际场景中却很少能派上用场,毕竟按键直接就能洗,远程操作一旦网络不稳,程序半道罢工也不是没可能。这些看似新奇的交互,非但没有带来实质性的体验提升,反倒会增加使用负担。 消费者的感受更为直接。今年3月AWE(中国家电及消费电子博览会)现场,有受访者对惊蛰研究所直言,目前智能家电有不少鸡肋之处。有人说,冰箱的核心就是制冷和容量,但一些智能款硬塞进奇怪功能,没啥用不说,价格倒是实打实上去了。另一位受访者觉得,很多产品不过是加了个固定命令式的语音对话,根本没接入真正的AI能力,增加的成本也就几块钱的机械元件,却拿来制造溢价,属于本末倒置。 换句话说,消费者反感的不是智能本身,而是伪智能和沦为功能堆叠、没解决实际问题的产品。 一个不争的事实是,不少智能产品已陷入增长乏力的困局。拿智能音箱来说,据洛图科技报告,2024年中国智能音箱市场销量为1570万台,同比下降25.6%,这已是连续第四年下滑。去年第四季度,洛图科技还曾预测2025年全年销量约1420万台,同比降幅虽有收窄,但仍达9.6%。 而生成式AI爆发之后,厂商们又迅速将“AI功能”视作新的差异化路径,AI陪伴机器人、AI眼镜、AI手机等概念产品接踵而至。但历史反复证明,每一次技术浪潮最终都会走向技术平权,当人人都有AI的时候,要么技术迭代已经遭遇瓶颈,要么技术落地本身已然没有了门槛。 眼下,智能产品迫于市场压力,在形态创新方面持续面临挑战。但由于制造业的产品功能创新更依赖于供应链的整体发展水平,因此厂商在功能上的竞争,短时间内或许很难拉开差距。然而竞争不会消失,厂商们需要找到一个功能之外的新叙事。而潮玩经济的兴起恰好提供了一个新的思路,用户愿意为情绪价值支付溢价。既然功能卷不动了,卷情绪价值也是一个不错的选择。 所以如今科技大厂们纷纷行动,比如百度推出潮玩积木款智能音箱,荣耀联名泡泡玛特推出MOLLY限定版手机,华为则推出毛绒款AI陪聊机器人“智能憨憨”。智能产品纷纷转向设计、情感与可玩性,试图以潮玩逻辑重新激活消费欲望。 2 潮玩化:门槛最低的差异化竞争 毋庸置疑,潮玩化确实是一条“捷径”,而且可能是阶段门槛最低、见效最快的差异化手段。 因为企业无需改变核心功能,甚至不需要自研底层技术,只需换一套外观设计或IP联名,即可快速生成“新产品”。这种操作的诱惑力,在存量竞争的时代,几乎无法抗拒。 一个最新的例子是格力。这家曾因“玫瑰空调”被全网吐槽“土味审美”的老牌家电企业,最近转了风向。据公开信息,格力即将推出多款萌系空调:小猫、云朵造型的挂机;小兔柜机(据说头部还可以更换)、仙人掌造型的柜机等。 *图片来源:格力家用空调小红书账号 尽管这些产品还没正式上市,但社交媒体上年轻人的好评已经纷至沓来。有网友直言自己理解格力了:它会给妈妈辈设计玫瑰,也会给年轻人造猫猫空调。也有年轻人直接提需求说,小兔柜机的头若能换成熊猫,自己会直接被“拿捏”。另一些声音则从家装角度出发,认为市场确实需要更具装饰属性的家电产品。 从全网吐槽到被年轻人接纳,情绪价值的力量可见一斑。由此也可以看到,智能产品潮玩化最核心的商业价值或许在于,它模糊了工具与玩具的边界,从而打开了过去不存在的中间品类。 可以作为例证的是,华为推出的一款售价399元的毛绒陪聊机器人——智能憨憨,预售首周就破10万台,在二手平台上溢价高达25%-40%。用户购买它的初始动机,显然不只是功能需求。 *图片来源:华为商城 潮玩化对智能产品的改造几乎是全方位的。外观上,引入积木、毛绒、IP联名等设计语言,服务于好看、好玩、好晒的传播逻辑;交互上,从单向的命令执行,扩展到触觉、表情、光效、震动等多模态反馈,构建出拟人化的回应机制。产品不再是纯粹的工具,它开始让人有一起对话聊天、一起玩的冲动,成为一种陪伴式的存在。 当然,潮玩化并非万能解药。它降低了差异化的门槛,却也容易让品牌陷入重外观、轻体验的依赖。 以眼下活跃的AI玩具赛道为例,外观设计一个比一个好看,材质触感、质感一个比一个细腻。但据杭州日报旗下的《每日商报》报道,电商平台上,部分AI陪伴潮玩产品7天无理由退货率高达30%。最主要的原因在于,当前对话式AI在响应延迟、交互连贯性和联网稳定性方面仍存在短板,难以支撑起真正的玩伴角色。 外观和情绪可以吸引用户下单,但体验的不可持续,最终也无法留住用户。在这点上,其实早就在智能音箱身上预演过了:不少人家里的智能音箱,如今最常用的功能只剩下查天气和当闹钟,用户还要忍受“见缝插针”的广告植入。这类产品往往是刚开始有新意,长期使用又不够,最后变成智能摆设。 目前潮玩之所以热度还在,是因为它提供的情绪价值,依然能打动并吸引很多人。但情绪红利,总会有失效的一天。 3 吃完情绪红利,吃什么? 当所有智能产品都变得好看、可爱、有IP,“潮玩化”这条创新路径也在快速同质化。 今天一个毛绒AI陪聊机器人能火,不久就会有更多同款出现。空调可以变成小猫造型,接下来,小狗、小熊的版本就会集体上新。如此一来,潮玩化的红利期可能会比技术红利更短,因为它更容易被复制。 除了同质化,更深层的问题在于,潮玩化与功能性之间存在天然矛盾。潮玩的特点是鼓励冲动消费、外观驱动换新、功能被弱化,而智能产品的基础特性要追求好用、耐用。当把这两种逻辑放在同一个产品里,很容易产生冲突。 不过,这种矛盾并非无解。市面上已经有一些产品尝试让IP不只是在外观,而是真正参与到功能之中。2024年10月,任天堂推出的Alarmo闹钟就是一个典型例子。 这款售价99.99美元、最初仅限NSO会员购买的智能闹钟,融入了体感操控、沉浸式游戏音效和睡眠监测功能。它内置了30多种来自《超级马里奥》《塞尔达传说》等Switch热门游戏的“唤醒场景”,让用户能在熟悉的游戏声音和音乐中醒来。比如《塞尔达传说》里林克被守护者追逐的音效,可以直接用作闹钟提示音。而在2025年3月,任天堂还为已购用户推送了复古超级马里奥主题更新。同年10月,又追加了“星之卡比探索发现”主题。这些持续更新的主题,也为用户带来了新的体验。 *图片来源:任天堂官网 有趣的产品创意和令人期待的产品体验,让这款闹钟一经发售便供不应求,线下门店遭遇断货,任天堂被迫改为抽签销售。在国内,这款闹钟的二手市场价格一度炒到2000到2500元,翻了三四倍,甚至有人花上万元求购。 它真正的特别之处,在于设计思路的转换:马里奥、林克这些IP,并没有被做成卡通造型呈现在闹钟外壳上,而是通过音效和场景主题,深度参与了“叫醒用户”这个核心功能。在这里,IP不是装饰,而是功能的一部分。 因此,评判一款潮玩化智能产品能否成功,不能只看它刚推出时的惊艳程度。真正的考验在于:半年、一年、两年后,用户还能不能找到新的玩法和体验,使用体验能否持续优化。甚至可以说,如果把潮玩元素全部剥离,它还算不算一个合格的产品?如果答案是否定的,那它的生命周期就不会太长。 这个判断标准,同样适用于泡泡玛特跨界做家电。短期来看,“IP+贴牌”可以快速起量;但长期来看,消费者最终会因为“好不好用”而决定复购或抛弃。更让智能产品的潮玩化道路扑朔迷离的是,潮玩自身也可能在某个不经意的节点骤然降温。 *图片来源:泡泡玛特官网 3月底,泡泡玛特发布了“史上最强年报”——2025年总营收达371.2亿元,同比增长184.7%,净利润130.8亿元,同比增长284.5%。然而财报发布后的五个交易日,其股价累计跌幅超过35%。股价的下跌或许正在释放一个信号:资本市场已经开始重新审视潮玩经济的可持续性。尤其是靠潮玩IP更新迭代撑起的营收模式,一旦IP热度回落,后续又缺乏能接棒的IP,增长天花板的风险便不言而喻。 消费者的需求从来都是多变的。单纯的情绪红利终会退潮,到那时,智能产品又要靠什么留住用户? 潮玩化确实正在重新定义智能产品的价值,但它的终点不会是潮玩。它可能演变成,一个既解决实际问题、又能提供持续情感价值的新品类。
对谈苏妈后,李开复的“一把手工程”堪称CEO学习的新圣典
智东西 作者 | 三北 编辑 | 漠影 “如果公司做的 AI 转型,最终没有改变任何一个会出现在季度财报电话会议上的数字,那么你是做错了,只是浪费钱打造了一个AI实验室。” 5月19日,在AMD AI开发者日上,李开复对台下数百名开发者说出这句话时,坐在他身旁的AMD董事会主席兼CEO苏姿丰也点头认同。 这场围绕“多智能体+ DRI”的对话很快在技术圈刷屏。李开复称,传统CIO角色将被大幅削弱,企业AI转型必须是“一把手工程”,而技术人若不交付结果,将在智能体时代被淘汰。 话音未落,零一万物便将这套方法论推向更广的舞台。这家由李开复创办的AI独角兽,正在把“一把手工程”倡议变成产品——CEO顶层战略驱动+万智平台底座+企业级多智能体+端到端价值交付。 就在5月20日下午,超聚变探索者大会 2026 现场,李开复登台发表了题为《多智能体:对CEO而言最需要掌握的技术》的主题演讲,为零一万物的“一把手工程”提供了新的注脚。 李开复给在场的CEO们划出了以下五个重要的行动参考建议: 1、CEO必躬身入局:这不是IT部门的技术选型,而是必须由CEO主导、贯穿顶层设计与一线执行的组织变革战。 2、多智能体释放“美第奇效应”:多个专长各异的Agent协同、互补乃至对抗,能突破单体智能天花板,产生创造性突破。 3、编码是行动基石:AI将编写99%的代码,编码能力让智能体能把意图直接转化为操作,是自动化数字行动的根本。 4、专属数据飞轮=最深护城河:当智能体深入核心业务并共享数据闭环,将形成企业独有的数据飞轮,自我进化且不可复制。 5、不提升财务回报的AI转型是浪费钱:Agent必须切入供应链、研发、销售等核心环节,以可量化的ROI(质量、成本、周期)为根本目标。 李开复认为,未来十年,企业竞争的分水岭不在于用了哪个大模型,而在于CEO能否像指挥交响乐一样编排多智能体,并让每个技术人都成为对结果负责的DRI(直接责任人)。 《多智能体:对CEO而言最需要掌握的技术》演讲主要内容讲述如下: 一、“美第奇效应”第一次进入AI世界:AI Agent 向“群体智能”质变 外界一度担心,AI 智能体的进展会趋于平缓。李开复的判断正相反:智能体的发展不但没有放缓,反而在加速。 支撑这个判断的,是李开复眼中行业发生的两个关键变化。 第一个重要的表现就是AI编码能力。李开复明确谈道,AI 编码能力跨过了临界点,过去几个季度,AI 编码能力以肉眼可见的速度提升。一边是AI编码质量的飙升,在SWE-bench验证通过率这一指标上,AI正在超越人类工程师;另一边是推理成本的骤降,每百万tokens的综合成本快速下探。 沿着这条曲线,李开复给出了明确的预测:AI代码生成将很快超过人类,最终99%的代码将由AI编写。 基于这一变化,他直言:“至少 95% 的程序员岗位,AI 不是平替,而是做得更好、更快、更便宜。”据李开复透露,如今零一万物内部,约 90% 的代码已经由 AI 生成。 不过,李开复同时强调,这并不意味着程序员会消失。在他看来,随着 AI 能力持续提升,未来世界所需要的代码量,可能会比今天增加 1000 倍、1 万倍,真正会被淘汰的,并不是程序员,而是“不会驾驭 AI 的程序员”。 为什么编码如此重要?在他看来,编码不仅是 AI 能完成的任务,更是自动化数字行动的技术基石。编码上的突破,会反过来加速整个多智能体时代的到来。 人类通过点击按钮操作工具,而AI智能体则是通过生成代码来行动。要查询数据库、发送消息、调用API,或操作软件,AI必须可靠地生成精确的数字指令。当 AI 能稳定地写代码、调用工具,它就具备了将人的意图直接转化为行动的能力。编码能力将赋予智能体“能动手操作”的能力。 第二个变化,也是李开复认为更重要的一个,是多智能体的出现。强推理的Agent从单打独斗走向协同。 在过去的一段时间,Agent正在快速进化。李开复梳理了Agent进化的三个阶段:工作流、强推理、多智能体。 •工作流:由人决定好流程,Agent一步步执行指定任务; •强推理:Agent基于大模型的推理能力规划复杂任务,并调用多种工具; •多智能体:多个AI Agent针对人类给定的目标自动形成子任务集群,有机互联,构建出一张AI智能体网络。 他强调,多智能体真正要解决的,是复杂问题的决策困境。从人类文明历史来看,投资委员会、公司董事会、陪审团、内阁,种种形式都在证明:单一认知总有极限,当协同式的集体智能介入,更可靠的判断才会涌现。零一万物以多智能体技术为基础,组建了模拟投资委员会、异构专家小组,以及专门扮演“魔鬼代言人”的红蓝对抗团队。 为了说明多智能体如何重构企业组织协作,李开复在现场以企业最常见的“部门墙”为例:“在你所在公司,负责绩效评估的 HR,平时会和负责招聘的 HR 天天沟通、彼此理解吗?肯定没有。” 在他看来,传统企业长期存在的信息孤岛,本质上源于部门之间的数据与目标彼此割裂。但在多智能体体系下,招聘 Agent 与绩效评估 Agent 可以共享底层数据,并基于统一目标持续协同。AI 甚至会根据员工实际业绩,自动优化招聘策略——“今年业绩公布后,多招 5% 最优秀的人,坚决不要最差的 5%。” 李开复认为,多智能体真正重要的意义,并不只是单点效率提升,而是它开始打破企业内部长期存在的信息壁垒:市场部门能够理解技术目标,产品部门能够感知组织效率,不同职能之间第一次拥有了共享的“企业认知系统”。 而当不同能力、不同角色的 Agent 开始协同、互补甚至彼此“辩论”时,多智能体便会进一步释放出远超单一智能体的价值。 李开复谈道,借由多智能体架构,零一万物第一次把“美第奇效应”带到了AI世界。所谓“美第奇效应”是指:当不同领域、不同背景的思想在边界处相遇,创新会以远超单一学科的强度爆发。 在李开复看来,多智能体的核心价值,正是来自于这种认知多样性架构。多智能体能够持续释放创造型摩擦与美第奇效应,从而突破单体Agent的智能天花板。 二、AI转型若与财务回报脱钩,那就是浪费钱 以OpenClaw为代表的通用智能体近期广受关注,但在李开复看来,智能体最大的价值在企业端。消费级应用固然热闹,但真正能让Agent深度运转、产生可量化回报的,是企业的核心业务场景。 问题在于,眼下最热的通用Agent,恰恰进不了企业的门。通用Agent天生不适配企业场景,它不懂行话、缺乏行业背景知识,又和企业核心数据存在断层,一进具体业务就容易产生事实性错误,难以真正落地。 李开复谈道,企业所需要的不是通用Agent,而是真懂业务的企业级Multi-Agent(多智能体)。零一万物给出的解法正冲着通用Agent的短板而去:利用RAG(Retrieval-Augmented Generation,检索增强生成)与微调打造行业模型,让Agent“懂业务不胡说”;深入业务流,以智能体连接ERP、CRM等核心系统;支持私有部署,把核心数据安全握在企业自己手里。 李开复在现场提到,过去真正能够把数据、业务流程与内部系统深度打通的,往往只有阿里、腾讯等大型互联网公司。 这些公司内部长期维持着规模达到3000至4000人的IT团队,持续开发和维护企业内部系统,从而实现对业务数据、组织流程与经营状态的深度数字化管理。 但在李开复看来,AI编码与多智能体能力成熟之后,这种能力正在被重新分配。“过去只有巨头才拥有的‘数千人工程团队’,未来每一家企业都可能拥有。” 而这正是企业级Multi-Agent与通用Agent最大的区别:它不只是一个“会聊天”的工具,而是能够真正深入企业核心业务、理解组织流程、连接内部系统,并持续参与业务协同与决策执行的智能体体系。 若要企业级多智能体要发挥最大价值,企业必须敢于让Agent深入核心场景。李开复直言,不能提升企业财务报表数据的AI转型,就是浪费钱。Agent的战场应该从行政、知识库这类基础应用,一路推进到供应链、客服、财务,直至生产、研发、销售这些真正的核心环节,并且以可验证、可量化的ROI为根本目标,把效果落到质量提升、成本下降、周期缩短上。 一旦企业智能体嵌进核心业务流程,它的身份也随之改变。企业级多智能体能够精准识别业务上下文,并主动介入协作工作流。这样一来,AI 智能体就能像人类一样,嵌入组织并承担虚拟角色。它们每一个都会成为独立的生产力节点,并与其他智能体协同合作来完成任务,从一个部门的效率工具,升级为可复制、秒级进化、边际成本趋近于零、24×7在岗的“超级员工”。 当一家企业越来越多的核心业务场景完成AI数智化转型,分散在各个环节的智能体会共享同一套企业数据,并在协同中不断把执行结果反馈给彼此:一个环节产出的反馈,会成为另一个环节优化决策的依据。数据由此转动起来,形成一个企业内部的数据飞轮。飞轮转得越久,智能体对这家企业的理解就越深,自我进化也越快。 这个数据闭环的关键,在于它专属于企业自身。未来每一家企业都会部署基座模型与智能体,但一家公司在自己业务里沉淀出的数据和协同经验,将会是最大的壁垒。李开复认为,多智能体时代企业数据飞轮一旦启动,就会成为企业最深的护城河。这才是企业AI数智化转型的真正含义。 从这一角度来看,核心业务的AI转型远不是单一IT部门能完成的。李开复反复强调,企业AI数智化转型是一把手工程,需要由CEO从顶层设计出发,自上而下地推动转型,与一线员工形成转型共同体,确保从战略到执行一路贯通。 这也是李开复把多智能体称作CEO必修课的一大主要原因:它考验的不是技术选型,而是企业组织一把手实施变革的决心。 这套方法论并非停留在演讲稿上。依托端到端自研技术,零一万物自主研发的“万智企业大模型平台”(以下简称万智平台)已覆盖政务、金融、工业、办公等重点行业。目前,零一万物已深度服务某国际头部能源企业、东南亚跨国巨头、某全球制造业龙头及友邦保险等国际标杆客户,持续提升国际竞争力。 李开复谈道,“多智能体是企业实现价值重构和生产力跃迁的关键,也是CEO最需要掌握的技术。它的真正价值,在于嵌入供应链、研发、销售这些最关键的环节。企业AI数智化转型所考验的不是CIO的选型能力,而是企业一把手推动组织变革的决心。企业转型没有旁观者,只有顶层设计贯穿到一线执行,才能让智能体真正走进业务,铸造新时代的核心壁垒。企业多智能体将是未来十年最重要的时代机遇,我希望每一位CEO都问自己一个问题——你的公司准备好了吗?”
阿里李飞飞首秀:一口气面向Agent发了32个新品
智东西 作者 | 李水青 编辑 | 漠影 2026阿里云峰会,可能是阿里云成立17年来释放信号最为密集的一场发布会。 智东西5月20日杭州报道,今天,阿里云宣布完成“芯片-云-模型-推理”全栈Agent化升级,同步推出搭载自研AI芯片真武M890的超节点服务器、最新旗舰模型Qwen3.7-Max、全新AI产品“千问云”等超50项新品及升级。这是国内云厂商首次围绕Agent进行全栈产品发布。 “Agent突破临界点之后,可以24小时不间断工作,对AI和云的需求无穷无尽。”阿里云资深副总裁刘伟光说,“阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。” 放眼全球,云巨头们正在展开一场全栈AI竞赛。谷歌有TPU+Gemini+GCP,亚马逊有Trainium+Nova+AWS,而阿里云此次亮出的“芯-云-模型-推理”全栈体系被业内称为阿里“通云哥”:通义+阿里云+平头哥。主要发布内容如下: 1. 平头哥首发新一代训推一体AI芯片真武M890,性能为上一代3倍,并公布未来两年路线图;磐久AL128超节点服务器实现128卡互联,P2P时延低于150ns。 2. 阿里云全面迈入Agentic Cloud,发布了至少32项Agentic Cloud新品及更新,覆盖运行时、编排、治理、安全、记忆、数据平面六大能力;对云产品进行Skill化、MCP化和CLI化改造,让Agent像调函数一样调用云能力。 3. Qwen3.7-Max正式发布,模型登顶Arena国产第一,可在全新芯片上自主工作35小时,将内核性能提升10倍。(智东西实测→《阿里Qwen3.7竞技场杀至国产第一!一手实测:分分钟破解奥赛难题,图文视觉全都难不倒》) 4. 百炼平台开放并池调度、上下文缓存等弹性技术,接入智谱、MiniMax、Kimi等150多款模型。 5. 千问云官网(www.qianwenai.com)上线,以一行指令替代传统导航,全面Skill/CLI化,对Agent更友好。 一、李飞飞首秀:连发32大新品及更新 这是阿里云首席技术官李飞飞自4月8日就任后在峰会上的重要首秀。 李飞飞宣布,阿里云通过Agent Infrastructure为Agent负载提供支持,并推出Agentic Products——面向Agent的云产品。 Agentic时代,云业务面临短生命周期、数据模态与存储形式复杂、无规律突发负载、动态环境依赖、任务级安全管控和大规模动态编排六大挑战,而Agent Infrastructure以运行时、编排、治理、安全、记忆、数据平面六大能力来应对挑战: 具体到运行环境,阿里云为Agent构建了完整的支撑体系:轻量高效的沙箱执行环境、多Agent协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。 Agentic Cloud运行时五大新品及更新如下: Agentic Cloud编排一大新品及更新如下: Agentic Cloud治理四大新品及更新如下: Agentic Cloud安全五大新品及更新如下: Agentic Cloud记忆七大新品及更新如下: Agentic Cloud数据平面十大新品及更新: 阿里云Agent Infrastructure已助MiniMax企业级Agent大规模落地。 有了这些产品及更新,未来一个开发者只需要给Agent一句自然语言指令,Agent就能自动完成从资源识别到应用部署的全流程,无需人工点击控制台或编写复杂脚本。 李飞飞认为,传统云产品的交互逻辑是为人设计的,用户看着控制台点击按钮,或者通过API编写代码调用。但Agent的工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。 传统云产品打开控制台,看到一堆菜单、配置项、仪表盘,这些视觉化信息对人很友好,但对Agent毫无意义。为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以“像调函数一样调用”的标准化能力模块。 阿里云不是在云上加一层Agent接口,而是把云本身变成Agent能用的东西。这套改造的野心在于让云从“人的工具”变成“Agent的操作系统”。 二、平头哥首发真武M890,扔出128卡超节点算力王炸 芯片层,阿里云亮出了一张目前国内云厂商中独一份的王牌:覆盖算力、网络、存储的完整自研数据中心芯片矩阵。 峰会现场,平头哥新一代训推一体AI芯片真武M890首次亮相。规格相当硬核:144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍。芯片原生支持FP32到FP4等多种数据精度,可应用于高精度训练到超低精度推理的全场景。在低精度推理场景下,不仅能保证模型输出质量,还能显著降低单次推理的算力开销。 更值得关注的是基于真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0。这个超节点可让128张AI芯片组成一台计算机,P2P时延低于150ns,单柜带宽达到Pb/s级。 为什么要做这么大的超节点?因为Agentic时代,算力集群需要承载成千上万个Agent同时运行,每个Agent在一次任务中可能连续发起数十次模型调用,对通信时延和带宽的要求是指数级上升的。该超节点已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流模型。 平头哥还首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片,已服务中国电信、中国一汽、浦发银行等20多个行业的400多家客户。 加上自研的倚天系列CPU、磐脉智能网卡、镇岳存储主控芯片、ICN Switch互联芯片,平头哥的芯片版图已经从“单点突破”走到了“全面覆盖”。 三、Qwen3.7-Max来了,登顶Arena榜,胜任35小时长程任务 Qwen3.7-Max是阿里巴巴最新发布的旗舰大模型。 在三方机构Arena全球大模型盲测总榜中,它超过Kimi-K2.6、DeepSeek-V4-Pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。在细分榜单上,数学排名第7、专家任务第9、编程任务第10,表现相当均衡。 比跑分更有说服力的,是一个堪称“极限测试”的实战案例。在模型训练时从未接触过的全新硬件平台——平头哥真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立进行了432次内核评估、1158次工具调用,完全自主地完成了编写、编译、性能分析与迭代改进的全流程。最终,它优化后的推理内核比SGLang Triton官方参考实现快了10倍。 没有人类干预,没有中间指导,35小时,从零到生产级。测试轨迹还显示,模型在独立运行超过30小时后仍发现了有效优化点,甚至主动发起了一次关键的架构重设计。这个案例展示的不是模型“回答问题”的能力,而是模型“自主完成复杂工程任务”的能力——这恰恰是Agent场景最核心的需求。 阿里巴巴通义大模型事业部负责人周靖人谈道:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型‘说得好’,现在要求模型‘做得到’。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。” 值得注意的是,近3个月内,千问旗舰模型已经连续迭代了3.5、3.6、3.7三个版本,保持着极高的发布节奏。阿里巴巴显然在刻意加速模型进化,以匹配Agent时代对模型能力的指数级增长需求。 四、百炼平台全面开放,智谱、Minimax、Kimi等顶尖模型首批上架 如果说芯片是地基、模型是引擎,那百炼推理平台就是Agent真正跑起来的“生产车间”。 阿里云在百炼平台上构建了大规模GPU资源集群,并通过一套完整的技术栈应对Agent场景的特殊挑战:并池调度将GPU资源统一调度提升利用率;上下文缓存消除多轮对话和长链路任务中的重复计算开销;吞吐弹性调度应对并发请求的波峰波谷;Agentic RL基于实际执行反馈让模型持续迭代。此外,百炼内建了安全治理能力——在Agent自主运行的语境下,一个24小时不间断执行任务的Agent如果没有边界约束,后果不可控。百炼的安全机制确保Agent始终在预设的权限范围内行动。 在生态策略上,百炼保持开放接入。峰会当天,阿里云宣布与月之暗面、Minimax、智谱、阶跃星辰、爱诗科技、生数科技等达成合作,GLM-5.1、MiniMax M2.7、Kimi K2.6、Pixverse-v6-it2v、Kling-v3-omni-video-generation、Vidu Q3-Pro等模型已上架百炼,并通过千问云官网全面售卖。目前百炼已提供150多款主流模型API。 百炼不仅提供阿里自研模型服务,同时面向头部AI厂商开放,为用户提供“一个入口、多模型可选”的一站式服务体验。目前百炼已推出按需、按时长的灵活计费模式,用户可通过统一SDK接口接入不同模型,实现灵活切换与高效迭代。据阿里最新财报,截至2026年3月,百炼平台该季度客户数量同比增长了8倍。 五、首发千问云,全面Skill和CLI化,对Agent更友好 千问云是阿里云成立17年来,首次在阿里云官网之外推出的全新产品官网。打开页面,突出的不是产品列表,也不是控制台,没有任何传统意义上的导航结构。首页只有一行字: 安装 Skills npx skills add QianWen-AI/qianwen-ai 这是一条Agent可读的prompt指令。阿里云将所有模型服务的核心能力封装为标准化的Skills和CLI工具,智能体可以直接解析这条指令,“学会”网站的全部能力,并根据需求自主调用。 过去十年,云的交互逻辑是“人登录控制台→选产品→配参数→调API”。这套流程对人类来说已经足够顺畅,但对Agent来说完全不可用。Agent不看网页,不点按钮,它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。 千问云Skills将模型选型、调用、认证配置、用量查询等完整链路能力封装,用户无需编写任何代码,Agent即可动态路由不同模型——自动用视觉模型处理图片,用生图模型生成图片,用视频生成模型创作视频。千问云CLI则可覆盖登录认证、模型查询、调用、用量查询和环境诊断等能力,直接通过脚本或命令行自动化完成所有模型服务的工作流。 基于千问云Skills和CLI,Agent还能实时拉取模型用量数据,自动分析趋势、识别异常,为用户提供成本优化建议。目前,千问云Skills和CLI均已在GitHub开源。付费模式上,千问云提供按量付费和Token Plan订阅两种模式,后者适用于高频AI编程和Agent场景,可显著降低Token成本。 结语:全球云巨头展开AI全栈竞赛 当云的主要消费者从人变成Agent,所有围绕人类设计的界面、流程和交互逻辑,都将被重写。 从芯片真武M890,到Agentic Cloud,到Qwen3.7-Max,到百炼平台,再到千问云……阿里云在2026年5月20日这一天,完成了一次从底层到入口的全链路重构。 放眼全球,这场竞赛刚刚进入深水区。谷歌以TPU+Gemini+GCP构筑闭环,亚马逊以Trainium+Nova+AWS正面迎战,微软手握Maia+ Copilot+Azure。而阿里云此次亮出的“芯-云-模型-推理”全栈体系,证明了中国云厂商有能力在同一张牌桌上竞争。 吴泳铭在财报电话会上把AI投入比作建设“训练工厂”和“推理工厂”。今天,这两座工厂已经开始全速运转。未来三年,阿里云的AI算力规模将比2022年增长十倍,是已经在执行的计划。 值得一提的是,阿里云选择了“开放”作为差异化路径——百炼平台接入150多款模型,千问云Skills和CLI全部开源,这既是生态策略,也是对Agent时代“没有一家模型能通吃一切”这一底层判断的回应。
刚打赢马斯克,OpenAI被曝本周启动IPO
智东西 编译 | 杨京丽 编辑 | 李水青 智东西5月21日消息,据《华尔街日报》报道,OpenAI正与高盛、摩根士丹利等投行合作,准备在未来几天或几周内向监管机构秘密提交IPO申请文件,最快可能本周五递表。 OpenAI目标最早在今年9月上市,不过计划仍可能调整。公司最近一轮融资中的估值达到8520亿美元(约合人民币5.8万亿元)。若顺利上市,OpenAI将成为今年科技公司IPO潮中最受关注的公司之一。 与此同时,马斯克旗下SpaceX今天已提交IPO文件,Anthropic也在探索公开上市,科技公司正集体涌向资本市场。 不过,OpenAI冲刺上市仍面临多重考验。一方面,公司需要证明其收入增长,足以支撑巨额数据中心和算力投入;另一方面,Anthropic近几个月增长较强,也给OpenAI带来更直接的竞争压力。递表时间、诉讼进展、算力开支和竞争压力,构成了OpenAI这次冲刺IPO的几条主线。 一、此前估值5.8万亿,OpenAI最快本周五递表冲刺9月上市 知情人士称,OpenAI可能最快于当地时间5月22日向监管机构秘密递交IPO文件。该公司由奥尔特曼领导,在最近一轮融资中,公司估值达到8520亿美元(约合人民币5.8万亿元)。 两天前,OpenAI在与马斯克的庭审中胜诉,扫清IPO前的一项重要障碍。不过,马斯克称计划对相关判决提出上诉。 奥尔特曼和马斯克(图源:CNBC) 尽管如此,OpenAI上市前,还需要解决一系列问题。公司已承诺投入巨额资金建设数据中心,但外界担心,它能否创造足够多收入,支撑这些开支。 此外,OpenAI还受到竞争对手的持续施压。近几个月,Anthropic凭借Claude及相关软件工具,在办公场景中的快速普及,增长速度超过OpenAI,威胁OpenAI此前在AI竞赛中的领先位置。OpenAI正在调整战略,试图重新拉开差距。 据《华尔街日报》5月1日报道,奥尔特曼一直希望推动OpenAI上市,但公司CFO萨拉·弗赖尔(Sarah Friar)曾向公司高层称,公司可能需要更多准备时间。OpenAI近期面对谷歌、Anthropic等竞争对手的压力,未能完成多个内部营收和用户目标。 二、SpaceX已递表、Anthropic筹备上市,科技公司集体涌向资本市场 今天,马斯克旗下火箭公司SpaceX公布IPO文件,可能在6月上市。除OpenAI和SpaceX外,Anthropic也在探索大规模公开上市,还有一些规模较小的公司也在筹备上市,IPO窗口明显回暖。若计划顺利推进,今年有望成为IPO融资总额创纪录的一年。 SpaceX招股书文件 值得注意的是,OpenAI、SpaceX、Anthropic三家公司关系微妙,背后多位核心人物曾有过合作,如今却站在不同阵营。随着这些公司走到IPO前夜,奥尔特曼、马斯克和Anthropic CEO达里奥·阿莫代伊(Dario Amodei)之间的竞争、分歧和旧账,也被放到更公开的位置。 过去几周,马斯克针对OpenAI发起的诉讼,让这段历史重新成为焦点。OpenAI最初是一家非营利AI研究机构,目标开发造福人类的AI技术。 后来,OpenAI管理层为筹集资金,推动建立营利性实体。参与这一阶段决策的核心人物包括奥尔特曼、早期为OpenAI提供数千万美元资金的马斯克,以及后来创办Anthropic的阿莫代伊。 诉讼中,马斯克指控OpenAI通过转为营利性公司“窃取慈善组织”。OpenAI则称,马斯克曾支持营利化转型,只是在意识到自己无法完全控制OpenAI后,才与奥尔特曼等人决裂。最终,陪审团裁定支持OpenAI,法官也驳回了马斯克的主张。 过去一年,马斯克与奥尔特曼的矛盾持续升级。除诉讼外,马斯克还多次批评OpenAI。近期,马斯克又同Anthropic达成协议,向这家OpenAI竞争对手提供数据中心算力。 冲刺IPO前,OpenAI已经处理了多项关键事项:它重新修订了与微软的合作关系,调整公司结构以满足上市需求,还赢下了与马斯克的官司。不过,投资者仍在追问OpenAI及其合作伙伴的财务状况。 微软和OpenAI宣布修订合作协议(图源:OpenAI) 过去一段时间,奥尔特曼密集宣布了多项科技行业合作,其中部分交易并未完全按最初设想落地。不过,OpenAI仍获得足够算力,支撑快速增长,继续与Anthropic等竞争对手争夺AI领先地位。 结语:科技巨头竞相上市,资本市场将检验商业化能力 SpaceX、OpenAI、Anthropic接连走到IPO前夜,AI等高科技公司正在迎来新一轮资本化窗口。对这些公司来说,上市一定程度上,意味着其估值、收入、算力投入和竞争格局将接受公开市场更直接的检验。 尤其对OpenAI和Anthropic而言,模型能力是它们获得高估值的重要基础,但公开市场还会进一步关注收入增长质量、算力成本控制、企业客户留存,以及大规模投入能否持续转化为商业回报。接下来,谁能把技术领先转化为可持续商业增长,将成为资本市场关注的核心问题。
腾讯版“贾维斯”上线:一句话搞定电脑配置,每天1000万Token免费用
作者 | 王涵 编辑 | 云鹏 智东西5月21日报道,昨天,腾讯旗下操作系统层级AI助手Marvis(马维斯)正式上线,其将终端系统、文件、应用、算力和跨端连接纳入同一个AI中间层。用户只需要用一句话说明目标,Marvis即可理解任务、拆解步骤、调用对应Agent执行,并在涉及隐私、安全和支付等关键环节时交回给用户确认。 在具体使用场景中,Marvis可以帮助用户做文件格式转换、合同信息审查、运营数据分析,甚至帮忙整理参考文献。 用户可以在虚拟办公室里随时查看每个Agent在干什么,被安排任务的Agent会坐在工位上认真搬砖,其他闲着的Agent可能会打盹、闲逛、健身、喝咖啡或上厕所。 今年3月,腾讯曾推出自研AI原生桌面智能体工作台Workbuddy,其核心在于“办公自动化”,主要面向办公人群。但Marvis的核心在于“对设备的理解与操控”,它的权限更高,直接深入到了电脑的操作系统底层,面向的人群则更加广泛。 在内测阶段,智东西就第一时间体验了Marvis。根据我们的实际体验,Marvis展现了“AI打工人”的雏形,它能实实在在地帮你干活,完成任务的质量不错,但在速度、token消耗量、灵活性等方面仍有提升空间。(腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了) 目前,Marvis开放Windows端、Mac端、安卓端版本下载,iOS端版本仍在开发中。用户每人每天有1000万免费Token额度。 一、操作系统层级理解,多端入口互通 据腾讯Marvis团队介绍,Marvis将整台电脑变成可对话的“智能对象”,能直接触达系统层级。 只需要一句话,用户可以直接询问电脑配置、电池健康、网络状态,或让它检测硬件能否流畅运行某款游戏,也可以通过聊天的方式调整系统设置、优化开机自启动项、清理冗余文件。 对于电脑小白和长辈用户,它降低了系统设置和故障排查的门槛;对于职场用户,它把原本分散在多个工具里的配置、检索和处理任务,变成一个更便捷的入口。 在此基础上,Marvis集合多种本地模型理解文件,能搜索文件/图片内容、图片内文字,还能根据人像、内容主题、节日地点等维度分类整理素材,搭建AI图文与文档资源库,帮助用户构建个人知识库。 Marvis支持Windows/Mac/iOS/Android多端入口、同账号互通。用户可在手机上直接查看电脑屏幕并实时接管,PC锁屏状态下手机仍可远程输入密码解锁操控;电脑上能完成的任务,通过手机远程也能完成。 二、6个Agent一个团队,7×24小时待命 主流Agent产品大多需要用户前期自行搭建工作流或配置skills技能,Marvis则在出厂时就预置了6个Agent协同的“AI团队”,可以7×24小时在线待命。 其中,主Agent负责全盘统筹,理解需求并拆解任务,调度其他Agent来完成任务;File Agent可以处理文件搜索、阅读、编辑生成、格式转换等;Computer Agent负责电脑底层配置与自动化运维,系统设置、硬件检测等操作; App Agent可以调用电脑上的App与Exe应用;Browser Agent能够接管网页,进行网页交互与数据抓取;Search Agent擅长网络搜索与信息聚合。 用户一句话下达需求,多个Agent可以并行处理,并通过执行日志和产出区展示进度与结果。 这种“初始多Agent模式”让用户的上手门槛更低。例如,用户可以让Marvis找出最新季度的发票,按时间顺序整理成表格;也可以让它定时监控机票价格、关注某个网站更新、整理多平台发布素材。 三、可选侧端模型,数据不出电脑不上云 据腾讯Marvis团队介绍,Marvis建立了L2级安全兜底机制,强制触发“硬垂询”,删除文件、修改文件、调整系统核心配置等敏感操作,会先给出执行计划并请求用户确认;支付等更高敏感级别动作必须由用户本人完成。 在数据保护方面,Marvis还提供“效率模式”和“隐私模式”两种工作方式。日常任务中,效率模式采用端云协同,复杂问题理解与规划可借助云端模型,文件处理、执行动作和本地索引仍尽量在端侧完成。 “隐私模式”则采用端侧模型,确保所有数据解析、图片识别及对话均在本地完成,完全不上云,即使断网亦可正常使用,以满足财务、法务、人力资源等对数据安全有高要求的场景。 Marvis的端云协同将任务拆成不同层级,能在本地完成的识别、索引和预处理尽量在本地消化,必要时再调用云端能力完成意图理解和复杂规划。 腾讯Marvis团队前置做了大量端侧预处理,使得Marvis在图片搜索、文件理解等任务上可以减少云端Token消耗,既降低使用成本,也减少不必要的数据流转。 结语:“AI替人干活”更近了一步 从Marvis的“牛马”形象标识,以及其对标钢铁侠的“Jarvis”贾维斯的命名思路不难看出,腾讯打造这款 AI 助手,初衷就是打造如同贾维斯一般高效省心的智能帮手,切实帮用户处理各类实际事务。 在产品理念上,腾讯想要的是从“人找功能”过渡到“功能找人”,不再需要用户去适应Agent,而是Agent去主动理解用户、调度资源、完成目标。 对普通用户来说,Marvis值得一试;对行业来说,Marvis也提供了一个新的产品范式参考。 Marvis让“AI替人干活”这件事,更近了一步。
这或许是苹果 AI 最有用的一次
今天是五月的第三个星期四,也是一年一度的「全球无障碍宣传日」。和往年一样,苹果抢先官宣了将在下随 iOS 27 一同登场的新一批无障碍功能。 相比过去几年,今年这批功能最明显的变化,是 AI 的存在感突然变强了, 并且一些新的特性,或许也直接提前「剧透」了 iOS 27 的系统级 AI 能力。 iPhone 不仅能帮你看,还能帮你想 旁白和放大镜属于 iPhone 的经典视力辅助功能,前者可以帮用户朗读屏幕上的内容,后者能利用摄像头放大、智能描述周围的事物。 这些场景,刚好和 Apple 智能的「屏幕识别」和「视觉智能」重合。 全新旁白功能中的图像浏览器,可以提供更详细的描述,例如照片、账单、个人记录和其他视觉内容,用户还能进一步对画面中的内容进行提问,例如询问账单的数额和截止日期,AI 会思考后回复。 放大镜功能同样支持更智能的描述和提问功能,用户还可以直接利用语音控制应用,比如对手机说「放大」或「打开手电筒」。 至于 AI 随之而来的幻觉问题,苹果会在这些功能中警告用户,在任何有风险或潜在危险的情况下,不应该依赖这些描述。 除此之外,辅助功能阅读器也得到了 AI 能力的加持,这个功能面向阅读障碍和低视力人群,能将复杂的文件格式化为更易读的文本。 现在,它可以更智能处理像科学文章这样的复杂文本,并且能够更从容处理图像、表格和多列文本,还全新内置了翻译功能。 语音控制 iPhone 终于来了 iPhone 变身「豆包手机」终于成了?一个全新的语音控制功能暗示,苹果终于要在 iOS 27 上实装 2 年前发布的 AI Siri 功能。 这个语音控制功能,允许肢体障碍的用户完全通过语音操控 iPhone 和 iPad,不只是打开 App,还能实现更灵活、细节的操作,例如点击按钮和控件,甚至不需要完全念对文件或按钮的名字。 比如在文件应用中,用户可以直接说「打开橙色文件夹」,iPhone 会自动从一堆彩色文件夹中识别、打开那个橙色文件夹;在地图应用中说一句「打开最佳餐厅指南」,iPhone 也会自己打开对应的功能。 彭博社记者 Mark Gurman 透露,这个辅助能力本质上就是 iOS 27 新版 Siri 能力的一部分。 对于苹果来说,他们不太可能会和 2 年前一样,在一个功能准备好之前就过早官宣发布,既然这次已经在辅助功能推出,那么很大概率,能根据语音指令操作手机的 AI Siri 这次真的准备好了。 看视频自带 AI 字幕 对于听障人士来说,视频的字幕功能至关重要,借助 AI 听写的能力,苹果设备可以为任何视频生成语音转录的实时字幕。 苹果表示,这个能力完全依靠设备端的语音识别功能,音频数据处理完全在本地完成,不会上传云端,支持 iPhone、iPad、Mac、Apple TV、Apple Vision Pro,用户也可以自定义字幕的显示方式。 就目前来说,字幕生成只支持英语一种语言,并且仅限美国和加拿大地区使用,预计未来会扩展到更多语言和地区。 不止「文字字幕」,苹果还表示 FaceTime 将支持新的 API,开发者可以将手语翻译应用接入 FaceTime 中,为用户视频通话添加人工手语翻译。 「姓名识别功能」则是让 iPhone 成为用户的耳朵,当有人喊出听障人士的名字时,设备会发出通知提醒。 还有更多功能 除了上面提到这些功能,苹果还推出了更多更新,无需 Apple Intelligence 也可以使用。 通过眼动来操作屏幕,已经是无障碍领域的常见方案,而苹果想更进一步,利用「虚实结合」的 Vision Pro 头显,实现显示世界的「眼动操作」。 一些使用电动轮椅的障碍人士,并不难很好使用操纵杆来驾驶,Apple Vision Pro 可以利用其眼动追踪系统,提供一种新的驾驶方式:眼前会出现一个方向仪表盘,动动眼球就能操控轮椅。 在 iPhone 上饱受好评的「车辆运动提示」,也就是「防晕车功能」,也来到了 Vision Pro 上,可以减少乘车佩戴头显的晕动症。 Vision Pro 还将支持面部手势,用于执行轻点和系统操作,并新增了一种在使用 “驻留控制” 时通过眼睛选择元素的方式。 tvOS 还新增了「大字体」的支持,为视力障碍人士增大屏幕上的文字大小,从而能更轻松阅读。 iOS 27 还将会为更多无障碍外设提供进一步的支持: 专为 iPhone 设计的助听器可以在 Apple 设备之间更可靠地配对和切换,并在 iOS、iPadOS、macOS 和 visionOS 中提供改进的设置体验。 iOS、iPadOS 和 macOS 系统可以链接 Sony Access 手柄,用户可以定义摇杆、九个内置按钮以及最多四个额外的外部按钮或专用开关,并组合使用两个控制器。 除了软件上的更新,苹果还宣布,Hikawa 自适应 MagSafe 握把支架上架全球 Apple Store 线上商城,提供三款颜色,国内售价 448 元。 Bailey Hikawa 是美国洛杉矶一名设计师,她与众多不便以及握力不足的残障人士合作,共同开发了这款自适应握把。 握把采用硅胶制成,可以直接通过 MagSafe 吸附在 iPhone 上,能够适应各种特殊的手形,并减少握持手机所需的力度,也可以作为支架使用。 对于这三种配色,Hikawa 和一起开发的障碍人士认为,它们宣示着与众不同 ,传递出一种「骄傲」的情绪。 AI 无障碍 在两年前,生成式 AI 刚刚崛起之时,除了如雨后春笋般冒出的各种 ChatBot,行业也迅速开展了将 AI 融入无障碍领域的尝试:有面向听障人士的智能眼镜,能实时把他人的话转成字幕;也有为视障人士设计的 AI 导盲杖,能够理解语音指令、完成导航。 而智能手机,恰恰是这一切最天然的载体。 一方面,它本身就承担着大量无障碍功能,负责降低数字世界的使用门槛;另一方面,它又几乎贯穿每个人的衣食住行,是最贴近日常生活、也最容易被 AI 改造的设备。 于是这几年,我们不断看到手机厂商在 AI 无障碍上的投入:荣耀、华为、vivo 都推出了「AI 看世界」类功能;华为甚至上线了「小艺语言修复」,尝试借助 AI 帮助语言障碍人士恢复更自然的表达能力。 而长期被视为无障碍领域行业标杆的 Apple,自然也不会错过这一轮趋势。传闻中将加入大量 AI 能力的 iOS 27,辅助功能也被刷上了一层 AI 的底色。 虽然 Apple 智能在过去两年的表现始终称不上稳定,但换个角度看,由长期深耕无障碍交互的苹果来推动 AI 与无障碍的结合,本身就可能给整个行业带来新的示范意义。 当然,如果这些功能无法做到完全可靠,也很可能为障碍人士制造困扰,那显然会与「无障碍」的初衷背道而驰。实际效果究竟如何,只能等下个月见分晓。 与此同时,国行 AI 功能迟迟未能全面落地,也可能让这些全新的无障碍体验,暂时无法真正惠及更多用户——目前,中国大陆的苹果官网,还没有发布这些功能的新闻稿。 但无论如何,技术进步最终能够服务那些真正有需要的人,让更多人依靠科技获得更体面、更自由的生活,本身就是一件值得期待的事。 作者|苏伟鸿

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。