行业分类:
加载中...
头条分类:
加载中...
古尔曼:苹果硬件团队第二轮重组,斯鲁吉加速产品开发
IT之家 5 月 20 日消息,彭博社的马克 · 古尔曼(Mark Gurman)昨日(5 月 19 日)发布博文,报道称苹果新任首席硬件官约翰尼 · 斯鲁吉(Johny Srouji)正推动上任后的第二轮团队重组,重点是重新分配产品设计、硬件工程和关键底层技术团队的职责。 Johny Srouji,图源:苹果 苹果公司于 4 月 21 日发布公告,宣布斯鲁吉出任苹果公司首席硬件官,率领此前由约翰 · 特努斯(John Ternus)管理的硬件工程团队及硬件技术部门。 IT之家援引博文介绍,在首轮团队调整中,更多聚焦职责下放,斯鲁吉需要把自己此前负责的一部分工作分出去;而本轮调整,他进一步改动了核心产品设计的管理方式,范围比前一轮更大。 古尔曼透露在本轮调整中,苹果公司主要产品设计原本由凯特・伯杰龙(Kate Bergeron)负责,接下来将交给她的两名副手 Shelly Goldberg 和 Dave Pakula 分担。 伯杰龙的新职位是接替汤姆 · 马里布(Tom Marieb),统筹所有产品可靠性工作,并继续负责材料使用相关团队。而马里布接任负责苹果的硬件工程部门,负责实体产品的研发、生产与品控。 在特努斯 9 月 1 日出任 Apple CEO,原本归属其体系下的两名高管也改为直接向 Srouji 汇报。其中,Matt Costello 负责过 Apple 家居与音频产品开发,Kevin Lynch 则负责一个特殊项目团队,重点推进机器人设备研发。 另一项值得关注的变化是,Apple 基带负责人 Zongjian Chen 的权限继续扩大。除了基带,他还将接手电池、相机工程团队,以及传感器软件开发,其中就包括 Apple Watch 无创血糖检测项目。
人人喊打的信用卡APP 终于要没了?
你烦不烦信用卡 App? 前两天,中国银行的信用卡 App 要关停的消息,冲上了热搜。 对,除了中国银行 App 之外,还有个专门给信用卡用的应用,叫“ 缤纷生活 ”,已经上线 14 年了。 应用关停的日子,定在了下个月 30 号。 不过,在它的讣告下面,全是欢呼鼓舞的用户们。 “ 早就应该啦,搞那么多 App 干嘛?”、“ 接好运,其他家赶紧跟进一下 ”、“ 最好所有银行全整合在一个 App 里。” 没有人对这个 App 有丝毫留恋,在大家看来,这些应用似乎早就该死。 因为大家真是苦银行 App 久矣。 本来一行一个 App 就已经很烦了,同一家还要搞好几个。储蓄卡一个、信用卡一个、生活服务又一个。 就拿中国银行来说,出过的 App 包括但不限于中银易商、来华通、惠如愿、中银企 E 贷、中银智慧商家。。。 零零总总算下来能凑出 10 来个,巴不得一个业务一个 App。 图源于网络 很多功能还不互通,比如招商银行信用卡的各种减免,只有用掌上生活买单才有效。 再比如早年,很多银行 App 是必须有借记卡才能用。如果你只有这家银行的信用卡,就只能用信用卡 App。 现在终于把一尊大佛熬走了,大伙自然是举杯欢庆。 不过,庆祝的声音其实可以再大一点。 因为差评君研究一圈后,发现关停的远不止这一家。在中国银行之前,很多银行就已经在排队下架信用卡 App 了。 差评君这里给你简单的数一数: 2018 年平安银行,2019 年浙商银行,2021 年恒丰银行、宁波银行,2024 年上海农商银行、四川农信银行、北京农商银行、渤海银行,2026 年中国银行。 踩在这些信用卡 APP 的尸体上,差评君就有点好奇了。 这种反人类、脱裤子放屁的 App,到底是谁想出来的?又是为啥接连暴毙呢? 一切的“ 万恶之源 ”,其实都得从招商银行说起,它是第一个做出信用卡 App 的。 2010 年的时候,就上线了“ 掌上生活 ”。不过,最开始也只是个能还钱、查账的普通应用。 结果,2014 年招行突然往里头加了两个划时代的功能“ 饭票 ”和“ 影票 ”。 其中最有名的就是周三五折饭票,简单来说,就是平台会精选上万家的合作餐饮商户,然后给信用卡用户们发放代金券、五折券、9 分招牌菜等等。 无数人每到周三,就必须点开招商 App 去抢一张火锅店或者烤肉店的半价券。 这招在经历过外卖大战的咱们看来,已经没啥稀奇。但在 2014 年,一个线上银行 App 都难用的一比的年代,可以说相当超前了。 掌上生活从此一飞冲天,用户数很快突破了 1 亿大关。 2017 年,招行饭票单年完成超过 5300 万笔交易,成交金额近 70 亿元。月活跃用户稳居行业第一,带动信用卡交易额年增长超过 20%。 招行银行这么一搞,大家才发现:我去,原来还能这么玩。 信用卡可以不只是个还款工具,还能成为流量入口。 因为作为纯金融工具,要不是想转点钱,大家基本不会点开。 可现在,理财、购物、餐饮、出行、打卡抽奖、签到积分、小游戏……只要你愿意打开,这个 App 就能给你找到花钱的理由,每一次消费又都在为你积累下一次的优惠资格。 你越用,越便宜,越习惯;你越习惯,银行越赚。 可以说,现在各家大厂疯抢本地生活的招,都是当年信用卡经理们玩剩下的。 自此信用卡 App 开始爆发。交通银行的" 买单吧 "、浦发银行的" 浦大喜奔 "、建设银行的" 建行生活 "接连上线。 当然了,银行们做独立 App,并不纯粹是跟风模仿。 早年他们确实有这方面的需求,因为不搞抢不过人家。 2015 到 2022 年,是中国信用卡疯涨的年代,银行一年能开出 1 亿张信用卡。 为了方便灵活地抢人头,银行里的信用卡业务都是一个独立出来的庞大部门。有独立的预算、团队,单独的指标和 KPI,往往还配有巨量的外包地推队伍。 冲线下的时候,经理拉着行李箱电饭煲,就冲进写字楼卖卡了。 等到搞线上时候,他们就发现跟着总部走太慢了。 主 App 的审核很慢,而且信用卡基本都是些第三方合作的营销活动,内部卡得更严格了。 其他家活动都卷上天了,你这边还在走审批。三四个月的流程走完,用户也跑光了。 为了不受原有框架影响,更灵活地制定战术,应对其他家的进攻,干脆连 App 都独立出来,供自己随便造。 那会大家的愿景相当美好,拥有独立的 App 不仅可以掌握预算资源,去抢更多的用户。又可以把 App 的流量变现,还能够增加用户粘性,根据使用习惯去分析用户需求,防止客户流失。 可惜的是,盲目跟风的代价很惨痛,很快大家就发现不是所有人都是招行的。 钱没赚到,烫手的问题倒先来了。 招商银行能把掌上生活做起来,本质上靠的是流畅的应用、庞大的用户基本盘,以及真金白银的优惠力度( 划重点 )。 很多银行就学到了个做 App,然后砸了上千万搭建,真实下载量就两三千,每年还要投入几百万来维护运营。 最后搞得国家都看不下去了,2024 年 9 月,国家金融监督管理总局强制要求金融机构把那些没人用、功能冗余的 App 都清一清。 更重要的是,这头 App 还没琢磨明白,那边信用卡慢慢不再是年轻人的标配。 以前卡包里塞几张联名信用卡,是刚毕业年轻人们经济独立的象征,是人生第一笔信用资产。 现在,外面已经是网贷的天下。花呗、白条、月付,哪哪都可以借款,甚至 P 图、买饭的 App 在哄你小贷一下。门槛低、覆盖场景还多。 有些信用卡给的那三瓜俩枣,在互联网大厂的补贴面前也啥都不是。根据银联数据的调研,2024 年的时候,信用卡线上获客的成本就已经飙到 303 元。 所以,银行关停的不只是一个 App 而已,是整个行业都在勒紧裤腰带。 发卡数量可以说一年少一年,消费金额也是一年低一年。 工商银行去年同比减少 500 万张 交通银行减少 502 万张 邮储银行减少 216 万张 ..... 图源 21 世纪经济报道 很多银行连信用卡分部都一并关停了。 交通银行的太平洋信用卡中心,从 2024 年 7 月至今,已经关停了 50 个城市的分中心。 华夏银行、广发银行、民生银行等等,也都在悄悄关停各地分部。 连部门都运营不住了,那么一个本来就冗余的 App,就更是难以维持了。缤纷生活关停之前,月活只有 154 万,而中国银行主 App 月活有 7200 余万。 不过,大家也不用担心 App 没了会影响我们使用。功能在主 App 里都能找到,应用会提前两三个月做数据交接。 说实话,早就应该这样了。 这些为了满足部门 KPI 和抢地盘,才人为创造出来的应用,本就不该存在。 早年你给点优惠,那消费者那就忍了。现在又没有羊毛薅,又强行占你手机空间,就纯粹成了折磨消费者的存在。 最终只能成为被时代淘汰的落后产物了。
Seedance 2.0最强对手上线!这就是AI视频的“Nano Banana 时刻”
不出所料,之前爆料的 Gemini Omni 正式发布了。 不过和当时大家预想的视频模型不同,Google 定义的 Gemini Omni 是一个能接受任意输入,生成任意输出的模型,视频只是当前的一部分。 DeepMind CEO Demis Hassabis 在发布会现场,给出了多个 Gemini Omni 的演示案例。它上传了一张自己的照片,Omni 可以快速地修改人物所处的现实环境,轻松调节不同的风格。 画一个简单的圆圈,Omni 可以生成一个黑洞,一场傍晚的漫步,Omni 会渲染不同风格的环境;任何素材通过 Omni 都可以成为构建全新现实的画布。 Gemini Omni 的核心能力在于把文字、视频、图像、交互仿真整合进同一个生成框架。 具体来说,Omni 结合了 Google 目前最先进的几款生成式媒体模型,包括图像模型 Nano Banana、视频生成模型 Veo,以及世界模型 Genie。 我们可以输入「制作一段蛋白质折叠的动画解说」,它会直接产出带有 α 螺旋、β 折叠结构演示的教学视频,而不只是文字描述。 提示词:claymation explainer of protein folding, everything is made out of clay, no hands, stop motion, accurate 有网友也立马用 Omni 和 Seedance 2.0 进行了更详细的对比,比较实际生成的质量、动态效果和一致性。 自动播放 视频来源:X@TopviewAIhq 整体看下来,Seedance 2.0 的表现还是相当稳定,Omni 则是在某些特定的场景表现要比 Seedance 更强。 根据官方博客的介绍,Omni 的能力集中在视频编辑和物理模拟上。 动动嘴就能剪视频,AI 视频的「可控时刻」 除了用来制作教学视频,视频编辑是 Omni 的另一个主打场景。 Omni 支持上传自拍或任意素材,用自然语言,像和人类剪辑师聊天一样,对视频进行多轮修改,调整风格、添加元素。这套交互逻辑也和此前 Nana Banana 的图片编辑的思路一脉相承。 在官方的演示中,这种能力显得有些特立独行。 拍了一段手摸镜子的视频,只需告诉 Omni:「当人触摸镜子时,让镜子像液体一样泛起美丽的涟漪,人的手臂变成反光材质。」 奇迹就真的发生了。视频没有被完全重绘,人物动作得以保留,但镜子的物理状态和手臂的材质被精准替换。 更值得一提的是它的「多轮对话能力」,每一次新指令都会基于前一次结果继续生成。 Gemini Omni 会尽量保持人物、环境、物理效果和场景上下文的一致性。 懂像素,更懂这个世界的物理法则 物理模拟则是 Gemini Omni 技术含量最高的部分。Google 称 Omni 在模拟动能、重力等现象时有了「质的飞跃」。更逼真的视频、图像以及交互式仿真内容,现在都能通过 Gemini Omni 生成。 当要求它生成「一条在连锁反应轨道上快速滚动的弹珠」时,Omni 展现出了对重力和动能的精确理解。 更复杂的案例是一个「字母表物品视频」。当要求模型展示 26 个英文字母,每个字母对应一个不寻常物体,例如 C 对应水豚、D 对应迪斯科球、L 对应熔岩灯。 提示词:Prompt: The video shows items of the alphabet. An unusual item starting with each letter is shown sitting on a table (like a Capybara for C, disco globe for D and Lava Lamp for L). All 26 letters must be represented by 26 items with matching lower thirds displaying the letter. Only one item and lower third at a time. Each lower third must look like a black marker written on a slip of paper in the bottom left. Rapid fire, roughly 9 frames per item at 24FPS. Last frame is a slip of paper "THE END". The whole video is accompanied by calm smooth music. Omni 能同时处理好字母和物体的对应关系、画面节奏、字幕形式、帧数要求、音乐风格和视频收尾方式,把语言、图像和意义联系起来,而不是只做表层的视觉匹配。 目前 Gemini Omni Flash 已同步上线所有 Google 产品,面向全球 Google AI Plus、Pro 和 Ultra 订阅用户推出,用户可以通过 Gemini app 和 Google Flow 使用。 在 Gemini 网页和应用端,我们可以选择「生成视频」体验 Omni 的能力。 Gemini 提供了年轻时尚、蒙太奇、美漫、会说话的宠物、派对邀请函、月亮、变身表情包、涂鸦特效、像素冒险等 18 种预设风格,我们的 Pro 账户每天有 3 次生成机会。 我们随手输入了一段提示词,「一个男的汽车博主,穿着女装JK服装,梳着双马尾辫,在一台汽车面前」,使用预设的 80 年代 MV 风格,就得到了下面这段让人「欲罢不能」的视频。 自动播放 Google 还提到 YouTube Shorts 和 YouTube Create App 用户也将从本周开始免费使用相关能力;未来几周会通过 API 向开发者和企业客户开放 Gemini Omni。 Omni 可以把图片、文字、视频和音频作为参考素材,并整合成一个连贯输出。 而为了打消公众对 AI 伪造的疑虑,Google 强调所有由 Omni 生成的视频都会嵌入肉眼不可见的 SynthID 数字水印,并且可以轻松验证来源。 针对真实人脸的使用,它还推出了可以克隆外貌和声音的 Avatar(数字分身)功能。 过去一年,谷歌用 Nano Banana 把 Gemini 的多模态能力推进到图像生成和编辑场景。 现在,Gemini Omni 开始把同一套思路带入视频领域,并试图打造视频生成领域的「Nano Banana 时刻」。 这对视频创作者的直接影响,是制作门槛继续下降:一段手机拍摄的视频、一张参考图、一段音乐,都可能成为可对话编辑的素材。 更大的变化则在于,当视频可以被一句话持续改写,内容生产的速度、真实感验证、版权边界和平台治理,也会被一起推到新的位置。
谷歌发布Gemini 3.5 Flash:智能体基准测试超越GPT-5.5
5月20日消息,据TC报道,谷歌周二发布了Gemini 3.5 Flash,这是一款全新的人工智能模型,该公司称其是迄今为止在编码和自主人工智能代理方面最强大的模型。 该模型在谷歌年度开发者大会Google I/O上亮相,能够独立执行编码流程、管理研究项目,并且在内部测试中,能够从零开始构建操作系统。 此次发布标志着谷歌将人工智能的定位从对话工具转向了智能体工具。它不仅能回答问题,还能在极少人工干预的情况下规划、构建和迭代实际工作。 DeepMind首席技术官Koray Kavukcuoglu在周一公开发布前告诉记者:“3.5 Flash提供了令人难以置信的质量和低延迟组合。它在几乎所有基准测试中都优于我们最新的前沿型号3.1 Pro”,包括编码、智能体任务和多模态推理。 他还补充说,它的速度比其他前沿模型快 4 倍,这种速度非常适合编码和智能体任务,但谷歌通过开发优化的 Flash 版本,在保持相同质量的情况下速度提高了 12 倍,从而“将其提升到了另一个水平”。 Kavukcuoglu 表示,这种速度对于 Flash 的智能体工作设计至关重要,在智能体工作中,多个 AI 智能体可以同时运行,执行长时间运行的任务。在 I/O 大会上,谷歌工程师 Varun Mohan 演示了智能体如何从多个独立组件中分离出来,最终在谷歌的智能体开发平台和集成开发环境 Antigravity 中构建完整的操作系统。 Kavukcuoglu 表示,Flash 3.5 是与 Antigravity 共同开发的,目的是拥有一个“可以生活、工作和执行任务的原生环境”。 在 I/O 大会上,谷歌发布了 Antigravity 2.0,这是一个围绕代理优先开发而设计的独立桌面应用程序。 这些优势不仅仅体现在演示中。谷歌表示,Flash 3.5 的智能代理功能已经对合作伙伴产生了影响,例如银行和金融科技公司利用它实现了长达数周的工作流程自动化,数据科学团队则利用它从复杂的数据环境中挖掘洞见。 该模型可以自主运行数小时,但谷歌高级总监兼产品负责人图尔西·多希表示,当遇到需要人工判断的决策点或权限问题时,该模型有时会暂停并请求用户输入。 当谷歌发布即将推出的 3.5 Pro 模型时,这两款产品将被设计成可以协同工作。 Doshi告诉TechCrunch,“3.5 Pro可以成为你的协调器、规划器,而且它还能利用Flash作为各种子代理。我认为关键在于你真正需要在哪里运用推理能力,哪些地方需要更强大的模型来真正发挥推理能力,哪些地方的任务确实需要强大的蛮力工具?” 现在,Gemini 应用和全球搜索 AI 模式的默认模型均为 Flash 3.5。在 I/O 大会上,谷歌还宣布搜索即将推出智能代理功能,使用户能够直接在平台上创建、自定义和管理 AI 代理。新模型还将为Gemini Spark提供支持,Gemini Spark 是谷歌全新推出的个人 AI 代理,旨在全天候运行,帮助消费者管理他们的数字生活。 向普通消费者提供这种级别的AI功能必然会受到严格审查。谷歌目前就面临诉讼,此前一名男子在去年与Gemini聊天数周后,险些酿成大规模伤亡事件,最终自杀身亡。 如果更广泛地使用功能强大的自主代理,其潜在危害只会越来越大。谷歌表示,Gemini 3.5 加强了网络安全和 CBRN(化学、生物、放射性和核)安全保障,并且能够更好地处理敏感问题,而不是直接拒绝回答。 Gemini 3.5 Flash 目前已可通过 Antigravity、Gemini API 和 Gemini Enterprise 以及 Gemini 应用和搜索中的 AI 模式普遍获得。
Google重塑搜索框,进化50亿人的上网习惯
在品尝过「会前甜点」Android Show 之后,真正的重头戏谷歌开发者大会 Google I/O 2026 正式揭开了帷幕。 不出所料,在时长接近两个小时的活动中,Gemini 占据了绝对的 C 位。 图|Google 除了更新基础模型和周边能力之外,Gemini 也更加深入的集成到了谷歌 app 全家桶里面,甚至还给 iOS 和 macOS 带来了一些更新。 比较可惜的是,上周亮相的 Googlebook 和 Android 17,在本次 I/O 开场活动上都没有被提及。 我们唯一看到的硬件产品,是与三星联合开发的智能眼镜: 图|Google 总之,谷歌借助本次 I/O 大会传达的信息已经很明确了: Gemini 的能力将会越来越强、存在感将会越来越高,与全球十几亿谷歌产品用户的「物理生活」的集成也会越来越紧密。 从夸张的角度想—— Gemini 距离接管大部分人的日常工作,似乎就只差一个人形机器人了。 底层模型更新 整场活动里最重磅的,就是围绕着 Gemini 的几款底层模型的更新了。 首先是正式的 Gemini 3.5 版本发布,用户最先可以体验到的版本则是 Gemini 3.5 Flash。 它在多个维度上展现出媲美之前 2.5 Pro 的能力,并且保持了 Flash 系列的速度: 图|Google 得益于速度和性能的平衡,Gemini 3.5 Flash 最擅长的场景之一就是处理长期、大规模的智能任务,同时还能省下大量 token 开销。 同时,最新的 Antigravity 集成也让 Gemini 3.5 Flash 拥有了更丰富的输出形式—— 执行分类代码、根据论文编写游戏、转换上古代码库、构建 3D 场景、交互式 Web 界面等等。 将遗留代码库转换成 Next.js|Google 此外还有规模最大的「世界模型」Gemini Omni,用谷歌的宏愿来描述 Gemini Omni 则是: 它可以根据任何输入内容,输出任何你想要的东西(Generate any output with any input)。 Omni 的首款模型产品则是 Gemini Omni Flash,除了 Gemini app,它也集成到了 Google Flow 和 YouTube Shorts 里面,支持用户使用自然语言生成「最像真的」的视频。 图|Google 相对应的,谷歌也调整了自己的 Google One 订阅模式,在原本最高等级的 AI Ultra 方案里新增了一个 100 美元/月的分类。 这个新的订阅同属于 AI Ultra 级别,包含 Gemini 3.5 Flash、Antigravity 2.0 和其他新功能的优先访问权等等。 当然,传统的 20TB 云空间和 YouTube Premium 权限也同样包含,主要面向开发者和高级创作者之类的群体。 图|Google 同时,原本 250 美元的最高等级 AI Ultra 订阅则迎来了降价,现在只需要 200 美元/月就能享受到包括最高 20 倍于 AI Pro 的使用额等等特权。 另一个重大的收费模式变革则是 Gemini app 本身。 图|Google I/O 在新闻稿里,谷歌宣布将 Gemini 的每日限额从「提示词额度」改成了「使用量计算」。 这样算下来,图片、视频和代码的消耗变多、文本任务消耗量则变少,整体是一种更灵活的算力计费模式。 实际业务落地 与 OpenAI、Anthropic 之类的公司不同,谷歌最大的特点在于,它真的有一套能够直达全球十几亿用户的产品生态。 在上述基础模型之外,谷歌本次展示的策略,重点是将这些「抽象」的 AI 模型能力,整合进普罗大众每天都在使用的 app 里面。 图|SlashGear 而这种整合大体上分成三步:传统搜索业务变革、手机系统智能化、视觉智能融合。 「搜索引擎」作为谷歌的起家业务,在今年的 I/O 上迎来了一次彻头彻尾的 AI 改造,谷歌称之为「AI 搜索的新时代」。 这种业务转变背后的逻辑很简单:相比 20 年前,人们只在搜索框里输入单词或短语,现在的人更习惯在里面输入复杂的复合指令。 图|Google 换言之,谷歌把传统的搜索框(search box)变成了一个通用对话框(chatbox)。 除了搜索,用户可以在里面要求任何形式的内容。 这刚好也是本次 I/O 活动的重点更新内容——具有智能体能力的搜索。 首先,AI Mode 的基础模型会升级到 Gemini 3.5,你的搜索框会自动推荐和补全输入的内容,让你的关键词变得更详细或者更广泛。 图|Google 此外还有全新的生成式 UI(Generative UI)回答,谷歌会根据你询问的东西智能生成最合适的回答形式。 比如搜索股票走势,回答里不仅有文本,还会生成折线图;问装修灵感,回答里就生成图片…… 甚至你搜索物理问题,它还能调用 Antigravity 快速编写一个互动式的 Web 演示: 图|Google 使用了这么多年的「多模态搜索」之后,我们终于进入了「多模态回答」的时代。 谷歌搜索结合 Antigravity 的能力不止于此,它还可以更进一步,根据你在搜索框里输入的内容实时生成 Web 形式的仪表盘或追踪器。 用人话来说,就是谷歌搜索框为你的需求直接编写了一个专门的 app。 这种多模态能力是非常恐怖的,甚至有可能彻底改变人们检索信息的方式—— 毕竟我们搜东西,大多是为了将搜索结果用在别的任务里面,而新的谷歌搜索可以直接帮你做完下一步操作。 图|Google 至于这种「代办」的具体方式,则是 Gemini Spark。 简单来说,Gemini Spark 本质上是类似 OpenClaw 的「语义理解-自动执行」功能,一个谷歌 Claw。 其中 Gemini Spark 基于最新的 Gemini 3.5 模型,支持 7 天 24 小时不间断运行。 并且由于运行载体是 Google Cloud,还可以执行跨端代理操作——在手机上布置任务,在电脑上查收结果。 图|Google Gemini Spark 目前支持所有谷歌套件 app,后续则会拓展 MCP 平台以兼容第三方 app 的内部功能,同时支持用户自己上传 Skill。 谷歌还宣布 Gemini Spark 后续会集成到 Chrome 和 Android Halo 中,为浏览器和手机带来智能体自动操作的功能。 Android Halo|Google 最后一步棋,则是 Gemini 与视觉智能的融合。 在本次 I/O 活动上,谷歌发布了首个与三星联合开发的「纯音频智能眼镜」产品,分别使用 Gentle Monster 和 Warby Parker 镜架: 图|Google 单纯从功能上讲,这个纯音频眼镜与市面上已经有的智能眼镜相差不大,主要优势是可以直接调用 Gemini 的多模态功能,用来调用前面提到的其他复杂能力。 另一方面,XREAL 与谷歌合作的那款带屏幕的智能眼镜 Project Aura 在本次活动上又有了更新。 根据介绍,Project Aura 搭载了 XREAL 自研的 X1S 空间计算芯片,并为了佩戴舒适采用了分体式的设计。 也就是说,Project Aura 的眼镜部分只负责显示,真正的处理芯片、电池包和触控板需要通过数据线连接到一个外置的随身单元上: 图|TheVerge 至于实际的生活功能方面,Project Aura 将会支持 Google Maps 沉浸式导航、巨幕/窗口化视频播放、YouTube VR 视频、WebXR 三维绘画、DP 拓展笔记本屏幕等等用法。 图|TECHEBLOG 总体来说,Android XR 是一套完全基于空间计算的视觉化的操作系统,与 Gemini 的能力搭配起来,为我们画出了一套未来智能眼镜的线路图。 更重要的是,虽然现在 Android XR 和 Android 17 是两个完全独立的系统,但就像 Android 和 ChromeOS 融合那样,它们未来大概率也会合二为一、变成一个「视觉智能系统」类似物。 Gemini 能接管一切吗 熬夜看完整场 Google I/O 之后,除了 Gemini 3.5 和它的小伙伴们带来的惊讶之外,我们难免也诧异于 AI 对于人类基础行为的革命。 无论是 Gemini 3.5 Flash、Antigravity、Gemini Spark,它们都隐藏在了一个简洁的「搜索对话框」背后,将搜索这一行为从「获取信息」进化成了「完成任务」。 图|Google Search 我们很难说这种进化在长期来看会对我们使用网络和人工智能产生什么影响,但我们至少可以从里面看到谷歌的野心—— 为一套强悍的 AI 模型赋予前所未有丰富的功能,并且将这些功能集成进自己覆盖全球几十亿用户的网络产品里,共同提升这几十亿人的效率。 Gemini 同时切进所有这些网络产品,副作用是「应用」这个概念正在变薄—— Agent 越能办事,应用内部和搜索结果页的存在价值就越被稀释。 至于这层智能会把多少旧规则一起重写,现在没人能答,谷歌自己也答不上来。 作者|马扶摇 编辑|肖钦鹏
WWDC 2026,苹果首届AI还账大会
作者|陆 邮箱|xiaoyu@pingwest.com 苹果刚刚把 WWDC 2026 的时间敲定,从 6 月 8 日到 12 日为期一周,主题演讲则是北京时间 6 月 9 日凌晨 1 点开始。 图源:苹果 友媒把这届 WWDC 定义成苹果两年 AI 工作的“落地总结”。这个说法不能算错,但准确来说苹果不是在落地,而是在补课:一份从 2024 年 WWDC 起就欠下的债,今年得还了。 2 年时间,苹果已经从雄心勃勃的宣告自研,变为逐步承认了自己确实打不过 OpenAI 和 Google 的模型军备竞赛,然后悄悄撤回到了自己最熟悉的阵地:开发者生态、设备出货量、隐私,尝试重新画出了一条战线。如果这条线走通了,它的意义对苹果比“做出最强模型”更重要。 1 那个拖了两年的“个人化 Siri” 故事得从 2024 年 WWDC 那个著名的 demo 讲起。 当时 Craig Federighi 在台上演示:问 Siri 妈妈的航班和午餐预订,Siri 从邮件和短信里自动取信息,给出一个跨 App 的答案。然后台下掌声雷动,宣告着 Apple Intelligence 的正式登场。 图源:苹果 然后这个功能就……没了。 这个原定 iOS 18 上线的功能被延后到了 iOS 18.4,再跳到 iOS 26,最后被苹果亲自承认“目前还做不出来”,相关广告也被悄悄下架。彭博 Mark Gurman 在此前的报道里直接指出:WWDC 2024 上演示的个性化 Siri 其实只是一个“勉强能跑的原型”,苹果当时真的以为自己能在一年内打磨好,就像乔布斯发布初代 iPhone 那样。 结果一年过去了,苹果发现并做不到当时承诺的功能,机器学习和 AI 战略部门相继被关停,一位 SVP 走人,整个个性化 Siri 项目完全被推倒重做。 在去年的 WWDC 2025,苹果用 Liquid Glass 搞了一场漂亮的注意力转移,对于 Siri 本身只字未提,甚至 Federighi 在主题演讲里只说了一句:“我们还需要更多时间达到我们的质量标准,明年再聊”。 图源:苹果 这个“明年”就是今年。 后续的故事我们都已经知道了,苹果在今年 1 月与 Google 签下合作协议,让 Gemini 模型成为新版 Siri 的底层支撑之一,这等于是公开承认自己的自研模型扛不起这个场景。 图源:X 所以这不并不是简单的“落地”,这是黯然退场后的重新选择阵地。 1 Siri 2.0:我们会看到什么 根据多家信源的爆料,我们已经大致可以拼出一个苹果在主题演讲上会演示的新版 Siri 框架: 形态——Siri 将从系统覆盖层变成独立 App,这是过去十年来 Siri 最大的一次结构改造。Siri 不再只是从屏幕底部唤起的语音覆盖层,而是变成一个真正的独立应用——可以进去翻历史对话、新开聊天、上传文件、像 ChatGPT、Gemini 那样切换对话列表,甚至不排除可以在 Android 手机上下载。 图源:苹果 模型——Gemini 在私有云上跑,这是最关键也最敏感的部分。苹果付钱让 Google 定制一个能在 Apple Private Cloud Compute 上运行的 Gemini 变种。用户数据不会被送到 Google 服务器训练,完全在幕后跑。这是一个非常苹果式的做法:要算力的同时,也要隐私。 隐私——历史对话自动删除。用户可以设定 Siri 的历史聊天记录 30 天后自动清除、一年后清除,或者永久保留,完全由用户自己来决定,这条放在 OpenAI 因为隐私问题正被持续质疑面前,是苹果尊重用户隐私最直观的答卷。 节奏——秋季跟随 iOS27 上线,还是“Beta”。即便跟随 iOS 27 正式版推送,新 Siri 也依旧会标上 Beta 的标签,且系统设置里会有一个退出测试的开关。 1 苹果终于承认:自己做不出最好的 AI 在今年 3 月彭博爆料,苹果将在 iOS 27 测试版代码里藏了一套“Extensions”系统。简单来说,用户可以在 iOS 27 上把 Claude、Gemini、ChatGPT 接入 Siri 和 Apple Intelligence,让它们成为某些任务的默认模型;比如写作工具可以用 Claude,图像生成可以用 ChatGPT,问答可以用 Gemini,完全由用户自主选择。 图源:Beta Profiles 这件事的份量远比 Siri 重新设计大得多。 苹果过去十年讲的 AI 故事都是“我们自己做”。从 Core ML 到 Apple Silicon 的 Neural Engine,从端侧 OpenELM 到 Private Cloud Compute,整套体系强调“全自研、不依赖外部”。Extensions 等于公开承认:在大语言模型这件事上,苹果做不到最好,但苹果能定义平台规则,让最好的模型在苹果的设备上跑。 这种“可控开放”是苹果的一贯姿态。如果走通了,苹果就不需要拥有最强模型,只需要拥有最强的设备入口、最强的开发者生态、最强的隐私品牌,就能成为这一波 AI 落地的最大赢家。至于 OpenAI,苹果一年前把 ChatGPT 设为唯一默认外部模型,在今年就将它降级成 App Store 里的一个可选项。 图源:网络 1 被低估的真正主角:Foundation Models 去年 WWDC 2025 上,Foundation Models 框架被 Liquid Glass 的视觉光环盖住了。但一年下来,这个东西可能是苹果 AI 叙事里最有想象力的一笔。 图源:网络 它做的事很简单:把驱动 Apple Intelligence 的端侧大模型(约 3B 参数)通过 Swift API 开放给所有开发者。没有 API key,没有云端费用,没有网络要求,完全免费,三行代码就能集成。 对独立开发者和中小团队来说,以前做 AI 功能必须挂一个第三方的 API 按 token 付费,只要 APP 的下载规模一大,成本就会瞬间失控;而现在 AI 功能可以直接在用户设备上本地跑,零成本、零延迟、零隐私顾虑。 iOS 26 落地一年后,这套框架在开发者社区的反响远比 Liquid Glass 更热。如果 WWDC 26 上苹果能够进一步扩展 Foundation Models 的能力,这才是一条苹果真正能赢的钥匙:开发者越多越好用,越好用开发者越多。 1 iOS 27:删屎山代码、重写部分系统、提升响应速度 iOS 27 更像是 2009 年的 Mac OS X Snow Leopard;Snow Leopard 当年最大的特点是——没什么新功能、但把整个 10.5 的代码捋了一遍,做底层重构、bug 修复、性能优化。 Snow Leopard 后来成了 macOS 历史上口碑最好的版本之一。 iOS 27 就是这个路数:删旧代码、改写部分系统、提升电池续航和响应速度、清理 Intel 时代遗留物。新功能并不多:比如主屏幕加个撤销/重做、Liquid Glass 加个调节滑杆、键盘自动纠错升级、Wallet 支持从二维码生成数字凭证、Genmoji 从输入法直接生成等等,全是些不痛不痒的小升级。 这种做法在今天的产品节奏下是反直觉的,Android 同行恨不得在新系统里一年加 50 个 AI 功能,苹果却选择慢下来“修地基”。但一个不稳定的 OS 加再多 AI 也撑不住,且 Siri 2.0 的底层重做,显然需要稳定的系统土壤。 对国行用户来说还有一个特殊变量:Apple Intelligence 在前段时间“闪现”,但很快被苹果自己下线,目前功能阉割明显,体验距离 Google Pixel 甚至豆包手机还有相当的差距;在 WWDC 26 上苹果是否会拿出针对中国大陆市场的新动作:比如正式宣布和国内某家大模型公司的合作,是一个值得关注的点。 1 硬件、库克的告别,和真正要观察的那个指标 虽然 WWDC 2026 是开发者大会,但偶尔我们也能看到硬件惊喜。今年可能呈现的产品大概率是 M5 系列的 Mac mini,M5 Pro/Max 用的是 Apple 自研 Fusion 架构(双 die 合一),每个 GPU 核心都带 Neural Accelerator,AI 性能比 M4 系列快 3.5 倍——这是为 Foundation Models 这种端侧推理量身定制的。 折叠屏 iPhone 据称会在今年秋季登场,所以 iOS 27 的多任务架构很可能在 WWDC 上展示折叠屏适配。 但今年 WWDC 最特殊的一件事跟产品无关:这是 Tim Cook 作为 CEO 的最后一届 WWDC,9 月 1 日,硬件高级副总裁 John Ternus 正式接任。 库克 2011 年接乔布斯的班,主持过 15 届 WWDC,看着 iPhone 从 4S 走到 17,把苹果市值从 3500 亿做到了 4 万亿。他的告别值得一个仪式感的瞬间——这一点苹果一向擅长。 判断这届 WWDC 中 AI 是不是真的“落地”,不要看主题演讲多炸,也不要看 Siri 演示多丝滑——这些苹果一定能演得漂亮,毕竟去年那场“barely functional prototype”的演示当时效果也很惊艳。 真正要观察的指标只有两个: 第一是 Foundation Models 的开发者采用速度。WWDC 26 之后三个月,App Store 里有多少头部应用接入了这个框架,有多少 indie 开发者用它做出新的 AI 功能,这是衡量苹果 AI 功能转得动转不动的硬指标。 第二是 Siri 2.0 在真实使用中的可靠性。从 9 月正式版到年底的三个月内,用户在日常使用 Siri 时遇到的“它能听懂”和“它又没听不懂”出现的比例,决定了苹果两年补课的成绩。 如果这两条都跑通了,那才叫真正的落地。如果只跑通了一条,那这届 WWDC 是一个“体面”的交代,但远远不是终点。如果两条都没跑通,那 John Ternus 接手的会是一个比库克交出去时困难得多的苹果。 6 月 9 日凌晨 1 点,我倒要看看怎么个事儿。
谷歌升级AI Studio:文本直出原生安卓应用,打通测试全流程
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌为 Google AI Studio 加入原生安卓应用生成功能,用户可直接在浏览器里用文本提示创建应用。 该功能面向两类人群:一类是希望加快原型验证的开发者,另一类是首次接触安卓开发的新手,而且输出的是可安装、可分享的完整安卓应用。 技术实现方面,生成的应用采用 Kotlin(安卓开发语言)与 Jetpack Compose(安卓界面框架)构建,更接近标准安卓原生应用。 IT之家援引博文介绍,创建的安卓应用具备离线使用、后台服务支持,以及更深层接入 GPS、蓝牙、NFC 等硬件特性等。 此次更新的一大重点,是谷歌把开发、生成、预览整合到同一浏览器环境中。AI Studio 新增内嵌安卓模拟器,用户在应用生成过程中就能直接预览和交互,无需频繁切换到本地开发工具。 测试环节,如果用户拥有 Google Play 开发者账号,就能直接从 AI Studio 发布应用用于测试。 平台会自动创建应用列表、打包应用 bundle,并上传到 Play Developer Console 的内部测试通道,减少手动整理与上传步骤。 如果后续需要更复杂的开发流程,项目也支持导出为 ZIP 文件、直接推送到 GitHub,或在 Android Studio(安卓官方集成开发环境)中打开继续完善。 从当前定位看,首发版本主要适合工具类应用、社交类应用和 Gemini 驱动工具。谷歌还预告,Firebase(后端云服务)集成与更便捷的 Play 商店发布能力即将上线。
美国名校大学生曾抄袭中国代码?该校学生曝光惊人内幕
两年前,三名美国大学生抄袭中国的人工智能模型代码,谎称是其自主开发的学术不端事件,一度在两国舆论场引起热议。而三人中有两人来自美国斯坦福大学的细节,更是让不少人对这所美国顶尖名校的诚信滑坡感到吃惊。 而在今天,这种作弊和投机的心态,并未从这所名校中消失。即将从该校毕业的大四学生、同时也是美国多家主流媒体撰稿人的西奥·贝克,近日就在美国《纽约时报》上撰文,曝光了该校在人工智能时代下越发严重的诚信问题,并引起了不少关注。 根据贝克讲述,自2022年11月30日人工智能大模型ChatGPT发布后,这种原本让人们感到兴奋的新技术,沦为了一些学生通过欺诈获得“成功”的“捷径”。 他说,在斯坦福的任何一门课中,都能看到差不多一半笔记本电脑里开着ChatGPT或其他人工智能大模型的对话窗口,而且即便学校开始要求学生在提交作业时签署没有用人工智能作弊的声明,他仍然看到有学生一边签字,说自己独立完成了作业,一边却开着ChatGPT的窗口。 “作弊变得无处不在”,贝克写道,“在人工智能驱动的世界里,学生们正越来越频繁地在几乎所有事情上弄虚作假”。 他还特别提到了2024年斯坦福大学两名学生抄袭中国大模型的案例,并在言辞中对两人将抄袭的责任完全推给外校第三名作者表示不满。 而为了应对人工智能这项新技术的滥用,斯坦福大学如今不得不采取一些旧办法,比如在考试时让学生们像一个世纪前那样在答题纸上手写答案,并严格监考。 美国媒体近些年的大量报道显示,美国众多顶尖名校,目前都存在学生滥用人工智能,在写作业和考试上作弊的情况。这些大学也不得不出台类似于斯坦福那样的线下考试措施,有些高校还引入了AI论文检测工具。 一位曾经给美国名校的学生上过课的外国教育从业者,不久前和耿直哥交流时还透露,这些学生对人工智能相当依赖,让她感到担忧。 不过,贝克并不认为人工智能技术是导致作弊的原因。他认为这项技术只是加速了斯坦福等一些美国高度商业化的大学内长期存在的一种不良趋势,即把大学功利地当成快速成功乃至一夜暴富的跳板,不再关心教育本身。 他说,在他2022年刚入学时,该校在诚信方面的名声就已经“摇摇欲坠”了。当时,斯坦福的校友伊丽莎白・霍尔姆斯和权道亨,分别因用虚假的血液检测技术和加密货币欺诈投资者,登上了报纸头条。 贝克还提到,在他大三时,斯坦福校园内的一项调查显示,在 849 名计算机专业本科生中,有 49% 的人表示,宁愿考试作弊,也不愿挂科。 耿直哥检索发现,斯坦福大学的校内报纸《斯坦福日报》在一篇2024年的文章中也认为,该校“愈演愈烈”的作弊问题,是功利主义作祟。 “学生们为保住未来的发展机会,可能会不惜一切代价铤而走险”,该文章写道,“而互联网、人工智能工具 ChatGPT,以及各类规避抄袭检测系统的手段,让作弊的机会呈指数级增长”。 文章还举例说,该校几乎每次计算机科学课程考试和重要作业结束后,学生们都会在校园论坛上大量发帖,询问计算机系的抄袭检测系统效果如何、自己因获取不当帮助是否会被抓。 而斯坦福大学教育学院的两名学者在一篇2023年文章中亦指出,人工智能只是让以往就严重的作弊问题凸显了出来。 而当坐落于斯坦福周边的美国科技中心硅谷,又在抛出一个个造富神话,以及一串串虚高的天文数字时,贝克认为学生们将更难抵挡住诱惑,进而更容易走上用欺诈和作弊实现目的的歪门邪道。 目前,贝克曝出的斯坦福大学相关情况,已经受到美国Axios新闻网站和《财富》杂志等媒体关注。Axios新闻网还介绍了贝克新出版的著作,该书聚焦斯坦福精英教育与硅谷之间的关联。有美国的教育类播客节目认为,贝克的文章,折射出成长于人工智能时代的美国大学生对高等教育的思考与反思。社交媒体平台上,美国《大西洋月刊》一名记者表示,贝克的文章为研究人工智能对美国高等教育造成的影响,提供了重要切入点。
直击谷歌I/O 2026:轰炸式发布Agent,狙击Claude Code,开战
作者|王兆洋 邮箱|wangzhaoyang@pingwest.com Google I/O 2026,再一次饱和式发布。 数十个产品更新,2个小时,一股脑全扔出来。信息量爆炸。 如果把最重要的发布更新先做个梳理,它们包括: Gemini 3.5系列亮相,先丢出 Flash版本,Pro下个月上线。一如既往,新的轻量模型干翻上一代Pro版本; Gemini Spark 亮相:对标OpenClaw的个人Agent产品终于有了,24/7在线干活; Antigravity发布2.0,全面摆脱coding的场景局限,终于和Claude Code 以及 Codex 直接竞争; 多模态能力集大成,聚到新的世界模型 Gemini Omni 上,可以用任何模态输入,任何模态输出,创造互动世界; Gemini app全面Agent化,交互设计和配套模型跟着完成大更新; 搜索、全家桶,全面“小 Gemini”化,让你在哪都能build; Gemini “降价”:新增一档 100 美元/月的 Ultra plan,给那些“想买重度 Agent 服务但还不到顶配水位”的用户。原来 250 美元/月的顶级 Ultra plan 直接降到 200 美元。Pro 维持 19.99 美元/月。 可以看出来,其中最重要的发布都是关于一个词: Agent!Agent! 还是 Agent! “最前沿的 Agent 可能只触达过世界上 0.1% 的人。”Google CEO Sundar Pichai 在 I/O 期间表示。“真正的问题,是怎么把这种前沿能力规模化交付给真正的更广泛的用户。” 让 Agent 这件事从早期采用者的小圈子走向所有人的过程,Google 准备自己来做。以下是憋了很久的Google为了做成这件事,在这次I/O上的重要发布。 1 3.5 Flash 干掉上代 Pro,把“Agent 经济账”摆上桌 Gemini 3.5 系列的第一款模型 3.5 Flash 在几乎所有基准测试上超过了自家上一代的 Gemini 3.1 Pro。在 Pichai 特意点名的 GDPval 基准(衡量“具有真实经济价值的任务”)上,提升尤其明显。 但真正让 Google 把它推到 keynote 中心位置的,是另一组数据。 3.5 Flash 的输出速度是其它前沿模型的 4 倍。Antigravity 2.0 里内置的优化版本可以做到 12 倍,质量不变。价格不到同档前沿模型的一半。 “这种速度与性能的平衡使 3.5 Flash 成为处理长时程Agent任务的最理想选择。”Google表示。这是一个特意为Agent设计的模型。 “过去需要开发者数天或审计师数周才能完成的工作,如今 3.5 Flash 可以在极短时间内辅助完成,成本通常不到其他前沿模型的一半。” 也就是说,Pichai 直接把这个性价比换算成了一笔账给所有 CIO 看。 “你可能听过很多 CIO 抱怨他们一年的 token 预算才到五月就快用完了。如果一家头部企业一天处理一万亿 token,把其中 80% 的负载从其它前沿模型迁到 3.5 Flash,一年能省下超过 10 亿美元,真金白银。” Google 自己已经是这件事最大的受益者。今年 3 月,Google 内部每天处理 5000 亿 token;现在每天超过 3 万亿,每隔几周翻一倍。增长的来源,是工程团队全面切换到 Antigravity 2.0 加 3.5 Flash 的开发流程之后释放出来的需求。 这套内部用法构成了一个完整的反馈回路,反过来又帮 Flash 做得更好。 而且,更强大的 Gemini 3.5 Pro 没有发布,Pichai 透露夏天会亮相,“内部已经在用,效果很好,但还在打磨”。 1 Gemini Spark:Google 的个人 Agent 终于落地 Spark 是这次回答“Agent 怎么走出 0.1%”最直接的产品。 它是一个 7×24 跑在云端的个人 Agent,以及毫不意外的,把Google全系产品都连了起来。 注意右下角那一堆产品,那就是Google的个人agent的护城河所在 它跑在 Google Cloud 的专用虚拟机上。你笔记本合上、手机关机,Spark 还在后台干活。底层模型是 Gemini 3.5,框架是 Google 内部用的 Antigravity Harness。所以它能跑“长周期任务”。 入口先是 Gemini app,随后接入邮件和聊天。工具调用先从 Google 自家产品开始,接下来几周开放第三方 MCP 接入。 展示的实际场景包括给老板发状态汇报,Spark 自动从你的 Gmail、Docs、Sheets、Slides 里拉事实写草稿;学生用 Spark 建一个会自动更新的学习指南;家长用它管学校时间表;小企业用它盯着收件箱,不漏掉任何客户问题。 Spark 接下来还会加 MCP 第三方连接、直接发短信或邮件指挥 Spark、自定义 sub-agent、接入 Chrome 跨网页干活。Android 上有一个新的 UI 入口叫 Android Halo,可以看 Spark 当前的执行进度。 开放节奏的拿捏值得注意。Spark 仅向受信任测试者首发,下周作为 beta 推给美国 Google AI Ultra 订阅用户。配合下面要讲的定价调整,Spark 接下来几个月会真正进入普通人手里。 目前个人Agent 普及最大的现实障碍是用户的不安全感。Google 这次专门花了时间讲它的设计哲学。Spark 在做什么这件事每时每刻都要很清晰,详细的“思考轨迹”会展示给用户,可以随时打断;执行敏感操作前会停下来征求许可。Google 给的一个具体例子是用 Spark 订日历会议,Spark 会在真正发出邀请前先和用户确认一次。 1 Antigravity 2.0 终于开卷 Claude Code 和 Codex Antigravity 1.0 是 6 个月前发布的(约 2025 年 11 月),已经有“数百万开发者在用”。 2.0 这次的关键变化是定位转移。它从“编程环境”变成了“多 Agent 编排平台”。 具体分三层。 第一层是一款独立桌面 App,作为“与 Agent 交互的中央枢纽”。你可以同时编排多个 Agent,一个写网站代码、一个生成品牌素材、第三个规划产品架构,互不打架。 第二层是新的 Antigravity CLI,命令行接口,给想留在终端里的开发者用。 第三层是新的 Antigravity SDK。这一层比较关键。Google 给的说明是,SDK 让程序可以直接、可编程地访问驱动 Google 自家产品的同一套 Agent harness,与 Gemini 模型协同优化。 内部的一个案例显示,它在还没对外发布的Gemnini 3.5 pro的支持下,可以让93个不同Agents工作,完成任务,消耗26亿token,从零建造起一个复杂系统项目。 换句话说,Google 试图把内部产品正在使用的 Agent harness,以 SDK 的形式开放给开发者。 这是一次对 Claude Code 和 Codex 的正面对位。 “开发者这个群体的好处是,你把东西做出来,如果真的好用,他们就会真的用。我自己玩过这些产品,Antigravity 加 3.5 Flash 是相当魔幻的体验,特别是它有多快。3.5 Flash 已经是其它前沿模型的 4 倍,在 Antigravity 里大约是 12 倍。”Pichai在前期的沟通里提到。 更有说服力的支撑来自 Google 的内部测试。用 3.5 Flash 加 Antigravity 2.0 跑多 Agent 协同,他们成功让 Agent 完全从零搭出了一个能跑的操作系统,而且API耗费在1千美金以内。 Antigravity 这条线下面还有一个单独发布的安全 Agent,叫 CodeMender。 CodeMender 用 Gemini 的高级推理能力自动找出并修复关键代码漏洞。Google 强调,CodeMender 会直接下笔把代码漏洞补上,等于接管了“人来打补丁”那一步。当前邀请少数专家测试 CodeMender API,更广泛的开放“很快”推出。 Google 给这件事的理由是,随着 Agent 写越来越多代码,cybersecurity 会变得更关键,agentic workflow 也是这个领域取得进展的必由路径。 1 彻底换新的 Gemini app,配上大降价 Gemini app 在过去一年里月活从 4 亿涨到 9 亿,日请求量翻 7 倍,在 230 个国家、70 种语言里运行,Google 在 I/O 上把它定义为“世界上覆盖最广的 AI 助手”。 这次Google形容它被从头重做了。 Gemini app 的新设计语言叫 Neural Expressive。从动效、色彩、字体到点击按钮时的触感反馈,全换。 但更值得注意的是回答页面的变化。回答不再是一整面文字墙。最重要的信息加粗顶在顶部。往下滚动,会看到交错排列的图片、时间线、可视化图表。Gemini Live 也不再需要切模式,直接内嵌打开。 Neural Expressive 5 月 19 日全球开放(Android、iOS、Web)。 Gemini Omni 同步进 app。你可以上传任意照片或视频,一键应用内置模板,甚至可以创建一个“看起来、听起来都像你”的 AI 化身,把自己放进 Omni 生成的内容里。 更重要的,是 Agent 第一次以“开箱即用”的方式进 Gemini app。第一个出场的是 Daily Brief。 Daily Brief 每天早上做一份个性化简报。Gemini 隔夜帮你整理收件箱、日历、当天最重要的任务,会替你把这些信息排序、组织,给出下一步建议。 Daily Brief 有一段值得讲的前史。它的前身是 2025 年 12 月在 Google Labs 上线的实验,叫 Cici。按 Google 自己的说法,Cici 很快成为最受用户喜爱的 Labs 实验之一,所以这次直接收编进 Gemini app 成为正式产品。Google Labs 的实验养大、定型、再吸纳进 Gemini 这条工业化产品线,Cici 到 Daily Brief 是最清晰的一个案例。 Daily Brief 5 月 19 日起在美国对所有 Google AI 订阅用户开放。 随这些发布一起调整的是 Gemini 的订阅价。 新增一档 100 美元/月的 Ultra plan,给那些“想买重度 Agent 服务但还不到顶配水位”的用户。原来 250 美元/月的顶级 Ultra plan 直接降到 200 美元。Pro 维持 19.99 美元/月。 2025 年 5 月 Google 才把顶级档 Ultra 定在 249.99 美元,一年时间实际降了 20%,中间又加了一档。这件事和 Spark 同步发生,意图很清楚,把 Spark 这种重度 Agent 服务的通道铺宽,让普通付费用户也能摸到。Google 自己的说法是要让这种新型的帮助“交到尽可能多人手里”。 1 Gemini Omni:把 Veo 和 Nano Banana 揉进 Gemini 主架构 如果说 3.5 Flash 是为“让 Agent 跑起来”准备的,那么 Gemini Omni 是为“让 world model 真的成型”准备的。 这部分由伟大的Demis Hassabis亲自发布。 Google 给 Omni 的定位是“能从任何输入生成任何输出模态的模型”,先做视频输出,未来扩展到图像和文字。 第一款上线的 Gemini Omni Flash,5 月 19 日起向 Google AI 订阅用户开放,入口包括 Gemini app、Google Flow 和 YouTube Shorts。所有 Omni 生成或编辑的内容都自带 SynthID 水印。Omni Pro“即将推出”。 Omni 和 Veo、Nano Banana 之间的关系,Google 自己给出的描述大致是这样。Omni 是 Gemini 主架构的进化,是 Gemini 一开始原生多模态底层设计延伸的产物。它让原生多模态从输入端扩展到输出端。视频生成是切入点,因为这是离 Veo 最近的能力;再把 Nano Banana 的编辑能力带进 Veo,让你可以像剪辑那样自然修改视频。本质上 Omni 是 Gemini 主线的进化,Veo 和 Nano Banana 是它身上的能力组件。 Nano Banana 累计已经生成超过 500 亿张图,Omni 这次把这个能力同等带到了视频里。它支持的玩法包括纯文本生成视频,也包括上传你自己的视频,做改风格、换角色、保持时间一致性的连续编辑。 自动播放 在它展示的各种效果里,Omni 可以让复杂想法可视化,从简短的提示词中生成引人入胜的解释视频,生成分解更复杂想法的视觉效果。 1 搜索 + 全家桶:Agent 进入 Google 每个角落 搜索:标志性搜索框 25 年来最大一次升级 AI Mode 一周岁了。2025 年的 I/O 上才推出,现在月活超过 10 亿,“上线以来每个季度查询量翻一倍”。 这次 AI Mode 升级到 Gemini 3.5 Flash 驱动。Google 搜索团队给出的判断是,人们意识到搜索能做更多事,开始问更长、更具体、跨模态的问题,所以上季度搜索总查询量创了历史新高。 围绕这种变化,Google 这次推出了一个全新的“智能搜索框”。Google 自己给这次搜索框改造下的定义是“标志性搜索框 25 年来最大的一次升级”。 新搜索框会扩展,容纳更长更口语化的查询。一套 AI 驱动的查询建议系统取代了原来的自动补全,会主动帮你写复杂、精细的搜索。同时支持多模态输入。5 月 19 日同步上线。 AI Overviews 和 AI Mode 这次合并成一个无缝体验。你问一个问题,得到 AI Overview,直接在原页面继续追问就进入 AI Mode。5 月 19 日在移动端和桌面端全球同时上线。 搜索框里也长出了 Agent Information Agents 把搜索从“一次性”变成了 Agent 后台跑活儿的入口。 你自己创建、定制、管理一个或多个后台 24/7 跑的 Agent。例如设一个跟踪某个领域市场变动的 alert,Agent 自己制定监控计划、确定要用哪些工具和数据(包括 Google 的实时金融数据),达到条件时合成一份带链接的更新推送给你。今夏上线。 更进一步,Generative UI 把 agentic 编程能力注入到了搜索。 例如搜“黑洞如何影响时空?”,得到的是一个 AI Overview 加一个可交互可视化;再追问,搜索会现场为你新建一个可视化。这套能力跑在 Gemini 3.5 Flash 上,背后是 Google DeepMind 和搜索团队共建的实时代码生成系统。今夏对所有人免费开放。 同时Google 还把 Antigravity 背后的 agentic 编程能力接进搜索,让用户可以用自然语言描述自己想要什么工具,搜索现场为你 build 一个“mini-app”。 Google 给的例子是个性化健身 mini-app,能接入实时天气、读你的日历、知道你的饮食偏好,自动生成餐计划并附带带链接的食谱。未来几个月先对美国 Google AI Pro 和 Ultra 订阅用户开放。 1 虽迟但到的 Google ,用轰炸式发布开卷Agent赛道 Google在此前一段时间在Agent的竞争里缺席了。而这场I/O可以看出它对Agent有多焦虑。而它给出的答案是一套全栈布局。 模型层,3.5 Flash 用速度和价格把 Agent 跑起来的边际成本压到企业可以接受的位置;Omni 把 world model 这件事再往前推一步。 产品层,Spark 给所有人,Daily Brief 给所有 AI 订阅用户,Information Agents 和 Generative UI 让 Agent 进入Google最广泛的“渠道”搜索框,Antigravity 2.0 直接给开发者提供了Claude Code的直接“平替”选择。 在商业层,UCP、AP2、Universal Cart 让 Agent 进入真实的交易场景。 别忘了Google还有强大的基础设施层兜底。Pichai也强调了第八代 TPU 这次第一次走“双芯片”分工,TPU 8T 专做训练,TPU 8I 专做推理。配合 JAX 和 Pathways,训练任务可以跨多个数据中心,全球分布到超过 100 万颗 TPU,这是“世界最大的训练集群”。 在I/O上,Pichai一直在提醒人们,Google的AI在各个主要产品里的用户量级全部是十亿级别的。有5个产品已经各自有30亿用户。这是一个没法忽视的优势,这种全栈的能力会一直让Anthropic和OpenAI们忌惮。 他透露,Google 今年的 capex 预计 1800-1900 亿美元,是 2022 年(310 亿)的 6 倍。每月跨自家产品处理的token已经达到了夸张的 3.2 千万亿(quadrillion)token,是 2025 年 I/O 时 480 万亿的 7 倍。 “为什么我们这么专注于做出既能力非常强、又很高效、很快、价格还很低的前沿模型?因为我们要把它带给尽可能多的人。这是我们随着时间会真正发光的地方,就像我们在搜索、推荐和其它领域已经做到的那样。”在I/O前的小范围交流里,Pichai这样说道。 虽迟但到,Google开卷Agent,The show goes on!
Google今秋推首款AI智能眼镜 支持连接iPhone
Google今日宣布,其首款定位为“智能眼镜”的可穿戴产品将于今秋正式上市,并将与三星以及眼镜品牌 Gentle Monster 和 Warby Parker 合作推出一系列全新的 AI 音频眼镜。 这些眼镜将搭载Google专为智能眼镜及 AR/VR 头显打造的 Android XR 平台,机身内置摄像头、扬声器和麦克风,但镜片本身并不配备显示屏。 Google已率先展示了来自 Gentle Monster 与 Warby Parker 的两款设计方案,并表示这两家公司将在产品发售时推出各自的完整款式系列,为用户提供多样化的外观选择。 所有款式均支持Google的 Gemini 人工智能系统,Gemini 将深度融入眼镜的全部功能之中。 用户可以通过说出“Hey Google”或轻触眼镜镜框侧边唤出 Gemini,随时进行语音交互。 在功能层面,Gemini 将利用眼镜上的摄像头与传感能力,为佩戴者提供与所见内容紧密关联的信息服务。 例如,用户可以获得附近餐厅的评价信息、识别头顶的云层形态,或快速读懂复杂的停车标志。 基于视觉的导航功能也将得到支持,系统可以提供逐向导航,并根据用户偏好添加途经点或查找附近餐厅等地点。 除了视觉与导航能力,这款智能眼镜还将承担一部分传统智能手机的通信与多媒体功能。 用户可通过语音管理电话、发送短信、自动汇总信息内容,并直接在眼镜上收听音乐。 眼镜还能完成拍照和视频录制,并借助Google的 Nano Banana 图像编辑引擎对画面进行智能编辑。 此外,Gemini 还可实时翻译讲话和文字内容,帮助用户跨语言交流。 Google强调,Gemini 不仅能响应简单指令,还可以处理诸如通过 DoorDash 订购咖啡等多步骤任务,并支持通过语音指令操作已连接智能手机上的应用。 在设备兼容性方面,Google明确表示,这款智能眼镜将在发布时同时支持 Android 智能手机和苹果 iPhone,从而覆盖更广泛的智能手机用户群体。 报道亦提到,苹果方面正在研发自家的 AI 智能眼镜产品,预期将具备类似能力,但相关产品据传要到 2027 年左右才会准备就绪。 与此同时,Google已规划后续推出配备小型镜片显示屏的“显示型眼镜”,以在镜片中直接呈现来自 Gemini 的信息,不过这类产品将会在今秋首款智能眼镜之后的未来阶段才会问世。
苹果Sports应用扩至170个市场,为2026世界杯引入对阵图等
IT之家 5 月 20 日消息,苹果公司昨日(5 月 19 日)宣布,Apple Sports 已新增覆盖 90 多个国家和地区,总可用范围扩大到超过 170 个市场。 Apple Sports 现在已在 90 多个新增国家和地区上线,覆盖范围从原先的北美、南美和欧洲,扩大到亚太、中东和非洲等市场。在本次扩张后,这款应用已在全球 170 个国家和地区提供。 为了配合 2026 国际足协世界杯(FIFA World Cup),Apple Sports 加入赛程对阵图,用户可以通过可滚动界面查看每一轮对阵和结果,并追踪一支球队从小组赛到最后一场比赛的晋级路径。 Apple Sports 2026 FIFA World Cup 界面 Apple Sports 还引入可视化阵型卡片,能在比赛开始前显示双方首发阵容的站位,让用户更直观地看懂战术安排。 IT之家援引博文介绍,Apple Sports 应用还加入了一键跳转 Apple News 的入口,方便用户从比分页面直接进入相关新闻报道。 苹果公司强调,Apple Sports 支持 Live Activities,用户可以在 iPhone 锁屏、灵动岛以及 Apple Watch 上,快速查看自己关注球队的比分和比赛进展,这对只想“抬手看一眼”的用户更实用。 Apple 负责 Music、Sports、Apple TV 和 Beats 的副总裁 Oliver Schusser 表示,世界杯能把全球球迷连接起来,因此也是把 Apple Sports 带给更多用户的合适时机。 不过,Apple 也说明,Apple Sports 目前仍然只支持 iPhone,对于 iPad、Mac 和其他平台用户而言,暂时还无法单独使用这款应用。
继续互放狠话 伊称将用新手段反击侵略 美称已有重启军事行动方案
  军事威慑与对话斡旋交织,美伊博弈仍在持续。伊朗外交部副部长加里巴巴迪19日表示,美国将“威胁”冠以“和平契机”之名,伊朗举国上下团结一致,将坚决应对任何形式的军事侵略。美国总统特朗普当天表示,美国或将再次对伊朗发起“沉重打击”,但是会留出至少两到三天时间,使对话直接进行。副总统万斯也说,美伊之间的直接谈判已在建立沟通渠道和推动外交进程方面取得“很大进展”,但美方也准备了重启军事行动的“B方案”。同时,以色列高层评估认为,特朗普政府仍倾向于对伊朗重启军事行动。   伊称坚决应对任何形式军事侵略   将采取新手段“开辟新战线”予以反击   △伊朗外交部副部长加里巴巴迪(资料图)   伊朗外交部副部长加里巴巴迪当地时间19日在其个人社交媒体上表示,美国宣称其“暂时”停止了“对伊朗的攻击,以给谈判一个机会”;但与此同时,美国又声称随时准备发动大规模袭击。 加里巴巴迪称,这就意味着美国将“威胁”冠以“和平契机”之名。   加里巴巴迪称,伊朗举国上下团结一致,将坚决应对任何形式的军事侵略。他还指责说,美国声称暂时停止对伊朗袭击、以便为谈判提供机会的同时,不断威胁“随时准备发动大规模攻击”。   伊方19日消息称,伊朗军方发言人表示,如果敌对势力再次侵略伊朗,伊朗将采取新手段并“开辟新战线”予以反击。   △霍尔木兹海峡(资料图)   伊朗伊斯兰革命卫队18日表示,在伊方对霍尔木兹海峡“实施管理”后,“可宣布所有经过该水道的光纤电缆必须接受许可、监管并缴纳主权性费用”。   据悉,伊朗要求西方科技企业遵守伊朗相关法律。伊朗方面还提出,海底光缆公司需支付过境许可费,且光缆的修理和维护权归伊方所有。   霍尔木兹海峡海底光缆是全球通信网络的重要组成部分。统计显示,全球共有超过500条用于通信的海底光缆,承载了逾95%的洲际数据传输工作,其中至少7条关键线路汇集于霍尔木兹海峡及附近海域。分析人士指出,霍尔木兹海峡海底光缆的战略价值,丝毫不逊色于海峡的航运价值。   美称谈判“进展很大”   但也预备军事行动“B方案”   伊朗面对威胁持续强硬表态,美方则在释放继续推进谈判信号的同时,进行军事与经济两方面进一步施压。   △当地时间5月19日,美国总统特朗普在白宫东翼宴会厅改建项目施工现场   当地时间19日,美国总统特朗普在白宫东翼宴会厅改建项目施工现场称,美国已迫使伊朗坐上谈判桌,伊方想要达成协议,“我希望我们不必再采取进一步行动,但我们也可能不得不再给他们一次沉重打击……目前我还不确定,你们很快就会知道”。   特朗普称,18日那天,“只差一个小时”,他就要下令打击伊朗了,但美国在海湾地区的盟友请求他暂缓实施该计划。特朗普说,多个海湾国家告知,在巴基斯坦斡旋下旨在达成和平协议的谈判正在取得进展。他将留出至少两到三天的“有限时间”,让对话能够继续进行。   美国财政部外国资产控制办公室在19日公布了新一轮针对伊朗的制裁名单。根据公告,制裁名单中有12名来自多个国家和地区的个人被列入“特别指定国民清单”。此外,制裁名单中还包括19艘石油、液化石油气和化学品运输船,以及29个贸易和航运类企业。其中,伊朗从事外汇交易的阿明交易所以及相关个人与企业均受到制裁。   △当地时间5月19日,美国副总统万斯在白宫新闻简报会上   美国副总统万斯在19日白宫新闻简报会上表示,美国与伊朗之间的直接谈判已在建立沟通渠道和推动外交进程方面取得“很大进展”,但美方也准备了重启军事行动的“B方案”。   万斯表示,目前“只有两个选项”,要么“达成一个好的协议”,要么回到军事行动。他说,显然,特朗普希望达成协议,伊朗方面也倾向于达成协议;同时,美方也准备可以重启军事行动,特朗普刚刚告诉他,“我们已经严阵以待”。“我们不希望走到那一步,但如有必要,总统愿意也有能力走那条路。”   以高层认为美方仍倾向对伊动武   以色列方面则更倾向于对伊战事可能重启。   △以色列特拉维夫(资料图)   当地时间5月19日晚,据以色列方面消息,尽管美国总统特朗普于前一日宣布取消对伊朗的袭击行动,但以色列高层当晚评估认为,特朗普仍倾向于对伊朗重启军事行动。   此外,还有以方消息称,以色列和美国对伊朗重启军事行动的联合准备工作已完成,目前正在等待特朗普的决定。   据以方18日消息,以总理内塔尼亚胡前一天与特朗普通电话后,连续两晚召集安全内阁开会,为美以重启对伊朗军事行动做准备。一名以色列官员称:“鉴于战事可能在本周结束前恢复,目前局势高度紧张。”   而据相关消息披露,18日晚,在下令不按原计划于19日对伊朗发动军事打击后的几小时,美总统特朗普召集国家安全团队开会听取了针对伊朗的军事行动方案简报。据两名美国官员消息,会议重点讨论了对伊朗战事的下一步方向、外交谈判进展,以及美国可能采取的军事行动。据称,此次简报会显示出特朗普“正认真考虑恢复对伊朗军事行动”。   若霍尔木兹海峡7月仍未开放   北约将考虑护航   美伊僵局难破,中东紧张局势外溢使欧洲经济持续承压。   当地时间18日,出席七国集团财长会议的国际能源署署长法提赫·比罗尔表示,受中东战事影响,商业石油库存正“急剧下降”,可支撑时间“仅剩数周”;欧盟委员会负责经济事务的委员瓦尔季斯·东布罗夫斯基斯指出,中东局势持续紧张令欧洲经济面临滞胀冲击。   △北约(资料图)   据美国方面19日消息,一名北约高级官员称,如果霍尔木兹海峡未能在7月初重新开放,北约将考虑是否“协助船只”通过该水道。   消息称,这一提议已获得多个北约成员国支持,但尚未达到其获通过所需的全体一致支持。北约高级官员说,尽管部分北约国家目前仍反对授权北约针对该海峡开展联合行动,但若封锁局面持续下去,他们最终将会支持这一提议。   监制丨郑弘   制片人丨赵新宇   主编丨崔翀   编辑丨欧阳文芊   记者丨曹健 李健南 魏然 梁慧 孙建
苹果Neo抢走用户后,英特尔开始反击
作者 | 梁卡尔 编辑 | 苗正卿 头图 | 虎嗅拍摄 尽管英特尔管理层在台上始终没有点出竞争对手的名字,但现场几乎所有人都明白,这场发布会的真正假想敌,是苹果MacBook Neo。 5月18日,英特尔面向中国市场正式发布第三代酷睿处理器,代号“Wildcat Lake(野猫湖)”。在官方表述里,这是一颗服务“全民AI轻薄本”的主流芯片,目标是以更低功耗、更高AI能力和更完整的平台方案,重塑主流PC体验。 但如果把这场发布放回当下的市场环境里看,英特尔的目标不只是一次常规产品迭代。随着苹果在入门轻薄本市场持续下探,学生、职场新人、家庭用户和个体创业者等原本属于Windows阵营的核心客群,正在被MacBook Neo这类产品快速吸走。Wildcat Lake更像是英特尔联合OEM厂商,对这一市场变化发起的一次正面防守反击。 从产品定位看,Wildcat Lake本质上是英特尔将先进制程进一步下放到主流价位段的尝试。根据官方信息,这款芯片采用Intel 18A制程。此前,在CES期间发布的高端产品线酷睿Ultra Series 3(采用Panther Lake架构)已经率先采用这一工艺,而Wildcat Lake则被视为面向主流市场的“精简版”方案。 从规格来看,Wildcat Lake并没有追求高端旗舰路线。其最高配版本为6核心,包括2个Cougar Cove性能核和4个Darkmont能效核;另有5核心入门版本。GPU部分最高配备2个Xe3架构核心,明显低于Panther Lake起步4个、最高12个Xe3核心的配置。AI部分则内置第五代NPU,单独可提供最高18TOPS算力,平台总算力达到40TOPS。 这组参数的意义不在于“堆高”,而在于“够用且可控”。Wildcat Lake是一颗用来压低主流AI PC门槛的芯片。英特尔给出的说法是,该芯片功耗可降低64%,图形AI性能提升2.7倍,并首次支持端云混合AI。对于主流轻薄本市场而言,这些指标比单纯拉高峰值性能更重要,因为它们直接对应的是续航、散热、轻薄化和整机成本。 英特尔在试图把“平台能力”整体下放到更大规模的价格带。该公司副总裁、中国区软件工程和客户端产品事业部总经理高嵩告诉虎嗅,将新制程尽快用在主流芯片上,核心目的是“把最先进制程尽快带给广大客户”。至于终端设计成本究竟能节省多少,他并未给出明确数字,只表示Wildcat Lake本身就是为主流产品设计,在性能和价格上都将具备竞争力。 芯片本身决定了性能底座,但英特尔这次真正押注的,是系统级创新。 发布会上,英特尔同步启动了“Firefly萤火虫计划”,希望联合产业链上下游伙伴,从产品设计、元器件选型到成本结构进行协同优化,推动主流PC在性能、质感和体验上的整体升级。与过去更强调单一芯片性能不同,这次英特尔格外强调与手机生态的融合。 英特尔展示参考设计。图片来源:虎嗅拍摄 按照英特尔披露的参考设计数据,相较前代产品,新方案可将PCB面积缩小5%,器件数量减少7%,并推动主板核心电路模块化和I/O板标准化连接。这些都是供应链和设计层面的技术细节,是为了给OEM厂商腾出更多空间,在有限成本内平衡轻薄化、续航、做工和配置。 过去几年,苹果完成了自研芯片、统一架构和跨设备协同,推出MacBook Neo固然有销库存A18 Pro芯片的目的,但其在用户体验上成功建立了新的用户心智。相比之下,Windows阵营的轻薄本长期存在产品分散、缺乏爆款的问题。 从这个角度看,Wildcat Lake的真正任务,不是在参数上压过苹果,而是帮助厂商在主流价格带,做出一批体验更整齐、成本更可控,且足以大规模铺货的产品。 发布会现场,英特尔列举的Wildcat Lake平台典型用户画像,包括家长学生、职场新人、一人公司创业者和银发族,这与MacBook Neo当前覆盖的核心消费群体高度重叠。一位苹果直营店销售告诉虎嗅,MacBook Neo最常见的销售场景之一,正是家长带学生到店购买。 联想、华硕、荣耀、惠普等厂商产品负责人上台介绍新品。与英特尔的“谨慎不同”,这些产品负责人甚至直接点名和苹果MacBook Neo的比较。活动现场还展示了七彩虹、畅网、铭凡等厂商的产品设计,涵盖PC、AI NAS等。英特尔预计,全球合作伙伴将陆续推出超过70款基于Wildcat Lake平台的终端产品。其中多数在即将到来的618购物季上市销售。 价格也正在成为这场竞争里最敏感的变量。尽管英特尔没有披露参考设计最终对应的终端价格区间,但有行业人士向虎嗅透露,相关产品售价大致会落在5000元左右。与此同时,搭载Wildcat Lake平台Core 5 320处理器的荣耀MagicBook X14 2026“战斗版”已经上架。荣耀京东自营旗舰店显示,其16GB+512GB版本定价4299元,叠加优惠后可下探至3999元。 这意味着,英特尔和终端厂商试图在大盘的主流市场,以更低的价格、更密集的机型和更快的上新节奏,守住甚至是夺回原本的基本盘。不过,这样的策略能否奏效,就要看这些终端厂商能否把这套平台能力真正转化为消费者可感知的产品力。尤其是在内存等关键元器件价格波动的背景下,厂商能否把终端售价稳定压到多少。
卖11万辆亏3.9亿,零跑年赚50亿“悬”了?
雷达财经出品 文|彭程 编|孟帅 刚刚在2025年初尝全年盈利甜头的零跑汽车,转头就在2026年一季度背上了3.9亿元的亏损。 据零跑汽车最新发布的财报,今年第一季度,零跑全球销量突破11万辆,单季实现营收108.2亿元,双双创下历史同期新高。 然而,零跑该季度的毛利率却从去年同期的14.9%骤降至9.4%,单季录得归母净利润亏损3.9亿元,终结了此前连续三个季度的盈利纪录。 国金证券研报认为,零跑汽车一季度毛利率同环比降低,主要由于整车产品组合变动、销量规模效应未充分释放及26Q1产能利用率相对较低导致制造费用上升。 今年4月,零跑汽车的单月销量突破7万辆大关,打破其创下的新势力月度销量纪录。尽管管理层对于全年年销百万辆的目标充满信心,但零跑汽车想要达成百万目标,目前仍有不小的销量缺口。 此外,一季度近4亿的亏损,也让零跑汽车全年盈利50亿元的目标陡然承压。零跑副总裁李腾飞直言,受原材料、国际政治环境、行业价格变化等因素影响,该目标的实现存在一定风险。 值得一提的是,就在财报发布前一周,Stellantis宣布与零跑汽车扩大战略合作伙伴关系,双方将在前期合作成果的基础上进一步深化布局。 增收不增利,一季度再度转亏 5月15日,零跑汽车发布2026年一季度财报。报告期内,公司实现营收108.2亿元,同比增长7.98%,创同期历史新高。 不过,零跑汽车在盈利端的表现却难言出色。今年第一季度,公司录得归母净利润亏损3.9亿元,相比去年同期的1.3亿元亏损进一步扩大。 而环比来看,零跑汽车也扭转了去年第四季度实现归母净利润3.6亿元的良好态势。 同时,零跑汽车的毛利率也出现下滑。今年第一季度,零跑汽车的毛利率为9.4%,不仅低于去年同期的14.9%,还低于去年第四季度的15%,同环比均下降超过5个百分点。 对于一季报的业绩表现,零跑汽车在财报中解释称,收入增长主要得益于整车及备件交付量的提升,但部分被整车产品组合变动导致的平均售价下降所抵消。 零跑汽车还表示,公司毛利率同比下降,主要由于整车产品组合的变动,部分被持续进行的成本管理所抵销;战略合作业务减少。 毛利率环比降低,则主要由于整车产品组合的变动,及产量下降导致的单台制造成本增加。 现金流方面,今年第一季度,零跑汽车经营活动产生的现金净额为-66.1亿元,自由现金流为-74亿元。 财通证券在研报中指出,公司Q1经营整体承压,但业绩符合预期。受到Q1行业需求下行影响公司销量,导致Q1销量同比增速放缓环比腰斩。 同时,公司本季度销量矩阵出现结构性下行,C系列销量占比下滑至45.1%。导致Q1公司毛利率和ASP双杀,毛利率下滑至9.4%,单车ASP下滑至9.8万元,系近两年来新低。 此外,来自合作伙伴的收入减少也影响了公司本季度的经营。但整体看,公司Q1亏损额度较小,业绩依旧是符合预期的。 在财报电话会上,零跑汽车副总裁李腾飞透露,公司一季度的整车毛利率预计在7%左右,跟去年全年差不太多。 李腾飞进一步表示,毛利率同环比下降,主要是由于一季度销量受行业季节性因素影响,规模效应未能充分释放,而产能及零部件储备较去年同期增加,导致产能利用率下降,制造费用明显上升。 此外,去年同期销售以C系列车型为主,今年一季度毛利率略低的B系列车型占比提升。 李腾飞还提到,原材料成本上涨影响不大。公司去年已针对主要原材料进行备货,基本能覆盖一季度的生产使用。但备货会用完,且关键材料的价格上行尚未结束。二季度原材料价格上涨开始体现,但当期毛利率受影响幅度不至于过大。 不过,李腾飞也坦言,“若三季度至四季度原材料(如碳酸锂、芯片、贵金属)持续上涨,在终端价格不变的前提下,将对零跑毛利率构成较大影响。” 李腾飞还透露,“部分友商已经在调整零售价。下半年公司会紧密跟踪地缘政治环境变化下的材料价格走势。如果原材料价格继续大幅上涨,整个行业最终都要上调零售价。” 据乘联分会数据,2026年1-2月,我国汽车行业利润率为2.9%,相对于下游工业企业利润率5.8%的平均水平,汽车行业仍偏低。 而行业整体利润空间被挤压的现状,也让零跑的盈利压力进一步加剧。李腾飞预计,二季度公司毛利率较一季度会有一定提升,但可能无法达到去年第四季度的水平,预计在12%至13%之间。 而支撑这一预期的其中一个有利因素在于,作为当前品牌售价最高的车型,D19上市后,短时间内已积累1.5万辆订单。 李腾飞表示,单车毛利率方面,与原计划和此前预期相比变化不大,但销量增长与产品结构改善将对整体盈利产生正向影响。“公司对D19团队提出了稳定月销约1万辆的目标,以保持D系销量并为后续D99铺路”。 全年盈利50亿目标承压,零跑高端化能否成功突围? 天眼查显示,零跑汽车于2022年登陆港股。2026年,零跑汽车定下了两大核心经营目标,即全年销量冲刺100万辆,净利润突破50亿元。 与2025年接近60万辆的销量相比,全年百万辆的目标,意味着超过66%的同比增长幅度。 今年第一季度,零跑汽车的销量为110155辆,仅完成全年目标的约11%。 不过,今年4月,零跑单月销量达71387辆,打破自己创下的新势力品牌月度销量纪录。 李腾飞也在财报电话会上表示,基于当前趋势,公司对完成全年100万辆销量目标有信心。 按照零跑的规划,二季度预计销量为24万至25万辆,上半年合计约36万辆,这意味着想要达成百万目标,零跑汽车下半年则需要交付约64万辆。 相比之下,零跑汽车想要达成利润目标的难度更大。一季度,公司3.9亿元的亏损已形成一个起始缺口,距年度利润目标尚有约54亿元的差距需要填补。 李腾飞表示,50亿元净利润目标暂不调整,但受原材料、国际政治环境、行业价格变化等因素影响,该目标的实现存在一定风险。 为了进一步提升公司的盈利能力,零跑汽车正在布局多层举措。 比如,零跑旗下定位为科技豪华旗舰首款MPV车型的D99,计划于6月开启预售,7月上市交付。D99上市后,有望进一步完善零跑高端产品矩阵,打开全新增长空间。 除了D99,零跑汽车还确认了第二品牌计划。据悉,零跑汽车第二品牌的产品定位30万元以上,预计最快在今年年底或明年亮相,明年年中或下半年上市,主攻品牌向上与高端市场,以提升均价与盈利空间。 不过,行业整体环境正在给零跑增加更多不确定性。在行业利润率被大幅压缩的背景下,上游原材料的价格上行正在倒逼车市风向逆转,持续许久的“价格战”进入转折期。 五一假期前后,十余家车企密集发布调价公告,比亚迪将智驾选装包从9900元上调至12000元,长安启源官宣涨价3000元,奇瑞星途涨价5000元,小米新款SU7全系涨价4000至8000元。 此外,2026年起,新能源汽车购置税由全额免征调整为减半征收,最高减免额降至1.5万元,这也进一步推动新能源汽车行业从价格竞争转向技术实力的比拼。 拿下欧洲量产车专线,全球化持续加码 在一季报发布一周前的5月8日,Stellantis集团宣布,与零跑汽车扩大战略合作伙伴关系。根据Stellantis方面披露的信息,双方将在三个层面推进合作。 第一,提升西班牙萨拉戈萨菲盖瑞拉工厂产能。双方正评估新增生产线,用于生产欧宝全新纯电动C级SUV,最快或于2028年投产,与现有标致208、蓝旗亚Ypsilon共线生产;零跑B10车型最快或于今年在该工厂投产。 作为Stellantis欧洲纯电市场增长战略的一部分,上述欧宝全新车型将采用零跑国际体系零部件,以降低成本。据悉,该工厂自1982年以来已生产超1000万辆欧宝Corsa。 第二,Stellantis集团与零跑汽车将通过零跑国际开展联合采购,借助中国新能源产业链提升价格竞争力,同时结合欧洲供应链保障供应韧性,加快新车型上市节奏。 第三,双方将为马德里比亚韦德工厂提供长期发展支撑,计划自2028年上半年起导入零跑全新车型,承接雪铁龙C4停产之后的产能空间。 双方正探讨将该工厂所有权转让给零跑国际西班牙子公司,投产车型将符合“欧洲制造”相关要求,由零跑国际在欧洲、中东与非洲市场销售。 雷达财经梳理发现,早在2023年10月,双方便已拉开合作序幕。彼时,Stellantis集团计划投资约15亿欧元以获取零跑汽车约20%的股权,成为零跑汽车的重要股东。 此外,Stellantis集团和零跑汽车还将以51%:49%的比例,成立一家名为“零跑国际”的合资公司。 除大中华地区以外,该合资公司独家拥有向全球其它所有市场开展出口和销售业务,以及独家拥有在当地制造零跑汽车产品的权利。 不过,欧洲内部对“中国汽车进入欧洲制造体系”的担忧正持续加剧。有分析人士担心,短期缓解产能利用率问题,中长期却可能压缩欧洲本土品牌市场空间,甚至导致供应链“空心化”。 而欧盟政策制定者也在关注本土零部件含量要求能否真正落地,监管环境变化可能影响合作深度。 值得注意的是,目前,零跑汽车的出海步伐已在多个区域加速推进。财报显示,一季度,零跑海外销量达40901辆,创下历史新高,同比增长442%,占总销量比例达37.1%。 4月,零跑海外销量达14225辆,占总销量的19.9%,持续领跑新势力品牌汽车出海速度。 值得一提的是,零跑在欧洲市场的表现尤为突出。在16个欧洲国家中,零跑汽车上牌量达2.33万辆,同比增长726.5%;在欧盟12个国家内,零跑纯电车型销量约为1.7万辆,位居中国纯电品牌首位。 李腾飞表示,公司2026年全年海外销量目标仍维持10万至15万辆不变,“基于前四月的表现,我们认为年度(海外销量)实现15万辆的可能性是大大增加了。” 去年在新势力品牌中销量一骑绝尘的零跑,2026年能否实现全年销量百万辆、利润50亿的目标?雷达财经将持续关注。
苹果零售店开业25周年:全球门店超500家 每平方米年销售额40万
苹果泰森斯角门店 凤凰网科技讯 北京时间5月20日,据科技网站MacRumors报道,美国当地时间5月19日,苹果零售店迎来开店25周年纪念日。2001年5月19日,苹果开设了首批门店,目前已过去了四分之一世纪。 2001年5月15日,在宣布苹果零售计划后,苹果联合创始人史蒂夫·乔布斯(Steve Jobs)亲自带领媒体记者参观了泰森斯角门店,当时距离该店开业还有四天。 开业当天,约有500名顾客在天亮前排队等候,到上午10点开门时,排队人数已超过1000人。位于弗吉尼亚州麦克莱恩泰森斯角中心以及加州格伦代尔广场的两家门店,在开业首个周末共接待了超过7700名访客,合计销售额达到59.9万美元。 苹果决定进军实体零售时,正值公司处境艰难之际。当时苹果的市场份额徘徊在2.8%左右,通过第三方零售商展示产品困难重重:Mac电脑常被弃置于布满灰尘的角落,店员对产品也所知甚少。乔布斯相信,除非苹果能从选购环节开始全程掌控客户体验,否则永远无法摆脱“小众品牌”的形象。他在传记中对作者沃尔特·艾萨克森(Walter Isaacson)说:“如果我们找不到办法在门店里把信息传达给顾客,那我们就完蛋了。” 到2003年时, 苹果的零售业务已经实现每家门店每季度约300万美元的利润,每个门店大约接待6万名访客。2004年,苹果零售营收达到12亿美元,打破零售行业最快达到10亿美元规模的纪录。 如今,苹果在27个国家运营着超过500家门店,每平方英尺每年创造约5500美元的销售额,相当于每平方米每年的销售额为5.92万美元(约合40.34万元人民币),这一数据位居零售行业顶尖之列。 苹果泰森斯角的原始门店后来搬迁,并于2023年5月在同一购物中心内在更大、重新设计的空间内重新开业。泰森斯角和格伦代尔广场的两家苹果零售店至今仍在运营。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
索尼发布 WH-1000X The ColleXion 纪念款旗舰降噪耳机
为纪念开启其旗舰降噪耳机序章的 MDR-1000X 问世十周年,索尼正式推出全新头戴式旗舰耳机 WH-1000X The ColleXion,并将其定位为 WH-1000X 系列中的顶级产品。 这款新品在延续 WH-1000XM6 核心功能的基础上,进一步升级设计用料、声学结构以及降噪与空间音频能力,同时价格也全面上探至高端区间。 在设计层面,WH-1000X The ColleXion 采用合成皮革材质打造耳罩外壳,以此向初代 MDR-1000X 致敬。 新款耳机配备更深更宽的耳垫以及尺寸更大的头梁,辅以不锈钢材质转轴与头梁上方金属饰件,旨在在佩戴舒适度和整体质感上全面升级。 与 WH-1000XM5 类似,新机取消了可折叠结构,仅支持耳罩向内旋转,索尼同时为其配备了带一体式握柄的新款收纳盒。 操控方面,WH-1000X The ColleXion 在左侧耳罩集成三枚实体按键,分别用于电源、主动降噪/环境声模式切换以及全新的空间音效模式切换键。 在音频功能上,新机加入了 360 Upmix 技术,支持针对音乐、电影和游戏的多种空间音频配置,并内置对 DSEE Ultimate 音频升频技术的原生支持,借助 AI 补偿丢失的高频细节。 声学结构上,WH-1000X The ColleXion 延续了与 WH-1000XM6 相同的 30mm 单元尺寸,但改用软边振膜单元,官方宣称可带来更强的低频表现及更出色的降噪能力。 索尼同时优化了耳机内部电路板布局,得以采用更厚的铜基板,从而在细节解析、声场宽度及声音纵深感方面获得提升。 新款耳机还与 Battery Studios、Sterling Sound 和 Coast Mastering 等录音与母带工程团队联合调音,意在进一步贴近专业监听标准。 在降噪与通话方面,WH-1000X The ColleXion 内置共计 12 颗麦克风,分布在耳机两侧,配合自适应主动降噪与波束成形拾音技术,以增强环境噪声抑制与人声捕捉精准度。 处理器方面,新机沿用与 WH-1000XM6 相同的 QN3 降噪芯片,同时新增 V3 集成处理器,用于进一步强化降噪表现与声音处理能力。 续航方面,WH-1000X The ColleXion 在开启主动降噪时官方标称可连续播放约 24 小时,关闭降噪则可达约 32 小时。 相较之下,这一数据低于 WH-1000XM6 开启降噪约 30 小时、关闭降噪约 40 小时的官方标称续航。 新款耳机提供黑色与白色两种配色,建议零售价为 649 美元 / 629 欧元 / 549 英镑,较 WH-1000XM6 首发价分别高出 200 美元 / 180 欧元 / 150 英镑,凸显其更为高端的市场定位。
突发!卡帕西官宣加入Anthropic,OpenAI对家挤满了前员工
刚刚,安德烈·卡帕西(Andrej Karpathy)在 X 平台宣布自己已加入 Anthropic。这位 OpenAI 联合创始人、前特斯拉 AI 总监、AI 教育创业者,选择了 Sam Altman 最直接的竞争对手作为自己的下一站。 据 Axios 报道,卡帕西本周起加入 Anthropic 的预训练团队,负责 Claude 模型的大规模训练。他将组建一支新团队,专注于用 Claude 本身来加速预训练研究,让 AI 帮助训练更好的 AI,这是也各大前沿实验室当下争相投入的方向。卡帕西在帖文中说,未来几年将是大语言模型前沿最具塑造力的时期,自己很高兴能回到研发一线。 图丨相关推文(来源:X) 卡帕西是极少数同时在学术界、工业界和公共传播领域都建立了声望的 AI 研究者。 他在斯坦福师从李飞飞,主讲深度学习课程 CS231n;2016 年联合创立 OpenAI;2017 年加入特斯拉担任 AI 总监,领导 Autopilot 计算机视觉团队;2022 年离开特斯拉,短暂回归 OpenAI 后于 2024 年再度离开。 此后他在 YouTube 上积累了超百万订阅者,“Neural Networks: Zero to Hero”成为最受欢迎的 AI 入门教程之一。他也是“vibe coding”一词的发明者。 2024 年 7 月,卡帕西创办了 AI 教育公司 Eureka Labs,要做“AI 原生学校”。但该公司从创立至今一直处于早期开发阶段,除了 LLM101n 课程的预览版本外几乎没有公开的商业产出。他在此次发帖中说自己对教育仍有热情,计划未来某个时间点重返这一领域。但眼下,他选择了先回到预训练一线。 过去一年,AI 人才争夺战的主角是 Meta 和 OpenAI。2025 年年中起,Meta 从 OpenAI 连续挖走至少 8 名研究员,包括 ChatGPT 联合开发者赵晟佳、感知团队负责人余佳辉,以及苏黎世办公室的三名核心研究者。OpenAI 首席研究官 Mark Chen 在内部 Slack 中称,这感觉像“有人闯进了我们的家,偷走了东西”。 而 Anthropic 几乎没有出现在这场混战中,一直处于闷声发大财的状态。根据 SignalFire 的数据,Anthropic 的员工留存率达80%,在前沿实验室中最高,offer 接受率95%。当 Meta 用天价薪酬和万卡集群做招聘筹码、OpenAI 紧急调整薪酬结构试图止血时,Anthropic 既没有大规模流失,也没有高调参与抢人。现在它直接拿到了卡帕西。 对 OpenAI 来说,这是一个微妙的时刻。联合创始团队成员近年陆续离开,有人独立创业,有人加入竞对。Anthropic 本身就是由 OpenAI 前研究副总裁 Dario Amodei 和 Daniela Amodei 在 2021 年带队出走创立的。卡帕西的加入,让这家公司在“前 OpenAI 成员汇聚地”的名单中又多了一个极具分量的名字。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。