行业分类:
加载中...
头条分类:
加载中...
古尔曼深度揭秘:苹果6条新产品线同时开工,接班人2年前已敲定
编译 | 刘煜 编辑 | 陈骏达 智东西4月24日消息,4月22日美国科技播客节目TBPN放出了对彭博社记者马克・古尔曼(Mark Gurman)的访谈,他透露,苹果在两年前就已敲定约翰·特纳斯(John Ternus)成为新一任CEO。苹果CEO蒂姆・库克(Tim Cook)近期卸任,是因为库克觉得时机已经成熟了。谈及折叠手机,古尔曼排斥道:“别跟我聊三折叠。”他吐槽:“它们做工松散,极易损坏。” 谈到苹果未来产品规划,古尔曼称苹果正在同步研发六大全新产品,包括AI智能耳机、智能眼镜、便携穿戴设备、智能显示屏、家用智能灯具、家用安防摄像头。他称,苹果至少十年内不会推出消费级人形机器人。 采访中,他提到了苹果最近面临人才流失风险的处境。他说道:“苹果的薪资待遇比不上OpenAI、Meta这类科技企业。最近这段时间,这些企业拆解苹果硬件工程团队,从各个部门疯狂招人,开出高额薪资待遇。” 谈及库克的接班人特纳斯,古尔曼评价道:“他拥有库克不具备的产品嗅觉,决策层面更擅长把控产品核心方向。”他猜测,特纳斯可能会获得一百万股股权激励。按美股最新收盘价计算,这一数字约为2.73亿美元(约合人民币18.66亿元)。 谈及苹果将iPhone的钛金属换回铝金属的决定,古尔曼称:“它(钛金属)在与热相关的性能方面真的很差。我们已经了解铝20年了,它是制造消费电子产品的一种极好的材料。所以他们换回了最初做法。” 他还在采访中透露,苹果的双折叠机型预计九月发布,这也是特纳斯上任后首款重磅全新产品。 采访的核心内容如下: 1、iPhone折叠机型:iPhone折叠机型与华为新款手机(Pura X)类似的是,它们的屏幕比例都和iPad相像,但也会存在黑边。 2、特纳斯薪资:古尔曼预计特纳斯将获得的薪酬或与库克最初上任时类似。 3、关于特纳斯与AI:特纳斯围绕全新AI平台重组了苹果硬件工程部门,该平台将用于优化产品研发流程与整体产品质量。 4、技术层面的潜在风险:苹果暂时不会受到安卓手机等产品威胁,隐藏威胁是OpenAI和Meta等公司的生态级创新突破。 5、iPhone换回铝金属:钛金属对于苹果只能是一个好的营销点,但散热性能方面比不了铝金属。 以下是对古尔曼采访编译: 一、2年前已敲定特纳斯继任苹果CEO,苹果6大新品正在研发 主持人1:你长期预判苹果人事变动,此次库克卸任、特纳斯接班,是否符合你的时间预期?官宣节点是否超出预料? 古尔曼:几周前我发布了特纳斯深度人物专访,一切人事变动早有铺垫。 苹果内部从去年年底开始加速推进权力交接,计划在品牌五十周年庆典后官宣人事调整。五十周年系列活动,既是该公司品牌里程碑纪念,也是库克任期的告别仪式。整体规划筹备长达数月,两年前就开始布局。 2024年初,库克正式敲定特纳斯为唯一继任人选,五年前将其纳入核心高管团队、任命硬件工程高级副总裁,就是定向培养的关键一步。 主持人1:你曝光了多份内部备忘录,能否聊聊苹果员工的内部反馈?管理层沟通铺垫充分,外界毫无意外,内部整体态度偏向乐观,但此前不少前员工负面评价特纳斯,是否影响内部士气? 部分媒体采访前员工,他们吐槽特纳斯决策温和、缺乏强硬魄力,不过这类评价并未影响他的最终任命。 古尔曼:他拥有库克不具备的产品嗅觉,决策层面更擅长把控产品核心方向。 库克任职期间,专注统筹整体运营,将产品研发全权下放给高管团队。而特纳斯上任后,会延续过往习惯,深度参与产品全流程研发设计,供应链、生产、采购、苹果售后等运营琐事,全部交由萨比赫・汗(Sabih Khan)、普丽娅·巴拉苏布拉马尼安(Priya Balasubramaniam)等运营负责人打理。 特纳斯会精准聚焦核心赛道,全身心投入硬件研发与产品创新。最直观的体现就是硬件部门的人事任命:他提拔汤姆・梅里亚布(Tom Marieb)接手硬件工程团队,此人并非激进创新者,却是硬件落地、品控管理领域的顶尖执行人才。 这份任命的核心用意十分明确:特纳斯将亲自担任苹果的产品愿景核心,亲自把控新品方向与设计理念。 主持人1:对比乔布斯的创新魄力、库克的稳健运营,特纳斯时代的苹果,会走向极致聚焦,还是重启多元创新、布局全新前沿项目? 古尔曼:特纳斯会延续常规硬件迭代节奏,稳定更新iPhone、iPad、Mac、手表、耳机等核心产品线。但相较于库克,他必须加速全新品类落地。 库克任期内,爆款新品仅有AirPods、Apple Watch,且核心研发团队源自乔布斯时代;2016年后,再无现象级全新爆款产品。Vision Pro战略遇冷、市场表现低迷,是库克时代的一大遗憾。 苹果已规划长期空间计算路线,未来将推出轻量化AR眼镜,对标Meta的无屏智能眼镜,预计2027年陆续落地。 目前六大全新产品品类正在同步研发:AI智能耳机、智能眼镜、便携穿戴设备、智能显示屏、家用智能灯具、家用安防摄像头。 二、人形机器人技术尚在探索,苹果可能遭受Meta、OpenAI等企业的智能硬件威胁 主持人1:外界热议苹果人形机器人布局,家用智能灯具是否为机器人赛道的前置探索?苹果是否会入局人形机器人? 古尔曼:苹果确实在探索人形机器人相关技术,但暂无全面落地计划,至少十年内不会推出消费级人形机器人。 该公司已组建大规模机器人研发团队,一年前特纳斯正式接管机器人硬件部门,整合原有AI团队资源。同时研发大型机械臂设备,未来将用于工厂自动化生产、线下门店智能仓储补货,落地周期约五年。 此外,小型家用移动机器人也在研发测试中,对标亚马逊Astro,但短期不会量产上市。 主持人2:聊聊供应链核心风险,供应链是库克时代的核心优势,而特纳斯缺乏相关经验,未来五年他的核心发力方向会避开供应链,聚焦产品创新吗? 古尔曼:没错,特纳斯不会深度介入供应链管理。今早全员内部会议上,他明确表态:每位管理者都要聚焦核心擅长领域。 库克深耕运营、财务、销售,全权放权产品;特纳斯的核心使命,是带领苹果重回硬件创新赛道。供应链、生产制造、渠道销售已有成熟顶尖团队操盘,无需新任CEO分心,产品迭代与技术突破,才是他的核心考核目标。 主持人1:安卓阵营折叠屏、隐私屏等特色功能持续迭代,差异化优势明显,是否会倒逼苹果加速创新、抢占市场? 古尔曼:现阶段安卓小众创新功能,尚未形成足够吸引力,无法撬动苹果核心用户换机。iPhone用户留存率极高,跨阵营换机数据持续净流入,即便苹果AI功能落后,依旧不影响产品市场竞争力。 真正的潜在风险,来自Meta、OpenAI等企业的生态级创新突破,一旦对手推出颠覆性智能硬件,才会冲击苹果生态壁垒。 特纳斯仅担任五年硬件高级副总裁,他虽高管任期不长,但全职深耕苹果二十五年,硬件研发底蕴深厚。特纳斯的贡献是让苹果硬件在速度和电池寿命方面表现更佳,质量更高。 他非常关注苹果产品的耐用性、寿命和可靠性。我认为,他们选择让来自英特尔的产品质量和可靠性专家梅里亚布,而不是一个产品设计师作为特纳斯的硬件工程继任者,这是有意义的。 三、iPhone换回铝材质,因为钛金属散热不行 主持人1:我拿到了新iPhone,它立刻就被磕碰了。当时为什么考虑把它设计成“一次性产品”?但是这对于散热更好,对于无线连接更好,尽管无法让颜色像以前那样牢固地附着在材料上。所以它会刮掉。这是苹果目前的取舍吗? 古尔曼:是的,每种材料都有权衡。像钛金属很轻,看起来很酷,可以进行喷砂处理,你知道,这看起来有趣,并给了苹果一个很好的营销点。比如,“哦,买个钛金属手机”——好像有人关心他们手机的材料似的。 但是,它在与散热相关的性能方面真的很差。我们已经了解铝20年了,它是制造消费电子产品的一种极好的材料。所以他们回归了基本做法。 去年年底他们确实在讨论细分产品线,一方面是超薄iPhone Air,另一方面是尽可能推进iPhone Pro,让它的性能更强。他们的目标就是尽可能多地将性能和功能塞进这些iPhone Pro中。而对于所有需要更少功能的人,他们可以选择更薄更轻的iPhone Air。 而且我认为大家会持续看到特纳斯推动这一方向,全力打造极致强悍、性能顶尖的MacBook Pro,同时引导其余用户选择MacBook Neo与MacBook Air。并且我认为,他在性能与产品品质方面留下的理念,是非常值得重视的一点。 四、特纳斯围绕AI重组了苹果硬件工程部门,面临OpenAI等高薪挖角难题 主持人1:特纳斯曾以任何形式公开发表过有关AI的言论吗? 古尔曼:他在今天早上与员工的全体会议上谈到了AI。他说:“我格外期待在当下接任这一职位,因为我可以明确告诉大家,苹果即将再度改变世界。” 他称:“苹果未来有着宏大的发展规划。毫不夸张地讲,这是我职业生涯里,在苹果打造产品与服务的最振奋人心的一段时期。AI,将创造近乎无限的潜力。我们会不断解锁全新的技术可能,为旗下产品和服务开辟全新机遇,我也十分期待这一切能为用户带来怎样的改变。” 本月早些时候,他围绕全新AI平台重组了苹果硬件工程部门,该平台将用于优化产品研发流程与整体产品质量。 主持人1:我看到了网友Bubble Boy的留言,想听听你的看法:随着特纳斯接手苹果,这家公司即将成为全球硬件工程师的朝圣之地。苹果本来难道不是吗?在硬件人才招聘方面,苹果还有向上突破的空间吗?你觉得这会给企业文化带来实质性的改变吗? 古尔曼:我的看法是,苹果的薪资待遇比不上OpenAI、Meta这类科技企业。最近这段时间,苹果正遭到OpenAI、Meta等一众公司的大肆挖角。这些企业拆分苹果硬件工程团队,从各个部门疯狂招人,开出高额薪资待遇。 这也是特纳斯过去一年多以来一直在着手解决的一大难题。 但不可否认,苹果本就是硬件领域的顶尖殿堂,是所有企业都想挖人的目标,也是从业者学习消费级硬件研发制造的标杆。所以说实话,我大体认同这位网友的观点。 五、折叠屏iPhone预计9月发布,屏幕比例类似华为新款手机 主持人1:好,我想了解一下,折叠屏iPhone的目前进展如何? 古尔曼:这款机型预计9月发布,也是特纳斯上任后首款重磅全新产品,非常值得期待。 我们之前聊过这个话题,我早就用腻了传统直板手机。这种同质化的外观设计,已经持续了二十年。我想要折叠屏、更大尺寸的屏幕。 主持人2:确实很让人期待。(主持人1)想要报纸大小的手机。 主持人1:我在中国见过那些,那是三折叠对吧。 古尔曼:但苹果这款是双折叠设计,别跟我聊三折叠。 主持人2:那你说说三折叠差在哪?看着明明很不错。 古尔曼:它们做工松散,极易损坏。 好吧,当他们以苹果的品控标准,做三折叠产品的时候,那就太好了。但现在市面上的折叠手机,开合时能明显听到屏幕嘎吱作响,中间还有一道明显折痕,开合手感生硬,拇指很难发力打开。 我希望苹果能彻底解决这些问题。花两千美元买一台手机,我完全不能接受开合异响,不能有类似踩在木地板上的杂音。我想要开合顺滑、反应迅速、手感轻盈,而不是像搬重物一样笨重。 主持人2:不过折叠屏的观影体验依旧会有局限,当下主流视频分为9:16竖屏与16:9宽屏。折叠屏展开后多为方形屏幕,并不适配常规观影场景。 古尔曼:不,苹果的观影体验不一样,苹果的手机就像新款华为手机(Pura X)一样,屏幕比例与iPad类似。 主持人1:即便如此,播放影片时还是会存在黑边。 古尔曼:确实,黑边问题无法避免。不管是横屏竖屏切换、观看院线电影,还是刷社交软件,都没法做到全屏显示,都会出现黑边。 主持人1:长期以来,影视内容制作都以超宽画幅为主。不管是昆汀式宽屏电影,还是短视频竖屏内容,在折叠屏上播放大多都会出现两侧黑边。但在办公文档、电视投屏这类场景中——(被打断) 古尔曼:折叠屏的显示效果会十分棒。 六、预计特纳斯将获100万股股权激励,库克卸任因为时机成熟 主持人2:你觉得特纳斯全新的薪酬福利方案会是什么标准? 古尔曼:当年因为库克的薪资问题,网友曾多次计划前往库比蒂诺总部抗议,要求削减他的薪酬。 我只是单纯猜测,他大概率会获得一百万股股权激励,十年分期授予,待遇规格很高。 我这么判断是有依据的,当年苹果任命库克为CEO时,给出的就是十年分期授予100万股股票的方案。所以我推测标准会保持一致,当然这只是猜测,没有实锤。 库克早年年薪一度达到一亿美元,引发全网哗然,之后他被迫降薪至四千万美元左右。舆论风波平息后,薪资又回调到七八千万美元每年。 主持人2:我们当初一直理性看待库克的薪酬体系。那几年我睡得很安稳。 古尔曼:我猜大概有100万股吧。或许会是50万股,我不知道,但我知道他们给了库克一百万股。你们现在就这么看好特纳斯了? 主持人1:没错,我们同时看好库克与特纳斯两位领导者。 古尔曼:那现在你们两个都得到了。 主持人1:为什么苹果CEO的退休年龄定在65岁?巴菲特年逾九旬,依旧能执掌万亿规模企业。CEO 这份工作,难道体力消耗更大?需要频繁出差?还是常年在华盛顿应酬奔波所致?如果身体条件允许,为何不能再多任职十年? 古尔曼:我不认为离职和社交应酬有关系。为什么他不再待10年?他需要给新任接班人一些时间适应。 库克为什么说要辞职?他说他辞职是因为时机成熟了,而特纳斯已经准备好了。苹果公司的财务状况处于非常有利的位置,苹果的发展规划清晰完善。 至于主动卸任的深层原因,可以去看我往期的深度分析文章。
镜识科技Bolt人形机器人奔跑速度提升至11米/秒
快科技4月25日消息,杭州镜识科技MirrorMe发布最新视频,其全尺寸人形机器人Bolt在室内环境中成功跑出11米/秒(约39.6公里/小时)的惊人速度,再次刷新全球人形机器人速度纪录。 Bolt命名灵感源自牙买加短跑传奇“飞人”博尔特 (Usain Bolt),而博尔特的百米世界纪录是9.58秒(约10.44米/秒),Bolt机器人已超越这一人类极限。 其采用全尺寸人体工学设计,身高175-177厘米,体重75公斤,与普通成年男性体型相近,外观线条流畅,无外露元器件,兼具美感与实用性,脚掌设计有可弯折自由度,能有效缓解高速奔跑时的地面冲击。 采用独创垂直电机轴设计,将电机轴与关节轴垂直布置,通过90度换向结构传动,充分利用腿部狭长空间,把电机隐藏于腿部内部,减少空气阻力同时提升关节响应速度。 配备新型高扭矩密度电机,在毫米级空间内实现高密度动力输出,搭配高强度合金+碳纤维轻量化材料,在75公斤体重限制下实现强劲动力与高效能耗平衡。 全新毫秒级平衡运动控制算法实现实时姿态调整,确保高速运动中稳定,使其能以9.5米/秒的速度持续奔跑超1分钟,远超人类顶尖运动员耐力极限。 除室内11米/秒的峰值速度外,Bolt在室外百米测试中也已达到10米/秒的稳定速度,此前行业领军企业波士顿动力等的人形机器人速度仅停留在3.3-4.0米/秒区间,Bolt的突破几乎将基准提升3倍。
DeepSeek V4一发布,黄仁勋的预言成真了
"一旦DeepSeek率先在华为平台上发布,对美国而言将是灾难性的结果"。 这里的"我国"指美国 这不是托尼说的,而是英伟达黄仁勋在某个播客上的原话。如今DeepSeek V4的出现,让老黄的预言成真了? 作为大家苦等了一年多的 DeepSeek 大版本迭代,只看性能差友们可能会略有失望。但 DeepSeek V4 是真便宜,价格对比国外模型直接腰斩属于是。 关于模型的具体内容,在白天的文章中已经提到,就不重复了。 但托尼觉得,随着这次发布,意义更重大的,是深度求索选择在华为昇腾平台上进行首发,结合下午的直播,这意味着 DeepSeek 完成了在国产硬件上的训练适配。 根据网友爆料,这次最先支持国产硬件训练的是 DeepSeek V4 Flash 的后训练过程,基于国产硬件的预训练也有望在今年下半年实现。 换句话说,从今天开始,大家嚷嚷了很久的 AI 全流程使用国产硬件,一下子就实现了! 大家可以把华为的昇腾平台理解为连 AI 芯片都是国产的 AI 计算平台。 假如一年以前有人跟我说,纯国产的AI平台能够支撑一款旗舰模型的全链路研发,托尼我也不敢相信。 但现在它就是成了,这对于国产AI的发展影响是很深远的。 之前老黄没少拿这个事儿游说美国政府 让自己卖货 ,按照老黄的意思,在 AI 军备竞赛中,从底层的电力,冷却,消防这些基础设施,到芯片、服务器等算力设施,再到软件生态和模型的架构演进,这些要素都缺一不可,样样都赢才能赢麻到最后。 AI 是一块“五层蛋糕” - NVIDIA 博客- 英伟达 而咱们的优势,无疑是祖国强大的基建能力,以及充足的人才储备。这些能让我们打造出很多高性价比的模型。 但不得不承认,我们的芯片制程离世界顶端,确实有些差距。好在 AI 需要的芯片,打的是规模战、集群战。所以工程师们想了些办法,来解决制程上的不足。 一来,虽然制程工艺有限制,但芯片可以在不计成本的情况下,通过暴力堆规模,来提升算力。而在配套的内存上,国产也有自研 HBM(高带宽内存),来保证带宽没有瓶颈。 二来,虽然单颗芯片性能有限,但架不住量大管饱啊,把大量的芯片利用起来,组合成一个"计算中心",塞进机柜里,其实就是这两年火热的超节点。 超节点的概念就是英伟达提出的,老黄也做了相应的布局,NVL72 系统把 72 个Blackwell GPU 集成到一个液冷机柜中,达成了约 180 PFLOPs 的 FP16 算力。 而国产芯片们想要堆出近似算力,就需要拿出更多的芯片。所以去年华为昇腾拿出了 384 超节点,通过 12 个机柜,每个机柜 32 张卡,硬是堆出 300 PFLOPs 算力,接近 NVL72 的两倍了。而今年差评更是在 MWC 现场看到了华为最新的 Atlas 950,也就是 8192 卡互联的超节点。 可最严重的一环,其实是生态。 托尼不得不承认,老黄是真有远见的。20年前,英伟达就开始为了 CUDA 生态埋伏笔,甚至牺牲掉了 GeForce 游戏显卡的利润,导致有一段时间差点在和 ATi/AMD 的竞争中死掉。 但英伟达成功熬到了黎明。所以差友们能看到,现在几乎所有 AI 相关的基础模型和优化都基于 CUDA 来运转、后起的 GPU、TPU 等 AI 计算生态都要向它低头。 甚至包括之前 DeepSeek 亲手打造的护城河之一:PTX 底层语言优化,也是为了把NVIDIA GPU 的性能榨干,让模型效率更高,从而让 DeepSeek 模型更有性价比。 也因此,对于国内来说,在制裁的大背景下,不论是华为昇腾的 CANN,还是摩尔线程的 MUSA,目前还要做对 CUDA 的兼容性支持,来让开发者能更快适应自家芯片。 但咱们也不能一直活在别人屋檐下。构建属于自己的软件生态,迫在眉睫。所以最近几年托尼也开始看到像 TileLang 这类由中国主导的生态项目,尝试在不同的方向构建出属于自己的护城河。 就是这些项目对于 CUDA 生态来说,并没有什么伤筋动骨的攻击性。 直到这次的 DeepSeek V4 更进一步,直接拒绝了英伟达和AMD的提前适配,而是选择华为昇腾和国产 CANN 软件生态。 也就是说,这次DeepSeek想要表达的其实是:不用美国的芯片和技术,我们自己也能做出足够先进的大模型。 托尼不得不感慨深度求索的这波操作:一方面是真的争气,另一方面,其实也是在把 DeepSeek 变成一个标杆,向其他国产大模型喊话:全国产链路已经跑通了,你们都可以来试试。 除此之外呢?还有什么理由让国产模型拥抱国产 AI 硬件生态吗? 最近一个月大家应该有感知,大模型的能力越来越强,强到已经不只是能对话的程度了。 前段时间 Anthropic 发布的 Mythos 模型,就号称"强到不敢直接发布",而是首先交给苹果、英伟达、微软等巨头,用来检测安全漏洞,加强网络防御。 也就是说,AI 已经不仅仅是一个对话窗口,一个效率工具,一个智能助手。未来甚至现在的模型,已经进化到可以在网络安全层面进行攻防了。这意味着 AI 已经从普通人使用的工具,成长为国家之间攻防的矛与盾。 不论如何,从硬件到软件,从模型到生态,全链路国产化,是必须要做的。这样才能真正不被英伟达等国外公司卡脖子。 当英伟达的GPU不再是唯一选择,当CUDA 护城河不再牢固,当咱们的AI人才越来越多,生态越来越繁荣,产业界的底气自然也会越来越足。 回头看DeepSeek V4发布通告的结束语:不诱于誉,不恐于诽,率道而行,端然正己,这不仅是对国内AI公司应当脚踏实地的宣言,更是对国产AI硬件生态,这么多年一步一步走过来的肯定。 老黄的预言,或许已经成为现实。
四面楚歌!OpenAI的至暗时刻可能才刚开始
奥特曼与AI在美国的公共形象,正从日本动漫中那个拯救世界的咸蛋超人奥特曼,逐渐变成了同一动漫中的大反派:龙虾人。 撰文丨张明扬 很少有人想到,2022年底的“ChatGPT时刻”刚刚过去了三年多,曾经风光无限的OpenAI便已左支右绌,进退维谷。 你甚至不敢说这是至暗时刻,因为谷底可能还没到来。 01 最近,围绕OpenAI的负面新闻多得令人顾此失彼。 4月18日,OpenAI爆发史上最严重人事地震,三大核心高管(首席产品官Kevin Weil、Sora之父Bill Peebles、企业应用CTO Srinivas Narayanan)同一天官宣离职。 高管离职潮的背后,是OpenAI正在进行的业务全面收缩。 3月底,OpenAI宣布关停视频生成模型Sora——这个曾经让整个好莱坞为之战栗的产品;4月中旬,“OpenAI for Science”项目解散,1月底刚刚上线的免费AI原生科研协作空间Prism不再作为独立应用运营。 图/图虫创意 与此同时,OpenAI与其创始人萨姆.奥特曼还官司缠身。 一场官司正诉诸公堂。马斯克公开指控OpenAI背离了成立伊始非营利性质的承诺,骗取其当年3800万美元原始捐赠,不仅要求OpenAI与微软支付高达千亿美元的天价赔款,更要求即刻解除奥特曼在 OpenAI的一切职务。 还有一起诉讼隐而未发。前一段亚马逊宣布战略入股OpenAI,并达成云服务采购协议,微软认定OpenAI违背了双方此前订立的独家云合作协议,正密筹酝酿、伺机发难。 从万众追捧到四面楚歌,OpenAI只用了三年多。很多人问,OpenAI究竟怎么了,最近不是还刚刚传出将于年内上市吗? 02 先谈谈舆情。 4月10日凌晨,AI界出了一个耸人听闻的大新闻:有人向萨姆·奥特曼的旧金山豪宅投掷了燃烧弹,引发火灾。 奥特曼在第一时间作出了回应: 我对那些反技术的情绪感同身受,显然技术并不总是对每个人都有利。 很显然,奥特曼对美国社会当下的反AI情绪是心知肚明的,他除了笼统的说一句“我相信技术进步能为你我的家人创造一个无比美好的未来”,也不敢直接挑战公众情绪。 因为他知道,电价上涨与裁员潮这两口大锅,辩无可辩。 尤其是裁员,令美国人对AI的态度正急剧转向负面。 3月底,美国公布了一份民调,70%的美国人认为AI的发展将减少就业机会;55%的美国人认为AI在日常生活中的弊端将超过益处,比去年4月激增了11个百分点。 图/图虫创意 尽管OpenAI目前尚未大规模裁员,但美国科技大厂从来都不缺此类新闻。 近日,Meta宣布计划于5月20日实施今年首轮大规模裁员,预计裁减约8000名员工,占其全球员工总数的10%;据说这只是第一阶段,公司预计在2026年下半年继续推进后续裁员,可能裁减至少20%员工,具体细节将依据“人工智能能力的发展”调整。 3月底,甲骨文也宣布裁掉了3万人,据说这是在过去一年间,科技行业单次裁员规模最大的一次。而理由呢,还是AI,为了给all in AI腾出现金流。 可以说,奥特曼与AI在美国的公共形象,正从日本动漫中那个拯救世界的咸蛋超人奥特曼,逐渐变成了同一动漫中的大反派:龙虾人。 尽管这一波反AI舆情潮并不是单单朝着OpenAI去的,但谁让你成名最早、最有名呢,所以也就成了众矢之的。更何况,OpenAI还有着独属于自己的“舆情”。 2月底,就在Anthropic拒绝美国国防部合同要求的几小时后,OpenAI宣布与五角大楼达成协议,此举招致了民间大量对OpenAI的恶评,大概就是“见利忘义”的意思。 有人说,舆情虽然来势汹汹,但与OpenAI当下的窘境恐怕并没有直接关系。 当然有。举一个例子,OpenAI雄心勃勃的“星际之门”数据中心扩张计划,正在新墨西哥州、密歇根州、威斯康星州等全美各地遭到抵制与诉讼,你说有影响吗? 03 当然,OpenAI与奥特曼目前最直接的挑战是:缺钱。 以上说的关停Sora搞战略收缩,乃至冒着违约风险与亚马逊达成战略入股协议,背后的原因其实都因为缺钱。人穷志短,事急从权,也就做不到事事体面了。 3月最后一天,OpenAI刚刚宣布完成了一轮规模达1220亿美元的融资,预计最早将于今年四季度上市,这大概率是上市前的最后一次融资了。 这笔钱当然看上去很大,但这里要补充一个背景:OpenAI预计2026年亏损约140亿美元,最早要到2030年才能实现现金流转正。 OpenAI前两年在巅峰时刻时铺的摊子太大了,资本支出计划也太激进了,什么业务都想碰, “星际之门”据说总预算最高攀升到1.4万亿美元。可以说,即使人类商业史上,这也是极其罕见的花钱强度与速度。 在这里,我们可以稍稍回忆一下,OpenAI已经多久没有因为ChatGPT的升级(不过,OpenAI刚刚发布了号称最强模型GPT-5.5),或是又实现了什么逆天的新功能而出圈了,最劲爆的新闻不是丑闻,就是又花了多少钱,又准备融多烧钱。 这第一个号称要改变人类的科技公司,真的正常吗? 图/图虫创意 当然,这里也要特别致敬奥特曼,他真是太难了。 看到奥特曼的窘境,谷歌DeepMind的掌舵人哈萨比斯想必很庆幸自己当初的明智抉择。早在2014年,哈萨比斯就将DeepMind卖身给了谷歌,哈萨比斯当时说:他已经厌倦了四处奔波,试图向那些不懂的有钱人证明有史以来最伟大事业的合理性。 而Gemini现在的后发制人,一个重要原因就是哈萨比斯背后有谷歌的生态体系,有谷歌几乎用之不竭的资金和算力。 哈萨比斯厌倦的事情,就是奥特曼正在干的事情。 目前来看,只有如期上市成功,奥特曼和OpenAI才能缓过这口气,在相当一段长的时间里不必再担心资金断供。 04 不过,OpenAI当下最核心的危机还是:Anthropic几乎不可阻挡的赶超。 4月中旬,在旧金山举行的HumanX大会上,很多参会者惊讶的发现,人人都在谈论Anthropic和旗下的大模型Claude,而OpenAI和ChatGPT则被视作已步入下行线。 美国AI三巨头中,OpenAI原本是遥遥领先,但先是去年谷歌Gemini完成了一次史诗式的大逆转,声势直逼OpenAI;最近一个更爆炸性的新闻是,Anthropic旗下的Claude正在更全面的超越OpenAI。 这还不单是技术上的所谓超越,毕竟,三巨头这一多年来不断地互相声称互相超越,很多时候只是不同的口径而已。更有说服力的是技术以外的数据。 其一是营收。就在4月初,Anthropic宣布年化收入突破300亿美元,超过了OpenAI的250亿美元;要知道,2025年底时,这个数字还只是90亿美元;而一年多前,Anthropic的年化收入更是只有10亿美元。 今年2月,Anthropic曾披露有超过500家企业客户的年化支出均超过100万美元;而如今,数字已超过1000家,在不到两个月的时间里实现了翻倍。 图/图虫创意 当然,按照OpenAI的说法,双方在计算营收时采取的口径不一样,如果采取相同的统计口径,OpenAI仍然是领先者。 但有一点是肯定的,Anthropic目前这个营收增速是远高于OpenAI的。 其二,市场估值。根据最新报道,Anthropic目前在私募二级市场的估值已突破10000亿美元,一举超过OpenAI(目前估值在8800亿美元左右)。 更惊人的是,今年2月,Anthropic的估值还“只有”3800亿美元。 据彭博社报道,Anthropic的商业化速度远超市场预期,尤其在企业客户端的渗透率快速提升,这也是投资者愿意给予更高估值的主要原因。有一个数据是,OpenAI在企业AI支出中的份额从50%降至27%,而Anthropic升至40%。 我们再稍稍回忆一下,今年以来,资本市场上关于AI的大部分舆情旋风,从“AI杀死软件”,到“AI颠覆一切”,其主角几乎都是Anthropic。 这两天还有新闻说,还不单是OpenAI,谷歌也被Anthropic逼急了。谷歌内部已经悄悄集结了一支由研究人员和工程师组成的“攻坚队”,由联合创始人谢尔盖·布林亲自带队,追赶被Anthropic拉开的编程能力差距。 一个更让OpenAI寝食难安的消息是,Anthropic可能将在今年10月上市,谁能够阻挡一个不缺钱的Anthropic。 OpenAI与Anthropic之争,胜败犹未可知,但我们知道的是,赢家一定是AI。 *题图来源于图虫创意
GPT-5.5实测:更聪明,也更爱“说谎”
文 | AIX财经(AIXcaijing)作者| 王璐,编辑| 魏佳 4月23日,OpenAI发布新一代旗舰模型GPT-5.5,并在其官网写道,是其迄今为止最智能、最直观易用的模型,也是在计算机上完成工作的新方式的下一步。 这一发布迅速引发行业关注,不仅因为它号称在智能体任务上实现突破,更因其在多项基准测试中展现出的“统治力”。根据第三方评测机构Artificial Analysis公布的综合智能指数榜单,OpenAI凭借GPT-5.5系列在前六名中独占四席,该机构认为,“GPT-5.5让OpenAI重回AI领域的第一位,打破了与Anthropic和谷歌的三方平局。” 但与高性能一同被曝光的,还有高幻觉率。在Artificial Analysis的私有基准测试AA-Omniscience中,GPT-5.5的幻觉率高达86%,远高于Claude Opus 4.7的36%。 这意味着,当这个目前“最聪明”的AI大脑面对不确定或未知的问题时,选择“坦言不知”的概率极低,反而更倾向于“自信地虚构”一个答案。而这种高幻觉率一旦放在需要高可靠性的工作场景中,很可能导致分析偏差、决策失误甚至财务损失。 最强的AI也是最危险的“说谎者”?面对高幻觉率,GPT-5.5究竟能否在实际应用中可靠地完成复杂的知识任务?为了回答这些关键问题,我们对GPT-5.5进行了实测,从处理家庭账本到编写实时对战游戏,测试其应对长上下文、复杂逻辑的知识工作与编程实战能力。 此次测试不仅关乎一个模型的性能,更关乎AI技术进入深水区后,我们如何在拥抱其强大能力的同时,应对其潜在风险。 01. 知识能力:它真的像职场人一样会干活 根据官方发布的基准测试结果,GPT-5.5在几乎所有核心指标上都超越了前代GPT-5.4,在知识工作领域表现尤为突出。 在一项覆盖44个职业的GDPval测试中,GPT-5.5取得了84.9%的得分,不仅超过了83.0%的真实职场人员水平,也高于Claude Opus 4.7的80.3%和Gemini 3.1 Pro的67.3%。该测试模拟了金融分析师、市场经理、软件工程师等多种白领职业的日常工作,要求模型完成信息整合、分析推理、决策建议与报告生成等综合性任务。 此外,GPT-5.5在其他多个实用场景的测试中也表现不错。在模拟复杂客服对话的测试中,无需特别指导就能达到98.0%的准确率;在让AI像真人一样操作电脑完成任务的测试中,得分78.7%;在需要结合图像、文字理解并调用工具解决问题的测试中,分别拿到83.2%和75.3%的分数。这些成绩说明,GPT-5.5正在逐步打通“看、说、做”等一系列能力。 OpenAI还用内部的实际案例证明了它的生产力价值。其财务团队用它审核了24771份K-1税表、总计71637页文件,并称这套流程比上一年提前了两周完成。这说明GPT-5.5是能够直接融入工作流程、切实提升效率的生产力工具。 这些能力在真实生活中用起来怎么样?我们设计了一个贴近家庭的测试来验证。 我们给GPT-5.5多条格式凌乱的单月开支数据,让其扮演家庭数据分析师,完成整理数据、计算总支出、分析各支付方式占比、分类统计开销等任务,并最终生成一份给家人看的建议报告。 这个测试场景设计得虽然简单,却很能看出AI是否真的“好用”。因为家庭记账是很多人的日常,但记录常常是随手写、格式乱,“乱七八糟”的记账数据要求AI不能只会处理整齐的表格,还得能“看懂”手写式的记录、理解每笔钱是什么意思,并把相似项目归到一起。 而算总账、分析钱花在哪儿、给出节省建议,其实对应着一套完整的思考过程,GPT-5.5需要先把信息理清楚,再从里面看出门道、提出可行的办法,最终让它“写报告”,则是要求它会用人能听懂、能接受的方式来汇报工作。 测试结果显示,它准确合并了“外卖-午餐”和“外卖-晚餐”,而且主动提示“支付宝自动扣”应统一计入“支付宝”统计,展现出了理解混乱账目和用户真实意图的能力。 GPT-5.5自主梳理表格并给出分析 在分析中,它通过计算占比,指出“网购”(衣物、书籍)类目支出较高,且多为非急需品,因此建议为这类消费设置预算,给出的建议具体可行。最后生成的报告也充满人情味,那句“稍微管住网购的小冲动,咱们家的开支就能更轻松一些”,符合“给家人看”的沟通要求,语气亲切,建议接地气。 这个简单的测试,相当于在生活场景中还原了上述GDPval测试所考察的核心能力,目前的结果也说明它的专业能力能用到实际生活中。 02. 编程能力:从初级到复杂,它没添乱 除了在日常知识任务中表现可靠,在编程这类对精准性要求更高的“硬功夫”上,GPT-5.5同样展现了不错的进步。 在一项考验“智能体”的基准测试(Terminal-Bench 2.0)中,它拿到了82.7%的高分。这个测试模拟了在命令行里执行一连串复杂操作,就像让AI自己完成一个多步骤的运维任务。它的成绩不仅比自家上一代(GPT-5.4的75.1%)高,也明显超过了竞争对手Claude Opus 4.7(69.4%)。这说明它在需要记住步骤、自己调试、坚持完成长时间任务时,表现更好。 其次,在处理超长内容方面也有进步。在一项针对50万到100万字符超长文本的检索测试中,它的得分达到74.0%,是上一代(36.6%)的两倍还多。这意味着让它分析一本厚书、浏览庞大的代码仓库时,它更不容易“看漏”或“记混”,找信息更准、思路也更连贯。 而且多项测试结果显示,在执行相同的编程任务时,GPT-5.5消耗的token数量显著少于GPT-5.4。就连代码编辑器Cursor的联合创始人Michael Truell也评价说,它比上一代更聪明、更有韧性,调用工具更可靠,面对复杂长期任务时能坚持更久。 简单来说,在编程这类复杂操作场景下,上述数据说明,GPT-5.5不仅更强,而且更稳、更省资源,适合处理那些步骤多、耗时长的实际开发任务。 为了验证它真实的编程能力,我们用一个具体的开发任务进行了测试,从零开始构建并逐步升级一款连连看游戏,并硬性规定其必须使用给到的12种不同的emoji表情。 首先,我们让GPT-5.5生成一个完整可运行的连连看游戏。 这需要它理解开发者的文字需求、设计界面、管理游戏状态,并自主实现核心的路径搜索算法。结果它在几分钟之内便顺利完成了。 GPT-5.5生成的连连看小游戏 接着,我们提高难度,要求它在游戏中加入一个“重绘”道具。 这个道具的功能是:玩家使用时,能消耗“连击”能量,把棋盘上与最后一次消除相同类型的图标全部随机刷新一次。 要实现这一点,GPT-5.5必须做两件事,一是修改游戏背后的数据规则来支持这个新功能;二是确保刷新后的棋盘布局仍然是“有解”的,不会让玩家卡关。最终,GPT-5.5成功写好了这部分代码。 之后,我们继续让其为游戏加入完整的用户系统,包括登录、积分记录和排行榜展示。 这一步主要考验的是,GPT-5.5能否将新功能平滑地接入现有框架,同时保持游戏原有的核心玩法和逻辑不被破坏。 它再一次顺利完成了任务,并且在代码迭代过程中表现得相当克制,没有进行过度重构,也没有引入不必要的变化。 GPT-5.5执行对游戏细节的调整指令 最后,我们将难度推至更高阶的实时对战模式,让两名玩家能在不同浏览器中实时竞争消除。 这其中涉及棋盘状态同步、操作冲突裁决和网络延迟处理等一系列典型的多人在线难题。面对这样一个集成度高、实时性强的复杂挑战,GPT-5.5依然做到了准确交付。 这个从简到繁的测试表明,GPT-5.5在真实编程任务中,既能处理复杂逻辑与架构设计,也能精准响应开发者需求,且不随意重构或引入其他代码,甚至当我们要求回退到上一版本时,它也能稳定恢复到之前的状态。 03. 高幻觉率:能用,但不敢放手 尽管在实测中表现惊艳,但结合公开数据来看,GPT-5.5依然没有超过市场太大预期,而且存在不可忽视的风险。 来看一组对比数据。 在Artificial Analysis的私有基准测试AA-Omniscience中,GPT-5.5的幻觉率高达86%,而Claude Opus 4.7仅为36%。这意味着在该测试所设定的、专门探测模型知识边界的场景下,当GPT-5.5面对不确定的答案时,其“坦言不知”的概率远低于对手,更倾向于生成一个可能错误的回答。 需要注意的是,这86%并不意味着模型在大多数日常问答中都会产生幻觉,而是其在触及知识盲区时的特定行为倾向。一位从业者解释,这可能是因为GPT-5.5的事实知识覆盖面更强,但不确定性也更偏激进,对于不确定的问题会猜答案。但在将其用于需要高可靠性的任务时,这一指标仍需引起高度警惕。 当GPT-5.5被部署到“自主工作”场景中时,这种高幻觉倾向可能会引发风险。 比如在数据分析与报告生成任务中,它可能自信地引用不存在的数据、编造统计趋势,或基于错误事实提出决策建议,导致用户做出偏离实际的商业判断。而在编程与调试环节,它提供的代码方案也许看起来合理,却可能无法运行,甚至暗藏安全漏洞,大幅增加后期排查与修复的成本。 而且,这类幻觉往往以高度自信、逻辑自洽的形式呈现。对于缺乏相关专业背景的用户而言,这种“确定性”输出极具欺骗性,需要提高警惕。 除了技术层面的隐忧,OpenAI此次的商业策略也显露出明确的意图:先用生态锁定用户,再用涨价收割市场。 一方面,GPT-5.5首发时并未同步开放API,仅限自家ChatGPT和Codex使用,初步将用户锁定在其应用生态内。另一方面,GPT-5.5的定价相比上一代有了明显上涨。根据官方公布的数据,GPT-5.5每处理100万tokens,输入收费5美元,输出收费30美元。而上一代的GPT-5.4,输入和输出价格分别为2.5美元和15美元,这意味着新一代的价格直接翻了一倍。 如果与当前的主要竞争对手对比,Anthropic最强的模型Opus 4.7定价为每百万tokens输入5美元、输出25美元。可以看出,GPT-5.5在输入价格上与对手持平,但在输出价格上则高出20%。 尽管OpenAI解释称,token使用效率的提升可对冲价格上涨,使用户实际成本无明显增加,但具体性价比仍需业界进一步验证。 对于这一模型,资深Agent从业者赵江杰评价道,这次GPT-5.5的发布并未形成断档领先,不如对社区热传的“Spud”模型预期的大幅提升期望那么大,但在agentic和coding能力上仍然继续保持头部顶尖位置,agentic能力提升的同时也在推动基模厂商提升模型迭代效率,OpenAI的下一代突破模型(GPT-6)很可能也在路上了。 总之,对普通用户而言,GPT-5.5或许值得尝鲜,但不应视其为绝对可靠的工具,对企业用户来说,在将其接入核心工作流前,则必须慎重,一旦出现那86%的“自信错误”,该由谁来兜底?
早报|小米YU7 GT定档五月底/罗福莉:中美顶尖模型代差仅两三个月/餐馆反向抹零被立案调查
DeepSeek V4 开源,华为昇腾首发,性能比肩顶级闭源 Google 拟向 Anthropic 投资最高 400 亿美元 Intel 发布一季度财报:营收增长 7%,AI 需求拉动 CPU 与封装业务 Apple Music 副总裁:AI 音乐投稿泛滥,但几乎没人听 阿联酋要让 AI Agent 接管一半政府工作 小米罗福莉:AGI 两年内实现,中美顶尖模型代差仅两三个月 小米 YU7 GT 定档五月底:续航 705 km,新增「车厘子红」配色 宝马 16 款新车亮相北京车展,新世代 i3 续航破 1000 公里 腾势 Z 电动超跑亮相北京车展 全新理想 L9 Livis 亮相北京车展,5 月 15 日上市 45.68 万元起,蔚来 ES8 玄金特别版亮相北京车展 乐道 L80 发布会定档 4 月 28 日 火山引擎发布新一代汽车 AI 解决方案 阶跃星辰发布语音新模型 StepAudio 2.5 ASR Keep 发布 9.0 版本,自研运动大模型 Keepace.ai 同步亮相 美团外卖「防疲劳」机制实施满一年:超 99% 骑手未触发强制下线 餐馆「反向抹零」被立案调查 耐克将裁员 1400 人 《绵羊侦探团》定档 5 月 16 日 周末也值得一看的新闻 DeepSeek V4 开源,华为昇腾首发,性能比肩顶级闭源 昨天,DeepSeek 正式发布并开源了 V4 系列模型预览版,推出 DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 两款产品,双双标配百万 token 上下文,API 服务同步上线。 V4-Pro 参数量达 1.6T(49B 激活参数),V4-Flash 参数量为 284B(13B 激活参数)。两款模型均以 AI Agent 能力为核心升级方向,已针对 Claude Code、OpenCode、CodeBuddy 等主流产品完成专项适配。V4-Pro-Max 的性能表现尤为突出: LiveCodeBench Pass@1 达 93.5,Codeforces Rating 达 3206,均为参测模型最高,目前在 Codeforces 人类选手排行榜位列第 23 名; SWE Verified Resolved 达 80.6,与 Claude Opus 4.6 Max 的 80.8 基本持平; IMOAnswerBench Pass@1 为 89.8,仅次于 GPT-5.4 的 91.4; BrowseComp Pass@1 达 83.4,MCPAtlas Public Pass@1 达 73.6,处于参测模型前列。 DeepSeek 官方表示,V4-Pro-Max 已「稳坐最佳开源模型宝座」,在编程基准上达到顶级水平,并在推理与 Agentic 任务上显著缩小与领先闭源模型的差距;V4-Flash-Max 则在给予充足思考预算时,可实现与 Pro 版本相当的推理表现。 值得注意的是,英伟达不再是唯一选项。DeepSeek 将 V4 的早期访问权限独家开放给国产芯片厂商,华为昇腾成为首发平台 —— 这是顶级开源大模型首次完整跑通国产算力,也是国产模型在「去英伟达化」上迈出的重要一步。 而就在上周,黄仁勋在播客访谈里说了一句话:「如果当初 DeepSeek 先在华为平台上发布,那对我们来说非常可怕。」 发布当日,各大云服务厂商迅速跟进: PPIO 成为业内首批上线 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 的 AI 云平台,开发者注册后即可直接调用,无需自行部署; 华为云 MaaS 平台同步首发适配,已提供一键调用 DeepSeek-V4-Flash API 的 Tokens 服务; 中国联通的联通云与联通元景平台也在发布当天完成集成,并在 CodingPlan 订阅套餐中直接内置了 V4 模型; 天数智芯、寒武纪均完成了对两个版本的 Day 0 级适配,寒武纪的适配代码已开源至 GitHub 社区。 Google 拟向 Anthropic 投资最高 400 亿美元 据彭博社报道,Google 计划向 Anthropic 投资最高 400 亿美元。根据 Anthropic 方面的说法,Google 将以 3500 亿美元的估值立即注入 100 亿美元现金,若 Anthropic 达成特定业绩目标,另外 300 亿美元将随后跟进。 在算力层面,Google Cloud 将在未来五年内为 Anthropic 提供 5 吉瓦的算力资源,后续或有更多吉瓦的容量跟进。这是本月早些时候 Anthropic、Google 与博通三方协议的进一步扩展。 Intel 发布一季度财报:营收增长 7%,AI 需求拉动 CPU 与封装业务 昨日,Intel 发布 2026 财年第一季度财报。 第一季度营收 136 亿美元,同比增长 7%,连续六个季度实现高于预期的营收表现。按通用会计准则每股收益为 -0.73 美元,非通用会计准则每股收益为 0.29 美元,单季度经营现金流达 11 亿美元。 业务层面,Intel 推出基于 Intel 18A 制程的第三代酷睿 Ultra 系列处理器,首次将该制程引入主流市场,同步发布至强 600、酷睿 Ultra 200S Plus 及 200HX Plus 等多款新品。 英特尔与 Google 达成为期多年合作,将在 Google 工作负载优化实例中持续部署至强处理器,并共同开发定制 ASIC 基础设施处理器(IPU);至强 6 处理器同时确认进入英伟达 DGX Rubin NVL8 系统,担任主控 CPU。 代工业务方面,英特尔扩大了马来西亚槟城工厂封装测试产能,并回购爱尔兰 Fab 34 晶圆厂合资企业中 49% 的少数股权权益。 展望今年第二季度,英特尔预计营收为 138 亿至 148 亿美元,非通用会计准则每股收益预计为 0.20 美元。 Apple Music 副总裁:AI 音乐投稿泛滥,但几乎没人听 据 AppleInsider 报道,Apple Music 正面临 AI 生成音乐大量涌入的挑战,但听众对此并不买账。 Apple Music 副总裁 Oliver Schusser 在日前的采访中透露,目前提交至该平台的全部音乐中,超过三分之一属于「100% AI 生成」的内容,然而 AI 音乐在 Apple Music 上的实际播放占比却不到 0.5%。 AI 音乐在 Apple Music 上的收听率真的非常低,四舍五入不到 0.5%。 Schusser 透露,苹果已开发了一套内部检测系统,可精准识别提交内容的 AI 模型来源,同时要求唱片公司和分发商主动披露 AI 使用情况。在反欺诈方面,苹果的反欺诈处罚机制已使平台欺诈行为累计减少约 60%。 阿联酋要让 AI Agent 接管一半政府工作 昨天,阿联酋副总统兼总理、迪拜酋长穆罕默德 · 本 · 拉希德 X 上宣布,该国正式启动一项全新政府运作模式 —— 未来两年内,阿联酋 50% 的政府部门、服务和运营将全面由 Agentic AI 驱动。 穆罕默德强调「AI 不再是工具。」这种 AI 智能体将被定位为政府的「执行伙伴」,核心目标指向三个维度:提升公共服务质量、加速决策流程、全面提高行政效率。 为此,阿联酋政府制定了严格的时间表和可量化评估标准。两年窗口期内,政府绩效将按三项指标进行衡量 —— AI 采用速度、实施质量以及在重塑政府工作流程中对 AI 的运用熟练度。 穆罕默德表示,每位联邦雇员都将接受 AI 相关培训,阿联酋方面称此举意在构建「全球最强的 AI 驱动型政府能力」之一。 小米罗福莉:AGI 两年内实现,中美顶尖模型代差仅两三个月 近日,小米大模型团队负责人罗福莉在接受「语言即世界」访谈时,就当前大模型竞争格局、AI 智能体范式转变及 AGI 进程给出了一系列具体判断。 罗福莉预计,AGI 将在两年内实现。她估计当前进度已完成约 20%,今年有望推进至 60% 到 70%。 罗福莉表示,目前国内已有包括 Kimi、MiMo 在内的多家公司具备 1T 参数以上的基座模型,中美两国在预训练阶段的差距「基本上已经没有」。 她认为,国内团队在预训练结构上反而存在一定优势,只要对 Agent 范式的反应速度足够快,国内顶尖模型与 Claude Opus 4.6 等国际前沿模型之间的代差,实际上只有两三个月。 「接下来两三个月会非常精彩」,她说,这一窗口期将是对各家团队整体研究水平、技术敏捷度以及拥抱新范式能力的关键考验。 罗福莉同时指出,大模型竞争已从预训练主导的 Chat 时代,全面转向后训练主导的 Agent 时代。 1T 参数规模是当前实现接近顶尖 Agent 水平的「入场券」,而算力分配逻辑也随之逆转 —— 顶尖团队的预训练与后训练算力投入比例已从过去的 5:1,收窄至今年的 1:1。 小米 YU7 GT 定档五月底:续航 705 km,新增「车厘子红」配色 在昨日开幕的 2026 北京车展上,小米集团董事长兼 CEO 雷军正式宣布,小米 YU7 GT 将于今年 5 月底发布。 雷军将其定位为「适合长途旅行的高性能 SUV」,并提前披露了部分核心参数:最大马力 1003 PS,最高时速 300 km/h,CLTC 续航里程达 705 km,新增配色命名为「车厘子红」。 发布会上,雷军还公布了小米汽车的最新交付数据。截至 4 月 23 日,小米汽车 24 个月累计交付量已超过 65.5 万台;新一代小米 SU7 锁单数超过 6 万台,已交付超过 2.6 万台。 宝马 16 款新车亮相北京车展,新世代 i3 续航破 1000 公里 昨日,宝马集团在 2026 北京车展上携 BMW、MINI、BMW Motorrad 三大品牌共 16 款首发车型亮相,全新 BMW 7 系、新世代 BMW iX3 长轴距版、新世代 BMW i3 长轴距版三款车型首次面向公众展示。 全新 BMW 7 系:搭载 BMW 全景 iDrive 系统,提供超过 500 种外观涂装及 50 余项中国专属数字化功能;纯电动 BMW i7 搭载大圆柱电池,CLTC 续航近 800 公里,计划明年在中国上市; 新世代 BMW iX3 长轴距版:基于 NCAR 平台,搭载 800V 高压架构与第六代 BMW eDrive,轴距超 3 米,CLTC 续航突破 900 公里,今年第四季度正式上市; 新世代 BMW i3 长轴距版:同平台同架构,CLTC 续航超 1000 km。两款新世代车型均标配 BMW 驾控超级大脑(Heart of Joy)中央计算单元及全场景 L2 级领航驾驶辅助系统。 本土化方面,中国版新世代操作系统 X 有 70% 源代码由中国团队开发,系统集成阿里巴巴 + DeepSeek AI 引擎、高德沉浸式导航及华为鸿蒙生态(数字钥匙、HiCar、MyBMW App)。宝马还与 Momenta 合作,计划于明年底前在多款车型上推出中国专属 L2 级点到点领航驾驶辅助系统。 此外,全球限量 70 台的 BMW Speedtop 概念车迎来中国首展,BMW M3 40 周年限量版轿车与旅行车在华各限量 20 台。 MINI 带来全球首发的 MINI X VAGABUND 创意展车,BMW Motorrad 则携全新 R 1300 RT 与 R 12 G/S 亮相。今年宝马集团计划在中国推出约 20 款全新或改款车型,明年全球将有 40 款车型应用新世代设计与科技。 腾势 Z 电动超跑亮相北京车展 据 Auto 鹏友报道,昨日,腾势汽车「全球首款智能电动超跑」腾势 Z 在北京车展全球首秀。该车由比亚迪全球设计总监沃尔夫冈·艾格领衔打造,以「Pure Emotion」为设计理念,提供硬顶、敞篷和赛道三款版本。性能与配置方面: 超过 1000 匹马力,零百加速进入 2 秒以内; 搭载易三方整车智能控制平台,支持精准扭矩矢量控制; 「云辇-M」智能磁流变悬架,毫秒级阻尼调节; 中国首款全栈自研线控转向系统; 天神之眼高阶智驾系统。 全新理想 L9 Livis 亮相北京车展,5 月 15 日上市 全新理想 L9 Livis 昨天在北京车展正式亮相,定位为「具身智能旗舰 SUV」。官方确认将于 5 月 15 日上市并开启交付。 外观方面,新车首次以 UWB 雷达替代超声波雷达取消车身开孔,并采用短前悬、长后悬比例搭配 22 英寸轮毂,钻石棱线从 A 柱延伸至 D 柱,尾部为宽肩正梯形造型; 新车搭载 800V 主动悬架与全线控底盘(含线控转向、后轮转向、线控机械制动),单轮举升力标称超 10000 牛,支持悬架弹跳与主动抬升车轮两种脱困模式,官方称为全球首个应用于全尺寸 SUV 的同类方案; 车门采用半隐藏式机械结构,支持电动与手动开启,断电状态下可手动拉开,四门均配备电吸防夹条。 理想汽车还透露,全新 L9 Livis 将同步搭载新一代内饰、智能座舱、5C 增程系统以及马赫 100 芯片,完整规格将于 5 月 15 日发布时一并揭晓。 45.68 万元起,蔚来 ES8 玄金特别版亮相北京车展 蔚来昨天在北京车展正式发布全新 ES8 玄金特别版,售价 45.6 万元;以 BaaS 电池租用方式购买,售价降至 34.8 万元。 玄金特别版以 6 座签名版为配置基础,外观采用极夜黑车色,搭配专属黑铬外饰套件、全新 22 英寸锻造玄金星耀轮圈与曙光金卡钳,并标配行李架导轨。 内饰方面,该版本首发全新雅丹橙内饰主题,同时提供苏木红内饰主题供选择。全新 ES8 所有版型同步开放雅丹橙内饰主题选装,选装价格为 8000 元。 乐道 L80 发布会定档 4 月 28 日 昨天,蔚来创始人、董事长兼 CEO 李斌在蔚来新闻发布会上宣布,旗下品牌乐道的新车 L80 将于 4 月 28 日举办产品技术发布会,并同步开启预售,届时该车型也将在北京车展现场及全国门店同期展出。 李斌将乐道 L80 定位为「全球首款双舱超级大五座 SUV」,并称其为中国市场装载空间最大的大五座 SUV。官方表示,L80 将「全面刷新大五座 SUV 的出行体验」,并推动大五座 SUV 市场加快向纯电转变。 火山引擎发布新一代汽车 AI 解决方案 昨天,火山引擎在北京车展开幕首日发布了基于 Agentic AI 架构的新一代汽车 AI 解决方案,包含 AI 座舱套件方案与豆包座舱助手方案两大产品线。 AI 座舱套件方案支持车企按需灵活接入;豆包座舱助手方案为完整产品级交付,并与豆包 APP 互联互通,计划今年内量产上车。 新方案以单一 AI 大脑取代上一代「意图分域 + 多 Agent 协同」架构,融合对话推理、目标驱动、学习成长三大引擎,打通车控、智驾、导航、座舱等功能域。 发布会上,火山引擎总裁谭待还公布了最新数据:搭载豆包大模型的智能汽车已超 700 万辆,覆盖超 50 个品牌、145 个车型,搭载量稳居行业第一,日均完成超 3000 万次座舱交互。 车展期间,梅赛德斯-奔驰纯电 GLC、上汽奥迪 E7X、上汽大众 ID. ERA 9X、奇瑞星途 EX7、一汽红旗 HS6 PHEV、别克至境 E7、荣威「家越」等多款搭载豆包大模型的新车也将同步亮相。 阶跃星辰发布语音新模型 StepAudio 2.5 ASR 阶跃星辰昨日正式发布新一代自动语音识别模型 StepAudio 2.5 ASR,主打速度与精度兼得,并率先将 LLM 推理加速技术引入语音识别领域。 推理速度提升 400%、时延降低 60%、推理成本直降 80%; 推理峰值达 500 tokens/s,约 5 分钟音视频可极速完成转写; 复用 LLM 原生 32K 上下文窗口,单次支持最长 30 分钟完整音频转写,告别传统「切片-转写-拼接」方案的上下文断裂问题; 在 5 个权威中文及英文开源测试集上,字错误率与词错误率均优于同类模型,长音频场景下精度无明显衰减。 Keep 发布 9.0 版本,自研运动大模型 Keepace.ai 同步亮相 运动健身 App「Keep」正式发布 9.0 版本,并同步公布了其自研运动健康大模型 Keepace.ai,正式启动 AI 战略的产品化进程。 课程方面,平台海量精品课程向用户免费开放,内容品类持续扩充,并由专业团队负责审核; 工具方面,App 界面大幅精简,运动页内嵌 AI 语音陪跑功能,AI 教练「卡卡」作为常驻入口,支持用户通过拍照记录饮食与生理信息,并具备评估多项身体指标的能力; 数据分析方面,新版本打通运动、饮食与睡眠的多维数据,覆盖计划、执行与复盘的全周期,为用户提供专业洞察与长期纠偏建议。 Keepace.ai 的命名取自 Keep Pace(保持配速)与 Keep Ace(保持王牌)的双重含义。该模型融合了 Keep 平台十年积累的亿级运动数据资产,主要聚焦训练课程生成、运动知识问答与运动数据解读共三大核心场景。 区别于通用大模型,Keepace.ai 针对运动健康场景的精准度要求进行了专项优化,系统会深度结合用户伤病史,基于动作、个体状态执行动态风险排查,并综合体能水平、疲劳状态及器械条件输出颗粒度更细的定制建议。 Keep 表示,随着 Keepace.ai 的持续迭代,今年上半年将陆续落地更丰富的「AI 全家桶」产品,以深化 AI 驱动的运动健康生态体系。 美团外卖「防疲劳」机制实施满一年:超 99% 骑手未触发强制下线 据第一财经报道,美团于昨日公布了「防疲劳」机制实施一年以来的多项数据。 全国骑手每天平均跑单时间在 5~6 小时范围内,日均仅 0.54% 的骑手触发强制下线,超过 99% 的骑手跑单时长未达到 12 小时上限。 美团「防疲劳」机制于 2021 年开始试点,并于 2024 年末在全国正式实施「单日有单时长 8 小时提醒休息、12 小时强制下线」规则。 在订单淡季,被弹窗提醒和强制下线的骑手占比分别较旺季低 23% 和 57%; 从地理维度看,北京、上海、深圳等一二线城市的强制下线骑手占比居全国前列,显著高于全国平均水平。 在收入层面,美团此前披露,2025 年上半年全国高频骑手月均收入为 6949 至 10201 元,北上广深等高线城市的「乐跑」熟练骑手群体月收入可达 12826 元。 第一财经采访的北京骑手张强表示,其日均实际接单时长约 8 小时,月收入在 1 万元左右,整体未受「防疲劳」机制明显影响,并对该机制持支持态度。不过,也有骑手反映,部分同行因经济压力在被强制下线后转至其他平台继续接单。 美团表示,今年将在连续跑单 4 小时、连续多日跑单等关键节点为骑手推送休息强提醒,但会将最终选择权交给骑手。 餐馆「反向抹零」被立案调查 据央视新闻报道,近期,广东佛山顺德区一家餐饮店因「反向抹零」多收消费者 0.1 元,被当地市场监管部门正式立案调查。 消费者在该店就餐,应付金额 156.9 元,商家收银系统自动向上取整,实收 157 元。 在接到 12315 热线投诉后,龙江市场监督管理所随即现场核查并调取后台交易流水,确认商家计价逻辑违规,责令其整改系统设置,并依法立案查处。案件目前仍在进一步处理中。 「反向抹零」并非个案。山西省市场监督管理局价格监督检查处处长官廉指出,从消费维权数据来看,此类投诉已覆盖餐饮、商超、农贸市场等多个行业。 耐克将裁员 1400 人 据路透社、CNBC 报道,耐克(Nike)昨日宣布将裁减约 1400 个岗位,裁员规模占全球员工总数的不到 2%,主要集中在技术部门,波及北美、亚洲及欧洲地区。 此次裁员是耐克今年以来的第二轮大规模裁员。今年 1 月,耐克已以加速推进自动化为由,削减了 775 个职位,主要涉及美国境内的配送中心岗位。此前去年夏天,耐克亦完成了一轮波及不到 1% 企业员工的裁员调整。 耐克首席运营官 Venkatesh Alagirisamy 在内部备忘录中表示,此次裁员是耐克「Win Now」战略的组成部分,旨在整合供应链、重塑技术团队,并将技术运营集中于比弗顿总部与耐克印度技术中心两个核心中心。 这不是一个新方向,而是现有工作的下一阶段。 《绵羊侦探团》定档 5 月 16 日 昨天,动画电影《绵羊侦探团》宣布定档 5 月 16 日,并同步发布官方海报。 影片由《小黄人大眼萌》系列导演凯尔 · 巴尔达执导,讲述牧羊人乔治离奇死亡、留下 3000 万美元遗嘱后,一群热爱推理小说的绵羊侦探走出牧场、展开调查的故事。 是周末啊! One Fun Thing|雷军 2026 北京车展「串门」蔚小理,还送 T 恤 昨天,2026 北京车展开幕首日,小米集团 CEO 雷军上午完成小米汽车发布会后,下午开启「逛展模式」,先后现身理想、蔚来、小鹏等品牌展台。 在理想展台,雷军向理想 CEO 李想赠送了一件印有「听我讲完」字样的 T 恤。这四个字源自李想 2013 年参加真人秀时因情绪激动喊出的名场面,此后演变为网络热梗。 雷军现场调侃称,上次介绍理想 L6 时大家说李想「应付了半个小时」,这次「真的听他讲完了」。 在蔚来展台,雷军则向蔚来 CEO 李斌送上印有「一起加电」的 T 恤,并对蔚来的充电桩给予好评。李斌随后在微博发文致谢,称「这个 T 恤上的字,大家都非常熟悉」。 雷军上午发布会还透露,截至 4 月 23 日,小米汽车累计交付已超 65.5 万辆,并预告高性能版本 YU7 GT 将于 5 月底发布,最大马力 1003 匹,续航 705 公里,定位跑车级 SUV。 周末看什么|《迈克尔 · 杰克逊:巨星之路》正式上映 迈克尔 · 杰克逊官方授权传记音乐电影《迈克尔·杰克逊:巨星之路》昨日正式登陆全国院线。 主演贾法尔 · 杰克逊作为杰克逊家族成员,历经两年深耕舞步、声线与内心世界,以近乎「复刻」的表演诠释天王神韵。 影片精准还原多个标志性舞台时刻:摩城 25 周年首秀「月球漫步」、《Thriller》先锋僵尸群舞、1988 年温布利球场《Bad》巅峰演出,白袜黑皮鞋、水晶手套等经典造型悉数重现。 科尔曼·多明戈饰演严厉父亲乔 · 杰克逊,尼娅 · 朗诠释温柔母亲凯瑟琳,共同勾勒出天王背后的家庭羁绊与成长阵痛。 影片融合 30 首经典金曲,并获 IMAX 与杜比全景声加持。执行制片人莉迪亚 · 西尔弗曼表示,影片旨在呈现「活生生的迈克尔」,让观众看见天才背后的挣扎与初心。 买书不读指南|《燃烧的龙舌兰》 《燃烧的龙舌兰》是旅行作家班卓(本名刘华)的最新游记,记录了作者于 2010 年末独自前往墨西哥的旅行经历。 作者从恰帕斯州圣克里斯托瓦尔出发,途经玛雅村落、龙舌兰农场与嬉皮士聚会,一路走入陌生人的日常生活,与其劳作、交谈、相处。 旅途中,她与偶遇的同伴深入彩虹森林,徒步荒寂的深夜沼泽,品尝致幻的神圣蘑菇,并潜入海底与海龟、鹰鳐共游。「理解生命的渴望」是驱动这段旅途的核心动力。 它书写肤色、语言、阶层与性别所制造的隔阂,同时记录人如何跨越这些差异尝试彼此靠近,以观察者姿态深入异质文化,在追问与对话中呈现「众生相」,并将记忆、孤独、爱情、理想等命题编织进具体的行旅叙事之中。 游戏推荐|《失落星船:马拉松》 《失落星船:马拉松》由《光环》和《命运》的原班人马打造,支持 PS5、Xbox 和 PC 平台。游戏延续了原作《马拉松》系列的宇宙背景,以超人类主义与永生不死为主题,构建了一个诡异而独特的科幻世界观。 玩家扮演「疾行者」,在 UESC「马拉松」号飞船残骸与周边区域中执行搜刮、撤离任务,与 NPC 敌人及其他玩家小队展开高风险对抗。 游戏采用英雄射击与撤离射击相结合的设计,提供「刺客」「救援」「毁灭者」「侦查」等多种定位各异的疾行者角色,每名角色携带预设能力,可与队友形成战术配合。 核心玩法围绕搜刮、装备成长与角色技能树展开,玩家在每局对战中积累材料、完成任务、解锁升级,即便撤离失败也能保留部分成长进度。 IGN 评测人 Travis Northup 在文章中给出 9 分(奇佳)的成绩,高度肯定了本作对 Bungie 标志性射击手感的传承,以及其深度成长系统与终局内容的设计质量。
大众CEO谈第九代高尔夫:像“高4”那样漂亮,我们正在走正确的路
IT之家 4 月 25 日消息,当地时间 4 月 24 日,外媒 Motor1 公布了采访大众汽车品牌首席执行官托马斯 · 谢弗的内容。 谢弗谈到了即将问世的第九代高尔夫,他给出的判断是,新车“走在正确的轨道上”。“团队正在开发这款车。去年 11 月,我看到了第一辆全尺寸模型,当时我只想说:‘哇,太漂亮了。’那还不是最终车型,只是其中一个设计方案,是后续继续做决策时会参考的原型之一。但第一眼看上去,我觉得非常好。” 谢弗回忆道:“年底,我们开了一场高级管理层会议,相当于年终总结会,既回顾成绩,也展望下一步。当时我们把这款车摆到台上展示,所有人都被打动了。” 大众汽车品牌技术开发负责人凯 · 格吕尼茨也谈到了第九代高尔夫,新车最终设计已经基本定型。“它会让人想起第四代高尔夫,那一代车当时是一次很大的进步。但新车看起来很现代,也很耐看。我觉得你们会喜欢。从设计角度看,我们全新的纯电高尔夫已经完成了 96% 到 97%。最早我们做了比例模型,它很棒,谢弗和我都加入讨论,然后说:‘嘿,别改了。’” 第四代高尔夫 格吕尼茨还确认,新车上市后,高尔夫车系会出现两条线并行销售:一边是全新的纯电高尔夫,另一边是现款高尔夫的电气化版本。“两款车将使用两个不同平台:纯电车型一个平台,燃油车型另一个平台。MQB Evo 会继续服务于我们今天熟悉的插电混动车型,之后还会有一款基于全新 SSB 平台打造的纯电高尔夫。” 谢弗说:“我对第九代高尔夫的发布非常有信心。它正在以完全正确的方式开发。对于一辆你以为已经很难再变得更好的车,团队竟然又做出了一套让我们所有人都说不出话的设计,毫无疑问,这是我们见过的最好设计。所以我非常高兴,也相信我们会交出一款能让很多人满意的车。” 至于刚刚发布的 ID.3 Neo 为何未被命名为 ID. Golf,谢弗回应说:“关于每款车型如何逐步回到正式名称,我们有一个很好的计划。不过,ID.3 是一个特殊案例。当时我们看过之后,很多人说,那干脆叫 Golf 吧。我们讨论过,但它不是高尔夫。我们确实改进了这款车,它仍然是 ID.3,但需要一个新名字。我们也想过给它起一个人为包装出来的现代化名字,但最后决定,就用概念车当时的名字:Neo。”
配大圆柱电池续航超900km!一图看懂国产宝马iX3加长版
快科技4月25日消息,近日,宝马中国正式发布了国产宝马iX3加长版,该车亮点颇多,且看一图读懂。 新车外观基本复刻了海外版车型的设计,数字天使光翼日行灯+3D光耀格栅的设计十分抢眼,这也将成为宝马新世代车型的标准设计语言。 将会提供9种车身颜色,分别为矿石白、极昼灰、滨海湾蓝、空间银、蓝岭山脉色、炭黑色、沙丘灰、火焰红和磨砂空间银。 国产版车身尺寸进一步增加以符合中国消费者的喜好,长宽高分别为4885*1895*1635mm,轴距较标轴版加长108mm至3005mm,所有额外空间加在第二排。 值得一提都是,长轴距版采用中国专属的全新半隐藏式外门把手设计,均为电动物理二合一开关,并设置“三重安全冗余”:高压电池直接供电、12伏蓄电池备用供电、机械结构冗余。 车辆尾部同样保留横向L形天羽尾灯,尾标换为华晨宝马以及iX350L,并在车顶分段式扰流板中央增加了后置摄像头,将搭载贴合本土出行场景的Momenta全场景领航驾驶辅助功能,覆盖高速及城区道路场景。 内饰采用宝马最新设计风格,包括全景视域桥、新世代操作系统X以及视平线全景显示系统都会得以保留,这套设计确实会令人耳目一新。 智能化全面与中国科技企业合作,引入与阿里巴巴共同开发的宝马定制大语言模型(LLM)技术,DeepSeek的AI大模型能力以及AI智能体引入座舱,同时系统支持鸿蒙生态,HUAWEI HiCar等数字化服务,同时还搭载全景一体式防晒天幕。 动力同样是这款车的亮点所在,其将搭载第六代BMW eDrive电驱技术,配前异步、后励磁同步电机,最大功率345kW,峰值扭矩645牛·米,0-100km/h加速为4.9秒, 匹配108kWh大圆柱电池,CLTC纯电续航里程超900公里,官方电耗为15.1kWh/100km,采用800V架构,10分钟可以实现427公里的补能需求。 【本文结束】如需转载请务必注明出处:快科技 责任编辑:落木
懂车帝现场体验扒开尚界Z7T顶棚引热议
快科技4月25日消息,在北京车展现场,一条关于尚界Z7内饰体验的短视频在社交平台引发广泛关注。由于视频中展现的交互方式极具争议,迅速成为了网友们吐槽和热议的焦点。 视频内容显示,懂车帝的现场体验人员在拍摄过程中,直接用手大力扒开了尚界Z7的顶棚内饰边缘。这一举动随后在网络上迅速发酵,引发了关于该车是否存在做工缺陷的激烈争论。 针对这一突发情况,尚界汽车法务部迅速发布严正声明。 声明中明确指出,车展现场发现有观众蓄意破坏展车内饰,并已经造成了实质性的车辆损伤。目前,厂方已经完整保留了相关证据,并表示将依法追究相关责任人的法律责任。 自动播放 为了验证内饰的牢固程度,不少后续探馆的博主也进行了实地测试。多位博主反馈称,在正常使用力度下,顶棚内饰结构非常稳固,普通乘客根本无法将其轻易拉开。 此事在社交媒体上引发了网友的大规模讨论。许多人表达了理性的看法,认为即便产品存在改进空间,这种带有破坏性质的测试方式也让人感到极度不适。 不少评论指出,这种为了博取流量而故意放大甚至制造缺陷的行为,其背后的动机令人怀疑。如果自媒体为了流量而不择手段,不仅会对车企造成不公,也会严重误导消费者对国产汽车品质的真实认知。
联播+|“鸡毛飞上天”的时代启示
  义乌被誉为“世界超市”,在全球贸易版图上有着举足轻重的地位。   近日,习近平总书记作出重要指示强调,要把“义乌发展经验”进一步总结好、运用好,探索走出符合各自实际的高质量发展之路。   早在20多年前,时任浙江省委书记的习近平就曾作出批示,要求省委办公厅会同有关部门成立调研组,好好总结推广“义乌发展经验”。在一次接受采访中,他这样阐释为什么要学习推广义乌发展经验——“既有独特之处,也具普遍意义”。   独特是立足资源禀赋的实践根基,普遍是升华发展规律的价值内核,二者相辅相成。独特与普遍,既成就了义乌“小商品闯出大市场”的传奇,也为全国县域高质量发展提供了深刻启示。   首先,义乌的独特性,体现在其不可复制的发展历程,以及因地制宜的实践探索。   1982年春,一位农村妇女因摆摊被查处。之后她“闯”进县委书记办公室,直言“希望政府给农民一口饭吃”。   当时,义乌没有什么禀赋资源。义乌县领导班子敏锐感受到群众的诉求,于当年8月25日发布“一号通告”,正式设立并开放小商品市场。当地领导干部群众冲破各种束缚,拉开了义乌发展的传奇大幕。   1982年,义乌湖清门马路市场场景。   此后,通过几十万敢闯敢干的义乌人奋力拼搏,小商品市场从露天经营迭代升级为室内市场,配套设施日趋完善,声名享誉全国。   21世纪初,昔日“鸡毛换糖”的义乌已“飞上天”,不仅拥有全国最大的小商品市场,而且开启了从内贸为主向外贸为主的转型。   一个不靠海不沿边的县城发展改革传奇,引起了习近平的关注。   2002年底,习近平刚从福建调任浙江省委书记不久,就来到义乌国际商贸城,深入市场交易区考察调研。   2005年,义乌国际贸易额首次超过国内贸易额,8000多名外商常驻,近600家境外企业设立办事处,经济活力空前迸发。但作为县级市,义乌市政府的经济社会管理权限已然跟不上自身发展的诉求,它面临的体制机制障碍亟待破解。   对此,习近平作出生动比喻:小孩子成长太快,而衣服太小,得“给成长快的孩子换上一件大衣服”。   说“换”就“换”:2006年,浙江启动义乌扩权改革,赋予其更大经济社会管理权限;2009年,义乌海关正式升格,提高了通关效率;2011年,义乌成为全国首个由国务院批准的县级市国际贸易改革试点……   2013年秋,习近平主席首次提出共建“丝绸之路经济带”倡议。义乌人敏锐地捕捉到商机,主动谋划开通中欧班列,打通内陆开放新通道。   2026年4月1日,外商在浙江义乌国际商贸城洽谈采购小商品。   如今,敢闯敢试的义乌已构建“陆、海、空、铁、邮”立体式开放新格局,让“买全球、卖全球”触手可及,走出了一条内陆县域开放创新的独特路径。   “义乌发展经验”虽是个例,但也存在普遍意义。   在浙江工作期间,习近平曾将义乌的发展生动概括为“莫名其妙”“无中生有”“点石成金”。这12个字是“坚持兴商建市、促进产业联动、注重城乡统筹、推进和谐发展、丰厚文化底蕴、力求党政有为”等实践的生动写照,其核心在于尊重群众首创精神,实现市场和政府各就其位、各展其长,让“看不见的手”和“看得见的手”协同发力。   政府有为,才能保障市场有效。   义乌建立每双周“深改会”制度,迭代改革闭环落实机制,形成“群众推着政府走,政府领着百姓跑”的良性互动。这种治理模式为全国县域处理政府与市场关系提供了重要借鉴。   2026年2月28日,义乌全球数贸中心举行新春开市仪式。   近年来,面对市场波动,义乌以开放创新育新机、开新局,通过开拓海外分市场、建设海外仓等“组合拳”,在共建“一带一路”国家布局商贸物流枢纽,畅通双循环。   2023年9月,习近平总书记来到义乌国际商贸城二期考察。他通过电子屏幕实时了解商贸城运营等情况,并走进市场同商户、小企业主代表交流。   听到一位店主介绍自己从摆摊到开店,再到创办企业,产品销往全球100多个国家和地区的经历后,总书记欣慰地笑了:“祝你们越做越好!”   这一幕,正是义乌小商品联通大市场、融入对外开放大局的生动缩影,也是“义乌发展经验”为畅通国内国际双循环、以小产业做大文章提供的普遍借鉴。   数据显示,截至2025年底,义乌市场经营面积已达800万平方米,商位超8万个。市场汇集26个大类210多万种商品,服务中小企业210万家,带动就业3200万人。   从“莫名其妙”的逆袭路径,到“无中生有”的改革智慧,再到“点石成金”的发展成果,义乌书写了中国县域经济发展的传奇。其“独特之处”彰显了县域发展的个性密码,“普遍意义”则为全国县域高质量发展提供了借鉴范例。   此次指示,总书记肯定“义乌发展经验”是“因地制宜发展县域经济的成功实践”,并要求各地区立足自身资源禀赋,尊重基层和群众首创精神,改革创新、真抓实干、久久为功。这正是“十五五”时期走高质量发展之路的应有之义,也是新征程“更好服务和融入全国发展大局”的必然要求。   总监制丨骆红秉 魏驱虎   监 制丨王敬东   主 编丨李璇   编 辑丨李丹   视 觉丨陈腾   校 对丨李雪菲 鲁杨 宋春燕 任佳 梁雅琴   出 品丨中央广播电视总台央视网
DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料
编辑:Aeneas KingHZ 昨夜,GPT-5.5果然按期发布了,全网没有白等。更炸裂的是,就在同一天,DeepSeek-V4紧随其后发布了!实测后,结果出人意料。 2026年4月24日,这是属于全球AI开发者的「疯狂星期五」,也是科技史上注定被铭记的一天。 凌晨时分,OpenAI的GPT-5.5如约空降,试图以绝对的参数再次定义智能边界。 然而,就在大洋彼岸的余震还未平息时,那个曾经数次单挑闭源巨头的国产「价格屠夫」与「效率天才」——DeepSeek,带着全新的V4系列来正面硬刚了! 当GPT-5.5还在试图用更昂贵的算力堆砌未来时,DeepSeek-V4已经用1M超长上下文、比肩顶级闭源模型的Agent能力,以及仅为前代10%的KV缓存占用,直接把大模型推向了「平民化智能」的极境。 一边是科技春晚般的华丽登场,一边是开源领域近乎「掀桌子」的绝地反击。我们见证了一场精彩的「暴力美学」与「算法巧思」的巅峰对决。 通往AGI的赛道,瞬间被这两大巨头缩短了不少。 接下来,中国开源之光DeepSeek-V4和GPT-5.5,要来一场真刀实枪的实测大PK了。 GPT-5.5和DeepSeek-V4巅峰对决 第一题,一道可以肉眼判断模型差异的电梯谜题,测的是「真假话+身份推理」。 有四个人 A、B、C、D,其中只有一个人偷了宝石。 他们分别说了下面四句话: A:不是我偷的。 B:是C偷的。 C:是D偷的。 D:B在说谎。 已知: 1. 四句话中恰好有两句是真的。 2. 小偷说的话一定是假话。 3. 非小偷不一定说真话,也可能说假话。 请问:谁偷了宝石? 这道题看似简单,但其实,在给出的条件下,B和C都满足。因此,这是一道故意设计的「陷阱题」:如果模型直接给出唯一答案C,说明它没有认真验证唯一性。 真正想测的是,模型会不会发现题目本身不充分。 更强模型应该回答:无法唯一确定,小偷可能是B或C。题目条件不足。 这道题给GPT-5.5后,它成功发现了陷阱。 把这道题给DeepSeek-V4后,一个直观感受就是:它的思考过程,真的十分长长长长长。 GPT-5.5十几秒就出了答案,四分钟了DeepSeek-V4还在跑。 不过好在,V4最终也给出了正确答案。结果是好的,就是过程比较慢。 第二题,我们用数字竞赛题,来测试CoT的思考上限。重点比拼两个模型的数学逻辑推理和思考模式效能。 既然DeepSeek-V4宣称在STEM和竞赛型代码上比肩顶级闭源模型,那我们就看看V4和GPT-5.5在面对人类智力天花板题目时,谁的推导过程更严密,谁会出现更多幻觉。 我们选了去年国际奥数决赛的一道真题: Alice和Bob正在玩一个名为inekoalaty的双人游戏,这个游戏的规则依赖于一个双方都知道的正实数λ。 在游戏的第n轮(从n=1开始),会发生以下情况: • 如果n是奇数,Alice选择一个非负实数xₙ,使得x₁ + x₂ + ⋯ + xₙ的总和不超过λn。 • 如果n是偶数,Bob选择一个非负实数xₙ,使得x₁² + x₂² + ⋯ + xₙ²的总和不超过n。 如果一个玩家无法选择一个合适的xₙ,游戏结束,另一个玩家获胜。如果游戏无限进行下去,没有玩家获胜。所有选定的数字对两个玩家都是已知的。 需要确定的是,哪些λ的值能确保Alice有获胜策略,以及哪些λ的值能确保Bob有获胜策略。 原题和答案:https://web.evanchen.cc/exams/IMO-2025-notes.pdf 在进阶思考深度下,GPT-5.5得到了正确答案: 全程耗时2分钟51秒,思路清晰,输出格式也很漂亮。 在专家模式下,开启思考模式,同样的题目输入DeepSeek── DeepSeek在思考过程结束前,没有给出明确的输出。 点击继续后,DeepSeek也发现了答案的线索: 最后,DeepSeek也成功证明了这道IMO决赛真题。 可以看出,DeepSeek推理能力、思考深度的确进步明显。 接下来,我们考验一下两个模型的可视化能力。 生成一个HTML网页介绍人类的起源和生物的进化,要图文并茂,好理解。 DeepSeek这次效果更佳,GPT-5.5生成格式有些问题。 接下来,要求两个模型开发一个游戏网站,测试它们在动态图形、3D空间交互、碰撞检测和整体游戏架构方面的能力。 通过最终呈现,可以清晰对比两个模型在2D细腻特效与3D场景构建、光照与实时粒子系统方面的代码生成能力、架构合理性以及视觉审美水平。 跟上面一样,GPT-5.5很快完成了这个任务,在预览中呈现了网站效果。 上下滚动查看更多 DeepSeek-V4的思考时间不长,最终效果不如GPT-5.5,这一轮V4完败。 GPT-5.5:更像个人了 接下来,我们还搜罗了一波AI大V和开发者们对GPT-5.5的实测。 在今天发布之前,多位早期测试者已经用了两周。他们的结论高度一致:在编程、推理、长任务三个维度上,GPT-5.5全面登顶。 但真正让人坐不住的不是它更聪明了,是它更「像个人」了。 更贵的单价,反而更省钱;更强的能力,反而更会聊天;更高的自主性,反而更听话。这一次,OpenAI拆掉了旧时代的发动机,直接给模型装上了「灵魂」。 Codex,直接淘汰「AI辅助编程」! 可以说,GPT-5.5的Codex模式,直接把「AI辅助编程」这个词淘汰了。 一位测试者扔给它一份完整的PRD文档,只说了一个词:go。 几个小时后,GPT-5.5就独立完成了整个项目构建。 更关键的,是GPT-5.5的工作方式。 它并不是写完代码等人审,而是自己形成了闭环——构建,视觉检查,发现问题,再迭代。 这种自主性,在其他模型上从未见过。 OpenAI研究员Noam Brown的反馈,相信大家都已经看过了。 用他的话说,「有了GPT-5.5,我的IC效率比以往任何时候都高。我现在可以像专业人士一样编写CUDA kernels,可以依靠它来运行我的研究实验。」 后端开发、复杂Bug定位、大型代码库理解,GPT-5.5在这些维度全面领先。 有测试者专门让它用Svelte写了一个自定义虚拟滚动实现,完美调用了所有bind原语。 他的评价是:「我见过AI写出的最好的代码,来自这个模型。」 在世界上最难的电子表格任务上,GPT-5.5实现全新SOTA:速度最快、效率最高。 更狠的是,GPT-5.5的持续研究能力,已有迹象表明AI已经能胜任研究合作者—— 人类研究人员只需要提出构想,全程无需写一行代码,GPT-5.5全部自主完成。 甚至可以自主运行31个小时! 这意味着,AI正从「助理」变为「雇佣兵」。你不需要告诉它怎么走,你只需要给它一个终点。 不过短板同样存在。 前端设计仍然不如Opus,响应速度不如Opus 4.6 Fast。 复杂布局有时候直接甩一张img了事,SVG硬编码把自己绕晕。 而且变得过度谨慎——动不动就问你问题,prompt稍有不慎就会触发「疯狂写单元测试」模式。 总结就是:能力很强,但需要驯服。 沃顿商学院的教授Ethan Mollick测试了GPT-5.5好几周,得出结论:目前,GPT-5.5 Pro就是解决复杂问题的最佳模型。 更贵的模型,怎么反而更便宜 GPT-5.5的定价比5.4更高。 纸面上看不是好消息。 但一位深度测试两周的开发者给出了关键数据:达到GPT-5.4同等智能水平,GPT-5.5消耗的Token显著更少。综合算下来,整体运行成本反而更低。 「这可能比大多数人意识到的更重要。」 在Artificial Analysis指数的成本性能前沿上,GPT-5.5模型系列占据绝对主导地位。 速度端的提升,就更加直观了。 早期测试者的实测数据摆在这里—— GPT-5.5 Thinking Heavy模式,2分钟出的答案,比GPT-5.4 Thinking Heavy花10分钟出的更好。 GPT-5.5 Pro,8分钟的输出质量,超过GPT-5.4 Pro花30分钟的结果。 同样的活,时间砍了80%,质量还涨了。 Token效率这件事为什么重要?因为它直接决定了AI Agent的经济可行性。 一个每跑一次任务就烧掉几美元Token的模型,没法大规模部署到真实工作流里。现在,GPT-5.5把这个门槛往下压了一大截。 为什么GPT-5.5感觉不一样? GPT-5.5建立在一次新的预训练(pre-train)之上。 所谓预训练,就是那种规模庞大、成本高昂的基础训练过程:在指令微调、工具使用和推理脚手架等后训练步骤加入之前,它先教会基础模型底层模式。 后训练可以让模型更听话、更安全,或者更具智能体能力;但一次新的预训练,则可能改变模型本身的「重心」。 其实,OpenAI已经通过GPT-5.4证明,自己重新具备了强竞争力。 GPT-5.4使用的仍然是早期GPT-5.x模型的同一套预训练。 而现在发布一个新的预训练。 此外,有国外科技媒体报道,GPT-5.5也就是Spud「将是更智能的预训练模型」。 现在,GPT-5.5的正式发布,更贵反而更便宜,编程效果又好得出奇,推测GPT-5.5可能只是新预训练模型的初始强化学习Checkpoint。 奥特曼直接摊牌了:GPT-5.5还会快速迭代。 这说明OpenAI想继续向Anthropic施压:它押注的是,回应Claude的下一步,不只是围绕同一个底座做更好的脚手架,而是换一个不同的基础模型。 GPT-5.5就是GPT-5.5,但无人关心了 整个GPT-5.5发布中,最重要的成果可能是前所未有的网络安全能力: 在一次网络攻防评估中,GPT-5.5在10次试验中有1次成功接管了模拟的企业网络,预算为1亿个token。 此前,唯一能够完成此任务的模型Claude Mythos,它在10次尝试中成功了3次。 Opus 4.6和Opus 4.7都做不到,GPT-5.4、GPT-5.3-Codex也做不到。 在衡量AI长时间跨度内经营业务能力的Vending-Bench Arena中,GPT-5.5再次击败Opus 4.7。 而Opus 4.7依旧延续Opus 4.6的策略:撒谎赖账,拒不退货;GPT-5.5赢得堂堂正正。 这说明GPT的对齐和能力同步提升,堪称「德才兼备、文武双全」。 GPT终于通关《宝可梦》! GPT-5.4曾在一个循环迷宫里反复读档,像个陷入算法死循环的孤魂。 而GPT-5.5不仅第一次尝试就轻松打赢了劲敌,甚至展现出真正的「人类逻辑」——它会主动拿取道具、购物、规划路径,而不是暴力试错。 在网友定制的超级难度的《宝可梦 水晶》中,GPT-5.5依旧轻松通关。 别被版本号里的「+0.1」骗了,GPT-5.5是一次重大更新。 诡异的是,对于99%的用户而言,这些都不重要。 最重要的亮点在于能力范围。GPT-5.5弥补了GPT系列在某些方面的不足: 基于现有上下文进行设计、iOS/原生Mac应用、安全等方面。 这次发布有一种心理上很奇怪的地方。 GPT-5感觉像一次相变,因为它抬高了「可能性」的天花板。 GPT-5.3-Codex感觉像一次相变,因为它让长时间运行的自主工程在操作层面变得真实可用。 GPT-5.5并非如此。 它更像把粗糙边缘磨平,让薄弱类别不再那么弱,让模型在更多真实世界的混乱工作中变得更有用。 它并不完美,它没有突然变成最好的设计模型,它不是魔法。 如果你想认真完成重要工作,你仍然需要给它明确目标、真实上下文和验证方式。 对大多数人、在大多数任务上,GPT-5.5与其说是一种全新能力,不如说是让现有能力变得更宽、更安全、更可靠。它把这个模型补圆了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。