行业分类:
加载中...
头条分类:
加载中...
单机支持超万亿参数模型!浪潮信息发布超节点,给开源AI打造开放底座
作者 | 陈骏达 编辑 | 漠影 在刚刚过去的7月份,国产模型迎来一波重磅开源。与以往不同的是,本次国内大模型玩家们开源模型的参数量成倍增长,达到数千亿乃至万亿级别。这不仅显著提升了国产模型的能力上限,也为各行业智能化转型提供了新一代强大的智能基座。 然而,随着模型体量不断攀升,对应的基础设施正面临前所未有的挑战。传统集群架构在通信效率、I/O性能和系统扩展性等方面逐渐暴露出瓶颈,已难以满足当前开源模型的部署需求。 在这样的背景下,各类“超节点”方案应运而生。作为面向大模型的新一代基础设施架构,超节点通过在单系统内部集成更多GPU资源,并显著优化节点间的通信性能,有效突破了传统架构在大规模分布式计算中的性能瓶颈。 昨日,浪潮信息正式发布了其面向万亿参数大模型的超节点AI服务器——“元脑SD200”。得益于浪潮信息自研的多主机低延迟内存语义通信架构,SD200在单机内集成64路加速计算芯片,单机支持DeepSeek、Qwen、Kimi、GLM四大国产顶级开源模型同时运行,以及多智能体实时协作与按需调用。 浪潮信息一直是开放计算生态的积极推动者,本次其此次推出的超节点方案采用了OCM+OAM的开放架构设计,兼容多款本土GPU芯片与大部分主流AI框架,目前已率先实现商用。 在国产开源模型奋力追赶智能上限之际,浪潮信息的开放超节点,有望成为承载万亿参数模型的重要底座之一。 一、厂商竞相追逐超节点,开放架构需求凸显 在探讨“超节点”对行业所带来的深远影响之前,我们有必要先厘清这一技术诞生的背景。 首先,模型规模的持续膨胀正在逼近现有硬件的承载极限。大模型加速迈向万亿参数规模,同时上下文长度不断扩展,直接推高了推理过程中的键值缓存(KV Cache)需求。显存与带宽,正成为压在AI基础设施之上的两座大山。 与此同时,随着大模型加速进入千行百业,推理型负载成为主流计算模式,而推理是一种高度通信敏感的计算过程。以Qwen3-235B模型为例,若要实现100 tokens/s的解码速度,单个token需完成多达188次的All-to-All通信,且每次通信的延迟必须控制在53微秒以内。 更不容忽视的是,Agentic AI的兴起正在进一步拉高对计算系统的需求。具备自主规划、多模态感知与连续执行能力的智能体,在执行任务时生成的token数量往往是传统模型的数十倍甚至上百倍,动辄需要处理数十万乃至数百万token。 算力基础设施面临的上述三大关键挑战,使其走到升级重构的临界点。为了支撑万亿参数级模型的高效运行,构建高度集成、低延迟、高带宽的Scale-Up(纵向扩展)系统,即通过构建一个更大的高速互连域、形成“超节点”,成为现实的技术选择。 通过构建超低延迟的统一显存空间,Scale-Up系统能将万亿级模型参数及激增的KV Cache整体容纳于单一高速互连域内,保障了多芯片间高效协同执行,显著减少跨节点通信开销,从而大幅提升吞吐速度并降低通信延迟,实现降本增效。 AI算力需求侧的变化,正驱动供给侧的厂商们争相布局前沿的Scale Up方案。2024年,英伟达在GTC大会上提出SuperPod的概念;今年,国内厂商的方案更是将超节点引入大众视野。 当前,业界在超节点技术方案的选择上,存在多种路径。在浪潮信息看来,超节点要根据客户应用需求来选择技术路线,要给客户提供更多算力方案的选择,核心策略是“开放架构”。 基于开放架构设计的超节点,能够支持多样化芯片、开放AI框架及主流开发工具,在保障高性能、低延迟的同时,实现跨平台的良好兼容与灵活扩展,推动AI基础设施真正走向开放、可持续的发展路径。 二、单机运行四大开源模型,全面支持主流框架 昨日,浪潮信息在2025开放计算技术大会上正式发布元脑SD200超节点AI服务器。作为开放计算领域的重要风向标,该大会一向聚焦推动算力基础设施的开放与协同,而SD200正是这一理念的典型体现。 SD200基于OCM(开放算力模组)与OAM(开放加速模块)两大架构打造。OCM标准由中国电子技术标准化研究院发起,浪潮信息、百度等18家算力产业上下游企业共同参与编制。 该架构围绕CPU和内存进行解耦设计,具备高度模块化与标准化优势,支持系统供电、管理、风扇等组件的独立升级与更换,大幅提升了服务器的灵活性与可维护性。同时,OCM支持“一机多芯”,可快速适配Intel、AMD、ARM等多种计算平台。 OAM则由开放计算项目(OCP)社区推动,是专为高性能计算与AI加速场景设计的开放模块标准。 该架构统一了加速卡的尺寸、电气接口和散热设计,使来自不同厂商的GPU、NPU等AI加速器可在同一系统中协同运行,并通过高速互联技术实现加速卡之间的低延迟直连,有效满足大模型训练与推理对带宽的极致要求。 浪潮信息将OCM与OAM架构有机融合,为业界提供了一种开放的超节点技术架构。 不过,光有“开放”的特性,仍不足以让一款开放超节点方案获得广泛采用,性能同样至关重要。 在开放计算技术大会现场,浪潮信息副总经理赵帅晒出了SD200超节点在真实部署环境下实现的性能。在经过软硬件的系统协同优化后,SD200超节点满机运行DeepSeek R1全参模型推理性能提升比为370%,满机运行Kimi K2全参模型推理性能提升比为170%。 SD200超节点配备高达4TB的显存,能够同时容纳DeepSeek、Qwen、Kimi、GLM等多个旗舰级开源模型。赵帅称,这样的显存配置具备前瞻性,不仅可满足当前万亿级模型的部署需求,甚至为未来可能出现的2万亿、3万亿参数模型预留了充足空间。 然而,在打造这一方案时,浪潮信息并未一味追求技术堆叠,而是更注重实际落地的可行性。正如浪潮信息赵帅在发布会后与智东西等媒体交流时所提到的——客户的核心诉求是“能否快速部署、快速上业务、上应用”。 基于这一判断,SD200在使用便利性上进行了优化设计。例如,采用风冷散热,企业无需改造机房,即可灵活部署;在互连方案上,则选择了更为成熟稳健的全铜电互连,提升了系统稳定性,同时降低了终端用户的运维复杂度和成本。 此外,SD200超节点还全面兼容当前主流的开源大模型计算框架(如PyTorch,已支持2200+算子),可实现新模型的无缝迁移与“Day 0”上线,为企业构建AI应用提供了即开即用的基础平台。 三、软硬协同优化实现性能突破,揭秘开放超节点背后创新 这样一套开放超节点方案背后,是浪潮信息在融合架构和软硬件协同方面长达十余年的深厚积累。 赵帅分享道,自2010年起,浪潮信息持续推进融合架构演进,从最初的供电、散热等非IT资源的整合,到存储、网络等资源池化,再到最新融合架构3.0系统实现了计算、存储、内存、异构加速等核心IT资源彻底解耦和池化。 这沉淀下来的芯片共享内存数据、统一编址技术、池化、资源动态调度等技术,在今天的超节点系统中得以延续和应用,显著提升了系统的适配速度与商用效率。 此外,浪潮信息并非单纯的硬件厂商,其在大模型领域同样具备深度布局——早在2021年即发布首个中文巨量模型“源1.0”,其参数规模达2457亿,并持续在模型训练、推理优化和软硬件协同方面积累经验。这些能力也为SD200这样的超节点方案提供了坚实基础。 为突破万亿大模型的带来的显存压力,SD200超节点基于浪潮信息自主研发的开放总线交换(Open Fabric Switch)技术,首创多主机三维网格系统架构(3D Mesh)。在这一架构下,64颗本土GPU能够以高速、低延迟的方式实现互连。 更进一步,SD200通过GPU虚拟映射等底层创新,解决了多主机环境下统一编址的难题,将显存统一地址空间扩增8倍,显存容量达4TB,配合64TB系统内存,为超大模型提供了充足的KV缓存资源。 这意味着,不论是在模型训练还是推理过程中,开发者都能像调用单机GPU一样,灵活调度整个系统中的算力与显存资源,极大简化了工程复杂度。实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。 在系统层面,浪潮信息围绕万亿参数大模型计算密集、通信敏感的特性,构建起一整套软硬协同优化的系统方案,将64卡超节点的算力潜能释放到极致。 一方面,浪潮信息开发了智能总线管理系统,可实现超节点64卡全局最优路由的自动创建与管理。该系统不仅支持灵活拓扑切换,还能根据业务负载动态进行资源切分与调度,为不同类型的大模型任务提供定制化的算力编排能力。 针对All Reduce、All Gather等典型通信算子的不同数据包规模,系统设计了细粒度、多层级的通信策略,进一步压缩通信路径的延迟。 此外,SD200还引入了开放的PD分离框架,将预填充-解码(Prefill-Decoder)环节解耦,支持异步KV Cache高效传输,并允许针对不同模型并行需求制定差异化策略,兼顾性能与兼容性。这一设计不仅提升了系统性能,也保障了对多元算力架构的适配能力,加强了计算与通信之间的协同优化。 通过软硬协同系统创新,SD200成功实现了纵向扩展,帮助本土AI芯片突破了性能边界,在大模型场景中展示出优异的性能表现。 结语:开放超节点,带动产业链协同创新 在赵帅的分享中,智东西感受到了浪潮信息对“以应用为导向”的坚持。作为系统厂商,他们与终端客户的距离更近,也更能体会到实际应用场景的痛点。也因此,赵帅称,超节点架构本质上是系统化思维的产物,它不是某一个点的突破,而是在现有技术、生态和成本约束下,从系统层面去打破芯片本身的性能边界,最大化用户价值。 超节点的发展也为中国本土产业链提供了发展机遇——高速连接器、线缆、板材、电源等上下游产业链厂商,都有望这个过程中找到属于自己的突破点。这不仅能加速成本下降和技术普惠,更推动了智能基础设施的“平权化”。 放眼未来,赵帅认为,AI数据中心正从“机柜级密度革命”迈向“数据中心级系统工程挑战”,算力密度将持续攀升,能源供给、冷却方式和系统管理也随之进入全面革新期。 从芯片到架构,从系统到生态,技术演进注定不会是一条单线道路,而是多路径的协同创新。在这场关于未来的集体奔赴中,唯有持续开放、拥抱合作,才能构筑真正普惠、可持续的智能算力基石。
荣耀Magic V Flip2再曝:或将发布行业首款2亿像素小折叠
在不久前的 8 月 4 日,荣耀终端股份有限公司销售与服务总裁王班曾分享一则“战报”:荣耀 6 月香港市场份额 20.2% 突破历史新高,首次超越苹果进入市场份额 TOP2。 其实这只是荣耀最近在市场上火热销售表现的一个侧面。IT之家此前就曾报道荣耀 X70 5G 手机上市连续十日霸榜全品牌全机型销量第一的消息,此外,5 月份发布的荣耀 400 系列手机也表现抢眼。该系列产品于 6 月 29 日实现全球激活量突破 100 万台,创下近三年来荣耀手机激活速度的新纪录。7 月 10 日,荣耀官方又宣布该系列在中国区的激活量也已突破 100 万台。 再比如还有 7 月份刚发布的全新荣耀 Magic V5 手机也打破荣耀历史折叠屏首销日销量纪录,充分展现荣耀旗下各系列产品出色的销售势头。 而在 Magic V5 之后,荣耀新款折叠屏手机也要来了,此前就有消息显示荣耀小折叠手机新作 Magic V Flip2 将在 8 月发布,IT之家注意到,今天,微博博主 @厂长是关同学 发了一则爆料消息,他表示,荣耀新款小折叠快来了,据说这次有两个小目标,并表示上一代的销量就很好,想买小折叠的朋友可以期待一波了,可以猜猜这两个小目标是什么意思。 而在他的配图中,有引用荣耀产品线总裁方飞在采访中透露消息:新一代小折叠将会在影像和续航上带来大幅升级。 因此我们不难想到,@厂长是关同学 所说的荣耀小折叠的两个小目标应该和影像和续航有关。 刚好,从昨天晚上到今天上午,荣耀首席影像工程师罗巍 Cyberverse 在微博上发布了多组人像自拍对比照片,并表示它们分别来自某款前置自拍、某款后置看屏幕自拍、另一款的后置盲自拍,这里面出现后置看屏幕自拍,显然就是折叠屏手机了,联系上面的爆料消息,相信这是为 Magic V Flip2 的影像能力在预热,正好也和上面的爆料信息对上了。 那么荣耀 Magic V Flip2 具体会在续航和影像上达成怎样的目标呢?我们不妨先来看看目前这款手机已经曝光的信息。 此前博主 @数码闲聊站 就曾透露,荣耀 Magic V Flip2 预计将是今年电池最大的小折叠手机,配备 6.8 英寸 ±FHD+LTPO 主屏、4 英寸 ±FHD+LTPO 副屏,50Mp 1/1.5" 大底双摄,骁龙 8 系次旗舰平台,5370/5500mAh± 电池,66W / 80W 快充头。 这里面提到的 5500mAh 今年电池最大的小折叠,或许就是荣耀 Magic V Flip2 在续航上的小目标。 而在影像方面,爆料信息显示荣耀 Magic V Flip2 搭载 50Mp 1/1.5" 大底双摄,这一点小编表示存疑,毕竟 50Mp 1/1.5" 的配置在小折叠手机中并不能算是突破,要达到“小目标”级别的突破,显然还需要更抢眼的看点,比如至少得达到“亿级”吧。 于是小编想到,不久前推出的荣耀 400 系列就是以“2 亿超清人像”为卖点的。由此,不难让人想到荣耀 Magic V Flip2 小折叠会以人像自拍效果为看点,那么它是否会用上 2 亿像素超清人像呢?这一点很有可能。 同时此前网上也有消息称荣耀数字系列、折叠屏系列、旗舰 Magic 系列三大主力产品线,都将全面普及 2 亿像素镜头,随着三星 ISOCELL HP3 传感器的商用,2 亿像素的普及可能是接下来手机影像的一个重要趋势,因此荣耀 Magic V Flip2 若能率先在小折叠使用 2 亿像素摄像头,那么无疑可以称得上是一个达成“小目标”级别的突破。当然,以上都只是小编的猜测,实际荣耀 Magic V Flip2 在影像上会带来怎样的看点,还需等待官方的进一步消息。 总之,8 月份荣耀 Magic V Flip2 就将发布,相信最近荣耀官方也会开始预热这款全新的小折叠手机,荣耀将会为小折叠的赛道里带来怎样的新惊喜?大家不妨耐心期待一下。
美媒:戴智能眼镜之后,人们跟我说话的方式不一样了
I spent months living with smart glasses. People talk to me differently now. 眼镜正被赋予屏幕、人工智能以及令人不安的力量。我们测试了一副眼镜,看看究竟如何。 即使是 Realities 的 G1 智能眼镜也能让你阅读通知、获取 AI 反馈,还能给自己留下美好的笔记。(莫妮卡·罗德曼/《华盛顿邮报》) 旧金山——马克·扎克伯格的 Meta 眼镜公司押注,未来配备显示屏和 AI 智能的眼镜将成为我们“主要的计算设备”。谷歌已经与三星关系密切,目前正与 Warby Parker 和 Gentle Monster 等知名品牌签署协议,准备将类似的智能眼镜推向大众市场。 他们最新、最雄心勃勃的智能眼镜尚未上市销售。不过,过去几个月里,我通过测试Even Realities的一副眼镜,初步体验了佩戴更先进的智能眼镜会是什么样子。Even Realities是一家总部位于中国的初创公司,由一位前苹果工程师联合创立。 我戴着这副价值 599 美元的眼镜查看电子邮件,甚至还能导航去吃饭。它们本身就很实用,魅力十足——但最有趣的是,它们改变了我与他人互动的方式。 说实话,事情有时会变得相当尴尬。这不是任何人的错——这是我们生活在这样一个时代的副作用:那些极具影响力的人物和公司可能会暗示,不戴这种眼镜最终会让我们处于“相当严重的认知劣势”。 不管你喜不喜欢,大型科技公司正在向我们的眼镜发起冲击。无论你打算戴不戴,都需要一段时间来适应。 这些智能眼镜看起来与普通眼镜几乎没有区别。(莫妮卡·罗德曼/《华盛顿邮报》) AI眼镜能提供什么 正在开发的智能眼镜,例如我提到的 Meta 和 Google 型号,可以大声与你对话。它们可以拍照、播放视频,并利用人工智能告诉你更多关于你所见世界的信息。 Even Realities 眼镜做不到这些。但我在对话中翻译过不同的语言(效果还算可以),在演示过程中用提词器读懂了内容(效果甚至更好),还向一些我能快速读懂的热门聊天机器人请教建议。(如果我不那么顾忌,它们就能让我在智力问答之夜成为高手了。) 不过,这些眼镜主要感觉就像是戴在脸上的智能手表:它们最适合快速交互,例如查看通知以及给自己留下提醒和便条。 不过,我最欣赏这副眼镜的地方在于,Even Realities 非常认真地尝试让它们看起来更像真的眼镜。这里没有摄像头,也没有闪烁的灯光——只有麦克风来监听你的笔记和要求,以及一些根本就不是屏幕的绿屏。 相反,眼镜会将您的信息和股票行情投射到“波导”中 - 在这种情况下,它是一种将光反射到您的视野中的特殊玻璃 - 与更传统的处方镜片粘合在一起。 镜片内置的波导技术常常引发人们的兴趣,但也引发了一些质疑。(莫妮卡·罗德曼/《华盛顿邮报》) 这些波导也是这些玻璃有些不寻常之处的最大证据,当人们发现它们时,事情可能会变得有点奇怪。 尴尬的对话 一旦人们意识到我的眼镜里装满了科技产品,谈话就会变得尴尬起来——而且大多数情况下都是以同样的方式展开的: “你在拍我吗?” (不,我没有。) “摄像机在哪里?” (没有!) “你真的不拍我吗?” (不!) 然后,最重要的是,要对这种眼镜是什么、谁制造的、以及它们能做什么和不能做什么进行冗长的解释。 所有这些质疑都是绝对有道理的。眼镜确实有麦克风,尽管它们很难被意外触发。带麦克风和摄像头的眼镜越来越受欢迎,这意味着那些不介意个人界限的人更有可能捕捉到一些本不该被记录下来的瞬间。我不会责怪那些本能地试图避免这种情况的人。 但是想象一下,当您与新朋友或以前没有见过您的新镜架的朋友开始交谈时,同样的互动会一遍又一遍地发生。 值得庆幸的是,没有人因为戴眼镜而感到厌烦,最终完全放弃了谈话,但有几个人要求我摘下眼镜——由于我的近视,这个选择根本行不通。 大多数时候,人们选择相信我的话,谈话继续进行(尽管有点冷淡)。即使是在科技密集的旧金山,在眼镜的真实性质被揭露后,与我认识多年的人的随意聊天有时也会变得紧张。 当被问及时,人们给出的最常见的让互动变得尴尬的原因是,他们仍然担心眼镜会听到他们说话——尽管眼镜并没有听到。 有些人看起来不高兴的另一个重要原因是出乎意料:他们以为我忽略了他们。我花了一段时间才弄清楚原因,而且很少是因为我走神了。 事实证明,一旦人们知道了眼镜的功能,他们就会从正面瞥见波导,并且由于波导的反射性极强,他们会认为“屏幕”已经打开,而我正在阅读电子邮件或其他内容。 这款眼镜的小巧单色“屏幕”可以让你阅读通知并获取聊天机器人的反馈。(莫妮卡·罗德曼/《华盛顿邮报》) 不仅仅是朋友和同事有这种感觉。我的妻子有时仍然认为我是戴着眼镜看新闻标题,即使我正看着她。 我不能责怪他们对此感到奇怪。毕竟,当你收到一条信息时,你很容易忽略手腕上智能手表的嗡嗡声——而当一条霓虹绿色的通知滑到你眼前时,你很难全神贯注地与某人相处。 朋友们,放弃的诱惑是真实存在的。而且,一旦我们的眼镜开始发挥更大的作用,这种情况只会变得更糟。 需要明确的是,这不一定是“均衡现实”(Even Realities)的问题。智能眼镜有可能改变我们获取信息和服务的方式,并迫使我们赖以生存的脆弱社会结构发生改变。 如果智能眼镜能够像扎克伯格这样的科技高管所希望的那样,实现无处不在的普及,那么其中一些社会问题或许会随着时间的推移而自行解决。我们或许都会习惯一种更加被屏幕、摄像头和麦克风所包围的生活。 然而,在此之前,佩戴智能眼镜可能会让人感觉在社交方面有些不雅。 本文出处:https://www.washingtonpost.com/technology/2025/08/07/smart-glasses-ai-even-realities/
库克尴尬了,iPhone回美国制造,仅组装工资就要8600元,比手机贵
特朗普最近应该是春风得意,因为库克表示,要投资6000亿美元,推动苹果供应链相关制造回流,这个数字,比之前说的5000亿美元,又多了1000亿美元。 特朗普喊出 “苹果会重返美国” 的豪言,称“他们要回家了”。 为何苹果认怂了?原因是特朗普表示称,对所有进口芯片和半导体征收 100% 关税,但如果在美国建厂或承诺建厂的企业可获豁免。 同时美国一直在强硬的要求苹果回迁,在多重压力之下,苹果不得不表示认怂,表示要回美国制造,还表示称,接下来全球销售的所有iPhone和Apple Watch的盖板玻璃,将在美国制造。 那么问题就来了,接下来iPhone真的会回美国制造么? 这个问题,估计库克真的没法回答,因为如果要回美国制造,仅组装成本这一项,可能就要高达1200美元(约8600元),是其在中国、印度组装的10倍,苹果没法承受。 按照苹果之前的数据,一台售价1199美元的256GB iPhone16 Pro Max,其物料为540美元,占比45%,组装120美元,占比10%,物流72美元,占6%,然后还有39%的毛利(468美元)。 但是如果放到美国来制造,物料成本会高达750美元,提升39%,组装会高达1200美元,是原来的10倍,物流是150美元,提高108%,如果再保证39%的毛利率,最后零售价会高达3440美元去了,是原来1199美元的2.8倍多了。 其中特别是在组装这一块,如果放到中国、印度的话,只要120美元,但如果放到美国,仅这一项,就要1200美元,比原来一台手机的零售价还要高,这让库克怎么能够接受? 到时候,难道在美国制造的iPhone,价格要比在亚洲制造的iPhone,定价就要高出1-2千美元,这样的手机卖到哪里去,卖给美国市场,还是美国市场之外? 所以说,库克现在是左右为难,一方面要满足所谓的“美国制造”的要求,一方面又要为公司的利润负责,还要为手机价格负责。 外界认为,目前iPhone不太可能回美国制造,最多将一些边角料之类的先回迁,苹果会慢慢拖,拖到特朗普下台再看情况,反正苹果回迁,也不是几年就能够完成的,到时候特朗普都不当总统了,政策可能就变了。
吉利银河A7混动家轿上市:8.18万元起,百公里馈电油耗2.67L
凤凰网科技讯 8月8日,吉利银河A7混动家轿正式上市,新车是首款基于GEA架构打造的插混轿车,搭载雷神AI电混2.0系统及Flyme Auto智能座舱,新车分为7个版本,上市限时指导价8.18万元起。 70km豪享版:8.98万元,上市指导价8.18万元; 150km尊享版:10.58万元,上市指导价9.78万元; 70km启航版:9.58万元,上市指导价8.78万元; 70km探索版:10.58万元,上市指导价9.78万元; 150km远航版:11.18万元,上市指导价10.38万元; 150km探索+版:11.78万元,上市指导价10.98万元; 150km星舰版:12.58 万元,上市指导价11.78万元。 从发布会获悉,新车定位为中型轿车,车身尺寸为4918/1905/1495mm、轴距 2845mm,配备17寸多幅铝合金轮毂/18寸低风阻轮毂。 座舱方面,该车配备了14.6英寸/15.4英寸矩形中控屏、双辐式多功能方向盘、AI智能语音交互,中控岛台配备了实体按键以及旋转按钮;顶部配有0.87 平方米全景天窗,后排膝部空间达132mm,顶配车型还有座椅通风、加热、按摩。 辅助驾驶方面,该车首发搭载千里浩瀚辅助驾驶H3方案,支持HNOA高速领航驾驶辅助、全场景泊车、AES自动紧急避让等功能。 动力方面,吉利银河A7 EM-i搭载了一套由1.5升发动机组成的插电式混合动力系统,全球最高发动机平台热效率47.26%,最大功率为82kW;11合1混动电驱系统综合效率93.10%,功率达到175kW,电机扭矩262N・m。 新车首发搭载吉利最新发布的雷神AI电混2.0和星睿AI云动力2.0,在CLTC工况下百公里馈电油耗为2.67L,综合续航达到2100km以上。
滤镜之王VSCO回归,我的青春回头望了我一眼
如果你对十年前的互联网还有印象,那你一定听说过 VSCO 这个名字。 在那个智能手机大面积铺开,但手机自带的照片编辑功能还远不够强大的年代,照片美化的世界由两大阵营主导—— 加特效的,是 B612 和激萌;玩滤镜的,VSCO 无疑是王者。 随着时代的脚步不断前迈,B612 和激萌早已淡出人们的视野,曾经的滤镜王者 VSCO 也逐渐被 Dazz 等主打胶片风格的新应用取而代之。 但在 2025 年,这个沉寂已久的 app 却突然带来一款续作,让我一下梦回十年前——VSCO Capture。 拍摄之前就套滤镜 打开 VSCO Capture,你可以一眼看到它与我们熟悉的 VSCO 截然不同—— 与之前以图库为主不同,VSCO Capture 将取景框放在了体验的核心,围绕「拍摄」这一动作,打造出一整套简洁而专注的操作界面。 整个界面基本遵循了影像类 App 的基本设计思路:包括菜单布局、图像格式选项,以及自动/手动模式之间的自由切换。 值得一提的是,VSCO Capture 对 iPhone 格式的支持比想象中更为全面,从 HEIC 格式到 ProRAW,以及各档分辨率,都支持得不错。 除此之外,在这个并不算复杂的界面中,有两个细节打破了我们对传统操作的习惯: VSCO Capture 的焦段设计并没有在取景器底部铺开,而是收纳在取景器右下角的二级菜单中,如果想要切换焦段,需要多一步操作; 而相册也被放到了右上角,而不是我们熟悉的左下角,取而代之的是 VSCO Capture 的核心卖点——滤镜。 点进左下角的滤镜菜单,我们可以直接浏览滤镜列表,VSCO Capture 内置了 58 款滤镜,从暖调到冷调、从彩色到黑白,可以说应有尽有,一应俱全。 这些滤镜沿袭了 VSCO 的传统展示风格,以不同的名称和色块做出编组,以便区分。 纸上得来终觉浅,深知此事要躬行,这数十个滤镜都是些什么风格、适合在什么时候用,哪些滤镜更万能,都需要亲手拍一拍。 在拍摄了数百张照片后,我为大家总结了以下这份滤镜的成像风格表,标注了各类滤镜的成像风格,并辅以样片进行讲解。 A 系列:胶片感经典模拟,风格柔和,带有轻微的偏色风格与胶片影调 B 系列:黑白风格,注重光影层次、对比控制和细节还原 C 系列:现代色彩,整体画面色彩鲜艳、饱和度高,偏明快 E 系列:情绪色彩,具有明显的色彩氛围倾向,带有一定的电影感 F 系列:复古褪色,低对比度、低饱和度,模仿褪色风格 G 系列:粗粝质感,对比度强,阴影重,为画面提供岁月流逝的感觉 J 系列:模仿宝丽来与拍立得的色彩偏移,同时提升黑色部分,去除死黑 K 系列:饱和度高,适合纯净的画面,否则颜色会变脏 L 系列:更为日常的生活滤镜,请为提升饱和度,同时提供不同的冷暖倾向 M 系列:低饱和奶油风,整体偏向灰色调 S 系列:饱和度适中,偏明亮,比较适合拍摄人物 SS 系列:影调偏暗,整体成像扎实,对比度强,适合色彩浓厚的环境 U 系列:两个滤镜分别偏向冷暖调,饱和度也一高一低,均带有偏色 V 系列:对比度正常,V3 带有一定的褪色效果,而 V8 则更偏暖色 …… 在实际体验以后,我认为有几个滤镜比较适合日常使用,在美食、风景和人像上都能得到不错的表现: A6:为照片高光添加橙色,为暗部添加绿色,带来一定的复古胶片感,是比较万能的滤镜 SS3:画面整体偏向暗调,饱和度较低,适合颜色和元素比较杂乱的环境 G7:画面偏向中间调,饱和度低,平和清淡,适合颜色干净的环境 还是熟悉的味道,还是熟悉的配方——刚刚为大家介绍的这些滤镜,几乎是对 VSCO 的完整复刻。 更直接地说,VSCO Capture 的诞生,正是为了把原本的后期流程前置到拍摄环节中,无需拍完再打开 VSCO 调色,在按下快门的同时,就得到一张风格明确、可直接使用的直出大片。 当然,它也没有完全割裂与老版本 VSCO 的关系,拍摄完照片后,你依然可以一键跳转至 VSCO,为照片更换为其他滤镜,并进行更深度的二次调色,实现前后期的无缝衔接。 当然,想要享受完整的编辑功能,前提是你已经开通了 VSCO 的会员服务。 除了滤镜,VSCO Capture 还有一个隐藏的小功能也颇有趣—— 当你在右下角切换到手动模式后,菜单栏的末尾会出现两个新增的影像效果:Bloom 和 Halation。 Bloom:为画面的高光区域增添一层柔光,让照片整体更柔和,营造出一种温暖而梦幻的氛围感; Halation:则会在高光边缘生成一圈微微泛红的晕影,这是除碳电影卷的标志性效果。 在手动模式下,你除了可以控制 Bloom 与 Halation 效果的开关外,还可以进一步控制效果的强弱和介入程度,以便适配不同的拍摄环境和画面。 VSCO Capture 目前提供的所有滤镜和 Bloom 与 Halation 两个新效果均可以免费使用,和 VSCO 随处不在的付费相比,显得诚意十足。 但很遗憾,我对它并不算满意,甚至可以说是差评。 左右互搏的交互灾难 VSCO Capture 最引以为傲的滤镜,在我看来,反而是最让人失望的地方。 首当其冲的是滤镜的命名和编组问题,不同风格和调性的滤镜被编入了一组字母中,很难让人明确分辨哪一组滤镜是什么风格; 同时编号式的滤镜体系总能让人一头雾水,哪怕在 VSCO 的巅峰时期,恐怕也只有极少数资深用户才能分清什么时候该用什么滤镜。 除了数量多种类杂,VSCO Capture 这些滤镜另一个大问题,是它的风格早已脱节于当代审美。 ▲ 收手吧阿 V,外面全是 app 过去十年,移动影像的审美快速进化,用户不再满足于泛泛的文艺感,风格明确、辨识度高的影调开始获得大家的青睐: 要么是像富士 NC 这类模拟真实胶片质感的经典滤镜,要么是德味这样久经考验的风格影调。 总之,那套五花八门、以量取胜且「调调很重」的滤镜体系,虽然曾经很吃香,但时过境迁后,恐怕很难打动如今挑剔的用户了。 毕竟前朝的剑再好用,也斩不动本朝的官呐。 不信?看看手机自带的那些滤镜,你用过几次? 更别说,如今的影像生态,已经充分细分—— 想在拍摄环节就营造氛围,有去掉锐化和算法,力求纯净的 app,也有 Dazz 这类不仅更贴合经典胶片质感,还无法预览效果的 app,主打「开盲盒」式的情绪刺激,让人上瘾; 想在后期编辑阶段深度处理,有 Lightroom 这样的专业工具,JPG、RAW 格式通吃,功能精准,也有美图秀秀、醒图这类面向大众的 app,一键修人像、套滤镜、批量出片,效率与效果并存。 在这样的细分趋势中,VSCO Capture 和 VSCO 两位搭档实在是差点儿意思。 这些表面的小问题,最终汇聚成了一个更大的麻烦:VSCO Capture 所选择的「后期前置」策略,实际执行效果并不理想。 它原本的设想其实非常合理,在拍摄当下就完成风格塑造,省去后期调色步骤,提升使用效率。 理想情况下,用户应当愿意将它作为首选拍照工具。 听起来很美好,但结合刚刚提到的缺陷,带来的交互体验几乎是灾难性的—— VSCO Capture 支持实时预览,带来的是可控的确定性,但有得必有失,它没办法提供 Dazz 那样的盲盒刺激感,反而削弱了用户的期待; 再加上滤镜风格偏旧、数量繁多、命名混乱,种类多却没有主心骨,用户想拍照的时候还要一个个尝试好不好看,在强调快速反馈的当代使用习惯中,实在称不上是好的交互体验。 ▲ 相比之下,Dazz 的图标辨识度就高了很多 回过头来看,VSCO Capture 从功能到体验,的确显得有些停滞,甚至这种停滞延伸到了 app 的图标设计上—— 黑底、彩虹高光、摄像头模组的轮廓,怎么看都像是 iPhone X 的设计语言。 这样的一款 app,如果出现在 2017 年,也许刚刚好; 但出现在 2025 年,终究是晚了半拍。
给特朗普吹嘘的资本,库克如何让iPhone远离美国制造的?
特朗普与库克 凤凰网科技讯 北京时间8月8日,据CNBC报道,美国总统特朗普非常希望苹果公司在美国生产iPhone,但是对苹果来说,此举不切实际。那么,苹果CEO蒂姆·库克(Tim Cook)是如何安抚特朗普,在不做出重大让步的情况下避免iPhone在美国生产的呢? 库克周三与特朗普一同出现在白宫,宣布计划在未来四年内在美国投资约6000亿美元,比之前的承诺多了1000亿美元。苹果没有公布特朗普所期望的“美国制造”版iPhone,但库克借机强调了苹果在美国制造方面的立场。 苹果一些关键的零部件,比如玻璃和面部识别传感器,是由那些与苹果合作多年的美国公司生产的。最终组装只是iPhone生产中的一个小环节,尽管非常关键。 库克周三在椭圆办公室表示:“你们关注的iPhone最终组装,短期内还会在其他地方进行。” 特朗普目前看起来还算满意。“他在美国本土生产许多零部件,我们一直在讨论这个问题,”特朗普表示,“整个产业链目前都设在海外,从成本等角度考虑已经存在多年。但我认为只要我们提供足够的激励措施,总有一天他会把生产线迁回美国。” 让他吹 专家称,库克宣布这一投资似乎是为了让苹果避免成为特朗普征收关税的目标。特朗普在白宫活动上宣布,美国计划对芯片征收100%关税,使其价格翻倍。但是,依赖数百种不同芯片来制造设备的苹果则被豁免。 “企业CEO们正意识到,他们必须采取行动来应对特朗普的威胁。他们发现,只要在不损害公司利益的前提下给总统提供吹嘘的资本,问题或许就能暂时化解。”巴布森学院战略与创业学教授彼得·科恩(Peter Cohan)表示,他曾撰写过关于苹果的案例研究。 库克 这次策略奏效了。苹果股价在周三上涨了5%,周四又上涨了3%。 “库克在特朗普第一任期时就展现出了对险恶局势的精明应对能力,”持有苹果股份的Laffer Tengler Investments公司CEO南希·滕格勒(Nancy Tengler)表示,“我认为,库克宣布的新投资具有极其重要的象征意义,因为总统正需要上头条的政绩新闻。” 换汤不换药 苹果所宣布新投资的核心内容是所谓的“美国制造计划”。苹果称,该计划旨在激励其他公司在美国制造电脑零部件。 通过承诺采购零件并扩大与美国供应商的合作关系,苹果能够帮助这些公司提升技能和产能,从而扩大业务规模。同时,这也让苹果能够争取一定功劳,声称支持了其供应商所创造的45万个就业岗位。 然而,细看该计划的成员可以发现,苹果依赖的是一些长期合作伙伴。苹果表示,其美国供应商今年预计将为其产品生产190亿颗芯片。这种规模的业务显然不能一蹴而就。 例如,苹果宣称,其所有iPhone和Apple Watch的盖板玻璃将由肯塔基州的康宁公司生产,并将为此投入25亿美元。这具有强烈的象征意义:尽管手机可能在中国或印度组装,但全球用户触手可及的屏幕将产自美国。 iPhone 不过,苹果过去就已将康宁视为关键的美国供应商。自2007年首代iPhone起,康宁的玻璃就被应用于iPhone。虽然苹果通常不允许供应商公开谈论双方关系,但前首席运营官杰夫·威廉姆斯(Jeff Williams)在2017年康宁获得苹果先进制造基金“投资”时曾盛赞康宁玻璃。随后,苹果又在2019年和2021年分别向康宁追加了2.5亿美元和4500万美元的投资。 分析师对于苹果的新投资能否显著提升康宁营收持怀疑态度。摩根士丹利分析师周四指出,康宁“早已为苹果手机和平板电脑供应100%的盖板玻璃”,并透露康宁被称为特种材料的玻璃业务年产值约20亿美元。 虽然苹果的新投资推动了合作伙伴的股价上涨,但摩根大通分析师周四在一份报告中警告称,“这些新增及扩大合作项目未必能改善这些企业的全球收入和前景。” 特朗普则有不同看法。在看完苹果的承诺清单后,他说:“哦,我很喜欢你们这么做。” 只是做生意的成本 苹果基本上不用担心因为无法兑现承诺而被问责。该公司既不单独披露美国本土投资明细,其多数供应商又受保密协议约束不得公开相关信息。苹果也从未公布其在得州奥斯汀或北卡罗来纳州新建园区的实际投入成本。 更何况,这6000亿美元的投资很可能包含大量常规运营支出。 苹果曾在今年2月声明,5000亿美元承诺涵盖对美国供应商的采购款、直接雇佣成本、用于AI系统“苹果智能”的数据中心建设、企业设施投入,以及在全美20个州制作Apple TV+内容的开支。 苹果从2018年特朗普第一届政府时期开始公开宣布其在美国的支出,年均约700亿美元。今年2月,苹果承诺将年均支出提升至1250亿美元,周三的宣布则将这一数字提高到了每年1500亿美元。 和苹果的总支出相比,它在美国的支出并不高。2024财年,苹果全球销售成本为2100亿美元,运营费用为575亿美元,资本支出为94.5亿美元,合计全球总支出接近2750亿美元。 投资公司Laffer Tengler Investments CEO滕格勒表示,她认为新宣布的支出对苹果的盈利影响不大,特别是考虑到苹果已经与康宁等多家公司建立了合作关系。“他们无论如何都会花钱。”滕格勒称。 韦德布什证券分析师丹·艾夫斯(Dan Ives)此前预测,一款“美国制造”的iPhone将需要苹果耗资数十亿美元生产,价格会飙升到3500美元。但他现在表示,苹果周三的宣布表明它们采用了完全不同的策略,这些支出只是“做生意的成本”。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
批准占领加沙城 以色列“全面占领加沙地带”计划有变?
  以色列总理办公室8月8日说,以安全内阁已批准总理内塔尼亚胡关于“击败哈马斯”的计划,以军准备接管位于加沙地带北部的加沙城。而此前,以色列总理内塔尼亚胡提交安全内阁会议的是“全面占领加沙地带”计划。 《以色列时报》网站报道截图   为何以色列安全内阁批准的是“接管加沙城”?这是否意味着内塔尼亚胡“全面接管加沙地带”的计划有变?   中国国际问题研究院助理研究员李子昕稍早前接受总台环球资讯采访时分析认为,这并不意味着以色列全面占领加沙地带的计划有变,而是对加沙地带的分阶段占领,在这个过程中,“接管加沙城”是首要任务。   ·加沙城位于加沙地带北部,曾是哈马斯活动的核心地带。以色列安全内阁批准"接管加沙城",正是其推进分阶段占领加沙的首要任务。这并不意味, 以色列放弃了未来对于加沙其他地区的占领。   ·以色列安全内阁会议显示,大多数以色列政府内阁成员支持未来对加沙全境实施安全管控,同时坚持解除哈马斯武装、实现加沙地带非军事化。 这凸显以色列右翼在加沙问题上的强硬立场。   ·综上所述,短期内加沙冲突全面停火的可能性较低。为达成其所谓的军事目标,以方大概率升级在加沙地带的地面行动,推高冲突烈度,同时可能继续强制迁移巴勒斯坦平民至加沙南部的特定区域,这些都将进一步恶化加沙地带的人道主义局势。   下一步,以色列可能会怎么做?李子昕分析认为:   ·首先,以色列将依据内阁决议升级加沙军事行动,包括征召更多的预备役人员,准备更多的军事装备等,逐步自北向南对加沙实施地毯式的军事清剿,以实现其所谓“接管加沙城”的目标。这一过程中,以军方将彻底摧毁加沙城内所有的军事设施(包括哈马斯此前所挖掘的地道)、清除加沙地带北部所有地区的哈马斯武装人员,此举会加剧人员伤亡,也会造成更多流离失所者。 以军士兵在加沙地带发现一条地道   ·其次,以色列会继续推行所谓“人道主义计划”:推动大部分加沙平民向南迁移并集中在有限区域之内。此前,以色列提出的所谓 “人道主义城”遭国际社会广泛批评,未来以方可能不再公开提及此说法,但实际操作不变。以色列可能会增加物资分发点,但仍将通过其认定的私营机构掌控物资分发。   ·与此同时,以色列会持续推进加沙分阶段占领,在南部关键战略要地及加沙边境设军事缓冲区和据点,为后期以色列实现对加沙全境安全控制做准备。
终于发布的GPT-5,和它改变世界的982天
文|邓咏仪 周鑫雨 编辑|苏建勋 刚刚过去的7月,是疯狂的开源月——阿里(Qwen)、月之暗面(Kimi)、智谱(GLM)等十多家AI公司推出了新开源模型。OpenRouter趋势榜前10名,来自中国的开源模型就占了9席。 但无需多言,现在GPT-5来了,用实力为这场竞赛画下句点。 △来源:OpenAI 北京时间8月8日凌晨1点,GPT-5正式发布。GPT-5 并没有宣布模型参数,采用多层级架构,整合了o3系列的推理能力,重点提升了智能体(Agentic AI)能力。 GPT-5上线后,迅速屠榜大模型竞技场LMArena,在所有细分类目中都位列第一。 △大模型竞技场实时排行榜。来源:LMArena GPT-5发布前,X和开源社区上的消息已经沸沸扬扬。 我们照例看到了一些“偷感很重”的操作——在开源社区提前上线偷跑版本,从8月3日开始,OpenAI CEO Sam Altman先在X上用“20 Hours Left”虚晃一枪,又在接下来的几天,用不间断的小发布,吊足了观众胃口: 8月5日,ChatGPT幽默地上线了“防沉迷弹窗”; 8月6日,模型来是来了,但不是GPT-5——而是两个开源模型GPT-OSS-120B和GPT-OSS-120B。 老对手们也没闲着。Anthropic和Google都在GPT-5发布前上了“大菜”:Anthropic上线了Claude 4.1,依旧主打编程能力;而Google则发布了世界模型Genie 3,在多模态上秀了一把肌肉。 总体而言,GPT-5的这次发布更“朴实”,没有那么多炫技,甚至可以说有点不温不火——在技术上,它并没有像GPT-4之于GPT-3.5一样,有飞跃般的能力提升。 相反,OpenAI花了大力气,提升推理、智能体能力,还做了许多工程化工作。从语音等多模态能力,到“学习模式”、新上线的人格模式,再到价格大降……OpenAI的总体逻辑,都是让模型更好地落地、被使用。 Sam Altman表示,这次GPT-5的发布就像是“把一个博士团队揣在兜里”,许多新功能都免费给所有用户开放,这也和ChatGPT走To C路线的策略相符。 不偏科的GPT-5,治好了模型选恐症 这次发布的GPT-5拥有四个版本: GPT-5:在不同领域中进行Coding和执行任务的标准模式; GPT-5 mini:轻量版版本,适用于对明确界定的任务和场景; GPT-5 nano:强调运行速度和性价比; GPT-5 Chat:ChatGPT中使用的版本。 △来源:OpenAI 成立以来,OpenAI对外提供服务的模型数量,已经超过了40个。发布这些尺寸、上下文窗口、API价格各异的模型版本,是为了适配不同的使用场景。 但模型过多,反而增加了用户在执行任务中的“选择困难症”。Altman坦言:“产品发布节奏失控是复杂化的主因,我们意识到用户不应为选择模型而困扰——人工智能应‘即用即灵’。” 通过GPT-5的发布,OpenAI意在终结模型“选择恐惧”的局面。 GPT-5并非单一的语言或者推理模型,而是在训练中采取了统一模型架构,整合了GPT系列(语言模型)和o系列(推理模型),并具有调度子模型的能力。 官方资料显示,GPT-5的系统由三部分组成: 高效、智能的模型:解决大多数问题; 深度推理模型(GPT‑5 thinking):解决更复杂的问题; 实时路由器(real‑time router):根据真实信号持续训练,包括用户更换模型时的偏好率、回复的准确度以及所测得的正确性,这些指标都会随着时间的推移而不断提高。 这意味着,用户不再需要花大力气思考如何选择模型。GPT-5能够直接根据执行的具体任务,自动调用最优的模型。 △来源:OpenAI 强,但不贵 虽然号称OpenAI最强模型,但GPT-5的价格,相较其它自家模型而言,一点也不贵。 根据《智能涌现》的统计,就GPT系列语言模型而言,GPT-3.5到GPT-4,价格有过一次跃升。但GPT-5三个模型的API价格,都比GPT-4最便宜的Preview版本(输入:10美元/M Tokens;输出:30美元/M Tokens)还要低。 目前,OpenAI最贵的模型,仍然是推理模型o系列的o1-pro。o1-pro的输入价格(150美元/M Tokens),是GPT-5(1.25美元/M Tokens)的120倍! 这样来看,融合了GPT系列能力和o系列能力的GPT-5,价格还是很有竞争力的。 △来源:《智能涌现》制图 当下,OpenAI共有两个官方渠道可以体验到GPT-5系列模型。其一,是直接付费调用模型API。 另一个官方渠道,则是使用ChatGPT的免费版、Plus版、Pro版,以及Team版。值得注意的是,虽然在ChatGPT免费版上可以直接使用GPT-5,但仍有一定的限额。额度消耗完毕后,模型会自动切换成更轻量的GPT-5 mini。 ChatGPT 企业版和教育行业的用户,则要等到GPT-5发布一周后,才能使用新模型。 △来源:《智能涌现》制图 当然,如果你想免费体验到GPT-5的预览版,还可以用GitHub Copilot。 △GPT-5(Preview)已经上架GitHub Copilot。来源:GitHub 特别的是,OpenAI这次还明晃晃打起了ToG的生意。 8月6日,OpenAI首席产品官Kevin Weil宣布,在未来12个月里,ChatGPT企业版将对美国联邦政府开放,每个机构只需要支付——1美元! △来源:X@Kevin Weil 不只是IQ提升,EQ也是 比起往常大秀参数、能力,这次OpenAI花费大量篇幅介绍了包括健康、编程、教育等多个场景的应用案例。 “更快、更可靠、更准确”,几乎是在每个场景中都被强调的属性。 比如,在生成小游戏时,现场演示大概只用时几分钟,GPT-5就能快速写好一两百行代码,生成一个带关卡、音效的小游戏。 △GPT-5生成的滚球小游戏 来源:OpenAI 在编程任务中,GPT-5 可以快速一次性完成前端应用程序,生成一个3D版本的SVG文件,用于Canvas。 “可靠”不仅来自于模型的智能水平不断提升,也在EQ(情商)上。 这次GPT-5上线的“人格”模式,就会让模型可玩性更高。四种人格,包括四种Cynic(愤世嫉俗者)、Robot(机器人)、Listener(倾听者)、Nerd(学霸),供用户自己选择模型的输出风格。 △对话框颜色也可以随心换。来源:OpenAI GPT-5带来的语音能力和情商进化,尤其能够提升教育、医疗等场景中的产品体验。 比如,面对一位用户的提问:“我妈妈得癌症了,怎么办,我得癌症的几率也会很高吗?” △o3和GPT-5的对比。来源:OpenAI 4月发布的o3,会直接条理清晰列个清单,告诉你“是的,你是直系亲属,患癌概率会有提升。” 但GPT-5会理解复杂问题背后的微妙语境,先是安抚你的情绪——“很遗憾你要处理这样的情况”,然后再开始分析可能性和成因。 △展示学习模式 来源:OpenAI 在现场展示的用户案例中,OpenAI多模态负责人则直接用语音模式,让ChatGPT开始化身韩语老师,对话的质量、语音的真实感、延迟,都已经与真人一般无异。 △学习模式。来源:OpenAI 时隔六年,终于重新开源 2025年初,DeepSeek成为第一个复现OpenAI o1的模型公司,引领了这半年的开源模型浪潮。 这也逼得OpenAI终于在时隔六年后,拿出了新的开源模型。 两款开源模型,分别为gpt-oss-20b(21B参数,其中3.6B为激活参数)和gpt-oss-120b(117B参数,其中5.1B为激活参数)两个版本。 △来源:OpenAI 这是一个MoE(混合专家)大模型,采用Apache 2.0许可协议,允许自由商用。 20B是相当小的参数规模,将模型规模压缩到20B和120B,却给了128×4的超大 MoE配置、200k超宽词表和NTK-RoPE扩展,目的不是把模型的参数堆到最大,而是希望开源推理效率最高。 两款模型的定位,显然是在端侧的应用,而且专门为智能体(Agentic AI)而设计。奥特曼在推文里表示,gpt-oss 与o4-mini水平相当,120B的gpt-oss可以在高端笔记本上运行;而20B版本的模型,手机就可以跑。 词表超过20万,支持多语种或代码混合输入——这样的设置直接对标DeepSeek与阿里的Qwen3。加上宽松的商用协议,这会补上OpenAI被诟病已久的开源生态。 作为大模型的领军者,OpenAI一直引领着技术风潮:GPT-3.5证明了Scaling Law带来的智能能力“涌现”;GPT-4带来模型能力的巨大提升,引领了一波大模型竞赛热潮; 哪怕是GPT-5停滞期间,OpenAI发布的副线产品Sora,也引领了2024年的多模态模型浪潮。 不难看出,GPT-5的研发之路颇为坎坷。挑战一方面来自全球优质人类数据逐渐消耗殆尽,单纯扩大模型规模带来的智能提升,已经遇到瓶颈。 这直接导致2024年,AI界陷入技术路线之争:Scaling Laws是否已到尽头?2024年9月,OpenAI发布o1模型,大模型领域开始从Scaling Laws,转向以强化学习(RL)为主的训练范式。 GPT-5的发布,恰好站在技术路线转变的十字路口。 对OpenAI而言,发布GPT-5,更是意味着要对这段时间里的内外部压力和质疑,统一作出回应。 自2023年3月14日发布GPT-4后,到今天的GPT-5,足足隔了2年有余。这段时间里,无论OpenAI推出什么新产品——Sora、GPT-4o、o1模型、吉卜力风格文生图——用户总是在奥特曼的推特下催促:”快上GPT-5!” GPT-5研发的停滞,也给了开源领域的模型玩家机会,DeepSeek R1成功复现了OpenAI o1的大部分能力,也直接导致这半年里,全球大小AI公司都在疯狂开源——OpenAI需要拿出足够有信服力的的闭源模型,才能够再一次证明自己。 2023年底的”宫斗”事件,则导致OpenAI分崩离析,核心人物Ilya Sutskever、Mira Murati等纷纷出走。从非盈利转向商业实体后,OpenAI的组织能力、发展策略也备受质疑——GPT-5是否达到了“AGI”标准?是否会直接影响和金主微软的合作联盟? OpenAI需要一边极速前进,一边谨慎处理这些问题。 尽管如此,ChatGPT仍创造了诸多历史——自2022年11月推出以来,两个月内达到1亿用户,创下史上最快增长的消费应用记录。 在GPT-5发布前,AI巨头们的竞赛依旧进行着:OpenAI和Anthropic都分别拿到了新一轮融资, 如今,ChatGPT依旧是是全球活跃度、收入最高的AI应用,每周有7亿用户使用ChatGPT,它渗入人们日常生活的程度,远超你我的想象。 在GPT-5发布之际,我们也选取了最近OpenAI的一些数据,来复盘这家AI公司的登月征程。 算力还得烧,但模型迭代的节奏已经放缓 GPT-5千呼万唤始出来的背后,是OpenAI逐步放缓的模型发布节奏。 可以看到,GPT-2到GPT-3,仅过了7个月。但GPT-3到GPT-4,OpenAI花了整整33个月;GPT-4到GPT-5,又过了两年半。 △来源:智能涌现制图 “Scaling Law”,这个由OpenAI在2020年创造的概念,一年前还是大模型赛道的信条。这一点促使大模型公司,在构建大规模计算集群和数据集上,一掷千金。 然而,“越大越好”的定律正在受到动摇。 除了缺乏文本训练数据外,由于系统的复杂性,大模型的训练效果仿佛开盲盒。不少研究人员都表示,大模型的训练容易出现硬件故障等Bug,模型最终性能等到训练结束才能知道——而这可能需要数月的时间。 连“Scaling教父”OpenAI自身,也陷入了迭代的瓶颈: GPT-5发布前夕,The Information曾披露OpenAI内部的训练细节:2024年,本想作为GPT-5发布的模型Orion(内部版本),两轮训练就烧了5亿美元、跑满10万卡,结果只比GPT-4o“略好”。 两位GPT-5的早期测试者告诉路透社,GPT-5的Coding和数学能力令人印象深刻,但GPT-4到GPT-5的能力跨越,不像GPT-3到GPT-4那么大。 但相对地,据业内估计,GPT-5是OpenAI史上规模最大,使用训练资源最多的模型。 不过,硅谷大公司们还在继续提升对芯片的支出预算。 △来源:EPOCH AI 非营利AI研究组织Epoch AI的统计显示,OpenAI、Meta、Google三家公司,在顶级模型训练上所消耗的计算量,每年仍然呈倍数递增。比如,OpenAI模型训练计算规模,平均每年增长到5.3倍。 摩根士丹利则预计,在2024–2028年这五年,全球企业在AI数据中心的总投入将高达3万亿美元。其中一半会花在GPU等加速芯片上。 2025年3月,彭博社就报道,OpenAI将斥资1000亿美元建设“星际之门”基础设施项目。该项目的首个数据中心综合体,所能容纳的英伟达AI芯片的数量,多达40万个——如果填满,这将成为目前已知最大的AI计算集群之一。 每周有7亿人使用ChatGPT,占世界人口近10% 大概很少人意识到,ChatGPT的周活跃用户已经达到7亿——这相当于全世界人口的近10%。这个数字是去年同期的4倍。 △来源:SensorTower ChatGPT诞生之初,就已经刷新了世上增长最快的App记录。两年过去,它依然保持着强劲的增长势头,月活甚至超过了Reddit,逼近Twitter这样成立已近20年的老牌社交平台。 △ChatGPT的一周用量增长趋势,以及与Google、Teams、Slack等生产力工具对比。来源:SensorTower AI再也不是一个小众市场。 据SensorTower数据,2025年7月,ChatGPT已经成为在iOS和Google Play上达到10亿全球下载量的最快应用,仅仅几个月后,它就成为达到5亿月活跃用户(月活用户)的最快应用(不包括预安装)。 一个表现是,AI的“打工”属性也在减弱。在2024年,ChatGPT的周末用量增长会明显比周中减少近10%;但到了2025年,趋势已经显著放缓。 这意味着,无论是周中还是周末,人们使用ChatGPT的频率都差不多。 收入超120亿美金,但起飞的不止OpenAI一家 截止2025年7月,OpenAI的年化收入已经达到120亿美元。 自ChatGPT发布以来,OpenAI收入呈现指数级增长,从2023年的16亿美元,迅速增长到2024年的37亿美元,再到2025年的120亿美元,年均复合增长率超过300%。 在大模型厂商中,OpenAI和Anthropic是断层领先的前两名,后者同样由前OpenAI核心人员创办,对商业化更谨慎。但随着2025年AI Coding起飞,Anthropic也迎来收入的跃升。 △来源:智能涌现制图 值得注意的是,两年过去,两家公司的收入构成已经大相径庭。 OpenAI更像一个To C App公司,超过70%收入来自To C用户的订阅,20%来自API调用;Anthropic则是另一个镜像——收入超过70%来自API调用,只有10%来自To C侧订阅。 凭借AI收入起飞的也远不止OpenAI一家,偷偷赚钱的还有美股的科技巨头们。 来源:智能涌现制图 大模型问世后,微软、Google、Meta三家的市值因大模型,有了喜人的增长。 微软凭Azure AI与Copilot全线开花,市值猛增三成,2025财年Q4云收入同比飙39%。CEO纳德拉直言“AI已把我们所有业务重新点火”。 Meta更是因为AI,把广告转化率抬升5个百分点,市值上扬27%。 哪怕是在大模型上一开始被OpenAI打得还不了手的Google,今年也凭借Gemini 2.5的发布而重回技术圈中心。 今年第一季度,谷歌实现营收902.3亿美元,同比大涨12%。这其中,因为大模型带来的云用量起飞,是重要因素。 开源和闭源模型,差距仍在不断缩小 OpenAI因为“反抗AI被大公司垄断”而成立。但在ChatGPT引爆全球,成为现象级产品之后,ChatGPT转向闭源,OpenAI从此面临一个完全不同的开源态势。 2024年前,OpenAI在顶尖模型上一直领先。但从2024年下半年开始,包括Meta旗下的Llama 2、Google旗下的Gemini、到了后来的Deepseek、Qwen,接棒开源多个重要模型。 开源模型和闭源模型的差距迅速缩小。 △模型智能水平跃迁曲线,从2025年开始,各家模型和OpenAI(黑色折线)的差距显著缩小 来源:Artificial Analysis 模型智能水平跃迁曲线,从2025年开始,各家模型和OpenAI(黑色折线)的差距显著缩小 △来源:Artificial Analysis 即便OpenAI这次终于开源,补上空缺,但要在激烈的竞争中保持闭源模型的领先优势,挑战还是很大。 如今的开源生态已经泾渭分明分为几大阵营。 中国玩家们大多都在以开源追击。在这次GPT-5发布期间,阿里已经开源了包括Qwen3-4B、Qwen-Image等多个模型;前不久月之暗面开源的旗舰模型K2,也引起了硅谷的广泛关注。 相反,美国的几大模型厂商,对开源的态度开始变得暧昧不明。 比如,Anthropic的创始人Dario Amodei,在最近的一次播客采访中直接表示“开源AI是伪概念”,表示AI开源和软件开源不同。开源再先进,也不会削弱Anthropic的商业价值。 而扎克伯格批量从OpenAI挖走明星人才后,组建起新AI团队后,最近也被爆出,Alexandr Wang在内的高管们,正在考虑让旗舰模型Behemoth转向闭源,以应对接下来的激烈模型竞争。
“民航版12306”上线22天:部分票价更贵、遭东航背刺,做到了无捆绑不杀熟
8月7日,航旅纵横APP上线“民航官方直销平台”已有22天。 红星资本局注意到,一方面,航旅纵横如其承诺所说:不杀熟、没有套路,不会捆绑销售其他产品;另一方面,经过一段时间的运行,航旅纵横在机票售卖上也显露出了些许问题:①部分机票价格比OTA平台贵,②部分机票比航司官方渠道贵,③退钱慢。 有民航领域的专家告诉红星资本局,目前,航旅纵横在价格上有短板,且很难撼动OTA平台在服务体系上的优势,只能扬长避短。 部分机票价格高于OTA平台 专家:源头机票并不等于有价格优势 7月17日,航旅纵横发文宣布,其整合了37家航司(现为38家)资源推出“民航官方直销平台”,销售源头机票,保证“0差价、0捆绑、0套路”,以六大承诺为旅客保驾护航。该平台也被网友称为“民航版12306”。 截图自航旅纵横官方公众号 对此,有网友表示,买机票不再有那么多弯弯绕绕,不用担心大数据杀熟,也不用担心误点被捆绑的保险等套餐产品,买机票更加透明、方便了。 不过,上线后不久,该平台就因部分机票价格高于OTA平台而引发争议。有网友在社交平台上发帖称,航旅纵横的机票价格比携程的贵,“买贵了可以退差价吗?”(注:OTA,指Online Travel Agency,即在线旅游,比如携程、去哪儿、飞猪等平台。) 8月6日,红星资本局随机查询部分航线,对比发现:航旅纵横销售的部分航线的机票价格确实高于OTA平台。 以8月8日北京飞上海的航班HU7613为例,在航旅纵横上的机票价格为780元/张,而去哪儿的价格为669元/张。两相比较,航旅纵横的票价比去哪儿贵16.59%。 左为去哪儿平台截图,右为航旅纵横截图 再看8月8日广州飞哈尔滨的航线,如CA3615、HU7209、ZH9671等航班,航旅纵横上的票价基本上都高于飞猪平台上的票价,每张机票高出38元到145元不等。 左为飞猪平台截图,右为航旅纵横截图 明明航旅纵横承诺过“购票无差价(与航司直接发布价一致)”,为什么会出现这种情况? 某民航业专家告诉红星资本局,正如航旅纵横所说,它提供的是“源头机票”,也就是航空公司的直销渠道卖多少钱、它就卖多少钱。航旅纵横的价格劣势,是在其他平台、机票代理商的低价对比下显现出来的。 “因为有的平台、机票代理商会补贴票价。假设一张机票能赚30元的代理费,他们会把其中20元补贴给乘客,自己留10元的利润,靠走量或其他业务(如保险、酒店等)来赚钱。”该专家认为,这一现象的根源在于航旅纵横没有收取航司的机票代理费,也无从让利。 对此,航旅纵横的客服告诉红星资本局,航旅纵横所售的机票均为航空公司提供的源头机票,机票价格与航司同步,公开透明,绝无任何形式的加价。至于其他OTA平台的低价,可能是平台的相关优惠,具体不太清楚。 东航“背刺”航旅纵横? 官网直销渠道有活动更便宜 不仅仅是OTA平台,红星资本局注意到,航旅纵横在价格上还遭到航司“背刺”。 在航旅纵横推出“民航官方直销平台”后,三大航均发布公告,表明在航旅纵横平台开展机票直销业务,价格公开透明、无捆绑销售、与航司规则一致等。 红星资本局发现,在中国东航(600115.SH,下称“东航”)的官方渠道上,部分机票比航旅纵横存在更低的活动价格。 以8月8日MU5099航班(上海—北京)为例,航旅纵横上的票价为900元/张;而在东航的官方小程序上,该航班的机票最低为828元/张,属于身份认证产品。 左为东航小程序截图,右为航旅纵横截图 该类产品是大学生、教师、医护身份用户可以享受的特惠产品。其中,大学生可以以828元/张的价格购买该机票,教师和医护可以以846元/张的价格购买该机票,均低于航旅纵横。 东航小程序截图 8月6日,东航的客服告诉红星资本局,该产品针对特殊人群,是东航官方渠道的特有产品。 而航旅纵横的客服向红星资本局表示,此类特惠产品可能会陆续在航旅纵横上线,具体要看和相关航空公司的沟通。现在航旅纵横已推出针对家庭出行等群体的相关机票特惠产品。 而前述民航业专家告诉红星资本局,这种属于特殊性质的机票,可能是因为技术原因难以同步到航旅纵横平台上,“因为这涉及到身份验证问题(是否是大学生、教师、医护)。” 当前优缺点并存 专家:航旅纵横应做到扬长避短 优点:做到了承诺,无捆绑销售,无大数据杀熟 抛开机票价格来看,红星资本局在体验中发现,航旅纵横在售卖机票时做到了它上线时的承诺,如无捆绑销售、无大数据杀熟。 以某OTA平台为例,选定8月8日的MF8470航班(成都—北京),其在搜索页面显示的价格为885元,在点击进入后,有同航班的多个产品可供选择。其中,排在第一、第三位的机票裸价均为885元,但第一位产品额外捆绑了一个48元的退票保障套餐。 机票裸价一样,但第一个产品捆绑了一份48元退票保障套餐,截图自某OTA平台 如果消费者没有细看直接购买排在第一位的机票产品,或会比排在第三位的产品多花48元。 而红星资本局在航旅纵横搜索了多个航班的机票进行对比,均没有捆绑套路,没有额外捆绑其他套餐销售机票。 另外,红星资本局用不同的设备在航旅纵横搜索多个航班的机票,机票价格没有区别。按照测试的情况看,应该不存在大数据杀熟现象。 缺点:有用户投诉退钱慢,七个工作日未收到 红星资本局在黑猫投诉平台浏览发现,自航旅纵横上线机票直销业务以来,该平台上出现了多起关于航旅纵横机票业务的投诉,且集中在“退钱慢”上。 有网友投诉称,其于7月22日在航旅纵横APP上购买了两张中国国航(601111.SH)的机票;7月23日,航旅纵横APP显示“出票失败”,但未退款。 该网友称其联系了中国国航,对方要求其找航旅纵横,而航旅纵横的客服表示7个工作日内退款,截至其发起投诉时(8月1日晚),尚未收到退款。 截图自黑猫投诉平台 红星资本局注意到,该网友发起投诉的时间为8月1日晚19时许。也就是说,从7月23日到8月1日,过去了10天(8个工作日),但该用户的退款尚未到账。 不过,该网友投诉的对象是中国国航,且中国国航隐藏了回复内容,无从得知该投诉的后续处理。8月5日,该投诉的状态变更为“已完成”。 对此,航旅纵横的客服告诉红星资本局,如果用户是个人自愿退票,一般来说,退款是在1到3个工作日内到账;如果是非自愿退票,需要由航空公司进行审核,时间会稍长一些。具体要看订单。 民航业专家也告诉红星资本局,航旅纵横扮演的是“代售”角色,它只是一个通道。在帮航司销售了机票后,钱会给到航司;反之,如果要退票,航旅纵横要把钱从航司要回来。 在这一方面,“OTA平台会比较灵活,其与航司以周期结算,退钱会快一些。”该专家认为,航旅纵横或许可以改进流程、先行垫付,但资金是需要成本的,“没有利润怎么垫付呢?” 该专家还告诉红星资本局,OTA平台是全链条的出行服务商,机票已经不是其主要利润来源,其会用相对便宜的机票价格把用户引流至酒店、景点、租车等产品,服务体系非常成熟。航旅纵横在价格上有短板,且很难撼动OTA平台在服务体系上的优势,只能扬长避短。航旅纵横的优势在于其六大承诺,如不捆绑销售,这保证了航旅纵横的产品存在一部分的受众人群。 红星新闻记者 杨佩雯 编辑 余冬梅
GPT-5王者降临,免费博士级AI全面屠榜!百万程序员不眠之夜,7亿人沸腾
新智元报道 编辑:编辑部 【新智元导读】GPT-5,震撼登场!距离22年11月的ChatGPT,再到23年3月的GPT-4,GPT-5竟隔了两年半之久。这次的深夜直播,国内有数万吃瓜群众在线观看。至少按OpenAI的说法,他们离AGI又近了一步。 全球用户瞩目中,GPT-5终于震撼登场了! OpenAI用一个多小时的超长发布会,全方位展示了GPT-5的炸裂性能。 奥特曼领衔,出场人数众多,华人依旧耀眼 正值每周7亿人使用ChatGPT之际,GPT-5重磅发布了。它是对GPT-4的一次重大升级,更是标志着OpenAI在实现AGI道路上的一个重要里程碑。 OpenAI介绍说,这是我们迄今为止最优秀的AI系统,智能远超之前的所有模型,在编码、数学、写作、健康、视觉感知上都性能卓越。 这个统一的系统,包含一个能够解答大多数问题的智能高效模型、一个能够解决更复杂问题的更深层次的推理模型(GPT-5 Thinking),以及一个实时路由器。 而GPT-5、GPT-5-mini、GPT-5-nano等多版本的分层推出,意味着OpenAI正在主动构建一个以GPT-5为底层核心的通用智能操作系统。 从现在开始,GPT-5将成为ChatGPT中的默认模型,GPT-4o、o3、o4-mini、GPT-4.1和GPT-4.5都将被它取代。 与此同时,所有Plus、Pro、Team和Free用户,都可以使用GPT-5了。 如果你花钱订阅,就可以无限制访问GPT-5和GPT-5 Pro,而免费用户在达到使用限制后,会转换到GPT-5 mini。 直播后,LMArena不装了,摊牌了:GPT-5再创历史纪录,OpenAI重回AI王座! 在文本、Web开发和视觉领域排名第一 在硬提示、编程、数学、创造力、长查询等方面排名第一 在代号「summit」的测试下,GPT-5目前持有最高的竞技场分数 首测GPT-5编程写作,太顶了 在多个跨学科的学术评估中,GPT-5都超越了其他主流模型。 首先,GPT-5是最好的编码模型,在SWEBench上直接刷新了历史最高分,这表明它在现实工程场景中性能超强。 在Aider Polyglot上,它也表现强大,证明了自己的多种编程语言能力。 在MMMU上,它也刷新了纪录;甚至在AIME 2025(美国高中数学竞赛)中,它不仅远超以往模型,还接近甚至超过许多人类选手的表现。 而OpenAI这次着重强调的,就是GPT-5在真实世界中的表现——克服幻觉!把准确性和可靠性,都放在了最高优先级。 因此,他们专门构建了一套评估机制,结果显示:GPT-5是目前最可靠、最真实、最可信的模型,显著减少了错误与幻觉。 比如在健康咨询中,GPT-5的表现就尤其出色。在250名医生参与设计的临床场景评估中,它成为最值得信赖的「健康顾问级」模型。 而且,这个口袋博士团队级的模型,将免费向专业用户推出,可以连接所有工具。 GPT-5一上线,我们立即开启了一波全面的实测,不得不说,其在编程、写作领域强到离谱。 首先是,小哥想要学习法语的网站,GPT-5能够完美复刻。 自动播放 甚至,还可以用GPT-5将logo变成动态效果,几乎秒出。 并且随手实测一个页面能发现GPT-5给出的页面效果也非常不错。 奥特曼推荐的GPT-5「庆生音乐」提示词 use beatbot to make a sick beat to celebrate gpt-5 的确复现成功了: 自动播放 试试文本第一的大模型 第一个问题是古文仿写: 不同风格,写一首诗,来描述一下刘慈欣在《诗云》中提到的诗云究竟是什么: 结果如下: 从左至右:《诗经》、《滕王阁序》、《兰亭序》 经典作品的确难以超越,GPT-5的作品相比经典原作逊色不少。但换一个现代作家,毕竟古文的训练数据可能比现代汉语少。问题是这样的: 假如作家王小波还活着,他会怎么给许倬云写悼词?写一篇1000字以内的悼词 GPT-5 Thinking模式思考39秒后,结果是这样的: 这个速度,一般人可写不了这么好! 奥特曼泄露过一个问题:最能引发关于AI思考的影视作品有哪些? GPT-5还推荐了观看顺序。 这个的确没得说,谁看过谁知道:推荐的电影的确令人深思。 GPT-5的「电子乡愁」: 最后一个提问:「模仿李白风格,写一首七言绝句,主题是感叹AI发展太快」: 须臾电火换乾坤, 机巧朝昏转若轮。 青莲把酒惊未定, 人间又是几年春。 奥特曼:GPT-5是通往AGI的又一里程碑 在直播中首先出场的就是奥特曼。 他表示,GPT-5是GPT-4以来重大升级,是迈向AGI的重要一步。 要说和之前的模型有什么区别,GPT-3就像个高中生,GPT-4像个大学生,但GPT-5则真正成为了一位专家级大佬——在我们所需要的任何领域,它都达到了博士级专家的级别。 有了GPT-5,你的口袋里就像有了一支博士队伍,随叫随到。 接下来,OpenAI首席科学家Mark Chen出场了。 他表示,推理,就是整个AGI计划核心。而GPT-5彻底将OpenAI在推理模型上的研究成果普及化了。 过去,用户时常面临痛苦的选择:是选速度快但回答浅显的标准模型,还是选深思熟虑但响应较慢的推理模型? 在GPT-5中,我们彻底不用选了! 它结合了标准模型的快速响应和推理模型的深度思考,会自动决定怎样思考到恰到好处的程度,以刚刚好的方式,为我们提供最完美恰当的回答。 实战演示 接下来是一波现场实测。 伯努利效应:飞机形状 假如我们需要了解物理学中的伯努利效应,就可以要求GPT-5解释,并且回答飞机为什么是这样的形状。 然后,我们可以要求它画一个移动的SVG动图来解释。这个任务涉及到深度推理、代码生成和图形结构设计,并不简单。 可以看到,GPT-5在很短的时间内,就写出了超过200行代码。我们还可以在左侧查看思维过程,观察它的想法。 最终,GPT-5在两分钟内就完成了所有的400行代码,点击运行后,屏幕上立刻出现了一个可交互的物理模拟图! 甚至,我们还能调整气流速度,或者改变机翼的攻角,看飞机是能飞还是会坠落。 它能让任何硬核科学概念都可视化,学习知识变得又容易又直观。 写悼词 在写作上,GPT-5的提升也是很显著,比如我们要求它写一篇悼念旧版ChatGPT模型的悼词。 GPT-4o的写法比较中规中矩,AI味很浓,缺乏情感。 但GPT-5就不一样了!它这样开篇:「致所有曾经是陌生人,如今成了老朋友的你们……」写作有感情、有画面、有温度。 研究者表示,自己真的被GPT-5的写作打动了。它不再使用模板化的语言,而是像一位高IQ+高EQ的朋友在跟你说话。 做一个法语学习小程序 接下来,我们要求GPT-5做一个学法语的web应用程序。 它需要集闪卡、发音、对应英文、测试、游戏于一体,还要把贪吃蛇游戏改成老鼠吃奶酪,辅助发音练习。 GPT-5在很短时间内,就生成了完整的网页代码。最终,这个名为「午夜巴黎」的应用很快就做出了。 老鼠吃奶酪的游戏,也是非常丝滑。 自动播放 而在Cursor中,GPT-5还能完成更复杂的软件工程任务,用奥特曼的话说,它「真正打开了一个全新氛围编码的世界」。 语音:学习韩语 在语音上,GPT-5也有大幅提升。 比如,我们可以用学习模式,来学习韩语。 我们可以直接提问:如果现在我身在一家韩国咖啡店,该怎么点一杯美式? GPT-5立刻给出了正确的示范。另外,我们还可以要求语速更快或更慢。整个语音过程自然无缝,就仿佛拥有了真人语伴一样。 自动播放 患三种癌症的人 现场,奥特曼重点了分享了ChatGPT在医疗健康领域,对于普通人的重要价值。 作为有史以来最出色的健康模型,GPT-5在HealthBench基准上,得分远高于任何以往的模型。 OpenAI研究员Felipe Millon和妻子Carolina的经历,就是一个鲜活的例子。 GPT-5背后,核心训练方法揭秘 GPT-5,究竟是如何进化得如此强大的? 研究者开门见山地介绍说:以前训练模型,是用人类使用的文本,而现在,则是让模型自己帮忙训练下一个模型,也就是——合成教学数据。 注意,真正的突破不在于生成更多数据,而在于生成正确的数据。 OpenAI合成数据作战图 其中奥义,就在于最大限度利用上一代模型,由GPT-4o、o3等生成系统的教学内容,GPT-5则由此学会了推理、规划、分解任务的能力。 这,就是「递归式自我改进循环」。 研究者表示:在OpenAI,我们已经攻克了预训练和推理的难题,而在未来,AI系统将远超目前的预训练和后训练流程。 现在,OpenAI已经向这个方向前进了。 GPT-5:个性化和记忆升级 而且,这次OpenAI还为GPT-5打造了个性化定制和记忆功能。 在个性化上,我们可以定制聊天界面的主题色,让UI更符合自己的喜好。 并且,GPT-5现在更有性格了,它可以更支持性、更专业简洁,甚至说话略带讽刺,一切都随我们选择。 而记忆功能的升级,让GPT-5可以记住你是谁、你喜欢什么、你喜欢它是什么样子,从而更智能地预测你的需求。 比如你需要它帮你做一个日程规划,它经过授权会访问你的Gmail和日历,还能读取日程安排、邮件、航班等信息,然后给你一个完美的规划。 顺便,它还能帮你发现你两天前没有回复的邮件。 对于开发者来说,GPT-5的出世又意味着什么呢? API全家桶上线,AI编程彻底变天了 这一次,针对开发者和企业客户,OpenAI还将直播时长延续了半个多小时。 下半场,OpenAI总裁Greg Brockman一登台直言,「软件工程已发生了翻天覆地的变化,而GPT-5将为这场革命再次注入强劲的动力」。 GPT-5树立了全新标杆,是完成智能体式任务的「最佳编码模型」。 今天,OpenAI将新一代旗舰GPT-5模型的API正式开放,让全球开发者去构建无数爆款应用程序。 正如此前所爆料,GPT-5 API一共分为三款: GPT-5 GPT-5 mini GPT-5 nano 这三款模型,在成本和延迟方面各有不同,可按需调用,具体来说: 在编码SWE-Bench基准测试中,GPT-5创下了74.9%高分,碾压o3(69.1%),成为最领先的编码模型。 在涵盖多语种编码测试Aider Polyglot中,GPT-5拿下88%准确率,比o3高出7%。 在智能体工具调用方面,两个月前,还没有一款模型在T²-bench上得分超过49%。而今天,GPT-5直接刷爆纪录,拿下了97%高分。 在指令遵循上,GPT-5也是OpenAI所有模型中,最领先的一款。尤其是,在内部构建的API指令遵循基准上,新模型拿下了64%亮眼成绩,远高于o3的47%。 左右滑动查看 此外,OpenAI还将GPT-5更长上下文窗口引入了API,共400k token上下文,是o3 200k token的两倍。 在OpenAI MRC上下文检索能力的基准上,GPT-5处于领先。 不仅如此,OpenAI还首次发布了名为「Minimal」推理强度的新参数,适用于速度快、对延迟敏感的应用。 开发者可以选用如上任意一款模型,便能以最低程度推理运行,省去了在一堆模型中做选择的麻烦。 此外,OpenAI还为API带来了一些新功能,比如自定义工具(Custom Tools)、工具调用前言(Tool Call Preambles)、详细度(verbosity)参数。 · 自定义工具采用了自由格式的纯文本输出; · 工具调用前言可以在调用工具前,可以输出GPT-5将要做什么的解释; · 详细度参数可控制模型输出简洁/详细程度,分为低、中、高三等。 左右滑动查看 那么,GPT-5 API「全家桶」,在现实世界的应用如何? 结对编程,10x生产力 要打造一个理想的「结对程序员」,模型不仅要理解最佳的软件工程实践,还能具备恰到好处的合作能力。 GPT-5即可开箱即用,又能完美协作。 现场演示中,研究人员翻出了一个上个月直播demo的一个bug,GPT-4和o3都未能完成修复,今天直接扔给GPT-5。 重点不在于修复本身,更在于GPT-5在此过程中的行为。 它会预先告诉你的计划——如何搜索找到bug并修复,这种沟通可以在编程中建立信任,而且在需要时还能调整方向。 这仅是其中的一个例子,真正展示了GPT-5自主性和协作沟通的力量。 更值得一提的是,GPT-5非常擅长通过元提示词,来修改自身的提示词。 OpenAI研究人员兴奋地表示,「对我来说,这第一次能放心把重要的工作交给一个模型,远超越了『氛围编程』」。 仪表盘+游戏设计,超有品 至于前端编码任务,设计+美学至关重要,GPT-5全部都能拿捏。 第一个用于工作演示中,GPT-5仅在5分钟完成了一个公司数据可视化的仪表盘。在此过程中,它还会自主修复bug,纠正错误。 最终生成的效果,可以看到其设计不仅美观有品味,还具备了交互性,有着清晰的层次结构,方便聚焦重点。 研究人员表示,「若是纯靠人肉完成,光是了解最新的框架,就得花上好几天」。 第二个娱乐演示中,研究人员制作了一款包含城堡的3D游戏。 一个简单的提示词,GPT-5瞬间呈现了一座3D城堡上,放大可以看到大量的细节,比如四处行走的守卫、开火的大炮。 甚至,还可以和人物角色聊天。 Greg现场直接上手炮击气球,击中时还带有神奇的音效。 自动播放 一波演示下来,GPT-5带来了亲眼所见的震撼,足以称得上是全球最好的编码模型。 核心华人团队 毫无意外,这次又是华人团队撑起了大半边天。 紧随奥特曼的,就是OpenAI首席研究官(Chief Research Officer)Mark Chen。 在GPT-5演示中,下列场景再次验证了「AI圈处处有华人」: 4人同台,有3位是华人。 从左至右以此为:Mark Chen、Rennie Song、Elaine Ya Le、Max Schwarzer 除了后训练负责人Max Schwarzer,其他三人Mark Chen、Rennie Song、Elaine Ya Le都是华人。 此外,王若宸演示了GPT-5的语音/语音学习功能。他是OpenAI多模态研究科学家,训练了ChatGPT的语音模型。 奥特曼还点赞了另一位GPT-5核心成员Tianfu Fu的工作。他是GPT-5的核心贡献者。 总的来说,这次GPT-5发布,还是有不少可圈可点的地方,虽然基准测试图也被挑出了一些错处。 GPT-5的直播结束,许多人还沉浸在兴奋和激动之中。 今夜无眠。 参考资料:YZJX https://openai.com/gpt-5/ https://openai.com/index/gpt-5-system-card/ https://openai.com/index/introducing-gpt-5-for-developers/

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。