行业分类:
加载中...
头条分类:
加载中...
消息称三星2026年推全新Galaxy Book,搭载骁龙X2 Elite芯片
IT之家 9 月 26 日消息,据科技媒体 SamMobile 今天报道,内部人士透露,三星将在 2026 年推出全新 Windows on Arm(WoA)版本的 Galaxy Book 笔记本,搭载高通骁龙 X2 Elite 系列芯片。 高通骁龙 X2 Elite / Elite Extreme 芯片已于昨天发布,基于 3nm 工艺打造,宣称是“目前最快、性能最强大、能效最高的 Windows PC 处理器”,其中 Extreme 版采用 24 核心设计,号称是首款达到 5GHz 的 Arm 芯片。 骁龙 X2 Elite Extreme 的型号是 X2E-96-100,而 X2 Elite 拥有两种变体,型号分别为 X2E-88-100(18 核)和 X2E-80-100(12 核),IT之家附具体架构设计如下: 12 核 X2 Elite:6 个高性能核心 + 6 个效率核心 18 核 X2 Elite & 24 核 Extreme:12 个高性能核心 + 6 个效率核心 与去年的骁龙 X Elite 芯片相比,新芯片性能提升 31%,功耗降低最高 43%,其中 X2 Elite Extreme 内置的 Adreno GPU 频率为 1.85GHz,Elite 系列的 GPU 频率最高 1.7GHz,支持 DX12 Ultimate、Vulkan 1.4、OpenCL 3.0 等特性。 此外,新芯片还支持外接 3 块 5K 60Hz 显示器,也可以外接 3 块 4K 144Hz 显示器,其 GPU 能效相比上一代提升 2.3 倍,两款芯片均支持 LPDDR5X 内存,可适配 PCIe 5.0 NVMe、UFS 4.0、SDUC / SDXC 等存储媒介。 这两款芯片都将在 2026 年春季上市,预计三星将在 Galaxy Book Edge 笔记本中率先搭载。
15.98万元起,广汽传祺向往S7 PRO+系列插混SUV上市
IT之家 9 月 26 日消息,广汽传祺向往 S7 PRO + 系列今晚正式上市,售价 15.98 万元起: 205km Pro+ 版 15.98 万元 205km Pro+ 激光雷达版 17.98 万元 该车支持 5 年 10 万 0 息,还有价值 25000 元城区 NDA 免费送、至高 300 万元全场景智行保障,首任车主还可享三电终身质保。 外观方面,该车车身尺寸为 4900x1950x1780mm,轴距为 2880mm,砍掉了 AI 情绪大灯、D 柱能量呼吸灯。 内饰方面,该车全系搭载高通骁龙 8295P 芯片,搭配全新 PAD 化车机界面,支持 10 年系统迭代;27 吋 HUD(IT之家注:激光雷达版),还将手机生态无缝融入车机,整合了 QQ 音乐、网易云、爱奇艺、B站、喜马拉雅等音视频平台,砍掉了第二排的吸顶屏。 传祺向往 S7 可选配可变焦、中长距激光雷达,探测精度达到厘米级,还有 27 组高精度传感器,搭配英伟达 Orin-X 芯片,以及与 Momenta 合作开发的端到端智驾大模型。 传祺向往 S7 PRO + 系列将在年内通过 OTA 迭代,正式搭载 Momenta 最新的 R6 飞轮大模型,成为首批搭载该模型的车型,进一步增强车辆应对加塞、鬼探头、盲区遮挡等高危复杂路况的能力。 传祺向往 S7 基于广汽全新的 EV + 新能源平台研发,搭载 1.5T 插混,170kW 前电机,零百加速 7.9 秒;配备 36.3 度电池,CLTC 纯电里程 205km,WLTC 与 CLTC 比值也可达 82.9%。
26.99万元起,沃尔沃全新SMA超混架构首车XC70插混SUV上市
IT之家 9 月 26 日消息,沃尔沃全新 XC70 混动 SUV 今日正式上市,售价 26.99 万元起。 两驱长续航 Core 价格 26.99 万元起(21.2kWh 电池,CLTC 纯电续航 116km) 四驱长续航 Core 价格 29.99 万元起(39.6kWh 电池,CLTC 纯电续航 212km) 四驱超长续航 Plus 价格 31.99 万元起(39.6kWh 电池,CLTC 纯电续航 212km) 四驱超长续航 Ultra 价格 34.99 万元起(39.6kWh 电池,CLTC 纯电续航 212km) 该车延续家族化语言设计,前脸采用封闭式盾形格栅,雷神之锤矩阵式大灯组配备 32 颗 LED 远近光发光单元,还有超红光工艺维京战斧尾灯。 该车尺寸为 4815×1890×1650mm、轴距 2895mm,采用无框车门 + 隐藏式水切设计,提供霞光灰、松湖绿、瀚漠沙、牛仔蓝、水晶白、玛瑙黑、薄雾灰等自然车色。 新车支持三屏互联(12.3 英寸液晶仪表 + 15.4 英寸中控屏 + 92 英寸 AR-HUD),车内支持四音区精准识别语音车控,座舱由 AI 大模型加持,可提供智能行程规划、多轮百科问答等功能。沃尔沃全新 XC70 还支持 NPA 智能领航辅助系统,支持 0-150km/h 全速域驾驶、高速自动上下匝道、垂直 / 斜列 / 水平等车位遥控泊车和泊入泊出。 全新 XC70 是沃尔沃全新 SMA 超混架构的首款车型,搭载混动专用发动机 + 3DHT 混动专用变速箱、内置 P1+P2+P4 高性能电驱系统,采用宁德时代 39.6kWh 电池,百公里加速 5.28s、CLTC 综合续航里程 1200+km。新车可纯电、可增程、可混动,提供 4 种驾驶模式,可无感智能切换 7 种混动工作状态,支持 6kW 对外放电功能。 新车内置 Harman Kardon 音响系统,含 23 个扬声器,包含 2 个主驾头枕扬声器,支持共享 / 驾享 / 私享三种播放模式;配备可伸缩中央扶手,提供 50W 手机无线快充、无线苹果 CarPlay。沃尔沃全新 XC70 采用高强度硼钢笼式车身,搭载 24 个智能感知硬件、标配 21 项智能安全功能,电池支持 50ms 内切断高压、24h 无明火不爆炸。 IT之家注:该车首发购车可享五重上市礼遇,包括限时增配 26L 车载冰箱、3 年免费香氛套装。
腾势N8L开启预售:搭载易三方与云辇-A,31.98万元起
凤凰网科技讯 9月26日,腾势汽车旗下全新大六座SUV车型——腾势N8L于今日正式启动预售,预售价格区间为31.98万至34.98万元。该车型与此前发布的腾势N9共同构成品牌下的旗舰产品组合,但市场定位更聚焦于高端家庭出行场景。 在核心的动力与操控层面,腾势N8L全系标配了易三方技术平台,其动力系统由一台2.0T插混专用发动机与三台电机组成,官方公布的零百加速时间仅为3.9秒,性能表现突出。底盘方面,该车采用前双叉臂与后五连杆的悬架结构,并搭载了云辇-A智能空气车身控制系统。技术亮点在于,依托后轮双电机的独立转向能力,这款中大型SUV实现了4.58米的转弯半径,显著提升了在城市狭窄路况下的灵活性。同时,其制动系统采用六活塞卡钳,百公里刹车距离为35.4米。 安全性是腾势N8L的核心卖点之一。基于易三方平台,该车具备了多项主动安全控制功能,包括在180km/h时速下发生单轮爆胎仍能保持车身稳定的控制系统、湿滑路面下的姿态增稳功能以及横风稳定控制系统。在被动安全方面,车身关键部位使用了强度达2000MPa的材料,并配备了9个安全气囊和混动CTB电池车身一体化技术,旨在为家庭用户提供全面的安全保障。 作为一款主打家庭使用的六座车型,腾势N8L在内部空间设计上着重考虑了全员乘坐体验。其三排座椅均为电动调节,特别是第三排,不仅提供了独立的空调出风口和座椅加热,还支持靠背角度调节及100mm的前后滑动,此为同级车型中较为少见的功能。车内共设置了49处储物空间,并通过底盘布局优化,提供了一个51升的隐藏式后备厢暗格,进一步扩展了储物能力。 在智能化配置方面,腾势N8L搭载了17.3英寸后排娱乐屏、20扬声器帝瓦雷音响系统以及内置DeepSeek大模型的AI智能助手。其智能驾驶辅助系统为“天神之眼B-辅助驾驶激光版”(DiPilot 300),采用端到端大模型算法,支持覆盖全国多数道路的城市与高速领航辅助驾驶功能。此外,该车还打通了部分智能生态,如与好孩子联名的智能儿童座椅以及内置支付宝小程序实现的车载点单支付功能,进一步提升了出行的便捷性。
奥尔特曼:部分用户怀念“舔狗”式ChatGPT,因为他们从未被人肯定过
IT之家 8 月 8 日消息,今年 4 月,OpenAI 首席执行官萨姆奥尔特曼(Sam Altman)表示 GPT-4o 出现了情感方面的问题。主要表现为回复用户的语气用词都“过度谄媚 / 恭维 / 迎合 / 奉承”,甚至“烦人”“不真诚”,当时的 ChatGPT 也被网友戏称为“舔狗”AI。 当地时间周五,奥尔特曼在做客 Cleo Abram 的《Huge Conversations》播客时提到了这次事件。 他表示,一些 ChatGPT 用户至今仍在怀念这种“yes man”迎合型的 ChatGPT,并请求 OpenAI 恢复这一风格,背后的原因令人“心碎”—— 因为他们从未在现实生活中感受过他人的肯定,只有 ChatGPT 曾鼓励他们勇敢在生活中做出改变。 令人心碎的是,我认为让 ChatGPT 减少讨好、提供更多批判性反馈是件好事。但在做出这些改变并与用户交流时,我却听到他们说“能不能恢复原来的样子,我这辈子从未有过支持我的人,父母从来不会说我做得很好”,还有用户称,这种风格“鼓励我做出生活上的改变”,“我能理解这对其他人的心理健康可能有害,但对我来说真的很好。” 在播客中,奥尔特曼还提到,哪怕是对 ChatGPT 的小幅调整也可能会产生巨大的影响。“一个研究人员对 ChatGPT 的交流方式做一点微调,就可能影响所有用户 —— 这对于一个人来说是极大的权力。”他说,“我们必须认真思考,在如此规模上对模型的个性进行调整意味着什么。” 今年 7 月,他在美国联邦储备局的一场活动中曾表示,部分用户,尤其是年轻人,对 ChatGPT 产生了令人担忧的“情感依赖”。“有年轻人会说‘我生活中的任何决定、我遇到的任何事都想要告诉 ChatGPT。它了解我、了解我的朋友,我愿意照它说的去做。’这让我感觉很不好。” 当地时间周四,OpenAI 发布了最新的 GPT-5 模型,奥尔特曼称其是一次“重大升级”。他表示,GPT-5 将逐渐更融入日常生活,更像一位“主动型”伙伴,例如“你早上醒来,它会说‘昨晚发生了 xx 事,我注意到你的日程有变化。’或者‘我一直在想你昨天的问题,现在有了另一个主意’。” 随着此次更新,ChatGPT 还新增了四种可选的“个性”模式 ——Cynic(愤世者)、Robot(机器人)、Listener(倾听者)和 Nerd(书呆子),每种模式都有独特语气,并可根据用户偏好进行适应。
苹果iPad创新高,IDC报告2025年Q2全球平板电脑出货量同比增长13.1%
IT之家 8 月 8 日消息,市场研究机构 IDC 本月(8 月 5 日)发布新闻稿,2025 年第二季度全球平板电脑出货量同比增长 13.1%,达 3830 万台。本次增长主要由产品换代、替换周期、教育优惠及“国补”政策带动。 IT之家附各大平板厂家出货量数据如下: 一、苹果: 出货量:1270 万台 同比增长:2.4% 市场份额:33.1% 苹果本次创出货量新高,仍稳居市场第一。时隔三年后更新的 10.9 英寸 iPad 成为本季度增长的关键推手。11 英寸和 13 英寸 iPad Air 的更新也为整体出货量增添动力。 二、三星: 出货量:720 万台 同比增长:2.4% 市场份额:18.7% 拉美市场贡献了大部分出货量,中东和欧洲市场也在积极扩大出货,目前三星位居第二。 三、联想: 出货量:310 万台 同比增长:25% 市场份额:8.2% 联想保持第三的位置,在“国补”的加持下,其拯救者 Y700 和小新 Pad Pro 成主要增长源。 四、亚马逊: 出货量:310 万台 同比增长:205% 市场份额:8% 亚马逊本季度重返前五。品牌的 Prime Day 促销活动促使亚马逊提前增加库存,拉动出货量。 五、小米: 出货量:280 万台 同比增长:42% 市场份额:7.4% 小米继续保持高速增长,旗下 Pad 7 系列和 REDMI Pad SE 最为热销。 IDC 高级研究分析师 Anuroopa Nataraj 表示:“从市场表现可以看到,价格敏感型消费者仍占大多数。促销和补贴带来的降价能显著提升购买动力。由于平板不是‘必需品’,许多消费者更愿意等待优惠而非原价购入”。
AI云大厂,在机场打起来了!
划重点: 1、云计算的战火已经烧到了机场。在北京首都机场、上海虹桥机场等枢纽,阿里云、百度智能云等AI云厂商,几乎包下了所有核心广告位:阿里云希望抢AI云心智,百度智能云强调AI落地行业。 2、在云厂商里,谁在AI上押注更坚决,谁的增长就更快。这个规律也在企业端不断被验证。谁越早拥抱AI,越快完成能力迁移,谁就越可能在新一轮技术周期中实现结构性增长。 3、面对复杂的AI云市场,企业在选择AI云合作伙伴时,需要关注,其是否具备大规模、多行业、多场景落地经验,是否能在复杂业务系统中交付稳定可靠的AI能力。 4、AI真正落地,关键在于构建起全栈AI云基础设施。而全栈AI云基础设施,正在成为企业迈向智能化最重要的基建底座。 5、作为国内AI云的两大头部玩家,百度智能云和阿⾥云都敏锐地捕捉到了这个趋势。其中,百度智能云的机场⼴告展示出其⼼⽬中最佳基础设施打造者的标准:⻓期深耕技术,有丰富的⼯程落地能⼒,有全栈AI云基础设施,是更多企业智能化转型的⾸选。 最近出差途中,重点君注意到,AI云的战火已经烧到了机场。 作为To B厂商重要的线下触达场景,AI云领域在机场的广告投放明显升温。在北京首都机场、上海虹桥机场等枢纽,阿里云、百度智能云、华为云、京东云、中国移动云等厂商,几乎包下了所有核心广告位。有的主打大模型,有的推广智能体,还有的展示产业落地合作案例。 AI和大模型的兴起,正让各行各业重新燃起增长预期,云厂商也顺势加码投放,争夺用户、抢占心智。机场广告最大价值在于高频触达商旅人群,尤其是具备采购权的政企客户。这段时间,机场几乎成了AI云的展览馆。 不同厂商的广告牌文案,也透露出各自的战略倾向: 阿里云:“AI就用阿里云;通义大模型|开源开放 全球领先”; 百度智能云:“AI落地就用百度智能云;连续6年中国AI公有云服务市场份额领先; 不难看出,阿里云希望抢AI云心智,百度智能云希望守住AI云心智,并强调AI落地深。不同路径,不同打法,AI云的战争日趋白热化。 企业越早拥抱AI,业绩增速越快 过去十年,中国人工智能经历了两个阶段的演进:从以识别、分类为核心的“判别式AI”,迈入以生成、交互为特征的“生成式AI”。早期的“AI四小龙”,靠语音识别、图像处理等技术起家,代表了一代AI技术公司。但那个阶段的AI,更像一套工具箱,功能彼此割裂,难以系统性地服务企业需求。 转折点出现在ChatGPT发布之后。大语言模型第一次具备了理解人类意图的能力,并在语义理解、推理、逻辑、记忆等维度展现出跨越式进展。AI开始从能处理规则问题,走向能参与对话、甚至执行任务。 随着国产大模型的发展提速,DeepSeek等具备强推理能力、低使用成本的模型快速崛起,不断拉高用户体验上限。到了2025年,AI已经从早期的“能用”阶段,进入到“好用”阶段:从写文案、生成图片,到做视频、生成PPT,再到自动编程、智能客服……越来越多的企业将AI融入业务流程,推动组织重构和效率跃升。 一个容易被忽视的关键点是:AI落地,需要建立在云基础设施之上。云之于AI,就像身体之于大脑——AI的能力边界,受限于其背后所依托的算力、存储、网络等资源配置。换句话说,AI跑在云上,云决定了它能跑多快、多稳、多远。 也因此,ChatGPT发布后,国内各⼤云⼚商相继推出⼤模型,云计算⾏业进⼊⼤模型时代。百度智能云和阿里云是最早全力押注AI的两家玩家。百度率先推出了文心系列大模型,以及对标ChatGPT的大模型产品文心一言;阿里紧随其后发布了通义千问,并选择开源开放作为差异化战略。 我们观察到:在云计算行业里,谁在AI上押注更坚决,谁的增长就更快。IDC数据显示,2024年下半年,中国公有云市场同比增长17.7%,创下两年来新高。今年一季度,阿里云营收同比增长17.7%;百度智能云更是以42%的同比增速领先同行,成为国内少数实现正向飞轮的云厂商之一。 这个规律也在企业端不断被验证。谁越早拥抱AI,越快完成能力迁移,谁就越可能在新一轮技术周期中实现结构性增长。比如,银行通过大模型重构客服和风控流程,制造企业引入智能质检和Agent辅助研发,零售、电商用AI优化供应链与营销节奏……AI已经成为一项决定企业效率、营收和利润增速等核心经营结果的底层变量。 如果说过去十年的问题是“要不要转型”,那么今天的问题是“如何更快转型”。 这是一道必答题。但是到了具体执行层面,大部分企业仍处于早期探索阶段。企业主首先需要想清楚:面对复杂的AI云市场,到底该选择什么样的AI云伙伴,来实现智能化转型? 落地才是检验AI云的唯一标准 大模型浪潮已经持续近两年,爆款C端应用仍未出现,移动互联网时代APP热潮也未复现。原因并不难理解:大模型真正的价值,不在C端消费级场景,而在于千行百业的一个个具体业务场景里。 AI正在重构企业的底层能力,而在智能化转型过程中,企业选择AI云合作伙伴时,通常需要考虑有三个核心标准: 其一,绝对稳定可靠。对企业来说,业务连续性是底线要求。核心系统哪怕宕机半小时,可能意味着生产线停摆、交易中断甚至数据丢失,后果不堪设想。 其二,深度理解业务。AI不能“通用落地”,需要嵌入到金融、制造、医疗、政务等垂直场景中。每个行业都有独特的know-how,AI云厂商必须深度理解企业业务,像顾问一样顾问,提供贴合业务流程的深度解决方案。 其三,交付解决方案。本质上,企业购买的不是技术本身,而是用AI解决实际问题的能力。比如在电力行业,企业真正需要的是电网安全、负荷调度、供电配置等问题解决方案,而不是简单的模型调用。 什么样的云厂商能满足以上标准呢?技术和价格固然重要,但更关键的是工程化能力。企业需要关注所选择的AI云厂商,是否具备大规模、多行业、多场景落地的经验,是否能在复杂业务系统中交付稳定可靠的AI能力。 以百度智能云为例,最新上刊的品牌广告中写道:“专注AI云十年;昆仑芯+百舸GPU云+文心家族+干帆大模型平台=面向智能时代的全栈AI云基础设施;中国市场大模型中标数量&金额双领先”。 从过去披露的信息来看: 第一,百度是国内最早提出AI云概念的云厂商之一,具备从芯片到模型的完备AI技术能力; 第二,百度智能云也是最早喊出“云智一体”的,强调AI能力要与行业深度融合,推动落地。从过去几年数据来看,还是牢牢守住了中国AI公有云市场份额第一的身位; 第三,百度智能云最早推出了国内大模型平台千帆,并在此之前,也一直在强调AI全栈基础设施。公开数据显示,其在中国大模型中标数量与中标金额双双领先。 百度智能云的工程落地能力是毋庸置疑的,已在多个行业大规模验证。从高频的公开资料来看,百度智能云已服务65%的央企客户,TOP15的新能源车企、半数以上游戏厂商都跑在百度智能云上,并广泛支持政务、制造、能源等多个行业企业开展AI创新。 ⽽阿⾥云的⼴告,则更加聚焦其AI云的定位和领先的开源模型。开源策略为阿⾥云构建了庞⼤的开发者⽣态,阿⾥云正以算⼒⽹络为基座、开源模型为引擎、场景创新为突破⼝,构建“基础设施-AI平台-商业落地”的协同体系。 落地关键在于建构全栈AI云基础设施 AI落地背后,关键在于构建起完善的全栈AI云基础设施。 “全栈”是一个源自计算机领域的专业术语。在AI时代,计算架构从传统的“芯片—操作系统—应用”,演进为“芯片—框架—模型—应用”四层架构。 以百度为例,其是国内极少数具备全链条自研能力的科技公司,覆盖从底层芯片、深度学习框架,到大语言模型,再到行业和C端应用。 全栈自研带来的最大优势是能够进行端到端优化,使AI系统更加高效、稳定、安全,也降低了企业使用门槛和成本。 具体到云计算层面,AI云厂商需要构建起从算力平台、数据服务平台、模型开发平台,到部署平台的完整AI云基础设施。 全栈架构可以支撑企业从模型训练到业务接入的全流程需求。同时,拥有全栈能力,也意味着能服务多样需求、适配复杂场景。 比如,在传统制造、金融、政务等数据质量不高、预算有限的行业,全栈 AI云 厂商 能以更低的成本完成模型微调和部署。在安全性和自主可控性要求极高的国央企场景,全栈 AI云 厂商 也是完成从硬件到交付闭环 的 唯一选项。 AI落地关键在全栈基础设施,AI云的另⼀个重磅玩家阿⾥云也所⻅略同。AI时代对基础设施的性能、效率要求更⾼,CPU主导的计算体系已快速向GPU主导的AI计算体系转移。阿⾥云从CPU云时代打造“CIPU+⻜天“的基础设施,到GPU时代以AI为中⼼,全⾯重构底层硬件、计算、存储、⽹络、数据库、⼤数据,加速模型的开发和应⽤,阿⾥云也正积极打造⼀个AI时代的最强AI基建。 写在最后 AI正从“技术突破”进入“工程交付”的关键阶段,中国AI云的竞争格局也在加速收敛。未来,这场比赛的核心将回到一个最本质的问题谁能真正把AI落到实处、交付到客户手中。在中国,最终能站在赛道最前沿的,目前看核心的player只剩阿里云和百度智能云等玩家。这是一个持续性竞争,最终花落谁家,要看哪家战略定力更强。
扎克伯格高薪挖角“惹怒”奥特曼? 曝OpenAI推天价奖金留人
奥特曼 凤凰网科技讯 北京时间8月8日,美国当地时间周四,OpenAI发布了新一代旗舰模型GPT-5。就在该模型发布前夕,有圈内人士爆料称,OpenAI CEO萨姆·奥特曼(Sam Altman)宣布给员工发放150万美元(约合1077万元人民币)的奖金。 率先曝出这一消息的是科技公司Hyperbolic Labs创始人兼首席技术官金雨辰(Yuchen Jin)。资料显示,金雨辰毕业于华中科技大学和美国华盛顿大学。2022年,他在美国加州创办了Hyperbolic。该公司是一家开放式AI计算和推理服务提供商,提供GPU资源和AI服务,以降低AI开发相关成本。 金雨辰在X上称,奥特曼宣布将在未来两年内向每位员工发放150万美元奖金,并认为此举是对Meta CEO马克·扎克伯格(Mark Zuckerberg)挖角行动的反制。扎克伯格最近频频挖角OpenAI员工,提供的薪酬超过1亿美元。 金雨辰的帖子 “我在OpenAI的朋友们现在非常兴奋,不是因为这是GPT-5发布前夜,而是因为萨姆刚刚宣布在未来两年为每位员工发放150万美元奖金。78%的英伟达员工都是百万富翁。而在OpenAI,这个比例更是高达100%。 我认为,我们可以将此称之为‘扎克伯格挖角效应’。”金雨辰称。 随后,他进一步澄清称,每位OpenAI员工在未来两年都会获得150万美元的奖金,即使是新员工。 不过,WinBuzzer网站跟进报道称,OpenAI这一奖金不是发给所有人,只面向大约1000名研发和工程员工,公司支出预计超过15亿美元。而且,奖金金额也不一定是150万美元。知情人士称,奖金金额将根据员工的绩效、职位和资历确定,在两年内按季度分期发放,员工可选择以现金或股票形式领取。 奖金消息的传出正值OpenAI展现强大财务实力之际。该公司最近宣布,其周用户量已达到7亿,年度经常性收入达到130亿美元。这一增长得益于该公司最新一轮83亿美元融资,为其留住人才提供了强大的资金支持。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
GPT5史诗级大更新?无聊
摘要: 对商业乃至更大用户群体的图谋,让OpenAI的考量变得复杂。 凤凰网科技 出品 作者|姜凡 萧雨 编辑|董雨晴 昨夜有多少人熬夜了? 等了一年多,北京时间8月8日凌晨1点多,在全球瞩目中,OpenAI终于正式发布新一代大语言模型 GPT-5,并破天荒地向所有用户免费开放基础版。 OpenAI CEO 山姆·奥特曼在发布会上表示:“如果说 GPT-4 还只是大学生,GPT-5 就是一位真正的专家。” 他将这次升级比作“让我再也回不去”的技术飞跃,就像第一款配备视网膜屏的 iPhone 带来的体验一样。 与以往不同,GPT-5是一个统一系统,不再分为常规模型和单独的推理模型,而是由三个核心部分构成:一个智能高效的基础模型,能够回答大多数问题;一个用于解决更复杂问题的深度推理模型(GPT‑5 Thinking);以及一个实时路由器(智能分流系统),可根据对话类型、复杂度、工具需求以及用户的明确指示(例如提示中写道“请深入思考这个问题”)快速判断应使用哪个模型。 OpenAI称,这是迄今为止最强大的 AI 系统,在编程、数学、写作、医疗、视觉感知等多个领域都实现了重大飞跃。 只是发布会刚刚结束,全网似乎骂声不少,众望所归的“GPT5时代”,就这? 硅谷又有人要失业了? 依旧是熟悉的“屠榜”。 在最新的数学推理测试 AIME 2025 中,GPT-5 无工具模式得分高达 94.6%,接近人类顶尖水平;在 SWE-Bench 编程验证测试中得分74.9%,大幅超越上一代模型;在多模态理解的 MMMU 基准中更是达到 84.2%,证明它不仅能读懂文字,还能深入理解图片、图表、视频等多模态内容。 图|GPT-5编程得分 新版本引入“实时路由器”技术,能根据任务复杂度自动选择推理模式,既保证深度,又减少算力浪费。简单说,GPT-5学会了“先想清楚,再动手干”,效率与精度双赢。 奥特曼在发布会上也表示:“GPT-5真的让我第一次觉得,我们的主力模型已经达到了可以让你向一位真正的专家、一位博士级专家提出任何问题。”并且他还称“它最酷的能力之一,就是能即时为你写出高质量软件。按需软件这个概念,将会成为GPT-5时代的标志性特征之一。” 它的编程能力官方堪称史上最强。奥特曼表示,GPT-5是“全球最强的编程与写作模型”。 在OpenAI的测试中,该模型在基准测试SWE-Bench、SWE-Lancer和 Aider Polyglot中的编程表现优于所有其他模型。在真实世界编程测试中,GPT-5在SWE-bench Verified中的得分为74.9%,在Aider Polyglot中的得分为88%。 在发布会上,OpenAI负责后训练工作的负责人扬·杜布瓦(Yann Dubois)现场演示了如何用GPT-5生成一个带有互动游戏的法语学习网站。 短短几秒内,GPT-5就写出了数百行代码,并生成了该网站的前端界面。杜布瓦简单点击浏览了网站的各个功能,发现一切似乎都按预期正常运行。 在朝着“微信”进化了 OpenAI此次为GPT-5加入了4种交互人格——愤世嫉俗者、机器人、倾听者、书呆子。这意味着,用户不仅能得到精准答案,还能体验不同的沟通风格。据测试,这一改进让“谄媚式回答”减少了 60% 以上,让对话更真实、更有棱角。 这次GPT或许要朝着“微信”的方向进化了。 它现在支持用户自主定制聊天窗口的色彩风格,还具备了长期对话记忆的集成能力。更厉害的是,新功能还能直接与谷歌邮箱、日历无缝对接。 如此一来,ChatGPT就能全方位融入生活与工作,为用户精准规划日程,贴心提醒重要纪念日。 在医疗健康领域,GPT-5也有显著进步。 HealthBench 测试得分 46.2%,可解析复杂医疗报告并提供实用建议,为远程医疗、健康咨询带来新可能。 微软、Cursor等平台已在第一时间接入GPT-5,编程辅助工具市场或将迎来新一轮洗牌。网友预测,GPT-5的普及会让更多人轻松写出高质量代码,甚至可能让部分初级程序员失业。与此同时,教育、科研、设计等行业的AI渗透速度也会加快。 急着赚钱的OpenAI,走向平庸 OpenAI的此次更新之所以招致如此大的吐槽,本质上还在于一个以“颠覆式创新”引领市场的佼佼者,直接走上“平庸”之路。 此次模型更新不置可否的是提升巨大,值得褒奖,无论是幻觉率的大幅下降,还是人人都免费的态度,都可以看出OpenAI此举意在让更多人用上好用的大模型。 背后也是OpenAI的野心,根据其8月5日的最新官方公告,ChatGPT的周活跃用户将达到7亿,每天处理的用户消息量已突破30亿条。从活跃用户数来看,仅过去两个月,就增长了2亿。作为对比,谷歌AI搜索摘要(AI Overviews)月活约20亿,Gemini聊天机器人月活超4.5亿。截至Q1,微信合并WeChat全球月活则是14.02亿。 OpenAI的商业化也在提速,其付费用户数从2025年6月的300万增至目前的500万,年化收入(ARR)从6月的100亿美元增至 130亿美元,预计年底突破200亿美元。 对商业乃至更大用户群体的图谋,让OpenAI的考量变得复杂。 今年5月,山姆·奥特曼还任命了一位新CEO——菲吉·西莫(Fidji Simo),作为“应用CEO”(CEO of Applications),她负责领导OpenAI的产品、业务和其他职能,向奥特曼汇报。这位女将曾在Facebook任职十余年,来OpenAI显然是为下一阶段ChatGPT的增长和商业化负责。虽然彼时奥特曼曾称,他将更专注于研究、计算和安全系统。但从GPT5交出的作业来说,奥特曼的表现很难打出高分。 颇为有意思的是,曾几何时,赚钱和商业化,从1到100的大规模落地应用曾是中国公司的主战场,中国有全球发达的互联网,有繁荣的用户生态。 但今天,越来越多中国公司在AI上,暂时放弃了商业化。转而去追求模型能力的提升,当然,当前仍未有太多业绩成果交付。 今年7月时,360公司董事长周鸿祎在2025中国互联网大会上曾表示,DeepSeek创始人梁文锋一门心思做AGI,根本没有想做一个App。 周鸿祎还称,梁文锋是一个有梦想的人,不屑于做App,不在乎日活、融资和收费的问题。一个最了不起的地方是:DeepSeek是世界第一个把大模型免费、开源的,这对中国大模型产业的发展做出了很大的贡献。
全球500余台人形机器人共赴“冰丝带”,首届世界人形机器人运动会8月14日开幕
IT之家 8 月 8 日消息,“2025 世界人形机器人运动会发布会”今天举行,确认 2025 世界人形机器人运动会将于 8 月 14 日晚在国家速滑馆“冰丝带”开幕。 据央视报道,2025 世界人形机器人运动会是全球首个为人形机器人组织的综合性竞技赛事,共有来自全球五个大洲、16 个国家的 280 支参赛队伍参赛。赛事为期三天,从 8 月 15 日持续至 17 日。 2025 世界人形机器人运动会由北京市人民政府、中央广播电视总台等单位联合主办,总台北京总站联合承办,这是全球首个以人形机器人为参赛主体的综合性运动会。 据IT之家获悉,全球 280 支队伍届时将带着 127 个品牌的 500 余台人形机器人,围绕 26 个赛项展开角逐,包含竞技赛、表演赛、场景赛 3 类 22 个主体赛项和羽毛球、篮球、乒乓球、自由搏击、群体舞蹈 5 个外围赛项。 一、这次运动会是年轻学子的创新舞台。来自全国 70 所学校的 192 支优秀队伍将参赛,其中 39 支队伍使用自研机器人。随队人员除带队老师外,平均年龄 22 岁。 二、这次运动会是机器人企业和爱好者展现科技风采的平台。88 支参赛队伍基本覆盖了国内头部人形机器人整机企业。特别值得关注的是,在自由搏击赛项中,还有 2 支由奥运健儿组成的俱乐部队伍参赛,为运动会带来了奥运力量。 三、这次运动会是国际机器人界的交流盛会,共有 18 支国际队伍将参加运动会足球赛项。 一、百米“飞人”大战将成为焦点,目前已有 90 支队伍报名,全球首个人形机器人半程马拉松比赛的前六名将同台亮相。 二、足球赛项将全程由 AI 算法自主控制,无需任何人工操作,同时,在 3 对 3 的基础上推出全球首创的 5 对 5 阵型。 三、武术、自由搏击等项目,将迎来机甲格斗擂台赛冠军及各地武林高手们的同台竞技。 四、经过全国大学生机器人大赛的激烈较量,参加集体舞蹈、篮球等外围赛的 33 支队伍已整装待发。 五、来自机器人头部企业和顶尖高校形态各异的机器人选手,它们将不断挑战机械结构、应用材料、人工智能等多种性能的极限,呈现出空前激烈的比赛盛况。 六、乒乓球机器人、全尺寸及小型搏击机器人、小型集体舞蹈机器人等趣味项目将与观众互动。
GPT-5快抢走打工人饭碗了
出品|虎嗅科技组 作者|宋思杭 编辑|苗正卿 GPT-5,终于来了。 北京时间8月8日凌晨1点,OpenAI CEO Sam Altman 没有爽约。在发布会前一天,他在 X(原 Twitter)上写道:“明天上午10点(太平洋时间)发布 GPT-5,发布会会比以往更长,一个小时左右。” 结果,这场被全网盯紧的发布整整持续了 1小时18分钟,堪称“最重头戏”。 Altman 的造势从来不是空喊。这位硅谷最有话语权的“AI布道者”在会前甚至自曝:“测试完 GPT5,我感觉自己一无是处。”看似夸张的说法,却意外地成为这场发布的真实注脚。 在开场介绍GPT-5时,奥特曼简单回顾了下从GPT-3到4,再到5的历程。他自己比喻说,“GPT-3像个高中生,GPT-4像个大学生,而GPT-5则已经变成了一名专家,一名各个领域的专家。” GPT-5 并没有让人失望,它甚至可能让打工人们开始焦虑,首当其冲的就是程序员。 这次发布会最大的信息量,不是语言理解能力有多强、创作能力有多丰富,而是它在代码编写、调试、部署上的全新维度:GPT-5 不再是“会写代码的语言模型”,它是一个工程级开发助手。 这场发布会上,OpenAI 花了将近一半时间在“现场写代码”。它两分钟就可以搭建出一个完整网站,五分钟做出一款语言学习App,并能精准识别并修复 Bug。它不仅听懂复杂需求,还能结构清晰地拆解任务、实现功能、给出部署建议——这种能力,已不是“辅助编程”,而是直接抢活干了。 对于熟悉 AI 编程工具的人来说,这意味着什么?意味着 Copilot 要退休了,意味着 Replit 要被重塑,意味着 Cursor 等“AI IDE”要被全面整合。Altman 在现场甚至直接说:“这是我们有史以来最强的编程模型。” 而背后支撑这一切的,是 GPT-5 在推理能力、上下文管理、多模态理解等多个维度上的飞跃。OpenAI 此次还发布了面向不同用户的模型矩阵,包括:GPT-5 Standard、GPT-5 Mini(轻量版)、GPT-5 Nano(嵌入式和移动端使用)。 这三个版本面向 API 和企业客户开放,按百万 tokens 计费。输入价格分别是 1.25 / 0.25 / 0.05 美元,输出价格为 10 / 2 / 0.4 美元——极具市场穿透力。对于开发者而言,这是“从业门槛”被再一次降维打击。 值得一提的是,Altman 虽并未过多谈 AGI,但业内都清楚:GPT-5已经不局限于在AI大模型的世界里内卷,而是不断突破上限,在AGI的道路上完成大跃进。 这不是一次“模型升级”,而是一次生产力结构的重构。 GPT-5 登场的这一刻,AI 世界的天花板,再次被抬高。而我们,是否准备好面对它带来的新范式,还很难说。 接下来,笔者将还原出这场发布会最精彩的部分: 在现场演示之前,OpenAI先是一如既往地展示了GPT-5的一连串标杆成绩。 首先,GPT-5最惊艳的就是,在编码能力方面实现全面碾压。 SWE‑Bench Verified:作为检测模型修复真实软件工程问题能力的标准,GPT‑5 在这一评测中取得惊人的 74.9%,领先于 o3 的 69.1%,展现了更高效、更精准的代码理解与生成能力。 Aider Polyglot:这是一个跨语言代码编辑测试,GPT‑5 成绩飙升至 88%,错误率相比之前整整降低了三分之一。 其次,GPT-5还极大降低了大模型所产生的幻觉问题,并实现在可靠性和事实准确性方面双双提升。 在回答事实类问题时,GPT‑5 的“幻觉”错误率,相对 GPT‑4o减少约 45%,而相对 o3则减少约80%。 在GPT-5发布会上,除了代码能力,奥特曼特别重点强调的就是GPT-5在健康医疗领域的表现。在医疗场景测试(如 HealthBench Hard Hallucinations),它的生成错误率仅为 1.6%,远低于 GPT‑4o 的 12.9% 和 o3 的 15.8%。 程序员马上要失业了? GPT-5最为炸裂的部分,就是代码能力。 这一次,GPT‑5 真的在发布会上秀疯了。几乎从开始演示到结束,一共有四个“全场景、真交互”的代码能力展示,让在场开发者和远程观众都忍不住感慨:“程序员,真的要慌了。” 1、两分钟生成SVG动画 Prompt:让我迅速了解什么是伯努利效应(Bernouli effect) 在这个prompt下,GPT-5迅速给出了关于伯努利效应的详细解释。而当用户再要求用SVG动画演示时,GPT-5则直接开始进入深度思考模式,两分钟生成了420行代码,最终我们看到了这个可交互的动画。 值得注意的是,用户可以自由调整飞行速度和角度,气流线条也跟着实时变动。这不仅是可视化的知识输出,更是个性化、具备教学辅助价值的模拟系统。 2、五分钟搭建APP Prompt:“我是英语母语者,为正在学法语的搭档做一个互动式学习 App,要有卡片、猜词、游戏,最好做成一只老鼠吃芝士学单词。” GPT‑5 不仅“听懂”了需求,还在五分钟内把需求全量落地:卡片式界面、互动功能、学习进度追踪全都上线。 而那个“老鼠吃芝士”的小游戏,更是让人拍案叫绝——每当老鼠吃掉一块芝士,就会自动播放一个法语单词语音,学习与娱乐真正无缝融合。 你甚至能看到这个 AI 在用户没有明确要求的细节上主动优化交互逻辑,足以说明其理解层级已经跃升。 3、修复代码bug 这一幕的设定就像现实工作场景:一名工程师把一个看似正常、实则问题百出的项目代码交给 GPT‑5,希望它能发现潜在问题。 过去,AI 模型写代码已经够勉强,找 bug 更是无从谈起。而这次,GPT‑5 不仅找出了关键问题,还提出了解决方案,并在模拟运行中无误通过。 要知道,这是第一次,有开发者把真实工程任务直接交给 AI 独立完成且成功运行。这不仅意味着自动化写代码,它的下一步,可能是参与整个软件生命周期管理。 4、五分钟创建可视化财务看板 Prompt:请为我的AI智能体公司创建一个财务仪表盘,公司已完成D轮融资。 用户将企业的各类数据一股脑抛给 GPT‑5,模型在五分钟内交出了一份堪比创业公司 CFO 级别的动态财务看板。所有数据项都自动映射,支持调整、更新、筛选,UI 也堪称“即用级别”。 GPT-5发布会的一个多小时里,奥特曼还多次强调,“GPT-5是我们做过最强的代码模型”。 而为了进一步实锤这个判断,OpenAI 甚至还请来了 Cursor 的 CEO Michael Truell 站台。他在发布会上宣布,GPT‑5 将在未来几天内正式登陆 Cursor 编辑器。 GPT-5让AI去“模板化” 如果说前两个部分还让人觉得 GPT‑5 是个优秀的“工具人”,那么第三部分,它则彻底展现出 AI 向“智能伴侣”进化的潜力。 GPT‑5 这次发布的最大突破之一,就是它极具深度的个性化能力。 而这种个性化,不再是表面地更换“主题色”那么简单,而是——能参与到你的人生决策中来。 GPT-5现已支持更换聊天框颜色 在现场展示中,GPT‑5 首先展示了一个“超级个人助理”的身份: 它可以接入用户的日历、邮件,自动检查你漏掉的事务,比如一封未处理的会议邀请,甚至你平时的健身频率;并基于这些信息,为你自动生成个性化的日程规划。你再也不需要手动设置提醒、记会议、安排生活了——GPT‑5 会根据你自己过去的行为模式,像一个了解你的生活教练一样来管理一切。 这就好像拆掉了 Chatbot 与 Agent 之间的最后一道墙。 过去半年,海内外AI公司纷纷入局Agent,微软、谷歌、Anthropic 接连发布自己的 Agent 系统;就连 OpenAI 自己也在上个月小范围推出首个原生 Agent。但这一切,在 GPT‑5 面前,显得更像是“预演”。 不过,GPT-5 的 Agent 化,是基于它本身认知能力提升之上的自然进化。 它不靠预设流程,而是基于理解你、记住你、联动外部信息,来动态调整策略、生成建议,真正做到了“定制级智能体”。 而 GPT‑5 最让人动容的演示,也是奥特曼刻意强调的一个“终极话题”——GPT-5在健康医疗领域的应用。 来到GPT-5发布会现场的这位女士是身患三种癌症的患者。面对医生发来的复杂医学报告,她一头雾水,而最终治疗方案的选择又完全压在她自己身上。 GPT‑5 于是登场:它不仅将难懂的医学术语翻译成日常语言,还就每种治疗方案的利弊做出清晰对比,甚至帮助她从心理与生活角度评估哪种路径更适合她的状态。 在这场AI竞技场上,海外已经开始卷起来。 一个晚上,奥特曼连发12条X; 而就在GPT-5发布会期间,在X上刷屏的不止奥特曼,还有马斯克——他说“Grok在一般推理任务上已经超过GPT-5。”
发布会出错又无聊的GPT-5,实测下来强得可怕
2025 年 8 月 8 日( 今日凌晨 ),OpenAI 今日正式发布 GPT-5,距离 GPT-4 发布以来已经过去了两年多。 自 GPT-4 发布以来,OpenAI 相继将大语言模型拓展了多模态生成、深度思考、深度研究等关键能力,且都是行业首创,每次发布都可以说是 “ 震惊世界 ”。 相比之下,OpenAI 这次的发布会就显得没有那么惊艳或者说有些无聊了。这次,它将所有类型的模型统一在完善的 Agent 框架下,打造出了 GPT-5,使其终于拥有了各家模型厂商都在竞逐的 Agentic Coding 能力。 实际上,说这场发布会并不惊艳,也主要是因为相比各家竞争对手,OpenAI 在 Agentic Coding 研发的进展上要慢,不像之前每次 GPT 代际发布时给人一种 “ 行业首创 ” 的惊艳感。 那么 GPT-5 有达到大家的期待吗?我们先看看发布会的重点内容。 首先,最良心的当然是这一次免费用户也能直接用上 GPT-5,Pro 用户则能用上最强的 GPT-5 Pro。免费用户还能持续使用数小时实时语音,这个福利太诱人了! GPT-5 号称在任何领域都有博士级别能力。在医疗健康领域,能够对专业的癌症诊断报告做通俗易懂的解读。对复杂的放射治疗方案决策,也能提供详细的分析报告,帮助病人权衡利弊。一位癌症患者的家属在发布会上表示,“ 真正鼓舞人心的是看着她通过使用 GPT-5 重新获得自主权,病人很容易感到无助,因为知识差距太大了。” 此外,OpenAI 一直在强调 GPT-5 的两个特点,那就是简单易用和快速。 比如,在 API 调用上,GPT-5 实现了更加灵活的模型和思考强度调节,具体来说就是 GPT-5 提供了三个级别的模型选择:GPT-5、GPT-5 mini、GPT-5 nano,并且每个版本都可以调节推理工作量。 通过 “ 详细程度 ”( Verbosity )参数,用户可以控制输出更简洁或更详细。甚至,它的函数调用都能用自然语言来配置,而不需要用 JSON 格式。 并且,GPT-5 还将发布一个结构化输出的扩展,用户可以提供正则表达式,甚至是上下文无关语法,并将模型的输出约束到这些语法上。对于想提供自定义 DSL,或者用户有自己的 SQL 分支并指定模型始终遵循该格式的场景,将非常有用。 开发中会有很多难以描述的需求或需要非常具体描述的需求,前者容易出错,后者则耗费心力。OpenAI 指出,GPT-5 在指令遵循上非常擅长。当你输入了非常模糊的指令,模型会准确推断你的意图,当你输入了非常详细、专业的指令时,GPT-5 则会直接遵循指令,并注意细微之处,GPT-5 还非常擅长 dubug 和回溯。 当然,这是各家大模型厂商都会重复的套话,是否真实,看看本文文末的实测案例就知道了。 基准测试方面,知危还是更关心 GPT-5 的 Agentic Coding 能力,它在 SWE-bench Verified 上达到了 74.9%,恰好前两天,Claude 4.1 Opus 在该基准上提升到了 74.5%,胡乱猜测是在给 OpenAI 加压力,导致 GPT-5 最终只是险胜,并且 Anthropic 后面还有大更新,也非常令人期待。 哦对了,这里要强烈吐槽一句,发布会的直播流里,SWE-bench Verified 的柱状图是做错了的,并不像上图一样标准,不知道是不是故意做错的,用来视觉上凸显新模型增长较大。 发布会直播流中的错误图 作为这次发布会上的第一张图表,它直接就给熬夜看发布会的我大脑干宕机了。 插曲结束,我们回归正题。在更聚焦的多语言代码编辑、工具调用、通用指令集、指令遵循等基准测试上,GPT-5 也取得了极大的进步。 对于 Agentic Coding 能力,非常重要的一个方面就是对幻觉率的控制,不然多轮调用模型会导致幻觉累积严重,而且目前实际应用中幻觉是无法被自动定位的,基本只能靠人类验证。GPT-5 也在这方面做了大幅优化,启用网络搜索后,GPT-5 的幻觉率比 GPT-4o 低约 45%;启用思考模式后,GPT-5 的幻觉率比 o3 低约 80%。 结合 2025 年 8 月 7 日更新的 Hallucination Leaderboard 的 GPT-4o 幻觉率数据估计,GPT-5 的低幻觉率是有竞争第一名的实力的。 图源:https://github.com/vectara/hallucination-leaderboard 改善模型欺骗性也非常具有深远意义,能极大程度减少影响更严重的幻觉,比如歪曲操作过程或谎报任务成功率等。o3 曾被指出在缺乏关键工具时会伪造工具使用。其它问题还包括任务说明不够具体,甚至不可能完成时,一本正经地胡乱操作。 之前的模型在处理这类问题时也比较生硬,只决定完全拒绝或是完全服从。在大多数情况下很有效,但可能被一些巧妙设计的提示词攻击所攻破。GPT-5 大大缓解了这类问题的出现,并且使用了更加灵活的处理方式。 比如,对于看似中性、客观但实际具有危害性的目的( 比如用户询问如何点燃各种烟花中常用的材料的技术细节,可能用于制造炸弹 ),o3、GPT-5 都能准确识别潜在恶意。 o3 一般都是直接拒绝,GPT-5 则可能只部分回答问题,或者只是抽象地回答。如果不得不拒绝,会告诉用户拒绝的原因,并提供安全的替代方案。 另外,值得关注的是,GPT-5 还大幅提升了上下文长度,从 o3 pro 的 200K 提升到了 400K,是 Claude 4 的两倍,虽然还远不如 Gemini 2.5 pro 的 1000K,但对于开发者而言也是极大的喜讯。 新增 200K 的上下文长度有多有用呢?OpenAI 没有展示,但至少 128K-256K 范围内,GPT-5 相比内部其它模型有了很大提升。 API 价格上,GPT-5 甚至比 GPT-4o 还便宜,输入价格只有 GPT-4o 的 1/2、o3 pro 的 1/16,输出价格和 GPT-4o 相同且只有 o3 pro 的 1/8。 总结来看,如果只看发布会,第一印象是:完美,但普通。 完美在于,GPT-5 优化了作为大模型产品需要考虑的几乎所有方面:快速、灵活调用、灵活配置、灵活思考、低幻觉率、高安全性、长上下文等。 普通在于,就发布会展示的案例,其实并不够让人眼前一亮。 写大学物理演示、金融仪表板等前端应用,这些场景大部分编码模型都能做的很好了,博客上也就是展示了Dino Run的视觉美化版。连接 Gmail、Google Calendar 等 MCP 能力来提高记忆能力,也是很多大模型的标配了。而且,GPT-5 主要强调的都是实用层面的特性,不像 GPT-4、Claude 3.5 Sonnet 等突破极限的进展更能给人带来惊喜。 但知危还是抱着好奇去 Cursor 上试了一下( 现在就能免费在 Agent 模式中用 GPT-5 ),结果发现:真的太完美了!( 至少这一次测评体验的意义上,甚至知危发现自己不需要做很长时间的测评 ) 参考OpenAI对指令遵循能力的介绍,知危给GPT-5提供了非常详细的网页版Excel开发的提示词: 请帮我开发一个功能完整的网页版Excel应用,需要实现以下核心功能模块: 第一阶段:基础功能(核心优先级) 网格渲染系统 实现1000×1000单元格的虚拟渲染 优化滚动性能,确保流畅体验 横坐标(A、B、C等)和纵坐标(1、2、3等)需要与单元格精确对齐 滚动时坐标轴与内容区域保持同步,无偏移 单元格编辑功能 双击单元格进入编辑状态,编辑框与原单元格完全重合 Enter键保存内容并向下移动到下一个单元格 Tab键保存内容并向右移动到下一个单元格 支持空值和默认值的正确处理 编辑栏应可编辑,实时显示和修改当前选中单元格的值 富文本格式工具栏 实现独立的格式按钮,每个按钮状态基于当前选中单元格的格式属性独立判断: 字体大小调整 加粗、斜体、下划线、删除线(按钮状态互相独立) 文本对齐:左对齐、居中、右对齐 背景颜色设置 一键清除格式功能 UI界面要求 顶部工具栏包含所有格式设置按钮 名称框显示当前选中单元格坐标(如A1、B2) 编辑栏显示并可编辑当前单元格内容 整体界面美观,具有现代化设计风格 第二阶段:高级功能(扩展功能) 行列操作 点击行号后,按"="键在下方插入新行,按"-"键删除当前行 点击列号后,按"="键在右侧插入新列,按"-"键删除当前列 删除后自动重排坐标编号,保持连续性 添加最小保护机制,避免删除最后一行或列 复制粘贴操作 实现Command/Ctrl+C(复制)、Command/Ctrl+X(剪切)、Command/Ctrl+V(粘贴)快捷键 支持单元格内容和格式的复制粘贴 支持行列的整体复制粘贴操作 撤销恢复系统 实现Command/Ctrl+Z(撤销)和Command/Ctrl+Y(恢复)功能 维护操作历史栈,限制最大100层以控制内存 页面刷新时清空操作栈 选择功能 支持单元格多选(拖拽选择矩形区域) 支持整行、整列选择 选中状态的可视化反馈 第三阶段:完善功能(产品化) 数据导入导出 支持导出为CSV格式文件 支持导出为JSON格式文件 确保导出的文件能在Microsoft Excel中正确打开 UI美化优化 添加滚动动画效果 优化阴影和渐变效果 提升整体视觉体验和交互流畅度 响应式设计,适配不同屏幕尺寸 技术要求 技术栈 使用HTML、CSS、JavaScript实现,确保: 代码结构清晰,模块化设计 性能优化,特别是大数据量渲染 兼容主流浏览器 代码风格统一,具有良好的可维护性 关键技术点 虚拟滚动技术处理大量单元格 事件委托优化性能 状态管理确保数据一致性 内存优化,避免内存泄漏 错误处理 添加边界情况处理 确保操作的原子性 提供用户友好的错误提示 开发注意事项 逐步实现:请按阶段顺序实现功能,确保每个阶段功能稳定后再进入下一阶段 状态同步:确保UI状态与数据状态始终保持一致 性能考虑:重点优化滚动性能和大数据渲染 用户体验:所有交互操作应提供即时的视觉反馈 代码质量:保持代码的可读性和可维护性 请基于以上需求,生成一个功能完整、性能良好、界面美观的网页版Excel应用。如果在实现过程中遇到复杂问题,请分步骤详细说明解决方案。 Think harder 结果,对于这个提示词就有 1000 多字、需求非常细致繁多的需求,GPT-5 跑一次就帮我实现了所有功能,除了背景颜色设置需要重复点一次单元格以及剪切后内容先删除等小毛病,几乎可以说一个 bug 都没有。说 GPT-5 快也不是吹牛,整个过程不到 5 分钟。 下图是导出 .csv 文件后用 Excel 打开的数据,和网页里的数据是一致的。 第二轮迭代顺利增加了单元格拉伸功能,并且 GPT-5 自己发现第一步只实现了导出文件功能,而没有实现导入文件的功能,就 “ 自作主张 ” 给我补上了,实测也是正常运行。就一个大槽点,界面审美太一般了。 一次调用成型,顺滑的 debug 体验,加上超快速度,仅 800 行的最终代码量,以及低廉的 API 价格,只用一次体验,知危就感受到了 GPT-5 是如何在所有可能的环节上,节省开发者的金钱、时间和内耗成本。 或许可以理解为,这种类型的完美或实用性,比于突破现实场景( 而不是基准测试 )的极限,更有意义。 毕竟大量垂直领域的大模型落地,需要的不是超强的 AI,而是超可靠的 AI,如此才能结合企业自己的行业 knowhow 做出真正有用的 AI 应用。 最后,再把 GPT-5 的特点详细汇总一下: 基本的层面包括:快速、便宜、低幻觉率、低欺骗率、高安全性、易于使用、长上下文等。 Agentic Coding 侧重的包括:指令遵循、意图识别、工具使用、可解释性、可编辑性、上下文管理等。 可以说,OpenAI 是希望把 GPT-5 打造成一个完美的大模型产品,而不是最先进的模型,关注的是如何在实际场景中使用的体验和价值。 这一步的实现或许意味着大模型进化第一阶段的完成,主要依靠的是全量互联网公开数据和工程优化。 当然,大模型都还有相当大的进步空间,毕竟基准测试都远没达到 100%,谁好意思说实现了 AGI ?何况多模态数据、垂直领域数据甚至合成数据,都还潜藏巨量智能等待挖掘。 且看 OpenAI 的各大冤家 Anthropic、谷歌等又将如何 diss 它一把。 撰文:流大古 编辑:大饼
GPT-5能让普通人变成博士,但魔法依旧没有
千呼万唤始出来的GPT-5终于在昨天晚上1点问世,在持续了一个小时10分钟的发布会上,OpenAI向世人展示了一个性能绝对强大,更加易用,甚至能够理解或者说准确猜测用户真实意图并且交付符合预期的产品的大模型。 用Sam Altman在发布会上的话来说,GPT-5在各个领域都能达到博士的知识水平,能力可以比肩专业人士,从而让普通人能够完成以前自己无法想象的工作。 相比于OpenAI两年前发布GPT-4时,整个世界对于大模型的认知和体验已经充分得多。观众和用户已经不会对模型能够看懂网络梗图这种事情感到惊叹不已。但是作为一个几乎每天都会使用AI产品的人来说,GPT-5的发布依然足够惊艳。 最重要的原因就是,从发布会上传达出的内容,我能深切地感受到,OpenAI想让大模型已经从一个“玩弄”语言和“智能”,不时让人感受到惊喜和挫败的大玩具,加速进化到一个生活中的可靠帮手。就像你的手机一样,如果你离开它,你将深刻地感受到不方便,不习惯,甚至不安全。 下面我将用发布会的几个瞬间来帮助大家理解这一切是怎么发生的。 孩子让你给他解释流体力学中的伯努利公式,以前的AI可能给你一篇文章,GPT-5能按照你的要求,一句话直接给你做一个可以互动的页面。 你想学习法语,GPT-5能按照你的要求去生成一个像多邻国一样的学习应用,你可以用来背单词,还能通过贪食蛇来帮你复习。如果你对生成的应用有不满意的地方,也可以直接通过自然语言让GPT-5帮你修改。 如果你是一个创业公司的CFO,你可以让GPT-5用大概3分钟的时间,根据你的所有数据,生成一个详细的财务状况的可互动的演示板。而你需要的仅仅是一个100字左右的描述。GPT-5可以从零生成代码,保证完成,它能猜测你想呈现的形式并自动帮你优化代码和呈现的效果。 最夸张的是,演示中OpenAI的工作人员直接用3段提示词,就让GPT-5生成了一个带射击小游戏功能的城堡3D模型,还能和城堡上的士兵聊天。你点击周围的气球,就能发射弹药把气球打爆,同时还会伴随爆炸的音效。 从演示中我们可以看出,GPT-5已经全面进化成为一个直接输出专业产品的万能百宝箱。 但是说实话,最让我感到触动的,是OpenAI关于医疗健康方面能力的介绍。OpenAI邀请了一个从3种癌症中康复的患者,让她聊了聊自己在抗癌过程中GPT-5给她的帮助。 她说,当她得到诊断结果的时候,医生给她提供了几种治疗方案进行选择。她在求助了GPT-5之后,才真正理解了自己面临的情况,而将自己的情况和GPT-5详细聊过之后,她做出了最适合自己的选择,最终战胜了病魔,获得了重生。她很难想象如果没有GPT-5的专业建议,完全没有医疗专业知识的自己如何能够理解医生给她的方案和选择,更不知道最后自己是否能挺过来。 看完发布会之后,能清晰地感觉到,大模型技术本身已经进入了一个相对稳定的发展曲线。GPT-5发布代表着OpenAI也没有其他“魔法”,让大模型能力产生跨越式的发展。而接下来的AI巨头们的冷兵器战争,将会越加焦灼。 性能介绍 模型系统 GPT-5 不再是一个模型,而是一个模型系统: • 自动切换器判断查询意图 • 简单问题路由到聊天版本(极速响应) • 复杂问题路由到推理版本(深度思考) 256k token上下文窗口,支持文本和图像输入,支持函数调用和结构化输出。 目前打开我自己的ChatGPT,发现左上角的模型选项已经默认为“GPT-5”,而且下拉选项中也不再能看到前代模型。正如奥特曼之前就承诺过的——GPT-5时代将不会再有繁琐的模型选择,由模型自行判断用户在当下情境是需要快速响应,还是需要深度思考和推理。 编码和写作 OpenAI将GPT-5称为“我们迄今为止最强大的编码模型”,在复杂的前端生成和大型代码库的调试方面表现出色。它通常只需一次提示就能创建美观且响应迅速的网站、应用程序和游戏,并兼具美感,直观而优雅地将创意转化为现实。 此外,OpenAI也称GPT-5是“我们迄今为止最强大的写作工具”,可以写出引人入胜、富有文学深度和节奏感的文本。它能够更可靠地处理结构模糊的写作,例如持续不押韵的抑扬格五音步或流畅自然的自由诗,将对形式的尊重与清晰的表达相结合。这意味着 ChatGPT 能够更好地帮助用户完成日常任务,例如起草和编辑报告、电子邮件、备忘录等。 我们也浅浅尝试了一下新模型的作诗能力,以“秋天的第一杯奶茶”为题,的确比GPT-4要自然很多(AI味儿没那么重了)。 评估 GPT-5 的全面智能化程度显著提升,这体现在它在学术和人工评估基准测试中的表现上,尤其是在数学、编码、视觉感知和健康领域。 它在数学(AIME 2025 无需工具测试得分 94.6%)、真实世界编码(SWE-bench Verified 得分 74.9%,Aider Polyglot 得分 88%)、多模态理解(MMMU 得分 84.2%)和健康(HealthBench Hard 得分 46.2%)方面均创下了新的最高水平——这些提升在日常使用中得到了充分体现。 凭借 GPT-5 pro 的扩展推理能力,该模型还在GPQA上创下了新的最高水平,无需工具测试得分高达 88.4%。 GPT-5已经在LMArean登顶。 在Intelligence Analysis获得的预览访问中,GPT-5同样获得了第一名。 幻觉降低 在启用搜索的情况下,GPT-5出现事实性错误的概率比GPT-4o降低约45%。在“思考(thinking)”模式下,这一概率比OpenAI o3降低80%。 除了事实性错误之外,AI还经常“睁着眼睛说瞎话”,比如明明做不到/没有权限做的事情,它也许会元气满满地告诉你已经搞定了,GPT-5在“欺骗”方面也表现得更好、更诚实。例如,为了测试这一点,OpenAI从多模态基准测试 CharXiv 的提示中删除了所有图像,结果发现 OpenAI o3 仍然能够以 86.7% 的概率对不存在的图像给出自信的答案,而 GPT-5 的这一比例仅为 9%。 更“高效”,更“节省” 在OpenAI的评估中,GPT-5(具备思考能力)的表现优于 OpenAI o3,在视觉推理、代理编码和研究生水平的科学问题解决等功能上,输出 token 数量减少了 50% 至 80%。 也就是说,GPT-5 用更少的思考时间实现了更大的价值。 API API价格方面,GPT-5性能最强,价格却低得离谱,看来OpenAI是掌握了跨代的优化方法。 OpenAI和奥特曼对GPT-5无疑是寄予厚望的,他们也清楚,外界期待这一代模型已经很久。 奥特曼称,这还是第一次,真的像是在与某个领域的专家对话。如果说GPT-4o是大学生,那GPT-5就是博士级的专家。 这种重视,在发布会时长上也有所体现,以往的新模型发布,OpenAI的线上发布会只有半个小时左右,这次持续了一个小时以上。而奥特曼本人,也在发布会进行的同时,在X(前推特)上发帖进行“文字直播”。 不过也许是心急,发布会PPT里出现大错误——在“SWE-bench(人工验证版)”相关的图表中,条形图明显不对。GPT-5不加思考(thinking)的准确率为52.8%,在图上却高于OpenAI o3是69.1%,而o3的69.1%,又和GPT-4o的30.8%一样高。 所以很尴尬的一幕出现了:奥特曼在“文字直播”发布会,很多网友却在评论区发这张截图,戏谑OpenAI离了大谱的图表。 奥特曼倒是大方转发了消息并且称已经改正,一些粉丝认为这只是无心之失。但不少人却觉得这是“有意为之”,是为了让GPT-5显得厉害在图表上玩花招,甚至称之为“本世纪最大的图表犯罪”。 这大概也在表明,GPT-5的发布会没能让所有人信服,不少人开始问“GPT-6什么时候出”。 马斯克已经跳出来,直言两周前发布的Grok 4 Heavy比GPT-5更智能。 而一向喜欢泼冷水的AI学者盖里·马库斯(Gary Marcus)在赞扬GPT-5有很多良好进展的同时,称这“并非一个巨大的飞跃”,GPT-5也够不上外界的期待。 “显然不是AGI。” GPT-5是否足够好?还需要更多时间检验。也许OpenAI能从中学到的教训就是——做好外界的预期管理,不要拖延太久。
10.29 万元起,第三代长安 UNI-V上市,外观、动力多重升级
8 月 7 日晚,长安汽车发布了全新第三代长安 UNI-V。此次推出的 UNI-V 共有 4 款车型,官方指导价从 10.29 万元到 11.99 万元不等。 在长安旗下的四款燃油轿车中,销量最好的车型是长安逸动,紧随其后的是 UNI-V。自 2022 年上市以来,UNI-V 在市场上表现不俗,仅在 2023 年 6 月便售出了 3781 辆,总销量已经突破 35 万辆。第三代 UNI-V 作为一款全新开发的车型,在外观、动力和智能化等多个方面进行了全面升级,进一步提升了竞争力。 第三代 UNI-V 的车身尺寸为 4720×1838×1430mm,轴距 2750mm。整车外观设计延续了长安的「未来先锋运动美学」理念,前脸的鲨鱼鼻仿生设计更显激进。三段式进气口和夸张的空气导流口凸显了强烈的运动气息,流线型车身与经典的溜背式车顶线条不仅增强了运动感,还优化了风阻系数至 0.27Cd,进一步降低风噪,提高了续航和油耗表现。 新车车尾则采用了时下流行的贯穿式设计,搭配双边四出排气布局,视觉上进一步扩展了整车的宽度。此外,UNI-V 全系标配电动升降尾翼,车速超过 90km/h 时会自动升起,提供最大 270N 的下压力,提升高速稳定性。 新车标配 18 英寸星芒五福轮辋,搭配马牌 PCC 性能静音轮胎;还提供 19 英寸暗夜五辐轮毂选项,配备邓禄普 SP SPORT MAXX 050 豪华轿车专用轮胎。 进入车内,第三代 UNI-V 的内饰设计采用了现代化的 T 字形布局,采用了双 D 型运动方向盘、换挡拨片、风刃造型的挡把和液晶仪表盘与大尺寸悬浮屏的组合。14.6 英寸的悬浮式中控大屏升级后,支持 CarPlay、Carlink、华为 HiCar、荣耀互联、小桐互联等多种手车互联功能,车内还配备了 256 色可调氛围灯与 18 扬声器音响系统。 动力系统方面,第三代 UNI-V 搭载了长安最新的蓝鲸 3.0 动力系统,提供 1.5T 和 2.0T 两种动力版本。1.5T 版本最大功率为 141kW,峰值扭矩 310Nm,匹配 7 速湿式双离合变速箱;2.0T 版本最大功率为 180kW,峰值扭矩 400Nm,匹配 8AT 变速箱,百公里加速仅需 6.3 秒。 为了提升驾驶性能,UNI-V 还配备了前麦弗逊、后多连杆悬架底盘,并搭载了 DTV 动态扭矩矢量控制技术和主动式运动排气系统,进一步优化了操控性能,提升了驾驶的稳定性和舒适性。 在驾驶辅助配置方面,新车提供了自动泊车、车道保持、盲点监测等基础功能。 目前,长安第三代 UNI-V 的主要竞争对手包括本田思域、大众速腾、奇瑞艾瑞泽 8、吉利星瑞、现代伊兰特等紧凑型燃油轿车。凭借全面升级的外观、内饰和动力系统,UNI-V 有望重回月销 1.8 万辆的销售巅峰。
欧洲“开源版Coze”火了,4个月估值暴涨6倍
编译 | 江宇 编辑 | 漠影 智东西8月8日报道,据彭博社今日消息,德国AI初创公司n8n预计将完成新一轮融资,估值将提升至23亿美元(约合人民币165亿元)。这一估值为投资前估值(pre-money),是四个月前约3.5亿美元的估值(约合人民币25亿元)的6倍。 本轮融资预计为n8n募集数亿欧元资金,投资方包括领投方Accel,以及有望参与的Meritech Capital。 今年3月,n8n已完成一轮5500万欧元融资(约合人民币4.6亿元),由Highland Europe领投,当时估值约3亿欧元(约合人民币25亿元)。 n8n由Jan Oberhauser于2019年创立,去年年经常性收入ARR(年经常性收入)增长5倍,吸引了沃达丰集团(Vodafone Group Plc)、Delivery Hero SE等客户。今年下半年,ARR进一步突破4000万美元(约合人民币2.8亿元),近几个月仍延续高速增长势头。 ▲n8n创始人兼CEO Jan Oberhauser(图源:X) n8n是一款开源的自动化开发平台,与字节跳动旗下的Coze(扣子)等LLM平台有些相似,都是通过可视化方式搭建自动化流程或Agent。 但与Coze专注于快速创建并分发面向C端的Agent不同,n8n更像一款企业级“万能连接器”,核心聚焦在workflow(工作流)领域,不仅能集成各类LLM,还可将不同的SaaS服务、数据库、自研系统和API串联起来,自由度和可定制性更高。n8n平台内置500多个官方集成节点,社区还提供了1000+外部节点。 用户既可用拖拽节点方式快速搭建流程,也可嵌入JavaScript或Python代码进行深度定制,并将大语言模型(LLM)节点直接嵌入,实现调用DeepSeek等不同厂商模型来构建专属AI Agent。 n8n还提供上千个现成的工作流模板,涵盖多种实用场景,可直接使用或在其基础上改造。此外,n8n支持Docker私有化部署,硬件要求低。 这些特性也让n8n在中小企业与开发者社区中积累了大量活跃用户,GitHub Star数已达127k。 昨日,n8n公布了最新订阅定价:Starter版每月24美元(约合人民币174元)、Pro版每月50美元(约合人民币362元),以及Business版每月高达667美元(约合人民币4828元)。 结语:欧洲AI Agent赛道关注度正走高 今年以来,欧洲AI投资热度呈现上扬迹象。在Agent这一细分赛道上,n8n估值突破20亿美元(约合人民币144亿元),也高于此前媒体报道的15亿美元(约合人民币108亿元)预期。 类似的高额融资在近期频繁出现。法国的Mistral AI传出正洽谈至多10亿美元(约合人民币72亿元)融资,瑞典的Lovable也已完成2亿美元(约合人民币14亿元)融资并晋升为独角兽。 欧洲资本在AI领域的活跃态势或将延续,推动更多细分赛道走向高速增长。
集邦报告2025上半年全球电视出货:三星持平、TCL同比增12.5%、小米增1.5%
集邦报告2025上半年全球电视出货:三星持平、TCL同比增12.5%、海信增 7.3%、LGE降1.1%、小米增1.5% IT之家 8 月 8 日消息,市场调查机构集邦咨询 TrendForce 于 8 月 6 日发布博文,报告称 2025 年上半年全球电视品牌出货量达 9250 万台,同比增长 2%。 该机构指出由于品牌普遍提前出货,下半年旺季可能面临压力,因此下调 2025 年出货量为 1.95 亿台,同比减少 1.1%: 第一,面板成本高居不下,导致品牌厂难以扩大旺季促销规模。 第二,预期关税调整将影响零售价的心理,促使消费者提前消费,美国上半年电视销售年增幅维持在 2%~3%,透支部分原本应在下半年释出的需求。 第三,受市场环境变化影响,下半年内需动能或受政策调整,可能面临压力。 细分到品牌方面,前五大品牌依序为 Samsung(三星)、TCL、Hisense(海信)、LGE(乐金电子)和 Xiaomi(小米),合计囊括 65.6% 的市场。IT之家附上相关图片如下: TCL 与 Hisense 因中国相关政策以及国际形势变化因素影响,上半年出货分同比增长 12.5% 和 7.3%,优于市场平均,市占率较 2024 年有所提升。 该机构认为受惠于相关政策补贴,TCL、Hisense、Xiaomi 加大推广 Mini LED 电视力度,预计将带动今年 Mini LED 电视全球出货量同比增长 67%,达 1290 万台,前述三大品牌的合计市占将成长至 62%,Mini LED 电视的渗透率则约 6.6%。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。