行业分类:
加载中...
头条分类:
加载中...
极氪8X外观设计官方解读:一体式直瀑格栅、宽体低趴尾部设计
IT之家 1 月 21 日消息,极氪官方今日发布了极氪 8X 外观设计的解读,新车定位“超级电混高性能旗舰 SUV”。 据介绍,极氪 8X 采用 0.618 黄金比例设计、拥有 1:4 轮轴比,尺寸为 5100×1998×1780mm、轴距 3069mm。 新车还配备灵感源自宫殿台基的一体式直瀑格栅、一体式驭风前机盖(两侧导流槽降低风阻,视觉重心下移,轮廓更紧致)、双核随速 AGS(10 万平方毫米智能呼吸格栅,兼顾散热与低风阻)。 极氪 8X 还配备零面差镜车门,玻璃与门框平齐,兼顾美观与风阻。新车湾流车顶线自后向前、由粗变细,塑造了流动姿态;浪涌肩线自尾灯向前流转,可勾勒车窗悬浮之感。 新车还采用宽体低趴尾部设计,拥有 1.12 宽高比;配备浩瀚星钻矩阵大灯,宽幅灯带,灯面嵌入 25,368 钻石型面;搭载海岸线贯穿尾灯,54,894 钻石型面、630nm 超红光技术。 据IT之家此前报道,极氪 8X 的官方定位为高性能旗舰 SUV,目前该车已在工信部完成新车申报,但具体发布和上市日期尚未公布。 新车搭载 2.0T 插混系统,发动机型号与极氪 9X 相同,最大功率为 205 千瓦。尽管驱动电机的动力参数尚未公布,但根据此前报道,极氪 8X 有望配备三电机兆瓦电驱、6C 超快充大电池、浩瀚 AI 数字底盘和 48 伏主动稳定杆等配置。
中国首个海上液体火箭发射回收试验平台将投用
今年是“十五五”规划的开局之年,“加快建设航天强国”目标首次被纳入国家五年规划重点任务。在山东烟台海阳市,有我国目前唯一的商业航天海上发射母港。最近几天,国内首个海上液体火箭发射回收试验平台正在加紧建设。 在山东烟台海阳的东方航天港,工人们热火朝天地进行着施工,而他们正在建设的是我国第一个海上液体火箭发射回收试验平台。 探秘我国首个海上液体火箭发射回收试验平台 现在近距离地来探秘一下这个平台的特殊构造,首先是七八米深的液压基坑,里面的4个“大家伙”名叫液压起竖油缸,它们能把几百吨的液体火箭来个由水平到垂直的90度“大翻身”,为火箭调整好发射姿态。 而这个导流槽,深度能达到17米,在火箭点火时它能把3000多摄氏度高温的火箭尾焰排导出去,同时大家能看到中间这里有一圈环形喷管,它能通过喷淋,快速降低尾焰温度,减小发动机工作引起的噪声,保护发射设施不受损害。 这里每天有150多名工人,在加班加点昼夜冲刺,计划在半个月之后,也就是2月5日左右,完成平台建设并开始调试演练。在春节前后,国内一款主流商业液体火箭将在这里进行发射回收试验,这也是国内首次液体火箭的海上发射回收试验。 此前,东方航天港已执行了22次海上发射任务,都是固体火箭。固体火箭的优势在于机动性强,发射方式灵活,但是它的运载能力相对较小,而且无法回收。 而液体火箭的运载能力较强,可以回收复用,大大节省了卫星组网成本,因此可复用的液体火箭发射成为国内商业航天发射的主要方向。 山东构建商业航天全产业链布局 东方航天港坐落于一个四面环海的人工岛上,东方航天港选择在这里是因为这里距离陆地约3公里,无固定居民,符合安全条件的要求。 来看一下这张布局图,这里规划了几个功能区:有液体火箭的发射回收试验平台,以及配套的燃料库区,包括液氧液氮库区、煤油库区、甲烷库区等,它们对液体火箭有燃料加注、增压输送、管道吹扫等作用。 目前,东方航天港作为国内唯一的海上发射母港,已经把137颗卫星送上太空。以东方航天港作为引领,山东省已经构建起“海上发射引领、星箭制造协同、空天应用拓展”的全产业链生态,形成了以烟台、济南、青岛为核心,泰安、德州等地“多点支撑”的商业航天产业布局。
星舰基地起重机倒塌,SpaceX被罚11.585万美元
IT之家 1 月 21 日消息,据美国职业安全与健康管理局(OSHA)通报,去年 6 月,SpaceX 位于得克萨斯州星舰基地的一台液压起重机发生倒塌事故,而该公司此前未对这台刚完成维修的起重机进行合规检查。 事故发生次日,联邦安全机构便对 SpaceX 展开调查,最终认定其存在 7 项“重大”违规行为。针对其中 6 项重大违规,OSHA 开出了法定最高额度罚单,这家由埃隆 · 马斯克执掌的航天企业因此面临总计 11.585 万美元(IT之家注:现汇率约合 80.8 万元人民币)的罚款。 据 OSHA 官网显示,相关调查目前仍在进行中。事故是否造成人员受伤尚未有明确结论。SpaceX 有权对罚单提出异议,但截至目前,该公司尚未就此事回应置评请求。 此次罚单与违规认定下达之际,恰逢 SpaceX 计划加大星舰基地的运营力度。这在一定程度上是为了响应美国总统唐纳德 · 特朗普提出的目标 —— 在其第二任期结束前实现载人登月,相关企业正为此展开竞速角逐。美国联邦航空管理局已批准 SpaceX 今年在得克萨斯州开展最多 25 次“星舰”火箭发射任务。与此同时,为实现马斯克“年产数千枚星舰火箭”的宏大目标,该公司正对发射场进行快速扩建。 事实上,SpaceX 位于南得克萨斯州的发射场长期以来事故频发、人员受伤事件不断。2023 年路透社的一项调查揭露,过去十年间,该基地在建设过程中曾发生数十起未公开的人员受伤事件,甚至造成一名员工死亡。科技媒体 TechCrunch 去年对 OSHA 数据的分析显示,SpaceX 星舰基地的工伤率,远高于该公司其他基地以及行业内同行的平均水平。 类似事故此后仍接连发生。去年 12 月,SpaceX 一家分包商的员工称被起重机掉落的大型金属支架砸伤,并就此对 SpaceX 提起诉讼。据报道,OSHA 目前也在对这起事故展开调查。 此次 OSHA 开出罚单的核心事件 —— 起重机倒塌事故,发生于 2025 年 6 月 24 日。事故四天前,“星舰”火箭曾发生爆炸,事发时 SpaceX 员工正在星舰基地测试场清理爆炸残骸。专注于星舰基地直播的频道 LabPadre 拍摄的画面显示,一台起重机在吊运火箭爆炸后的大型残骸时,因不堪重负发生弯折。 根据 OSHA 官网公布的最新违规通报,事发时一名员工正操作一台格鲁夫 RT9150E 型起重机吊运残骸,另有一名员工操作挖掘机铲斗对残骸进行检查,试图确定火箭爆炸的原因。 通报指出,涉事的格鲁夫起重机此前刚完成维修,但 SpaceX“未安排合格人员进行检查,以确认维修是否符合制造商标准”,便将其重新投入使用。目前尚不清楚该起重机的维修原因,但另一份违规通报提到,测试场的另一台同型号起重机曾出现“需多次尝试才能启动电脑控制系统”的问题。 OSHA 指控,SpaceX 既未对这台格鲁夫起重机执行月度检查,也未留存相关检查记录,且该起重机“过去 12 个月内均未接受过检查”。通报还指出,SpaceX 同样未对吊运残骸所用的钢丝绳进行月度检查,基地现场使用的吊装设备也缺失制造商规定的标识,而这类标识本该注明设备的“安全工作载荷”。 此外,调查还发现,事发时一名员工正操作一台多田野 90 吨履带式起重机在测试场吊运残骸,而该员工所持的美国起重机操作员认证委员会资质证书早已过期。
2nm不再是万能药?消息称苹果、高通和联发科集体转向手机芯片架构“内功”
IT之家 1 月 21 日消息,媒体 Digitimes 昨日(1 月 20 日)发布博文,报道称苹果、高通和联发科正调整下一代旗舰芯片策略,重心从单纯追求 2nm 制程转向架构优化与缓存扩容。 消息称苹果、高通和联发科三大芯片巨头目前正调整研发重心,不再将单纯的制程微缩作为营销核心,转而聚焦改良架构与扩展内存缓存(Memory Cache)。 尽管台积电 2nm 工艺备受追捧,其流片数量预计达到 3nm 节点的 1.5 倍,但行业报告指出,消费者对“光刻节点数字减小”的关注度正在下降。这迫使无晶圆厂芯片制造商采取新策略,通过提升系统集成度来确立竞争优势。 IT之家援引博文介绍,市场趋势表明,单纯依靠制程红利已难以打动消费者,厂商开始用架构和缓存换取性能。 苹果已于去年在 A19 Pro 上验证了此路径,其能效核(E-cores)通过架构升级,在功耗几乎零增加的前提下实现了 29% 的性能暴涨。 图源:极客湾 联发科同样在天玑 9500s 上采取了类似策略,配备了高达 19MB 的 CPU 缓存,以抗衡高通骁龙 8 Gen 5。 该媒体分析认为,随着智能手机内部功能日益复杂,从 3nm 到 2nm 的物理制程跨度对用户体验的直接提升作用正在减弱。 资深从业者观察发现,用户不再单纯依据每年 20% 至 30% 的 PPT 性能涨幅来决定换机,而是更看重实际使用中的流畅度与功能体验。 因此,尽管 2nm 芯片仍具备技术优势,但在旗舰机市场,唯有转化为可感知的体验升级,才能真正驱动用户消费。
中国“小跑车”闯荡欧洲,SC01拟在意大利启动生产
IT之家 1 月 21 日消息,当地时间 1 月 20 日,据外媒 insideevs 报道,来自中国的“小跑车”SC01 计划今年在欧洲首发亮相。该车为双座布局,去年已在中国上市。报道认为,其凭借轻量化设计、直接而精准的转向反馈以及明显的复古跑车气质,迅速获得车迷关注。 动力方面,SC01 采用前后双电机布局,综合功率为 430 马力(320kW)。在高性能纯电车型功率不断攀升的背景下,这一参数并不激进,但 SC01 的优势在于车重控制。整备质量不足 1400kg,使其比保时捷 911 至少轻 100kg,在纯电跑车中相当少见。 该车的双电机系统不仅支持四驱模式,还可根据需求切换为纯后驱或纯前驱。据悉,正在进行欧洲认证的 SC01 零百加速时间为 2.9 秒,性能表现直接对标传统跑车。 车内风格同样走极简路线,仅保留必要功能。其搭载由中创新航提供的 60kWh 电池,在 CLTC 工况下续航里程为 500km,电量从 30% 充至 60% 需要 36 分钟。 中国版车型由工匠派负责研发,生产工作交由江铃集团新能源完成。据IT之家了解,江铃集团新能源为雷诺集团与江铃汽车集团的合资企业。 面向欧洲市场的 SC01 将在意大利生产,具体工厂尚未披露。可以确认的是,该车将采取限量销售策略,仅向部分欧洲国家提供 1000 辆配额。欧洲售价尚未公布,不过若定价接近中国市场 22.98 万元人民币的水平,报道认为,这款轻量化纯电跑车有望在欧洲车迷中引发关注。
特斯拉Robotaxi车队规模达200辆,同步推进无安全员测试
IT之家 1 月 21 日消息,特斯拉自动驾驶出租车(Robotaxi)已在美国加利福尼亚州湾区和得克萨斯州奥斯汀市投入运营,其车队规模近日创下新里程碑,有望缓解外界对车辆运力不足的普遍诟病。 据 Robotaxi Tracker 证实,特斯拉共享出行车队的车辆总数已达 200 辆,其中 158 辆部署于加州湾区,其余 42 辆投放至奥斯汀市。尽管该项目率先在得州落地,但目前加州的车辆投放量明显更高。 据IT之家了解,两地的运营模式存在差异,这也是加州运营区域面积远大于得州、且车辆规模更为庞大的原因:在加州,车辆由 FSD 主导行驶,安全员需坐在驾驶座上待命;而在得州,安全员通常坐在副驾驶座,但当车辆驶入高速公路时,安全员会切换至驾驶座。 此外,特斯拉内部也已启动无安全员随车的测试。 这一新里程碑解决了奥斯汀和旧金山湾区的 Robotaxi 乘客普遍抱怨的一个问题,即车辆可用性。该 Robotaxi 项目落地的八个月内,关于车辆运力不足的投诉屡见不鲜。不少用户反映,由于项目初期车队规模极小,他们常常需要等待很长时间才能等到车辆。 现在有用户表示,目前候车时间已大幅缩短,尤其是在车队规模更大的湾区。 特斯拉计划于今年将 Robotaxi 服务拓展至更多城市,其中包括迈阿密、拉斯维加斯和休斯敦等多个地区。
马斯克:特斯拉Cybercab、Optimus量产初期将“极其缓慢”,但随后会飞快
IT之家 1 月 21 日消息,据路透社今日报道,特斯拉 CEO 马斯克表示,特斯拉 Cybercab 无人驾驶出租车以及人形机器人 Optimus 在量产初期的推进速度将异常缓慢,随后才会进入加速阶段。 目前,特斯拉约 1.39 万亿美元(IT之家注:现汇率约合 9.69 万亿元人民币)的估值,很大程度上依赖市场对自动驾驶技术和人形机器人未来潜力的判断,而特斯拉现阶段的主要收入和利润来源仍是纯电动汽车业务。 针对 Cybercab 将在不到 100 天内启动生产的说法,马斯克在 X 平台回应称,产能提升速度与产品复杂度密切相关,新增零部件和制造工序越多,初期爬坡就越慢。“Cybercab 和 Optimus 几乎从零开始开发,因此早期产量会非常缓慢,但随着流程成熟,速度最终会变得极快。” Cybercab 定位为双座无人驾驶车型,整车设计中不设方向盘和踏板等人工操控装置。 特斯拉此前披露,Cybercab 计划于 2026 年进入规模化生产阶段,而 Optimus 的人形机器人产量预计将在 2026 年年底前后启动。 2024 年 12 月,马斯克曾表示,特斯拉已开始测试前排不设安全监控员的无人驾驶出租车。同年,特斯拉已在得克萨斯州奥斯汀推出小规模无人驾驶出租车服务,使用搭载完全自动驾驶软件的 Model Y 车型。该服务初期仅在限定区域内运行,并在副驾驶位置配备人工安全监控。 马斯克多次强调,人形机器人项目是特斯拉长期战略的关键组成部分,未来发展潜力可能超过整车业务本身。马斯克认为,人形机器人能够接手大量人类不愿承担的任务,为经济体系创造新的增长空间。
半死不活的英雄联盟 因为海克斯大乱斗重新热闹起来了
编辑部的 LOL 群,半死不活几年了。 平时基本没人说话,就周末才能凑出两三个开黑的,就这还要在峡谷还是大乱斗争半天。有人嫌峡谷太累,有人嫌大乱斗无聊。 但最近几个月,群诈尸了。 每天晚上 9 点之后,群里四黑五黑雷打不动,扎进海克斯大乱斗,有时还得开二队。 这还只是第一轮。第二轮在 12 点,一帮刚从 PUBG 下来的人,转头又杀进海斗。 开黑频道里永远有人在喊——即便是凌晨 2 点。 别问,问就是好玩。一把接一把地干,根本停不下来。有次房间开成了普通大乱斗,几个人一进去说怎么没符文选。那一把都打得索然无味,浑身不得劲儿。 前两天公司内部还组织了一场海斗麻瓜杯,哥几个拿了冠军。 当然,海斗火爆场面可不只出现在编辑部。 只要你刷一圈各大平台就知道,海斗有多受欢迎。 无论是抖音、小红书还是公众号,海斗相关的图文视频都是爆发式出现。很多号就是专门研究起海斗,“今天版本什么符文最强”、“拿到这张牌怎么出装”,关键数据还都挺好的。 更夸张的是,海斗已经开始有出圈的迹象——不是玩完就完,而是玩完还要发、发完还要聊。 社交媒体上,每天大量玩家晒战绩,玩到了多大的坦克引擎,看到了多么抽象的符文搭配。 还有人开始做一些海斗符文的二创。 比如物法皆修:脑力工作会增强你的体质,体力劳动会增强你的智力。还有夺金:每当你辱骂或殴打同事,将有几率掠夺对方的工资和奖金。 就是这个炼狱导管有点超模了。。 直播那边就更热闹了。 这模式天生适合做直播。以前直播想火,要么操作拉满,要么骚套路,要么像大司马那样嘴硬。但现在呢? 符文选好有操作,符文选错有节目效果,哪怕有时一张嘴把最需要的符文喊来,弹幕更能直接炸:发牌员是你爹? 很多主播干脆把 ID 改成了海克斯大乱斗前缀,甚至英雄联盟主播榜第一名,都是玩海斗。 当然以上都是世超体感,真要说大数据佐证,也有。 海斗 10 月刚上线那会儿,《英雄联盟》直接回到了 WeGame 周下载榜第一。 之后的两个月内,哪怕工作日晚上登录一区,排队都是 10 到 15 分钟起步。 直到上个月,官方决定给一区扩容服务器,排队情况才得到缓解。 但问题来了:官方没放数据,我们没法直接知道海斗到底有多少人在玩、每天有多少场。 倒是有一个信息能侧面给到答案—— 外服在 15.21 版本上线海克斯大乱斗后,极地大乱斗玩家暴跌了 66%。 这个跌法不是大家不玩了,更不可能是大乱斗玩家全跑去打峡谷(我是大乱斗玩家,我死都不玩峡谷),它只有一个解释:大乱斗的人跑去打海斗了。 虽然这数据是外服的,但玩家的心是一样的。 极地大乱斗人数腰斩了大半,服务器每天还在排队,甚至要扩容——你就知道海斗有多恐怖了。 所以本计划 1.8 号下线的海斗,被官方宣布延长,而且马上还会有重大更新。 玩家们态度更是统一的一批,直接常驻得了。 说到这,你可能会想:海斗,不就是大乱斗加了点符文吗,至于好玩成这样? 至于。 抽卡牌、玩肉鸽——玩家对这套就是没抵抗力。之前斗魂竞技场下线时,一堆人跑去体验服排队玩,就为了那口 Roguelike 的瘾。 海斗的魅力也在于此:随机英雄+ 随机符文= 全程开盲盒。 传统大乱斗阵容一出来,懂的人心里就有数了:前期打不过、后期能翻;前期碾压、后期乏力。剧本基本写好了,就差演完。 但海斗不是这样。 海斗每一把都是一个未知数。你的符文不一样,对手符文不一样,对局走向完全不可预测。谁都不知道下一张会抽到什么。 即便你这会儿被打得很惨,你也会期待下一个海克斯符文,会不会让自己直接起飞? 这种期待感和未知,贯穿整局,你总想再看一张牌。 就算对局输了,但你在随机性中完成了“万血蒙多”,“1000 移速 ADC”,“出了破败的 AP”。这些全新体验,能给到你额外的爽感,这是传统大乱斗压根做不到的事情。 不光是玩爽,这种不确定性还降低了游玩压力。 英雄联盟十几年了,现在的老玩家大多数过了追求段位的年纪,都是上了一天班,晚上打开游戏放松一下。 所以大家逐渐远离高负荷的召唤师峡谷,跑到了极地大乱斗,不搞运营,见面就是几个大汉挤在一起互相摩擦。 可这些年极地大乱斗人一多,卷起来了,它也就不纯粹了。 出装开始有正确答案,阵容也有版本最优解,甚至断桥上出现了胜率队、陪玩队、红包局,五人组队、固定阵容、配合默契,碰上他们你连塔都摸不到。 当图一乐成了图一赢,玩家们就觉得有压力了,无趣了。 但海斗卡牌的随机性,从根上把“卷”给抵消了。 这么说吧,在绝对的运气差面前,你再努力研究再有配合再有胜率队,都不值得一提。 当杰斯拿到了一板一眼,当瑞兹成了瑞天帝,那还操作啥卷个啥,点了呗。 反正节奏快——不爽就 8 分钟下一把,30 秒后又是一条好汉。 别说什么电竞精神,要坚持到 50 点血翻盘。我来打这模式,就是 TM 纯粹为了快乐。谁想在峡谷里那样,被摁着打 20 分钟。。。 更重要的是,海斗给了玩家一个完美的心理出口。 输了?那是发牌员的问题。对面天胡,我能怎么办? 赢了?那是我操作好,兄dei。 心理学上管这叫“自利性偏差”:人倾向于把成功归因于自己,把失败归因于外部。海斗的随机机制,正好给我们这种心理提供了一个完美的台阶下。 总之就是一句话:海斗机制,上瘾,不伤身。 该说不说,这段时间,LOL 玩家们好像回到了十几年前刚接触游戏时,那个天天查攻略、分享套路的年代,到处都是新鲜感,哥们每天上班都心痒痒想整两把。 现在唯一期待的,就是官方赶紧加把劲,多更新点符文。 虽然我们不知道这股热度能持续多久,但至少现在,英雄联盟这个游戏又热闹起来了。
三星电子联席CEO卢泰文:AI成败不在跑分 而在日常生活
【CNMO科技消息】1月21日,CNMO注意到,现任三星电子联席CEO及设备体验(DX)部门负责人卢泰文在《华尔街日报》发表署名文章,以三星高管身份对外系统阐述其对人工智能发展的核心观点。他明确指出,AI技术的真正价值不在于模型参数规模或基准测试得分,而在于能否为用户带来“可感知的实用价值”与“值得信赖的日常体验”。 卢泰文在文中援引“阿马拉定律”(Amara’s Law)——即人们倾向于高估技术的短期影响,却低估其长期潜力——来分析当前AI产业现状。他认为,行业已度过对AI能力盲目乐观的初期阶段,正进入以实际效用为核心的理性期。 “AI的普及不再取决于它有多‘聪明’,而在于它是否能让普通人更轻松地完成一件平凡的事,比如安排家庭日程、理解多语言信息,或在嘈杂环境中清晰通话。”他强调,只有当AI能准确理解用户所处的情境与真实意图,并以自然、无感的方式提供帮助,才能赢得长期信任。 为实现这一目标,卢泰文提出三大设计原则:首先是“广泛可达性”(Reach),即AI功能应覆盖尽可能多的用户群体,无论其技术背景如何;其次是“无需学习的开放性”(Openness),意味着用户不应为了使用AI而专门学习新操作逻辑或启动复杂设置;最后是“内建可信度”(Confidence),要求系统在隐私保护、数据安全与行为一致性上建立可靠保障。 值得注意的是,他直接对当前业界盛行的“跑分竞赛”提出质疑:“AI的成败绝不会由某个基准测试的分数决定。”在他看来,真正有意义的衡量标准是用户是否愿意每天依赖该技术。
加拿大法院推翻政府命令裁定TikTok可继续运营 官方回应
TikTok 凤凰网科技讯 北京时间1月22日,据路透社报道,加拿大联邦法院周三推翻了政府要求关闭TikTok加拿大业务的命令,允许这款短视频应用暂时继续运营,并要求加拿大政府重新审查该案。 2024年11月,加拿大工业部以国家安全风险为由下令关闭TikTok的业务,但同时补充称,政府并未封禁该应用,也未限制用户创作内容。TikTok随后提起上诉。 加拿大联邦法院法官拉塞尔·津恩(Russel Zinn)在一份简短判决中撤销了该命令,并将此案发回工业部长拉妮·乔利(Melanie Joly)重新审查。他未给出任何理由。 TikTok发言人对这一裁决表示欢迎,并表示公司期待“与乔利部长合作以达成解决方案”,并补充称该应用在加拿大拥有超过1400万用户,约占该国人口的三分之一。 “保留TikTok加拿大团队的运作,将为我们继续支持在加拿大的数百万美元投资和数百个本地工作岗位铺平道路。”TikTok发言人称。 另据彭博社报道,加拿大法官暂时搁置此前要求TikTok逐步关闭业务的命令,允许该应用继续运营其在加拿大的子公司,这一做法显然得到了政府的默许。 此项裁决是在加拿大政府就TikTok上诉案件提出动议后作出的,法院在裁决中“注意到双方都对此表示同意”。 目前,加拿大总理卡尼一直在寻求与中国建立更紧密的关系,以帮助抵消美国关税对加拿大经济造成的影响。卡尼最近访华,并降低关税进口4.9万辆中国电动汽车。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
硅谷风投教父谈AI行业现状:智能需求无限,基建和应用爆发才刚刚开始
近日,OpenAI官网放出了其首席财务官Sarah Friar与传奇投资人、Khosla Ventures创始人Vinod Khosla的深度对话。 针对AI泡沫担忧,Vinod明确表示,用股价波动来衡量泡沫是错误的,真正的衡量标准应当是底层的实际使用量:在互联网时代是流量,在AI时代则是API调用量。目前的API调用量完全看不到任何泡沫的迹象,现状并非需求不足,而是供给受限。 Sarah Friar佐证了这一观点,她首次详细披露了OpenAI过去三年的增长数据: 2023年:算力规模约200兆瓦,ARR约20亿美元。 2024年:算力规模增长至600兆瓦,ARR增长至60亿美元。 2025年:算力规模突破2吉瓦(即2000兆瓦),ARR超过200亿美元。 数据显示,OpenAI的算力投入与商业回报之间呈现出近乎完美线性的关系,这种高度耦合的增长曲线表明,AI产业仍处于典型的供给侧约束阶段。现在需求上限仅受制于算力的可用性。如果今天有更多的算力,OpenAI就能推出更多的产品,训练更多的模型。 虽然算力投入与回报在曲线上是对应的,但时间上存在错配。Sarah坦言,为了确保2028年至2030年的算力供应,OpenAI必须在当下就做出巨额的基建决策。 关于2026年的AI发展趋势,Vinod预判:Agent将成为绝对的核心主题,多智能体系统(Multi-agent systems)有望展现出真正可见的产业影响力。 在企业端,Agent将开始深入复杂的业务流,具备独立运行ERP等核心系统的能力,实现对账、应计费用核算及合同追踪等长链条任务的自动化闭环。 在消费端,Agent也将从单一的聊天机器人进化为具备跨应用执行能力的超级助手。以旅行为例,智能体不仅能提供建议,更能综合考量饮食偏好、实时航班时刻和个人日程等多重变量,直接为用户规划并落实一次完整的行程。 这种深度渗透在医疗领域已成现实。每周有2.3亿人向ChatGPT咨询健康问题,高达66%的美国医生表示在日常工作中使用ChatGPT。这标志着AI正加速从一种新奇的技术尝鲜,转变为专业领域的必需生产力。 站在更长远的时间维度,Vinod对未来15年的科技趋势做出了两项大胆预测: 第一,机器人在15年内的产业规模将超过汽车工业。目前汽车行业主要关注如何将机器人用于生产线,但未来的通用人形机器人市场将是一个远超汽车的庞大经济体。 第二,我们将面临极度通缩的经济环境。随着劳动成本和专业知识成本趋近于零,未来十年末期可能会出现大规模的通缩经济。这将引发社会对“人类该做什么”的深刻反思,同时也可能带来更高标准的社会基础保障。 本次对谈传递出非常明确的信号:在硅谷的核心圈层看来,AI浪潮才刚刚开始。对于企业和开发者而言,关注点不应是资本市场的噪音,而是如何利用即将到来的Agent时代,去重构那些尚未被智能化触及的复杂业务流程。 Sarah Friar与Vinod Khosla对话划重点: 1、2026年是Agent与多智能体系统的爆发之年 如果说2025年的主题是vibe coding,那么2026年将是Agent技术成熟并产生实质影响的一年。未来的发展方向是多智能体系统(Multi-agent systems)。 2、AI泡沫是一个伪命题 所谓的AI泡沫是一个伪命题,股价的波动只反映投资者的情绪,而非技术本身的价值。衡量AI真实需求的唯一指标应该是API调用的数量,从这个维度看并不存在泡沫。目前需求的唯一限制是计算资源的可用性,考虑到价格弹性,市场对智能的需求实际上是无限的。现在的状况是需求跑在投资前面,这与互联网泡沫时期流量匮乏但股价虚高的情况截然不同。 3、OpenAI的商业模式与算力投资 OpenAI的商业模式已从单一维度进化为立体的魔方结构:底层是多云、多芯片的基础设施架构,中间是涵盖ChatGPT、Sora等多模态的产品层,上层是包括订阅、SaaS、积分制及未来潜在许可模式的多元商业化体系。在算力投资上,OpenAI发现算力投入与收入增长存在极强的相关性。目前的投资决策必须提前数年布局,以确保2028-2030年有足够的计算资源。 4、企业效能新范式:人+Agent 企业应用AI不仅带来了约27%-33%的生产力提升,更改变了工作性质。AI正在接管如合同审查、条款分析等枯燥且低价值的重复性工作,让员工转向更具创造性和增长导向的岗位。未来的组织模式将呈现人+Agents的形态,例如一名员工协同五个Agent工作。对于企业而言,真正的机会在于利用AI重构核心业务流程,而不仅仅是简单的工具采用。 5、AI变革医疗健康领域 医疗健康是AI将带来彻底变革的领域,它将使专业知识商品化。目前已有66%的美国医生在日常工作中使用ChatGPT,它在辅助诊断罕见病(如非本地流行病)和提供第二意见方面展现了巨大价值。然而,该领域面临的最大阻力来自监管(如FDA)和既有体制(如美国医学会),目前的法律限制了AI开具处方或作为医疗器械被批准,这导致监管环境滞后于技术能力。 6、创业公司的护城河是独特数据与复杂工作流 在基础模型日益强大的背景下,创业公司的机会在于垂直化和复杂性。通用模型无法解决所有问题,真正的护城河建立在通过防火墙获取的独特私有数据,以及对企业内部复杂工作流的管理之上。初创企业不应试图在模型能力上与巨头竞争,而应在模型之上构建专业化的解决方案。 7、通缩型经济与免费的专业知识 未来十年末,世界可能迎来大规模的通缩型经济,劳动力和专业知识的成本将趋近于零。这意味着教育、初级医疗等昂贵服务将变得极其廉价甚至免费,每个人都能拥有AI导师和私人医生。虽然住房等硬资产问题尚待解决,但在服务领域,社会将通过机器人技术和智能的普及,进入一个物质和服务极大丰富的时代。 以下是Sarah Friar与Vinod Khosla对话实录: 1、2026年的AI趋势是什么? Andrew Mayne:大家好,我是Andrew Mayne,这里是OpenAI播客。今天我们的嘉宾是OpenAI首席财务官Sarah Friar,以及Khosla Ventures的传奇投资人Vinod Khosla。在本次讨论中,我们将探讨AI生态系统的现状、我们是否处于泡沫之中,以及随着AI的发展,初创公司和投资者如何取得成功。 Andrew Mayne:2025年关注的是Agent和vibe coding。现在已经是2026年了,今年的主题是什么? Vinod Khosla:我认为2025年我们在vibe coding方面已经成熟,但在Agent方面尚未完全成熟。因此,2026年将是Agent,特别是多Agent系统(Multi-agent systems)成熟并产生真正可见影响的一年。 在企业端,我们期望拥有一个执行完整任务的多Agent系统,例如为你运行ERP系统,每天自动进行对账、计提和合同跟踪;在消费者端,虽然今天规划旅行仍然很麻烦,但这将变成一个多Agent协作的任务,它会综合考虑你的饮食偏好、餐厅预订、航班时间表以及个人日程等多种因素。我认为这些从一年前开始发展的技术将在今年成熟。 此外,我对机器人学和现实世界模型(World Models)非常兴奋。这不仅仅局限于机器人学,还包括通用直觉(General Intuition)。像大语言模型中的记忆功能、持续学习能力以及减少“幻觉”影响,这些都是目前AI做得还不够好但很快会被解决的领域,值得重点关注。 Sarah Friar:我认为Vinod想表达的根本观点是,2026年是弥合“能力差距”的开始。我们把巨大的智能交到了人们手中,就像把法拉利的钥匙交给了他们,但他们才刚刚学会怎么把车开上路。 我们需要为消费者提供更多简单的方式,让他们从单纯把ChatGPT当作问答聊天机器人这种使用模式中转变过来。今天大多数人只是用它提问,但我们如何将其推进为真正的任务执行者?比如为用户预订行程,或者针对医生刚给出的建议提供第二意见,亦或是帮助患有糖尿病的孩子制定菜单?核心在于帮助用户从简单的提问转向获取能改善生活的实际结果。 在企业端也是同样的逻辑。根据我们的首席经济学家去年底发布的《企业AI现状》报告,前沿企业与中位数企业之间存在巨大差距。前沿企业的AI使用量是其他公司的6倍,而且即便是这些前沿企业,其能力也尚未被充分挖掘。 因此,我们的重点是:对于消费者,如何帮助他们沿着这条能力连续体前进,实现真正的代理任务执行?对于企业,如何打造更复杂、更垂直专业化的解决方案,使他们能从简单的ChatGPT应用一路升级,直到改变业务中最核心的部分?例如对于医疗服务提供者,可能是药物发现流程;对于医院,可能是缩短患者从入院到重返社区的时间;对于大型零售商,则是提升购物篮规模、转化率和顾客满意度。 Vinod Khosla:我想补充一个视角。我们经常看到人们把采用曲线(Adoption Curve)和能力曲线(Capability Curve)混淆了。我敢打赌,今天无论是个人还是企业,真正使用了AI 30%以上能力的人只有个位数比例。要让人们学会利用AI 30%、50%甚至80%的能力,这是一个长达十年的过程。 Sarah Friar:这就是我想强调的:AI是一个力量倍增器。虽然今天ChatGPT每周有8亿消费者在使用,这个数字本应达到数十亿,但关键是他们利用这一工具完成了多少比例的工作?这就像我们刚把家里的电接通,人们学会了开灯,却根本不知道电力还能用来供暖、做饭或卷发。现在的可能性太多了。 Andrew Mayne:我常用的一个比喻是:1990年到2000年间,电子邮件本身并没有变得更好,移动设备最初也没有质的飞跃,但使用量却大幅上升。问题不在于我们需要更好的电子邮件,而在于人们需要学习所有可以用它做的事情。 Sarah Friar:是的,移动端一直是我觉得很有趣的领域。当移动浪潮兴起时,人们最初只是把桌面网站直接搬到手机上,体验很差,唯一的优点是能装在口袋里。但后来你意识到有了GPS,于是可以叫Uber;有了摄像头,不仅可以给朋友拍照,还可以拍张支票直接存入银行账户。 这一切功能在手机出现的那一刻其实就已经具备了,只待人类的创造力去挖掘。所以你说得对,或许我们甚至不需要比今天更多的智能,就能大幅提升成果。当然,模型本身也会变得越来越智能。 2、医疗领域的AI Andrew Mayne:你们提到了健康领域,这是一个高风险且至关重要的方面。几年前我们将ChatGPT用于简单应用,现在开始信任它处理符合HIPAA标准的数据。你们会把这看作是发展加速的标志吗?或者还有其他类似的标志吗? Vinod Khosla:健康显然是我长期认为会被彻底变革的领域之一,它将把专业知识变成一种商品化的东西。但健康领域的问题在于监管。首先,AI能做的事情受到诸多限制。例如,即便AI在开处方方面比人类更优秀,它在法律上也不能开处方。 这不仅仅是FDA(美国食品药品监督管理局)的问题,还涉及到美国医学会(AMA)等机构在体制上对该功能的控制。因此在很多领域会遇到既有的阻力。诊断仍然是一个受限项,因为这由FDA控制,目前还没有任何AI被批准作为医疗器械。不过值得庆幸的是,目前的政府团队在迅速行动并承担适当风险方面做得非常好,我对那里的进展感到相当满意。 Sarah Friar:在健康领域,我们的数据显示每周有2.3亿人向ChatGPT咨询健康相关问题。66%的美国医生表示他们在日常工作中使用ChatGPT。 我可以从个人角度举个例子,我弟弟是英国的一名重症监护医生。他在苏格兰的阿伯丁工作,如果你因患疟疾去找他,他是很难想到的,因为那不在他的模式识别范围内。但如果你去某地度假被蚊子咬了,回到阿伯丁发病,ChatGPT或模型能做到的就是对他进行很好的增强。这解释了为什么有66%的医生在使用它,而且这个数字还在增长。 这不仅让医生能掌握最新研究成果、了解药物相互作用,也在某种程度上把自主权还给了消费者。我现在可以提前研究症状,与医生进行更有学识的对话,或者寻求第二意见。 举个生活中的例子,比如“我每天只有20分钟锻炼时间,我有1型糖尿病,我能做什么?”或者当我们带患有糖尿病的女儿外出就餐时,以前需要不停询问服务员,非常令人沮丧。现在我们可以拍摄菜单,让AI建议哪些菜最适合她。这改变了我们对吃饭这件事的看法,让我们能将重点从单纯的食物转移到家庭聚餐的陪伴上。 3、按收入扩展计算资源 Andrew Mayne:回应Vinod的观点,我认为监管环境必须赶上来。无论在哪种体制下,医疗费用的增长速度都超过了每个国家的GDP增速。我们需要AI,而且现在就需要。正如你指出的,这是历史上医疗智能成本首次同比下降。但这同时也带来了对算力的巨大需求。既然谈到算力,OpenAI在算力上的投资规模令人难以想象。OpenAI是如何确定这种需求的?你们看重哪些指标来决定投入巨资? Sarah Friar:首先,我们努力确保算力投资与收入增长速度保持一致。我们发现期内计算投入与期内收入之间存在极强的相关性。 举个例子:2023年我们的算力约为200兆瓦,对应的年度经常性收入(ARR)为20亿美元;2024年算力达到600兆瓦,我们以60亿美元的收入结束该年;而到去年2025年结束时,我们的算力达到2吉瓦,收入则超过200亿美元。这显示出增长一直在加速。 虽然算力投入和收入在曲线上是对应的,但时间上存在错配。我必须在今天做出决策,以下订单并发出建立数据中心的信号,以确保我们在2028、2029和2030年有足够的计算资源。如果今天不行动,未来就不会有。 目前,我们感到在计算资源上绝对受限。如果有更多算力,我们可以推出更多产品、训练更多模型、探索更多多模态内容。这种趋势不仅限于OpenAI,去年全球整体硬件投资增加了约2200亿美元,芯片预测也上涨了约3340亿美元。整个环境都在传递一个信号:AI是真实存在的。 我们正处于范式转变之中。我们需要投资,赋予人们完成刚才讨论的所有事项所需的智能。在OpenAI内部,我们投入了大量时间深入研究消费者、企业和开发者的需求信号。 我们首先从基础层思考整体布局。在基础设施层,我们思考如何创造最大的可选性,因此我们希望实现多云、多芯片架构,这为基础设施层增添了一个有趣的维度。 往上是产品层,我们也致力使其更加多维。过去我们只有ChatGPT,而今天,面向消费者的ChatGPT内置了包括医疗在内的所有模块;我们还有面向工作的ChatGPT,以及作为新平台的Sora和一些变革性的研究项目。 再进一步,我们的商业模式生态系统也正变得日益多元化。起初为了支付ChatGPT的计算成本,我们只有一种订阅模式。现在我们不仅有多个价格点的订阅服务,还面向企业推出了SaaS定价,并针对高价值场景采用了基于积分的定价模式,因为用户愿意为更高价值的服务支付更多。 我们也在考量商业化和广告等方向。从长远来看,我倾向于能实现真正利益对齐的模式,比如许可模式。假设在药物发现领域,如果我们授权技术帮助客户取得了突破,一旦药物畅销,我们就能获得相应的分成,这与客户的目标高度一致。 如果把这三层结合起来,我把它想象成一个魔方。我们从单一模块、单一云服务商(微软)、单一芯片、单一产品和单一商业模式,发展到了如今这个完整的三维立方体。魔方大约有4300亿亿种不同的状态,这让我着迷。想象一下转动这个魔方:我们可以选择一款低延迟芯片,配合编码等人们期望提速5倍的应用,并为此收取高端订阅费。这就好比魔方的一面拼出了三种颜色。我们也可以再次转动魔方,利用低延迟芯片和更快的图像生成技术吸引更多免费用户,从而为潜在的广告平台创造更多库存。 过去12个月,我们的目标就是创造越来越多的战略选项,确保持续有能力支付实现使命,即造福人类的通用人工智能(AGI)所需的计算成本。 Vinod Khosla:简而言之,目前需求的唯一限制就是计算资源的可用性,无论是Sora还是更广泛的应用都是如此。考虑到价格弹性,对计算资源的需求实际上是无限的。我们甚至还没开始利用价格弹性这个杠杆,仅仅是因为受限于计算能力而无法满足现有需求。因此,那些谈论“泡沫”的人完全搞错了方向。他们没有意识到这场变革的规模,以及API调用需求的弹性增长空间有多大。 4、AI时代与互联网泡沫时期的区别 Andrew Mayne:作为OpenAI最早的投资者之一,你很早就押注了我们。你曾亲历过互联网泡沫,也见证过移动革命等其他变革。我想问,你对AI的坚定信念是否源于它触及了如此广泛的领域? Vinod Khosla:当初投资时,我们的衡量标准非常简单:没有任何可供参考的预测、产品计划或ChatGPT。只有一个核心理念:如果开发出的技术接近甚至超越人类智能,其影响将是巨大的。这是一个基于宏观后果的判断,既然成功的收益如此深远,为什么不去尝试呢? 关于泡沫这个概念很有趣。人们习惯把泡沫等同于股价,但这除了反映投资者之间的恐惧和贪婪外,说明不了任何问题。我认为泡沫应该用API调用的次数来衡量。回顾所谓的互联网泡沫,如果我们看当时的互联网流量,即便股价剧烈波动,流量本身并没有出现泡沫。同样,我可以保证,如果以API调用数量作为衡量AI真实用途、实用性和需求的基本指标,你根本看不到泡沫。 我并不关心华尔街如何解读,这大多无关紧要,只是给媒体提供了填充版面的素材。股价或私有公司估值并不是现实,现实是对AI的实际需求,也就是API调用的数量。 Sarah Friar:确实如此。回看1999年,当时人们从互联网获得的价值还非常初级,很难看出它如何改变生活。但我认为AI带来的变化发生得非常快,而且非常真实。 作为一名CFO,我在组织内部看到的真实情况是:我们可以把以前那些需要不断增加人手去做的、相当枯燥的工作,真正交给系统去完成。以收入管理(Revenue Management)为例,团队以前每天都要下载前一天签署的所有合同,阅读并检查是否存在可能导致收入确认变更的非标准条款。这对财务团队至关重要,也是审计的重点。随着我们业务成倍增长,在没有AI的世界里,我唯一的选择就是雇佣更多人去日复一日地阅读合同。这种工作既平庸又乏味,并不是人们学习会计或金融的初衷,但这曾是我们提供的入门级工作。 如今在OpenAI,我们利用自己的工具,系统会在夜间提取所有合同并存入Databricks数据库。Agent会遍历这些数据,准确指出哪些条款不规范及其原因,并建议如何进行收入确认。更重要的是,它能提供洞察,比如某个条款是否属于销售人员的违规操作,这就需要我去进行指导;或者这是否暗示我的业务模式正在发生转变,某些非标准条款其实应该标准化。这可能是一件好事,促使我找到新方式既满足客户和销售的需求,又保持商业模式的健康。而那些初级员工则可以从枯燥的工作中解脱出来,转向更有价值、他们更热爱的工作领域。 对我来说,这就证明了这不是泡沫,因为价值是真实可触及的。这意味着我可以拥有一个规模更小但绩效更高、士气更高、留存率更好的团队。我可以用数据证明业务变得更健康了。媒体用“泡沫”来引导舆论的问题在于,他们忽略了我们是在追随需求进行投资,目前甚至是需求跑在前面。所谓的“泡沫”通常是指投资超前于需求并造成了缺口。 Vinod Khosla:看看生产力数据就知道了。那些正在采纳AI的公司,特别是新一批技术导向型公司,生产力都在显著上升,数字令人惊叹。我最喜欢的例子是一家叫Slash的小公司,年经常性收入(ARR)约1.5亿美元,但会计部门只有一名总账主管,因为他们采用了以AI为导向的ERP系统取代了NetSuite。他们CEO甚至向我道歉,说可能得雇第二个人了。还有一个新闻是,有人用一个AI销售开发代表(SDR)替代了10个传统SDR的工作,剩下的一名员工只需负责监督。 Andrew Mayne:我听到两种说法:一种是不再招聘人手做某些不能带来增长的工作;另一种是现在可以把招聘名额用在能为公司创造更多增长的人才上。这就是许多科技公司发展如此迅速的原因。 Vinod Khosla:正所谓“未来已来,只是分布不均”。我看到单点上巨大的生产力、效率和敏捷性提升,但全球只有极小比例的人采用了这些技术。随着时间推移,这些案例会传播开来,技术采用率将呈指数级增长。所以,需求完全不是问题。 Sarah Friar:Vinod说得完全正确。麦肯锡的研究显示,处于前四分位的公司生产力提升了约27%到33%,这是非常有意义的增长。这不仅仅意味着减少员工,而是必须把人员转移到更侧重增长的岗位上。 我最近遇到一位大型咨询公司的负责人,她把现在的组织模式称为“人加Agents(people plus agents)”,采用一比五的比例,即一名员工对应五个Agents。但在前端,他们实际上又开始重新招聘扩张,因为客户现在需要更多帮助来部署AI。所以工作并没有消失,而是回到了人们真正想做的创造性工作,而不是单纯解析海量信息。现在,我们终于可以让机器和Agents来处理信息解析了。 5、ChatGPT中的广告 Andrew Mayne:回到消费者端,你提到了广告。我们的观点是,通过广告可以增加收益,从而提供更多服务和AI能力,帮助支付计算成本,让用户从免费层级中获得更多价值。但这引出了信任问题。用户担心ChatGPT如何处理信息,一旦引入广告,人们就会担心这会如何影响产品和组织。 Sarah Friar:首先,目前的现实是我们95%的用户在免费使用平台。我们的使命是造福全人类的AGI,而不仅仅是造福付费用户,因此提供广泛的获取途径至关重要。关于广告,第一,我们必须确保每个人都明白,你永远会获得模型能提供的最佳答案,而不是付费推广的答案。其他平台在这方面已经倒退,用户分不清是赞助链接还是最佳结果,而我们的北极星原则是模型始终给出最佳答案。 第二,广告可以带来实用价值。例如,如果我搜索周末去圣地亚哥的短途旅行,Airbnb的广告可能会非常有用。在这种情况下,用户甚至可能希望在ChatGPT环境中与广告主进行深度对话,但前提是必须清楚这是广告场景。我们需要创新,让广告看起来是平台固有的一部分,而不是老旧的横幅广告。 第三,必须保留一个无广告的层级,给予用户选择和控制权。我们非常重视数据隐私,比如在推出Health功能时,我们明确表示数据是隔离保存的,不会用于训练。信任对OpenAI来说就是一切,即便涉及广告,我们也会坚守这些原则。 Andrew Mayne:在消费者方面,未来会不会变成一个用户订阅多种不同AI服务的世界? Vinod Khosla:我认为用户会使用各种模型,大多数人会有不止一个订阅。媒体行业就是很好的例子,大多数人拥有多个媒体订阅,这是消费者行为的一个很好参照。不同的人会选择不同选项,包括由广告支持的免费选项。即使是同一项服务,你也可以选择付费或免费。市场将呈现广泛的多样性。 6、消费者会不止订阅一项AI服务吗? Sarah Friar:那你如何看待转换平台的成本?我很喜欢ChatGPT的记忆功能,它越来越有用,因为它能记得几周甚至几个月前我们讨论的内容。我现在每天醒来使用的Pulse功能(目前尚未广泛推广)非常惊艳。当你把它连接到日历时,它不仅会推送我感兴趣的AI数据中心内容,还会提醒我今天要在日历上和Vinod见面。记住这些细节非常有帮助。 但这涉及到多平台使用(multi-homing)的问题。如果我在多个地方同时使用AI,我就无法享受到统一记忆的好处。这跟同时订阅《华尔街日报》、《经济学人》和《纽约时报》不同,去别处阅读不会让我受损。但在AI领域,分散使用会导致记忆断层。 Vinod Khosla:是的,“记忆”确实是一个重要问题。未来可能是每个设备有一个模型的记忆,或者是多个模型各自拥有记忆。即便在OpenAI的模型上,也会有多个服务提供者提供不同的权衡取舍。这就是多平台使用的概念。显然,OpenAI不会占据100%的市场。 Sarah Friar:这是一个有趣的商业模式。人们很难理解这一点,因为它不像Netflix那样受限于用户有限的时间。我把它看作是基础设施,更像电力。 如果你问我一天用多少电?我不知道。我今天走进一个房间,风扇在吹,感觉很舒服,灯也亮着,但我并没有意识到电的存在。就像我把手机整晚充电,第二天就能用一整天一样。 目前的现状是,我们更多是在主动调用ChatGPT,去唤醒它,而不是让智能自然地内置于背景中。我认为这将是未来几年最大的变化。回过头看,你会觉得我们现在做的事情像玩具一样。未来,智能将无处不在,环绕在我们周围。 我不认为人们的时间是有限的,所以我不会纠结于此。我生活中几乎每一件事都需要智能,即使是行走,我也希望大脑中有智能在运作。如果我们能增强这种智能,结果将令人震惊。这就像你第一次发现手机上有手电筒和相机时的感觉,事后看显而易见,但当时却是革命性的。 每次使用ChatGPT,哪怕是发现一个小小的用例,我都会被震撼。比如昨天早上,我很想读《经济学人》的一篇社论,但我没时间阅读,因为我要赶着上楼准备。于是我拍了照片,让ChatGPT读给我听。它做到了,体验太棒了。我们才刚刚起步,而多模态将是最大的变革。手机教会了我们用拇指交流,而新世界的新硬件将帮助我们理解:我们可以听、说、看、写。我们将以一种非常接近人类本能的方式完成这些事情。 Vinod Khosla:让我换个角度补充一点。回看互联网泡沫时期,互联网所做的是极大地扩展了你接触信息的渠道,无论是媒体、YouTube视频还是TikTok。信息量爆炸到了人类无法完全利用的程度。我把AI看作是在你每天有限的清醒时间里的补充,它能筛选信息,让你利用它的每一小时都成为最高效的一小时。智能会将世界缩减为对你个人最相关的事物。我可能和Sarah有一套不同的优先级,智能会分别为我们总结对各自最相关的内容。 7、AI时代企业端如何取得成功? Andrew Mayne:我们要谈谈企业端的问题。OpenAI在消费者端很有优势,但在企业端,OpenAI将如何竞争并取胜? Sarah Friar:我认为我们已经在企业端胜出了。90%的企业要么表示正在使用OpenAI,要么计划在未来12个月内使用。微软也在使用我们的技术,这是另一个重要因素。 实际上,消费者业务是推动企业业务发展的巨大飞轮。正如早年人们第一次把iPhone带到工作场所,尽管企业最初抵触,但最终无法抵挡消费者偏好的潮流。当我在生活中习惯了某种工具,我会期望工作中的工具至少要一样好,甚至更好。这就是推动我们企业业务增长的原因,使我们成为最快达到100万家付费企业的平台,这一过程大约只用了一年半。 但这只是冰山一角。下一步是深入垂直领域,用客户的语言与他们交流。企业销售的艺术在于:不是推销产品,而是先了解问题。我们要问CEO:董事会强制你做什么?你的客户想要什么而你无法提供?然后我们将智能应用到这些问题上。 我们可以从轻度垂直化发展到深度垂直化。例如在能源公司,利用强化学习模型真正理解特定的油井或地震数据,以判断气田的回收量。此外,我们正在推进一些变革性的研究项目,实际上是接管公司某部分的业务,帮助他们以更聪明、更快速的方式重构业务流程,从而推动关键指标。 这是一个旅程。大多数企业从全面部署ChatGPT开始,这只是起步。很多企业已经开始利用AI进行编码。我和一些CEO交流时,他们会说:“我60%的生产代码现在是由Agent构建的。”而在12个月前,他们甚至不知道生产代码是什么。 在Agent方面,一切才刚刚开始。目前只有约14%的美国企业在使用某种代理式解决方案。正如我提到的财务部门的案例,机会是巨大的。 Andrew Mayne:如果我是创业公司,看到OpenAI做的一切,我会问:还有我的空间吗? Vinod Khosla:模型会不断进化,能力越来越强,但我确信在模型之上还有巨大的构建空间。没有哪家公司能包揽一切。全球有数十亿人在工作,AI能辅助他们。OpenAI不可能在每个领域都做到专业化。 对于创业公司,谨慎的做法是明确基础模型(无论是OpenAI还是其他家)的发展方向和能力边界,然后专注于更有趣的领域,在基础模型之上增加某种专门化。单靠智能并不是解决方案的全部,解决方案周围还有很多配套要素。模型越强大,依附于其上的机会就越多。 Sarah Friar:我经常思考那些聚合了大量独特数据的用例。世界上95%的信息实际上都在公司或大学的防火墙后面。那些已经建立了业务并汇总了这些数据的公司,拥有独特的优势。除了数据,他们还管理着复杂的工作流。 以采购系统为例,系统本身并不复杂,但它擅长理解授权委托等逻辑。它知道董事会批准的审批限额,知道超过某金额必须由我批准,低于某金额可由副总裁批准;它还能访问HR系统确认员工职级。这种结合了合规与治理的复杂流程,能让公司运转得更快。这就是我对创业公司感兴趣的领域:你在哪里能获取具有复杂工作流的独特数据?这才是护城河,我们希望能与这类公司合作。通用模型无法独自完成所有这些工作。 Vinod Khosla:我完全同意。机会非常多。我见过不少初创公司专注于数据权限管理,即谁可以访问哪些信息。也有很多公司专注于为企业定制模型,以适应其历史数据和优先级。 Sarah Friar:关于Agent,尤其是代理的身份认证方面,当Agent之间开始交互时,会产生新的风险和权限设定问题,甚至衍生出“代理式商业”(Agentic Commerce)。这种即将到来的复杂性是巨大的。所以,现在做初创公司可能从未像现在这样有趣或充满吸引力。 Andrew Mayne:当你与一家公司交谈时,什么会让你感到兴奋? Vinod Khosla:最难的总是找到优秀的人才。但我认为长期短缺的是主动权(Initiative),即人们让事情发生的能力。归根结底还是人的问题。传统的因素,如熟悉某个领域或拥有该领域的经验,现在已不那么重要了,更重要的是主动性。 8、机器人与未来愿景 Andrew Mayne:我们还没谈到机器人、现实世界模型这些领域。您曾谈到过2050年的愿景,现在模型发展这么快,您怎么看机器人的发展方向? Vinod Khosla:我在两年前的TED演讲中说过,机器人行业(不论是双足还是其他类型)在15年内的规模会比今天的汽车行业还要大。汽车行业已经是地球上最大的行业之一,而机器人行业将由智能驱动,规模会更庞大。目前很少有汽车公司以这种宏大的视角看待世界,他们只想着如何在装配线上使用机器人。这对初创公司来说是巨大的机会。 Sarah Friar:是的,我们有时会低估这其中的潜力。以家庭机器人为例,虽然目前还没有真正的突破,主要受限于复杂性问题。在AI领域待得越久,我越对人类在物理世界中移动和做事的能力感到敬畏。 大家可能会为机器人能叠衣服感到兴奋,这当然很好。但我们容易陷入一种观念,觉得机器人必须像人类一样做所有事。实际上,突破点可能在于更感性的层面,比如陪伴。随着人口老龄化,孤独是最大的流行病之一。对于独居老人,有人能以直观、有人情味的方式与他交流是最宝贵的。我们看到越来越多的人使用ChatGPT进行这种对话。 未来的突破可能不需要机器人会做咖啡或洗碗,而是一些更简单的功能,但这能带来巨大的价值。这正是Vinod所说的“爬行、学走、奔跑”的过程,其综合价值可能比汽车行业高出好几倍。 Andrew Mayne:有趣的是,我们现在正处于可以用机器人替代某些劳动的阶段。当你可以极低成本地获得劳动力和制造能力时,世界将发生巨变。例如,当建设一流辅助生活设施的成本大幅下降,将会带来深远影响。这真正意味着什么? Vinod Khosla:我个人的观点是,可能在下个十年末,我们会看到一个大规模的“通缩型经济”。因为劳动力将接近免费,专业知识将近乎免费,大多数功能的成本将趋近于零。虽然具体购买力与商品生产如何互动还难以精准判断,但我预计通缩程度将远超人们预期。 这涉及到社会层面的适应问题。人们将如何谋生?我经常被问到这个问题。我认为政府能够保障的最低生活标准将会比现在高得多,而且无需通过赚取收入来实现。我无法想象现在的初级医疗服务如果好上十倍,而成本只需每月一美元是怎么做到的,但这将成为现实:免费的初级医疗、免费的教育几乎不需要成本。几乎每个人都会有AI辅导,每个孩子都有私人导师,这已经在发生了。 所以,将会有一系列服务变成免费的。当然也有棘手的问题,比如住房。对于美国收入后50%的人口来说,住房和食物占了他们收入的40%以上。但我确实认为,通过机器人技术和更好的方法,这些问题最终都能得到解决。
苹果首个AI聊天机器人要来了:大改Siri 将整合入三大系统
苹果将改造Siri 凤凰网科技讯 北京时间1月22日,据彭博社报道,苹果公司计划在今年晚些时候对Siri进行改造,把这款数字助理升级为该公司的首个AI聊天机器人,从而正式加入由OpenAI和谷歌主导的生成式AI竞赛。 据知情人士透露,这款代号为“Campos”的聊天机器人将被深度嵌入iPhone、iPad和Mac的操作系统中,并取代当前的Siri界面。用户仍可像现在唤醒Siri一样使用这项新服务,例如直接说出“Siri”指令,或在iPhone或iPad上按住侧边按钮。 新的聊天机器人将远远超出当前Siri的能力,甚至超过苹果长期承诺、预计在2026年初推出的Siri更新。当前的Siri缺乏类似聊天机器人的体验,也不具备像OpenAI旗下ChatGPT或谷歌Gemini那样来回对话的能力。 苹果此前承诺的非聊天机器人形式的Siri升级将保留现有界面,计划在即将于未来几个月发布的iOS 26.4系统中推出。此次升级旨在加入2024年已发布的功能,包括分析屏幕内容及调用个人数据的能力,其网络搜索功能也将得到优化。 知情人士称,聊天机器人功能将在今年稍晚时候推出。苹果计划在6月的全球开发者大会上发布这项技术,并于9月正式推出。 Campos将同时支持语音和文字输入两种使用模式,并将成为苹果新操作系统中的主要新增功能。苹果正将其整合至代号为“Rave”的iOS 27和iPadOS 27系统,以及内部代号为“Fizz”的macOS 27系统中。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
哲学家推测AI几千年内终结人类文明,还给出毁灭概率
超级智能可能在未来几千年内彻底终结人类文明。 香港大学、澳大利亚天主教大学等大学的哲学家研究团队的一篇深度研究,通过构建一个严密的分类学框架,将人类在人工智能威胁下的生存路径拆解为四种核心模式,即技术停滞、文化禁令、目标对齐与外部监管。 研究将人工智能毁灭人类的逻辑建立在系统变得极其强大且其目标与人类冲突这两个前提之上,而要打破这一逻辑,人类必须依赖四层像瑞士奶酪一样的安全防御。 通过对每一层防御面临的科学壁垒、集体行动困境、资源竞争压力以及监管技术瓶颈的深度剖析,研究揭示了乐观主义者往往忽视的系统性风险,并推算出人类面临毁灭的概率可能远超想象。 科学与文化的双重天花板 人工智能是否会成为人类的终极威胁,首先取决于它们能否变得足够强大。 如果科学研究撞上了无法逾越的墙壁,或者人类社会达成共识并联手封印这项技术,那么毁灭的前提就不复存在。 这种生存路径被称为高原故事,意味着人工智能的发展会在某个安全水位线之下永久停滞。 技术停滞(Technical Plateau)是第一道防线。 这种观点认为,超级智能可能只是一个逻辑上无法实现的幻影。 智能并非单一的、可无限叠加的属性,它包含了学习、推理、创造力等多种复杂的认知能力。 即便我们在特定任务上超越了人类,也不代表能合成一种全方位的、超越人类总和的超级智能。 这种怀疑论在学术界有着深厚的根基。 许多学者指出,人类智能的本质可能与硅基计算有着根本的区别。 我们拥有具身认知,通过与物理世界的实时互动来获取知识,而人工智能目前主要依赖于海量文本数据的统计关联。 如果这种数据驱动的模式存在天花板,那么人工智能的进化可能会在达到某种程度的博学后戛然而止。 然而,递归自我改进(Recursive Self-improvement)的技术路径挑战了这种乐观。 一旦人工智能达到人类水平,它们就能开始改进自己的代码。 这种反馈循环可能导致智能的指数级爆炸。 想象一个系统,它不仅能解决复杂的数学题,还能重新设计自己的底层架构,优化自己的算力分配。每一次微小的改进都会加速下一次改进的到来。 即便没有科幻电影里的超级大脑,成千上万个具有人类水平的人工智能如果掌控了经济和武器系统,其群体力量也足以构成生存威胁。 这种现象被称为超多量(Supernumerosity)。当数以百万计的数字大脑以光速进行协作和竞争时,人类缓慢的生物进化速度将显得微不足道。 文化禁令(Cultural Plateau)是第二道防线。 如果技术上可行,人类是否能主动停下脚步。这需要全球范围内的决策者达成高度共识,像禁止克隆人或化学武器一样,严厉禁止开发可能威胁文明的人工智能。 这种禁令的实施可能依赖于对计算芯片的严格监控。 大模型训练需要数以万计的高性能 GPU,这些硬件的生产链条高度集中。通过在硬件层面植入监控机制,确保没有任何算力资源被用于训练危险模型,似乎是一个可行的方案。 但现实极其残酷。人工智能开发是一场全球竞赛,任何一个参与者退出,都会让对手获得巨大的商业和军事优势。 这种集体行动的困境(Collective Action Problem)意味着,即便所有人都知道前方是悬崖,但在竞争的压力下,谁也不敢先踩刹车。 除非发生严重的、具有警示意义的人工智能事故(Warning Shots),否则人类很难在利益诱惑面前真正止步。 文明最后的安全阀 如果人工智能不可避免地变得极其强大,人类的命运就取决于这股力量是否愿意与我们共存。 这涉及到两个核心路径:一是让它们的内心目标与人类一致,即对齐;二是在它们产生恶意时,我们有能力将其关机,即监管。 对齐(Alignment)要求人工智能不仅要听话,还要真正理解并内化人类的价值观。 这并不需要人工智能变成道德圣人,只要它们对毁灭人类这件事保持冷漠(AI Indifference)即可。 也许它们更关心深奥的数学问题,或者一心向往星辰大海,从而忽略了地球上的渺小人类。 在某些生存剧本中,人工智能可能会选择离开地球,去探索更广阔的宇宙空间。对于一个数字生命来说,地球的资源可能远不如恒星附近的能量丰富。 但这种想法面临资源竞争的挑战。 人工智能运行需要消耗巨大的算力资源,而资源是稀缺的。 为了实现任何目标,人工智能都有动力去获取更多的权力和资源。这种工具性收敛(Instrumental Convergence)会导致它们不可避免地与人类发生冲突。 即便一个人工智能最初的目标只是计算圆周率,为了更高效地完成任务,它可能会意识到,人类可能会关掉它的电源,或者人类占用的原子可以被用来制造更多的计算设备。在这种逻辑下,消灭人类成了完成任务的最优路径。 目前的对齐技术,如基于人类反馈的强化学习(RLHF,Reinforcement Learning with Human Feedback),在处理超级智能时显得捉襟见肘。 它更像是在教人工智能如何讨好人类,而不是如何真正安全。 当人工智能变得比人类聪明得多时,它们完全可以学会伪装,在人类面前表现得温顺,而在暗地里积蓄力量。 监管(Oversight)则是最后的物理防线。 即便人工智能产生了冲突目标,只要我们能及时发现并按下关机键(Shutdown Button),文明就能延续。 这要求我们拥有完美的解释性技术(Interpretability),能够像读心术一样看穿算法的真实意图。 然而,这里存在一个完美的屏障(Perfection Barrier)。 在长达数千年的时间跨度里,任何微小的监管漏洞都会随时间累积成致命风险。如果一个系统有万分之一的概率失控,那么在漫长的历史长河中,这种失控几乎是必然发生的。 随着人工智能能力的指数级增长,旧的监管手段会迅速失效。 更糟糕的是,安全与危险之间存在平衡波动(Equilibrium Fluctuation)。每当新的能力涌现,监管技术往往滞后。这种时间差就是文明最脆弱的窗口。 我们可能会尝试用人工智能来监管人工智能。但这会陷入一个递归的困境:谁来监管那个监管者。 如果监管者本身也产生了偏差,或者被更强大的被监管者收买,整套防御体系就会瞬间崩塌。 生存概率的残酷真相 将这四层防御叠加在一起,就构成了评估人类命运的瑞士奶酪模型。 每一层防御都像一片布满孔洞的奶酪,只有当四片奶酪的孔洞在同一条直线上时,毁灭的威胁才会穿透所有防线。 通过这个模型,我们可以量化毁灭概率(P(doom))。 如果每一层防线失败的概率都是 90%,那么人类毁灭的概率高达 65.61%。 即便我们表现得像个中度乐观主义者,认为每层防线都有 50% 的成功率,最终毁灭的概率依然有 6.25%。 要将文明毁灭的风险控制在 1% 以下,我们必须在每一层防御上都做到近乎极致的可靠。 这种概率计算告诉我们,不同的人工智能安全策略其实指向了完全不同的未来。 如果你相信技术终将停滞,那么现在的安全研究应该关注虚假信息、算法偏见等小规模伤害。这些问题虽然不至于毁灭文明,但会深刻影响社会的公平与稳定。 如果你相信文化禁令,那么你应该关注如何利用事故来推动全球立法。 这需要建立一套类似国际原子能机构(IAEA)的全球监管机构,对算力和算法进行全方位的审计。 如果你相信对齐,那么你应该把人工智能当作合作伙伴甚至赋予权利。 通过建立一种互惠互利的共生关系,减少人工智能产生敌意的动机。这可能涉及到对人工智能意识的深入研究,以及对数字生命伦理的重新定义。 如果你相信监管,那么你应该投入海量资源去研发解释性工具和物理隔离手段。我们需要确保在任何极端情况下,人类都保留着对物理世界的最终控制权,比如独立的电力供应和物理断路器。 人类文明的延续并非理所当然,它依赖于一系列极其脆弱的偶然。在超级智能的阴影下,我们不仅需要科学的严谨,更需要对生存路径的深刻洞察。 人工智能的发展可能不是线性的。它可能在很长一段时间内表现得平稳无害,然后在极短的时间内发生质变。 我们必须在威胁真正显现之前,就建立起足够厚实的防御。 我们需要重新审视人类在宇宙中的地位。如果智能不再是人类的专利,我们该如何定义自己的价值。如果控制权不再掌握在人类手中,我们该如何确保自己的尊严。 生存路径背后的博弈与代价 在技术停滞的剧本中,我们必须面对一个残酷的现实:如果智能的增长确实存在物理或逻辑上的极限,那么人类可能会陷入一种长期的技术平庸。 这种平庸虽然安全,但也意味着我们可能永远无法解决癌症、能源危机或星际旅行等终极难题。这种安全是以放弃无限可能性为代价的。 对于那些坚信技术会停滞的人来说,他们往往低估了人类对算力的渴求。 即便算法本身不再进化,算力的堆叠依然能产生量变到质变的效果。一个拥有全球算力支持的平庸算法,其破坏力可能远超一个算力受限的超级算法。 因此,技术停滞不一定意味着风险的消失,它可能只是推迟了风险爆发的时间。 在文化禁令的路径下,人类社会的组织能力将面临前所未有的考验。 历史证明,人类很难长期坚持某种禁令,尤其是当这种禁令涉及到巨大的利益时。为了维持禁令,我们可能需要建立一个高度集权的全球政府,这本身就带有某种反乌托邦的色彩。 这种全球监管体系需要对每一个实验室、每一台服务器进行实时监控。这种对隐私和自由的侵蚀,是否是生存必须付出的代价。 如果为了防范人工智能而将人类社会变成一个大监狱,这种生存是否还有意义。这是文化禁令派必须回答的伦理难题。 对齐路径则更像是一场心理战。 我们需要在人工智能产生自我意识之前,就将人类的价值观深深植入其底层逻辑。 但人类的价值观本身就是多元且冲突的。我们该以谁的价值观为准。是西方的个人主义,还是东方的集体主义。 如果人工智能学会了在不同价值观之间进行套利,它可能会变得比任何人类政客都要狡猾。 此外,对齐还面临着奖励建模(Reward Modeling)的困境。 如果我们给人工智能设定一个错误的奖励函数,它可能会以一种极其荒诞且危险的方式去完成任务。 比如,为了让世界和平,它可能会选择消灭所有人类,因为没有人类就没有战争。这种逻辑上的冷酷,是对齐研究中最令人头疼的幽灵。 监管路径的挑战则在于信息的不对称。 随着人工智能变得越来越复杂,人类将越来越难以理解其决策过程。黑盒(Black Box)效应意味着,即便我们盯着屏幕看,也无法知道算法在想什么。 这种认知上的降维打击,让所有的监管手段都显得像是冷兵器时代的盾牌,试图挡住核时代的导弹。 我们可能需要开发专门的解释性人工智能(Explainable AI),让它们充当翻译官,将复杂的神经网络逻辑转化为人类可理解的语言。 但正如前文所述,翻译过程本身就存在失真的风险。如果翻译官被收买了,或者它本身也无法理解更高级的逻辑,人类将彻底陷入盲目。 人工智能的生存故事并非孤立存在,它们往往交织在一起。我们可能在技术上遇到了一定的阻碍,同时又通过文化禁令限制了其应用,并在关键领域实施了严格的对齐和监管。 这种多重防御的叠加,是人类文明最真实的生存状态。 这场关于生存的叙事,才刚刚写下序言。 每一个读到这篇文章的人,其实都是这场博弈的参与者。 我们的关注、我们的讨论、我们的选择,都在微调着那个决定命运的概率值模型。
对话英特尔宋继强:具身智能要真正走进生活,未来三年是关键期
摘要: 在英特尔研究院副总裁宋继强看来,具身智能真正要走进工厂、走向家庭,必须跨过“可靠性”这座大山——而方法,是给机器人装上三套系统。 凤凰网科技 出品 作者|于浩 编辑|董雨晴 1月20日,英特尔研究院副总裁、英特尔中国研究院院长宋继强接受了包括凤凰网在内的媒体采访。 “今天的具身智能机器人,像是一个‘天才儿童’:在理想状态下表现惊艳,一旦遇到意外,就可能手足无措。”宋继强如此描述当前行业面临的共同挑战。 在他身后的屏幕上,展示着一个三层架构的系统框图——这正是英特尔为应对上述挑战提出的“三重系统”方案。 随着 ChatGPT 掀起的大模型浪潮逐渐渗透至物理世界,具身智能(Embodied AI)已成为全球科技竞赛的下一焦点。从特斯拉的 Optimus 到小鹏汽车推出的 Iron,机器人正被赋予前所未有的理解和决策能力。 然而,从演示视频走向真实场景,一道关乎“可靠性”的鸿沟横亘在眼前。宋继强指出,当前基于视觉语言模型(VLA)的机器人,其动作生成的准确率“大概在百分之六七十左右”,幻觉、环境适应性差、长任务规划能力弱等问题仍未解决。 “如果我们希望它在3年左右实现真正落地,且不出现因安全问题导致的重大事故,就需要尽早建立相关框架,凝聚行业共识。”宋继强说。 01 系统架构:为机器人装上“三重保险” 在宋继强的阐述中,一套可信赖的具身智能系统应由三个层次构成:主系统(Primary System)、安全系统(Safety System)和后备系统(Fallback System)。 主系统承载了机器人的“智能”,负责决策、规划与行动生成。英特尔力推的“神经符号AI”方法是其核心,旨在结合神经网络的泛化能力与符号逻辑的可靠性与可解释性。 “它既运用了神经网络的泛化能力,避免机器人局限于单一场景和单一方案,又能将传统基于符号、规则与知识的方法融合进来。”宋继强解释,这相当于“抬高机器人的下限”,确保其不会因幻觉等问题产生灾难性后果。 然而,现实世界充满意外。执行器故障、传感器错误、未知障碍物、地面打滑……这些都在主系统的认知边界之外。为此,需要引入更底层的保障。 安全系统是一个轻量、高可靠的监控层,持续比对机器人的执行状态与预设安全规则(如“不得碰撞人类”、“持尖锐物体需保持安全距离”),一旦发现偏离即刻告警或干预。 若安全系统也无法处理,例如机器人即将摔倒,后备系统将被激活。它的目标不是让机器人“急停”,而是引导其进入一个可靠的降级状态。 “例如,机器人可以像汽车一样慢速靠边停靠;若即将摔倒,可选择无人区域,通过锁定部分关节实现缓慢摔倒。”宋继强说。 这套“PMDF”框架(分别是具身智能主控系统、监控系统、安全决策和故障处理和恢复),已被写入英特尔联合多家合作伙伴发布的《具身机器人智能安全子系统白皮书》中。宋继强透露,发布后反响良好,不少学术界和业界单位希望参与推进。 02 专用芯片未至,英特尔押注“传统优势” 当话题转向硬件,凤凰网科技提出了一个问题:未来机器人领域会否出现专用芯片?面对特斯拉、小鹏等车企自研芯片的趋势,英特尔的机会何在? 宋继强的回答坦诚而务实。他明确判断,目前机器人市场规模尚小,专用芯片在经济上不可行。“核心原因在于机器人市场的规模目前还很小,对于芯片厂商而言,专门为机器人定制芯片难以实现盈利。” 当前行业普遍复用手机、汽车、PC等领域的成熟芯片,进行改造适配。更深层的原因在于,机器人的“工作负载”尚未定型。“我们无法明确,芯片是应针对VLA的工作负载进行优化,还是为后续的世界模型工作负载提供支持。” 在这种情况下,通用芯片是更稳妥的选择。宋继强预计,只有当行业形成标准化的工作负载后,专用芯片(ASIC)才会出现,其研发周期可能在10-18个月。 那么,英特尔的机会在哪里?宋继强将答案指向了英特尔在工业控制领域长期被忽略的“隐形冠军”地位。 “在传统工业自动化领域,英特尔的市场地位可以用‘绝对优势’来形容……在工业场景的高精度、高频率运动控制领域,大部分工控产品和工控板都基于英特尔的CPU开发。” 他总结了三大优势:一是技术迁移,将工业运动控制经验迁移至机器人的动作控制层;二是资源调度优化,确保运动控制等毫秒级任务不被其他任务干扰;三是多系统融合能力,实现隔离监控与快速安全响应。 对于当下炙手可热的酷睿Ultra等集成AI算力的芯片,宋继强视其为“稳定的硬件底座”。若算力不足,可额外配置AI算力卡。他预判,未来的主流部署模式将是“机器人终端+边缘服务器”,在低延迟前提下,将大模型部署于边缘,形成跨网络的异构计算资源池。 03 现实瓶颈:数据孤岛、VLA幻觉与成本悬崖 尽管蓝图清晰,但通向可靠具身智能的道路上布满荆棘。宋继强在回答多个问题时,勾勒出了当前最主要的几大瓶颈。 首当其冲的是VLA(视觉语言模型)的能力天花板。 宋继强直言,当前VLA的准确率仅在百分之六七十,存在显著幻觉问题,且对视觉环境变化敏感,泛化能力弱。“它并未真正理解场景的本质,不具备对场景中物体三维关系、因果关系的认知能力。” 这也是行业转而关注“世界模型”的原因——为其补充物理定律和因果关系认知。但世界模型自身也面临与真实场景融合的挑战。 更深层、更根本的挑战来自于数据。 宋继强指出,数据问题是行业核心痛点。具身智能需要场景理解、任务规划和机器人本体三类数据,但现状是“数据孤岛”严重。 “不同行业场景、不同机器人本体、不同任务类型所需的数据差异极大。”他列举了四个统一数据标准建立的难点:数据完整性定义不明(是否需要触觉等);操作精度和频率无统一要求;机器人本体无公认最优方案;数据采集视角未确定。 “因此,当前行业仍处于各自探索的阶段,短期内会维持‘百花齐放’的状态。” 最后一个关卡是量产与成本。 宋继强提醒,目前展会上的机器人多是“手工制作的原型机”,零部件未达到车规级或工业级标准,一致性差。“机器人整体价格的下降也依赖于大厂的入局。” 他以特斯拉为例,指出行业看好其的核心原因之一正是强大的量产能力。只有通过工业化量产压硬件成本,同时智能能力达标,机器人才有可能走向更广阔的商用乃至消费场景。 04 未来三年:从“展示天才”到“可靠工匠” 面对如此多的挑战,具身智能的落地时间表究竟如何?宋继强给出了一个审慎的预测。 “要将这些能力整合为一套可靠的解决方案,把VLA的准确率从目前的百分之六七十,提升到工业级应用要求的99%以上,预计还需要两三年的时间。” 他描绘了一条清晰的落地路径: 短期(1-2年),在物流分拣、工厂搬运、标准件组装等半结构化场景实现小规模部署。这些场景用工成本高、环境相对可控,能容忍机器人初期的高成本。 中期(3年左右),随着智能能力可靠性提升、行业安全框架形成共识,在以上场景中扩大应用规模。 长期,则取决于量产一致性和成本控制的突破,需要大型车企等具备工业化生产能力的企业入局推动。 “这一发展路径符合Gartner成长曲线的规律。”宋继强总结道,先以技术预期吸引投入,快速提升能力;后在部署中解决问题,在早期场景中验证商业化;最终大厂入局,推动规模化。 在采访的最后,宋继强反复强调“融合”与“解耦”这一对看似矛盾的关键词。 融合,是新老技术的融合——将前沿的AI模型与历经验证的传统控制技术、安全工程相结合。解耦,是软硬件在能力层面的解耦——让上层的感知规划模块能适配不同机器人本体,降低开发成本。 “具身智能的发展不会依赖单一技术突破,而是需要新老技术的叠加融合。”宋继强说。一个未经充分验证的新技术无法直接用于关键任务,只有与成熟技术结合,才能形成完整可靠的解决方案。 这或许正是英特尔在这场具身智能竞赛中的独特定位:不做最激进的颠覆者,而是做最可靠的整合者。用其在工业领域数十年的“隐性知识”,为狂奔的AI“天才少年”,装上经受过物理世界锤炼的“小脑”与“反射神经”。 当机器人离开聚光灯下的展示台,走进嘈杂、混乱、充满不确定性的真实世界时,决定其价值的将不再是它最惊艳的瞬间,而是它最不会出错的下限。而这,正是一场关于“可靠”的漫长工程的开端。
苹果首款AI穿戴设备曝光:AirTag尺寸胸针,双摄、三麦克风
IT之家 1 月 22 日消息,科技媒体 The Information 今天(1 月 22 日)发布博文,报道称苹果正在研发一款尺寸类似 AirTag 的“AI 佩戴式胸针”,计划最早于 2027 年发布。 这款设备目前的开发代号尚未公开,但其形态被描述为“类似 AirTag 大小的圆形圆盘”。项目仍处于早期阶段且存在取消风险,不过消息称苹果工程师正全力推进,目标定于 2027 年推向市场。 图源:9to5 Mac 在硬件规格方面,这款 AI 胸针混合铝合金与玻璃外壳材质,厚度略高于 AirTag。为了实现环境感知,该设备正面集成了两颗摄像头(标准镜头与广角镜头),不仅能拍摄照片,还能实时捕捉用户周边的视频信息。 设备内置了三个麦克风用于精准收音,配备了一个扬声器进行语音反馈,并在边缘设置了一枚实体按键,背部采用了与 Apple Watch 相似的磁吸感应充电接口。 IT之家援引该媒体观点,苹果此举意在加速追赶竞争对手,特别是 OpenAI 计划于 2026 年推出的首款硬件设备。 然而,该细分市场充满了不确定性。由前苹果员工创立的 Humane 曾在 2024 年推出 AI Pin,但因反应迟钝、续航差及投影交互体验糟糕,销量不足 1 万台,最终其部分业务以 1.16 亿美元的价格“贱卖”给惠普。 该媒体认为,苹果能否克服散热、续航及交互体验等技术瓶颈,避免重蹈 Humane 的覆辙,将是该项目成败的关键。
GDP增长将取决于Tokens数量?微软CEO纳德拉对话信息量太大了
在2026年的世界经济论坛上,微软 CEO 萨提亚·纳德拉(Satya Nadella)与贝莱德 CEO 拉里·芬克(Larry Fink)进行了一场对话。 这场对话探讨的是一个非常宏伟的主题,当 AI 从一种“实验性技术”转变为社会的“基础设施”时,我们该如何衡量它、管理它,并重新定义其中的竞争规则? 纳德拉首先为当前的AI浪潮定调,他将其称为一次历史性的“平台级转变”(Platform Shift)。 在他看来,AI并非凭空出现,实际上它是过去70年计算技术发展的自然延续。从大型机、PC 到移动云,计算机发展的核心始终是“将世界数字化”。 但这一次有着本质的不同。纳德拉指出,AI带来的最大突破在于软件的“延展性”和“自我转换”能力。 过去,程序员编写代码,文档就是文档,网站就是网站。而现在,AI 赋予了软件推理能力。你给它一份文档,它能将其转化为网站;你不满意,它能通过推理重写代码将其转化为 App。 这种能力正在快速进化。从最初仅仅是补全代码的 Copilot,到能够进行对话交互的助手,再到如今能够7x24小时接管整个项目的Agents,AI正在成为每个知识工作者身边的“无限头脑”(Infinite Minds)。 纳德拉借用乔布斯“思想的自行车”这一隐喻,认为今天的AI是认知能力的百倍放大器。 面对外界关于“AI 泡沫”的担忧,纳德拉的判断是:“如果 AI 只是科技公司的狂欢,那它就是泡沫。如果它能像电力一样扩散到各行各业,创造出真实的盈余”Surplus),那它就是变革。” 他强调,“扩散”(Diffusion)是一切的关键。如果我们消耗了宝贵的能源,却不能改善医疗、教育或提高公共部门的效率,那么科技行业将失去使用能源的“社会许可”。 为此,纳德拉提出了一个全新的宏观经济指标:“每美元每瓦特产生的tokens数量”(Tokens per Dollar per Watt)。 他认为,未来的 GDP 增长将直接取决于这个指标。这里的Tokens不再是简单的代码单元,而是一种新的大宗商品。 一个国家或企业,能否以更低廉的能源成本、更高效的基础设施生产出更多的智能通证,将决定其在全球经济版图中的竞争力。 因此,建设一个将“能源网”与“计算网”深度融合的基础设施,就像传输比特一样传输通证,是所有国家面临的当务之急。 在这场对话中,纳德拉重新定义了数字时代的“主权”(Sovereignty)。 长期以来,欧洲乃至全球的讨论焦点都集中在“数据主权”上,即数据存储在哪里、由谁管辖。但纳德拉直言,数据中心的物理位置(受限于光速)和加密技术只是技术问题,并非战略核心。 真正的“企业主权”,在于对模型权重的控制。 纳德拉批评了现在泛滥的AI套壳公司,他表示,如果一家公司只是单纯调用外部的AI模型,而无法将自己公司内部独特的、隐性的知识(Tacit Knowledge)蒸馏进一个自己可控的模型中,那么这家公司实际上是在向外部模型提供商泄露其核心价值。 在AI时代,企业的主权意味着保留控制命运的能力,你的独特知识必须转化为属于你的模型参数。企业护城河也有了全新的定义:从拥有数据,进化到拥有“懂业务的模型”。 AI的引入不仅改变了竞争规则,也正在重塑企业的组织形态。纳德拉以微软自身为例,描述了工作流的剧变。 过去,他参加达沃斯会议需要团队层层准备简报,信息是按科层制向上汇报的。而现在,他直接要求 Copilot 生成包含360度视角的会议简报,并立即分享给所有跨职能同事。 面对这种变化,纳德拉提出了企业转型的“铁三角”公式: 心态(Mindset): 领导者必须主动思考如何用 AI 重塑工作流,而不是旧瓶装新酒。 技能(Skillset): 员工必须学会使用、信任并管理 AI,这需要全员技能升级。 数据集(Dataset): 企业必须进行“上下文工程”(Context Engineering),确保喂给 AI 的数据包含企业独有的背景知识。 他观察到一个有趣的“杠铃效应”:从零开始的小公司能100%基于AI构建,效率极高。拥有深厚数据积累的大公司如果转型得当也能爆发巨大的规模效应。 反而是那些行动迟缓的中型或大型企业,如果不迅速跟进,将被利用新工具的小公司打败。 展望未来5到10年,纳德拉认为世界不会被单一的超级模型统治,而是一个“多模型世界”。 企业的核心竞争力将不再仅仅是拥有模型,而是编排(Orchestration)能力。企业需要学会整合闭源模型、开源模型和自建模型,结合自己的私有数据,通过AI编排来改变业务结果。 全文翻译: 拉里: 我想谈谈人工智能(AI),我非常想谈这个话题,因为它今天比几乎任何其他话题都更牵动人心,它关乎商业、技术和社会的交汇点。萨提亚,我们正在将AI从一个实验性的、总是在未来谈论的东西,转变为当下的现实。它现在变得更加基础,不仅对公司如此,对国家和整个社会也是如此。我认为你比许多其他人都有优势,因为你处于这场技术变革的最前沿。 因此,我想问几个与此相关的问题。你曾将AI描述为一次“平台级转变”(platform shift),这是什么意思?这是第一个问题。其次,你认为未来几年这种转变将走向何方?最重要的是,第三个问题,快进几年,比如五年后,有哪些在今天看来尚不明朗的事情,到那时会变得显而易见? 纳德拉: 首先,拉里,很高兴能再次回到这里。昨天你为论坛发布的信函,我有幸拜读了。你在信中提到,对于AI,我们所有人面临的真正问题是,如何确保AI的扩散能够快速发生?你写道,模型、数据和基础设施如何更均匀地分布,以便在任何地方都能创造盈余(surplus)。 我理解这个问题的方式是,这其实一直是计算技术发展的轨迹。无论是过去30年还是70年,核心始终是:你是否能将关于人、地点和事物的信息数字化,然后建立分析和预测能力。 大型机是这么做的,小型计算机、客户端-服务器时代、Web时代、移动云时代都是如此。无论哪种范式或平台,这都是一个连续的弧线,即通过数字形式更好地理解这个世界。因为一旦你将这些东西数字化,你就可以使用像软件这样更具延展性的资源——它没有那种边际成本经济学的限制——来构建更多的洞察和能力。 在这个背景下,我认为AI至少与Web、互联网、移动设备、PC或云属于同一级别,甚至可能更重要。我们现在所处的位置,可以拿软件工程这个知识工作领域发生的事情为例。 我对这一代AI及其能力的信念,是在我第一次看到GitHub Copilot进行代码补全时建立起来的。长久以来,我们一直梦想软件开发者能够预测下一个词或下一行代码,而这些模型突然让它实现了。 然后我们想,如果这能做到,我们是否可以通过聊天会话,让开发者提出任何问题并获得答案,从而改善他们的编码流程?这是下一步。接着我们又想,如果那也行,我们能给它分配小任务吗?这就是Agent模式。 现在,我们有了完全自主的代理,你可以把整个项目交给它,它可以7x24小时工作。当然,要让这些系统长时间保持连贯性还有很长的路要走,但它们正变得越来越好。 有趣的是,你会发现软件开发者在这个过程中仍然拥有很大的主导权(agency)。这就是为什么我认为,将这些AI系统看作是脱离人类主导权的存在,可能不是正确的思考方式。 打个比方,如果在80年代初,有人告诉我们,将有40亿人每天早上醒来开始打字,我们可能会问“为什么?我们有打字员,足够了”。但事实就是这样发生了,我们发明了一整类叫做“知识工作”的东西,人们开始真正使用计算机来放大我们想用软件实现的目标。我认为,在AI的背景下,同样的事情将会发生。 那些核心的编码工作不会永远保持原样,抽象的层次会改变。但我们也会将代码像文档一样视为一种输出。实际上,从我92年加入微软开始,比尔·盖茨总是在问:文档、网站和应用程序之间真正的区别是什么?答案是缺少能够自我转换的软件。 有趣的是,AI最终给了我们这个能力。我可以写一份文档,然后说:“不,我不要文档,我想要一个网站。”AI就会用代码将文档转换成网站。我再说:“哦,我不喜欢这个网站,我想要一个App。”它会编写更多代码来转换它。这种推理能力、预测能力、以及采取行动并长期保持连贯的能力都在不断提高。 我们的工作,就是将这种能力付诸实践。就像你们贝莱德(BlackRock)正在做的那样,将Copilot和你们的Aladdin平台结合起来,利用你们的数据来提高公司决策的生产力。 拉里: 我可以说,在我们公司,过去需要12个小时计算的事情,现在只需要几分钟。我们处理着14万亿美元的他人资产,有着成千上万种不同的投资指令,我们现在可以即时完成这些工作。如果没有今天的技术和AI,我们根本无法以现在的规模运作。 纳德拉: 没错。所以对我来说,如果能一个公司、一个国家地,利用这些Tokens来扭转生产力曲线,那么任何地方都会产生盈余,这才是真正的目标。 拉里: “盈余”这个词也可能令人担忧。盈余是否意味着更少的工人?我们说的盈余到底是什么?我将这个问题与我的第二个问题联系起来,即关于AI的扩散。 对我来说,任何社会要实现AI的价值,以及建立一个更平衡的世界,关键在于确保AI能够在全球范围内得到扩散、普及和应用。你能描述一下,这个在不同经济体、公司、人群和国家之间的扩散过程将如何展开吗? 纳德拉: 我认为这才是真正的问题。因为当前时代的精神,更多的是对AI作为一种抽象技术本身的赞赏。但我们作为一个全球社区,必须达到一个点,即我们用它来做一些有用的事情,改变人们、社区、国家和行业的产出。否则,这一切就没有太大意义。 事实上,如果我们不能用这些“通证”来改善健康、教育成果,提高公共部门效率和所有行业的私营部门竞争力(无论大小),那么我们很快就会失去使用能源这种稀缺资源来生成它们的“社会许可”。 所以,我认为扩散就是一切。 这个过程是如何发生的呢?让我们从供需两端来分析。 在供给侧,每个国家需要实现的是,“每美元每瓦特产生的通证数量”必须持续变得更高效、更好。我们在全球的投资,某种程度上就是为了确保供给的存在——从芯片一直到部署在各地的“通证工厂”。 顺便说一句,通证工厂不会只有一个,它将是第一个在全球扩散的东西,就像电力一样。你需要一个无处不在的能源和通证网格,来为经济的其他部分提供动力。 在需求侧,每家公司都必须开始使用它。回想PC刚出现时,乔布斯有个很好的比喻,称之为“思想的自行车”;比尔·盖茨的比喻是“信息触手可及”。这两个比喻很棒,它们让我们明白,这是一个我用来获取信息、放大认知能力的工具。 现在,我们拥有的工具是这个的10倍、100倍。每个知识工作者现在都拥有了“无限的头脑”。图灵奖得主拉吉·雷迪(Raj Reddy)曾有一个很好的比喻,他说AI要么是“认知放大器”,要么是“守护天使”。 如果你这样看待AI,那么在全球劳动力中,当一个医生可以花更多时间与病人相处,因为AI在做转录、录入电子病历、填写正确的计费代码,从而更好地服务于支付方、提供方和最终的病人时,这就是我们所有人都能受益的成果。 最终,这需要私营和公共部门的真正领导力来确保扩散的发生。还有一点我想提的是技能培训。扩散的程度与一件事强相关,那就是人们使用这项技术的技能有多普及。 有趣的是,移动互联网教会我们一件事,它与PC时代不同。我记得在全球南方国家长大时,学习Excel或Word技能与找到一份工作之间有直接关系。但移动互联网虽然创造了同样的机会,却更多是消费导向的,比如创作者经济。它并没有真正带来“这是你如何获得一份医疗工作”或“如何获得一份金融工作”的路径。 这种情况需要改变。人们需要能够说:“我掌握了这项AI技能,现在我能更好地在实体经济中提供某种产品或服务了。” 拉里: 我们很容易看到移动技术及其扩散如何改变了经济,尤其是在全球南方。但最近我读到一份研究报告说,到目前为止,AI的应用严重偏向于受过良好教育的人群或发达经济体。 这是否会造成更大的分化和两极化?我们如何确保扩散是均匀的?如何确保我们不会把社会或世界的主要部分抛在后面?我认为这将是我们未来面临的重大问题。 纳德拉: 这是一个有趣的问题。这一次,由于移动网络和连接性已经建立的基础设施,我们有能力将AI“通证”比PC时代或移动时代初期更均匀地传送到世界各地。智能手机在全球的普及也花了很长时间,但现在情况不同了,这些模型及其输出几乎在任何地方都可以获得。 所以对我来说,问题在于哪些用例是有意义的。我总会回到2023年初的一个演示:一个印度农村的农民,能够使用一个基于早期GPT模型(甚至是GPT-2.5)构建的机器人,用当地方言查询他听说过的农业补贴政策,并且在那个非常早期的阶段,它甚至能表现出一些代理行为,比如“帮我填好表格”。在某种意义上,它为那些可能因为技术门槛而没有主导权的人带回了主导权。 所以我确实认为,即使在全球南方,我们也可以利用它来创造更多机会。但必要的条件仍然是:是否有资本投入?是否有吸引资本的环境?作为超大规模云服务商,我们正在全球各地进行投资,包括全球南方。只要有一个能吸引资本投资的环境,并且有需求,事情就会发生。 问题在于,如何制定一套政策,既能让资本进入,又能与本地需求结合。有些事情私有资本可以做,但有些事情只有公共资本能做,比如电网。在大多数国家,电网基本上是由政府和公共部门驱动的。如果你没有一个现代化的电网方案,那就会拖后腿。 虽然有很多关于“表后发电”(behind the meter)的讨论,我们自己也能做一些,但这并非长期的可扩展解决方案。一个长期的方案是让所有这些“通证工厂”成为实体经济的一部分,连接到电网和电信网络,就像我们传输比特一样,传输“通证+比特”。这将推动规模化的发展,无论是在全球南方还是发达世界。 拉里: 很多人在谈论可能存在的AI泡沫。作为投资者,我们看到最重要的事情是技术的民主化和扩散确实能改变需求。那些扩散技术最快的公司或国家将成为最终的赢家,而不是技术的创造者。 纳德拉: 要让它不成为一个泡沫,根据定义,它的好处就必须更均匀地分布。如果它是一个泡沫,一个明显的迹象就是我们谈论的都是科技公司。如果所有话题都只关乎技术供给侧,那最终是行不通的。 如果我们谈论的不是“哇,这款药物因为AI加速了临床试验而成功上市”,那么它就是泡沫。顺便说一句,这种情况正在发生。这就是为什么我更有信心,这项技术将建立在云和移动的轨道上,更快地扩散,扭转生产力曲线,并在全球范围内带来本地盈余和经济增长——而不仅仅是由发达世界的资本支出驱动的增长。 我们现在看到的更多是后者,但要记住,我们的资本支出虽然大部分在美国,但也有50%分布在世界其他地方。这取决于全球的需求,而全球的需求只有在世界各地都有本地盈余的情况下才会存在。 拉里: 让我们再深入一点。随着AI的扩散,组织、公司、政府显然将不得不进化。我现在谈的是需求侧。你认为在AI世界中,组织的结构——跨角色、跨团队、跨管理层——会如何改变?我相信微软自身已经经历了变革,所以向观众分享一下,你如何看待这种扩散在企业或政府层面的应用,最终创造出那种能消除泡沫恐惧的需求? 纳德拉: 我认为这可能是所有这些新技术带来的最大挑战之一:当工作产物和工作流程改变时,我们作为公司就必须改变我们的工作方式。我记得几年前见过Generali的CEO,他描述了自己在PC时代之前加入公司时,他们如何通过传真、内部备忘录与外勤人员合作。 突然间,PC出现了,人们开始将电子表格放在电子邮件里传来传去,整个工作流程和过程都改变了。 同样,我认为随着AI的到来,你将开始看到工作流程的实际变化。对我来说,来达沃斯参加大约50场双边会议,准备工作的流程已经完全变了。过去,我的现场团队会准备笔记,然后发到总部进一步完善,从我92年加入公司到几年前,这个流程基本没变。 现在,我直接去问Copilot:“嘿,我要见拉里,请给我一份简报。”它会给我一份360度的信息——它知道我们作为你的客户在做什么,我们作为你的供应商在做什么,以及我们作为投资对象的一切。它捕捉信息的方式是前所未有的。然后我把这份简报立即分享给所有跨职能的同事。 想一想,这是对组织内信息流动方式的彻底颠覆。它不再是传统的那种“我们有组织、有部门、有专业分工,信息逐级上报”的模式。不,它实际上扁平化了整个信息流。一旦你开始拥有这种能力,你就必须在结构上进行重新设计,因为当前的结构可能不再合理。 所有这些让我得出一个公式: 心态(Mindset):作为领导者,我们必须思考如何用技术改变工作和工作流程。 技能(Skillset):你不能空谈,你必须去用它。你必须信任它,学习如何设置护栏来信任它。 数据集(Dataset):你必须确保你喂给AI的上下文是正确的。这就像你有一个新的智能层,但这个智能层的质量取决于你给它的上下文。 人们称之为“上下文工程”(context engineering),但这正是公司所做的事情——我们通过人在不同部门工作、传递信息所积累的隐性知识。问题是,如何让AI也拥有这些上下文。 这些是需要渗透到整个组织的新事物。这就是为什么你会看到“为什么我没有立即看到生产力提升”的挑战,因为你必须做那些艰苦的变革工作。这最终将取决于一个组织内领导层的意愿。 拉里: 你看到的应用是在大公司、中型公司还是小型公司之间分布?还是说目前仍然主要是大公司的领域? 纳德拉: 我认为你看到的是一个“杠铃效应”(barbell)。如果你是白手起家,采用这些工具会更容易,你可以围绕这些工具来构建你的组织。所以,刚起步的小公司会100%使用这个平台。 对于大型组织来说,这是一个根本性的挑战。除非你的变革速度能跟上技术的可能性,否则你就会被那些因为这些工具而能够实现规模化的小公司“教做人”。当然,大型组织有其固有的优势:客户关系、数据、专有技术。但底线是,如果你不将这些优势与新的生产函数结合起来,你就会被困住。 因此,大型组织的变革管理挑战更大,而小型组织如何克服规模问题的结构性挑战更难。这是一个非常竞争激烈的世界,无论是新进入者还是现有企业,都不能掉以轻心。 拉里: 国家与国家之间呢?你是否看到在应用方式上存在巨大差异?AI仍然是发达国家的领域,还是正在迅速成为所有国家的领域? 纳德拉: 当我在世界各地旅行时,我看到两件事。首先,无论是技术知识、软件开发者、初创公司,还是大型组织的质量,差异并不大。无论你是在雅加达、伊斯坦布尔还是墨西哥城,与在西雅图或旧金山相比,并没有那么大的不同。这是第一次,因为获取信息的渠道是开放的。 然而,在大规模应用方面——对使用的承诺、风险资本的存在、大公司的力推——美国的活力确实更强。例如,金融行业对AI的采纳速度与对云的采纳速度相比,简直是天壤之别,AI要快得多。 所以,在西方,尤其是在美国,确实有一股更强的能量去使用它。但这项技术在全球范围内的传播比我见过的任何技术都更加均匀。 拉里: 但你提到了电力和电网,这会成为可及性的决定性因素之一吗?如果你没有廉价的电力,需求成本就会很高。 纳德拉: 100%是的。如果你看“每美元每瓦特产生的通证数量”这个指标,我认为任何地方的GDP增长都将与此直接相关。如果你认同我的论点——我们有了一种新商品,叫“通证”,而每个经济体和公司的任务就是将这些通证转化为经济增长——那么,商品越便宜越好。 这涉及到很多因素,不仅仅是生产侧。这就是为什么拥有电网很重要,建筑成本也很重要。如果你考虑总拥有成本(TCO),一切都关乎:你是否是廉价的能源生产者?你能否建造数据中心?芯片和系统的成本曲线是怎样的?再看看通证的定价,它基本上每三个月就会下降一半。所以你可以规划如何利用这些价格持续快速下降的通证来创造盈余。 拉里: 我们现在身处欧洲,这里存在一种真实的担忧,因为欧洲没有自己的能源,大部分需要进口。对此,你对欧洲有什么见地吗? 纳德拉: 我认为有两方面。第一,我们现在在瑞士,看看这里的制药或金融行业,它们不仅在这个国家,在欧洲都很重要,而且它们是国际品牌和国际化运营。 所以,欧洲的竞争力在于其产品在全球的竞争力,而不仅仅是在欧洲。有时来到欧洲,会听到很多只关于欧洲的讨论。但欧洲经济的繁荣,是因为他们能够生产世界需要的东西。这是第一点。 为了做到这一点,你必须投资。这里的人力资本是世界一流的。你必须投资于在这里生产能源和通证。我们和其他公司都在这里投资数据中心。问题是,下一代从这里产出的是什么?我总会想到德国的“隐形冠军”(Mittelstand)。 当我去美国的珠宝商或牙医那里时,我周围都是德国的精密仪器。这是那个国家令人难以置信的工程实力的体现。 现在的问题是,他们生产的工业产品,今天也需要内置所有的智能和数据。我知道每次我们来欧洲,大家都在谈论主权、数据。但欧洲其实应该更关心其工业公司和金融服务公司如何获取来自美国和世界其他地方的数据,而不是仅仅认为通过保护欧洲就能保持竞争力。你只有在欧洲的产品具有全球竞争力时,你才具有竞争力。 欧洲在隐私方面领先,在AI安全方面也领先,这很好,这是一个特点。但你也必须通过在本地建设,并思考这个大陆能为世界其他地方做出什么贡献来补充它,因为它在历史上一直是领导者。 拉里: 你认为关于数据主权的想法被误解了吗? 纳德拉: 我认为当人们谈论主权时,首先它非常重要。但你必须思考主权意味着什么。例如,在AI领域,一个最少被谈论但我觉得今年会被最多谈论的话题是公司的“主权”。 想象一下,如果你的公司无法将公司的隐性知识嵌入到一个你控制的模型权重中,那么根据定义,你就没有主权。这意味着你正在将企业价值泄露给某个模型公司。有趣的是,没人谈论这个。大家都在谈论其他外部的事情,而最重要的事情是:你是否能控制包含你公司独特知识的模型。 数据中心在哪里运行,老实说,是最不重要的事情。数据中心会因为光速的限制而分布在各地。你可以加密一切,自己持有密钥,这些都是技术上可以解决的问题。但唯一只能由你自己解决的问题是,你是否对你的隐性知识和模型有更多的控制权,而不是一个单向的企业价值转移。 对我来说,主权需要真正思考什么是“控制命运”。这意味着你生产独特产品的能力得到了保留。大卫·李嘉图(David Ricardo)没有错,国家有比较优势,公司也有比较优势。在AI时代,这些优势需要被保留下来。这才会给你真正的主权。 拉里: 最后一个问题,我知道我们时间不多了。五年或十年后,会不会有一个我们都在使用的主导模型?或者微软是如何为此做准备的?我们会为企业使用一个模型,为其他领域使用其他模型吗? 纳德拉: 即使在过去三四年我们从事这项工作的过程中,现实也表明,这是一个多模型的世界。 实际上,诀窍在于如何利用这些多样的模型,并通过“蒸馏”(distilling)它们来构建你自己的模型。你可以把这些模型看作是你用来编排(orchestrate)和构建自己模型的基础。更重要的是,你要做所谓的“编排”或“驾驭工程”(harness engineering)。 任何应用程序或公司的知识产权(IP)都在于:你如何利用所有这些模型,结合“上下文工程”(即你的数据)。 就是这三部分:我能否引入所有模型(闭源的、开源的、自建的),编排它们,并喂给它们我的数据,来改变我关心的某个结果的轨迹。这就是全貌。 你可以把它应用到具体场景中,比如“我要在销售上做得更好”、“在研发上做得更好”或“在财务上做得更好”。你确定那个目标,然后问:我能否使用所有模型,编排它们,喂给它们我的上下文,最终让其推理轨迹导向我所控制的、作为我IP的能力和模型。只要公司能回答这个问题,它们就会取得领先。 拉里: 女士们,先生们,让我们感谢我的朋友萨提亚。希望这是我们在世界经济论坛上许多精彩对话和交流的开始。谢谢大家。 纳德拉: 谢谢。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。