行业分类:
加载中...
头条分类:
加载中...
蒲得宇:苹果将与英特尔重启芯片合作,瞄准iPhone 21系列
IT之家 1 月 24 日消息,广发证券分析师蒲得宇 Jeff Pu 昨日(1 月 23 日)发布研报,指出苹果公司正考虑重启与英特尔的芯片制造合作关系。 最新研报指出,英特尔将利用其 2028 年量产的 14A 制程工艺,开始为苹果 iPhone 21 系列供应部分芯片。IT之家曾于 12 月报道,蒲得宇预测双方的供应协议初期仅覆盖 iPhone 标准版机型。 基于这一时间表推算,英特尔未来可能承接部分 A21 或 A22 芯片的代工订单,不过台积电预计仍将稳居苹果主要芯片代工合作伙伴的位置。 此次传闻中的合作模式与早期的“英特尔 Mac 时代”有着本质区别。目前的迹象表明,英特尔将不会参与 iPhone 芯片的架构设计,其角色将严格限制在晶圆制造(Fabrication)环节。 这与苹果在 2020 年之前使用英特尔 x86 架构处理器的情况完全不同。事实上,双方曾在 iPhone 7 至 iPhone 11 时期有过基带芯片的供应合作,此次若达成协议,将是双方在核心处理器领域的首次代工合作。 除了 iPhone,苹果在 Mac 和 iPad 产品线上也可能引入英特尔作为供应商。天风证券分析师郭明錤(Ming-Chi Kuo)在去年曾预测,英特尔最快将于 2027 年中期开始为部分 Mac 和 iPad 机型出货低端 M 系列芯片。 郭明錤当时透露,苹果计划为此采用英特尔的“18A”工艺节点。这两大权威分析师的观点相互印证,显示出苹果正在逐步构建多元化的芯片制造版图。
马斯克说“中国将最终赢得AI竞争”,有什么深意?
近期,马斯克关于“中国将是 AI 竞争最大赢家”的论述传播度巨广,这一判断的核心逻辑为电力是AI发展的瓶颈,而中国拥有全球最大的电力基础,因此将在AI 算力上远超世界其他地区。 抛开宏大叙事,从对电力这一行业的中美对比研究出发,马斯克这一论述的可信度有几分,又有什么深意? 01 上下半场是两个游戏 从2023年AI竞争至今已3年整,但是对于AI底层的核心竞争的第一性没有变,那就是大力出奇迹。 只不过竞争的重点从芯片,开始切换到了整个工业基础设施——最后以缺电的形式暴露出来。 1.上半场缺芯片 2023-2025年,AI训练和推理的军备竞赛,都是围绕芯片展开的: ●核心是英伟达的GPU算力芯片体系,从Ampere到Hopper,再到Blackwell,再到今年的Robin。 ●与之配套的通信,虽然表面是光模块从400到800再到1.6T,但核心仍是其中的光芯片的迭代。 ●还有充当“记忆功能”的存储,也是从HBM,到SSD缺货。 虽然国产算力芯片在过去取得很大的进步,但是受限于算子生态、先进制程的良率始终无法突破50%、高端设备禁运等情况,我们在AI上的追赶始终磕磕绊绊。 最直观的体现是字节、阿里等主要AI投资大厂,其实2025年都没有完成年初制定的AI资本开支计划,不是由于需求不行,而是订的英伟达芯片被禁、国产交付又迟迟跟不上。 尽管我们拥有并不逊色的人才储备和更优的工程化能力,比如Deepseek出圈,但国产大模型客观而言,在整体性能上,还是落后于美国大厂半年左右。 2.下半场缺电 直到2025年年中,全球AI叙事开始发生转折。海外投资的重心开始转向超大集群的AI工厂,数据中心建设的单位不再是多少万卡为单位,而是多少Gw为单位。 AI基础设施发展的瓶颈开始转向电力。为什么竞争焦点不再是芯片了?下面这个图看的很清晰,从23年AI加速以来,英伟达主力芯片单芯片功率仅从800W提升到了1200W,说实话,单芯片算力提升非常有限。 虽然台积电的先进制程可以米粒上雕花,但是这种摩尔进步速度完全满足不了下游对算力的指数级渴求,所以英伟达推出大卡、推机柜、推出集群,也顺带带火了先进封装、液冷、光模块、PCB、电力设备等等一众附带供应链。 直到以上路线的算力增益也开始放缓,最后就变成了比拼电力。简单结论就是:不是芯片这些高精尖的东西不重要了,而是电力,成为了军备竞赛下半场的高地。 图:英伟达GPU单卡过去功率变化图 资料来源:财通证券 如果说围绕芯片为核心的产业链,是科技行业内部的问题,而缺电,则是经济系统性问题,更为复杂。 马斯克之所以看好中国的AI,在电力冗余度这点上,体现的确实是没错的。 中国总装机量高达38亿千瓦,2025 年全年发用电量约 10.4 万亿千瓦时,即使2030年全球数据中心都用中国来供,也只占我们用电量的10%。 而美国电源总装机约 1300GW,发电量只有中国的一半。同时,装机量仅为最大负荷的 1.5 倍,显著低于中国的 2.5 倍冗余水平。 图:主要经济体发电量对比(2024) 数据来源:《世界能源统计年鉴2025》 更严重的是,总量问题是现在缺未来更缺。 美国2024年用电量在4.3万亿千瓦时出头,已经20年基本没有增长了,远低于美国GDP的增幅。这是由于制造业空心化,美国电力需求主要靠居民用电支撑,单看工业用电,其实还略有下降。 这不仅仅是美国的问题,日本、欧洲这些不如工业化后期的国家都是如此。 图:过去25年美国用电量情况 资料来源:EIA 由于市场化,过去美国发电和用电可以取得比较好的平衡。直到AI边际变量的出现打破了这看似美好的平静。 美国电网是分区域的,不是中国这种统一大市场,所以我们看到在局部紧缺的地方,已经出现了供需失衡:2025年美国电价上涨超过5%,而且PJM这个局域网,涨幅更大。 当前AI用电还只占美国用电的5%左右,美国能源部DOE、EIA等机构都做了测算,大概结论是到2030年,美国AI用电国内总需求的10%,到2035年,AI耗电需求达到800-1000Twh,占比接近20%。 所以可以预见未来总量上会更加缺电。 02 结构比总量问题更大,2027年大考将至 由于全球过去十多年加速转向碳达峰,全球发电侧都明显的转向风电、光伏等新能源,美国也是如此。 但同步电网投资又是不够的,全球电网投资每年大概3000亿美元,而中国一家就占到30%,足以见其他国家电网的滞后,基本上新十年、旧十年、缝缝补补再10年。实际上,美国电网设备超50%运行超 20 年。 而东部、西部、德州三大独立电网之间互联互通能力弱,与中国统一的电力市场截然不同。 对于电这种可能是最为精密的系统来说,一方面是新能源这种高度不稳定的电源带来巨大冲击,另一方面是电网的老旧。在边际增量AI出来之后(由于大量的高性能GPU,AI负荷功率是非常大的),一切就显得更为脆弱。 具体表现为两方面:一是功率缺口,最大有效功率低于最大负荷,导致用电高峰时供应紧张;二是电量缺口,引发电价持续上涨。 在历史上,美国的供电中断指标(人均停电小时数)就是中国的5倍以上,未来只会更多。根据EIA的估算,美国电力系统的额储备裕度(即应对尖峰用电),如果不去迅速的改,在未来几年将被直接击穿,即今年发生在西班牙的大停电,我们也将在美国看到。 从EIA数据推演上来看,如果不紧急新增转机,2027年将是供需矛盾爆发的一年:美国用电将从供需紧平衡变成硬缺口。 图:测算美国电力系统储备冗余度(如果不新增装机)资料来源:EIA、兴业证券 03 AI用电问题怎么解决? 1.即使AI建设加速,中国电力整体仍过剩 电力是典型的公用事业,所以我们国家发展的思路一直是统筹为主、市场为辅。体现在发电侧、电网侧、用电侧我们都是超前发展的,走出了一条J型曲线。 虽然发展的过程饱受争议,但这使得我们整个系统有足够的安全冗余,也顺带使得我国的新能源、电动车和电力设备,都具备世界最强竞争力。 根据《中国电气化率年度发展报告》, 2024 年我国电气化率为28.8%,已经提升到跟主要发达国家相似的水平。 最后的结果就是,在美国由于缺电涨电价的背景下,国内25年的电价实际上是在跌的。 图:中国发电量高速增长来源:银河证券 而且根据已有的电源投资规划,如墨脱水电站、核电、新能源等,以及最近的十五五四万亿元的电网投资,未来我国在电力供给侧,确定性继续高增。 市场测算,到 2035 年我国总发电量预计为15万亿千瓦时,而届时美国很难突破5万亿千万时,也就是中国发电量将是美国的3倍,差距未缩小反而扩大。 发电和电网支持我们的用电需求无虞。预计十五五期间我国电气化率将以年均 1pct 的增幅稳步增长至 2030 年的 35% 左右,超出 OECD 国家平均水平8个点以上。 2.美国市场化主导,只能靠解绑和新技术 由于电是涉及到源网荷储的系统性问题,涵盖能源结构、体制、发电主体、电网运营商、配套设备厂等等一系列复杂的问题。基于当前的美国的电网结构,确实没有很好的解决办法。 在电力趋紧的2025年,就已经可以从电价看到压力陡增的情形。 首先,美国电价虽然有丰富的天然气拉低,使得其低于类似德国等欧洲国家,但是1元一度的居民用电,0.8元一度左右的工业用电,都比中国6毛左右要高出不少。 历史上由于市场化,美国电价基本持平于CPI涨幅,同时作为相对弱势的居民电价反而更贵;中国则反过来,用工业用电反哺居民。 但美国正在快速告别低电价,而且目前是在由居民买单。 2025年7月之后,美国数据中心在建容量停止增长,核心原因就是电网接入阻力大,居民也反对,政府审批也困难。比如德州,作为最缺电的区域之一,居民在听证会上直接反对AI数据中心对居民用电的挤出。 为了解决居民和工业之间的矛盾,可行的招数是让大厂自己建局域电网。 就在不到两周前,特朗普承诺确保美国居民不因为AI的数据中心挤占,去支付更高的电费,科技巨头应为 AI 能耗自行买单。 但这种做法也只是扬汤止沸,没有解决发电和电网的问题。 在发电侧,短期最快能顶上的就是燃气轮机,因为美国天然气资源丰富(美国AIDC中市电占比70%,燃气占比20%+),目前卡在GE、三菱等设备商产能极度紧缺,同时发展柴油发动机、燃料电池作为辅助电源,所以都是通过涨价来刺激生产。 长期,则需要稳定的基荷能源,因为天然气仍有不小的碳排放,只能作为过渡选择。被寄予厚望的是核电,尤其是SMR(小型模块化反应堆),以及更远期的可控核聚变。 同时在电网侧,还需同步升级老旧电力设备,提升区域互联能力。但这个难度可能比用电侧要大很多,因为涉及到民生、国家安全、区域协调等,纯市场化手段很难解决,同时还碰上海外如伊顿等并不愿意扩产。 图:AI公司布局核电事件汇总 来源:国盛证券 在我们看来,马斯克喊话中国AI要反超美国,主要是为了倒逼美国进行电力改革,类似于当时在SpaceX时怒喷奇葩的环保规则一样。 但至于如何改,根据以上分析判断,我们觉得系统性解决方案基本没有,可能他们唯一的办法,唯是依靠科技企业自身“各显神通”来应对困局。
沃尔沃力挺新能源,CEO塞缪尔森称电动汽车业务已实现盈利
IT之家 1 月 24 日消息,据外媒 CarBuzz 今日报道,沃尔沃管理层强调“全面电动化”依旧是公司核心目标,且电动汽车业务已经开始带来可观收益。 谈到盈利问题时,沃尔沃 CEO 哈坎 · 塞缪尔森说,沃尔沃因为电动汽车“现在更赚钱”。塞缪尔森的理由是,沃尔沃电动汽车不仅能够独立盈利,还扩大了销量规模。缺少电动汽车产品,沃尔沃销量和收入都会减少,利润也会随之下降。塞缪尔森也承认,电动车型利润率不如燃油车型,但既然仍取得了盈利,那么继续推进电动汽车阵容就是非常有必要的。 与此同时,沃尔沃并未忽视燃油车型需求。IT之家从报道中获悉,塞缪尔森表示,沃尔沃正在研发“下一代”插混车型,整体思路更接近增程车型。 沃尔沃首席战略与产品官迈克尔 · 弗莱斯补充说,新插混车型不会完全等同于纯增程结构,发动机仍可在效率需要时直接参与驱动,但在必要情况下也能以串联增程方式运行。弗莱斯确认,新系统的纯电续航将达到约 160km。 报道认为,新动力系统可能率先出现在 XC60 等现有车型的未来版本中,也可能用于全新车型。此外,一款新的插混车型将在不久后进入美国市场,并由沃尔沃南卡罗来纳州工厂负责生产。
当事人回应用SIM卡炼出191克黄金:用了接近两吨废料
快科技1月24日消息,近日,“男子用SIM卡炼出191克黄金”受到网友热议,有网友质疑真实性,认为这是在炒作话题。 炼金当事人“客家炼金师-桥”对此表示,自己确实是基于电子废料中贵金属回收的实拍记录,但网络上部分数据存在转载和表述不完全准确的情况。 据介绍,他用SIM卡确实提炼出了黄金,但并非是单一、完整的普通SIM卡,而是来源于通信电子领域中的芯片类镀金废料集合。 当时大概用了2吨的废料,而且网络上流传“191.73克”这一数字只是是某一批次成品的称重数据,在传播过程中被简化成了“用SIM卡炼金”,这一说法并不严谨。 同时他强调,这不是个人用生活废卡炼金的故事,而是贵金属回收行业中,对特定电子废料进行合规提炼的过程,记录视频的初衷是展示工艺和回收价值,而非制造噱头。 据悉,这种炼金需要经过复杂的提纯过程,涉及强酸溶解、电解还原等步骤,经过清洗、加酸、溶解、过滤、提纯才能获得黄金。 这一系列操作都需要需专业设备与防护措施,个人切勿模仿此类操作。 SIM卡中除微量金外,还含有铅、镉、溴化阻燃剂等有毒有害物质,而且提炼过程必须使用强腐蚀性化学试剂,非专业环境下处理极易造成环境污染和人身伤害。 除了SIM卡芯片,日常生活和工业场景中的银行卡芯片、各类IC卡,以及各类电子芯片、封装切片、连接器、触点、引脚等镀金部件等都可以提炼出黄金。
突发!黄仁勋2026首度来华
新智元报道 编辑:KingHZ 定慧 【新智元导读】AI不是泡沫,而是人类史上最大基建狂潮!黄仁勋直言:已投数千亿,仅是开端,未来需数万亿美元打造「五层蛋糕」,从电厂到应用层全产业链爆发,就业机会前所未有。 突发! 腾讯科技独家新闻报道,2026年黄仁勋首度来华, 首站到访了英伟达在上海的新办公室,与员工交流,回顾公司2025年主要事件。 据报道,这次来华行程与2025年初基本一致,主要参加上海、北京和深圳分公司的新年晚会以及供应商答谢会。 腾讯科技:独家丨黄仁勋2026年首度来华,未提及H200 根据知情人士,黄仁勋和员工的诸多问题中,主要聚焦在2026年重点芯片相关的话题。 根据英伟达真实路线图,继Blackwell之后,2026年的重点大概率是Rubin架构。 而就在中国行前夕,黄仁勋在达沃斯世界经济论坛上的一番发言,正在全球科技界引发震动,让全场脊背发凉:我们正在犯一个历史性错误—— 把AI当作技术,而不是电和路。 这句话背后,是一场数万亿美元的财富转移: 水管工、电工、建筑工人的收入未来或突破「六位数」, 而坐在办公室里的白领,可能面临第一波AI冲击。 这不仅是科技革命,这是人类工作价值的重新定价。 人工智能(AI)爆发,已拉开「史上最大规模基础设施建设」的序幕。 规模到底有多大? 黄仁勋表示,尽管各大企业已为这项技术投入数千亿美元,但未来仍需持续投入巨额资金。「我们需要建设价值万亿美元级的基础设施。」 他认为,ASI基建新工种将涌现,预测未来美国的建筑工有机会实现「六位数」收入。 人类历史上最大规模基础设施建设 2026年1月21日,瑞士达沃斯,世界经济论坛(WEF)。 在一场挤得水泄不通的主论坛上,黄仁勋(下图右)与Larry Fink(下图左)展开了一场关于AI未来的深度对话,豪言AI是「人类历史上最大规模基础设施建设」的基石。 众所周知,黄仁勋是NVIDIA创始人兼CEO,是AI时代「算力之王」;而后者Larry Fink,也不简单,是华尔街的两枚定海神针之一贝莱德(BlackRock)共同创办人、董事长、CEO。 黄仁勋提到,2025年是有记录以来风险投资规模最大的年份之一,大部分资金流向他所称的「原生AI公司」。 这些企业遍布医疗、机器人、制造与金融服务领域。黄仁勋指出:「这是首次出现足够成熟的模型,能够支撑这些行业的深度开发。」 相关投资正直接转化为就业岗位。 他特别列举了当前紧缺的技术工种:水管工、电工、建筑工人、钢铁工人、网络技术员,以及负责安装运营高端设备的专业团队。 从熟练技工到初创企业,AI正开启下一次平台级变革。 对全球打工人来说,这场变革将推动工作重心从执行任务转向实现价值。 AI 之下,工作要有目的 面对大家对AI取代人类的担忧,黄仁勋给出了反直觉的有力反击:AI不会摧毁工作,它正在让工作从「完成任务」转向「实现人生价值」 。 他以放射科医生为例。 2016年,「AI教父」辛顿曾表示:「我们现在就应该停止培训放射科医生了」,因为AI很快就能比他们做得更好。 他说得没错:近十年来,模型在各项基准测试中的表现已超越放射科医生。 然而,放射科医生的岗位数量正处于历史最高水平,平均薪资高达52万美元。 为什么? 因为医生的使命是诊断疾病和救治病人,看片子只是任务之一 。 AI处理了看片子的任务,让医生能花更多时间与病人互动,从而能接诊更多病人,从而医院效益好了,自然需要更多放射科医生。 同样的逻辑也适用于护士。 美国正面临500万护士的短缺,部分原因是护士们近一半的时间都花在填表和记录上 。 AI接管了图表记录和转录工作后,护士的工作效率提高了,医院效益变好了,反而需要招募更多护士。 作为CEO,黄仁勋幽默比喻:「若有人观察我和Fink的工作,大概会觉得我俩是打字员。」 但自动化打字不会取代他们的CEO工作,因为打字并非核心价值。 再比如,黄仁勋盛赞Claude「不可思议」,宣称「所有软件公司都需要使用它」。 黄仁勋并非突然认同Anthropic的AI安全理念,而是折服于他们的工程能力。Claude Code正在以惊人速度吞噬企业软件开发市场,以至于英伟达这家硬件公司竟公开点名推荐特定模型。 这说明AI已跨越「新奇事物」的门槛,蜕变为软件行业基础设施。 AI通过协助事务性工作,让人更能聚焦核心使命,提升效能,从而创造更大价值。 「所以关键在于:你工作的本质价值是什么?」黄仁勋最后发问。 英伟达创始人兼首席执行官黄仁勋与贝莱德董事长兼首席执行官Larry Fink在2026年瑞士达沃斯世界经济论坛年会对话 在对话中,他也淡化了外界对巨额支出承诺可能导致AI泡沫的担忧。 五层蛋糕论 AI没有泡沫 据估计,仅2025年一年,全行业就将在AI研发上投入约1.5万亿美元—— 这个数字超过了几乎所有其他领域任何企业集团的名义支出。 然而,黄仁勋坚持认为,这并不是过度投资。他说,这代表着人类历史上规模最大的基础设施建设,而这还只是刚刚开始。 他进一步解释称,在芯片领域,「台积电已宣布计划新建20座芯片工厂;富士康正与我们合作,还有纬创和广达,将新建30座计算机工厂,这些工厂后续将转化为AI工厂(数据中心)。」 「美光已开始在美国投资2000亿美元,SK海力士表现非常出色,三星也做得非常出色。你们可以看到,整个芯片行业正以惊人的速度增长,」黄仁勋补充说。 而且不止单一的芯片突破。 黄仁勋将AI产业精辟地拆解为五个核心层级,重申了他的「AI五层蛋糕论」: 1.能源(Energy):为AI提供动力的电力基础。 2.芯片与计算基础设施(Chips and Computing Infrastructure):硬件算力的基石。 3.云数据中心(Cloud Data Centers):承载计算的枢纽。 4.AI模型(AI Models):智能的大脑。 5.应用层(Application Layer):最终创造经济效益的顶端。 他特别指出,最大的经济效益将来自应用层—— AI正在重塑医疗、制造、金融服务等行业,并改变整体经济中的工作性质。 从能源发电、芯片制造到数据中心建设与云端运维,黄仁勋表示AI建设已催生大量技术工种需求。 更关键的是,他用「价格」来反证泡沫论: 如果这是泡沫,算力应该不缺、租GPU应该越来越便宜;但现实相反——GPU 很难租到,算力现货租赁价格在上涨,不只是最新一代,连两代以前的GPU也在涨。 这意味着需求来自真实业务,而不只是投机资本烧钱。 黄仁勋还举了企业调整研发预算的例子:比如制药公司把一部分投入从湿实验室转向AI超算。 AI是电,是路,是生产力 黄仁勋将AI定位为国家关键基础设施。 「AI即基础设施,」他强调,各国应像对待电力或公路那样重视AI,「必须将AI纳入国家基础设施体系」。 他呼吁各国基于本土语言文化构建自主AI能力:「开发属于自己的AI,持续优化迭代,让国家智慧融入生态系统。」 Fink质疑是否只有高学历人群才能使用或受益于AI。 黄仁勋驳斥了这一观点。 「AI超级易用——这是历史上最简单的软件,」他表示,AI工具仅用两三年已触达近十亿用户。 因此,掌握AI素养正成为必备技能:「学习如何使用AI、引导它、管理它、设立防护栏、评估结果,这些能力与领导力和团队管理同等重要。」 回到「放射科医生」,RSNA(北美放射学会)主席、 斯坦福大学医学教授Curt Langlotz之前表达过类似的观点: AI不会取代放射科医生,但会使用AI的放射科医生将取代不会使用 AI 的放射科医生。 欧洲的AI超车机会:物理AI 对于发展中国家,黄仁勋认为AI带来了缩小长期技术差距的契机:「AI很可能弥合技术鸿沟,普惠性与资源丰沛性将发挥关键作用。」 谈到欧洲时,他特别指出制造业与工业实力是巨大优势:AI不是写出来的,是教出来的。 「机器人是世代难逢的机遇,」黄仁勋强调,这对工业基础雄厚的国家尤为关键。 「如今我们可以将工业能力、制造能力与人工智能相融合,由此迈入实体AI即机器人技术的世界,」他补充说,这为欧洲带来了「跨越」由美国主导的软件时代的机遇。 「我认为,为了在欧洲构建繁荣的AI生态系统,我们必须认真对待能源供给的增长,加大对基础设施层的投资,这一点是确定无疑的,」 黄仁勋说道 Fink总结讨论时表示,这场对话说明世界远未形成AI泡沫,真正的问题在于:「我们的投资够吗?」 黄仁勋赞同这一判断,指出庞大投资势在必行:我们必须为AI技术栈的所有上层建筑构建必要基础设施。 他形容这一机遇「非同寻常,每个人都应参与其中」。 他重申2025年全球风投规模创历史新高,超千亿美元资金流向全球,其中大部分注入AI原生初创企业。「这些公司正在构建上层的应用生态,」黄仁勋说,「而它们需要基础设施与投资来筑造未来。」 Fink补充道,确保增长红利被广泛共享至关重要: 我相信全球养老基金参与这场变革将是绝佳投资机遇,能与AI世界共同成长。 我们必须让普通养老金领取者和储蓄者分享这份增长。若只能作壁上观,他们将被时代抛在后面。
在OpenAI“创新已经变得困难”!离职高管深喉爆料
刚离职的副总裁,把OpenAI的创新困境一股脑全曝光了。 编译 | 陈骏达 编辑 | Panken 智东西1月23日消息,昨天,由知名媒体人和作家Ashlee Vance主办的Core Memory播客,发布了对OpenAI前研究副总裁Jerry Tworek的深度专访。今年1月初决定离开的OpenAI的Tworek分享了一个关键洞察:随着竞争加剧与组织急速膨胀,OpenAI正逐渐陷入一种难以再承担真正高风险研究的结构性困境,一些前沿创新的研究方向,已经难以在OpenAI内部推进。 在正式进入访谈内容前,我们有必要了解下Tworek的传奇履历。Tworek是OpenAI元老级成员,2019年便加入该公司。他是OpenAI推理模型o1、o3背后的关键人物,将强化学习做到了极致,也让强化学习、推理模型真正进入了主流视野。此外,Tworek还在编程和Agent领域颇有建树。 今年1月7日,Tworek在X平台上分享了自己离职的消息,评论区涌入了诸多OpenAI大佬,言语间满是不舍之情。 这场访谈长达70分钟,实录近2万字,智东西梳理出Tworek分享的八大关键洞察: 1、OpenAI的创新困境:成本、增长压力等多重因素影响了OpenAI对风险的“胃口”,同时该公司尚未找到良好的跨团队的研究协作模式。 2、谷歌崛起:与其说是谷歌“回归”,不如说是OpenAI自己犯了错误,没能充分把握住自己的领先优势。OpenAI本应该持续领先。 3、行业弊病:5家头部AI公司路径完全趋同,研究员想在主流机器学习范式之外做点不同的事情,几乎找不到合适的地方,这令人沮丧。 4、人才争夺战:人才争夺战已演变成一场肥皂剧,有些人频繁地更换工作,而真正投入到工作的时间不多。 5、创新引擎:明星AI研究员并不是驱动创新的核心因素,公司本身能否打造个人责任感强、允许探索和做大事的环境,可能更为关键。 6、什么阻碍了创新:阻碍AI Lab研究的因素不是算力短缺,而是缺乏专注。对OpenAI来说,“集中力量办大事”已经变得有些困难。 7、AGI时间表:目前AGI仍然缺失关键拼图,架构创新与持续学习是两大重要方向,但AGI将会在2029年左右实现。 8、强化学习的回归:科学史已经反复证明,好的想法往往会卷土重来,判断一个想法是否重要并不难,难的是判断它什么时候会变得重要。 以下是访谈内容的完整编译: 01. 竞争激烈、组织膨胀 OpenAI的创新困境 主持人:你的离职声明写得很好,充满感情。你在OpenAI经历了非常重要的一段时间,见证了巨大的变化。那种感觉怎么样? Jerry Tworek:在OpenAI的每一年,都是一家完全不同的公司。公司本身的高速成长,以及整个AI世界的变化。 这种经历我觉得在人类历史上都很少见。我很庆幸自己能亲身经历这一切。正如我之前说的,每一个阶段都完全不同。 主持人:OpenAI在2019年时大概只有30个人?现在已经是几千人了吧? Jerry Tworek:说实话,很难统计清楚。全球多地办公室,遍布世界各地。现在几乎找不到没听说过OpenAI的人了。而我刚加入的时候,只是几个小团队,各自做着自己的研究项目。 但有一件事始终没变——OpenAI的野心。从一开始就瞄准AGI,想真正改变世界,并且带来正面的影响。而通过ChatGPT,把智能和实用性真正分发给了全球用户,我觉得这是一件非常了不起的事情。 主持人:所以你发了那条推文之后,是不是全球所有基础模型实验室都来找你了? Jerry Tworek:确实有很多。我现在也在思考下一步该做什么。在这个行业这么多年,我已经认识了很多人。我并不急着做决定。 我已经连续高强度工作很多年了,甚至没太多时间好好和人聊天。现在正好可以慢下来,想一想:接下来的七年,我想怎么度过。但确实,我正在和很多人交流。 主持人:你在推文里提到,你想做一些在OpenAI没法做的研究。能具体说说吗? Jerry Tworek:当前,在全球范围内争夺“最佳AI模型”的竞争异常激烈且严苛。想要保持竞争力,公司在运营的多个层面都面临着极大的挑战。 其中一个核心问题在于风险承担的意愿:从避免落后的角度出发,公司自然会被迫思考,究竟愿意承担多大的风险。无论是用户增长指标,还是持续支付高昂的GPU成本,现实都极其残酷。 也正因如此,持续展示实力、不断推出最强模型,对所有人而言都变得至关重要。这是当下几乎所有主要AI公司共同面临的处境,而这种压力无疑会影响一家机构对风险的“胃口”。 另一组同样难以权衡的因素来自组织结构。公司有其组织架构图,而组织架构往往在很大程度上决定了你能够开展什么样的研究:每个团队都需要明确的身份认同、研究边界以及其专注解决的问题集合。 跨组织的研究往往异常困难,而如何在大规模条件下高效地组织研究,这个问题可能还没有被真正解决。 研究本身偏好活力,甚至可以说偏好某种程度的混乱;而大型组织却需要秩序、结构与清晰的分工。这正是为什么“你最终交付的是你的组织架构图”这一说法如此流行:研究工作往往会演变成那些最适合现有人员配置的项目。 我也正是在这种背景下意识到,有一些我真正想做的研究方向,并不是OpenAI当前的组织架构所能支持的。 02. Transformer肯定不是最终形态 有很多路径尚未得到系统性实践 主持人:我曾在播客里和Mark Chen(OpenAI首席研究官)聊过这个问题——几乎所有人都在向他(以及Jakub,OpenAI首席科学家)提出自己的想法。OpenAI的确有一个优良传统:愿意承担风险,愿意去做一些其他实验室不敢做的事情。 但现实是,无论聚集了多少聪明人,资源已相当可观,这终究是一家资源有限的公司。它必须做出重大的取舍:哪些方向值得投入,哪些现在还无法承担成本。 而真正足够新颖的路径,往往恰恰是那种让人犹豫的方向——我们不知道现在该不该走,也不知道钱包是否负担得起。 Jerry Tworek:关于Ilya提出的“研究时代”这一概念,我不确定它是否像他所描述的那样非此即彼,但我确信,在AI和机器学习领域,仍然存在大量尚未被充分探索的可能性。 六年前,我们选定了Transformer架构,此后人们不断对其进行Scaling,并且效果显著。路径非常清晰:每个季度训练更大的模型,使用更多计算资源和数据,而进步似乎从未真正停滞。 但问题在于:这就是全部了吗?这是最终形态吗?我相当确定不是。模型仍然可以通过多种方式改进,而其中许多路径至今尚未被系统性地实践。 正如你提到的,我曾在推理和强化学习扩展方面投入大量工作。在那之前,整个领域几乎把所有赌注都押在了Transformer预训练的Scaling上。 这种方式确实有效:每一次预训练都可以打造出更强的模型,其能力都会全面提升,各项评测指标也随之改善。因此,人们很容易得出结论:只要不断扩展预训练,模型就会持续变好。 但后来,一些研究者开始相信,我们能做的不止于此。他们尝试证明:如果在语言模型之上,以与预训练相当的计算规模去扩展强化学习,就能教会模型一些仅靠预训练永远无法获得的能力。 正是由于这种探索,我们今天才拥有了这些能够自动化复杂任务、显著降低计算与数据需求的智能体系统。一旦发现新的扩展路径,就能解锁全新的能力,而如果只沿着预训练的扩展定律前进,这些能力可能需要极其漫长的时间才能出现。 在我看来,自GPT-4发布以来,推理模型代表了一次真正重大的能力跃迁。而我也坚信,类似这样的突破并非孤例。研究者不应只满足于渐进式改进,更应持续思考如何从根本上改变游戏规则。 03. 头部AI玩家路径趋同 这是件令人遗憾的事儿 主持人:去年在NeurIPS上,Ilya提到“我们正在耗尽数据”,暗示预训练终将触及瓶颈。 Jerry Tworek:我并不认为这意味着预训练即将终结,它仍然在持续改进,也依然有许多优化空间。但预训练并不是提升模型能力的唯一方式,而且在很多情况下,它提升得非常缓慢。其他方法,或许能更快地推动能力跃迁。 主持人:硅谷长期存在一种有趣的现象:科技公司往往会提出一些在外界看来怪异、甚至离经叛道的想法,而正是这些想法催生了真正颠覆性的创新。 但一旦某条路径被证明是成功的,局面就会迅速反转,形成强烈的共识,所有人开始沿着同一方向竞赛。 这正是我们当前所处的阶段。模型竞赛已经持续了两三年,几乎所有主要实验室都在做同一件事。你认为这是个问题吗? Jerry Tworek:我对此感到相当、相当遗憾,几乎所有公司都在做和OpenAI一样的事儿。OpenAI无疑取得了巨大成功,做对了更多事儿,引领了扩展Transformer的范式,也证明了大规模模型能够为世界创造真实而广泛的价值。 但如今,有多少公司在做着几乎一模一样的事情?竞争当然有其价值,但我们现在大概有五家严肃的AI公司,使用几乎相同的技术配方,在同一技术基础上构建略有差异的产品。 也许这是正确的路径,但我仍然希望看到更多多样性,模型之间真正的差异,而不仅是微小的调优。 如果你观察当下最顶级的模型,很少有人能真正分辨它们之间的不同。或许我们应该进行更多盲测:让用户与不同模型对话,看看他们是否能分辨出差异。 我怀疑99.9%的用户做不到。这些模型在体验上极其相似,即便它们来自不同团队、采用了略有不同的技术选择。在这样的环境中,真正的探索在哪里?真正的创新,以及与他人区分开来的能力,又在哪里? 04. 与OpenAI已出现实质性分歧 分开比勉强合作更健康 主持人:我问一个有些尖锐的问题:你在OpenAI内外都被视为传奇人物,参与的项目成功率极高。如果连你这样的人,都觉得自己真正想做的事情在公司内部难以推进——无论公司是否明确反对,这种阻力本身就已经存在。 对于一家最初以研究实验室起家的公司而言,这是否是一个值得警惕的信号? Jerry Tworek:我的看法是,有时候人们会成长到某个阶段,需要与过去分道扬镳。对一家公司及其成员来说,就目标和前进方向达成一致极其重要。 而在某个时刻,我意识到自己对未来研究路线的看法,与OpenAI所选择的方向在某种实质性层面上出现了分歧。在这种情况下,分开也许比勉强合作要更健康。 正因如此,我也认为,如果不同公司能够真正专注于不同的事情,行业会因此变得更好。专注对一家公司而言至关重要,而OpenAI很可能正在做所有正确的事情。 也许只是我怀抱了一些不切实际的梦想。我是一个相对乐观的人,我相信世界上始终还有很多不同的事情可以去做,这在原则上完全是可能的。 关键在于专注,把真正核心的事情做到极致。事实上,很多事情、很多公司,只有做到这一点,才能生存下来并进入下一个阶段。 在一个理想的世界里,应该存在大量做着不同事情的公司。尤其是对研究人员而言,他们很难在一个自己并不真正相信的研究方向上长期投入。他们理应能够找到一个地方,在那里从事自己最笃信的研究,并让时间来检验其价值。 也正因为如此,我对如今几乎所有公司都在做同样的事情感到有些难过。现实是,如果你想在主流机器学习范式之外做点不同的事情,几乎找不到合适的地方。这可能是目前让我最沮丧的一点。 主持人:当你开始认真思考“下一步要做什么”时,这种同质化的问题会变得尤为明显。如果所有实验室都在做同样的事,你自然也不会觉得自己只是换一家大实验室就能获得真正不同的空间。 Jerry Tworek:我确实在思考人生的下一个阶段,但如果世界上能有更多选择,让人可以稍微偏离主流,去做一些不那么热门、但可能同样重要的事情,那会让我更开心,也更容易做出决定。 主持人:这就引出了一个问题:我们到底需要什么,才能真正偏离主流? 一个投入了如此多资金和资源、又处在聚光灯下的公司,会本能地害怕承担风险。但问题在于,这些风险也许恰恰是必要的。那么,究竟需要改变什么?这种状况未来会不会发生改变? Jerry Tworek:有趣的是,我个人其实非常喜欢冒险,别人也常这样形容我。冒险本身是一件好事。 但当风险和巨额资金绑定在一起时,愿意、也有能力承担这种风险的人就会变得极其稀少。风险承受能力是一种高度个人化、极其独特的特质。我与很多人共事过,深切体会到这一点。 我真心认为,人们本该更愿意承担风险,去尝试更多不同的事情。尤其是研究人员这一群体——如今AI领域的薪酬水平已经相当夸张了,而这反而可能带来一种副作用:人们变得不愿意失去工作,不愿意经历糟糕的绩效周期。于是,他们更倾向于追逐短期回报。 很多研究人员本身非常聪明、也很有想法,只是整个系统的激励机制过于短视。可恰恰是研究人员,才最应该被鼓励去冒险、去做大胆的尝试——因为真正的进步,正是这样产生的。 05. 算力门槛正阻碍创新 “探索与利用”的权衡是关键问题 主持人:当然,我们也看到了一些例子。比如游戏教父John Carmack,他去了达拉斯的“洞穴”,一度几乎是独自工作,现在可能也只有极少数员工。Carmack说过:“也许我未必能做出真正不同的东西,但至少应该有人在认真尝试一条完全不同的路径。” 我也和Ilya聊过,不过我并不清楚他具体在研究什么。所以我无法判断,他的工作是在延续过去的方向,还是某种更加激进的尝试。但可以肯定的是,如果他不认为那是一条不同的道路,就不会去筹集那么多资金来做这件事。杨立昆显然也有与主流不同的理念。 这正是让我觉得这个领域非常有趣的地方。AI在某种意义上是一个非常古老的领域,可以追溯到几十年前;但当下这套主流范式,其实是相对较新的。当我和研究人员交流时,他们仍然会说:“只要把主要论文都读一遍,很快就能跟上进度。” 可我时常会想,会不会有某个人,突然带着一个极其激进、全新的想法出现,彻底推动整个领域向前?如今这件事似乎变得更难了,因为你可能需要一个州那么大的数据中心来支撑实验。 Jerry Tworek:这是一个巨大的资源门槛,也确实让问题变得更加棘手。但这同样是一个值得认真思考、试图解决的问题。 世界上有大量学术研究在进行,许多学生在做各种各样的探索,但其中绝大多数都严重缺乏资源。结果是,许多原本可能很有潜力的研究,最终不了了之,因为真正关键的研究往往需要大规模实验。 也正因如此,我对当下的一个趋势感到非常欣慰:确实有相当多的资金开始流向那些支持新颖、激进想法的尝试。像Carmack、Ilya、杨立昆这样的人,正是当下应该存在、也应该被资助的对象。 显然,并不是所有尝试都会成功,但其中一些一定会——世界上的创新正是以这种方式发生的。 在强化学习领域,“探索与利用”的权衡早已是一个经典概念。即便是我们在优化智能体时,也始终面临这个问题:是选择那些已被验证有效、成功路径明确的策略,还是尝试全新的方法,用不同的方式解决旧问题? 这是一个艰难但无法回避的权衡。当我们思考智能体该如何行动时,也许同样应该反思我们自己是如何做选择的。 主持人:至于那个由顶尖AI研究者组成的小圈子,人们是否真的清楚Carmack在做什么? Jerry Tworek:说实话,我并不完全清楚。我的印象是,他正在大力押注于通过鼠标和键盘,在电子游戏中进行端到端的强化学习。如果我没记错的话,大致是这样。 而这恰恰让我觉得非常有意思。长期以来,我一直认为电子游戏是训练智能的绝佳环境之一。游戏是为人类大脑设计的,要让人类觉得有趣,它们融合了故事、权力幻想、解谜和问题解决,必须持续保持新鲜感,不能变得重复。 从某种意义上说,电子游戏是为人类认知量身定制的学习环境,而问题解决这样的能力,正是我们希望智能体具备的能力。 但我们至今还没有真正聪明的模型,能够在这种高频、多模态的环境中稳定运行。这也许暴露了某些架构层面的限制。但我依然认为,在电子游戏上训练AI,是一件非常有前景的事情。 强化学习之父Richard Sutton过去做过大量相关工作,不仅是电子游戏,还有扑克等复杂博弈。我曾去过他的实验室。当然,他当年的游戏环境,比我们后来在OpenAI让模型玩Dota时要简单得多。DeepMind CEO Demis Hassabis也一直在坚持类似的想法。 06. 好的想法 往往会卷土重来 主持人:有趣的是,这些思路曾一度被认为“过时”。在ChatGPT时代,它们看起来不像是主流方向。 Jerry Tworek:科学史反复告诉我们:好的想法往往会卷土重来。判断一个想法是否重要并不难,难的是判断它什么时候会变得重要。 七年前我刚加入OpenAI时,基于游戏的强化学习是绝对的热点。我们解决了Dota、《星际争霸》。当时DeepMind的AlphaGo更是一个里程碑。 但这些模型有一个非常明显的问题:它们几乎没有世界知识。它们只是在从零开始学习如何玩某一个游戏,而并不真正理解我们的世界。 显然,这不是正确的路径。模型首先需要对现实世界形成高层次的理解,而不仅仅是对像素作出反应。从零开始的强化学习,更像是一种“蜥蜴脑”或“猴脑”的学习方式。我们真正希望的是让模型具备更抽象的概念结构。 而经过多年大规模预训练,我们终于获得了对世界极其丰富、稳固的表征。现在,是时候在此基础上重新引入强化学习了。推理模型的真正魔力,正是在于:它们在一个强大的世界表征之上,通过强化学习构建能力层级。这才是未来的方向。 主持人:至于世界模型,谷歌做过相关探索,杨立昆和李飞飞的研究在某种程度上也指向这一方向。我们作为婴儿并不是生活在黑箱中,而是通过不断试探来理解世界。所以,将世界模型与强化学习结合,在我看来是非常合理的。 Jerry Tworek:这个想法显然是正确的。真正有趣的地方在于,我们如何将世界模型的表征构建与强化学习结合起来。强化学习用于教会模型各种技能,而这些技能正是模型在现实世界中运作所必需的——它赋予模型实现自身目标的能力。 然而,要想实现目标,模型首先必须理解自己所处的世界;只有在具备这种理解之后,它才能形成有效的计划与策略。这正是为什么世界模型与强化学习必须协同发展的原因。一旦有人能够在一个训练良好的世界模型之上成功地进行强化学习,那将会是一个极其令人振奋、具有里程碑意义的时刻。 07. 架构创新与持续学习是两大方向 AGI仍然缺失关键拼图 主持人:你现在对什么最感兴趣? Jerry Tworek:总体上,我认为简单地去重复实验室里已经在做的事情,其实意义不大。在现有的范式和设置中,仍然有很多可以调整、可以改进的地方,但有两个方向,我觉得要么被明显低估了,要么至少没有得到足够的资源去真正推进。 第一个方向是架构层面的创新。我们在Transformer架构上多少有些过于固步自封了。它无疑是一个伟大的架构,也已经被极其深入地探索过。 人们在对Transformer进行局部改进、试图通过一些小的结构调整来进一步提升它时,确实遇到了不少困难,当然,也有一些相当成功的尝试——比如稀疏性显然就非常成功,各种降低注意力机制计算成本的方法也取得了不错的效果。 但问题是:Transformer会是机器学习的终极架构吗?显然不会。尽管Transformer的提出者们做了极其出色的工作,几乎定义了接下来十年机器学习的发展格局,但事情远不止于此。 一定还存在其他训练大模型的方法——它们可能看起来有点像Transformer,也可能完全不像。这是一个非常值得投入精力去探索的问题。如果没有人去做这件事,那我会很乐意自己试一试。 第二个方向是一个更热门的话题,但我并不认为目前有人真正把它做好了,那就是持续学习,以及如何真正地、彻底地将test time与train time融合在一起。 对人类而言,这种方式再自然不过了:我们并不存在一个明确分离的“学习模式”和“回答模式”,一切都是在持续不断地同时发生的。我们的模型也应该更接近这种运作方式。 这很可能是我们在实现AGI之前,仍然缺失的几个关键能力要素之一。如果模型无法从它们所接触到的数据中持续学习,那么无论它们在其他方面多么强大,依然会给人一种受限、甚至有些“愚钝”的感觉。 主持人:说到AGI,我们上次聊天时我提到过,相比一两年前,现在我已经不太常听到关于时间线的讨论了。甚至连关于AGI本身的讨论似乎也减少了。所以我其实挺好奇的。 你称自己对AI持谨慎乐观的态度。那么在你看来,我们现在处在AGI时间线的哪个位置? Jerry Tworek:是的,我个人的看法其实也略有更新。我一直认为,扩大强化学习的规模是实现AGI的必要组成部分。大约在一年前或一年半前,我几乎坚信,只要我们把模型的强化学习规模做大,它就会成为AGI。 而现在,我不得不稍微修正这一观点。不过有些东西,只有在真正进入下一个阶段之后你才能看清。我们也必须承认,今天的模型在非常非常多的方面已经做得相当出色了。 它们在编程方面所能做到的事情,对我来说尤其震撼——因为写代码本身就是我最喜欢的事情之一。你现在可以非常、非常快地完成大量工作。 对十年前的一些人来说,如果你向他们展示我们今天所拥有的能力,他们可能已经会把这称作AGI了。所以,谈论AGI已经不再像过去那样离谱或疯狂。 但至少按照我自己的定义,当前的模型仍然不能算是AGI,因为持续学习还没有以任何实质性的方式与我们的模型真正整合在一起。同时,从模型目前的状态来看,甚至在多模态感知这样的能力上也仍有明显缺失。 如果模型看不到外部世界,或者无法观看视频并对其进行良好的理解,那么即便它们在文本理解和编程方面非常出色,我们真的能称它们为AGI吗? 因此,要真正实现构建AGI这一文明级别的里程碑,还有许多我称之为“必要步骤”的问题需要解决。 一段时间我曾想过,如果我们真的非常努力,如果所有事情都做得非常好,也许2026年至少会成为我们在真正优秀的持续学习和真正通用的强化学习方面取得突破的一年。 我的时间线判断依然是有些浮动的。但与此同时,AI领域的发展速度确实非常快。投资每年都在不断增长,越来越多的人进入AI领域,这扩大了人才储备,也增加了我们能够探索的想法数量。 所以我并不认为这个想法完全荒诞或不切实际。也许会更早一些,也许会稍晚一些——可能是26年,也可能是27年、28年,甚至29年。我不认为会比这再晚太多。 当然,还有大量工作要做,但确实有很多人正在为实现AGI而努力。 08. 我们正处在变革时代 保持担忧和谨慎有必要 主持人:如果我的记忆没错的话,在“Strawberry”项目出现之前,你是不是在研究Q*项目?那时候有很多风声,大家都在谈论Ilya看到了Q*,知道AGI已经来了,这把所有人都吓坏了。 我的意思是,听你刚才这么说,反而让人觉得有点好笑。因为这确实是一件非常棘手的事情:这些系统能做到一些极其令人印象深刻的事,于是我们就会变得异常兴奋。然后时间过去, 你知道,就像现在的“Strawberry”项目一样——它确实令人难以置信,几乎改变了整个领域,但我并不觉得我第一次使用它的时候被“吓到了”。 Jerry Tworek:我明白你的意思。这是人类心理中非常有趣的一部分,在某种程度上也反映了我们与技术互动的方式。 对我来说,强化学习Scale up的效果仍然非常显著,而且随着时间推移,我们会看到更多这样的成果。尤其是在编程领域,这将以许多不同的方式影响我们的生活。 今天,进行任何大规模编程项目的体验,与一年前相比几乎是天壤之别。我们会在各种各样的事情中看到这些变化。当我和我的团队,以及OpenAI的许多人,在两年前第一次看到Q*开始显现出有效迹象时, 你坐在一个房间里,目睹一项具有实质性意义的新技术。如果你在那一刻没有感到哪怕一点点害怕、一点点担忧,没有对“我们正在做这件事会带来什么后果”产生一丝疑虑,那么我会认为你对自己的工作不够负责。 我觉得每一位AI研究人员都应该问自己:如果我正在做的事情是全新的,具备前所未有的能力,那么它会给世界带来什么影响?事实上,很多研究人员确实在这样思考。有时候,人们也确实会不小心走得快了一两步。 到目前为止,AI还没有对世界造成任何真正的伤害。尽管像“阿谀奉承”这样的问题或许可以争论一下,其他问题至少据我们所知还没有。 但即便如此,我仍然认为,在向世界发布任何新技术时,保持担忧和谨慎是一种非常好的、也非常健康的反应。 我们正处在一个变革的时代,一个许多新事物不断向世界扩散的时代。它们会产生许多影响,影响人们如何度过一生,影响人们如何看待自己、看待他人,影响人际关系,也影响国际关系,还会影响GDP和生产力。 有时候,有人写下一行代码,所引发的连锁反应却会像瀑布一样,贯穿这一切。而其中所承载的责任,是相当沉重的。 主持人:这些想法确实都很有道理,其实我之前也一直在反复思考这些问题。我们此前大概也零星讨论过一些。只是那段时间里,随着所谓的“OpenAI政变”事件逐渐浮出水面,我总会下意识地试着设身处地为你着想。 但在这样一个关键的时刻,一个本应被认真理解的创造物,却率先成为人们迷恋、投射与争夺的对象,这本身难道不会让人感到一种微妙的怪异吗? 而与此同时,我看到你所创造的东西被推到聚光灯下,在尚未真正被理解之前,就被媒体反复谈论,又被卷入一场近乎肥皂剧式的纷争之中。我一时间甚至不知道该用什么词来形容这种感觉——说“好笑”似乎并不完全贴切。 Jerry Tworek:很难将科技世界、概念世界、人类情感、人类生活、人类之间的共同点以及分歧彼此分离开来。我们生活在这样一个世界:AI领域的重要参与者之间,存在着极其复杂、跨越多个层面的关系网络。 要真正理清这一切,历史学家恐怕需要花费很多年,甚至几十年,才能弄清这里究竟发生了什么,真实情况到底是什么。 说实话,即便是我自己,现在对“OpenAI政变”期间发生的一切,也只保留着非常零碎的记忆。每当有新的证词出现,每当新的文件被披露,我们都会了解到一些此前未知的事实。将来肯定会有人把所有真相拼凑出来,但世界本身就是复杂的。 或许我们确实需要一种更健康的方式来讨论技术,找到一个合适的讨论平台,让这些分歧在某种程度上得到解决。但我们生活在一个没有完美解决方案的世界,也没有完美的讨论方式。 09. 分歧不可避免 只能依靠想法、信念与梦想 主持人:你也不认为X平台是一个理想的媒介? Jerry Tworek:我个人其实很喜欢在X上发帖,喜欢和研究社区、和身边所有人分享想法,但X平台也并不是一个完全严肃的地方。所以很多时候,讨论总是介于玩笑和认真之间。 那么,什么才是正确的解决方案呢?当一个人担心某项技术过于危险,主张应当停止研究,而另一个人却认为它或许应当继续推进,因为它能够扩展人类的能力。第一个人又进一步认为,这甚至不是一条正确的研究路径,我们理应转向完全不同的方向。 在技术进步与科研探索的领域中,这样的分歧几乎不可避免,而一切又都笼罩在未知之中。没有人真正知道未来会走向何方。我们所能依靠的,只有想法、信念与梦想。在这种根本性的不可确定性里,我们仍然必须继续生活、继续选择,并且往往不得不在许多关键问题上,以某种方式学会求同存异。 主持人:是的,考虑到当时媒体对Q*的高度关注,诸如“伊利亚看到了什么”之类的叙事,相关的炒作确实过于密集了,而且几乎是一月接着一月不断升级。我对此并非没有意识到,只是仍然感到有些困惑。 我之所以好奇,是因为我们中的许多人在推特上都非常活跃,也都在不同程度上参与、放大,甚至推动了这种讨论和想象。那么,从你的角度来看,你如何看待这种持续升温的炒作?你是否也觉得,它或许需要稍微降温一些了?我个人认为,我们确实应该大幅降温。 Jerry Tworek:但与此同时,如果有人在七年前告诉你,OpenAI会成为一家万亿美元级别的公司,会建设史上最大规模的数据中心,拥有全球最大的网络产品之一,所有人都会时刻谈论AI。你当时一定会觉得那些人疯了。这听起来本身就像是炒作。 我其实认为,在很多方面,炒作背后是有实质内容的。有时它会过头,有时又不够,但AI确实很重要,也确实需要被讨论。我想现在已经没有人会认为AI是一个不重要的话题了。 几年前的情况肯定不同,当时确实有很多人认为AI不重要。但现在已经很清楚了,AI可能是这个世界上最重要的话题之一,值得我们持续讨论和深入思考。 进展会有多快?哪些路径是正确的?它到底有多安全,或者多危险?这些问题当然可以存在分歧和争论,但AI已经深度地融入了这个世界,而且只会变得越来越强。 10. 有些人频繁跳槽 做的实事并不多 主持人:完全同意。但如果暂时把技术本身放在一边,我的意思是,我报道过Meta的挖角狂潮。这件事已经变成了一场肥皂剧、一档真人秀,而不再只是关于硬核科学的问题。你已经在这个领域工作了这么久。我只是好奇,我们是不是已经越界,进入了真人秀的范畴? Jerry Tworek:但问题是,究竟是谁在制造这场肥皂剧呢?肯定不是我。 主持人:我的年龄足以让我亲历互联网泡沫,以及更早几个技术周期。而这一次的感觉,确实更像一场肥皂剧。即便回想当年的生产力软件大战,事情也并非如此。 很大一部分原因在于,今天的利害关系实在过于巨大。牵涉的资金规模、研究人员在各个实验室之间的流动,再加上一连串高度戏剧化的事件,这些因素叠加在一起,让整个局势长期处于紧绷状态。 从一开始我就有一种强烈的感觉:旧金山仿佛为自己创造了一个独立的世界。与其说这是泡沫,不如说是我们彼此不断说服自己,这就是终局,赌注巨大,这是一场竞赛,既可能极其精彩,也可能极其糟糕。一切都高度紧张,也因此带来了额外的心理负担。 所以我确实觉得,这一次很不一样。互联网泡沫时期,一切源于一个简单而天真的念头:这太酷了,世界上所有的信息都触手可及,人可以彼此连接。公司是后来才出现的,金钱竞争更是逐渐浮现的结果。而现在却仿佛从一开始,整个世界的重量就压在了这件事情上。 老实说,我不知道你们是怎么撑过来的。我看到无论是OpenAI、Anthropic还是其他实验室,都在拼命工作、彼此竞争,而赌注又如此之高。连续七八年处在这样的状态里,任何人都会被消耗。我完全理解,为什么你会想停下来休息一段时间。 这不仅是体力上的消耗,更是心理上的磨损。因为一旦你真正接受了这种设定,它本身就会不断侵蚀你。 Jerry Tworek:确实,这一切都会带来心理上的损耗。不过我可以告诉你,曾经有一位在应对压力方面比我经验丰富得多的人对我说过一句话:每经历一次高压时刻,就像是做了一次俯卧撑,你对压力的承受能力都会稍微增强一点。 坦率地说这七年的工作确实锻炼了我极强的心理与情感韧性。至少我真切地感觉到,自己能够屏蔽掉大量噪音和无谓的干扰,在无论发生什么情况时,都尽量保持稳定和坚定,不管是公司濒临崩溃、研究人员频繁流动,还是项目被不断重新分配。 总会有一些事情发生。我也听到有人把人才挖角比作体育队的转会。体育联盟之所以能相对有序地运作,在于它们有清晰的角色分工,以及明确的转会规则,何时可以流动,何时不能流动。遗憾的是,加州法律在这方面几乎没有真正的限制。 我确实认为,如果能在这方面建立一些规则,或许会是一件好事。因为在这个行业里,确实存在这样一种现象:有些人频繁地更换工作,而真正投入到工作的时间,反而显得更少。这种情况正在发生,而且并不罕见。 主持人:那么,给AI领域加上工资帽怎么样? Jerry Tworek:确实有些人在频繁跳槽,也有些人仍然在坚持工作,努力把前沿继续向前推进。不过,AI 毫无疑问已经是一门大生意了。 主持人:前两天我还在和同事聊,我们需要列一份名单,上面包括所有在前沿AI机构工作过的人,还要标注他们在每一个地方待了多久。肯定至少有不少人完成了“湾区大满贯”,每家都呆过。 11. 揭秘OpenAI内部“波兰黑手党”: 勤奋是项重要品质 主持人:我们能聊聊“波兰黑手党”吗?当我刚开始写这本关于OpenAI的书的时候,大概是2018年左右,那时整个公司里大约只有三十个人。这个最初的群体中,有相当一部分来自波兰,数量多得出人意料。他们几乎都是数学天才,有些人从小就彼此认识,有些则并非如此。 不过,这确实在某种程度上反映了苏联教育体系在数学人才培养方面的卓越之处,或者也可能只是因为,只要有一个人先去了OpenAI,大家彼此认识,就陆续跟着去了。 Jerry Tworek:就我个人而言,在最终加入OpenAI之前,我完全不认识那里任何一个人,来到OpenAI纯属机缘巧合。 但在OpenAI的早期阶段,波兰人的比例确实非常高。我并不认为这种趋势能够长期持续。现在,波兰裔员工的绝对人数比早期更多了,但考虑到公司规模扩大了上百倍,这个比例其实已经不算高了。 不过,我们的教育系统确实有点东西。不过我没有亲身经历过其他教育体系,所以也无法真正判断波兰教育体系是否真的如此出色。 波兰确实拥有很多杰出的人才。而我非常欣赏波兰的一点,就是波兰人非常勤奋。其实随着时间推移,尤其是在许多发达国家,勤奋工作似乎越来越不被重视。生活变得更安逸了,人们有更多其他事情可以关注和优先考虑,这本身也很正常。但波兰人确实非常看重勤奋。 在我出生之前,波兰还是一个共产主义国家。就在我出生的那一年,国家转型为自由市场经济。这个过程相当残酷,但社会拥抱了这种变化,努力摸索如何变得更具创业精神,如何为自己的未来奋斗,如何实现经济繁荣。而事实证明,这是成功的。 我是一个移居海外的人,如今并不住在波兰。但每次回去,大概一年一两次吧,我都能清楚地看到国家在持续建设和发展。我看到它变得更好、更美丽、更繁荣。这真的是一个了不起的故事。 主持人:你在当地算是个名人吗?我总觉得,波兰政府可能在想:该死,我们本来可以把这件事做成的。我们当初应该把这些人都留下来。我去年去了波兰,我知道他们已经意识到这一点了。几乎每个人都会问:你认识Wojciech(OpenAI联合创始人之一,也是少数仍在OpenAI工作的早期OpenAI成员)吗? Jerry Tworek:Wojciech真的是一个了不起的人,非常友善。不过硅谷也是完全独一无二的,雄心、规模以及活力,这并不是在世界任何地方都能轻易实现的。但我可以向你保证,波兰人非常勤奋,而且能够识破“忽悠”。这一点,在生活中真的能让你走得很远。 12. 谷歌的回归背后 是OpenAI在犯错 主持人:你对谷歌的回归,或者说重新崛起感到惊讶吗?看起来他们做对了很多事情,你们一直都认为他们最终能理清思路,然后迎头赶上吗?还是说,这其实是个意外? Jerry Tworek:我个人认为,与其说是谷歌的“回归”,不如说是OpenAI自己犯了一些错误。尽管OpenAI做对了很多事情,但即便在理想环境下,它也犯过几次错,执行速度比本可以做到的要慢。 如果你是一家领先的公司,并且拥有OpenAI所具备的全部优势,那么你理应始终保持领先。但如果你在这个过程中做出了错误决策,而别人做出了正确决策,那么别人就会赶上来。 谷歌确实做对了很多事情,他们在硬件、人才等方面拥有巨大的结构性优势。当OpenAI刚起步时,谷歌在几乎所有机器学习与研究方向上都是明显的第一名。 OpenAI能够脱颖而出,主要源于对某一特定方向、特定路径的坚定研究信念。而世界花了极其漫长的时间,才意识到这是一个很好的信念、一个很好的方向。 即便在GPT-2、GPT-3、GPT-3.5被训练出来的时候,也并没有太多人真正放在心上。你去NeurIPS和研究人员交流,大家会觉得OpenAI挺酷,但其他实验室往往会说:嗯,我们迟早也能复现。那些大语言模型挺有意思,但也就那样。 只有当OpenAI开始通过ChatGPT真正赚钱时,其他公司才突然意识到:哦,这东西现在能盈利了,我们真的需要做这件事了。 这给了OpenAI一个极其漫长的时间窗口,从构建技术到实现商业化,而其他人直到后来才意识到“我们真的、真的需要做了”。谷歌也是从那时起才开始认真对待大语言模型的训练。 而由于OpenAI没能充分把握住自己的领先优势,谷歌如今在模型能力和训练方面已经非常、非常接近了。对谷歌来说,这是件好事,我会给他们送上祝贺,因为他们扭转了局面、并且执行得非常出色。 主持人:有哪些失误?我记得当时我报道你们推出搜索功能时,外界的说法是:OpenAI推出搜索,谷歌要完了。我当时就想,我并不确定会是这样。那么,具体的失误是什么呢? Jerry Tworek:我不太想深入讨论内部决策的细节,哪些是对的,哪些是错的。但我再强调一次:在理想的执行情况下,如果你一开始就领先,你本应保持领先。 13. OpenAI需要加快进度 Anthropic令人钦佩 主持人:看起来你认为OpenAI存在一些技术层面的失误,同时公司内部的一些戏剧性事件在某些阶段拖慢了进度。我和足够多的OpenAI内部人士聊过,他们一直在思考公司该如何继续向前。然后在某个阶段,一批关键人物离开了。但听起来,你刚才更多是在谈技术层面的问题。 Jerry Tworek:这些事情有时是相关的。从技术上讲,我并不认为人员流动本身是一个严重问题。在任何公司,人来人往都应该是正常的现象。但有时,人员离开确实是问题的征兆。 但如果公司有人说:“有人在做错误的事情,我们不再相信这家公司了,我们应该离开”,那可能确实说明存在更深层次的问题。不过,正如我之前所说,有些事情的进展速度显然是可以更快的。 主持人:正如你所说,各大实验室在总体方向上做的是类似的事情。那么Meta在某种程度上算是后来者。虽然他们早就涉足AI,但现在看起来,他们是想用不同方式来做这件事,同时从其他公司挖人。 我不太清楚Meta具体在做什么,但给我的感觉是,他们并不是要走出一条真正不同的道路,而是想走同一条路。这在我看来是一个根本性的问题。你来得晚了一点,却在做和别人一样的事情,结果可能不会太好。你觉得他们真的有不同的方法吗? Jerry Tworek:我对他们的策略并不是特别熟悉,所以无法确定。但从外部来看,我觉得他们意识到了一点:在当前的AI世界里,你可以用两种方式来思考你想做什么。 一种是,我们想打造一个在某些方面明显优于他人的模型;另一种是,我想打造一个和别人同样优秀的模型,但以不同的方式去使用它,或者围绕它构建不同的产品。 就我对Meta的理解而言,这家公司关注的是连接人、建立关系、打造体验,无论是元宇宙、社交网络,还是其他形式的体验。我再强调一次,这只是我的推测,但我认为他们的思路是,利用行业已经理解并掌握的AI技术和Transformer,来尝试构建这些体验。 从一家极其盈利、拥有全球最大社交网络的公司角度来看,这可能是一种相当不错的策略。 主持人:我们刚刚谈到了谷歌的回归。在OpenAI与其他公司的持续竞争中,有没有某个AI Lab给留下了特别深刻的印象? Jerry Tworek:我得说,这是最近才发生的变化,但在过去一年里,我对Anthropic的钦佩程度确实大幅上升。我从来都不是特别关注模型“个性”的那种人。虽然我听说Claude的个性不错,也许吧。 但他们在编程模型和编程智能体方面所做的事情,他们围绕这些成果建立的品牌以及他们所拥有的大量开发者,这些绝对是令人震惊的成就。 Anthropic起步更晚,计算资源受限,团队规模也更小,在获取优质算力和硬件方面遇到了许多困难,但他们依然成功构建了卓越的产品。这些产品正在改变人们开发软件的方式,并且据我所知,显著提升了企业生产力。祝贺他们。 主持人:他们似乎正处在一个高光时刻。我认识的每一个人都在谈论Claude Code,但我确实不知道,他们是如何做出一个如此出色、像ChatGPT一样被广泛喜爱的Claude Code的。似乎很多实验室确实在借鉴这个工具,还有些实验室被断供了。 Jerry Tworek:是的。在OpenAI,我们也在开发Codex,这是我们自己的编程工具,它也挺不错的。有意思的是,我自己其实并没有怎么用过Claude Code。毕竟我当时受雇于OpenAI,所以没怎么用过。 所以我真的说不太准。但我觉得Codex不是一个坏产品。只不过,从Twitter上的情绪来看,Claude确实深受全球开发者的喜爱。 14. AI圈缺乏专注度已成普遍问题 OpenAI很难“集中力量办大事” 主持人:根据我们之前的对话,你似乎在智识层面上对科学怀有浓厚兴趣。你关于推理的研究,源自你想创造“AI科学家”的长期愿景。当我看到你宣布离开的那条推文时,我就在想,你究竟是会继续留在这场以基础模型为中心的竞赛中,还是会走一条不同的道路。我感觉你可能会进入生物技术领域,或类似的方向,以一种相当不同的方式去追求这个目标。 Jerry Tworek:如果我能克隆自己,去做多种不同的事情,我真的很想那样做。但长话短说,在某些时刻我醒来,会意识到自己对一生中所取得的成就感到相当满足,也感到自豪。 但我现在真正想做的,是押注一两个重大的研究方向,并竭尽全力让它们成功。我认为人们应该愿意承担风险。我是那种愿意尝试疯狂想法、拥有极高风险承受能力的人之一。我觉得我应该把这种能力用在一些有益的事情上。 主持人:把你脑海中的想法真正落地,需要多长时间?这是一个一年的项目吗?还是你所说的“高风险”,需要投入四五年的人生,去追逐一个可能并不比现有技术更好的东西? Jerry Tworek:我绝对愿意投入大量时间。同时,我也认为人们应该快速执行,做事慢并不是值得骄傲的理由。为了在研究项目上执行得好,我希望能尽快做好。 但真正重要的部分,还是我之前提到的:专注和信念。如果你同时做很多不同的事情,就会分散你的注意力,分散你的资源。尽管AI Lab经常说他们受限于计算资源,因此研究变慢了,这也确实是重要的影响因素之一。但很多时候,更常见、更普遍的问题,其实是缺乏专注力。毕竟,你每天能分配的注意力是有限的。 我经常告诉我合作的研究人员:减少实验次数,但要对每一次实验思考得更深入。因为有时候,即便只是花时间,比如几个小时,不运行任何程序,仅仅更仔细地分析实验数据,相比于运行更多实验,反而更容易带来突破。 主持人:像OpenAI这样拥有大量计算资源的机构,其实只是把资源分散在了太多项目上。实际上,如果把这些资源集中到更少的项目中,算力本身是完全足够的。 Jerry Tworek:这又回到了风险承担和信念的问题。如果你同时做三个项目,其中一个成功了,另外两个可能被放弃。如果三个都成功了,那当然非常棒,但如果你只做一个项目,会推进得快得多,因为你可以更加专注,信念也更加坚定。 当然,如果项目最后失败了,麻烦就大了,但如果成功了,就可能拥有世界上最好的模型。 对OpenAI来说,目前要让整个公司集中力量去做一些全新的、完全不同的事情,是有点困难的。要让我们完全不在乎Gemini下个季度会不会有更好的模型,也非常难做到。 这样的事情绝对需要一种特定类型的人,只有这种人才愿意去承担风险。这正是关键所在。 主持人:我知道你不能谈论那些所谓的“秘密配方”。但我还是很好奇,OpenAI正在朝哪个方向发展?或者至少,从宏观上看,他们把资源投向了哪里?最近OpenAI给ChatGPT加广告的消息刷爆了全网。 Jerry Tworek:我不应该、也不能谈论OpenAI的任何计划。 主持人:你觉得,在这些模型公司中,会不会有哪一家有勇气像OpenAI一样加入广告?也许“勇气”这个词并不准确,因为不放广告可能本身就是一个糟糕的决定。广告变现是不是不可避免的? Jerry Tworek:这是一个商业策略问题,而我的工作是训练模型。 15. OpenAI真正擅长的是“1到100” 驱动创新的是“运作方式” 主持人:我并不是想为难你,只是在进行了这次完整的对话之后,我仍然在试图理清一些想法。当你谈到你想要追求的新方向时,你确实需要一定的“马力”。你会自己进行尝试,还是必须身处一个拥有足够“能量”的地方,才能进行你想做的研究? Jerry Tworek:这是我目前正在努力理解的首要问题。每一项AI研究仍然需要GPU,需要算力,我需要考虑什么才是最好的方式。 主持人:这是波兰的机会。他们需要给你一个国家级数据中心。 Jerry Tworek:这个主意或许不错。我还在逐渐理清自己的速录,我知道自己想做哪些类型的研究,也在不断尝试弄清楚,什么才是实现它们的最佳路径。 我不止一次听别人说,你离职后比以前快乐多了。我从一个现在自己创业的人那里听说,在OpenAI工作比创业压力还要更大,这让我非常震惊。OpenAI确实是一个相当有压力的地方。 主持人:最后一个问题,除了大家追逐的东西过于相似之外,你有没有观察到AI领域内其他的重大错误? Jerry Tworek:我不认为存在什么巨大的错误。因为要让所有人都犯下同一个巨大错误,其实很难。我觉得这里只有一个真正的问题:如何在探索和延续原有技术路线之间取得平衡? 主持人:我刚才那个问题可能问得不太好,我更想问的是,在研究界中,是否存在一些你认为被低估了、没有得到世界足够关注的想法? Jerry Tworek:说实话,这样的想法有很多,但它们最需要的,其实只是多一点关注、多一点计算资源,以及多一点为之奋斗的精神。 我觉得有一点比较独特:很多研究人员喜欢做从0到1的工作。很多学术研究正是如此,创造出一些全新的想法,证明它在某种程度上是可行的,然后就把它发表出来。 而我认为,我和我在OpenAI的团队真正擅长的,以及我觉得我们做得非常出色的一点,是把研究从1推进到100,也就是采纳那些不同的、我们以前没有做过、但已经初步被验证的想法,并找出如何让它们在大规模训练前沿模型时,可靠地工作,同时还要整合许多其他相关因素。 这正是大量学术研究所欠缺的东西。概念验证当然很酷,但要用某种特定技术训练出世界上最有能力的模型之一,需要做大量非常具体、细致的工作。如果方法不对,可能需要数年时间,但如果你有合适的算法,知道如何引入这些东西,可能只需要几个月。这正是我未来想多多尝试的事情。 主持人:当我们谈到OpenAI的一些人员离职时,你曾说,公司应该能够承受这些损失。但AI领域在某种程度上似乎一直是由“明星”驱动的,比如Alec Radford这样的明星人物。挖人的行为也是持续不断。 从这些实验室的行为来看,显然这些公司认为AI一个由研究明星驱动的领域。我很好奇你的看法。你刚才似乎对这个问题有些犹豫。行业中既有整个学界、整个领域长期积累的工作,也有一些关键时刻和重大的突破来自极少数个人。 Jerry Tworek:这是一个相当复杂的话题,但我觉得两件事可以同时成立。很多时候,就像你在OpenAI看到的那样,确实是极少数个人产生了超乎寻常的影响,推动了一系列完全开创性的成果,并将其扩散到整个行业。我一次又一次地看到这种情况发生。 但与此同时,每当我看到人们换公司时,我很少看到这对原公司造成真正重大的影响。公司本身的特质,或者说一种近乎“运作方式”的东西,才是真正的研究引擎,而不是某一个特定研究员是否还在这里。 我也观察到,那些在公司之间跳槽的研究员,往往在新环境中并没有那么高效。即使他们过去常常做出伟大的工作,来到新地方后,也可能变得有些分心,需要时间适应环境,或者暂时没有特别新鲜的想法。 当然,在这个领域的经验肯定能带来一些优势,但更重要的是,创造一种个人责任感强、允许探索、能够赋能人们去做大事的氛围。 而且,无论是这批人,还是另一批人,都完全有可能组建出许多能够做出伟大成果的团队。我并不认为某个特定的人是不可替代的。在我看来,良好的研究结构、良好的研究文化、良好的协作方式,远比某个具体的人是否在你的团队中重要得多。
智驾芯片变天,蔚小理“集体”放弃英伟达
记者 花子健 编辑 高宇雷 英伟达的智能驾驶芯片正在被中国汽车公司重新审视。 在1月8日举行的全球新品发布会上,小鹏汽车一口气发布了G6、G7、G9和P7+四个系列新车型,但罕见没有提及英伟达的芯片,全部新车型都搭载了小鹏汽车自研的图灵AI芯片。在小鹏汽车的智能驾驶发展历程中,这是一个具有转折意义的信号,这四款车的上一代车型都使用了英伟达的芯片。 何小鹏在这场发布会上反而说了一句话:“未来全球最好的AI公司,都会选择自研芯片。” 根据36氪汽车的报道,理想汽车也将在L9的重大改款车型中使用自研智能驾驶芯片M100。这款芯片在2025年第一季度回片,进入量产前的关键阶段。理想汽车的自研芯片M100的性能特点包括,运行大语言模型计算任务时,1颗M100能提供的有效算力相当于两颗英伟达Thor-U;处理卷积神经网络相关的传统视觉任务时则可以对标3颗英伟达Thor-U。 在此之前,英伟达是理想汽车重要的合作伙伴之一。一位供应链人士透露,当时理想汽车为了等算力更强的Thor-U,L系列的改款计划一度延期,错失了销量提升的窗口期。 蔚来曾经在一辆车上使用4颗英伟达Orin芯片,因此李斌更能从成本的角度理解自研的必要性,他算过一笔账:“2024年,蔚来从英伟达采购Orin X花销超过3亿美元(约合人民币21.9亿元)。”在蔚来的车型上,4颗Orin芯片是标配,最旗舰的蔚来ET9上,只用了两颗神玑NX9031,等效算力等于8颗英伟达Orin X。 因此,神玑芯片上车可以帮助蔚来实现单车1万元降本,蔚来计划在新款的ET5、ET5T、ES6、EC6上都使用神玑芯片,这意味着全系搭载成为必然。 在造车新势力中,搭载英伟达最先进的智能驾驶芯片是曾经必然的选择。现在,蔚来和小鹏汽车已经加快去英伟达化,理想汽车也按下了启动键。作为2025年销量最高的造车新势力,零跑汽车拥抱高通,完全没有转向英伟达的迹象。造车新势力的另外一极,鸿蒙智行主要的五个“界”品牌和华为与广汽、东风、上汽通用五菱推出的三个“境”品牌与英伟达也不会产生业务往来。 造车新势力的“去英伟达化”产生的影响不可小觑,2025年,蔚来、小鹏汽车、理想汽车的合计销量超过116万辆。随着长安、东风、广汽和上汽与华为、鸿蒙智行合作的扩大,以及智能驾驶下放到入门级车型,这个数字还将继续增加。 2025年是中国智能驾驶的大年,汽车公司的智能驾驶技术路线从“规控”全面转向“端到端”。中国汽车工业协会下属的经济技术信息研究所发布的《2025城市NOA汽车辅助驾驶研究报告》显示,2025年前三个季度,具备L2级功能的乘用车新车销量同比增长21.2%,渗透率已经达到64%。城市NOA(导航辅助驾驶)是L2级辅助驾驶的高级功能,2025年1至11月,国内搭载该功能的乘用车累计销量达321.9万辆,占乘用车上险量的15.1%,较2024年全年提升5.6个百分点。 但英伟达2025年在国内的市场份额出现了下滑。2023年,英伟达凭借一颗Orin在国内占有33.5%的市场份额,并在2024年上升至39%。2025年,英伟达同时提供Orin和Thor两个系列的智能驾驶芯片,但国内的市场份额下降至25%。 核心原因是英伟达Orin的架构已经落后——这款芯片是2019年设计,在2022年量产的。性能更强的Thor面临的问题则是算力缩水,从最初宣称的2000TOPS到实际交付的只有700TOPS,期间还因为功耗过高、散热问题无法解决经历了多次延迟交付。英伟达的做法打乱了理想汽车、小鹏汽车、智己的产品上市节奏,智能驾驶系统的迭代也受到影响。 “大家当时都想不到,英伟达竟然成了供应链中最大的不确定性之一,恰恰这两年又是新车上市比较密集,智驾技术迭代比较快的一个时期,因此,对供应链安全感要求比较高的车企陆续把更多资源倾向自研。”前述接受采访的供应链人士说。 对英伟达而言,短期的市场份额波动产生的影响几乎可以忽略不计。从英伟达2026财年前三个季度的财报可以看出,来自自动驾驶芯片销售的收入占了总收入的大约1%。但可能会影响英伟达在自动驾驶领域的长远规划。 今年CES期间,英伟达在拉斯维加斯发布了一套完整自动驾驶生态体系——Alpamayo,包含开源大模型、全球驾驶数据集与高保真仿真框架。英伟达CEO黄仁勋认为,自动驾驶将是物理AI的第一个大规模应用场景。支撑英伟达这一生态体系的是三台“计算机”,其中就包括自动驾驶芯片为核心的车载推理计算机。 英伟达在中国市场将面临更激烈的竞争。以地平线、华为、Momenta为主的供应商,以蔚来、小鹏和理想为代表的造车新势力,已经具备或正在具备智能驾驶的“软硬一体”全栈交付能力——Momenta也启动了芯片自研。 另外一方面,中国汽车市场在2026年呈现三个特点和趋势:“9系”和“8系”等高端产品将受益于国家补贴和购置税减半征收的政策,逐步释放销量,高端市场的竞争同样趋于白热化,包括鸿蒙智行、蔚来、理想和小鹏在内,都将在高端产品线使用自研芯片;具备城市NOA功能的L2级辅助驾驶功能逐步下放至入门级车型,地平线的征程系列,以及卓驭、元戎启行提供的基于高通骁龙芯片的解决方案兼具性能和性价比;本土品牌和华为的合作进一步扩大,这些品牌可能会进一步减少对英伟达的依赖。
甘肃退伍老兵,抱紧黄仁勋,狂揽上千亿
2025年5月17日,黄仁勋在台北,设宴款待AI供应链核心伙伴。 镁光灯下,围坐他身旁的,皆是台积电董事长魏哲家这样的产业巨擘。然而媒体的镜头,却默契地对准了第三排一个陌生的身影: 这是全场唯一来自大陆的企业家。 全球一哥 那一夜,台湾科技圈都在追问: 他,到底是谁? ▲第三排最左边,即胜宏科技创始人陈涛 谜底数月后揭晓:原来他是胜宏科技董事长陈涛。 英伟达在大陆合作伙伴众多,为何独独他拿到了这张顶级入场券?答案藏在一组冰冷的数据里: 英伟达AI服务器所需PCB,七成来自胜宏。 PCB,即印刷电路板,被誉为电子产品之母,是连接芯片与所有元件的桥梁,更是AI时代的地基。 “如果把电子产品比喻成人体,PCB就是人体的骨骼、经络和血管。” 没有它,再强大的AI芯片也无法连接,电子世界会瞬间瘫痪,整个AI算力大厦也将无从谈起。 全球PCB厂商多如牛毛,胜宏凭什么独占鳌头?因为它手握独门绝技。 AI时代,大量算卡需要在极小面积内集群,过去单层或少层板已经不够用,必须靠20层甚至更多层HDI(高密度互连)板来完成互联。 这门技术,如同走钢丝,不是谁都能做。 而胜宏不但能做出来,还能在短时间快速放量,满足英伟达的爆发式需求,同时质量还稳定可靠。 放眼全球,同时具备这三种能力的厂商,几乎就找不到第二家。 正因为如此,黄仁勋——这个AI时代最有权势的男人,才会在一场重要私宴上,将陈涛邀为座上宾,并亲切称其为自己的: 中国搭子。 这不仅是荣誉,更是通往全球AI供应链核心的通行证。 资本市场心领神会。 过去一年,胜宏科技上演资本神话: 2025年上半年营收90亿元,净利润21亿元,均实现翻倍增长。 股价更如脱缰野马,从40多块最高涨到355元,涨幅超过750%,公司总市值突破2300亿元。 陈涛夫妇身价随之飙升至700亿元。一年前,这个数字仅是130亿。 外界对于这种造富速度叹为观止。 但这位甘肃陇南走出的退伍老兵,最该感谢的,或许是30年前那次命运的转折。 孤注一掷:死磕高难度工艺 1995年的陈涛,还在新疆喀什市二轻局工作。 对于一名退伍老兵,这在当时是一份令人羡慕的铁饭碗。但一次广东出差经历,彻底改变了他的命运。 在那里,陈涛亲眼见到了改革开放前沿阵地热火朝天的景象。回到新疆,他内心再也无法平静。 最终,他毅然南下。 在广东惠州,他进入一家台资PCB厂工作,并主动申请成为一名销售员,由此开启了他的创业传奇。 初为销售员的陈涛,很快展现出他作为一名军人的干练和果敢。 他带领三个业务员一起闯天下,在深圳和惠州两地来回跑,不到两个月便拉回200万元的订单。 由于业绩突出,他迅速被提拔为公司高管。 但心气颇高的陈涛,不甘久居人下。2003年,他纵身一跃,创办胜华电子。 彼时的中国PCB行业,外资盘踞高端,深南、沪电等本土企业疯狂扩产。一个民营小厂想杀出血路,难如登天。 更何况,陈涛当时还是个技术小白。“创业之初,最困难的就是技术。”他坦言。 关键时刻,一股不服输的劲头支撑着他。 为了钻研技术,陈涛买来先进电路板,一层层拆解,抽丝剥茧。同时,自学理论知识,并请教行业专家。 日复一日,这个门外汉,硬生生把自己逼成了专家。 更难能可贵的是,虽然只是一名行业新人,但陈涛从一开始就立志高端。 别人都说他疯了:国内做高端多层板?没戏! 陈涛偏偏不信邪,他不但要做高端,还要做别人不敢做、不愿做、做不好的事情。 为此,他把利润全砸进研发,带着团队在深圳、惠州反复试验埋孔、层压、阻抗控制等高难度工艺。 设备坏了,线报废了,也在所不惜。每一次送样,都像一场豪赌。 ▲来源:羊城晚报 陈涛之所以死磕高难度工艺,是因为他深谙行业底层逻辑: PCB行业属于高端精密制造业,它既有传统制造业的成本、规模属性,也有高科技行业快速迭代的一面。 这个行业随芯片而变,必须不断迭代,攀登技术高峰。 为了加快迭代速度,跟上行业节奏,陈涛甚至在公司创办早期的2006年,就做出一个重要决定: 投资3.5亿港币,在惠州拿下400亩土地,打造第一座大型生产基地。 在此基础上,陈涛创建胜宏科技,正式进军高端PCB市场。为了筹建设资金,他不惜质押了胜华所有股权。 持续的投入,让胜宏一度亏损。 但正是这种孤注一掷,让它的技术不断飞跃,从低端通孔板到8层、16层、24层……为日后AI时代的一骑绝尘,埋下了伏笔。 胜宏速度:可怕的执行力 从2003年到2017年,陈涛和胜宏科技默默积累了十几年技术。 同一时期,竞争对手也没闲着,深南、沪电都在向高端PCB板挺进。但陈涛更早嗅到了产业先机并果断下注。 2017年,全球PCB行业刚经历两年调整,多数企业在增产还是减产之间举棋不定。 陈涛却逆势而上,启动史上最大扩产——斥资十几亿,新建高端产线,主攻新能源汽车和AI。 有人质疑他疯了:汽车电子认证至少两年,AI订单在哪里?这是烧钱玩命! 陈涛不以为然:胜宏赌的不是客户,是未来。 2019年,他再下重注:正式成立HDI(高密度互连)事业部。当对手还在观望,胜宏已全力押注AI未来。 这是胜宏历史上一次关键的战略转型。 AI服务器对PCB要求苛刻:它要能承受上千瓦的功率,支撑几十层信号层、供电层,还得抗高温、防干扰、精度到微米级……普通厂商连图纸都望而生畏。 而胜宏,凭借过去十几年的技术死磕,以及提前两三年对高密度多层板的押注,不断突破6阶24层乃至10阶30层先进技术。 于是,当英伟达放眼全球,为关键产品寻找高端PCB供应商时,发现:只有胜宏等少数厂商能胜任。 比技术领先更可怕的,是胜宏的量产交付能力。 2024年,当AI服务器需求大爆发,大部分厂商还在调试或认证阶段,胜宏已经量产,稳定供货。 这背后,是陈涛雷厉风行的作风。 业界流传一句话:胜宏速度,陈涛节奏。 据媒体报道,2017年大扩产,陈涛为抢时间,设计、桩基、钢结构、机电同步,工地24小时轮班。 他本人常在深夜12点,佩戴安全帽巡场,一旦发现有螺丝未拧紧等情况,立即开罚单并要求整改。 如此,实现从土建完工到设备搬入仅45天,比行业常规速度快一倍。 这同时也是中国PCB行业第一家互联网智慧工厂,极大提升了胜宏的效率、良率和量产交付能力。 胜宏的厉害,在于不但能做出来,还能大规模量产,同时保证高质量、稳定交付。 这一方面得益于智慧工厂实现了半导体级的自动化生产环境,更离不开陈涛近乎变态的军事化管理。 他亲自抓品质,并定下质量红线:宁可多花钱,绝不让次品流出。 在胜宏内部,考核逻辑不是产量第一,而是良率第一,其内部质量管控堪称严苛。 很多员工叫苦不迭,吐槽比军训还狠,但也正是这般严苛,让胜宏通过英伟达审核,并创下98.5%的超高良率,领先全球。 在业界,能做到6阶24层的并非胜宏一家。 但能把产品做出来,同时还能大规模量产交付,并保证质量、良率和交付稳定性的,凤毛麟角。 从这个意义上讲,除了胜宏,英伟达几乎找不到更好的替代供应商。 正因为如此,在那场重要的台北晚宴上,陈涛才能站在黄仁勋身边,与众多产业大佬一起纵论AI天下。 PCB界的任正非 媒体对陈涛的关注,并不仅仅局限在他的真实身份上。 那场晚宴之后,他们详细梳理了陈涛过往的创业经历,并感叹:30年前,台湾才是PCB行业的引领者。 而今,随着胜宏科技等企业的崛起,大陆正取而代之。 在总结胜宏的成功经验时,他们用了两个词:技术赌注和军事化管理。 有人甚至将陈涛比作“PCB界的任正非”,除了相似的管理风格和技术赌注,更因为两人都曾当过兵。 陈涛自己,对于当年的部队生涯,也给予高度评价,他曾感慨:是部队磨炼了我的意志、开阔了我的胸怀,让我敢于去闯关。 这并非虚言。 回望陈涛过去几十年,敢闯、敢打硬仗是他身上最鲜明的特征之一。 当年,他单枪匹马闯惠州,进入一家台资厂。公司原本打算让他搞行政,陈涛却主动请缨到一线当销售。 据媒体披露,1998年亚洲金融危机,工厂被迫裁员三分之一。他不顾风险,逆流而上,去日本客户产线跟线。 风暴过后,他成了厂里唯一能用日语写制程报告的人。 2006年创办胜宏科技时,陈涛在强敌环伺、一穷二白的情况下,就敢于押上所有身家,死磕高难度工艺。 凭借这些积累,十年后,又再次豪赌AI赛道。 很多人说,这得益于陈涛超前的战略眼光。 这一点固然不假,但2017年前后,同样看好AI趋势的并不止陈涛一人,甚至很多同行也跃跃欲试。 但他们大多不见兔子不撒鹰,而陈涛在产业尚未完全落地,就敢于豪赌,并且说干就干,展现出极强的执行力。 不仅如此,他还把军人的纪律精神直接搬到公司管理上,反复强调:军人开拔时没开拔是要枪毙的,企业决定了的要执行,错了再纠错。 这条胜宏铁律,在2017年大扩产中,被展现得淋漓尽致。 陈涛对自己的要求,更是严苛,这个浓眉大眼、英俊挺拔的西北汉子,日常生活中始终保持着高度自律: 每天工作到再晚都要回家,晚上睡得再晚早上都要跑步一个小时,中午雷打不动的拉伸运动半小时。 哪怕再苦再累,也要保持精力充沛、仪表端正。 这种高度的自律,以及极强的执行力,是过去二十年,陈涛和胜宏科技不断克服困难,一步一步走向巅峰的法宝。 2015年,胜宏登陆创业板当天,股价大涨,陈涛身价暴涨。 有机构好奇,问他成功的秘诀,陈涛脱口而出道:“当兵的执行力,就是令行禁止,说干就干。” 上个世纪90年代,17岁的陈涛在新疆茫茫戈壁滩上,练就了铁打的骨骼、雷厉风行的军人精神。 这种精神一直支撑着他勇往前行。 哪怕今天,胜宏已成为英伟达核心供应商,站在时代的风口浪尖上,陈涛依旧不敢有丝毫松懈。 技术一日千里,稍有松懈,便可能被时代抛弃。 从这个意义上讲,属于AI的战场才刚刚开始。而53岁的陈涛,依然战斗在最前线。
周鸿祎:2026年全世界至少会出现100亿个智能体 百亿级公司在AI领域都算小公司
快科技1月24日消息,360集团创始人周鸿祎近日现身2026崇礼论坛并发表演讲。 开场后,周鸿祎便以幽默口吻调侃“我来太舞小镇和大家目的一样,主要是来滑雪的,另外我也希望能在这实现一个梦想,我滑雪很多年了,但水平一直很一般,希望能学会上下身分离的技巧。” 谈及AI行业发展趋势,周鸿祎梳理出清晰的进化脉络:2024年是大模型的追逐热潮,2025年大模型完成向智能体的转型升级,而到了 2026年,全球智能体数量或将突破百亿大关,届时在AI领域,百亿级公司都只能算作小公司。 他进一步阐述称,此前的大模型大多停留在聊天机器人阶段,难以承担实际业务;唯有升级为智能体,才能真正在各行各业实现落地应用。 针对行业内的认知误区,周鸿祎直言,2024至2025年,很多人混淆了训练算力与推理算力的概念。 他指出,训练算力需求巨大,是少数头部企业的 “专属赛道”;而绝大多数普通人与普通公司,真正需要的其实是推理算力。 二者的算力消耗差距悬殊:日常与大模型聊天,即便每天发送2万字内容,每月的token消耗量也仅为数万; 但如果让智能体完成一部短剧制作、或是开展一堂专业业务授课,所需的算力投入将达到百万甚至千万级别。 周鸿祎还强调,业界普遍存在一种误解,认为只有研发大模型、制造芯片才算得上AI领域的核心角色。 诚然,这些技术研发至关重要,但要推动AI真正走进企业、融入行业,打造智能体才是关键环节,而这一过程中的主角,实则是垂直领域的业务专家与行业专家。 他解释道,每个企业都蕴藏着大量隐性知识与 “潜规则”,比如岗位的特殊要求、业务流程的专属规范等。 这些知识往往储存在老员工或企业管理者的经验中,部分专业技术更是企业的核心机密。 若将这类知识用于通用大模型训练,极易造成核心秘诀泄露;其最佳用途,是用来训练专属智能体。 在周鸿祎看来,谁能率先将这些隐性知识转化为智能体的学习素材,谁就能抢占AI发展的核心红利。
雷蛇CEO谈玩家反AI情绪:6亿美元投资难消玩家不满
IT之家 1 月 24 日消息,雷蛇 CEO 陈民亮(Min-Liang Tan)本周(1 月 19 日)出席 The Verge 旗下视频播客节目《Decoder》,谈及当今游戏圈内玩家普遍存在的“反 AI 情绪”。 陈民亮透露,雷蛇已经在 AI 技术上投入了将近 6 亿美元(IT之家注:现汇率约合 41.86 亿元人民币),但玩家仍然对生成式 AI 的垃圾内容感到不满。在这种情况下,AI 更应该作为开发者的辅助工具,帮助他们打造更好的游戏。 他还在采访中进一步解释了玩家与公司之间的认识落差,并直言不讳地表示: 所以我觉得问题在于:我们到底对什么不满意。请注意,我这里说的“我们”指的是所有游戏玩家。反正我认为大家不满意的点集中于生成式 AI 产出的垃圾内容,我个人不喜欢,玩家们也不喜欢。 作为一名玩家,我希望在游戏中获得投入感、沉浸感和竞争感。我不想看到角色多出几根手指,或者剧情写得一塌糊涂之类的情况。我和大家都站在同一阵线,讨厌那些只靠几个提示词就批量生产出来的低质量 AI 内容。 他随后补充道:“我们并不反对那些能够支持开发者、帮他们做出优秀游戏的工具,雷蛇也在探索这点。如果 AI 工具能帮开发者更快、更好地测试和找出 Bug,那我相信大家都会拍手叫好。如果它还能检查拼写错误、完善细节,让游戏变得更好,我想所有玩家都会乐见其成”。 最后,陈民亮将雷蛇这 6 亿美元的投资形容成一场押注,他认为这能胜过当前市场炒作以及玩家对 AI 的反感情绪。目前公司已经计划招聘 150 名 AI 工程师,推动一系列带有品牌特色的 AI 功能落地。
不存在“就业末日”,高盛CEO否认AI会使劳动力市场萎缩
IT之家 1 月 24 日消息,当地时间 1 月 23 日,据《财富》报道,在 AI 可能引发“无就业增长”担忧加剧之际,高盛董事长兼 CEO 大卫 · 所罗门对“就业末日论”作出明确反驳:尽管 AI 基础设施投资正迎来大规模热潮,但劳动力市场并未走向灾难,也不存在 AI 引发的“就业噩梦”。 所罗门说,自己“不属于就业末日那一派”,并不认同这轮技术浪潮会对人类就业构成根本性威胁。相比近期经济增长表现,劳动力市场确实显得有些脆弱,不过这种现象更像是长期以来“创造性破坏”的正常过程,而非结构性的新危机。 所罗门表示,技术几十年来一直在改变工作方式,既会淘汰岗位,也会迫使经济体不断创造新岗位,“这一次并无不同”。 他强调,高盛引入 AI 的目标并不是减少员工数量,而是扩大业务能力。如果推进得当,AI 并不会显著降低高盛的用工规模,相反,效率提升将带来过去受限的增长投资空间。 不过,所罗门也承认,转型并不容易。员工往往愿意采用能让自己“更聪明”的生产力工具,但要彻底重塑像 KYC(IT之家注:了解你的客户)这样的传统流程,难度要大得多。在大型企业中推动流程变革是一项艰巨工作,需要时间,并且涉及对人力结构的深层调整。 所罗门预计,资本投资仍会继续加速,但企业是否能像市场所期待的那样迅速消化算力、快速完成落地,2026 年可能会出现调整。到 2026 年的某个阶段,市场或许会逐渐意识到,企业部署 AI 比最初想象的更复杂,因此推进速度可能会“比目前人们认为的更慢”。
GitHub都没用明白,怎么用AI编程从零开发应用
编注:我们会不定期挑选 Matrix 的优质文章,展示来自用户的最真实的体验和观点。 文章代表作者个人观点,少数派仅对标题和排版略作修改。 人生中的第一个独立开发的 APP 终于通过审核了,这篇文章的重心不在应用推介,更多是记录我作为一名运营独自一人开发应用上架的完整历程。年纪大了,如果当下的感受没有被及时记录,很容易会被时间冲淡。 文章不会涉及到太多专业术语露出,无论你对 AI 编程是否感兴趣,都可以把它当个有趣的故事看下去。 ▍前言 我貌似一直对写应用 / 做产品有一种执念,尽管我连 GitHub 怎么用都一头雾水。 2014 年,因为经常要写 APP 推荐文的原因,为了丰富截图美观度,联合少数派的 Android 开发小哥倒腾了个【带壳截图】。当时的我,负责的只是想法、素材设计和宣传推广,没有参与过半行代码的编写。 2023 年,当时部门被公司一锅端,突然失业的我申领失业金频繁受挫,靠着每天把免费版 GPT 额度用完,很是艰难地倒腾了个如何申领失业金的微信小程序。这是我自己第一个手搓代码的的产品,这阶段的我开始掌握了「如何插入广告代码」这一核心技能。 2025~2026 年,因为工作缘故要经常输出鸿蒙相关的内容,我先是做了个缓解鸿蒙升级阵痛的小程序,后来在 Gemini 的帮助下,我正式提交了人生中第一款独立开发的 APP,一个能联网的、打通服务端和前端的、有实际功能的、不再是静态页封装的应用。 所幸每一个阶段的产品,我都在少数派写过文章,留下过印记。 ▍使用 AI 编程的挑战 😵‍💫 自我设限 早在去年鸿蒙推出开发者激励计划的时候,老麦就问过我能不能倒腾个鸿蒙应用,我说这超出了我的能力范畴。其实彼时的我已经写过好几个小程序了,然而在我的固有认知里,小程序和 APP 开发的区别应该比美图秀秀和 PS 还要大...... 加上现在鸿蒙编译工具和原生开发语言才推出市场没多久,可能 AI 都没有收集到足够的数据来应对。 事实证明一切都是借口,真正实践起来,我这个 GitHub 都用不明白的家伙,从 12 月 30 日配置到鸿蒙开发环境,到 1 月 5 号正式动工,最后 1 月 10 日提交审核,减去中间的元旦假期和周末,整个开发周期差不多就一个星期左右。 挣脱了思想的牢笼后,一切就豁然开朗了。 🌐 网络环境 无论是 Gemini、ChatGPT,还是其他更进阶的 AI 编程服务,对网络和地区的要求都是极高的。网络的波动,经常会导致「地区限制、IP 污染」等拒绝访问的情况发生,哪怕能顺利进入,也会有一定概率只能新建聊天但无加载历史对话。 付钱也是个大问题,搞定了网络,也舍得每个月掏出 20 美元甚至更高的费用去订阅,但如果没有一张境外发行的银行卡或海外账户,那么大概率无法完成关键的付款操作。 💻 技术门槛 社交媒体上铺天盖地的都是「不懂代码也能编程」的帖子和教程,但目前市面上一些主流的 AI 编程工具其实都是需要使用者具备一定专业技能的,强如 Cursor 一打开就让我关联 GitHub 的代码仓库,单就这一步就直接难倒我了。 同时,零代码基础,意味着你无法判断 AI 输出的方案优劣 / 对错 / 是否最优解,AI 会偷懒、会造假、会胡说八道、会消极怠工...... 没有专业能力去支撑你的判断与决策,一旦涉及关键模块的改动,轻则影响项目进度,重则前功尽弃,推倒重来。 ✅ 备案和审核 从 2025 年开始,所有联网的应用都需要进行 APP 备案。从服务器和域名,再到 APP 备案,兜兜转转搞了差不多 1 个月才搞定,所幸只是耗时长,过程并不复杂。 来到核心的应用审核环节,由于之前提交审核的版本功能实在过于简单被驳回,让我下定心思真正做一个有实际功能用途的 APP。于是乎,我拾起了 10 年前的带壳截图项目,因为应用名称已经备案了,所以我还是沿用【NEXT 升级站】这个名称,在截图带壳的基础上,新增了图层顺序调整、设备素材云端下载与更新、添加贴纸、设备形态切换等功能。 1 月 10 日,我将重新构造的 NEXT 升级站提交到鸿蒙应用商店;1 月 16 日,经过了多次沟通和调整之后,NEXT 升级站终于顺利通过审核,正式登陆鸿蒙平台。得知应用审核通过的瞬间心情还是非常激动的,毕竟花了这么多心思去打造,肯定是想让它呈现在公众面前,供有需求的人去使用。 ▍与 Gemini 的角色分工 因为 Chat 形态的 Gemini 不能直接操作项目,所以从配置环境的安装到最后的签名打包,涉及到开发环节的每一步,全都是 Gemini 输出文字指引,我来进行操作。虽然是原始了点,但一步一脚印,也不算是一件坏事。在这个鸿蒙应用开发项目里,我主要扮演产品经理和交付验收专员的角色,Gemini 则负责以下工作: 产品项目 / 需求评估 解决方案输出 100% 代码编写 问题定位与修复 LOGO 初稿输出与绘制教程 机型素材整理方案输出 快速生成图片配置文档 我不太清楚近期火热的 Vibe Coding 能否全自动地完成项目的代码编写和程序编译,因为我没真正使用过,一来是文章开篇提及到的网络问题,二来也是我自身专业度不足以支撑的问题,当然最主要的还是自我设限,认为自己驾驭不到。 有机会尝试的话,再给各位输出一篇关于 Vibe Coding 的体验文章。 🧑‍💻 擅长开新坑 Gemini 的靠谱程度,很大程度取决于你是「开新坑」还是「优化屎山代码」。如果是「开新坑」,决策准、速度快、效率高、完成度高,会是我对它的评价;一般这种情况下的需求指令都不会特别清晰或具体,这时候的它有足够的发挥空间。 一个具体的例子,10 月初我想把初始版本的【NEXT 升级站】小程序想快速移植为鸿蒙应用,专门请教了公司的开发同事,询问一下这件事情在技术层面的可行性,得到的结论是不行,斩钉截铁的不行。 随后,我将这个具体的想法交代给 Gemini 后,它给出的答案也是不行,但同时提出了另一种解决方案:因为我的产品架构很简单(本地搭好页面框架,从腾讯云读取数据),无需转译,直接用鸿蒙原生开发工具写一个更简单。 然后,它就手把手教我从如何安装配置鸿蒙开发环境、如何配置页面、如何调用组件、如何读取数据、如何解决编译报错、如何真机调试等等。因为我小程序已经写好了逻辑,所以它列了几个关键的 js 文件让我发过去,它就能复用对应页面的数据读取、字段展示、排序逻辑、元素布局等。 效果非常惊人,花了 1 天的下班时间,我就已经完成从搭建鸿蒙开发环境到输出 Demo 能在真机安装运行了。虽然一开始 Gemini 并没有告诉我 Beta 版编译工具签名的 APP 无法提交审核,但那是后话了...... 😵‍💫 优化能力不详,像鬼打墙 但场景一旦切换到「具体功能优化、Bug 修复」时,当需求越具体,它就会变得越固执、越短视、喜欢钻牛角尖、重复造轮子、简单的事情复杂化: 能调用系统图标的它偏要自己画; 在正常编译的云服务配置文档新增一个字段读取处理,它偏不按那个版本结构逻辑去写,硬是要自己优化,结果每个自作聪明优化的代码版本都不能编译; 我说哪个功能上有问题,它就只是把这个问题修复好,全然不告诉我它为了修复这个问题,偷偷把其他能正常运行的功能删了,把数据读取逻辑从服务器端改成了本地虚拟数据...... 诸如此类各种数不尽的骚操作,逐渐倒逼着我自己去管控整个项目走向。慢慢地,我这个毫无感情的代码复制粘贴机器,也开始系统性地判断 Gemini 输出的技术方案思路是不是可行的,给出的方案有哪些考虑不周到的地方,存在哪些风险,需要做哪些准备工作,备份哪些关键文件,实施过程中可能会发生的问题以及应对方案等: 比如在进行一些关键页面/功能的修改时,是不是可以创建一个隔离环境,先验证功能可行性,再合并到正式页面里等; 又比如在复制粘贴代码的时候会多留一个心眼,观察代码量变化,很多时候往往只是修改一个极小的细节问题,但输出的完整代码量和上一个版本竟然相差 200 多行,我就知道它又开始偷懒了。 见证我踩坑与进化的,是每次下达精准修改需求时越来越长的注意事项: 必须精准修改,不要动已有的功能布局与逻辑,尤其是不要自作聪明覆盖本地数据和功能 ,不要悄默默的删掉功能,你这是惯犯 输出方案之前,要严格关联上下文,涉及到需要验证的解决方案,必须要在最小单元内测试是否有效,再全面推广 优先使用系统组件、遵从鸿蒙设计/开发规范,不要简单的问题复杂化 涉及到需要修改的页面,需要输出完整代码,减少手动操作带来的误操作 不要偷懒,不要在不告知我的情况输出精简 DEMO 来替代我现有的功能界面和布局 一步步详细的列明每一个操作步骤,不要精简和省略,包括需要修改的文件具体路径,尤其是涉及到一些不可逆或容易误操作的地方,要特别标注出来 需要涉及需要在本地新增素材或引用云端字段/系统能力,要和我提前说,并告知具体的文件存放位置和作用,减少因为「资源缺/对不上」造成的编译错误,尽量做到每一次输出的方案都是不报错的; 输出方案的时候要明确说明思路、方向、修改了什么,可能会发生的问题,以及应对思路...... 背后的心酸,只有我和 Gemini 才能知晓。 虽然开发环节总是会出现这样那样的问题,但在整个应用构建过程,我始终保持着非常激动甚至亢奋的心情。关键的转变在于我从某个环节的螺丝钉变成了整个链条的掌舵手,提出想法的是我,需求评估的是我,原型设计的是我,敲定技术实现方案的是我,字段配置、代码编译、功能验收、BUG 修复、功能迭代的还都是我...... 每天结束代码编译工作时,我都会和 Gemini 复盘一下今日的成果、踩过的坑、明天的计划、以及突然冒出来的鬼点子。看着应用从最初的原型图,到一步步完善,最后成为能在真机运行的应用,成就感可以用爆棚来形容。 ▍主角登场:NEXT 升级站 🌠 聚焦截图编辑与创作 铺垫了这么久,是时候要请出主角了。NEXT 升级站聚焦于截图编辑与创作,支持带壳截图、快速切换设备形态、添加贴纸、云端更新素材库等。应用支持联网更新,即使不更新应用,也能获取到最新的设备素材与贴纸。 在产品架构设计阶段,应用内几乎每个环节我都加上了支持运营控制的字段与配置入口。除了机型素材和贴纸中心,还包括创作页背景、机型默认壁纸,甚至连遮罩颜色和透明度等,都可以在云端直接修改更新。节假日定期换个应景的素材,或和其他应用联名搞搞活动,是我作为一名老运营的职业习惯。 核心的截图创作页上,我将「机型系列」作为一个最小单位,一个单元内对应多个 SKU,下载对应素材后,可以左右切换更换同系列的姐妹机型与颜色。如果是涉及到折叠屏这种多形态变化的产品,同样可以通过左右切换,快速更换设备形态。 同时,「贴纸中心」的加入,大大丰富了截图的可玩性,这也是 NEXT 升级站区别于同类应用的一大特色功能。支持图层顺序调整带来了无限大的拓展空间:除了常规的表情贴纸,它可以是画布壁纸,还可以是契合产品的具体使用场景、更可以是模特手持的特写海报。 😢 一些遗憾 由于贴纸引入了图层概念,所以正常情况下只需新增一个图层字段或贴纸类型,就可以实现「图片背景」这一功能了,写好逻辑本地处理,当检测到图层字段等于 0 时,图片自动置底且铺满画框。道理是这个道理,但可惜,目前我的水平无法支撑这个需求的实现;不仅没有实现,还出现了同一个素材从创作页添加是正常的,但从贴纸中心添加就不能显示的奇特 Bug,折腾了好久才恢复到原样来。 此外,在原本的产品规划里,我是打算将 Navigation bar 和 tabBar 统一都设置为半透明的毛玻璃效果,让壁纸能够完整铺满整个屏幕,体验更加沉浸。但这涉及到全局组件的改动,加上当时风险管理意识不足,一番操作下来,布局全乱,软件元素和系统安全区叠加在一起,越改越乱,最后不得不代码回滚。 这也是这个版本里为数不多的遗憾。 🎨 图标绘制 我对图标尤为看重,7 天的开发周期,图标绘制就占了我整整一天的时间,可见重视程度之高。我希望 NEXT 的图标是有质感的、且符合应用使用场景的,发了几个我想要的效果素材给 Nano Banana Pro,结果输出的第一个方案里就有对胃口的版本,这让我极其欣喜。 我完整阐述一下我的图标绘制操作和思路: 在 Gemini 工具栏里选择「生成图片」,输出详细设计需求并附上参考图,让它出 n 个方案; 从中选择合心意的版本,进行细致修改; 确定最终方案后,让 Gemini 输出 Figma 绘制教程; 根据教程重绘矢量图标。 为什么要重绘图标? 我个人不太建议直接使用 AI 输出的图片作为图标。 一来是 Gemini 无法输出透明背景的 png,虽然市面上大把移除图片背景的工具和插件,但移除背景这个动作本身就会对图片质量本身产生较大影响,如边缘锯齿、阴影裁切、残留白边等; 二来应用图标在软件项目构造里并不是一张单纯的圆角矩形图,它是由一张透明背景的主体图 + 一张保留直角的背景图组成的; 三是考虑到 AI 输出的图片可能存在的版权归属问题,以及后续图标的拓展延伸(如面向付费用户提供多种图标切换、应用周边制作、品牌宣传露出等),几乎每个场景都需要你有「源文件」在手,而不仅仅只是一张 AI 提供的固定分辨率、放大会有锯齿的位图; 所以让 AI 输出方案 + 重绘修改,会是一个相对稳健且方便后续运营拓展的方案。哪怕你是设计新手也不要紧,目前主流的 AI 基本上可以做到专属教程产出,发一张图片过去,询问如何在 Photoshop 或 Figma 上绘制出一模一样的效果,它就会输出详尽的教程,包含每个图层需要叠加的效果参数、渐变色值等。 当然,图标重绘并不意味着百分百的还原 AI 稿,更多是根据实际情况进行风格和元素的调整,毕竟是手把手操作,灵活度上还是要比输入关键词指令更精准一些。我对这个工作流输出的图标成品很是满意。 📖 名字来源和背后故事 介绍完应用功能和图标,我想展开聊聊 NEXT 升级站名字的来源和背后的功能变更。 故事的开始是去年我主力使用的华为设备升级到鸿蒙 5,在日常使用中或多或少都会有一些困扰与不习惯,于是我针对常见痛点梳理了解决方案,拾起老本行做了个微信小程序承载。想着解决他人问题之余还能靠流量主赚点广告费,没成想鸿蒙版的微信小程序并不支持加载流量主广告 😂 路径依赖失效了~ 但每个月 19.99 的腾讯云套餐是无论如何都节省不了的支出,怎么样才能把这 19.99 用回本成为了我的新课题。既然腾讯云能被小程序调用,是不是也能被第三方网站或 APP 调用?我向 Gemini 提出了这个问题,得到了肯定的答复,随后我就搞了个页面,通过云函数将小程序的内容同步展示到网页来。不过这个页面更多是技术验证,并没对外开放访问。 小程序有了,引流页面也有了,作为一个面向鸿蒙用户提供解决方案的产品,没有鸿蒙原生应用似乎说不过去。刚开始我是打算通过「小程序转译」的方式去实现,结果 Gemini 告诉我直接原生编译工具写更简单。接下来的故事前文也提及过了,初始版本的应用多次被驳回,一是联网应用没备案,二是功能实在太过简单。 应用审核被驳回,但耗时一个月的应用备案下来了,秉持着备案不能白白浪费的原则,我又硬着头皮搞了如今以截图编辑与创作为核心的【NEXT 升级站】并成功上架,也算是给 10 年前的【带壳截图】一次秽土重生的机会。 所以现在的 NEXT 升级站处在一个非常神奇的阶段,同一个名字在不同渠道是两个完全不同形态的存在。在微信小程序里,它是提供各种常见问题解决方案的实用工具箱;在鸿蒙原生应用里,它是可以实现以带壳截图为核心的截图创作工具。至于后面究竟是逐渐融合还是单独区分,就有待后续故事的发展了,现在的我也说不准。 回顾 NEXT 升级站每一次的更迭,基本上都是脑海里的灵光一闪在稍纵即逝之际被 Gemini 及时验证可行性并给出实施方案,我才得以踏出下一步的。我认为这是 AI 存在最大的价值,通过 AI 快速验证各种天马行空想法的可行性,并以最低成本踏出第一步,只要出发了,距离终点就不远了。 💰 开发费用 我来简单盘点一下本次开发全链路的所需费用。 腾讯云:¥19.9/月 服务器:¥69/年 域名:¥33/年 以一年时间为例,最基础的费用支出是 340.8 元。当然,实际上远不止这个价格, 正常情况下 Gemini 应该是最费钱的一项。 ▍写在最后 这是 2026 年我送给自己的新年礼物,突破一个运营原定能力边界的礼物。 简单评价一下这个开发周期只有 7 天的应用,我认为功能完成度是大大超出我预期的。代码质量我不好评价,后续版本维护上我也比较担忧,但在产品架构、功能完善度、可玩性上,我有信心,NEXT 升级站起码是合格的,甚至是超过平均水平线的。 当然,初个版本还是有很多不足的地方,受限于技术水平与人力原因,很多东西距离「尽善尽美」还有很长一段距离,不过大框架搭好了,素材也能支持云端更新,后续保持一定的频率更新,问题也不大。 我还蛮享受这种独立开发的过程,当一个深夜在脑海浮现出来的想法,隔日就能亲手实现的时候,那种心情还是难以言喻的。无需说服别人,也不用依赖谁来实现,想到了就去做,有种坐了几年副驾驶终于考上驾照,能够自由掌握方向盘的快感。 洋洋洒洒写了太多字,感谢你的收看,全文完。
TikTok成立美国合资公司 CEO周受资员工信曝光
周受资 凤凰网科技讯 北京时间1月24日,TikTok宣布成立美国数据安全合资公司。据《商业内幕》报道,TikTok CEO周受资周四向美国员工发送了一份备忘录,庆祝这一“好消息”,并感谢大家展现出的“韧性”。 周受资同时宣布,“目前已有超过2亿美国人来到TikTok,在更广泛的全球社区中娱乐、学习,并发展他们的业务”。 《商业内幕》认为,新合资公司对TikTok及其母公司字节跳动而言是一次重大胜利,这意味着它们能够继续在美国运营,且无需切断美国用户与世界其他地区的连接。该安排对TikTok新美国投资者同样意味着胜利,因为他们能够借此入股高速发展的TikTok。 以下是周受资的备忘录全文: 我很高兴向大家通报一则好消息。 根据特朗普总统2025年9月25日签署的行政命令,TikTok美国数据安全合资有限责任公司今日正式成立,这使我们的美国用户能够继续作为TikTok充满活力的全球社区和体验的一部分,继续发现内容、进行创作并蓬勃发展。 在公司迈出这一重要一步之际,我也自豪地与大家分享:目前已有超过2亿美国人来到TikTok,在更广泛的全球社区中娱乐、学习,并发展自己的业务。我们衷心感谢用户给予的非凡支持,也感激全体员工坚定的奉献精神和韧性,这让我们能够持续提供优质服务。 TikTok在美国市场的稳步增长,为该合资公司未来的成功奠定了坚实基础。这家由美国资本占多数的合资公司将在一系列明确的保障措施下运营,通过全面的数据保护、算法安全、内容审核以及为美国用户提供的软件保障,保护美国国家安全。合资公司将由亚当·普雷瑟(Adam Presser)领导。鉴于他在领导TikTok信任与安全、运营领域大型团队方面的出色成绩,合资公司董事会已于今日正式任命他担任这一职务。 产品互通性,对于保障用户和创作者继续享受他们熟知且喜爱的全球化体验至关重要,同时也是750万家美国企业通过触达全球客户继续在TikTok蓬勃发展的关键。为确保持续为用户提供无缝体验,我们新设立了包括“TT商业与全球服务有限责任公司”在内的多家子公司,专门负责管理全球产品互通性以及电商、广告、营销等商业活动。 目前为止,我们已为全体TikTok员工提供了合规培训。未来在与新成立的美国数据安全合资公司合作时,我希望大家继续严格遵守数据隐私、内容保障、代码合规以及信任与安全规范。 感谢大家日复一日的不懈努力,持续践行我们“激发创造,带来愉悦”的使命。 周受资 (作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。