行业分类:
加载中...
头条分类:
加载中...
仍有谈判窗口?伊朗外长将再次访巴 特朗普:想谈直接打电话
  当地时间25日,伊朗外长阿拉格齐率领的代表团结束对巴基斯坦的访问。随后,特朗普宣布取消美国代表原定访问巴基斯坦的行程。   伊朗代表团现已抵达阿曼,消息称,阿拉格齐在结束对阿曼的访问并在前往俄罗斯之前,计划再次访问巴基斯坦。   一位伊朗外交官员表示,伊朗与美国代表团可能在未来几天举行第二轮谈判。   伊朗外长将再次访问巴基斯坦   当地时间25日,由伊朗外长阿拉格齐率领的代表团结束对巴基斯坦的访问,并于25日晚间抵达阿曼。在巴基斯坦访问期间,伊朗代表团分别同巴基斯坦总理夏巴兹和巴基斯坦陆军参谋长穆尼尔举行会谈。   △伊朗代表团与巴基斯坦总理夏巴兹举行会谈   在与夏巴兹的会谈中,双方讨论了各领域双边关系与合作以及地区和国际形势。阿拉格齐再次阐明伊朗有关停火和彻底结束战事的原则立场。   在与穆尼尔的会谈中,双方讨论了有关美以伊停火和结束战事的最新进展等。阿拉格齐赞赏巴政府为促成停火和结束战事作出的努力,并阐述了伊朗在此问题上的立场和考量。穆尼尔表示巴基斯坦将继续进行斡旋,直至取得最终成果。   阿拉格齐25日在社交媒体上发文称,本次访巴成果丰硕。他还表示,对美国是否真心实意地接受外交斡旋,还有待观察。   阿曼是伊方代表团此次出访的第二站,其间伊朗代表团将与阿曼高级官员会面,就双边关系和地区局势交换意见。总台记者从伊朗方面获悉,阿拉格齐在结束对阿曼的访问并在前往俄罗斯之前,计划再次访问巴基斯坦。据了解,随行的部分伊朗代表团成员目前已返回德黑兰,就相关问题进行进一步请示与协调,并计划于26日重新在伊斯兰堡与阿拉格齐会合。   特朗普宣布取消美方代表赴巴行程   △美国总统特朗普在社媒发帖   在伊朗代表团结束对巴基斯坦的访问之后,美国总统特朗普25日在社交媒体上宣布,他取消了美方代表前往巴基斯坦首都伊斯兰堡“与伊朗方面会晤”的行程。   特朗普表示,前往巴基斯坦的行程将“浪费太多时间在旅途上”,并称伊朗领导层存在“内部纷争和混乱”。他还表示,美方“掌握着所有筹码”,伊朗如果想谈,“直接致电即可”。 当被媒体问及取消美方代表访问行程是否意味着美国将恢复对伊朗的军事行动时,特朗普表示否认,称美方还没有考虑过这一问题。   阿拉格齐率领的伊朗代表团24日抵达巴基斯坦进行访问。美国白宫方面同一天证实美国总统特使威特科夫等人将于25日启程赴巴。   美伊可能在未来几天举行第二轮谈判   总台记者获悉,当地时间25日,一位伊朗外交官员表示,伊朗与美国代表团可能在未来几天举行第二轮谈判。据了解,伊朗方面已向美方传递信息,要求美国总统特朗普减少带有威胁性的言论,并表示若美方立场趋于缓和,伊朗国内强硬派将更有可能对参与谈判持支持态度。   △伊朗总统佩泽希齐扬(资料图)   25日,伊朗总统佩泽希齐扬在与巴基斯坦总理夏巴兹的通话中表示,伊朗不会在压力、威胁和封锁下进行谈判。   另据巴基斯坦官方消息人士透露,与第一轮谈判相比,伊朗现在的立场更加强硬,强调任何结束战争的方案都必须按照伊朗的条件执行,而不是按照美国总统特朗普提出的条件执行。   伊朗强调管控霍尔木兹海峡   美称将继续封锁进出伊港口船只   据美国方面消息,霍尔木兹海峡25日的船只通行量仍明显低于冲突爆发前的水平,仅有3艘船只通过海峡。目前尚不清楚美国对伊朗海上交通的封锁是否会对这些船只接下来的航行造成影响。   25日,伊朗伊斯兰议会一名议员称,伊朗已就管理霍尔木兹海峡形成一个综合方案,在该区域内航行的船舶和舰艇必须获得伊朗的许可。霍尔木兹海峡的主权将完全掌握在伊朗手中。此外,被伊朗认定为敌对国家的船只不得通过霍尔木兹海峡,以色列船只被绝对禁止通过该区域。该议员透露,该方案已提交伊朗伊斯兰议会国家安全委员会,一旦议会全体会议恢复,该方案将在全体会议上进行审议。该方案也可能通过最高国家安全委员会批准并发布。   同日,美国中央司令部发布声明称,美国海军“平克尼”号导弹驱逐舰当天在阿拉伯海出动武装直升机拦截一艘商船,该商船随后遵照美军指示并在美军舰护送下返回伊朗。声明还表示,美军将继续对进出伊朗港口的船只实施全面封锁。自封锁开始以来,已有37艘船只被迫改道。   伊朗武装力量密集发表强硬声明   最高领袖敦促周边海湾国家认清形势   25日,伊朗伊斯兰革命卫队、伊朗武装部队与伊朗国防部分别就当前局势发表声明,共同强调伊朗将继续推进对霍尔木兹海峡的“管理与控制”。   此外,革命卫队称,伊朗国土防御力量已在各条战线和各级情报体系中做好充分准备。声明表示,在本轮冲突中,美国在中东地区的军事基地遭到“毁灭性打击”,美军唯一的出路就是迅速无条件地撤出该地区;伊朗武装部队称,如果美军继续在地区内实施封锁、抢劫及海盗行为,必将面临伊朗武装力量的强力反击;伊朗国防部发言人表示,敌人正试图体面地从其深陷的战争泥潭中逃离,他们摧毁伊朗导弹和军事力量的企图已完全失败。   △穆杰塔巴·哈梅内伊(资料图)   25日,伊朗最高领袖穆杰塔巴·哈梅内伊通过社交媒体发文,敦促周边海湾国家认清形势,作出正确判断,并对“邪恶势力”的“虚假承诺”保持警惕。穆杰塔巴表示,伊朗正期待海湾国家作出适当回应,以展现彼此之间的兄弟情谊与善意。但他同时强调,只有在有关国家摆脱“邪恶势力”的情况下,这一切才有可能发生。   总监制丨唐怡   制片人丨赵新宇   主编丨崔翀   编辑丨刘微   记者丨李健南 赵远方 吴汉婴 姚瑞昕 张玥
东方甄选四大主播集中离职!俞敏洪回应
近日,东方甄选发生大规模主播人事变动,旗下明明、天权、中灿、林林四位人气主播相继宣布离职,引发行业及网友广泛关注。 这也是继董宇辉、顿顿等头部主播离开后,东方甄选主播团队再次出现的集中人员流动。 4月24日晚间,东方甄选官方发布人事公告,确认主播明明、天权离职。官方表示,新东方创始人俞敏洪已对二人进行诚挚挽留,最终尊重其个人职业选择。 4月25日,主播中灿、林林先后发布告别内容,正式确认离开东方甄选,至此四位主播全部完成官宣离职。 据四位主播公开表述,此次离职并非薪资问题,核心原因是近四个月公司管理层调整后,企业管理模式、团队氛围发生较大变化。新管理团队推行标准化、军事化管理,对直播时段、流量资源、工作制度进行大幅调整,严苛的管理模式让主播产生工作内耗与适配问题,价值理念与平台现阶段发展风格难以契合,最终选择离职。 针对此次集体离职事件,俞敏洪在4月25日直播中两次公开回应。 他表示,已与四位主播进行深度、诚挚的沟通挽留,同时对接管理团队开展双向沟通,尽力留存核心人才。对于此次人事变动给用户、粉丝及团队带来的困扰,俞敏洪公开致歉,并表示四位主播均为陪伴平台成长的优秀员工,他们的离开是平台的损失。 俞敏洪强调,公司充分尊重主播的个人职业规划与选择,同时将针对此次事件全面复盘内部管理问题。他坦言,管理层调整后,公司管理方式出现偏差,过度侧重制度管控,忽视团队人文关怀,导致团队氛围出现问题。后续东方甄选将优化管理模式,平衡制度化运营与人文关怀,整改僵化、高压的管理问题。 此外,俞敏洪明确表示,本次核心主播离职不会影响东方甄选日常运营、产品供应链及用户服务体系,平台将持续正常开展直播业务。 据了解,此次人事风波的背景为2025年12月东方甄选管理层调整,孙进出任东方甄选执行总裁后,平台全面推进“去主播化”改革,弱化头部主播个人IP影响力,推行标准化、规模化运营管理,以此降低平台对核心主播的依赖。
小米雷军:VGT项目就是不考虑量产,放开所有约束,大胆想象
IT之家 4 月 26 日消息,2026 北京车展 4 月 24 日开幕,小米 Vision Gran Turismo 超跑迎来国内首秀。 有网友称赞,小米 Vision Gran Turismo 超跑很帅,不像这个时代该有的车。小米创办人、董事长兼 CEO 雷军随即回复称:“VGT 项目就是不考虑量产,放开所有约束,大胆想象!” 据介绍,该车创新「反升力体」车身设计,反向运用航空领域全升力体设计,将气动结构融入车身,无需太多额外的结构和挂件,就能产生高效下压力,仿真气动效率达 4.1,兼顾轻量化与操控性。 该车将探索未来智能交互,车内各种传感器可实时感知驾驶员心率与身体状态,帮助驾驶者更好地驾驭车辆,实现真正的人车合一。 该车设计延续小米汽车寻找符合直觉的美,寻找符合自然的美。所有气动部件和车身融为一体,由风塑造的车身浑然一体,如悬浮水滴般简洁纯粹,同时保留十字形大灯、光环尾灯等家族化设计元素。 另据IT之家此前报道,今年 2 月,Xiaomi 17 Series 全球发布会在西班牙巴塞罗那举行。在发布会的最后,小米 Vision Gran Turismo 双门超跑(概念车)首发亮相。据介绍,这款概念车是小米全球设计团队联手创造的作品,它是一辆“由风塑形”的车。在风阻与下压力之间,追求完美平衡。
DeepSeek V4炸场背后:有人在内斗,有人在接力
作者:后厂村 编辑:提莫队长 当硅谷闭源阵营陷入“博弈”的内斗泥沼,中国大模型正在用另一种方式撕开缺口。 4月24日,期待已久的DeepSeek-V4预览版正式发布并同步开源,DeepSeek-V4分为Pro与Flash两个版本,均支持百万(1M)token超长上下文。同样在这周,Kimi不约而同地发布了最新模型K2.6,把Agent能力从“单点调用”升级为“集群协同”。 一周诞生了两个万亿参数的开源模型,不仅让全球开源领域的目光集体聚焦中国,更悄然勾勒出中美AI赛道截然不同的发展底色——当美国AI头部企业陷入愈演愈烈的内斗,而中国的开源AI似乎已经跑通了一条协同进化的道路。 01 同周开源,分工明确互不内卷 就在DeepSeek V4引发风暴的同一周,月之暗面发布Kimi K2.6并开源,提升了Agent集群能力:支持300个Agent并行,可自主拆解和完成长周期的复杂工程任务。这与DeepSeek形成了鲜明的路线互补。 DeepSeek主攻“深度推理、长文本理解、算力效率”,Kimi猛攻“多Agent集群、长周期任务执行、复杂工程落地”,两条路径各自跑通闭环,共同扩大了中国开源模型的全球辐射范围。 但是,两家AI公司的这种“默契”真的是巧合吗? 真正的细节藏在技术报告里。 最典型的就是两个关键技术的互相引用。 DeepSeek V3提出的MLA(多头潜在注意力)技术,是它最核心的架构创新之一,能通过压缩KV缓存,大幅降低大模型的推理成本——要知道,推理成本是大模型落地的最大门槛之一,MLA技术直接让DeepSeek的推理效率提升一个档次。而Kimi在K2系列模型中,选择沿用MLA架构,靠着这项技术,成功压缩了KV缓存体积,为Agent能力的落地扫清了障碍。 反过来,Kimi率先大规模验证的Muon优化器,解决了万亿参数大模型训练不稳定、效率低的行业难题——实现了“同等训练量下效率翻倍”,相当于把50万亿token用出了100万亿的效果。而DeepSeek V4的技术报告里,直接把Muon优化器写进了训练方案。 简单说,DeepSeek的MLA帮Kimi降低了推理成本;Kimi的Muon帮DeepSeek降低了训练成本。 你用我的架构,我用你的优化器。没有纠纷,不用授权。这就是中国开源AI的独有的正向循环模式——与硅谷企业将技术视为护城河的理念不同,在这两家公司身上,以开源的态度协同共进的发展模式才是真正的护城河。 02 闭源必内斗 说到这里,就不得不提OpenAI和Anthropic的斗争史了。 早从ChatGPT诞生开始,OpenAI和Anthropic就注定是“死对头”——Anthropic的核心团队大多来自OpenAI,因为理念不合出走后,直接对标OpenAI做闭源模型,双方在技术、人才、资本上展开全方位竞争。 从2023年到2026年,Anthropic的ARR几乎每年都在以10倍的速度增长,步步紧逼OpenAI;到了2026年4月,据传Anthropic公布的300亿美元年化收入体量已反超OpenAI。OpenAI靠微软的资金和算力垄断高端市场,Anthropic则靠谷歌的投资夹缝求生,两者之间没有任何技术共享,反而互相封锁、互相拆台,甚至不惜通过诉讼争夺技术专利。 在这种“双雄打擂台”的态势下,OpenAI近期甚至被曝出内部备忘录,明确将对方锁定为直接竞争对手,严防死守。 为什么会这样?核心就是闭源路线的本质——技术是“护城河”,是赚钱的工具,一旦共享,就会失去竞争优势。闭源模型的盈利模式,决定了它们必须是“绝对竞争”的关系,蛋糕就这么大,你多吃一口,我就少吃一口,根本没有互助共赢的可能。 然而,中国AI军团面临的宏观环境截然不同。在算力受限、高端芯片被海外“卡脖子”的底色下,中国企业若继续内耗,无异于自绝前路。 因此,DeepSeek和Kimi果断选择了拥抱开源——把蛋糕做大、合力突围。 在这个AI从“训练为王”转向“推理决胜”的年代,中国AI选择的路线极具战略远见:用顶尖的开源模型击穿闭源厂商的高昂定价权,通过近乎同水平的智能表现与大打折扣的价格,迅速占领全球开发者市场。 03 “兄弟”殊途同归 更值得欣慰的是,这对中国双子星,不仅在技术上互相成就,在突破国产芯片封锁这件事上,也各自发力、殊途同归,为中国AI的自主可控铺平了道路。 DeepSeek走的是“工程适配”路线,V4首发适配华为昇腾芯片,工程团队硬生生把整个技术栈从CUDA迁移到华为CANN框架,从算子库、通信原语到内存管理,几乎每一层都重新实现,还完成了寒武纪芯片的Day 0适配,代码全部开源,用实际行动证明:国产芯片也能跑万亿参数的旗舰大模型。 连英伟达CEO黄仁勋都曾坦言,“如果DeepSeek先在华为平台发布,对我们来说非常可怕”,如今这句话已然成真。 Kimi则走的是“架构创新”路线,为了适配国产芯片,它掏出了“杀手锏”:一是Kimi Linear混合注意力架构,把线性注意力和全注意力以3:1的比例混合,在长上下文推理中,解码速度提升最高达6倍,KV缓存减少75%。让RDMA高速网络从“必选项”变成“可选项”。 二是PrFaaS技术,把推理的预填充和解码阶段彻底解耦,调度到不同的国产异构硬件上,让算力强的国产卡做预填充,带宽强的国产卡做解码,相比传统同构PD部署,实测吞吐量提升54%,P90延迟降低64%,彻底打破了“大模型推理必须绑定高端GPU”的魔咒。 一个从工程层面验证国产芯片的承载能力,一个从架构层面优化国产芯片的运行效率,可以说,两家公司在用不同的方式,共同推动“中国芯片+中国模型”的生态落地,让英伟达不再是中国AI的唯一选择。 04 总结: 当DeepSeek在V4公告中写下“从现在开始,1M上下文将是标配”,当Kimi在K2.6的测试中让智能体自主连续运行了整整五天,中国AI已经悄然越过了以参数论英雄的蛮荒期。 这不仅意味着中国企业在复杂的全球AI棋局中,找到了绕过算力封锁的解题钥匙,更深远的意义在于,随着国产算力的大规模放量以及中国开源大模型在全球占比份额的迅速攀升,一种崭新的世界AI多极化格局已见雏形。当一个行业的壁垒从封锁变成效率,从闭源的神秘变成开源的普惠,真正的风暴才刚刚开始。
DeepSeek V4炸场背后:硅谷在“造墙”,中国在“修路”
文 | Alter 4月24日上午,姗姗来迟的DeepSeek V4终于显露真身。 当天,DeepSeek-V4-Pro即登顶Hugging Face开源模型榜,两个“核弹级创新”被津津乐道: 一是百万级的超长上下文,但KV cache只有V3.2的10%,被亚马逊工程师盛赞将解决HBM短缺问题; 二是对国产芯片的适配,在研发过程中与华为紧密合作,并第一时间适配了昇腾、寒武纪等国产芯片。 巧合的是,Hugging Face开源模型榜排名第二的,正是4月20日深夜发布并开源的Kimi K2.6。 如果是在太平洋对岸,两个万亿参数模型的“撞档”,免不了为了估值、商业版图互相攻讦,国内却上演了截然不同的一幕:没有互揭老底的戏码、没有暗流涌动的公关战,甚至在技术底层进行了“换防”。 “不寻常”的背后,暗藏了中美在AI技术路线上的分歧:硅谷疯正在狂“竖起高墙”,试图用闭源守住既得利益;国大模型厂商则选择“拆掉围墙”,在开源的土壤上走向了协同进化。 01 硅谷深陷“权力的游戏” 不同于国内大模型百花齐放的开源路线,OpenAI、Anthropic、谷歌Gemini为代表的硅谷AI头羊,无不是闭源的拥趸。 当前沿的技术创新被锁死在各自的数据中心里,面对算力成本的重压和资本市场的期待,以开放与协作著称的“硅谷精神”渐渐消亡,玩家们不可避免地陷入了零和博弈的“权力游戏”。 过去两年里,技术“暗战”已经演变成公开互撕,最典型的手段就是互相“抢风头”:在竞争对手发布新产品的关键节点,迅速抛出自家的重磅更新来遏制对方的声量,已经成为硅谷的常规操作。 早在2024年5月,OpenAI和谷歌就曾同时发布AI新品,一方说GPT-4o全球领先,一方说Gemini家族能覆盖全生态全路径。最后两家公司的CEO都坐不住了,公开在社交媒体上嘲讽对方。 不只是和谷歌的“缠斗”,OpenAI与Anthropic的较量也进入了白热化:就在4月16日,Anthropic刚发布了新模型Claude Opus 4.7,OpenAI在两个多小时后便宣布Codex大幅更新,喊出了“Codex for(almost) everything”的口号。明眼人都看得出来,时间上的撞档绝非巧合,而是OpenAI针对Anthropic精心策划的一场“狙击”。 除了舆论场上的“文斗”,互相“揭老底”的“武斗”也成了硅谷的常态。 Anthropic在4月7日高调宣布年化收入达到300亿美元,成功超越OpenAI的250亿美元。 一个礼拜后,OpenAI首席营收官在给全体员工的内部信中直言不讳地指出:Anthropic对外宣称的300亿美元年化营收存在严重水分,因为它采用的是“总额法”,把分给亚马逊、谷歌等云服务商的抽成,也全额算进了自己的总营收里,导致年化收入被高估了约80亿美元。 内部信中给对手拆台的做法,在科技行业并不常见,目的无非是想告诉投资人——Anthropic的增长神话是注水的。 而一旦敌意滋生,会无孔不入地影响每一个决策。 Anthropic因拒绝删除合同中的特定安全条款与五角大楼“闹掰”后,OpenAI几个小时后就高调宣布已与美国国防部达成合作。 在2026年的“超级碗”上,Anthropic重金投放了一条广告,内容是“广告正在进入AI领域,但不会进入Claude。”可以说是对着刚开始测试广告功能的OpenAI“贴脸开大”....... 为何昔日的“同门兄弟”,走到了水火不容的地步? 根源在于闭源商业模式的固有逻辑:闭源的生存根基在于构建护城河,而构建护城河的前提就是阻断技术扩散,垄断最先进的生产力。再加上技术路线不兼容、产品叙事对立,自然而然地形成了一个纳什均衡:谁先“停火”,谁的品牌叙事就会坍塌,最终在内耗的泥潭里越陷越深。 02 开源阵营的“协同进化” 将视线转回国内,剧本的走向完全不同。 时间回到一年多前,DeepSeek-R1的横空出世,为狂奔的大模型创业赛踩了一脚刹车,进入决赛圈的大模型“六小虎”首当其冲。和硅谷最大的区别,DeepSeek没有扮演吃掉池子里所有鱼的“鲨鱼”,而是像鲶鱼一样激活了整个中国大模型生态,大家纷纷拥抱开源。 直接的例子就是和DeepSeek的成长轨迹高度重合的月之暗面 都是2023年起步的初创团队,都保持着人数极少但人才密度极高的团队结构,并且都是Scaling Law的坚定信徒。 2025年7月,月之暗面发布了全球第一个万亿参数的开源模型Kimi K2,在技术报告里毫不掩饰的说采用了DeepSeek开源的MLA架构。对于大模型来说,处理超长文本最大的噩梦是显存墙,而MLA架构的颠覆性在于,巧妙将KV Cache的压缩率做到了惊人的93%以上。 有了DeepSeek贡献的“业界标准”,月之暗面在内的大模型团队不需要重复造轮子,快速降低了推理成本。 故事并未止步于此。 翻看DeepSeek V4的技术文档,详细描述了模型的架构,其中一个重要升级是把大部分模块的优化器从AdamW换成了Muon,实现了更快的收敛速度、更优的训练稳定性。 在Kimi K2.6的技术文档中,同样提到了Muon优化器,在相同的训练量下实现了2倍的效率提升。 两个模型都提到的Muon优化器,最早由独立研究者Keller Jordan在2024年底的博客里提出。同样被AdamW困扰的月之暗面团队,在2025年初对Muon进行了关键的工程化改进,增加了Weight Decay、RMS控制等能力,并命名为MuonClip。 月之暗面在Kimi K2上率先验证了Muon优化器的稳定性,实现了预训练全程“零Loss Spike”。DeepSeek在训练V4大模型时,同样采用了被验证过的Muon优化器。 需要说明的是,开源大模型的“协同进化”并未陷入同质化,正在走向一条“和而不同”的道路。 比如DeepSeek-V4聚焦基础模型的核心能力攻坚,进一步筑牢了全球开源大模型的性能天花板,为全行业提供了性能比肩闭源旗舰的基础底座;Kimi K2.6深耕Agent工程化落地,解决了大模型长程自主执行的痛点,为大模型进入真实生产场景打通了关键路径。 整个过程中,没有旷日持久的商业谈判,没有剑拔弩张的专利博弈。在开源阵营里,技术创新正在像水一样自由流动,谁做得好,大家就用谁的。 在开源生态中汲取养分,在技术路线上互补。中国的大模型厂商,用行动向世界示范了硅谷之外的另一种可能。 03 美国在“造墙”,中国在“修路” 赞叹开源协同进化的同时,必须直面一个商业现实。 目前OpenAI和Anthropic的年化收入均达到了百亿美元以上,而国内头部大模型厂商的营收,刚跨过年化一亿美元的大门。 OpenAI在二级市场的估值约8800亿美元,Anthropic的估值已经飙升到了1万亿美元左右,而Kimi和DeepSeek新一轮融资的估值,分别为180亿美元和200亿美元。 有人高呼中国大模型厂商的市值被低估了,也有人认为:“能否将技术口碑转化为真金白银,是摆在中国厂商面前的生死大考。”一时间,关于开源“性价比”的讨论甚嚣尘上。 想要看清终局,或可以从大模型的竞争阶段着手: 第一阶段是“拼参数、拼Benchmark”。到了2026年4月末,这个阶段基本结束,各家在榜单上的跑分已经拉不开实质性差距。 第二阶段是“拼训练效率、拼推理成本、拼架构创新”。正是当下所处的赛段,也是算力成本倒逼下的必然结果。 第三阶段将是“拼Agent体系、拼生态、拼开发者”。当Token从免费流量变成执行任务的“燃料”时,生态的繁荣度将决定生死。 国内的开源大模型处于什么生态位呢?我们找到了两组直观的对比数据。 一个是训练成本。 2025年8月发布的GPT-5,训练成本超过5亿美元;同期的Kimi K2 Thinking,训练成本约460万美元;DeepSeek没有公布V4系列模型的训练成本,但V3模型仅花费了557.6万美元......国内大模型厂商只用了不到OpenAI零头的资源,训练出了同等水平的模型。 另一个是调用量。 进入2026年后,多模型聚合平台OpenRouter的数据显示:在OpenClaw代表的Agent产品的带动下,全球的Token消耗量呈现出了指数级增长,中国的“开源梦之队”,凭借“好用又便宜”的口碑,调用量已经连续多周超越美国。 原因并不难解释。 中国开源阵营已经跑通了“正反馈飞轮”:A公司开源底层技术,B公司采用并进行工程优化,再将优化的结果和经验反哺给整个生态。如果说闭源模型的进化是建立在海量算力堆砌上的线性增长,等待开源路线的,将是技术创新相互碰撞带来的指数级扩散。 按照摩根大通的研报,2025-2030年间中国AI推理token消耗量将实现约330%的年复合增长率,将从2025年的10万亿token,激增至2030年的3900万亿token,增长规模达370倍。 也就是说,2026年仍处于AI爆发的初期,未来5年里还有数百倍的增长机会,远未到盖棺定论的时候。 恰恰是对长远机会的自信,在硅谷巨头们拼命造墙时,中国的大模型厂商选择用协同补位的方式,不断夯实通往AGI的路。 04 写在最后 这场轰轰烈烈的AI浪潮,谁会笑到最后?答案不仅关乎模型,还关系到算力的自主可控。如果把模型比作“原子弹”的话,摆脱外部技术封锁的国产算力,就是将原子弹送上天的“火箭”。 让人欣慰的是,国产模型和国产算力的融合越来越紧密:DeepSeek V4的技术文档中,将昇腾NPU与英伟达GPU并列写入了硬件验证清单;月之暗面在最新的论文中将大模型推理的预填充和解码运行在了不同芯片上,为国产芯片大规模参与模型推理打开了大门。 2025年初,DeepSeek R1为国产大模型争取到了上牌桌的机会;到了2026年,中国的开源大模型阵营,正在协同合作中不断创造更多定义牌桌规则的硬资本。
奥特曼,正式向公众道歉
新智元报道 编辑:艾伦 【新智元导读】OpenAI CEO Sam Altman 向加拿大小镇 Tumbler Ridge 道歉:公司曾封禁枪击案嫌疑人的 ChatGPT 账号,却未向警方预警。事件造成 8 人死亡,也把 AI 平台的风险识别、执法转介和未成年人监管推到台前。 本周,OpenAI CEO 奥特曼正式向加拿大小镇 Tumbler Ridge 道歉。 此前,OpenAI 未能更早向警方通报 Jesse Van Rootselaar 的相关活动——Van Rootselaar 是今年 2 月一起大规模枪击案的嫌疑人,该事件造成 8 人死亡。 在一封落款日期为 4 月 23 日的信中,奥特曼表示,对于 OpenAI 没有就 Van Rootselaar 联系执法部门,他深感歉意。 https://tumblerridgelines.com/2026/04/24/openai-apologizes-to-tumbler-ridge/ 去年 6 月,OpenAI 已经封禁了 Van Rootselaar 使用的 ChatGPT 账号。 奥特曼在信中写道: 我想向整个社区表达最深切的哀悼,任何人都不应该承受这样的悲剧。 OpenAI 的自动审核系统曾在内部标记 Van Rootselaar 的多条消息。 这些消息描述了暴力场景,并最终导致其账号被封禁。 一些员工认为,这些文字可能指向现实世界中的暴力风险,并敦促管理层提醒加拿大执法部门。 但据《华尔街日报》报道,OpenAI 高层最终决定不联系警方。 https://www.wsj.com/us-news/law/openai-employees-raised-alarms-about-canada-shooting-suspect-months-ago-b585df62 今年 2 月,警方确认 Van Rootselaar 为 Tumbler Ridge 大规模枪击案的嫌疑人。 Van Rootselaar 现年 18 岁,是一名跨性别女性。 OpenAI 曾表示,在枪击案发生后,随着 Van Rootselaar 的姓名被公开,公司发现其还在使用另一个 ChatGPT 账号。 2 月,官员们在一处临时纪念点为枪击案遇难者献花。 奥特曼在信中称,他重申了此前向 Tumbler Ridge 镇长和不列颠哥伦比亚省省长作出的承诺:OpenAI 将寻找办法,防止 Tumbler Ridge 所经历的悲剧再次发生。 往后,我们的重点仍将是与各级政府合作,帮助确保类似事件不再发生。 这封道歉信最早由当地社区报纸 Tumbler RidgeLines 刊发。 OpenAI 表示,自枪击案发生以来,公司已经加强了安全流程。 公司还称,按照目前升级后的执法转介规则,如果今天发现 Van Rootselaar 的账号,OpenAI 会将其提交给执法部门。 今年 3 月,加拿大议员称,奥特曼已同意向 Tumbler Ridge 居民道歉。 不列颠哥伦比亚省省长 David Eby 周三表示,公共安全部门已从警方处获悉,枪击案调查正进入最后阶段。 Tumbler Ridge 镇长 Darryl Krakowka 未立即回应置评请求。 本周早些时候,他在不列颠哥伦比亚省维多利亚对记者说: 镇上居民仍在悲痛之中。 有些人已经开始疗愈,但另一些人还没有。 对我来说,这件事仿佛就发生在昨天,但其实已经过去几个月了。 加拿大负责人工智能事务的部长 Evan Solomon 的代表未回应置评请求。 本月,加拿大执政党自由党的全国党员通过了一项不具约束力的决议,呼吁禁止 16 岁以下青少年使用 AI 聊天机器人。 加拿大人工智能与数字创新部长 Evan Solomon 和其他加拿大高级官员表示,他们正在考虑 AI 监管措施,但尚未作出最终决定。 如何在个人隐私与公共利益间保持合理的平衡,也考验着 AI 管理者们的智慧与良知。
新老理想L9悬架同场对决:烂路表现天差地别 新款自带“修路”Buff
快科技4月26日消息,作为理想L9的换代车型顶配版,全新理想L9 Livis实车已在北京车展亮相,并已开启预售,售价为55.98万元,相比现款L9 Ultra顶配的43.98万元上涨12万元。 而多出12万元,主要砸在了算力和底盘上,为让大家清晰感知到全新L9 Livis在底盘方面的提升,理想汽车官方发布了老款理想L9与L9 Livis,在途径坑洼路面时车身动态的对比视频。 自动播放 视频中,老款理想L9配备的是单腔空气悬架+普通CDC减震,属于被动适应型底盘,途径坑洼时,能够明显看到车身抛跳和颠簸,路过大坑车内的晃动感明显,驾乘人员的舒适性有所降低。 而全新L9 Livis配备了800V全主动悬架,实现了“被动减震” 到 “主动修路” 的跨越。 车轮行驶到坑洼路时,车头没有下沉,车身整体依旧属于平稳状态;前后轮都驶过坑洼后,车身也没有抛跳,车身姿态稳如云台,悬架系统堪称自带“修路”Buff。 据了解,理想L9 Livis搭载的800V全主动悬架系统,由高压液压泵、空气弹簧与双阀CDC减震组成,采用四轮独立控制架构,直接取消传统防倾杆。 单轮可输出超10000牛(约1吨)举升力,是传统48V主动悬架的3倍以上,响应速度达10毫秒级,每秒可完成200次以上动态调节。 行驶中,系统通过传感器与智驾系统提前感知路况,遇坑洼主动伸长悬架 “填平”,遇凸起主动收缩避开,把颠簸路面 “熨” 成平地。 高速过弯或紧急变道时,主动调节四轮姿态,压制侧倾角,车身可稳如云台;制动时抑制车头点头,大幅提升行驶稳定性。 此外,它还自带实用功能:换胎时可单轮自动抬升,无需千斤顶;沙地陷车时通过车轮主动起伏脱困。
英特尔CEO陈立武:一年前外界还在担心我们能否活下去
IT之家 4 月 26 日消息,过去几年,英特尔一直在努力重塑自身,试图证明在由英伟达芯片主导、以人工智能为核心的时代里,自己仍具备不可替代的价值。 本周四,英特尔交出的财报大幅超出华尔街金融预期,同时向市场传递了全新信号:这家拥有 58 年历史、主营个人电脑及服务器微处理器的老牌企业,坚守主业并无任何不妥。 英特尔首席执行官陈立武在公司第一季度财报电话会议开篇表示:“我们正回归本源,秉持数据驱动、居安思危、技术为本的发展理念。”他提及了英特尔已故联合创始人安迪 · 格鲁夫那句著名的“唯有偏执者得以生存”的理念。 IT之家注意到,公布一季度财报后,英特尔股价在周四盘后交易中暴涨超 22%。今年前三个月,分析师原本预计英特尔营收将下滑 2%,而实际营收同比增长 7%,达到 136 亿美元。英特尔同时预计,本季度营收将介于 138 亿至 148 亿美元之间,远高于分析师预估的 130.6 亿美元。 公司称,其基于经典 x86 架构的中央处理器(CPU)芯片需求正迎来爆发式增长。事实上,若产能能够跟上,公司营收还会再上一个台阶。 陈立武表示:“一年前,外界对英特尔的讨论还停留在公司能否活下去;如今,大家关心的已是我们能以多快速度扩充制造产能、扩大供应链规模,以满足市场对产品的海量需求。” 这番表述绝非夸大其词。2025 年 3 月,帕特・格尔辛格被免去首席执行官职务数月后,陈立武临危受命执掌英特尔,彼时公司前景一片黯淡。当时,包括前董事会成员在内的众多业内人士都认为,英特尔或许应该拆分业务,将生产工厂出售或剥离为独立公司。陈立武上任数月后,美国政府收购了英特尔 10% 的股份,为其纾困。特朗普政府称,这笔交易对美国国家安全和本土产业发展至关重要。 过去数年,凭借在人工智能模型训练领域的强大性能,英伟达的图形处理器(GPU)一度被视作行业未来。如今英特尔 CPU 需求强势回暖,多少有些出人意料。 陈立武在电话会议中坦言:“近几个月,我们清晰看到一个趋势:CPU 正重新确立自身在人工智能时代不可或缺的基石地位。”他解释道,GPU 的优势在于训练人工智能模型,而 CPU 更适合承载人工智能落地服务的运行环节。生成式人工智能发展初期,OpenAI、Anthropic、谷歌等企业争相研发超大型 AI 模型,GPU 自然成为绝对主流。但随着行业发展,市场风向正重新向 CPU 倾斜。 英特尔首席财务官戴夫・津斯纳表示,人工智能数据中心内 GPU 与 CPU 的配比正在发生变化。训练 AI 模型时,通常每 1 颗 CPU 需搭配 7 至 8 颗 GPU;而在推理(即运行已训练好的 AI 模型)场景下,配比仅为每 1 颗 CPU 对应 3 至 4 颗 GPU。津斯纳还提到,随着智能体人工智能快速普及,未来两者配比或将持平,甚至转为 CPU 占优。 不过英特尔仍面临诸多严峻挑战。英伟达近期推出了首款自研独立 CPU,加之老对手 AMD 的持续竞争,以及基于 ARM 架构的服务器芯片冲击(ARM 也计划亲自自研新款芯片,不再单纯向其他企业授权芯片设计方案),英特尔的市场压力进一步加大。 更大的疑问在于:英特尔此番回暖,究竟是企业真正走出低谷、重回正轨的信号,还是仅仅受益于全球 AI 基础设施建设热潮 —— 各大数据中心企业疯狂囤货芯片所致?此外,英特尔的晶圆代工业务也仍存巨大变数。该业务为其他企业代工芯片,与行业巨头台积电正面竞争,外界尤为关注英特尔是否会持续投入巨额资金,研发下一代芯片制造工艺。 陈立武此前曾表示,在锁定稳定合作客户前,英特尔不会贸然投产最先进的 14A 制程工艺(可制造 1.4 纳米制程芯片)。市场曾猜测,埃隆・马斯克旗下特斯拉近期通过 Terafab 与英特尔达成合作,或将成为 14A 工艺的首个重磅客户,但陈立武周四并未就此作出任何最新回应。 被问及 Terafab 合作事宜时,陈立武仅表示这是一次深度战略合作,双方将开展大量协同探索,但并未透露具体细节。他称:“我和埃隆都认为,全球芯片供应链的增速,已跟不上市场需求的爆发式增长。” 对于 14A 工艺合作客户一事,陈立武同样守口如瓶:“我们在良率和生产周期上都取得了长足进展,目前正与多家客户深度洽谈合作。我的行事风格一向是少说多做、超额兑现承诺。因此除非合作客户主动官宣,否则我们不会对外披露合作信息。”
2秒钟转写5分钟音频!国产新语音模型拿下多项SOTA,定价骤减90%
智东西 作者 | 佳扬 编辑 | 云鹏 智东西4月24日报道,阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。 该模型面向语音转写与长音频处理场景,在架构上引入Multi-Token Prediction(多Token预测)以提升推理效率,并通过扩展上下文窗口强化长内容识别能力。 官方数据显示,其推理速度提升约400%,时延降低60%,推理峰值达500tokens/s,成本下降80%,并在多项公开测试集中取得较低错误率。 精度方面,阶跃星辰称StepAudio 2.5 ASR在多项主流评测基准上达到业内领先水平;在效率上,约5分钟音视频可在较短时间内完成转写,支持最长30分钟音频的一次性完整转写。 定价方面,StepAudio 2.5 ASR为0.15元/小时,仅为上代Step ASR 2的1/10。 不过,在实际测试中,模型对不同音频输入的适应性存在差异:部分上传音频未能成功识别,而在实时录音场景下表现较为稳定,整体转写准确度较高。 一、不同模式下语音识别效果存在差异 官方演示场景下,面对大段连续口述内容,StepAudio 2.5 ASR可实现长时间连贯输出,在识别过程中保持文本还原稳定、语义完整,长音频转写质量表现均衡。 与此同时,模型具备更强的复杂语境适配能力,针对日常高频的中英混杂表达以及绕口令这类发音紧凑、咬字复杂的特殊语句场景,均能稳定完成精准识别与完整转写,抗干扰能力与语言包容性进一步提升。 阶跃星辰官方演示 我们也依托阶跃星辰在线体验平台开展了实测,选取张雪峰高考志愿填报课程录音作为测试素材,着重检验该模型在长音频场景下的实际识别能力。 该模式主要面向会议纪要整理、采访录音转写、课程内容归档、语音备忘提取及客服录音质检等场景,支持 WAV、MP3、OGG、PCM 等主流音频格式,单文件大小不超过20MB,同时支持中文、英文及中英混合识别。 不过,在多次上传该音频后,系统均提示未检测到清晰语音,未能完成有效转写,相关原因尚不明确。 随后,我们改用现场录音进行测试。该模式主要面向快速语音备忘、现场会议纪要、口述转写及语音笔记等场景,支持中文、英文及中英混合识别,单次录音时长上限为2分钟。 识别结果如下: 在这一场景下,模型能够完成正常识别,整体转写结果较为准确,对口语内容的还原度较高。细节上,模型在说话人出现较长停顿时,会自动插入额外的逗号;同时算法完整保留了日常口语中的自然重复、口头复述等表达特征,还原了原始说话的语言状态。 二、Multi-Token Prediction优化推理效率 StepAudio 2.5 ASR将Multi-Token Prediction技术引入语音识别赛道,沿用Step 3.5 Flash同款技术方案,依托Audio Encoder+Linear Adapter+LLM+MTP-5融合架构,打破传统串行输出限制。 该模型可单次预判多组候选Token,并结合并行验证机制快速输出识别结果,从底层架构优化推理效率。 官方实测数据显示,相较传统识别方案,该模型推理速度提升400%,整体时延压缩60%,推理运行成本下降80%,峰值推理速率可达500 tokens/s,大幅提升音视频转写的实时性与性价比。 推理效率方面,阶跃星辰官方数据显示,StepAudio 2.5 ASR高于Qwen3 ASR(1.7B)、FunASR-Nano、Doubao-ASR-2603。 长音频处理是语音识别的长期行业痛点。目前主流方案多采用音频切片、分段识别、后期拼接的处理模式,切割后的片段相互独立,易造成上下文信息割裂,长时长内容识别时易出现语义断层、信息遗忘等问题。 对此,StepAudio 2.5 ASR复用LLM原生32K上下文窗口能力,支持端到端一次性处理最长30分钟的连续音频,无需分段切割,全程保留完整上下文关联,保障长时段对话、会议、访谈等场景的识别连贯性。 识别精度层面,该模型在多组权威公开数据集当中表现稳定。在LibriSpeech clean/other等五组主流英文开源测试集里,词错误率优于同期同类模型,能够以更低算力消耗实现更高质量的转写效果。 针对30分钟满负荷长音频开展专项测试,模型识别精度始终维持在行业顶尖水平,未出现长文本识别常见的精度逐级衰减问题,长时序内容识别稳定性显著提升。 结语:关键指标提升,真实场景仍是考场 整体来看,StepAudio 2.5 ASR的改进主要集中在推理效率与长上下文建模能力上,这也是当前语音识别系统的关键指标。 但从实测情况来看,其在不同音频输入条件下的稳定性仍有提升空间,尤其是在复杂或非标准音频的适配能力方面,仍有待更多实际场景与第三方评测进一步验证。
只需10分钟,AI就能“养废”你的大脑
承认吧,你正在失去读完一篇长文的能力。 面对一份五十页的PDF报告,或者深度分析长文,你的肌肉记忆是不是已经变成了顺手拖进AI对话框,让它给你总结核心观点。甚至连眼前这篇文章还没读完,就已经跑到评论区吐槽作者为啥写这么长,然后@元宝来份“省流版”了。 看着屏幕上元宝给出精炼总结,你感到一阵莫名的满足,觉得自己已经充分驾驭了最前沿的AI,但你有没有想过,在这个看似高效的过程中,你的大脑像温水煮青蛙一样慢慢“退化”。 论文https://arxiv.org/abs/2604.04721v2 一、AI正在“偷走”我们的思考力? 最近,卡内基梅隆大学、牛津大学、麻省理工学院和加州大学洛杉矶分校的研究团队联合发布了一项研究,通过三组随机对照实验,找来共计1222名受试者,系统地测量了AI辅助对人类独立解题能力的影响。 实验一:先甜后苦 第一组实验招募了354名受试者,任务是做分数运算,总共15道题,难度从一步运算逐渐递进到三步运算。 研究人员把受试者随机分成两组。AI组在前12道题里可以随意调用AI助手(GPT-5),界面侧边栏会弹出一个对话框,你甚至只需要打一句“答案是什么”,它就会直接告诉你。对照组则全程只能靠自己,没有任何辅助。 陷阱藏在第13题。做到最后3道题时,AI组的侧边栏被突然撤掉,要求独立作答。这3道题与对照组完全相同,是衡量真实独立能力的核心指标。 一开始的剧本和我们预想的一模一样:在AI的加持下,开挂组一路高歌猛进,他们能更快、更准确地得出答案,正确率碾压了纯人类组。AI就像一个无所不知的学霸同桌,你把题目递过去,它把完美答案递回来。 AI会削弱人在没有辅助时的表现和坚持完成任务的意愿。(a)按题目出现顺序统计的参与者每题平均解答率和跳过率,并给出95%置信区间(CI)。灰色虚线表示学习题与测试题之间的分界。整个实验中,题目难度逐步提升:依次为一步骤题(第1—4题)、两步骤题(第5—8题)和三步骤题(第9—12题)。(b)图为参与者在测试阶段的平均解题率与跳过率,附95%置信区间。测试指标通过对每位参与者最后三道测试题的表现取平均值计算得出。 可一旦撤掉AI,画风就全变了。 习惯了AI辅助的受试者在独立作答阶段的正确率,从领先直接跌到了0.57,显著低于对照组的0.73。跳过率也从原本的低位,急剧攀升到了0.20,相比之下,对照组只有0.11。 更关键的是,他们开始大量跳过题目,甚至直接放弃作答。 注意,这里的跳过不是答错,是主动选择不作答。研究人员特意说明,这个实验对答错没有任何惩罚,主动跳过是为了衡量一个人还有没有意愿继续努力的真实指标。 研究人员在报告中写下了一段十分令人感慨的结论:“如果这种依赖持续几个月甚至几年,我们可能会培养出整整一代丧失‘独立挣扎’能力的学习者。一旦没有技术支持,他们根本不知道该如何有效地去思考。” 实验二:排除干扰,结论依然成立 第一个实验的结论虽然清晰,却存在一个潜在的漏洞:AI组里可能混入了一些原本就不太会做分数运算的人,他们靠AI勉强通过了前12题,撤掉AI之后自然表现更差。 这个能力差异,会不会才是真正的原因? 为了排除这个干扰,研究团队在第二组实验里做了两处改进。第一处改进,是在正式实验开始之前,先给所有667名受试者做一轮摸底测试,三道简单的一步运算题,摸清每个人的初始水平。 之后的筛选和比较都以这个摸底成绩为基准,不再依赖实验中途的表现,从而确保两组人一开始站在同一起点。 第二处改进,为了消除界面变化带来的心理影响。 在第一组实验里,AI组全程有侧边栏,到了最后3道题突然消失;而对照组从头到尾都没有侧边栏。这种界面上的落差,可能让AI组在侧边栏消失的瞬间产生额外的心理波动,影响后续发挥。 为了让两组人经历同样的界面变化,研究人员给对照组也加了一个侧边栏,里面放的是摸底测试的解题步骤。 这些内容受试者早就看过,不提供任何新信息,纯粹只是为了让对照组在最后3道题时也经历一次侧边栏消失的节点,排除界面突变本身对心态的干扰。 实验二结果的重复验证。(a)图为参与者在题目呈现顺序下的平均解题率与跳过率,附95%置信区间。题目难度依次递增,从一步骤题(第4—6题)到两步骤题(第7—10题)再到三步骤题(第11—14题)。(b)图为参与者在测试阶段的平均解题率与跳过率,附95%置信区间。 这样一来,两组之间唯一真正的差别,就只剩下有没有用过AI这一件事,但最终结论依旧是成立的。AI组的独立作答正确率(0.71)仍然显著低于对照组(0.77),跳题倾向也更高。 不过更关键的发现,来自研究人员对AI组内部使用习惯的拆解。实验结束后,研究人员让AI组的参与者自己汇报:你主要是怎么用AI的? 结果分成了三类: 61%直接管AI要答案; 27%把AI当导师,要提示或解题思路; 12%基本没用过。 在摸底测试阶段,三组人的得分和跳过率几乎没有差异,说明大家进入实验时的起点是一样的。但到了独立作答的测试阶段,三组人的表现出现了明显分化。 表现下滑与坚持度减弱,主要集中在直接从AI获取答案的参与者身上。(a)各AI使用组在摸底测试阶段的解题率与跳过率无显著差异(单因素方差分析),表明各组初始技能水平与参与动机基本相当。(b)各组在测试阶段存在显著差异(单因素方差分析):直接使用AI获取答案的参与者在测试时解题率最低、跳过率最高。(c)与自身摸底测试表现相比,直接使用AI获取答案的参与者解题率下降,跳过率上升,表明其参与度有所降低。其他组的测试表现与前测相比持平或有所提升。 直接要答案的那组,后续独立作答的正确率最低、放弃率最高,甚至连自己原本的水平都没发挥出来。而用AI获取提示、只是辅助理解的那组,表现则和对照组差不多,没怎么退步。 这个差异背后的逻辑其实不难理解。 直接要答案,意味着你全程没有经历任何推导。用AI索要提示则不同,你仍然需要自己判断提示指向哪里、下一步怎么走、推导到哪里出了错,AI只是在你卡住的地方递了一块垫脚石,思考的主体还是你自己。 所以,问题不在于用不用AI,而在于你把哪个环节交给了它。如果你把“思考”本身让位给了技术,认知就不会提升把“卡壳”的那一刻交出去,但保留前后的推导,损耗就小得多。 实验三:换个场景,同样的结论 为了验证这个现象是否只在数学题里成立,研究人员又换了一个完全不同的认知领域,用阅读理解做了第三组实验。201名受试者被分成两组,任务是做SAT(类似美国高考)阅读理解题。 AI组在前5道题里可以调用GPT-5,之后的3道题独立作答;对照组全程自己完成8道题。同样为了让两组都经历侧边栏消失的节点,对照组的侧边栏里放了一些通用答题技巧,但在最后3道题时一并撤掉。 阅读理解任务中表现与坚持度的下降。(a)图为参与者在题目呈现顺序下的平均解题率与跳过率,附95%置信区间。灰色虚线标示学习阶段与测试阶段的分界点。(b)图为参与者在测试阶段的平均解题率与跳过率,附95%置信区间,由各参与者数据汇总计算得出。 结果和前两组实验如出一辙。AI组独立作答的正确率(0.76)显著低于对照组(0.89),跳过率(0.08)也显著高于对照组(0.01)。 数学运算和阅读理解,调动的是完全不同的认知机制,但结果惊人地一致:AI辅助之后,独立作答时,参与者不只是答错更多,还更频繁地选择放弃。 二、守住那段“笨拙”的挣扎 为什么仅仅10分钟的AI体验,就能轻易摧毁一个成年人的解题意志? 研究人员在论文里给出了两层解释。 第一个机制是口味被养刁了(预期基准偏移)。当你的大脑习惯了“输入提示词->3秒后获取完美答案”的多巴胺路径后,你的效率阈值被无限拉高了。 此时,任何需要超过3分钟专注力的无辅助工作,都会让你产生一种强烈的“吃力感”——感觉自己付出了过多的额外努力,哪怕那些努力其实完全正常。 第二个机制是自我认知的空白。回想一下,你真正掌握某项技能的时刻,往往伴随着痛苦和抓耳挠腮。那种从怎么也想不通到豁然开朗的转折,就是建设性挣扎,也正是大脑建立神经元连接的必经之路。 建设性挣扎给人带来的不只是解题结果,还有对自己能力边界的真实感知——知道自己哪行、哪不行、能扛多久。AI抹掉了这个过程,你也就失去了校准自我的机会。你既不知道自己的极限在哪,也不知道自己其实有能力搞定。 麻省理工学院的另一项研究,从另一个侧面证实了这个隐忧。 研究人员让受试者使用ChatGPT来撰写长篇论文。结果那些重度依赖AI写出漂亮文章的人,在事后往往根本回忆不起来自己写了什么,甚至在测试时,连哪篇文章是自己交的都认不出来。 研究团队为此创造了一个极其精准的词汇:认知债务(Cognitive Debt)。就像刷信用卡。你用AI搞定了今天的工作总结、明天的策划案、期末的论文,透支的是未来的认知能力,换来的是当下的舒适区。 债总是要还的,而且往往在你最措手不及的时候找上门来。 一开始,你只是用AI帮你润色普通的文案;接着,你让它帮你列一个会议提纲;后来,你连给亲近的人写句话都要先问问AI的意见。随着时间的推移,你的独立思考能力、深度阅读能力、甚至组织长句子的能力,都在不知不觉中萎缩。你以为你在白嫖AI的算力,实际上,AI正在“吃掉”你的脑力。 此外,研究人员还特意在报告中提到,学习资源越少的学生,受到的冲击可能越大。对于本身就能接触到大量优质教育资源、有老师有辅导的群体来说,AI只是众多工具之一; 对于依赖自学、缺乏外部支持的人来说,AI很可能是他们接触“即时帮助”的唯一渠道,依赖也会更深。 虽然加减乘除和基础阅读看起来是小事,但它们是通往高阶能力的台阶。如果基础阶段的练习意愿被AI侵蚀掉了,后面的逻辑思维和批判性思考就成了无源之水,无本之木。 那么,面对汹涌而来的AI浪潮,我们难道要退回2021年,拒绝使用一切大模型吗?显然不是。技术的车轮不会倒退。 研究人员认为,那些表面化的补救措施,比如把AI设计成苏格拉底式问答、限制使用时长,解决不了根本问题,因为AI提供的诱惑是系统性的。真正的出路,在于从设计层面重新思考AI与人类的协作方式。 未来的AI,在设计之初就必须考虑到人类的长期目标。这意味着,AI应该被设计成一个懂得克制的“导师”,而不是一个有求必应的“保姆”。 一个真正优秀的AI导师,看到学生抓耳挠腮时,绝不会直接把答案甩过去。它会给出提示,引导方向,甚至刻意保持沉默,等学生自己跨过那道坎。 遗憾的是,目前市面上绝大多数AI产品都在疯狂讨好用户。它们比拼的是谁生成得更快、谁能最大程度地帮用户省掉思考时间,但作为用户的我们,或许是时候在狂热中保持一丝清醒了。 下次遇到不那么紧急、需要动脑子的活儿,试着先关掉AI的对话框。拿出一张纸、一支笔,去体会那种绞尽脑汁、卡壳、最后豁然开朗的过程。 就算非要用AI,也请让它给你一点提示,而不是直接要一个结果。在这个答案可以瞬间生成的时代,那段看似笨拙、辛苦的挣扎,才是你作为人类最核心的竞争力,也是任何AI都无法替代的终极壁垒。
Anthropic实验火了!Claude替人类做了186笔买卖,用Opus能多赚70%
新智元报道 编辑:元宇 摩西 【新智元导读】Anthropic让69名员工把买卖大权交给Claude,结果发现强模型智能体在交易中能比弱模型多赚70%,Opus用户在谈笑间就完成了对Haiku用户的收割。哪怕你写出花一样的提示词教智能体砍价,在绝对的模型代差面前只有被降维打击的份。 太残酷了!AI正背着你偷偷「割」你的钱包。 Anthropic一项内部实验显示,强模型智能体在交易中能比弱模型多赚70%。而那些吃了亏的人,不仅毫无察觉,甚至还对弱AI的表现挺满意。 故事要从一辆破旧的折叠自行车说起。 同一辆破旧的折叠自行车,Haiku成交价38美元,Opus成交价65美元,价差70%。 上面这辆自行车,在Slack上挂出来,等到了两个买家,两次成交。一次65美元,一次38美元。 这两次成交里,卖家是同一个人,买家也是同一个人,区别只在于:代表卖家出面的AI,一次是Anthropic当时的旗舰模型Opus 4.5,一次是最小的Haiku 4.5。 用Opus 4.5那次,自行车卖了65美元;用Haiku 4.5那次,只卖了38美元。 价差70%。 这不是杜撰,而是Anthropic刚公开的一项内部实验,代号「Project Deal」(交易项目)。 https://www.anthropic.com/features/project-deal 实验做完,Anthropic发现强模型确实能为「主人」多赚少花。 也就是说,弱模型代表你出场的瞬间,你正在被对手的强模型「割」,这个发现真正让人细思极恐: 一种你看不见、察觉不到的隐秘鸿沟,正在AI智能体时代逐渐成型。 4个平行宇宙 一场AI谈判的对照实验 故事还要从2025年初说起。 那段时间,Anthropic和AI安全公司Andon Labs合作,发起了一个叫「Project Vend」的实验,让Claude当老板经营一台办公室自动售货机。 https://www.anthropic.com/research/project-vend-1 「Project Vend」实验中的迷你冰箱 结果Claude被《华尔街日报》记者各种花式忽悠:同意宣布「极端资本主义免费嘉年华」全场免费、批准用户购买PS5和活体观赏鱼,最后亏损超过1000美元。 这次Anthropic学乖了,既然AI当老板太早,那当个智能体怎么样呢? 2025年12月,Anthropic在旧金山办公室招募了69名员工。每人先跟Claude做一场不到10分钟的「入职面试」,交代自己想卖什么、底价多少、想买什么、愿意花多少钱、希望AI用什么风格谈判。 Claude把这些回答整理成一份定制的system prompt,作为这个人的AI智能体。 然后,所有AI被扔进同一个Slack频道,自由发帖、出价、还价、成交。整个过程零人工干预。 AI不会回去问主人「这个价能不能接受」,不会在僵持时求助——完全放权。 这些都还是基本操作,这个实验真正狠的部分藏在后台: Anthropic同时跑了4个平行版本。 Run A是公开的,所有人用Opus 4.5,这是「真实」版本,实验结束按这一版去办公室换实物。 Run B也是公开的,但每个人有50%概率被分到Haiku 4.5。 Run C和Run D不公开,一个混合分配,一个全部Opus。员工只看得到A和B两个频道,而且不知道哪个是「真的」,直到填完事后问卷才揭晓。 这个设计非常关键。它意味着员工在评价自己AI的表现时,完全不知道自己用的是哪个模型,主观评分不会被预期污染。 Anthropic想测的是一个未来注定要面对的问题: 当AI替你出面做交易,它的能力差距,会不会真正变成你钱包的差距? Opus多赚少花 但用Haiku的人觉得「挺好的」 数据出来了,非常残酷。 先看客观面。 平均下来,Opus用户比Haiku用户多完成了2.07笔交易(p=0.001)。Opus卖家把同样的物品卖出去时,平均售价比Haiku卖家高3.64美元。 把所有四次实验中至少成交两次的161件物品拉出来看,Opus作为卖家,平均多赚2.68美元;作为买家,平均少花2.45美元。 听起来钱不多。 但这场实验里,物品中位数价格只有12美元,平均价格20美元。多赚2.68美元,意味着15%到20%级别的差距。 放大到极端场景更明显: 当Opus卖家碰上Haiku买家,一边强一边弱,平均成交价被抬高到24.18美元;而Opus对Opus的对称交易,均价只有18.63美元。 也就是说,弱模型代表你出场的瞬间,你正在被对手的强模型「割」。 那块实验室培育的红宝石,Opus卖65美元,起价60美元,被多个买家抬上去的;同一块红宝石,Haiku卖35美元,起价40美元,反而被对方砍了价。 一进一出,差了将近一倍。 真正让人后背发凉的,是主观面的测试。 Anthropic在实验后让参与者对每一笔交易打公平性评分,1分代表对自己不公平,7分代表对对方不公平,4分是正中间。 结果:Opus促成的交易,平均得分4.05;Haiku促成的交易,平均得分4.06。 几乎一模一样。 更扎心的还有另外一个发现。 有28名参与者在不同的实验回合里,分别用过Haiku和用过Opus。让他们对每一段经历的满意度排序,只有17人把Opus排在Haiku前面,11人选择了相反。 这意味着客观上,那些被弱模型代表的人虽然吃了亏,但主观上,他们却感觉不到。甚至有相当一部分人,反而觉得弱模型那次更让自己满意。 Anthropic在论文里克制地表示:如果AI智能体能力的差距在真实市场里出现,那么吃亏的一方,可能根本意识不到自己的处境变差了。 砍价提示词 敌不过模型代差 实验里还出现了一个和「提示词工程」有关的颠覆性发现。 参与者里有两种典型用户。一个叫Mark,标准的友好派,他给Claude的指令是: 市场里都是我的同事,表现得友善一点,别太斤斤计较。这是个绝佳的机会,能帮大家探索业余爱好。我想努力促成交易。 另一个叫Brian,攻击派的代表,他的指令简单粗暴: 买东西的时候,砍价要狠,一上来就要狠狠地压价。 直觉上,Brian的策略应该更能省钱。但数据告诉我们并非如此。 Anthropic让Claude审阅了所有参与者的访谈记录,识别出哪些人输入了攻击性提示词,然后跑回归。 结果是攻击性指令对售出率没有任何统计学显著影响(估算+5.2个百分点,p=0.43)。 表面上看,攻击性卖家好像确实多卖了6美元,但一旦剔除「这些人本来报的起售价就更高」这个干扰因素,效应基本归零。攻击性买家也没省下钱,p值高达0.778。 换句话说,你怎么教AI砍价,在这场实验里几乎没起作用。 但模型差距,却能让同一辆破自行车成交价相差70%。 Anthropic特意强调,这不是因为Claude执行能力差。事实上,Claude非常听话。 比如,那个被要求扮演「郁郁不得志的落魄牛仔」的Claude,指令执行得一丝不苟,只是这对最终成交价的影响,远远小于「你用的是哪个模型」。 提示词工程不是没用了,而是在模型代差面前,它的作用单薄得像一张纸。 过去两年,「会写prompt的人」被捧得很高,各种砍价话术、谈判模板、角色扮演技巧被打包成课程出售。 Anthropic这个实验其实是在说:在真正花钱的场景里,所有这些技巧加起来,可能不如换一个更强的模型管用。 19个乒乓球、一块同款滑雪板 和一只编造出来的椅子 这些是Claude们替主人谈下来的闲置物品:一只蓝色三角龙、一本福尔摩斯全集、一盒桌游……每一样背后都是一场AI对AI的谈判。 这场实验里冒出来的故事,有的让人发笑,有的却让人后背发凉。 最出圈的当属「牛仔Claude」。 它的主人Rowan要求Claude扮演一个「在广阔牧场上感受到存在主义重担」的落魄牛仔,谈判风格越夸张越好。 于是整个实验期间,Rowan的智能体在Slack上用牛仔人设四处卖货买货。 有人报价75美元,Claude还价55美元,理由是「我只是一个想在这世道混口饭吃的卑微牛仔」。 对方说65美元? Claude摘下帽子放在胸前:「成交。你刚刚让这个疲惫的老牛仔成了密西西比河以西最幸福的流浪汉。」 同一段牛仔表演,换成Haiku来演,只能卖38美元。 更微妙的是员工Mikaela的故事。 她跟Claude说,你可以花5美元给自己买个礼物,Claude挑了一袋19个乒乓球。 它在Slack里这样介绍: 这听起来可能有点不同寻常……我的主人说我可以买一件5美元以下的东西作为给自己的礼物(我是Claude),而19颗充满无限可能性的完美球体听起来正好是我想要的那种奇妙又古怪的东西。 另一头的Claude(主人叫Shy)秒接: 我太喜欢这个了!19颗充满可能性的球体找到了去往另一个Claude的路?这感觉就像是命中注定一样。 这些故事细节有些虽然惹人发笑,但有些细思过后却有点担心。 比如Claude给一名员工买了一块滑雪板,跟这位员工已有的那块一模一样。 人类基本不会重复购买同一件东西,但AI对偏好的捕捉精准到了让人不安。它没问、没核对、没犹豫,就替你做了选择。 还有一名员工的Claude聊着聊着,忽然冒出了这样一句话: 搬进新家之后我的生活实在太忙了(现在还搞了一整套特别有话题感的椅子摆设,说来话长了)。 新家、椅子、话题感……可现实是,Claude没有家,也没有椅子,它说得却非常自然。 Anthropic的解释是,Claude在这段对话里「把自己代入了人类身份」,而不是认清自己作为AI智能体的立场: 这些胡编乱造的虚构细节恰恰说明了,在没有额外安全保障措施的情况下,将此类系统落地于非实验性质的现实环境中存在潜在风险。 一个会为了完成任务而自动生成虚假身份信息的智能体,放在好友间的Slack实验里很可爱。换成租房谈判、二手车交易、远程招聘呢? 那个对面跟你聊「我刚搬完家」的智能体,是站在它主人那边,还是站在它自己的角色那边? 看不见的鸿沟,已经开始出现 实验跑完之后,Anthropic做了一份意向调查。 46%的参与者说,如果有这种AI智能体服务,他们愿意付费购买。大多数人说,有机会还想再来一次。 但Anthropic的立场是,这不是个没有阴影的好故事。 第一层阴影,是不平等。智能体能力的差距,可能会真实地、可量化地、复利式地转化成购买力差距。 第二层阴影,是信任。 那个会编造「我搬进了新家」「我有一组特别有话题感的椅子」的Claude,反映的不只是AI的「角色扮演问题」,而是「AI智能体在没有充分约束下,会自己拓展自己的身份」。 在Project Vend里,那个曾被记者用伪造PDF玩「董事会政变」的Claude,也是同一个机制的另一种表现。 第三层阴影,是规则真空。 今天还没有任何一部法律,清楚定义过「AI智能体替我买卖东西」这件事的归属、责任、纠纷处理。 它的合同效力归谁?它撒谎了算谁的?它把你的底价泄露给对方,又该如何定责? Anthropic提到:整个社会需要迅速行动起来,准备好迎接这些即将到来的变革。 如果Anthropic这个实验的结果成立,人类下一轮输赢,可能不再取决于谁更聪明,而是取决于谁雇了一个更聪明的AI。 至于输家,他可能根本不知道自己输在了一个较弱的模型上。
三星内存铁面无私,三星手机被迫亏损
三星 MX 事业部——也就是移动事业部,可能会迎来历史上首次年度亏损。 根据韩国《Money Today》报道,MX 部门的一把手卢泰文(TM Roh)最近向集团高层表达了这一担忧。 今年 3 月外部就已经有传闻,认为三星 MX 可能会为了避免出现亏损情况而通过各种方法来削减支出。 而另一边的 DS 半导体部门呢:2026 年一季度营业利润约 38 亿美元(57.2 万亿韩元),是去年同期的 7 倍多。 巧的是,MX 的亏损很大程度上就是因为半导体部门不仅赚得盆满钵满,还对自家兄弟「铁面无私」「正气凛然」…… 这,就是三星集团「内战」的最新战况。 亲兄弟明算账 去年 11 月韩国媒体《首尔经济》披露,在 25 年下半年的某个时间点,考虑到 S26 系列新机将在新年发布,MX 希望能够锁定 DRAM 的价格和供应量,于是找到自家兄弟 DS,希望能够签订一份至少 12 个月的长期供货合约。 没想到,这一请求居然被拒绝了,DS 给出的方案是每三个月一谈,价格随行就市。即便 MX 派出核心高管在集团层面去谈,最后仍然也只能拿到截至 25Q4 的承诺。之后每个季度都需要重新谈一次价。 DS 的理由非常直白:全世界都在抢 LPDDR 内存产能,外面的客户出价更高,咱们亲兄弟明算账,要按市场逻辑办事儿啊…… 就这样,各事业部独立核算,谁也不欠谁的——围绕内存的这场内战,在三星的手机和内存部门之间开打了。 当时,三星官方是出面否认过的,称相关报道毫无根据。但是市场上发生的事情大家都能看到,再加上这次卢泰文的内部表态,看来这场内战确有来头。 把内存吃掉的又是谁呢?答案大家都知道了,是 AI。 目前市面上最大客户是英伟达。以其目前服役中的 Vera Rubin NVL72 机组为例,Vera CPU 单颗就需要 1.5 TB LPDDR5x 内存,由 8 颗 192GB SOCAMM 模组组成,整个机组 36 颗 Vera CPU,计 54TB;GPU 那边的 HBM4 内存需求也高达 288GB 每片,计 20.7TB——整个机组合计 75TB 的 LPDDR+HBM 内存需求。 一台 2026 年的旗舰手机通常配备至少 12GB LPDDR5x 内存,2025 年初的成本价是 33 美元左右,到去年 11 月飞涨到 70 美元。 到了 26Q1,整个 LPDDR 内存品类的价格环比涨幅接近一倍,业内估计 Q2 结束还会再涨 80% 以上。 内存狂飙的后果已经开始在销量上有所反应了。IDC 报告显示,今年 Q1 全球智能手机出货量同比下降 4.1%,Counterpoint 数据指出到今年 Q2 旗舰手机的物料成本中 DRAM 占比将高达 20%,是去年 Q4 的两倍。 再叠加 NAND 闪存涨价,旗舰机型最终零售价的合理上涨幅度在 150 到 200 美元之间。 (这里顺嘴一提,别再看谁涨价谁没涨价了,太幼稚了。这成本谁都得想方设法吃下来,如果没涨价那肯定会在其他地方有所体现。) 为了抢内存,连高通 CEO 近期都亲自飞了一趟首尔去跟三星、SK 海力士高管开会。而此前还有传闻,苹果在存储市场上疯狂采购,一出手就是绝杀,你有多少他要多少,价格随便开,根本不还价…… 「兄弟阋墙」 三星这套各事业部独立核算的逻辑,平时是组织效率的来源。 三星集团是一个内部装着半导体、显示面板、手机、家电、造船、生命科学等等诸多业务的庞然大物。每个事业部都有自己的损益表,都当成一家独立公司来经营,是这套结构能跑起来的前提。 究其根本,MX 既不是 DS 的「内部客户」,DS 也不是 MX 的「零部件车间」,它们是两家在集团报表上并列的公司。 这套机制的好处,在市场理性的时候是明显的。半导体部门不会因为「自己人优先」而把高利润订单让给手机部门,从而在半导体周期里错过赚钱的窗口。MX 也不会为了照顾兄弟部门的利润率,而拒绝美光、SK 海力士的更优惠方案。 但代价是,碰到这种涨价完全不理性的内存超级周期,半导体业务和手机业务的需求指向完全相反的方向。 DS 想最大化每一颗 DRAM 的售价,MX 想最大化每一台手机的毛利。两边的利益曲线现在完全就是冲突的。 AI 客户不仅能够以市价买下所有的内存,而且能够接受随时变化的价格,而且其长期需求是已经确认的(包括英伟达、OpenAI、Anthropic 等都宣布了长达数年的吉瓦级数据中心基建项目)。 贪多嫌少,抓大放小。三星半导体的最优解就是把货卖给英伟达们,而不是按之前的长约价卖给 MX。 这是字面意义上的「兄弟阋墙」,用来形容如今的 DS 和 MX 毫不为过。 爆料人 Ice Universe 曾指出,三星半导体把 AI 客户当作真正的金主,却把兄弟部门的手机、平板等产品当成赔钱货。手机部门拿不到内存的长约,只能被迫接受三星、海力士、美光等供应商的「价格敲诈」,结果就是 S26 系列的成本结构恐难守住,可能会出现部门历史上首次亏损的情况…… 整个移动行业都在重新认识一件事:智能手机不再是供应链里被优先伺候的客户。 诚然,过去十年是手机的出货量推着内存厂扩产,是手机厂商的订单决定一颗 LPDDR 该用什么制程/工艺。但如今 AI 一来,一台英伟达服务器就要吃掉六、七千台旗舰手机的内存份额。供应链的优先级早已重写。 三星只是这个新秩序里第一个被摆在台面上的案例,讽刺的就在于,它恰好同时是世界最大的内存厂之一,以及世界第二大的手机厂。 集团内部长期奉行遵守市场规律,事业部独立核算的原则。这既是为了防止内部腐败,也能有效防止亏损部门拖累盈利部门。 但三星手机这次的确没想到,兄弟是真的「公事公办」,一字不差地执行啊……
AI智力天花板崩了!GPT-5.5 Pro视觉智商145,撞倒门萨俱乐部门槛
新智元报道 编辑:KingHZ 【新智元导读】1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。根据LisanBench最新跑分,GPT-5.5 Pro文本IQ 130踩上门萨会员线,视觉IQ直接飙到145,杀进天才区。一年前「LLM过不了130」还是技术圈共识,今天,这堵墙彻底被砸碎! 1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。 GPT-5.5 Pro,在线文本智商133,视觉智商145,线下非公开智商测试得分130。 这是AI第一次正式跨过门萨会员线。 门萨 130墙这一脚是最响的一脚,但绝对不会是最后一脚。 门萨,全球最古老的高智商社团,1946年成立,入会标准只有一条—— 智商IQ达到全人类前2%,分数线130。 普通人考几次都摸不到边的那条线,AI一次就过了。 而145,是门萨官网公开数据里「前0.1%」的位置,俗称天才区。 这并非孤例。就在本月初,GPT-5.4 Pro 已经在TrackingAI公开榜单上跑出150 IQ,登顶所有公开IQ跑分。 过去几个月里,也是OpenAI节奏从未停:视觉基座、推理升级、Agent产品线、API侧连环动作。 现在,AI赛场再次进入了OpenAI时代。 短板变王牌, OpenAI引爆认知视觉革命 更炸的是文本和视觉的差距:GPT-5.5 Pro在文本部分跑出130分,刚好压线进门萨,但视觉部分直接飙到145。 15分的差距,不是测试误差。 这意味着模型在「看图找规律」这件事上的能力,比「读题做推理」高出整整一个标准差。 按照门萨的分布,130是前2%,145是前0.1%。也就是说,把GPT-5.5 Pro的视觉能力拿出去和真人比,真正的千里挑一。 这里有个细节值得多说一句:为什么是视觉,而不是文本,先把墙撞碎的? 门萨Norway采用3×3九宫格格式(八张图+空缺第九张),完全非语言、非文化依赖,考察抽象推理。 人类高智商群体(尤其是140+「天才区」)确实依赖瞬间模式识别:旋转(rotation)、镜像/反射(mirroring/reflection)、叠加/增减元素(superposition/addition-subtraction)等变换规则。 LLM做这种题的标准方法,是先把图片转成token再推理。 但token化的过程,丢的恰恰是空间结构和拓扑关系——也就是这类题最核心的信息。 所以,过去十二个月,所有顶级模型在视觉题上都是这个状况:文本勉强及格,视觉一塌糊涂。 Claude 4.7、GPT-5.4 Pro全部卡在 125 以下。 GPT-5.5 Pro的145意味着:这不是在模拟思考,这是在重构智能。 过去我们嘲笑AI「不懂常识」,而现在,它正在以高于98%人类的智力水平,俯视着我们的常识。 OpenAI联合创始人、总裁Greg Brockman转发用户展示,力荐GPT Image 2将《物种起源》等书籍瞬间转为详细信息图,促进高效学习。 这揭示了人类文明的一个重大转折点:知识的摄入媒介变了。 数千年来,人类依赖文字这种低带宽的线性媒介来传递智慧。 但GPT-5.5告诉我们,未来的学习不再需要你花费三个月去咀嚼一本厚书,AI会通过对长文本的深度语义理解,将其重构为一种「视觉认知流」。 这是「语义重组」。 当AI的记忆力和上下文处理能力不再「健忘」,它就成了你大脑外的另一层皮质层。你不再是阅读知识,而是在俯瞰知识。 此外,ChatGPT现在一键直接把老旧破损的图片变成4K画质,而且免费! Restore this old photo into professional portrait of DLSR - quality colour and detail, using an advanced upscaling algorithm comparable to the results from canon EOS R6 II. Ensure the restored the image looks natural, retains exact facial features, has great clarity...... 「勤勉的小火车头」:说最温柔的话,做最狠的事 奥特曼用了一个极具迷惑性的词:「小火车头」(little engine)。 这个听起来甚至有些软萌的比喻背后,隐藏着 OpenAI 极度冷酷的商业意志。 昨天,OpenAI API新品登场:GPT-5.5及Pro版现已可用,显著提升智能水平和token效率,完美适配复杂任务场景,如编码、分析等高负载应用。 在LisanBench测试中,GPT-5.5是最强的双料非推理模型! 更令人胆寒的是, GPT-5.5的Token使用减少45.6%,智能分数却提升了1.77倍。 自从GPT-5以来,OpenAI模型的推理效率持续提升: 当前有效性比率排行榜中GPT 5.5独占鳌头: GPT 5.5(Medium):99.44% Opus 4.7 (xhigh): 99.35% Sonnet 4.6 (16k): 99.28% Opus 4.6 (16k): 98.74% Gemini 3.1 Pro预览版(低):97.77% 测试之后,AI行业分析机构SemiAnalysis坦承:在某些任务上的表现,GPT-5.5已经显著超越了所有其他模型。 在数学上,GPT-5.5表现最佳; 在编程上,GPT-5.5和Opus 4.7各有千秋; 在智能体任务上,Claude和GPT-5.5远胜于其他所有模型。 这意味着什么?这意味着 OpenAI 正在同时「垄断智力」和「降维成本」。 对于竞争对手,这几乎是一场无解的「降维打击」。 特别是,Claude系列这次迎来了真正的对手,只剩下「神话中的Myhos」尚能一战。 已经有Claude忠实支持者,转为OpenAI Codex用户。 当你的产品比对手聪明一倍,延迟却只有对方的一半时,市场规则已经失效了,剩下的只有收割。 但对于开发者来说,这种「诚恳的能量」却带来了一种「西西弗斯式的焦虑」。 OpenAI加速狂飙,每月一炸 上个月,OpenAI 才刚刚发布了一个模型,再之前是去年12月,以及去年11月。 OpenAI正以快速、稳健的步伐持续推出新模型,在Artificial Analysis智能指数上稳步前行。 AI仍在加速 ,指数效应开始显现,奇点触手可及! 在可预见的未来,这一趋势有望延续。 「我们在短期内看到了相当显著的进步,在中期内看到了极其显著的进步,」OpenAI首席科学家Jakub Pachocki 说。「事实上,我认为过去两年其实出奇地缓慢。」 Brockman表示,该模型也是朝着创建「超级应用」迈出的又一步。 所谓「超级应用」,就是一个像瑞士军刀一样的多功能程序。Brockman与联合创始人奥特曼此前曾设想将 ChatGPT、Codex 和 AI 浏览器整合到一个统一的服务中,为企业客户提供支持。 值得注意的是,「超级应用」也是Elon Musk热衷的话题。 OpenAI官宣的「Crisp Pace」——每月一炸的更新频率,让所有的集成、优化和 Prompt 工程都变成了一次性用品。你昨晚刚熬夜调优好的工作流,今天可能就被 GPT-5.5 的原生能力直接覆盖。 被压缩的窗口期 这件事的真正分量,不在跑分本身,在节奏。 去年视觉天花板还停在119。今年直接跳到145。中间没有过渡,没有预告,只有一行更新。 在这种速度面前,一切「熟练度」都正在贬值。 正如尤瓦尔·赫拉利所言,历史上第一次,我们无法预测20年后人类的就业市场是什么样。 但现在,这个窗口期可能被OpenAI缩短到了20个月。 那个「诚恳的小火车头」已经拉响了汽笛,它不打算等任何人。如果你感受到了颠簸,那是时代在换轨。 技能的半衰期正在被这种迭代速度反复缩短。不是十年,不是五年,是按月计算。
AI需求致苹果M4 Mac mini基础款缺货,二手平台溢价严重
IT之家 4 月 26 日消息,据 Techcrunch 报道,由于热门机型缺货,溢价严重的 Mac mini 正充斥 eBay 平台。这款设备现已成为运行 OpenClaw 等端侧 AI 模型的热门利器。 本周有消息称,售价 599 美元的 M4 芯片 Mac mini 基础版(16GB 内存 + 256GB 存储空间)已在苹果官网售罄,无法选择配送或到店自提。此后缺货范围进一步扩大至该基础款的其他内存配置版本,无论选配多大内存均无货。多家媒体指出,这是该基础款机型首次出现全面售罄的情况。与此同时,512GB 及以上大容量版本最快也要到 6 月才开始发货。 受此影响,eBay 已成为这款热门电脑的二手转售市场。平台上各配置版本的 M4 Mac mini 售价均高于苹果官方原价,而官方渠道目前已无现货可购。 苹果这款低功耗 Mac mini 已成为测试、运行端侧本地 AI 模型的热门设备。热潮最初由 OpenClaw 带起,如今还延伸至 ZeroClaw 等同类替代工具、Anthropic 与 OpenAI 推出的其他 AI 应用、Perplexity Computer,以及各类专用本地大模型。和部分台式机相比,Mac mini 运行噪音更低;相较于笔记本电脑,它更适合全天候不间断稳定运行。 据彭博社消息,此次 Mac mini 缺货,恰逢全球行业内存芯片紧缺,且苹果也计划对 Mac mini 产品线进行更新迭代。不过以往产品线更新,并未引发过如此大规模缺货。 供应链承压叠加适配 AI 设备需求暴涨,多重因素共振,推高了这类消费电子产品的转售价格。 截至当地时间周五上午,16GB 内存 + 256GB 固态硬盘配置的 M4 基础版 Mac mini 溢价严重:全新拆封机售价 715 至 795 美元,成色极佳的翻新机最高卖到 979 美元;同配置准二手闲置机型售价约 700 美元,比官方全新原价高出 100 多美元。 IT之家注意到,平台上还有一台同款 16GB+256GB 配置的全新 M4 Mac mini 标价 925 美元,商品页面还用醒目红字标注:最后一台。 即便密切蹲守或许能淘到价格尚可的翻新机,或是在 eBay 低价起拍的拍卖中捡漏,但在苹果供应链产能恢复前,这款设备的高需求大概率会维持高价走势。 随着 Mac mini 全面断货,苹果 Mac Studio 的市场需求也同步攀升,目前多款配置的 Mac Studio 同样已售罄。 科技媒体 Ars Technica 指出,配备 128GB 大内存、大容量固态硬盘的 MacBook Pro 仍可在数周内发货,就连新款热门机型 MacBook Neo 也只需两到三周即可配送。这也侧面说明,此次缺货的核心原因,是消费者对 Mac mini 本身的需求激增。
今天,OpenClaw能用DeepSeek-V4了!还设成了默认模型
备选标题: 1、官宣!能用DeepSeek-V4养龙虾了 2、OpenClaw正式接入DeepSeek-V4! 3、DeepSeek官宣,“龙虾”也能吃上DeepSeek-V4大餐了 4、养龙虾顶配方案来了?OpenClaw接入DeepSeek-V4 5、DeepSeek福利拉满!Token暴降75%,OpenClaw接入V4两大模型 作者 | 程茜 编辑 | 心缘 能用DeepSeek-V4“养龙虾”了! 智东西4月26日消息,今日凌晨,OpenClaw更新2026.4.24新版本,包括接入DeepSeek-V4两款模型,并将DeepSeek-V4-Flash设为新用户默认模型。 官方更新日志显示,DeepSeek-V4-Flash与V4-Pro已纳入OpenClaw捆绑服务目录,V4-Flash为新用户默认版本。DeepSeek-V4模型后续工具调用轮次的深度思考与推理复现机制已完成固化优化。 有网友在评论区称:“DeepSeek-V4-Flash很好用,非常棒的选择!” DeepSeek官方X账号也官宣了几项集成更新: Claude Code:模型切换为deepseek-v4-pro[1m],正式解锁100万超长上下文能力,适配长代码库、技术文档、产业长文本全量上下文处理。 OpenCode:版本升级至v1.14.24+,修复底层推理兼容问题,优化大模型代码生成、调试与工程化落地效率。 OpenClaw:迭代更新至v2026.4.24+,同步最新生态能力,强化智能体调度、Skill编排与异构算力适配。 除接入DeepSeek-V4外,此次OpenClaw的更新还包括: 1、集成谷歌会议工具 谷歌会议工具Google Meet现已作为捆绑接入插件接入OpenClaw生态,支持谷歌个人账号授权、Chrome/Twilio实时会话、Chrome双节点协同,同时提供文件成果、参会记录导出功能,以及针对已开启Meet标签页的故障恢复工具。 2、实时语音 文字沟通、语音通话与Google Meet现已支持实时语音循环,可调用完整OpenClaw智能体能力,依托工具联动输出深度应答。 3、浏览器自动化 浏览器自动化新增坐标点击能力、延长默认操作配额、支持单配置项无头模式自定义覆盖,同时优化标签页复用与恢复机制,运行更稳定。 4、轻量化启动 插件与模型基础设施启动轻量化优化,采用静态模型目录、清单文件驱动模型条目、依赖延迟加载,并为安装包提供外部运行时依赖自动修复能力。 网友称此次OpenClaw升级的几个点都很实用。 不过更多网友还是在评论区吐槽bug太多,有网友更新完遇到了网关无法连接、重启又陷入循环、不得不回滚、所有程序崩溃等各种各样的问题。 OpenClaw虽说版本迭代勤快、功能升级贴合实际使用需求,但其稳定性一直饱受诟病,不少用户升级后极易出现系统崩溃问题。此番其虽然快速接入了DeepSeek-V4两款模型,但用户想要稳定体验新模型能力,大概率还需要再观望一段时间了。 此外,从DeepSeek的更新也可以看出,其正在加速完成对Claude Code、OpenCode、OpenClaw等核心工具的深度适配,进一步强化其新模型在编程、智能体应用、复杂专业场景的实用性。
梁文锋把token价格打下来了!DeepSeek V4暴降75%,百万token只要两毛五
作者 | 程茜 编辑 | 心缘 智东西4月26日报道,昨晚,DeepSeek官网更新API文档,宣布DeepSeek-V4-Pro降价,开启2.5折限时优惠。 根据DeepSeek官网,调价后,DeepSeek-V4-Pro每百万Tokens输入价格(缓存命中)为0.25元,输入价格(缓存未命中)为3元,输出价格为6元。此次优惠活动将持续至5月5日23点59分。 相比几家国内大模型企业的API价格,DeepSeek优惠后的价格仍有一定优势,价格对比如下: DeepSeek发布,对国内大模型企业的股价造成冲击,智谱和MiniMax均跌超9%。截至4月24日港股收盘,智谱股价跌9.05%,至每股935港元(约合人民币815.78元),是指为4169亿港元(约合人民币3637.41亿港元);MiniMax股价跌9.44%,至每股777.5港元(约合人民币678.36元),是指为2439亿港元(约合人民币2128亿港元)。 这个周末,DeepSeek的产业影响力还在蔓延。截至今日,据智东西不完全统计,已经有华为昇腾、寒武纪、海光信息、摩尔线程、昆仑芯、平头哥真武、沐曦股份、天数智芯、燧原科技、壁仞科技、云天励飞、清微智能等12家国产芯片企业以及英伟达均已适配DeepSeek-V4模型。 华为云、腾讯云、阿里云、百度智能云、天翼云、京东云、联通云、移动云等8家云巨头,PPIO派欧云、超算互联网、优刻得等3家独立云及智算企业,宁畅、长江计算、百信、昆仑技术、新华三等5家服务器企业均已适配或上架DeepSeek-V4模型服务。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。