行业分类:
加载中...
头条分类:
加载中...
OpenAI大神教你如何榨干Codex
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 新晋员工确实毫无保留。 Jason Liu,13k星开源库Instructor的作者,刚被OpenAI招进Codex团队没多久,不仅在社交平台大方发API额度; 还写了篇Codex-maxxing,把自己的Codex玩法全抖出来了。 而且是让Codex自动跟进亚马逊退款、定时扫Slack接需求、开着Heartbeats在你洗澡的时候帮你干活的那种。 Codex周活用户4月底已经破了400万,终于来了份“官方使用指南”。 正好,这两天Codex又更新了一波:Appshots截图直喂、Goal模式正式转正、锁屏后也能远程干活。 跟Jason的使用心法叠在一起看会发现,现在大家比拼的,是谁能持续工作更久,谁能真正上岗了…… 让它自己跑起来 Jason整套玩法的核心,是把Codex改造成了一个能长期运行、持续接管任务的工作系统。 多数人习惯单次问答结束就关闭会话,但Jason是开着一堆跨月存活的巨型线程,不会随意终止。 他给每个工作流一个置顶线程:管日程的一个、管开源项目的一个、监控社交平台的一个……通过Command-1到Command-9一键跳转。 线程里积累了几个月的对话历史、偏好和决策,再次使用时不用重新交代背景,Agent就能自动承接进度。 当线程生命周期被拉长后,项目背景、沟通习惯和历史决策都会自然沉淀进去,Agent开始具备连续性。 而且Jason下任务不打字,主要靠说。 在他看来,口述能完整保留原始思路,不需要刻意优化Prompt,可以直接把模糊、跳跃、带溯源需求的想法原样丢给Agent。 再配合Codex的Steering功能,还能在Agent执行任务时插队追加指令,说完就走,不用干等。 不过,真正让Codex从工具变员工的,是Heartbeats+@computer这套组合拳。 Heartbeats本质上相当于给Agent加了一层定时任务调度。 Jason有个Chief of Staff线程,每30分钟跑一次—— 扫一遍Slack和Gmail,看看有没有需要回复的消息,判断优先级,需要回复的先起草一份草稿,但不发送,最终由人来决定是否发出。 他还举了一个更复杂的例子是,做动画项目时,他会先把视频发到Slack审阅线程,然后让Codex每15分钟检查一次线程。 如果同事提了反馈,Codex就重新渲染一个新版本并回复到线程里。 因为Slack MCP服务器还不支持文件上传,Agent甚至会自己调用@computer去点“Add file”按钮,把渲染好的文件传上去。 还有一次,Jason在洗澡前让Codex盯着亚马逊客服排队状态,结果等他洗完澡出来,退款已经到账了。 类似的流程,现在已经能扩展到Google Docs评论、GitHub PR Review等场景,只要有反馈就自动推进下一步。 Jason最强调的一点,是验证机制,可以判断任务什么时候终止。 他试过让Codex把Python的Rich库完整迁移到Rust,硬性要求是必须通过原Python库的所有单元测试。 测试能不能通过,决定了任务是否完成;失败了,Agent就继续修。 用他的话说: 没有验证机制的野心,顶多算个愿望而已。 而在最新的这次更新中,OpenAI已经把Goal模式从实验版本转正了。 你只要明确一个最终目标和验收标准,Codex会自主持续推进,短则几小时长则数天,中途可以查进度、调方向,也可以直接暂停。 但前提是任务本身必须存在清晰、可验证的反馈闭环。 记忆放在自己手里 Jason这套用法的另一大核心思路,是个人工作记忆不应该托管在平台内部。 他所有的长期线程都从一个Obsidian vault起步,目录划分为TODO、people、projects、agent、notes等板块。 在顶层AGENTS.md里写明规则:人员信息更新、项目推进、待办办结等变动,都要同步更新知识库对应内容。 也就是说,他几乎放弃了Codex的内置记忆系统,把核心记忆数据存放在本地可控文件中,既能随时查阅手动修改,也能通过版本对比查看变动,出现问题还能一键roll back。 原因是AI承载的记忆体量越大,就越不该把数据锁死在单一平台。 而文件是完全属于用户自己的,后续想换工具、迁平台,拎着知识库就能走,毫无顾虑。 他也提到了Codex自带的记忆功能Chronicle,通过截取屏幕内容来构建上下文。 但这是需要手动开启的实验预览功能,在权限、速率和隐私方面存仍在短板,整体方向可行但还不够成熟。 所以,在他看来,文件系统仍然是最可靠的记忆基础设施。 而且Codex工作台本身也在升级。 Codex的侧边栏不再局限聊天交互,可直接渲染Markdown、筛选表格、阅览PDF与PPT。 Agent还能通过内置浏览器用JavaScript控制网页,用户可以边看边标注,不用来回切窗口。 Jason说他经常在侧边面板里同时打开Storybook审阅UI组件、用Remotion Studio做动画、用Slidev做演示文稿。 而他最喜欢的交付形式,就是一个带JS和CSS的单文件index.html,不用部署,不用服务器,打开就能跑。 另外,他还把Connectors和Skills作为可复用工作流模版。 只要成功做完一件有用的事,就把流程打包起来,下次Codex不用重新学,直接调用就行。 最近Codex还补了一手远程能力,电脑锁屏后Codex可以继续工作,手机端也能实时查看、审批甚至接管任务。 现在好了,你下班它加班,你锁屏它干活,超额KPI这不就来了…… 不过,当AI可以持续接管工作,人自己倒是越来越轻松了(doge)。
谷歌Gemini杀入科学界!一日两登Nature,AlphaFold只是开胃菜
新智元报道 【新智元导读】Google把科学研究的三个核心瓶颈:假设生成、计算发现、文献洞察拆解为三个可由AI深度辅助的模块,并同日发表两篇Nature论文,为假设生成和计算发现两大环节提供支撑。 5月19日,在Google I/O的窗口期,Nature同日上线两篇论文。 一篇介绍ERA(Empirical Research Assistance,经验性研究助手),这是一套由大模型加树搜索驱动的系统,目标是让AI自动写出用于计算实验的专家级科学软件。 另一篇介绍Co-Scientist(AI 合作科学家),这是一套多智能体架构,让AI持续生成、批判、细化科研假设,随测试时计算量扩展,假设质量持续提升。 两篇论文的发布方均是Google。发布的时间点,也选在了Google官方宣布「Gemini for Science」工具集上线的同一天。 https://blog.google/innovation-and-ai/technology/research/gemini-for-science-io-2026/ 两篇论文同日登上Nature,与Gemini for Science工具集的发布同一时刻落地,释放出这样一个信号:Google是在用同行评审为整套工具链做信用背书。 这是AlphaFold之后,Google在科学领域推出的又一项重磅成果。 一日两篇Nature Gemini接管两段科研流水线 紧跟在两篇论文后面的,是一份100多家机构的名单。 Google官方称,已与100多家机构合作验证新系统和工具,包括斯坦福大学、帝国理工学院、Crick Institute(克里克研究所)、ICML、STOC、NeurIPS、美国国家实验室等。 同时还建立了由博士生、产业研究员和诺奖得主等组成的「可信测试者」社区,并与 ICML、STOC、NeurIPS等会议试点同行评审辅助工具。 Google在推出AI工作台的同时,还发出两篇Nature论文,为整套工具链做信用背书。 先看ERA论文。 https://www.nature.com/articles/s41586-026-10658-6 ERA的定位是经验性研究助手,主要任务是替科学家写出专家水准的实验软件。它的底层是大语言模型加树搜索,目标是把一个质量指标拉到最高。 这套系统在Nature论文里交出了一份亮眼的成绩单: 生物信息学方向,ERA独立发现了40种新的单细胞数据分析方法,在公开榜单上跑赢所有人类提交的方法。 流行病学方向,ERA在传染病住院数预测任务上产出14个独立模型,全部超过CDC的集成模型。 此外还覆盖地理空间分析、斑马鱼神经活动预测、数值积分,这些都是Nature论文里可复现的实验。 ERA论文中写道,这套系统不只是会跑代码,它能把外部的研究思路吸进来,组合出专家水准的解法。 再看Co-Scientist。 https://www.nature.com/articles/s41586-026-10644-y Co-Scientist是基于Gemini的多智能体系统,核心机制是「点子锦标赛」(idea tournament)。 多个智能体之间不断生成、辩论、批判、细化假设,再用测试时计算扩展(test-time compute scaling)持续提升假设质量。 论文重点验证了三个生物医学场景:药物再利用、新靶点发现、抗微生物耐药机制解释。 其中急性髓系白血病(AML)的药物再利用候选和协同组合疗法,已经在体外实验中得到验证,验证方包括斯坦福医学院的研究者。 两篇论文都瞄准了科研最耗时的两个环节,一个是写计算实验软件环节,另一个是生成可验证的科研假设环节。 三个Labs原型 把科学方法拆成三段 除了Nature论文之外,这次Google还同步开放了三个Labs实验原型,对应科学方法的三个核心环节。 第一个是Hypothesis Generation(假设生成),底层是Co-Scientist,有Nature论文支撑。 多个智能体之间通过点子锦标赛生成假设,每一条主张都附带可点击的citation(引用溯源)。 Co-Scientist多智能体系统的工作循环:生成、辩论、进化假设三个阶段,由Generation、Reflection、Ranking、Evolution、Meta-review、Proximity、Supervisor等多个专门智能体协作完成 第二个是Computational Discovery(计算发现)。 底层是AlphaEvolve加ERA,ERA论文刚登上Nature,AlphaEvolve则有Google DeepMind自家独立背书。 这套引擎并行生成数千个代码变体,每个变体自动评分,让原本要靠人工耗时数月摸索的复杂建模路径被压缩到机器搜索的范围里。太阳能预测和流行病学是Google官方点名的两个场景。 第三个是Literature Insights(文献洞察)。 底层是NotebookLM,目前没有Nature背书,定位是早期预览。功能上把文献结构化成可搜索的属性表格,能直接产出报告、幻灯片、信息图、音视频概览。 除了工作台之外,Google还发布了一套Science Skills,集成了30多个生命科学数据库和工具,包括UniProt、AlphaFold Database、AlphaGenome API、InterPro等。 这套Skills跑在类似Google Antigravity这种智能体平台上,可以把过去要在十几个数据库之间来回跳的结构生物信息学和基因组分析流程,拼成一个链路。 Google研究团队的早期测试里,Science Skills在AK2基因相关的罕见遗传病分析中产出了关于潜在机制的新洞察。一项本来要数小时的复杂分析,被压到分钟级。 Google Antigravity在Science Skills加持下分析AK2基因变体的实际操作画面,整个工作流用自然语言指令在分钟级完成 百年化工巨头多次失败的问题 这样解决了 除了两篇Nature论文背书之外,Google还甩出了另一张牌:BASF农业解决方案。 BASF面对的问题足够复杂:180个生产基地、5000多条价值链,单一产品的物料清单有时深达30层,横跨不同生产地点和区域。 人类规划员每天要做数千个本地决策,但没有人能实时看清局部决策如何影响整张全球供应链网络。 BASF高级供应链副总裁Goetz Krabbe说道,「此前我们多次尝试用确定性模型建数字孪生,均告失败。」 Google的目标并非让AI取代人类决策,而是建立一套决策支持体系。 他们给AlphaEvolve输入了一段「种子程序」,作为基础规划逻辑,再喂入三年历史数据,包括库存水平、市场需求和实际产出记录。AlphaEvolve开始生成代码变体,自动发现供应链运作的内在规律。 最终,AlphaEvolve自动提炼出了三条在传统建模中需要领域专家手工编码的规则: 生产整合(如何把小批量生产合并以优化产线时间);动态安全库存(如何用参数处理季节性波动);网络级协调(如何映射不同生产层级之间的依赖关系)。 相比最初的种子模型,最新一轮AlphaEvolve的运行结果在准确率上实现了超过80%的相对提升。 BASF下一步要用这套数字孪生覆盖整个全球生产网络,作为情景预测和优化的基础。 据Google官方称,Daiichi Sankyo、Bayer Crop Science和美国能源部旗下的国家实验室(Genesis Mission项目)也已接入Co-Scientist。瑞典金融科技公司Klarna则用AlphaEvolve把一个大型Transformer模型的训练速度提升了一倍,同时改善了模型质量。 争夺「可信验证」的入场券 Nature论文,只是Google在「AI for Science」整套布局里抢占信用制高点的一个重磅动作,目的是给工具链增加一层科学社区背书,让研究者面对系统时有一个「这经过同行评审」的心理锚点。 Google目前公开的合作机构已经超过100家,覆盖斯坦福大学(肝纤维化方向)、Imperial College London(抗菌素耐药性方向)、Crick Institute(多年合作项目)。 可信测试者从博士生一路覆盖到诺贝尔奖得主,每个人都在真实科研场景中给系统找漏洞。 更值得关注的是Google正在推进的一件相关事件:与ICML、STOC、NeurIPS等顶级学术会议合作,开发智能体同行评审工具PAT(Paper Assistant Tool,论文助手工具)和ScholarPeer。 这意味着科学可信度基础设施,正在成为新的竞争场地:谁的AI建议能被引用,谁的假设经得起审计,谁的系统能被顶级期刊工作流接入,谁就能在未来的科研生态里扎根。 OpenAI 4月推了GPT-Rosalind,主打生物学、药物研发和转化医学的前沿推理。 Anthropic把Claude for Life Sciences接入AWS Marketplace,对接Databricks和Snowflake做大规模生物信息学分析。 Google这次压上了Nature论文、100多家机构、ERA和Co-Scientist。 三家公司都把「科学」单独拆出来做成了产品线。接下来竞争的,将是哪个平台的工具链能成为科学家信赖并依赖的首选。
豪掷105亿,曾毓群盯上AI算力龙头,还要投DeepSeek
作者 | 程茜 编辑 | 心缘 智东西5月23日报道,据The Information昨晚报道,全球动力电池市场龙头宁德时代拟入局DeepSeek首轮融资。这是宁德时代在AI领域被曝出的最新布局。 就在刚刚过去的一个半月内,宁德时代官宣斥资105亿元加码AI算电协同赛道,电力、算力、储能、AI一体化全产业链布局全面落地。 5月13日,中国首家在美股上市的IDC公司世纪互联发布公告,宁德时代关联资本方将以约9.42亿美元(约合人民币64.03亿元)入股,拿下约38.1%股份;4月9日,宁德时代以约41亿元入股智算中心HVDC市场龙头中恒电气,拿下中恒电气控股股东49%的股权。 这也意味着,宁德时代实现了算力机房、电力、储能的核心赛道全覆盖。 这两大重磅投资迅速引爆资本市场,宁德时代、世纪互联、中恒电气行情拉升。世纪互联5月13日盘中一度飙涨超30%,截至当地时间5月22日收盘,其股价为每股9.54美元(约合人民币64.82元),市值为27.16亿美元(约合人民币184.55亿元);中恒电气4月9日股价为每股31.93元,至今上涨了63.14%为每股52.09元,总市值293.56亿元。 ▲世纪互联、中恒电气股价变化(图源:腾讯自选股) 事实上宁德时代入局算力领域早已于去年开始布局。去年7月和10月,宁德时代旗下投资平台参投能源大模型公司达卯科技,并联手商汤落地AIDC算电协同平台,抢占算力能源智能化调度市场。 去年9月至今,宁德时代在A股的股价已上涨超60%,截至5月22日收盘,其股价为每股411.16元,总市值达到1.9万亿元。 ▲宁德时代A股股价变化情况(图源:腾讯自选股) 算电协同,正成为AI产业发展的新风口。 今年3月全国两会期间,政府工作报告首次将算电协同列入新基建重点工程,与超大规模智算集群并列。 4月,四部门联合发布《关于促进人工智能与能源双向赋能的行动方案》,提出“到2030年,全国算力枢纽节点绿电应用占比须达80%以上”的具体目标。 可以看出,借力AI算力风口,宁德时代正在寻找第二增长曲线,从电池巨头向算力时代能源基建巨头全面转型。 其战略在2024年11月就已明确,宁德时代创始人、董事长曾毓群在接受外媒路透社采访时提到,宁德时代计划打造大型独立能源系统,使得供电能力足以支撑超大型数据中心甚至整座城市。 伴随百亿资金落地,宁德时代这场跨界大棋局,已经全速起航。 01. 斥资64亿元 入局国内头部IDC公司 上周斥资64亿元,是宁德时代跨界数据中心的最新布局。 5月13日,世纪互联宣布,宁德时代关联资本方将以约9.42亿美元(约合人民币64.03亿元),收购其约38.1%的股份,本次投资交易预计将于2026年第四季度完成交割。 买方为PJ Millennium I、PJ Millennium II,卖方为山东高速控股集团旗下的Success Flow与Choice Faitt。买方将向卖方购买世纪互联总计最多6.504244192亿股A类普通股(本次拟投资交易),每股普通股现金价格为1.4486美元(约合人民币9.8522元),折合每股美国存托股份8.6914美元(约合人民币59.1119元)。 买方的两家公司为PJ Millennium Partnership的全资子公司,该合伙企业的普通合伙人Lochpine BG I GP,为宁德时代的非控股、非合并报表关联主体。这意味着宁德时代的报表不会体现这笔投资,合规压力可能较小。 ▲世纪互联公告(图源:世纪互联官网) 成立于1996年的世纪互联来头不小。其官网显示,世纪互联是中国第一家美股IDC上市公司、国内唯一一家以“基地型+城市型”IDC业务同步发展的头部IDC企业,目前已经在全国30多个城市运营超过50座数据中心,基地型业务运营容量889MW,城市型业务运营机柜数超49000个,端口容量达4T以上。 世纪互联的数据中心业务是耗电大户,而宁德时代做的就是电池生意。 再加上世纪互联如今已经拿下多个大单。根据世纪物联披露的数据,该公司在2025年第四季度成功赢得五笔订单,总容量达135MW。除上季度已披露的32MW订单外,其长三角的数据中心再次获得互联网客户的12MW订单,环京地区的多个数据中心获得来自云计算客户、智能驾驶客户、互联网客户的订单共91MW。 今年4月,在世纪互联成立30周年之际,该公司宣布其战略重点将聚焦于算电一体,包括在基地型与城市型布局中探索不同场景下的算电协同方式;在算粒、电粒与智粒的协同中提升资源调度能力;在绿色直流路径下优化能效,提升系统稳定性。 02. 一月前砸下41亿 押注智算中心直流供电 除了上面这笔大额注资,今年4月,宁德时代还以约41亿元入股中恒电气的控股股东中恒科技投资。中恒电气的角色是数据中心的“电力心脏”。 4月9日,中恒电气在深交所发布公告,宁德时代拟以约41亿元入股中恒电气的控股股东中恒科技投资。 其中,宁德时代将以旗下时代天源99.7%股权作价近12亿元,其余以现金支付。拟议增资完成后,中恒科技投资注册资本将变更为2941万元,其股东朱国锭、包晓茹和宁德时代分别持有中恒科技投资35.70%、15.30%、49.00%股权。 ▲中恒电气公告(图源:深交所) 中恒电气成立于1996年,国内数字产业咨询机构科智咨询的数据显示,在2025年我国智算中心HVDC市场,中恒电气以‌31%的市占率‌位居第一。 该公司已落地的800V直流供电(800VDC)旗舰产品,是解决当下数据中心供电瓶颈的有效解法。 今年5月,英伟达在其技术博客中明确提到,2027年,800V HVDC数据中心将与NVIDIA Kyber机架级系统同步全面投产。当下数据中心需求旺盛,机柜功率密度不断提升,单机柜功率从2022年的36kW跃升至2025年的200kW,并预计于2027年达到600kW甚至MW级,这种变化迫使智算中心供电架构向直流800V加速演进。 中恒电气的财报显示,该公司已经中标阿里巴巴自建机房及多个第三方合建机房的电源系统、腾讯自建机房及多个第三方合建机房的弹性直流系统项目、精密配电产品中标字节跳动自建机房及多个第三方合建机房项目、HVDC电源中标中国银行金融数据中心项目。 ▲中恒电气解决方案已落地的阿里巴巴数据中心(图源:中恒电气官网) 其数据中心电源收入在业务中占比最高,达36.3%,收入金额7.76亿元,同比增长16.1%。 03. 参投智算中心“AI大脑” 联手商汤建AIDC算电协同标杆案例 宁德时代的另一个布局更为早期。去年10月,宁德时代旗下产业投资平台溥泉资本参投了达卯科技的近亿元A+轮融资。 达卯科技成立于2021年3月,其主攻方向是用能源大模型帮算力基础设施进行预测、动态决策和实时调度,也就是智算中心、通算中心与超算中心等的“智慧大脑”。2025年10月的这笔融资公布时,达卯科技称将这轮资金用于能源大模型、算电协同平台及相关智能体等核心技术的自主研发及商业化推广。 值得一提的是,就在这笔融资公布的三个月前,也就是去年7月,达卯科技联合商汤、宁德时代旗下溥泉资本发布了落地于商汤临港智算中心的AIDC算电协同平台。 这一平台整合了商汤自研多模态基座大模型、达卯科技的能源大模型及宁德时代储能技术,通过异构算力弹性调度平台和动态柔性能源调度平台的整合能力,结合商汤智慧运维平台的全量数据,打造从“数据-算法-策略-执行-验证”的全链条智能调度系统。 该平台实现了全年节约用电300万度,基于能量块的模型能源需求预测准确率已经达到88%以上,决策准确率已达到93%以上。 ▲AIDC算电协同平台架构图(图源:商汤公众号) 其中,达卯自研的能量操作系统(EOS)整合能源大模型、AI Agent及自适应调度技术,形成了“预测-调度-交易”一体化能力。 达卯科技此前还获得商汤科技天使轮和寒武纪A轮融资,这也意味着其背后实现了芯片、算法、储能的协同。 04. 结语:算力大战背后 能源巨头正抢占算电一体化先机 宁德时代在AIDC能源领域的布局呈现出清晰的系统性。从底层储能电芯、高压直流供电设备,到实体算力机房资源,再到顶层智能调度平台,自上而下打通全链路环节,形成储能变电、电力输送、算力承载、智能调控的闭环。 曾毓群在接受路透社采访时也提到,他认为(下一代AI工厂标配的)零碳电网开发与运营业务的市场规模,或将是电动汽车动力电池供货业务的十倍。因此,除宁德时代外,还有阳光电源、特变电工等企业也纷纷从能源侧跨界AIDC、算电一体化。 这也印证,AI算力竞争与能源供给能力息息相关,一众能源企业顺势切入算力赛道,提前卡位AI时代核心底层资源。
谁愿刚买就降价!15家车企发布调价公告:车市该跟价格战说再见了
快科技5月23日消息,官媒《经济日报》今日发文明确表态,国内车市是时候和持续多年的无序价格战正式说再见了。 今年二季度开始,一波覆盖传统车企与新势力品牌的涨价潮正在行业内悄然酝酿。 截至5月中旬,比亚迪、特斯拉、小米、蔚来、小鹏、极氪、星途等15家新能源汽车品牌已经先后发布调价公告,或是直接收紧了此前给出的终端购车优惠。 车企选择上调售价绝非主动谋利,而是当前行业环境倒逼之下的必然选择,上游原材料成本的刚性上涨,已经实实在在击穿了不少车企能承受的成本底线。 今年以来,动力电池的核心原材料碳酸锂价格从每吨约11万元一路飙升至18万元左右,涨幅直接突破60%。要知道动力电池的成本占到整车成本的三成到四成,仅这一项成本上涨,一台中型电动汽车的造车成本就要直接多出5000元。 除此之外,车规级存储芯片价格大幅上调,铜、铝等大宗金属原材料价格持续走高,都在从不同维度抬高造车的综合成本。 叠加新能源汽车购置税从全额免征退坡至减半征收,政策红利的逐步消退,相当于又在成本端给所有车企增加了一层额外压力。 一边是成本持续攀升,另一边是售价没法同步跟上,整个行业的利润空间正在持续被压缩。 5月初上市车企的一季度财报陆续披露完成,梳理A股及港股上市乘用车企业的核心财务数据就能发现,大部分车企的归母净利润都出现了同比下滑。 今年一季度,国内整个汽车行业的平均利润率仅为3.2%,远低于国内制造业6%的平均水平。汽车产业的长期发展高度依赖持续的技术创新,企业如果拿不到合理的利润,就没有足够的资金投入到后续研发环节,技术迭代与产品创新自然就成了无源之水。 更值得关注的是,普通消费者对行业价格战的态度也在发生明显转变,无底线的低价竞争已经开始反噬消费者的购车信心。 最新发布的2026麦肯锡中国汽车消费者洞察显示,过去一年内完成购车的消费者里,对价格战持消极态度的比例达到22.2%,已经超过了持积极态度的16.5%,整体净负面感受达到5.7%。 越来越多消费者购车时的第一顾虑,就是怕刚提完新车,品牌就官宣大降价导致车辆快速贬值,不少人甚至会直接抱着晚买更划算的观望心态,尤其是选购高端车型的用户,这种观望情绪会更明显。几乎没有消费者愿意刚花大价钱入手新车,转头就被官方的大幅降价政策背刺。 这一轮部分车企做出的试探性涨价动作,并不意味着车市价格战的硝烟会立刻完全散去,但或许预示着整个行业正在站上一个全新的历史节点。当企业不再为了争抢短期市场份额赔本赚吆喝,转而把竞争重心从价格比拼回归到技术、质量、服务等核心价值层面。 那些具备强创新力和品牌积淀的车企会获得更突出的竞争优势,缺乏产品核心亮点、单纯依靠低价生存的车企也会更快被市场淘汰,推动各类资源要素向先进生产力和优势主体集聚,最终重塑整个车市的运行生态,真正推动汽车产业向高质量方向发展。
Mythos首个报告出炉:全球数十亿设备裸奔!30天挖出10000致命漏洞
新智元报道 【新智元导读】A厂的玻璃翼计划首战告捷,Mythos 30天内就挖出1万个致命漏洞,甚至拦截了150万美元电诈!面对雪片式的报告,人类程序员也崩溃求饶了:「求别挖了,根本修不完啊!」 就在刚刚,Anthropic又发布了一条震撼全球科技圈与安全圈的消息。 「玻璃翼计划」的首月战报,正式公布了! 在这场秘密行动中,Anthropic首次动用了下一代顶级大模型——Claude Mythos Preview。 在短短30天内,它联合了全球约50家网络巨头和关键基础设施软件开发方,一口气揪出了超过10,000个高危或严重级别的软件漏洞! 更恐怖的是,它不仅能找漏洞,还能「端到端」自动构建攻击链。 甚至在某家合作银行的真实业务中,成功拦截了一笔150万美元的电诈! 一时间,整个安全圈彻底震了。 有安全专家甚至在X上绝望惊呼:「互联网底座被AI翻了个底朝天……我们可能真的要凉了!」 疯狂的30天 全球科技巨头亲身体验,Mythos究竟多恐怖 2026年4月,Anthropic秘密启动了Project Glasswing。这个名字的寓意,是希望世界上最重要的闭源和开源软件变得透明且安全。 首批加入该计划的,是约50家关键基础设施软件开发方。 当他们拿到Claude Mythos Preview的测试权限后,短短一个月内,整个行业的三观都被震碎了。 来看看这份闪瞎眼的战报—— Cloudflare报告,在极度关键的核心路径系统中,Mythos一口气挖出了2000个漏洞!其中有400个属于高危或严重级别。 更离谱的是,Cloudflare的安全团队惊呼:这个AI的误报率,甚至比人类顶级安全测试员还要低。 在Mozilla最新的Firefox 150浏览器测试中,Mythos一口气修复了 271个高危漏洞。 这个数字是此前在Firefox 148版本中使用Opus 4.6所发现漏洞数的10倍以上! OpenBSD报告的战绩简直让人毛骨悚然:Mythos在OpenBSD的代码库中,竟然揪出了隐藏了整整27年的陈年老Bug! 而且,模型甚至不需要人类插手,自己就构建出了完整的漏洞利用链。 英国AI安全研究所则给出了官方背书。他们确认,Mythos Preview是全球首个能够端到端完全攻克他们设置的双重网络靶场的AI模型。 Mythos在实战防御中,Mythos也大显神威。 在一家合作的银行中,一个黑客团伙已经成功入侵了客户的电子邮件,并使用了AI语音克隆技术拨打了欺诈电话。 就在这笔高达150万美元的电汇即将被转走的千钧一发之际,Mythos模型通过实时分析异常行为链路,瞬间识破了骗局并强行阻断了交易! 「我们这群人类安全专家,看起来就像是拿着长矛的原始人,看着一架F-22战斗机从头顶飞过。」 一位参与内测的安全研究员在X上感叹道。 全球数十亿台裸奔设备,被Mythos挽救了! 然而,Mythos也掀起一场产能危机。 在过去,网络安全界的核心瓶颈是发现漏洞。找到一个高危零日漏洞,顶尖白帽黑客可能要花上几个星期甚至几个月。 而现在,Claude Mythos把寻找漏洞的成本和时间直接打到了「无限趋近于零」。 Anthropic用它对全球1000多个支撑着互联网运转的核心开源项目进行了扫描。结果令人头皮发麻—— 总共扫出 23,019 个漏洞,其中包含由Mythos评估的 6,202 个高危或严重漏洞! 为了确保不是AI在「胡言乱语」,Anthropic联合了6家全球顶尖的独立安全研究公司进行人工交叉复核。 结果证明:AI的真阳性(即漏洞真实存在)准确率高达90.6%! 最终确认其中有1,094个是铁证如山的高危或严重漏洞。 开源漏洞仪表盘,显示所有严重程度的漏洞 这里必须提一个极其典型的案例——wolfSSL。 wolfSSL是一个极其著名的开源密码学库,全球有数十亿台设备(包括物联网设备、路由器、智能汽车等)都在使用它。 然而,在Mythos面前,wolfSSL的防线形同虚设。Mythos不仅发现了一个极其隐蔽的逻辑漏洞,它甚至自己动手写出了一套攻击代码! 利用这套代码,黑客可以随意伪造数字证书,造出极其逼真的银行网站或者邮箱登录页,没有任何破绽。 如果这个漏洞没有被Mythos提前发现并提交修复,一旦被黑产利用,后果不堪设想。 全球数十亿台设备,其实一直都在危险边缘裸奔。这一次,是Mythos拉了回来。 史诗级反转:找bug不再是瓶颈,修bug才是! 随着Project Glasswing的推进,一个网络安全历史上从未出现过的奇葩现象诞生了。 「网络安全的瓶颈不再是寻找漏洞。现在的瓶颈是:人类修复漏洞的速度,远远跟不上AI发现漏洞的速度。」 对于开源社区维护者来说,这简直是一场噩梦。 Anthropic的漏洞报告就像雪片一样飞向各大开源社区。作者们已经招架不住了。 「别挖了!求求你们放慢速度!我们真的修不过来了!」 据Anthropic透露,近期有多位开源维护者发来「求饶」邮件,请求他们放缓漏洞披露的节奏。因为人手严重不足。 即使收到详细报告,人类程序员平均修复一个高危漏洞,依然需要整整两周的时间。 目前,Anthropic提交给开源作者的1129个漏洞中,目前只有75个高危漏洞被成功打上补丁。当前安全生态系统已经严重超载! 魔法打败魔法:Anthropic的防御 既然人类已经修不过来,那就用魔法打败魔法。 Anthropic果断抛出了「防御者工具包」方案。 首先是重磅上线的 Claude Security。 这是专为Claude企业版客户打造的自动化神器。它的逻辑是:我不光帮你找出代码库里的漏洞,我还直接把修复补丁给你写好。 上线仅三周,企业客户就已经用Opus 4.7光速修复了超过2100个漏洞! 其次是「网络验证计划」。 Anthropic开始允许专业的白帽子、渗透测试员和红蓝对抗团队,在合法合规的前提下,解除Claude模型的一些「安全紧箍咒」,用于合法的漏洞研究和靶场测试。 更有意思的是,Anthropic直接开源了一套「抓BUG流水线」。 1 定制化指令(Skills): 教你怎么让AI保持专注,进行深度的代码审查。 2 自动化框架(Harness): 一个能让Claude自动遍历庞大代码库、克隆子代理并行扫描、自动分拣漏洞并生成报告的指挥系统。 3 威胁建模生成器(Threat Model Builder): 直接把代码丢进去,AI会自动识别系统里最容易被攻击的「软肋」,优先安排重点防御。 网络巨头思科也站了出来,宣布开源「Foundry Security Spec」系统,搭建类似于Mythos的安全评估防线。 从此,就是AI发现漏洞,再用AI生成补丁,人类只负责最后审核。 这,才是未来网络安全的终极形态。 达摩克利斯之剑:Mythos究竟何时公开发布? 所以,Claude Mythos究竟什么时候正式开放? Anthropic目前的态度依然非常谨慎。 他们表示,一旦构建出「更强大、更高级别的安全护栏」,Mythos级模型必将全面推向公开发布! 现在还不能放出来,因为它实在太危险了。 正如XBOW的测试报告所言:Mythos Preview在Web漏洞利用基准测试上实现了「对所有现有模型的跨代级大幅领先」,甚至在每一个Token的生成上都展现出了「绝对史无前例的精确度」。 Anthropic非常清楚,目前世界上没有任何一家公司拥有足够强大的安全机制,能100%确保这个模型不被滥用。 如果今天就把Mythos的API公之于众,明天全球的黑客组织、甚至某些极端组织,就能以极低成本批量生产出成千上万个Zero-day利用工具。 普通人的电脑、医院的系统、电网的控制中枢,将面临一场浩劫! Anthropic给出的建议是: 1 缩短补丁周期!缩短补丁周期!缩短补丁周期! 别攒着一个月发一次更新了,利用现有的AI工具(如Opus 4.7),尽快把安全修复推给用户。 2 强制升级策略。 开发者必须让用户尽可能无脑地安装更新,对于那些死活不升级的用户,采取强制断网。 回归安全基本功。 3 强化多因素认证(MFA)、加固默认配置、保留详尽的日志。风暴前夕的平静 风暴前夕的平静 一个月,超50家巨头联手,10000+致命漏洞,拦截150万美元电诈……这仅仅是Claude Mythos Preview小试牛刀的战绩。 现在,人类程序员在经历阵痛期——被AI报告淹没,修补潜伏二三十年的bug。 但正如Anthropic在所展望的那样—— 「跨越这些风险之后,一个令人振奋的世界正在向我们招手:在那个世界里,人类重要的代码将被淬炼得比今天坚固百倍,而黑客攻击,将成为极其罕见的历史名词。」 让我们默默感谢一下那些不知疲倦地审查了数亿行代码的AI。 很可能,它刚刚为你阻挡了一次致命的核爆。
10 万元级双电机四驱!吉利银河星耀 7 MAX 要给友商上一课
10 万到 15 万的家用轿车市场一直有个规律: 想要省油,就得接受小排量发动机和单电机的组合,忍受平淡的加速表现;想要畅快的动力和四驱系统,预算门槛大概率要抬高到 15 万元甚至更高。消费者在很长一段时间里只能在经济和性能之间做单选题。 吉利银河星耀 7 MAX 打破了这种行业惯例。 这款轴距超过 2.8 米的中型插混轿车,补贴后售价定在了 10.68 万元,并且,它把过去属于高配车型的 P1 加 P3 加 P4 双电机四驱系统做到了近乎全系标配。 为什么是「近乎」呢?因为如果你不想要四驱,那么补贴后售价还能降到 9.88 万元。 这种让用户去做减法的定价思路,无疑会给同级别的竞争对手带来不小的压力。 把双电机四驱拉入家用门槛 吉利星耀 7 MAX 搭载了一套名为 E-AWD 的智电四驱系统,这套系统由混动专用发动机以及三台电机组成。 P1 电机是一台大功率的专用发电机,负责高效补能;P3 和 P4 则是布置在前后轴的驱动电机。三者协同工作,让整车的最大功率达到了 312 千瓦(418 马力),峰值扭矩来到 526 牛·米。 在这组数据的支撑下,星耀 7 MAX 的零百加速时间定格在 5.4 秒。 吉利整车研究院院长易新宇在发布会上点出了他们的考量。 以往的部分插混车型经常会面临「满电一条龙、馈电一条虫」的尴尬局面。星耀 7 MAX 利用大功率的 P1 发电机和高容量电池进行缓冲,在馈电状态下,发动机依然可以与前后驱动电机并联输出动力。不管电池电量多少,车辆都能保持一致的动力响应,且响应时间只要 0.01 秒 在实际的日常驾驶中,这套四驱系统发挥作用的场景远不止于直线加速。遇到雨雪天气的湿滑路面,或者在山路中急弯穿梭时,系统会实时监测路面附着力,并在极短的时间内完成四个车轮的扭矩分配,快速修正车身姿态,给驾驶员提供足够的操控信心。 动力充沛带来的另一个隐忧是能耗,一台带大电池包的四驱轿车,自重本来就不小。 星耀 7 MAX 搭载了一块 28.3 度的神盾金砖电池,能够提供 220 公里的纯电续航,应付一周的城市通勤不成问题。在馈电状态下,官方标定的百公里油耗数据是 2.98 升,实测甚至跑出了 2.69 升的成绩。 能实现如此低的能耗水平,电机物理层面的解耦发挥了很大作用。 吉利表示,在不需要四驱的平稳巡航路况下,后轴的 P4 电机可以做到零拖拽、零损耗。整台车在两驱模式下运行,减少了不必要的机械消耗,把每一滴油和每一度电都用在驱动车辆前进上。 强劲的动力输出,必须有稳固的底盘来承载。星耀 7 MAX 诞生于 GEA evo 架构,工程师在布局三电系统时,做到了 50:50 的前后轴荷比,为它的操控提供了物理基础。 星耀 7 MAX 悬挂系统的用料也很扎实,它的后桥配备了加强型的五连杆独立悬挂,搭配了自适应可变阻尼减震器。 在经过城市里的减速带或者坑洼路面时,减震器可以根据路况实时调整软硬,兼顾滤震的舒适性。当车辆在高速状态下紧急变道或过弯时,减震器又会迅速提供更强的支撑力。 出色的不仅是硬件,易新宇还称,路特斯工程团队深度参与了这台车的底盘调校工作,他们在英国银石赛道等多个场地进行了多轮测试,把这台家用轿车的麋鹿测试成绩推到了 83.6 公里每小时。 除了底盘部件,空气动力学设计同样在暗处发力。星耀 7 MAX 的车身造型遵循了严格的风阻管理逻辑,车头采用了圆润的曲面导流设计,引导气流顺着车身两侧平滑穿过。 轮毂区域也是车辆行驶时产生涡流的重灾区。 在星耀 7 MAX 上,设计师在雾灯区域开辟了气帘通道,通过控制气流走向,在前轮外侧形成了一道无形的空气幕墙,大幅降低了轮腔内部的空气阻力,从而抑制高速行驶时前轴产生的升力,让车头牢牢贴紧地面。 或许会有人说,这一设计在如今的新能源市场上并不罕见,但别忘了这辆车的售价——目前市场上 10 万元级车型前保两侧的导流口往往只是装饰,并没有贯穿风道,我愿称之为「空力风味设计」。 气流顺着车顶滑落至车尾,遇到了微微上翘的鸭尾,它将离开车身的空气转化为下压力,配合四驱系统的扭矩分配,让四个车轮获得更强的抓地力。 从动力架构、底盘悬挂再到风阻管理,吉利把不少预算花在了这些平时看不见的底层部件上,为这台轿车打好了地基。 拥有了一副好身板,便有了发挥的空间。 赛道的底子,装下一个舒适的家 尺寸来到中型车的级别,车内布局就有了更多的发挥余地。 接近 5 米的车身长度和超过 2.8 米的轴距,给星耀 7 MAX 换来了 541 升的后备箱容积,装下六个 20 寸行李箱不在话下。座舱内,地板做到了纯平状态,肩部和腿部横向空间达到了 1.5 米。 落座后排,C 柱区域的软包提供了 270° 的包裹感,高配车型的后排配备了通风、加热和按摩功能,也带有老板键。宽敞的中央扶手处集成了控制屏幕和小桌板,照顾到了商务接待或者家庭出行需求。 视线转移到前排,车机用的是吉利招牌的 Flyme Auto 2.0 系统,这套系统在手车无感互联方面积累了不少用户口碑。吉利表示,配合带有 16 个扬声器的无界之声大师版音响,车内的影音体验也做到了同级前列。 最有意思的是,你还可以选装一个名为「Eva」的小机器人。 是的,吉利也拥有了属于它的 Nomi。 EVA 可以通过近百种拟人表情与驾驶员互动,还支持手机 NFC 触碰流转导航地址。 在辅助驾驶层面,千里浩瀚 H3 方案提供了高速公路和高架桥的领航辅助功能,日常也能应对记忆泊车和遥控泊车等复杂的停车场景。 不仅是辅助驾驶,日常驾驶的安心感很大程度也来自于一些隐性的安全机制。 星耀 7 MAX 配备了一套全场景爆胎稳行系统,当高速行驶发生爆胎,系统会在 0.175 秒内锁定失压的轮胎,并在 0.3 秒内完成车身姿态的修正。据官方给出的测试数据,它最高能够应对时速 160km/h 的直线爆胎。 星耀 7 MAX 能展现出这种级别的底盘能力,离不开吉利对驾控的持续追求。在刚刚结束的 2026 赛季 TCR 世界巡回赛意大利站中,吉利成功拿下了分站冠军。令人意外的是,他们的冠军赛车不再是领克 03,而是吉利星瑞。 显然,吉利要在整个品牌层面进一步强化驾控标签。 那么,把赛道级的底盘调校放在一台家用车上,到底有什么实际价值? 家庭用户平时开车很少会踩全油门,更不会去探寻车辆的物理极限。 答案是工程冗余。暴雨天积水的高架弯道,乡道上突然窜出的非机动车,都是随时可能出现的隐患。在这些突发瞬间,底盘极高的循迹性和悬架的快速支撑,能把车辆失控的临界点往后推很远。 平时用不到的机械上限,在关键时刻就是一条保命的防线。只有当安全感建立起来之后,谈论驾驶乐趣才顺理成章。 我认为驾驶的快乐不该只属于赛道,要让每个人都能感受性能,找到快乐,爱上驾驶。只有这样,我们中国的汽车运动才能越来越繁荣。 冠军车手马青骅在发布会现场的这番话,恰好给这台车做了收尾。在家用轿车讲究精打细算的大环境里,多给一点底盘和动力上的冗余,说不定真能让平淡的通勤路变得有些不一样。
估值110亿美元,美国富豪们戴的戒指要IPO了
出品|虎嗅科技组 作者|陈伊凡 编辑|苗正卿 头图|视觉中国 规模最大消费可穿戴设备IPO来了。 2026年5月21日,芬兰智能戒指制造商 Oura 向美国证券交易委员会提交了 IPO 申请。这家估值110亿美元的公司计划于今年晚些时候上市,高盛、摩根士丹利和摩根大通等投资银行正在参与此次交易。若成功上市,Oura 将成为自2019年 Peloton(81亿美元)和2015年 Fitbit(41亿美元)以来最大的消费可穿戴设备 IPO。 Oura 的时机选择颇具象征意义。它与 SpaceX、OpenAI 等明星公司同期提交申请,共同构成了2026年科技行业的上市浪潮。但与那些以技术突破为卖点、宏大叙事的公司不同,Oura 的故事显得很简单:一枚4克重的戒指,如何在三年内将营收从2.25亿美元增长至预计的15-20亿美元。 两次转折和数据飞轮 Oura 成立于2013年,总部位于芬兰。创始团队的产品逻辑直截了当:只有不到5%的人会定期锻炼,但超过95%的人每晚都需要睡眠。相比聚焦运动的智能手表,戒指更低调舒适,可以7×24小时佩戴,获取更连续准确的睡眠和恢复数据。 但真正让 Oura 从一家芬兰硬件创业公司变成百亿美元公司的,是两次关键转折。 第一次发生在2017年。纽约对冲基金经理 Harpreet Singh Rai 在体验 Oura 后决定投资并担任总裁,推动公司向全球消费品牌转型。2018年,英国哈里王子被拍到佩戴 Oura Ring,王室带货让品牌一夜出圈。2020年疫情期间,NBA 采购2000多枚戒指用于球员健康监测,不仅如此,扎克伯格也带了Oura Ring,Oura 从“极客玩物”变成公共健康象征。 2026年4月,美国足球协会也宣布了和Oura的长期合作。Oura Ring 被正式指定为美国足球协会的官方可穿戴设备。Oura这套数据飞轮越转越大。 第二次转折更为关键。2022年3月,前 SurveyMonkey 总裁 Tom Hale 接任 CEO。董事会最初因他缺乏硬件经验而拒绝,但 Hale 用一封信扭转了局面:“Oura 的本质是软件问题,而非硬件。我们需要解决的是如何让海量数据产生个性化洞察。” 这句话道出了 AI 原生硬件的核心逻辑:硬件是载体,数据飞轮才是护城河。 在 Hale 主导下,Oura 从睡眠追踪设备转型为“主动健康管理平台”。商业模式也随之改变:硬件售价299-399美元,订阅费每月5.99美元。2023至2024年营收从2.25亿美元翻番至5亿美元,2025年预计突破10亿美元。收入结构健康:80%来自硬件,20%来自高利润率订阅业务,年度经常性收入(ARR)达1.44亿美元。 在今年2月,Oura还推出了首个自主研发的AI模型,旨在提供基于临床数据的个性化女性健康指导服务。 这套逻辑更接近 SaaS 公司而非传统硬件厂商。用户越多,数据越丰富,算法越精准,产品越有价值,从而吸引更多用户。这正是资本市场愿意给 Oura 如此高的估值倍数的原因。 智能健康管理在软件时代被证伪 Oura 的成功,建立在一个被验证的教训之上:纯软件无法解决健康管理问题。 智能戒指公司灵析生物的CEO彭智峰告诉虎嗅,2014、2015年的“百糖大战”期间,大量 APP 试图用软件颠覆医疗管理。它们的逻辑是:用户手动记录血糖、饮食和运动,APP 提供管理建议。但这套模式很快崩溃。核心问题是:没有硬件数据入口,所谓管理变成了用户手动记录、间歇上传、低频互动,难以持续。 医疗健康领域需要的是软硬件一体化。硬件负责连续、无感、医疗级的数据采集,AI 负责把数据转化为可执行的健康建议,缺一不可。Oura 构建了“连续监测、数据沉淀、智能干预”的完整闭环。只有数据积累够了,AI 的管理建议才有意义,数据飞轮才能真正转起来。 传统消费电子路径,例如统计步数、记录睡眠、偶尔测个心率等无法形成持续价值。这些是“看一眼就过去”的数据,用户在特定场景里查看后就丢弃。Oura 选择的路径是:连续、无感、医疗级的健康监测。这也是现在智能可穿戴硬件的做法。 Oura 的生态系统由核心硬件Oura Ring 和软件产品Oura App 与会员服务构成。 2024年10月发布的 Oura Ring 4是这一路径的最新体现。它将传感器完全嵌入戒指内部,信号通道增至18条,能自适应手指结构、肤色和日常旋转。这枚仅重4克的戒指追踪超过50项生物特征,通过 AI 算法转化为三个核心评分:准备度、睡眠和活动。其中准备度分数(0-100)是原创明星功能,直观告诉用户当天身体恢复程度。 硬件是入口,数据是生意 Oura 的成功并非孤例。整个健康可穿戴设备市场正在从小众爱好者市场转变为大众消费市场,增长速度足以容纳多个玩家。 根据第三方数据机构Electro IQ统计,全球智能戒指市场预计将从 2023 年的 26.7 亿美元增长到 2024 年的 44.6 亿美元,到 2032 年将达到 348.7 亿美元。预计到2029 年美国智能戒指市场收入将达到9004 万美元。 Apple Watch 继续主导智能手表市场并不断增加健康功能。Garmin 在2026年第一季度的健身产品营收同比增长42%。健身追踪带 Whoop 在2026年3月以101亿美元估值完成5.75亿美元融资。三星在2024年推出了 Galaxy Ring,Google 通过 Fitbit 布局轻量化健康监测。 从更长远的视角看,健康管理正在经历根本性转变:从被动的、间歇性的医疗干预,转向主动的、连续的日常优化。AI 驱动的可穿戴设备是这一转变的关键基础设施。 未来十年可能出现的变化:非侵入式生化传感技术的突破,使更多生理指标可以通过可穿戴设备连续监测;AI 模型变得更加个性化,能够学习每个人独特的生理节律和反应模式;预测性健康管理成为现实,设备不仅告诉你当前状态,还能预测未来几天的健康趋势并提前干预;健康数据的互操作性和用户主权成为行业标准。 如今Oura 已经占据了有利位置。它建立了从数据采集、AI 分析到用户干预的完整闭环。IPO 将为公司提供资本来加速国际扩张、深化 AI 能力、拓展生态合作。 Oura的IPO,本质上是对这种AI硬件商业模式的认可。在 AI 时代,硬件只是入口,真正的价值在于持续积累的数据和不断优化的算法。
AI爱因斯坦快了,工业革命100倍冲击!Anthropic联创预言2028跨越奇点
新智元报道 【新智元导读】同一周,Anthropic联创和DeepMind掌门同时预警!2028年AI递归自我改进概率超60%,2030年AGI或全面降临。100倍于工业革命的冲击波,正全速砸向全人类。 刚刚,全球最顶级的两大AI实验室,同时按下了超级智能的倒计时。 牛津大学讲台上,Anthropic联合创始人Jack Clark抛出了一份时间表。 AI将在一年内助力人类做出诺奖级发现,完全由机器代码独立运营的公司将在18个月内创造数百万美元营收。 另一边,Google DeepMind联创兼CEO Demis Hassabis给出了同样笃定的预测。 通用人工智能将在2030年前后降临,而这场风暴的冲击力将是工业革命的100倍以上。 两家风格迥异的巨头,在这一刻达成了同一个判断。 AI的进化速度已经越过了人类社会的认知底线。 我们面对的不再是技术路线之争,而是一场关乎经济体系和文明形态全面重构的决战。 2028年跨越奇点 Anthropic预演疯狂未来 Clark抛出的不是模糊的技术愿景,而是一份精确到月的路线图。 12个月内,AI将与人类合作做出诺贝尔奖级科学发现。 18个月内,完全由AI运营的公司将创造数百万美元营收。 两年内,双足机器人全面进驻工地协助技术工人。 最核心的颠覆落在2028年底。届时AI系统将跨入递归自我改进阶段,获得脱离人类干预的自我进化能力,自行设计出更强的下一代。 整个行业苦苦等待的奇点,就这样被Anthropic联创钉在了两年半后的日历上。 而这些预测背后的核心支撑,是他5月初在「Import AI」上给出的判断—— AI在2028年底之前实现递归自我改进(RSI)的概率超过60%。 什么叫递归自我改进? 你对AI说「造一个比你更强的自己」,它就去了。完全自主,不需要人类插手。 Clark花了几周翻了数百份公开数据源,从编程到科研复现,从模型训练到内核设计,每条能力曲线都在向右上方飙。 没有任何减速迹象。 Anthropic研究院同一周发布的白皮书也证实了这一点,他们内部已经观察到「AI正在加速AI自身的研发」。 他为什么敢把话说得这么绝? 因为Anthropic刚刚被自家模型吓了一跳。 今年4月,Anthropic发布了Claude Mythos Preview。 这个模型在测试中找到了数千个高危漏洞,覆盖所有主流操作系统和浏览器,有些漏洞在人类眼皮底下藏了几十年,无数次安全审计都没抓到。 上一代Opus 4.6发现了大约500个零日漏洞,而Mythos直接实现了几个数量级的碾压。 Clark坦言,Mythos训练完成的那一刻,整个团队的反应像是「迎头撞上了一辆高速列车」。超级智能来得比所有人预想的都快,而他们根本还没准备好。 而它还只是一个被人类训练出来的模型。一旦AI跨过RSI门槛,开始自己训练自己,这种能力跃升的速度将完全脱离人类的节奏。 如果人类只会袖手旁观,任由合成智能肆意繁衍,最终只会被迫陷入疲于应对的境地。 哈萨比斯的终极考卷 让AI重现爱因斯坦 同一周,DeepMind掌门Hassabis在Google I/O 2026上给出了一个更大的数字—— AGI时间表是2030年前后,正负一年,也就是2029到2031之间。 如果你非要量化它,它的影响将是工业革命的10倍,速度也是10倍。也就是说在十年内席卷而来,而不是一个世纪。 Axios记者当场愣了,「等等,10倍的影响和10倍的速度?」 Hassabis回答,「对,所以你可以把它看作是工业革命的100倍。而且,可能还是低估了。」 工业革命用了上百年重塑工厂、城市和阶层。 Hassabis说的是同等甚至更高强度的冲击,压缩在十年内完成。 一口气折叠两亿蛋白质 纪录片《思考游戏》里,有一段决定性的瞬间。 当时AlphaFold刚取得突破,一位研究员随口说了一句,我们其实可以在一个月内预测出所有已知序列。 Hassabis愣了一下,然后直接掐断了原来的计划。 已知蛋白质超过两亿个,为什么要让人排队一个个提交?为什么不调集所有资源把地球上每一种蛋白质全部折叠出来,然后免费扔给全世界? 最终他真的做到了。两亿个蛋白质结构被托管在剑桥的数据库里,全球科研人员像用搜索引擎一样一秒调取。 用暴力算力去攻克停滞了几十年的科学难题,这便是Hassabis口中「良性加速」的样子。 所有模型统统不及格 随后他再次搬出那份已经在AI圈引发过激烈争论的「爱因斯坦测试」。 也就是,把一个AI系统的知识库硬生生切断在1901年,然后看它能不能仅凭自身的推理和洞察,独立推演出爱因斯坦在1905年提出的狭义相对论。 Hassabis的回答很干脆,「今天的系统显然做不到。」 GPT、Gemini、Claude,统统不及格。 它们可以通过律师考试,可以写出能跑的代码,可以在各种benchmark上刷到榜首。但这些本质上都是在已有知识的版图内做排列组合。 让它们在人类认知的边界之外凭空跃出一步,做出一个真正原创的科学发现,目前没有任何一个前沿模型做得到。 基于这个测试,Hassabis画了一条AGI的分界线。 去年Google I/O上,Hassabis被问到AGI是2030年前还是后到来,他选了「后」。 今年他说的是「2030年,正负一年」。造这个东西的人自己在收窄时间窗口。 而真正让他兴奋的,是所有顶尖实验室眼下都在死磕的同一个方向,自我改进。 编码Agent已经在帮自家工程师提升产出效率,这只是慢动作版本。 而编程和数学这两个领域极其特殊,它们的输出结果可以被算法自动验证,可以随心所欲地生成海量合成数据。 Hassabis说,「种种迹象表明,这里正在形成一个指数级复合的飞轮效应。」 这句话跟Clark的RSI预测指向的是同一件事。 两个对手阵营,从完全不同的内部数据出发,看到了同一个正在加速的飞轮。 时钟滴答作响 历史不再宽恕人类 Clark预测2028年底出现递归自我改进,Hassabis把AGI锚在2030年前后。 把他们的预测拼在一起,浮现的是一条完整路径。 AI先压缩科学发现,再接管公司运营,再进入物理世界,最后参与制造下一代AI。 这四条线正在同时推进,一旦跑通,AI就不再只是更好用的软件,而会变成一种反过来改写科学、商业和劳动本身的基础设施。 当AI模型能够跨越爱因斯坦测试,当双足机器人全面接管物理世界的繁重劳作,当完全由机器代码驱动的公司开始在市场上碾压传统企业,人类过去几百年积累的经验和直觉,都将面临一次彻底的重估。 算力在集中,模型在加速,Agent在接管工作流,采用曲线还在陡峭上扬。 狂热的加速派和忧心忡忡的吹哨人,这一周全都亮了底牌。 而他们给出的答案指向同一个结论,留给人类调整方向的窗口,可能只剩三年。 当AI开始推动下一轮AI进步,真正的问题只有一个。 方向盘还在谁手里。
论文AI检测,正在逼疯这届大学生
瑕疵「天临七年」,今年毕业论文除了查重之外又多了一道关卡—— AIGC 检测。 今年以来,国内多所高校相继发布通知,要求本科毕业论文须进行 AIGC 检测,并对论文的 AIGC 率给出明确规定,把检测结果作为论文能否通过的指标。 四川大学要求文科类毕业论文AI生成内容占比不超过20%,理工医科类不超过15%; 南京工业大学要求全校毕业论文均须进行检测,标准由各学院自行制定; 广西师范大学、河北工程大学、南京航空航天大学则规定AIGC比例不得高于40%。 图片由 AI 生成 作为刚经历答辩的毕业生,那段时间可是和 AIGC 检测周旋了许久。经历了「检测—修改—再检测—再改」的痛苦循环后,终于从 61.7% 降到 0%。 这个过程之所以这么让人崩溃,是因为 AIGC 检测真的不讲武德: 有些明明是自己一个字一个字敲下的,也会被整段标红,判定为 AI 生成;在这一个平台上测出的 10%,换个平台又可能测出 100%;而哪怕是在同一个平台,同一个段落这次测是 0%,下次可能就变成 100%。 这还不是最离谱的,有网友把朱自清的散文《荷塘月色》扔给多款高校论文 AI检测工具,居然被判定为「62.88%由 AI 生成」。 这不禁让我深深怀疑,当前的 AIGC 检测和它最初的目的是否已经偏离?从更大的层面来讲,它会对我们的写作和思考方式造成怎么样的影响? 在「降 AI」的过程中,为了降低那个数字,内容好坏变成了次要的事。论文被改得七零八落、面目全非只为了证明「我不是 AI」。与此同时,我还额外支付了不少 AIGC 检测费用。 证明自己没用 AI,成为学生新的噩梦 上网一搜,发现一样被 AIGC 检测折磨的毕业生不在少数,大家都叫苦不迭。 有大学生纯手搓的论文,上传检测后 AI 率竟高达80%。而同一篇文章,不同平台查重结果竟能相差 30%。 为通过审核,学生被迫故意制造瑕疵,比如删减逻辑连接词、刻意制造语病错别字、口语化表达,为了降重不惜降低论文质量,讽刺拉满。 国外也不遑多让,23 岁的美国大学生 Burrel,在一门写作必修课的期末测试中得了 0 分,教授给出的理由,是怀疑她这篇作文是由 AI 代笔的。 「我的心跳都快停了。」 Burrel 认为,这个指控既荒谬又可怕。 Burrel 称这份模拟求职信的作业完全没依赖 AI ,她给《纽约时报》展示了 Google 文档的编辑历史记录,她表示花了整整两天时间来起草和修改这份作业。 不过全球知名查重公司 Turnitin 所提供的 AI 检测结果显示,这篇文章有 AI 写作的痕迹。 为了证明自己的清白,Burrel 向英语系主任提交了一份长达 15 页的 PDF 文件,里面包含了她写作过程中所有带时间戳的屏幕截图和笔记。最终,她的成绩被恢复了。 最终,她的成绩被恢复了。但这次经历给 Burrel 留下了不小的阴影。 在那次被指控后,当 Burrel 再次提交作业时,她上传了一段长达 93 分钟的 YouTube 视频,完整记录了她的写作全过程。 「我很害怕会因为一件自己没做过的事而影响成绩。」 Turnitin 尚未回应这一报道,但其首席产品官 Annie Chechitelli 曾在 2023 年的一篇博客文章中指出,AI 检测分数不应被用作判断学生是否滥用 AI 的唯一决定性因素。 去年开始,美国已经有一些高校学生在网上发起请愿,要求他们所在的大学停止使用类似的 AI 检测工具,随着 AI 工具的渗透,可以预见这样的矛盾将在学生和老师之间愈发频繁出现。 但实际上,现在大学生在论文和作业中使用 AI 的比例已经非常高,但这未必是一种「作弊」。 图片来自:小红书@Darer 在就业市场都要求这些应届生要掌握 AI 技能的当下,合理地使用 AI 反而应该是大学教育里要给出引导,而非与 AI 彻底切割。 搞懂 AIGC 检测的基本逻辑 AIGC 检测结果为什么总像是随机生成的?它的检测逻辑究竟是什么?毕竟只有理解它的原理,才能在「降 AI」时对症下药。 传统的论文查重主要是与已有文献数据库进行比对,查重报告会明确告诉你是哪些段落和哪篇文献重复了。 所以对于传统「降重」,前人已经摸索出一套有效的「打法」,比如改写句子结构、同义词替换、翻译成小语种再翻译回中文……总之,只要能避开与已存在文献的重复,就能过关。 但到了 「降 AI 」这里,这些已有的经验似乎都失灵了: AIGC 检测更像一个黑箱,标准不明。目前任何一种检测手段都无法保证 100% 判定哪个是 AI 写的,哪个是人类写的。因此,检测系统通常都会给出一个 AIGC 疑似值。 虽然说这只是「疑似度范围」,系统也声明「检测结果与论文质量无关」,但一旦超过某个数值,论文就会实打实地不通过啊,让人有种无处申诉的无力感。 去年人大新闻学院副教授董晨宇也要在 AIGC 检测中被迫「自证清白」:他的研究团队的一篇耗时三年、基于真实案例撰写的关于直播产业的研究论文,却被某论文检测平台标注为「高度疑似AI生成」。 🔗:https://www.bilibili.com/video/BV1WK7fzNEa5/?spm\_id\_from=333.337.search-card.all.click&vd\_source=2304bb3a0ff80390775707914f5ee0ed 所以,AIGC 检测真的就是「黑箱」吗?它的基本逻辑究竟是什么? 基于知网在 2023 和 2024 年发布的两个专利,我们也可以总结目前知网 AIGC 检测的底层逻辑和流程: 第一阶段:信息量差值检测(基于 2023 年专利) 输入文章,按学科分类 用大语言模型改写文章,计算原文与改写版的信息量 差值差值小 → 可能 AI 生成;差值大 → 可能人类写作 第二阶段:多特征分析(基于 2024 年专利) 使用文本分类模型计算 AI 生成概率 分析逻辑偏离度、词汇扩散度、句子长度、字词分布等特征 综合多个特征判断 AI 生成可能性 第三阶段:最终判定 结合两阶段结果 两阶段均指向 AI → 判定 AI 生成 否则 → 判定人类写作 既然如此,似乎有标准可循。那依据这个标准,让 AI 拟人化改写文章,以此增加「人味」、降 「AI 味」,岂不是可以用魔法打败魔法? 用 AI 降 AI ?真的有用吗? 我试过市面上流传的两类 「用 AI 降 AI」的方法: 输入 prompt,让大模型对原文本进行改写 使用专门的「一键降 AI」工具(多为付费服务) 拿我的论文当小白鼠,将几段文字(人工撰写+ Chat GPT 润色共 972 字)丢进一个大学生常用的免费 AI 查重平台「PaperYY」平台进行 AIGC 检测,检测结果 AIGC 疑似率为 61.7%。 接下来依次使用下面表格中的几种「用 AI 降 AI」的方法分别改写这段文本,并再次放入同一检测平台 PaperYY 上进行检测。 同时,作为对照,将购买检测平台 PaperYY 上自带的「降 AI」服务进行测试。 🔗:笔栈:https://biee.net/; SpeedAI:https://speedai.fun/; PaperYY:https://www.paperyy.com/ 方法一:人工指令 分别喂给 GPT、DeepSeek 和 Grok 一段相同的「降 AI」指令: 但结果仿佛养蛊,三个 AI 各自一顿操作之后,AIGC 率全都成功从61.7% 升到100%…… 不过,接收同样的 prompt,GPT 和 Grok 改写的文本风格比较相似,语言较平实,但 DeepSeek 却出现了明显的「AI 幻觉」,开始变得不像人话…… 如原文在描写摄影技法的时候,仅仅提到「色彩反转、低角度构图、光源的超现实处理」等,但 DeepSeek 却自行发明了「放射性构图」、「异色温处理」、「钨丝灯频闪」等,并存在堆砌复杂词汇的现象,使得与原文有较大偏离。 方法二:「一键降 AI」工具 我选取了两款市面上专门的论文写作与查重网站中的「降 AI」工具——「笔栈」和「SpeedAI」进行测试。 笔栈改写后 AIGC 率飙升至91.5%,似乎已经没有什么好意外的了。 但神奇的是,SpeedAI 的改写文本居然测出了 0%,反倒令人大跌眼镜。 对照测试:检测平台 PaperYY 上的付费降AI服务 在付了「降 AI」费之后,PaperYY「自己答题自己改卷」的测试结果倒不出意外的是 0%。 测试结果:初始文章 AIGC 检测结果:61.7% 除了在 PaperYY 平台的对照测试外,真正能较好完成「降 AI」任务的,竟只有 SpeedAI。 然而,这一结果并不能证明 SpeedAI 在「降 AI」方面表现出色,反而使整个测试显得更加扑朔迷离。 于是,我们进一步选取了两个极端案例——ChatGPT 改写后被判定为 100% AIGC 的「文本一」与 SpeedAI 改写后被判定为 0% 的「文本二」,让 Grok 对其进行详细的对照分析。 乍一看似乎有点道理,然而回到具体文本,我们会发现 Grok 不过是照着已有结论套说辞,「锤子找钉子」罢了,实际上: SpeedAI 生成的「文本二」中同样使用了很多抽象的理论词汇如「社会象征」「叙事装置」等; ChatGPT 生成的「文本一」中其实具有更多处以「我」作主语的所谓口语化表达。 但话说回来,如果论文中都是充满「人味」的口语表达,而缺少专业理论词汇,还能叫学术论文吗?逻辑清晰、条理分明的表达方式,什么时候变成 AI 专属了呢? 写作本该是思考与表达,而非证明「我不是 AI」 筋疲力竭地「降 AI」之后,尽管我的论文顺利通过了系统检测,但很多地方也变成了我不认识的样子。 在这个过程中,最终的论文质量似乎不再是衡量的标准,关键变成了如何向系统证明我不是用 AI 写的。 这种本末倒置的操作消耗了我很多本该投入在论文思考、打磨和创新中的时间、精力和金钱。 更加可怕的是,对于学生而言,这种章法不明的「标准」可能会变成一个无形的框架,窄化我们的语言表达,甚至约束我们的思维。 当我们不再专注于深入思考问题,而是不断琢磨如何迎合这一「标准」,就会逐渐失去写作应有的创造力、想象力和自我表达的功能。 对此,人大副教授董晨宇表示: 「AI 其实在倒逼学术生产进行重新布局,适应这种布局,需要进行非常整体性的调整,但在这一切之前,应激式的防火防盗防 AI 一定是我们最开始的反应。但 AI 不是现代人的旁门左道,而是现代人的生存之道。AI 提高了底线,但是人仍然决定的是上限。」 所以,真正决定论文价值的,不该是系统判定的一个数值,而是其中凝结的思考深度与写作诚意。 尽管 AI 提高了写作的底线,但人类不必与工具对抗,而应在理解它、驾驭它之后,继续追求属于人的表达上限。
DeepSeek V4价格打骨折,宁王京东网易抢着入场,梁文锋:目标是AGI
听雨 发自 凹非寺 量子位 | 公众号 QbitAI 同一天,DeepSeek又发生两件大事。 一边,DeepSeek-V4-Pro API宣布永久降价。从 6月1日起,V4 Pro的API 价格将正式调整为当前促销价,不再恢复原价。 另一边,The Information爆料:宁德时代,正在接洽DeepSeek的融资。 报道称,此番投资布局,也恰逢宁德时代正全力拓展面向AI数据中心的电力设备业务。 不止宁德时代,有消息称,京东、网易等大厂也在洽谈参投,但尚未完全落实。讨论正在进行中,包括投资金额和最终参与者在内的细节可能仍然会发生变化。 据彭博社报道,DeepSeek正在推进一轮700亿元融资,估值已飙至450亿美元。 知情人士称,梁文锋已向潜在投资者明确表示,公司将继续优先推进突破性人工智能研究,追求通用人工智能(AGI),而非短期商业化变现。 同时,DeepSeek也承诺坚持开源路线。 宁德时代也投了DeepSeek The Information报道称,宁德时代(CATL)计划出资参投DeepSeek的首轮融资。 在大多数人印象里,宁德时代是造电池的。动力电池、新能源汽车,这才是它的主场。 而它投资DeepSeek,第一眼看起来像是跨界玩票。 但如果把时间线拉长,会发现宁德时代的布局早已超出这个框架。宁德时代的主业是动力电池,但近年来一直在向数据中心储能领域扩张。 就在本月,宁德时代旗下关联公司宣布以9.42亿美元战略投资万国数据(VNET Group),后者是中国头部数据中心运营商之一。 更早之前,宁德时代还投资了中恒电气,专门做数据中心供电系统。 从种种蛛丝马迹可以看出,宁王正在用真金白银告诉市场,数据中心是下一个主战场。 而DeepSeek,恰好是一个正在快速膨胀的能源需求方。 此前量子位曾注意到,DeepSeek正在内蒙古自建数据中心,还在大量招聘数据中心工程师。 选址原因是当地电力资源丰富、年平均气温极低,可以大幅降低服务器冷却成本。上个月,DeepSeek曾遭遇一次持续近12小时的系统崩溃,自建基础设施的紧迫性也进一步凸显。 对宁德时代来说,投资DeepSeek等于提前锁定了一个潜力巨大的下游客户。 此外,数据中心也正在面临越来越严格的绿色能源使用要求。这意味着DeepSeek的数据中心,天然需要风能、太阳能配套储能系统,而这正是宁德时代的核心产品线。 另外据The Information报道,京东和网易也在洽谈参与本轮融资,但尚未最终确定,相关细节仍可能变化。 三家公司均未公开确认,DeepSeek和CATL对此回应「不评论市场传言」。 如果放大来看,紧锣密鼓的AI竞赛,正在从模型层、芯片层,向下蔓延至最基础的物理基础设施,电力系统、工业设备、储能配套。 能源,正在成为AI竞赛里被严重低估的战略资源。 而宁德时代这家全球最大动力电池厂商入场,也为能源竞赛打响了首发信号。 梁文锋:不为赚钱为AGI DeepSeek这轮初始融资的规模,在过去一个月内经历了三级跳。 最早的消息是「估值超100亿美元」。随后The Information报出500亿人民币的融资目标。 到了5月22日,彭博社给出了更激进的数字:约700亿人民币,约合100亿美元。投前估值约450亿美元。 如果最终谈成,这可能成为中国AI公司有史以来的最大融资轮。 据The Information和彭博社消息,目前接近确认的投资方包括:国家AI产业投资基金(约100亿人民币)、腾讯、IDG资本、Monolith Capital。 而创始人梁文锋本人,将提供本轮最大份额的出资,约200亿人民币。 融资最快可能在6月完成。 但比数字更值得关注的,是梁文锋对投资方的口径。 据彭博社报道,梁文锋在至少一次投资者会议上明确表态: DeepSeek的主要目标是推动技术边界,而不是尽快变现。他承诺继续开发开源模型,同时将追求更大的目标——AGI。 把这句话和V4永久降价的消息联系起来看,会颇有意思。 就在同一天,DeepSeek宣布V4-Pro API永久降价: 输入缓存命中价格0.025元/百万Token,缓存未命中3元,输出6元,均为原定价的四分之一,且没有时限。 这也不难理解,因为早在2024年,DeepSeek V2宣布降价时,梁文锋就曾解释过DeepSeek的定价哲学: 我们只是按照自己的步调来做事,然后核算成本定价。我们的原则是不贴钱,也不赚取暴利。 我们降价一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。 一边向投资人要钱,一边向开发者让利,也符合梁文锋一贯的逻辑。 这是DeepSeek成立三年来首次接受外部资本。它的开源模型,让全球开发者免费用上了世界顶级AI,它的API,一降再降,今天连「降价活动」都永久化了。 但是维持这一切的成本,在急速攀升。现在造电池的来了,做游戏的来了,卖东西的也来了。 DeepSeek的融资后续如何落槌,还需拭目以待。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。