行业分类:
加载中...
头条分类:
加载中...
OpenAI爆更Codex!非码农也能用,9亿人喜提“AI员工”
作者 | 程茜 编辑 | 心缘 智东西6月3日报道,昨夜,OpenAI直播发布AI编程智能体Codex三项更新,分别是智能体插件、定点修改以及文档一键生成交互式站点。 OpenAI还透露Codex的每周活跃用户已经达到500万,较今年年初增长8倍。 其中,智能体插件(Agent Plugins)为企业打包了6个专属岗位的技能包,企业无需编程接入插件就能让“资深AI员工”干活;注释(Annotations)功能可帮助用户对已生成内容精准修改,“指哪改哪”;站点(Sites)功能让用户把任意文档转化为交互式网站、应用程序的功能预览,并和同事、客户共享。 这些功能今天将在Codex上逐步上线,站点功能今日面向企业和商业团队以预览版上线,近期逐步向其他订阅计划用户开放。 OpenAI计划将Codex引入ChatGPT,所有订阅用户均可使用。今年2月,OpenAI宣布,ChatGPT的周活跃用户已经超过9亿。 此外,OpenAI宣布其所有前沿模型和Codex现已支持在AWS平台一键部署,其为企业提供了两种使用方式:一是在Amazon Bedrock上直接调用OpenAI模型,二是通过Codex on Amazon Bedrock将OpenAI的软件工程智能体Codex引入AWS。 在直播最后,OpenAI联合创始人、CEO萨姆·奥尔特曼(Sam Altman)现身,称OpenAI Codex此次更新就是要帮企业整合所有产品、服务,同时降低成本。他预测,AI产业接下来的重点是全天候自主运行的主动式AI,这也是他首选的未来一年最值得提前布局的方向。 奥尔特曼提到,如今OpenAI正迈入第三个发展阶段,而这一阶段他们的目标是让所有人都能用得上AI。 OpenAI创始人、CEO萨姆·奥尔特曼(Sam Altman)和OpenAI首席营收官丹妮丝·德雷瑟(Denise Dresser)(从左至右) 一、Codex三连更,首发6个特定角色插件 OpenAI首席营收官丹妮丝·德雷瑟(Denise Dresser)透露,企业业务目前占OpenAI收入的40%,到年底将占50%。这一部分业务是OpenAI的重点。 为了提升用户的智能体协作效率,其为Codex更新了三项功能。 首先是智能体插件。OpenAI首发了6个特定角色插件,会以编解码器的形式逐步上线,并很快在ChatGPT中推出。 每个插件都捆绑了相关角色的应用程序、技能、说明和工作流程,共包含62个热门应用程序和110项技能。 数据分析插件可以帮助分析师和业务团队利用数据解答问题,并使用Snowflake、Databricks Genie、Hex和Tableau等工具创建报告和仪表板。 利用数据分析插件进行业务绩效分析 创意制作插件可以帮助市场营销和创意团队将简报转化为可供审核的素材,团队还可以使用Figma、Canva、Shutterstock、Picsart和Fal等工具创建活动板、制作和优化展示广告等。 销售插件能帮助销售团队将客户背景信息融入到推进交易的工作流程中,其可以使用Salesforce、HubSpot、Slack、Outreach、Clay、Rox和Actively等工具,查找高优先级客户和信号,准备客户会议,完成后续跟进等。 使用销售插件生成销售渠道并准备会议 此外还有产品设计插件、公开股票投资插件和投资银行插件。 企业可以根据自身工作流程调整插件,或者为自己的系统构建和共享自定义插件。OpenAI即将推出企业财务、私募股权投资、市场营销策略、战略咨询和法律等更多针对特定角色的插件,未来还将支持企业直接在Codex和ChatGPT中创建和部署自己的插件。 其次是注释。对于Codex产出的内容,用户可以选中其中的任意内容,让其进行解释和编辑。 基于注释功能,用户可以指出需要改进的部分,并告诉Codex需要更改什么。例如在网站中选中导航栏,让Codex更新字体;在幻灯片上标记图表,要求添加更清晰的标签等。 使用注释功能优化表格 最后是Sites(站点)。借助Sites,用户可以将Codex创建的任何内容转化为安全且易于分享的内容。例如可以将财务预测转化为面向全公司的实时业务仪表盘、将产品规划转化为可运行的原型供团队共同评审等。 将财务预测转化为面向全公司的实时业务仪表盘 OpenAI企业业务负责人亚历山大·谢尔吉安(Alexander Sergian)称,这一切的提升都得益于OpenAI模型的性能进步,所使用的token却同步在减少。用户在使用Codex和GPT-5.5时获得相同质量输出结果时,所需token数仅为原来的1/3。 二、OpenAI进入第三发展阶段,要让每个人都用上AI OpenAI首席营收官丹妮丝·德雷瑟(Denise Dresser)还与OpenAI联合创始人、CEO萨姆·奥尔特曼(Sam Altman)在直播最后进行了交流。 奥尔特曼提到,他在与客户的交流中感受到企业最大的需求是将所有产品和服务整合起来,在企业内部形成一套统一工作流。因为此前这些功能彼此割裂,用户往往不清楚该在何时使用聊天、编解码器或隐藏的API,也无法将所有上下文和所需的插件整合在一起。 另一件重要的事情是成本。奥尔特曼称,现在AI圈内甚至都形成一个梗,不少企业一季度就把2026全年预算花光了。面对这一问题,OpenAI正在投入开发更多模型,让人们通过更少的投入获得更大价值。 这延伸出来第三件事就是,很多用户认为自己没有充分挖掘出AI的价值,很多人并不知道该如何提出恰当的问题,还会导致token消耗量过高。因此OpenAI在做的就是让一切都自动化,不需要用户自己去理解AI能为我做些什么、如何发挥作用。 关于OpenAI和企业的关系,奥尔特曼认为,OpenAI将自己看作一种新型基础设施,就像以前的云服务一样。 今年OpenAI的研发重点大体分为两类,一类对话式的大模型,一类是能够自主完成复杂任务的智能体产品。 在奥尔特曼看来,AI产业接下来的重点是全天候自主运行的主动式AI,这也是他首选的未来一年最值得提前布局的方向。 在谈到OpenAI的发展历程时,他透露,OpenAI正在进入第三个阶段,此前两个阶段是从研究实验室转型为一家产品公司,其中的标志性事件就是三年半前ChatGPT的问世。 六年半前,OpenAI首位token大户每月大约使用10万个token,如今这一用量已经达到全球人均使用水平;用量顶尖的用户每月要消耗约1亿个Token,六年半时间里token整体用量足足暴涨了100万倍。 如果延续当前增长趋势,再往后推演六年半时间,奥尔特曼预测,上述token用量将成为全球人均token消耗量或人均AI使用基准。到那时,大家更能意识到基建压力,这正是OpenAI所处的第三发展阶段。 OpenAI的目标就是让所有人都能用得上AI,使其既能体验顶尖性能、价格亲民的功能,同时保障充足的算力供给。 结语:非开发者涌入AI编程工具,用户增速是程序员3倍 如今越来越多非开发人士开始使用AI编程工具。OpenAI的数据显示,虽然最初的Codex是一款软件开发工具,但如今分析师、营销人员、运营人员等非开发人员约占Codex用户总数的20% , 并且其增长速度已经达到开发人员的3倍多。 这样的用户结构也使得Codex等AI编程工具朝着更加低代码化、自动化进阶,其产品的研发重心转向适配企业业务人员用自然语言快速落地需求。
苹果自研相机液冷方案:誓要根治iPhone相机发烫难题
6月3日消息,iPhone的影像能力始终是苹果每年发布会主打的核心卖点之一。 在每一轮新品迭代的过程中,iPhone的相机模组变得越来越大,内部结构也越来越复杂,随之而来的发热问题正逐渐演变成一个令用户和厂商都头疼的痛点,甚至在一定程度上阻碍了苹果影像能力的进一步升级。 如今苹果刚刚正式获批一项全新专利,计划采用特殊的吸热液体方案,彻底攻克这一困扰影像系统许久的散热棘手难题。 这项专利设计的是一个结构非常精密的一体化相机模组,包含外层外壳、内嵌镜头组件、承载着图像传感器的可移动基板,还有一块能把模组内部空间隔开的柔性密封件,所有部件的装配精度要求都非常高。 模组靠近镜头光路的区域填充氮气,或是其他具备优异光学透过特性的气体,保证光线穿过镜头的过程中不会出现折射偏差;而在模组剩下的所有其余空间内,则注满矿物油之类的高绝缘液体,直接充当散热片的作用,接触所有产热部件。 苹果这套方案的核心逻辑,是把图像传感器、驱动马达、电路及其他电子元件运行时产生的热量,直接通过导热液体快速导出相机模组之外,从而让整个影像系统能够在最佳的热管理条件下,长时间平稳满负载运行,不会出现过热降频的问题。 这项专利的关键优势就在于,常规风冷、石墨散热方案很难触碰到的内部活动部件,这套液体方案都能实现全覆盖的高效散热,几乎没有散热死角。 如果这套方案最终能够落地量产商用,用户在户外探店、户外露营直播、户外赛事实时转播这类长时间高负载拍摄的场景下,就能有效杜绝镜头过热、画面卡顿甚至直接强制退出拍摄的问题,影像体验会提升一大截。 之前iPhone在长时间4K录制、极限环境拍摄时经常掉帧过热的老毛病,困扰专业用户很久,这项专利如果能顺利落地,相当于从相机模组的底层结构上解决了散热短板,后续iPhone的影像能力上限也会被彻底打开,再也不用为了控制发热砍算力和拍摄时长。
史上最糟一年!手机平均售价历史最高 换机预算没4千都快买不到机了
快科技6月2日消息,上游存储芯片价格持续上涨的大背景下,本就承压的全球手机市场日子正变得越来越难熬。 知名市场研究机构IDC此前曾作出预测,受AI产业爆发驱动的内存供应短缺影响,2026年全球智能手机的全年出货量将同比下降12.9%。 但在周二更新的最新报告里,该机构直接把预测的下调幅度进一步拉大,给出了13.9%的同比降幅预判,核心原因是近期不断升级的美伊冲突进一步削弱了本就疲软的终端消费需求。 IDC在最新发布的研究报告中直接点明,当前全球智能手机市场正走向有史以来表现最糟糕的一个年份。 IDC研究总监Nabila Popal解释称,霍尔木兹海峡的航运封锁直接推高了国际油价,层层传导之下智能手机厂商要承担更多额外成本,覆盖原材料、零部件到整机的全链路运输成本都出现明显上涨。 持续上涨的多重成本压力,倒逼各家手机厂商不得不主动调低出货量规划,上调终端产品售价,把研发和供应链资源都向更高价位段的产品倾斜。 受此影响,当前全球智能手机的平均售价已经攀升到创纪录的550美元,约合人民币3800元,对比去年直接上涨了100美元。 另一家头部调研机构Counterpoint Research发布的最新报告也得出了相近的预判,2026年全球智能手机出货量预计将同比下降13.9%,整体规模跌到约10.8亿部,创下2013年以来的年度出货量新低,这次的下滑幅度也超出了该机构今年2月时作出的12.4%的早期预判。
苹果MacBook Neo以低价策略成功破圈,开售三周出货110万台
IT之家 6 月 3 日消息,苹果 MacBook Neo 上市近三个月便收获开门红,助力该公司开拓新客群,也打破了长久以来外界对 Mac 消费群体的固有认知。 市场调研机构 IDC 向科技媒体 TechCrunch 提供的数据显示,在截至 3 月的财季里,MacBook Neo 出货量达 110 万台,彼时新款 M5 芯片 MacBook Air 与 MacBook Pro 尚未发布;后两款机型首发季度出货量分别仅 90 余万台、55 万台。 IDC 副高级副总裁纳夫肯达尔 · 辛格表示,该数据含金量十足:这款新品 3 月中旬才开售,整季在售时长仅有三周左右,而且出货量从 4 月初才开始大幅攀升。 MacBook Neo 于 3 月初正式发售,起售价 4599 元,比入门款 MacBook Air 便宜约 45%。苹果打造这款笔记本的初衷,是降低 Mac 的入手门槛、覆盖更多消费人群。该机沿用苹果高端笔记本多数设计质感,配备铝合金机身与 13 英寸液态视网膜显示屏;为压低成本定价,产品做出部分取舍:搭载 A18 Pro 芯片而非 M 系列自研处理器,基础版标配 8GB 运行内存。 辛格称,目前市场反馈印证了苹果的定价策略,MacBook Neo 在印度等多个国家的市场需求远超预期,当地经销商始终面临备货紧缺难题。 IDC 数据显示,3 月财季全球出货的 MacBook Neo 中,44% 销往美国;而该机型在印度仅上架数周,当地出货量仍接近 1.8 万台。 MacBook Neo 在印度起售价 69900 印度卢比(IT之家注:现汇率约合 4981 元人民币),而同地区入门版 MacBook Air 定价 119900 卢比(现汇率约合 8544 元人民币)。 辛格在接受 TechCrunch 采访时表示:“Windows 笔记本售价持续走高,叠加 Neo 亲民的定价,催生了这款产品的超高市场需求。” IDC 资深市场分析师巴拉特 · 谢诺伊指出,Neo 的热销或将重塑苹果在印度等市场的产品布局。此前在印度市场,M1、M2、M3 芯片版老款 MacBook Air 常年依靠大促降价走量,是苹果出货主力机型。 辛格表示:“随着 Neo 热度不断走高,后续老款机型的市场处境还需持续观察。” 苹果 CEO 蒂姆 · 库克在 4 月财报电话会上透露,消费者对 MacBook Neo 的反响“火爆超乎预期”,产品上市后苹果深陷供货短缺问题;他同时提到,依托 Neo 的拉动,苹果 3 月财季新增 Mac 用户数量创下历史新高。 调研机构 Counterpoint Research 副总监戴维 · 纳兰霍认为,MacBook Neo 的价值不止于亮眼的首发销量:这款产品正在帮苹果跳出原有用户圈层,吸纳大批首次选购 Mac 的消费者,切入过去苹果鲜有布局的低价笔记本赛道。 他补充道,依托 Neo,苹果在 400 至 699 美元价位笔记本市场的份额,有望从当前约 2% 提升至 15% 左右。 纳兰霍表示:“现阶段虽上市时间尚短,但 MacBook Neo 称得上苹果近年战略意义最重的 Mac 产品之一。当下全球 PC 行业正遭遇内存涨价、产品变相缩水涨价的困境,这款新品却助力苹果持续拓宽市场版图。” IDC 的辛格则认为,Neo 的目标客群不止新用户:相比历代 Mac 产品,苹果为 Neo 划定了覆盖面更广的受众,这套打法有望帮助苹果在消费级、小微企业笔记本市场抢占更多份额。 MacBook Neo 首发热销,已经倒逼竞品跟进布局。戴尔本周推出新款 XPS 13,起售价 699 美元(现汇率约合 4740 元人民币),精准对标同价位赛道;戴尔坦言,MacBook Neo 的面世印证了市场对高质感亲民价位笔记本的旺盛需求。 不过辛格提示,首发季度数据仅能反映阶段性表现:随着苹果逐步缓解产能瓶颈、扩充铺货范围,本财季 Neo 出货量预计将迎来暴涨。
小鹏汽车在欧调查:仅13%当地民众愿意体验自动驾驶汽车
IT之家 6 月 3 日消息,据外媒 Auto Express 当地时间 3 日(今天)报道,小鹏汽车发起的一项调查显示,欧洲消费者对汽车 AI 的接受度仍明显落后。只有 13% 的欧洲人愿意体验自动驾驶汽车,而中国消费者的这一比例达到 70%。 调查显示,多达 82% 的欧洲受访者表示自己了解 AI,但只有 13% 的人愿意在没有驾驶员掌控方向盘的情况下乘坐自动驾驶汽车。在“AI 接管驾驶或作出紧急决策”的设定下,53% 的受访者表示对 AI “信任很少或完全不信任”。 调查覆盖六个欧洲国家,受访者超过 5000 人。结果显示,最多 53% 的驾驶员可以接受自适应巡航、交通标志识别、车道保持辅助等功能,而这些功能或多或少都依赖 AI。 IT之家从数据中获悉,欧洲各国态度也存在明显差异。西班牙受访者对自动驾驶更开放,63% 的人愿意乘坐自动驾驶汽车;英国受访者的比例为 34%。整体来看,61% 的欧洲受访者认为,失去人类控制是自己对 AI 的主要担忧之一。 小鹏汽车副董事长兼总裁顾宏地博士表示:“欧洲等待的不是更多功能,而是更多接触机会。调查结果表明,真正能改变欧洲看法的,是人类仍能发出指令、边界清晰,以及经过验证的可持续性收益。” 顾宏地进一步解释称:“如果 AI 出行能在欧洲赢得认可,就能建立更有力的全球标杆,因为欧洲对隐私、安全、可持续性和问责制的要求位居全球最高水平之列。小鹏汽车的方法很简单:让 AI 看得见、讲得清,同时在我们赢得进一步自动化的资格前,让驾驶员始终掌握控制权。”
丰田、本田等日本8家车企统一放宽零部件标准:外观稍有瑕疵也能用,原材料供应紧张
IT之家 6 月 3 日消息,据日本经济新闻 6 月 1 日报道,包括丰田汽车公司在内的日本汽车制造商和零部件生产商正在制定一项统一的零部件缺陷判定政策。 即使个别公司认定某个零部件存在缺陷,只要不符合统一政策,该零部件仍将被继续使用。此举旨在确保日本国内零部件供应稳定,尤其是在中东危机导致原材料采购困难的情况下。 这项统一政策将由日本汽车制造商协会(JAMA)和日本汽车零部件工业协会(JAFA)共同制定。IT之家查询获悉,JAMA 包括丰田、本田等八家乘用车制造商,以及卡车和巴士制造商;JAFA 则由约 450 家零部件制造商组成。 统一政策实施后,对于不影响整车性能的轻微瑕疵(如黑点、细小划痕),零部件厂商将不再自行判断为不良品并废弃,即使功能完全正常。只要符合国家标准且功能和外观无重大问题,整车厂将接受这些零部件。 以车载电子线束塑胶接插件为例,约 60% 的不良判定是因为存在黑点,统一标准后预计日本国内每月可减少 1 万个废弃品。新规范还将允许带有无害毛刺、毛边的零部件通过检验,并缩短质检工时。 丰田已设立专项部门,联合配套厂商按统一标准评审零部件,并定期与其他日系车企及供应商召开联合评审会议。
成都规范停车场扫码缴费:严禁强制注册会员、虚假广告诱导
原标题:再也不用看广告了,成都规范停车场扫码缴费!建议全国推广 [汽车之家 资讯] 日前,成都市市场监督管理局发布合规提示,对全市停车场扫码缴费页面商业营销行为作出明确规范,切实维护消费者合法权益,提升停车缴费便利度。 近期,成都部分停车场在扫码缴费页面,以优惠券、红包等信息诱导消费者,夹杂不当营销内容,干扰正常缴费流程,影响群众出行体验。为此,成都市市场监管部门依据消费者权益保护、广告管理等相关法律法规,从个人信息保护、广告合规、主体责任三个方面提出具体要求。 合规提示明确,停车场经营者不得过度收集个人信息,不得以概括授权、默认授权等方式强制获取无关信息;严禁强制或变相强制关注公众号、注册会员才能缴费;消费协议规则须显著告知,并提供拒绝选项。 在广告规范方面,缴费页面发布的广告必须真实合法,显著标注“广告”字样;弹窗广告须确保一键关闭,不得使用虚假红包、虚假通知、虚假按钮等方式误导消费者点击。 成都市市场监管部门同时要求,停车场经营管理方要履行审核管理责任,及时制止违规营销行为。全市市场监管系统将强化日常监管,依法查处违法违规行为。消费者如遇侵权问题,可通过12315、12345热线进行举报。
赛力斯字节合作新车品牌智驾方案商预计为元戎启行
图片来源:视觉中国 蓝鲸新闻6月3日讯(记者 李卓玲)由赛力斯参股,并与字节跳动旗下火山引擎深度合作的赛豆科技新汽车品牌神秘面纱本月即将揭开。 日前,蓝鲸汽车独家报道的《赛力斯字节合作新车品牌细节曝光:将推纯电、增程双动力》引发行业广泛关注,尤其关于其首款新车智驾方案预计不会用华为乾崑一事,坊间对会用谁家猜测众多,诸如猜测为Momenta、地平线等,最新,记者又从知情人士处独家了解到,该车的智驾方案预计将与元戎启行合作。 对此,蓝鲸汽车记者向赛豆科技求证,对方并未置评,“不太清楚,没有确切的消息。”其并表示,“我们将在6月9日发布会上发布全新品牌和LOGO等,到时以我们官方公布的为准。” 官网显示,元戎启行由CEO周光于2019年带领团队创立,总部位于深圳。元戎启行已完成8轮融资,累计融资金额超10亿美元。其中,2021年,元戎启行曾获得由阿里巴巴战略领投的3亿美元融资。 目前,元戎启行已与多家车企建立深度量产合作,并有30万辆搭载其城市领航辅助驾驶方案的车辆进入消费者市场,覆盖十余款车型等。此前,其被曝出合作车企包括长城汽车、零跑汽车、smart等。 据披露,2025年,元戎启行第三方城市NOA市场份额达到24%,同比增长2.1倍。进入2026年,元戎启行提出三项目标:推动辅助驾驶系统量产交付规模突破100万辆;将MPCI指标提升至1000公里以上;推动用户高频使用率提升至50%以上。 今年年初,前DeepSeek研发负责人、多模态技术核心研究员阮翀被曝加盟元戎启行曾引发关注。据公开资料,作为从幻方时期就加入DeepSeek的老成员,阮翀曾是Janus-Pro等 DeepSeek多模态成果的核心贡献者,并曾与创始人梁文锋共创多篇论文。在业界看来,阮翀的加入或将加速元戎启行在VLA大模型领域的技术突破。 随后,今年北京车展期间,阮翀以元戎启行首席科学家身份首次公开亮相。据界面新闻报道,阮翀在现场表示,元戎启行正从多个小模型转向统一基座大模型架构,并分化为驾驶、分析、评论三个更具体的模型,目前单次模型迭代周期已从100余小时压缩至10余小时。 值得关注的是,蓝鲸汽车记者留意到,在去年的上海车展上,元戎启行还宣布与火山引擎达成深度合作,双方将深度协同,联合车企共同打造AI汽车。据悉,元戎启行与火山引擎的合作聚焦在AI原生服务、智能驾驶与大语言模型融合等领域。同时,火山引擎也将为元戎启行提供算力支持,共同提升AI算法训练效率,催化VLA模型迭代。 “算力、数据与算法是拉动VLA模型进化的三驾马车。在火山引擎的助力下,算力问题已经得到进一步优化。而数据问题,在元戎启行强数据闭环系统的推动下,已经提炼出大量高质量数据。至于算法,这本身就是元戎启行的强项。”周光表示。 火山引擎副总裁杨立伟彼时也直言,“能打造VLA模型的企业,一定对AI技术有深刻的理解,元戎就是其中之一。”
打破国外巨头垄断!国产航空涂料首获民航适航认证
快科技6月3日消息,据报道,近日,浙江鱼童新材料股份有限公司自主研发的航空涂料正式获得中国民用航空局颁发的《民用航空用化学产品设计/生产批准函》,成为国内首家取得民航适航认证的航空涂料企业,打破了该领域长期被国外巨头垄断的局面。 航空涂料被称为涂料界的“珠峰级产品”,技术门槛极高。此次获批的两款产品为Aeroep 452环氧底漆和Aeropu 900聚氨酯面漆,历经超过6年研发认证、超千万元资金投入,在民航局全程监督下通过了50余项测试项目,最终拿到进入民航市场的“通行证”。 鱼童航空涂料主研工程师于春波介绍,飞机在万米高空飞行,涂料必须做到轻薄以减轻机身负荷,漆膜厚度仅约20微米,与一张A4纸相当。 同时,涂料需承受飞机起降过程中短时间内近百摄氏度的剧烈温差变化,而漆膜硬度与柔韧性又存在天然矛盾,多重技术难题叠加使研发攻关难度极高。为此,企业先后筛选数百种原料、迭代上百组配方、完成上千次性能检测。 生产环节同样严苛,航空涂料需在全密闭无尘空间内生产,车间湿度控制在70%以内,所有工作人员须经专业培训实操合格后方可上岗。企业还专门投入数百万元定制专属生产设备。 这两款涂料符合中国商飞、波音、空客等全球主流航空企业的材料规范,可适配C909、空客、波音等多款主流机型,其核心技术此前已在军用直升机、无人机领域落地应用。 鱼童目前已与中国商飞对接合作,计划今年年底将产品率先应用于C909国产大飞机的维修场景。 公司总经理曾超表示,一架大型飞机根据使用部位不同需要配套十余种甚至几十种涂料,后续企业会按品类逐一攻关,陆续完成各类专用涂料的研发与适航认证,期待更多自研涂料全面应用于国产大飞机。
以小博大登顶全球榜单:一款中国世界模型凭什么跑赢Google和NVIDIA?
上周,全球世界模型权威评测体系WorldArena公布了Track-1(视频质量赛道)的最终结果。 来自中国的“无界世界模型”(Boundless World Model,BWM)一鸣惊人——开源版本BLM得分64.54,在13个参评模型中斩获全球第一;闭源版本BWM-Fast得分67.87,在总计86个参评模型中位列全球第二,距离榜首仅差0.39分。 这份榜单从视觉质量、运动质量、物理遵循性、内容一致性、三维空间准确性及可控性六大维度、16项细分指标进行综合评估。参赛阵容堪称豪华:Google、NVIDIA、高德、智元机器人、生数科技、极佳视界、流形空间、北京人形机器人创新中心……国内外顶尖团队悉数到场。 WorldArena Track-1 最终排名:BLM开源第一,BWM-Fast总榜第二(数据来源:WorldArena官方榜单) 值得注意的是,BWM并非出自算力堆叠的大厂之手,而是由欧洲科学院外籍院士、同济大学计算机科学与技术学院院长申恒涛教授牵头,国家级青年人才朱磊及其团队,联合考拉悠然、上海码极客共同研发。团队基于阿里巴巴开源的Wan2.2-TI2V-5B视频生成模型,以50亿参数的小体量,跑赢了诸多规模远超自己的对手。 消息传出后,AI圈的反应可以用两个字概括:意外。在“算力即正义”的叙事之下,一条不堆算力的“巧劲”路线凭什么登顶全球? 世界模型:AI的“物理直觉”从何而来 要理解BWM的意义,先得搞清楚“世界模型”到底在做什么。 如果你看过波士顿动力的机器人视频,可能会有一个疑问:那些流畅的动作、精准的抓取,到底是提前编好的程序,还是机器人真的“理解”了物理世界?这个问题的答案,指向AI领域最前沿也最棘手的方向之一——世界模型。 世界模型的野心很大:让AI不只“看见”画面,还能“预见”接下来会发生什么。给它一张初始照片,再告诉它“机器人要把杯子放到桌上”,它就能推演出整个动作过程的视频——就像给AI装了一双能预见未来的眼睛。这个能力一旦成熟,机器人就不需要在真实世界里一次次试错,而是在虚拟世界里先把动作“彩排”一万遍。 2026年,世界模型成了AI圈最炙手可热的赛道。图灵奖得主Yann LeCun与谢赛宁合伙创立AMI Labs,据多家媒体报道融资规模达10亿美元级别;李飞飞的World Labs持续加码;贝索斯成立Project Prometheus押注制造业AI。具身智能也被列入“十五五”未来产业规划,政策与资本的双重驱动下,全球科技巨头正疯狂涌入。 全球世界模型赛道主要技术路线对比:BWM走的是"动作条件视频生成"路线 近两年,世界模型这条赛道有一种明显的“军备竞赛”倾向:模型参数越来越大,训练数据越堆越多,算力卡集群越拉越长。在这种氛围下,BWM团队选择了一条不那么“卷”的路线——不靠堆数据和拼算力,而是靠架构创新和数据效率取胜。 具体而言,这条差异化技术路线包含三个层面的创新: BWM差异化技术路线的三个层面 这里需要展开解释一下DiT架构的价值。与传统扩散模型不同,DiT用Transformer替代了原来的卷积骨干网络。在处理长视频序列时,注意力机制能够捕捉更远距离的时空依赖关系——简单说,就是让模型在推演第100帧时,还记得第1帧里杯子放在哪里。而“动态记忆机制”的引入,则进一步缓解了长时序推演中的“灾难性遗忘”问题。 首帧引导机制利用初始帧信息锚定场景,提升视频生成的时空连贯性;双通路动作控制调制则将机器人动作轨迹精准映射到视频生成中,实现动作可控的物理仿真。三项创新从场景初始化、长时序记忆建模到动作响应控制多维度协同,使BWM在时空连贯性、动作可控性与物理一致性上全面领先。 BWM技术架构示意:从首帧引导到动作调制,再到动态记忆的完整流程 BWM以小参数量跑赢大模型,这在世界模型领域并不多见。它不仅是一项技术成绩,更在提示一个方向:算力规模并非唯一的入场券,架构原创才是真正的壁垒。 六大场景,检验“物理直觉” 世界模型好不好,最终要看它能不能在真实的机器人任务中“靠谱地预判”。BWM在评测中覆盖了六大类典型具身任务场景,每一类都在考验模型对不同物理交互的建模能力: 空间重排——按大小排列积木、堆叠碗碟。挑战在于多物体的空间排序与堆叠稳定性。BWM能够保持物体身份与目标布局,维持稳定堆叠接触,并预测自适应夹爪控制。 铰链交互——打开微波炉、翻开笔记本电脑。挑战在于铰链约束下的开合动力学,以及旋转过程中物体几何形态的连贯性。BWM在长时序推演中保持了物体状态的持久性。 精细操作——拧开关、挂杯子、按铃铛、盖印章。挑战在于极小的接触区域和精确的状态变化交互,要求模型理解物体的可供性——也就是"这个东西能怎么用"。 双臂协同——双手传递积块、交接麦克风。挑战在于双臂同步运动与近距离交接中的碰撞避免。BWM建模了同步双臂运动,保持了物体连续性。 长程放置——将物体放入柜子、瓶子扔进垃圾桶。挑战在于长时序场景一致性与遮挡下的物体漂移问题——BWM在遮挡场景下物体不会"凭空消失"。 分布外泛化——团队用GPT-Image-2生成了从未见过的初始场景,叠加原始机器人动作序列让BWM推演未来结果。面对物体外观的剧烈变化,BWM仍然保持了动作驱动的动力学一致性和交互连贯性。这意味着模型并不是靠"背题"拿到高分,而是真正学到了某种程度的物理规律——即便面对训练过程中没见过的场景外观,它依然能沿着给定的动作序列,合理地推演出接下来会发生什么。用更通俗的话说:模型拥有了一定程度的“物理直觉”。 空间重排:积木按大小排序 铰链交互:打开微波炉 精细操作:悬挂杯子 双臂协同:传递积块 长程放置:物体放入柜子 分布外泛化:未见场景推理 BWM在WorldArena评测中的六大场景生成效果(来源:GitHub开源项目) 这些场景的难度在于,它们不是简单的视频生成,而是基于给定动作序列的物理仿真。模型需要理解“力”与“运动”的关系,需要预判动作的后果,需要对三维空间有精确感知。这正是世界模型区别于普通视频生成模型的核心能力。 WorldArena六大评测维度表现对比:BWM在物理遵循性和可控性上表现突出 开源与闭源并举,世界模型需要生态 当前世界模型行业存在一个明显的痛点:学术成果难验证,顶尖技术难复现。很多团队在论文里报告的成绩令人印象深刻,但外界既无法复现,也难以判断真实能力边界在哪里。 BWM团队采取的策略是开源与闭源并行——开源版本BLM释放可复现的技术底座,降低科研与开发门槛;闭源版本BWM-Fast则持续探索模型性能上限,验证技术路线的竞争力。 截至发稿,BLM的模型权重、推理代码已在GitHub和Hugging Face同步开放,训练代码也在逐步释出中。GitHub仓库已收获超过1600颗Star。当足够多的研究者和开发者基于同一套开源底座做实验、提issue、贡献代码,世界模型的迭代速度将会显著加快。 从更大的行业视角来看,世界模型赛道正在从“要不要做”进入“怎么做”的深水区。LeCun的JEPA路线、李飞飞的3D生成路线、华为系团队的类脑认知路线、以及BWM所代表的动作条件视频生成路线——不同的技术路径正在交汇和分化。 英伟达机器人方向负责人Jim Fan在红杉AI Ascent 2026大会上抛出了一个极具争议的论断:“VLA已死,WAM当立”。随后,复旦大学团队联合新加坡国立大学发表综述《World Action Models: The Next Frontier in Embodied AI》,与Jim Fan的论断遥相呼应。 无论这场路线之争最终走向何方,BWM的成绩已经证明了一件事:在世界模型的竞争格局中,中国团队不仅在场,而且有实力站在最前面。同济大学空间智能团队表示,这套技术路线与全栈能力体系已形成,未来将在空间智能与世界模型核心问题上持续深度探索。而对于整个行业来说,一个开源、高水平、持续迭代的世界模型底座,或许正是当前最缺的那块拼图。 世界模型的竞争,才刚刚开始。(作者 | AGI-Signal,编辑 | 焦燕)
形态大变!华为新三折叠外观换新:从奏折S型变成包裹G型
快科技6月3日消息,博主定焦数码暗示,华为新一代三折叠屏Mate XT2非凡大师,将对沿用多年的经典折叠形态做出重大调整。 众所周知,前代Mate XT系列一直采用辨识度极高的S型折叠设计,结构为一屏外折加两屏内折,完全闭合后的形态类似传统奏折,这套方案的核心优势是能把整机厚度和重量控制得更轻薄,长时间单手握持也不会有明显坠手感。 这次华为新款三折叠直接改用G字型双内折方案,和三星Galaxy Z TriFold的设计逻辑一致,两片屏幕全部向内收拢包裹住主屏,所有柔性屏幕区域全程藏在机身内部,日常使用时的抗摔、防刮表现都会得到大幅提升。 G型折叠结构天然自带一块独立的外侧小屏,用户不用完全展开大屏就能直接完成日常通话、回复消息、刷短视频等高频操作。 这也意味着华为会对全新铰链结构重新调校,整机的厚度、重量还会在现有基础上进一步优化,即将登场的鸿蒙7系统也会针对性适配双屏独立交互的专属逻辑。 除此之外,华为Mate XT2还会搭载今年最新的旗舰级芯片,型号预计就是此前多次传出消息的麒麟9050 Pro,算力和能效比都比上一代芯片有明显升级。 全新麒麟旗舰芯片和深度优化的鸿蒙系统深度联动之后,有望进一步提升整机的日常流畅度、多任务并行处理能力,以及大屏展开之后分屏、跨屏联动等场景下的综合使用体验。
美国AI军备竞赛遭遇现实瓶颈:6700亿美元投入背后,数据中心难落地
谷歌 凤凰网科技讯 北京时间6月3日,据《华尔街日报》报道,美国科技公司正投入前所未有的巨额资金用于建设大型数据中心,谷歌母公司Alphabet计划募资800亿美元就是最新一例。然而,即便科技巨头们已筹集的资本规模不断扩大,在AI竞赛中如何有效投入这些资金却变得越来越不确定。 供应链延迟交付、许可审批之争以及电力供应不足等问题,已导致美国数据中心的建设落后于原定时间表,而且这一差距在近几个月进一步扩大:摩根大通上个月的一项分析发现,计划在2027年完工的数据中心容量中,超过60%尚未开工建设,另有7%已经延期。 这似乎形成了一个悖论:如果超大规模云服务商连已经宣布的许多项目都无法破土动工,那么即便华尔街再愿意提供数千亿美元资金,又能有多大作用呢? 对谷歌AI基础设施扩张的进一步观察,至少提供了这个问题的初步答案。谷歌在为其云业务(第一季度收入达到200亿美元)建设新设施的过程中采取了一种新方法,以绕开数据中心建设面临的一些主要瓶颈,尤其是获取所需大量电力供应。 分析师和电力行业专家表示,该公司确保拥有自身发电来源,并进行投资根据电力供应情况转移计算负载,这可能使其数据中心比竞争对手更快地接入电网,并为其部署日益庞大的资金储备提供新的途径。 美国科技巨头大力投资建设数据中心 谷歌和其他科技巨头近几个月纷纷大幅上调了资本支出预期,因为AI竞赛迫使它们必须加紧建设机库般大小的建筑,里面塞满了服务器、网络硬件和冷却系统。微软、Alphabet、Meta和亚马逊去年共投入了4100亿美元的资本支出,预计今年将支出超过6700亿美元。 建设挑战 这些企业面临的一项关键挑战是,如何获得电网运营商和电力公司批准,将数据中心接入电力系统。在这些庞大的设施中,有些耗电量相当于一座中等规模城市,在极端炎热或寒冷天气的用电高峰期,可能对电网造成压力。 部分建设延误还与评估流程的复杂性有关,需要判断某个具体项目是否可能对电力系统造成影响。 “由于目前对究竟有多少数据中心是真实会落地、以及将接入多少负载存在很大不确定性,这在某种程度上让许多审批流程陷入了停滞。”德克萨斯大学奥斯汀分校能源专家乔什·罗兹(Josh Rhodes)表示。 今年,谷歌以47.5亿美元收购了风能和太阳能开发商Intersect,成为唯一一家拥有电力公司的科技巨头。Intersect近年来已转向开发专门为数据中心供能的项目。谷歌表示,Intersect正在开发中的能源项目可提供数吉瓦的电力。1吉瓦的电力可为数十万户家庭供电。 大型数据中心包含服务器、网络设备等 谷歌还招募了一批能源领域的专家。曾任美国能源部贷款项目办公室主任的能源企业家吉加尔·沙阿(Jigar Shah)表示:“谷歌确实聘请了内部团队来开发其数据中心,因此他们采取了一种更加一体化的方法,我认为这种做法要周到得多。” 眼下,拥有现场发电能力正成为科技公司的一项战略优势。许多地区的监管机构和电力官员正在考虑,那些与新能源发电设施配套建设的数据中心是否应获得更快的并网通道,因为它们对电网的依赖程度较低。 包括xAI、OpenAI和Meta在内的公司已经建造或提议建造由现场天然气发电供电的数据中心。xAI位于孟菲斯附近的Colossus数据中心的部分电力来自燃气轮机,这引发了当地居民和政策制定者对空气污染的担忧。 其他科技巨头则押注于核电,包括传统的大型反应堆以及众多公司和创业公司正在开发的小型模块化反应堆。微软在2024年与电力生产商Constellation Energy达成协议,重启三里岛核电站未受损的反应堆。该核电站曾发生美国历史上最严重的核事故。联邦监管机构本周已批准了该计划中的部分内容。 发电设施瓶颈 建设发电设施本身也面临瓶颈。摩根大通在分析中指出,燃气轮机和电力变压器的采购延迟也是导致数据中心工期延误的因素之一。 除了为自建电力来源的数据中心提供更快的并网通道外,监管机构还在考虑将这一机会提供给那些能够减少用电量或在电力供应紧张时完全脱离电网的数据中心。多年来,数据中心运营商一直抵制这一想法,理由是许多数据中心功能对医疗和金融等关键行业至关重要。 多年前,谷歌成为首家开始研究在电网紧张时期如何降低数据中心用电的科技巨头。目前,该公司已与多家公用事业公司开展试点项目,通过减少数据中心用电来换取补偿,这种做法被称为“需求响应”。 周二,谷歌与需求响应公司Voltus宣布达成一项为期三年的协议,以帮助在美国最大电力市场PJM创造更多容量。在该市场,数据中心的建设已导致客户成本上升,并增加了在酷热或严寒天气下电力供应短缺的风险。 根据该协议,Voltus将向家庭和企业支付费用,以换取其在用电高峰时段减少电力消耗,并利用家用电池、智能恒温器等技术来进行管理。双方表示,这项合作最高可释放约100兆瓦的电力容量,规模大致相当于一座小型发电厂。 尽管Alphabet股价下跌,但投资者似乎对公司的募资计划处之泰然。科技股整体仍普遍上涨,延续了此轮强劲的涨势,该涨势已推动主要股指创下历史新高。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。