行业分类:
加载中...
头条分类:
加载中...
突发!美国拟撤销对三星/SK海力士/台积电在华晶圆厂“豁免”
当地时间6月20日,据《华尔街日报》援引知情人士的话报道称,负责美国商务部工业和安全局(BIS)的商务部副部长杰弗里·凯斯勒 (Jeffrey Kessler) 已经通知三星电子、SK海力士、台积电等在中国大陆拥有晶圆厂的晶圆制造商,美国计划取消允许它们在中国使用美国技术(主要是半导体设备)的豁免。 美国商务部发言人在一份声明中表示,“芯片制造商仍将能够在中国运营。芯片的新执行机制反映了适用于其他向中国出口的半导体公司的许可要求,并确保美国拥有平等和互惠的程序。” 撤销“无限期豁免”,设备供应将受限 早在2022年10月7日,美国出台了新的对华半导体出口管制政策,限制了位于中国大陆的晶圆制造厂商获取先进逻辑制程芯片、128层NAND闪存芯片、18nm半间距或更小的DRAM内存芯片所需的制造设备的能力,除非获得美国商务部的许可。三星、SK海力士、台积电等外资企业在中国大陆的晶圆厂也受到了该政策的影响。 不过,在数日之后的,三星电子、SK海力士、台积电均获得了美国商务部颁发的1年豁免期许可,使得他们在之后的1年内,美系设备厂无需办理任何额外的许可,即可向他们位于中大陆的晶圆厂供货。 2023年10月,在1年豁免期即将到期之际,美国商务部又同意向三星电子、SK海力士和台积电位于中国大陆的晶圆厂提供“无限期豁免”,使得他们无需再担心受到美国对华半导体设备供应限制政策的影响。这也将使得他们在中国的晶圆厂能够继续正常运营。 目前主流的NAND Flash芯片正在迈向了128层以上的更高的堆叠层数,主流的DRAM芯片也在进入10纳米级。而三星和SK海力士在中国都有着庞大的NAND FlashH和DRAM产能,台积电南京厂也有一定的16/12nm逻辑芯片代工产能,如果无法获得美系先进的半导体设备及零部件供应,那么不仅现有的产线运营可能将受影响,未来也将无法继续进行技术升级和扩大产能,这势必将会影响到他们在华工厂的正常运营,以及未来的产能布局和市场竞争力。虽然这一负面影响在短时间内不会立刻显现。 三星、SK海力士在华产能占比较高,取消豁免将冲击全球供应链 资料显示,三星在中国大陆的西安、苏州拥有存储芯片工厂。其中,西安工厂是三星在华最大投资项目,主要制造3D NAND闪存芯片。截至2024年年中,西安厂两期项目总投资已高达270亿美元。数据显示,三星西安工厂月产能将达到26.5万张12英寸晶圆,占三星全球NAND闪存芯片总产量的42%。2022年,三星半导体西安工厂产值将突破1000亿元人民币。 SK海力士目前在中国大陆无锡、大连(从英特尔手中收购而来)拥有晶圆厂。截止至2020年,SK海力士已累计在中国投资超过200亿美元,在无锡拥有4000多名员工,并于2019年完成第二工厂C2F的建设。随着C2F项目的持续推进,无锡工厂将承担SK海力士DRAM芯片全球生产总量近一半的份额。此外,在2021年SK海力士还将其位于韩国青州的8英寸成熟制程晶圆代工厂M8迁至了无锡,但是该晶圆厂去年已经被出售给了中企。 研调机构TrendForce数据显示,2025年一季度的全球DRAM市场,SK海力士以36%市场份额位居第一,三星以33.7%的份额居第二。而在2025年一季度的全球NAND Flash市场,三星以31.9%的份额位居第一,SK海力士以16.6%的份额居第二。 也就是说,三星与SK海力士一起占据了全球近70%的DRAM市场和近50%的NAND Flash市场。另有数据显示,目前三星在中国的NAND Flash工厂,投片量占该公司 NAND Flash总产能的 42.3%,全球产能占比也高达 15.3%。SK海力士也同样拥有约50%的DRAM产能和20%的NAND Flash产能在中国大陆。 显然,如果美国撤销对于三星和SK海力士在华晶圆厂的豁免,不仅他们在华晶圆厂未来的运营将会受到很大的影响,全球的存储芯片供应可能也将受到冲击。 至于台积电,其目前在中国大陆的南京厂仅拥有每月2万片先进制程产能,主要以16nm及12nm为主。虽然这部分的先进制程产能可能将会受到美国撤销“无限期豁免”的负面影响,但相对于台积电全球庞大的先进制程产能来说,影响可能并不大。由于美系成熟制程设备对华出口目前不受限,所以台积电在南京厂的28nm产能及松江厂的成熟制程产能则不会受到影响。 这可能只是一个谈判筹码 需要指出的是,目前撤销对于 三星电子、SK海力士、台积电在华晶圆厂的“无限期豁免”,还处于计划阶段,尚未正式实施。而且即便实施, 三星电子、SK海力士、台积电 可能也会被允许向美国政府寻求逐案许可,以供应他们在中国大陆的晶圆厂。 《华尔街日报》也透露,参与该规则讨论的人表示,撤销豁免并不是一个既定的决议。凯斯勒的部门——美国商务部工业和安全局(BIS)——还没有得到美国政府其他部门的支持,比如美国国防部。 因为,美国政府中的反对者担心,取消对于 三星电子、SK海力士、台积电在华晶圆厂的“豁免”,最终会提振中国的半导体设备及零部件公司,并最终让中国供应链掌控这些晶圆厂。 毕竟, 三星电子、SK海力士、台积电等半导体巨头不会坐视自己在华利益受损,所以他们在华晶圆厂如果无法获得美系半导体设备的供应,那么必然会推动他们转向采用中国本土或其他非美系的半导体设备来进行替代,而这无疑有助于中国发展国产化及非美化半导体供应链。 同时,美国此举也必然会影响到其与韩国等盟友之间的合作关系。 对于韩国来说,中国也是其最大的芯片出口国。数据显示,韩国芯片厂商将大约 60% 的芯片出口到了中国大陆,并且韩国芯片制造商在中国工厂的产能也远高于其他国家和地区的芯片制造商。 总结来看,此次事件很可能是美国特朗普政府为获得关税谈判筹码而“无中生有”的策略。 虽然此前在5月12日,中美双方达成了初步的关税协议,但是有保留有暂停90天的24%的关税需要继续谈判。美国此番计划撤销对三星电子、SK海力士、台积电等外资企业在华晶圆厂使用美国技术的豁免,可能是为了增加美国与中国进行关税谈判的筹码。 同时,目前中国对于稀土的出口管制政策,正颇为令美国的汽车等依赖于稀土材料的相关产业头疼。美国政府可能也是想要借此来换取中国对于稀土的出口许可。 《华尔街日报》报道称,白宫官员表示,美国此举并非新的贸易升级,而是旨在使半导体制造设备的许可制度类似于中国对稀土材料的许可制度。 此外,对于美国政府来说,利用撤销该“豁免”的威胁,对于韩国两大半导体巨头三星电子和SK海力士,以及中国台湾晶圆代工龙头厂商台积电的“拿捏”,也有助于美国政府与韩国及中国台湾的关税谈判。
六小龙开抢大模型第一股
“六小龙里已经有五家在筹备上市了。” 某头部创投机构合伙人李铮(化名)向字母榜(ID:wujicaijing)透露了这个消息。继智谱传出IPO消息之外,近日媒体爆料稀宇科技(MiniMax)正考虑在香港进行首次公开募股(IPO)。根据澎湃新闻报道,接近MiniMax的知情人士表示,MiniMax内部确实有类似想法,但目前仍处于初步筹备阶段。 但其实“六小龙里五家都早已开始接触投资机构募资,规模都在五亿美金以上,都进入初步筹备阶段了。”李铮表示。 MiniMax和智谱并非唯二筹备上市的大模型创企,而随着国内上市标准的进一步放宽,六小龙中五家争抢“大模型第一股”的局面也势必形成。 根据路透社报道,在2025陆家嘴论坛上,中国证监会宣布计划在上海以科技股为主的科创板设立新板块,以容纳尚未盈利的成长型企业。其中不仅重点提到人工智能企业,更提及将重启未盈利企业适用科创板第五套标准上市,“也就是说,即使现在仍在亏损、盈利不足的大模型创企也有机会上创业板了。”李铮补充道。 根据《智能涌现》报道,一名百川智能员工记得,百川创始人王小川去年就曾在他在内部会上说,2025年目标把业绩做到上市门槛(10亿元),拿到绿通(绿色通道名单)就随时能上市。对于六小龙而言,先敲钟者是谁或许还未落定。 无论是港股还是A股,对六小龙来说,眼下无疑是争夺“大模型第一股”的绝佳机遇。对于仍在筹备期的后来者而言,先传出IPO的智谱,似乎未必是最后的赢家。 2025年,挣扎求生的AI六小龙都在等一个“鲤鱼跃龙门”的机会——上市。 4月14日,智谱正式向北京证监局提交上市辅导备案,由中金公司担任辅导机构。成为六小龙中首家启动IPO进程的企业。 创建于2019年的智谱最早传出上市消息,一个关键因素就是满足了基本条件,即企业连续经营3年以上。紧随其后在6月被爆筹备上市的MiniMax创建于2021年12月,也因为成立日期较早,满足了这项基本条件。而由于其余几家都创建于2023年中后到2024年年初,因此并不满足“创建3年”的要求。 不过,抢跑的智谱未必能成为“大模型第一股”。 近半年来,字母榜从不同机构的投资人处分别得知,六小龙中,已有五家还未明确推进IPO,但已经频繁接触投资人,释放出上市的信号。其中智谱最先传出了备案的消息。 但论抢时间,智谱未必有先发优势。根据智谱的备案计划,智谱的上市辅导分三阶段推进:4月完成摸底调查与方案制定;5月至7月聚焦规范整改与持续尽调;8月至10月进入冲刺期,筹备上市申请文件。也就是筹备IPO,再加上路演等等必要程序,智谱也得再拖半年到一年的时间。 而同样的功夫,六小龙中的五家也都在下。等走完这些必要的上市程序,剩下的几家也都将满足创建三年的基本条件。 同时,这个条件现在也有了松动的可能性。 根据路透社报道,在2025陆家嘴论坛上,中国证监会宣布计划在上海以科技股为主的科创板设立新板块,以容纳尚未盈利的成长型企业。根据证监会官网发布的指导意见,具备 “重大技术突破、商业前景广阔、研发投入高” 特点的企业可在新板块上市。 证监会主席吴清表示,中国证监会将新设科创成长层,创业版正式启用第三套标准,重启未盈利企业适用科创板第五套标准上市,支持优质未盈利创新企业上市,人工智能企业被画了重点。 宽松政策之下,不仅创建未满3年的大模型明星创企们有了希望,就连一向被投资人诟病的盈利问题,都拿到了赦免书。 对几家尚未盈利的大模型创企而言,重启未盈利企业适用科创板第五套标准上市后,盈利不足的压力也可暂缓,对于六小龙来说,今年无疑正是决胜“大模型第一股”之年。 需要注意的是,“大模型第一股”的Title对六小龙的意义并不只是“好听”而已。 “中国互联网的上市逻辑,在AI大模型一样通用,是赢家通吃。” 某位曾从事FA业务的投资人告诉字母榜,无论是互联网还是AI大模型,都是充分竞争的行业,奉行着胜者为王的逻辑,作为前无古人后无来者的第一股,往往会因为没有参照,而能享受极高的估值溢价,也就能挤占其他创企的生存空间。 对于六小龙来说,扎堆寻求上市并不奇怪。这不仅来自于创企自身对资金巨大的需求缺口,还会受到投资人的压力。 “早期投资人都在等着回收部分资金,六小龙的投资协议里恐怕也难以避免有上市时限的要求。”上述该投资人补充道。 但争夺“大模型第一股”,却不单单是为了拿钱。 这个问题,或许前几年在“AI四小龙时代”,争夺“第一股”的商汤、旷视、依图、云从能够回答。 2021年,彼时AlphaGo掀起了大众对人工智能的关注热情,以商汤、旷视、依图、云从为首的四家企业也趁势争夺首个上市敲钟的资格。虽然商汤三年半亏损242.72亿,但最终流血上市,成为“第一股”。 IPO时,商汤的发行价3.85港元是发行价区间的下限,上市首日,商汤冲高回落,收涨7.27%,次日,商汤股价涨幅33.17%,交易最高点为9.7港元,也一度使得商汤的最高市值超过3200亿港元。而四家企业中,首先上市的商汤正是靠着市场的持续输血,在大模型时代跟上了步伐。反观旷视转向智能驾驶,原有业务几乎裁撤完全;云从等公司的业务则大规模收缩,以云从为例,2024年进行大裁员,其中研发人员占比高达51%。 “大模型第一股”在市场的号召力是切切实实的,对于六小龙而言,“大模型第一股”不仅是一个现成的可以讲给投资人的新故事,也能够在实际上为他们增加生存的时间和空间。 争夺大模型第一股,也就意味着六小龙中最先得到投资者的认可,不仅容易获得相应的溢价,也能够成为后上市者的价格锚点。 同时,对于迫切需要输血的六小龙而言,上市最直接的好处就是可以为企业引入最直接的资金支持。 进入2025年,无论是腾讯、阿里、字节等科技大厂押注AI的技术布局,还是DeepSeek后来居上的技术领先,都让六小龙面临巨头在前、技术故事难讲的尴尬局面,同时,如今的大模型创企想从外部拿钱,越来越难。 即便是上半年仍然融资的智谱,单次融资额都不超过10亿元人民币。3月,智谱宣布完成三笔战略投资,金额分别为超10亿元,5亿元和3亿元。而天眼查数据显示,智谱在2024年已经披露的融资金额共计接近70亿元,去年12月,智谱单笔融资数额为30亿元。 对于需要持续烧钱追上技术迭代的六小龙来说,融资太难了。那么钱从哪来呢?或许对于如今的六小龙来说,只能从股市中来。 不过,六小龙争上市,还有很多功课要补。 无论是港交所还是科创板,盈利能力不足的六小龙,迫切需要外界看到自己的盈利能力。 科创板要求以市值为中心,综合考虑收入、净利润、研发投入、现金流等因素,尽管港交所的主板上市,为特专科技公司引入上市制度,未商业化公司的门槛由100亿港元降至80亿港元。但创业板(GEM)的市值+收益+现金流量测试‌的要求,则是上市时市值不低于20亿港元,近一年收入不少于5亿港元,过去近三年经营活动现金流入净额不低于1亿港元。 而跻身六小龙的明星创企,都早早在去年就通过多轮高额融资冲到了200亿元的估值。但如此高估值之下,各家的盈利数据却颇为惨淡,至今仍没有一家公司的年收入达到10亿元人民币。 从去年齐做TO C的聊天工具人,到今年发力B端,单次预训练成本三四百万美元的AI六小龙,即便是最先冲刺IPO的智谱,据《财经杂志》报道,尽管2024年收入达3亿元,亏损约20亿元。 据The information预估,2024年,OpenAI的成本主要分成推理成本、训练成本和人工成本三大块,加起来在85亿美元左右。对标OpenAI,六小龙研发费用和商业化收入规模之间的差距,短期内难以弥合。 希望跃入龙门的六小龙,如今迫切需要的让外界看到收入增长的新故事,展示自己的造血能力。 做好数据的首要似乎正是节流。 此前在投流获客上颇为激进,月投流数额超亿元的月之暗面已暂停大规模投流;阶跃星辰也在最近爆出旗下AI 社交工具“冒泡鸭”业务缩减调整,决心与汽车、具身智能等头部企业合作开发垂类Agent;MiniMax此前B端业务的负责人魏伟也被爆离开;百川智能裁撤了负责金融、教育等领域的B端组,理由是集中资源,聚焦在医疗核心业务。 当C端的故事不好讲。B端成为新的突破口。不过,当DeepSeek、通义千问、字节豆包等争相把API价格打到地板价,在移动互联网时代就通过云服务积累起忠实客户的大厂,早已搞起了“云服务和大模型的叠加优惠”活动,甚至六小龙原有的B端客户也存在被大厂撬走的可能。 “API价格卷不过阿里和百度,也没有和云服务绑定的老客户,去年几家几乎都是贴钱开发中小规模的企业用户,只为了老板给投资人的报告里有业务想象力。”某大模型创企市场人员表示。 在《智能涌现》的采访中,几名百川智能员工也表示,去年以来,不少医院科室都有AI落地的指标,客户愿意签单,“一是为了自己的政绩,二是为了能发AI医疗相关的论文,最后是为后续医疗产品的销售。” 以专注B端医疗市场的百川为例,尽管早早定位医疗领域,抢到窗口期签下不少B端的医院客户,3月中旬,华为传出组建医疗卫生军团的消息,当下,如何避免与“B/G收割机”华为的直接竞争,是百川内部抓紧讨论的新命题。 此外,六小龙还必须面对一个问题,上市如果不成功呢? 同样作为科技创企,曾与商汤争夺第一股的旷视,经历五年的艰难筹备,最终几次冲击上市均失败。有市场分析指出,虽然旷视科技在人脸识别、智能安防等领域技术领先,但迟迟未能盈利。此外,AI行业的投融资环境趋于冷静,投资者对AI企业的估值回归理性。这些都成为了旷视迈不过去的坎。 而在投资人“FOMO”情绪逐渐冷却的当下,先行者曾经上市遇到的门槛,也是如今六家需要向外界交的答卷。是否能够成功敲钟,六小龙还得各凭本事。
英伟达,将用AI造AI?
据媒体报道,两位知情人士透露,英伟达正在与富士康洽谈,计划在美国得州休斯敦的一座新工厂内部署人形机器人,该工厂将用于生产英伟达的AI服务器。 消息人士称,这将是英伟达产品首次在生产线上由人形机器人协助下制造,同时也有望是富士康首座在生产线上使用人形机器人进行生产的AI服务器工厂。 报道称,预计这一部署将在未来几个月敲定,若落地标志着人形机器人在制造业中应用的一个重要里程碑,未来有望彻底改变传统制造流程。 消息人士称,两家公司计划最早于明年第一季度在休斯敦工厂启用人形机器人,届时富士康将开始生产英伟达的新款GB300 AI服务器。 目前尚不清楚将在该工厂部署哪种类型的机器人、它们的外观或初期部署数量,也不清楚这些机器人在工厂内将具体承担哪些工作。 根据富士康今年5月的演示资料显示,公司正训练机器人进行物品拾取与摆放、插入线缆和执行组装任务。 一位消息人士指出,富士康位于休斯敦的新工厂空间充足,相较于现有的AI服务器制造基地,更适合部署人形机器人。 今年4月时,英伟达宣布将在美国得州建立AI超级计算制造工厂,在休斯敦与富士康合作,在达拉斯则与纬创合作,两地预计将在12至15个月内实现量产。 媒体分析称,对于英伟达而言,在AI服务器制造中引入人形机器人,意味着其在该领域更进一步——公司本身已向机器人制造商提供构建这类机器人的平台。 德国汽车制造商如奔驰与宝马已在生产线测试人形机器人,特斯拉也在开发自家版本。年内早些时候,黄仁勋曾预测,人形机器人在制造业中的广泛应用将在五年内实现。
我在华为开发者大会现场,见到了鸿蒙的合伙人
每年华为开发者大会(HDC)期间,来自全球各地的开发者、行业专家和合作伙伴汇聚到华为松山湖园区,丰富多样的主题演讲、峰会、专题论坛和互动体验,让这个平日静谧的小镇变得火热起来。 今年也不例外。在松山湖,华为开发者大会 2025(HDC 2025)开启了一场属于「鸿蒙的时代合伙人」的盛会。 当华为常务董事、终端 BG 董事长余承东站在台上,感谢所有「鸿蒙的时代合伙人」——也就是鸿蒙的合作伙伴、开发者,以及屏幕前的无数用户——与华为一同经历了「635 个日夜的冲锋」,并高声宣布 HarmonyOS 6 Developer Beta 正式启动报名时,场内爆发出一阵欢呼。 与其说是因为惊喜,不如说,大家是在为过去一年里每个人亲身感受到的「鸿蒙速度」而喝彩。 过往经验告诉我们,操作系统的生态建设动辄以 5 年乃至 10 年为单位;但时至今日,发布一年多的鸿蒙 5 已有超 3 万个鸿蒙应用及元服务正加速开发和更新中,满足了 99.9% 的用户使用时长。 放眼半个多世纪的移动操作系统发展史,这种速度也极其罕见。 「鸿蒙速度」和 HDC 现场的热烈氛围告诉我们,在生态建设上,鸿蒙有一种与众不同的叙事—— 一个关于平台、开发者和用户共同勉励前行的故事。 从操作系统到生态平台,鸿蒙的答卷由众人共书 回顾科技行业的历史叙事,一个新操作系统的诞生,往往意味着旷日持久的「阵地战」。 平台需要以一家之力,去说服十百万计的开发者,去教育亿万级的用户,投入百亿级别的资金,并历经数十年的积累——然而对于起步阶段的鸿蒙而言,它既没有数十年的时间窗口,也无法在完全理想的环境中从容布局。 但鸿蒙的实践与速度,似乎证明了,生态建设还有另一条路径。 鸿蒙并未选择那条走不通的老路,而是将现实挑战转为了一次重构生态建设模式的契机,这就是「共建」模式的由来——鸿蒙生态的厚积薄发依靠的是平台、开发者和用户间的相互协同。 这场被称为「中国科技力量的集体冲锋」的生态建设,将鸿蒙的前景与无数开发者的机遇、亿万用户的体验深度绑定,用加速度弥补了时间的紧迫。 这场「冲锋」的结果,首先体现在一连串令人瞩目的数字上: · 超过 40 款华为终端产品搭载鸿蒙 5,数字仍在快速增加; · Top5000 的应用均已上架,满足消费者 99.9% 的使用时长,更多长尾应用也在陆续鸿蒙化; · 华为开发者联盟注册开发者数量已达 800 万,732 万人通过鸿蒙生态学堂学习鸿蒙开发; · 鸿蒙 5 带来了 70 多种创新体验,如碰一碰、安全访问、实况窗等创新体验,已有超过 9000 个应用接入这些创新体验; · 伙伴积极参与共建生态,带来 50+ 场景化创新,从适配鸿蒙和接入鸿蒙,走向生态共建的正向循环。 当然,数字的增长只是结果,在这一过程中更值得关注的,是鸿蒙与合作伙伴共建共享的独特模式。 超过 9000 个应用,已不再是简单地「适配」鸿蒙,而是深度接入了「碰一碰」、「实况窗」等 70 多项鸿蒙创新体验:用手机轻触电脑,就能将手机存储的图片放入 WPS 的幻灯片中,或是将视频素材无缝导入剪映素材库。 这种丝滑体验背后,是华为与众多生态伙伴联合开发、挑战场景化创新的努力。 在这里,生态伙伴不再是单纯的「适配者」,而是深度参与生态建设的「共建者」。鸿蒙的生态板图,不是一块块孤立的领地,而是平台与开发者用创新的「毛细血管」连接起来的活体网络。 任何生态都不会是无源之水、无本之木,鸿蒙场景化创新的勃勃生机,反倒更令人好奇:这片充满生命力的创新之林,生长在怎样的土壤之上? 正如自然生态系统不由「设计」而来,鸿蒙的成功并非只靠「顶层设计」,而更多依赖自下而上的「涌现」。 鸿蒙设计了分布式、微内核等底层规则,以及可用于应用演化的功能架构,但具体要用这些规则打造怎样的「物种」,则交由开发者和用户去主导。 强大的底层架构,赋予了开发者更多可能性。而这个通用架构所能「涌现」出的集体创造力,则将远超任何顶层设计。 例如,京东利用鸿蒙 AR Engine 对空间的厘米级高精感知能力,实现了 AR 嵌入式摆放,不需要等商品到家也能预测摆放的效果;类似地,QQ 音乐利用端侧 NPU 能力,首次在端侧完成人声与伴奏音轨分离,可有效降低资源负担。 种种基于鸿蒙的延展应用宣告着,鸿蒙已成为千行万业的数字底座。 当平台提供的不再仅仅是流量分发渠道,而是强大的底层能力时,平台与开发者的关系就发生了根本变化。 平台的核心价值是通过赋能开发者的创造力,让开发者创造前所未有的增量价值,并从中共同分享收益。这是一种从「管理」到「赋能」、从「控制」到「共生」的平台经济模式转变。 华为铺路,开发者修路,而用户用脚投票 开放生态与先进底层的红利,最终还是要通过开发者之手来挖掘才能得以释放。值得庆祝的是,开发者正在以前所未有的热情涌入鸿蒙生态,逾 800 万注册开发者数量就是活力最好的证明。 但为什么是鸿蒙,而不是其他? 这里不需要回避一个事实:开发者都希望自己的应用被「看见」,获得用户认可,带来经济收益。 作为一片「新大陆」,现阶段的鸿蒙有着强烈的「入局红利」——它意味着新的流量规则、新的交互方式和新的商业机会。 但在我看来,新机会的红利之外,还有一个更根本的吸引力,那就是鸿蒙通过「一次开发,多端部署」的方式,实实在在地降低了开发门槛。 一切开发与否的决定,归结起来都是成本问题:开发一款新应用带来的回报,能不能弥补个人投入其中的时间精力以及企业的资金投入?如果答案是否定的,那么开发应用的计划自然会被搁置。 在这方面,鸿蒙早早做出了规划:覆盖超过 6100 家企业的创新实训营通过预培训降低了进入鸿蒙生态的难度,而鸿蒙面向全场景的基因使得技术资产仅需极少处理就能顺利迁移到其他终端。 一个例子是,蜻蜓 FM 在覆盖直板机、双折叠、三折叠、阔折叠、鸿蒙电脑等多形态终端时,代码复用率高达 85%~90%,开发效率提升极大。 集齐低成本和高回报,鸿蒙生态的繁荣就成了一种必然。 另一方面,当开发者和用户同时涌入,鸿蒙生态的实际体验也在被亿万用户「调校」得越来越好。这一点仅从鸿蒙与用户的互动数据上就能看出端倪:635 天,鸿蒙新增 260 多项系统功能,完成 216 万用户心愿单,开发者提交版本数超 27 万次。 平台、开发者和用户三者的深度参与,塑造了鸿蒙用户体验的「微笑曲线」: 系统流畅性能与功能创新带来极佳的初体验,随后交互变化与适配问题可能会带来不便,但对用户反馈的敏捷采纳和快速迭代很快就会解决问题,从而让鸿蒙设备越用越顺手。 所谓「鸿蒙速度」的本质,其实就是「信任的速度」。它是平台与用户之间的反馈-兑现机制,也是平台与开发者之间「技术共研」的默契。这种信任的正循环,才是系统生态真正启动的钥匙。 无论是「捷停车」的无感停车支付,还是与中石油合作的「加油不下车」无感补能,这些备受好评的场景创新,都源自对用户真实反馈的回应。 可以说,鸿蒙像是一座高速发展的城市,身处其中的人,每一天都能看到新的风景。 这也是鸿蒙的独到之处:当一个生态系统里的用户不再是沉默的消费者,开发者也不只是单纯的淘金者,而是共同成为了生态的「产品经理」时,这个生态才真正拥有了自我进化的生命力。 另起一行:鸿蒙为万物互联的 AI 时代重写规则 人类总是习惯用旧地图去寻找新大陆,因此,长期以来,业界习惯于将鸿蒙置于 Android 与 iOS 各占半壁的框架中去审视,试图为其找到一个「第三极」的定位。 然而,当 HDC 2025 上鸿蒙 6 的全新互联架构与鸿蒙智能体框架(HMAF)浮出水面时,鸿蒙真正的战略意图已然清晰:它并非旧世界的事物,也无意在原有的版图中寻找位置。 它的诞生,是为了解决在万物互联和 AI 浪潮来临的当下,从未被好好解决的命题。 而这种对时代的回应,可以归为两点:重构空间,以及重构时间。 空间维度的重构,体现在打破了设备与生活空间的物理边界。当你的音乐可以从手机无缝流转到车机,当视频可以在平板和电脑间自由接续,鸿蒙实际上是在围绕着「人」这个中心,将不同空间内的设备,重新整合为一个统一、流动的数字化「超空间」。 你的服务和数据,不再被禁锢于某一块屏幕,而是跟随你的脚步在空间中自由穿行。 而时间维度的重构,则由 AI 驱动。传统的人机交互线性且耗时:用户需要依次打开不同 APP,一步步完成搜索、比对、下单等操作,这个过程中消耗的是用户宝贵的时间。 鸿蒙智能体框架则试图打破这一模式,当你对小艺说「帮我规划周末到上海的行程」时,一个「旅行 Agent」就能协同调用航旅、酒店、点评等原子化服务,将原本需要半个小时的线性操作,压缩到了几句话的即时回应之内。 当一个操作系统能够跨越所有空间去理解你,并预判你的需求以节省你的时间,它就不再只是被动的 GUI,而是演进为一个理解并服务于用户意图的「意图操作系统」。这是一种交互方式上的巨大进步。 当然,理解意图的核心其实是生态。一个能打通手机、车机、PC、智能家居等所有场景的操作系统,在理解用户的综合意图上,有着单一设备操作系统无法比拟的结构性优势,这才是鸿蒙最难以复制的护城河,也是其在 AI 时代敢于重写规则的底气所在。 这个全新的时空体验,诞生于平台、开发者与用户的「共建」模式,也反过来巩固了这个生态。它为开发者提供了全新的创新方向,也为用户带来了无可替代的价值。 鸿蒙的目标,或许不在于重走一遍智能手机操作系统的老路,而在于当 AI 与万物互联的潮水涌来时,它早已造好了那艘适应最新航道的船。 无论这艘船将如何驶向大海,掌舵者仍是鸿蒙的时代合伙人。
马斯克:AI海啸巨浪袭来,DOGE就是沙滩捡垃圾!超级智能最晚明年到
别忘了还有马斯克! 在昨天的YC创业学校演讲上,老马说和「伟大的AI之神」比起来,政治是多么微不足道——所以他决定退出政坛! 人类正处于智能大爆炸的极早期。 若AI发展顺利且未带来灾难,未来经济体量将远超现在的十倍以上。 超级智能今年或明年就会到来。 刚刚结束130天美国政府「政府效率部」(DOGE)特别雇员任期的老马,直言不讳地说这DOGE这次经历如同一次「有趣的支线任务」。 但其重要性在即将到来的AI革命面前完全不值一提! 老马说如果将政府效率部门的工作比作「清理海滩」,那即将到来的AI革命则是「上千英尺高的海啸」。 不得不说,连马斯克都无法处理Bureaucracy,但是,幸好还有AI。 修复政府就像清理很脏的海滩,那里有针头、粪便,以及各种垃圾。 但接着即将到来的是一道高达上千英尺的海啸。 当如此大规模的海啸即将袭来时,清理海滩上的垃圾还有多大意义? 完全没有。 昨天AI圈都沉浸在YC创业学校上Karpathy关于「软件3.0」、「人人都是代码之神」等各种新奇词语上。 但千万别忘了,马斯克的这个分享也值得一看,内容涵盖了他从早期互联网创业到领导SpaceX、Tesla和xAI的历程,以及他对AI和第一性原理思维的深刻见解。 另外,他也提到Grok 3.5的进展,以及xAI拥有的GPU的情况。 最后,他对人类文明未来的深思特别的有意思——其实马斯克自己也没太想明白,但先干了再说。 视频很长,以下是关键内容提要: 人类处于智能大爆炸的黎明,目前正处在智能大爆炸纪元的极早期。 人类成为多行星物种,将极大延长文明、意识与智能的存续。 火星有望在30年内实现自我生态维持。 我们已无限接近数字超级智能,它可能今年或明年就会到来。 给18-25岁早期创业者的建议:切勿放弃董事会控制权;聘请一位顶尖律师。 在繁荣期辍学,投身互联网浪潮,即便失败,也可重返校园深造。 若AI发展顺利且未带来灾难,未来经济体量将远超现在的十倍以上。 早期创业经历PayPal的深远影响:PayPal孕育了「PayPal黑帮」,催生的公司数量或许是21世纪最多的。 SpaceX想要实现人类登陆火星的宏愿,尽管最初成功的几率预估不足10%,但是干了再说。 第一性原理思维:将事物回归其最基本的、不证自明的公理,然后由此出发,审慎地向上推演,而非依赖类比或分析。 xAI的挑战:需要场地、电力和冷却系统。训练中心配备15万块H100、5万块H200和3万块GB200。 Neuralink的使命:突破人脑输入输出带宽瓶颈,弥补输出带宽的不足。 不远的未来,人类智能在总体智能中的占比将微乎其微,甚至不足1%。 人类是未来数字超级智能的生物启动器,很早老马就说人类只是某种数字生命的BIOS。 关于人类,关于AI,关于未来,马斯克还有更深的感悟,老马的演讲整理如下。 第一性原理 智能大爆炸的序章 关键词:第一性原理、Zip2、创业动机、X.com、PayPal 从互联网早期到火星计划,马斯克始终秉持一个信念——用第一性原理拆解复杂问题。 他回忆自己最初只是想做「有用的事情」,而非「伟大的公司」。 1995年,他在斯坦福读博和投身互联网之间选择了后者。 起初,他甚至连Netscape的面试机会都得不到,只好自己在帕洛阿尔托创办Zip2。 Zip2的代码是马斯克亲自手写的,他和兄弟就睡在办公室,洗澡去YMCA。 尽管最终卖了三亿美元,但他认为技术并没有被真正发挥,于是他「把筹码留在了桌子上」,投身创建了x.com,即后来的PayPal。 他强调:「失败的主要原因之一是,自尊与能力的比例超过1」,原话如下: 无论你是CEO还是创业公司中的其他角色,你都要不惜一切代价去取得成功,同时要不断打击自己的自尊心,就像内化责任一样。 一个主要的失败模式是当自尊与能力的比例大于1时。如果你的自尊与能力的比例变得太高,那么你就会打破与现实的反馈循环。 用AI术语来说,你会破坏你的强化学习(RL)循环。如果你想要有一个强大的RL循环,就意味着内化责任并最小化自尊心,无论任务多么伟大或卑微,你都要完成它。 真正的成功源自不断压低自我、内化责任、追求真实的反馈循环。 极限工程学 从火箭工厂到AI训练集群题 关键词:SpaceX、Falcon 1、Tesla、生死时刻、工程文化 SpaceX的成功,几乎是九死一生。 前三次发射失败,第四次如果再失败,公司就彻底没钱了。 幸好成功,NASA紧接着在12月22日打来电话授予他们空间站补给合同,「我当时脱口而出:我爱你们。」 两天后,他又在最后一刻完成了特斯拉的融资,避免了圣诞节后发不出工资的危机。 他说:「你骗不了数学。」 在硬件世界中,政治毫无意义,只有对真理的极致追求才管用。 这就是他为什么说自己更喜欢「工程师」这个身份而非「研究者」。 构建AI世界主线任务 数字超级智能即将降临 关键词:xAI、Grok、数字超级智能、AI训练、Truth Alignment 马斯克认为,数字超级智能最快可能在今年出现,「如果今年没来,明年一定来」。 他主张打造「最大限度追求真理的AI」,因为「强迫AI相信不真实的东西,是非常危险的」。 为了训练xAI的模型,他们在孟菲斯建起超级训练集群:15万H100、5万H200、3万GB200,另一个中心还将上线11万个GB200。 他亲自睡在数据中心,参与布线工作,只为在6个月内搭建出一个原本需要24个月才能完成的训练基地。 「我们没有时间从头建楼,只能找旧工厂、租柴油发电机、移动冷却设备、修改特斯拉Megapack软件以稳定供电。」 未来的主线与支线 人形机器人与多行星文明 关键词:Optimus、人形机器人、Neuralink、多行星文明、卡尔达舍夫等级 马斯克预测,未来人形机器人的数量将比人类多出五到十倍。 他表示,过去拖延做类人机器人,是不想让《终结者》成为现实。 但现在,「你只能选择做旁观者还是参与者」,于是他开始全力推进Optimus和数字超级智能。 成为多行星物种对文明延续至关重要。 他估计30年内将有足够的人口迁移到火星,使其在地球补给停止时依然自给自足。 这将极大延长意识的生命周期,不论是生物的还是数字的。 「如果我们是银河系中唯一的智慧生命,那人类意识就是黑暗中唯一的一点烛光,我们必须竭尽所能守护它。」 奇点将至 风险、希望和未来 关键词:奇点、AI安全、白药丸、Neuralink、超级丰裕 对于AI的未来,马斯克并不全然乐观。 他认同AI之父辛顿Hinton的看法:可能有10%-20%的概率走向毁灭,但同时也有80%-90%的概率实现超级丰裕。 要避免风险,他强调两个关键词:「严格的真理」和「对生命的同情」,原话是: 热爱人类并且乐于助人的AI和机器人。 我认为在构建AI时非常重要的一点是对真理的严格遵守。 我的直觉是,如果强迫AI相信一些不真实的事情,这可能会使AI变得非常危险。 他还提到Neuralink能弥补人与机器之间的带宽差距,但超级智能在这之前就会来临。 「今天我们还有选择。但如果人类智能总量不到所有智能的1%,我们还能控制什么?」 在最后,马斯克还对在座的18-25岁的创业者发出了邀请。 Grok就是他心目中追求真理的AI。 而AI也许能够帮助我们找到宇宙的本质。 或者,AI能告诉我们外星人在哪里,我们是不是宇宙唯一的生命,以及宇宙是如何开始的。 最后的最后,老马依然不忘本提醒在座的朋友们: 「我们人类的本质是生活在一种模拟中吗? 如果是,我们处于什么级别的模拟?」
用人脑细胞跑AI,我快搞不懂这个世界了
自打沾上 AI 和大模型推理训练之后,在这个领域没啥对手的老黄,高端显卡眼瞅着越卖越贵。到头来,连带着我们这群臭打游戏的也遭了秧,想要高性能的显卡就得加钱。。。 但是最近看到一条新闻,让我感觉摆脱老黄的统治,买上便宜的显卡,也不是没有可能。 事情是这样的,澳大利亚有家公司叫 Cortical Labs,推出了一台能将人类脑细胞与硅芯片结合的生物计算机,用人类神经元处理数据,直接 “ 活体计算 ”。 这个技术再发展发展,恐怕下一步就是培养出更接近大脑的器官,是不是感觉黑客帝国要上演现实版了? 但先别急,相信有不少人看到这里的第一反应,是质疑这件新闻的真实性,以及好奇这个事情的原理。接下来咱们一个个慢慢聊。 想要搞懂这个颠覆咱们认知的事情,得先确立几个基本的概念。 首先,将成熟的体细胞重新编程为多能干细胞,技术已经非常成熟了。早在 2012年,英国科学家约翰・格登(John B. Gurdon)和日本科学家山中伸弥(Shinya Yamanaka),就发现了 iPSC( 诱导性多能干细胞 )技术。 根据这个技术,理论上可以在体外大规模培养人体干细胞,还可以利用干细胞的全能特性,定向去诱导分化出具备特定功能的人体细胞。 而且利用 iPSC技术培育类器官( 如微型肝脏 ),或者修补受损组织等相关的医疗用途,可以说是很常见了。 其次,通过主动向细胞发送电信号、再收集记录细胞发出的电信号,可以实现硅基芯片与细胞之间的信息传递。 也就是,我们可以通过放电,告诉细胞目前发生了啥,还可以通过监测记录细胞的放电,搞明白它想表达啥。 明白这两点之后,接下来咱们就可以正式讲讲生物计算机的事了。 开头提到的 Cortical Labs 团队,将提取的人体细胞重新编程为干细胞,随后将它们诱导分化成了神经细胞,然后培养成有着真正神经轴突和树突的细胞集合,并且证实了这个“迷你大脑”是有智能的。 相关的论文,已经发表在神经科学领域极具权威性的期刊《Neuron》上。 简单来说,他们尝试让这个体外合成的人工智能玩经典的乒乓球游戏《Pong》。 如果球板击中乒乓球,那么系统就会产生一个可以预测的、规律的电刺激奖励;反之,就会产生一个不和谐的随机电流。结果发现,迷你大脑会为了追求可预测的电信号,自己琢磨明白了游戏规则。 当然世超本身并不是从事这方面研究的,还是看了 B 站 up 主@K形态生命科学关于实验的解析,才明白 Cortical Labs 团队具体都干了啥—— 他们用不同位置的电极刺激神经网络,用来代表乒乓球的位置;同时电极的刺激频率,代表着球距离球板的距离。同时微电极阵列还会感应神经网络的电流变化,以此来操控小球。 随着电刺激的反复进行,迷你大脑开始尝试移动球板,击中小球。并且球板并不是来回无意义地反复移动“碰运气”,而是恰好能出现在小球的移动路径上。 也就证明,这个迷你大脑意识到自己在玩游戏,而且随着时间的推移玩得越来越好了。 并且,团队也用电脑人工智能模拟了这个游戏,发现生物计算机的效率是电脑的500倍以上。。。 相较于电脑人工智能大模型,靠海量的数据运算和参数优化,才能模拟真实的神经网络,迷你大脑在自我学习的情况下,直接掌握了游戏逻辑。 这也意味着,丢给迷你大脑别的课题,它极有可能表现得比电脑人工智能更好。 正是在这个实验的基础上,Cortical Labs 团队推出了生物计算机 CL1。每台 CL1 装有大约 80 万个人类神经元,以及与它们交互的阵列电极。当然为了维持神经元的活性,还有配套的生命维持系统,负责调节温度、供给氧气等等。 那说了这么多,生物计算机到底有啥优势呢? 首先,相比较传统计算机,效率更高这一点,刚才的实验环节其实已经足够说明问题了。但是最新的 CL1 能发挥啥样的效果,世超这里也不好下定论。 毕竟售价也不是一般人能够负担得起的:单台 CL1 售价为 3.5w 美元( 约 25.1 万人民币 ),30 台起购,每台也要 2w 美元。目前看来,最主要的用途还是医学和 AI 相关的研发。 不过 CL1 也提供远程租赁的方案,每周 300 美元,就可以远程访问一台 CL1。目前已经正式开启租用服务了,如果哪位差友从事相关研究,用上了这台设备的,记得在评论区给世超解疑答惑一下。。。 另一个优势在于,生物计算机的功耗极低。单个 CL1 单元的功耗仅为 30 瓦,一个包含 30 个 CL1 单元的机架也仅消耗 850-1000 瓦的能量,远低于传统 AI 服务器。 其实再举一个直观的例子,会更方便大家理解,人脑平均功耗仅仅为 20 瓦左右,但与柯洁对弈的 AlphaGo,TPU 集群运行的功耗大约 160 瓦,而为了训练它所消耗的功耗,足够驱动上万个大脑连续运行。。。 那么是不是可以畅想一下,未来的生物计算机,能开发出脑神经专用编程语言,效率直接起飞;或者通过神经细胞的自适应学习能力,补齐电脑人工智能在模糊感知任务上的短板。这样的话,也许训练AI,可以多一个选择,就不用上赶着找老黄买显卡了。。。 但是生物计算机的发展,也面临一些道德伦理问题—— 虽说目前 CL1 系统的神经元数量,与人脑 860 亿的神经元规模相比不值一提。。。但是当类人脑器官的规模到一定程度后,是否会产生自我意识?所以,生物计算机能实现什么样的效果,这条路能不能走得通,还是让子弹再飞一会吧。
荣耀CEO李健上海MWC最新演讲,释放了什么信号?
划重点: 1、6月19日上海世界移动通信大会上,荣耀CEO李健在主论坛上说:“AI不能永远停留在服务器或云端,只有流淌进用户的每台设备、每个场景、每次呼吸,才能真正发挥它的价值。”这不是一句产品宣传语,而是一场产业变革的信号。 2、目前全球AI竞争中,加速落地应用成为新的共识和命题。荣耀用一项明确的落地计划和一次生态联盟的构建,代表中国企业给出了自己的答案。 3、荣耀Magic V5将不仅仅是一部手机,而是一个真正能感知用户认知、自主执行复杂任务、并能安全可靠地提供服务的“贴身秘书式智能体”。荣耀希望通过AI模型企业、运营商、AI终端企业、互联网企业四方紧密协作,在技术、商业创新、标准定义和人才培育等全渠道合作,推动人工智能走向产业的标准化进程。 4、在全球消费电子企业中,几乎没有品牌在销量下滑后,能再次复苏。而荣耀,却经历了两次奇迹崛起。荣耀强大的韧性背后,是管理团队的卓越基因,以及品牌本身的顽强生命力。 作者 常远 编辑 重点君 在哲学领域,我是谁?我从哪里来?到哪里去?是三个终极问题。而在商业领域,这个终极问题变成了:我是什么价值观?我解决什么问题?为客户创造什么价值?在AI时代的浪潮里,荣耀率先有了定义。 6月19日上海世界移动通信大会上,荣耀CEO李健在主论坛上说:“AI不能永远停留在服务器或云端,只有流淌进用户的每台设备、每个场景、每次呼吸,才能真正发挥它的价值。” 这不是一句产品宣传语,而是一场产业变革的信号。 从OpenAI收购前苹果设计负责人Jony Ive的硬件公司io,到Sam Altman再次强调L1-L5智能体路径,再到苹果、谷歌、阿里、百度纷纷将AI嵌入手机与终端的举措,行业趋势愈发清晰:AI不再只是模型的炫技舞台,而是开始从“思考”走向“行动”,走向人人都能感知的使用场景。 在这场新的AI技术竞速中,荣耀用一项明确的落地计划和一次生态联盟的构建,代表中国企业给出了自己的答案。荣耀选择的突破口,不是模型参数,而是AI终端生态的标准化落地。以Magic V5为代表的智能体手机,正在成为这一战略的样本。 AI加速落地应用,全球科技巨头殊途同归 2022年11月,ChatGPT横空出世,让世界看到了通用人工智能(AGI)的曙光。我们第一次感受到AI可以生成内容,进行基础的文本交互,日常聊天和简单问答。但很快就发现,这种只会聊天的AI,在处理深度任务时仍然局限。 OpenAI CEO Sam Altman对AI的演进路径有着清晰的定义,他将AGI的实现划分为L1到L5五个阶段:从“聊天者”(L1)到“推理者”(L2),再到“行动者”(L3)、“创新者”(L4),最后是“组织者”(L5)。他认为,当前我们正处于从“推理者”向“行动者”跨越的关键过渡期,即从“会想”到“会做”的转变。 这意味着,AI不能再仅仅停留在理解和分析层面,而是需要具备执行复杂任务的能力。OpenAI的战略布局也印证了这一点。今年5月22日,OpenAI宣布以近65亿美元收购Jony Ive创办的硬件公司io。这一举动被视为OpenAI战略重心从云端模型转向物理硬件的关键转折点,预示着AI将从虚拟世界走向物理世界,真正实现行动。毕竟,只有当AI与硬件载体深度融合,才能真正触达用户的日常生活场景,释放其全部潜能。 据《划重点》观察,5月以来,从红杉AI内部峰会(Sequoia AI Ascent)、微软 Build 2025、Google I/O 2025,到苹果 WWDC 2025,一系列重量级行业大会也都清晰地勾勒出了AI领域最显著的趋势:模型竞赛冷却,AI进入产品化与应用落地的“第二幕”。海外各大科技企业不再仅仅卷参数和论文,而是争夺用户入口、智能体标准和终端能力。 与此同时,国内的AI公司也纷纷将目光投向智能体方向。阿里巴巴、腾讯、字节、百度,以及三大运营商,都已在各自领域积极布局智能体。这表明,中国企业与全球AI巨头在L1-L5的技术路径上取得了高度一致,加速落地应用成为新的共识和命题。 作为中国智能终端领域的代表企业,荣耀的顶层认知与OpenAI等全球行业巨头不谋而合。荣耀CEO李健在MWC上系统阐释了AI的演进路径,强调AI加速落地应用的重要性,并首次提出组建AI终端生态联盟的倡议。荣耀的策略是聚焦终端智能和生态协同,正是这场技术共识的中国实践者,致力于将AI能力深度嵌入硬件,打造“能感知、会思考、可行动”的智能终端。 当前,全球AI产业正朝通用人工智能(AGI)的目标演进,这意味着,AI将从会说、会想走向会做、会创,最终实现会管。在这个阶段,让AI融入到日常生活场景中,才是释放技术潜能的关键。荣耀正是抓住了这一核心,从技术共识中找到了自己的差异化落地方向。 荣耀走出差异化路径,牵引中国AI加速发展 在AI浪潮席卷全球的当下,业界普遍认识到,AI的未来不再是单纯追求模型参数的无限扩大,而是谁能真正让AI落地,谁能让用户在日常生活中真正使用起来。李健在演讲中一语中的:“AI最终应该服务于人,服务于人的工作与生活。” 李健指出,AI的发展正在经历三个转变: 一是,从“模型能力”到“落地能力”:未来的AI竞争不再是谁的模型参数更大、谁的模型能力更强,而是谁能更好地交付落地。无论什么模型,“能跑起来干活”的才是好模型。 这意味着,AI的价值不再停留在实验室的演示,而是要真正解决实际问题,融入用户的生活场景。 二是,从“工具效率”到“结果闭环”:真正的AI应用,不应该仅仅是你点击后,它做了什么,而是它主动替你完成了什么。AI应该能够跑通一个完整的任务流程,实现结果归因,而不是仅仅提供单一环节的效率提升。 这意味着AI要从一个提供效率的工具,进化为能够自主完成复杂任务并交付结果的服务。 三是,从“云端计算”到“贴身存在”: 真正的AI产品,不应该只是你去找它,而是它就在你身边。AI不能永远停留在服务器或云端,只有流淌进用户的每台设备、每个场景、每次呼吸,才能真正发挥它的价值。 这强调了AI终端化的重要性,让AI成为用户贴身存在的伙伴。谁能率先把AI从服务器搬进终端,谁就能抢占AI时代的主动权。 为了实现AI的真正落地,荣耀提出了“两大支柱”:终端和Agent。 硬件终端是核心载体:它不再只是承载模型的外壳,而是内在人格的延伸,与用户共处、共感、共生。硬件作为核心生态载体,不再是冰冷的算力容器,而是AI人格化的物理延伸。通过传感器与用户共感,以终端设备为共生场景,同时汇聚行为数据反哺AI进化,让AI更懂用户,形成“设备即服务中枢”的闭环。 Agent是核心入口:Agent不再只是执行任务的应用,而是理解用户意图、自主执行任务与结果交付闭环的生态入口。它是用户的知己、智囊、伙伴,甚至可以成为用户的“第二个自我”。Agent充当用户与AI的“翻译官+执行者”,精准拆解意图,调度工具链完成任务规划,最终交付闭环结果,是连接虚拟智能与现实需求的枢纽。 最强AI智能体手机荣耀Magic V5,正是其“落地优先”战略的集中体现。其实,早在2016年,荣耀Magic系列手机就代表了智能科技的探索,荣耀一直是AI领域的先行者。2024年9月的IFA展上,荣耀首次在智能手机行业提出AI智能体概念,并在10月30日发布了首款搭载MagicOS 9.0系统的旗舰手机——荣耀Magic7,具备了智能体手机的能力。 Magic V5作为荣耀第五代折叠屏旗舰手机,将进一步实现AI能力的终端侧创新落地实践。它将具备三大闭环能力,解决当前AI落地面临的共同挑战: 场景闭环:当前AI应用存在断层、碎片和割裂的问题,设备之间无法高效联通,AI无法高效流转、灵活调用。Magic V5将通过打破数据孤岛、服务孤岛和设备孤岛,实现数据共享训练、服务生态整合和设备互联互通,让AI“做得通、做得好、做得全”,让用户真正获得解放,获得“自由感”。 性能闭环:AI落地面临力、时延和功耗的挑战,端侧算力不足,难以承载大型模型。Magic V5将通过三个“协同”打通性能闭环:端云协同,突破算力瓶颈;软硬协同,突破能效瓶颈;算网协同,强化计算效率。让AI“强劲、流畅、高效”,让用户享受极致体验,获得“满足感”。 信任闭环:AI应用还存在幻觉、隐私和伦理问题。Magic V5将通过模型算法,技术共创;隐私保护,标准共建;AI伦理,行业共治。让AI“可靠、可信、可控”,让用户无后顾之忧,获得“安全感”。 这些闭环能力的实现,意味着Magic V5将不仅仅是一部手机,而是一个真正能感知用户认知、自主执行复杂任务、并能安全可靠地提供服务的“贴身秘书式智能体”。荣耀将AI智能体的思考阶段转化为实际产品,从点咖啡的简单场景,到未来能够打通多个App,实现出差时自动处理订票、选餐厅、打车等所有事务的一站式服务。这是荣耀在AI领域“落地优先”的差异化路径,也是其牵引中国AI加速发展的关键所在。 生态破局、协同致胜,全球AI竞争的中国方案 在AI浪潮中,单打独斗已成过去式,生态共赢才是致胜关键。荣耀深刻认识到了这一点。5月21日,在AI节点暨低空经济标准化创新研讨会上,荣耀联合中国信息通信研究院以及20余家企业共同推进结构调整标准落地,并牵头了10余个AI节点的标准立项及启动。这标志着中国在全球率先提出智能手机AI分级概念,凭借庞大的市场基础、完善的网络条件和丰富的数据资源,成为首个实现L3级别AI终端应用的国家,目前处于全球领先水平。 荣耀发起的AI终端生态联盟,其构建逻辑承载具出一个“从理念根基到生态象”的“支柱演化模型”。这个模型不仅是理念的延伸,更是生态构建的支撑,共同勾勒出AI落地的完整蓝图。 理念层:团结、开放、共创、共享。这是联盟运转的底层价值逻辑,构成生态的“思想土壤”。它强调各方需打破技术壁垒、共享研发资源、加速技术,共同突破推动人工智能落地。 理念的落地需要创新,这三层思维是生态运转的“认知引擎”。要求将人工智能能力深度嵌入硬件,打造“能感知、会思考、可行动”的智能终端;强调AI要从“会思考”走向“能作用”,解决实际问题;各方优势互补、紧密协作,形成合力。 生态层:AI终端生态联盟。理念与思维的最终指向,是具象化的生态协作网络,就是AI落地的“执行阵地”。该联盟由AI模型企业、运营商、AI终端企业、互联网企业四方协同组成,通过角色互补、协作协作、价值跃迁,共同引领行业变革,加速AI落地。 在这个联盟中,各方发挥各自优势,构建生态合力: AI模型企业:拥有领先的技术创新生态,比如DeepSeek、阿里、字节、百度等公司在大模型算法、AI训练等方面拥有核心优势。 运营商:拥有丰富的算网生态,其网络基础设施和数据传输能力是AI终端实现端云互惠、算网互惠的基础,也是AI服务触达用户的关键通道。 AI终端企业:拥有丰富的终端生态,如手机、平板、智能穿戴等设备,是AI能力深度嵌入硬件、打造智能终端的载体。 互联网企业:拥有丰富的数字服务生态和用户行为数据,可将AI能力封装原生服务,创新用户体验,并基于数据反哺AI模型优化,让AI更懂用户需求,形成“服务-数据-优化-服务”的闭环。 荣耀希望通过这种四方紧密协作,在技术、商业创新、标准定义和人才培育等全渠道合作,推动人工智能走向产业的标准化进程。荣耀在AI终端标准制定中扮演重要角色,荣耀与中国通信标准化协会、中国信通院泰尔终端实验室、以及电信终端产业协会合作,牵头立项了多项AI终端相关标准,包括分级标准、以及由分级标准衍生出的场景标准、能力标准等。 特别是AI终端L1-L5智能终端分级标准的推出,这是国内首个针对手机自动化的分级标准,不仅填补了行业空白,也为中国在全球AI标准制定中争取了重要话语权。 这个“金字塔模型”本质上是一场“从理念思想到生态实践”的产业革命。当“团结、开放、共创、共享”的理念,通过“终端思维、AI思维、生态思维”的转化,最终沉淀为AI终端生态联盟的协作网络时,以荣耀为代表的中国人工智能产业正走出一条“以生态破局、以协同致胜”的差异化道路。这不仅是全球技术落地的创新,更是AI竞争中“中国方案”的集体突围。 做难而正确的事,不是AI追随者,而是定义者 在全球AI竞速上,荣耀与OpenAI、苹果等国际选择的路径不同。OpenAI和苹果更倾向于端侧模型与硬件闭环的深度整合,封闭的生态体系。OpenAI收购io,正是其从云端模型向物理部分延伸硬件,构建软硬一体则闭环生态的强信号。而苹果一直以追求封闭高度但和谐的生态系统为著称,致力于将AI能力融入其硬件产品中,提供最大限度的用户体验。 与此不同,荣耀选择强调“标准先行+生态和谐”的开放路径。荣耀的策略是,通过推动人工智能终端标准化,降低人工智能落地产业,鼓励更多合作伙伴加入,共同构建开放的人工智能生态。这背后有着荣耀独特的优势: 荣耀是唯一与华为、苹果设备互联互通的品牌,真正实现荣耀“谁都能联,传啥都快”,这为AI在多场景下的流畅体验提供了基础。 荣耀的AI团队普遍年轻化,平均年龄在30岁以下,这使得年轻团队充满活力和创新精神,能够快速响应市场变化,进行技术迭代。 荣耀在AI智能体的标准化过程中,核心问题之一是如何在数据用出端的情况下,实现用户的需求,同时保护用户数据的安全。智能体需要在终端具备足够的处理能力,以理解用户并正确调用相应的App。通过全栈个人知识库等技术,确保隐私敏感数据在端侧加密、安全存储,这极大提升了用户对AI的信任度。 尽管开放生态之路仍面临挑战,但荣耀选择做难而正确的事,而不是快而浮躁。坚定的开放态度和对标准化的投入,体现了荣耀对AI未来发展的深刻洞察和长期主义的战略定力。荣耀的目标不是简单地追赶潮流,而是要为AI产业的健康发展奠定基础,让AI真正成为普惠大众的科技。 大模型的光环逐渐褪色,AI走向开始“贴身存在”的行动阶段时,中国企业必须思考一个终极命题:我们要以什么姿态参与波澜壮阔的AI变革?是亦步亦趋地紧随,还是走自己的路,贡献“中国方案”? 荣耀给出了自己的答案——“团结、开放、共创、共享”。这不仅仅是一个联盟口号,更是面对技术迷雾时,中国企业在提出集体行动路线。在技术、市场和伦理的十字路口,荣耀的多边主义十分紧迫。它呼吁AI模型企业、运营商、AI企业、互联网企业四方友好,通过优势互补、紧密协作,共同解决AI落地的场景、性能和信任三大闭环问题。 中国拥有全球最大的移动互联网用户群体和丰富的数字服务场景,为人工智能落地提供了肥沃的土壤。同时,国家政策高度重视人工智能标准化,通过引导和资金支持,鼓励企业在人工智能领域进行创新和突破。在此背景下,荣耀并不是唯一一家迈向人工智能发展的企业,但它代表了中国企业向全球释放开放的明确信号:我们不再是追随者,而是定义者。 未来AI的战争,终将在每一位用户手中的终端里决出胜负。这不仅仅是技术之争,更是生态之争、标准之争、价值观之争。荣耀开放的姿势、对标准化的执着,以及对用户价值的洞察,正在牵引中国AI走出一条独特的道路。不仅通向更智能的生活,更指向一个由中国企业共同定义、开放共生的AI成时代。这是一个众木成林的时代,每一个人都将成为AI变革的受益者和参与者,共同迎接AI为生活带来的无限可能。 写在最后 我们需要再次回顾荣耀这家企业的特殊性。在全球消费电子企业中,几乎没有品牌在销量下滑后,能再次复苏。而荣耀,却经历了两次奇迹崛起。2020年底从离开华为后,荣耀销量一度跌至个位数,但在解决供应链等问题后迅速实现“V字反转”;2024年,荣耀因多种原因销量承压,但今年凭借荣耀400系列,再次吹响反攻冲锋号、坐稳第一梯队。荣耀强大的韧性背后,是管理团队的卓越基因,以及品牌本身的顽强生命力。 7月2日,荣耀即将发布第五代折叠屏旗舰手机Magic V5,据李健介绍,全栈式个人知识库、多智能体协同带来的PC级生产力、全品牌互联互通等都将会落地到这款手机中,它将是全球最轻薄的折叠旗舰,也是当前行业最强的AI智能体手机。我们可以拭目以待。
苹果被硅谷AI圈围殴了
作者 | 李水青 编辑 | 心缘 智东西6月21日报道,自上周苹果发表一篇论文,质疑大模型的思考能力,并论证大模型在复杂难题上“准确率崩溃”后,不少产业人士对其进行了围攻。(《苹果AI“暴论”震动AI圈!DeepSeek、Claude等热门大模型只是死记的模式机器?》) 近日,纽约大学名誉教授、《代数思维》和《深度学习正在遭遇瓶颈》的作者加里·马库斯(Gary Marcus)发文总结了反驳苹果论点的7个观点,包括“人类也无法做到真推理”、“实验例子设计存在逻辑漏洞”、“推理内容超出token限制导致结果失真”、“一作是实习生”等,并对此进行了一一驳斥,证明这些观点缺乏说服力。 博客地址:https://garymarcus.substack.com/p/seven-replies-to-the-viral-apple 马库斯还援引全球SaaS龙头Salesforce于5月24日发布的一篇论文,拥护苹果的观点。这篇论文提到,在可能需要推理和算法精度的“多轮”条件下,即便是Gemini-2.5-Pro这样的顶级模型在测试中性能仅为35%。 论文地址:https://arxiv.org/abs/2505.18878 此外,加州大学伯利克里分校于6月9日发表的一篇论文展示了视觉语言模型的脆弱性:“视觉语言模型的表现明显比其视觉编码器差,性能会下降到接近偶然水平。”这也被认为是苹果“大模型崩溃论”的有力论证。 论文地址:https://www.arxiv.org/abs/2506.08008 值得一提的是,参与这场AI论辩的除了人类还有AI作者。此前6月10日,大模型Claude被放在arXiv论文的一作,与一名人类作者联合“发文”质疑苹果的实验设计有问题,强调所谓的“推理崩溃”其实只是token限制导致。 论文地址:https://arxiv.org/abs/2506.09250 一、大模型Claude被放论文一作,驳斥苹果的“AI崩溃论” 苹果刚刚发布一篇论文质疑大型推理模型是“假思考”,就有大模型“本模”跳出来反驳了。 6月10日,Anthropic旗下大模型Claude被一位名为Lawsen的人类作者放在论文一作,在arXiv平台上“发表”了一篇题为《思维的幻觉的幻觉(The Illusion of the Illusion of Thinking)》的论文。 苹果此前的论文报告大型推理模型在超过特定复杂度阈值的规划难题上会表现出“准确率崩溃”,Claude的这篇论文则试图证明,他们发现这主要反映了实验设计的局限性,而非根本性的推理失败。 这篇论文主要攻击了苹果AI论文中的河内塔实验。河内塔游戏是一种经典的游戏,它有三个柱子和多个圆盘,玩家需要将左侧柱子上的所有圆盘移动到右侧柱子上,并且不能将较大的圆盘堆叠在较小的圆盘上。 论文的分析揭示了三个关键问题:1、河内塔实验在报告的失败点系统性地超出了模型输出token的限制,而模型在其输出中明确承认了这些限制;2、作者的自动评估框架未能区分推理失败和实际约束,导致模型能力分类错误;3、最令人担忧的是,他们的“过河”基准测试包含了由于船只容量不足导致N>5在数学上不可能出现的实例,但模型却因未能解决这些无法解决的问题而被评为失败。 当他们控制这些实验结果时,通过请求生成函数而不是详尽的移动列表,跨多个模型的初步实验表明,此前被报告为完全失败的河内塔实例具有很高的准确率。这些发现凸显了在评估AI推理能力时,精心设计实验的重要性。 这篇论文的观点得到不少人的赞同。有网友认为,Claude的批评证明了象征性限制扭曲了大模型的产出。苹果的“推理崩溃”是技术性的,而非根本性的——研究方法终将适应。也有人称“token限制论证为性能指标提供了新的视角”,并认为“看到AI直接参与学术讨论很有趣了。” 不少网友赞叹“AI作为一作的时代正式到来”、“C. Opus将成为被引用次数最多的研究人员之一”、“现在每个人都在读LLM的文章,甚至连研究人员都一样”,这侧面论证了大模型的强大能力。 但反驳的声音依然强大。X平台用户Chomba Bupe说:“整件事都只是在重复我在推特上看到的那些观点。Claude到底贡献了什么,竟然被列为作者?如果语言模型(LM)连需要255次迭代的算法都执行不了,那它还有什么用?” 二、苹果AI论文七大质疑,纽约大学名誉教授:都缺乏说服力 针对大量反驳苹果AI论文的观点,纽约大学名誉教授、《代数思维》和《深度学习正在遭遇瓶颈》的作者加里·马库斯进行了总结,依次列出了七个论点并进行了一一反驳。 总的来说,马库斯认为所有这些反驳都缺乏说服力。苹果的论文再次明确表明,规模化并非解决之道。 观点1:人类在处理复杂问题和内存需求方面存在困难。 马库斯反驳称:“没错。但这还不够全面。我们完全有理由期待机器去做我们做不到的事情。汽车拥有更强的耐力,计算器不会犯算术错误。这就是我们发明计算机的原因:进行无差错的重复计算。而且在很多情况下,包括论文中重点提到的河内塔问题,我们现有的系统都能完美运行,不会出现任何错误。AGI应该向前迈一步。 但在很多情况下,大语言模型反而是倒退了一步。请注意,他们把‘我们要构建能够彻底改变世界的AGI’变成了‘相信我们,我们的系统会犯错,人类也会犯错’。 苹果论文的真正要点是,随着算法复杂度和与训练分布的距离不断增加,大语言模型不再适合用来运行算法,就像人类不应该充当计算器一样。如果我们想要实现AGI,就必须做得更好。” 观点2:大型推理模型无法解决问题,是因为输出需要太多的输出标记(也就是说,正确答案太长,大型推理模型无法生成)。 马库斯反驳称:“这部分属实,但也是一个非常巧妙的观察:大型推理模型有一个缺点,那就是其输出长度有限。对于某些大型推理模型来说,12步河内塔的正确答案太长,无法输出,作者应该已经解决了这个问题。 但关键在于: 1、这个反对意见虽然很巧妙,但实际上并不能解释结果的整体模式。大型推理模型在8个盘的河内塔问题上失败了,其中最优解是255步,完全在所谓的标记限制之内; 2、编写良好的符号人工智能系统通常不会遇到这个问题,通用人工智能也不应该遇到这个问题。大语言模型的长度限制是一个Bug,绝对不是一个特性。再说,如果大语言模型连像“河内塔”这样基本的计算都无法可靠地完成,你怎么能认为它能够正确计算军事战略(尤其是在战争迷雾笼罩的情况下)或分子生物学(存在许多未知数)呢?苹果团队要求的比现实世界通常要求的要简单得多。” 观点3:这篇论文是由一名实习生撰写的。 马库斯反驳称:“这让我很生气,因为它是一种人身攻击而不是实质内容,它具有误导性,几乎不真实,而且完全缺乏背景。第一作者确实是苹果的实习生Parshin Shojaee,但马库斯强调: 1、她也是一位非常有前途的三年级博士生,曾在许多主要会议上发表过论文。 2、如果你真的读过这篇文章,就会清楚地发现她与拥有博士学位的Iman Mirzadeh共同承担领导责任。 3、这篇论文实际上有六位作者,而不是一位,其中四位拥有博士学位;其中一位是Yoshua Bengio的兄弟Samy Bengio,他在机器学习社区中非常有名气 4、在许多科学领域,像这篇论文一样,把初级作者放在第一位,资深作者放在最后,这是一种常见的做法;成千上万篇重要论文都这么做了,而且从未因此受到批评。 5、真正重要的是论文的质量。Alfred Sturtevant在发明基因图谱时还是一名本科生。” 观点4:更大的模型可能会做得更好。 马库斯反驳称:“没错,情况总是如此,我看到过一份报告称o3-pro至少在某些时候可以解决其中一个问题。更大的模型有时会做得更好,因为模型本身有真正的改进,有时是因为针对特定问题进行了训练。从外部我们永远无法知道是哪种原因。 但问题是,我们无法提前知道对于任何给定的问题,哪个模型足够大。苹果的结果是,一些相当大的模型可以在6个圆盘的河内塔游戏中取得成功,给人一种精通的假象,但到8张圆盘时就会崩溃,这不是好的信号。人们只需要一直测试所有的东西,而几乎没有任何保证。有些模型可能对规模为S的任务T来说足够大,但在下一个规模或略有不同的任务T’上会失败,等等。这一切都变成了掷骰子游戏。” 观点5:这些系统可以用代码解决难题。 马库斯反驳称:“在某些情况下确实如此,这对于神经符号人工智能来说是一个巨大的胜利,因为它们无法在没有代码的情况下可靠地解决难题,而且代码是符号化的。这极大地证明了我一直以来的说法:我们需要一种能够整合神经网络和符号算法及表示,例如逻辑、代码、知识图谱等的人工智能。但同时,我们需要可靠地、通用地做到这一点,而我们还没有跨过这个门槛。 重要的是,苹果论文的目标是了解大型推理模型如何通过推理和回溯在无人协助的情况下探索解决方案,而不是了解它如何很好地利用从网络上检索到的现有代码。打个比方:学生可能会抱怨数学考试需要手算积分或微分,即使数学软件可以立即给出正确答案。然而,老师布置问题的目的并非寻找问题的答案,而是评估学生对概念的理解。 大语言模型真的理解河内塔算法的概念吗?这正是苹果团队想要探究的。大语言模型能下载正确的代码吗?当然可以。但如果遇到新问题、环境瞬息万变等情况,在没有概念理解的情况下下载代码就没什么用了。” 观点6:这篇论文只有四个例子,其中至少有一个(河内塔)并不完美。 马库斯反驳称:“例子可能都不是完美的,但这四个例子加在一起,提供了与数十篇其他先前论文相吻合的证据,他相信还会发现更多的例子。他自己已经在算法应用中发现了几个类似的错误,将在几天后写出来。 纽约大学的Tal Linzen刚刚发表了另一个例子,其中模型……能够更正简单版本的语言问题(小型语法、短字符串),但随着问题变得更加复杂,准确率会迅速下降。马库斯认为,假以时日,我们将看到大量论文强化苹果的结果。” 观点7:这篇论文并非新鲜事,我们早已知道这些模型泛化能力很差。 马库斯反驳称:“没错,但为什么我们认为这些模型是通往通用人工智能的康庄大道呢?除了这是一项巧妙的研究,明确了一个重要观点之外,真正的新闻是,人们终于开始关注生成式AI的两大致命弱点之一,并认识到其重要性。顺便说一句,同时听到‘这是错的’和‘我们早就知道’真是太搞笑了。至少有一次,我看到一个人同时说出了这两句话,间隔几分钟。 归根结底所有这些反驳都缺乏说服力。如果像Sam Altman这样的人感到紧张,那是因为他们应该紧张。苹果的论文再次明确表明,规模化并非解决之道;这一次,人们终于开始关注这个问题了。” 三、Salesforce新研究“撞题”苹果:多轮推理测试下准确率仅35% 除了马库斯的一系列反驳,Salesforce最新发布的一篇论文拥护了苹果的观点。 论文证明,在可能需要推理和算法精度的“多轮”条件下,即便是Gemini-2.5-Pro这样的顶级模型在测试中性能仅为35%。马库斯认为这足以和苹果的论文融合证明当前的技术不可信。 让我们来具体看看这篇论文,论文发布于2025年5月24日,题为:《CRMArena-Pro:对不同业务场景和互动中的大语言模型智能体进行全面评估(CRMArena-Pro:Holistic Assessment of LLM Agents Across Diverse Business Scenarios and Interactions)》 论文提到,尽管智能体(AI Agent)在商业领域拥有变革潜力,但由于广泛使用的平台上缺乏公开且真实的业务数据,有效的性能基准测试受到阻碍。现有的基准测试通常对其环境、数据和智能体与用户交互缺乏保真度,对各种业务场景和行业的覆盖范围有限。 为了弥补这些不足,Salesforce推出了CRMArena-Pro,这是一个全新的基准测试,用于对各种专业环境中的大语言模型智能体进行全面、真实的评估。CRMArena-Pro在CRMArena的基础上进行了扩展,包含19项经专家验证的任务,涵盖销售、服务和“配置、定价和报价”流程,适用于B2B和B2C场景,融合了由不同角色引导的多轮交互和保密意识评估。 实验表明,领先的大语言模型在CRMArena-Pro上的单轮成功率仅为58%左右,在多轮设置下,性能显著下降至约35%。 虽然工作流执行对于顶尖的智能体来说更容易掌握(单轮成功率超过83%),但其他经评估的业务技能却面临更大的挑战。此外,智能体的固有保密意识几乎为零;虽然有针对性的提示可以改善这种情况,但这往往会损害任务绩效。 这些发现凸显了当前大语言模型能力与企业需求之间的巨大差距,展示了在多轮推理、保密性和多功能技能习得方面取得进步的必要性。 这篇论文同样质疑了当下主流测试基准的价值,并通过一个基于业务场景数据的新基准论证了主流推理模型能力的不足。 此外,其中有一句话对于很多企业来说都是一个破坏因素:几乎零保密性。这又攻击了大语言模型在信息安全上的不足。 四、UC伯克利论文:视觉语言模型很脆弱,只会学习捷径 另一篇论文展示了视觉语言模型(VLM)的脆弱性:“视觉语言模型的表现明显比其视觉编码器差,性能会下降到接近偶然水平”,X用户Chomba Bupe认为,这意味着语言模型只是忽略了来自视觉编码器的丰富信息然后输出内容。 他谈道:“理解视觉信息需要某种形式的抽象推理,如果没有推理,连接到视觉编码器(VE)的语言模型只会学习捷径,即忽略来自VE的信息并编造看起来合理但毫无意义的细节。” 让我们具体来看下这篇论文,论文由加州大学伯利克里分校于2025年6月9日发布,题为:《隐藏在显而易见的地方:视觉语言模型忽略了它们的视觉表现(Hidden in plain sight: VLMs overlook their visual representations)》。 论文提到,语言提供了一个自然的界面来指定和评估视觉任务的性能。为了实现这一可能性,视觉语言模型必须成功地整合视觉和语言信息。UC伯克利研究人员的工作将视觉语言模型与其视觉编码器的直接读数进行比较,以了解它们跨模态整合的能力。在一系列以视觉为中心的基准测试(例如深度估计、对应性)中,他们发现视觉语言模型的性能明显低于其视觉编码器,性能下降到接近偶然水平。 他们通过对整个视觉语言模型进行一系列分析来探究这些结果:1、视觉表征的退化,2、对任务提示的脆弱性,以及3、语言模型在解决任务中的作用。 他们发现,执行这些以视觉为中心的任务的瓶颈就在于这第三类。视觉语言模型无法有效地利用整个模型中易于访问的视觉信息,并且它们继承了大语言模型中存在的语言先验。 如下图所示,在所有任务中,尽管视觉编码器的性能存在较大差异,但视觉编码器的表现均显著优于视觉语言模型评估和盲评估。此外,尽管DINOv2在6项任务中的5项里是性能最强的编码器,但它在任何任务中都未使视觉语言模型方法达到最高性能。 结语:苹果AI论文争议,呼唤新评估范式 这场围绕苹果论文引发的学术论战超出技术细节争论,触及大模型发展前景的信仰。一方面这种反共识的观点受到了来自多方的围攻,另一方面,Salesforce和UC伯克利的研究则从多轮复杂推理任务的显著低成功率、以及视觉语言模型对视觉信息利用的脆弱性等不同角度,提供了有力的佐证。 这场争论不仅指出了“规模化”路径的潜在局限,更倡导评估范式的革新与底层架构的突破。未来的突破点或许在于更深入地理解模型失效的根源,设计更能真实反映智能本质的测试基准,以及探索神经符号结合等新架构,使AI不仅能识别模式,更能进行可靠、可泛化的计算与推理。
苹果遭股东集体起诉:Apple Intelligence进展被夸大,构成证券欺诈
IT之家 6 月 21 日消息,据路透社报道,当地时间周五,苹果公司遭到股东集体起诉,被指在信息披露中低估了将先进生成式 AI 整合进语音助手 Siri 所需的时间,导致 iPhone 销量受影响、股价下滑,构成证券欺诈。 这起诉讼涵盖在截至 6 月 9 日的一年中蒙受损失的投资者,诉方称可能因此损失了数千亿美元。尽管苹果在此期间推出了一些新功能和外观更新,但在 AI 方面的进展依然有限。 苹果尚未回应媒体置评请求。首席执行官蒂姆・库克、现任首席财务官凯文・帕雷克以及前任首席财务官卢卡・梅斯特里均被列为被告,诉讼已在旧金山联邦法院立案。 以埃里克・塔克为首的股东表示,苹果在 2024 年 6 月举行的全球开发者大会上推出“ Apple Intelligence”,称其将显著提升 Siri 的功能性和用户体验,并暗示 AI 将成为 iPhone 16 的核心卖点。 但股东指出,苹果当时并未真正掌握可用的 AI 版 Siri 原型,且无法合理预期这些功能能赶上 iPhone 16 的发布时间。 他们认为,从 3 月 7 日苹果宣布将部分 Siri 升级推迟至 2026 年开始,外界才逐步了解实情。直到 6 月 9 日的全球开发者大会,苹果对自身 AI 进展的评估令市场分析师大感失望。 自 2024 年 12 月 26 日创下历史高点以来,苹果股价已回落近四分之一,市值蒸发约 9000 亿美元(IT之家注:现汇率约合 6.47 万亿元人民币)。
Meta 新眼镜来了!这次是 Oakley 的经典运动口味
Meta新眼镜 Oakley口味 自从 2023 年 Facebook 的母公司 Meta 与知名时尚眼镜品牌雷朋联名,推出了一款带录像功能和语音助手的智能眼镜 Meta AI Glasses 之后,带录像功能的智能眼镜领域就重新火爆了起来。 就在昨夜,美国知名运动眼镜和配件品牌欧克利(Oakley)也宣布了一款与 Meta 合作的智能眼镜—— Oakley Meta HSTN (发音为 how-stun),口号为「性能 AI 眼镜」: 本次与 Meta 合作的欧克利与雷朋一样,两者均为全球眼镜行业巨头依视路陆逊梯卡(EssilorLuxottica SA)麾下的子品牌。 这家意大利-法国跨国公司是全球最大的眼镜产品和视觉护理解决方案提供商,除了自有品牌之外,普拉达、香奈儿和蒂芙尼等等奢侈品牌的眼镜产品也是由依视路陆逊梯卡设计和生产的。 回到本次发布的 Oakley Meta HSTN 上,相比已经上市两年多的 Ray-Ban Meta 眼镜,Oakley Meta HSTN 放弃了时尚属性,而是选择了将智能的重点放在欧克利最擅长的运动领域。 一款意外保守的欧克利 与此前的传言不同,欧克利并没有使用类似滑雪镜的贯穿式镜片以及中置的摄像头,而是采用与 Ray-Ban Meta 基本相同的布局:偏圆的镜片,以及录像指示灯与摄像头左右放置的设计,在欧克利现有的产品线中属于较为日常化的风格。 不过比起雷朋,欧克利的运动专业属性在 Oakley Meta HSTN 上还是有所体现的,最直观的地方就是丰富的可选镜片。根据欧克利的宣发,它可以兼容所有欧克利现有的特殊镜片(如变色镜片和特殊镀膜镜片)与医疗镜片,颜色和反光度的选择种类也比雷朋更多一些。 换句话说,这就是一款 Oakley 最标志性的运动眼镜,且得到了 Meta AI 的智能体验加持。 此外,在首日的宣传中欧克利还展示了一款使用白金色镜架,搭配自家可以增强对比度的 PRIZM 墨镜片的限量版眼镜,开场广告中姆巴佩和 J.R.史密斯佩戴的都是这款金色限量版。 「嘿 Meta,谁是最快的球员?」 得益于后发的优势,Oakley Meta HSTN 在功能性方面相比 Ray-Ban Meta 有了很大的提升,其中最亮眼的就是视频录制规格的进步。 Oakley Meta HSTN 用上了一颗新的 1200 万像素摄像头,录制规格从 1080P 跃进到了 3K。只不过目前官方仍未宣布更具体的参数,比如是否去除了雷朋上 3 分钟的录制时限,以及是否有新的针对运动场景的增稳算法等等。 此外,在交互功能上 Oakley Meta HSTN 则与雷朋款基本保持了一致,两者都可以通过镜腿上的按钮与触控区域唤醒手机上的 Meta AI 助手,也可以直接作为蓝牙耳机,用来听音乐和接打电话。 根据宣发视频所展示的使用场景看,Meta AI 很有可能增强了对于运动方面的视觉识别的搜索功能,或许在实际发售的版本中除了回答信息之外,还能进行运动数据(比如比分或者路线)的记录。 由于主要面向的客户和使用场景都是偏向体育运动类的,Oakley Meta HSTN 将最主要的功能性提升留给了续航。根据 Meta 与欧克利公布的数据,Oakley Meta HSTN 的持续使用时长可以达到 8 个小时,待机 19 个小时。 Oakley Meta HSTN 的眼镜盒并未使用皮革,而是类绒质地 只不过本次 Meta 眼镜还是没有可以直供电的选项,Oakley Meta HSTN 依然需要使用眼镜盒充电,充满电的眼镜盒可以在眼镜本身的基础上再提供约 48 小时的续航,基本可以做到两天一充。 更重要的是,相比雷朋,Oakley Meta HSTN 补全了对于日用配件非常重要的指标:防水。 根据欧克利官网的数据,Oakley Meta HSTN 的防水等级为 IPX4,即可以防止全向的喷溅和泼水、但不能完全浸没在水中,对于陆上运动常见的遇水场景基本都可以防护。 Meta 的智能眼镜宇宙,还在继续扩张 作为与依视路陆逊梯卡合作的第二款品牌眼镜,Oakley Meta HSTN 或许标志着一系列为了特殊场景细分化的智能眼镜正在到来。 根据彭博社记者 Mark Gurman 的报道,此前传言中的「摄像头中置」款欧克利眼镜并没有被取消,而是将在未来基于欧克利的 Sphaera 镜架推出,主要面向骑行等长距运动用户。 Oakley Sphaera Slash 骑行眼镜 只不过根据业内人士披露,Meta 旗下短时间内不会推出带显示功能的智能眼镜,而是专注于拍照录像和语音交互。 此外,欧克利的母公司依视路陆逊梯卡也表示,Meta 将会在未来与更多旗下的眼镜品牌合作,继续推出智能眼镜产品。 实际上,Meta 与雷朋合作眼镜的成功已经彻底引爆了智能眼镜市场,不到两年内销量超过两百万副的纪录证实了智能眼镜产品的可行性。 根据目前市面上已经在销售的智能眼镜产品,我们可以很清晰的看到三条不同的技术路线: 首先就是以 Meta 为首的,包括苹果和小米传闻中即将推出的智能眼镜,都是采用纯语音交互,主打随身记录、音乐和 AI 助手的使用场景,是现阶段技术最成熟、新用户学习门槛最低的实现方式。但缺乏视觉引导,纯语音的交互逻辑也受环境限制比较大。 其次是类似雷鸟、魅族、Rokid 等采用单色光波导和纯文字显示的方式,主要侧重日常生活中的提示和辅助工具(比如用眼镜扫码付款)的道路,目前市面上已经有不少产品,也有许多新品蓄势待发。 以及最后以谷歌在 I/O 2025 上展示的,结合了投影或光波导显示的 XR 智能眼镜,争取将智能眼镜变成便携巨幕的道路——比如前阵子雷鸟发布的 X3 Pro 也属于这类——这是技术难度最高,却也最代表着未来方向的方案。 换言之,智能眼镜市场的增长飞轮已经开始转动。让智能眼镜完全取代手机不太现实,但却有可能彻底改变我们与电子设备交互的方式——让手机负责计算、让眼镜负责显示,这不就是分布式计算机的雏形吗? 抛弃这跟数据线的时间指日可待 目前根据 Meta 官网的信息,Oakley Meta HSTN 的销售国家将包括美国、加拿大、英国、爱尔兰、法国、意大利、西班牙、奥地利、比利时、澳大利亚、德国、瑞典、挪威、芬兰、丹麦。其中 499 美元的金色限量款将于 7 月 11 日起接受预订,399 美元的标准版将于今夏晚些时候发售。 虽然 Meta 系智能眼镜短时间内不会在国内开售,但今年的智能眼镜领域注定不会平静,不说远的,下周发布的小米 AI 眼镜,或许又会激起千层浪。 文|马扶搖
华为预告旗下首款鸿蒙旗舰智慧屏电视,支持灵犀悬浮触控技术
IT之家 6 月 21 日消息,华为开发者大会(HDC 2025)于 6 月 20 日-6 月 22 日在东莞松山湖召开,根据IT之家获得的最新消息,华为在此次大会中首次预告了旗下首款鸿蒙旗舰智慧屏电视。根据华为介绍,该电视在整体技术、性能、交互、设计、AI 等方面具有一系列改进。 在交互方面,全新鸿蒙旗舰智慧屏电视在整体系统界面、图标、动效和光标等设计上均和手机 / Pad / PC 界面拉齐,引入最新光场视效设计体系,同时支持 4K UI 等特性。 此款智慧屏电视还创新搭载华为灵犀悬浮触控技术,支持双指悬浮触控交互,用户可以通过手势打开 App、调用多任务 / 控制中心,控制音量、亮度等,整体操作较为便捷。 全新鸿蒙旗舰智慧屏电视还能够与鸿蒙手机、鸿蒙平板等跨设备接续,实现应用在设备间的无缝流转。例如用户听音乐时,只需走到客厅的智慧屏旁,便能通过接续就能在智慧屏上继续收听手机上播放的音乐,实现无缝接续。 此外,该机搭载 4K 畅连通话技术,配备 5000 万像素摄像头。同时还支持人像追踪功能,画面可以随人物移动而变化。 而在鸿蒙 AI 方面,相应鸿蒙旗舰智慧屏电视搭载“AI 识人”功能,号称是行业首个“认识你”的 AI 电视。它能够识别不同家庭成员的人脸和声纹,在确保用户隐私安全的前提下,智能推荐不同内容。还支持开机问候,不同家庭成员会有不同的问候语,更可以针对不同家庭用户个性化展示各自的观影记录。 此外,华为透露该智慧屏电视的 AI 意图能力也得到了升级,结合 AI 识人功能,可实现“一人一服务”,做到对每个家庭成员的精准推荐,例如为孩子自动推送益智内容,为长辈过滤适宜资讯等。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。