行业分类:
加载中...
头条分类:
加载中...
MiniMax大模型认不出马嘉祺!官方终于给出原因
快科技5月9日消息,近期有网友发现一个有趣的现象:MiniMax 模型似乎无法正常识别马嘉祺三个字。 起初大家都以为只是偶然出现的小漏洞,但多方实测后发现情况有些离谱:不管切换不同接口、更换使用平台,该问题都能稳定复现。 翻看网友测试截图以及实际调用返回结果能看出,模型其实可以检索到马嘉祺的相关资料,也能完整准确输出他的个人履历、相关经历等信息。可唯独只要提及本名,模型就会出现文字错乱、随意改写名字的情况。 简单来说,人物背景信息基本无误,对应人物也完全匹配,唯独在识别和输出姓名时频频出错。 那么为什么会出现这种情况呢? 今日,MiniMax官微发长文回应M2系列模型无法说出马嘉祺一事,提供了对“嘉祺识别”问题的完整排查过程和技术思考。 MiniMax表示,其从分词器版本对齐、embedding统计分布、语义近邻检索、预训练与后训练模型的few-shot对比实验、后训练数据频次统计以及对全词表lm_head变化幅度的排序扫描等多个维度进行了排查。 最终定位到的原因是:嘉祺在分词器中被合并为一个独立token,但该token在后训练数据中出现频次极低,导致模型在后训练中逐渐遗忘了对该token的生成能力。 修复方案方面,MiniMax构造了一份覆盖全词表的合成数据,核心思想是:通过一个简单的复读任务,为全词表建立一个生成频率的“下限保障”,防止任何token因为完全缺失而退化。 此外,MiniMax表示,将token覆盖度作为后训练数据质量的一项常规监控指标,可以在早期发现潜在的稀疏token退化风险,避免类似问题在线上复现。
“泰国孕妇坠崖案”王暖暖控诉无忧传媒:长期霸凌、PUA
鞭牛士 5月9日,“泰国孕妇坠崖案” 当事人王暖暖公开控诉签约MCN机构无忧传媒,指控其长期实施霸凌、PUA与软控制,引发全网热议,登上热搜。 王暖暖昨日在浙江宋城景区拍摄时突发惊厥倒地,伴随剧烈抽搐、呼吸困难等,紧急送医抢救,她自述有强烈濒死感,称此次突发状况是长期超负荷工作与精神压力透支的结果。 据中国蓝新闻采访,王暖暖控诉其MCN公司无忧传媒完全无视其健康状况,2025年直播200多场,平均隔天一场,单场直播及筹备复盘时长常超12小时,凌晨五点起床出差拍视频成为常态,就连孕期、月子期也被强制开播带货,全年无休,远超正常人承受极限。 王暖暖还揭露了公司的直播管控:直播时面前坐十几人实时监控数据、举提词器,硬性规定每3分钟必须引导粉丝点赞关注,被她形容为“绑架式直播”;若涨粉、点赞、带货额等KPI未达标,不仅不许下播,结束后还会遭到辱骂威胁;同时强制她按剧本说假话,让她倍感煎熬,每次直播都双手冒汗、濒临崩溃。 “每次直播的时候手心都冒汗,反正我已经是够够的了,已经被逼疯到边缘了,我无所谓了,这口饭让我吃我就吃,不让我吃我就立刻把饭碗放下来。” 据悉,王暖暖于2019年遭丈夫推下34米悬崖,导致全身17处骨折。她于2023年6月与无忧传媒签约,合约3年,现还未到期。 公开信息显示,无忧传媒有限公司成立于2020年12月,由无忧传媒集团有限公司与雷彬艺共同持股,官网显示,该公司签约艺人超10W+,全约优质艺人超5000个。 存在多条涉及合同纠纷、劳动争议的法律诉讼记录。 相关阅读: 无忧传媒回应王暖暖控诉霸凌:暂停其商业活动,否认职场PUA指控
抖音和QQ抢“杀马特”?
抖音做社交多年,一直困扰于一个基本问题:到底做哪个人群的社交? 以前,抖音试图和微信PK,做所有人的社交。但过去一段时间,抖音开始有了新的答案:抓住05后乃至10年后的年轻人,和QQ抢人。 这种新策略,体现在了最新的产品功能上。 近日,抖音悄然上线了一个新功能“星光商城”,入口位于App首页下方“消息”标签页的左上角。 用户可充值获取虚拟货币“星光”,购买聊天气泡和聊天表情两类商品,可用于抖音站内聊天,以及去年重启的“聊天版抖音”多闪。1元人民币可兑换100星光。 抖音此举目的很明确:年轻人只要花点儿小钱,聊天就能变得酷炫。 早在十几年前,腾讯旗下的QQ就已经有了类似的玩法;五颜六色的聊天道具够不够新潮、有没有out,一度成为“杀马特”年轻人的比拼焦点。 如今,在社交赛道屡战屡败、屡败屡战的抖音,也盯上了这一看似有点儿low、古早冲浪味道浓郁的功能。 抖音一直希望在社交领域打开局面,杀入腾讯的腹地。能否打赢这场漫长而艰难的攻坚战,对于抖音能否启动新的增长引擎,乃至字节能否与腾讯长期对抗至关重要。 这场关乎双方根基的战役,似乎包含着一个理所当然的推论:字节要想和腾讯拼社交,抖音就得和微信正面对决。 一直以来,抖音也是这么做。 此前,无论具体产品形态如何,抖音做社交的假想敌都是微信。它希望凭借某些新功能、新玩法,比如所谓“短视频社交”,撬走微信的一部分用户,尤其是那些相对年轻的用户。 但抖音很可能选错了对手。 无论是“微信Plus”,亦或是“微信青春版”,起步之初大都轰轰烈烈,却也很快丢掉了用户,归于沉寂。抖音瞄着抖音打,已经被证明完全行不通。 毕竟,微信早已成为普通人最主要的线上社交、娱乐和信息获取场景,兼具强大的全天候办公属性,用户并不会为了尝鲜而大举迁移,哪怕强如抖音也无力改变。 选了一位几乎无懈可击的对手,是抖音做不起来社交的关键症结。 如今,抖音再次发力社交,切入点选在了聊天气泡和表情,而这些模块都是微信不太在意,甚至完全不支持的。 这释放出一个强烈信号:抖音不再和微信打擂台,而是将进攻目标重新定在了QQ身上。新功能虽小,却预示着抖音社交前所未有的战略转向。 A 把聊天气泡装扮成卡哇伊的猫猫狗狗,或是把黄豆表情打扮成黄毛小伙、粉毛小妹、五彩斑斓头发的杀马特,20岁以上人群恐怕都要当场尴尬症发作,脚趾抠出三室一厅。 但在年轻人扎堆的QQ,这是再正常不过的玩法。中年人觉得无聊,初老的年轻人觉得幼稚,而真正的年轻人——05后、10后喜欢。 一代人有一代人的语言体系和社交方式。“中登”“老登”用不上、看不懂的东西,未必不是年轻一代的文化潮流。它既可以是Labubu、拼豆、造景贴纸,也可以是非主流的聊天气泡和表情包。 如今,搞不定泛人群社交的抖音,也打算摸着QQ过河。 在星光商城,用户可以花1块钱买到一款可爱的聊天气泡,比如“猫猫啃麻薯”“熊兔莓莓”“幸福加马”等。 如果觉得平台自带的黄豆聊天表情太过普通,用户还可以购买头发和面部装饰,让一些被“老登”“中登”用烂了的表情瞬间年轻二十岁。 以前,年轻人想斗气泡、斗表情包,基本上只能选择QQ。 原因很简单:微信至今都不支持自定义聊天气泡,官方表情包也几乎一成不变。不是微信做不到,而是微信觉得没必要。 这就是微信的强势之处:它不仅满足需求,还定义需求。微信从来不要“你觉得”,只要“我觉得”。而让竞争对手无可奈何的是,微信的“我觉得”极少犯错。 QQ就没这么多包袱。年轻人想玩什么,它就提供什么。 在被淘汰出局的长期压力面前,QQ这些年跟着用户需求跑,整了不少大活,从UI、交互到功能、服务,几乎每隔一段时间就大变样。 这些大活取得了一定效果。QQ的月活跃用户量还在下行,但依然稳定在5亿以上,没有像其他古董级互联网产品那样,被奔涌的时代大潮砸得稀碎。 作为对比,字节全力培育、势头正盛的豆包,如今也不过3.45亿月活。 年轻人对于QQ的偏爱,还体现在另一个数据上:付费用户数。 根据腾讯财报,今年第一季度,QQ收费增值服务订阅会员数达2.67亿,同比增长2%。也就是说,QQ超过一半的用户都在平台上花过钱,爱优腾闻者落泪。 这些钱花到哪里去了? 一部分流向了名目繁多的会员,比如QQ会员、超级会员和大会员,还有一些花在了QQ等级加速、群聊特权、个性化装扮上。其余的收费项目包括消息漫游、离线文件、游戏礼包、腾讯系产品权益等。 微信不屑于赚这种小钱。但抖音不仅想赚,还想借机把QQ的年轻人招揽过来。 QQ吸引年轻人的武器库里,最容易模仿的就是个性化装扮。 于是抖音星光商城上线了,还加入了腾味儿十足的小巧思:你花一块钱买来的气泡和表情包,只有10天有效期,逾期就得续费。对于这套长线收割手法,给QQ会员和腾讯游戏充过钱的朋友肯定不陌生。 此外,抖音没有上线免费装扮,年轻人想要变“酷”必须付费。它的精妙之处在于,用户往往更乐于使用和分享花钱购买的产品,而非人人可得的免费产品。抖音从未如此谙熟用户心理学,QQ和腾讯还是太博大精深了。 B 在上线星光商城之前,抖音已经在有意识地把社交重心转向年轻人,而“重社交”的打法与QQ高度相似。 它选中的突破口,是小火人。 小火人是一种虚拟宠物,用户可以在抖音或多闪App内与好友合养。它的形象非常可爱,但并没有什么实际用途——这种“美丽而无用”的定位,显然不是给事事追求ROI的中年人所准备的。 2024年3月上线后,在抖音平台和头部博主的带动下,小火人积累了一批忠实用户。根据抖音披露的数据,截至2025年底,小火人的日活跃用户量已经突破1亿。 可以说,小火人是迄今为止抖音最成功的社交产品,没有之一。 但这款当红产品也有自己的天然缺陷。 作为赛博玩具,小火人的“养育”成本颇高:用户要和好友连续聊天三天以上,才能共同领养;还需要每天完成“续火花”任务赚取“火星”,来喂养、升级和装扮小火人。 同时,小火人的“惩罚”机制十分严厉。用户连续2天没有互动,小火人就会变暗;连续7天没有互动,小火人就会永久消失——就连难度变态的魂游,也不太敢这么干。 这意味着,小火人本质上是一款“重社交”产品,用户将不得不频繁聊天,才能把小火人养好;同时,它无法带来情绪之外的正反馈,却会因为用户疏忽带来明显的挫败感——字节确实是不太擅长做游戏。 这种缺陷也体现在了用户量上。1亿DAU,绝对值不小,但相比抖音超7亿日活的体量,小火人的渗透率还是低了些。 “重社交”本身不是问题。 QQ很早就上线了好友之间的“互动标识”系统。用户同样需要完成不同的互动任务,才能点亮标识。 只不过,QQ驱动用户社交的方式十分丰富,好友互发消息、一起玩游戏、访问彼此QQ空间,乃至直接邀请,都能点亮标识。同时,这些标识并不会轻易失效变灰。 QQ能把“重社交”尽可能做轻,抖音小火人还没能做到这一点。 按照当前的产品逻辑,抖音要想吸引更多年轻人养小火人,就需要想办法让用户多聊天。那么答案就呼之欲出了——卖气泡和表情,把聊天变成娱乐而非负担。 从这一视角观察,抖音做星光商城,其实是在补齐小火人的天然缺陷,其主要目的并不是赚一点儿增值服务收入,而是让聊天更有趣,让养小火人更轻松。 同时,这也是在产品哲学上向QQ靠拢:尽可能把用户行为游戏化,融入更多正反馈。 从小火人到星光商城,抖音做社交的新思路日益清晰:围绕聊天这一核心场景,以气泡和表情包吸引年轻人,以小火人留住年轻人。 C 抖音不再与微信竞争,转而把社交重心放在05后、10后,试图与QQ争夺用户,其逻辑根基在于,一代人有一代人的社交网络。 新生代不喜欢和老一辈同处一室。现实生活如此,赛博冲浪亦如是。 在全球市场,Facebook依然是第一大社交网络,但倘若问一个美国年轻人“可以加你Facebook好友吗”,TA大概率会让你关注其Instagram或TikTok账号。 国内互联网同样如此。当微信崛起后,90后、00后已经很少互留QQ号码,而是要加微信了。更年轻的05后、10后们,理应有自己的“专属”社交网络。 只不过,微信太过强大,以至于新的社交服务迟迟没能跑出来。希望和“中登”“老登”划清界限的年轻人,越来越多地聚集在非传统社交场景中,比如抖音、快手、B站、小红书、微博等。 QQ最近几年压力山大、缓慢流失用户,却没有出现雪崩,其实也和不肯用微信的年轻人涌入有关。 以往,年轻人主要通过评论区、私信等方式进行社交互动。抖音通过做小火人和星光商城,再加上外部App多闪,试图整合零散、即时的聊天互动,把社交需求沉淀在一张网络中。 年轻人对于传统社交网络的黏性,远低于早已习惯了微信的中年人。日活过亿的小火人,足以证明抖音有很大机会得到青睐。 同时,抖音给聊天场景增加“杀马特”表情包,摆明了自己不再以微信为对手,而是要把QQ作为新的挑战对象。 与微信相比,QQ是一个更容易被撼动的巨型社交平台。 QQ已经增长停滞多时。它的症结在于,一方面缺少视频号、公众号等提供内容,不够“好玩”,另一方面又没有小程序生态,不够“有用”。其用户量呈现慢慢萎缩的趋势,暂时还看不到扭转迹象。 此外,QQ多年积攒下来庞大的功能矩阵,却又不能随意舍弃,导致App显得臃肿。相比之下,抖音的社交功能简洁明了、重点明确,更容易吸引年轻人使用。 抖音并没有公开挑战QQ,但它的一些动作,比如与漫展联动、在多闪搭建主题聊天室等,显然还是想抓住05后、10后,而这势必与QQ的用户群产生交集。 D 与以往相比,抖音这一思路要简洁得多,回到了所谓“第一性原理”。 过去几年,抖音社交堪称大杂烩,把热门玩法试了个遍:熟人社交、半熟人社交、兴趣社交、短视频社交、语音社交……每一波大大小小的浪头涌来,抖音都要拉起一支队伍,第一时间赶赴现场,试图占据一席之地。 然而事与愿违,复杂多变的玩法不仅让用户不知所措,也让抖音社交忙于普及新概念,迟迟找不到高效、可持续的运营方式。 折腾到现在,一系列产品虎头蛇尾、不了了之,抖音在社交领域的存在感依然很稀薄。硕果仅存的多闪几经沉浮,仍需要依托抖音的社交关系链,才能作为附属业务存活下去。 但这一次,抖音一没有另起炉灶,二没有生造概念,三没有追赶潮流,只是老老实实基于聊天做产品和功能拓展,反而拿到了比以往更大的成功概率。 这种力求简洁、少即是多的哲学,在字节体系内并不多见。作为曾经的App工厂,字节更喜欢多款新品同时出击、赛马决胜,而非在现有产品内进行小规模的创新。 抖音社交或许因为失败次数太多,选择了一条迥异于字节传统的路线,这才有了小火人在低调中平稳发育。最新推出的星光商城服务于聊天场景,从而间接拉动小火人,同样没有为了创新而创新。 可以说,抖音社交的这一波攻势,不仅拿出了能打的产品、吸引了年轻人,更在一定程度上突破了字节的旧传统。 不过,抖音想要从QQ抢来用户,困难也不少。 QQ现在最高频应用是群聊,而平台也围绕这一功能做了大量开发,群管理、群内互动等功能非常完备。相比之下,抖音群聊基本上只是“能用”而已,非常薄弱。 在核心功能上,抖音距离取代QQ还需要大量补课。同时,QQ数亿日活的巨大惯性,也不是抖音一时半会儿能够靠几个表情包就抵消掉的。 手握小火人和星光商城的抖音,梳理了在社交领域的思路和打法,也切换了社交领域的“假想敌”。但抖音社交的“练级”难度并未降低太多;微信不好打,QQ同样是抖音需要长期模仿和学习的一座山。
无忧传媒回应王暖暖控诉霸凌:暂停其商业活动,否认职场PUA指控
凤凰网科技讯 5月9日,无忧传媒针对旗下签约达人王暖暖(泰国孕妇坠崖案当事人)近期出现的身体不适及相关舆论争议发布声明,称公司已暂停其所有直播、短视频拍摄及商务活动,直至其完全康复。针对外界关注的职场环境问题,无忧传媒在声明中明确表示坚决反对任何形式的职场霸凌和精神控制,并承诺未来将根据王暖暖的意愿与健康状况调整工作节奏,确保工作强度在其承受范围内。 此前,王暖暖在浙江拍摄期间突发惊厥倒地并送医抢救,随后其在社交平台公开控诉无忧传媒实施霸凌、PUA与软控制。王暖暖自述,自2023年6月签约以来,其工作强度远超负荷,2025年全年直播场次超过200场,甚至在孕期与月子期也未能休息。她将公司的管理模式形容为“绑架式直播”,称现场有专人实时监控数据并下达硬性考核指标,若涨粉或带货KPI未达标,不仅会被禁止下播,还会面临辱骂与威胁。 对于此次突发状况,无忧传媒在回应中将其归因于“工作压力导致的身体不适”,并表示公司已安排专人全程陪同就医及探视。 公开资料显示,无忧传媒目前拥有超过10万名签约艺人,但其企业信用记录中存在多条涉及劳动争议及合同纠纷的法律诉讼。王暖暖与其签署的三年期合约目前尚未到期,此次事件也再次引发了舆论对MCN机构创作者保障机制及职场压力的广泛讨论。
SK海力士被传员工人均奖金达610万人民币 官方回应:业绩尚未确定 奖金规模无法预测
快科技5月9日消息,近日,SK 海力士传出的年终奖金方案引发全球热议,有消息称其韩国员工人均奖金或将高达610万元人民币。 据了解,该说法源于国际投行麦格理证券的预测。 该投行测算,若SK海力士2027年营业利润达到447万亿韩元,按营业利润的10%和去年年末约3.5万名员工总数简单计算,分红总规模将达到约44.7万亿韩元,人均可发放奖金约12.9亿韩元,换算成人民币接近610万元。 针对网传高额奖金传闻,5月9日,SK海力士向媒体回应称,由于今年与明年的年度业绩尚未确定,奖金规模也无法预测。 同时,该公司还表示,已在总部层面建立了一套新制度,即以营业利润的10%作为资金来源,每年发放一次绩效奖金。 回顾过往业绩,SK 海力士 2025 年营收达 97.1467 万亿韩元,同比大增超 30 万亿韩元;营业利润 47.2063 万亿韩元,同比实现翻倍,创下历史年度业绩新高。 按 3.5 万名员工计算,去年人均可分配奖金约 1.4 亿韩元,折合人民币 65 万元。 进入 2026 年第一季度,公司业绩依旧强势增长。单季营收 52.5763 万亿韩元,营业利润 37.6103 万亿韩元,季度销售额首次突破50万亿韩元大关。 其中营业利润同比暴涨 405%,毛利率更是攀升至 79%,超强的盈利实力备受科技行业关注。 业绩大幅飙升主要得益于全球 AI 产业需求爆发。SK 海力士在高带宽内存 HBM 领域市占率超 50%,稳居行业龙头并掌握定价主动权。 受行业景气度带动,其服务器内存、闪存产品价格环比分别大涨 60%、70%。 随着高额绩效奖金话题发酵,韩国社交网络也衍生出趣味热议,SK海力士员工工服已经被调侃为“相亲神器”,SK海力士员工在婚恋市场中备受追捧。
安卓首发!飞书来电正式接入荣耀灵动胶囊
【CNMO科技消息】5月9日,MagicOS官方正式宣布,飞书来电已正式接入荣耀灵动胶囊,在安卓手机中实现首发适配。这意味着,荣耀手机用户在收到飞书语音来电时,无需唤醒应用、无需切换界面,直接在屏幕顶部的灵动胶囊即可完成接听、挂断、静音等全部通话操作。 荣耀MagicOS CNMO科技注意到,早在今年年初,MagicOS官方微博已宣布了灵动胶囊生态的重要里程碑:生态突破120多项服务,累计响应250亿次,覆盖从日常工具到出行服务的广泛场景。 基础功能方面,灵动胶囊已支持人脸解锁、NFC卡快速调用、录屏一键控制、手电筒快捷开关、充电状态实时显示、闹钟提醒、录音一键启动等功能。 出行与生活场景则整合了铁路12306行程信息实时更新、大麦演出开票抢票提醒、哈啰骑行/打车订单状态显示等,同时音乐播放时支持音乐律动胶囊,秒表计时胶囊也支持暂停、继续、结束等一键操控。 办公与效率场景中,取餐码早已上线YOYO建议与灵动胶囊并支持胶囊动效,YOYO帮手、AI多语言翻译、AI通话信息重点秒知等功能也在持续推进。再加上此次飞书来电的接入,灵动胶囊在高效沟通场景下的服务闭环进一步完善。 据了解,荣耀MagicOS团队持续通过“用户共创”机制吸收反馈,来自用户的天气预警接入、屏幕实时翻译、手机热点胶囊化等建议也已在优化中。在最新的四月系统更新中,Mac互联功能更趋无缝,灵动胶囊也已接入优酷等更多第三方应用服务,进一步拓宽了胶囊的应用边界。
新国标要来了,国产手机再也不能乱吹AI了?
好好好,大伙的手机也有「聪明等级」了。 就在前两天,相关部门联合发布了《人工智能终端智能化分级》系列国家标准。 准备要给终端 AI 的聪明度打标签。 这是全球首个,针对消费级 AI 终端的,量化分级国家标准。 起草单位阵容堪称豪华。 基本涵盖了大伙耳熟能详的头部企业: 包括华为、荣耀、小米、OPPO、vivo、联想、紫光展锐… 除了手机以外,也涵盖了电脑、电视、眼镜、汽车座舱、耳机、音响,一共 7 个品类。 现在,这些品类的智能化全都有了 L1-L4 的,和汽车类似的分级。 L1 最笨,L4 最聪明。 说不定以后买手机,包装盒背面都会贴个标签,告诉你它的 AI 到底有多猛。 讲真,刚看到这消息的时候,机哥是举双手双脚赞成的。 众所周知。 这几年最火,也就是发展最快的玩意。 AI 说第二,没别的敢说第一。 以至于它也成为了各家厂商着力宣传的重点—— AI 手机、AI PC、AIOS、AI 手表、AI 耳机… 甭管能力行不行,总之先凑个 AI 前缀上去。 但是关键是。 到底啥叫 AI 手机啊? 是 NPU 算力达到多少了,还是能跑端侧自动任务处理了。 又或者,单纯加了个 AI 助手就算? 没人说得清楚。 这就很迷惑了,各家厂商都吹自家 AI 牛逼。 但咱们压根就不清楚,这款手机的 AI 能力到底有多猛。 只知道,哦这个好像可以点瑞幸,这个好像能消除路人…… 至于眼镜、音响啥的,就更混乱了。 至于原因嘛,前几年 AI 大模型突然爆发。 芯片厂商也开始设备里,塞越来越强的 NPU,终端上都可以随便跑本地大模型。 但技术到位了,标准没跟上。 以至于,什么牛鬼蛇神都能出来宣传自己是 AI 设备。 反观隔壁,同样是靠算法和智能帮你做事的“智驾”。 分级就很清楚啦。 比方说 L2 算辅助驾驶,L3 算有条件自动驾驶,一看就很简单明了。 而这次的国家标准,就和智驾分级蛮类似。 明确告诉了大家: “什么是人工智能终端、怎么分级、怎么判定”。 不过这里得先提一嘴,标准全文官方短时间内还不会放出。 所以机哥只能结合《鸿蒙智能体白皮书》、和电信终端产业协会发布的,同样由华米 O V 耀参与起草的《终端智能化分级研究报告》。 跟大伙前瞻一下,每级大概对应啥水平。 鸿蒙智能体白皮书 L1 叫「响应级」。 和传统的语音助手差不多,你叫它干嘛,它就被动响应。 可以定个闹钟,开个空调啥的,回答一些预设好的简单问题。 稍微复杂点就萎了。 经常被吐槽蠢到家的国行 Siri,大概就在这一级。 L2 叫「工具级」。 到这级,应该就能够调用工具完成任务了。 比如说,“导航到屏幕上显示的地方”。 它能自动抓取屏幕内容并理解,然后调用地图 App 直接开始导航。 到这,用户的指令还需要很精准。 不然可能会尬在那,然后给你返回一句“这个操作我还不会”。 目前大多数手机还停留在这一层。 大伙可以试试手里的机子行不行。 L3 叫「辅助级」。 到这里,指令就可以不用说那么精准了。 能自己理解用户的意图,拆分目标,完成复杂任务。 像是赵明发布会时的名场面,现场点 2000 杯饮品。 只说了个—— “帮我点 2000 杯喝的吧,适合现在喝的”。 AI 就根据用户之前的偏好习惯,跑去找了家咖啡店。 用户只需要确认,它就能吭哧吭哧开始下单。 包括之前很火的豆包手机,以及自带龙虾的手机,其实也算在这一级别。 到这一步其实已经很智能了。 用户基本只起到监督的作用。 大部分任务都是 AI 自己在跑。 至于 L4「协同级」。 这玩意就有点狠了,提升最大的地方,在于感知力。 你甚至不需要和 AI 对话,它就能提供服务。 举个栗子。 它能识别到你的办公软件,天天充斥着被老板催 deadline、以及和加班相关的消息。 预测出你需要放松休息。 反手根据你的历史偏好习惯,规划一整套旅行攻略。 包括定啥时候的票、住哪里、玩什么、吃什么。 然后在相关软件里搜索好,推送到你面前,稳稳地接住你的坏情绪。 其实,早期的研究。 也就是电信终端产业协会的《终端智能化分级研究报告》。 还有 L5 级别。 感知能力和 L4 差不多。 区别在于,是把规划好的东西推送给你,还是直接帮你下单。 比如,AI 识别到我天天跟八弟说,好想买 5090… 然后根据历史记忆,用户有忍不住剁手的习惯。 直接反手给我下单了… 贾维斯来了也不敢这么主动啊… 能主动预测识别用户意图,全场景自主规划,的确是好事一桩。 但如何把握好 AI 主动服务的度,确实太难了。 所以这次国家标准,直接去掉了 L5 级别,把最终决策权还给了人类。 只留下了 L1-L4。 而且,就连这个 L4 也没完全定死。 而是会随着科技发展水平,动态调整。 也特挺好理解。 就跟固态电池还没用上,就开始定义核能源电池安全标准一样。 距离那一步还很远,不知道具体该怎么定标准,定出来也没用。 不如先画个坑占位。 那么这会问题来了—— 实行新的国家标准后,对咱们消费者来说到底有啥用? 其实吧… 短期内,还比较有限。 主要是现在 AI 迭代太快了,一天一个样。 所以它是灵活性更高,修改起来也更方便的 GB/Z,指导性技术文件。 不是强制性国家标准,也不是推荐性国家标准。 约束力属于最弟中弟的那一档。 厂商可以选择无视。 但从长远来看,意义一定是重大的。 就像是多年前,自动驾驶国际分级标准发布之前。 每家车企都有自己的一套话术, 人人都是“自动驾驶”,厂商宣传混乱,消费者一看一个不吱声。 产品之间,也很难直接比较。 但现在有公认的标准后。 大伙都知道了,L3 出了事大部分情况,就是得厂商来担责的。 不担责的,你智慧程度再高,也通通不能宣传 L3。 (当然打擦边也不太行 现在终端设备的情况,就和汽车自动驾驶很相似。 没有国家标准的话,过不了多久,每个厂商就会有一套自己的标准。 至于约束力不强的问题。 其实也不是事儿。 等到技术相对稳定,估计就会转变成约束力更强的 GB/T 文件。 对于隐私安全、第三方软件兼容性的规范也会跟上。 咱们,期待就完事了。
突发!马斯克痛失华人AI大将,多位xAI成员同日离职
智东西5月9日报道,今日凌晨,xAI预训练负责人庄钧堂发推宣布,自己已在今年早些时候从xAI离职,他曾负责Grok大规模训练基础设施及核心训练方案,主导了Grok 2/3/4/4-fast/4.1/4.2/4.3的训练。 庄钧堂官宣离职 在他的推文下方,有不少曾与庄钧堂共事的同事在评论区道别,用🐐代表“GOAT”,意为“Greatest of all time(史上最佳)”。 同事道别(来源:X) 5月7日,马斯克在X上官宣“xAI将不再作为独立公司存在,它将只是SpaceXAI,即SpaceX的AI产品。”同日,SpaceX宣布与Anthropic合作,将拥有超过22万张英伟达GPU的AI超算Colossus 1的所有算力供给Anthropic。 此后,xAI成员离职的消息就开始逐步放出。除庄钧堂外,xAI技术团队成员Xiuyu Li以及前端工程师、设计师Fraster Cook均发文称自己已从xAI离职。 Xiuyu Li离职推文(来源:X) Fraster Cook离职推文(来源:X) 一、清华大学工程物理毕业,GPT-4o核心贡献者 据庄钧堂Github主页介绍,他同时是X平台和特斯拉上Grok语音模型的预训练负责人。此外,其还担任Grok编程模型的强化学习负责人。 在加入xAI之前,他曾是OpenAI的研究科学家,是GPT-4o的核心贡献者,研发了GPT-4-Turbo 128k长上下文算法,还是DALL-E 3的主要贡献者,以及OpenAI Embedding模型的第一位贡献者。 庄钧堂的模型工作具体如下: 庄钧堂模型发布工作(来源:Github) 同时他也是AdaBelief优化器与TorchDiffEqPack等开源项目的创作者,其中AdaBelief优化器已被集成至PyTorch、Tensorflow-Addons、Google Flax、Deepmind Optax等主流框架。 根据其领英主页,庄钧堂本科毕业于清华大学工程物理专业,辅修法律。本科毕业后,庄钧堂前往耶鲁大学攻读统计学硕士,以满绩毕业后留校读博,博士专业为生物医学工程。 庄钧堂学习经历(来源:领英) 庄钧堂曾发表过多篇学术论文,其论文总引用数为39111次,其中引用数最高的论文为GPT-4的技术报告。 庄钧堂论文发表情况(来源:谷歌学术) 二、内部裁员、联创集体出走、计算资源让给“竞对”,xAI前途动荡 据外媒The Information今日报道,知情人士透露,xAI在上周还进行了一次内部裁员。据透露,此次内部裁员影响了Grok模型相关团队的约10名员工。此外,xAI在最近几周还裁减了部分在其数据中心工作的员工。 在今年3月加入xAI的、Mistrl AI和Thinking Machines Lab的创始成员Devendra Chaplot也于今年4月离职。据知情人士透露,Devendra Chaplot直接向马斯克汇报,当时被视为一位重量级引援。 Devendra Chaplot(来源:Github) 将时间回溯,xAI的人员动荡,其实从今年2月甚至更早就已经开始了。 今年2月,xAI的联合创始人吴宇怀与Jimmy Ba前后脚在X上发文,宣布自己已从xAI离职。2月27日,xAI联合创始人、前谷歌DeepMind工程师Toby Pohlen宣布离职。3月29日,xAI联合创始人Ross Nordeen在X上移除了xAI员工认证,低调离开xAI。 此外,xAI创始人Manuel Kroiss、张国栋、戴子航、杨格、Igor Babuschkin、Christian Szegedy、Kyle Kosic均已离职。xAI最初的12名联合创始人中,如今仅剩马斯克一人。(马斯克的AI创业搭子,全跑光了) xAI的困局,也不止是人员动荡。 2月3日,马斯克旗下商业航天巨头SpaceX正式官宣收购马斯克AI大模型独角兽xAI。5月7日,马斯克在X上官宣“xAI将不再作为独立公司存在,它将只是SpaceXAI,即SpaceX的AI产品。” 同日,SpaceX宣布与Anthropic签署合作协议,将AI超算Colossus 1的所有算力供给Anthropic。Colossus 1拥有超过22万张英伟达GPU,包括密集部署的H100、H200和新一代GB200加速器。(马斯克,拿下AI算力大单) 与外部合作的同时,xAI自己的AI模型Grok在基准测试上的表现却不那么亮眼。 5月2日,xAI低调发布Grok 4.3,其在Artificial Analysis的Intelligence Index测试中得分为53,与GPT-5.5和Claude Opus 4.7仍有差距。在Agent能力测评GDPval-AA 上,Grok 4.3仍落后 GPT-5.5 xhigh。 Intelligence Index排名(来源:Artificial Analysis) 将大量计算资源让给昔日的竞争对手、自家模型表现不佳……这不禁让人开始怀疑,xAI会不会成为马斯克的弃子? 结语:xAI动荡不断,战略转型面临严峻挑战 马斯克将xAI并入SpaceX并更名为“SpaceXAI”的决定,标志着这家曾经独立运营的 AI 实验室将彻底转向服务于航天巨头的内部产品需求。 而对于外界而言,更需要关注的是:技术骨干纷纷出走、数据中心算力被转交Anthropic、收购Cursor悬而未决,SpaceXAI是否还能否延续xAI时期的技术锐气与创新能力?
Cerebras上市背后,OpenAI正在抢英伟达的蛋糕
OpenAI还没上市,它的“算力小弟”先要上市了。 2026年5月,AI芯片制造商Cerebras Systems在最新S-1/A文件中披露IPO发行细节,股票代码CBRS,计划发行2800万股,定价区间115-125美元,募资规模最高可达35亿美元,目标估值达266亿美元。 这件事有点反常。 因为有黄仁勋这座大山在,资本怎么可能容得下小小的一只Cerebras呢? 大模型公司烧钱,云厂商买卡,创业公司排队等GPU,最后利润大多流向卖铲子的英伟达,这才是现状。 但OpenAI似乎想要改写这条链路。 5月6日,OpenAI组了个局,把自己放在了龙头老大的座位上,然后把英伟达、AMD、英特尔、博通、微软这些明显存在竞争关系的芯片公司拉到一起,推出了一套面向大型AI训练集群的网络协议(MRC,Multi-Rail Compute)。 表面上,这是一次超算网络合作。更深一层看,我认为OpenAI是想要重新分蛋糕了。 首先可以明确一点,OpenAI没有抛弃英伟达,它也没有办法抛弃英伟达。至少在当前阶段,OpenAI绝对没有勇气All in一个“英伟达杀手”。 相反,OpenAI正在把原本被英伟达一家公司强势覆盖的算力体系拆开:训练归训练,推理归推理,网络归网络,云归云。不同负载,用不同芯片;不同环节,找不同供应商。 Cerebras就是在这个时候被推上牌桌。 Cerebras当然还不是英伟达的对手,也不可能在短期内撼动CUDA和GPU集群构成的护城河。 但Cerebras的上市,真正值得看的地方,不是又一家AI芯片公司冲刺IPO,而是OpenAI开始把推理这门生意单独拎出来定价了。 01 押注推理 事实上,这已经是Cerebras第二次冲击IPO了。 2024年10月,Cerebras曾经提交过上市申请,但很快就撤回了。 原因是美国外资投资委员会(CFIUS)对它的阿联酋投资方G42展开审查。那时候,阿联酋G42人工智能公司不仅是Cerebras的股东,还是它最大的客户,贡献了超过80%的收入。 这种深度绑定的关系,再加上当时美国与阿联酋之间略微的不和谐,自然让监管部门不太放心Cerebras。 到了2025年3月,CFIUS终于放行,G42的股份被重组为无投票权股份,监管风险暂时解除。 但Cerebras并没有立刻重启上市,而是等到了2026年5月,恰好赶上了AI基础设施投资热。 Cerebras上市的真正意义,其实不在于它又是一家AI芯片公司要IPO。 市场上不缺芯片公司,缺的是一个故事,一个能让资本相信“推理市场可以独立定价”的故事。 OpenAI目前刚刚开始主动重组供应链,把不同芯片匹配到不同工作负载,这件事本身就是在细化芯片产业。 训练是一层,推理是一层,网络是一层,云分发是一层,应用场景又是一层。每一层都可以有不同的玩家,每一层都可以重新定价。 Cerebras在OpenAI的算力供应链中,负责的就是推理这一环。 Cerebras的核心竞争力,在于它那颗独特的晶圆级引擎芯片WSE-3。 传统芯片都是从一整片晶圆上切割出很多小块,每一小块是一颗芯片。 英伟达的GPU就是这么做的,然后再把很多颗GPU通过高速互联组成集群。这种方式的好处是成熟、稳定、生态完整,坏处是芯片之间来回搬数据的成本很高,尤其是在推理场景,延迟会被放大。 Cerebras的WSE-3完全不同。 它直接把整片12英寸晶圆做成一颗巨型芯片,面积达到46225平方毫米,相当于一张A4纸的三分之一大小。 WSE-3基于台积电5nm工艺,拥有4万亿个晶体管,90万个AI优化核心,44GB片上SRAM,内存带宽达到21PB/s。如果和英伟达H100对比,WSE-3的面积是H100的57倍,核心数量是52倍,片上内存是880倍,内存带宽是7000倍。 这些数字听起来很夸张,但关键不在于“大”,而在于“快”。 在推理场景,尤其是当下最火的长文本输出、实时交互、代码生成、agent这些需要低延迟的任务上,Cerebras的优势非常明显。 它的CS-3系统在推理速度上比英伟达DGX B200快21倍,成本和能耗都降低到三分之一。 快,就意味着OpenAI可以在单位时间内服务更多的客户。 训练市场是英伟达的绝对主场,CUDA生态、成熟工具链、大规模GPU集群,这些护城河短期内很难被撼动。 推理市场不一样,此前推理市场是个非常小众的市场,算力大头在训练。但是随着越来越多的行业、应用开始使用AI,推理正在成为AI应用商业化的关键。 早期,Cerebras主要卖硬件系统。一套CS-3系统售价高达数百万美元,客户群体主要是超大规模数据中心、云服务商和政府机构。这种模式的问题在于,客户采购门槛太高,销售周期长,收入波动大。 从2024年开始,Cerebras逐步转向基于自有芯片的云服务模式。客户不需要购买昂贵的硬件,只需要按需使用Cerebras的算力集群。 2025年,Cerebras的财务数据非常亮眼。全年营收5.1亿美元,比2024年的2.9亿美元增长了76%。更重要的是,净利润达到8790万美元,相比2024年4.85亿美元的巨额亏损,实现了扭亏为盈。 但Cerebras的客户集中度太高了。 2025年,阿联酋AI公司MBZUAI贡献了62%的收入,G42贡献了24%,前两大客户占比高达86%。未来,OpenAI将成为Cerebras最大的客户。 这确实给了Cerebras大量的收入,不过这就意味着Cerebras必须受制于这些大客户,不能有太多自己的想法。 02 OpenAI也在转型 2026年1月,OpenAI与Cerebras宣布签署多年协议。 根据协议,Cerebras将为OpenAI提供750兆瓦的低延迟AI算力,部署将分阶段进行到2028年,交易总价值超过200亿美元。这是全球最大的高速AI推理部署项目,也是OpenAI算力战略的一次重大转向。 但这份协议的深度,远不止采购合同这么简单。 OpenAI创始人奥特曼、总裁布鲁克曼、前首席科学家伊利亚、董事会成员亚当·安戈洛(Adam D‘Angelo),这些OpenAI的核心高管,都以个人的身份投资了Cerebras。 你以为这就完了?早着呢! OpenAI还通过贷款、认股权证等金融工具,与Cerebras建立了长期利益绑定。这种超越简单供应商关系的深度合作,让Cerebras成为了OpenAI的资产,甚至我可以说,现在的Cerebras,就是OpenAI的芯片部门。 这种绑定方式,在科技行业并不常见。 OpenAI与Cerebras的合作,不能简单理解成“用Cerebras替代英伟达”。 前文提到,OpenAI在2026年5月6日专门和各位芯片龙头企业组了个局,合作开发MRC网络协议,用于提升大型AI训练集群的网络效率和韧性。 OpenAI并没有放弃英伟达,但OpenAI也不想久居英伟达之下。 OpenAI的真实意图是什么? 训练继续使用英伟达高端GPU,推理引入Cerebras的低延迟方案,部分GPU采购AMD方案,网络协议开放化,云服务在AWS、Azure、谷歌Cloud之间多家下注。 未来,OpenAI还可能推进自研芯片。 这是一种“算力组合拳”策略,不同工作负载匹配不同系统,不再单独依赖英伟达的全栈方案。 这种战略转变的本质,是OpenAI正在从一家模型公司转变为算力架构公司。 以前,OpenAI只能被动接受芯片厂商定义的技术路线。 英伟达出什么芯片,OpenAI就用什么训练。 云厂商提供什么服务,OpenAI就在什么平台上部署。这种被动状态,在AI竞争的早期阶段是可以接受的,因为那时候最重要的是快速迭代模型,而不是优化基础设施。 但现在不一样了。 当ChatGPT的周活跃用户超过9亿,推理成本越来越高,OpenAI不能再被动得去等英伟达发布新产品,他们得主动设计更符合当下AI需求的算力组合。 OpenAI正在做的,是把芯片供应商从“平台提供者”降维为“模块供应商”。 在过去的AI算力市场,英伟达提供的不只是GPU,而是一整套从硬件到软件、从芯片到网络、从单机到集群的完整解决方案。客户买的不是一颗芯片,而是一个生态。 这种完整性,既是英伟达的核心竞争力,也是它能够维持高毛利率和定价权的根本原因。 OpenAI现在要打破这个完整性,英伟达的超级客户,开始逐渐掌握供应链的主导权。 这对英伟达来说,是比丢失订单更深层的冲击。 03 英伟达怎么说 虽然我前面下了很多利空英伟达的判断,但是我认为,Cerebras上市,对英伟达的冲击不会很大。就像身上长了个粉刺、痱子一样无关痛痒。 英伟达目前仍然占据AI芯片市场约80-90%的份额。 CUDA生态、GPU供应链、NVLink网络,这些护城河短期内很难被撼动。 Cerebras的WSE芯片单价高达数百万美元,产能有限,客户群体主要是超大规模数据中心和云服务商,无法在短期内大规模替代英伟达GPU。 更重要的是,CUDA生态经过十余年积累,已经成为AI开发的事实标准。几乎所有主流AI框架、模型、工具链,都优先适配CUDA。开发者社区、技术文档、最佳实践,全都围绕CUDA构建。 这种生态优势,不是一两年就能被追上的。 然而Cerebras对英伟达的威胁依然还是存在的。 过去,AI公司几乎别无选择,只能使用英伟达GPU。现在,至少在推理场景,客户有了可行的替代方案。这种选择权的出现,削弱了英伟达的定价权。 当OpenAI可以说“推理我用Cerebras,训练我用英伟达”时,英伟达就失去了“全包”的议价能力。 如果Cerebras的故事将通,那么AI算力市场就真的开始分层了。 训练和推理的需求差异被明确化,专用芯片在细分场景的优势被验证。英伟达“一种芯片打天下”的叙事不再完全成立。市场也会从“通用GPU垄断”走向“场景化芯片组合”。 在这个新格局里,英伟达在训练市场的优势依然稳固。但在推理市场,尤其是低延迟推理、实时交互这些场景,专用芯片的优势开始显现。 而且,还只是OpenAI这一家这么干。Anthropic也开始和亚马逊、谷歌结盟。这些头部AI公司,都在通过多元化采购来降低对英伟达的依赖。 英伟达面临的挑战还不止于此。 AI推理市场的快速增长,可能会超过训练市场。根据LP Information/MarketPublishers在《Cloud AI Inference Chips》这份报告中的预测,全球AI推理市场在2026-2032年期间的复合增长率将达到28.9%。 推理场景,肯定更适合专用芯片。当推理市场的规模超过训练市场时,英伟达在推理领域的相对弱势,就会成为更大的问题。 不过英伟达的短期优势依然稳固。 2026年,英伟达在GTC大会上强调了加速计算生态系统的深度,覆盖汽车、金融服务、医疗健康、工业、媒体、量子计算、零售、机器人和电信等多个领域。 黄仁勋把CUDA-X库称为英伟达的“掌上明珠”,这套丰富的软件栈,是Cerebras没有的,也是英伟达又一道护城河。 英伟达的Blackwell架构即将大规模出货,性能和能效都有显著提升。英伟达在训练市场上的优势,将会进一步巩固。 但长期来看,英伟达必须适应一个新现实,他们正在从“唯一供应商”变成“核心供应商之一”。 这个转变,不是因为英伟达变弱了,而是因为市场变大了,客户变强了,需求变复杂了。 当AI从实验室走向大规模商业化,当算力需求从训练扩展到推理,当超级客户开始主动设计算力架构,单一供应商的“完整解决方案”就绝对不再是最优的选择。
视频模型:最容易制造惊艳,也最容易消耗惊艳
4月以来,视频模型重新成为AI行业里最拥挤的赛道之一。 先是月初,阿里的HappyHorse-1.0登顶Artificial Analysis视频竞技场榜单,在无音频文生视频榜单中拿到1368的Elo分,力压Seedance 2.0和可灵3.0。 随后,总部位于美国的fal.AI上线HappyHorse-1.0官方API。fal主要为开发者和企业提供图像、视频、语音等生成模型的API调用和推理服务,此前已接入可灵、海螺等视频模型。 同一时间,视频模型创业公司开始密集释放资本信号。生数科技和爱诗科技在斩获两笔融资后,先后传出考虑赴港上市的消息。 而随着阿里正式入场,巨头厂商间的竞争格局愈发激烈。 快手的可灵,是业内最早跑出规模商业化的样本,可灵2025年12月单月收入超过2000万美元;另一边,字节年初凭借Seedance 2.0的惊艳表现不断做大声量。 国产视频模型风生水起的几个月中,OpenAI则选择了在本月关停旗下视频模型产品 Sora,宣告了视频模型的上一个周期结束,也迎来了国产视频模型的加速周期,相关统计显示,今年以来,中国AI视频赛道已经发布约10个模型。 只是,Sora退场也更像一个提醒:视频模型最容易制造惊艳,也最容易消耗惊艳。蜂拥而至的国产厂商们,都将面临一个共性问题:技术层面的差距在毫厘之间,而商业化层面的竞争已经进入深水区。 01 巨头三强:有人抢声量,有人冲榜单 参考Artificial Analysis榜单,国产视频模型的头部由三大巨头组成:快手可灵、字节Seedance以及阿里HappyHorse。不过,在榜单上的你追我赶背后,三家公司面对的是完全不同的考题。 可灵的关键词是商业化,在技术指标的打榜之外,可灵最早拿出了相对清晰的收入账单。公开报道显示,可灵在2025年12月单月收入超过2000万美元,相比2025年3月披露的1亿美元年化收入有明显增长。 快手方面在此前的财报电话会中透露,截至2026年1月,可灵AI年化收入运行率(ARR)已超过3亿美元,并透露出今年将实现收入同比翻倍以上增长的信心。 在国产视频模型已公开的营收数据中,这一数据处于绝对领跑的地位。同期,可灵服务超过6000万创作者,累计生成超过6亿条视频,并与超过3万家企业用户建立合作。 可灵在模型侧发力得很早,自2024年6月开放后,它一直是国产视频模型追赶Sora的代表。但进入2026年后,两大竞争对手先后在视频基模领域给可灵“上强度”。 Artificial Analysis最新榜单显示,在无音频文生视频榜单中,Kling 3.0 1080p Pro排在第三,前面是阿里和字节的HappyHorse 1.0和Seedance 2.0。 值得注意的是,主导HappyHorse的核心人物张迪,此前正是可灵的技术负责人。 不过,只看榜单跑分,Seedance 2.0、HappyHorse和可灵3.0的差距并不大,真正的差距体现在,阿里和字节不约而同地下场开始争抢用户声量。 Seedance 2.0的关键词就是“出圈”。 该模型发布后不久,一段由爱尔兰导演Ruairi Robinson用Seedance 2.0生成的“汤姆·克鲁斯与布拉德·皮特”视频在社交平台传播,其中一条播放量超过140万,另一条超过300万。 甚至马斯克都曾在X上评论Seedance 2.0视频:“这一切发生得太快了。” Seedance 2.0在国内的出圈,也被“雪山救狐狸”带起。这条由贵州一家酱板鸭品牌四人团队制作的AI短片,耗时约5小时、花费40元,全网传播量突破50亿。 相关报道显示,主创先用豆包拆脚本,再用小云雀和即梦生成画面,即梦的Seedance系列就是主要模型之一。 与此同时,字节也在主动推动Seedance 2.0的行业心智:贾樟柯担任监制的春节贺岁短片《贾科长Dance》由Seedance 2.0生成,火山引擎总裁谭待还透露,Seedance 2.0在正式推出前已参与央视春晚多个节目的视觉制作,春晚是它的第一个客户。 显然,视频领域的优势不只是模型本身。字节在视频生产链路上拥有其他公司很难复制的入口:即梦面向创作者,剪映承接剪辑需求,还有抖音这样的巨量内容池,企业侧由火山引擎承接企业调用。 所以,一旦Seedance开始收割用户声量,依托字节的资源可能比可灵更快收割C端创作者心智。 不过,用户声量的扩张,并不完全能代表商业层面的胜利。一方面,字节目前没有披露类似可灵那样清晰的ARR口径。在专业级用户的市场中,究竟与可灵的市场份额占比如何,仍是未知。 其次,Seedance 2.0的出圈,直接在正面撞上版权和肖像问题。美国电影协会、演员工会等好莱坞组织批评Seedance 2.0涉嫌大规模未经授权使用版权作品和演员肖像,随后,字节方面因好莱坞版权争议暂停了Seedance 2.0的全球发布。 而当Seedance还在和版权问题作斗争的时候,阿里带着HappyHorse抢走了它榜单第一的位置。 事实上,HappyHorse-1.0是在无音频文生视频榜单中排第一,Elo分达到1368;而在图生视频有音频榜单中,Seedance 2.0 720p仍然排第一,HappyHorse-1.0排第二。 这个原本属于淘天旗下的多模态团队,迅速成为了阿里在多模态领域的金字招牌。 不过,HappyHorse目前证明的是理论上的技术冲击力,而两大竞争对手可灵和Seedance/即梦,都已经形成了真实用户体量的护城河。 事实上,Artificial Analysis的榜单会每日动态更新,盲测偏好一定程度上能反映输出质量,但不能替代具体业务场景里的成本、速度、稳定性和合规测试。 腾讯云开发者社区中,有行业人士横评了这三大模型:HappyHorse-1.0在多镜头测试里,它在11个视觉锚点中保持了9个,人物连续性强于Seedance 2.0;音画同步测试里,声画延迟控制在80毫秒内,优于可灵3.0的120毫秒。 然而,是物理拟真和复杂规律成为了HappyHorse的短板。水杯碎裂测试要求模型在5秒内模拟碰撞、流体、玻璃裂纹等6种物理现象,HappyHorse出现网球未接触杯体、杯子已反向倾倒,水体穿模、裂纹扩散生硬等问题。 价格比对中,它的720P折后价约0.44元/秒,低于Seedance 2.0的1元/秒和可灵3.0的0.48—0.96元/秒。 再往后看,阿里与快手、字节的差异也很明显。快手有短视频社区,字节有全球化视频工具和分发平台,而阿里没有天然的内容社区。 HappyHorse更可能进入的是阿里云百炼、千问、电商营销、商家素材、品牌广告和企业内容生产,短时间内还不会和即梦、可灵正面厮杀。 而在一线AI大厂中,百度和腾讯今年以来都没有更新视频模型品类。两家公司最近一次较明确的视频模型版本发布,仍停留在去年10月至11月。 显然,在视频模型第一梯队中,至少在整个2026上半年,都将是阿里、字节、快手的三强格局。 02 第二梯队:上市、融资和路线分化 巨头之外,第二梯队正在分化,首先来关注瞄准了IPO的两家创业公司,生数科技和爱诗科技。 4月,生数科技完成20亿元人民币B轮融资,由阿里云领投。 产品上,Vidu仍是生数最重要的抓手。Vidu Q2曾重点推出Reference-to-Video能力,允许用户上传最多7张参考图,用人物、物体、场景或道具作为约束,生成更一致的视频。 生数另一张牌是“世界模型”。它的路线更接近视频基座世界模型——通过海量视频学习时间、空间、运动与因果规律,再延展到机器人动作模型,而不是纯3D空间重建路线。 另一边,爱诗科技PixVerse是一家面向全球创作者的视频生成平台,目前也传出考虑最快今年赴港上市,并已与中金、摩根大通等投行合作。最新融资信息显示,爱诗今年完成3亿美元C轮融资,估值超过10亿美元。 营收方面,爱诗科技ARR约4000万美元,生数科技公开可查口径约2000万美元,距离支撑十亿至二十亿美元级估值,仍需要更强的收入增长、成本控制和企业级复购证明。 如果进一步比较,爱诗更像是“C端规模先跑出来”的公司,靠PixVerse和拍我AI获得用户与订阅收入;生数更像是“技术与模型叙事更强”的公司,背靠清华团队、U-ViT架构和Vidu的行业能力。 但两者共同的问题是,AI视频生成尚未进入稳定盈利期,巨头竞争、算力成本、版权合规和用户留存,都可能成为IPO审核和二级市场定价时的核心阻碍。 两家创业公司之外,另一家值得关注的视频模型厂商,是曾经“六小龙”中的代表人物MiniMax。 MiniMax旗下的海螺曾经是上一轮国产视频模型热潮里的代表产品,而MiniMax也是六小龙中少数坚持视频模型产品线代表。 但到了2026年,海螺的行业存在感明显不如去年。海螺的上一次模型更新,还是发布于2025年10月的Hailuo 2.3和2.3 Fast,主要提升身体动作、面部表情、物理真实感和提示词遵循。 走全球化路线的海螺,同样面临着版权问题。此前有报道称,迪士尼、环球、华纳兄弟探索在美国起诉MiniMax,指控其Hailuo AI使用被盗知识产权,并能生成《星球大战》达斯·维达、小黄人、神奇女侠等版权角色。 另一匹“黑马”来自昆仑万维。3月发布的SkyReels V4冲进Artificial Analysis无音频文生视频榜单前列,一度排到第四。昆仑万维方面此前披露,SkyReels V4目前已全面开放API。 但它的差异在于,昆仑本身有短剧和海外内容业务,SkyReels仍是优先进入自家短剧、广告、游戏等生产链路,承担降本工具角色。这是这部分内部效率,能否折算成有效的商业化收入仍是未知。 第二梯队的共同处境正在变得清楚:每家公司都有出口,但每个出口都不宽。 视频模型领域和AI Coding不同,缺少平台优势的厂商,只讲基座模型的故事是不够的。生数拥抱世界模型概念,爱诗讲全球化创作工具,MiniMax专注于在Agentic模型上赚钱,而昆仑万维优先赋能自家的短剧业务。 显然,对于创业/腰部公司而言,视频模型的问题不只在于技术领先程度,更在于ROI的困境。 03 Sora退场后,视频模型的ROI困境 Sora退场,是今年视频模型行业最重要的警示。 OpenAI方面在几天前,正式关停了Sora,而Sora API将于9月24日停止服务。 这一举措十分突然,有报道披露,OpenAI的动作让迪士尼等合作方感到意外,也意味着双方一项拟议中的10亿美元合作告吹;报道还提到,OpenAI正把重点转向更有盈利潜力的编码工具和企业解决方案。 这件事直接揭露的当下的视频模型困境,技术突飞猛进,但是商业化难题一直在台面上。 首先面临的第一道坎就是成本。 视频生成不是“一句提示词换一段成片”。它背后是多帧生成、时序一致性、高分辨率、音画同步、失败重试和后期筛选。用户最后看到的是一条8秒、10秒、15秒的片段,平台承担的是大量候选结果和算力消耗。 AI应用开发平台MindStudio,在一篇行业博客中把Sora的失败归结为“推理墙”:文章称,Sora关闭前每天推理成本约1500万美元,而生命周期收入约210万美元。 这对国产模型同样成立,尽管国内市场的版权压力相对较小,但定价和营收始终是一门玄学。 以Seedance为例,Sora退场后,Seedance 2.0一度被视为中国视频模型市场最强的挑战者,但字节随后在一个月内多次上调即梦价格:高级版年费从2599元涨到3099元,不同套餐的月度额度被削减三分之一到一半以上。 这意味着,一段2分钟AI漫剧的素材生成成本,从7元涨到约80元。 涨价背后是算力账。文章称,一个15秒视频大约消耗30万token;按照火山引擎3月公布的Seedance API价格,视频输入模式为每百万token 28元,无视频输入模式为每百万token 46元,折算下来,一段15秒视频约15元,约合1元/秒。 巨额的算力消耗背后,是模型厂商难以平衡营收和服务质量的现状。 有针对即梦的相关分析显示,即使是高级会员用户,排队时间仍然超过3小时。普通用户有时需要排在8万人后面等待。只有签订合作协议的大型制作公司才能使用Seedance的完整功能,无需排队。 根据界面等媒体报道,想要使用Seedance 2.0的逼真人类视频模式,则需要单独签订企业协议,且最低消费额为500万元人民币。 另一方面,版权问题仍是视频模型领域的拦路虎,甚至不止在好莱坞,国内市场也是如此。 几天前,爱奇艺在世界大会上称,已有100多名深度合作艺人同意入驻纳逗Pro艺人库,引发舆论争议;随后于和伟、张若昀、王楚然等多位艺人或团队否认签署AI相关授权文件。 爱奇艺回应称,入驻艺人库只代表有接洽AI影视项目的意愿,是否参加具体项目、出演具体角色,仍需单独商谈和授权。 这件事更能说明视频模型商业化的麻烦:不是平台给了授权,问题就解决了。 证券时报在后续报道提到,爱奇艺、Seedance和即梦等平台都在探索明星人脸授权模式,但有法律界人士表示了担忧,平台服务协议和创作者协议叠加后,可能让艺人难以控制自己的AI形象后续被用到哪里。 人脸既是商业素材,也是生物识别信息;一旦进入短剧、广告、互动视频和虚拟直播,授权边界、使用次数、二次创作、收益分配和撤回机制都会变成新问题。 这些问题总结下来,还是回归到老生常谈的ROI问题。 麦肯锡在2026年关于影视制作和AI的报告中提到,AI可能改变内容生产方式和行业价值链,但它带来的结果不只是一种:可能压低成本、扩大内容供给,也可能重塑价值分配。 德勤在2026年TMT预测中也提醒,AI的承诺和现实价值之间仍存在差距,真正的规模化来自推理计算、智能体编排和运营收益等后台能力的持续改善。 这句话放到视频模型上尤其现实。尤其在Sora退场之后,视频模型行业的标准变了。 最会做演示的模型,不一定活得最好;最会冲榜的模型,也不一定最能赚钱。 真正能穿越周期的公司,必须把生成能力接进生产链路,压低真实交付成本,处理版权合规,并让客户算清ROI。 视频模型当然还会继续进步。它的上限仍然很高,尤其是在广告、电商、短剧、游戏、影视预演和社交内容生产里。但2026年的问题已经不再是“谁能生成一段更像电影的视频”,而是“如何给客户提供能持续产生营收的服务”。 经历了轰轰烈烈的跑分竞赛之后,视频模型正在跑进深水区。
大厂永远理解不了梁文锋
摘要: 互联网大厂永远理解不了梁文锋,就像旧玩家难以跟上新牌局一样——它们以为这是一场有钱就能入局的牌局,但实际上他们可能根本不在一个牌桌。 凤凰网科技 出品 作者|董雨晴 5月8日深夜,一则让人感觉既惊讶又合理的消息传来——DeepSeek正在寻求在其首轮融资中募集最多500亿元人民币(约合73.5亿美元),这一金额将刷新中国AI公司单轮融资的历史纪录。 消息落地前夕,一个更意味深长的细节浮出水面,据白鲸实验室报道——此前高调参与竞逐的阿里,在本轮融资的谈判中陷入了僵局。 过去数周,围绕着DeepSeek这张中国AI最稀缺的船票,腾讯、阿里和一众国资机构展开了一场无声的博弈。据潮新闻报道,腾讯拟出资60亿元,约占2%股权;而创始人梁文锋拟个人最高出资200亿元,占募资总额的40%。但阿里的名字,始终悬而未定。 此外,DeepSeek的投后估值将达到3500亿元。在二级市场,目前智谱的市值为4115亿港元(约合3574亿元),MiniMax为2328亿港元(约2022亿元)。一级市场,Kimi的最新投后估值为200亿美元(约合1360亿元)。《财经》在2月底时曾报道,阶跃星辰计划在今年6月30日前在港股交表,预期基石定价在100亿美元(680亿元)左右。 至此,中国AI新五强的合计估值/市值已经达到了1.1万亿。 在五强背后,也分别站着不同的互联网大厂,据凤凰网科技不完全统计,以上AI企业的多轮融资中,出现了腾讯、阿里、美团、蚂蚁、小红书、小米、米哈游等多家互联网大厂和中厂,又以腾讯、阿里出手的频次最高,腾讯几乎投资了全部AI五强,阿里参投了Kimi、智谱、MiniMax三家,美团在近期重注了Kimi。小红书则参与投资了Kimi和MiniMax。 但在DeepSeek这个最为重要的船票上,互联网大厂的碰壁或许是最为强烈的。错位自然的不是价格,而是底层逻辑,在所有AI新星里,DeepSeek是最接近原始创新,最崇尚反KPI、反OKR,而后者恰恰是过去多年里大厂能茁壮成长的、最引以为傲的组织文化。 当大厂习惯于用自己的坐标系去理解一切,而梁文锋从来没打算走进那个坐标系。 阿里和DeepSeek,几次缘分几次否认 故事要先回到一个颇具戏剧性的起点:DeepSeek与阿里巴巴,同处一座城市——杭州。 2025年2月,市场一度传出阿里将以100亿美元估值、投资10亿美元认购DeepSeek 10%股权的消息。彼时,这场同城联姻被视作天作之合:一方是急于在AI大模型赛道确立身位的电商巨头;另一方则是技术底盘扎实但商业化尚未启程的明星初创,缺钱、缺算力、缺应用场景。逻辑上,这桩交易能同时满足双方的诉求。 况且,阿里在AI战略上表现出了极其势在必得的势头,从3800亿的基建投入规划,到平头哥、阿里云、通义大模型的黄金三角设定,让阿里几乎成为了全球唯二的AI全栈玩家。 但消息传出的当天晚上,阿里集团相关负责人就发了一条朋友圈,措辞礼貌但已经澄清:“同为中国杭州企业,我们为DeepSeek鼓掌,但是外界流传阿里投资DeepSeek的信息是假消息。” 这不是阿里第一次表达善意,也不是第一次被拒之门外。据《华尔街日报》此前报道,2025年3月以来,梁文锋连续拒绝包括腾讯、阿里在内的投资提议,甚至直言“不急于融资”。梁文锋曾定下一条铁律:不接受外部融资、不稀释股权、不被任何人的商业化时间表绑架。 在大厂眼中,这几乎是一种傲慢;但在梁文锋的逻辑里,这恰恰是一个科研人员对科研纯粹性的最后防线。 在历史上,阿里曾有过明确的技术协同方案,以阿里云的相关算力需求,抵消投资款项,以战略资源折价入股,最终实现双重绑定。 但对于一个靠技术开源和架构创新建立江湖地位的团队来说,“被绑定”三个字可能是不可接受的底线。 在大厂看来,拿钱、给资源、铺渠道,被投企业只需安安心心做技术,这难道不是天下最好的生意?但以推崇原始创新的DeepSeek看来,这是一种路径依赖,并且是一种可能扼杀创新的错误路径。 正因此,缺乏创新基因的大厂或许永远理解不了,为什么有人不愿意坐上它们精心铺好的牌桌——因为它们深信,所有创业故事的终点,都应该是一座商业帝国。 从来不是钱的事 谈判遇阻的本质,从来不是钱的问题。 据报道,腾讯在本轮融资中曾提出认购DeepSeek最多20%的股份,但被DeepSeek一口回绝。阿里提出的条件更为向前:不仅要求相当的股权比例,还试图在董事会中嵌入战略决策权。对梁文锋来说,这都是对红线的触碰。 一个关键的时间节点值得注意:2026年4月27日,就在融资消息密集发酵的前夕,DeepSeek悄然完成了一次股权结构调整。工商信息显示,公司注册资本由1000万元增至1500万元,创始人梁文锋通过直接增资将持股比例从1%提升至34%,原大股东宁波程恩企业管理咨询合伙企业持股比例稀释至66%。调整后,梁文锋通过直接与间接持股合计控制公司约84.29%的股权。更直接的是,梁文锋在本轮融资中拟以个人名义最高出资200亿元人民币,占募资总额的40%。 先用自己的真金白银把控制权攥紧,再打开大门迎接战略投资者入场——这个操作序列,传递的信号再清楚不过:梁文锋欢迎资本,但绝不容忍资本反客为主,这是对DeepSeek作为创新性组织的最大伤害。 另一家AI企业就是最为典型的案例,凤凰网科技了解到,2025年初,某个爆红的AI企业在拿到了互联网大厂的投资后,被后者要求看DAU数据,这是个互联网时代最值得观测的指标,但在AI时代,过分追求短期DAU可能不仅不会起到正向作用,还会侵蚀一个技术研究性团队的创新动力。“创始人开始忙着应对股东,应对DAU指标,肯定会让研发走形”,一位一级市场投资人告诉凤凰网科技。 但梁文锋的独立性执念,让习惯了“我投你,你就得听我的”的大厂感到无所适从。在大厂的认知框架里,投资本质上是一种资源的等价交换:我给你钱和场景,你给我股权和话语权,这是市场规则。 梁文锋的底气来自幻方量化——这家管理规模超700亿元的量化巨头,2025年实现了56.55%的年化收益,仅业绩报酬一项便可能在一年内带来超过7亿美元的现金流。更重要的是,梁文锋持有幻方多数股权,幻方的利润可以全额转化为DeepSeek的研发预算,不被任何外部股东稀释。这也使得,自创立至今,DeepSeek在融资谈判桌上的底气,一直是国内所有AI初创公司中最硬的一档。 在大厂的投资史上,这几乎是一种陌生的体验。它们习惯了用体量压制、用流量诱惑、用生态裹挟,但面对一个自给自足的对手,这些招法全都落空。也正因为如此,大厂永远理解不了梁文锋——在它们眼中,控制权是谈判桌上的筹码,而在梁文锋眼中,控制权是不可交易的信仰。 新牌局如何坐下旧玩家? 就在大厂与DeepSeek博弈得难解难分之际,一个真正的“超级变量”横空入场。 5月6日,据报道,国家集成电路产业投资基金(即“国家大基金”)正在与DeepSeek洽谈主导其首轮融资事宜,投后估值有望定在450亿美元左右。仅仅两周时间,外界对DeepSeek的估值便从200亿美元直接翻番。 国家大基金的入局,带来的远不止估值倍增这么简单。大基金一期、二期以芯片硬件为唯一入口,三期曾通过设立专门的AI产业投资基金,将触角系统性地延伸至大模型、具身智能、AI安全等全产业链环节。此次与DeepSeek的接洽,被称为首笔AI大模型公司直投案例。背后的生态目标明确。 多位投资人向上海证券报表示:“这个项目和其他创业项目不同,尽管目前商业化力度有限,但投资者仍看好其发展潜力。现在肯定是投资人追着梁文锋跑,看他最后会选哪一个。”有分析人士进一步指出,最终投资方阵容中,“国资一定会扮演非常重要的角色”。 这也意味着,当国家级资本集体入场,大厂的出价能力被彻底碾压——不是比钱多,而是比谁能给DeepSeek真正需要的战略性资源:产业链整合能力、算力基础设施的支持。 这些结构性力量,远超一家互联网巨头能够提供的价值范畴。对梁文锋来说,选择国资而非大厂,不是简单地“向资本低头”,而是选择了一种能够最大程度保全治理独立性的“战略型合伙人”。在上海证券报的求证中,业界普遍认为,融资的终点很可能是“大基金主导、多家互联网巨头小额参与、梁文锋个人继续重注”的三层结构,既保障资金供给,又防止任何一方获得压倒性话语权。 只是,在新时代的牌桌中,旧玩家们仍在奋力的寻找自己的位置。 以阿里、腾讯、字节为首的第一梯队大厂自不必说,就连中厂如今都开始布局频频。 今年五一前夕,小红书以内部信形式宣布了一场规模巨大的组织升级,核心动作是两个:一是成立以AI为核心的一级部门Dots,建设从模型研发、基础设施、工程到产品的完整技术体系;二是在组织层面成立“企业智能部”,从智能、人才、数据和资源四个维度为“AI时代的组织”重新打底。小红书的AI建设,最终交给了技术出身的柯南。 美团的反思更早,2026年3月13日,美团召开2000人规模的管理层沟通会,CEO王兴把话讲得很重,他说“移动互联网和互联网就像玫瑰和芍药,而AI和互联网就像猴与花——量级和影响力要大得多。紧接着在4月底,美团低调启动万亿级参数大模型的邀请测试。5月,其高调宣布战略投资Kimi,但这场战斗仅仅是开始。 而从对DeepSeek投资上的分歧来看,这是旧玩家与新牌局的第一次碰撞。 互联网大厂永远理解不了梁文锋,就像旧玩家难以跟上新牌局一样——它们以为这是一场有钱就能入局的牌局,但实际上他们可能根本不在一个牌桌。
中芯国际Q1财报出炉:单季营收破25亿美元 同比增长11.5%
快科技5月14日消息,中芯国际今日正式公布2026年第一季度的财报。业绩显示,公司Q1销售收入25.05亿美元,同比增长11.5%,环比增长0.7%。 盈利方面,本季毛利5.04亿美元,毛利率回升至20.1%,较2025年第四季度的19.2%环比提升0.9个百分点,盈利水平稳步修复。 从收入区域看,中国大陆地区占比攀升至88.9%,较2025年同期的84.3%进一步提升,本土客户需求成为业绩核心支撑。 同期美国地区收入占比为 9.3%,较去年同期的12.6%有所下降;欧亚地区收入占比1.8%,同比、环比均呈收窄趋势。 按下游应用划分,消费电子仍是第一大收入来源,一季度占比达46.2%,较2025年同期的40.6%大幅提升。工业与汽车领域占比由去年同期的9.6%增至14.0%,成为增速最快的业务板块。智能手机业务占比18.9%,电脑与平板占比13.6%。 2026年第一季度,销售晶圆折合8英寸标准片为2,509,137片,环比微降0.2%;产能利用率达93.1%,较去年同期的 89.6% 显著提升,行业景气度回升带动产能利用率持续改善。 资本开支方面,本季资本开支为15.63亿美元,较2025年Q4的24.08亿美元大幅缩减。研发开支从上季的2.40亿美元降至1.87亿美元,行政管理开支亦有所减少。 展望二季度,中芯国际表示,收入预计环比增长14%至16%,毛利率进一步提升至20%至22%。
2026 AI眼镜大战升级!一边等苹果出手,一边憋大招
智东西 作者 | 王涵 编辑 | 心缘 云鹏 2026年,AI智能眼镜还在继续升温。 据多家外媒爆料,苹果与三星均在推进AI智能眼镜项目,首款产品有望于2026年前后亮相。 过去的2025年,Meta凭借Ray-Ban Meta系列产品迅速占领市场。知名行研机构Counterpoint数据显示,其在全球智能眼镜市场份额一度超过70%;而据道琼斯旗下财经媒体Barron’s援引行业数据,Ray-Ban Meta累计销量已突破700万台。 随着Meta验证市场需求,中国厂商也开始迅速跟进,国内市场迎来“百镜大战”。 国际数据公司(IDC)在2026年3月发布的《全球智能眼镜市场季度跟踪报告》中,2025年中国智能眼镜出货量达246万台,同比增长87.1%,远超全球44.2%的平均增速。 华为、小米、OPPO、理想、阿里夸克、百度小度等大厂密集入局,字节跳动也传出入局传闻。 Smart Analytics Global (SAG) 最新“AI智能眼镜功能报告”预测,2026年,全球AI智能眼镜的收入将增长四倍,销量将从2025年的600万台增至2026年的2000万台,市场规模预计将从12亿美元增长至56亿美元。美国和中国仍将是2026年最大的两个市场,合计占全球需求的近80%。 而这意味着,AI智能眼镜仍处于市场扩张期的阶段,蛋糕还够分,大厂们都不愿错过下一代硬件入口的争夺。 但又一个问题随之出现:当越来越多厂商进入市场后,AI智能眼镜究竟会分化出怎样的产品路线? 根据目前已知官方信息,智东西整理出了国内外大厂AI智能眼镜参数对比表(仅含已公布参数的产品): 国内外大厂AI智能眼镜产品不完全对比(智东西制图) 通过参数对比不难发现,目前大厂发布的AI智能眼镜有以下特点: 1、重量: 主流国产AI智能眼镜的框架重量普遍已压缩至40g以内,接近普通墨镜水平,更加追求“全天候佩戴”。 2、续航: 无屏产品由于功耗更低,续航普遍可以达到8小时以上。而带显示方案的产品,目前单次续航大多仍停留在2至5小时。如何在重量、显示与续航之间找到平衡,仍是AI眼镜最大的技术难题之一。 3、芯片: 以高通骁龙为代表的通用平台,仍是多数厂商的主流选择;与此同时,部分手机厂商开始尝试自研芯片,以强化软硬件协同能力;也有一些厂商选择将AI计算放在手机端完成,以降低眼镜本体重量与功耗。 4、生态: 手机与硬件厂商更倾向于将AI智能眼镜纳入现有硬件生态,希望延长手机、耳机等设备的使用链路;而AI公司与互联网平台,则更关注与现有软件生态的接入,希望借AI智能眼镜争夺下一代交互入口。 在技术尚未形成明显代差、行业标准也仍未统一的阶段,AI智能眼镜正进入“定义产品形态”的关键窗口期。不同阵营的玩家开始依托自身生态、模型能力与硬件积累,围绕下一代个人计算入口展开竞争。 一、国产集体轻三成,主打轻量化 从参数表的重量、显示与续航数据来看,轻量化已成为AI智能眼镜的核心竞争点。 重量方面,国产无屏AI智能眼镜的轻量化优势突出:华为AI眼镜框架重35.5g是目前最轻的,小米AI眼镜、夸克G1、小度AI眼镜Pro、理想Livis的框架重量均控制在40g以内,平均重量约38g。 小度AI眼镜Pro 而海外已量产的产品中,Ray-Ban Meta Gen2框架重量为52g,国产主流无屏产品比其轻近三成,佩戴舒适度优势明显。值得注意的是,苹果被曝正在开发的首款智能眼镜,也计划将目标重量控制在50g以下,侧面印证了轻量化已是行业共识。 二、显示屏幕不再是必选项,消费者更喜欢无屏眼镜 显示方案的选择,是影响AI智能眼镜重量的核心因素,也让厂商形成了两大阵营: 1、无屏路线:华为、小米、夸克G1、小度、理想、Meta均选择去掉光机模组,以“无显示”方案实现机身轻量化,核心逻辑是做手机的延伸,主打音频交互与拍摄功能。苹果、三星的传闻方案也倾向于这一路线,试图通过去掉显示模块平衡重量与功耗。 上:华为AI眼镜;下:小米AI眼镜 2、带屏路线:OPPO Air Glass 3、夸克S1坚持带屏设计,试图抢占视觉入口,延续AR/VR/MR的技术路径,但也导致机身重量偏高、功耗承压。 左:OPPO Air Glass 3;右:夸克AI眼镜S1 续航表现上,无屏AI眼镜平均续航可达8.4小时,而带屏产品机身单次续航普遍仅2~5小时,整体呈现出“无屏续航显著优于带屏”的规律。 即便如此,AI智能眼镜的续航能力仍远不及手机,因此理想、Meta、阿里等厂商纷纷采用可更换电池或充电仓方案,进一步缓解用户续航焦虑。 夸克AI眼镜S1的可更换电池与换电仓 从市场反馈来看,轻量化无屏产品更受消费者青睐。根据CINNO Research数据,2025年上半年中国消费级AI/AR眼镜市场销量26.2万台,其中轻量化无屏AI眼镜同比增速达463%,印证了无屏路线的市场认可度。 但无论有屏还是无屏,AI智能眼镜的影像能力的“手机化”已成为行业标配。从表格中不难发现,除华为标注800万像素外,小米、夸克、小度、Meta均采用了1200万像素级别的摄像头,并全线支持4K视频录制、电子防抖和超广角拍摄。 在无屏的硬件躯壳下,厂商们正疯狂内卷影像算法,试图让眼镜先成为一部戴在脸上的“AI相机”。 三、从高通到自研,大厂们分化出四大芯片路线 芯片作为AI智能眼镜的算力核心,背后是厂商技术路线与生态布局的差异,也直接影响了产品的独立使用能力与功耗表现。国内外大厂的产品主要形成了四种差异化路线: 1、通用方案路线: 高通骁龙AR1平台凭借低功耗与算力平衡的优势,成为多数主流产品的“通用方案”。小米、夸克G1均采用该芯片或其衍生方案,快速对齐Meta的基础能力。这一选择能帮助厂商快速缩短研发周期,降低技术门槛。 但芯片平台的通用化,意味着在基础的算力处理上,各家大厂几乎站在同一条起跑线上,难以拉开体验代差。 2、自研芯片路线: 华为AI眼镜采用自研AI眼镜芯片,配合HarmonyOS 6.0系统,构建起封闭且流畅的生态闭环,这也使其在连接稳定性与响应速度上形成优势。 华为自研AI眼镜芯片 3、第三方方案路线: 如理想Livis采用恒玄BES2800BP芯片。 4、无独立芯片路线: OPPO Air Glass 3未配备独立主芯片,算力完全依赖手机端,这种设计虽减轻了眼镜端的重量与功耗负担,但也限制了产品的独立使用场景,使其只能作为手机的辅助配件。 根据目前已知的爆料消息,苹果将为其AI眼镜定制基于Apple Watch S系列芯片的新处理器,主要负责驱动摄像头、处理传感器数据及运行基础机器学习模型,更复杂的计算任务则将通过无线传输至iPhone或云端处理,以此平衡功耗与续航。 四、硬件延伸VS入口卡位?立场决定产品路线 从参数表中的操作系统与AI模型配置来看,手机厂商、互联网厂商与汽车厂商的生态布局思路差异显著,形成了“硬件生态延伸”与“软件入口卡位”的不同策略,也决定了产品的定位与发展方向。 AI模型层面,多数产品接入了厂商自研的大模型或AI助手:华为AI眼镜搭载小艺助手,小米接入小爱同学,夸克G1接入千问大模型,小度AI眼镜搭载小度,理想Livis接入理想同学,Ray-Ban Meta Gen2搭载Meta AI,均聚焦多模态交互能力,实现实时翻译、识物问答等基础功能。 小米AI眼镜搭载超级小爱 而对于在AI能力相对没那么突出的厂家来说,多模型融合成为补齐产品AI能力的举措之一。海外巨头中,三星被曝计划在其AI眼镜中同时接入Galaxy AI与Gemini AI,苹果也被曝将搭载Apple Intelligence和Gemini AI。 在AI智能眼镜的生态布局上,行业逐渐分化为硬件生态延伸与软件生态联动两大路线。 硬件生态延伸阵营以手机厂商、汽车厂商为核心,包括华为、小米、苹果、三星以及理想,均将AI智能眼镜定位为自身硬件生态的延伸配件,核心发力跨设备流转与场景联动。 闪极科技创始人兼CEO张波曾在采访中表示:手机厂商做AI智能眼镜,本质是为手机使用提供“替补”,防止用户时间被AI智能眼镜抢占,属于防守型产品策略。 理想Livis作为汽车厂商推出的AI眼镜,搭载自研Livis OS与理想同学AI助手,核心逻辑是服务于车机生态,实现车内交互与跨场景联动,这也是汽车厂商切入AI智能眼镜赛道的独特优势。 软件生态联动路线的代表则是如阿里、百度、Meta等互联网/科技厂商,他们更倾向于将AI智能眼镜打造为“下一代交互入口”,试图通过眼镜联通自身软件生态,打破硬件边界。 阿里巴巴千问AI硬件产品总监吴建军(晋显)在昨天的千问AI眼镜沟通会上登台分享,他特别提到,千问AI眼镜有两个突出优势:深度定制的千问大模型“最强版本”+阿里生态中丰富的应用和服务。 以夸克G1为例,其搭载Android+RTOS双系统与自研Master Agent大模型中控系统,深度联动阿里千问大模型,联动高德地图、支付宝等软件生态,凸显入口价值。 结语:AI智能眼镜正从概念走向大众消费 尽管目前各大厂商的产品在硬件方案、AI能力、续航表现上仍趋于相近,尚未有某一款产品建立起绝对领先的技术壁垒,但这种百花齐放的格局,恰恰为行业带来了更多可能性。 根据国际数据公司(IDC)今年3月发布的《全球智能眼镜市场季度跟踪报告》,2025年全球智能眼镜市场出货量达1477.3万台,同比增长44.2%;其中中国市场表现尤为突出,全年出货量246.0万台,同比增幅高达87.1%。 没有一家独大,意味着赛道仍充满机会。随着技术持续成熟、场景不断丰富,AI智能眼镜距离真正走进日常生活,已经越来越近。
从落后到领跑:Anthropic如何逆袭OpenAI成AI热潮新赢家?
凤凰网科技讯 5月14日,据《华尔街日报》报道,Anthropic正逐渐成为AI霸权争夺战中公认的领跑者。凭借更快的增长速度和融资能力,其估值可能很快就会超越竞争对手OpenAI。 Anthropic两位创始人曾在OpenAI工作 在这场竞赛中,OpenAI曾看似稳操胜券,而Anthropic只是奋起直追的弱势挑战者。但两家公司之间的差距在今年已显著缩小。新的数据表明,Anthropic的增长仍在持续加速。而某些指标显示,OpenAI的增长已开始趋于平缓。 赶超OpenAI 据知情人士透露,Anthropic近几个月已收到多份投资要约,对其估值超过9000亿美元。这将使该公司目前的估值增加了一倍以上,并首次超越OpenAI。今年早些时候,OpenAI以8520亿美元的估值融资1220亿美元。 根据Anthropic向投资者透露的数据,该公司的收入运行率(创业公司常用的一种基于短期销售预测年度收入的指标)预计将在下月底达到500亿美元。今年4月,其收入运行率已突破300亿美元,而2025年底时为90亿美元。该公司原本计划今年实现10倍的增长,但在第一季度,其年化收入和使用量却实现了80倍的增长。 OpenAI则在3月底表示,其收入已达到每月20亿美元,年化约240亿美元。不过,由于统计口径不同,这一数据并不完全可比。Anthropic将通过云服务合作伙伴实现的销售计入收入,而OpenAI则不这样处理。OpenAI发言人表示,3月份公布的月收入数据并非旨在代表精确的年化收入运行率。 金融科技创业公司Ramp在周三公布的数据中表示,其使用Anthropic模型的客户数量首次超过了使用OpenAI模型的客户,其中34.4%的客户使用Anthropic,而使用OpenAI的客户占32.3%。数据显示,从3月到4月,Anthropic旗下Claude工具的使用率上升了3.8%,而OpenAI的使用率则下降了2.9%。Ramp分析了约5万名客户的支出情况,来追踪AI应用趋势。 Ramp客户中使用Anthropic的比例超过OpenAI “我们在这个市场上一次又一次看到,一个占据主导地位的大公司可能在短短几个月内被取代。Anthropic就刚刚做到了这一点。”Ramp经济学实验室首席经济学家阿拉·卡拉齐安(Ara Kharazian)表示。 OpenAI发言人表示,Ramp的数据并不能全面反映企业客户的情况,因为大型企业客户并非通过信用卡支付软件服务费用。 逆袭法宝 在今年之前,OpenAI一直被视为AI竞赛中的“默认领跑者”,其ChatGPT聊天机器人在整体用户规模上仍然显著领先于Anthropic的Claude。 Anthropic之所以能够迎头赶上,是因为它专注于开发少数几款产品,而非试图主导市场的每一个角落。它在编程用户和企业客户方面取得的成功,使其按照自己的节奏重塑了AI竞争格局。 2022年底ChatGPT发布后,OpenAI迅速腾飞,很快成为业界公认的赢家,并吸引了大量资本涌入。 与此同时,Anthropic与被判欺诈罪、名誉扫地的加密货币高管萨姆·班克曼-弗里德(Sam Bankman-Fried)扯上了关系。这种关系使得它在许多主流投资者眼中成为了“弃儿”。 这导致Anthropic在更为“受约束”的环境中发展,被迫采取更加克制的策略,将重心放在为企业客户开发AI工具上。 Anthropic的投资者、投资公司Iconiq创始人迪维什·马坎(Divesh Makan)在此前的一次采访中表示,那时候“还没有数十亿美元的资金涌入”,“他们必须时刻想着:如何用更少的资源做更多的事情?”。 Claude 2025年底,随着Claude Opus 4.5的发布,Anthropic的增长急剧加速。该模型在编程能力上的提升推动了Claude Code的使用激增,后者是一款与其旗舰模型配合使用的软件工具。开发者与AI爱好者们在假期期间花费大量时间体验这款工具,并表示他们“对Claude上瘾了”。 今年1月,随着Anthropic面向非技术任务的智能体工具Cowork的发布,其增长势头进一步加快。 尽管如此,OpenAI在消费者覆盖面方面仍然远超Anthropic。OpenAI在2月表示,ChatGPT的周活跃用户已达到9亿。在美国市场的每周应用下载量方面,ChatGPT长期显著领先于Claude,但在3月曾短暂被反超。 根据网络数据公司Sensor Tower的数据,3月2日,Claude在美国周下载量上首次超越了ChatGPT。大约在同一时间,ChatGPT在美国的应用卸载量激增了295%,Sensor Tower认为这与OpenAI与美国国防部达成合作所引发的用户反弹有关。 与此同时,在市场预期Anthropic即将进行新一轮融资以及随后启动IPO的背景下,Anthropic股票在二级市场上的买盘、卖盘和交易活动均大幅增加。在私募股票交易平台Augment上,Anthropic股票第一季度的交易量较去年第四季度增长了两倍,首次位居该平台交易活跃度榜首。 在同一时期,OpenAI在Augment平台上的二级市场估值下跌了22%,交易活跃度则基本持平。 “两个AI领军者,在同一个季度朝着截然相反的方向发展。”Augment在一篇博客文章中写道。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
腾讯辟谣“AI一号位即将离职”:纯属子虚乌有
凤凰网科技讯(作者/于雷)5月14日,针对网传“AI一号位即将离职”并影射腾讯一事,腾讯官方发布严正声明表示,此谣言纯属子虚乌有。腾讯严正辟谣,并保留对相关恶意造谣者追究法律责任的权利。 前OpenAI核心研究员姚顺雨2025年12月加入腾讯,出任CEO/总裁办公室首席AI科学家,同时兼任AI Infra 部、大语言模型部负责人,向腾讯总裁刘炽平和技术工程事业群总裁卢山双线汇报。他是“思维树”框架的提出者,该成果让AI解决复杂问题的能力提升40%,论文引用超15000次。在OpenAI期间主导了Operator智能体DeepResearch产品的开发,2025年入选《麻省理工科技评论》全球35岁以下科技创新35人榜单。 腾讯AI近期最受关注的进展是姚顺雨团队4月23日发布并开源的Hy3 preview语言模型,这是他执掌腾讯大模型研发后的首个重要成果。该模型采用MoE架构,在复杂推理、指令遵循和工具调用能力上实现显著提升,同时大幅降低了使用成本。截至5月13日,Hy3 preview已连续三周登顶OpenRouter周榜总榜,工具调用和编程场景分列第一、第二,结束限免期后日Token调用量仍保持榜首。 此外,腾讯3月底推出的AI效率智能体WorkBuddy目前已成为中国使用最广的 AI 效率智能体服务,公司累计上线数十款通用和垂直场景Agent,AI能力已全面融入元宝、QQ 浏览器等核心产品。
首超龙虾!「爱马仕」Agent全球调用第一,小米MiMo是第一贡献模型
智东西 作者 | 李水青 编辑 | 心缘 智东西5月10日报道,5月9日,Hermes Agent(昵称:爱马仕)登顶OpenRouter全球应用调用量榜首,首次超越OpenClaw(昵称:龙虾)。 OpenRouter榜单地址:https://openrouter.ai/app 据OpenRouter应用Token消耗榜最新数据,这一Nous Research旗下开源自进化Agent产品登顶全球应用Token消耗榜,单日Token消耗量达到271B,也就是2710亿Token。 Nous Research发文感谢用户 这个数字把一众热门AI代码与Agent工具甩在身后:第二名是OpenClaw,245B Token;第三名Kilo Code,149B Token;第四名Claude Code,79.2B Token。 此前4月14日,Hermes曾冲上OpenRouter“最热门编程Agent”细分榜单榜首,但未曾登顶总榜。当时,不少人开始弃掉OpenClaw转战Hermes。 而仅仅不到一个月后,Hermes在实打实的日调用量上超越龙虾,正在被大量用户真实使用。最新数据显示,Hermes累计Token消耗量已超过6.37万亿。 Hermes总体Token消耗情况 本月调用排名前五的模型为MiMo-V2-Pro(小米)、MiniMax M2.7(MiniMax)、Nemotron 3 Super(英伟达)、Step 3.5 Flash(阶跃星辰)、Hy3 preview(腾讯)。 Hermes模型调用情况 Hermes是2026年继OpenClaw之后走红的第二个开源智能体。与OpenClaw相比,该项目主打可成长性:具备持久记忆与精准回忆能力,并搭载完整的自我学习机制,可在使用过程中自主创建并优化技能。这也是为什么它会被称为“越用越聪明”的Agent。 Token消耗不等于产品成功,但它至少说明两件事:第一,有真实用户在高频调用。第二,应用正在承接复杂任务,而不是浅层问答。 值得注意的是,Hermes的token消耗量超过了多个AI代码助手。从Claude Code到Kilo Code,AI代码助手的边界正在被通用Agent侵蚀。 Hermes在编程Agent中的token消耗排名 当然,Hermes登顶不代表它已经赢了。开源Agent想真正成为主流,还要过稳定性、安全性、Token成本、生态协同等几大关。271B日Token消耗说明使用量惊人,也说明推理成本可能很高。 Agent要成为基础工具,不能只会“猛烧Token”,还得在任务成功率、成本、速度之间找到平衡。 截至目前,Hermes在GitHub已获得14万星,相比一个月前直接翻倍,Fork达21.8k。 Hermes的GitHub页面截图 GitHub地址: https://github.com/nousresearch/hermes-agent 同时,Hermes国内官宣适配平台已覆盖大模型、云厂商、社交/办公IM、消费级Agent。 Hermes在四月已支持微信调用 结语:AI Agent开始进入真实用量竞争阶段 Hermes登顶OpenRouter应用Token消耗榜,是一个值得关注的拐点。过去AI产品比的是模型参数、榜单分数和发布声量,现在越来越多产品要接受真实使用量的检验。 以Hermes、OpenClaw为代表的AI Agent正在重构软件行业。过去SaaS靠流程、权限、数据和组织协作建立壁垒,未来Agent可能靠“懂你”和“会干活”建立壁垒。 开源Agent不再只是追赶者,它正在用真实Token消耗,正面挑战AI代码助手和闭源Agent产品。AI Agent的牌桌,可能真的要重洗了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。