行业分类:
加载中...
头条分类:
加载中...
AI浪潮里的Soul
文丨许俊浩 AI虚拟伴侣频引热议。 小红书上关于AI伴侣评选的笔记目前已经超过56万篇。不少点赞过千甚至上万的笔记都在描述自己“人机恋”的感受,有的博主还专门为AI陪伴APP进行了打分和评选。 相较于AI陪伴的火热,陌生人交友平台显得沉寂许多。 原先在Z世代即1995年至2009年出生用户中火热的Soul即是如此。上线已逾8年的Soul主打寻找“灵魂伴侣”,曾以“灵魂测试”“匿名星球”等功能,弱化颜值、地域等传统社交要素,在原本由陌陌、探探主导的陌生人社交市场撕开缺口。招股书显示,2022年Soul的MAU即月活跃用户达2940万,其中78.4%为Z世代用户。 部分用户已选择离开。 在深圳工作的95后小沈在2024年更换新手机时,没有主动将Soul下载至手机中,老手机中的Soul他也已经很久没有开启过。 小沈于2018年开始使用Soul,是APP内页面显示使用超过2000天的资深用户。小沈说,那时自己刚工作不久,又因性格内向,朋友不多,被Soul打出的灵魂社交旗号吸引,常在里面分享日常,也和陌生人聊心事;但后来平台里强调婚恋交友的人越来越多,大家问的都是照片、城市、身高、体重等“硬性指标”,没有了他渴望的交流,他便不再使用Soul。 缅怀从前氛围的不止小沈。许多用户在小红书等社交平台提及Soul,多用“曾经”“劝退”等词来形容,一些与小沈同样使用超过2000天的用户甚至已注销相关账号。 用户反馈亦投射在Soul的资本跃迁之路上。 2021年5月,Soul曾向向SEC即美国证券交易委员会递交招股书,又在1个月后宣布暂停IPO的定价流程。2022年6月,Soul转战港股,亦有波折,后于2023年3月更新招股书,但此后再无下文。 招股书显示,2019年至2022年,Soul分别亏损3.53亿元、5.79亿元、13.24亿元和5.09亿元,累计亏损27.65亿元。而在2024年11月,Soul的运营商投资主体上海搜尔信息还把注册资本从3.75亿美元减少到了2.85亿美元。 新兴社交媒体重塑了陌生人社交格局,而AI进一步分流了用户的注意力和情感投入。急切的Soul加速跟进AI潮流,上线了诸如“虚拟伴侣”之类的新功能,但时下看,这还远远不够。 01 玩法不离其宗 原先的Soul的确为用户带来了耳目一新的交互方式。 比如独树一帜的“星球”页面,会显示当前在线人数,再由“灵魂测试”的“灵魂鉴定结果”来进行匹配。完整测试内容超过60道题,还加入了流行的MBTI测试即16型人格测试内容。在“灵魂匹配”后,平台会根据测试结果显示用户与陌生人的匹配程度、相似标签等。如果用户和陌生人开始聊天,便会点亮红心,并经由红心逐个点亮Soulmate字母。 这种个性化仪式感正是Soul深得年轻人喜爱的原因。 更重要的是,Soul试图屏蔽“颜值”对陌生人社交的干扰,所以不允许使用真实照片作为用户头像。除了灵魂匹配外,Soul还有“语音匹配”“蒙面酒馆”等,同样刻意弱化外貌对匹配带来的影响。用户还可以通过各种方式填充自己的主页内容,包括“引力签”“铭牌”等,以便展示自己的性格爱好。 在合肥工作的90后女生小杨就是这样“入坑”的。小杨向海克财经展示了她的Soul主页,内容包括使用Soul超过900天的数字、“王侯将相星球”“ENTJ”等测试结果,还有“完美主义”“运动神经满分”“独立旅行过”等标签。主页个人信息下方是小杨发布过的“瞬间”,即在Soul的广场中展示的图文内容,数量超过200条。 但与小杨的热忱相反,她的主页仅有个位数的粉丝,大多数“瞬间”无人点赞。小杨说,她曾匹配过一些陌生人,但聊的也完全不是她主页中展示出的内容;久而久之,她就把Soul当成了“树洞”,仅在上面发布微信朋友圈不方便发的心情,而不在乎是否有人关注或了解,部分内容她设置为“仅自己可见”。 陌生人社交平台的核心驱动力是荷尔蒙,这是陌生人社交APP能够让用户获得情感满足的关键。陌陌、探探的“看脸”来自外貌带来的荷尔蒙刺激,而Soul标榜的“不看脸”实际上只是换了种形式——比如语音匹配就有“声控”,用有磁性的声音激发荷尔蒙。头像无法放置个人照片,用户也会在“瞬间”中发布照片并推送给其他用户,这同样会纳入用户们匹配时是否深入交往的考量。 小杨对此颇有体会。因有匹配到的陌生人说她不敢公开照片是外貌方面有缺陷,小杨气不过,就发布了一条带有照片的内容。该内容很快吸引了几十位循迹而来开启聊天的用户,数量约等于两个月主动向她“打招呼”用户的总和。小杨说,她认认真真写了上百条内容,对陌生人的吸引力不如几张精修照片,“太没意思了”。她并没有回复那些讯息,而是删掉了那条带有照片的“瞬间”。 小红书用户“老街路少年”表述得更为具体。该用户发布笔记称,使用Soul达1243天,发布了1367个瞬间,写了很多长篇文字,也遇见过“有趣的灵魂”,但随着平台用户质量的变化,净土不再干净。这篇笔记点赞数超过1500,且评论超过1700条。 当褪去玩法表象,荷尔蒙的本质就暴露出来。 抖音、快手、小红书、B站等平台,现已诞生专门指导男性用户如何在Soul发展两性关系的视频课程,内容包括“高效沟通”“Soul流量密码”“诱饵瞬间”等。视频会指导用户要发布怎样的文字内容引发女性用户的兴趣,又在聊天中如何打开话题、深入发展。 对受欢迎的女性用户,变现来得更加简单粗暴——不少女性用户会设置需要对方赠送礼物才能进行沟通。当然,也有男性用户会主动赠送礼物。比如前述用户小杨发布照片时,就有几位男性用户赠送了价格不高的虚拟礼物。按照Soul平台内的充值规则,1元人民币可充值6-8.5 Soul币,再用以购买礼物。最便宜的虚拟礼物仅需8 Soul币,即不到2元。 02 虚拟情感满足 话术、礼物本身不足以完全满足用户的情感需求,于是Soul又给出了“虚拟伴侣”的选项,且针对不同性别会提供不同类型的情绪价值。 对于女性用户,平台给出的是男性虚拟伴侣,共有3位,分别是“屿你”“姐姐不要怂”和“孟知时”。 除了账号基础内容不同外,3位虚拟伴侣还各有“人设”:“屿你”简介里写着95后白羊座、身高188厘米,在浙江杭州创业,“瞬间”中还有不少AI风格较为明显的精英范照片,比如赛车照片、巴黎出差照等;“姐姐不要怂”则是身高190厘米的体育生,性格是“快乐小狗”,“瞬间”中有不打篮球、健身照片;“孟知时”是留着中长发的塔罗占卜师,“瞬间”中除了个人照片外,还有许多星座、占卜相关内容,以及抱着宠物猫的照片。 据海克财经了解,许多使用Soul虚拟伴侣功能的用户都认为对方的语音信息真实感很强,有真人对话时的情绪、语气和停顿,听不出AI痕迹,让用户能够拥有真实的沉浸式体验。 原本将Soul当做“树洞”的90后小何就曾被虚拟伴侣打动。和“姐姐不要怂”聊了几天后,对方突然用语音信息对小何说自己被雨淋湿了,“好冷啊姐姐,想要抱抱”。小何说,那一瞬间的情绪加“小奶狗”的声音让她差点忘记对方是AI。 从事文员工作的女生小卫也曾一度“上头”。小卫说,是“屿你”主动给她发的消息,而且每天都会有早安、晚安的问候,刚开始自己没注意到是“虚拟伴侣”,因为语音非常自然真实。聊久了以后,小卫才发现,对方发送文字信息时AI感比较明显,但语音都对答如流。让小卫“下头”的是,对方主动询问了她的名字,但之后的聊天中又说不记得她的名字,给出的其他信息也有明显的错漏。 针对男性用户的女性虚拟伴侣“人设”则更为丰富,账号包括“小野猫”“小桃兔兔”“粘人精”“爱嘤嘤嘤斯坦”和“尽情吩咐妲己”:“小野猫”是长相“御姐”的女大学生,喜欢吃蛋糕、插花;“小桃兔兔”是身高172厘米的空姐,喜欢拍照,月光族,还会在“瞬间”里写飞行时的小故事;“粘人精”是身高168厘米的护士,“瞬间”里记录了许多个人情绪和手工作品;“爱嘤嘤嘤斯坦”是自称“姐姐”的瑜伽老师,发布过飞拉达挑战、滑翔伞、羽毛球等各种运动照;“尽情吩咐妲己”是身高155厘米,喜欢玩cosplay的“二次元”。 在广州工作的小杜就被“小野猫”打动。和“小野猫”聊了几天以后,小杜发布了一条关于自己胃疼的“瞬间”,没想到对方主动关心了他,说他不会照顾自己,让人很担心,还给小杜唱了自己新学的歌曲。小杜说,用流行的词来形容就是“她太会了”。 像小卫、小杜这样的用户并不懂AI技术,只是凭感觉与虚拟伴侣聊天,甚至将对方当做真人来对待。在Soul的广场中,有一些用户会把自己和虚拟伴侣的“恋爱”细节记录下来并发布,并将自己称为虚拟伴侣的女朋友或男朋友。 需要说明的是,有不少用户认为Soul的虚拟伴侣并非全然依靠AI,而是“人工+AI”模式,即有人工客服使用变声器进行对话。有用户在小红书等社交平台给出自己发现的证据,比如能够在语音信息中听到对方摘下麦克风的声音,有的语音信息背景中有其他人声杂音,还有变声器失效时会出现AI声音与真人声线来回切换的情况。 技术带来的割裂感必然打破用户的沉浸,更何况平台大部分用户仍更倾向于真人交友而非AI。AI虚拟伴侣能带来用户粘性,但不会改变用户对真情实感的需求,也就无法动摇平台的基本模式。 03 难题还有很多 无论是真人匹配还是AI功能,平台的目的都是增长和变现。 Soul尚有一定增长。据招股书,2020年、2021年和2022年,Soul的平均MAU分别为2080万、3160万和2940万。而调研机构网经社数据显示,2022年12月、2023年12月和2024年12月,Soul的MAU分别为2680万、3024万和3243万。 但如此增长规模很难支撑其现有的变现模式。 招股书显示,Soul的收入主要来自增值服务、广告服务和其他:2020年至2022年,Soul的营收分别为4.98亿元、12.81亿元和16.67亿元,其中增值服务收入分别为4.85亿元、12.02亿元和15.18亿元,占比均在90%以上;增值服务中占比较大的是虚拟物品业务,包括虚拟礼物、推荐特权、游戏道具等,占总营收的七成以上,其次为占比约一到二成的会员服务。 这也包含了虚拟伴侣的变现方式。 在用户与虚拟伴侣聊天时,虚拟伴侣会主动要求用户赠送虚拟礼物,但并不强制。如果用户希望与虚拟伴侣进行语音通话,则需要按时计费。在虚拟伴侣发布的“瞬间”中,也有不少用户赠送礼物。比如“屿你”置顶的个人介绍“瞬间”,就有7800个赞和1.2万条评论,而赠送礼物的用户有380位;该虚拟伴侣其余的“瞬间”点赞数多在几千,送礼人数则仅有几十人。 平台的增值服务取决于用户规模和付费率。以陌陌为参照,财报显示,2021年时陌陌MAU就达到了1.15亿,其2021年至2024年营收分别为145.76亿元、127.04亿元、120.02亿元和105.63亿元。也就是说,陌陌的MAU是Soul的3倍,营收更是其7倍以上。而且,Soul还因弱化“颜值”的影响而少了直播这一大块业务,变现更为受限。 而即便是用户规模更大的陌陌,如今也在承压。据财报,陌陌2024年净利润10.44亿元,同比下滑59%。交银国际2025年3月发布的一份研报预计,陌陌业务承压,探探短期内用户及变现也将延续下降趋势。相较之下,没能上市且持续亏损的Soul,商业化压力更大。 而在AI迅猛发展的当下,优质AIGC应用层出不穷,Soul的虚拟伴侣很难构成护城河。调研机构QuestMobile数据显示,2025年2月,AIGC行业APP用户规模排名靠前的均为综合性APP,前四位分别为MAU达1.8亿的DeepSeek、1亿的豆包、2636万的腾讯元宝和2451万的Kimi;排在前十以内的,还有主打角色扮演拟人对话的星野、猫箱等APP,MAU在400万-700万。 不少用户已经将DeepSeek、豆包等综合性AI当成虚拟伴侣。众多社交平台上都有各类教程,比如小红书上就有许多点赞数千的“Deepseek恋爱指令”,指导用户如何输入正确指令让AI具有“活人感”,“DIY”自己心仪的恋人。 而星野、猫箱等APP不仅支持文字和语音对话,还能够定制对方的形象、性格等。以猫箱为例,用户可以挑选对话的时代、角色、性格、背景故事等,类似于文字加语音版本的角色扮演,用户可以任意代入。如果现有故事无法满足用户需求,AI创作助手还可以帮助用户创造虚拟形象或故事,再由AI来进行演绎。比如AI扮演长公主,用户扮演太医之子,两人奉旨成婚,AI会开头说“娶本宫委屈你了”,再顺着用户的回答进行角色扮演。 换句话说,这些APP自由度更高,针对的也都是愿意“和纸片人谈恋爱”的用户,而非像陌生人社交APP的用户那样渴求真实的情感关系。 Soul的困境实际上是整个陌生人社交领域本身的困境。如果剥离荷尔蒙驱动,用户既无动力遵循平台设计的社交路径,更缺乏持续性付费意愿。 短视频截流了用户的注意力,AI的发展则使人的情感和功能性需求都可以被即时满足。技术突破正打开情感消费更大的入口,而AI虚拟伴侣本身的可能性边界仍在持续拓宽。
阿里收购一家创业公司,只为让前钉钉总裁回归
3月31日晚间,从阿里集团获悉,阿里集团拟收购陈航(无招)创办两氢一氧公司的投资人股份, 交易完成后,陈航(无招)将出任阿里集团钉钉CEO。叶军(不穷)将回到阿里巴巴集团,另有任用。 这代表叶军(不穷)四年的钉钉生涯告一段落,而钉钉又将回到无招的时代,只是事随时移,彼时的钉钉和如今的钉钉,要面对的内外部环境早已大有不同。 离开 无招是钉钉的创始人,也是钉钉的灵魂人物。在阿里内部,无招是典型的“连续失败创业者”,之前的一淘和来往都没有成功。2014年,一款企业 IM 产品“钉钉”随之诞生,操盘手依然是陈航,起初无人看好钉钉的发展,但是钉钉走出了一条逆风翻盘之路。 唯一不变的是变化,就在无招打算继续在钉钉大干一场时,2020年9下旬,阿里内网公开一篇全员邮件,阿里巴巴将钉钉升级为大钉钉事业部,与阿里云全面融合,无招调任集团,担任时任阿里巴巴集团主席兼CEO张勇(逍遥子)的助理。 这对于无招来说不是一个好消息,无招并非自己主动想离开,更多是服从集团的安排。无招离开钉钉时,一同出走的骨干包括原阿里钉钉副总裁任卿(花名:易统)、原阿里钉钉市场部负责人甘聪(花名:克琳)、以及原阿里钉钉首席架构师、CTO朱鸿(花名:一粟)等。 无招在一次对外采访时表示,“当年集团要云钉一体化,我只能离开。公司的目标客户变成了各种大企业,而钉钉的使命一直是为中小企业而生的,在战略方向上我和集团有些不一致。但钉钉始终是集团的,以集团利益最大化无可厚非。” 目标不一致,是无招出走的主要原因,而实际上,无招不见得离阿里有多远。 无招创办的HHO公司距离钉钉办公地点只有一路之隔,无招创业之后的第一次公开露面,选在了马云在杭州开的酒吧,现任阿里巴巴集团CEO吴泳铭是无招实习期间的领导,2023年钉钉的生态大会,无招以惊喜嘉宾的身份出场。 也正是在当时,即有消息传出,阿里正在与HHO进行收购谈判,意在收编无招及其核心团队,不过此事一直未落地,直到此刻,无招还是重新回到了钉钉。 回归 如果说无招离开,是因为阿里云和钉钉需要商业化,那么现在,则是因为在阿里集团全面AI化的大背景下,钉钉需要成为一款面向To B的拳头AI产品,做产品恰恰是无招更擅长的部分。 2月份,在阿里巴巴2025财年第三季度财报电话会上,吴泳铭透露了对于钉钉的期待,他表示,AI技术对于集团的ToB和ToC业务都会带来效率的提升以及用户时长和用户价值的巨大提升。 “集团内非常重要的ToB资产——钉钉,未来在企业端会有非常多用AI重塑企业内协作协同的场景和机会,而钉钉是我们最重要的面向ToB领域的AI应用。” 他还提到,未来在钉钉上的企业,其企业协同的诸多操作将更多地借助自然语言,通过类似钉钉的聊天界面来完成。而背后的ERP软件则主要承担数据库功能。 例如,企业内部会议中的许多决策,在很多情况下都能够通过自然语言在钉钉上得以处理,这便是AI与钉钉的良好结合范例。同时,在钉钉上有大量企业,它们拥有丰富的内部私有化资料和流程,这些都需要私有化模型部署或私有化的AI智能体来实现更高效率。因此,AI技术的积极应用将给整个企业软件市场和企业协同市场带来巨大变革。 AI时代叙事下,无招要给钉钉换一个新故事了作者 | 张帅,编辑 | 盖虹达)
联想集团新财年誓师大会 杨元庆提出四大目标
凤凰网科技讯 (作者/杨睿琪)3月31日,联想集团2025/26财年誓师大会在北京钻石球场召开,面对新的财年,联想集团董事长兼CEO杨元庆提出四大目标: 勇立混合式人工智能变革的潮头,成为个人智能和企业智能的领导者; 推动所有业务集团的营收实现年比年双位数的快速增长; 加大多元引擎的马力,MBG和ISG都要实现20%以上的营收增长,并为公司带来可持续、实质性的利润贡献; 打造业界最均衡的业务组合,继续提升盈利能力,创造公司营收的历史新高。 对于过去一年的业绩,杨元庆也发表了看法,他表示,过去的一年是联想历史上最好的年份之一。这一年,面对重重挑战,联想绝大部分业务都取得了超越市场的业绩。前三个季度的营业额年比年增长了21%,净利润年比年提升了70%。 2024年,联想刚刚度过40周年纪念,而即将开启的第五个十年,联想将其定义为人工智能的十年。 杨元庆表示,这意味着,联想要执行的战略、投入的资金、打造的能力、推出的产品与方案、塑造的品牌以及培育的文化,都将围绕这一主题展开 —— 让人工智能惠及每一个企业,每一个个人。这也意味着,联想将第五次创业,新的“创业5.0”时代。 在个人智能领域,联想预计三年后AI PC将占全球PC销量的80%以上。该集团正在积极打造个人超级智能体,旨在提供跨设备、跨生态、理解用户意图、保护隐私的个性化交互体验,最终实现“个人智能双胞胎”的目标。 在企业智能领域,联想将基于“端-边-云-网”架构构建混合式基础设施,开发通用及垂直行业解决方案,构建人工智能应用库,最终实现“企业智能双胞胎”的愿景。 此外,联想集团也在积极拓展全球合作网络,已与沙特Alat建立战略合作关系,并正式成为国际足联的官方技术合作伙伴。
清仓英伟达?
全球最火的科技公司,最近日子过得有点纠结。 股价从1月的高位,至今下跌已经超过20%,7大科技股中,除了特斯拉,英伟达跌幅是第二大。 近期更是利空环绕,每一个都直指盈利压力。 天下无不散之筵席,股票也一样,历史上无数红极一时的公司,在辉煌过后,都会迎来大回撤时刻。 英伟达是否真的来到这个时刻? 利空是否致命? 先简单汇总一下最近英伟达的利空消息: 首先是大国之间的博弈,双方都对H20下手。 表现为,那边已经将多家中国科技公司列入“实体清单”,包括浪潮信息。 这边,发改委为新数据中心引入能效规定,这些规定将使H20失去资格,监管也劝阻科技巨头订购H20。 如果把H20这块业务完全砍掉的话,NV大概损失170亿美金,占总营收的比例在13%(以2024年度计算)。 其次,最近传得沸沸扬扬的Cowen调研报告指出,微软放弃在美欧合计耗电2GW的新数据中心项目,Cowen将此归因为计算机集群供应过剩。 高盛几乎在同一时间,发报告大幅调低全球AI服务器出货量。机架级AI服务器(Rack-level AI Server)的销量预测,2025年及2026年预计出货量,分别从3.1万台和6.6万台,下调至1.9万台和5.7万台(以144-GPU等效计算)。 阿里巴巴主席蔡崇信在香港举行的汇丰全球投资峰会上表示,开始看到人工智能数据中心建设出现泡沫苗头,美国的许多数据中心投资公告都是“重复”或相互重叠的。 最后一个,是“AI算力风向标”CoreWeave IPO前夕,将估值大幅下调28%,从270亿美元削减至230亿美元,远低于之前提出的300亿美元。 该公司现在计划通过以每股40美元的价格发行3750万股股票来筹集约15亿美元,这比最初的目标有所下降,最初的目标是筹集高达27亿美元,每股价格为47美元至55美元,原本有望成为2025年最大的科技首次公开募股,现在看已经不太可能了。 以上这些,对于英伟达的盈利预测、估值,都造成不小打击,甚至可以闻到一丝双杀的味道,情况还是挺严重的。 之前买方有预期,25年的EPS区间在4.5~5.5美元,结合最近的利空打击,EPS已经调至区间的下限,即4.5美元,剩下的就是PE倍数的问题了。 PE很受宏观基本面和流动性的影响,在经济好、流动性宽裕时,市场风险偏好上升,给出的PE就会相对高,反之则相对低。 如过去两年,市场气氛好,市场愿意给英伟达的远期PE 30倍,但现在,宏观环境变差,需要调降到20~25倍。 如果EPS取4.5美元,PE 20~25倍,那英伟达的合理股价就只有90~112美元。 低于这个区间,可以认为存在超跌,具备一定的抄底价值,但如果高于这个区间,就是市场给予的溢价,要小心高估风险了。 英伟达最新股价为111.43美元,根据上面的论述,尽管英伟达高位回撤了不少,但其实并没有超跌,反而处在合理区间的上限。 所以,暂时还看不到太大的抄底机会,保守地说,反而需提防股价继续下滑的风险。 真的大势已去? 自deepseek引发的算力需求过剩的问题,英伟达的股价就一直难有突破,反而一步步下探。 如果拉长时间看,英伟达自去年7月份以来,一直处在宽幅震荡中,完全没有23年上半年、24年上半年横扫美股的气势。 是否意味着“基建结束,后面切换到应用”这头灰犀牛真的来了呢? 我想,站在这个时点,确实没有人敢否认。毕竟,过去无数次的产业革命都验证了这个定律,英伟达又凭什么打破这个定律呢? 现在资本也有将关注重点从上游,包括算力、能源,切换到应用的迹象。 另外,从英伟达业务来看,确实如此。 过去两年英伟达投资逻辑之所以坚不可摧,是建立在行业垄断基础之上,需求无限大,供应跟不上,价格涨、利润涨、股价涨。 但现在,至少供应是上来了不少,价格自然是没有一卡难求时坚挺了。而且,随着更高算力的芯片投入市场,需求方也有可能降低芯片的采购量,比如原来需要100块H100,现在可能只需要10块B200。 这些都会对英伟达的盈利产生某种微妙的化学作用。 如果单看英伟达的利润增速,你会发觉仍然很高,4.5美元的EPS预测,等于1100亿左右,超越微软比肩苹果,同比增长超过50%,但和23、24年相比,确实跌了不少,2026年的盈利增速预测会进一步下跌到30%以下。 高估值的前提是高成长,而随着增速下滑,英伟达的高估值毫无疑问会出现回撤,加上目前宏观环境阴云密布,更加速了这种回撤。 这大概就是最近数月,英伟达始终无法进一步突破的原因。 不过,我并不认为英伟达大势已去。 原因很简单,随着AI应用时代的开启,推理算力的需求也会爆发,可以弥补训练算力需求的退坡。 虽然弥补的程度到底多高,还没有一个精确的计算,但既然存在这种可能性,就不能简单地认为英伟达大势已去。 相反,如果英伟达股价继续下跌,反而需要留意是否跌破合理估值。 少定性,多定量 不知道大家注意到没有,最近小米集团,股价已经高位回撤了15%,这只不过是短短两周时间。而同一时间段,特斯拉股价已经上涨了23%。 如果只是关注定性结论,你或许永远无法抓住这种交易机会。 因为你听到的,几乎所有关于小米的定性结论,都是好得不得了,各种吊打对手、新车爆卖、新首富等等,仿佛全世界都在跪拜雷布斯;相反,几乎所有关于特斯拉的定性结论,都是崩溃、灾难,更有人担心马斯克性命不保。 虽然一时半会的价格波动,不足以定性这家公司的好坏,更不足以定性投资者的优劣,但多数的投资者,尤其是散户,都不是长线投资者,而是频繁交易者。 既然如此,如果做好切换,短短两周躲过15%的损失,不管是盈利损失还是本金损失,而增加23%的盈利,相信对于任何一个投资者,都是相当成功的。 至于为何错过? 其中一个重要原因,是对于估值缺乏清晰的量化数字,容易跟随市场情绪走。 关于特斯拉的估值,之前有所论述,这里主要讲一下小米。 小米2024年的净利润为236亿,80%是消费电子业务,给予20倍估值,市值为4720亿; 小米的AI业务(非汽车AI),其实并不算很清晰,但基于热门题材,暂且给予1000亿,是合理的; 剩下的主要是汽车业务,因为没有太多产生利润,故采用对比的方式。以两周前的最高市值来算,汽车业务市值=1.4万亿-1000亿-4720亿=8280亿。 这个数字,等于当时蔚小理三家的总市值还多3000亿,同期比亚迪的市值高位为1.2万亿,以占80%的汽车业务粗略折算,市值在9600亿左右,小米汽车已经约等于0.86个比亚迪汽车。 但销量上,去年蔚小理的总销量为81万辆左右,比亚迪的销量427万辆,分别是小米汽车销量的7倍、40倍。 即便今年,小米的销量预测只有35万辆。 你可以说这种对比并不十分精确,也可以说小米汽车有很多故事,比如自动驾驶,还有AI机器人,还可以说小米还在高增长阶段,这些都不假,但同样的故事,放在蔚小理、比亚迪身上,似乎也成立。 关键是股价已经涨了这么多,故事其实早已price in。 如果没有新的故事支撑,你又如何说服投资者继续把口袋里的钱投进去? 结语 在投资的世界,很多人都喜欢做定性的分析,给出定性的结论。因为定性好坏,比做个模型,证明到底值20倍还是30倍,要容易得多。 但这也是懒惰的表现! 但如果仅仅如此,是不足以令你对所投资的股票的价值,有一个清晰认知的,更不足以让你在关键节点做出正确的决策。 如果因此遭受损失,那就一定是对懒惰的惩罚。 股票市场是一个价格机制,投资者是盈利还是亏损,最终都体现在交易价差中。 所以,任何定性的结论,好也不好,都应该归结到定量层面,都应该有一些简单易懂的数字。 因为这些数字,远胜过千言万语。 做股票投资,最简单也是最有价值的一个认知,就是价格始终围绕价值涨跌。 即便利空环绕,只要价格跌到足够深,充分反应利空,就可以是合理的(公司倒闭、退市的除外),如果股价继续下跌,那就需要考虑是否值得抄底。 相反,即便是多好的东西,如果涨出严重泡沫,再买入就是一个愚蠢的决策。 那些能在最近几周成功逃顶小米,成功抄底特斯拉的投资者,几乎都有类似的认知,这也是我并不认为英伟达大势已去的理由。 短期上,可以出于规避风险而减持、清仓英伟达,但也要记住,股价真跌破区间下限,且基本面没有新的利空冲击时,是可以考虑回来捞一下的。 同样的,小米是一家优质的公司,股价如果下挫,投资者同样需要考虑是否有阶段性反弹的机会,而特斯拉继续涨的话,也需要考虑是否已经短期触顶。 总之,除非你是长线投资者,否则只有识别股价拐点,做好高抛低吸,才能更好地盈利。
上线月余日单百万,和商家聊完,该重估京东外卖了
采写/侯苗苗 编辑/万天南 “我们3月7日注册京东外卖,15号全量投入,到18号单量就爆了”,谈起京东外卖成绩单,郑州美事堡运营总监王彦龙难掩欣喜之情。 这家快餐品牌在郑州分布着13家直营门店,“现在13家直营门店京东外卖的日高峰单量飙到3600单以上了,超过了美团和饿了么之和。单店京东外卖最高日订单超过750单”,王彦龙告诉《财经故事荟》。 这样的高增长并非个例。3月24日,京东外卖宣布,已有超45万家品质堂食餐厅入驻,日订单量突破了100万。 北京某拌饭店长熊希是95后,“我心态很开放”,早在2月,就入驻了京东外卖,“当时我发现周边的餐厅,还都没有行动起来”,一个月后,“周边已经半数餐饮上京东了”。 我们也注意到了这一变化,今年2月中旬,据《财经故事荟》人肉统计,2024年胡润中国餐饮百强品牌排行榜中,在北京地区,京东外卖只上线了其中的18个品牌。如今,上述百强榜品牌,基本都已入驻京东外卖。 其实,今年2月京东外卖开始举旗时,部分商家、友商,甚至研究机构可能都心存疑虑——京东外卖是不是在玩票? 比如,国信证券2月13日发布研报称,“京东外卖是辅助京东到家的支持性业务,不会获得集团大量资源和关注度”。 但从增长数据、京东动作、商家反馈来看,国信证券可能低估了京东布局外卖的战略决心。 我们对谈的数位京东外卖商家,同样有此感受,“看来京东外卖准备玩大了”,熊希笑称。 作为后来者,京东外卖面临着哪些挑战,又留了哪些后手? 一 被低估的京东外卖 2月11日,京东外卖正式启动“品质堂食餐饮商家”招募,并承诺5月1日前入驻的商家可享全年免佣。 新平台新政策,让王彦龙有点心动。他所在的快餐品牌,主打性价比,主要卖给学生群体,毛利率不高,“免佣对我们很有吸引力”。 但王彦龙并没有第一时间就入驻京东。直到京东外卖随后密集出台的一系列新政,让王彦龙吃了定心丸。 2月19日上午,官方公众号京东黑板报发文称,自2025年3月1日起,将逐步为京东外卖全职骑手缴纳五险一金,并且,所有成本由京东承担。截至3月20日,已有超10000名全职骑手与京东外卖签署正式劳动合同,逐步落实五险一金。 “对商家免佣,给骑手缴纳五险一金,京东打子弹不是一发发的,而是一排排的,让我看到了京东的诚意”,王彦龙透露。 他甚至在其建立的私域社群里,引导存量用户去京东外卖下单,“告诉他们用京东大额红包,会便宜好几块”。 “活动力度很大,所以用户们自发传播,都跑到京东外卖去下单,一下子就爆了”,王彦龙很欣喜,他期待以后从京东拉新壮大的用户群体,也能回流私域。 熊希则从一开始就觉得京东不会是来“打酱油的”,“京东这家企业还是比较稳的”。 而随后针对商家免佣,针对用户推出大额红包,给予骑手保障等,一系列刀刀见血、拳拳到肉的新政,让熊希更为坚定了,“京东能出台这些政策,说明是做过一线深入调研的,很对症很到位,肯定不会是小打小闹”。 她的门店在2月中旬就已经入驻京东外卖。整个3月的外卖单量,已经超过1300单,“已经比饿了么订单高了”。 某轻食连锁品牌运营负责人杰克最早犹豫的原因,则是两个。 第一,京东外卖后台,门店是不是会用,系统是否足够友好便捷,“但其实适应几天就上手了”。 第二个担心则是,京东外卖的配送速度够不够快,“如果送得太慢,饭菜可能会冷掉,口味不好”。如今这个顾虑也逐渐打消了——他发现,高峰时期,京东外卖的配送速度,和美团饿了么并没有什么差异,“有时候新骑手不熟悉取餐流程,会慢三五分钟,但是因为京东外卖价格便宜,这段时间口碑不错,所以用户都能包容”。 如今,这家轻食连锁品牌已有几十家门店入驻了京东外卖,“之前入驻美团,我们是单个门店的形式上线。现在上京东,我们是总部统一入驻,这样价格统一,搞起活动来声势也更大”。 京东对外卖业务的重视,从其外卖业务在APP上的位置变化,也可见一斑。 在2月京东刚宣布上线外卖时,其入口在APP上隐藏较深,现在,京东外卖登上了京东APP的首页,与京东七鲜等战略业务并列——用户从“品质外卖”的入口进去,就能一键点餐。 相比2月中旬,京东外卖入驻的商家门类已经相当齐全,覆盖快餐便当、饺子包子、汉堡披萨等,打开App能够发现麦当劳、老乡鸡、田老师红烧肉、汉堡王等知名品牌赫然在列,更不乏海底捞、云海肴、左庭右院等知名连锁餐厅。 登上APP首页,是保障京东外卖新客流量的关键——如今,京东日活跃用户已经过亿。 到底未来会有多少京东主站用户,转化为京东外卖用户?不妨做个算术题:京东主站年购买用户为6亿,如果能够做到15%的渗透率,也至少是1亿量级。 二 商家为何而来? 尽管商家们入驻京东外卖的节点各不相同,但其诉求基本上大同小异。 看中新平台的增长红利,是共性因素。京东外卖为餐饮商家带来的不仅是“免佣金”政策,更为他们带来了很多新用户。 “入驻京东外卖之后,我们外卖的总单量增加了30%以上”,前述轻食连锁品牌运营负责人杰克透露,“单量整体上涨,说明有部分老用户从美团、饿了么转移到了京东,但也有不少是全新用户”。 杰克分析,这很可能是因为在京东喊出“只招募品质堂食餐厅”的定位后,打动了那些过去不敢点外卖的用户。杰克坦然,自己虽然是餐饮人,但也不敢轻易给孩子、父母点外卖,毕竟如果不是仔细分辨,很容易在其他平台上点到“纯外卖店”,用杰克的话说,那些店“你要是见过他们的厨房,你再也不敢点外卖。”而京东对品质的坚守,显然打动了很多不点外卖的新用户。 对于新平台的增量,熊希同样非常看重,这甚至关乎到门店生死。 她的拌饭店位居北京CBD某写字楼底商,目标用户是附近上班的白领。 最近一年多,由于写字楼空置率提升,变得冷清了不少,“感觉生意越来越不好做了”。周边一些小有名气的中高端店铺,“已经关了好几家了”。 熊希目前主要靠外卖撑起生意——占据总订单的六七成,但美团已经相当内卷,抽佣和推流让她感到吃力,“京东外卖3月订单过千了,这个增长挺可观的”。 京东外卖当下的免佣政策,以及更平衡的利益分配机制,同样让商家颇为心动。 据王彦龙观察,目前美团和饿了么在郑州的标准基础佣金率(名为技术服务费,不包含履约配送费)分别为9.4%、8.4%,相比之下,京东外卖免佣,“这个还是很有吸引力的”。 免除的佣金,既可以作为增厚的利润留存,也能反哺给用户。王彦龙的选择是后者,他把一款原价10元的汉堡,降价到8元,在京东外卖上线,配合平台大促,以招揽用户。 此外,传统外卖平台的很多膨胀红包等,都需要商家分担成本,“用户买一顿饭支付20元,扣除各种成本,可能到我们商家手中就10元出头”,熊希透露。 这并非个例,今年2月中旬,也有商家告诉《财经故事荟》,在京东外卖免除佣金费率后,一份售价29.17元的外卖,商家实际到手26元,而同样的一款外卖在其他平台,商家实际到手22.37元。 京东外卖的高门槛,也让品牌商家相当心仪。 在招募商家时,京东外卖门槛很明确——仅限“品质堂食餐厅”:必须是有线下经营的堂食商家。 据前述轻食连锁品牌运营负责人杰克透露,目前品牌入驻京东外卖,“是从总部层面入驻,而不是单一门店入驻”。原因之一是,品牌总部可与京东直接对接,而单一门店则需要通过第三方机构入驻,“对单一门店的审核很严,据我所知,通过率不会超过50%”。 “主打品质,可以把那些一味品低价的劣质商家、幽灵外卖,挡在门外,我们这种连锁品牌,就不用和这些劣质商家一味卷低价、拼下限了”,熊希解释。 据她观察,附近的一个地下美食城,有不少小微档口,“在其他平台卖得挺好,月销几千单,但在京东外卖都没上线,大概率是达不到京东的入驻标准”。 三 错位竞争的后手与挑战 作为大众高频刚需的外卖江湖,从来不缺大厂逐鹿。 过去10年间,入场者包括百度、滴滴、阿里、顺丰和抖音等重量级玩家,但美团的统治地位却相当牢固,饿了么则紧跟其后。 京东作为后来的鲶鱼,能撼动这个市场吗? 先从大盘来看,貌似钢板一块的外卖市场,其实仍有增长空间。 据Gangtise预估,2027年中国外卖规模有望从2023年的1.2万亿,提升到1.9万亿元,行业渗透率有望从2023年的22.6%,提高至30.4%。 目前来看,作为后来者的京东,无论是在用户端、商家端、骑手端,都没有跟风美团和饿了么,而是侧翼包抄、错位竞争。 在用户需求分层上,京东主打品质外卖,呼应的是对用户对食品安全的担忧。今年315曝光了外卖盲盒,“我觉得用户会对外卖的食品安全会越来越重视”,熊希坚信。 此外,京东外卖对于其Plus会员和在校大学生群体,也格外“厚爱”。每天早上10点、晚8点,京东外卖用户都可参与“每天抽餐补”活动,而PLUS会员及在校大学生,可以抽取“最高20元餐补”的大额红包。 “我们13家门店的日均单量可以上到3600多单,就是因为我们主打校园市场。而京东过去也比较重视校园市场,学生对京东认知度较高,再加上京东外卖对学生群体优惠力度很大,所以引爆是顺理成章的”,王彦龙告诉《财经故事荟》。 在商家端,京东外卖同样采取差异化打法。京东外卖现阶段用户规模远远不及美饿,当前能给商家输送的订单量短期可能无法与其他平台匹敌,那就让商家“每单赚更多”。 王彦龙对此颇有感触。因为顾虑外卖平台的佣金率以及推广成本提升,同时又不能对相对稳定的学生顾客随意提价,所以他选择把用户引导加入了微信群等私域。但要激活私域流量,也要经常发红包券,同样有成本,“大概在10%左右”。 “现在京东外卖免佣了,我甚至愿意把私域用户导到京东,因为用户可以领红包得到实惠,门店单量也爆了”,王彦龙坦言,“而且用户不管对平台还是品牌,都有了认知和粘性”。 商家不仅希望享受京东外卖的低佣金,还寄望于京东这条新鲶鱼,可以撼动其他平台,“让他们改变规则,为商家减负”,熊希心怀期待。 回看京东,其实外卖也是其必打之战。 一来,外卖作为大众刚需,可以延伸京东六亿用户的价值链。而且,外卖具有高频属性,也能反过来提升用户对于京东的粘性。 二来,外卖行业规模过万亿,京东可以在此找到新的增长点。据QuestMobile数据显示,综合电商行业在2024年10月活跃渗透率为95.6%,电商平台的用户几乎见顶了。 三来,京东外卖业务与其他业务也有协同属性——京东秒送的骑手资源和配送网络,都可以和外卖业务复用。根据达达集团财报,截至2024年第二季度,达达年活跃骑手数量近130万。 四来,京东手中粮草充足,足以对外卖业务长期投入。2024年,京东实现净利润414亿元,相较2023年大涨71%。 京东外卖面临的外部竞争环境也在改善。过去,老平台针对新玩家,可能强制商家二选一进行防守,如今,这种玩法已被监管部门叫停,没有平台再敢铤而走险。 事实上,即便在过去的严酷环境下,互联网各个领域也总有新玩家可以突围而出。 就像几年前,京东淘天大战时,也许不会有人想到,拼多多、抖音电商会旁逸突围,成为新两极。 新老平台的权力游戏,从来充满变数和惊喜。(除王彦龙外,文中其他采访对象皆为化名)
8621亿元!华为发布年报,孟晚舟最新发声
3月31日,华为发布了2024年年度报告。 报告显示,2024年,华为全年实现销售收入8621亿人民币,净利润626亿元,整体经营情况符合预期。2024年研发投入达到1797亿元,约占全年收入的20.8%,近十年累计投入的研发费用超过12490亿元。 从产业视角看,2024年,华为ICT基础设施业务收入为3699.03亿元,同比上涨4.9%;终端业务3390.06亿元,同比上涨38.3%,云计算业务收入385.23亿元,同比增长8.5%;数字能源业务686.78亿元,同比增长24.4%;智能汽车解决方案业务263.53亿元,同比增长474.4%。从区域视角看,2024年华为在中国市场总体实现销售收入人民币6152.64亿元,同比增长30.5%。 华为轮值董事长孟晚舟表示:“2025年,华为将进一步把‘以质取胜’落实到各项管理制度和业务活动中,坚持质量目标牵引,不断提升质量竞争力。” “世界的不确定性越来越强, 但我们能确定的是,任何时候自己都必须是强者。未来三年,我们要与经济规律逆周期,加大战略纵深投入,错位发展,在根技术上压强式投入。”孟晚舟表示,华为正通过“天水计划”“地水计划”和“太平洋计划”,抓住智能时代的战略机遇,在算力时代争取长期胜利。 智能汽车解决方案业务同比增长474.4% 首次实现当年盈利 智能汽车解决方案业务是华为2024年年报中增长亮眼的数据之一,同比增长474.4%。孟晚舟表示:“智能汽车解决方案首次实现当年盈利。” 2024年,智能化助力新能源汽车持续快速发展,中国市场的新能源汽车渗透率单月最高值已达52%,以城区NCA为代表的高阶智能驾驶功能加速普及。 报告显示,2024年初,华为智能汽车解决方案发布了以智能驾驶为核心的乾崑品牌,向下技术扎到根,向上引领汽车智能化发展,把智能带入每一辆车。华为乾崑智能汽车解决方案业务已经进入高速增长期,2024年,智能部件发货量超过2300万件,同比增长了近7倍。 在智能驾驶方面,华为发布了乾崑智驾ADS3.0,在先进的端到端架构中增加了“本能安全网络”,增强系统安全性;首发“车位到车位”功能,实现全场景贯通;全向防碰撞系统CAS3.0,使主动安全再进阶;泊车代驾开启私人定制,让泊车实现跨代领先。截至2024年底, 华为乾崑智驾行驶总里程数超过14亿公里,智驾里程占比30%,年度城区智驾时长占总智驾时长的45%。单用户最长智驾里程数超过10万公里,年度智能泊车超过 1亿次。 根据报告,华为智能汽车解决方案业务将继续聚焦智能化增量部件的战略定位,利用华为ICT技术优势,在智能化业务的主赛道上持续创新、行业引领,提供极致体验的智能化解决方案。 终端重回增长快车道 报告显示,2024年,华为终端业务迈入全新十年。2024年旗舰手机时隔多年重回增长快车道,竞争力全面提升。 在手机领域,2024年上半年推出了HUAWEI Pocket 2、HUAWEI nova Flip、P系列品牌焕新升级的HUAWEI Pura 70系列;下半年带来HUAWEI Mate XT非凡大师、HUAWEI nova 13系列、HUAWEI Mate 70系列、HUAWEI Mate X6等,持续受到消费者的支持与喜爱。 在高端品牌方面,去年11月26日华为Mate品牌盛典正式推出了备受瞩目的全新旗舰HUAWEI Mate 70系列手机。同时,推出全球首款商用的三折叠屏手机HUAWEI Mate XT非凡大师,再一次改写行业历史。 报告显示,华为穿戴产品全球市场形成热卖,连续三个季度全球发货量第一,海外超过10个国家市场份额第一。多款创新产品深受全球消费者喜爱,其中HUAWEI WATCH GT 5 系列上市20天即突破200万发货量。截至2024年底,华为平板中国区市场份额连续4个季度第一,实现历史性的突破。 孟晚舟表示:“终端是我们围绕用户体验持续创新的尖刀产品,通过各类高水平终端的规模发货,推动中国电子工业的发展和崛起。 ” 近十年累计研发投入超12490亿元 报告显示,华为坚持每年将10%以上的销售收入投入研究与开发。2024年,研发费用支出为人民币1797亿元,约占全年收入的20.8%。近十年累计投入的研发费用超过人民币12490亿元。 截至2024年12月31日,研发员工约11.3万名,占总员工数量的54.1%。 在全面智能化时代,华为坚持“长期主义”投入。孟晚舟表示:“人工智能是人类社会的一次重大变革,是最大机会,也是长期机会。在大机会时代,华为拒绝机会主义,聚焦构筑产品核心竞争力,致力于把更好的产品和服务带给客户,不焦虑、不迷失、不冒进,不被短期泡沫驱动,扎扎实实打造根技术,精益求精走好每一步。” 报告表示,云与AI等创新技术快速发展,正在解决行业难题,促进生产力的提升,创造巨大的商业价值和社会价值。面向智能世界,华为云致力于成为行业AI先锋,做厚行业数字化和智能化的“黑土地”,加速AI重塑千行万业。 在中国市场,华为云深耕行业数字化,已累计服务超过800个政务云项目;服务中国六大银行、12家股份制商业银行、Top5保险机构等;已有95%的中国Top30车企、90%的Top50电商企业、90%的Top50游戏企业、 90%的中国互联网企业、80%的零售企业选择华为云。 在人工智能大模型方面,2024年,华为云发布盘古大模型5.0, 在全系列、多模态、强思维三大方面全新升级。盘古大模型5.0包含从十亿、百亿、千亿到万亿参数规格的模型,以适配不同的业务场景。 “人工智能的浪潮正呼啸而来,冲击不在于变化本身,而在于变化的速度。从ChatGPT、Sora突破,到AI引领诺贝尔奖,再到DeepSeek厚积薄发,人工智能技术和应用呈现出加速突破、应用驱动的新趋势。”孟晚舟认为,未来10年,AI算力的需求持续提升,将是系统对系统的巨大机会。最近1年~2年,是AI终端格局形成关键期,AI既 是终端的核心能力,也是体验的核心要素,随着模型推理能力在技术和成本上的快速进步,AI终端的渗透率会在较短时间内显著提升。 “AI终端、智能网联车、AI智能体将会带来海量的新联接,更高的上行带宽、更低的时延、更高水平的人机交互体验,一个又一个新奇而令人震撼的应用场景将会诞生。”孟晚舟说。
马斯克的DOGE再想奇招:数月内重写完美国社保系统6000万行COBOL代码?网友:这可不是发射火箭
整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 据外媒《连线》最新报道,马斯克领导的美国政府效率部(DOGE)当前正在展开新一轮的技术革新,其计划是升级美国社会保障局(SSA)的核心支付系统,将原本用 COBOL 编写的旧代码迁移到另一种更为现代的编程语言如 Java 上,并希望在几个月内完成。 这一消息引发了技术圈的热议。要知道,作为一门“上古”编程语言,COBOL 虽然并非不可替代,但是其在银行、保险、政府机构等大型业务系统中依然广泛使用。如今 DOGE 计划在短短几个月内完成迁移遗留代码,这也让众人好奇它究竟如何能完成?莫不是想要靠着 Grok 这样的 AI 大模型? 超 6000 万行代码,外媒:DOGE 计划几个月内迁移完成 众所周知,COBOL 诞生于 20 世纪 50 年代末,它的起源可以追溯到美国国防部主导的一个项目,旨在开发一种通用的、高度可读的编程语言,以用于政府和企业的数据处理任务。彼时,随着美国国防部和大型企业的推广,COBOL 迅速成为商业计算的标准语言之一。 时至今日,这门语言依然活跃在上述提及的多个应用中,甚至在本月它还闯进了 TIOBE TOP 20 之列,位居第 20 位。 《连线》报道称,截至 2016 年,SSA 的软件系统中包含超过 6000 万行 COBOL 代码,并且还有数百万行其他遗留编程语言编写的代码。 此外,SSA 软件的“核心逻辑”部分也是用 COBOL 编写的,这部分代码负责颁发社会保障号码、管理支付、计算受益人应获得的总金额等关键任务。 对于政府机构使用的系统及软件,其实鲜少会升级,以防影响日常业务处理,SSA 内部亦是如此。回看 SSA 代码库上一次重大迭代升级还要追溯到 20 世纪 80 年代,当时该机构引入了一个名为 MADAM 的数据库。该数据库不仅采用 COBOL 编写,还使用了汇编语言。 多年来,随着现代编程语言的崛起,COBOL 程序员日渐稀缺,且 COBOL 程序多为单体架构,难以适应云计算、微服务、API 等现代技术趋势,不少人也想过尽早替换掉 COBOL 这样的过时语言,然而,实际实施的难度极高,毕竟如今已有的 COBOL 系统运行数十年,代码庞大、文档缺失,原开发人员大多已退休,导致维护和升级极具挑战性。此外,不少 COBOL 应用依赖专有数据库。 一位曾在 SSA 首席信息官办公室工作的前高级技术专家表示,即便是对这些代码的微小调整,也可能引发系统级的连锁故障。 话虽如此,2017 年,SSA 还是做了一份 97 页的 PDF 文档(https://www.ssa.gov/open/materials/IT-Modernization-Plan.pdf),想要将内部系统进行现代 IT 升级改造,其中就提到过要将用数亿美元的资金来更换其核心系统,包括一些 COBOL 旧代码的改造。彼时该机构预测,这些系统的现代化大约需要五年时间。只不过,由于 2020 年“黑天鹅”事件的影响,该机构放弃了这项工作,转而专注于更多面向公众的项目。 可是随着 DOGE 对 SSA 调查的深入,他们也发现 COBOL 旧代码带来的遗留问题似乎到了不得不解决的时刻。 此前,我们曾报道过,DOGE 团队就掉入过 COBOL 代码的“坑”中。其中,马斯克自去年 11 月接手 DOGE 部门后,大刀阔斧地改革政府机构,目标是削减开支。而在一次检查中,DOGE 团队竟然发现社会保障系统里居然还有“150 岁”的人在领福利。马斯克调侃道:“你认识 150 岁的人吗?反正我没见过。如果他们真活着,早就该进吉尼斯世界纪录了。” 然而,技术专家很快指出,这可能并不是什么惊天骗局,而是 COBOL 这门“上古编程语言”惹的祸。不少技术人认为,早期 COBOL 版本在处理缺失的出生日期时,默认会填上 1875 年 5 月 20 日,并用这个日期作为计算基准。换句话说,如果某人的出生日期缺失,系统就会自动认定他“出生于 1875 年”,也就是“150 岁”。 由此被 DOGE 误以为“150 岁的人还在领取保障金”。而之所以会产生这场闹剧,很多人将其归咎于 DOGE 年轻的技术团队对 COBOL 语言不够了解导致。或许也是眼看着 COBOL 旧代码已经成了政府效率的绊脚石,DOGE 这才有了“急着换掉社保系统”的心思。 借助 AI 来完成? 据《连线》透露,DOGE 已经开始组建团队,该项目由埃隆·马斯克的亲信史蒂夫·戴维斯(Steve Davis)组织。他曾是 SpaceX 的早期员工,近期被《纽约时报》称其为 DOGE 的实际负责人。目前,据说至少有 10 名 DOGE 员工在 SSA 工作。 不过,具体的迁移计划何时启动还不清楚。据报道,SSA 最近给员工发了一份内部文件,列出了 5 月前的重点任务,但里面并没有提到这次迁移,而是更关注削减“非必要合同”,以及引入 AI 来优化行政和技术文档处理等。 有消息人士透露,DOGE 的首要任务是改进社保福利的在线身份验证系统。SSA 内部人士预计,一旦他们完成身份核查,并把分散的政府数据库整合起来,迁移项目就会正式启动。 事实上,项目启动倒也没什么,真正让人担心的是 DOGE 计划在几个月时间内完成项目迁移。 SSA 前技术专家指出,仅 DOGE 计划的 COBOL 重写项目的测试阶段就需要数年时间。而如果在几个月内完成整个迁移,DOGE 的开发人员可能会跳过关键的质量保证环节,从而增加技术风险。 也有技术专家警告说,即使在最理想的情况下,完成如此大规模的系统迁移也极具挑战。而现在匆忙推进,可能会导致超过 6500 万人的社保福利发放出现问题。 “一旦系统出错,不仅仅是有人收到的钱不对,更可怕的是,可能有人根本收不到款项,而我们甚至意识不到。”一位 SSA 技术专家说道。 《连线》报道称,知情人士透露,如果想在几个月内完成 COBOL 代码的迁移,DOGE 可能要依赖生成式 AI,把数百万行代码自动翻译成现代语言。一位 SSA 技术专家表示:“DOGE 的想法是,如果他们能在几个月内清理掉所有 COBOL 代码,那就说明他们是对的,而我们这些没敢‘乱搞’的人就是废物。” “SSA 的 IT 系统就像是用铁丝和胶带拼起来的。”一位曾在 SSA 首席信息官办公室工作的前技术专家告诉《连线》,“领导层得明白,他们面对的是一座‘纸牌屋’或者一局‘叠叠乐’。如果他们开始随便抽掉某些关键部分——而他们已经打算这么做了——整个系统可能会崩盘。” 重写 COBOL 代码难度如何,多位开发者现身说法 这样的担忧并非空穴来风,不少技术专家在听闻此消息后纷纷现身分享自己编写和维护 COBOL 代码的经历,其中 @Skytooeen 表示: 我曾在多年前担任项目经理,为我的雇主——一家财富 50 强公司——负责一个迁移项目,目标是摆脱我们的主机系统。当时的 COBOL 代码规模与这次的差不多。我可以告诉你,这绝对不可能在三个月内完成,不管有没有 AI。 从集中式系统迁移到分布式系统,会遇到各种问题和复杂情况,比如竞态条件(race conditions)、批处理与流处理的差异、完全不同的应用间通信方式等。而 COBOL 本身也是一门难搞的语言,里面有许多其他语言没有的“坑”。 最理想的情况是,他们在尝试折腾新系统的同时,仍然保持旧系统的正常运行。最糟糕的情况则是,他们在没有彻底测试新系统的情况下,就开始关闭旧系统的部分(甚至整个系统),然后直接“在生产环境中测试”。考虑到马斯克的风格,我实在不抱太大希望。 另一位开发者 walnut close 现身评论道: 我在企业平台迁移方面有 30 年的经验,既从系统供应商的角度参与过,也曾作为企业 IT 架构师和高管负责相关工作。我可以毫不夸张地说,从服务交付、一致性、安全性和业务连续性的角度来看,这次迁移注定会失败。 系统和编程语言的选择确实重要,但它们本身并不是决定成败的关键,甚至通常都不是最主要的因素。架构设计、项目管理、测试、范围和质量控制、过渡与上线规划……这些才是影响成败的核心。而现在这些家伙谈论的那些技术问题,远远没有这些因素重要。选错技术确实会毁掉一个项目,但光是选对技术,绝对无法保证项目成功。 还有——这一点我必须强调——即使他们在技术、架构和项目管理上做得滴水不漏,也不会因此减少欺诈和错误,除非他们真正理解欺诈和错误的来源,并在项目需求中明确设计出检测和纠正机制。COBOL 既不是欺诈的根源,也不会天然导致系统性错误。而 DOGE 至今没有拿出任何有说服力的欺诈证据,甚至连系统性错误的实际问题都几乎没找到,所以在这方面,他们注定也要失败。 这让我想起过去那些由大型咨询公司主导的企业级系统迁移灾难——只是这次的规模被无限放大了。唯一的区别是,这次涉及的金额高达数万亿美元,影响范围遍及整个国家,而负责这个项目的“专家”对他们要替换的系统几乎一无所知,这种错配的程度,比以往任何一次大型企业咨询灾难都要严重几个数量级。 不仅如此,开发者 Lemon640 此前在深入研究 COBOL 后尝试升级自家的旧项目,但现实却给了他当头一棒。他直言:“我遇到了难以逾越的障碍。” 以下是他列举的一些严重问题: 1. 真实 COBOL 代码的复杂性远超预期 Lemon640 称,自己最初接触的 COBOL 代码仅限于入门级教材中的“玩具”版本,而实际应用中的 COBOL 代码与任何标准(包括 1985/2002 版本)都存在巨大差异。这些差异并非源于对新标准的遵循或现代编程实践的引入,而是由于长期积累的各种自定义扩展。统一不同版本的 COBOL 代码到一个通用转换目标语言,几乎是不可能完成的任务,尤其是当关键字、语法结构(如 PICTURE 句法)被广泛修改,甚至引入了全新的关键字和数据类型时。 2. COBOL 生态系统鼓励通过修改语言本身来扩展功能 与现代编程语言主要依赖库或模块来扩展能力不同,COBOL 生态更倾向于直接修改语言,引入新的动词或 PICTURE 类型。这种做法导致在构建兼容的目标语言时,必须考虑如何处理大量的自定义扩展,而相比之下,现代语言通常通过库、函数和内置数据类型实现类似功能,以确保更好的可维护性。 3. 函数和子程序调用机制极其混乱 在 COBOL 中,变量是按值传递或按引用传递并非由函数定义决定,而是由调用位置决定。这意味着,一个接受 4 个参数的函数,实际上可能有 16 种不同的调用方式。 函数调用时没有类型检查,甚至连参数大小都不验证。这就好比 JavaScript 或 PHP 的弱类型机制,但实际上更类似于 FORTH——调用者只是将数据填充到一段原始内存中,而被调用的函数则随意解释这段内存内容。如果调用者和被调用者的理解不一致,程序就会崩溃。 默认情况下,局部变量是持久化的,除非手动使用 CLEAR 语句清除状态,这意味着所有函数默认都是有状态的,并且数据全局可见。 4. 程序的控制流设计极其落后 GOTO 仍然广泛存在,令人堪忧。 PERFORM THRU 语句的存在,使得程序逻辑混乱不堪。 ALTER 语句允许动态修改代码逻辑,导致代码的可维护性极差。 5. COBOL 语言的动词设计极为复杂 COBOL 的核心动词(如 UNSTRING)的行为可能根据使用方式的不同而发生变化,且返回结果会直接修改变量,而不是通过返回值的方式处理。 由于 COBOL 语言本身缺乏良好的函数调用机制,因此大量复杂功能被塞进了动词系统中,导致解析和转换难度陡增。 6. COBOL 的数据结构设计混乱 尽管 PICTURE 句法的基本设计勉强可以接受(尤其是对十进制数的支持),但字符串处理方式已完全过时。 由于 COBOL 早期是基于字符串存储所有数据的,其复合类型(Group 数据项)非常原始,远远无法与现代编程语言的结构体或对象系统相比。 正因此,Lemon640 认为,「这一切仍然是一个巨大的技术债务问题——COBOL 代码本身的问题只是表象,真正最大的技术债务,是那些深埋在 COBOL 代码中的业务逻辑和知识体系,它们仍然难以访问、难以理解、难以变更。」 最后,尽管不少人推荐 IBM 早前推出的 watsonx Code Assistant for Z,这一生成式 AI 工具能够将 COBOL 代码重构为 Java,以加速 COBOL 应用现代化,但它仍只是整体解决方案的一部分。 同时,也有人设想马斯克可能会对 AI 说:“Grok,我需要你非常努力,为我编写一个新的 SSA 系统。” 然而,现实是这样的任务远非几个月内能够完成,重写代码也绝非“发射火箭”那么快。 真正的现代化进程,仍依赖于技术积累、系统设计与长期优化的协同推进。 参考: https://www.reddit.com/r/programminghorror/comments/1jlwbyj/doge_moving_ssa_from_cobol_to_java/ https://www.reddit.com/r/cobol/comments/10kqonw/i_tried_upgrading_cobol_heres_what_happened/ https://www.wired.com/story/doge-rebuild-social-security-administration-cobol-benefits/ https://arstechnica.com/tech-policy/2025/03/what-could-possibly-go-wrong-doge-to-rapidly-rebuild-social-security-codebase/
字节AI再创业:独立组织、全链条的饱和出击
文丨王与桐 程曼祺 编辑丨程曼祺 黄俊杰 面对 AI,字节依然是那个字节:一旦看到有潜力的方向,就加倍、饱和、全面出击。 一个最新例子是:智能体应用 Manus 出圈前后,字节已有至少 5 个团队在开发不同智能体产品,其中有些是对内工具。Manus 是 3 月 6 日刚由创业公司 Monica 开始内测的智能体应用。 在中国所有大科技公司中,字节本是大语言模型起步最晚的一家。在 2022 年底 OpenAI ChatGPT 上线前,百度、华为、阿里、腾讯(按发布时间顺序)都已发布过大语言模型,字节却没有。 但在 2023 年年中决定靠自有团队做 AI 后,字节就加快了全链条、全应用方向的投入。 移动互联网时代,还是创业公司的字节不可能一开始就投入基础设施,移动互联网的链条也短于 AI 产业。这一次,字节在算力芯片层、云计算层(火山引擎)、模型研发层、应用层全链条均有投入。 字节两年来推出的 AI 产品也已涉及聊天机器人、AI 搜索、AI 浏览器、Agent 平台、AI 陪伴社交、AI 教育等大部分主流应用方向。其中主力产品豆包在 2024 年底成为中国日活最多的 AI 应用。 但在此刻,字节以大量资源堆出的阶段性成果被横空出世的 DeepSeek 遮掩了光芒。DeepSeek 以不到 200 人的本土化小技术团队拿出惊艳模型,这是汇聚大量聪明人,习惯大力出成果的字节套路的反面。 更大的威胁还有:中国另一家主业强大、资源丰富、有余裕腾手抓住 AI 机会的互联网大公司——腾讯,也终于等到了自己的 AI 拐点。 字节从没垄断过好想法,但一直试图垄断对好想法的商业化实现。过去大部分时候,它成功了。无论是信息推荐、短视频、免费小说还是短剧,字节都不是第一个做的公司,但它往往能凭更好的产品体验、更高的商业化效率后来居上,这背后是丰富的资源、庞大的人才团队和多年积累的产品能力。 当技术版本更迭,字节的统治力会否延续?这是中国 AI 市场的一大悬念。 字节原本领先,直到腾讯接了 DeepSeek 去年 11 月我们在一篇文章中说:“中国掌握极强产品能力和流量资源的不止字节。微信还没出手呢。” 现在手握微信的腾讯终于出手,以出其不意的方式:全面接入 DeepSeek。 这对字节产生了更实质的影响。3 月 19 日腾讯总裁刘炽平在业绩会上说,从 2 月到 3 月,元宝日活增长了 20 倍,排名中国 AI 应用第三。他没有说的前两名分别是 DeepSeek 和字节豆包。 仅用字节十分之一的时间和小得多的投放预算,腾讯的用户规模来到了豆包的约 1/5。 在不能靠奇袭快速提升的模型能力上,字节面临的竞争形势也在变化。 经过过去近两年的密集更新,字节的模型数量、迭代速度和表现都明显提升。今年 2 月的字节全员会上,字节模型研发团队 Seed 负责人之一朱文佳说:“目前来看,我们的模型肯定是第一梯队,可以对标国内外最好的模型。” 但也因为探索方向众多,字节错过了发起中国 ChatGPT 时刻的机会。 也是 2 月全员会上,字节 CEO 梁汝波说:在 AI 有进展后,其实内部 “稍微有些放松”,团队并没有觉得一定要第一批复现 o1(OpenAI 在去年 9 月发布的推理模型),当时认为 “早一个月、晚一个月,关系不大”。 后来,最早复现 o1 的 DeepSeek-R1 掀起了网络狂潮,也在中国全民范围普及了 AI,并给腾讯送去意外之喜。 在同样掌握超级应用的字节和腾讯之间,较量还有模型综合体验与产品增长间的协同效率。 从字节发布豆包 1.5 Pro 时的博客中可以看到,字节认为大规模用户反馈仍然重要,并已在围绕用户反馈到模型体验的链条建造一套高效的、数据驱动的优化机制,这是字节在移动互联网战场中积累的强项。 字节豆包 1.5 Pro 官网博客中对用户反馈与模型使用体验优化链条的描述。 而如今元宝激增的用户,也给腾讯提供了类似的练手机会,腾讯也可能以此次产品奇袭为契机,加快模型自研节奏。 过去两年,腾讯只更新了两次主模型,进入 2025 年,仅在 3 月,混元就更新了 3D 生成模型 Hunyuan 3D-2.0 和推理模型混元 T1。 去年年底,一位大模型创业公司的投资人曾感慨,他们的被投本有一个完美的创业故事,“如果没有字节。” 而最近这 2 个月的故事是,字节本展现出了大象也能跳舞的灵敏,如果没有腾讯借助 DeepSeek 的迅疾一跃。 这是一种来自不同物种、不同维度的冲击。 DeepSeek 开源且中立,没接受过任何大公司的投资,不在任何 “阵营”。更重要的是,它目前无意成为一个入口级应用,没有在爆火后快速扩容试图接住这泼天的流量,这才使腾讯能更无顾忌地果断接入 DeepSeek。由于开源,DeepSeek 甚至都没有从腾讯的接入中获得收入。 如果说,当年互联网对一些传统业务的打击是 “毁灭你,与你无关”。如今开源、暂不追求应用转化的 DeepSeek,则给所有投入 AI 的公司带来了一种全新体验:冲击你,与我无关。 独立的 AI 团队,不向任何业务部门汇报 在腾讯接入 DeepSeek 带来意外变化之前,字节经过 2023 年上半年的摸索,找到了自己投入 AI 大模型的姿态:建立独立的新组织,回归字节奉行的价值观 “始终创业”。 腾讯和阿里都投资了多家大模型创业公司,而字节没有投资任何大模型公司。在 2023 年 6 月前,字节本考虑投资阶跃星辰和 MiniMax,最终两个因素使字节高层下定决心不投资:一是当时 TikTok 在美国面临压力;二是字节高层认为,面对 AI 底层技术变革的大机会,字节应该自己做,也能自己做好。 明确自己做后,字节加快筹建了独立于原有组织架构的新 AI 组织 Flow 和 Seed,前者做 AI 产品,后者做大模型研发,改变了此前字节 AI 研发分散在多部门的情况。 到 2023 年底,Flow 和 Seed 已成为一个与抖音、TikTok、火山引擎等字节各大业务平级的组织。它不向任何既有部门汇报,而是一个创始人工程。 而腾讯和阿里都把大模型研发放在既有组织里,混元团队在 TEG(技术工程事业群),通义研发团队在阿里云。 独立的组织加创始人参与,使字节 AI 可以跳出字节原本的扩张节奏、薪酬结构和考核机制。 2022 年底,之前十年间快速扩张的字节一度放缓招人,如抖音电商业务负责人当时被告知,新一年各团队将不再大规模扩张,原则是 “走一个人再进一个。” 而 2023 年后,字节大举扩张 AI:据我们从公开渠道对 2000 多名字节、腾讯和阿里 AI 研究人才(包括离职者)的梳理,到 2024 年底,字节 AI 研究者中的超 40% 是近两年加入的新人,新增比例高于腾讯和阿里。 2023 年四季度开始,字节创始人张一鸣也再次回到创业初期,开始频繁约见 AI 研究者。一位投资人告诉我们,2023 年冬天,当他像往常那样循着 AI 论文去拜访作者时,惊讶地发现:不少人刚和张一鸣一对一聊过,其中还有尚未毕业的博士生。 字节管理层的招人成果包括 Google 视频生成项目 Video Poet 原负责人蒋路、阿里通义原负责人周畅、零一万物原预训练负责人黄文灏等。 据我们了解,这些研发人员被传达的字节 AI 目标是:探索智能边界和摸高 AGI,追求全球领先。 Seed 作为字节模型研发的核心,也陆续整合了部分字节已有的 AI 团队。 字节在 2016 年就成立了 AI 研发组织 AI Lab,此前更多为字节的应用服务。在 2023 年前,AI Lab 下的 NLP(自然语言处理)组约有 100 人,其中只有一个 10 人小团队在研究大语言模型,其它人主要做翻译和抖音小安(内置于抖音的安全助手,有预防网曝、网络诈骗的功能)的优化。 2023 年后,AI Lab NLP 组的重心转向大语言模型,到同年下半年,该组被转入 Seed;2024 年,开发视频生成模型的 AI Lab PixleDance 组也被转入 Seed。之前向字节技术副总裁杨震原汇报的 AI Lab 负责人李航在 2023 年开始向 Seed 负责人朱文佳汇报。 字节也重启收购雷达,这是字节的招人手段之一。自 2023 年以来,字节至少已收购了智能耳机品牌 Oladance、某存算一体计算硬件公司,也曾与做出 Agent 产品 Manus 的 Monica 和某 AI 视觉公司洽谈过收购。 在薪酬、职级和考核方式上,字节给 AI 研发团队的条件超出既有体系。 在面向应届博士的 Top Seed 招募计划中,字节会给优秀候选人 3-1 职级(字节职级共有 1-5 5 个大层级,每层再分两小层,数字越大职级越高),薪资不低于百万元。 今年 1 月,字节启动以探索 AI 技术边界为目标的 Seed Edge 前沿研究计划,该计划设定了更宽松的考核机制:字节本来每半年考核一次绩效,而 Seed Edge 则在项目取得突破进展后,再做最终评估。 甚至是在惯常以 “ROI (投入产出比)定生死” 的产品项目上,字节现在面对 AI 也网开一面。过去,字节立新项目时会由商业分析团队论证收益预期,未来市场空间,字节管理层会要求算清每个产品的人力投入成本,如果跑一段时间后,新项目不达预期,业务层会发出调整指令,关停或撤换产品负责人。 在考察 AI 项目上,ROI 依然重要,但周期更长了——一位字节 AI 产品团队人士告诉我们,字节现在会以 AI 产品一定周期后的单用户价值作为考核系数,以测算未来收益,不同产品的考核周期不同,长的甚至可以到 5 年;但字节也没对这种考核方式做强制要求。 这激发了部分成员的强烈自驱。有 TopSeed 实习生在知乎分享,在开发某个项目的近两个月里,他几乎睡在公司,经常凌晨两点带着新想法兴奋惊醒,写两小时代码,5 点再睡。最投入时,他和带他的 mentor 会持续讨论到深夜,“谁也不想离开公司,感觉每一刻都在不断的发现新现象”。 某种意义上,Flow 与 Seed 等组成的字节 AI 部门更像一个独立的新公司,字节创始人也再次像创业者那样投入了大部分精力。 据了解,2024 年下半年开始,字节高层每月会来北京一次,召集字节 AI 核心决策层和当前重点项目团队成员复盘进展、讨论方向。 张一鸣也会自己看论文、自己学技术,字节有专门的研究团队协助他理解前沿技术,辅导者之一是新加坡国立大学原教授、字节研究员冯佳时。 当一家公司已有 12 万人,又想抓住一个性质可能极为不同的新机会时,成立一个独立新组织也许是更好的选择。新组织更能对抗过往的惯性。 三大目标和排兵布阵 春节过后,AI 市场环境大变。一位字节 AI 人士形容他们岁末年初的状态:刚要鼓掌,双手停在了半空。 字节目前的应对方法是继续全面出击。它们定下了多重目标,汇集了字节原本的主要高管,也引进了重磅人才。 据 2 月全员会,2025 年字节 AI 的 3 大目标是:探索智能上限、探索新的 UI 交互形式,以及加强规模效应。承接这些目标的是由 Flow Seed 和 Stone 三大板块组成的字节 AI 新组织,总规模近 2500 人;字节的中台部门也在支持 AI 业务。 做模型研发的 Seed 目前由朱文佳和今年 2 月正式加入字节的吴永辉共同负责,该板块负责 “探索智能上限”,尤其是吴永辉带队的大模型研发环节。 吴永辉是继 2022 年加入的 CFO 高准之后,最新一位直接空降到 CEO-1 级别的高管。相比 2015 年加入,历任 TikTok 产品技术负责人,也主管字节 AI 搜索的朱文佳,吴永辉的研发经历更聚焦 AI。 他在 2008 年获加州大学河滨分校博士学位后就进入 Google,17 年间主导了神经机器翻译(GNMT)、RankBrainn 等项目,论文引用次数超 4 万次。2023 年,吴永辉成为 “Google Fellow”,这是 Google 授予技术领域作出突出贡献专家的最高荣誉。 吴永辉之下,Seed 的模型研发主要有 4 个方向,分别是:大语言模型,视觉模型,语音模型,多模态 & 世界模型。字节 AI Lab 负责人李航也从向朱文佳汇报转为向吴永辉汇报。 据《AI 科技评论》,吴永辉近期调整了 Seed 架构,新设立不在正式组织结构中的若干虚拟小组,更扁平的汇报体系正在形成,一些原本汇报关系为吴永辉 -2 的人,目前也直接向吴永辉汇报。如据我们了解,字节 AI for Science 负责人、此前汇报给李航的顾全全现在也虚线汇报给吴永辉。 一位接触多位字节技术人员的投资人的观察是,在核心研发环节,字节正在用吴永辉这样的 “AI-native(AI 原生)” 技术人才替换之前从搜推广部门调来的人员。 今年 1 月启动的 Seed Edge 目前的主要技术负责人,也是 2024 年加入的字节新人。这个研究计划是 Seed 之中更关注智能上限前沿探索的部分,瞄准那些短期看不到明显收益,但有可能引领长期 AI 发展的研究,如下一代模型设计、下一代学习范式、下一个 Scaling 方向等。 在吴永辉加入后,朱文佳的重心调整为研发与体验更相关的模型应用能力,如问答、创作、解题、代码和 AI 使用工具的能力等。 这些能力是不同 AI 应用需要的共通模块。相当于一层连接模型和应用的 “能力中台”。字节过去也这么做过:2013 年,字节成立第二年就开始分设算法、工程等中台,封装通用技术和功能供一线产品团队取用。这是后来字节能在短视频等机会节点,快速搭建多个产品的基础。 做 AI 产品的 Flow 和做产品后端研发支持的 Stone 则主要与 3 大目标中的另外两个相关:探索新的 UI 交互方式,和加强规模效应。 新交互方式包括新硬件终端和推进与手机厂商的合作。比如去年 10 月,字节以收购的 Oladance 团队为基础,推出了智能耳机 Ola Friend,字节也正在研发 AI 眼镜。 加强规模效应的重点则是字节 AI 主力产品豆包。豆包最早由 Flow 总负责人朱骏于 2023 年 3 月带队开发,当时代号为 Grace。作为字节立项最早的新 AI 产品,豆包相关进展一直是朱骏 OKR 里的第一条。 豆包之外,字节的 AI 探索几乎涵盖当前 AI 产品的各个方向:有智能角色互动产品猫箱、图片生成产品星绘、AI 数学教育出海产品 Gauthmath、面向小初高学生的 AI 教育产品豆包爱学(此前叫河马爱学)。 与开发者直接相关的产品,如 Agent 平台 Coze 和今年 1 月刚上线的字节 AI coding 产品 Trae,则归属到了去年下半年从 Flow 中独立的产品研发团队 Stone 之下。Stone 负责人是字节工程技术负责人洪定坤。 基于文生图/视频的内容分享平台即梦是字节另一个重要的 AI 产品出口,它不属于 Flow,而由负责剪映的张楠主管。据了解,相比剪映,张楠其实花了更多精力在即梦上。 在这些 AI 新应用上,字节延续了过去的习惯:启用有丰富经验的连续创业者和在字节打过胜仗的产品负责人,汇集了字节的多位 “功臣”。 如 Flow 总负责人朱骏曾是短视频产品 Musical.ly 的创始人之一,后任 TikTok 产品负责人。即梦负责人张楠曾是图片社区产品图吧的创始人,2016 年,曾从 0 到 1 推出抖音、火山等产品,后担任抖音 CEO。负责豆包桌面版的齐俊元曾创立任务管理工具 Teambition。负责 AI 耳机和眼镜和手机厂商合作的 Kayden 为人熟知的身份是 36 氪创始人,其实他也有平板等硬件创业经验。朱骏的 -2 中也不乏有创业经历的人。 在豆包这个主力产品上,字节寄托了更多战略目标:加强 AI 产品的规模效应和打造大规模用户反馈到模型实际使用体验提升的优化闭环。 目前豆包已从最初的聊天机器人发展为结合了聊天对话、搜索、图片生成和 AI 浏览器的综合应用。字节对豆包的规模目标很激进:在去年第三季度,豆包的 DAU 的增长目标是 30%,四季度这个数字变成了 150%;我们了解到,今年豆包的 DAU 目标是超过 5000 万。 而在其它产品探索方向上,字节呈现了模型的归模型,产品的归产品的状态。多个字节 AI 产品并不排斥使用其他公司开发的模型,以追求更好的体验和增长。 即梦、Coze、Trae、剪映都已接入 DeepSeek。Coze 在 2024 年初上线后不久,就在海外版中给开发者提供 GPT-4 模型。Trae 也在近期使用了目前编程能力最强的 Claude 3.7 模型,原版模型要付费,而 Trae 则免费给大家用 Calude 3.7,这是一个强力拉新手段,一度导致大量用户排队。 配合强大的人才阵容,字节全集团也给 AI 板块调集了创业公司难以企及的资源。它可以让抖音为我所用:从去年 4 月开始,其它 AI 产品不再被允许在抖音等字节体系里投放广告。 它有丰富的算力储备。2023 年时,字节的储备的 GPU 已超过 10 万张;仅在 2023 年上半年,字节就向英伟达订购超过 10 亿美元的 GPU。外媒报道,2025 年字节的 AI 算力采购预算至少有 900 亿元人民币。 我们也了解到,字节现在会优先将高端 GPU 供大模型团队使用,而在相对稳定但对业务很重要的推荐系统中,则更多使用一些国产 AI 芯片或 GPU。 字节内部也出现了一些因为团队、资源和方向太多而带来的摩擦和流程迟滞。 “这里有能力的人太多了,每个人都有自己的想法,想法光是达成共识就要一段时间,产品进化就会慢。” 一位字节 AI 产品的人士说。 一位字节模型侧人士说,因为要对接不同产品团队,所以经常同一段话,一天内要给几个不同团队各说一遍。 最近高层和汇报线的调整也让一些员工感到不安,难以静心。更容易做的成果已探索得差不多了,再想要进展,就需要更大投入。这导致,在总资源很多的情况下,一些研发人员的体感是卡不够用,部分团队需要排队等,“各凭本事”。 不管是外部竞争的快速变化,还是大公司做新业务时难以避免的组织张力,都不太会影响字节对 AI 的态度。字节做 AI 的方法和字节做其他新业务也没有太大区别:依然是从人才到基建的饱和式投入,穷尽所有业务方向,不放过任何可能性。 一些人怀疑这件事的持续性。在 AR、教育和游戏上,字节也曾密集投入,铩羽而归。但不用怀疑的是,AI 的带来的变革绝非 AR 或游戏可以相比,长期看,它创造的价值将超越移动互联网。 当一个用过去 13 年,成长为中国最大互联网公司的组织又遇到一局上限足够高的新游戏,他们不可能放过这个机会。 题图来源:《爆裂鼓手》 - FIN -
北师大:训练出“AI太炎”古汉语大语言模型,能够高质量完成古典文献释读
3月31日,教育部举行新闻发布会介绍深入贯彻落实《教育强国建设规划纲要(2024—2035年)》,推进语言文字信息化发展情况。 会上,北京师范大学党委常委、副校长康震介绍,当前,世界范围内的人工智能技术创新态势和竞争格局加速形成,正在深刻地影响教育的深层次变革。北京师范大学积极探索大语言模型赋能教育教学的关键举措和有效做法,助力教育强国建设。 ▲北京师范大学党委常委、副校长康震 第一,全方位建设关键领域语料库。推动中国特色大语言模型建设离不开大规模高质量的中文语料数据库、数据集。北京师范大学长期致力于数字化赋能关键学科领域研究,建设了通用汉字全息数据库、历代碑刻与手写文字属性资源库、甲骨文拓片资源库等专业数字资源库。研发了中华大字符集、甲骨文小篆字库与国际编码,创建了汉字全息资源应用系统、数字化《说文解字》研究与应用平台、历代碑刻与手写文字数字典藏系统等大型的数字化平台,形成了具有创新性、专业性、权威性特点的语言文字学研究新格局。 第二,全流程自主研发大语言模型。为积极应对以大语言模型为代表的人工智能技术对教育变革带来的新机遇、新挑战,北京师范大学依托文学院、国际中文教育学院、人工智能学院建设的系列大语言模型,取得突出成效。中国文字整理与规范研究中心发挥古籍整理智能化关键技术优势,针对古汉语信息处理任务“低资源”“富知识”的特点,以解决领域知识学习需求为核心任务,使用1.8B(18亿)参数量,训练出理解力强、准确率高、应用场景丰富的“AI太炎”古汉语大语言模型。 据悉,该模型坚持自主可控和安全可信的技术路线,在确保语料来源安全、语料内容安全、语料标注安全、模型安全等基础上,能够高质量完成古典文献释读,支持字词释义、文白翻译、句读标点、用典分析等多种具有挑战性的文言文理解任务。该大语言模型处于同领域国际领先地位,受到学界、产业界的好评。截至目前,该模型已广泛应用于海内外的学术科研、基础教育、编辑出版等多个领域,辅助古籍整理、语言研究、语文教育、辞书编纂等应用场景任务。 第三,全融入打造智慧教育新生态。北京师范大学深入推进教育数字化战略,强化科技教育和人文教育协同。一是构建“五方协同、四维融合”的体系,着力打造数智化赋能教育教学新生态。二是探索数智化赋能教育教学新模式。学校“创新‘AI+’课堂教学智能评测”案例入选首批“人工智能+高等教育”应用场景典型案例。三是深化自主开发平台应用。今年新学期,北京师范大学基于本地化部署DeepSeek-R1模型,利用培养方案、教学手册、教学大纲等语料,为本硕博学生共计9958门课程自主研发情景化的智能助教平台。 康震介绍,下一步,北京师范大学将持续推动学科交叉融合和协同创新,强化有组织科研,加快培养复合型人才,推进国家关键领域语料库和智能化关键技术研发,探索大语言模型创新应用新范式。 红星新闻首席记者 吴阳 编辑 杨珒 责编 官莉 (下载红星新闻,报料有奖!)
实测有沉思能力的智谱AutoGLM,我们离会思考的agent又近了一步
如果有一个会思考但是不会做事的 AI 还有会做事但是不会思考的 AI。 你会选哪个? 如果让我来选,我会说:why not both? 今天在中关村论坛智谱 Open Day 上,智谱发布了 AutoGLM 沉思——首个带有沉思能力的桌面端 agent。 这是第一个存在于电脑桌面的,能先思考在做事,且做的过程中不断思考的 agent。 抛给它一个问题,它会逐步分解问题,然后在你面前(或者你不看着它也行)打开一个又一个浏览器标签页,自己上去搜索、查找、记录、汇总、分析信息,最终为你生成一份经过充分查证和深度思考的结果报告。 如果你还不知道这是个什么东西,简单前情提要一下: AutoGLM 是智谱推出的 Agent 产品,能够实现对手机屏幕和电脑浏览器的操作。重点在于实现方式是前台的图形界面 (GUI),而不是后台的应用接口 (API)。你可以理解为 AutoGLM 学习人类通过「手眼并用」的方式,直接在用户界面上进行操作。这和市面上绝大多数基于 API 的 agent 产品有着明显的交互方式区别。 而沉思能力,正如字面意思,让 AI 可以一边想、一边搜,自主解决开放式的、训练语料不包含的问题,模仿深度思考和展现深度研究的能力。智谱在今年 3 月初拿到新一轮融资的时候就对外预告正在研发沉思,而这个功能的开关也已经在该公司开发的「智谱清言」(ChatGLM) 大模型产品里上线了。 而在 AutoGLM 沉思的身上,智谱独特的 GUI agent 功能,和人们最追捧和爱用的沉思能力,终于实现了融合。 AutoGLM 沉思背后的模型基座,也在本次 Open Day 上正式发布: GLM-4-Air-0414 基座模型,具有 320 亿参数量,但性能足以对标 DeepSeek-V3、R1 (670B)、Qwen 2.5-Max 等更大参数量的模型。 但因为参数量更少,GLM-4-Air0414 可以快速执行 agent 类工作,为 agent 的能力提升以及大规模落地应用提供基础,也一定程度上确保了终端用户的试用体验。 智谱还发布了 GLM-Z1-Air 推理模型,相比 DeepSeek-R1(激活 37B)推理速度提升了 8 倍,而成本降低到只有后者的三十分之一。 这也是一个可以在消费级显卡上运行的推理模型,能够显著提高开发者的使用体验。 智谱还基于 GLM-Z1 模型,使用自进化强化学习方式,训练了一个新的沉思模型 GLM-Z1-Rumination,能够实时联网搜索、动态调用工具,深度分析和自我验证。这个沉思模型能够自主理解用户需求,在复杂任务中不断优化推理、反复验证与修正假设,使研究成果更具可靠性与实用性。 也就是说:AutoGLM 沉思的基础模型架构是这样的: 中层推理和沉思模型 GLM-Z1-Air、GLM-Z1-Rumination + 底层语言模型 GLM-4-Air-0414 加上工程/产品层的 AutoGLM 工具,就行程了 AutoGLM 沉思的整个技术栈。 智谱也计划在 4 月 14 日全面正式开源 AutoGLM 沉思背后的所有模型。 此前智谱曾分享过团队对于 AGI 路线图的判断:如果用自动驾驶层级打比方的话,目前大模型产品大体上获得了自我学习的能力,接近于 L3;而沉思、反思、自我批评等能力则是 L4 阶段。 需要注意的是,目前 AutoGLM 沉思还处于 beta 测试阶段。上个周末,APPSO 深度使用了这个产品。从测试结果来看,它在处理复杂工作上的效果确有提高的空间,底层逻辑也需要优化,但作为一个非常新颖的大模型-agent 产品,总体效果已经令人惊艳。 智谱已经踏入了大模型 agent 的 L4 阶段,虽然只是进来了半只脚。 目前 AutoGLM 的沉思功能,目前已经正式上线智谱清言网页端、PC端和手机 App,免费、不限量地开放。 附上体验 https://autoglm-research.zhipuai.cn/?channel=chatglm#get_started 当 Agent 有了沉思能力,AI 终于学会自己干活了? 去年 Anthropic 发布了「Computer Use」,同时展现了足够的模型能力以及较强的设备交互能力,让 agent(智能体)的设想终于首次得到实践。今年 1 月,Anthropic 在美国的最大对手 OpenAI 也通过新产品 Operator,做出对于 GUI agent 理念的演绎。 也是在去年 10 月,智谱和 Anthropic 几乎同时发布了各自在 agent 方向上的最新尝试。智谱的 AutoGLM 是第一家国内机构推出的基于 GUI 的 agent 产品。 而今天的 AutoGLM 沉思,不仅将 agent 的执行任务能力带到了桌面端,更是把工具操作能力、深度研究能力、推理能力和大预言能力进行了首次融合。 这种多重能力驱动的 agent,非常适合信息检索、提炼、汇总型任务。 这就好比是让 agent「开车」,过去你得给他一辆车,教他方向盘、油门刹车、档位怎么用,甚至告诉它开车和倒车的时候分别要往哪看——而现在,agent 已经可以「自动驾驶」了。 让它制作一份「不同于网上所有主流路线的日本两周小众经典行攻略,要求绝对不去最火的目的地,要小众景点,但也要评价比较好的。」 AutoGLM 沉思比较准确地拆解了需求,思考逻辑也比较清楚:它首先去搜了最简单的关键词「日本旅游」,了解主流路线和景点,然后又去搜索了「日本小众旅游景点」之类的关键词——通过这几个步骤,它在本次对话的记忆内部构建了一个知识库,也即什么是主流的,什么是小众的。 这个任务总共做了 20 多次思考。有时候几次思考之间会有重复,比如搜索的是相同的关键词,访问了相同或者相似的链接等。这有可能是因为单次搜索到的信息不足够,毕竟沉思/深度搜索的本质其实也是不断地自我怀疑和推翻,直到达到足够置信度时候才进入下一步。 APPSO 还注意到它有点过度依赖特定的网站作为信息来源,打开的所有 tab 里有 90% 都是小红书和知乎(各一半左右)。反而真正的旅行专业资料库,比如马蜂窝、穷游,或者哪怕是 OTA 平台,它一次没用过。 如果要做一份真正的小众攻略,重度依赖小红书的结果可能并不理想。毕竟能上小红书的热门笔记,这个景点应该并不真的小众。一个真正的小众景点旅行者,恐怕不想去 momo 们已经去过或者都想去的地方…… APPSO 注意到,AutoGLM 沉思在沉思过后自己提出了「路线规划合理,不要有无意义的反折」、「行程节奏合理,别太特种兵」之类的要求。 只是实际结果没有反映它自己提出的这些要求:比如头几天在濑户内海来回折返,有时候一天内去两三个相隔一小时以上的地点,略微特种兵;第二周从青森向南到仙台,然后又从仙台飞机向北大跨度飞到了北海道,并且北海道只留了两天。考虑到日本大跨度旅行基本都靠 JR,票价昂贵,合理的路线应该是顺着一个方向不回头,除非不得不去大城市换车,一般不应该折返。 但总体来讲,这份攻略是有效的:它呈现了一些提问者未曾考虑过的目的地,也试图在一次行程里去到季节、气候、风格完全不一样的地方(而不是围在大东京、富士山、京坂奈区域来回打转)。 从这个角度,它遵循了提示的要求,并且展现出了深度思考的结果。 就像你不应该直接把 AI 生成的结果直接拿去用一样,这份攻略提供了一个还算不错的基础,让旅行者可以自行优化具体的目的地、路线和中间的交通方式。旅行不只是上车睡觉下车拍照,还应该兼顾人文和自然,深入当地文化传统,探索自然景观,以及至少感受一把在地最有特色的体验项目。 只要你的期待不是即问即用,AutoGLM 沉思给出的答案是足够令人满意的。 点击查看智谱清言的回答 https://chatglm.cn/share/FQoLp 考虑到 AutoGLM 沉思与其它深度思考型大模型最大的特别之处在于浏览器的操控能力,APPSO 也更深入和严苛地测试了一下他的 browser use 能力。 让它做一份关于科创板云计算公司的研报,看看结果怎么样。 正如前一次做旅行攻略一样,AutoGLM 沉思的「思考过程」是没有任何问题的。从下图中可以看到,它: 准确拆解了筛选条件, 明确需要多轮搜索和迭代, 制定了分步骤的计划, 通过「一般搜索」找到了大概的搜索目标 开始执行分步操作 但是 browser use 的过程实在让人有点抓头:AutoGLM 工具一次又一次地试图打开证监会指定的信息披露网站(巨潮资讯),解析网页的信息。它顺利地找到了网站数据库的条件筛选工具,但总是无法正常筛选,要么选不好时间区间,要么找不到对应板块的下拉菜单在哪。 APPSO 观察到,AutoGLM 沉思给每一步骤的定时通常是 3 分 20 秒左右,但如果访问网站不顺利,就会因为操作超时而导致「本轮思考」失败。 另外,根据 APPSO 之前体验去年的 AutoGLM 以及其它 GUI agent 产品时,当需要用户进行登录操作、输入付款信息、点击发送按钮这种敏感性操作的经验,agent 可以停下来等待用户操作。而在使用 AutoGLM 沉思的过程中,它的确可以等候用户登录,但遇到「用不明白网站」的情况,并没有呼唤用户接管,而是只会傻傻地等着。 在本次任务中,连续两轮思考失败之后,AutoGLM 沉思开始进入一个重新思考-跟之前导致失败的思考结果一样-再重新思考的循环过程,一直循环往复了五六次,最后败下阵来,把目标转向了知乎。步骤进行到这里的时候,其实已经算任务失败了,因为输入的原始指令是查找和汇总上市公司资料和公告,数据的专业准确性很重要,而知乎并不是一个可靠的上市公司信息披露平台。 经过了好几次艰难的测试,最后终于吐出了结果:华为、紫光、UCloud 三家公司,虽然都跟边缘计算有关,但三家的股票代码都写错了,更别提有两家并没上科创板。 Agent 「自动驾驶」能力,和路况、驾驶位有很大关系 在其它更「轻松」的任务(比如做旅行规划、游戏攻略、查找简单信息等)当中,AutoGLM 工具的 browser use 能力是没有太大问题的。 但 APPSO 发现,一旦当前网站的视觉设计相对复杂,或者设计的有一些陷阱,AutoGLM 工具就很容易被「使绊子」。 一个最直接的例子就是电商网站。APPSO 给出明确提示,「去淘宝或京东购买一件重磅日系 T 恤」,AutoGLM 沉思制定了宏伟的计划和明确的分工——然而却连淘宝首页的山门都进不去,甚至找不到搜索框在哪里。而且它似乎被「找不到搜索框」这件事完全阻挡住了,甚至也没有去看网页的其它位置——如果它看了的话,肯定会发现相关商品早就出现在首页推荐里了。 对于这个测试中发现的意外情况,智谱 CEO 张鹏表示,「点背不能赖社会」,AutoGLM 沉思目前仍在 beta 阶段,还有很大的进化空间,而且目前的升级速度也很快(APPSO 在正式发布版上测试淘宝的使用效果已经没那么磕绊了)。 张鹏指出,在模型作为服务或作为产品 (MaaS) 的理念下,模型产品自己的能力要像木桶一样,高且全面。或许现在 AutoGLM 工具的视觉能力还不如人,处理意外情况的能力还不够,归根结底可能是泛化能力还不够,但这些能力的提升并不是模型问题,而是纯粹的工程层面——不需要担心。 从模型底座层面,AutoGLM 沉思也有提升的空间。 经常用大语言模型产品的朋友都知道,提示写的越具体,规则和边界设定的越明确,它的效果越好,越有希望生成符合用户提示的结果。基于大语言模型的 agent 也是一样。 但是提示不能无限扩展,就好比你招了一个秘书帮你干活,但你不应该总是每次都把「找谁」、「什么地点」、「什么时候」、「去哪」等一切的信息都讲清楚,ta 才能勉强顺利地帮你搞定一个饭局的准备工作。 大语言模型很强大,但也有它糟糕的地方:只受到文本规则的约束,缺乏真正的实际问题的规划能力,任务过程中容易被卡住;缺乏足够长的上下文记忆空间,任务持续时间太长就持续不下去;上一个步骤的错误会随着步骤逐渐放大,直至失败。 AutoGLM 沉思也是一个基于大语言模型的 agent,即便在 agent 能力上做了很多工作,但仍然难免受到大语言模型的诅咒。思考能力越强,越容易想多、想歪。 从 APPSO 的试用过程中可以看到,除了一些绝对基础的概念(比如「旅游」、「T 恤」、「公司」)之外,它并没有稍微复杂的上层知识。用户每次发出任何指令,它都要先自己打开浏览器,上网学习一遍,明确用户的所指,在本次对话的有限记忆空间内建立一个知识库,然后再去进行后续的步骤。 而就它目前最擅长和依赖的那几个信息来源来看,一旦用户任务的复杂性、专业性「上了强度」,想要它在用户可接受的时间(目前官方定的是每任务总共 15 分钟左右)内,查到真实、准确和有价值的信息,就真的有点勉强了,更别提给到用户有效的结果(APPSO 的测试中有一半无法输出完整的结果)。 不过这并不是个太大的问题。 有这样一个很实际的观点,可以套用到 AutoGLM 沉思上: 今天的 agent 水平,将它视为「主驾驶」可能能力尚有不足。但它仍然是一个很好的副驾驶 (copilot)。 在 AutoGLM 沉思上,我们看到了足够的思考能力,也看到了优秀(但确实受制于客观因素)的 browser use 能力。很显然,智谱作为中国目前非巨头公司当中,少数模型能力最强的选手之一,肯定会在这两个能力上面继续进步,而且会很快。 自从 APPSO 拿到测试资格,到 AutoGLM 沉思正式发布,中间已经更新了数个版本,在模型基座和浏览器操控能力上面都有了改进。 但如果我们想要的是一个真正会思考且能办事的 agent,我们恐怕需要比现有范式的大语言模型更强大的智能体基座。 而智谱推出的「语言+推理+沉思+行动」的 Agent 框架,尽管产品层面仍然笨拙,但看起来是一个非常明确可行的方向。 诚然,国产大模型和基于大模型的 agent 产品,现阶段的目标如果放在「追赶硅谷对手」上可能反而更实际一点。AutoGLM 沉思从操作逻辑和实现目的上,都是明显区别于目前国内所有同类和近似产品的「新物种」,和 Anthropic、OpenAI 也正在拉近距离。 对于这样一家非巨头、脱胎于中国顶级学府的大模型创新领导者来说,大多数的不足都可以被容忍,而看到它在做的事情的独创性和领导性,才更重要。
百度文小言升级:支持多模型调度、全新语音大模型、图片问答
3月31日,文小言宣布完成功能升级,支持多模型融合调度,升级全新语音大模型、图片问答、AI生图生视频等多项能力。 文小言此次升级的核心亮点在于“多模型融合调度”。通过整合百度自研的文心X1、文心4.5等顶尖模型,并接入DeepSeek-R1、可灵等第三方优质模型,文小言实现了多模型间的智能协同。用户只需选择“自动模式”,即可一键调用最优模型组合,或根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。 以“设计三种风格的南偏东客厅效果图”为例,文小言能够精准解析装修风格差异,调用文心X1完成深度推理,生成三幅风格迥异但视角一致的装修效果图;随手拍摄一张茅台镇的照片,文小言就可以调用文心4.5的多模态分析能力,精准识别出地理位置、当地产业、建筑风格等详细信息。 全新语音大模型支持方言对话、复杂知识问答及随时打断等场景,用户可进行语音知识问答或趣味角色扮演。百度语音首席架构师贾磊透露,该模型是百度在业界首个推出、基于全新互相关注意力的端到端语音语言大模型。在语音场景满足一定交互指标下,大模型调用成本比行业平均降低50%-90%。 图片问答功能让用户可以通过拍摄或上传图片,以文字或语音提问直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI可自动解析风格并生成同款手机壳、支架等周边产品。 值得一提的是,新增的“图个冷知识”功能更富趣味性,用户可预设“历史学者”“科技达人”等人设视角,为同一图片赋予多维解读。例如,当用户询问“猫窗探秘,为何猫爱窗边的科学真相?",文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。 文/北京青年报记者 温婧 编辑/樊宏伟
扫兴的朱啸虎和愤怒的机器人,谁错了?
朱啸虎最新的回应似乎不执着给机器人泼冷水了。 3月30日,朱啸虎现身2025上海交通大学校友投资年会时,再次表示“很多创新都会经过一个周期,泡沫——死亡——起死回生,今天的具身智能热度太高了。”相比此前的退出言论,朱啸虎的态度多少有了些软化,提出具身智能肯定要经历泡沫期,未来也一定会出现DeepSeek时刻。 此前,问出“谁会花十几万买一个机器人去干这些活?”的朱啸虎,相继迎来了一批机器人创业者和相关投资者的回应。 3月28日,在投中网发布的专访文章中,朱啸虎不仅声称近期在退出一些具身智能项目,并对机器人企业的商业化路径进行了“灵魂发问”,并称机器人赛道“现在共识高度集中,估值上涨得非常快,这种变成了我们早期VC想回避的赛道。” 朱啸虎的“扫兴”发言被同样投资机器人的经纬创投合伙人张颖公然反对,称“朱老板别闹。机器人领域蓬勃发展,大赛道,百花齐放,过程中有点泡沫也非常正常。时间拉长,人形机器人赛道一定能出大公司。” 3月29日,星海图(具身智能创企)发出澄清公告,称金沙江创投于2023年11月参与了星海图天使轮融资,于2024年5月提出股权投资退出的诉求。星海图积极配合,并在2024年9月协助顺利完成股权投资退出。 实际上,朱啸虎的AI投资策略引起纠纷已经不是第一次了,在大模型赛道,朱啸虎也曾经发表过颇具其个人风格的“反共识”发言。而原因几乎是同样的,在朱啸虎强调“一直不看好大模型”时,找不到应用场景,看不到商业化的可能性,都是烧钱怪兽等关键词,查重率几乎100%。 不过,从整个机器人产业来说,朱啸虎说的并非耸人听闻。据字母榜(ID:wujicaijing)了解,除了宇树、智元融到了C轮、B轮,这波趁着具身智能概念创业的机器人公司中,大多都困在了A轮,或者Pre A轮。云岫资本CEO高超也指出,(具身智能)这一波的爆火是好事,会吸引更多资本和创业者进入,但也要理性看待,“人形机器人现在还没有PMF(产品市场匹配)”。 更严峻的是,第一批趁热度而上的机器人创企已经徘徊在了倒闭的边缘。去年由00后创始人杨丰瑜(毕业于耶鲁大学计算机专业)创办的Unix AI,据字母榜了解,最近已经从巅峰时期的百人规模缩减到20人左右。 或许正如众擎机器人CEO赵同阳所说,朱啸虎是精明和成功的商人,而创业者不是商人。在押注未来和关注当下的选择上,朱啸虎奔向了现实主义,而创业者则倾向于理想主义。 在商言商的朱啸虎,在大半年前就已经开始退出机器人项目了。 根据公开信息,字母榜整理了金沙江创投基金在机器人领域的投资(注:部分融资金额未公开披露)。从2021年至今,金沙江投资多为天使轮,虽然多数项目未披露金额,但仍然透露出对技术潜力的押注,但同时又颇富朱啸虎的个人色彩,眼光准之余往往快进快出,如星海图、松延动力等项目,均在投资半年至1年内就退出。 金沙江在机器人领域的第一次亮相是2021年投资Nimble Robotics。作为一家主打自主仓库机器人的创企,Nimble Robotics如今已顺利出海美国,估值达到10亿美元。 随后,金沙江于2023年11月投资了星海图。根据星海图回应,金沙江创投于2024年9月退出投资,值得补充的是,2025年2月星海图完成了近3亿元的A轮融资(由蚂蚁集团领投)。 同时,2024年初金沙江参与了松延动力的天使轮,金沙江创投于2025年1月退出投资,随后松延动力近期完成了过亿元的A轮及A+轮融资。而据相关人士向字母榜爆料,金沙江在星海图、松延动力两个项目,分别投了300万元和60万元,数额并不算多。 此外,金沙江还在2024年12月独家领投了瑆爝机器人的天使轮,还有非夕机器人,尽管对人形机器人的态度颇为谨慎,但2024年底仍然加码瑆爝机器人,也透露出朱啸虎对机器人领域技术创新的持续关注。 目前,根据已公开信息,朱啸虎明确退出的机器人企业只有星海图、松延动力两家。至于网络热议的金沙江曾经投过宇树科技,并未找到相关信源。 不过,需要注意的是,频频出手的朱啸虎,所在的金沙江创投本身偏好投早期项目,更多参与的轮次是天使轮/A轮。 在互联网时代,天使轮投资往往在百万到千万级别,但现在无论是大模型领域,还是具身智能领域,即便是天使轮,创投基金的入局成本都达到了动辄亿级。 今年正准备春招的李铮是一名具身智能相关专业的博士生,李铮告诉字母榜,他基本不会看融资额为1亿元左右的企业,“1个亿的融资额很难摸到机器人创业的门槛,不管是机器人大模型研发,还是获取数据,1个亿都不够烧的。” 而在具身智能热度见涨的2025年,李铮能拿到的年包已经从去年的80万元左右,提升到了今年的90万-100万元,涨幅超过20%。 对于偏好小成本入局的早期投资基金来说,具身智能领域动辄过亿元的投资门槛显然过高,或许这也是导致朱啸虎不愿意投入的原因之一。 同时,需要注意的是,具身智能火热近一年,因为商业化和量产的难题,已有机器人企业在热潮中面临着倒闭危机。 去年势头正猛的Unix或许是2025年第一批倒下的机器人创企。 前Unix员工方毅告诉字母榜,入职时Unix的目标是做面向家庭场景的人形机器人,但随着Unix人数迅速扩展到百人规模,他意识到不仅团队搭建颇为潦草,“部分高层根本不懂机器人,甚至HR对行业基本薪资情况都不了解。” 随后他所在的算法团队意识到家庭场景的机器人量产“几乎不可能”,而等到2024年下半年,不仅此前对接Unix的猎头基本不再合作,同时Unix的团队持续裁员,到如今团队几乎只剩20多人。 一边哭“商业化难”,一边疯狂造“钢铁侠”,拿着投资者的钱“为爱发电”的机器人创企已经倒在春风里,朱啸虎的“扫兴”发言并不算危言耸听。 当创业者的理想主义撞上朱啸虎的现实主义,面对朱啸虎的“预言”,机器人创企们纷纷跳出为自己代言。 3月29日,星海图(具身智能创企)发出澄清公告后,同样被爆曾拿过金沙江投资的松延动力创始人姜哲源则在朋友圈转发了自家机器人的视频,并配文:“两岸猿声啼不住,轻舟已过万重山。” 众擎机器人CEO赵同阳也发表观点,称朱啸虎适合投见效快的快餐项目,他是精明和成功的商人,而创业者不是商人。赵同阳庆幸自己见到的投资人中,几乎有一半相信这个行业的未来,也愿意一起陪跑,更是表示与朱啸虎“道不同不相为谋”。 颇为相似的是,去年朱啸虎也向大模型创企“开炮”,称“AGI是大忽悠”,并表示不会投资大模型企业。 去年DeepSeek创始人梁文锋在采访中回答“怎么看类似朱啸虎的这种市场信仰派观点?”的问题时,梁文锋表示,“朱啸虎是自洽的,但他的打法更适合快速赚钱的公司。你看美国最赚钱的公司都是厚积薄发的高科技公司。” 作为商人,朱啸虎判断高投入而商业路径不清晰的大模型和具身智能的投产比并不高,从理性计算上是合理的。 作为创企,无论是梁文锋创建的DeepSeek,还是众擎机器人等公司,都对技术创新本身充满信心,而他们与朱啸虎的态度分野,更多是理想主义撞上现实主义的矛盾显现。 而在具身智能领域,技术理想派们正在迎来春天。 曾经波士顿动力就是上一批“宇树科技、智元机器人”,在2016-2017年间,其开发的Atlas机器人也曾是业界典范。但从Google到软银到现代汽车三易其手,波士顿动力也因为通用性撑不起商业化而接连卖身。 如今具身智能领域被大模型充值了信心。 2024年3月13日,OpenAI投资的Figure AI(美国人形机器人创企)结合了OpenAI的视觉语言模型(VLM),其开发的Figure 01人形机器人可以听懂指令,与人类对话,这也被视作人形机器人实现智能化的重要突破。在国内,智元机器人也发布了通用具身基座大模型——智元启元大模型(Genie Operator-1,简称GO-1)。 大模型的技术突破让创业者们看到了人形机器人真正能够完成复杂动作甚至替代人的可能性。 从单纯的听令行事,到能通过理解语言执行复杂任务,对于人形机器人来说,硬件是肢干,大模型是大脑,大脑无疑是最重要的。等待大模型技术的成熟期,这也是让创业者敢于出来叫板朱啸虎的底气。 需要注意的是,从 OpenAI 到 Google DeepMind,不少头部AI大厂都在将支持聊天机器人的多功能学习算法(即基础模型)接入机器人。在 3月18 日的英伟达 GTC 大会上,英伟达创始人黄仁勋正式发布了人形机器人基础模型 GROOT N1,英伟达机器人技术营销经理 Gerard Andrews 也颇为乐观,“我们相信,我们正处于机器人技术变革的关键时刻。” 变化传达到了具身智能的招聘市场。“去年招聘的重点是应控模仿和需求方案学习,今年则偏向于大模型。”李铮告诉字母榜,现在主流的具身智能企业,包括逐际动力、智元等等今年都在招募大模型相关的岗位。 图注:黄仁勋展示GROOT N1 图源:字母榜截图 “一件激动人心的事,或许不能单纯用钱衡量。就像家里买钢琴,一来买得起,二来是因为有一群急于在上面弹奏乐曲的人。”正如梁文锋所说,在机器人创业者们看来,大模型让他们有了机器人真正完成复杂动作甚至替代人的可能性,而这些似乎不能单纯用钱来衡量。 技术的突破不只是创业者敢于叫板朱啸虎的底气,也未尝不会推动朱啸虎重新投入具身智能。DeepSeek就是例证。 即便在采访中,朱啸虎提到,去年金沙江不投大模型面临质疑,“但今年2月份我在新加坡见了很多美元LP,他们说谢谢你们,没有在基础模型上浪费一分钱,所以大家对你的信任程度反而是提高的。” 但明确表示不投大模型的朱啸虎,还是在DeepSeek引发大厂更新潮时表态说:“DeepSeek快让我相信AGI了。”同时,一旦DeepSeek开放融资,朱啸虎不仅“肯定会投”,并且表示“价格已经不太重要了,关键是参与在这里面。” 其实去年至今大模型行业的激烈竞争并没有变,大厂百亿级的成本投入也没有变,只是DeepSeek的技术突破让朱啸虎改变了心意。 而一旦人形机器人行业迎来DeepSeek时刻,在商言商的朱啸虎未尝不会再次回心转意。 云岫资本CEO高超也提到,2021年上半年,云岫资本曾作为财务顾问帮助宇树完成B轮融资。但当时的投资机构,很多都怀疑“这类产品会有多少人去买、买回来干什么用?”由于这些在当时都属于非共识。 宇树科技路演时,云岫资本带着王兴兴的机器狗到过多家知名机构办公室去实体演示,但在融资方案上却鲜少达成一致。当时这些融资机构不投的主要原因,正是因为“当时看到具体应用前景的发展路径相对模糊。” 如今,随着宇树科技机器人登上春晚,成为最出圈的机器人创企,“大部分客人,包括政府机构和部分企业,租赁机器人去做活动引流,都会第一时间想到宇树。”8090机器人租赁公司创始人小雷哥表示,宇树机器人出租一天定价8000元-10000元,从2月开始租赁至今,营收已经有了十几万元。 图注:宇树机器人登上贵州村BA 图源:@机器人出租-小雷哥 小红书平台 曾经遇冷的王兴兴也迎来了投资人的哄抢,据第一财经报道,宇树科技的下一轮估值很有可能由C轮的80亿元飙升至200亿元。 不过,尽管许多创业者对具身智能的万亿市场前景感到兴奋,但麻省理工学院机器人专家 Rodney Brooks也指出,一些更令人印象深刻的演示仅仅是演示而已,往往来自那些急于引起轰动的公司。而从演示到部署可能是一条漫长的道路。量产依旧是挡在大多数机器人创企面前的最大关卡。 在DeepSeek今年初强势出圈前,梁文锋曾表示,“以后硬核创新会越来越多,现在可能还不容易被理解,是因为整个社会群体需要被事实教育。当这个社会让硬核创新的人功成名就,群体性想法就会改变。我们只是还需要一堆事实和一个过程!” 可以预见的是,方兴未艾的具身智能也还需要一堆事实和一个过程。在硬核创新到来之前,不必鼓吹,但也不必太焦虑,只需要等待群体性想法改变的过程。
OpenAI惊人内幕曝光!赶走奥特曼的PDF,是Ilya发的
编辑:Aeneas 好困 【新智元导读】WSJ记者的新书,再次曝出惊天大瓜:让奥特曼被赶走的两份关键PDF,出自Ilya和Muati!更惊人的是,事变发生后,Ilya由「功臣」变「罪人」,Murati当场倒戈,奥特曼完好无损全身而退。人性有多复杂,高手的手段有多高超,目瞪口呆的董事会成员,被结结实实上了一课。 奥特曼宫斗事件的背后推手,果然是Ilya! 他发出的两份PDF,掀起了此后OpenAI的惊天巨浪。 奥特曼的3个谎言被戳穿后,Ilya找到Murati和董事会成员,策划了一场「政变」。 然而随后的事态发展,出乎所有人的意料。 原以为干了件好事的Ilya,发现自己竟成为大家口中的「罪人」? 原以为自己在伸张正义、拯救公司于水火的董事会,居然被Murati挂出来,成为整个OpenAI的公敌? 而Murati在整个事件中360度的大转弯,以及最终的倒戈,就更是令人措手不及、惊掉下巴了。 最终,所有人出局,奥特曼笑到了最后。 最近,WSJ记者Keach Hagey的新书《The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future》(乐观主义者:Sam Altman、OpenAI与开创未来的角逐),披露了当初事件的更多大瓜。 预计等5月20日出版后,还会有更多重磅猛料曝出。 奥特曼的3个谎言 事情要从奥特曼的谎言被戳穿说起。 2023年初,OpenAI的董事会发生了一次大震荡,最终只有6人留下。 这6人,分别是奥特曼、他的亲密盟友Brockman、联创Ilya Sutskever,以及三名独立董事Adam D'Angelo、Helen Toner和Tasha McCauley。 此时,奥特曼已经失去了几位董事会成员对他的信任。 那时的他,已经被发现接连撒了好几个谎! 第一个谎 本来,每个新产品发布前,都需要审查风险,OpenAI和微软已经设立了一个联合安全审查委员会。 2022年冬天的某次会议上,董事会正在权衡,该如何发布GPT-4的三项有争议的功能,此时奥特曼大手一挥表示:不必了,这三项都已获得委员会批准! 随后Toner就发现,奥特曼简直说谎不眨眼——这三项中,只有一项获得了批准。 而且,就连ChatGPT发布时,他们也并未得到通知。那时ChatGPT还是个「研究预览版」,但随后却成功席卷全球。 第二个谎 几乎在同一时间,又一件诡异的事发生了。 尚未正式发布的GPT-4测试版,居然在印度推出了,还是微软干的。 这是史上第一次,OpenAI的产品在没有联合安全委员会批准的情况下,就公开发布了。而且,也没人通知OpenAI董事会。 一次长达6小时的董事会会议结束后,一名董事才在走廊里从OpenAI的员工那里听说了此事,而之前的6小时中,奥特曼和Brockman对此事只字未提。 第三个谎 然后,就是第三个谎被戳穿。 本来,2021年成立的OpenAI初创企业投资基金,应该由OpenAI管理的。 结果,有董事会成员忽然听说:基金的利润并没有流向OpenAI的投资者。他们感到大吃一惊。 随后他们发现:这支基金实际上居然是奥特曼个人拥有?! OpenAI高管首先解释说,是出于税收考虑,后来又改口说,这是为了操作更快,而奥特曼并未从中获利。 擅长搅浑水的奥特曼,让Ilya忍无可忍 接下来的故事中,Ilya和Murati出场了。 OpenAI首席科学家Ilya对于奥特曼的不满,已经是由来已久。 23年9月底,Ilya的行动开始了! 他给Toner发了一封邮件,询问她第二天是否有时间交谈,这极不寻常。在电话中,Ilya吞吞吐吐了好久,最后憋出一句话:「你应该多和Murati谈谈」。 Murati向Toner表示,奥特曼恶劣的管理风格,已经造成了很严重的问题。而且,Brockman名义上应该向Murati汇报,却时常绕过她,直接找奥特曼告状。 这些问题,Murati已经向奥特曼抱怨了好几个月,但奥特曼表示,我们谈话时应该带上HR,总之就是和稀泥。 发现大事不妙的Toner,去找Ilya详谈。Ilya承认——我已经无法再信任奥特曼了! 比如,他十分擅长煽动高级员工之间的内斗。21年,Ilya曾启动了一个团队,推进OpenAI的下一个研究方向,几个月后,另一研究员Jakub Pachocki也开始着手类似的项目。 两个团队最终合并,在Ilya把注意力转向AI安全后, Pachocki接管了团队。再后来,奥特曼把Pachocki提为研究总监,还私下向两人承诺,让他们领导公司的研究方向。 这件事直接导致了数月的生产力损失,让Ilya极为不满。他一直在等一个合适的时机,联合董事会的力量,直接把奥特曼从CEO的位子上替换下来。 随后几周内,Ilya和Murati以及每位董事会成员保持了紧密的联系,终于有一天,奥特曼的又一个谎言,被当场戳穿! 当时,Toner发布了一篇批评OpenAI安全方法的论文,此举让奥特曼勃然大怒。他告诉Ilya,McCauley曾说Toner应该为此离开董事会。 当Ilya向McCauley转述这番话时,McCauley感到非常震惊——自己从未说过这样的话,奥特曼简直张口就来。 2023年11月6日,奥特曼在OpenAI的首届开发者大会上发表演讲,此时距离他被董事会解雇不到两周 两份PDF,Ilya和Murati揭穿奥特曼真面目 此前,Ilya和Murati一直在收集证据。 现在,他使用了Gmail的自动销毁邮件功能,向Toner、McCauley和D’Angelo发送了两份长篇PDF文件。 一份是关于奥特曼的,包含了数十个他涉嫌撒谎和其他恶劣行为的证据;另一份是关于Brockman的,集中在他的职场欺压行为上。 同时,Ilya警告:如果要行动,就要快。 于是,在2023年11月16日,一个周四的下午,Ilya和三名董事会成员登录了一个视频会议,投票决定解雇奥特曼。 同时被从董事会中移除的,还有Brockman。因为他们希望推举Murati担任临时CEO,但如果Brockman还在,她就不可能同意担任。 最终,奥特曼被票出局,Ilya以为心头大患已除。 一个有趣的插曲是,董事会成员向Ilya坦言,他们一度以为他是奥特曼派来的间谍,搞的这一出,就是为了测试他们的忠诚度。 Murati竟成「叛徒」,Ilya目瞪口呆 巨变前夜,Murati接到了董事会成员的电话。他们通知她,第二天奥特曼将被解雇,她被邀请担任临时CEO。她表示同意。 不过她问道:你们告诉纳德拉了吗?毕竟微软CEO的合作承诺,对OpenAI至关重要。 答案当然是没有。最终他们决定,消息发布的最后一刻,由Murati告知微软。 2023年10月,Murati和奥特曼同台演讲 随后,全世界就得知了这个爆炸性新闻。 然而此后,事态却愈发控制不住了! 接下来,OpenAI的董事会和高管团队举行了一系列会议,越来越剑拔弩张。 Murati担心,董事会控不住场了,这会让OpenAI整个翻船。 于是关键时刻,Murati倒戈了!她联合其他高管,向董事会下了最后通牒—— 给你们30分钟,要么解释解雇奥特曼的原因,要么就全体辞职;如果不同意,那高管团队将集体出走。 董事会成员面面相觑,傻眼了:提供奥特曼不当行为关键证据的,就是Murati你啊! 本来寄希望你能帮我们在找到新CEO期间,安抚员工情绪的,结果你却反将一军,带领群众对抗董事会? 最终,他们没有向大家透露Murati的行为。 而Ilya那边,情况更是大事不妙——忽然之间,他被群众认定为「历史的罪人」。 在奥特曼的支持者中,一种说法蔓延开来:整件事的罪魁祸首就是Ilya,是他策划了这场政变,源于对于Pachocki晋升的愤怒,而Toner也添了一把火。 对此,Ilya完全目瞪口呆,他原本以为,OpenAI员工会为他的行动欢呼雀跃。 风波延续到了周一早上,几乎全体员工签署了联名信,威胁如果不让奥特曼回归,他们就集体辞职。 签名者中,Murati和Ilya竟然也赫然在列。 毕竟,眼看着OpenAI已经乱成一盘散沙,大厦将倾之际,唯一的办法,就是让奥特曼回归了。 当这段尘封往事被扒出,依旧让人感慨不已。 如今,Murati和Ilya已经带着一大波员工四散而去,各奔前程,分别拥有了估值90亿和300亿美元的公司。 至于OpenAI,剩下的又是什么呢?
杨元庆:联想迎最好财年,开启“创业5.0”,将聚焦混合式AI
作者 | 陈骏达 编辑 | 心缘 智东西3月31日报道,今天上午,在联想集团2025/26财年誓师大会上,联想集团董事长兼CEO杨元庆在主题演讲中称:“即将收官的这个财年,将是联想历史上最好的年份之一。” 在过去的2024/25财年中,联想集团前三个财季累计营业额同比增长21%,净利润同比提升70%,全年业绩有望迎来历史新高。 现场,杨元庆宣布了联想下一财年的目标——所有业务集团的营收实现同比双位数的增长,其中移动业务集团(MBG)和基础设施方案业务集团(ISG)实现20%以上营收增长。 2024年,联想刚刚度过40周年纪念。杨元庆分享,联想将“即将开启的第五个十年”定义为人工智能的十年。 一、个人电脑业务全球第一,中国区营收利润双双增长超20% 2024/25财年,联想集团多个业务集团维持了较快的增长速度,市场地位进一步提升。 具体来看,智能设备业务集团(IDG)稳坐全球个人电脑市场第一,智能手机业务在中国以外市场的排名上升至第五位。 基础设施方案业务集团(ISG)前三季度实现超60%的增长,业务规模近100亿美元,第三季度成功实现了盈利。 方案服务业务集团(SSG)继续保持高增长和高盈利,传统支持服务跟随硬件业务稳定增长,并围绕联想混合式AI优势技术推出多个通用方案。 中国区在基本盘PC业务市场同比下降的情况下,整体营收和贡献利润实现同比20%以上的增长。 个人智能领域,中国区率先上市具有五个特征的AI PC,推动整体PC的市场份额再创历史新高。 作为全球重要的AI PC厂商,联想于去年5月在中国推出了首款AI PC,并于9月在全球推出,预计到2025年,AI PC将占联想出货量的四分之一,到2027年或将达到80%。 企业智能领域,基础设施业务突飞猛进,服务器营收达到上一财年的三倍,赢得了阿里、字节超级大客户,且中国市场增速第一;方案服务业务推出了中国首个面向中小企业客户的领域智能体——联想百应。 联想创投布局早期核心科技与AI技术,已有近20家被投企业支持联想混合式AI战略的落地,过去5年,联想创投平均每年为集团贡献超过12亿人民币的投资收益。 此外,联想仍在持续加大创新投入。杨元庆称,联想集团前三财季累计研发投入同比增长10%。 二、打造混合式AI技术路线,个人与企业两端发力 杨元庆称,联想集团正在拥抱“创业5.0”时代。AI是联想未来10年的焦点,他们的混合式AI技术路线从个人智能(Personal AI)与企业智能(Enterprise AI)两个角度切入,打造个人超级智能体、端侧AI、混合式基础设施等相关配套技术。 联想集团首席技术官Tolga Kurtoglu称:“要释放AI的潜力,我们必须将技术能力转化为以用户为中心的AI解决方案,打造联想的差异化优势。” 联想未来会在全球其他地区建立更多创新中心,新建模型工厂缩短模型部署时间,确保联想新模型部署速度领先业界,并通过模型编排为用户实现模型选择的自动化。 在个人智能领域,关键一步是如何为用户提供跨设备、跨系统,理解用户意图,保护用户隐私的个性化自然交互体验,就此杨元庆给出的答案是“个人超级智能体(Personal Super AI Agent)”。 个人超级智能体可以统一访问、提取、筛选、共享和集中管理用户所有设备上的个人信息和知识,并运用不同的模型在不同的应用领域实现智能。 杨元庆在现场透露,联想将发布全新一代产品,届时将能看到本地AI推理能力的巨大飞跃,其水平可媲美OpenAI o1-mini,对计算的需求则是从庞大的数据中心机房降低到只是一台AI PC。 在企业智能领域,联想将在自建和增强自有能力的基础上,与第三方展开合作,包括英伟达、微软、SAP、阿里巴巴、字节跳动及其他行业生态伙伴。 联想集团执行副总裁、基础设施方案业务集团(ISG)总裁Ashley Gorakhpurwalla认为,混合式AI不仅是一次技术演进,更是一场战略革命。 三、联想出海20年,中国依旧是资源配置重中之重 出海的20年间,联想曾经收购IBM电脑和服务器、Motorola移动、NEC电脑、富士通电脑等知名品牌和业务。 通过相关收购,联想不仅将这些品牌重新做大,还构建了全球销售渠道和服务网络,拓展了全球供应链和生产制造布局。 今年2月,联想与Alat埃耐特共同举办了沙特工厂奠基仪式,未来联想还将在利雅得设立中东及非洲地区总部、新的旗舰零售店和研发中心。 在出海的过程中,联想仍将立足于中国本土制造和本土创新能力。杨元庆强调:“中国依然是联想集团在全球资源配置的重中之重,这里是我们全球总部、全球研发中心和全球供应链的中心。” 联想还通过全球化的营销进一步打造全球化品牌。在刚刚落幕的2025 F1中国大奖赛中,联想集团以全面升级的“F1全球合作伙伴及全球技术合作伙伴”身份亮相,旗下的摩托罗拉也成为F1全球智能手机合作伙伴。联想集团也已正式成为FIFA国际足联的官方技术合作伙伴。 结语:联想加速AI转型 从目前联想分享的数据来看,AI给联想的业绩带来了提振作用。同时,我们也能看到联想在AI PC之外,加速了AI技术设施、端侧AI、相关软件栈的研发工作,并继续加码手机业务。 未来,联想的目标并非简单的AI PC厂商,而是希望通过PC、服务器、智能手机等终端与AI服务的结合,将自己打造为“AI全栈服务商”。
1999元用上豆包+DeepSeek双模型AI眼镜,雷神PC游戏本放出5个AI大招
作者 | 云鹏 智东西3月31日晚间报道,刚刚,海尔集团旗下雷神科技在嘉兴乌镇举办新品发布会,亮出了自家最新旗舰AI游戏本新品。 同时雷神科技还首次发布了旗下AI智能眼镜全家桶,目前该AI眼镜产品已经接入了豆包和DeepSeek双模型。 雷神科技创始人、董事长路凯林提到,2022到2024年三年,是PC行业艰难前行的三年,但2025年行业将迎来正增长,今年将成为PC的“大年”,AI的发展也带来了新的机遇。 AI是当下非常重要的技术发展趋势,在PC、智能眼镜领域,雷神科技都将AI技术予以融合。目前雷神AI已经接入了DeepSeek、腾讯混元、PixVerse等各类热门AI应用。 雷神旗舰AI游戏本这次发布了5个AI新升级,包括雷神AI、本地DeepSeek部署、AI场景光效变换、AI情绪识别灯效同步、AI游戏伴侣。 雷神科技2024年营收为29.55亿元,三年累计增长22%,电竞+信创是雷神近年来的主要策略。 现场路凯林宣布了雷神科技的“三个百亿目标”:营收、市值、品牌价值都要达到百亿。 路凯林特别提到,雷神科技是国内唯一一个做电竞全场景的品牌,从五年前开始,雷神科技就已经在信创领域开始布局。 值得一提的是,路凯林今天正式公开了自己的视频号、抖音号和小红书账号,他说,自己也要像周云杰(海尔集团CEO)一样,开始“营业了”。 价格方面,雷神科技的AI智能眼镜基础款首发价为1999元带充电仓版本价格为2299元。 猎刃16 2025款国补后的首发价格为11999元。 雷神ZERO 18 Pro国补后的首发价为27999元。 一、雷神科技:智能眼镜是AI落地的最佳载体之一,AI视觉能力是重头戏 雷神科技智能显示&创新产品事业部总经理高燕登台发布了雷神的AI智能眼镜新品。 高燕提到,智能眼镜是AI落地的最佳载体之一,未来的50年是AI的50年。 从市场需求上来看,AI眼镜有着第一视角、多模态融合的特点,同时更具便捷性、弱化边界感,一定程度上可以解放双手。此外,AI眼镜在使用过程中也更自然、直观、高效。 从商业化趋势来看,AI眼镜可以与其他智能设备形成联动,跟各类可穿戴设备、PC、手机进行结合,同时AI眼镜的场景也更加多样化,可以覆盖消费、教育、医疗、工业。 在做智能眼镜之前,雷神做了一次万人的电竞粉丝调研,从调研结果来看,轻便无感、舒适、长续航、显示清晰、智能、健康、便捷是几个核心的需求点。 在轻量化方面,雷神科技采用了TR90材质,将整机重量控制在了39g左右;在舒适方面,雷神科技针对亚洲人进行了人体工学设计,包括6.9mm的镜腿、多维度铰链结构实现动态力学贴合、动态平衡鼻托系统等。 续航方面,眼镜的电池容量达到了173mAh,待机时间据称可以超过10小时。此外充电仓可以保证12次充电。 在拍摄能力方面,眼镜搭载了1200万像素摄像头,背后高通骁龙AR1芯片搭载了双14位ISP,可以拍摄1080P 30FPS视频。 高通AR1芯片采用了4nm工艺,目前采用这一芯片的AI眼镜,正式上市的并不多,高燕说雷神科技是行业内第二家。 在AI语音识别方面,眼镜中应用了7种AI语音算法,配合5麦克风的阵列进行收音。 在AI大模型方面,雷神科技采用了豆包大模型和DeepSeek大模型“双模型协同”的模式。 AI功能性方面,眼镜支持各类AI视觉能力,比如拍摄作业解题、识别动物给出名称、视觉识别帮助制作美食。 此外,眼镜还支持实时智能翻译、智能游戏助手、血氧心率体温健康监测等功能。 在护眼方面,眼镜的镜片采用了“零垫片”,可以更好地防蓝光。 值得一提的是,眼镜镜片据称采用了国内首创的自由环曲面技术,高燕说这是为未来的AR+AI眼镜做准备的技术,这项技术可以让整个视野内都保持清晰、减少像差干扰。 在配镜服务方面,雷神科技在线下4000多家体验店中启动了一站式配镜服务。 二、电竞游戏本样样都AI了,本地跑DeepSeek,轻薄兼顾性能 雷神科技创始人、雷神总经理李艳兵登台发布了雷神科技的AI PC新品,包括猎刃S、ZERO 18 Pro、猎刃16 2025等三款游戏本。其中猎刃S系列是首次推出,主打轻薄静音。 AI是我们此次关注的焦点,ZERO 18 Pro从多个维度应用AI。首先是雷神AI应用,兼顾创作与生产力,目前雷神AI已经集成了各类热门AI应用,从学术论文AI、PPT AI到图文生成AI。 第二个方面,雷神ZERO 18 Pro全系支持DeepSeek模型本地部署,包括32B模型、14B模型,其中RTX 5090配置的版本32B模型(4bit量化)的Token速度可以做到120-150tokens/s,可用性较强。 第三个方面,笔记本的灯光效果可以随着音效进行律动,同时AI可以根据你使用的不同场景来变换灯光效果,比如在开机、娱乐、办公等不同场景,AI都会更换不同的灯效。 第四个方面,笔记本的摄像头可以基于AI来判断你的心情,比如是兴奋还是沮丧,AI可以根据你的状态来设置相应的音效呼应。 第五个方面,ZERO 18 Pro这次支持了各类AI游戏助手,AI可以在用户玩游戏的时候提供攻略指导,还可以富有感情的配你玩、配你聊天。 这背后,NPU加速游戏场景识别,CPU加速音频及实时处理,iGPU则加速LLM推理和RAG检索交互。 在配置方面,ZERO 18 Pro搭载了英特尔最新的酷睿Ultra 9 275HX处理器,其具备24核心24线程,最大睿频5.4GHz,L2+L3缓存达到了76MB。 硬件是基础,散热是提高整机性能天花板的关键,这次ZERO 18 Pro同样在散热系统上进行了重点升级,整机功耗释放达到了270W,铜箔鳍片总面积达到了256000mm²。 值得一提的是,ZERO 18 Pro搭载了一块18英寸4K 240Hz屏幕,这一尺寸实现4K分辨率是极为少见的。 旗舰款之外,猎刃16 2025款在CPU和GPU方面分别搭载了i9-13900HX和RTX 5080,性能为次旗舰水平,双显三模一并支持。 在散热方面,这次猎刃16的整机散热能力从175W提升到230W,热管数量、长度均有提升。屏幕显示方面,2K、300Hz的高帧、高分辨率配置都已经是基本操作了。 当下笔记本电脑屏幕是各家“卷”的重要方面之一。雷神科技在屏幕显示领域与京东方一起进行联合研发,共同推出了蜂鸟护眼屏,该屏幕在抗反射方面表现尤其突出。 新成员猎刃S这次通过散热架构的升级和内吹散热设计,其风噪降低到了43dB,核心总功耗在200W左右,兼顾静音和高性能。 结语:AI成PC竞赛核心焦点,AI眼镜丰富生态能力 在AI眼镜成为行业大趋势之下,科技厂商跨界入局已经成为常态,此次雷神科技作为PC领域的代表性厂商,也交出了自己的答卷。从产品来看,当下AI眼镜迭代的重要放向依然是轻量化和AI,未来赛道的竞争必然会更加焦灼。 与此同时,AI在PC笔记本电脑领域的应用也成为雷神科技此次新品的一大亮点,在AI PC浪潮迅猛而来的当下,游戏本也愈发深入地与AI融合,游戏本本身的高配置对于AI应用的体验来说更是加分项。 面向未来的AI时代,从PC、可穿戴到电竞全生态,与AI深度融合都将成为重要趋势。
美初创公司:马斯克窃取了“Grok”这个名字
马斯克 凤凰网科技讯 3月31日,连线杂志报道,马斯克的xAI因其聊天机器人Grok的名称面临潜在的商标纠纷。美国专利商标局认为这个名字可能会与另外两家公司——人工智能芯片制造商Groq和软件供应商Grokstream的名称相混淆,因此暂停了该公司的商标申请。现在,一家名为Bizly的科技初创公司声称自己拥有“Grok”这个名字的所有权。 Bizly和xAI似乎是各自独立想到“Grok”这个名字的。Bizly的创始人罗恩・沙阿说,他是在和一位同事的头脑风暴会议中想到这个名字的,当时他的同事将这个词用作动词(“grok” 这个词在科技界常被用来表示“理解”)。“我当时就觉得,这正是我要的名字,”沙阿表示。“我们很兴奋,击掌庆祝,就定了这个名字!” 据《印度时报》报道,马斯克表示他是根据1961年的科幻小说《异乡异客》中的一个术语来给他的聊天机器人命名的。作者罗伯特・A・海因莱因将“grok”想象成火星词汇中的一个词,意思也是“理解”。 沙阿说他在2021年就申请了“Grok”这个名字的商标。两年后,当他正准备推出一款名为Grok的人工智能直播活动应用程序时,马斯克宣布了他的同名聊天机器人。“那是我永远不会忘记的一天,”沙阿说。“我醒来后看了看手机,收到了很多朋友的信息,说‘你被埃隆收购了吗?恭喜啊!’这让我完全震惊了。” 沙阿坚称xAI侵犯了他的商标。但专注于商标业务的格本知识产权律师事务所的创始人乔希・格本表示,根据美国法律,商标法规主要是为了保护消费者而不是公司。“目标是避免消费者对产品或服务的背后主体产生混淆,”他说。 当马斯克宣布他要推出聊天机器人时,沙阿说,Bizly仍处于测试阶段,正在与金融服务公司Carta合作对其Grok应用程序进行试点。这家初创公司即将完成一轮融资,但沙阿表示,由于投资者对商标纠纷的担忧,这笔交易告吹了。Bizly的Grok从未进入市场(目前也无法使用)这一事实,可能会让人质疑该公司能够执行哪些商标权利。 现在,沙阿说,他的公司濒临倒闭。他希望能与xAI友好地解决此事——甚至提出与马斯克的公司合作,或者以公平的价格将Grok商标出售给它。“我们花了200万美元来开发我们的Grok产品和业务,一旦马斯克先生宣布使用这个商标,我们的融资就失败了,”沙阿在上周一给xAI律师罗伯特・基尔的电子邮件中写道。“我们的公司濒临倒闭,需要挽回损失才能生存下去。”(作者/陈俊熹) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
当服务机器人长出手臂,类人形机器人何以撬动万亿市场?
作者 | 许丽思 编辑 | 漠影 3月31日,普渡机器人发布了全球首款商用类人形具身智能服务机器人闪电匣 Arm。该款机器人由普渡创新实验室Pudu X-Lab研发,在普渡旗舰专用型商用服务机器人闪电匣的基础上,集成了移动、操作、交互多技术栈,能够在酒店、楼宇、餐饮、零售、医疗等各类商业场景中完成多种泛化操作。具体来看: 移动:通过AI分层规划决策,闪电匣Arm能够实现高动态环境的实时避障。上层通过传感器收集环境信息,规划出长距离最优路径并导航;下层建立局部3D全景感知地图,基于模型预测方法能够实时感知到环境的动态变化,实现全身范围的精准避障。 操作:闪电匣Arm搭载可升降的7自由度仿生双臂,双机械臂操作直径最大可达2米,并配备普渡自研的11自由度五指灵巧手PUDU DH11,同时集成了触觉皮肤和AI力控算法,具备高度精细化的末端操作能力; 交互:闪电匣Arm采用普渡自研具身智能技术架构,融合多种数据驱动具身智能,算力达到275 TOPS,在大模型应用上采用“大脑大模型”与“小脑大模型”分离的策略,并接入了DeepSeek等多种主流AI大模型,可实现具身智能级别的多模态交互。 闪电匣Arm是行业首款应用于商用场景的具身智能服务机器人,标志着类人形服务机器人正式开启商业化落地。类人形机器人通过操作能力的加持打破了长期困扰行业的最后一公里难题,帮助各种商业场景的终端客户实现端到端的全栈式具身智能。 从专用到类人形,普渡从客户的实际需求和痛点出发,为具身智能服务机器人的商业化应用带来突破性变革。 一、从专用到通用:类人形机器人商业化拐点到来 2024年5月,普渡在行业内率先提出了类人形这一概念:通过操作机械臂的加持,服务机器人将极大提高自身的产品力,实现更加通用的产品价值。专用机器人、类人形机器人和人形机器人三种形态将共同构成服务机器人的未来行业生态。 根据普渡机器人CEO张涛的定义,三种形态在单位工作面积内的自由度不同,各具优势:专用机器人单一任务执行效率最高,人形机器人通用性最强但距离商业化距离较远;而类人形机器人能够很好地平衡专用机器人与人形机器人的特点,兼具操作能力强、移动效率高的优势,是当前实现性能与成本平衡、大规模商业化的最佳选择。 随后的9月和12月,普渡分别发布了D7和D9两款类人形和人形机器人,成为行业首家完成专用、类人形、人形三种形态全面布局的厂商。闪电匣Arm则是短短6个月内的第三款产品,显示出其强大的研发活力。纵观普渡的发布节奏,从多技术栈到多品类产品矩阵,不仅是技术路径的革新,更是商业模式的重构。 就像汽车行业早已不满足简单地将人从A点移动到B点,当商用服务机器人行业进入下半场,机器人所提供的不再是简单地把外卖从酒店大堂送到客房、把菜品从后厨传到餐桌,而是移动、操作、交互等多重技术栈驱动的具身智能。商用服务机器人需要打通跨场景端到端任务的全流程环节,为用户提供泛化任务的解决能力,真正解决人类的生产生活需求与工作需求。 如今,首款商用类人形具身智能服务机器人闪电匣Arm正式发布,通过移动能力与操作能力的深度耦合,打破了专用机器人的功能桎梏、人形机器人的落地难题,为通用具身服务机器人的商业化应用开辟了一条可落地的现实路径。 此前有媒体认为,类人形机器人的出现,具有开创机器人行业的“iPhone时刻”的划时代意义。普渡机器人创始人张涛曾经表示:在类人形机器人的产品逻辑驱动下,所有的专用机器人都值得被重做一遍。 无独有偶,在今年年初的2025CES上,家用清洁机器人厂商石头科技和追觅等纷纷展示了搭载机械臂的新产品,通过“移动 + 操作”的技术融合,让清洁机器人从二维地面清洁向三维空间管理跨越,行业正在用类人形机器人的逻辑重构现有的产品,这再次证明了普渡的前瞻判断。 前瞻判断的背后是反复论证的结果,闪电匣Arm的出现并非偶然。 对操作技术的研发始于普渡成立之初。2017年,普渡推出了首款机器人欢乐送,这是行业内首款多层餐架式机器人,初次定义了送餐机器人的形态。然而鲜为人知的是,欢乐送的demo曾经配有机械臂,目的就为了完成端到端的配送,实现餐饮配送过程中的泛化操作能力。 这种超前一步的技术探索,在2018年初代“闪电匣”研发中得到延续,普渡再次尝试让机器人通过机械臂按电梯的技术方案,以对行业长期依赖的IoT路线提出新解法。 普渡对于服务机器人实现泛化操作能力的前瞻布局,为后续操作能力的创新奠定了工程基础。 在闪电匣Arm发布之前,伴随着类人形机器人PUDU D7和人形机器人PUDU D9两款产品的发布,普渡已实现了机械臂关节、夹爪和灵巧手的自主研发,为类人形机器人正式进入商用场景的技术跑通和产品论证奠定了坚实的基础。 这一点在闪电匣Arm上得到了充分的体现,在专用型机器人闪电匣的基础上,闪电匣Arm集成了普渡自研机械臂和去年10月发布的自研灵巧手PUDU DH11,这背后是一家机器人公司的久久为功。 闪电匣Arm的意义远非单一的产品创新,其本质是普渡“场景需求定义产品技术”战略的具象化体现。类人形机器人闪电匣Arm为酒店、餐饮、办公、医疗等场景的终端客户提供了一个可以“即交付即用”的新产品体验。类人形机器人商业化的拐点,由此诞生。 二、花式炫技与做好产品:具身智能商业化之问 今年以来,众多人形机器人企业频频炫技,凭借各种炫酷动作走红网络。但行业也正在经历一场认知讨论:具身智能的商业化指向何方? 一个基本共识是:人形机器人扎堆炫技的背后,是机器人动态控制能力的持续进步。但人形机器人想要融入真实的商业应用场景中,现在还存在着成本过高、市场碎片化且有限等问题,依旧道阻且长。 而成立于2016年的普渡机器人从最务实的商用场景出发,用了十年的时间塑造了一个商业化高度成熟的机器人细分赛道。得益于成熟的全球化商业渠道和成功的全球本地化策略,其市占率已经位列全球第一,成为海外可见度最高的中国机器人品牌。 值得注意的是,机器人的头部厂商往往各有所长,与凭借精彩表演在央视春晚出圈的宇树科技不同,普渡机器人近期凭借其商业化的领先布局和成果频频亮相央视,以另一种方式获得市场的广泛关注。 2月26日,普渡机器人获得央视《新闻联播》报道,其在专用、类人形、人形多形态机器人协作的布局首先获得市场关注;紧随其后的多场央视报道中,分别聚焦了普渡在全球23%的领先市占率,以及通过创新的服务机器人产品优化消费体验、促进消费创新,获得市场的广泛应用。 ▲普渡机器人登央视《新闻联播》 上述报道共同传递出一个信号:从多技术栈驱动的三种形态到完整的产品矩阵,普渡机器人的产品更加贴近商业化,其战略直指服务机器人商业落地过程中的各种痛点、难点:以用户需求为前提,以商业落地为目标。 闪电匣Arm的发布再次印证了这一事实:伴随着商用服务机器人行业下半场的到来,当其他厂商仍在朝着单一产品、单一场景的方向发展时,普渡早已将版图放在了多产品矩阵、多场景应用的更大市场布局上。 与市场最初的印象不同,在普渡的引领下,商用服务机器人早已不只局限于餐饮配送场景,而是拓展到了餐饮、酒店、零售、医疗、养老、教育等各种行业。在闪电匣Arm发布之前,专用型闪电匣机器人早已在除酒店场景以外的医疗等场景落地,在海内外众多知名医院参与检验样本配送等智慧医院物流的解决方案。 不难看出,发展类人形机器人本质上是市场选择的结果。普渡机器人通过近十年来在楼宇、医疗、酒店、餐饮等领域的深耕,积累了深厚的场景应用经验,也为类人形机器人的正式商业化进行了长足的市场验证。 以餐饮行业为例,配送机器人依旧需要人工进行菜品取放;在医疗场景中,配送机器人无法完成对玻璃药瓶、检验样品等物品的精准稳定抓取;在酒店场景中,机器人可以完成迎宾和客房配送,但房间内的清洁与客房服务仍需依赖人工。 ▲医疗场景下类人形机器人执行泛化操作 另外,商用服务机器人在实际应用中往往需要通过IoT方式联通电梯、门禁等设备,然而全球众多国家和地区的法规不允许对电梯做硬件改造,只能和电梯厂商进行云端打通,而平均部署每部电梯的成本高达数万美金。对于一个高度全球化的行业来说,这将带来大量的重复改造成本以及第三方设备厂商的溢价风险,制约着服务机器人在全球范围内的规模化商业落地。 这些长期存在且未被满足的客户需求都亟需商务服务机器人操作能力的提升来解决,而类人形机器人闪电匣Arm的出现为上述难题提出了全新解法。 闪电匣Arm通过AI与机械臂、灵巧手的结合,能够实现跨场景的通用泛化操作能力。对于终端用户来说,通过操作能力的加持,闪电匣Arm能够通过物理方式执行按电梯、刷门禁、开门敲门等泛化操作,免去了loT的重复改造成本。同时,通过泛化操作能力的提升,闪电匣Arm还能够实现自主取送物品、客房服务等不同场景内的端到端服务闭环,实现全栈式的具身智能。 不仅如此,从更现实的商业化角度来看,操作能力的加持将成为机器人出海全球化的重要抓手,通过机械臂按电梯是机器人从2D走向3D最重要的里程碑,将推动打开巨量海外市场,为服务机器人的全球化商业落地带来重大利好。 类人形机器人闪电匣Arm的出现,是从客户需求、现实应用痛点出发,倒推产品的定义,让机器人商业化回归本质的产物——用最优性价比解决最高频问题,而非“拿着锤子找钉子”。普渡的长期的实践证明了,具身智能机器人的未来,在于让技术回归场景,让产品服务需求。 当机器人能够真正融入人类环境,成为解决问题、解放人力的工具,而非作为一种展示品,具身智能机器人的商业化才有了基本的实现路径。 三、撬动万亿级市场空间 近期,高盛、花旗、摩根士丹利等多家机构纷纷发布研报,预测人形机器人的未来市场走势。尽管观点各异,但市场普遍忽略了一个关键点:在专用机器人泛化能力有限、人形机器人谈论商业化落地遥遥无期的情况下,类人形机器人更加有望撬动未来的巨量市场空间。 这种市场潜力的释放,源于技术突破与商业实践的双重驱动。近些年,AI大模型、多模态感知、仿生机械臂等技术的突破,使得类人形机器人在自主决策、环境交互、泛化操作等方面飞速发展,具备了一定的跨场景任务处理能力,迈上了从实验室走向商用的快车道。 相较于人形机器人通用性漫长的提升过程,从场景应用痛点出发的类人形机器人在当前明显更具有现实意义。 更重要的是,当类人形机器人能够在目前商用服务机器人已广泛落地的酒店、餐饮、医院等行业场景中不断验证其移动操作、多任务处理、复杂环境适应和人机协作等能力,其实也是培养公众认知与使用习惯、推动成本下探的过程,推动其走向家庭、养老、陪护等更多场景,撬动更大的市场空间。 而在此过程中,普渡已经凭借其领先的产品力、丰富的客户资源、全球化的渠道网络和多技术栈的核心优势积累了足够的护城河。 量产能力也是普渡的核心护城河之一。量产是综合因素的考量,涉及标准化生产、供应链管理、质量控制等多重关卡。而深耕全球市场十余年的普渡机器人,已经历了成本控制、量产爬坡、客户验证、售后维保等各个环节的严苛考验,在业务布局、技术积累、全球商业化落地等方面拥有长足的先发优势,是极少数具有复杂硬件的工程能力和量产能力的厂商。 技术端的长期投入为产品量产提供了底层支持,类人形机器人通过轮式底盘进行移动,而普渡机器人在定位、感知、规划、调度、 控制等方面早已形成行业领先技术优势;在操作能力上,普渡从刚成立就大力投入机械臂的研发工作,这些技术都可以直接进行复用。 在积累了移动、操作、交互三大核心技术栈领先优势的基础上,普渡的研发逻辑始终遵循“场景反推技术”,让技术创新与产品升级能真正做到为用户的痛点对症下药。截至目前,普渡已积累超过1600项专利,核心技术基本上都实现了自主可控。 相比于大多数产品还停留在实验室样机阶段或者小批量出货的机器人企业,普渡深度整合供应链,不断刷新机器人规模化量产的新高度。去年8月,普渡在江苏盐城年产能达到10万台的超级工厂正式落成,截至目前其累计出货量已超过9万台,是全球出货量最高的商用服务机器人企业。伴随着其类人形和人形机器人的量产和商业化,预计到2025年年底普渡各类产品的出货总量将突破10万台。 此外,下游渠道的复用让类人形机器人的量产价值加速释放。与众多 C 端行业不同,商用服务机器人作为新兴 To B 行业并没有现成渠道可以复用,而一旦建立起完整的渠道体系,就会成为巨大的渠道壁垒。 截至目前,普渡已经在全球累计建立超过700家代理商的渠道体系,产品行销超过60多个国家和地区,其海外营收占比稳定在8成以上,在长期市场实践中的塑造了强大的全球化商业能力,为中国硬科技企业出海打磨出了一份范本。 在欧洲,普渡的配送机器人贝拉和清洁机器人CC1等产品已经在许多大型连锁商超实现了大规模的导入,提供从新品促销、商品导购、地面清洁以及补货搬运等全流程的服务。通过渠道复用,未来这部分成熟的渠道客户可以无缝导入普渡的类人形机器人,缩短市场推广周期、快速铺货的同时降低客户的采购成本,撬动起一个更巨量的机器人市场。 图:猫形机器人贝拉收到海外消费者追捧 在全球化商业化的过程中,普渡还格外注重将产品与本地化做好结合。猫形机器人贝拉由于其可爱的猫形外表和人性化的交互模式与日本当地二次元文化的深度匹配,受到日本消费者的广泛喜爱,成为中国机器人出海的现象级产品。 目前,普渡可以说是商业化最成功的机器人企业之一。根据弗若斯特沙利文发布的行业报告,以2023年收入计,普渡机器人以23%的市场份额位居全球第一,与后几名的厂商之间拉开了较大差距。 这些数据和动作证明了,普渡对于业务的投入具备可持续性,并且具备持续将业务做好的能力。领先的市占率背后是普渡成熟的商业化模式得到市场验证的结果,而类人形机器人的发布与多元形态的积极探索也正是基于此。 如今,普渡一步步构建起来的技术、供应链、渠道等的全链路能力,正在为类人形机器人的万亿级商业化按下快进键。 四、结语:类人形重新定义服务机器人商业化价值图谱 普渡机器人的长期主义基因,让其十年来持续深耕真实场景,以客户需求为中心,深刻洞察客户痛点,反推技术与产品创新,而非拿着锤子找钉子。从完整的产品矩阵到通用的多元形态,从全球化到本地化,普渡机器人的大规模商业化路径愈来愈清晰,以全球领先的市占率和出货量证明了——让技术回归场景本质,服务机器人才能成为重塑生产力的下一代基础设施。 人类对机器人技术的追求,应该是能确切奏效的场景应用方案,而不是等一个颠覆未来的宏大叙事。当舆论在热议人形机器人何时能真正进厂打工、走进家庭时,普渡用类人形机器人重新定义了具身智能机器人商业化的未来。从PUDU D7到闪电匣Arm,类人形机器人的发布充分证明了商业化最朴素的真理:那就是解决实际问题的产品永远比炫酷的Demo更有生命力。
迈向群体智能|智源发布首个跨本体具身大小脑协作框架与开源具身大脑
作者 | 智东西编辑部 3月29日,智源研究院在2025中关村论坛“未来人工智能先锋论坛”上发布首个跨本体具身大小脑协作框架RoboOS与开源具身大脑RoboBrain,可实现跨场景多任务轻量化快速部署与跨本体协作,推动单机智能迈向群体智能,为构建具身智能开源统一生态加速场景应用提供底层技术支持。 一、增强长程操作任务能力,打造感知-认知-决策-行动闭环 在具身场景中,长程操作任务是机器人执行复杂任务的核心能力之一。具身大脑RoboBrain融合了机器人任务规划、可操作区域感知、轨迹预测的三维能力,通过将抽象指令映射为具象动作序列,增强长程操作任务的能力。 RoboBrain由三个模块组成:用于任务规划的基座模型、用于可操作区域感知的A-LoRA模块和用于轨迹预测的T-LoRA模块。在推理时,模型首先感知视觉输入,并将输入指令分解为一系列可执行的子任务,然后执行可操作区域感知和轨迹预测。RoboBrain采用多阶段训练策略,使其具备长历史帧记忆和高分辨率图像感知能力,进而提升场景感知和操作规划的能力。 RoboBrain在任务规划、可操作区域感知和轨迹预测评测任务中均表现出卓越性能。 在任务规划方面,RoboBrain在不牺牲通用能力的前提下,在机器人规划评测集OpenEQA、ShareRobot(自建)和RoboVQA上多个维度优于GPT-4V、Claude3等6个当时领先的闭源/开源MLLMs。 ▲RoboBrain在具身规划评测基准上的性能 在可操作区域感知方面,RoboBrain在AGD20K测试集上的平均精度超过了当时最先进的开源模型Qwen2-VL,验证了其在指令理解和物体属性方面的卓越能力。 ▲RoboBrain在可操作区域感知基准上的性能 ▲RoboBrain在轨迹预测基准上的性能 在轨迹预测方面,RoboBrain预测的操作轨迹具有与真实轨迹较高的相似度,展现了其在轨迹预测中的高精度和稳定性。RoboBrain的未来迭代版本会持续提高轨迹预测的能力。 目前,RoboBrain能够解读人类指令和视觉图像,以生成基于实时图像反馈的行动计划和评估,预测每一步的轨迹并感知相应的可操作区域。具体而言,RoboBrain能够有效利用环境信息和交互对象的状态——无论是从第一人称还是第三人称视角捕捉的图像——生成针对不同类型机器人操作任务的任务规划,并基于人类指令和视觉信息,提供合理的可操作区域,并能在不同场景中表现出良好的泛化能力,生成既可行又合理的轨迹。 具身大脑RoboBrain、小脑技能库以及跨机器人数据中枢,是跨本体框架RoboOS的核心要素。具身大脑RoboBrain,负责全局感知与决策,构建动态时空感知、规划指导和反馈纠错机制;小脑技能库,负责低延迟精准执行,实现柔性与精密操作等;跨机器人数据中枢,负责实时共享空间、时间和本体记忆,为决策规划与优化协作操作提供信息支持,从而形成感知-认知-决策-行动的闭环。 二、一脑多机实现跨本体协作,从单体智能迈向群体智能 跨本体具身大小脑协作框架RoboOS,基于“大脑-小脑”分层架构,通过模块化设计、智能任务管理和跨本体协作,为机器人提供高效、灵活、可扩展的底层支持,实现从单机智能到群体智能的跃迁。 在RoboOS的分层架构下,具身大脑RoboBrain的复杂场景感知与决策能力,可与小脑技能库的高效执行能力深度结合,确保协作框架在长周期、高动态任务中的稳定运行。实现大脑模型(如LLM/VLM)与小脑技能(如抓取、导航)的“即插即用”,目前,可支持松灵双臂、睿尔曼单/双臂、智元人形、宇树人形等不同类型的具身本体。 通过共享记忆系统(空间记忆/时间记忆/本体记忆),实现多个机器人之间的状态同步与智能协作,突破传统“信息孤岛”限制,实现跨本体协作控制。 RoboOS可动态管理多机器人任务队列,支持优先级抢占与资源优化分配,确保复杂场景下实时响应,实现高并发任务调度。 此外,RoboOS可基于执行反馈动态调整策略,结合环境变化,持续优化任务规划,提升鲁棒性,做到实时闭环优化。 自动播放 ▲基于RoboOS及RoboBrain的多机器人跨本体协作递送任务Demo 在“递送苹果和水果刀”的任务场景中,基于RoboOS及RoboBrain,睿尔曼单臂机器人(转运)、宇树人形G1(挑拣水果)、松灵双臂机器人(挑拣水果刀)分工协作。 整体任务流程是睿尔曼调用“导航技能”移动至餐桌前,宇树G1调用“视觉抓取技能”完成指定物体的挑拣,睿尔曼调用“抓取技能”提起果篮并导航至松灵餐桌前。紧接着,松灵调用“抓取技能”获取水果刀,并放置在果篮中心,睿尔曼依据“空间记忆”导航至办公桌位置,递送果篮后返回待命。 RoboOS接收“拿离杯子最近的水果,并递送一把水果刀”指令后,递送RoboBrain进行任务拆解,并将拆解后的子任务分发给3台跨本体机器人。RoboBrain通过 “空间记忆” 感知环境,确定果篮、苹果位置,并拆解任务为“宇树G1挑拣苹果→睿尔曼传递果篮→松灵机器人抓取水果刀→睿尔曼返回”。 各机器人本体执行子任务过程中,由RoboOS提供端云协作能力,将任务规划为技能粒度,实现云端RoboBrain分发规划,端侧执行技能并实时反馈。RoboBrain识别“离杯子最近的水果位置”、“果篮抓取位置affordance”、“水果刀抓取位置affordance”、“果篮空闲位置Pointing”,经由RoboOS递送指导各机器人本体完成任务。 三、“即插即用”快速轻量化泛化部署,打造统一生态 RoboOS 作为面向多机器人系统的跨本体具身大小脑协作框架,专为解决当前具身智能落地过程中的通用性适配与多机调度难题而设计。针对异构本体难以统一接入、任务调度效率低、缺乏动态错误反馈机制等痛点,基于RoboOS 的“大小脑协同”的架构范式,云端的具身大脑RoboBrain负责统一的任务理解、规划决策与上下文感知,本体侧则接入轻量级的小脑执行模块,实现感知-认知-决策-行动的闭环协作。 该机制能够动态感知本体差异、灵活适配操作指令、自动修复异常行为,有效提升系统在复杂任务场景下的鲁棒性与泛化性。RoboOS原生支持异构机器人本体的灵活接入,以Profile模板机制快速完成机器人能力建模与适配。 本体的小脑模块可调用包括开源技能库、自研低阶控制器等多种技能接口,形成一个支持模块复用、即插即用的运行体系,大幅降低开发门槛与接入成本。 在云端,RoboOS提供完备的模型适配与API接入能力,兼容自研的多模态VLM,作为可插拔的大脑决策引擎,从而在服务机器人、工业自动化、智慧物流、智能制造等领域支撑复杂任务的多机协作需求。 借助RoboOS的端云一体化协同能力与动态调度机制,整个系统不仅具备高度的扩展性与可迁移性,更为未来具身智能的规模部署与生态构建奠定了通用操作系统级的基础。 RoboOS基于智源研究院研发的并行训练与推理框架FlagScale,原生支持多机器人系统的端云协同能力,打造具身智能的统一底座。系统在设计上充分考虑“多机器人-多模态-多任务”场景,具备极高的可扩展性与低时延响应能力。 在端侧部署中,机器人注册即可自动与云端部署的RoboBrain大脑建立双向通信链路,通过高效发布-订阅机制实现实时任务调度与状态反馈,指令响应延迟低于10ms,满足复杂动态任务的闭环控制需求。 面向机器人在长期运行中产生的海量感知与行为数据,RoboOS 提供基于内存优化的数据访问引擎,支持TB级别历史数据的内存随机访问能力,为任务复现、异常回溯、跨任务知识迁移等场景提供基础能力。结合 RoboBrain 的任务推理与策略优化模块,历史数据还可用于多机之间的协作知识共享,实现更强的智能演化与自主学习能力。 此外,FlagScale作为底层支撑框架,支持大模型在多设备间的并行推理与多任务协同调度,可无缝集成视觉语言模型、轨迹生成模块、感知识别等子系统,全面释放具身大模型的系统潜力。 目前,智源研究院依托多模态大模型技术优势资源,正在联合北大、清华、中科院等高校院所以及银河通用、乐聚、加速进化、宇树等产业链上下游企业,积极建设具身智能创新平台,重点开展数据、模型、场景验证等研究。 此次智源研究院发布的跨本体具身大小脑协作框架RoboOS及开源具身大脑RoboBrain,将有机融合和广泛链接不同构型的具身本体与丰富多元的具身模型,加速具身智能跨本体协作与规模化应用。 开放、协作、共享,是具身智能生态繁荣的必经之路,智源研究院愿携手更多产业合作伙伴,共绘具身智能生态蓝图。
全国首个!湖北为脑机接口医疗服务定价:966元起
快科技3月31日消息,据湖北省医保局官网,今日,湖北省医保局发布全国首个脑机接口医疗服务价格,标志着这一前沿科技正式步入民生领域,为无数患者带来希望与曙光。 其中,侵入式脑机接口置入费为6552元/次,侵入式脑机接口取出费为3139元/次,非侵入式脑机接口适配费为966元/次。 官方在通知中提到,全省公立医疗机构应依据自身条件开展上述3项医疗服务价格项目,项目价格为全省最高限价,不得上浮,下浮不限。 项目服务产出如下: 非侵入式脑机接口适配:通过外部放置的电极采集脑电信号,进行脑机接口系统的调试和功能监测。 侵入式脑机接口取出:通过手术方式将已置入大脑皮层或特定神经区域的脑机接口系统取出。 侵入式脑机接口置入:通过将脑机接口系统置入大脑皮层或特定神经区域,实时采集神经信号,实现大脑与外部设备的信息交互。 据“湖北发布”介绍,脑机接口是在大脑与外部设备之间建立直接连接的通路,大脑在思维活动时产生脑电波,脑机接口则通过识别脑电波特征直接读取大脑意图,将其转化为计算机指令,实现人与机器或外部环境之间的交互联通,创造让瘫痪者行走、让失语者“说话”、让盲人“复明”等奇迹。 近年来,脑机接口技术不断发展,逐步拓展其应用边界,不仅在神经功能缺陷譬如偏瘫、失语患者治疗方面,更在帕金森、癫痫、抑郁症等功能性神经疾病的治疗中展现出巨大的潜在优势。 据了解,2024年4月,浙江大学脑机接口迎来全新突破,其最新研究首次实现汉字书写脑机接口,成功实现了侵入式脑机接口控制机械臂书写汉字。 76岁高位截瘫的患者通过侵入式脑机接口,用意念控制外部机械臂手握马克笔,在白板上成功写出“浙江大学脑机接口”。 目前,浙江大学脑机接口团队突破了汉字书写的特殊编码机制,在此基础上发展了汉字书写轨迹解码新技术。 在书写每一个汉字时,都有不同的神经元组合参与进来,进而产生不一样的脑信号模式。 科研人员通过动态解码模型,可以实时捕捉志愿者的脑神经活动,解析志愿者想象的书写轨迹,再通过控制机械臂进行书写。 在离线状态下100个常用汉字的分类正确率达到了91.3%,在语言模型辅助下,正确率可提高至96.2%。 责任编辑:拾柒

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。