行业分类:
加载中...
头条分类:
加载中...
人形机器人,困在A轮里
稚晖君的“昨天”,似乎正是人形机器人创业者们的今天。 当智元机器人经历6轮A轮融资,终于在近日挺进B轮时,更多的人形机器人创企还被困在A轮融资里。 首当其冲的,或许正是被朱啸虎送上热搜位的松延动力。 朱啸虎在采访中表示“正批量退出人形机器人公司”,并且质疑“谁会花十几万买机器人干活”。退出的创企之一正是松延动力。 而松延动力也是目前在A轮阶段融资最频繁的人形机器人公司。企查查信息显示,自去年3月进入A轮以来,松延动力已完成4次A轮系列融资,在A轮阶段“长跑”达13个月。这家成立于2023年9月的公司,已累计完成五次融资,却仍未迈入B轮大门。 图源:企查查 松延动力创始人姜哲源在今年3月接受“搜狐科技”采访时表示,“在企业竞争方面,目前最主要集中在融资领域,融资跟不上就快被淘汰了,其实有一些企业不乐观了。” 对于眼下红得发紫的人形机器人赛道来说,除去“轻舟已过万重山”驶过A轮融资难关的宇树科技和智元机器人,松延动力或是新一轮机器人创企当下的小小缩影。 据直面AI(ID:faceaibang)统计,2022年以来成立的13家明星机器人公司普遍呈现“单一轮次里徘徊”的融资特征。数据显示,这13家企业在进入B轮融资前已经历多次融资,除智元机器人在A轮里融了6次挺进B轮外,还有6家徘徊在A轮阶段尚未晋级至B轮,另有6家至少完成三次融资的企业,还在更早期的天使轮和Pre-A轮徘徊。 云岫资本曾为宇树科技等机器人公司提供FA服务,其合伙人兼智能制造组负责人的符志龙指出,当企业估值已经顶到高位,而量产进度不达预期时,企业便会通过多次“+轮”融资补足资金。 “去年年底第一次天使轮融资额不理想,今年热度高,投资人看得不少,真正出手的不多,今年准备分2-3次小批量融preA的钱了。”某机器人企业创始人告诉直面AI,机器人创业早已到了1亿元融资额一年不到就能烧完的阶段,但面对谨慎的投资人,不谋求单轮大金额融资,多轮小额加入资金,一样能得到理想的结果。 对于松延动力们而言,企业进行小轮融资也有其考量。机器人赛道研发周期长,技术门槛高,需要大量的资金投入。硬件开发、算法优化、供应链管理都是花钱的大头。但是现在市场情绪比较谨慎,企业很难一次性拿到足够的资金,往往只能采用拆分融资轮次的方式来缓解融资压力。 只不过,困在A轮并不算舒适区,等待松延动力们的是持续的融资压力,累计拿到五次融资的松延动力仍然资金紧张,“松延动力仍是草根团队,钱一直会是相对比较紧的状态”。姜哲源在接受采访时也表示。 01 “刚开始创业的时候,松延动力融到的钱没有现在这么多。”姜哲源接受采访时表示。资金紧张一直都贯穿在松延动力的创业阶段。 本科就读于清华大学电子系的姜哲源,在25岁那年,放弃了清华博士学位下海创业。当时,姜哲源的父亲找来自己的老朋友劝说儿子不要创业,结果对方直接给松延动力投资了一百万元。 但是机器人创业并非想象中那么简单,这个行业投入巨大,资金紧张困住了大部分机器人公司。即使是顶着“华为天才少年”光环的稚辉君(彭志辉),创立的智元机器人两年内在A轮融资里徘徊6次才迈入B轮。 2023年11月,成立两个月后,松延动力就获得了天使轮融资。2024年3月-2025年2月,松延动力获得四次A轮融资。松延动力并未披露融资金额,只有最近一次披露了超亿元的融资额,也显得语焉不详。 即使刚刚完成第四次A轮融资,姜哲源在采访时仍表示,“松延动力仍是草根团队,钱一直会是相对比较紧的状态,不能像DeepSeek这样放心地去追求技术理想,必须尽快商业化。” 事实上,在A轮融资阶段,卡住姜哲源的正是投资人看重PMF(产品市场匹配度)。 对比已经走出A轮的稚晖君,姜哲源先卡在了量产上。 2024年12月,智元机器人启动通用机器人的商用量产。今年1月,通用型机器人累计下线1000台。其合伙人姚卯青透露,今年出货量预计在数千台左右。就在两个月后,智元机器人就完成了以腾讯领投的B轮融资,投后估值高达150亿元。 相较之下,今年3月,松延动力发布了两款机器人:人形机器人N2和升级版机器人E1。目前,松延动力手上订单有六百多台。按照姜哲源的规划,预计到今年下半年,松延动力机器人产量将能达到每月150台以上。并希望今年能够出货一千台,在四季度实现现金流转正。 图源:松延动力微信公众号 符志龙表示,PMF能不能真正跑通,产品得让客户觉得有用且付费意愿高。一方面,是否具备大规模生产的能力。另一方面,销售能否闭环,决定了商业逻辑是否成立。 也就是说,是否能够量产,正是创企从A轮跨入B轮的一个重要因素。 和一些明星机器人公司相比,松延动力的创业团队并不是最顶尖的。目前机器人创业团队有在高校任教的,比如银河通用创始人王鹤来在北大前沿计算研究中心任助理教授,两次融资累计12亿元;也有创始人有大厂背景,比如智元机器人创始人稚辉君,顶着“华为天才少年”的头衔。 这也导致松延动力在资本青睐度方面并不算头部。因此,如何用最短的时间做出下一个milestone(里程碑)以及匹配适当节奏的现金支出,对姜哲源来说是非常有挑战的。 姜哲源坦言,他对公司的一个要求是:眼下要挣钱。 姜哲源加快商业化步伐的原因不难理解,中国机器人公司必须严格按照PMF思考问题,所以先让市场看到PMF的能力至关重要。 目前,松延动力发布的人形机器人N2,高度1.2m,整机重量仅30kg,具备后空翻等运动能力,价格已经下探到3.99万元。市场上和N2相似的宇树科技Unitree G1、智元灵犀X1,量产价格分别为9.9万元和10.8万元。 面对“到底能不能赚钱......是否也是卖一台亏一台?”的提问,姜哲源曾对“机器人大讲堂”表示,“我们有着极强的成本控制能力,39900元肯定依然能挣钱。” 盈利多少或许不是松延动力现阶段最主要考量的,先制造现金流,按照PMF行事才是走出A轮困境的当务之急。 02 “(松延动力)不能像DeepSeek这样放心地去追求技术理想,必须尽快商业化。”姜哲源的话或许代表了当下大多数机器人创企的心声。 由于看不到清晰的商业化路径而退出松延动力的朱啸虎说,“我们喜欢的是可持续的,能够给客户创造价值的商业化。” 某种程度上,投资人给了初创企业需尽快商业化的压力。 正在看早期机器人项目的恒业资本创始合伙人江一告诉直面AI,他接触到的某知名仓储机器人A轮估值18亿遇冷,后改拆为A1轮12亿(对应产品原型)、A2轮15亿(对应首个客户签约),通过渐进式诱导缓解市场的抵触。 “具身智能机器人赛道距离成熟还比较远,缺乏商业化支撑的估值难获认可。”一位头部创投机构前投资人告诉直面AI。 而估值很难上涨的原因也和市场环境有关,上述投资人表示,整个VC市场有一些退潮,愿意在估值上推波助澜的美元基金,没有之前那么活跃。而入局的国资比较多,但是国资更求稳定,也会在估值上面压的比较低。 因此,采用“小+轮”融资模式逐步提升估值,成为机器人公司应对当下市场环境的生存之道。商业化困境和融资环境导致创企很难一次性拿到大额资金,但是机器人研发又需要足够资金投入,所以A轮阶段投融资就被拉长了。 其实,作为区别于互联网时代的新赛道,具身智能尚未有产品从研制到实现商用量产需要多少资金的标准。 以智元机器人的融资作为参考,虽然智元机器人并未披露每一轮融资金额,但是在进入B轮融资之前,智元机器人累计完成8次融资,其中2023年12月的一次融资金额超过6亿元人民币。松延动力未披露具体金额,最近一次融资额为超亿元人民币。作为参考,融到A3轮的星海图,根据公开信息,目前的融资金额累计超过8亿元。 图源:企查查 智元机器人巨额的融资或许可以从另外一个角度来看,即要想突破B轮融资,松延动力和星海图或许需要完成一定的融资金额。 再者,对于松延动力们来说,想要解困,还得抱紧产业资本的大腿。 蓝驰创投合伙人曹巍接受“经济观察报”采访时表示,智元机器人有大量的产业股东,仅来自股东方的需求可能就创造出几万台机器人的销量。智元机器人的落地场景也聚焦在工业。在A轮阶段,智元机器人引入的投资方非常多元,不仅有创投机构和地方国资,还有比亚迪、上汽投资等产业资本,这无疑提供了不少的落地场景。 这似乎正中松延动力们的命门。如今结伴困在A轮,包括完成4次A轮融资的松延动力,完成A3轮融资的星海图,投资方名单中都缺少产业资本的身影,这也使得它们在工业、服务、医疗等多个领域商业化落地较为艰难。 缺少产业投资,以至于商业化路径不明晰,或许也是它们无法吸引更多融资向前迈进的原因。 在此前朱啸虎引发的舆论争议中,金沙江创投退出的两个具身智能项目,分别是松延动力和星海图,原因则是没有看到清晰的商业化路径。对于朱啸虎的质疑,还困在A轮融资的松延动力们,或许需要更多时间来回答。 03 需要注意的是,对于初创公司来说,拿到钱还只是开始,如何花钱才是问题。 而钱,往往先花在了抢人上。符志龙指出,在早期投资阶段,投资人比较看重团队能力,这事关A轮阶段的供应链能力。 “投资人比较关注人形机器人的核心部件(比如关节模组、夹爪)是自研还是外包;如果是外包的话,团队有没有做二次调试的能力,确保产品竞争力。另外投资人会特别在意团队里有没有从0到1搭建过产线、从1到100跑过量产的人才,工程化能力直接决定后面能不能放大规模。”符志龙补充道。 对于松延动力来说,想要拿到更好的融资额,首先要做的就是团队扩充,尽快完成人才储备,但是这一部分的成本往往非常高。 根据第三方招聘平台信息,松延动力招聘的嵌入式软件工程师、电子工程师等均为13薪,每月薪水高达2万-3万元。其中具身智能算法工程师的薪水最高,年薪最高可达65万元。类似的岗位,宇树科技的激光slam开发工程师薪水为2.5万-5万元/月,智元机器人的控制算法工程师则达到3万-5.5万元/月。 智元机器人用四次A轮融资完成了团队的扩充。 2023年8月,智元机器人完成A2轮融资,当时其研发团队还不到50人。此后一年时间里,智元机器人完成了四次A轮融资。截至2024年9月,智元机器人团队已经超过300人。 可以预见的是,具身智能赛道仍处于早期阶段,这是一个链条长、技术栈复杂的行业,松延动力们面临着巨大的研发投入。 对于更多团队来说,最重要的可能是先活下去。 不过,需要关注的是,对于松延动力们来说,现在正是机器人创业的好时候。 星海图创始人之一的赵行在接受《晚点Auto》采访时表示,大模型、ChatGPT 的火爆,让大家对具身智能有了更多信心,各界都在投入更多资源。 投资人生怕错过潜力项目的焦虑情绪让整个机器人领域都热了起来。星海图联合创始人许华哲在接受《南方都市报》采访时也说,去年,投资人的心态可能是有兴趣投资,但需要进一步考虑。然而,今年投资人的心态已经变成FOMO(害怕错过),更倾向于迅速达成一致,抓紧机会投资。今年2月以来,星海图在三个月之内完成了3次A轮系列融资。 同时,大模型的技术进步也让人形机器人有更多的可能性。 美国人形机器人创企Figure AI,结合OpenAI的视觉语言模型(VLM)开发的Figure 01人形机器人,可以听懂指令,与人类对话,被视为是人形机器人实现智能化的重要突破。今年2月,Figure AI抛弃OpenAI,进一步发布了自研的通用的视觉-语言-动作(VLA)模型“Helix ”,目前,Figure AI正以400亿美元估值寻求C轮融资。 大模型的技术突破给人形机器人的发展增加了好的信号,让机器人不止于能运动,有了替代人的可能性。目前,宇树科技、智元机器人等创企都开始招聘和大模型领域相关的技术人才。宇树科技薪酬最高的岗位为生成式AI算法工程师,年薪最高将超过90万元。 即便当前松延动力们仍困在A轮,但是随着技术的进步,无论是量产还是融资,都将迎来更多的好消息。 正如Figure AI创始人Brett在接受采访时表示,“我们现在正好处于人形机器人推向市场的正确阶段,并推动这一进程。这非常令人兴奋。” 在AI时代,尽管机器人创企将走过一段混沌期,但正如稚晖君所说,短期市场上会有各种正、负反馈,对一家初创公司,最重要的是留在牌桌上。我们仍可以期待松延动力们的更多好消息。
5000字长文带你看懂,Agent世界里的A2A、MCP协议到底是个啥
昨天晚上,Google发了一个关于Agent的新开放协议。 叫Agent2Agent,简称A2A。 包括昨天阿里云百炼也官宣搞MCP了。 这些本来没打算写的,因为太技术了,也是感觉离普通人还是有很大距离。 但是有好几个朋友都在群里说。。。 那还是来聊聊吧,正好也用我自己的理解,来做个小科普,让大家一片文章看懂,A2A、MCP,到底是个啥。 正好最近特朗普对等关税这事,非常火。 搞得全世界鸡犬不宁,每个国家之间的隔阂,好像又重新出现了。 我就用国与国之间的外交,来去解释这两个协议。不要以为八竿子打不着,其实真的非常的像。 我们现在,假设每个AI智能体(Agent)就是一个小国家,它们各自有自己的语言和规矩。 现在,这些国家的大使馆分布在同一栋大楼里,试图互相沟通、做生意、交换情报。 理想情况是,各国之间关系和睦,大家都有一套明晰的外交规则,只要大家坐在圆桌前,就能顺畅地交流、签署协议、并合作进行国际项目。 但现实却是,每个国家的大使馆互不统属,协议各异,有的只认英制度量衡,有的只收欧元货币,有的说谈判必须用法语,有的则坚持任何通信都要用自家加密算法…… 结果,你想跟A国谈一个简单的贸易合作,得先备齐对方要求的一大堆条文、证明、翻译、特殊密钥。如果你还想同时跟B国、C国合作,那就得重复N遍相似的流程。 这种临时的、分散的、多头的各国各自为政,让所有人的沟通成本居高不下,每次对话都要额外缴一份信息关税。 过去,AI世界里的Agent想要合作,都面临一样的窘境。 举个例子,你可能有一个自动帮你帮你回邮件的Agent,还有一个内置在日历应用里的Agent,能帮你安排日程。 但这两个AI很难直接对话,必须得你充当翻译在中间手动复制粘贴信息,或者依赖开发者定制的接口。贼恶心。 结果就是,AI智能体各据山头,互操作性极差,这种碎片化现状让很多用户头疼,因为需要在多个AI应用间来回切换,也限制了AI的潜力发挥,很多本可以多Agent协同完成的复杂任务,被人为隔断在各自的小圈子里。 这种局面下,就有点像二战后世界的状态:每个AI智能体各自为政,缺乏统一规则,互通有壁垒。 当年二战后,也就是 1940年代,美国寻求建立一套战后多边机构,其中之一将致力于重建世界贸易,搞了很多轮的谈判。 最后,历经50年,终于1995 年1月1日正式开始运作,依据 1994年马拉喀什协议 ,取代了1948 年建立的关税与贸易总协定。 我们有了人类历史上也是非常伟大的组织: WTO,世界贸易组织。 而现在AI世界的生态,就有点像二战后的废墟,WTO成立的前夕,你调用我的功能要按我的接口来,我访问你的数据也得敲你定的门路。 没有标准,意味着每增加一种合作关系,都要付出额外“关税”(开发成本和沟通成本)。 AI生态因此变得割裂且低效。 人人设墙,自扫门前雪。 但是还好,在AI圈里也出现了想要 制定通用规则的势力,就想大家在贸易混战中渴望一个WTO那样。 AI行业开始探讨能否有一套大家都认可的协议,让智能体之间、智能体与工具之间互相对接更加顺畅。 这时候,Google和Anthropic分别站了出来,各自抛出了一个方案,也就是我们今天的主角: A2A 协议和 MCP 协议。 一. A2A协议 先来看Google发布的 A2A协议 。 A2A(Agent-to-Agent)协议,顾名思义,就是让AI代理彼此直接对话、协同工作的协议。 这次Google得到了包括Salesforce、SAP、ServiceNow、MongoDB等在内的50多家科技公司的支持参与。 A2A协议的设计初衷很简单: 让 不同来源、不同厂商 的Agent能够互相理解、协作。就像WTO旨在消减各国间的关税壁垒一样。 一旦采用A2A,不同供应商和框架的Agent就像一个个的小国家,加入了一个自由贸易区,能够用共同语言交流、无缝协作,联手完成单个Agent难以独立完成的复杂工作流程。 至于A2A是如何运作的,我尽量用现实类比来通俗易懂的解释下 : 1. Agent = 国家外交官 每个Agent其实就像一个国家大使馆的外交官。他的名牌上写着自己能干啥、隶属于哪家企业,联络方式如何等。A2A要做的,就是制定一个统一的外交礼仪和沟通流程。 过去,A国外交官只会说法语,B国外交官只用西里尔字母写文件,C国外交官要求面谈时必须使用古老的云纹金箔信件。。。而A2A的出现,就是让大家在同一个会议室开会时,都能说一套约定好的通用语言,用相同格式提交文件,让商议好的结果可以被各方理解并执行。 2. Agent Card(代理卡) = 外交国书 / 大使名片 在A2A规范中,每个Agent都要公开一份“Agent Card”,相当于其外交官的身份名片。 包含以下内容:Agent名称、版本、能力描述、支持什么“语言或格式”等等。 现实中,外交官的身份名片让对方知道他是谁,代表哪个国家,有哪些职权。同理,在A2A里,Agent Card列举了“我(这个Agent)能执行哪些技能”、“我的认证方式是什么”、“输入输出格式有哪些”等等。 这样,其他外交官想跟你合作就能很快找到你、理解你的能力,省去了大量沟通障碍。 3. Task(任务)= 双边或多边外交项目 A2A中最核心的概念之一是Task。 当一个Agent想委托另一个Agent去完成什么事情,就像对外发布一份“合作项目意向书”。对方同意接单后,双方会记录一个Task ID,追踪项目进度、交换资料、直到该Task完成为止。 现实外交中,某国家就可能向某兔提议:“我们想合作修一条跨境高铁,麻烦你们派工程队来。” 这就对应A2A的Task:由发起方提出需求(TaskSend),远程Agent表示接受(Task状态变更),然后双方在整个项目过程中随时更新任务进度 里面还有个Artifacts(成果物),就相当于这个项目最后落地的“合同文本、建设成果”。在AI里可能是生成的一份报告、一张图片或任意形式的输出。而在A2A语言里,用 Artifact 表示最终生成的成果。 Message(消息),则是项目前期或中期的各种来回沟通。它可能包含对任务细节的补充说明、要对方再确认某些条件等。这与现实外交中的电报、照会、使节往来是一模一样的。 4. Push Notifications(推送通知)= 外交使馆快报 在A2A里,如果一个Task是长期项目,远程Agent需要花很久时间才能完成,比如DeepResearch动辄十几分钟,某些复杂的Agent动辄一小时,它就可以通过推送通知机制向发起方更新进度。 就像在外交中,如果一个跨国基建项目周期很长,甲国会定期给乙国发通报:“进度到哪儿了?有什么问题需要协调?” 这样能大幅提升异步协作的能力。过去很多AI系统比较原始,只能用同步的“请求-响应”模式,就像放一个人在那24小时监控,一旦响应超时就中断。 A2A允许设置回调接口、服务器端事件(SSE)等方式,把漫长的任务分段汇报,让沟通保持流畅。 5. 身份认证与安全= 外交特权与协议 A2A采用企业级的认证策略,要求通信双方先验证对方的身份凭证。例如在现实外交中,不是谁都能随意闯进某国大使馆,必须持有相应的外交护照、获得许可。 这就是为了防范“冒名顶替”或“恶意窃听”。 在A2A里,“认证头信息”“token”“签名”等一系列安全手段,就相当于外交通行证或盖了公章的外事批准文书,确保你跟我谈判时是真的代表“你所在的国家”,而不是一个假冒的第三方。 这大概,就是A2A的机制,其实你看,跟国与国的外交,或者跟企业与企业之间的协同,没有任何本质的区别。 二. MCP协议 再来看 MCP协议 ,全称 Model Context Protocol 。 这就是Claude的母公司Anthropic在2024年11月推出并开源的一套标准。 A2A解决了AI外交官之间的交流流程问题,但是还有一个棘手的现实,再能言善辩的外交官或者企业商务,要是没有 任何可靠的信息 来源 ,对国际局势和资源配置就两眼一抹黑,根本就没法干活。 更何况,在现代社会,外交官往往需要调用种种外部工具,比如签证系统、国际结算系统、情报数据库等等,才能完成任务。 同理,一个Agent若想承担真正的复杂职责,也需要能连上各种数据库、文档系统、企业应用,甚至是硬件设备。 这就像给外交官建立完备的情报局,并授权他们使用某些工具处理事物。 过去,Agent要接入外部资源,常常得各自开发专用插件,与不同工具做深度整合,劳心劳力。 但是,我们现在有MCP了。 MCP致力于标准化大型语言模型(LLM)与外部数据源、工具之间的交互方式 。 Anthropic的官方比喻很形象: MCP就像AI应用程序的USB-C端口 。 USB-C是如今设备通用的接口,不管充电、传数据都是一个口搞定。 MCP的野心也是这样的, 搞一个AI领域的万能接口 ,让各种模型和外部系统接驳都用同一个协议,而不是每次另写一套集成方案。 以后AI模型要连数据库、连搜索引擎、连第三方应用,不用每家各订各的协议,只要都支持MCP就能对上话。 它大概是客户端-服务器架构的思路: 1. MCP服务器= 整合的情报局 企业或个人可以把自己的数据库、文件系统、日历、甚至第三方服务封装成一个个“MCP Server”,这些Server符合MCP协议,向外暴露统一格式的访问端点,任何Agent只要符合MCP客户端标准,就能发送请求、检索信息或执行操作。 比如高德就把自己的一些API,封装成了MCP,只要你有高德的API Key,你就可以在Agent上调用高德。 2. MCP客户端 = 外交官实际使用的终端设备 就像一个Agent外交官带着专用的终端设备,可以输入各种指令:“帮我查一下财务系统里库存数据”、“帮我向某个API提交请求”,“把某份PDF拿来我看看”。 过去,如果没有MCP,你得针对各种系统写不同的访问代码,整合起来极其麻烦;但是用了MCP后,只要客户端支持协议,就能轻松切换到不同的MCP服务器。 调用不同的信息,随时获取情报、做业务流程。 这大概,就是MCP的机制。 三. A2A和MCP的不同 抽象讲了很多,可能很多人,还是有点云里雾里。 别急,我们通过一个故事化的场景来把A2A和MCP的区别与合作说明白。 比如我们现在,有一个世界版的国际峰会。 各国首脑其实是各家公司的Agent代表,比如谷歌代表是小G,Anthropic派出了小A,OpenAI来了个小O,国内的阿里派出小Q,腾讯派小T等等。大家齐聚一堂,要合作完成一项跨国任务,比如联合写一份全球经济分析报告。 在没有通用协议之前,这会基本开不起来,因为每个代表讲自家语言,互相听不懂。 但现在好了, 有了A2A协议这套外交标准 ,所有代表进入会场前都签了《A2A维也纳外交公约》:发言必须用统一格式,说话先报身份、标明意图,回应要引用之前的发言ID等等。 于是,小G可以正式地用A2A格式发消息给小O,小O收到后依样画葫芦地回复一个A2A消息。 这样,不同公司的AI首次实现了无障碍对话。 二对话进行中,各位AI代表难免需要查阅资料或使用工具帮助分析。 这时候Anthropic的小A说:“各位,如果需要外部数据或工具的支持,可以通过MCP系统获取。” 原来,会场边上还架设了一套“MCP同声传译室”。里面坐着各种专家(对应不同的MCP服务器)。 有谷歌Drive资料馆管理员、有Slack聊天记录管家、有GitHub代码管家,甚至还有Postgres数据库管理员…只要通过MCP提请求,他们就能用统一语言回应。 比如,小Q(阿里云代表)想调自家云端数据库算点东西,如果按老办法,他得派人打个飞的回国去拿。 现在他直接在会上发送一个MCP请求(这请求其实也是按MCP定义的JSON格式发给对应的MCP Server): “我要查询X数据库里的Y数据”。 MCP数据库管家翻译室收到请求,立刻查库拿到结果,用MCP语言回复给小Q。 整个过程对其他Agent来说是透明的,他们也听懂了小Q引用的这份数据,因为MCP翻译过来的格式大家都认识。 继续写报告过程中,小G(谷歌)和小A(Anthropic)发现需要把各自部分内容对接起来分析。 小G擅长数值分析,小A擅长语言总结,那就协作: 小G通过A2A对小A说“我这边算完GDP增速了,数据如下”,小A收到后,在自己这边通过MCP又连了一下Excel表格插件,验证了数据趋势,然后再用A2A回复小G一个总结段落…… 一来二去,A2A让Agent彼此沟通任务,MCP让每个智能体方便地调用外部工具补充信息,两套协议配合默契,报告很快完工。 这个故事中,大家可以清楚地看到: A2A更像外交部专线,解决的是Agent直接对话的问题。 MCP更像同声传译与资源共享系统,解决的是智能体对接外部信息的问题。 两者配合起来,就是为AI版联合国量身打造的沟通协定。有了它们,AI Agents可以各展所长又紧密合作,真正形成一个互联互通的AI生态体系。 写在最后 当A2A和MCP这样的开放协议逐渐统一标准之后,我们有理由畅想一个全新的AI Agent生态。 无数AI Agent像网站一样部署在各处,它们通过A2A协议彼此发现、通信,通过MCP协议调动资源、分享知识。 我们作为用户,就像当年浏览网页一样,可以无感知地使用这些智能体的协同服务。比如,你的个人AI助理Agent接受了你的复杂委托: “帮我计划一次欧洲旅行,顺便写一篇游记稿件。” 它不会单打独斗,而是迅速通过A2A喊来各路好手:旅行规划Agent、航班预订Agent、翻译Agent、文案Agent…… 大家分工合作,各显其能。 正如我们希望国家间少打贸易战、多订规则,AI领域我们也乐见各家少搞闭关锁国,多推行兼容协议。 A2A和MCP的崛起,意味着AI产业已经在朝着 协作而非对抗 的方向进化。 现实世界,和AI世界,明明是一体,却是两种趋势。 真是讽刺。 最后,希望这篇文章,对你有一些帮助。
全系降价 2 万元、百公里 2 L 油,奇瑞下定决心要干一架
奇瑞在 10 号的发布会上说了两件大事。 一件是他们新研究的混动专用发动机,实测达成了百公里 2L 的油耗。 另一件是宣布旗下 3 大车系的 10 款混动车型通通降价 2 万元,跟进了车圈的价格战。 面对最近来自市场的各种压力,奇瑞不想再低调下去了。 百公里 2L 油的新技术 先来讲讲新的混动技术,总结起来其实是一句话——我们的技术很厉害,请快点来买我们的车。 技术厉害在哪里呢? 超过 48% 的热效率,百公里 2L 的油耗,以及电混发动机、电混 DHT 变速箱和电混专用电池这三大件实现了全栈自研。 还有几个没那么直观,但也很厉害的参数——26:1的超高膨胀比、全域实现过量空气系统系数 lamda=1、EGR率达到35%。 另外,奇瑞专门研究了了强越野方案。 有越野专属的 2.0T GDI 全能混动发动机、越野专属多档混动变速箱,以及矢量双电机,其中,2.0TGDI 全能混动发动机功率可达到 200kW,峰值扭矩 400Nm,涉水深度可达到 1240mm;还有全球首创横置3挡架构、全球首发纵置十合一2挡架构;矢量双电机则拥有行业第一车端最大功率1200kW。 奇瑞说自己能有这样的技术突破,主要归功于「三驾马车」。 首先是对核心技术的全链条掌控,也就是刚才提到的三大件全部自研。 其次是以安全为底线,定义行业标准。特别是针对当前混动车型在高速馈电情况下容易失速而带来的安全隐患做了专项优化。 再就是携手全球伙伴共建开源生态。在全球设立了8大研发中心,并且对合作伙伴开源自己的技术,一起创新。 10 款车型大降价 那你可能会有点疑惑说,现在大家的注意力不都在纯电上,有必要在混动上花这么大力气嘛? 不知道你还记不记得董车会在稍早之前写过一篇文章——《保时捷计划开发新燃油 SUV,欧美车企集体「开倒车」?》 里面提到说大多数海外车企都放缓了走向纯电的步伐,开始更多的发展混动技术。 但其实中国厂商对外也对外出口了不少混动车和零部件。 比如奇瑞,截至到 2025 年一季度,就差不多累计出口了 470 多万台整车和 70 多万台发动机。 海外市场对奇瑞来说,还是相当重要的,2024 年,奇瑞汽车营收达到了 4800 亿,总销量达到 260 万辆,出口达到 114 万辆。海外市场的销售份额快占了整个集团的一半。 但最近的情况大家可能都知道,普遍的预期是今年的出口可能会不太乐观。 再加上最近车圈愈演愈烈的价格战,奇瑞也不得不考虑从「活的好不好」转变为「先活下去」。 这次大降价涉及到了四大品牌(分别是奇瑞风云、捷途山海、iCAR 和星途瑶光 C-DM),虽然不是全部车型,但也足够震撼了,最低的是风云 A8,一口价 8.99 万元起,甚至连 A8L 都一口价 10.99 万元起。 简单介绍一下这几款车。 2025 款风云 A8 搭载鲲鹏超能电混 CDM5.0,第五代混动专用发动机,最大功率 115 kW,综合热效率 44.5%,百公里加速 7 秒级,极速可达到 205km/h。匹配电混 DHT、高性能混动专用电池,CLTC 纯电续航 145 km,实测综合续航 2000km+,实测百公里油耗低至 2.68L。 2025 款风云 T9 采用 5+2 座椅布局,得房率高达70.04%,前排还支持 10点 按摩/ 3 挡加热/通风。搭载鲲鹏超能电混 CDM5.0,WLTC 综合续航 1400km+,CLTC 最高纯电续航 210km。 2025 款风云 T10 则采用大六座布局,动力搭载鲲鹏超能电混 CDM5.0,四驱版百公里加速 4 秒级,且 200km/h 高速不失速。搭载宁德时代大容量电池,纯电续航 210km,WLTC 馈电油耗 5.75L,综合续航 1400km+,实测最远 2196.64km。 与此同时奇瑞也发布了山海 T2 加长版的预售价格,并且在 4 月 18 日正式上市,预售价格是三个版型,两驱版一个,四驱版两个,分别是 19.99 万元、23.49 万元和 24.49 万元。 结合整场发布会和价格来看,奇瑞这次多少有点「亮剑」的意思,打算用技术和价格双重抗压,无论是开源全栈自研的混动三大件,还是 10 款车型直降 2 万元,都证明了奇瑞想打好这场「仗」的决心。
马斯克否认SpaceX制造星链手机传闻,怒斥外媒“谎话连篇”
凤凰网科技讯 2月6日,针对路透社SpaceX将推出“星链手机”的报道,SpaceX首席执行官埃隆·马斯克(Elon Musk)在社交平台X上进行了辟谣,明确表示公司并未研发此类硬件产品。 马斯克在回应相关报道时直接指出:“We are not developing a phone.”(我们没有在开发手机。) 他进一步批评部分媒体的报道内容不实,甚至直言路透社“谎话连篇”。 此次回应是对近期市场猜测的定调,彻底否定了外界关于SpaceX目前正在涉足智能手机硬件制造的说法。虽然马斯克曾于1月底在与网友互动时提到,未来推出一种“纯粹优化为运行最高性能/瓦特神经网络”的设备并非完全不可能,但他当时也强调这若存在,将是与传统手机截然不同的AI计算设备。外界此前将这一模糊表态过度解读为“造手机”的信号,而马斯克最新的表态则消除了这种歧义。 “星链手机”传闻与现有“星链直连手机”(Direct to Cell)技术之间有本质的区别。目前SpaceX确实在积极推进Direct to Cell业务,但这并非指制造新的手机硬件,而是一种通信服务技术。该技术允许现有的普通智能手机(如iPhone或Android设备)在无地面基站覆盖的区域,直接连接星链卫星进行短信、通话及上网。马斯克此前多次强调,这项技术旨在消除信号死区并在紧急情况下提供通信保障,是基于现有手机生态的增值服务,而非通过制造SpaceX自有品牌手机来与苹果或三星等厂商竞争。
联发科发布天玑 9400+,还想推动智能体 AI 的发展
联发科最新的旗舰芯片 9400+ 发布节奏有点独特,首发搭载它的 OPPO Find X8s 系列在昨晚已经发布,但芯片的正式发布,却是在今天的举办天玑开发者大会 MDDC 2025。先发终端产品,再发新片的节奏在业内倒是很少见,不过想来也比较好理解,作为小升级产品,联发科肯定还是想把更多的声量留给下半年的天玑 9500。 天玑 9400+ 发布,定位变了 联发科对于天玑 9400+ 的定位是「旗舰 5G 智能体 AI 移动芯片」,旗舰和 5G 我们都很好理解,智能体 AI 是什么意思?联发科认为,当下智能手机的 AI 经历了分析式 AI 和生成式 AI 两个阶段,现在正处在往智能体 AI 发展的过程中,因而天玑 9400+ 的使命就成了提供生成式 AI 和智能体化 AI 能力,以高智能、高性能、高能效、低功耗特性处理各类 AI 任务。 天玑 9400+ 采用第二代全大核架构,8 核 CPU 包含 1 个主频为 3.73GHz 的 Arm Cortex-X925 超大核,以及 3 个Cortex-X4 超大核和 4 个 Cortex-A720 大核。天玑 9400+ 集成 MediaTek 第八代 AI 处理器 NPU 890,端侧率先支持 DeepSeek-R1 推理模型四大关键技术,同时率先支持增强型推理解码技术(SpD+),所以智能体 AI 任务的推理速度能够提升 20%。另外,天玑 9400+ 搭载 12 核 Arm GPU Immortalis-G925,支持天玑 OMM 追光引擎和天玑倍帧技术,前者让游戏视觉效果更逼真更炫酷,而后者能够让游戏更流畅,同时功耗更低。 相比于 Cortex-X925 超大核主频相较于天玑 9400 的提升,天玑 9400+ 的有两个连接性的提升:视距内手机对手机的蓝牙连接扩展到 10 公里,连接距离是天玑 9400 的 6.6 倍,新增支持北斗卫星轨道信息,即使没有蜂窝网络连接,首次定位时间(TTFF)也能加速 33%。 联发科更想推动智能体 AI 的发展 前面说了天玑 9400+ 发布节奏的事情,以及定位的改变,其实这次天玑开发者大会 MDDC 2025 的主题就呼之欲出了:AI。 「AI 随芯,应用无界」的主题比较虚,联发科和开发者们真正想讨论的是智能体 AI (Agentic AI)体验发展和技术新范式下的共同机遇。 这里解释一下什么是智能体 AI(Agentic AI),相比于位于幕后的分析式 AI 和需要用户主动提出需求的生成式 AI,智能体 AI 可以根据高级目标自主进行推理,制定计划并执行复杂任务。 MediaTek董事、总经理暨营运长陈冠州说: AI 产业正全面加速成长,催生出全新形态的 AI 体验。下一波 AI 浪潮属于智能体 AI。MediaTek 一直领创前沿 AI 技术与生态系统的发展,每年通过 20 亿台边缘设备,将智能体 AI 从技术概念转化为全民触手可及的体验,赋能万千应用,实现从智能向智慧的跨越式升级。 话术当然有点官方,但相比于去年大谈特谈生成式 AI 的节奏,今年的智能体 AI(Agentic AI)显然更打动人,也对普通消费者更有吸引力。 不过,联发科作为上游企业,和消费者的直接联系并不多,在这场 AI 变革当中更想扮演领航员和基石的角色。于是乎,联发科就推出了 AI 应用与游戏的一站式可视化智能开发工具——天玑开发工具集(Dimensity Development Studio),天玑 AI 开发套件 2.0。另外,联发科还拉着阿里云通义千问、传音、面壁智能、摩托罗拉、OPPO、荣耀、vivo、微软、小米共同启动「天玑智能体化体验领航计划」,一系列动作,都是用来帮助智能体 AI 的发展。 联发科发布的这个天玑开发工具集(Dimensity Development Studio),包含 Neuron Studio 和 Dimensity Profiler 两部分。 Neuron Studio 支持 AI 应用开发全流程分析,开发者可实时查看每个模型的执行细节,Neuron Studio 打造了跨模型全链路分析功能,提供全局视角和执行流程,能够大幅节省模型分析时间。Neuron Studio 还支持神经网络自动化调优,将性能和内存占用自动优化至理想配置,开发者可全程监控大模型演化过程,让模型与端侧平台的适配更加省心、省力、省时间。此外,Neuron Studio 提供开发一站式整合,通过整合 MLKits 开发工具,帮助开发者实现模型开发一套工具就能行。 系统全性能一站式分析工具 Dimensity Profiler 则可覆盖 CPU、GPU、NPU、内存、FPS、温度、功耗以及网络等核心性能指标,并提供「实时、回放、逐帧、深度回放」四大分析模式,为开发者提供全面的游戏调优支持,充分释放天玑平台的性能潜力,降低移动游戏的优化难度。 除了 Dimensity Profiler 的推出,天玑星速引擎也获得了升级。借助天玑倍帧技术,开放世界移动游戏《无限暖暖》即将带来 60 帧满帧体验。 天玑星速引擎自适应调控技术帮助 Google Android 动态性能框架在 2025 年 Android 新版本生效,另外,联发科携手《王者荣耀》海外版 Honor of Kings 创造 18% 的功耗收益。天玑光追仿生细节也有所升级,与《暗区突围》合作,让仿生细节再突破,实现接近 PC 级骨骼模型效果。AI 落地方面,联发科还与《王者荣耀》、《永劫无间》手游等游戏合作,成功在端侧部署 TTS、ASR、LLM 等 AI 模型,为玩家带来更低延迟、更精准的语音互动体验。 天玑 AI 开发套件 2.0 主要应用在开发者布局智能体 AI 用户体验领域。其中,Gen-AI Model Hub 模型库适配的模型数量提升至 3.3 倍,为开发者提供更加多样化的全球主流模型选择;联发科海推出开源弹性架构,助力开发者自由选择模型并加速部署。天玑 AI 开发套件 2.0 率先支持 DeepSeek 四大关键技术:混合专家模型(MoE)、多 Token 预测(MTP)、多头潜在注意力(MLA)和 FP8 推理(FP8 Inferencing),理论上 token 产生速度可提升 2 倍,内存带宽占用量可节省 50%。同时,通过天玑 AI 开发套件 2.0,端侧 LoRA 训练速度提升可超过 50 倍。 可以这么说,联发科上半年开天玑开发者大会 MDDC 发改进型旗舰芯片,并宣布 AI 战略,下半年发布年度旗舰芯片的节奏,在现在的遇事不决问 AI 的时代,对于占领 AI 心智高地还是大有益处的,这大概也是为什么天玑 9400+ 和 AI 战略在这场开发者大会上地位反转的原因,因为 AI 是需求侧,芯片是供给侧,定义了需求,供给才顺理成章。
消息称字节跳动计划推出AI智能眼镜,正在与供应商谈判
AI智能眼镜 凤凰网科技讯 4月11日,The Information报道,据两位知情人士透露,字节跳动正计划推出自家的AI智能眼镜。这一消息标志着,全球科技巨头们愈发将智能穿戴设备视为AI服务的下一个新兴市场。 据其中一位知情人士透露,字节跳动预计将在其智能眼镜中,提供类似自研模型豆包的AI功能。 目前,字节跳动推出这款智能眼镜的时间和销售地区尚未确定。据了解内情的人士透露,字节跳动正在与供应商谈判,确定产品功能、技术规格、成本以及发布时间。对此,字节跳动的发言人尚未回应置评请求。 去年10月,字节跳动首次涉足AI硬件领域,在中国推出了配备AI功能的无线耳机Ola Friend。这款耳机允许用户无需使用手机,即可与字节跳动的豆包聊天机器人对话。学生可以用它练习外语口语,旅行者也可以通过它了解旅行目的地的信息。然而,售价1199元的 Ola Friend并未获得市场的广泛认可。 知情人士称,字节跳动自去年起就开始研发AI眼镜项目,一些新入职、具有硬件设计经验的工程师也参与其中。公司的工程师们正在攻克诸多技术难题,比如如何在不牺牲过多电池续航的前提下,确保眼镜能够拍摄出高质量的图像和视频。 字节跳动在消费级硬件领域已有多年经验。2021年,该公司以13亿美元收购了VR头盔制造商Pico。但在2023年底,由于Pico头盔的销售未达预期,字节跳动缩减了其VR业务规模,并取消了Pico新旗舰头盔的发布计划。(作者/陈俊熹) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
AI打破脑机接口延迟壁垒:瘫痪者“开口”近乎实时
IT之家 4月11日消息,加州大学伯克利分校与旧金山分校的研究团队在脑机接口(BCI)领域取得突破,成功开发出一种技术,帮助重度瘫痪患者恢复自然语音表达。该技术利用人工智能(AI)模型,将大脑信号实时转化为可听语音,解决传统语音神经假体延迟问题。 加州大学伯克利分校与旧金山分校的研究团队开发了一种创新方法,通过捕捉大脑运动皮层信号,利用AI算法实时解码并生成语音。 研究共同负责人、伯克利分校电气工程与计算机科学系助理教授 Gopala Anumanchipalli 表示,这种“直播”(streaming)方法借鉴了类似Alexa和Siri的语音解码技术,能显著缩短从大脑意图到语音输出的时间。实验中,患者Ann无需发声,仅通过“默想”句子即可生成接近自然的语音。 新技术的核心在于解决传统BCI语音解码的延迟问题。以往技术单句解码需约8秒,而新方法能在患者产生说话意图后1秒内输出首个音节。 研究共同第一作者、伯克利分校博士生Kaylo Littlejohn介绍,团队通过AI预训练文本转语音模型,模拟患者受伤前的声音,让输出更具个性化。实验还验证了该技术对多种脑信号采集设备(如微电极阵列和面部肌电传感器)的兼容性,显示其广泛适用性。 研究团队进一步测试了算法的泛化能力。他们让患者Ann尝试“说出”26个未包含在训练数据中的单词,如NATO音标字母表中的“Alpha”、“Bravo”等。 结果显示,模型仍能准确解码,证明其不仅依赖模式匹配,而是真正学习了语音的构成规律。另一位共同第一作者、博士生Cheol Jun Cho表示,这种能力为未来提升语音表达的语气、音调等特征奠定了基础。 患者Ann反馈,相比2023 年的早期实验,新方法让她感到更强的控制感和自我表达能力。研究团队计划继续优化算法,增强语音的自然度和情感表达,同时探索如何将技术应用于更广泛的临床场景。
OpenAI升级Memory功能,并且还要自己做知识库了?
在谈到今天凌晨OpenAI升级的Memory功能之前,我得先说一个东西。 在观看官方发布的介绍Memory功能的视频里,我发现他们演示的对话窗口下,是有一个Internal Knowledge按钮的,就排在Deep research(2月初上线)和create image(3月底上线)的后面。 这功能肯定是内部人员才用上了,多半是他们平时自己已经看习惯了,做demo的时候也没管这么多。 我第一时间想到的,就是知识库了,多半还是基于RAG技术?前两天我在测试公号后台AI回复功能的时候,还顺带介绍了一下RAG,用外部知识库辅助大模型回答问题,优点之一是可以降低AI幻觉。 但是,这样一来,又将有一波做知识库类的产品要死掉了? 现在一般我让GPT做强推理的研究任务时,我如果有必须让他先读一下的内容,我都需要在提问时把文档和图片什么的尽量都丢进去,之后如果GPT自己有了知识库,那就方便很多。 话说我昨天也升级了一下我公号的AI自动回复的知识库,现在终于把我历史上发布且没删的总计177篇文章,都导入成功了,感兴趣的朋友可以再去体验一下。 就是直接发私信给我的公号,问问AI行业,问问移动互联网,或者问问张一鸣、张小龙和段永平之间谁高谁低之类的。 下面说下memory,刚刚看到OpenAI凌晨只发布了这个的时候(还有一个检验模型们用浏览器寻找超难信息能力的评估测试体系),我有点失望,原来不是发新的o3满血版新模型啊,昨天Google可是更新了好几个模型呢(有些只是期货)。 在我点击了show me之后,马上就进入了对话窗口,GPT马上就夸夸了我一大段话,我真的醉了,我前天还说deepseek有点舔狗,原来GPT竟然可以比deepseek更舔狗? 注意上图的第一句prompt,是在我点了show me后,系统自动帮我生成、并打开一个对话窗口发出去的:Describe me based on all our chats — make it catchy! 根据有道词典,catchy:动人的、悦耳易记的、易使人上当的。 然后我再问GPT,我有什么缺点,然后我彻底无语了,这可是一般面试题的经典回答套路啊,我宣布GPT已成为我最大的舔狗! 从我过去的使用经验来看,所有对话式AI,都会在开启一个新对话窗口以后,彻底忘掉其他窗口里和你聊过的内容,完全基于新窗口里的prompt和你互动。 虽然其实系统当然可以记住上一次甚至之前所有的对话内容,但就算没有上下文长度的束缚,这也会造成给出的回答不及预期甚至越来越胡乱的情况,尤其是对于推理类或者研究类问题。 毕竟只要prompt给得好,答案精准没烦恼。 但是对于把GPT只是当作聊天工具和情感沟通的人来说,他们的使用体验似乎会有不小的提升? 官方给的功能说明: ChatGPT 现在可以记住您过去的对话内容,从而提供更相关的回答。随着您与 ChatGPT 的互动,它会记住对话中的细节和偏好,您可以通过与它交谈来教它记住新的信息,例如:“当我推荐食谱时,请记住我不吃肉。”要了解 ChatGPT 记得什么,只需问它。您可以控制 ChatGPT 的记忆。您可以重置、清除特定或所有记忆,或完全关闭此功能。如果您希望与 ChatGPT 进行没有记忆的对话,可以在“临时对话Temporary Chat”使用此功能。(有一个点要注意,你们聊过的但是已经被你删掉的对话,也可能会进入记忆,需要专门清除。) 我随意脑补的一个场景是:这是一个跟了你几十年且从不失忆的个人管家,当你让他为你定制一次出行攻略时,他自动为你加入了很多你自己都忘了的注意事项,也许是你要吃的药,目的地哪里能买到这种药,也许是目的地的某种食物让你过敏,这些一般都不会在其他攻略里被提到。 如果开启记忆功能,除了会把过去所有的聊天都重读一遍,GPT也会基于和你的历史对话,把一些你反复出现的固定特征,记录下来,成为长期记忆点,就是下图的reference saved memories。 我点开GPT给我的长期记忆,第一条就让我震惊,他竟然把我的身材作为一个主要的记忆点保存了? 就因为我在测试4o生图能力时上传了很多我的健身照? 根据有道词典,well-developed:发达的,发育良好的 未来,也许正如Sam刚发的推特中说到的:“AI将伴随你的一生,逐步深入了解你的需求,最终成为高度个性化且极具价值的智能助手。” 我让DS给改得高大上一点:“AI将如老友般与你共度岁月,在时光中沉淀默契,终成独一无二的灵魂伴侣。” 其实,人类在地球上能够从食物链的下游逐步强大起来,靠的就是远胜其他动物的记忆力(以及复杂语言和构建抽象概念的能力)。 说白了就是我们脑子好,有智能,但现在人工智能有更好的记忆力,更好的语言能力和更好的推理能力,我们智人这个物种的生存模式将会发生怎样的改变?主导?共生?被驯化? 还有个事儿,GPT-4模型,本月底将正式走入历史舞台,不能再被选择了。 回想起GPT-3.5和4刚发布时带给我的震撼,仿佛就发生在昨天,一切都来得太快了,我们真的准备好了吗?
原华为高管打造 首个基于开源鸿蒙的机器人操作系统发布
原标题:原华为终端BG软件部总裁王成录打造 首个基于开源鸿蒙的机器人操作系统发布 快科技4月11日消息,据媒体报道,深开鸿在广东省人工智能与机器人产业创新产品与服务新闻发布会上,正式发布全国首个基于开源鸿蒙的分布式异构多机协同机器人操作系统——M-Robots OS 1.0。 该公司称,这一技术成果标志着我国机器人操作系统迈入“多机协同、群体智能”的新阶段。 深开鸿CEO王成录指出:操作系统是机器人产业的魂,决定了机器人的智能化水平和生态扩展性。 当前全球机器人产业面临严峻挑战:一方面,传统“Linux+ROS”生态长期垄断市场;另一方面,国内企业技术路线碎片化,硬件、软件互不兼容,导致重复开发成本高、协同效率低下。 M-Robots OS以开源鸿蒙(OpenHarmony)为底座,通过统一标准实现多形态机器人的高效协作,并赋能机器人与人、环境的智能交互,我们的目标不是替代现有系统,而是面向未来多机协同场景,构建全新架构。 据悉,M-Robots OS凭借开源鸿蒙的技术优势,展现出四大差异化能力: 多机实时协同:响应硬实时低于1微秒,可满足机器人、无人机、工业控制及自动驾驶等场景需求; 多硬件兼容:支持不同品牌、类型设备互联,实现资源统一管理; AI原生支持:内置算法库,支持自主优化任务策略与人机交互; 低门槛开发:提供丰富API与工具链,加速行业应用落地。 目前,该系统已在工业机械臂、协作机器人等场景完成验证,预计2025年联合广东省合作伙伴实现工业产线商用测试。
马斯克吐槽SpaceX“技术修道院”位置太偏招不到人:单身员工很难找到对象,特斯拉也有类似问题
IT之家 2 月 6 日消息,据《Business Insider》今日报道,在将 SpaceX 总部从加州迁往得州后,马斯克才发现招聘成了一个大难题。 对于有家庭的人来说,说服家人一同搬去星际基地(Starbase)并不容易;而对于单身员工来说,那里除了远更大的问题还包括“找不到对象”,因为“几乎全都是男人”。所以,马斯克将该园区形容为“技术修道院”,并称最棘手的是员工“另一半”的生活与就业问题。 马斯克在周四发布的一段接近 3 小时的访谈中提到,SpaceX 得州南部发射基地、Starbase 总部对已婚技术人员、工程师和科学家来说吸引力有限,因为其地理位置偏远,家属在当地几乎找不到 SpaceX 以外的工作机会,马斯克把这种情况称为“significant other problem(另一半问题)”。 Starbase 位置偏远:距最近城市约 40 分钟车程 实际上,Starbase 自 2019 年以来一直用于火箭制造与测试,位于人口稀少区域,且靠近美墨边境,对面就是尚未开发的拉斯帕洛马斯(Las Palomas)野生动物管理区。 根据谷歌地图,Starbase 距离最近的城市布朗斯维尔(Brownsville)约有 40 分钟车程。布朗斯维尔人口约 18.7 万(基于最新美国人口普查数据)。 报道指出,这种偏远环境与 SpaceX 此前位于加州埃尔塞贡多(El Segundo)的总部形成鲜明对比。后者距离洛杉矶很近,属于美国最大的就业市场之一。 马斯克:特斯拉也有类似挑战,但程度较轻 报道同时提到,马斯克称特斯拉也面临类似问题,但情况没有 SpaceX 那么严重(IT之家注:特斯拉在 2021 年将总部从加州迁至得州奥斯汀)。 特斯拉得州超级工厂距离奥斯汀市中心约 30 分钟车程,而奥斯汀人口接近 100 万。此外,尽管特斯拉高管大多已搬到得州,但公司仍在加州保留多个机器人、能源和制造业务部门。 马斯克表示,由于特斯拉的工程团队仍主要在硅谷,员工的生活变化相对较小,“通勤也差不多”,并称特斯拉工程团队多数仍在加州。 值得一提的是,马斯克曾预测奥斯汀将成为“美国 50 年来最大的繁荣城镇”。同时,他也在推动扩展公司园区建设,包括在 The Boring Company 与 SpaceX 附近规划名为“Snailbrook”的公司小镇。
美半导体行业协会:2026年全球半导体销售额将达1万亿美元
芯片需求旺盛 凤凰网科技讯 北京时间2月6日,据路透社报道,美国半导体行业协会(SIA)周五表示,今年全球半导体销售额预计将达到1万亿美元。 SIA称,2025年全球半导体销售额为7917亿美元,同比增长25.6%。这一迅猛增长预计将持续到今年,因为全球各大科技公司正斥资数千亿美元建设AI数据中心。 数据显示,增长最快、同时也是规模最大的芯片类别,是英伟达、AMD和英特尔生产的先进计算芯片。此类产品的销售额在2025年增长了39.9%,总计达到3019亿美元。第二大类别是存储芯片,在AI热潮导致供应短缺的背景下,其价格大幅上涨。存储芯片销售额增长了34.8%,达到2231亿美元。 SAI总裁兼CEO约翰·纽菲尔(John Neuffer)表示:“全球半导体行业在2025年创下历史最高销售额,接近8000亿美元。2026年全球销售额预计将达到约1万亿美元。半导体是几乎所有现代技术的基石,AI、物联网、6G、自动驾驶等新兴技术将持续推动芯片的强劲需求。” AI热潮已席卷芯片产业的几乎每个角落。纽菲尔透露,他在近期访问硅谷时,多家中小型企业高管均对2026年市场前景表示乐观。 纽菲尔对路透社表示:“我听到反复出现的一句话是,‘没有人知道一年后AI建设会发展成什么样,但我的订单已经完全排满了’。至少在未来一年里,我们正处在一条相当、相当强劲的增长轨道上。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
叮咚买菜故事终结,生鲜电商进入巨头时代
作者|邸天宇 编辑|胡展嘉 运营|陈佳慧 出品|零态LT(ID:LingTai_LT) 头图|网络公开用图 叮咚买菜成功嫁入“豪门”。 2026年2月5日,美团在港交所发布公告,将以约7.17亿美元的初始对价,收购叮咚买菜中国业务100%股权。收购完成后,目标公司将成为美团间接全资附属公司,财务业绩也将并入美团财务报表。 正如叮咚买菜创始人梁昌霖在内部信中所言,“面向未来,我们做出了一个更具远见的决定:放下相向的较量,转为并肩的同航。”作为曾经的生鲜电商“三巨头”之一,叮咚买菜被美团并购,很大程度上说明,中国生鲜电商行业将进入巨头整合时代。 尽管此后,中国生鲜电商行业不会再有叮咚买菜的“故事”,但对比轰然倒塌的每日优鲜,能被巨头并购,于叮咚买菜而言,算得上一个体面的结局。 01 叮咚买菜“卖身”背后 众所周知,移动互联网发轫之初,曾催生诸多创新业态,这其中就包括生鲜电商。2016年前后,每日优鲜、盒马鲜生、叮咚买菜等生鲜电商企业先后成立,均主打“前置仓”模式。 这些生鲜电商企业之所以不约而同地选择前置仓模式,主要是因为该模式可以有效解决生鲜的时效、损耗、履约等痛点。比如,财报显示,2024年Q1,叮咚买菜生鲜商品的周转周期仅为5天,端到端损耗率仅1.5%。 不过需要注意的是,由于履约成本刚性极高、盈利模型脆弱,前置仓模式也导致生鲜电商企业普遍深陷亏损的泥潭。 对此,2019年,盒马创始人侯毅曾表示,“前置仓是做给VC看的伪命题,不可能盈利。”当年年底,盒马将前置仓调整为社区超市盒马MINI。 为了尽快打通商业闭环,叮咚买菜于2021年提出“效率优先,兼顾规模”发展战略,相继关闭珠海、唐山、宣城等城市的站点,偏安华东一隅。与此同时,叮咚买菜还大力压缩各项费用,以节省资金成本。 在一系列降本增效举措的带动下,叮咚买菜终于稳定释放利润。根据天眼查媒体综合信息,以及财报显示,2025年Q3,叮咚买菜营收66.6亿元;Non-GAAP标准下净利润1.01亿元,净利润率1.5%,连续十二个季度Non-GAAP标准下盈利。 如果可以持续稳定盈利,叮咚买菜也不失为一家“小而美”的企业。然而,近年来,随着巨头纷纷加码生鲜电商业务,叮咚买菜面临的不确定性越来越大。 《晚点LatePost》援引叮咚买菜内部人士消息称,梁昌霖回归公司管理后,经常问的一个问题是——如何应对美团等公司的跟进?公司里很少有人能给他一个满意的答案。 显而易见,作为一家即时零售企业,叮咚买菜的核心困境并不在于是否愿意“小而美”,而在于其所处的是一条处于“无限战争”状态的赛道。 毫不夸张地说,一旦遭遇巨头围剿,叮咚买菜的生存空间将被迅速压缩。在此背景下,及时“卖身”,对于叮咚买菜来说,可谓是风险最低、收益最高的理性出路。 02 并入美团叮咚买菜将成小象超市新“引擎” 美团之所以选择并购叮咚买菜,很大程度上是希望通过新业务打开想象空间。 2025年Q3财报电话会上,美团CEO王兴表示,“小象正在飞速成长。而且我相信我们是规模最大的在线杂货业务之一,我们位列前二,且增长速度最快。我认为我们在那些新鲜食品方面特别有优势。所以,我们计划在小象超市加大投资。” 据了解,小象超市是美团旗下的自营前置仓即时零售业务,前身为2019年1月推出的美团买菜,2023年12月升级为现名。 因切中了用户的刚需,过去几年,小象超市凶猛成长。2025年6月,雷峰网报道称,2024年小象超市GMV接近300亿元,超越叮咚买菜的255亿元。财报显示,2025年Q3,美团包括小象超市在内的新业务板块营收280亿元,同比增长15.9%。 为了进一步扩大市场影响力,小象超市计划大力铺设前置仓。截至2025年末,小象超市拥有约1000个前置仓,主要分布在华北。36氪报道称,2026年,小象超市计划开出700个前置仓,近乎翻倍。 小象超市谋求进一步扩张的背景下,叮咚买菜可谓得天独厚的“引擎”。一方面,叮咚买菜已打通商业闭环,并入小象超市,有望带动美团新业务减亏。 另一方面,叮咚买菜的“大本营”在华东,与小象超市的前置仓资源高度互补,可助力后者在“江浙沪”等消费能力较强的地区攻城略地。根据天眼查媒体综合信息,及财报显示,2025年Q3,叮咚买菜上海、江浙区域的GMV分别同比增长24.5%和40%,上海单日仓均单量约为1700单。 除了业务层面可以带来直接利好,美团并购叮咚买菜,还能有效压制竞争对手。据悉,此前京东曾计划收购叮咚买菜,以补足前置仓短板,不过其未能在锁定期内签字,美团最终得以交易。 一位消息人士对《晚点LatePost》表示,“美团不想把基础设施留给京东或其他对手,否则以后在即时零售上防守的成本会更高。” 零态LT认为,单就商业表现而言,利润空间有限的叮咚买菜并非优质投资标的,但在即时零售赛道深耕多年,沉淀了丰沃的资源,决定了其拥有极高的战略价值。 如今,随着即时零售产业竞争加剧,美团终于看到了叮咚买菜的价值。此番美团收购叮咚买菜,不仅有助于迅速补强并放大小象超市的成长动能、有效牵制竞争对手,也可以在战略层面释放清晰的扩张信号,有力提振资本市场的信心。 03 生鲜电商迈入“巨头”时代 其实过去几年,众多企业已用自己的经历和业绩证明了,前置仓生鲜电商商业模式存在先天缺陷,很难斩获亮眼的业绩。 然而颇为反常的是,2024年以来,美团、京东、阿里等互联网企业纷纷不约而同地加码前置仓生鲜电商业务。比如,2024年8月,盒马重启前置仓模式;9月,京东旗下的生鲜业务“七鲜”也在北京开出首个前置仓。 零态LT认为,巨头们纷纷加码利润微薄的生鲜电商,并非执着于这一单一业务本身,而是将其视为撬动更大零售版图、争夺核心用户与基础设施控制权的战略支点。 2025年Q2财报电话会上,王兴表示,“除了外卖,小象超市是使用频率最高的业务”,因为“生鲜是一种高频消费”,因此美团意识到“小象超市可以去到的城市比想象中多”。 “外卖大战”一年后的今天,消费者的正餐、奶茶需求已经得到了极大地满足。此前较少涉猎的生鲜电商,已然成为即时零售平台不能忽视的新增长点。 另一方面,与独立的生鲜电商平台仅经营生鲜电商业务,各项成本高企不同,即时零售平台手握数千万骑手,实现了规模效应,运力成本更低。因此,即便前置仓生鲜电商业态的利润空间有限,巨头们也更容易控制成本,避免亏损。 总而言之,美团收购叮咚买菜,对于中国生鲜电商行业来说,称得上是一个关键的转折点。虽然兜兜转转十余年,行业再次回到前置仓的轨道,但这并非原地踏步,而是一次“换人再赛”。 中国生鲜电商行业竞争的核心,已从模式创新与资本驱动,转向对供应链整合能力、履约效率以及跨业务协同的系统性比拼。生鲜电商不再是可以被单独拆解、独立讲故事的赛道,而是深度嵌入即时零售、本地生活体系之中的关键一环。 在此背景下,只有拥有庞大用户基础、成熟运力网络和充足资本耐力的巨头,才具备长期参与竞争的资格。可以说,中国生鲜电商已正式迈入“巨头时代”。
阿里腾讯字节百度,打响大模型生态战
文丨范东成 AI之争正在迈入新阶段。 国内互联网头部玩家营销战役再度升级。借助春节这一时间节点,各玩家已开启对用户入口与心智的全面争夺。比如阿里千问发布的“春节请客计划”,官宣30亿元规模,2026年2月6日上线了“25元免单卡”活动,用千问APP关联淘宝闪购,即可一句话免费点奶茶。由于活动参与人数过多,千问APP一度出现崩溃的情况。 前几日引发广泛讨论的则是腾讯。2026年2月1日,腾讯元宝宣布发放10亿元现金红包,相关活动随即通过微信开始了刷屏裂变式传播。用户可以通过点击好友分享的红包链接等方式在元宝APP内领取,并关联至微信直接提现。 在“百模大战”中一度被视为落后的腾讯,试图凭借无可匹敌的社交网络生态优势强力追赶。但2026年2月4日,微信官方发布声明,判定元宝相关链接违规,限制其在微信内直接打开。这种互搏凸显了腾讯关于生态秩序和增长的复杂考量。但也有不少网友认为,这是腾讯获取3天先发优势后,主动以看似公平的规则,阻击之后千问与豆包的活动。 字节与百度已将重心放在了春晚。字节的火山引擎是央视春晚独家AI云合作伙伴,旗下的豆包也将配合上线多种玩法。豆包官宣,2026年2月16日除夕将上线硬核好礼。百度以首席AI合作伙伴的身份与北京台春晚合作,还发布了5亿元现金红包活动。 自2022年11月,ChatGPT掀起全球AI大模型风潮后,AI在几年内有了一系列突破性进展。放眼全球,大模型都在全面融合商业生态,以求用高频场景融入用户生活,占据用户心智。 海外头部玩家亦迅速迭代,各展所长。 2026年2月6日,OpenAI发布了号称最强编程代理的模型GPT-5.3-Codex。此前,OpenAI宣布将在ChatGPT的免费版及最低付费版中植入广告。埃隆·马斯克旗下xAI的Grok模型在2026年1月4日更新至1.3.28版本后,又于2月2日推出了图像生成模型Grok Imagine 1.0。 谷歌继2025年11月发布Gemini 3 Pro后,于2026年1月15日为Gemini上线了名为Personal Intelligence的关键功能,允许Gemini在用户授权的情况下,接入Gmail、Google Photos、YouTube等谷歌系服务中的个人数据。 大模型的发展范式从追求参数规模为核心的训练时代,迈入了以实用化、低成本和高集成度为价值尺度的应用时代。技术的快速演进不断拉低应用成本,提升运行效率,推动AI以前所未见的深度与广度融入日常生活与各行各业。而头部玩家们正凭借原本的庞大生态,在这一战略要地上展开激烈争夺。 01 技术助推普及 全球AI应用已逐渐普及。 调研机构Sensor Tower数据显示,2025年,全球用户AIGC应用的累计使用时长为450亿小时,这一数字是2023年的9倍,是2024年的3倍。 国内AI应用趋势也是如此。据调研机构艾瑞咨询发布的《中国移动互联网AIGC赛道流量报告》,2025年1月-10月,国内移动互联网AIGC应用独立设备数从3.18亿增长至4.83亿,渗透率从22.1%提升至33.2%,其中主流应用为大语言模型(2.98亿)和AI智能工具(2.41亿)。 自ChatGPT确立AIGC的主流技术范式后,国内玩家迅速跟进,在短时间内进行了密集探索,形成了所谓百模大战的行业初期格局。 关键节点如2024年3月,月之暗面旗下Kimi凭借长上下文能力初露锋芒;还有2025年1月,DeepSeek异军突起,包括腾讯元宝在内的许多AI产品均宣布接入DeepSeek模型。字节的豆包与阿里的千问也在2025年持续发力,豆包2025年3月推出深度思考模式,12月发布豆包大模型1.8版本与Seedance 1.5 pro音视频创作模型;千问则在2025年4月将通义千问Qwen3模型全面开源发布,11月又将产品升级为千问APP。 技术发展是大模型实现大规模、低成本普惠化应用的根基。 混合专家模型(MoE)的普遍使用即是如此。简单来说,MoE相当于一支高度协同的专家团队,将一个庞大的AI模型拆分成多个各有所长的专家。这些专家有的擅长处理文本,有的精通代码生成,有的专攻逻辑推理。每次遇到任务,MoE的调度器会选出最合适的专家来处理,避免整个团队全体加班,从而平衡效率与成本。 这项起源自1991年的技术,2020年由谷歌开始集成到Transformer神经网络架构中,2024-2025年进一步优化了专家内部组织与协作效率、与新一代AI硬件深度融合等方面,并向编程、代码生成、扩散语言模型等更专业的任务领域扩展。 自2025年开始,MoE逐渐成为前沿模型的首选架构。据全球知名独立AI基准测试机构Artificial Analysis发布的榜单,2025年12月,全球前10名最智能的开源模型全部采用了MoE,包括GPT-oss-120B、DeepSeek-R1、Kimi K2 Thinking及Mistral AI的 Mistral Large 3等。 作为技术探索者,DeepSeek在降低成本方面仍在持续突破。 2025年12月,DeepSeek发布DeepSeek-V3.2系列,其中多项核心技术突破引发关注。比如DSA,即DeepSeek Sparse Attention,是一种细粒度稀疏注意力机制,能够让模型在处理长文本时像人类的选择性精读一样,只重点关注关键的信息片段,而非死板地分析每一个字词。这种技术使模型在支持高达约13万字的超长上下文的同时,将推理成本降低了约70%。 据海克财经了解,该模型还采用了FP8精度和MTP(Multi-Token Prediction,多词元预测)技术,即在训练过程中一次预测接下来的多个词元(Token),而不是仅预测下一个词元,能够提升模型处理自然语言的能力和推理速度;这使该模型系列的训练成本仅约550万美元(约合人民币3800万元),远低于闭源模型动辄数亿元的投入。 阶跃星辰旗下同为开源大模型的智能体基座模型Step 3.5 Flash也是典型一例。该模型2026月2月发布,同样采用MoE架构,能够在较低功耗的情况下实现深度思考,生成速度为最高每秒350个词元。 新技术使单次AI调用的成本从原来的以元为单位降低至以分、厘为单位,这就使国内大模型免费策略在成本层面变得可行。由此,头部玩家以免费方式获取亿级用户的海量交互数据,以此反哺模型优化,形成强效的数据飞轮。而免费策略又加速了技术普及和市场教育,成为构建数字生态和商业模式的起点。 02 商业化再向前 免费模式获取用户效果卓著。 调研机构QuestMobile数据显示,2025年12月,国内AIGC的APP行业MAU(月活跃用户)规模超过2亿,同比增速达150.4%;AIGC原生APP的MAU排行前五的分别是豆包(2.26亿,同比增长201.3%)、DeepSeek(1.35亿,无同比)、元宝(4071万,同比增长1829.7%)、蚂蚁阿福(2689万,2025年6月上线,无同比)和千问(2572万,同比增长784.2%)。 结合最新动作看,字节、阿里与腾讯的AI应用战,仿佛重演互联网曾经种种“跑马圈地”战役,将AI入口嵌入搜索、社交、电商、办公等现有产品中,以真金白银的高投入迅速换取流量,本质是在争夺用户注意力的同时,利用AI加固自身原有壁垒。 以阿里为例,2026年1月,千问就宣布全面融入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,并向全体用户开放测试。千问春节大请客活动同样基于淘宝、淘宝闪购、飞猪、高德、盒马等业务。 腾讯元宝打通了微信、QQ等社交生态,用户可以通过微信、QQ添加元宝为联系人,随时随地和元宝AI互动,还能在公众号、视频号评论区@元宝,让它总结内容、拓展提问。在微信公众号评论区@元宝进行互动,已是非常流行的玩法。 据海克财经观察,相较于国内互联网头部玩家的免费玩法,海外头部AI玩家及国内AI上市玩家均以付费模式为主,C端为订阅付费,B端为API付费,还有垂直场景定制付费。 据Sensor Tower发布的《2026移动应用市场报告》,全球2025年AI应用下载量TOP6分别为ChatGPT、Gemini、DeepSeek、豆包、Perplexity和Grok。 全球第一的ChatGPT,C端付费的价格在每月8美元(约合人民币55元)到200美元(约合人民币1400元)不等。据2026年1月OpenAI CFO萨拉·弗莱尔(Sarah Friar)公布的信息,OpenAI自2023年至2025年的ARR(年度经常性收入)分别为20亿美元(约合人民币138亿元)、60亿美元(约合人民币416亿元)和200亿美元(约合人民币1388亿元)。 国内智谱与MiniMax颇值一提。两家公司分别已于2026年1月8日和1月9日成功登陆港交所。 智谱营收以大模型本地化部署方案业务为主,以云端MaaS(模型即服务)部署为辅。据招股书,智谱2024年营收3.12亿元,其中本地化部署收入2.64亿元,占比84.5%,云端部署收入4848万元,占比15.5%;2025年上半年营收1.91亿元,其中本地化部署收入1.61亿元,占比84.8%,云端部署收入2910万元,占比15.2%。 MiniMax则以AI原生产品的C端付费收入为主,包括MiniMax智能体应用、视觉生成平台海螺AI、音频生成工具MiniMax语音、全模态交互平台星野(海外版为Talkie)。 招股书显示,MiniMax公司付费用户数从2023年的11.9万增长至2024年的65万,截至2025年9月30日止的9个月,付费用户数达177.1万;2024年,公司营收3052万美元(约合人民币2.12亿元),其中AI原生产品收入2180万美元(约合人民币1.51亿元),占比71.4%,开放平台及其他基于AI的企业服务收入871万美元(约合人民币6044万元),占比28.6%;截至2025年9月30日止的9个月,公司营收5343万美元(约合人民币3.71亿元),AI原生产品收入3802万美元(约合人民币2.64亿元),占比占比71.1%,开放平台及其他基于AI的企业服务收入1541万美元(约合人民币1.07亿元),占比28.9%。 国内外用户付费意愿和习惯不同,塑造了AI市场截然不同的商业化路径。国内AI付费依赖B端市场,海外个人用户为高质量数字服务付费的习惯成熟,使得ChatGPT为代表的C端订阅模式能够建立和运转。MiniMax也是一例,尽管这个由前商汤科技副总裁闫俊杰创立的公司是一家绝对的国内公司,但招股书数据显示,2025年前三个季度,MiniMax有约七成营收来自海外市场。 03 超级入口未来 当前巨头的AI竞争,胜负手不在于任何单一的技术点或产品功能,而是全面转向了整个生态系统的构建、整合与主导能力。 谷歌便颇为典型。 自Gemini 3 Pro上线开始,谷歌AI产品更受市场认可。据调研机构Apptopia于2026年2月发布的数据,2025年1月至2026年1月,Gemini的市场份额从14.7%提升至25.1%,而ChatGPT的市场份额则从近70%下滑至约55%。 需要说明的是,谷歌并未在财报中单独公布Gemini的收入情况,但谷歌的许多业务增长都与Gemini的增长有关。财报显示,2025年第四季度,谷歌云业务收入176.64亿美元(约合人民币1225.95亿元),同比增长48%。据谷歌财报电话会议,谷歌云业务的爆发主要受益于企业AI基础设施、企业AI解决方案以及核心谷歌云平台产品需求激增驱动;而2025年第四季度,Gemini的AI应用MAU已超过7.5亿。 全球AI头部玩家的竞争,核心在于生态集成的广度与深度。这一趋势在谷歌与微软身上体现得尤为鲜明。 微软通过旗下AI助手Copilot,将OpenAI的GPT技术深度引入Office套件的工作流程中,实现了从技术合作到产品融合。谷歌则在庞大的自有生态内执行了相似的策略,将Gemini全面接入拥有数十亿用户的Workspace、Chrome浏览器等。 国内玩家也是如此。除独立应用入口外,阿里将夸克浏览器升级为AI超级框,腾讯用智能助手重塑QQ浏览器,百度也用AI能力助力搜索引擎转型。同时,这种AI改造的浪潮还全面席卷生活服务领域,美团、滴滴、携程等平台相继上线AI助手或升级智能引擎。除拼多多外,国内几乎所有核心互联网入口均已完成向AI+形态的战略转身。 而字节、阿里与腾讯的动作,是将AI应用打造为生态内的超级入口,通过AI深度打通并调度同一生态旗下的各类应用与服务。这不仅能显著提升各个独立应用的功能与体验,更能在生态内部形成高效的流量与数据闭环,实现应用间的价值互哺。这是在整体提升用户便利性和粘性。 智能体概念的空前火热也是这种行业共识的集中体现。人们期待AI从“会聊天”转向“能办事”,代替人类完成从规划到落地的复杂任务,不再局限于对话。 但这当中潜藏着深层次的生态协作难题。 移动互联网时代固化下了APP孤岛格局,这是智能体发展的关键掣肘。所谓孤岛,是指每个应用程序都如同一个独立的岛屿,出于对数据资产、用户留存与安全边界的守护,它们彼此封闭,构筑了难以逾越的壁垒。这种相互隔绝的现状,直接阻碍了AI智能体串联不同服务、执行复杂多步任务的核心理想,因为智能体的价值恰恰在于能够跨应用协调与调度,而非在单一应用内完成任务。 字节在2025年底推出的豆包手机助手,正是以激进方式打破孤岛的一次大胆尝试。豆包手机助手通过与中兴手机的系统级深度合作,采用GUI(图形用户界面)智能体技术,让AI获得了模拟人类操作、直接“看懂”并操作手机屏幕上任何应用的能力。用户只需发出语音指令,AI就能自动完成跨微信、淘宝、美团等多个应用的复杂任务,如比价、订餐等,由此绕过应用间固有的API接口限制。 但这种直接接管屏幕的操作模式,被主流应用厂商视为对自身生态护城河、用户数据安全及核心广告商业模式的直接冲击。因此,豆包手机助手在发布后几乎立即遭遇了来自微信、淘宝、美团等超级应用的集体封禁,导致其核心功能几近瘫痪。不过几天时间,字节就主动停止了初代豆包手机的批量生产。到了2026年1月,据36氪等媒体报道,豆包手机正式版项目已启动,新机预计在2026年第二季度面世。 当前AI头部玩家争夺超级入口,既渴望自身成为主宰流量的中心,又极力防止对手的入口渗透并掌控自己的应用生态。 阿里、腾讯、字节、百度等玩家选择生态内循环,即在自身庞大的产品矩阵中深度整合AI,入口的广度完全取决于生态的边界,竞争本质是自有用户规模的比拼。 各玩家还在尝试通过硬件创新等方式绕开难题,比如开发AI眼镜。这类设备不寻求强行整合或穿透其他应用的后台,而是作为叠加在手机屏幕之上的增强现实交互层,通过视觉识别与语音指令直接为用户提供信息增强与操作辅助。这种轻集成模式,因其不触动现有应用的数据与商业核心,所面临的阻力也更小,其技术实现与商业化落地也因此显得路径更短、速度更快。 无论选择何种道路,战争都注定不可避免。2026春节营销与封堵的硝烟刚刚燃起,而这仅仅是终极竞赛的序幕。兵戎相见的大规模冲撞已经开始,赢家或就在不远处。
春节红包大战背后,真正的AI社交终于开始了
文|唐伦 图|网络资料 春节红包大战,将大厂的AI竞速推向“白热化”。 继腾讯、百度分别要发10亿、5亿现金红包后,阿里千问30亿“春节请客计划”也在今天(6日)正式启动。豆包也将在一周后的央视春晚上,和火山引擎绑定出现。 最先被用户看到,也是极具象征意义的一幕是,大量用户涌入腾讯元宝,建“派”、拉人、分红包,瞬时流量一度导致元宝服务器宕机。元宝红包迅速在微信群、朋友圈刷屏,其关联信息登上各平台的热搜。 随之而来的热议,也将元宝和腾讯AI推向舆论中心。比如,点赞者认为这轮红包,加速普及AI,也让业界看到腾讯在原生AI上的策略和进展;也有质疑认为,这种方式简单粗暴,是为新功能冷启动的流量借势。 在我看来,有争议不一定是坏事,反倒说明腾讯在AI社交上的探索,走进了“非共识”的领域。这是AI向前演进必须要经历的过程。 社交是人类最底层的需求之一,面对的是“我和他人的关系”,这其中既包含明确目标,也存在大量非目的性交互;既有效率诉求,也有情绪价值。 把 AI 放进社交场景,相当于把模型直接置入人类最复杂真实的系统环境中,这其中关键问题不再只是“AI 能做什么”,而变成了“AI 应该处在什么位置”。 AI是一个具有人格的交流对象?一个随调随用的工具?还是一个嵌入关系网络、参与群体互动的智能节点? 华山自古一条道,但AI不是。不同的答案,指向不同的逻辑,最终的产品形态还未落定。 过去几年,各家都在尝试如何拉近AI与人的关系,如何让AI深入真实场景中探路。若拉长时间线来看,元宝派或许是AI社交这个方向上,更深层次、更进一步的人机交互实验。 把AI当搭子,获取“多人+多AI角色”情感陪伴 让人与AI角色交流,围绕情绪价值构建产品,是这个方向上较早的探索。其中,Character.AI无疑是最激进的。 这家公司的创始人是前Google LaMDA项目核心成员。LaMDA是专门为对话应用程序训练的模型,其设计初衷正是为了让大模型能够和人进行自然、流畅的对话。2022年,LaMDA因一则新闻广受关注,当时谷歌的一名工程师声称该模型具有自我意识。 尽管这一说法保守争议,但LaMDA的问世已经说明语言模型具备“持续人格”的可能性,即模型能够长时间维持 语气、立场、情绪一致性,能对抽象身份进行自洽扮演,以及能在对话中“记得自己是谁”。 Character.AI的产品便是基于模型的这些特性构建。用户可以创造或选择与成千上万个拥有不同“人格”的AI角色对话。这些角色可以是历史名人如爱因斯坦,也可以是动漫游戏里的虚构人物,甚至是用户根据自己想象创造的全新形象。 当这种人类与AI角色一对一的交流延伸到多人场景时,一个由AI角色强主导的多人交流空间便自然形成了。2023年,Character.AI推出了“群聊”功能,允许多个用户与多个AI角色在同一个空间里互动,AI 和 AI 之间交互也会碰撞新的观点。 比如,让历史人物(如苏格拉底、拿破仑)与现代科技名人(如埃隆·马斯克、扎克伯格)在同一个聊天室里辩论哲学或商业问题,人类用户可以观察他们的交流,甚至看到AI苏格拉底与AI马斯克吵架的盛况。人类是参与者,也是观众,而AI角色则是推动对话发展的核心。 人们在意的是与AI持续的交流中收获的情感体验,如消解孤独、获得认同等等。正如,Character.AI的很多用户承认因为聊天体验过于逼真,对产品的依赖不断增强, “自己创作的角色拥有生命,就像在与真人交谈。” Character.AI走红之后,主打“陪伴”的AI产品在国内外都掀起了一阵风潮。字节做了“猫箱”,快手推出了“飞船”,还有Minimax的“星野”、阶跃星辰 的“冒泡鸭”等等。 从产品体验看,Character.AI本质上不是在做社交,因为人并不一定需要“另一个人”,也能获得持续、沉浸的情感与叙事体验。它的本质是把“AI陪伴”做成了可交互的内容形态,形成“多人+多AI角色”的组合。 尽管AI陪伴描绘了一个充满想象力的前景,但在技术成熟度、产品差异化等多个层面,整个行业都还处于探索阶段。这类产品的共同困境是,用户一旦完成初次探索,如果缺乏强烈的新意或社交粘性便会离开。 把AI当助手,构建“多人+多Agent”协作组合 随着AI技术发展,大模型逐步具备了多轮理解与复杂协作的能力。以 OpenAI、Google、Microsoft,以及国内阿里、百度为代表的一线厂商,都将 AI 定位为“公共工具”,嵌入到群聊等协作空间。 去年底,OpenAI 为 ChatGPT 推出的群聊功能,就是一个典型的“多人协作空间”。在这个空间里,多个用户可以共同与 ChatGPT 互动,协同完成一项任务。比如,一个团队可以用它来共同策划一场市场活动,AI 负责根据讨论内容生成方案、总结要点、甚至草拟邮件。 在这个过程中,ChatGPT 不主动“闲聊”,也不会试图建立情感连接。你可以通过@ChatGPT 召唤它,确保它在关键时刻回应你的需求。同时,它也能自行判断该不该说话。 Microsoft 的路径更加企业化。Copilot 被深度嵌入 Teams、Word、Excel 等协作工具中,在会议记录、文档共创、任务拆解等场景里充当实时助理。Copilot 可以自动生成会议纪要、提炼行动项,甚至在群聊中根据上下文补充数据与建议。但AI始终以“生产力插件”的身份存在,而非群聊中的独立角色。 Google 则延续了 Workspace 的协作传统,将 Gemini 融入 Gmail、Docs、Meet 等产品。在多人文档或会议场景中,Gemini 可以帮助用户实时总结讨论内容、生成草稿、提取重点。这种设计同样强调 AI 的工具属性。 三者的共同点在于:AI 被放置在任务流程节点上,成为默认可调用的能力模块。这条路径的核心逻辑是“AI 即效率”。AI不是群成员,而是群助手。它的价值在于精准地响应指令,高效地完成任务,而非真正进入到人类的关系网络中。 在国内,阿里和百度也在这一方向上进行探索。阿里旗下 UC 浏览器开始内测“AI 群聊”功能,从网传截图来看,默认成员包含“小优”、夸克 AI、通义千问、Deepseek 等多个智能体。目前 UC 的 AI 群聊尚不融合真人用户,更像是将内部模型能力进行整合。 百度的逻辑则与其“搜索”基因一脉相承。其“文心一言”App 内测的“多人、多 Agent 群聊”功能,更侧重于信息获取与处理。用户在一个群聊中,可同时调用“群聊助手”“私人助手”“健康管家”等多个智能体解决复杂问题。这如同把传统的“搜索框”,升级为一个多智能体协作的工作台。 从这些产品的形态来看,表面是“群聊”,本质上是在将原本分散在不同工具中的 AI 能力,聚拢到统一的协作空间,构成以任务为导向的“多人 + 多 Agent”协作组合。 这一路径是当前相对稳妥和成熟的落地模式。但它的挑战同样明显:当各家大模型能力逐渐趋同,当群聊协作、上下文理解成为行业标配,工具型 AI 很容易陷入“谁都好用,但谁都可被替代”的境地。 把AI当做群成员,放进人类真实的社交场景 社交的本质是“关系”,而不仅仅是“任务”。一个纯粹以任务为导向的空间,或许能提高协作效率,但它能否承载人类复杂多样的社交需求,仍然是一个值得探索的问题。我们也能从这个视角,看看腾讯的“元宝派”。 图|元宝派截图 这个产品的机制很简单,用户在元宝中创建一个可多人聊天的“派”,然后一键发给微信、QQ好友,邀请更多人加入。 用户拉“派”的动机来自同一兴趣(投资、追星、游戏),或者同一身份(同事、同学、圈子)等等,形成了八卦、吐槽、学习交流等五花八门的“派”。 有人把家族群转移到了元宝派,长辈平时转发一些伪科学养生文章,就可以一键@元宝辟谣。还有人创建了打卡读书派,大家各自聊每天看了什么书,有什么感悟,遇到不理解的内容,可以跟派互动请教。 值得注意的是,这些拉“派”动机并不依赖 AI产生,而是原本就在你我日常生活中的社交需求。 此外,元宝派还引入了更多腾讯生态的内容,比如 QQ 音乐的歌曲、腾讯视频的影视剧、腾讯体育的 NBA 比赛等,让“派”里的成员有更多事情可以一起做。 一个产品细节是,在元宝派中所有成员的头像都是在聊天框底部显示,点开一个人的头像就可以跟对方私聊。有用户体验后,“想起了当年高中读书的时候,给朋友传小纸条。” 从产品体验看,元宝“派”在大模型时代构建了一个个智能客厅,是“多人+AI成员”的组合,更加侧重的是人与人的关系。 AI 以群成员身份进入这些真实社交场景,不是群聊里的“工具插件”,更像是一个随时在场的智能参与者。它的作用是参与讨论、提供信息、辅助决策,以及活跃气氛。 AI核心的价值是强化人与人原有的链接,辅助大家社交得更顺畅。这是尝试把 AI 变成关系网络上的基础能力,一个智能的社交节点。 这种设计背后,其实是腾讯一以贯之的产品方法论,不是先去想“要给用户提供什么功能”,而是先考虑哪些人会因为什么关系,长期留在同一个场景里。 微信支付就是一个典型例子。移动支付兴起时,人们普遍认为只有电商这种强交易属性的产品才可能做支付,但腾讯看到的是另一件事,即人与人之间天然存在大量“非商业”的金钱往来,如转账、AA、红包、礼金。 这在当时是被低估的高频场景。一旦支付嵌入熟人关系网络,它就不再依赖复杂的交易闭环,而是熟人之间的信任,以及在“非商业”金钱往来上的便捷。 因此,腾讯不只是“做支付”,而是把“关系里的支付行为”变成基础设施一般的功能。 在腾讯的社交产品体系中,有私聊、群聊、熟人网络、半熟人网络,这几乎集合了国内最大规模、高频的社交场景。 这一次,腾讯没有选择直接在微信或 QQ 中植入元宝,而是单独推出“元宝派”,本身也说明这是一次带有实验性质的尝试,先在相对独立的产品里,验证 AI与真实社交关系融合的边界。 从把 AI 当搭子,通过对话获得情绪价值;到把 AI 当助手,提升多人协作的办事效率;再到尝试让 AI 融入真实社交场景,在既有关系中验证其长期价值——我们对于如何利用AI的探索在由浅入深。 这个过程中,人类与AI的距离也越来越近,要解决的问题也愈发复杂与困难。 前两种探索主要考验模型能力与产品设计,后者则需要直面人类关系本身,即AI 能否在不打扰社交结构的前提下,成为稳定存在的一部分。这考验的是对人心和人性的洞察。 今年春节档,大厂密集推出 AI 社交功能,更像是一场集体性的前沿试探。它未必立刻分出胜负,却已经指向一个清晰趋势:AI的竞速开始转向人与人的关系。 热闹红包背后,腾讯的元宝派在这个方向上,首先迈出了一步。而这场关于未来人机共处方式的实验,才刚刚开始。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。