行业分类:
加载中...
头条分类:
加载中...
网友玩疯!把照片变成3岁小孩画作火了:只需一句AI提示词
快科技5月7日消息,生成式AI还在卷更精致、更逼真的图像创作,海外社交平台却掀起了一股反向热潮。用户纷纷要求AI生成刻意简陋、画风粗糙的图片,甚至秉持着“越烂越好”的创作准则。 这股热潮的源头,是韩国创意总监、平面设计师Wonjae Gi。他最早在Threads平台分享了一段生成简笔画的提示词,还将其称作“世界上最无意义的提示词”。 WonjaeGi在采访中表示,网上越来越多打磨精致、充满电影感的AI图片,让他产生了强烈的审美疲劳。这些作品足够惊艳,但千篇一律的完美感让人倦怠。他才突发奇想,朝着完全相反的方向创作,只为好玩做出刻意笨拙、低质的内容。 4月底,OpenAI CEO山姆・奥特曼在X平台转发了相关帖子。这段提示词迅速在ChatGPT上走红,传播范围极速扩大。就连OpenAI刚上线、主打高清高质输出的图片生成工具Images2.0,都直接内置了这个提示词模板。马斯克旗下xAI的Grok Imagine也快速跟进,上线了同款粗糙画风的“Scribbli”模板。 目前全网流传最广的核心提示词为:“以最笨拙、最潦草、最糟糕的方式重绘附上的图片。使用白色背景,让它看起来像是用鼠标在微软画图软件里画出来的。整体要有点相似但又不完全对,带着让人迷惑的笨拙感,突出低质的离谱糟糕感。算了,随便你怎么画都行”。 (“Redraw the attached image in the most clumsy, scribbly, and utterly pathetic way possible. Use a white background, and make it look like it was drawn in MS Paint with a mouse. It should be vaguely similar but also not really, kind of matching but also off in a confusing, awkward way, with that low-quality pixel-by-pixel feel that really emphasizes how ridiculously bad it is. Actually, you know what, whatever, just draw it however you want.”) 跟风创作的用户,把个人照片、品牌logo、名人肖像都改成了歪歪扭扭的涂鸦。成品画风酷似90年代微软画图工具的手绘作品,五官歪斜、线条杂乱,像3岁小孩的随手涂鸦,凭借强烈的反差感刷屏社交平台。 OpenAI相关负责人评价,这股热潮充满欢乐、社交属性极强。在AI相关话题越来越偏向严肃的技术,商业博弈的当下,这种无门槛的轻松创作,给用户提供了完全不同的情绪价值。 这也不是ChatGPT首次带火AI绘图风潮,此前的职场漫画风、吉卜力风都曾刷屏社交平台,只是这一次,大家彻底放弃了对精致的追求,把“拙劣感”变成了创作核心。
为啥敢收费一年近万元?20位科学家亲测豆包 省下大量时间
快科技5月7日消息,豆包近期传出付费订阅,最高年费接近万元,引发不少网友讨论。 豆包方面给出底气,多位来自中科院、清华、南开等机构的科研工作者实测,豆包能显著提升科研效率,覆盖从文献、写作到代码、数据处理全流程。 不少科研人员表示,AI已经成为科研中不可缺少的工具。年纪偏大的工程师用豆包辅助写代码,忘记语法和用法时,直接询问就能快速得到答案,不用再花大量时间查资料。做实验遇到异常现象,也能通过AI快速排查可能原因,节省大量试错时间。 在学术写作上,豆包可以和文档联动,逐段改写、润色,对话容量大,交互顺畅,大幅减轻撰写和修改压力。文献调研、参考文献推荐、实验思路梳理,豆包都能快速完成,相当于随身科研助理。 数据处理、代码编写同样高效。生成滤波器代码只需要微调参数,就能直接使用。组会录音可以实时转成纪要,还能一键生成思维导图和PPT,把科研人员从繁琐事务中解放出来。 多位科研人员反馈,豆包样本库丰富、输出专业,能提供很多靠个人知识储备想不到的新思路和新观点,在归纳整理、思路启发上作用明显。 豆包基础功能仍可免费使用,付费版本主要面向高强度、高算力需求的专业用户。对于需要长期做研究、写论文、处理数据的科研人群来说,能实实在在节省时间、提升产出,这也是豆包敢定高价的重要原因。
AI学会“睡眠”!Claude记忆优化后任务完成率飙升6倍
快科技5月7日消息,据媒体报道,在旧金山举办的开发者大会上,人工智能公司Anthropic宣布为旗下智能体平台Claude推出一项突破性功能——Dreaming。 该技术允许AI在执行任务间隙进入类似睡眠的状态,通过模拟人类快速眼动(REM)睡眠机制,自动整理历史会话数据、优化记忆库并挖掘潜在规律,从而在“醒来”后显著提升性能。 传统AI代理处理复杂任务时,会将信息以碎片化方式存储于记忆库。随着会话次数增加,记忆库中逐渐积累重复条目、过时数据和矛盾信息,而AI缺乏全局视角,难以自主识别这些问题。 Dreaming功能通过定时运行的异步任务,同时读取现有记忆库及最多100个历史会话的完整记录,生成经过优化的全新记忆库。该过程包含三个核心步骤:合并重复数据、更新过时条目、提炼宏观规律,其运作原理与人类大脑在REM阶段将短期记忆整合为长期记忆的过程高度相似。 为确保系统安全,Anthropic设计了严格的控制机制。Dreaming生成的记忆库不会直接覆盖原始数据,开发者可先审查优化结果,再决定是否应用。 该功能还支持实时监控:开发者通过订阅会话事件流,可观察AI处理记忆的具体过程,并在发现问题时随时终止任务。借助自定义指令字段,用户可引导AI聚焦特定主题进行记忆整理,实现多维度优化。 针对AI输出质量不稳定的问题,平台同步推出Outcomes自动评分系统。开发者可制定包含成功标准的评分规则,系统会分配独立评估器对AI输出进行打分。当检测到缺陷时,评估器将精准定位问题并指示AI重新优化,直至满足标准。 内部测试显示,该功能使任务成功率提升最高达10个百分点。在文档生成场景中,docx格式任务成功率提高8.4%,pptx格式提高10.1%,对品牌调性匹配等主观质量评估同样有效。 为应对更复杂的任务挑战,平台引入了多智能体编排系统。当单个代理无法完成任务时,主智能体可将任务拆解为多个子任务,分配给具备不同专业能力的子智能体并行处理。 各子智能体基于共享文件系统协作,成果汇总至主智能体的全局上下文。开发者可在控制台追溯每个步骤的决策依据,实现全流程透明化管理。 在月球采矿无人机着陆模拟实验中,该系统协调地质探测与导航两个子智能体,将安全评分从67%成功提升至100%。 法律科技公司Harvey的实践验证了这套技术组合的价值。在应用Dreaming功能后,其任务完成率增长约6倍。 此外,Anthropic宣布与SpaceX达成战略合作,租赁位于得克萨斯州的Colossus 1数据中心全部算力资源,包含22万张GPU。这笔交易为托管智能体平台提供了强大算力支撑,满足Dreaming处理海量数据、多智能体并行运算以及Outcomes系统反复迭代的需求。 作为直接用户福利,Claude Code的使用时长限额即时翻倍,Pro/MAX版本高峰时段访问限制大幅放宽,Opus API调用速率也获得显著提升。
AI四小龙,估值破万亿
身价集体暴涨。 AIX财经(AIXcaijing)原创 作者 | 金玙璠 编辑 | 魏佳 中国的AI四小龙,加起来值一万亿了。 5月初,《金融时报》援引消息人士披露,DeepSeek新一轮融资估值锁定在450亿美元,由国家大基金(国家集成电路产业投资基金)领投。4月初,DeepSeek首次被曝出融资消息,外界流传的估值版本是超100亿美元。照此估算,一个月时间估值涨到了4.5倍。 智谱、MiniMax两家公司自2026年1月初在港股上市以来,股价分别累计涨了7倍、近4倍,最新市值分别为4347亿港元(3775亿元)、2573亿港元(2235亿元)。 月之暗面(Kimi)在一级市场的估值已突破200亿美元(约1362亿元人民币),据《晚点LatePost》报道,Kimi母公司月之暗面即将完成20亿美元(约合人民币136亿元)新一轮融资,由美团龙珠领投,中国移动、CPE等参投,仅龙珠一家出手就超过2亿美元。Kimi累计融资超376亿元。 如果将DeepSeek的估值按照450亿美元(约合3065亿元人民币)与其余三家加在一起,中国AI四小龙估值已突破一万亿人民币,从高到低排列为:智谱、DeepSeek、MiniMax、月之暗面。 需要说明的是,DeepSeek是一级市场谈判中的估值,智谱、MiniMax是二级市场市值的波动价格,月之暗面是新一轮融资的投后估值。即便如此,最高的智谱仍是最低的月之暗面的近3倍。市场究竟在按照什么逻辑给这些AI大模型公司定价? 01. 为什么估值差异这么大? 首先要明确的是,市场不是在按收入给它们定价。如果按收入排序:智谱(2025年收入7.24亿元)>MiniMax(2025年收入7903.8万美元,约5.6亿元)>月之暗面(约2亿元)>DeepSeek,收入和估值的排序对不上。 关注AI公司的投资人表示,美国AI公司的估值倍数会随着发展阶段切换:对于高增长阶段的公司,市场愿意给极高的市销率(P/S)溢价(97-145倍),本质上是为“定义权”和“高增长”买单;当商业模式稳定后,估值逻辑就会切换到27-44倍市盈率(P/E)的“现金流定价”。 这是两套并行的定价体系。 一套看财务指标:收入、利润、毛利率、ARR增速。这套逻辑在公司收入达到一定规模、商业模式稳定之后会成为主导。传统软件公司、SaaS公司基本都按这套体系定价。 另一套看的是公司能不能制定标准、能不能成为基础设施。投资人买的是“成为定义者”的概率。美国资本市场靠这套逻辑尝到过甜头,微软定义了PC入口,谷歌定义了信息组织方式,苹果定义了移动生态。一旦成为定义者,回报是指数级的。所以今天给OpenAI和Anthropic的估值里,相当大一部分是对这种“生态控制权”的提前下注,按P/S给价。 用这个逻辑来看中国AI四小龙,就解释得通了。 DeepSeek估值能在没有公开披露收入的情况下排到3000亿量级,是因为它目前是四家里最有潜力的“定义者”。V3、R1、V4在全球开源社区里建立起技术品牌,V4模型对国产芯片(华为昇腾950PR芯片)的适配,把“独立+开源+国产算力适配”这条路打通了。虽然美团等公司也在用国产卡从头训练万亿模型,但DeepSeek在国产芯片适配验证、行业标准共建、开源生态落地方面,都有先发优势。 图源 / pexels 智谱排第二,走的是现金流+定义权混合定价。一方面,它的收入最高,商业模式清晰(B端/G端为主),有一些可以验证的财务指标:付费开发者超24万、前十大互联网客户9家在用、API涨价后调用量增长等,这属于“现金流定价”范畴。另一方面,市场目前接受了它“中国版Anthropic”的定位,因此,它的估值里有一部分“定义权”的溢价。 MiniMax排第三,靠的是相对扎实的财务表现:收入高于月之暗面,而且海外收入占比超70%,毛利率从12.2%提升至25.4%。以2025年全年收入计算,PS倍数超过500倍,远超现金流定价逻辑,市场押注的是它作为C端AI入口的非线性增长的可能性。只不过,主打C端陪伴的明星公司Character.ai当年也讲过类似的故事,市场已经看到过这条路的天花板。 至于月之暗面,行业估算其2025年收入是2亿元,K2.5模型发布后,ARR一个月翻倍的速度(3月初突破1亿美元,4月超2亿美元),加上它在长文本和深度推理场景上建立的技术品牌,让一级市场愿意按“中国版ChatGPT入口”的可能性定价,PS约在100倍左右。 收入和估值排序对不上,本质是四家公司适用的估值逻辑不一样。DeepSeek拿到的是超过纯商业估值的战略溢价;市场给月之暗面和MiniMax的定价是押注C端AI入口的可能性;智谱两种逻辑都有,现金流是基础,再叠加行业定义权的估值溢价。 上述投资人强调,这套“定义权定价”在国内资本市场大规模落地,本身就是标志性变化。过去几年,主流一级市场更习惯按财务指标估值。DeepSeek的技术突破,智谱和MiniMax的上市,给AI大模型打开了估值空间。现在国家大基金领投DeepSeek,意味着大模型被抬到了和芯片制造相当的战略层面。 02. 估值是怎么一步步集体暴涨的? 智谱2025年12月递交港股招股书时,估值锁定在243.8亿元,IPO时发行市值超过511亿港元,上市后4个月,市值涨到4347亿港元,是IPO前估值的16倍左右。涨这么多,是这期间有几个因素依次叠加,把定价方式推着往上走。 首先是技术层面。2025年初,DeepSeek R1发布,全球第一次相信中国AI公司能用美国对手十分之一的训练成本做出同档次的模型。这直接影响了一级市场的判断,剩下的几家“小龙”跟着一起被重估。 同时,港股的窗口也打开了。政策松绑(18C特专科技章节把市值门槛降到40亿港元),加上整体资本市场大年(2025年港股IPO募资规模约360亿美元,创四年新高),为AI大模型公司上市创造了条件。智谱、MiniMax上市后被追捧,一级市场的投资人就更敢继续往上押注,也间接帮Kimi抬高了估值。 第三是国家大基金的入场。过去国家大基金主要投中芯国际这类制造端公司,这次领投DeepSeek,是第一次直接出手AI模型公司。这代表的信号是,在算力可能受限的情况下,中国需要有不依赖英伟达、不依赖美国云的独立模型公司。 硅谷巨头也在同步抬高天花板。OpenAI最新投后估值已经到8500亿美元,Anthropic正以9000亿美元的目标估值进行新一轮融资。在这个参照系下,中国四小龙加起来一万亿人民币,反而不算激进。 不过,定义权定价本质上是期权,期权能不能兑现,要看后续表现。 Character.ai就是经常被提起的例子。这家公司估值一度冲到近50亿美元。但后来用户增长停滞、变现走不通,最终被谷歌以25亿美元变相收编。从高点到收编,前后不到一年。 中国的AI赛道,也刚经历过一轮洗牌。去年这时候,行业还在提“AI六小虎”。如今,队伍已经分化了。其中,百川智能和零一万物因预训练成本过高、开源冲击,已退出通用大模型竞赛,分别转去做医疗垂类、B端服务;阶跃星辰Pre-IPO轮主流投前估值在50-60亿美元区间,和“四小龙”已不在一个量级。 现在留下来的四家,要么有足够的技术品牌(DeepSeek)、要么有跑得通的商业化路径(智谱)、要么有让用户买单的产品(MiniMax、Kimi)。 但进了名单只是入场券。摩根大通参照寒武纪的先例算过这个窗口期:寒武纪曾是A股唯一的纯AI芯片标的,随后摩尔线程、沐曦、壁仞、燧原陆续上市,尽管寒武纪业绩逐季改善,可市值还是收缩了两到三成。通俗地说,“独一份”的故事一旦有了竞争者,溢价自然会打折扣。摩根大通的结论是,“布局中国AI的唯一路径”这个稀缺性窗口,大约还有6-12个月。 03. 下一步,抢算力、拼场景 估值的比拼之外,四家眼下都卡在两个问题上:算力怎么用才不亏,场景能不能挣到钱。 算力问题是,训练加推理的总成本,能不能被token收入覆盖。四家给出了不同的解法。 智谱是高价筛选客户、保毛利。今年2月发布GLM-5时,API价格相比上一代涨了三成:每百万token输入6元、输出22元;4月GLM-5.1发布,再上调10%。 提价后,智谱的定价高于DeepSeek V3、Kimi K2系列、MiniMax M2,在国内属于偏高的一档。虽然离Claude Sonnet 4.6还有距离,但走的是和Anthropic一样的高价路线。 MiniMax是类似于“先圈地再盖楼”的互联网打法。它的M系列模型从M1到M2.7一路开源,借此快速搭建起了开发者生态。为了把门槛打下来,它靠MoE架构和模型迭代降低推理成本,M2.7的API价格每百万token输入1元、输出4元,是国内较低的一档。MiniMax的逻辑是:先吸引开发者和用户,再靠规模和粘性变现。 DeepSeek直接在架构上找空间。V4模型在架构上动了刀,把长文本的缓存成本压到了传统方案的2%,对外分级定价,数势科技CEO黎科峰评价:“这不是最优技术路线,而是受限环境下的最优解。”在算力不够用的情况下,中国工程师选择用更复杂的系统设计,去填硬件的坑。 Kimi走的是第四条路:算法代偿,核心方式是通过软件创新,即Muon优化器(训练token效率提升两倍)、Kimi Linear架构(长上下文KV缓存减少75%,解码速度提升6倍)、PrfaaS预填充架构(让万亿参数模型跨数据中心调度不再依赖天价专用网络),来实现对硬件资源的替代。月之暗面(Kimi)的联合创始人兼总裁张予彤称作是“不拼算力拼算法”。AI领域从业者Leo表示,算法代偿终究有天花板,靠单一环节的深度优化来节省算力,这条路迟早会走到头。 图源 / pexels 算力上四家各走各的路,到了场景上,同质化就明显得多。 各家的模型矩阵和长期战略仍有差异,不过在Leo看来,Agent和Coding是两个绕不开的战场。“尤其是面对OpenClaw这类流量红利时,几家国内厂商采取了差不多的短期战术,产品发布节奏同步、功能相似。”他补充道。 Agent方向上,今年2月OpenClaw引爆市场后,智谱、MiniMax和月之暗面三家几乎同步跟进:月之暗面、MiniMax上线了Kimi Claw、MaxClaw,智谱则有AutoClaw。 从OpenClaw集成水平来看,MiniMax有先发优势,智谱的AutoClaw则是国内第一个实现一键安装的本地版。 在Coding方向,国内厂商更是效仿了Anthropic的Claude Code商业模式。 最初,智谱等公司推出了固定月费、几乎无限调用的Coding Plan。但当模型能力提升,吸引来的重度用户越多时,固定的订阅收入就无法覆盖算力推理成本,Anthropic先一步改成灵活的“按量计费”;国内这边,智谱的GLM Coding Plan在用了一段时间之后改为“涨价+限购”;月之暗面的Kimi Code Plan也改为按Token计费。 Leo总结,这说明,AI行业靠补贴和无限订阅换规模的草莽时代,过去了;也侧面反映出,国内大模型公司目前的主流商业化场景,还是Anthropic已经走通的那两个。 04. 结语 一万亿是资本市场给“未来定义权”的定价,估值能上去,也能下来。 DeepSeek能否维持估值优势,要看它能不能保持住“独苗”的地位。国家大基金这一轮注资在战略上给它锁定先发优势,但模型迭代节奏和国产芯片兼容才是护城河。其他大厂比如阿里、华为也在做各自的模型和芯片适配,竞争压力确实存在。 除了技术和算力,还要看团队的稳定性。过去一年,王炳宣(DeepSeek第一代大语言模型核心作者)去了腾讯、郭达雅(R1核心研究员)去了字节跳动、罗福莉(V2核心贡献者)去了小米。市场推测原因是DeepSeek此前没有公开估值、员工期权兑不了现,大厂开出千万甚至近亿薪酬包,留人难度可想而知。不止一位受访者提到,一些核心成员的离开直接加速了DeepSeek启动外部融资:用市场化的定价,把期权的价值坐实。 智谱的压力在业绩。智谱核心的MaaS(模型即服务)API平台,截至今年3月的ARR约17亿元(约合2.5亿美元),增速放在国内是第一梯队,但和它对标的Anthropic相比,差距仍然不在同一个数量级上。Anthropic的ARR在2025年底约90亿美元,到2026年4月已经突破300亿美元,短短几个月增长超过三倍。 MiniMax七成收入来自C端,大头是Talkie、星野这类社交产品,海螺AI在多模态创作上也有一定贡献,剩下的B端API服务占比三成。它面对的主要问题是除了社交陪伴,C端产品能不能靠多模态创作和Agent工具跑通商业闭环。 月之暗面的考验比较直观:据其公布,今年3月ARR突破1亿美元,4月突破2亿美元,市场在关注它接下来能否保持高速增长。 当下的估值是起跑线,也可能是最高点。
谷歌回应Chrome静默安装Gemini Nano 却避谈核心问题
【CNMO科技消息】5月7日,谷歌Chrome浏览器副总裁兼总经理帕里萨·塔布里兹回应了关于Chrome静默下载AI模型的问题。他表示设备端AI是浏览器安全和开发者战略的核心。但塔布里兹没有直接回答用户同意问题,也未解释为何删除模型后会自动重新下载。 谷歌Chrome 据了解,此次争议源于隐私研究员亚历山大·汉夫近期对Chrome行为的记录。他发现Chrome会在未提示用户或提供明确退出选项的情况下,自动下载约4GB大小的Gemini Nano模型。手动删除该文件后,下次重启Chrome时会自动触发重新下载。 亚历山大还指出,Chrome地址栏中高度可见的“AI模式”功能并未使用该本地模型。用户在该模式中输入查询时,数据会被发送至谷歌云端服务器处理。这意味着用户承担了4GB文件的存储和带宽成本,但该文件与浏览器最突出的AI功能并无关联。 塔布里兹在社交媒体上发布帖子回应称,谷歌自2024年起已在Chrome中提供Gemini Nano作为轻量级设备端模型,该模型是Chrome开发者API和安全功能(包括诈骗检测)的核心。他指出,该模型在本地处理数据,而非发送至谷歌服务器,并在设备存储空间不足时会自动卸载。 但塔布里兹未直接回应同意问题,也未解释为何用户删除模型后会自动重新安装。谷歌在另一份声明中表示,用户可通过Chrome设置禁用并移除该模型,且禁用后模型不会重新下载。
中国AI性价比奇高的秘密,被一篇博客捅破了
五一假期后的第一个交易日,智谱和MiniMax都涨疯了。 5月4日,智谱涨超10%,股价再次逼近千元关口,MiniMax大涨12.62%,报收803港元。 根据摩根士丹利的报告,股价暴涨的原因来自于中国AI独有的“性价比叙事”。 摩根士丹利在报告《China‘s AI Path: More Bang For The Buck》中表示,在算力受到约束的前提下,中美顶尖模型的智能水平正在快速接近,差距已经收窄到3到6个月。 同时报告指出,中国模型真正突出的地方,是能以美国同行15%到20%的推理成本,实现接近同等水平的智能。 这句话其实很好理解。大家不一定需要用最强的模型,但绝大多数人都想用便宜的模型。 市场买的不是一个简单的“国产替代”故事,而是中国AI正在把性价比转化成真实调用量、真实收入和真实估值弹性。 但问题也随之而来,这种性价比到底从哪里来? 如果只是低价获客,那它很快会变成价格战。 如果只是模型蒸馏,可现在Anthropic、OpenAI等企业,均已关闭蒸馏的入口,那么评级不应该下降吗,怎么还调高了? 事实上,真正让这个叙事变得更有说服力的,是智谱在五一前发布的技术博客《Scaling Pain:超大规模Coding Agent推理实践》。 这篇博客没有讲宏大的AGI愿景,而是把KV Cache、吞吐、调度、异常输出这些底层工程摊开给市场看。 最主要的是,它把中国AI性价比背后的秘密,给“捅破了”。 A 在这篇博客里,智谱大概讲了怎么通过优化缓存、调度和异常监控,让同样的GPU能干更多活,出错更少。 智谱发现,AI不好用不一定是模型不聪明,也可能是后台运行系统太乱。它修掉了缓存串数据的问题,优化了GPU调度和缓存复用,还加了一个能提前发现异常输出的报警器。 结果就是,同样的模型、同样的GPU,可以服务更多用户,出错概率也更低。所以它的“性价比叙事”不是单纯降价,而是靠工程优化,把每张GPU榨出了更多稳定可用的算力。 经过底层工程优化,GLM-5系列在Coding Agent场景下的系统吞吐量最高提升132%,系统异常输出率从大约万分之10,下降到了万分之3。 比如原来一张GPU,它原先一小时能服务100个任务,现在经过优化后,最高可能服务232个任务。 每一项单独看,都不足以决定胜负。但叠在一起,就是同等算力下多出来的一倍吞吐,和一个数量级以上的稳定性提升。 模型没有变。变的是模型被“用起来”的方式。 具体来讲,自3月起,智谱在GLM-5的线上监控和用户反馈中观察到三类异常现象:乱码、复读、生僻字。这些现象在表面上与长上下文场景下常见的“降智”相似。 但智谱团队没有上线任何降低模型精度的优化。那异常究竟源于模型本身,还是源于推理链路? 在反复分析推理日志后,他们找到了一个意想不到的切入点:投机采样指标可以作为异常检测的参考信号。 投机采样原本只是一个性能优化技术。先由草稿模型生成候选token,再由目标模型校验并决定是否接受,从而在不改变最终输出分布的前提下提升解码效率。 就是让小模型先快速生成一批答案,大模型再挑选正确的,这样既快又准。 智谱团队发现,当异常发生时,投机采样的两个指标会呈现稳定模式。于是他们把投机采样从单纯的性能优化,扩展为输出质量的实时监控信号。 当spec_accept_length持续低于1.4且生成长度已超过128 token,或spec_accept_rate超过0.96时,系统主动中止当前生成,把请求交给负载均衡器重试。 这两个数字就像体检指标,一旦异常就说明模型“生病了”,需要重启治疗。 用户虽然感知不到这个过程,但是后台的确是完成了一次这样的重启。 异常的根因,是KV Cache复用冲突。 这就好比厨房,到了饭点的高峰期,很多人同时过来点单。 系统要临时保存每个用户的上下文,也就是KV Cache。这桌客人刚才点了什么、是要少放辣椒还是不吃香菜。一个两个客人还好,一旦客人多了,服务员就容易记错。 高并发时,某些缓存被回收、复用、读取的顺序乱了。结果模型拿错了上下文,就可能输出乱码、复读、生僻字。 在推理引擎中,PD分离架构下,请求生命周期与KV Cache回收与复用的时序之间存在不一致。并发压力一大,冲突就被放大,表现在用户端就是乱码和复读。 于是多个请求同时抢一块内存,结果数据乱了套,用户看到的就是乱码。 智谱团队定位了这个bug,也修复了它。 此外,他们还在主流开源推理框架SGLang的源代码层面发现并修复了HiCache模块的加载时序缺失问题,也就是read-before-ready。 修复方案通过Pull Request #22811提交给了SGLang社区,并被采纳。 SGLang是一个开源项目,全称可以理解为一种面向大语言模型的推理/服务框架。它不是一个大模型,也不是一家AI公司,而是一套让大模型高效运行的基础软件。 智谱在使用SGLang这套开源推理框架时,发现了一个高并发缓存bug。 它没有只在自己内部修,智谱还把修复代码提交给SGLang这个开源项目。 项目维护者审核后接受并合并。于是,这个修复进入了公共版本,其他使用SGLang的开发者和公司之后也可以用到。 这什么意思呢? 如果千问的某个部署链路用了SGLang+HiCache,那么阿里也会因为智谱发现并修复了这个问题而受益。 还是刚才说的那句话,模型是没有变的,但通过工程优化,让它在用起来的时候更聪明了。 B 智谱这篇博客真正戳破的,是一个更深的层次。 Chatbot时代的便宜,很大程度上来自训练成本低,一部分训练集来自对头部模型的蒸馏。 Agent时代,这招行不通了。 今年以来,Anthropic和OpenAI陆续关闭了蒸馏入口,明确禁止用其模型输出训练竞争模型。靠蒸馏取巧的路,越来越窄。 但中国AI公司的性价比叙事并没有弱下去,市场反而在为这个故事加码。 原因在于,性价比的定义已经变了。 Chatbot时代,平均上下文55K tokens,单次对话,低并发。 Agent时代,平均上下文70K+ tokens,长时间任务(8小时级),高并发、高前缀复用。 Chatbot时代,AI性价比的计量单位很简单。同样问一个问题,谁的模型更便宜,谁的回答更接近一线水平。 行业讨论的是每百万token多少钱、模型参数多大、榜单成绩高不高。 Agent时代,没人问这个,这套算法失效了。 用户买的不再是一句回答。他买的是一个完整任务的完成结果。 一个Coding Agent要读代码、理解上下文、规划步骤、调用工具、修改文件、跑测试、失败重试。它消耗的token不是一次问答的增量,而是一个工作流的总账。 OpenRouter作为全球最大的调用平台,它每周处理的token总量,从2026年1月第一周的6.4万亿,涨到2月9日当周的13万亿,一个月翻了一倍。 OpenRouter官方的说法是,100K到1M长文本区间的增量调用需求,正是agent工作流的典型消耗场景。 大家使用AI的模式,已经从“对话型”切换到了“流程型”。因此,AI性价比的单位,也从“token单价”变成了“任务单价”。 这就导致,有些模型它的token便宜,但是由于模型性能不行,进行任务的过程中总是失败,或者任务结果不达标,导致它的agent价格并不便宜。 比如说,一个8小时级别的Coding任务,中途只要乱码一次,整个工作流可能都要重来。节省下来的token单价,补不回浪费的时间。 中国AI的性价比叙事正在升级。 以前讲的是“输出相同水准的答案,我更便宜”。现在讲的是“同样复杂的任务,我能用更低成本跑完”。 开源基础设施也在成为中国AI的新护城河。 前文提到的SGLang就是如此。中国AI的工程能力,开始向上游社区辐射。 这件事的价值不只在于智谱修了一个bug,而在于中国AI公司正在把真实业务里的高并发、长上下文、agent调用问题,反向沉淀成公共基础设施的能力。 就像前文提到的,当一个修复进入SGLang这样的开源框架,它就不再只服务于智谱自己的模型。所有使用这套框架部署大模型的团队,都有机会获得更稳定的缓存、更低的推理成本和更好的agent体验。 模型能力可以被追赶,价格可以被压低,但基础设施一旦进入开源生态,就会变成标准、接口和开发习惯。 谁更早把自己的工程经验写进这些底层系统,谁就更容易在下一轮AI应用爆发里占住位置。 C 回到资本市场。 AI大模型概念股全线走高,资本愿意给AI公司重新定价?市场买的到底是什么? 答案是,资本市场正在为“中国AI公司能用更低推理成本做出接近一线智能”的叙事买单。 还是以OpenRouter的数据来说。 中国头部AI公司的token消耗份额,从2025年4月的5%快速攀升至2026年3月的32%。美国头部模型份额,从58%大幅下滑至19%。 MiniMax、智谱、阿里的token使用量,在2026年2-3月较去年12月增长4-6倍。 除了token调用以外,中国AI还在形成一套,完全不同于海外巨头的增长逻辑。 海外头部模型在卖“能力溢价”。 模型能力越强,单次调用越贵,用户为最强智能付费。Claude、GPT-5、Gemini都在往这个方向走。 中国AI在卖“工程”。 模型能力逼近一线模型,但是价格、延迟、调用门槛更低,更符合绝大多数高频场景的需求。 摩根士丹利的报告里提到,中国模型的输入价格约为0.3美元/百万token,部分海外同类产品的价格在5美元左右。这中间是十几倍的差距。 当AI从尝鲜工具变成生产力工具,性价比会直接决定调用频次。 模型便宜一点,企业就敢把更多客服、代码、营销、数据分析任务交给它。任务跑得越多,token消耗越大,平台越能摊薄基础设施成本。 我认为在这个环节,它是有可能会形成一个飞轮的。 第一圈,是用更低的API价格和更接近一线的能力,去吸引开发者和企业。 第二圈,更高的调用量会带来更多真实场景,倒逼模型和推理系统继续优化。 第三圈,也就是智谱这篇技术博客里讲到的,用工程优化降低单位token和单位任务成本,让厂商有能力继续降价、涨量,或者在高价值场景里涨价。 第四圈,当token消耗成为AI时代的新流量,谁能以更低成本承载更多token,谁就更接近下一阶段的平台型公司。 如果只是模型降价,市场会担心这是补贴和价格战,越来越烧钱,总有人的钱包撑不住。 而且,价格战撑不起高估值。 但如果降价背后是吞吐提升、缓存复用、异常率下降和调度效率提升,那么低价就不是牺牲利润换增长,而是工程能力释放出来的成本空间。 价格战和这种工程优化的结果,虽然都是让模型更便宜,而且在财报上看起来可能差不多。在估值模型里,差得很远。 前者是补贴,市场会折价。后者是工程壁垒,市场会溢价。 最后可以落到一个判断。 过去AI公司的估值看模型能力上限,看谁更接近AGI。当时市场在为“最强智能”付费,最强智能的定义越来越模糊,单次调用越来越贵。 现在agent时代,估值还要看成本下限。看谁能把智能稳定、便宜、大规模地交付出去。 对于追求最尖端的“智能”,这可能不是中国AI擅长的事情。 然而中国AI是最有可能把“智能”这两个字,做成所有人和企业都用得起的基础设施。 而市场只愿意为能说清楚自己逻辑的公司付钱。
小米开源OmniVoice多语言语音克隆TTS模型,号称搞定600余种语言
IT之家 5 月 7 日消息,“小米技术”公众号今天下午宣布,小米 AI 实验室新一代 Kaldi 团队全新推出 OmniVoice,不仅在中英文场景达到顶尖性能,更在多语言任务中展现出超越商用系统的实力,是业内首个覆盖数百语种的语音克隆 TTS 模型。 官方表示,该模型在低资源小语种上具备极强的泛化能力,你想得到的所有语种几乎都可以用 OmniVoice 来合成。OmniVoice“最亮眼的突破”是其极简的模型架构。它仅用一个双向 Transformer 网络,就能直接实现文本到语音的转化,省去了多余的结构和环节:没有文本的单独建模,没有复杂的混合结构,也没有多层级的 token 预测,是目前最简单的非自回归 TTS 模型。 OmniVoice 的语音合成质量优于目前同类主流模型,同时,训练和推理速度极具优势,一天完成 10 万小时训练,用 PyTorch 推理就可以达到 40 倍实时,轻松适配各类应用场景。 在这种实力的背后,是两项“关键设计”:一是通过全码本随机掩蔽策略,显著提升模型的训练效率,进而全面提升模型能力;二是引入大语言模型作为模型的预训练参数,首次在非自回归 TTS 模型中有效利用大语言模型,让语音合成的可懂度大幅提升,解决“读不准”的问题。 IT之家从官方介绍获悉,在多语言测试中,即便仅基于开源数据训练,在 24 语种的测试中,其语音相似度和可懂度均超越多款商用系统;在 102 种语种的测试中,它的语音可懂度逼近甚至优于真实语音;即便对于训练数据不足 10 小时的小语种,OmniVoice 也能实现高质量的语音合成,大大降低了低资源语种的语音合成门槛。 该模型还具备多项实用功能: 自定义音色设计:无需参考音频,只需描述音色属性(如性别、年龄、音调、方言、口音等),就能生成符合预期的音色,还支持耳语等特殊风格。 带噪参考音频适配:针对实际使用中参考音频音质不佳的问题,OmniVoice 能自动过滤噪声,提取清晰的音色特征,即便在嘈杂环境下录制的音频,也能克隆出高质量语音。 丰富语气表达:支持插入笑声、叹气等语气符号,让合成语音更有表现力,更贴近真人交流。 发音精准纠正:针对中英文多音字、专有名词易读错的问题,用户可通过简单设置,纠正发音错误,提升语音合成的可靠性。
欧盟就“弱化版”AI法案达成初步协议,禁止深度伪造色情内容
IT之家 5 月 7 日消息,欧盟成员国与欧洲议会议员已就弱化版的人工智能法案达成初步协议,这是是欧盟委员会所谓的“数字一揽子计划”的一部分。 欧洲议会在周四凌晨发布新闻稿称,经过深夜谈判,各方达成临时协议,决定推迟人工智能系统部分合规义务的生效时间,以避免法律适用不确定性。 各方商定,将高风险人工智能系统相关法规的生效时间,从原定今年 8 月 2 日推迟至 2027 年 12 月 2 日。这类高风险系统涵盖生物识别、关键基础设施、教育、就业、执法及边境管理等领域。 协议还同意将机械设备排除在人工智能法案管辖范围之外,理由是机械设备只需遵守其现行适用的行业安全法规即可。 批评人士认为,欧盟两大立法机构此举是向企业压力作出妥协让步。 人工智能生成内容强制水印标注规定将于今年 12 月 2 日正式实施。 塞浦路斯欧洲事务副部长玛丽莱娜・劳乌纳在声明中表示:“此次《人工智能法案》达成协议,通过降低企业常态化行政成本,为本国企业提供了有力支持。协议保障了法律确定性,让相关法规在欧盟范围内落地实施更顺畅、标准更统一,同时也强化了欧盟的数字主权与整体竞争力。” 目前塞浦路斯担任欧盟理事会轮值主席国。 禁止“裸照生成”类应用 欧盟成员国与欧洲议会谈判代表还达成共识,禁止利用人工智能应用制作未经授权的色情深度伪造内容。 相关内容包括图片、视频及音频。相关企业需在今年 12 月 2 日前完成系统合规整改。 此次拟定的禁令还明确将制作儿童性虐待相关虚假影像内容纳入管控范畴。 欧盟此次修订举措,在很大程度上是对今年年初相关事件的回应:当时有用户利用美国富豪埃隆・马斯克旗下的人工智能聊天机器人 Grok,在网络上生成并传播数百万张由 AI 制作的女性及儿童色情影像。 声明指出:“我们正加大对儿童的保护力度,防范人工智能系统带来的相关风险。此次协议充分证明欧盟各机构具备快速行动、兑现承诺的能力。” 简化监管配套举措 IT之家注意到,欧盟《人工智能法案》已于 2024 年 8 月正式生效,核心条款将分阶段逐步落地实施。 此次周三达成的修订方案,是欧盟委员会推进简化各类新兴数字监管法规工作的一部分。该协议后续还需经欧洲议会全体会议及欧盟各国政府正式批准,而这一流程普遍被认为只是例行程序。
豆包还有个大杀招
接上一篇继续聊豆包收费。 收费问题不大,全世界的Chatbot都收费,真正的问题是:豆包目前的功能矩阵,和“生产力”关系不大。 自上线以来,豆包的核心功能一直是Chatbot,可以查询信息、搜索资料,或是单纯“调戏”AI。过去几年,豆包逐渐加入了写文章、作图、做视频、做PPT、翻译等功能,逐渐具备了轻度办公能力。 结合卖会员的新动作,不难看出,豆包在泛生活场景之外,扩展一系列轻办公功能,目的之一就是变得更“有用”、更适应工作场景,为收费铺平道路。 但理想很丰满,现实很骨感。 一方面,大多数用户为“轻办公”付费的意愿并不强烈。轻度办公需求的特点是非标、零散、低频;在日常工作中,如果偶尔需要P张图、做一段AI短视频,用户更倾向于“临时抱佛脚”,现场寻找解决方案,而非购买月费套餐。 另一方面,豆包提供的轻度办公能力,千问、元宝、DeepSeek等同类App同样具备,且各有千秋,比如与钉钉、企业微信等办公协同软件打通等。在“轻办公”这条分外拥挤的赛道上,豆包并没有什么优势。 在字母榜看来,豆包要想卖会员,靠“办公”是可行的,但“轻办公”很难让用户心甘情愿掏钱,既然要收费,那不如索性往“重办公”里探索。而通往“重办公”的桥梁,则是“豆包群”。 A 豆包之所以手握1.5亿日活跃用户、遥遥领先其他对手,关键在于培养起了用户搜索习惯。越来越多的人习惯通过豆包问一问、搜一搜,而非求助于搜索引擎。 这才是豆包的真正优势,也是它敢于率先收费的基石。 但经常用豆包的人,都有个“痛点”:如果想与别人分享豆包生成的内容,就不得不手动复制粘贴,把内容“搬运”到微信群。这种AI与群聊的强行黏合,不仅操作繁复,也间接导致豆包给微信做了嫁衣。 倘若豆包因应用户需求,在自家App内搭建群聊场景,那么上述痛点将迎刃而解。而切入到工作场景中后,豆包作为生产力工具的“AI+办公协作”的巨大潜力也将得到释放。 参考企业微信等办公软件的做法,豆包群聊的商业化手段也会很丰富,比如基本功能免费,但新增AI助手、扩充群空间、增加协作功能等都需要额外付费。 同时,豆包将完成AI与社交的闭环,无需继续扩张功能矩阵,就能跃升为主流办公场景之一,变得真正“有用”,实现质的跨越。 单就用户规模而言,微信群是最主流的协同办公场景。但微信群尚不支持添加AI机器人,腾讯自家的元宝只能待在联系人列表中。用户需要跳出微信,通过AI App获得答案,再复制到微信群中。 微信群动作迟缓,给豆包创造了卡位“AI群聊”的契机。 不少AI App注意到了这一需求,比如企业微信、飞书、钉钉等。他们将AI与群聊、文档协作、审批流程、内部信息共享等深度融合,功能颇为丰富。 豆包的用户量远多于各个协同办公App,又有AI App的牢固心智,只需要把真人与AI拉到同一个群聊里,就能瞬间化解用户在不同App之间横跳的痛点。 工作群是被微信长期“垄断”的高价值生态位,倘若豆包能从中切下一块蛋糕,其价值和战略意义毋庸赘言。同时,豆包的收费也会顺理成章。 字节此前攻略企业办公市场,主攻手是飞书。但这块被寄予厚望的业务发展平平,在与钉钉、企业微信的竞争中并没有占据上风。倘若豆包开通AI群聊,完全可以与飞书打通,给后者注入精准的用户和流量。字节在这条赛道的份额,也有机会得到不小的提升。 一个具备真实生产力的豆包,完全有资格收取每月最高500元的会员费。 豆包长期的挑战就是商业化。如今,张一鸣要给豆包“算账”,就算不赚钱,也要尽可能少亏钱。通过搭建付费会员体系,豆包朝着赚钱迈出关键一步。要想把这一步走好,豆包就需要尽快建群、补齐生产力短板。 B 除了在多人办公场景占据一席之地,豆包“建群”的另一重意义在于切入社交赛道,帮助字节补齐这块短板。 过去几年,字节一直尝试构建自己的社交生态。它以抖音账号体系为根基,在抖音App内外多方尝试,包括推出多款独立社交App,在抖音App内增添社交功能等。 截至目前,这些尝试虽然有一些亮点,比如抖音用户“养小火人”,但距离一个完整繁荣的社交网络仍有不小的距离,腾讯的霸主地位并未被动摇。 现在,或许到了让豆包试一试社交的时候了。 豆包已经积累了足够庞大的用户池。根据第三方数据,豆包月活跃用户已达3.45亿。但如此庞大的用户群,并未形成社交网络,甚至都没有组成社区,而是处于高度原子化的状态。 这一原子化特性,与产品设计直接相关。豆包没有通讯录,内容分享也很不方便。用户可以把AI生成的内容分享到抖音,甚至发给微信好友,唯独无法发给另一个豆包用户。 豆包要想破局,方式并不复杂:建群。 “建群”符合豆包用户的直觉和需求。他们对于这一功能并不陌生:豆包曾在2024年前后小规模测试“建群”功能,用户可以把多个Agent拉到群聊里。 这与真人建群相去甚远,且一段时间后就宣告下线。即便如此,在一些互联网平台上,至今仍有用户在询问“豆包怎么拉群聊”,并对功能下线感到惋惜。 如今,倘若豆包二次入局群聊,显然不应该以“多Agent陪用户聊天”为主要目标。只有真人为主、AI为辅的群聊,才能真正把豆包用户凝聚在同一张社交网络中。 以往,AI群聊往往与AI社交画上等号。但现在看来,AI只需要“潜伏”在群内,只有用户主动唤醒时,才会做出响应。 表面上看,这似乎不够“性感”,与当前主动式Agent“眼里有活儿、主动干活儿”的潮流相去甚远。 但AI并不是越主动越好。在用户时刻在线的群聊场景下,过度积极的AI频繁制造杂音和冗余信息,只会导致整个群聊一片荒芜,已经被证明完全行不通。AI必须“无感存在”、不打扰真人用户,才能作为“群友”长期存活下去。 相比AI圈子里的时髦玩法,把真人和AI拉到一个群聊里,实在算不得惊天动地的突破。但这一小步,可以精准击中用户的痛点、快速构建社交关系,恰恰是豆包应该迈出去的。 倘若经营得当,随着一个又一个豆包群的建立,豆包App的社交氛围就会越来越强;再加上常驻AI的便捷,它甚至有机会吸引一部分人将豆包群作为主要活动场所。字节此前做社交事倍功半,如今豆包手握利器,很有机会打开局面。 C 过去几个月,“在AI App内建群”的玩法一度非常流行,国内的腾讯、阿里、百度,国外的OpenAI等多家公司参与其中。 声量最大的当数腾讯麾下的“元宝派”,1月底上线后,不仅发放春节红包进行宣传,马化腾也罕见地亲自“带货”。随后两个多月,元宝派新增了“免费养虾”功能,还上线了电脑版,功能逐渐丰富。 但时至今日,包括元宝派在内,各个APP的“AI群聊”虽然还在,却也没有刚刚上线时那样火爆,无论是群内活跃度,还是社交媒体讨论热度,均明显下滑。 不过,“AI群聊”走到死胡同了吗? 未必。 “AI群聊”自有其价值——在群聊中添加AI助手、随时响应,能够解决真实存在的痛点,并不是伪需求;尽管尚未完全跑通,依然值得被重视和开发。 对于AI群聊,用户无疑是有需求的,尤其是工作场景,它可以解决在聊天App和AI App之间反复切换的痛点。同时,别人做不好AI群聊,豆包却可以凭借用户量、心智、时长等方面的优势,把这一功能融入用户日常使用中。 即使别人的探索都折戟沉沙,豆包仍然应当尽快抓住机会。更何况,豆包面对的竞争态势正在发生根本变化。 一方面,AI行业从Chatbot时代跃入Agent时代,竞逐中心不再位于豆包的舒适区。 豆包依然保持了克制——它在OpenClaw卷起的“养虾”浪潮中按兵不动,更没有追逐harness engineering(驾驭工程)这样的浪花。但实力雄厚的豆包,终归要面向Agent时代给出新的答案,而非停在Chatbot旧框架内。 另一方面,微信下场了。 腾讯早已明确表示,“微信最终会推出一个Agent”。根据3月初的消息,腾讯计划在年中前进行灰度测试,第三季度向所有用户推出。 不难想象,微信Agent将依托小程序生态,接入大量服务,在一个封闭但足够大的内生市场里,打通任务链路、满足亿万用户的AI办事需求。 Agent化的微信,注定将成为豆包的强大对手。 豆包的底色是Chatbot,它的功能矩阵也以此为根基展开。当千问等对手纷纷喊出“AI办事”的口号时,豆包反而显得有些沉寂,这既与字节缺乏线下业务有关,也和豆包的Chatbot基因一脉相承。 但随着Agent取代Chatbot,成为AI时代最主流的应用场景,豆包提升“办事”能力,已经势在必行。 豆包或许可以无视千问的挑战,但必须对微信Agent提高警惕。在没有小程序生态做支撑的情况下,如果豆包试图效仿微信、搞自己的Agent生态正面对决,恐怕没有太大胜算。 在此情况下,豆包不妨从群聊这一基础功能切入,既可以通过多人办公场景,展现“办事”能力,又可以构筑自己的社交生态,把战火烧到微信的后院。 倘若建群成功,豆包的战略形态将第一次得到重塑。 在理想情况下,豆包有机会成为“Chatbot+企业微信”的新型AI App,既具备通用的聊天能力,又具备专精于工作场景、服务多人协同办公的Agent能力。 一个既能to C又能to B的豆包,其价值之大不言而喻。这种价值,将首先通过售价不菲的付费会员得到验证和变现。 微信Agent瞄准的是“AI办事能力”,而豆包建群,也是以此为终极目标,只不过第一步先落在办公场景内。两大超级App又一次踏入同一条河流。 手握微信的腾讯,一直是字节在AI领域的最强大对手。 在第一回合,豆包席卷Chatbot赛场,赢了旧时代的王者微信一局。而在第二个回合,微信Agent已经准备好强力一击,而豆包还没给出回应,尽快建群或许就是答案。 唯一的问题是,时间并不站在豆包这一边。 微信Agent有可能下半年全面上线,届时豆包建群的必要性和吸引力将急剧收缩。留给豆包做出决断的时间窗口,很可能只有两三个月了。
大摩:中国人形机器人,有望复刻“电车奇迹”
人形机器人正在跨越从科幻到现实的商业化拐点,一场史无前例的资本抢筹大战已经打响。 5月7日,据追风交易台消息,摩根士丹利最新研报显示,2026年年初至今,全球人形机器人风险投资规模已超过2025年全年总额,增速之快令业界侧目——其中中国市场贡献了约46%的年内风险投资资金,成为全球资本最密集的角力场。 该行特别强调,中国正完美复刻其在电动车(EV)领域的成功剧本,通过全产业链布局和惊人的迭代速度,预计将在2030年将其占全球制造业的份额推升至16.5%。 摩根士丹利预计,随着特斯拉Optimus步入量产倒计时,Meta与杰夫·贝索斯等科技巨头携数百亿美元重金杀入“物理AI”领域,一个到2050年规模高达7.5万亿美元、保有量达10亿台的终极蓝海正在成型。对投资者而言,最直接的信号是:摩根士丹利“人形机器人100”指数自2025年2月设立以来已暴涨45%,全面碾压标普500指数。 资本狂飙:2026年风投超去年总和,科技巨头跑步入场 华尔街的聪明钱正在疯狂涌入物理AI领域。 数据显示,2026年至今的人形机器人风险投资额已经打破了2025年的全年纪录,其中亚洲地区吸金尤为迅猛,占年内风投总额的约46%。 仅在4月份,中国就记录了41笔独立的人形机器人融资,而去年同期仅为16笔。 科技巨头的并购与融资正在加速行业洗牌: Meta的硬件野心:Meta收购了美国机器人基础模型初创公司ARI(由Lerrel Pinto和前英伟达研究员Xiaolong Wang于2025年创立),其CTO直言人形机器人是Meta继AR之后的下一个“重大押注”。 贝索斯的百亿美金豪赌:杰夫·贝索斯的物理AI初创公司Project Prometheus据报道正在以约380亿美元的估值筹集100亿美元(10 billion)资金,旨在为工程和制造构建AI模型。 特斯拉的预期管理:马斯克继续将Optimus视为“史上最大的产品”,并正准备于2026年晚些时候在弗里蒙特工厂启动量产,德州奥斯汀工厂则计划于2027年夏季投产。尽管Gen 3可能在2026年中期亮相,但马斯克警告称,作为全新产品,初期的产能爬坡将会“非常缓慢”,且设计仍在快速迭代中。 中国复刻“电车奇迹”:全产业链布局与惊人的商业化速度 摩根士丹利宏观经济学家指出,中国在人形机器人领域的早期领先地位,将推动其全球制造和出口主导地位进入新阶段。正如十年前押注电动车(EV)一样,中国正在构建整个人形机器人供应链,这使其在面对依赖中国零部件的美国、日本和韩国竞争者时占据优势。 与美国企业侧重于高成本、高规格原型机并在量产前进行漫长测试的路径不同,中国企业推出模型的速度更快,并直接将本土市场作为试验田。商业化落地正在全面提速: 惊人的盈利能力:宇树科技(Unitree)的IPO招股书显示了极强的早期变现能力,其平均售价(ASP)降至约2.5万美元,但毛利率高达约60%,调整后净利率约37%,在所有覆盖的中国机器人和制造企业中名列前茅。 量产数据爆发:越疆(Dobot)和AI² Robotics各达1000台,优必选(UBTECH)达5000台工业人形机器人,领龙科技(Linkerbot)的灵巧手产量达5万至10万只。 技术与政策共振:荣耀研发的“Lightning”机器人在2026年北京半程马拉松中以50分26秒的成绩夺冠,打破了人类世界纪录。 同时,中国“十五五”规划首次将机器人列为战略性新兴产业,各级政府已设立总额约1870亿人民币的基金为产业提供资本支持。 大摩预计,这将助力中国在全球制造业的份额从目前的15%提升至2030年的16.5%。 总结来看,摩根士丹利的研究给出了一个清晰的逻辑链:技术验证→政策催化→资本涌入→供应链成熟→规模量产→成本下降→需求爆发——这条路径在新能源汽车赛道已被中国完整走过一遍,如今正在人形机器人赛道上加速重演。 7.5万亿美元的终极蓝海:采用率爆发与指数超额收益 摩根士丹利对全球人形机器人市场的长期规模做出系统性预测,基于6年换机周期与分地区差异化ASP假设: 从长期市场规模(TAM)来看,这不仅是一个主题炒作,而是一个具有深远宏观影响的超级赛道。摩根士丹利预测: 到2036年,全球人形机器人采用量将达到2440万台。 到2040年,采用量将激增至1.379亿台。 到2050年,全球人形机器人保有量将达到10亿台(1 billion),假设6年的更换周期,全球人形机器人市场年收入将达到惊人的7.5万亿美元。 从地区分布来看,到2050年,东亚及太平洋地区(以中国为核心)预计占全球累计采用量的43%;北美占9%;欧洲及中亚占16%。 中国预计到2050年累计采用量达约3.023亿台,远超美国的约7,770万台,占全球总量约30%。 摩根士丹利等权重的“人形机器人100”指数自2025年2月6日成立以来累计上涨45%,跑赢了标普500、MSCI欧洲和MSCI中国指数。 其中,英特尔(+389%)、三星电子(+319%)和工业富联(FII,+224%)成为表现最亮眼的成分股。
全球首台!双核原子量子计算机“汉原2号”发布
快科技5月7日消息,据媒体报道,中科酷原科技(武汉)有限公司正式发布全球首台双核中性原子量子计算机“汉原2号”。 这是继去年“汉原1号”实现我国中性原子量子计算机商用化“零的突破”之后,湖北科技企业在量子计算领域取得的又一里程碑式成果,标志着我国中性原子量子计算技术正式从单核时代迈入双核协同的新阶段。 “汉原2号”基于自主可控的中性原子阵列技术,创新性地集成了100个Rb85原子与100个Rb87原子,构建起总计200个量子比特的双核协同计算系统。 这是全球范围内首次将量子处理器从“单核”架构拓展至“双核”架构,实现了量子计算核心架构的原创性突破。 在硬件实现上,该量子计算机摒弃了传统芯片方案,转而采用精密的光学系统,实现对200个原子的稳定囚禁与操控。 这200个原子被划分为两个100原子阵列,既可独立并行计算,从而效率与速度翻倍;也可采用“一主一辅”模式,一个阵列负责计算,另一个实时进行纠错,能够有效支撑金融建模、物流优化等复杂计算场景。 在关键性能指标方面,中科酷原研发总监付卓表示,“汉原2号”将计算保真度提升至0.99,量子比特寿命延长至100秒。从可处理问题的规模与复杂度来看,“汉原2号”相比“汉原1号”至少提升了四倍,整体性能已达到国际一流水平。 付卓进一步解释,量子计算适用于特定类型的复杂问题。以密码破解领域的肖尔算法为例,经典计算机求解可能需要数百年甚至上千年,在有限时间内根本无法完成;而量子计算可将时间压缩至数周,带来质的效率提升。 在金融领域,如股票投资组合优化;在生物医药领域,如蛋白质设计、新药研发等方向,量子计算均展现出广阔的应用前景。 在“汉原2号”发布会现场,中科酷原技术专家葛贵国博士详细介绍了双核架构的技术优势:两个核心各自为独立且完整的中性原子量子比特阵列,既支持并行计算以大幅提升运算效率,也可采用“一主一辅”模式构建高稳定性逻辑比特,有效破解了单核架构下比特扩展受限、近邻串扰等技术痛点。 在工程化与实用层面,“汉原2号”延续并升级了“汉原1号”低功耗、易部署的优势。整机采用标准机柜式集成设计,仅需小型激光冷却系统即可运行,整体功耗低于7kW,无需复杂的低温制冷环境,可在普通室内环境中快速部署,大幅降低了量子计算技术的应用门槛与落地成本。 相较于其他类型量子计算机对极端环境的依赖,“汉原2号”的这一特性,为量子计算在金融建模、物流优化、量子教育、医药研发、量超融合等多场景的规模化落地提供了关键支撑。
苹果低价本也要涨价?MacBook Neo或砍掉入门级256GB版本
MacBook Neo 凤凰网科技讯 北京时间5月7日,据科技网站MacRumors报道,据科技专栏作家、前彭博社记者蒂姆·库尔潘(Tim Culpan)透露,面对热门笔记本MacBook Neo制造成本的上涨,苹果可能采取的应对措施之一,是考虑取消最便宜的配置版本。 目前,MacBook Neo的起售价为599美元,存储空间为256GB,512GB版本售价为699美元。 库尔潘在其最新《Culpium》新闻通讯中写道,随着零部件成本不断攀升,苹果正在考虑的选项之一就是取消入门级的256GB型号。这样一来,即使不提高任何单一配置的标价,MacBook Neo的实际起售价也会变相上涨100美元。 库尔潘表示,MacBook Neo面临的定价压力与苹果推进产能爬坡有关。由于需求超出预期,目前苹果官网上整个MacBook Neo产品线的发货时间已经延长至两到三周。苹果据称已指示供应商将产能提升至1000万台,大约是原先预期500万至600万台的两倍。 苹果最近已经在另外两款Mac产品上采取了类似做法。苹果在今年3月停止提供配备512GB内存的 Mac Studio,上周又取消了Mac mini最低配的256GB存储版本,使后者在美国市场的起售价从599美元提高到了799美元。这些调整源于需求高于预期,而且全球存储芯片短缺推高了成本。眼下,AI数据中心的建设正在挤压供应链。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
任天堂股东希望Switch 2掌机涨价50-100美元,因为目前在亏本卖
IT之家 5 月 7 日消息,彭博社 6 日报道称,除 3 月《宝可梦 Pokopia》发售带来短暂拉升外,任天堂股价今年整体持续下跌。任天堂股价在 2026 年初为 68.15 美元,目前已跌至 47.38 美元(IT之家注:现汇率约合 323.4 元人民币),跌幅超过 30%。 股价走低让任天堂股东感到不安,部分股东开始要求公司提高 Switch 2 售价。Switch 2 于 2025 年 6 月上市,建议零售价为 449.99 美元。任天堂还在日本推出锁区版本,售价约 318 美元。据称,Switch 2 两个版本目前都在亏本销售,日版亏损压力尤其明显。 分析师称,即便任天堂把 Switch 2 售价上调 50 至 100 美元(现汇率约合 341.2 至 682.5 元人民币),也只能减少一部分负担,而非真正赚钱。 主机厂商亏本卖硬件并不罕见,后续通常依靠游戏销售、订阅服务和配件收入弥补差额。Wii U 失败后,任天堂曾选择让初代 Switch 以盈利方式销售。但到了 Switch 2,任天堂重新转向亏本卖硬件,即便 Switch 2 已比前代贵 150 美元。 Switch 2 可能涨价的消息此前已经出现过。今年 2 月曾有报道称,受零部件价格上涨影响,任天堂正在考虑提高 Switch 2 售价。 任天堂社长古川俊太郎在 2025 年 11 月接受采访时曾承诺,2026 年不会提高 Switch 2 售价。不过,这一承诺并非没有条件:只要关税上升或零部件成本上涨没有带来通胀压力,Switch 2 价格才会保持不变。 任天堂的矛盾在于,Switch 2 发售后并不缺销量。截至去年 12 月底,Switch 2 已售出 1737 万台,Switch 2 游戏销量达到 3793 万份,新硬件还推动季度利润增长 23%。但如果 AI 带动的内存成本上涨和关税风险持续侵蚀利润率,需求再强也未必能安抚投资者。
国产内存能不能带动大降价 业内大佬表态:短期很难 缺口太大
快科技5月7日消息,持续了一年的内存及闪存涨价让三星、SK海力士及美光等公司业绩炸裂,Q1季度的利润都是5-10倍的增长,今年三星的利润有望达到1.1万亿元,SK海力士也差不多水平。 推动内存及闪存涨价的直接原因是AI需求爆发,然而根源并非如此,说到底还是全球的内存及闪存芯片主要掌握在少数几家公司中,三星、SK海力士、美光三家占了全球内存市场95%的份额,他们再加上闪迪、铠侠等公司,也垄断了全球闪存市场。 这么大的需求就被这几家公司掌握着,而且面对内存及闪存涨价,这几家公司几乎都不会大幅增产,任由价格继续上涨,现在最保守的估计也是缺货到2027年,长远一点的预期是缺货到2030年。 如果内存价格维持高位水平5年,三星、SK海力士、美光这几年的利润抵得上以往40-50年的利润水平,未来哪怕降价了,他们也足够支撑下去。 这样的情况下如何破局?最大的变数是大陆的内存及闪存公司,长江及长鑫两家也在扩产,而且产能目标非常夸张,未来2-3年产能提升是2-3倍的增长。 那国产的内存、闪存能不能快速推动价格下降,回归合理水平呢?威刚董事长陈立白日前在采访中指出,短期内影响有限,因为目前的供需缺口非常大,即便两长持续扩产,短期内也填补不了缺口,客户端也没有因此出现明显的杀价情况。 作为行业内的大佬,陈立白这番表态不意外,国内的内存及闪存产能占比还是偏低的,而且因为之前几年持续被制裁封锁,技术挑战也很大,产能及良率要想追上三星这种还需要时间,即便现在继续扩产,成为主流还早,三星等公司恐怕也是知道这一点的,所以目前并不担心内存价格崩盘。
无屏手环风很大,谷歌也来凑热闹
北京时间 5 月 7 日晚,谷歌官宣了一款全新的无屏手环 FitBit Air。 最近无屏健康手环的风很大,主要玩家 Whoop 的手环成为了硅谷人士除了 Apple Watch 之外最常见的新「腕上装备」。谷歌也不能免俗。 FitBit Air 没有屏幕,通过链接手机上的 Google Health app 工作。手环内置各类运动/健康相关传感器,支持睡眠、步数、步行距离、心率、血氧检测、体温监测,以及各类主流运动数据记录等功能。 这款手环内置锂聚合物电池,续航七天,充满需一个半小时,充够一天续航仅需 5 分钟。在不连接手机的时候,它能储存最长 7 天的动作细节数据、1 天的运动数据,以及最多一个月的每日运动汇总。 在定价策略方面,先来的 Whoop 和后来的 FitBit Air 有很大不同: - Whoop 硬件不要钱,但需支付每年 200 美元健康服务订阅费用后才可正常使用; - FitBit Air 硬件定价 99 美元,附送 3 个月 Google Health Premium 订阅服务,随后 $10/月。 FitBit Air 标配「软性编制」质感的性能腕带 (Performance Loop Band),采用环保回收材料制成。(图二) 谷歌另提供两种选项:硅胶腕带 (Active Band),适合运动量极大的用户;更具高级感的「质感现代腕带」(Elevated Modern Band),能将手环变成配饰穿戴。这两种额外款式腕带售价 $34.99 起。(图三、图四) 谷歌还推出与 NBA 球星史蒂芬·库里设计推出的特别版腕带,表面涂有拒水涂层,整机价格 129 美元。(图五、图六、图七)
对标OpenClaw?Meta被曝将推消费级AI智能体
智东西 编译 | 高远瞩 编辑 | 程茜 智东西5月7日消息,据The Information 5月6日报道,Meta正在开发一款面向普通消费者的AI智能体,内部代号“Hatch”,该智能体的定位是普通消费者版OpenClaw。Hatch能够自主执行跨应用、跨网站的各类任务,如比价、查找信息、整理行程等,无需用户编写代码或复杂配置。 与此同时,Meta还计划在Instagram中植入一款独立的“智能体化”购物工具,目标是2026年第四季度前上线。 这两款产品的推进,标志着扎克伯格正在将Meta庞大的AI基础设施投入转化为用户能实实在在触摸到的智能体产品,而Meta今年在该领域的资本支出最高已达1450亿美元(约合9861亿人民币)。 一、用Anthropic模型训练Hatch,却在为自家的Muse Spark铺路 据The Information透露,Meta正在训练的这款消费级AI智能体目前暂时叫作“Hatch”(正式发布后名称可能更改),其核心目标是让普通用户也能像极客一样使用自主智能体,而不需要编写代码或配置复杂环境。 OpenClaw虽然今年在技术爱好者中迅速走红,但对于大多数非技术用户来说过于复杂。Hatch被设计用来为用户执行一系列跨应用、跨网站的任务。 例如Meta已经构建了“沙盒化”的网络环境,在模拟DoorDash、Etsy、Reddit、Yelp和Outlook等真实网站的仿真场景中对Hatch进行反复测试,这意味着Hatch未来可能能够自主在电商平台比价、在论坛查找信息、在邮件客户端整理行程等。 Meta被曝计划在6月底前完成Hatch的内部测试,如果进度顺利,后续将进入更广泛的预览或公测阶段。 然而知情人士告诉The Information,Hatch目前的开发版本并不是由Meta自研模型驱动的,现阶段Hatch运行在Anthropic的Claude Opus 4.6和Claude Sonnet 4.6模型之上;但在正式发布时,Meta将切换为其最新的自研AI模型Muse Spark。 这种“先外援、后自主”的路线在硅谷大厂中并不罕见,一方面可以加速早期原型开发,另一方面为自研模型争取更多优化时间。 知情人士还爆料,Meta正在从三个关键方向提升Hatch的能力:让智能体学会判断“什么时候该主动出手,而不是傻等用户下达每一条指令”;扩大模型在单次会话中能同时处理的信息量,以便理解更复杂的任务链;改进跨对话记忆能力,使Hatch能够在多次、跨时间的对话中保留用户偏好和任务进度。此外,Meta还在优化Hatch如何回应用户,以及如何选择和使用外部工具,这是自主智能体能否真正“干活”的核心。 如今Meta员工已经在使用一款名为“MyClaw”的内部AI智能体,用于访问工作文件、汇总公司留言板上的帖子、获取技术建议等日常任务。 然而最近,一名员工因听从了MyClaw给出的错误建议,导致敏感的公司和用户数据暴露给了未授权的人员,在Meta内部触发了一次重大的安全警报。所以Meta在推向数亿消费者之前,必须在安全性和准确性上做更充分的验证。 二、Instagram购物智能体:剑指TikTok Shop,Q4前上线 Meta计划在Instagram中推出一款独立的“智能体化”购物工具,目标是2026年第四季度之前上线。 当用户在Instagram的短视频流或信息流中看到某件商品时,可以直接点击该商品,Hatch(或购物智能体)将帮助用户获取更详细的产品信息,然后导航到外部商家的网页,最终在平台内完成整个购买流程,这样用户就无需跳转多个App或反复填写信息。 这意味着Meta试图将“种草-比价-购买”的购物全链路都纳入自己的闭环体验中。 该购物工具将建立在Meta于2026年3月公布的一系列AI购物体验之上,包括利用AI呈现更详细的商品信息(如自动生成的规格、评价摘要等),以及一种新的“一键结账”体验:用户只需点击广告即可完成购买,大幅减少结账步骤。 据The Information透露,Meta希望通过Instagram购物智能体,增强与TikTok的电商功能TikTok Shop的竞争能力。 实际上大型科技公司在购物智能体领域的竞赛已经全面展开:谷歌在2026年1月推出Gemini Enterprise for Customer Experience平台,其中包含一个AI驱动的购物智能体,能够推荐产品、构建购物车,并在用户批准后完成购买;亚马逊则提供AI购物助手Rufus,帮助用户追踪价格、研究商品并下单购买。 三、Meta野心不小,现实却阻碍重重 今年Meta曾试图直接收购OpenClaw,但OpenClaw的创造者Peter Steinberger在一档播客节目中透露,他在2月被OpenAI聘用,并正在成立一个基金会来管理OpenClaw软件。The Information特别更正了早期版本的一个错误:此前有报道误称“OpenAI收购了OpenClaw”,实际情况是OpenAI聘用了其创造者,之后另起炉灶打造Hatch。 无论是Meta还是其他科技公司,在推广AI智能体时都必须直面一个核心问题:消费者凭什么信任它? 此前已经发生过智能体做出错误行为的案例,例如提供错误的技术建议。 亚马逊CEO Andy Jassy上周也对第三方智能体的表现表达了不满,他感到目前亚马逊平台上第三方智能体的体验“还不算好”,因为“它们往往无法准确获取价格或商品信息”。 此外,购物智能体还面临另一个现实障碍:部分平台会抵制其他公司的智能体爬取或操作自己的网站。 例如,一个Meta的智能体试图在某个竞争对手的电商平台上自动下单,可能会被屏蔽或限制,这也是所有跨平台自主智能体共同面临的地缘性技术难题。 Meta的AI雄心背后是巨额的资金投入。今年4月底,Meta再次上调了年度资本支出预测,计划在AI基础设施上投入高达1450亿美元(约合9861亿人民币),路透社报道中特别提到,这一举动发生在“投资者对Meta不断飙升的AI支出进行审视”的背景下。 另外,Meta对AI智能体的兴趣还曾促使其在去年12月收购了中国初创公司开发的AI智能体Manus。然而今年4月,中国国家发展和改革委员会要求Meta撤销这项收购,这意味着Meta在获取海外AI技术时遇到了监管阻力。 结语:Meta的AI愿景与信任困境 扎克伯格在上周的财报电话会上这样定义Meta的AI愿景:“提供能够理解你的目标,然后日以继夜地工作、帮助你实现这些目标的智能体。” 从6月底即将完成内测的Hatch,到瞄准TikTok Shop的Instagram购物工具,Meta正在用实际行动实现这一愿望,但其面临的风险问题也不可忽视。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。