行业分类:
加载中...
头条分类:
加载中...
Claude背后的男人:融资IPO算力三手抓,把估值干到3800亿美元
编译 | 杨京丽 编辑 | 李水青 智东西4月20日消息,据外媒The Information报道,Anthropic首席财务官(CFO)克里希纳·拉奥(Krishna Rao)竟然解决了公司头等算力难题。 在他的力推下,Anthropic与三大云服务商谷歌、亚马逊、微软全部达成协议,其模型同时跑在英伟达、谷歌、亚马逊的芯片上,比主要对手OpenAI更早完成多云多芯布局,把困扰所有AI公司的算力瓶颈,变成了Anthropic的竞争优势。 2024年,拉奥跳槽至Anthropic,此前履历横跨贝恩公司、黑石集团和爱彼迎,曾主导2020年爱彼迎IPO。短短两年时间,拉奥主导Anthropic毛利率从-94%翻到+40%,年化收入从不到10亿美元(约合人民币68.2亿元)跃升至今年4月初的300亿美元(约合人民币2046亿元)。 同时,拉奥推动Anthropic完成累计600亿美元(约合人民币4092亿元)融资,将该公司估值抬升至2026年1月的3800亿美元(约合人民币2.59万亿元),最快可能今年秋季启动IPO。 然而,这位Anthropic高管十分低调,不接受媒体采访,同时是这个量级AI高管中唯一一位从未上过科技播客的人。 可以说,Anthropic内部向来不缺戏剧性角色:有内部的哲学家、有专门防范“AI末日”的研究员、有敢跟五角大楼正面交锋的CEO。而CFO拉奥却身居幕后,凭借其前瞻判断力、业务理解力及谈判能力,成为Anthropic的一大“杀手锏”。 一、入职第一件事:推动多云多芯,跑在OpenAI前面 2024年,拉奥加入Anthropic时,公司与谷歌签有云计算协议,算力来源较为单一。他上任后,力推新方案,同时与多家芯片供应商和多家云厂商合作。 贝塞默风险合伙公司合伙人、Anthropic投资人拜伦·迪特尔(Byron Deeter)是他当时讨论这一方案的对象之一。迪特尔认为,拉奥当时判断得非常清晰,“如果伙伴更多,Anthropic可以成长更快”。 如今,Anthropic已与三大云服务商谷歌、亚马逊、微软全部达成协议,其模型同时跑在英伟达、谷歌、亚马逊的芯片上。在多云多芯这条路上,Anthropic走得比其主要对手OpenAI更早,后者如今才沿着类似路径铺开。 另外,据知情人士透露,拉奥近期担任Anthropic内部推动一项重要合资项目的主要负责人。该项目由Anthropic与黑石及其他私募股权公司共同推进,目的是让Anthropic把AI卖给上述私募基金的投资组合公司。就在几周前,拉奥还被派往高盛集团CEO大卫·所罗门(David Solomon)位于巴哈马的海滨别墅,与多位公募和私募投资人、高盛的高级银行家会面。 曾在黑石与拉奥共事的马丁·布兰德(Martin Brand),目前掌管黑石旗舰私募股权基金,他评价拉奥说:“有些CFO是从会计起家、能把数字做对,但并不真正懂商业,而拉奥不是这种CFO。他很清楚什么重要、对业务意味着什么,以及对面前这个人意味着什么。” 二、入职以来融资600亿美元,估值飙到3800亿美元,秋季可能IPO AI行业竞争日益加剧,拉奥扮演的角色比一般创业公司CFO要复杂得多。除了常规的并购任务,他还要解决公司研发AI所需的巨额资本需求,尤其是越来越紧缺的云厂商芯片集群。 Anthropic最新300亿美元(约合人民币2046亿元)融资中,共同领投的新加坡政府投资公司的克里斯·埃马纽埃尔(Chris Emanuel)称,拉奥对业务的技术层面挖得非常深。 为了支付公司的全部开支,拉奥自入职以来已推动Anthropic完成多轮融资,累计筹资600亿美元(约合人民币4092亿元),估值在2026年1月抬升至3800亿美元(约合人民币2.59万亿元)。 2026年年初,Anthropic估值抬升至3800亿美元(图源:The Information) 去年9月,风投公司Iconiq共同领投了Anthropic的融资,当时Anthropic的估值为1830亿美元(约合人民币1.25万亿元)。Iconiq合伙人马特·雅各布森(Matt Jacobson)说,拉奥在筹集如此大规模的“量级资本”时,以极高的透明度向投资人清晰传达了公司的发展叙事。 两位消息人士透露,Anthropic目前并无进一步融资计划;若要再融,预计要等到5月的董事会会议,届时将讨论所有融资选项。据另一位消息人士称,拉奥及其团队已收到以8000亿美元(约合人民币5.46万亿元)估值投资公司的报价,部分投资人认为估值甚至可能冲到1万亿美元(约合人民币6.82万亿元)。 此外,拉奥还要盯住另一条战线:IPO。公司尚未对外公布上市计划,但最快可能在今年秋季启动。拉奥曾在爱彼迎2020年上市中扮演重要角色,但Anthropic的上市对他来说仍是一次大考。一位参与过Anthropic融资的人士坦言:“他的确非常聪明,看上去也是好人,但他还很嫩,从没在这种体量上操盘过。” 三、跟OpenAI CFO的鲜明对比:一个高调、一个极少露面 拉奥与同行对手形成了鲜明对比。OpenAI CFO萨拉·弗里亚(Sarah Friar)是硅谷老将,此前曾任支付公司Square的CFO、邻里社交网站Nextdoor的CEO,现任沃尔玛董事。随着OpenAI筹备上市,弗里亚刻意塑造高曝光度,频繁与媒体接触。 拉奥则恰恰相反。他不喜欢任何形式的聚光灯,可能是目前这个量级的AI高管中唯一一位从未上过科技播客的人。本次报道中,他也通过发言人拒绝了采访。 Anthropic和OpenAI两家公司争的是同一批芯片、同一批投资人、同一批员工和同一批客户。Anthropic的营收近期飙升,本月年化收入突破300亿美元(约合人民币2046亿元),是2025年底水平的三倍多,略超过OpenAI同期水平。据The Information此前报道,OpenAI在2025年底的年化收入为210亿美元(约合人民币1432亿元),毛利率33%。 但收入飙升也带来质疑,OpenAI已经借机发难,暗指Anthropic是否拿到了足够多的AI服务器。 Anthropic CEO达里奥·阿莫代伊(Dario Amodei)说过,准确预测公司数年之后的庞大算力需求,是决定“成功还是破产”的关键。而这份计算任务的大部分责任落在拉奥肩上。 曾和拉奥在黑石、爱彼迎共事的拉奥导师劳伦斯·托西(Laurence Tosi)认为拉奥顶得住,他的整个职业生涯都贯穿着“有纪律的增长”这一概念。“他不会靠希望亏钱,也不会在愚蠢的估值上融资。”托西说。 四、从哈佛、耶鲁法学院、黑石,再到Airbnb IPO操盘手 拉奥出生于明尼阿波利斯,在南加州和明尼苏达两地长大,2005年以summa cum laude(最高荣誉)从哈佛大学经济学专业毕业,随后在贝恩公司当了三年顾问,接着拿到耶鲁法学院的学位,并得到了一份美国最高法院的宝贵实习机会。但他没有选择做律师,而是去了黑石。 在当年面试他的黑石高管布兰德的印象里,拉奥原本可能过不了关,因为他没有投行背景,也没在私募股权干过。但几轮脑筋急转弯式的问题过后,布兰德被说服了,黑石聘用拉奥为高级助理。“我觉得他聪明,而且很能聊,有一种干冷幽默感,是那种你愿意一起玩的人。”布兰德回忆。 布兰德称,拉奥最突出的优势是在棘手情形下的谈判能力。他举例称,在黑石将一家公司私有化后,拉奥作为黑石方代表进入董事会,与节奏迟缓的管理团队反复博弈。“不管发生什么,他都非常能干、非常冷静。” 拉奥的工作经历(图源:领英) 2015年,拉奥把目光投向西海岸,在优步(Uber)和爱彼迎中选择了后者,与当时已从黑石CFO转任爱彼迎CFO的托西重逢。拉奥起步于FP&A(财务规划与分析),很快升任爱彼迎公司与业务发展负责人,推动公司投资餐厅应用Resy,并以4亿美元(约合人民币27.28亿元)收购HotelTonight。 2020年初,爱彼迎正准备上市,随后其业务受疫情重创,上市计划搁浅。拉奥主导了救命谈判:4月6日,爱彼迎宣布从Sixth Street和银湖资本获得10亿美元(约合人民币68.2亿元)紧急融资;不到一周,又从贝莱德、富达和普信集团等投资人手中拿下另外10亿美元债务融资。 到了夏天,业务开始复苏,上市计划重启。2020年12月初,爱彼迎以470亿美元(约合人民币3205亿元)估值完成IPO,募集超过35亿美元(约合人民币238.7亿元),上市首日收盘市值突破1000亿美元(约合人民币6820亿元)。一位参与爱彼迎IPO的律师说:“商业侧运作IPO的就是他。我觉得他协调得非常好,对接银行和爱彼迎内部高管都很到位。” 离开爱彼迎后,拉奥做了几次较短时间的跳槽:先是担任医疗支付创业公司Cedar的CFO,又去运动周边公司Fanatics担任其电商业务的CFO。Fanatics这份部门CFO职位在公司层级中其实是一步退棋,他也没待很久。一年后,他开始考虑加入Anthropic。 Anthropic认真考察拉奥时,是Anthropic联合创始人Daniela Amodei(丹妮拉·阿莫代伊)打电话给他的推荐人之一托西,托西极力推荐。拉奥不久后就拿到了Offer。“他们要的是懂融资、风险、投资人和公募市场的人,不想要一个从软件公司财务主管做起的硅谷CFO。”托西说。 五、入职一年:毛利率从-94%翻到+40%,组建前银行家并购军团 在拉奥加入Anthropic前,公司主要业务职能由联合创始人汤姆·布朗(Tom Brown)负责,他此前在OpenAI和谷歌DeepMind工作过。但据一位接近公司的人士称,布朗需要一位有融资背景的财务高管来帮他。 2024年拉奥入职时,Anthropic估值约为150亿美元(约合人民币1023亿元),年化收入仅为两三亿美元级别。公司在很多方面仍像一间研究实验室。Anthropic的董事会会议此前主要聚焦技术、政策和AI安全议题,拉奥在议程中增加了业务和财务表现专项,包括企业软件指标和增长的关键先行指标。 他的第一刀砍向毛利率和算力管理。据The Information报道,Anthropic毛利率从2024年的-94%翻转到2025年的+40%。同一时间段内,公司年化收入从不到10亿美元(约合人民币68.2亿元)飙升至90亿美元(约合人民币613.8亿元)。 2026年4月,公司年化收入已升至300亿美元,几乎提前实现此前对2026年底的预测目标(图源:The Information) 与此同时,拉奥搭起一支并购团队,2025年5月挖来软银愿景基金前合伙人安德鲁·兹洛托(Andrew Zloto),此人此前也在爱彼迎与拉奥共事。一些银行家和投资人形容兹洛托对拉奥而言“至关重要”,并称他已接过老板的部分工作,包括部分与投资人、投行的会面。 Anthropic并没有急着做大手笔并购,相比之下,OpenAI曾以50亿美元(约合人民币341亿元)全股票收购硬件初创公司Io,该公司由苹果前首席设计官乔尼·艾维(Jony Ive)联合创立。拉奥和下属告诉银行家,他们更偏好单笔低于5亿美元(约合人民币34.1亿元)的交易,瞄准那些拥有前沿技术、或聚集了优秀研究人员和工程师的公司。 尽管如此,银行家和投资人的邮件、电话还是涌向Anthropic。与Anthropic高管有过交流的人士透露,其公司发展团队已经用Claude来筛选这些来电来信、分析公司。 近几个月,Anthropic还从上市科技公司挖来数位资深公司发展高管,包括前ServiceNow副总裁维沙尔·库马尔·古普塔(Vishal Kumar Gupta),他此前在ServiceNow统管全球公司发展业务,以及来自Meta、更早在谷歌任职的马特·德瓦恩(Matt Devine)。 六、严控融资条款,签下数百亿美元算力大单 曾任爱彼迎首席营销官、现任Fanatics董事的乔纳森·米尔登霍尔(Jonathan Mildenhall)形容拉奥“把东西抓得非常非常紧”。这种风格也体现在Anthropic的融资操作上。 投资人抢着挤进Anthropic的每一轮融资,同时有人抱怨拉奥执行的条款过于严苛。据四位熟悉相关融资的人士透露,去年9月宣布的130亿美元(约合人民币886.6亿元)融资轮中,Anthropic要求投资人单张支票动辄数亿美元,对部分风投基金而言相当于半个募资总额。一位熟悉OpenAI融资的人士称,OpenAI那边也设有投资门槛,做法大致相当。 即便凑齐了资金的投资人,也经常因为需求过于旺盛,而拿不到他们想要的份额,不少人感到失望。 对AI时代的CFO来说,融资只是一半的战场,另一半是算力合同。拉奥参与谈判,并管理了一系列算力协议,确保Anthropic有足够服务器来训练和运行模型。其中,包括去年年底签下的两份共计300亿美元(约合人民币2046亿元)的微软云服务器协议,以及一份承诺使用最高100万颗谷歌张量处理单元(TPU)的协议。 本月早些时候,Anthropic又宣布与博通和谷歌达成新合作,获取“多千兆瓦”级别的数据中心电力。这些合同叠加在与亚马逊AWS的多维合作之上。AWS公司发展副总裁安库什·普拉卡什(Ankush Prakash)评价拉奥说:“我们期待与他长期合作下去。” 贝塞默的迪特尔认为,面对全部这些压力,拉奥处理得很不错。“这是当前投资需求最旺的公司,他把这个动态管理得非常好。他说到做到,不做过度承诺。” 结语:从爱彼迎到Anthropic,拉奥下一站是秋季IPO 从拉奥加入Anthropic,公司估值从150亿美元(约合人民币1023亿元)抬升至3800亿美元(约合人民币2.59万亿元),年化收入从几亿美元量级跃升到今年4月初的300亿美元(约合人民币2046亿元),毛利率也完成了从负到正的翻转。他推动的多云多芯策略先于OpenAI落地,同时算力采购、并购节奏和融资条款被同步纳入CFO视野,让这家原本像“研究实验室”的公司,逐渐具备重资本运作公司的框架。 按当前节奏,Anthropic可能在今年秋季启动IPO,拉奥在爱彼迎2020年上市中积累的操盘经验,正好能够接上这一关。
外媒实测Claude设计神器:5分钟生成网页原型,半小时烧掉八成周配额
编译 | 陈佳 编辑 | 程茜 智东西4月20日消息,4月18日,外媒PCWorld记者实测发现,Anthropic的AI设计工具Claude Design约25分钟时间完成了AI Tokens科普网页的三版原型设计,但这一任务消耗了他80%的Claude Design周额度。 并且,记者误操作一键清空设计成果,切换至成本更低的Sonnet 4.6模型继续重建任务,仅五分钟便耗尽剩余20%的额度。 PCWorld记者实测中,Claude Design生成的AI Tokens科普网页原型总览(图源:PCWorld) Claude Design是Anthropic于4月17日正式推出的AI设计工具,支持用户通过文字提示生成网页原型、应用线框图、演示文稿、营销素材等视觉作品,成品可导出为ZIP、PDF、PPTX、HTML格式,也可直接对接Canva或Claude Code进行后续开发。 该工具目前以研究预览形式向Claude Pro、Max、团队和企业订阅用户开放,底层由Anthropic同日发布的新模型Opus 4.7驱动,同时配有独立的每周额度,不占用Claude Chat或Claude Code的总Token额度。 Claude Design打通了传统上割裂的设计、原型与开发环节,不仅能直接生成原型、支持编辑与多格式导出,还可一键对接Claude Code生成代码,把从创意到落地的流程整合进同一系统。设计师以外的产品经理、营销人员和企业管理者等非专业用户同样能通过使用Claude Design快速产出可用成果。 有Reddit社区用户总结出一套更“精打细算”的Claude Design用法:用户先用高成本模型完成初稿,再切换低成本模型做局部修改,尽量用简短指令或直接框选编辑,以降低Token消耗。不过,即便在这种优化成本策略下,该用户采用5倍用量的Max套餐,连续使用10小时Claude Design仍会消耗约80%的周配额,而且这种用法本身也依赖用户对模型成本结构的清晰认知。 一、一句话生成完整交互网页,25分钟出三版原型 用户试用Claude Design时,界面会显示带标签的聊天框,用户可在此输入初始提示词,并选择新建原型或演示文稿,也可以从模板开始或自行创建模板,然后开启设计任务。用户还可以填写公司名称、关联GitHub仓库、绑定本地文件夹,或是上传字体、Logo等设计素材,为后续创作准备个性化资源。 Claude Design操作界面(图源:Anthropic) PCWorld记者采用了最简单的方式,什么都不上传,直接输入一句提示词:为普通用户创建一个解释AI Tokens概念的交互图表。 拿到需求后,Claude Design并没有立刻开工,而是先抛出一组多选题:这个设计网页的目标受众是谁?偏好哪种呈现形式?希望有哪些互动设计?整体风格是《纽约时报》式的严肃编辑风,还是卡通插画风?内容规模大致在哪个量级? Claude Design生成AI Tokens科普网页前,向用户发起的交互式需求调研界面(图源:PCWorld) 这一轮问答约花了一分钟,Claude Design随即根据刚刚记者的回答规划出整体思路:采用《纽约时报》或者美国数据新闻媒体The Pudding的风格,使用衬线字体标题,页面留白充足,并搭配单一主题色。 正式创作启动后,用户与Claude的对话窗口会移至左侧边栏,网页右侧则变为大型画布,用户可实时查看设计进度。画布顶部设有标签页,用户既能查看项目的多个版本,也可直接浏览项目源文件,Claude Design支持同时生成多套设计方案。 Claude Design中生成并预览设计的界面(图源:Anthropic) 不到五分钟,Claude Design就生成了初稿:一个界面美观的网页,文案清晰、简洁易懂,能够分步讲解AI Tokens,还搭载了交互式模块,用户可以输入文字,实时查看Tokens数量。 整体来看,Claude Design仅用大约25分钟,就完成了三版AI Tokens科普原型设计,效果十分出色。 Claude Design生成的AI Tokens科普网页中,可查看Token拆分效果的交互式演示模块(图源:PCWorld) 二、误将“撤销”当返回,所有设计成果被一键清空 但在亮眼的生成效果背后,Claude Design使用过程中的成本与操作风险也开始显露。 PCWorld记者随后发现,仅25分钟,Claude Pro套餐中单独划分给Claude Design的一周使用额度就已经消耗了80%。值得注意的是,Claude Design有独立的每周额度,不占用Claude Chat或Claude Code的总Token额度。他认为自己订阅的Claude Pro套餐更适合普通个人用户,并不适合需要制作应用或网页原型的企业级使用场景。 比配额更让人崩溃的是一次操作失误。该记者在切换Claude Design生成的不同原型版本时,页面弹出“需要预览Token”的提示,原因是Claude并未将刚刚对话生成的多个设计版本集成至单一HTML文件中。由于操作失误,该记者将“撤销”按钮当成了返回键,导致所有设计成果被一键清空。Claude随即提示,撤销操作已清除全部内容,需重新从零构建所有文件。 眼看额度即将耗尽,他将模型切换到成本更低的Sonnet 4.6,让Claude重新开始设计。然而仅仅五分钟后,他本周的Claude Design额度就已彻底归零。 好在Anthropic近期向Claude用户发放了超额额度补偿,这才让他得以补充额度并完成设计实测。但即便没有发生误删文件的情况,他的使用额度也不足以支撑完整的评测流程。 三、用户总结省Token路径,设计质量依赖输入质量 Reddit社区里,有经验的用户给出了更务实的Claude Design用法建议。4月18日,一名深度使用Claude Code近一年、有软件开发背景的用户分享了自己连续使用Claude Design十小时的体验,并总结了几条节省配额的心得: 用户在首次生成文件时应优先使用Opus 4.7模型,因为初稿质量会直接影响后续迭代效果。在完成初稿后,用户可以切换至Sonnet 4.6进行局部修改,因为编辑环节的Token消耗更低、速度更快。此外,用户在提交修改指令时应尽量简短具体,或直接用编辑按钮框选元素操作,以提高效率。 这名用户订阅的是5倍用量的Max计划,十小时高强度Claude Design使用消耗了约80%的周配额。他认为这个性价比尚在接受范围内,毕竟Claude Design的配额与Claude Code是分开计算的,两套工具可以并行使用。 但这种用法本质上要求用户对模型成本有清晰认知,并主动优化使用方式,否则很容易在早期探索阶段就耗尽额度。 Reddit用户分享的Claude Design使用体验帖(图源:Reddit) 另一位有二十多年从业经验的设计师在Reddit上写道,当前不少人评价AI设计工具时,都只盯着“初期生成效果粗糙”这一点,其实完全抓错了重点。他认为,在过去十多年里,设计行业已经高度体系化,大量工作都围绕设计系统、组件复用和现有规范展开,本质上只是对已有模式的重复拼接。 从行业实际情况来看,真正能从零打造品牌、创新设计范式的设计师只是少数,绝大多数从业者只是按照需求规范拼装组件。 在这样的行业现状下,Claude Design这类AI工具的价值,并不在于一开始就能生成完美的设计,而在于它天然就适配这种结构化、规则化、重复性的工作模式。在这位设计师看来,设计行业中最容易被标准化的工作内容,本身就像是为AI准备好的训练数据。 这也不难理解,为什么Claude Design在“初次生成”上表现亮眼,可一旦进入需要大量判断与反复打磨的环节,距离成熟工具仍有差距。对没有明确需求、缺乏设计判断能力的用户而言,反复试错不仅效果有限,还会迅速推高使用成本。 从现阶段表现来看,Claude Design更像是一款“高成本设计加速器”。它能大幅缩短从想法到初稿的时间,但前提是用户清楚自己想要什么,并尽可能减少无效的反复修改。 拥有二十多年从业经验的设计师在Reddit上分享的Claude Design行业视角分析帖(图源:Reddit) 结语:好用还不够,成本可控才能成为真正的AI生产力 Claude Design能在五分钟内生成一个完整的网页原型,其效率确实让人眼前一亮。但伴随这种高效率而来的,是高昂的Token消耗。无论是生成多版本原型,还是预览、修改甚至误操作,背后都在持续烧Token。AI确实降低了从0到1的操作门槛,却让反复试错的成本变得昂贵。 这种高昂的试错成本,改变了用户使用这类工具的方式。对普通用户而言,Claude Design无法替你判断哪个方向更正确,如果在自己都模棱两可的情况下让AI反复生成、对比方案,Token额度很可能在你理清思路前就迅速烧光。 因此,对于Claude Design这类AI工具,“好不好用”依然是焦点,但它已经不再是一个单选题。能否让用户在可控的Token成本内,顺滑地完成完整的创作流程,决定了它到底是真正的生产力工具,还是只能用来尝鲜的昂贵玩具。
“龙虾热”凉了吗?
年初那阵子,OpenClaw在中文AI圈和海外开发者社区内,都成为了新时代AI生产力的代名词。 一时间,只要对AI稍有耳闻的人,都知道有这么一个“龙虾”,在电脑上部署后,可以帮你盯邮箱、跑日程、读文档、调工具、跨软件干活。OpenClaw的出现,可以说让Agent的概念第一次深入大众人心。 但,一个多月时间过去,如果只看大众社交媒体,龙虾似乎有点“凉”了,进入4月后,OpenClaw的微信指数一路下滑,从上亿回落到百万级别,仿佛二级市场上那些股价坐了“过山车”的妖股一样,留下了一道尖锐的折线。 龙虾真的凉了吗?还是说,它只是从大众围观的网红,变成了一种更窄、更贵、更现实的生产工具? 如果只看“微信指数”这样的表层声量,答案确实像是“退潮”。但把视线挪到项目和行业层面,故事恰恰相反。 OpenClaw 的 GitHub 公开发版记录显示,项目更新节奏并未停下。最新一版更新中,开发团队继续处理实际使用中的高频问题,包括提升对 GPT-5 系列模型的兼容性、修复 Telegram 频道相关异常、优化 Ollama 连接超时,并对部分底层架构与性能进行调整。 而在更大的背景中,AI用户群体的大盘其实仍然稳固,“退潮”的是“人人都能用好Agent”这层想象。 Gallup最新对23717名美国在职员工的调查显示,2026年第一季度,已有50%的受访者表示自己至少偶尔在工作中使用AI,13%每天使用,28%每周使用几次以上。 但同一组数据也显示,有41%的员工所在组织真的把AI引入到改进组织实践中,说明普及在发生,只是落地在高度分层。 对于C端用户而言,一些日常需求通过一整套OpenClaw工作流来实现确实有点“小题大做”。但到了很多真实工作/生产力场景中,Agent的飞轮其实正在越转越快。 谷歌方面今年4月披露,其平台月度AI token调用量已达480万亿,同比增长36倍;字节跳动方面此前也宣布,豆包大模型日均token调用量已超过120万亿。这说明企业级自动化和生产力场景仍在持续吞吐大量算力。 这种差异,正在龙虾退潮和Token调用持续爆表的反差中不断凸显。 这个问题其实不难给出结论:在大众视野中的龙虾,热度确实退了,但从另一个角度而言,整个Agent生态反而进入了用户的沉淀和筛选期。 为什么轻度使用的AI大众用户,玩不下去龙虾? 首先,龙虾的上手使用存在一定门槛,这个门槛并不仅仅只在安装层面。 早期OpenClaw更偏向本地部署和开发者工具链,如今官方已提供Northflank、Railway等云端一键部署方案,各家大厂也迅速推出了云端托管版、一键部署版等各种“龙虾产品”。 尽管相比起OpenClaw刚刚发布时,入口确实比过去简单得多,但这不代表大众用户就能顺畅上手。科技社区Hacker News上,一位提供预装虚拟机方案的开发者直言:“对常年混迹技术论坛的用户来说,安装也许不难,但对大多数人绝对不是。” 在一些更泛化的用户社区里,小白“龙虾”的使用体验往往是:“初次配置花了数小时,还因报错重装了三次。” 此外,就算你选择了某些一键部署工具/平台,安装也只是第一步,“会用”才是关键。 即便进了云端,用户仍要理解模型绑定、权限授权、Skill模块等一整套新概念。对轻度用户来说,他们想要的是打开就能帮忙做事的工具,而不是先学习一套新的操作系统。 而一旦上手,小白用户会逐渐意识到这样一件事:龙虾天然更适合高频、连续、流程化任务,而不是低频、碎片化需求。 这类产品最亮眼的场景,往往是持续盯邮件、定时抓取信息、批量整理资料、多工具串联执行、代码协作等长链路工作流。 在各类对龙虾用途的讨论,会发现公认的最有价值的用法,是让OpenClaw定时抓取数据,自动写入知识库,再整理成周报和月报。这种模式,本质上是把它当数字助理长期使用。 可对大多数普通用户而言,真实需求往往只是查资料、润色文字、总结文档、偶尔做表格。也就是说,大部分人的工作,根本没有复杂到需要AI去承接工作流,这些任务今天用ChatGPT、Claude、豆包和DeepSeek等网页产品就能完成。 美国“贴吧”Reddit上甚至有人总结观察到的“三周流失路径”:许多新用户第一周热情高涨,第二周开始遇到循环调用、插件报错、费用上涨等问题,第三周就暂时搁置。 说到底,不是龙虾没能力,而是工具复杂度超过了多数人的真实需求强度。 在操作门槛之外,以龙虾为代表的“系统级”Agent,还有无法忽视的安全问题。 微软此前曾公开提醒,OpenClaw并不适合直接运行在普通个人电脑或企业办公终端上,因为它通常需要接触软件权限、在线账号令牌、本地文件等高敏感资源。 OpenClaw早期曾被评为8.8/10的高危漏洞。网络资产搜索平台Censys此前的扫描数据称,在相关补丁发布前,互联网上可识别的OpenClaw暴露实例超过21,000个。 而一旦涉及到用户数据,自然也会触及很多用户敏感的神经。Thales 2026数字信任指数显示,仅有23%的消费者信任企业会负责任地使用AI数据,77%的人对AI代理替自己在线行动感到担忧。 显然,对于轻度用户而言,“龙虾”生态带来的好处和现实需求出现了错位。 因为,以OpenClaw为代表的系统级Agent,是一套需要交出权限、持续投入费用的系统。如果没有足够高频的刚需,企业级的安全维护授权,大多数人很难长期坚持使用。 但如果因此断言“龙虾凉了”,又过于草率。因为留下来的用户,并不是在大众社交平台占据最多声量的人,而是最重度的一批开发者、自动化用户和企业实验团队。 微软最近传出正在Copilot里测试OpenClaw式的常驻Agent,而且强调会做得更适合企业、更安全;这恰恰说明,OpenClaw代表的路线并没有被判死刑,相反,它正在被大厂吸收、重做和企业化。 最近两周,国内并非没有新“龙虾”,而演化为各类Agent生态的延伸。 阿里在本月推出 Qwen3.6 新版本,强化复杂任务执行与工具调用;字节本月初上线 OpenClaw 国内镜像站,方便开发者部署技能生态;阶跃星辰已与 OPPO、吉利合作,把Agent能力推进到手机和汽车终端。 17日,《哈佛商业评论》发文点名中国 AI Agent 正快速进入电商和零售场景。文章以美团为例,提到美团在内部把“小美”定位为“调度者 + 执行者”,能帮用户完成下单、比价、售后、路线安排等整套任务。 也就是说,相比起龙虾的概念火不火,厂商们已经开始聚焦争夺真实入口,当然,这项竞争还在早期阶段。 智库机构The Conference Board几周前发布的调查显示,美国企业中60%的组织仍处在AI应用早期阶段,主要停留在实验和试点层面,仅11%进入更成熟的整合状态。 换句话说,今天讨论“龙虾退潮”,很大程度上是结束了大众的“围观”,而在真实的使用场景中开始了高强度试点。 近期的全球模型API调用激增,也揭示了让小白用户真正退而却步的一点:“龙虾”的Token耗费巨大,而普通人很难持续的为模型API买单。 大众用户参与龙虾的另一个拐点,是Anthropic在几周前斩下的那刀。本月4日,Claude订阅额度不再覆盖OpenClaw这类第三方harness的高强度使用,想继续跑就得切到单独按量付费。 过去几个月中,模型厂商有的把OpenClaw剔出订阅套餐,有的不断给API涨价。这等于正式告诉市场,Agent的消耗,已经超出了“几十美元月费随便包”的范围。对于普通用户而言,只是停留在体验和探索层,显然很难接受每月付出上百美金、甚至更高昂的模型费用。 而且,Agent的贵,不是模型单价贵,而是任务链路贵。 以OpenAI最新定价为例,调用网页搜索功能,大致是每1000次10美元,部分场景更高;如果任务需要代码执行环境,还要额外支付“容器费用”,按20分钟一次会话计费,配置越高越贵,从几美分到接近2美元不等。这还没算模型本身输入输出的token成本。 说白了,Agent不再是你问一句、它答一句,而是先搜索、再调工具、再跑代码、再读取上下文继续执行。和Chatbot时代的API消耗Token的速度相比,完全不是一回事。 而Anthropic这边的收费逻辑,更能说明Agent时代为什么越来越贵。 官方定价页显示,短时缓存写入要加价约25%,长时缓存最高加价到2倍,只有命中缓存重新读取时,成本才会降到正常输入价的一成左右。也就是说,模型越常驻、任务越长链路,费用结构就越复杂。 几天前,Anthropic发布Claude Opus 4.7时表示价格与上一代相同,仍是每百万输入token 5美元、输出token 25美元。但许多社区反馈显示,新版分词机制可能让同样内容消耗更多token,用户感受并不是“没涨价”,而是“同样的问题更费额度了”。 这也解释了为什么最近Claude Pro用户抱怨增多。美国“贴吧”Reddit上有人称,自己用Pro套餐“问了3个问题就烧掉了50%的5小时额度”;也有人吐槽,以前能顺畅做完整学习笔记,现在很快就触发限制。 我本人的经历甚至更“夸张”。在Claude Opus 4.7发布当天,我曾试图让Claude整理某家公司的资料,同时以行业视角进行横向对比。这是一个信息量稍显复杂的Prompt,而Opus 4.7只运行了两轮就烧光了Claude Pro的5小时限额。 虽然这些反馈不代表官方平均水平,但它至少说明一件事:2026年,如果你想把模型当成同事、研究助手或代码搭子连续使用时,月费几十美元更像是一张体验票,而不是稳定的生产力预算。 但API价格攀升的另一面是,模型厂商的算力矩阵和服务器正在拉满运行。 Anthropic今年3月曾短暂把低峰时段订阅额度翻倍,引导用户错峰使用;月底又调整高峰期额度消耗速度,想要利用规则调节算力拥堵,给有限GPU资源排队。 另一边,今年2月,智谱宣布GLM Coding Plan套餐整体涨价30%起,海外订阅价格提高30%-60%,部分API调用价格提升67%-100%。官方给出的理由是:市场需求持续增长,用户规模与调用量快速提升,同时要保障高负载下的稳定性,并继续加大算力和模型投入。 换句话说,模型厂商涨价不是因为没人用,而是因为用的人太多。 更值得注意的是,涨价后需求并未明显回落。第一财经近期披露的报道显示,智谱2026年第一季度API价格上涨83%后,调用量仍同比增长400%,出现“量价齐升”。 其他国产模型大厂的情况也类似。阿里云、百度智能云等平台3月开始同步上调部分AI算力、模型服务和GPU租赁价格,高端GPU租赁成本上涨,交付周期拉长。价格抬升背后,本质仍是推理需求增长快于供给释放速度。 模型厂商们纷纷开始采用更精细的收费方式:按token、按工具调用、按额度、按套餐层级收费。 对企业来说,这些费用都被视为效率提升的成本;但对普通用户来说,几十美金的月支出已经是大众用户的上限。 所以,龙虾的“凉了”,本质上是用户结构变了:退下去的是尝鲜的小白、低频使用的用户和想要低成本套利的投机者;留下来的是个人开发者、有复杂工作流需求的用户。 大众的“龙虾盛宴”浅尝辄止,但是Agent革命已经全面铺开。
谷歌联手Marvel研发下一代TPU,专为AI推理打造
编译 | 刘煜 编辑 | 陈骏达 智东西4月20日消息,昨天,据The Information报道,两名直接知情人士透露,谷歌正与无晶圆厂半导体公司Marvell商谈合作,计划开发两款全新芯片,包括专为运行AI模型打造的全新TPU,以及设计用于与谷歌TPU协同工作的内存处理单元。但值得一提的是,长期以来,博通一直是谷歌TPU的独家设计合作伙伴。 本次谷歌与Marvell的合作计划最快于明年完成对内存处理单元的设计,并生产近200万颗该单元。该合作尚未披露具体金额。消息人士补充称,由于谈判仍处于早期阶段,200万这一数字仍有可能调整。 一名谷歌员工透露,对于新推理芯片的研发,谷歌早已开始布局规划。今年3月,英伟达于GTC大会上发布了旨在提升推理任务效率的LPU芯片。谷歌在其发布LPU之后,进一步加快了对新一代推理芯片的相关研发速度。 值得一提的是,LPU是英伟达以200亿美元从Groq获得技术授权后研发打造的。而谷歌此次的合作对象Marvell,曾作为Groq第一代LPU的芯片设计合作伙伴,在推理芯片设计领域积累了相应的技术与项目经验。 在合作研发层面,谷歌在芯片设计领域对博通存在单一依赖。但由于博通收费模式成本高昂,该公司按每颗量产TPU收取费用,随着TPU需求激增,谷歌的相关支出也大幅攀升。因此谷歌正寻求降低对博通依赖的途径。 不过,据The Information 2023年报道,谷歌早在当时就有摆脱对博通单一依赖的意图了。那时谷歌曾考虑让Marvell取代博通,成为其数据中心内用于连接服务器与以太网交换机的网络接口芯片供应商。 去年,谷歌为了降低对博通的单一依赖,引入了中国台湾厂商联发科参与TPU芯片的设计与生产。 但在本月早些时候,博通与谷歌签署新协议,将为谷歌下一代AI数据中心开发并供应定制化TPU及网络组件,合作期限延长至2031年。这意味着博通在谷歌的芯片体系中仍占据着核心地位。 需要补充的是,摩根士丹利曾预计,谷歌2027年TPU产量约为600万颗。不过,本次双方合作中全新TPU的设计完成时间及谷歌规划的量产规模,目前仍未明确。 此外,谷歌当前的芯片均由台积电代工生产,新款芯片最终由台积电还是其他厂商制造,目前也未确定。 在谷歌与Marvell协商此次合作前,谷歌也曾向Marvell采购过CXL控制器芯片。据两名谷歌员工介绍,这类芯片用于管理数据中心内服务器之间的内存共享。不过采购的均为现货标准产品,并未涉及定制化合作。 多年来,谷歌仅在自有数据中心内部署TPU,用于支撑搜索、YouTube及Gemini大模型等业务,且仅对谷歌云客户开放。据The Information报道,这一局面在去年出现转变:谷歌开始向客户提供TPU算力租赁服务,支持客户将其部署于非谷歌数据中心,直接挑战英伟达在AI芯片领域的主导地位。 截至目前,谷歌TPU已被包括Anthropic、Meta以及苹果在内的客户采用。 而Marvell主营数据中心通用网络、存储及光互联芯片设计,同时为客户提供定制化芯片设计服务,该业务已成为其增长最快的板块。 结语:AI Agent推高算力需求,专用推理芯片研发趋势持续升温 谷歌与Marvell的此次合作,不止为降低谷歌对博通的单一依赖。 由于AI推理环节正走向精细化分工,推理任务并非通用处理器就能一概胜任,该任务部分环节依赖峰值算力,另一部分则受限于内存读写与数据调度效率。而谷歌与Marvell此次合作研发可与TPU协同工作的内存处理单元,正是这一行业趋势下的产物。 此外,当前AI Agent对算力的消耗远高于聊天机器人等传统AI应用,随着各类AI企业持续推出更复杂的智能体产品,专用推理芯片市场也进入快速发展阶段。 除谷歌外,OpenAI已于4月中旬与AI芯片公司Cerebras达成协议,计划斥资超200亿美元采购其推理芯片,同时该公司也在与博通合作研发自研推理芯片。 综合来说,为不同任务搭配专用推理芯片,而非依靠单一处理器包揽全部工作,也在逐渐成为头部厂商提升效率、控制成本的选择趋势。在此趋势下,AI芯片有望加速从通用化路线,向更贴合场景、更聚焦专业功能的方向分化发展。
实测Claude Design:小白也能做出专业级设计|附最全玩法+官方实用技巧
所有你能想到关于设计的工作,Claude Design 现在都能做。 无论是惊艳复杂的动效模拟,用简单的一句提示词,就能创建一个能互动的着色器壁纸库。 ▲提示词:想象一下,你正在为一款未来操作系统设计壁纸。我们希望它具有互动性,让人忍不住想摆弄一番。请创建五款不同的交互式着色器壁纸,它们能够对鼠标位置甚至点击做出反应。 还是能套在应用开发过程中的打字机效果,以及文字爆炸。 用一句提示词,Claude Design 就能给我们设计打字机、单词渐隐、单词滑入、字符模糊、点转文字、打乱、交错下落、上升进入、字符弹出、加粗进入、倾斜进入共 11 种文本流格式。 ▲在一个响应式网格中,为聊天应用制作 10 种不同的文本流动画;在 300×300 的单元格中分别展示每种动画;显示用户提问并在下方显示回复。循环播放。单色显示。 Claude Design 实现的文本粒子特效,包括对 火 Fire、烟 Smoke、金属 Metal、风 Wind、雪 Snow 等单词添加了对应的视觉特效。 ▲提示词:创建一个非常大的可编辑文本框,预先填充示例文本。对于某些词语,例如「火」、「烟」、「金属」、「风」,渲染与这些词语相匹配的视觉效果和粒子效果。 甚至可以说,Claude Design 一发布就导致 Figma 股价大跌的原因,是因为现在用它做原型设计,不仅审美高,而且完全不需要手工干预。 想要给共享单车应用创建一个简单的 iOS 注册流程,过去用 Figma 要先找到 iOS 对应的应用套件,然后自己想合适的配色逻辑,添加对应的布局,现在用 Claude Design 直出可交付的方案。 ▲提示词:为一款共享单车应用创建一个简单的 iOS 注册流程。在画布上展示界面。采用蓝橙相间的现代配色方案。 我们从网上找到了 Claude Design 最全的玩法,以及上手使用 Claude Design 的保姆级教程。可以说 Claude 这次的更新,让过去一年那些做 PPT、做精美网页设计的工具,瞬间黯然失色了。 玩法一:真正的 Vibe Coding 上线 让 AI 做一个网页似乎是检查模型代码能力,最重要的一项测试。一些 Agent 产品也利用现有的模型,进行优化组合,来控制模型的输出,以得到更精确、更遵循提示词指令的网页。 但现在当 Claude 自己下场来做设计类 Agent,基本上就没有给别的产品留任何空间了。 有网友用一句话就做出了一个高品质的公司官网,生成的网页内容 UI 精美、色彩搭配高级,配有符合场景特征的动效,和其他产品的渐变紫完全不在一个等级。 并且,Claude Design 生成的网页,可以无缝衔接到 Claude Code 进行项目的优化和迭代。 除了落地页,还有网友生成了一个个人仪表盘,把每天的日程、健康信息、以及待办事项等信息放在一个页面,并且能自动切换夜间和白天模式。 ▲来源:https://x.com/jerrod_lew/status/2045493141709464047 功能性的网页,Claude Design 能自动编排好信息,并且以高品质的 UI 设计呈现。对于一些单纯是用来「炫技」的网页设计,Claude Design 的表现也比其他工具要好。 像这个地球加载系统,也是只用一句提示词,就能得到可用的结果。 ▲提示词:设计一个加载指示器原型,显示一个旋转的地球仪,带有真实的地区轮廓,全单色,无文字,尺寸为 200×200,居中显示在米白色背景上,为其添加旋转效果。 玩法二:不只是设计,办公人的 PPT 也可以做 有网友分享了自己使用 Claude Design 做 PPT 的经历,在 Claude Design 工具里,也有专门一项是用来生成 Slide Deck(幻灯片)。 其他的办公场景,像是营销邮件的设计,通过上传自己的图片素材和商业广告信息给 Claude Design,它会自动编排好所有的内容,再简单的迭代优化之后,能得到可以直接发给潜在用户的广告邮件。 还有网友用 Claude Design 做了一本电子指南,她提到自己仅用一次提示就完成了这本书的设计。 玩法三:产品、UI 设计、画原型图 在软件开发的过程中,前端一般负责实现产品经理+设计的想法,过去的 AI Coding 告诉我们「前端已死」,但设计的「Taste(品味)」无法被替代。 现在的 Claude Design + Claude Code 就是要设计+产品经理+前端,统统承包,并且让生成的内容有「taste」。 原型图一般是产品经理在拿到设计的方案后,给出一款产品成型之前的一个简单的框架,将页面的排版布局展现出来,每个功能键的交互,使产品的初步构思有一个可视化的展示。 社交媒体上大量的网友分享了自己用 Claude Design 完成的 APP 原型设计,其中不乏交互友好、赏心悦目的各种实例。 部分提示词:设计一款名为「Lumi」的 iOS 和 Android 移动应用——一款以灵性健康为主题,专注于日记和显化功能的应用。期望输出:每个主屏幕:高分辨率浅色和深色模式的模型、交互式原型流程(最少:引导 → 主页 → 创建新清单 → 撰写日志 → 查看见解)、组件库(按钮、输入框、卡片、底部面板、芯片、模态框变体)和设计系统文档(颜色、排版、间距、立面)。 无论是何种类型的 APP,Claude Design 都能找到最适合对应主题的设计方案。有网友设计了一个简单的、基于 AI 的游戏化生活管理应用程序,在生成的原型图里,有经典的热力图、各种成就等级系统,和课程等详细内容 玩法四:视频动画也能生成 基于强大的代码能力,Claude 能组合不同的动效库,生成各种各样的动画。例如在 Claude Design 的官方案例展示里,他们使用一句提示词,生成了一段宇宙运动的模拟动画。 ▲创建一个基于精灵的动画,提供关于天体距离和大小的趣味知识。将使用不同大小圆形作为天体的抽象动画与文字动画相结合。采用单色调、Helvetica字体配色方案。 也有网友输入提示词「请制作一个基于精灵图的动画,介绍任天堂的历史趣闻。将各种动画与文字动画结合起来。使用符合任天堂品牌风格的配色方案和字体。」 最后生成的动画不仅详细介绍了任天堂的历史趣闻,同时采用了动画设计来衔接和过渡不同的页面,整个动画时长 1 分 02 秒。 也有网友直接给 Claude Design 的博客文章和一些推文粘贴进去,就生成了这个 30 秒的动画视频。 所谓的精灵图 Sprite,又叫拼合图,是一个计算机图形学术语,也是目前在 Web 前端开发中常用的图像拼合技术,是指当一张二维图像集成进场景中,成为整个显示图像的一部分时,这张图就称为精灵图。 我们看到这些由 Claude Design 生成的动画,都是使用精灵图来切换显示不同的图像、排版、控制纹理尺寸等工作,保证动画效果的同时提升网页的渲染性能。 实测上手,和来自官方的 7 个实用小技巧 目前 Claude Design 仅向 Pro、Max、Team 和 Enterprise 订阅用户开放,并且有每周额度限制。我们在创建三个 Claude Design 任务之后,基本上都是动效风格比较丰富的项目,占据了 37% 的周额度。 通过 Claude 网页侧边栏的 Design 一行,或是直接输入网址我们可以访问 Claude Design 的首页。 和一般的网页生成 Agent 工具不同,Claude 并没有在首页放一个大大的对话框,而是大多数的传统设计工具一样。主页左边可以让我们新建不同的项目,原型、幻灯片、从模板开始或者其他类型,还有一个设计系统的设置。 在原型设计中,又分为线框图和高保真内容,幻灯片则可以开启「使用演讲者备注」的功能,以及选择已有的模板,从模板开始设计。 输入项目名字,点击创建,来到项目首页。Claude Design 在左侧边栏为我们提供了对话窗口,而在右边则可以用先画草图的方式,让 Claude Design 通过草图来完成设计。 我们输入了一句简单的提示词,「帮我设计一个 Spotify 2026 wrapped 的年度总结动画」,等 Claude 自动跑完所有的流程,它最后生成了一段 44s 的动画,包括年度歌手、音乐风格、收听时长等信息,并且提供了 Tweak,我们可以直接在右侧边栏进行修改。 在测试 PPT 制作时,我们发送了一句简单的提示词,Claude 会生成一份问卷,要求我们回答,最后的 PPT 是什么形态,例如语言的要求、页数的要求、演讲者备注是否要详细、听众技术背景等等。 最后,Claude Design 生成的 40 页 PPT,在内容上不仅要比一些动不动深度研究几十分钟的工具要全面,并且还直接在下方提供了讲稿,还允许我们对主题进行修改,使用深色/午夜蓝/暖色调,以及对字体大小的修改等。 ▲提示词:我要给高中生做演讲,主题是大语言模型的发展–从 2026 到 2030,时长是一个小时,帮我设计一份 PPT。 Claude Design 的设计师 Ryan Mather,在 X 上也分享了一些充分利用 Claude Design 的小技巧。 搭建你的设计系统和核心界面。花一个小时进行设置和完善是值得的。 与工程师实时迭代。通常在一次会议中,就能和工程师一起设计出新功能。因为 Claude 在做原型方面非常快,我们可以把讨论保持在较高层次,一边围绕概念和约束进行头脑风暴,一边看着它们逐渐成形。 使用评论工具进行快速、精准的修改。在完成一个粗略的初稿之后,可能会发现有几十个细节想要调整。用语言去描述所有这些修改会很棘手,所以应该使用评论工具,直接指出并进行修改。 让 Claude 为我们的想法制作视频演示。Claude Design 几乎可以做到我们能想到的任何事情,它更像 Claude Code,而不是一个基于画布的设计工具。 使用连接器(尤其是 docs / slack)。 一旦设置完成,我们可以发送类似这样的提示:「请阅读产品交流会的会议记录,并创建一个演示文稿,探讨所有出现问题的不同设计解决方案」。 让 Claude 即时创建定制工具。通常情况下,不要试图像使用基于画布的工具那样去使用 Claude Design。它是另一种存在,拥有不同的能力。多尝试,玩出点花样!你会发现自己的设计方式已经远远超出了过去的思路。 知道何时放慢节奏,亲手完成。新的图标、点缀插画、命名。有些细节始终会产生超出预期的影响。很容易被 Agent 设计的高速节奏卷入其中。知道何时放慢下来,本身也是一门艺术。 ▲就像每个学校、公司都会有自己的品牌使用指引,规范颜色、字体、Logo 等形象,Claude Design 的设计系统,也能让我们一次性规范这些设计资源。 得益于 Claude 目前强大的生态系统, Claude Design 的能力有机会真正融入到 AI 工作流里,彻底改变过去那些 AI 网页生成类工具里,输出过于泛化、忽视现有设计语言,以及很难以在团队流程中复用等问题。
阿里甩出AI语音转写神器!准确率击败字节腾讯,连方言都能写对
作者 | 王涵 编辑 | 心缘 智东西4月20日报道,刚刚,阿里发布语音识别大模型Fun-ASR1.5,该模型是千问端到端语音识别大模型的新一代版本。 该模型可以识别30种语言,覆盖中文七大方言体系及20余种地方口音,并强化了古诗词诵读的专项识别。Fun-ASR1.5可以分辨出语音中的抑扬顿挫,重点优化了标点预测和文本归一化能力,可以应用于会议纪要、新闻采访整理、法律笔录等场景。 技术团队介绍称,与Seed-ASR和Tencent-ASR模型相比,Fun-ASR1.5在西班牙语、葡萄牙语和英语方面的识别准确率成绩较为突出,均在96分以上。 Fun-ASR1.5在开源多语言测试集中获得多项SOTA 中文方言方面,Fun-ASR1.5则在四川话、闽南话、长沙话、苏州话等13种方言识别准确率上,超越Seed-ASR和Tencent-ASR模型。 Fun-ASR1.5在工业方言测试集中获得多项SOTA 智东西第一时间体验了其音频转写功能。我们上传了一段三星CES 2026“First Look”演讲的录音音频。在原音频中,背景环境声音嘈杂,演讲人使用英语演讲但带有韩语口音,且录制声音较小。 Fun-ASR1.5不仅将演讲内容准确完整地转写了出来,还根据演讲人的语气和内容,对相关语句进行了大写强调处理,提高了会议转写的效率。 智东西实测体验音频转写 目前用户可以在魔搭社区体验该模型,开发者可以通过阿里云百炼平台调用API。 一、能识别30种语言,跨语言切换无需预设 Fun-ASR1.5可精准识别欧洲、东亚、东南亚、南亚及中东主流语种,覆盖中、英、日、韩、法、德、西、葡、俄、阿拉伯语等30种语言。 韩语: ASR结果:저는 이 주제에 따라 한 말씀 드리자면, 사실 저희도 이전에 비슷한 상황을 겪은 적이 있습니다. 马来语: ASR结果:Kejayaan projek ini tidak dapat dipisahkan daripada usaha pasukan, terutamanya kerja keras siang malam oleh jabatan penyelidikan dan pembangunan. 西班牙语: ASR结果:La diversidad cultural es un tesoro invaluable para la sociedad humana, y debemos respetar y proteger todas las tradiciones culturales. 在跨语言切换(Code-Switching)场景下,Fun-ASR1.5可以做到无需预设语种标签,就自动识别并切换,保证转写的准确性。比如,同一段对话里夹杂多种语言,模型也能准确识别,无需提前告诉它接下来要说哪种语言。 英语日语切换: ASR结果:We’ve all had that experience of finally visiting a place we’ve dreamed about for years,only to find that it doesn’t quite live up to our expectations.There’s even a term for this in one of the most visited cities in the world,Paris Syndrome.何年も前から行きたかった場所をやっと訪れてみたら、思っていたほどではなかったという経験は誰しもあることだと思います。 技术团队介绍称,这种多语言能力,源于模型的架构和训练创新。Fun-ASR1.5采取MoE(混合专家)架构,模型内部可以分工协作,听到特定语言时仅激活相关部分进行处理,因而更为灵活高效。 同时,技术团队在模型的训练阶段分级、分阶段地使用精准数据,也可以使模型更能适配真实世界中的复杂语音场景。 二、错字率下降56.2%,古诗词准确率达97% 在中文本土化方面,基于数十万小时真实方言语音数据训练,技术团队称,Fun-ASR1.5的平均字错误率(CER)相比上一版本下降56.2%。 上海话: ASR结果:现在发展了蛮快个现在伊拉用户算大户唻。 客家话: ASR结果:呃,那些吃的不就这样的土笋冻啊,我觉得不好吃。 闽南话: ASR识别结果:但是一个人若是两三两百箍一百外箍安无算贵吧,吼自助餐啊,啊你也有肉咯也有菜咯也有水果咯也有甜点咯,啥物计有咯。 粤语: ASR结果:诶,其实可能有时候觉得去超市都几远下噶。 此外,该模型不仅听得懂,还能“写得地道”,Fun-ASR1.5可原汁原味还原方言,如上海话的“侬”、苏州话“倷”(均指“你”),为下游模型处理方言文字提供了准确的基础语料。 不同于现代口语,文言语法特殊、典故生僻字繁多,具有不少挑战。例如,文言语法简练,省略主谓宾;押韵严格,节奏固定(如五言、七言律诗);多用典故、异体字、古今异义词;诵读时存在拖腔、停顿、吟咏等非自然语流特征。 Fun-ASR1.5对中文古诗词识别进行专项优化。研究团队构建了先秦至近代的古诗词语音-文本对齐语料库,涵盖《诗经》《楚辞》、李白杜甫诗集、苏轼辛弃疾词作等经典文本的真人诵读录音。 在内部评测集中,Fun-ASR1.5对古诗词的字符级准确率达到97%,可应用于国学在线课程和有声诗词,助力文化传承。 ASR结果:蓬山此去无多路,青鸟殷勤为探看。 ASR结果:子夏曰,博学而笃志,切问而近思,仁在其中矣。 三、能自动插入标点符号,口语表达一键规范 语音识别最终都要落脚于生成可直接使用的文本,Fun-ASR1.5在后处理环节也重点优化了标点预测和文本归一化两项能力,大幅降低了会议纪要、新闻采访整理、法律笔录等场景的后期人工校对和编辑成本,具体如下: 1、标点预测:更加智能模型基于上下文语义自动插入逗号、句号、问号、感叹号等标点,使转写结果接近书面表达。例如: 输入语音:“今天天气怎么样啊我想出去走走但又怕下雨”输出文本:“今天天气怎么样啊?我想出去走走,但又怕下雨。” 2、文本归一化(ITN)表现:进一步提升将口语中的非标准表达自动转换为规范格式: 数字:“三千五百六十二” → “3562” 日期:“二零二六年三月二十九号” → “2026年3月29日” 金额:“五万八千块” → “58000元” 电话:“幺三八零零幺三八零零零” → “13800138000” 结语:AI语音模型正稳步落地应用 会议纪要、法律笔录等场景,长期处于“半自动”应用状态,核心痛点是AI识别结果需人工进行大量校对,不仅未能有效提升工作效率,还影响了实际工作推进。 阿里Fun-ASR1.5针对这一痛点进行定向优化,补齐了传统语音识别的部分短板,也降低了各行业引入AI语音技术的门槛。 目前,科大讯飞、百度、字节等企业的语音模型均在持续迭代,AI语音大模型正从技术研发逐步向实际应用推进,语音识别作为AI与人交互的重要入口,其实用性直接关系到行业落地的实际效果。
OPPO Find X9 Pro,4779元解锁“夜拍大师”与“全能旗舰”
OPPO Find X9 Pro:4779元的“全能旗舰”,为何值得你立刻入手? 在2026年的手机市场,旗舰机的“内卷”早已从单纯的参数比拼,升级为对用户体验、生态协同与性价比的全方位考量。OPPO Find X9 Pro正是这样一款集哈苏影像、旗舰性能、超长续航与智慧生态于一身的“六边形战士”。如今,随着淘宝百亿补贴的限时加码,这款16GB+512GB版本的顶级旗舰到手价仅需4779元,叠加国补更可低至4279元,还附赠原装充电器与碎屏险。这不仅是价格的“跳水”,更是OPPO向市场交出的一份诚意答卷。 核心卖点:从“参数领先”到“体验制胜” OPPO Find X9 Pro的强大,并非堆砌硬件的简单叠加,而是围绕用户核心需求构建的系统性优势。 哈苏2亿长焦:移动影像的“画质革命” 在影像领域,Find X9 Pro搭载了行业瞩目的哈苏2亿像素超清长焦镜头,采用1/1.56英寸大底传感器与f/2.1光圈,配合四轴OIS光学防抖,实现了真正的“无损放大”。无论是拍摄远处的建筑细节,还是捕捉舞台上的精彩瞬间,都能呈现清晰锐利的画质。哈苏自然色彩调校让照片拥有专业级的动态范围与色彩还原,告别“数码味”,每一张都如同艺术品。 天玑9500+7500mAh:性能与续航的“双核驱动” 性能方面,天玑9500旗舰芯片搭配LPDDR5X内存与UFS 4.1闪存,构成“性能铁三角”。实测《原神》最高画质60帧运行1小时,机身温度控制在42℃以内,帧率波动仅2.3帧,多任务切换时,16GB大运存可同时驻留30个应用,后台应用重启率低于5%。续航方面,7500mAh冰川电池实现“续航天花板”级表现:重度使用场景下(社交、游戏、视频)可持续24小时,总亮屏时间超7小时;80W有线快充30分钟充入54%,50M无线快充则满足碎片化充电需求。 绒砂钛工艺:设计美学的“视觉与触觉反差” 设计美学上,16GB+512GB绒砂钛版本采用微米级绒砂工艺,玻璃后盖呈现金属光泽的同时,触感如丝绒般细腻,彻底告别指纹沾染问题。机身采用超大弧度边框设计,224克重量分布均匀,长时间握持无头重脚轻感。矩形镜头模组通过冷雕工艺与背板无缝衔接,边缘铝合金高亮装饰圈随光线变化呈现冷冽银与温柔金的渐变效果,既凸显精致感又视觉减薄。 ColorOS 16:智慧生态的“无缝互联” ColorOS 16系统深度优化多设备互联,实测与OPPO平板、笔记本、手表等设备一键互联,文件互传速度达1.2GB/秒,AI语音助手支持声控拍照、定时连拍等功能,进一步拓展使用场景。 适合群体:精准定位多元需求 OPPO Find X9 Pro并非面向所有人的“万金油”,而是精准锁定三类核心用户: 影像爱好者与内容创作者:哈苏2亿长焦与全场景影像系统,让他们能轻松捕捉专业级照片与视频,无论是旅行记录、Vlog拍摄还是社交媒体分享,都能满足对画质的极致追求。 重度续航需求用户:经常出差、旅行或长时间在外办公的用户,7500mAh大电池与80W快充能彻底告别电量焦虑,实现“一天一充”甚至“两天一充”的续航体验。 性能党与商务用户:天玑9500芯片与16GB大运存确保大型游戏、多任务处理的流畅体验,而精致的设计与智慧生态则满足商务场景下的高效办公与形象需求。 使用场景:从日常通勤到专业创作的无缝覆盖 在日常通勤中,Find X9 Pro的轻薄手感与智慧互联功能,让用户能高效处理邮件、查阅文档,同时通过AI语音助手实现声控导航、音乐播放等操作。 在旅行与户外场景中,7500mAh大电池与IP68防水功能,让用户无需携带充电宝,即可应对长时间拍摄与导航需求,哈苏长焦镜头更能捕捉远处的风景与人文细节。 在专业创作场景中,2亿像素长焦与哈苏影调,让摄影师能轻松拍摄高质量的照片与视频,ColorOS 16的多设备互联功能则方便与平板、笔记本协同工作,实现素材的快速传输与编辑。 价格与福利:限时补贴下的“性价比之王” 此次淘宝百亿补贴的限时活动,让OPPO Find X9 Pro的性价比达到前所未有的高度。16GB+512GB版本日常价5299元,现到手价仅4779元,直降520元,叠加国补更可低至4279元,比日常价低820元。同时,赠送原装充电器与碎屏险,进一步降低用户的使用成本与风险。 结语:一次“闭眼入”的旗舰选择 OPPO Find X9 Pro凭借哈苏2亿长焦、天玑9500芯片、7500mAh续航与智慧生态的四大核心优势,重新定义了高端旗舰的标准。在淘宝百亿补贴的加持下,这款“全能旗舰”以4779元的亲民价格,成为2026年最值得入手的影像旗舰之一。对于追求画质、续航与性能的用户来说,这无疑是一次“闭眼入”的绝佳机会。
OPPO Find X9 Ultra外观已公布,Reno16 Pro系列再曝
最近,关于OPPO后续新机的消息正在大量出现。除了即将亮相的Find X9s Pro和 Find X9 Ultra外,还有Reno系列的新消息。 今天,博主@数码闲聊站 的一份爆料中显示,一款疑似OPPO Reno16 Pro系列的新机将提供白色、黑色、紫色、绿色几款配色,带来12+256GB、12+512GB、16+256GB、16+512GB、16+1TB等存储组合,但不知道超大内存版本会不会被取消。 这款工程机配备6.78英寸1.5K LTPO四窄边大直屏,搭载天玑9400+(9500s),内置7K级大电池,配备200Mp大底影像、潜望镜,采用金属中框设计。 除此之外,这位博主以往的爆料也提到过OPPO Reno16 系列的产品。 当时的消息显示,Reno下一代在考虑新增超大杯Pro Max,天玑N-1旗舰芯片,6.78"1.5K LTPO四等边直屏,200Mp大底主摄+50Mp潜望镜,核心增配涨价。 也就是说,OPPO有望在接下来为Reno系列引入Pro Max机型。 据悉,2025年已经有多家厂商都推出了Pro Max机型,且这些机型都取得了不错的销售成绩。在这样的市场趋势下,Pro Max命名似乎会有更多品牌跟进,这其中也就包括OPPO品牌。 同一位博主更早之前的爆料也曾提到过,Reno系列的下一代已经开始测试了,当时还是全系多尺寸直屏,全系标配200Mp大底主摄,全系标配50Mp潜望长焦,芯片测试天玑8500系列,普及金属中框,下放LIPO四等边,超轻薄拍照机,暂定年中前后发布。 同时按照爆料中的信息来看,OPPO Reno系列“固定一年两代,最近几代都卖得很好,也出得快”。 参考来看,OPPO Reno 15 手机于去年 11 月发布。配置方面,OPPO Reno15采用6.32英寸1.5K小屏,配备金属中框,搭载联发科天玑 8450 芯片,内置6200mAh电池,支持 80W 有线快充。OPPO Reno15 Pro 版搭载天玑 8450 处理器、自研山海通信增强芯片、纳米冰晶散热,采用6.78 英寸1.5K 护眼屏,内置 6500mAh电池,支持 80W 有线快充、50W 无线快充、旁路供电。在此基础上,OPPO Reno15起售价 2999 元,OPPO Reno15 Pro起售价 3699 元。 除此之外,OPPO Find X9 Ultra的外观也已正式公布。 官方介绍称,OPPO Find X9 Ultra可以说是真正能装进口袋里的「专业口袋哈苏」。 灵感来源于哈苏 X2D 大地探索家限量版,「大地苔原」颜色来源于哈苏故乡的北欧苔原;新一代皮革材质也参考了哈苏相机的手柄设计,更加的防滑耐用;侧边的金属快门键,特意赋予了那一抹哈苏橙。 同时,OPPO Find X9 Ultra还有极地冰川、绒砂峡谷等配色。提供哈苏大地探索家大师套装,包括哈苏专业增距镜 Ultra、哈苏摄影手柄保护壳、哈苏收藏纪念编号证书。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。