注册 登录
EN
中文
APP下载
logo
icon
数字孪生
icon
大数据获客
icon
人工智能
分类目录
行业分类:
IT/通信
金融财经
市场/营销
交通/物流
节能环保
休闲旅游
农林渔牧
日化用品
数码家电
房产/建材
企业/管理
家具/家居
医疗/保健
新零售
机械/工业
餐饮/食品
其它行业
头条分类:
行业前景
行业动态
行业资讯
行业活动
Q1净赚1200亿,台积电成了AI产业链“话事人”
算力时代的产业新秩序。 采写/丁泽文 编辑/万天南 2026年4月16日,台积电发布2026年第一季度财报,单季营收359亿美元,毛利率66.2%,双双超出市场预期。 这份业绩并非短期景气,而是产业链权力转移的明确信号:当上游模型与应用厂商仍在竞争叙事、下游硬件落地仍在探索路径时,行业利润已向最底层的制造环节加速集中,彻底打破过去二十年科技行业的价值分配规则。 过去十年,全球科技产业的价值分配始终遵循“终端为王、应用至上”的逻辑。移动互联网浪潮中,苹果、三星、华为等消费电子品牌占据产业链利润顶端,谷歌、Meta等互联网平台依托流量与生态实现高毛利,芯片设计公司依靠架构创新与产品迭代分享行业红利,而晶圆制造环节长期被视作“苦力型”配套产业,处于成本敏感、低议价、重资产的被动位置。即便在半导体行业内部,市场也更关注设计创新、指令集架构、芯片功能迭代,制造环节的价值被长期低估。但AI算力时代的到来,彻底颠覆这一格局。 大模型训练与推理对算力密度、能效比、制程精度提出前所未有的要求,先进制造变成不可替代的产业基础设施。台积电66.2%的毛利率,不仅是单季度业绩的突破,更是全球科技产业链权力再分配的标志性事件。 移动互联网时代,产业价值集中在贴近用户的环节,操作系统、平台生态、消费电子品牌与终端硬件占据利润核心。制造虽不可或缺,却长期被视为只拼规模与效率的配套角色,处于价值链中低端,议价能力有限。而AI算力时代的到来,让先进制造从配套环节升级为整个产业的刚性瓶颈,价值流向随之逆转。 产业链结构重塑:三层分工下的利润再分配 当前AI产业链已形成清晰的三层结构,各环节风险、收益与话语权发生根本性改变。 上层是模型与应用公司,以OpenAI等厂商为代表,产品迭代快、研发投入高,同时承担最大商业不确定性。大模型训练、人才与算力成本居高不下,商业化落地仍在探索,盈利路径尚不清晰。 中层是芯片设计企业,以英伟达为代表,直接受益于算力需求爆发,营收与利润快速增长。但据TrendForce(集邦咨询)数据,2026年搭载云厂商自研ASIC的AI服务器出货占比将达27.%,谷歌、亚马逊、微软、Meta等头部云厂商持续推进自研芯片以降低成本、锁定产能,对通用GPU形成持续分流与定价压力;叠加AI芯片迭代加速、产品生命周期缩短、竞争对手追赶,长期增长存在明确隐忧。 底层则是以台积电为核心的晶圆制造环节,成为连接设计与应用的关键出口。 从商业模式看,上层应用与模型公司普遍处于“高投入、弱变现”阶段。大模型训练单次成本动辄数亿美元,顶尖算法人才成本持续走高,算力采购占据大部分开支,但面向企业与消费者的付费转化仍处于早期。多数AI厂商尚未建立稳定现金流,只能依靠融资与母公司补贴维持研发投入,盈利周期被不断拉长。 中层芯片设计行业当前盈利水平极高,以英伟达为代表的厂商盈利能力甚至领先全产业链,但增长逻辑正在发生结构性变化。一方面,云服务厂商加速自研AI芯片,试图绕过第三方设计公司直接与晶圆厂合作,以降低成本并锁定长期产能;另一方面,AI芯片架构竞争日趋激烈,算力、显存、互联标准快速迭代,产品生命周期大幅缩短,研发投入与技术风险显著上升。尽管当前设计环节盈利水平突出,但长期增长的确定性正在被削弱。 与之相对,台积电凭借先进制程垄断性地位,成为所有AI创新的必经出口。无论是设计层的架构突破,还是应用层的产品落地,最终都必须依托高性能、高良率的先进制程实现商业化,制造环节的议价能力由此实现质变。 算力是AI产业的物理瓶颈,算法与架构演进最终必须依托硬件落地,高性能计算芯片需依靠先进制程实现性能与能效平衡。 目前,台积电是全球唯一能大规模、高良率稳定量产3纳米芯片的代工厂,所有AI竞争无论发生在应用层还是设计层,最终都要经过同一制造出口。 这种“单点收敛”结构,让台积电从被动接单的代工厂,升级为承载全球算力的基础设施提供者。上游创新越激烈,对底层制造能力的依赖就越强,台积电在产业链中的话语权持续提升,并直接反映在财报表现中。 业务结构突变:AI算力驱动增长,传统业务让位 一季度本是半导体传统淡季,智能手机厂商去库存通常导致晶圆厂产能利用率回落,但这一规律在2026年被AI需求打破。 财报显示,台积电高性能计算(HPC)业务收入占比升至61%,季环比增长20%,核心驱动力来自AI训练GPU、推理芯片与加速芯片。AI需求不仅填平消费电子淡季波动,更重塑了台积电的增长曲线,使其逐步摆脱传统周期束缚。 与之形成鲜明对比,智能手机芯片作为台积电长期基本盘显著降温,本季度收入占比降至26%,季环比下滑11%,这并非短期季节性调整,而是不可逆的结构性位移。在先进制程产能刚性、3纳米产线投资巨大的背景下,台积电已从“接单生产”转向主动筛选客户。 先进制程产能的稀缺性,进一步强化台积电的产业链主导权。3纳米、5纳米产线单座投资超百亿美元,设备交付周期长、技术门槛极高、良率爬坡缓慢,形成极高的行业壁垒。 在产能有限的前提下,台积电的产能分配逻辑从“按订单生产”转向“按价值分配”。 智能手机芯片虽然出货量大,但单价与利润空间有限,且行业处于存量竞争,客户对价格高度敏感,难以支撑先进制程的高成本。 AI算力芯片则完全不同,云厂商、AI算力企业、大型科技公司为保障模型训练与服务稳定,愿意签订长期产能协议,接受更高的代工价格,并提前支付产能定金。这种客户结构的切换,直接带来毛利率的阶梯式提升。 与此同时,台积电持续将资源向先进制程集中,根据台积电2026年第一季财报,7纳米及以下先进制程营收占比已达74%,其中5纳米贡献36%、3纳米贡献25%,合计占比高达61%,成熟制程营收占比持续收缩。公司将资本开支、产能与研发资源优先配置于高毛利先进制程,而非被动承接市场需求,这种主动结构调整,成为台积电维持66.2%超高毛利率的核心支撑。 智能手机市场饱和、价格竞争激烈,厂商对成本高度敏感;而AI客户(云厂商、算力企业)更重视产能保障与交付时效,愿意为优先产能支付溢价。 先进制程资源不可逆地向高价值需求倾斜,HPC业务(高性能计算)占比持续攀升、手机业务不断收缩,本质是产能向更高利润、更刚性需求集中。这一变化直接支撑台积电实现66.2%的超高毛利率,其中3纳米(25%)与5纳米(36%)工艺合计贡献61%收入,成为盈利核心支柱。 AI驱动的高增长背后,行业呈现显著结构性分化。一季度Automotive业务收入占比4%,季环比下滑7%,规模与增速均显著低于HPC。车用芯片仍以28纳米及以上成熟制程为主,缺芯潮后进入去库存阶段;高阶自动驾驶先进制程渗透率有限,难以形成规模效应。同时,汽车行业更看重稳定性、成本与供应链安全,先进制程并非最优解,导致台积电核心优势难以在汽车领域释放。 AI带来的半导体行业复苏呈现明显的结构性撕裂。一方面,先进制程赛道持续火爆,3纳米、5纳米产能满载,价格与毛利同步上行;另一方面,成熟制程市场竞争激烈,消费电子、家电、工业芯片仍处于去库存周期,价格与毛利率承压。 汽车半导体曾被视为下一个增长引擎,但实际贡献远不及预期。车用芯片对可靠性、安全性、长期供货要求极高,产品迭代缓慢,且大部分需求集中在28纳米以上成熟制程,无法为台积电带来高附加值。物联网、消费类IoT芯片同样面临单价低、波动大、毛利率有限的问题。这意味着,全球半导体行业正在分裂为两个市场:AI先进制程的高增长天堂,与传统芯片的存量竞争战场。 台积电精准踩中前者,从而脱离行业周期,走出独立行情。这也意味着,台积电的增长愈发依赖少数高景气赛道,业务均衡性有所下降。 高投入增长与长期挑战:确定性背后的脆弱 台积电的高增长,依托于巨额资本开支支撑。2026年一季度,台积电资本支出达3507.6亿新台币,用于产线扩建、设备采购与先进制程研发。在先进制程竞争中,领先意味着高利润与高壁垒,持续投入才能维持优势,这是典型的高资本投入增长模式。 这一模式高度依赖两大前提:先进制程持续领先、AI算力需求持续高速增长。一旦AI商业化进展不及预期,算力采购节奏放缓,最先承压的便是制造环节。台积电庞大的先进制程产能必须持续被“填满”,否则巨额固定成本将快速侵蚀利润,这也让台积电成为一家“无法慢下来”的企业。 从宏观视角看,半导体行业正进入集中化周期。过去需求由手机、PC、汽车、消费电子等多板块分散驱动,周期波动可相互对冲;如今AI成为核心乃至唯一增长变量。集中化带来弹性,也放大了风险,台积电已蜕变为AI周期高度敏感型企业:AI上行时涨幅更显著,AI调整时更早承受压力。 地缘政治与技术竞争,进一步改变台积电的长期逻辑。过去三十年,以中国台湾地区为核心的集中生产体系,带来极致效率与成本优势,是台积电高毛利的重要基石。而在供应链安全优先的趋势下,台积电加速在美国、欧洲等地布局先进制程产能,安全溢价转化为成本抬升,人力、配套、协同效率等压力长期存在,极致效率模式被重新定价。 长期来看,台积电的领先地位并非绝对稳固。后摩尔时代,单一制程微缩的红利逐步收窄,行业竞争从“制程节点竞赛”转向系统级整合能力竞争。先进封装、小芯片(Chiplet)、3D堆叠、高速互联等技术,正在与先进制程并列为核心竞争力。 三星通过GAA制程在3纳米与2纳米路线持续追赶,英特尔依托IFS代工业务与美国政策支持重返先进制程赛道,叠加各国扶持本土半导体制造,全球先进制程供给格局将从“一强独大”逐步走向“多极竞争”。 与此同时,高额资本开支带来的折旧压力、海外建厂带来的成本上升、供应链分散带来的效率损失,都将在未来3-5年持续压制毛利率。台积电的超高毛利能否长期维持,不仅取决于AI需求,更取决于技术迭代、成本控制与全球供应链布局的综合能力。 技术层面,台积电在3纳米节点保持领先,但迈向2纳米及以下,竞争格局复杂化。三星推进GAA架构谋求技术超车,英特尔以18A制程重返先进代工赛道,行业从“先产量”竞争,转向技术路线、良率稳定性、生态绑定的体系化竞争。同时,制程逼近物理极限,单纯工艺微缩空间收窄,以CoWoS为代表的先进封装重要性提升,系统整合能力与制程能力同等重要,行业进入全面竞争新阶段。 AI周期的确定性与脆弱性 台积电2026年一季度财报,交出了增长强劲、盈利突出、地位稳固的答卷。短期来看,它仍是AI周期中最具确定性的受益者。但拉长视角,这份确定性伴随显著脆弱性:台积电手握全球最核心的先进制造能力,同时增长高度绑定AI算力单一变量。 它如同AI周期的放大器:AI需求上行,业绩被成倍放大;AI需求波动,冲击同步传导。台积电既是本轮技术周期最稳健的支柱,也是对周期变化最敏感的环节。 台积电的崛起,折射出全球科技产业的深层变迁:当AI成为核心叙事,制造环节不再是配角,而是掌握定价权的核心力量。但全行业高度集中于单一赛道,也带来弹性与风险并存的格局。这一轮AI驱动的增长能否持续,能否消化海量投入的资本与产能,当权力回归制造底层,产业链能否形成更健康的生态,将是比季度财报数据更值得行业深思的长期命题。 从产业历史维度看,每一轮科技革命都会带来价值链的重构。PC时代成就英特尔与微软,移动互联网时代成就苹果与安卓生态,而AI算力时代,核心壁垒落回最底层的先进制造。台积电用66.2%的毛利率证明,当技术创新走向深水区,能够落地、量产、稳定交付的硬科技能力,才是最稀缺的资产。 未来,随着AI应用持续渗透、算力需求持续膨胀,晶圆制造的战略地位还将进一步提升,但伴随而来的周期波动、地缘约束、技术竞争与成本压力,也将成为整个行业必须共同面对的命题。 对于全球科技产业而言,台积电的财报不仅是一份业绩单,更是一张揭示未来格局的路线图:制造归来,权力重构,AI产业的下半场,将由硬实力定义。
巨头下场,AI漫剧狂飙
技术正在拓宽内容边界。 文丨范东成 微短剧无疑是国内视频行业热门领域。 近日由国家广电总局主办的第十三届中国网络视听大会就聚焦在微短剧高质量发展、AI对微短剧的影响、漫剧规范化发展等议题上。 按照国家广电总局官方定义,微短剧指单集时长从几十秒到15分钟左右,有相对明确主题和完整情节的网络剧集;短剧指单集时长15-30分钟,集数在20集以内的连续剧。随着微短剧热度走高,大多数用户更习惯于用“短剧”一词来指代这种节奏极快、令人上瘾的剧集类型。 微短剧中新潮的是漫剧。所谓漫剧,即动画微短剧,国家广电总局官方定义的是动画形式的微短剧,是对网文、平面漫画或者原创剧本等图文故事的视频化再创作。简单来说,按照制作方式的不同,微短剧可以分为真人剧和漫剧,真人剧需要真人实拍,漫剧只需要制作动画,动画风格包括2D、3D或拟人等。 影视行业均在探索AI应用,而漫剧是其中佼佼者。漫剧无需实拍,意味着从剧本、画面制作到配音、音效等的全链路制作流程都能使用AI实现。近年大模型视频生成能力有了指数级跃迁,漫剧由此实现降本增效和产能爆发。 前述大会发布的《中国网络视听发展研究报告(2026)》显示,2025年,国内网络视听用户规模达10.99亿人,超过半数网络视听用户都已接触过AI生成内容;国内主要视听平台AI生成的内容累计突破20亿条,同比2024年增长超过14倍。 漫剧市场的发展,根植于微短剧用户规模的迅猛增长。据调研机构QuestMobile数据,2026年2月,微短剧行业覆盖用户规模已达7.18亿,行业独立APP的MAU(月活跃用户)达3.35亿,同比增长74.3%;而在2023年8月,行业APP的MAU仅为1200万。调研机构DataEye数据则显示,2025年国内漫剧用户约为1.2亿,2026年将达2.8亿。 漫剧的市场规模同样呈高速发展态势。调研机构艾媒咨询数据显示,国内漫剧市场规模2024年为50.4亿元,2025年为189.8亿元,2026年将达313.7亿元,预计2030年可达858.6亿元,5年CAGR(复合年增长率)为35.2%。 技术迭代正以前所未有的强度冲击内容产业,倒逼内容形态快速变化。潮流之中,互联网头部玩家纷纷下场竞逐漫剧,试图在流量红利见顶的世代锚定新的入口,拓宽内容边界的同时占据年轻人的用户心智。 01 技术带来爆发 漫剧上新数量正持续飙升。 据DataEye发布的《2026年Q1 AI剧及漫剧数据报告》,以抖音端为例,2026年以前在播漫剧为5.8万部,2026年第一季度增长至约18万部,单3月就新增了约5万部漫剧;2026年第一季度的新增漫剧中,占比最高的类型为AI仿真人剧(56%),2D漫排名第二(35%),其余为3D漫(5%)、沙雕漫(4%)等。 漫剧有多种不同风格类型,如保留原始漫画分镜与画风的2D漫,3D制作的3D漫,旁白解说或吐槽口播为主要推进方式的解说漫,以表情包为核心素材、极具喜剧色彩的沙雕漫,人物建模与画面光影模仿真人实拍的仿真人剧等。 漫剧崛起与类型变化均与AI的突飞猛进直接相关。 在AI视频生成能力跃迁之前,漫剧主要指动态漫画,即介于静态漫画与完整动画之间的内容形式。动态漫画的制作方式主要是让漫画产生局部动态效果,比如人物头发的飘动、嘴巴的开合等,再加上配音,既能让用户看到动起来的情节,也能使制作成本低于完整的动画。 出于运营成本考虑,OpenAI已于2026年3月宣布关停视频生成模型应用Sora,但这不能抹杀Sora在技术发展史上的重要性。正是因为2024年2月初代Sora上线后引发热潮,各大AI领域玩家才大力投入视频生成领域,其后有了谷歌的Veo、快手的可灵、字节的即梦、Minimax的海螺等系列AI视频生成产品。字节2026年2月上线的新一代AI视频生成模型Seedance 2.0,还曾因极强的模型能力被市场投以高度关注。 技术跃迁解决了漫剧的画面制作难题。 原先的动态漫画出于对成本的考量,动作往往较为简单,画面效果有限。比如小说《斗破苍穹》,有漫画、动态漫画、动画、电视剧等多种改编版本,动态漫画版本的画面质量与动画版本差距极为明显。如今AI已能够覆盖从剧本生成、美术绘图到画面动态制作、后期配音的完整流程,在降低成本的同时保证画面质量。以2026年2月上线的3D类型AI漫剧《武极天尊之神界篇》为例,其画面效果不输《斗破苍穹》的动画版本。 长江证券2026年3月5日发布的一份研报提及,真人微短剧单部制作成本120万-150万元,拍摄加后期制作的完整生产周期为1-2个月;动画制作成本为每分钟动画2万-3万元,单部制作成本超过100万元,制作周期多为3-6个月,有的超过1年;AI漫剧制作成本为每分钟1000元,单部10万-30万元,1-2周就可以生产一部,最快1天即可完成单部制作;真人微短剧头部演员日薪可达3万元,动画需要30-50人的专业美术团队,AI漫剧仅需2-3人小团队使用AI工具即可完成,60%以上的制作流程都可以交给AI。 相较于电影和传统剧集,微短剧的门槛与生产成本大幅降低,这是微短剧近年来增速极高的原因之一。与真人微短剧相比,漫剧的门槛与生产成本进一步下降。 从事微短剧行业的小宋参与过真人剧与漫剧的制作。小宋对海克财经表示,制作较为精良的3D漫成本稍高,可达每分钟6000-8000元,但仍比传统动画便宜很多;如果是2D漫,制作普通的可以低至每分钟600元,精品的约在1000-2000元;同样质量中上的微短剧,漫剧的整体成本约是真人剧的一半,制作周期也能减少约10天;最为重要的是,漫剧能够成为数字资产,场景、人物等素材很多可以复用,这能极大降低成本,提升效率。 兼具导演、编剧、演员等多重身份的业内资深创作者李景涛,20多年来在电影电视真人剧投拍及发行上积累了丰富经验,有电影《一路绽放》《激战黎明》、电视剧《母爱如山》、短剧《婚里婚外》《萌萌,战起来》等多部代表作。作为文化传媒公司大景天骐创始人,李景涛近来亦对漫剧生产及AI价值有了再认识。李景涛在接受海克财经采访时提到,AI在真人剧上还有明显短板,但在漫剧上已可堪一用,目前他和他的团队已颇多用到即梦、可灵、OiiOii等AI工具,每月Token消耗量已颇可观;尽管AI生成内容在画面、声音等细节上还存在前后不一致等瑕疵,尚需后期人工剪辑及重新配音等必要操作,但成本可大幅降低,而且理论上已经可以做到一个人顶替一个团队。 02 头部玩家竞逐 漫剧与真人微短剧的商业模式基本一致。 影视产业链的上游为IP版权与剧本供给,中游为剧集制作,下游为分发、变现,微短剧也是如此。常见的微短剧观看平台包括短视频平台抖音、快手,微信、抖音等平台的小程序,微短剧独立应用APP,部分长视频平台也有微短剧内容。微短剧的变现方式则以IAA(观看广告)和IAP(付费购买)为主。 微短剧中,漫剧比真人剧有更为特殊的生态位。漫剧源于漫画,属于二次元文化。部分漫画平台原本就设有动态漫画这一分类,在漫剧浪潮到来以后直接改为漫剧,比如腾讯动漫就有漫剧页面。主流的微短剧平台普遍兼有真人剧与漫剧,但漫剧又能够拥有独立的用户心智。因此,字节于2023年5月推出红果短剧后,又在2025年3月推出红果漫剧,腾讯则于2026年2月推出了火龙漫剧。 凭借免费的IAA流量打法,字节先以番茄小说切入免费阅读领域,有了对广告变现模型和信息流投放的深度理解,以及海量网文IP积累。然后,字节把这套打法应用于微短剧领域,使红果短剧迅速起量,如今又复用在红果漫剧上,成效显著。 据QuestMobile数据,2026年2月,在微短剧APP的MAU排行榜上,红果短剧以3.03亿排名第一,同比增长84.6%,其后为河马剧场(3928.3万)、红果漫剧(2404.4万)、喜番短剧(564.9万);而从月人均单日使用时长来看,红果漫剧仅次(90.7分钟)于红果短剧(125分钟),远超河马剧场(41.7分钟)、喜番短剧(28.1分钟)等。 在中游的生产制作环节,除了即梦外,字节还通过旗下AI创作平台小云雀AI推出了短剧智能体功能。用户只需要提供故事文本,小云雀即可自动调配智能体协同完成从剧本到成片的漫剧生产全流程。这意味着从版权储备、创作工具到终端出口,字节在每个关键节点都建立了壁垒。 腾讯对漫剧的重视远超真人微短剧。背靠腾讯的阅文集团2025年下半年开始布局AI漫剧业务,前述腾讯动漫即属于阅文。阅文宣布开放IP资源库、设立亿元专项创作基金以促进漫剧发展,还推出了漫剧助手等AI工具。阅文财报及官方数据显示,2025年下半年,集团上线了近千部AI漫剧作品,《大明贤婿》《刷爆无敌模拟系统》《魅魔判主》等多部漫剧作品播放量破亿,漫剧业务收入超过1亿元。 对同样拥有巨量IP资源的腾讯而言,长视频平台以真人影视和动画为主,内容开发成本高、制作周期长,绝大部分IP无法被视觉化激活。漫剧恰好能够高效把IP从文字、漫画等静态库存转化为视频流量。阅文集团CEO侯晓楠就公开表示,短剧与漫剧成为IP视觉化的重要引擎,能够极大提升文字到视觉的转化效率,为大量IP带来开发机会。 网易、百度等互联网玩家同样涉足了漫剧领域。网易开放了雷火映画动画编辑器等工具的商业化运营,还授权了《永劫无间》IP用于漫剧制作。腾讯上线火龙漫剧后,网易官宣与火龙漫剧达成深度合作,授权使用雷火映画、大宋映画编辑器制作的漫剧内容可以在火龙漫剧及腾讯生态的其他产品内分发。 百度则在2025年12月上线免费漫剧APP柚漫剧,试图补充百度移动生态的年轻化内容。柚漫剧不仅有漫剧内容,还接入了纵横中文网等百度系小说资源,目前主要有漫剧、小说和动漫三个主页面。2026年1月,百度旗下的免费小说平台七猫也推出了独立的七猫漫剧APP。 03 还有更多可能 如今漫剧热度已逐渐占据微短剧榜单前列。 以红果短剧榜单为例,2026年3月,红果不再仅以独立的漫剧榜计算漫剧热度,而是将漫剧纳入热播榜、新剧榜等榜单内,与真人剧共同排序。4月,就有新上线的AI漫剧《菩提临世真人AI版》热度近9000万,登顶红果热度榜单。 《菩提临世》改编自小说《西游记:菩提祖师下山》,讲述孙悟空含冤而死,六耳猕猴顶替了孙悟空成为斗战圣佛,菩提祖师因此下山踏碎灵山佛国,复活孙悟空后师徒联手报仇的故事。该剧共60集,每集时长约2分钟,画面风格模拟真人,有不少精彩的打斗场面让用户感慨如今AI的强大。目前《菩提临世》第二部的预约人数已超过230万。 在红果短剧的部分热度榜单上,漫剧已能占到超过三分之一。比如4月20日的新剧榜单,《彪悍人生:从制霸高原开始》《聚宝仙盆之杂灵根才是真BOSS》《云浮梦若归》《被三叔辜负后,我怒闯大海成渔王》等漫剧热度均超过5000万,排名前40的新剧里有15部是AI漫剧。 市场对漫剧的重视,来自新生代用户的内容偏好。平台如果能够占领年轻人的用户心智,便能在未来把握内容消费市场的方向。 据DataEye数据,漫剧的核心受众是40岁以下的年轻人,他们占据了整体漫剧用户的近80%;其中18-23岁的Z世代(1995-2009年出生)用户占比23%,且偏好度高于整体水平,是内容传播、二次创作和口碑发酵的核心力量。 年轻态的内容形式为漫剧打开了更多探索空间。 游戏剧即是其中一类。游戏剧是与游戏相关的漫剧,能够以《魔兽世界》《三角洲行动》《地下城与勇士》等热门游戏作为背景和主要元素,引发游戏玩家的共鸣。2026年2月,以《三角洲行动》为背景的AI漫剧《气运三角洲,我凭操作吊打全球》就获得了较高的曝光量。上线两天,累计播放量就超过2亿。 颇值一提的还有互动剧。互动剧兼具视频和游戏两种内容形态,是以用户选择驱动剧情前进的游戏化视频形式。 据海克财经观察,此前真人实拍的互动游戏《盛世天下》曾引发大众对这种内容形式的关注。这一2025年9月上线的互动游戏,在安卓、Steam等平台的售价为39元,官方数据显示发售12天,全球销量就超过100万套。游戏中,用户扮演主角武元照,通过不同选项推动剧情发展,在唐代宫廷中步步为营。该游戏制作人Demi公开表示,《盛世天下》的剧本超过30万字,素材时长1200分钟,有几十种不同结局,制作周期近1年。 AI漫剧的发展使互动剧的制作门槛降低,让互动剧体量更轻、内容供给更加充沛。 2026年2月,芒果TV就上线了AI互动影游《马上来财》,几天内播放量就突破了1500万。该作品内置了“电子祈福”点击互动体验,颇受用户好评。与此同时,番茄小说IP授权、番茄小说与万年影业共同出品的AI仿真人互动剧《诡舍》开启内测,作品改编自同名悬疑小说,讲述玩家被困于神秘诡舍后被迫参与生死游戏的悬疑故事。 漫剧出海亦有广阔前景。 漫剧完全剥离了真人演员与物理拍摄这一环,意味着剧方不需要承担高昂的海外拍摄成本,也不需要依靠传统人工方式对现有剧集进行译制。这使同一套内容数字资产能以极低边际成本适配全球多区域市场的差异化需求。 浙商证券2026年2月23日发布的一份研报提及,2025年海外短剧市场呈爆发式增长,应用全年下载量超过18.55亿次,同比增长300%,其中国内玩家出海的短剧APP下载量达14.93亿次;2025年海外短剧市场规模达40亿美元(约合人民币272亿元),2026年将达50亿美元(约合人民币340亿元);国内企业出品的AI剧《After Divorce: My Five Brothers Paved My Way to the Billionaire Throne》和《The Billionaire’s Return》已成爆款,2025年11月曾登顶海外短剧榜单。 AI技术对内容的重塑超越了单纯的工具范畴,带动了内容形态本身的更多变化。从真人剧到漫剧,意味着IP价值、叙事、视觉等原有模式都被打破,所有玩家都在重新适应这个变化极快的时代。 漫剧仍在不顾一切地向前狂奔,一如当年野蛮生长的微短剧,沿途卷起的既有令人振奋的效率革命,也有关于内容同质化与创意匮乏的隐忧。我们很难断言漫剧能走多远,但谁都不想被落下。
月之暗面IPO,杨植麟不急股东急
中国AI公司为何比OpenAI溢价七八倍? 采写/Linda 编辑/陈纪英 据多家媒体报道,月之暗面计划2026年下半年IPO。 去年年底的跨年夜,月之暗面曾公开表态是“不着急上市”。从不着急到IPO传闻,中间隔了一百多天,月之暗面的估值已经从43亿美元涨到了180亿美元,翻了四倍。 把它推到这个位置的,不是它自己,是身边那两家已经上市的同行。智谱1月8日敲钟,MiniMax 1月9日敲钟,到四月中旬,智谱涨了近700%,MiniMax涨了480%。按2025年全年真实收入算,两家的市销率高达540到550倍,是OpenAI(66倍)和Anthropic(76倍)的七到八倍。 有了智谱和MiniMax市值飙涨的珠玉在前,月之暗面此时挂牌,也能跟风拿到高溢价。 月之暗面为何改变了IPO节奏?相比于OpenAI和Anthropic的理性估值,AI大模型三兄弟,是不是正在陷入一场非理性的溢价狂欢? 毕竟,市值涨上去不难,但撑得住不容易。 一 估值三个月翻四倍 2025年12月31日,跨年夜,月之暗面创始人杨植麟给月之暗面全员发了一封信。 此时,公司的C轮融资刚刚关上,5亿美元到账,账上现金超过100亿人民币。信里他明确表态。“我们短期内不着急上市,也不以上市为目的。” 那时候,杨植麟有底气说这句话。Kimi K2 Thinking在11月发布,460万美元的训练成本刷新了DeepSeek的纪录,开源榜单上一度超过GPT-5。海外API收入四个月翻了四倍,全球付费用户月增170%。IDG领投,阿里腾讯老股东超额认购,投后估值43亿美元。 一位清华出身,一度想当流浪诗人的年轻人,带着一群工程师,做出了一个能和OpenAI掰手腕的模型,手里攥着一百亿现金,他凭什么着急?! 短短八天之后,1月8日,智谱在港交所敲钟,发行价116.2港元,公开发售阶段拿到了1160倍的超额认购;1月9日,MiniMax敲钟,首日股价涨了将近110%,市值超过1050亿港元。 接下来几个月,港股的AI板块像是燃烧弹一般火热。 2月9日到12日,四个交易日,智谱涨了110%。3月9日,MiniMax突破千元股,最高摸到1330港元。到四月中旬,智谱年内涨幅接近700%。 这种行情,杨植麟再怎么“不着急”,他身后的股东也不会不着急——投资价值、享受泡沫,风投从来善于算账。 1月20日,澎湃报道,月之暗面C+轮融资投前估值48亿美元。2月,这一轮以100亿美元的投后估值关上。到了3月26日,彭博的电话打到中金和高盛,透露月之暗面正在考虑赴港IPO,同步进行的是一轮最高10亿美元的融资,目标估值180亿美元。 43亿,100亿,180亿。三个月,三个台阶。 二 MiniMax和智谱为何贵过OpenAI? 现在大概是中国AI大模型公司上市的最佳窗口期。 窗口这个词,在港股AI板块里,指的是一件非常具体的事情,估值倍数高到一个需要重新校准的程度。 按2025年全年真实收入算,MiniMax 7904万美元,智谱7.24亿人民币。两家走的是完全不同的路,智谱以B端开源为主,2025年下半年收入环比上半年涨了180%,MiniMax押注C端多模态,海外收入占比超过70%。打法不同,但二级市场给了它们一样的定价,到2026年4月中旬,MiniMax市值3300亿港元,智谱市值一度冲破4300亿港元,两家的市销率都在540到550倍之间。 这个数字有多离谱,对比一下就知道了。 OpenAI 2025年真实全年收入约130亿美元,估值8520亿美元,PS大约66倍。Anthropic 2025全年真实收入业内估算50亿美元,估值3800亿美元,PS大约76倍。 中国两家上市AI公司的估值倍数,是美国头部AI大模型公司的七到八倍。 再换一个角度,OpenAI 2025年全年的收入,大约是智谱全年收入的130倍。 传统的估值方法在这里全部失效了。 DCF(折现现金流估值法,用公司未来能赚的钱折算成现在的价值)算不出来,因为AI公司未来到底能赚多少钱没人说得准;PE(市盈率,股价除以每股利润)没有E(earnings,利润),因为这些公司还在亏损;PEG(用市盈率除以增长率)的G(growth,增长率)可以随便讲故事,因为增速全靠预测。市场已经不是在给AI公司定价,市场在给“稀缺性”定价。 数据注解: • OpenAI 130亿:业内主流估算(官方未披露完整2025年报,从"2024年3.7亿→2025年中10亿runrate→年底20亿runrate"反推) • Anthropic 50亿:业内估算区间45-55亿,Sacra等数据源支持 • 智谱 7.24亿人民币:招股书审计数据 • MiniMax 7904万美元:雪球4月披露的2025全年数据(招股书前九个月为5344万) • 月之暗面 2亿人民币:无审计数据,估算误差±50%,文章建议不算PS 三 结构性错配的稀缺效应 港股现在真正纯血的大模型公司只有两家:智谱和MiniMax。你想买中国AI,腾讯阿里给你的是“AI+主营业务”,中芯华虹给你的是算力硬件,只有这两家给你的是“纯血AI”。 南向资金要配置AI,公募的AI主题基金要有持仓,全球AI主题基金要有中国敞口,QDII(合格境内机构投资者)要有,对冲基金要有,所有这些池子里的钱,都在抢这两只票。 买方深不见底,卖方屈指可数。这是稀缺的第一层。 第二层是认知的重估。一年前海外资本还在讨论中国AI能不能追上,DeekSeek R1和Kimi K2之后,讨论的主题已经变成了中国AI的估值折价该不该存在。 DeepSeek那个春节不只是改变了技术叙事,也改变了资金的配置逻辑,从“边缘仓位”变成“必须要有一点”。全球资本里,哪怕只有1%配置到中国AI,分母乘起来也是一个天文数字,涌进一个极小的池子。 第三层是一级二级的相互锚定。Anthropic 3800亿美元估值给一级市场一个参照,既然美国前沿模型能到这个估值量级,中国前沿模型凭什么不能?!二级市场500多倍PS又反过来给一级市场背书,既然挂牌之后能到这个价,私募加注就是赚的。 阿里和腾讯在月之暗面每一轮都追加投资,不是因为他们特别看好,是因为在当前这个估值体系里,不追加的机会成本太高。 供给小,资金多,锚点互相推,这三件事叠在一起,就是现在这个七到八倍溢价的来源。 它不是泡沫。它是一个结构性错配。 四 高溢价的三个变量 这个溢价能撑多久,取决于三件事:收入增速能不能追上来,新的AI标的会以什么速度上市,全球AI板块整体方向往哪儿走。 第一个变量是最核心的。月之暗面披露K2.5发布以后海外收入月增长170%,智谱2025年全年收入同比增长131.9%,下半年环比上半年又涨了180%。这些增速本身不慢,但对应的收入基数太小,即使再翻几倍,距离把PS(市销率)从550倍压到和美国同行对话的水位,还有相当长的距离。 第二个变量是稀缺性能否持续。阶跃星辰已经在排队,百川智能也在酝酿,智谱MiniMax的再融资也会跟上。每多一家挂牌,市场“稀缺”两个字的含金量就少一分。月之暗面越晚上,它面对的“已经买过AI”的资金就越深。 第三个变量说不准。OpenAI传出2026年Q4可能启动IPO,目标估值1万亿美元;Anthropic也在评估10月份上市的可能。这两家一旦挂牌,全球AI资产的定价锚会被重新校准,国内公司的估值倍数还能不能维持现在的水位,要看市场届时的参照逻辑往哪个方向走。 五 IPO的开关不在杨植麟手里 回到月之暗面本身,它现在面对的是一个很具体的两难。 定高了,上市之后大概率要经历估值杀。商汤走过这条路,2021年12月上市,发行价3.85港元,一度冲到9.7,然后连续几年在一块多的位置挣扎,最后几轮进来的一级市场资金到现在都没解套。 定低了,对不起老股东。阿里、腾讯、IDG、五源在43亿、100亿、180亿美元三个台阶上各自加码,如果上市后市值落在180亿美元以下,最后一轮就是账面倒挂;哪怕按180亿定,前面几轮的浮盈也要被二级市场的交易价格重新校准。 最大概率的路径,月之暗面会把私募估值推到180亿美元甚至更高的位置,把一级的价格锁死,然后IPO发行价给一个温柔的折扣,留出上市首日的涨幅空间。MiniMax和智谱已经走过这套流程,月之暗面几乎没有理由不复用。 杨植麟去年跨年夜说“不着急上市”的时候,他大概率是真心这么想的。百亿现金在手,K2 Thinking刚刚震动行业,没有理由急。 但一级市场就是这样。你不急,你身后的资金急;你不急,你身边上市的同行急;你不急,全世界在看中国AI的资金急。 在抛出”不着急上市”的三个月后,杨植麟坐在英伟达GTC的讲台上,作为唯一受邀的中国独立大模型公司创始人。又过几周,中关村论坛上,他以主持人身份和智谱的张鹏、小米MiMo的罗福莉同台。聚光灯之下,他谈的是开源,是技术,是智能的上限,没人会在这种场合谈IPO。 但IPO上不上,不由他。180亿美元这个数字一旦传出来,后面的路就只有一条。 月之暗面挂牌的那一天,不是一家公司的IPO。是这场溢价游戏的第三次公开定价。前两次市场给了狂热的答案,第三次,开始有分化的苗头。 真正要担心的不是它会不会涨。是涨到什么位置之后,没有人再愿意接棒。
曝字节跳动2025年净利润骤降超70% AI算力采购成“吞金兽”
【CNMO科技消息】4月20日,据“科创板日报”报道,字节跳动2025年净利润同比下滑超过70% ,净利润率亦出现大幅缩水,其背后是公司在去年三、四季度显著加大了对AI业务的投入力度。与此同时,字节跳动海外营收增长近50%,远超约20%的国内增幅,海外业务营收占比从2024年的25%上探至30%以上,再创历史新高。字节跳动对以上数据未予置评。 字节跳动 TikTok电商业务成为海外扩张的主力引擎。知情人士称,TikTok Shop 2025年GMV同比增速接近70%,推动TikTok在2025年录得大幅盈利。有消息称,TikTok Shop活跃消费者已达4亿,全年GMV规模逼近千亿美元。2025年美国市场销售额同比增长108%,欧洲主要市场增幅均超100%;东南亚稳居行业第二,12月单月GMV在海外市场超越Shopee;巴西上线三个月GMV增长约25倍,日本上线四个月增长约20倍。 然而,海外业务的亮眼表现并未阻止整体利润大幅缩水。知情人士透露,净利润大幅下降的主要原因在于字节跳动在2025年三、四季度大幅增加AI算力采购、模型研发与基础设施投入。据其他媒体报道,字节跳动最近在与股东沟通中透露,预期2026年的技术资源投入会进一步加大,叠加美国市场新成立的数据安全合资公司影响,公司净利润率短期还将继续承压。此前有外媒报道称,字节跳动2026年资本支出总额将有较大幅度增长,其中超过一半专项用于人工智能处理器采购及相关基础设施建设。
俞浩:追觅希望成为最伟大的企业,超越苹果等公司
俞浩:追觅希望成为人类有史以来最伟大的企业,超越苹果、特斯拉、谷歌等一切人类历史上的公司 IT之家 4 月 20 日消息,追觅创始人兼 CEO 俞浩今天接受晚点 LatePost 采访,谈自己为何“疯狂”。 俞浩表示,他其实厌恶风险,不喜欢赌。在自主品牌做成之前,他同时做米家和自主品牌,而不赌自主品牌一定能成功。他认为自己之所以敢定那么大的目标,是因为自己看到了事物的底层规律,并基于这个底层规律推导未来。其他人不掌握这个规律,看不到这个未来,才觉得他疯狂。 他透露,追觅希望成为人类有史以来最伟大的企业,成为一家百万亿美元的公司,超越包括苹果、特斯拉、谷歌在内的一切人类历史上的公司。 谈到有人把他比作贾跃亭时,俞浩表示:“追觅有一个左侧模型和右侧模型。左侧关于如何做好经营;右侧是如何获得社会资源。贾跃亭的问题是,他几乎完全活在右侧,他没挣过钱,乐视从头到尾都在亏损,而追觅的主业一直是盈利的”。 IT之家注意到,此前俞浩还透露今年第一季度,追觅实现了 100% 的同步增长。其声称今年将挑战 1000 亿,明年挑战 3000 亿,后年挑战 1 万亿。 互联网公开资料显示,自去年下半年以来,追觅已先后入局牙刷、显示器、汽车、洗衣机、冰箱、手机、空调、燃气灶、热水器、洗碗机、净水器、宠物用品、抽油烟机、航空、耳机、洗车机、剃须刀、智能电视、音箱、智能戒指、体脂秤、路由器、移动电源、智能眼镜、家装灯具、运动相机、空气炸锅、咖啡机、厨师机、按摩仪、电竞椅、具身机器人、机票酒旅事业、芯片、算力卫星等市场。
搜狐推出AI助手“小狐”,能追上豆包、元宝、文心们吗?
据郭静的互联网圈观察,4月17日,搜狐在苹果应用商店App Store上线了一款名为“小狐”的AI助手产品。从图片介绍来看,其多次提到了“AI搜索引擎”概念。当我向它提问“你是谁”时,其回复称,它是视频网站AI搜索引擎小狐,由搜狐视频团队研发。 搜狐算是国内互联网公司的“老前辈”,至今已运营28年,几乎互联网时代、移动互联网时代的所有辉煌历史,它都经历过,不过,如今这些老牌网站正面临着我在《运营20年的360doc个人图书馆网站将关停,老牌网站命运的缩影》一文中提到的问题:时代正在逐渐将他们抛弃,如果本身盈利能力不行,必然会出现关停的命运。 这些运营超过20年的老牌网站出现了明显的错位,当前国内网民的主要使用习惯是智能手机,而这些老牌网站的优势仍是PC,虽然它们在移动端也有所布局,但App Store免费总榜单上前50名已经没有它们的位置,它们的主流App产品甚至都没排到App Store免费总榜单的前200名。 论体量,搜狐显然和360doc个人图书馆这类网站不是一个量级,因此,它的转变手段和方法都比这类老网站要强,它就有机会在AI这类当前最主流的行业中做尝试。 AI除了在名气和影响力方面爆火之外,资本市场对它的认可度也非常高,近几年上市的AI公司市值不断创下新高,智谱目前总市值超4300亿港元,MiniMax总市值超2700亿港元,迅策科技总市值超1000亿港元,壁仞科技市值超1200亿港元(以上数据截至206年4月20日)。 外界的诱惑如此之大,以致于几乎所有公司都想涉足AI领域,做游戏的、做软件的、做家电的、做硬件的、做汽车的、做教育的,都跑来搞AI。数据显示,截至2026年年2月28日,累计有796款生成式人工智能服务完成备案,481款生成式人工智能应用或功能完成登记。 与某些擅长“蹭热点”的互联网公司相比,搜狐的风格属于慢热型,比如,ChatGPT、Gemini、Claude、Grok、DeepSeek等产品爆火之时,不少互联网公司都迅速跟上这些产品的技术热点,有的甚至连公司创始人都亲自下场,包括今年爆火的“龙虾热”也是。 搜狐此前推出过两款AI产品,面向C端的简单 AI和面向B端媒体与营销的 AI 技术平台搜狐 AILab。不过,这两款产品都没有推出独立的App,“小狐”App是搜狐首款拥有App终端的AI产品。可问题在于,如今AI助手行业的竞争如此激烈,“小狐”能追上豆包、元宝、文心、Kimi等市场上较为成熟且用户终端较多的产品吗? 首先,向“成功者”学习。有过抖音、小红书、视频号、微信公众号等平台运营经验的人,肯定会熟悉一个玩法儿,即向“成功者”学习。一个成功的“爆款”背后,说明众多用户对它的需求是存在的,那么,其他账号在没有明确运营方法的时候,就会向这些“成功者”的爆款账号学习,你先看看这些“爆款”是怎么做的。 对AI助手行业同样如此,搜狐直到2026年才推出AI助手App,这可比豆包、元宝、文心、Kimi等产品晚了好几年,而且,豆包、元宝才刚刚在过年期间火过一轮,此时的搜狐才推出专门的App,已经有些姗姗来迟,这种情况下,向过去“成功”过的AI助手产品学习是必然的。 回顾豆包、元宝、文心、Kimi等产品的“成功”路径来看,在推动终端下载量方面,有三条路数: 第一,旗下产品全力为AI助手导流。比如腾讯的元宝,为了力推元宝,微信、QQ、腾讯新闻、腾讯视频、QQ浏览器等多款腾讯系产品都为它导流;豆包,包括抖音、今日头条等在内的产品都在给它推流。 字节跳动、腾讯、百度等互联网巨头的产品本身就有非常大的流量势能,将这部分流量全力推向自家的产品,成本就低了很多,其他任何AI助手产品如果想要营销推广,成本都比它们要高。 第二,外部疯狂购买流量。所有支持广告的App上,都在疯狂为旗下的AI助手产品购买流量,包括App Store这类应用商店、各类新闻客户端、小说网站、视频网站、短视频平台等,AI助手的广告铺天盖地,尽管用户可能会觉得这些AI助手的广告看多了会烦,但铺天盖地的广告为产品带来了知名度。 第三,借势营销。春节期间,豆包、元宝、文心们都在利用春节期间的人群聚集效应,砸入重金营销,虽然外界在吐槽用户薅羊毛,薅完羊毛“就走”,但确实也让AI助手的数据起来了,今年春节期间,元宝、千问轮番冲到App Store免费总榜单的第一名,豆包被挤出第一名。事实是,若没有此番重金砸入,元宝、千问要把豆包挤出第一名还是很有难度的。 “小狐”若能跟豆包、元宝、文心、Kimi等产品一样,在拉用户下载量方面全力以赴,并且砸下重金投入,还是有可能让产品爆红的。 其次,另辟蹊径,找到市场上“未被满足”的需求。中国互联网行业并不乏“后来居上”的案例,比如,网易云音乐推出的时候,靠歌单从当时的网络音乐市场找到机会,迅速成长,就在TME(腾讯音乐娱乐集团,旗下主要有QQ音乐、酷狗音乐、酷我音乐)和网易云音乐竞争正激烈的时候,字节跳动旗下的汽水音乐突然崛起。今日头条依靠“个性化算法推荐”从一众新闻客户端产品中脱颖而出,也是在成熟市场中找到机会的例子。 对于“小狐”而言,除了在市场营销方面需要向“成功者”学习之外,还需要在产品上找到自己的突出点,即它跟豆包、元宝、文心、Kimi等产品有什么不一样的地方,另外,它能帮助用户解决什么问题?它的主要使用场景是什么?现在所有的AI助手都在走“通用型”这条路数,让AI助手的赛道显得异常拥挤,而在更细分的场景上,AI助手能够为用户和市场解决更多问题方面,却并未看到有较为突出的产品出现。 如果说过去互联网行业对于中小型创业者还有机会的话,当前的互联网行业对于非巨头并不友好,以AI助手产品为例,巨头旗下的产品太强了,其品牌知名度、产品、用户量都不差,那么,其他AI助手就会面临一个非常非常尴尬的境地,市场上多它一个产品不多,少它一个产品不少,中小型互联网公司的AI助手就陷入了这种存在感较低的情况。 那么,能不能像豆包、元宝、文心等产品一样,走高举高打路线呢?显然也不能。搜古2025年财报显示,2025年全年,搜狐公司总收入为5.84亿美元。其中,营销服务收入为6000万美元,在线游戏收入为5.06亿美元。剔除冲销畅游预提所得税影响后,2025年搜狐公司非美国通用会计准则下亏损5100万美元。 搜狐一年的总营收只有5.84亿美元,而阿里、京东、腾讯、字节等仅在2026年春节红包大战的投入就逼近100亿元,其中,腾讯元宝10亿元,百度5亿元,千问App的30亿元“请客计划”,豆包的投入也不低。以搜狐的体量,断然不可能像这些大巨头一样禁戏如此高额的市场营销投放。 而在产品侧的差异化创新,难度也很大。如果真的有什么突破点,其他巨头早就一窝蜂似的冲上去了,各大巨头并非只有一款AI助手产品,号称“App工厂”的字节跳动各类AI产品超过20款,阿里巴巴旗下的AI产品也有多款。在当前的互联网行业,任何大巨头、小公司想要推出创新产品,都会有一堆人盯着,反而加大了创新的难度。 “小狐”需要向用户解释,用户为什么要用它,而不是市场上其他更知名的AI助手产品。
国产推理GPU企业曦望完成超10亿元融资 估值超百亿成独角兽
凤凰网科技 4月20日,国内全栈自研AI推理GPU企业曦望宣布完成新一轮超10亿元人民币融资,估值超百亿,成国内纯推理GPU赛道首家独角兽。 这是2026年AI产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。至此,分拆独立仅一年多的曦望已累计完成七轮融资,总融资额约40亿元,成为国内首家估值超百亿的纯推理GPU独角兽。 本轮融资资金将主要用于新一代启望S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4/S5后续芯片的研发迭代。 曦望自创立之初即锁定AI推理赛道。2026年被行业公认为“AI智能体元年”,随着大模型从“会聊天”进化为“会思考、会执行”的数字员工,推理需求迎来爆发式增长。英伟达GTC 2026大会正式宣告AI产业全面迈入“推理落地、智能体普及”的新时代,将“每瓦Token吞吐量”定义为AI时代的核心竞争力,这与曦望的战略方向高度契合。 曦望董事长徐冰表示:“AI算力基建的重心已彻底切换。2026年AI推理计算需求将达到训练需求的4-5倍,推理算力租赁价格半年涨幅近40%。”目前公司已推进三代推理GPU迭代、数万颗GPU量产落地,实现了从芯片研发、产品量产到解决方案交付的完整闭环,并保持“芯片均实现一次性流片成功、流片后性能符合设计预期”的标准。 2026年1月,曦望正式发布新一代旗舰产品启望S3推理GPU。这是国内首款搭载LPDDR6且兼容LPDDR5X内存的推理GPU,它没有盲目照搬高端训练GPU的HBM显存路线,而是基于Agent推理的本质需求,从AI Core计算架构到内存IO系统进行了全链路重构。 以OpenClaw为代表的智能体推理,“感知-规划-执行-反馈”高频循环,带来了对KV-cache密集访问的全新计算负载。通用GPU面向训练优化,推理实际算力利用率往往远低于峰值。启望S3通过裁剪训练态所需的模块,将节省出的晶体管与功耗预算集中投向推理,让单位面积有效算力效率提升5倍以上。 在计算层,启望S3通过深度定制解决了通用GPU“算力用不满”的核心痛点,推理性能较上一代S2提升5倍,目标实现Token成本下降90%。大语言模型推理中,GEMM与Attention算子占总计算量的90%以上,启望S3将GEMM和Flash Attention两项核心算子的利用率分别推至约99%与98%。芯片采用128-bit指令集并支持3D指令,指令密度领先传统SIMT架构;独立线程调度精准匹配智能体复杂控制流;通过Block cluster和Broadcast等技术实现片上数据复用。此外,启望S3原生支持FP16至FP4全链路低精度运算。 本轮超10亿元融资的完成,将为启望S3的规模化落地及后续研发提供重要支撑。
Claude背后的男人:融资IPO算力三手抓,把估值干到3800亿美元
编译 | 杨京丽 编辑 | 李水青 智东西4月20日消息,据外媒The Information报道,Anthropic首席财务官(CFO)克里希纳·拉奥(Krishna Rao)竟然解决了公司头等算力难题。 在他的力推下,Anthropic与三大云服务商谷歌、亚马逊、微软全部达成协议,其模型同时跑在英伟达、谷歌、亚马逊的芯片上,比主要对手OpenAI更早完成多云多芯布局,把困扰所有AI公司的算力瓶颈,变成了Anthropic的竞争优势。 2024年,拉奥跳槽至Anthropic,此前履历横跨贝恩公司、黑石集团和爱彼迎,曾主导2020年爱彼迎IPO。短短两年时间,拉奥主导Anthropic毛利率从-94%翻到+40%,年化收入从不到10亿美元(约合人民币68.2亿元)跃升至今年4月初的300亿美元(约合人民币2046亿元)。 同时,拉奥推动Anthropic完成累计600亿美元(约合人民币4092亿元)融资,将该公司估值抬升至2026年1月的3800亿美元(约合人民币2.59万亿元),最快可能今年秋季启动IPO。 然而,这位Anthropic高管十分低调,不接受媒体采访,同时是这个量级AI高管中唯一一位从未上过科技播客的人。 可以说,Anthropic内部向来不缺戏剧性角色:有内部的哲学家、有专门防范“AI末日”的研究员、有敢跟五角大楼正面交锋的CEO。而CFO拉奥却身居幕后,凭借其前瞻判断力、业务理解力及谈判能力,成为Anthropic的一大“杀手锏”。 一、入职第一件事:推动多云多芯,跑在OpenAI前面 2024年,拉奥加入Anthropic时,公司与谷歌签有云计算协议,算力来源较为单一。他上任后,力推新方案,同时与多家芯片供应商和多家云厂商合作。 贝塞默风险合伙公司合伙人、Anthropic投资人拜伦·迪特尔(Byron Deeter)是他当时讨论这一方案的对象之一。迪特尔认为,拉奥当时判断得非常清晰,“如果伙伴更多,Anthropic可以成长更快”。 如今,Anthropic已与三大云服务商谷歌、亚马逊、微软全部达成协议,其模型同时跑在英伟达、谷歌、亚马逊的芯片上。在多云多芯这条路上,Anthropic走得比其主要对手OpenAI更早,后者如今才沿着类似路径铺开。 另外,据知情人士透露,拉奥近期担任Anthropic内部推动一项重要合资项目的主要负责人。该项目由Anthropic与黑石及其他私募股权公司共同推进,目的是让Anthropic把AI卖给上述私募基金的投资组合公司。就在几周前,拉奥还被派往高盛集团CEO大卫·所罗门(David Solomon)位于巴哈马的海滨别墅,与多位公募和私募投资人、高盛的高级银行家会面。 曾在黑石与拉奥共事的马丁·布兰德(Martin Brand),目前掌管黑石旗舰私募股权基金,他评价拉奥说:“有些CFO是从会计起家、能把数字做对,但并不真正懂商业,而拉奥不是这种CFO。他很清楚什么重要、对业务意味着什么,以及对面前这个人意味着什么。” 二、入职以来融资600亿美元,估值飙到3800亿美元,秋季可能IPO AI行业竞争日益加剧,拉奥扮演的角色比一般创业公司CFO要复杂得多。除了常规的并购任务,他还要解决公司研发AI所需的巨额资本需求,尤其是越来越紧缺的云厂商芯片集群。 Anthropic最新300亿美元(约合人民币2046亿元)融资中,共同领投的新加坡政府投资公司的克里斯·埃马纽埃尔(Chris Emanuel)称,拉奥对业务的技术层面挖得非常深。 为了支付公司的全部开支,拉奥自入职以来已推动Anthropic完成多轮融资,累计筹资600亿美元(约合人民币4092亿元),估值在2026年1月抬升至3800亿美元(约合人民币2.59万亿元)。 2026年年初,Anthropic估值抬升至3800亿美元(图源:The Information) 去年9月,风投公司Iconiq共同领投了Anthropic的融资,当时Anthropic的估值为1830亿美元(约合人民币1.25万亿元)。Iconiq合伙人马特·雅各布森(Matt Jacobson)说,拉奥在筹集如此大规模的“量级资本”时,以极高的透明度向投资人清晰传达了公司的发展叙事。 两位消息人士透露,Anthropic目前并无进一步融资计划;若要再融,预计要等到5月的董事会会议,届时将讨论所有融资选项。据另一位消息人士称,拉奥及其团队已收到以8000亿美元(约合人民币5.46万亿元)估值投资公司的报价,部分投资人认为估值甚至可能冲到1万亿美元(约合人民币6.82万亿元)。 此外,拉奥还要盯住另一条战线:IPO。公司尚未对外公布上市计划,但最快可能在今年秋季启动。拉奥曾在爱彼迎2020年上市中扮演重要角色,但Anthropic的上市对他来说仍是一次大考。一位参与过Anthropic融资的人士坦言:“他的确非常聪明,看上去也是好人,但他还很嫩,从没在这种体量上操盘过。” 三、跟OpenAI CFO的鲜明对比:一个高调、一个极少露面 拉奥与同行对手形成了鲜明对比。OpenAI CFO萨拉·弗里亚(Sarah Friar)是硅谷老将,此前曾任支付公司Square的CFO、邻里社交网站Nextdoor的CEO,现任沃尔玛董事。随着OpenAI筹备上市,弗里亚刻意塑造高曝光度,频繁与媒体接触。 拉奥则恰恰相反。他不喜欢任何形式的聚光灯,可能是目前这个量级的AI高管中唯一一位从未上过科技播客的人。本次报道中,他也通过发言人拒绝了采访。 Anthropic和OpenAI两家公司争的是同一批芯片、同一批投资人、同一批员工和同一批客户。Anthropic的营收近期飙升,本月年化收入突破300亿美元(约合人民币2046亿元),是2025年底水平的三倍多,略超过OpenAI同期水平。据The Information此前报道,OpenAI在2025年底的年化收入为210亿美元(约合人民币1432亿元),毛利率33%。 但收入飙升也带来质疑,OpenAI已经借机发难,暗指Anthropic是否拿到了足够多的AI服务器。 Anthropic CEO达里奥·阿莫代伊(Dario Amodei)说过,准确预测公司数年之后的庞大算力需求,是决定“成功还是破产”的关键。而这份计算任务的大部分责任落在拉奥肩上。 曾和拉奥在黑石、爱彼迎共事的拉奥导师劳伦斯·托西(Laurence Tosi)认为拉奥顶得住,他的整个职业生涯都贯穿着“有纪律的增长”这一概念。“他不会靠希望亏钱,也不会在愚蠢的估值上融资。”托西说。 四、从哈佛、耶鲁法学院、黑石,再到Airbnb IPO操盘手 拉奥出生于明尼阿波利斯,在南加州和明尼苏达两地长大,2005年以summa cum laude(最高荣誉)从哈佛大学经济学专业毕业,随后在贝恩公司当了三年顾问,接着拿到耶鲁法学院的学位,并得到了一份美国最高法院的宝贵实习机会。但他没有选择做律师,而是去了黑石。 在当年面试他的黑石高管布兰德的印象里,拉奥原本可能过不了关,因为他没有投行背景,也没在私募股权干过。但几轮脑筋急转弯式的问题过后,布兰德被说服了,黑石聘用拉奥为高级助理。“我觉得他聪明,而且很能聊,有一种干冷幽默感,是那种你愿意一起玩的人。”布兰德回忆。 布兰德称,拉奥最突出的优势是在棘手情形下的谈判能力。他举例称,在黑石将一家公司私有化后,拉奥作为黑石方代表进入董事会,与节奏迟缓的管理团队反复博弈。“不管发生什么,他都非常能干、非常冷静。” 拉奥的工作经历(图源:领英) 2015年,拉奥把目光投向西海岸,在优步(Uber)和爱彼迎中选择了后者,与当时已从黑石CFO转任爱彼迎CFO的托西重逢。拉奥起步于FP&A(财务规划与分析),很快升任爱彼迎公司与业务发展负责人,推动公司投资餐厅应用Resy,并以4亿美元(约合人民币27.28亿元)收购HotelTonight。 2020年初,爱彼迎正准备上市,随后其业务受疫情重创,上市计划搁浅。拉奥主导了救命谈判:4月6日,爱彼迎宣布从Sixth Street和银湖资本获得10亿美元(约合人民币68.2亿元)紧急融资;不到一周,又从贝莱德、富达和普信集团等投资人手中拿下另外10亿美元债务融资。 到了夏天,业务开始复苏,上市计划重启。2020年12月初,爱彼迎以470亿美元(约合人民币3205亿元)估值完成IPO,募集超过35亿美元(约合人民币238.7亿元),上市首日收盘市值突破1000亿美元(约合人民币6820亿元)。一位参与爱彼迎IPO的律师说:“商业侧运作IPO的就是他。我觉得他协调得非常好,对接银行和爱彼迎内部高管都很到位。” 离开爱彼迎后,拉奥做了几次较短时间的跳槽:先是担任医疗支付创业公司Cedar的CFO,又去运动周边公司Fanatics担任其电商业务的CFO。Fanatics这份部门CFO职位在公司层级中其实是一步退棋,他也没待很久。一年后,他开始考虑加入Anthropic。 Anthropic认真考察拉奥时,是Anthropic联合创始人Daniela Amodei(丹妮拉·阿莫代伊)打电话给他的推荐人之一托西,托西极力推荐。拉奥不久后就拿到了Offer。“他们要的是懂融资、风险、投资人和公募市场的人,不想要一个从软件公司财务主管做起的硅谷CFO。”托西说。 五、入职一年:毛利率从-94%翻到+40%,组建前银行家并购军团 在拉奥加入Anthropic前,公司主要业务职能由联合创始人汤姆·布朗(Tom Brown)负责,他此前在OpenAI和谷歌DeepMind工作过。但据一位接近公司的人士称,布朗需要一位有融资背景的财务高管来帮他。 2024年拉奥入职时,Anthropic估值约为150亿美元(约合人民币1023亿元),年化收入仅为两三亿美元级别。公司在很多方面仍像一间研究实验室。Anthropic的董事会会议此前主要聚焦技术、政策和AI安全议题,拉奥在议程中增加了业务和财务表现专项,包括企业软件指标和增长的关键先行指标。 他的第一刀砍向毛利率和算力管理。据The Information报道,Anthropic毛利率从2024年的-94%翻转到2025年的+40%。同一时间段内,公司年化收入从不到10亿美元(约合人民币68.2亿元)飙升至90亿美元(约合人民币613.8亿元)。 2026年4月,公司年化收入已升至300亿美元,几乎提前实现此前对2026年底的预测目标(图源:The Information) 与此同时,拉奥搭起一支并购团队,2025年5月挖来软银愿景基金前合伙人安德鲁·兹洛托(Andrew Zloto),此人此前也在爱彼迎与拉奥共事。一些银行家和投资人形容兹洛托对拉奥而言“至关重要”,并称他已接过老板的部分工作,包括部分与投资人、投行的会面。 Anthropic并没有急着做大手笔并购,相比之下,OpenAI曾以50亿美元(约合人民币341亿元)全股票收购硬件初创公司Io,该公司由苹果前首席设计官乔尼·艾维(Jony Ive)联合创立。拉奥和下属告诉银行家,他们更偏好单笔低于5亿美元(约合人民币34.1亿元)的交易,瞄准那些拥有前沿技术、或聚集了优秀研究人员和工程师的公司。 尽管如此,银行家和投资人的邮件、电话还是涌向Anthropic。与Anthropic高管有过交流的人士透露,其公司发展团队已经用Claude来筛选这些来电来信、分析公司。 近几个月,Anthropic还从上市科技公司挖来数位资深公司发展高管,包括前ServiceNow副总裁维沙尔·库马尔·古普塔(Vishal Kumar Gupta),他此前在ServiceNow统管全球公司发展业务,以及来自Meta、更早在谷歌任职的马特·德瓦恩(Matt Devine)。 六、严控融资条款,签下数百亿美元算力大单 曾任爱彼迎首席营销官、现任Fanatics董事的乔纳森·米尔登霍尔(Jonathan Mildenhall)形容拉奥“把东西抓得非常非常紧”。这种风格也体现在Anthropic的融资操作上。 投资人抢着挤进Anthropic的每一轮融资,同时有人抱怨拉奥执行的条款过于严苛。据四位熟悉相关融资的人士透露,去年9月宣布的130亿美元(约合人民币886.6亿元)融资轮中,Anthropic要求投资人单张支票动辄数亿美元,对部分风投基金而言相当于半个募资总额。一位熟悉OpenAI融资的人士称,OpenAI那边也设有投资门槛,做法大致相当。 即便凑齐了资金的投资人,也经常因为需求过于旺盛,而拿不到他们想要的份额,不少人感到失望。 对AI时代的CFO来说,融资只是一半的战场,另一半是算力合同。拉奥参与谈判,并管理了一系列算力协议,确保Anthropic有足够服务器来训练和运行模型。其中,包括去年年底签下的两份共计300亿美元(约合人民币2046亿元)的微软云服务器协议,以及一份承诺使用最高100万颗谷歌张量处理单元(TPU)的协议。 本月早些时候,Anthropic又宣布与博通和谷歌达成新合作,获取“多千兆瓦”级别的数据中心电力。这些合同叠加在与亚马逊AWS的多维合作之上。AWS公司发展副总裁安库什·普拉卡什(Ankush Prakash)评价拉奥说:“我们期待与他长期合作下去。” 贝塞默的迪特尔认为,面对全部这些压力,拉奥处理得很不错。“这是当前投资需求最旺的公司,他把这个动态管理得非常好。他说到做到,不做过度承诺。” 结语:从爱彼迎到Anthropic,拉奥下一站是秋季IPO 从拉奥加入Anthropic,公司估值从150亿美元(约合人民币1023亿元)抬升至3800亿美元(约合人民币2.59万亿元),年化收入从几亿美元量级跃升到今年4月初的300亿美元(约合人民币2046亿元),毛利率也完成了从负到正的翻转。他推动的多云多芯策略先于OpenAI落地,同时算力采购、并购节奏和融资条款被同步纳入CFO视野,让这家原本像“研究实验室”的公司,逐渐具备重资本运作公司的框架。 按当前节奏,Anthropic可能在今年秋季启动IPO,拉奥在爱彼迎2020年上市中积累的操盘经验,正好能够接上这一关。
外媒实测Claude设计神器:5分钟生成网页原型,半小时烧掉八成周配额
编译 | 陈佳 编辑 | 程茜 智东西4月20日消息,4月18日,外媒PCWorld记者实测发现,Anthropic的AI设计工具Claude Design约25分钟时间完成了AI Tokens科普网页的三版原型设计,但这一任务消耗了他80%的Claude Design周额度。 并且,记者误操作一键清空设计成果,切换至成本更低的Sonnet 4.6模型继续重建任务,仅五分钟便耗尽剩余20%的额度。 PCWorld记者实测中,Claude Design生成的AI Tokens科普网页原型总览(图源:PCWorld) Claude Design是Anthropic于4月17日正式推出的AI设计工具,支持用户通过文字提示生成网页原型、应用线框图、演示文稿、营销素材等视觉作品,成品可导出为ZIP、PDF、PPTX、HTML格式,也可直接对接Canva或Claude Code进行后续开发。 该工具目前以研究预览形式向Claude Pro、Max、团队和企业订阅用户开放,底层由Anthropic同日发布的新模型Opus 4.7驱动,同时配有独立的每周额度,不占用Claude Chat或Claude Code的总Token额度。 Claude Design打通了传统上割裂的设计、原型与开发环节,不仅能直接生成原型、支持编辑与多格式导出,还可一键对接Claude Code生成代码,把从创意到落地的流程整合进同一系统。设计师以外的产品经理、营销人员和企业管理者等非专业用户同样能通过使用Claude Design快速产出可用成果。 有Reddit社区用户总结出一套更“精打细算”的Claude Design用法:用户先用高成本模型完成初稿,再切换低成本模型做局部修改,尽量用简短指令或直接框选编辑,以降低Token消耗。不过,即便在这种优化成本策略下,该用户采用5倍用量的Max套餐,连续使用10小时Claude Design仍会消耗约80%的周配额,而且这种用法本身也依赖用户对模型成本结构的清晰认知。 一、一句话生成完整交互网页,25分钟出三版原型 用户试用Claude Design时,界面会显示带标签的聊天框,用户可在此输入初始提示词,并选择新建原型或演示文稿,也可以从模板开始或自行创建模板,然后开启设计任务。用户还可以填写公司名称、关联GitHub仓库、绑定本地文件夹,或是上传字体、Logo等设计素材,为后续创作准备个性化资源。 Claude Design操作界面(图源:Anthropic) PCWorld记者采用了最简单的方式,什么都不上传,直接输入一句提示词:为普通用户创建一个解释AI Tokens概念的交互图表。 拿到需求后,Claude Design并没有立刻开工,而是先抛出一组多选题:这个设计网页的目标受众是谁?偏好哪种呈现形式?希望有哪些互动设计?整体风格是《纽约时报》式的严肃编辑风,还是卡通插画风?内容规模大致在哪个量级? Claude Design生成AI Tokens科普网页前,向用户发起的交互式需求调研界面(图源:PCWorld) 这一轮问答约花了一分钟,Claude Design随即根据刚刚记者的回答规划出整体思路:采用《纽约时报》或者美国数据新闻媒体The Pudding的风格,使用衬线字体标题,页面留白充足,并搭配单一主题色。 正式创作启动后,用户与Claude的对话窗口会移至左侧边栏,网页右侧则变为大型画布,用户可实时查看设计进度。画布顶部设有标签页,用户既能查看项目的多个版本,也可直接浏览项目源文件,Claude Design支持同时生成多套设计方案。 Claude Design中生成并预览设计的界面(图源:Anthropic) 不到五分钟,Claude Design就生成了初稿:一个界面美观的网页,文案清晰、简洁易懂,能够分步讲解AI Tokens,还搭载了交互式模块,用户可以输入文字,实时查看Tokens数量。 整体来看,Claude Design仅用大约25分钟,就完成了三版AI Tokens科普原型设计,效果十分出色。 Claude Design生成的AI Tokens科普网页中,可查看Token拆分效果的交互式演示模块(图源:PCWorld) 二、误将“撤销”当返回,所有设计成果被一键清空 但在亮眼的生成效果背后,Claude Design使用过程中的成本与操作风险也开始显露。 PCWorld记者随后发现,仅25分钟,Claude Pro套餐中单独划分给Claude Design的一周使用额度就已经消耗了80%。值得注意的是,Claude Design有独立的每周额度,不占用Claude Chat或Claude Code的总Token额度。他认为自己订阅的Claude Pro套餐更适合普通个人用户,并不适合需要制作应用或网页原型的企业级使用场景。 比配额更让人崩溃的是一次操作失误。该记者在切换Claude Design生成的不同原型版本时,页面弹出“需要预览Token”的提示,原因是Claude并未将刚刚对话生成的多个设计版本集成至单一HTML文件中。由于操作失误,该记者将“撤销”按钮当成了返回键,导致所有设计成果被一键清空。Claude随即提示,撤销操作已清除全部内容,需重新从零构建所有文件。 眼看额度即将耗尽,他将模型切换到成本更低的Sonnet 4.6,让Claude重新开始设计。然而仅仅五分钟后,他本周的Claude Design额度就已彻底归零。 好在Anthropic近期向Claude用户发放了超额额度补偿,这才让他得以补充额度并完成设计实测。但即便没有发生误删文件的情况,他的使用额度也不足以支撑完整的评测流程。 三、用户总结省Token路径,设计质量依赖输入质量 Reddit社区里,有经验的用户给出了更务实的Claude Design用法建议。4月18日,一名深度使用Claude Code近一年、有软件开发背景的用户分享了自己连续使用Claude Design十小时的体验,并总结了几条节省配额的心得: 用户在首次生成文件时应优先使用Opus 4.7模型,因为初稿质量会直接影响后续迭代效果。在完成初稿后,用户可以切换至Sonnet 4.6进行局部修改,因为编辑环节的Token消耗更低、速度更快。此外,用户在提交修改指令时应尽量简短具体,或直接用编辑按钮框选元素操作,以提高效率。 这名用户订阅的是5倍用量的Max计划,十小时高强度Claude Design使用消耗了约80%的周配额。他认为这个性价比尚在接受范围内,毕竟Claude Design的配额与Claude Code是分开计算的,两套工具可以并行使用。 但这种用法本质上要求用户对模型成本有清晰认知,并主动优化使用方式,否则很容易在早期探索阶段就耗尽额度。 Reddit用户分享的Claude Design使用体验帖(图源:Reddit) 另一位有二十多年从业经验的设计师在Reddit上写道,当前不少人评价AI设计工具时,都只盯着“初期生成效果粗糙”这一点,其实完全抓错了重点。他认为,在过去十多年里,设计行业已经高度体系化,大量工作都围绕设计系统、组件复用和现有规范展开,本质上只是对已有模式的重复拼接。 从行业实际情况来看,真正能从零打造品牌、创新设计范式的设计师只是少数,绝大多数从业者只是按照需求规范拼装组件。 在这样的行业现状下,Claude Design这类AI工具的价值,并不在于一开始就能生成完美的设计,而在于它天然就适配这种结构化、规则化、重复性的工作模式。在这位设计师看来,设计行业中最容易被标准化的工作内容,本身就像是为AI准备好的训练数据。 这也不难理解,为什么Claude Design在“初次生成”上表现亮眼,可一旦进入需要大量判断与反复打磨的环节,距离成熟工具仍有差距。对没有明确需求、缺乏设计判断能力的用户而言,反复试错不仅效果有限,还会迅速推高使用成本。 从现阶段表现来看,Claude Design更像是一款“高成本设计加速器”。它能大幅缩短从想法到初稿的时间,但前提是用户清楚自己想要什么,并尽可能减少无效的反复修改。 拥有二十多年从业经验的设计师在Reddit上分享的Claude Design行业视角分析帖(图源:Reddit) 结语:好用还不够,成本可控才能成为真正的AI生产力 Claude Design能在五分钟内生成一个完整的网页原型,其效率确实让人眼前一亮。但伴随这种高效率而来的,是高昂的Token消耗。无论是生成多版本原型,还是预览、修改甚至误操作,背后都在持续烧Token。AI确实降低了从0到1的操作门槛,却让反复试错的成本变得昂贵。 这种高昂的试错成本,改变了用户使用这类工具的方式。对普通用户而言,Claude Design无法替你判断哪个方向更正确,如果在自己都模棱两可的情况下让AI反复生成、对比方案,Token额度很可能在你理清思路前就迅速烧光。 因此,对于Claude Design这类AI工具,“好不好用”依然是焦点,但它已经不再是一个单选题。能否让用户在可控的Token成本内,顺滑地完成完整的创作流程,决定了它到底是真正的生产力工具,还是只能用来尝鲜的昂贵玩具。
“龙虾热”凉了吗?
年初那阵子,OpenClaw在中文AI圈和海外开发者社区内,都成为了新时代AI生产力的代名词。 一时间,只要对AI稍有耳闻的人,都知道有这么一个“龙虾”,在电脑上部署后,可以帮你盯邮箱、跑日程、读文档、调工具、跨软件干活。OpenClaw的出现,可以说让Agent的概念第一次深入大众人心。 但,一个多月时间过去,如果只看大众社交媒体,龙虾似乎有点“凉”了,进入4月后,OpenClaw的微信指数一路下滑,从上亿回落到百万级别,仿佛二级市场上那些股价坐了“过山车”的妖股一样,留下了一道尖锐的折线。 龙虾真的凉了吗?还是说,它只是从大众围观的网红,变成了一种更窄、更贵、更现实的生产工具? 如果只看“微信指数”这样的表层声量,答案确实像是“退潮”。但把视线挪到项目和行业层面,故事恰恰相反。 OpenClaw 的 GitHub 公开发版记录显示,项目更新节奏并未停下。最新一版更新中,开发团队继续处理实际使用中的高频问题,包括提升对 GPT-5 系列模型的兼容性、修复 Telegram 频道相关异常、优化 Ollama 连接超时,并对部分底层架构与性能进行调整。 而在更大的背景中,AI用户群体的大盘其实仍然稳固,“退潮”的是“人人都能用好Agent”这层想象。 Gallup最新对23717名美国在职员工的调查显示,2026年第一季度,已有50%的受访者表示自己至少偶尔在工作中使用AI,13%每天使用,28%每周使用几次以上。 但同一组数据也显示,有41%的员工所在组织真的把AI引入到改进组织实践中,说明普及在发生,只是落地在高度分层。 对于C端用户而言,一些日常需求通过一整套OpenClaw工作流来实现确实有点“小题大做”。但到了很多真实工作/生产力场景中,Agent的飞轮其实正在越转越快。 谷歌方面今年4月披露,其平台月度AI token调用量已达480万亿,同比增长36倍;字节跳动方面此前也宣布,豆包大模型日均token调用量已超过120万亿。这说明企业级自动化和生产力场景仍在持续吞吐大量算力。 这种差异,正在龙虾退潮和Token调用持续爆表的反差中不断凸显。 这个问题其实不难给出结论:在大众视野中的龙虾,热度确实退了,但从另一个角度而言,整个Agent生态反而进入了用户的沉淀和筛选期。 为什么轻度使用的AI大众用户,玩不下去龙虾? 首先,龙虾的上手使用存在一定门槛,这个门槛并不仅仅只在安装层面。 早期OpenClaw更偏向本地部署和开发者工具链,如今官方已提供Northflank、Railway等云端一键部署方案,各家大厂也迅速推出了云端托管版、一键部署版等各种“龙虾产品”。 尽管相比起OpenClaw刚刚发布时,入口确实比过去简单得多,但这不代表大众用户就能顺畅上手。科技社区Hacker News上,一位提供预装虚拟机方案的开发者直言:“对常年混迹技术论坛的用户来说,安装也许不难,但对大多数人绝对不是。” 在一些更泛化的用户社区里,小白“龙虾”的使用体验往往是:“初次配置花了数小时,还因报错重装了三次。” 此外,就算你选择了某些一键部署工具/平台,安装也只是第一步,“会用”才是关键。 即便进了云端,用户仍要理解模型绑定、权限授权、Skill模块等一整套新概念。对轻度用户来说,他们想要的是打开就能帮忙做事的工具,而不是先学习一套新的操作系统。 而一旦上手,小白用户会逐渐意识到这样一件事:龙虾天然更适合高频、连续、流程化任务,而不是低频、碎片化需求。 这类产品最亮眼的场景,往往是持续盯邮件、定时抓取信息、批量整理资料、多工具串联执行、代码协作等长链路工作流。 在各类对龙虾用途的讨论,会发现公认的最有价值的用法,是让OpenClaw定时抓取数据,自动写入知识库,再整理成周报和月报。这种模式,本质上是把它当数字助理长期使用。 可对大多数普通用户而言,真实需求往往只是查资料、润色文字、总结文档、偶尔做表格。也就是说,大部分人的工作,根本没有复杂到需要AI去承接工作流,这些任务今天用ChatGPT、Claude、豆包和DeepSeek等网页产品就能完成。 美国“贴吧”Reddit上甚至有人总结观察到的“三周流失路径”:许多新用户第一周热情高涨,第二周开始遇到循环调用、插件报错、费用上涨等问题,第三周就暂时搁置。 说到底,不是龙虾没能力,而是工具复杂度超过了多数人的真实需求强度。 在操作门槛之外,以龙虾为代表的“系统级”Agent,还有无法忽视的安全问题。 微软此前曾公开提醒,OpenClaw并不适合直接运行在普通个人电脑或企业办公终端上,因为它通常需要接触软件权限、在线账号令牌、本地文件等高敏感资源。 OpenClaw早期曾被评为8.8/10的高危漏洞。网络资产搜索平台Censys此前的扫描数据称,在相关补丁发布前,互联网上可识别的OpenClaw暴露实例超过21,000个。 而一旦涉及到用户数据,自然也会触及很多用户敏感的神经。Thales 2026数字信任指数显示,仅有23%的消费者信任企业会负责任地使用AI数据,77%的人对AI代理替自己在线行动感到担忧。 显然,对于轻度用户而言,“龙虾”生态带来的好处和现实需求出现了错位。 因为,以OpenClaw为代表的系统级Agent,是一套需要交出权限、持续投入费用的系统。如果没有足够高频的刚需,企业级的安全维护授权,大多数人很难长期坚持使用。 但如果因此断言“龙虾凉了”,又过于草率。因为留下来的用户,并不是在大众社交平台占据最多声量的人,而是最重度的一批开发者、自动化用户和企业实验团队。 微软最近传出正在Copilot里测试OpenClaw式的常驻Agent,而且强调会做得更适合企业、更安全;这恰恰说明,OpenClaw代表的路线并没有被判死刑,相反,它正在被大厂吸收、重做和企业化。 最近两周,国内并非没有新“龙虾”,而演化为各类Agent生态的延伸。 阿里在本月推出 Qwen3.6 新版本,强化复杂任务执行与工具调用;字节本月初上线 OpenClaw 国内镜像站,方便开发者部署技能生态;阶跃星辰已与 OPPO、吉利合作,把Agent能力推进到手机和汽车终端。 17日,《哈佛商业评论》发文点名中国 AI Agent 正快速进入电商和零售场景。文章以美团为例,提到美团在内部把“小美”定位为“调度者 + 执行者”,能帮用户完成下单、比价、售后、路线安排等整套任务。 也就是说,相比起龙虾的概念火不火,厂商们已经开始聚焦争夺真实入口,当然,这项竞争还在早期阶段。 智库机构The Conference Board几周前发布的调查显示,美国企业中60%的组织仍处在AI应用早期阶段,主要停留在实验和试点层面,仅11%进入更成熟的整合状态。 换句话说,今天讨论“龙虾退潮”,很大程度上是结束了大众的“围观”,而在真实的使用场景中开始了高强度试点。 近期的全球模型API调用激增,也揭示了让小白用户真正退而却步的一点:“龙虾”的Token耗费巨大,而普通人很难持续的为模型API买单。 大众用户参与龙虾的另一个拐点,是Anthropic在几周前斩下的那刀。本月4日,Claude订阅额度不再覆盖OpenClaw这类第三方harness的高强度使用,想继续跑就得切到单独按量付费。 过去几个月中,模型厂商有的把OpenClaw剔出订阅套餐,有的不断给API涨价。这等于正式告诉市场,Agent的消耗,已经超出了“几十美元月费随便包”的范围。对于普通用户而言,只是停留在体验和探索层,显然很难接受每月付出上百美金、甚至更高昂的模型费用。 而且,Agent的贵,不是模型单价贵,而是任务链路贵。 以OpenAI最新定价为例,调用网页搜索功能,大致是每1000次10美元,部分场景更高;如果任务需要代码执行环境,还要额外支付“容器费用”,按20分钟一次会话计费,配置越高越贵,从几美分到接近2美元不等。这还没算模型本身输入输出的token成本。 说白了,Agent不再是你问一句、它答一句,而是先搜索、再调工具、再跑代码、再读取上下文继续执行。和Chatbot时代的API消耗Token的速度相比,完全不是一回事。 而Anthropic这边的收费逻辑,更能说明Agent时代为什么越来越贵。 官方定价页显示,短时缓存写入要加价约25%,长时缓存最高加价到2倍,只有命中缓存重新读取时,成本才会降到正常输入价的一成左右。也就是说,模型越常驻、任务越长链路,费用结构就越复杂。 几天前,Anthropic发布Claude Opus 4.7时表示价格与上一代相同,仍是每百万输入token 5美元、输出token 25美元。但许多社区反馈显示,新版分词机制可能让同样内容消耗更多token,用户感受并不是“没涨价”,而是“同样的问题更费额度了”。 这也解释了为什么最近Claude Pro用户抱怨增多。美国“贴吧”Reddit上有人称,自己用Pro套餐“问了3个问题就烧掉了50%的5小时额度”;也有人吐槽,以前能顺畅做完整学习笔记,现在很快就触发限制。 我本人的经历甚至更“夸张”。在Claude Opus 4.7发布当天,我曾试图让Claude整理某家公司的资料,同时以行业视角进行横向对比。这是一个信息量稍显复杂的Prompt,而Opus 4.7只运行了两轮就烧光了Claude Pro的5小时限额。 虽然这些反馈不代表官方平均水平,但它至少说明一件事:2026年,如果你想把模型当成同事、研究助手或代码搭子连续使用时,月费几十美元更像是一张体验票,而不是稳定的生产力预算。 但API价格攀升的另一面是,模型厂商的算力矩阵和服务器正在拉满运行。 Anthropic今年3月曾短暂把低峰时段订阅额度翻倍,引导用户错峰使用;月底又调整高峰期额度消耗速度,想要利用规则调节算力拥堵,给有限GPU资源排队。 另一边,今年2月,智谱宣布GLM Coding Plan套餐整体涨价30%起,海外订阅价格提高30%-60%,部分API调用价格提升67%-100%。官方给出的理由是:市场需求持续增长,用户规模与调用量快速提升,同时要保障高负载下的稳定性,并继续加大算力和模型投入。 换句话说,模型厂商涨价不是因为没人用,而是因为用的人太多。 更值得注意的是,涨价后需求并未明显回落。第一财经近期披露的报道显示,智谱2026年第一季度API价格上涨83%后,调用量仍同比增长400%,出现“量价齐升”。 其他国产模型大厂的情况也类似。阿里云、百度智能云等平台3月开始同步上调部分AI算力、模型服务和GPU租赁价格,高端GPU租赁成本上涨,交付周期拉长。价格抬升背后,本质仍是推理需求增长快于供给释放速度。 模型厂商们纷纷开始采用更精细的收费方式:按token、按工具调用、按额度、按套餐层级收费。 对企业来说,这些费用都被视为效率提升的成本;但对普通用户来说,几十美金的月支出已经是大众用户的上限。 所以,龙虾的“凉了”,本质上是用户结构变了:退下去的是尝鲜的小白、低频使用的用户和想要低成本套利的投机者;留下来的是个人开发者、有复杂工作流需求的用户。 大众的“龙虾盛宴”浅尝辄止,但是Agent革命已经全面铺开。
谷歌联手Marvel研发下一代TPU,专为AI推理打造
编译 | 刘煜 编辑 | 陈骏达 智东西4月20日消息,昨天,据The Information报道,两名直接知情人士透露,谷歌正与无晶圆厂半导体公司Marvell商谈合作,计划开发两款全新芯片,包括专为运行AI模型打造的全新TPU,以及设计用于与谷歌TPU协同工作的内存处理单元。但值得一提的是,长期以来,博通一直是谷歌TPU的独家设计合作伙伴。 本次谷歌与Marvell的合作计划最快于明年完成对内存处理单元的设计,并生产近200万颗该单元。该合作尚未披露具体金额。消息人士补充称,由于谈判仍处于早期阶段,200万这一数字仍有可能调整。 一名谷歌员工透露,对于新推理芯片的研发,谷歌早已开始布局规划。今年3月,英伟达于GTC大会上发布了旨在提升推理任务效率的LPU芯片。谷歌在其发布LPU之后,进一步加快了对新一代推理芯片的相关研发速度。 值得一提的是,LPU是英伟达以200亿美元从Groq获得技术授权后研发打造的。而谷歌此次的合作对象Marvell,曾作为Groq第一代LPU的芯片设计合作伙伴,在推理芯片设计领域积累了相应的技术与项目经验。 在合作研发层面,谷歌在芯片设计领域对博通存在单一依赖。但由于博通收费模式成本高昂,该公司按每颗量产TPU收取费用,随着TPU需求激增,谷歌的相关支出也大幅攀升。因此谷歌正寻求降低对博通依赖的途径。 不过,据The Information 2023年报道,谷歌早在当时就有摆脱对博通单一依赖的意图了。那时谷歌曾考虑让Marvell取代博通,成为其数据中心内用于连接服务器与以太网交换机的网络接口芯片供应商。 去年,谷歌为了降低对博通的单一依赖,引入了中国台湾厂商联发科参与TPU芯片的设计与生产。 但在本月早些时候,博通与谷歌签署新协议,将为谷歌下一代AI数据中心开发并供应定制化TPU及网络组件,合作期限延长至2031年。这意味着博通在谷歌的芯片体系中仍占据着核心地位。 需要补充的是,摩根士丹利曾预计,谷歌2027年TPU产量约为600万颗。不过,本次双方合作中全新TPU的设计完成时间及谷歌规划的量产规模,目前仍未明确。 此外,谷歌当前的芯片均由台积电代工生产,新款芯片最终由台积电还是其他厂商制造,目前也未确定。 在谷歌与Marvell协商此次合作前,谷歌也曾向Marvell采购过CXL控制器芯片。据两名谷歌员工介绍,这类芯片用于管理数据中心内服务器之间的内存共享。不过采购的均为现货标准产品,并未涉及定制化合作。 多年来,谷歌仅在自有数据中心内部署TPU,用于支撑搜索、YouTube及Gemini大模型等业务,且仅对谷歌云客户开放。据The Information报道,这一局面在去年出现转变:谷歌开始向客户提供TPU算力租赁服务,支持客户将其部署于非谷歌数据中心,直接挑战英伟达在AI芯片领域的主导地位。 截至目前,谷歌TPU已被包括Anthropic、Meta以及苹果在内的客户采用。 而Marvell主营数据中心通用网络、存储及光互联芯片设计,同时为客户提供定制化芯片设计服务,该业务已成为其增长最快的板块。 结语:AI Agent推高算力需求,专用推理芯片研发趋势持续升温 谷歌与Marvell的此次合作,不止为降低谷歌对博通的单一依赖。 由于AI推理环节正走向精细化分工,推理任务并非通用处理器就能一概胜任,该任务部分环节依赖峰值算力,另一部分则受限于内存读写与数据调度效率。而谷歌与Marvell此次合作研发可与TPU协同工作的内存处理单元,正是这一行业趋势下的产物。 此外,当前AI Agent对算力的消耗远高于聊天机器人等传统AI应用,随着各类AI企业持续推出更复杂的智能体产品,专用推理芯片市场也进入快速发展阶段。 除谷歌外,OpenAI已于4月中旬与AI芯片公司Cerebras达成协议,计划斥资超200亿美元采购其推理芯片,同时该公司也在与博通合作研发自研推理芯片。 综合来说,为不同任务搭配专用推理芯片,而非依靠单一处理器包揽全部工作,也在逐渐成为头部厂商提升效率、控制成本的选择趋势。在此趋势下,AI芯片有望加速从通用化路线,向更贴合场景、更聚焦专业功能的方向分化发展。
实测Claude Design:小白也能做出专业级设计|附最全玩法+官方实用技巧
所有你能想到关于设计的工作,Claude Design 现在都能做。 无论是惊艳复杂的动效模拟,用简单的一句提示词,就能创建一个能互动的着色器壁纸库。 ▲提示词:想象一下,你正在为一款未来操作系统设计壁纸。我们希望它具有互动性,让人忍不住想摆弄一番。请创建五款不同的交互式着色器壁纸,它们能够对鼠标位置甚至点击做出反应。 还是能套在应用开发过程中的打字机效果,以及文字爆炸。 用一句提示词,Claude Design 就能给我们设计打字机、单词渐隐、单词滑入、字符模糊、点转文字、打乱、交错下落、上升进入、字符弹出、加粗进入、倾斜进入共 11 种文本流格式。 ▲在一个响应式网格中,为聊天应用制作 10 种不同的文本流动画;在 300×300 的单元格中分别展示每种动画;显示用户提问并在下方显示回复。循环播放。单色显示。 Claude Design 实现的文本粒子特效,包括对 火 Fire、烟 Smoke、金属 Metal、风 Wind、雪 Snow 等单词添加了对应的视觉特效。 ▲提示词:创建一个非常大的可编辑文本框,预先填充示例文本。对于某些词语,例如「火」、「烟」、「金属」、「风」,渲染与这些词语相匹配的视觉效果和粒子效果。 甚至可以说,Claude Design 一发布就导致 Figma 股价大跌的原因,是因为现在用它做原型设计,不仅审美高,而且完全不需要手工干预。 想要给共享单车应用创建一个简单的 iOS 注册流程,过去用 Figma 要先找到 iOS 对应的应用套件,然后自己想合适的配色逻辑,添加对应的布局,现在用 Claude Design 直出可交付的方案。 ▲提示词:为一款共享单车应用创建一个简单的 iOS 注册流程。在画布上展示界面。采用蓝橙相间的现代配色方案。 我们从网上找到了 Claude Design 最全的玩法,以及上手使用 Claude Design 的保姆级教程。可以说 Claude 这次的更新,让过去一年那些做 PPT、做精美网页设计的工具,瞬间黯然失色了。 玩法一:真正的 Vibe Coding 上线 让 AI 做一个网页似乎是检查模型代码能力,最重要的一项测试。一些 Agent 产品也利用现有的模型,进行优化组合,来控制模型的输出,以得到更精确、更遵循提示词指令的网页。 但现在当 Claude 自己下场来做设计类 Agent,基本上就没有给别的产品留任何空间了。 有网友用一句话就做出了一个高品质的公司官网,生成的网页内容 UI 精美、色彩搭配高级,配有符合场景特征的动效,和其他产品的渐变紫完全不在一个等级。 并且,Claude Design 生成的网页,可以无缝衔接到 Claude Code 进行项目的优化和迭代。 除了落地页,还有网友生成了一个个人仪表盘,把每天的日程、健康信息、以及待办事项等信息放在一个页面,并且能自动切换夜间和白天模式。 ▲来源:https://x.com/jerrod_lew/status/2045493141709464047 功能性的网页,Claude Design 能自动编排好信息,并且以高品质的 UI 设计呈现。对于一些单纯是用来「炫技」的网页设计,Claude Design 的表现也比其他工具要好。 像这个地球加载系统,也是只用一句提示词,就能得到可用的结果。 ▲提示词:设计一个加载指示器原型,显示一个旋转的地球仪,带有真实的地区轮廓,全单色,无文字,尺寸为 200×200,居中显示在米白色背景上,为其添加旋转效果。 玩法二:不只是设计,办公人的 PPT 也可以做 有网友分享了自己使用 Claude Design 做 PPT 的经历,在 Claude Design 工具里,也有专门一项是用来生成 Slide Deck(幻灯片)。 其他的办公场景,像是营销邮件的设计,通过上传自己的图片素材和商业广告信息给 Claude Design,它会自动编排好所有的内容,再简单的迭代优化之后,能得到可以直接发给潜在用户的广告邮件。 还有网友用 Claude Design 做了一本电子指南,她提到自己仅用一次提示就完成了这本书的设计。 玩法三:产品、UI 设计、画原型图 在软件开发的过程中,前端一般负责实现产品经理+设计的想法,过去的 AI Coding 告诉我们「前端已死」,但设计的「Taste(品味)」无法被替代。 现在的 Claude Design + Claude Code 就是要设计+产品经理+前端,统统承包,并且让生成的内容有「taste」。 原型图一般是产品经理在拿到设计的方案后,给出一款产品成型之前的一个简单的框架,将页面的排版布局展现出来,每个功能键的交互,使产品的初步构思有一个可视化的展示。 社交媒体上大量的网友分享了自己用 Claude Design 完成的 APP 原型设计,其中不乏交互友好、赏心悦目的各种实例。 部分提示词:设计一款名为「Lumi」的 iOS 和 Android 移动应用——一款以灵性健康为主题,专注于日记和显化功能的应用。期望输出:每个主屏幕:高分辨率浅色和深色模式的模型、交互式原型流程(最少:引导 → 主页 → 创建新清单 → 撰写日志 → 查看见解)、组件库(按钮、输入框、卡片、底部面板、芯片、模态框变体)和设计系统文档(颜色、排版、间距、立面)。 无论是何种类型的 APP,Claude Design 都能找到最适合对应主题的设计方案。有网友设计了一个简单的、基于 AI 的游戏化生活管理应用程序,在生成的原型图里,有经典的热力图、各种成就等级系统,和课程等详细内容 玩法四:视频动画也能生成 基于强大的代码能力,Claude 能组合不同的动效库,生成各种各样的动画。例如在 Claude Design 的官方案例展示里,他们使用一句提示词,生成了一段宇宙运动的模拟动画。 ▲创建一个基于精灵的动画,提供关于天体距离和大小的趣味知识。将使用不同大小圆形作为天体的抽象动画与文字动画相结合。采用单色调、Helvetica字体配色方案。 也有网友输入提示词「请制作一个基于精灵图的动画,介绍任天堂的历史趣闻。将各种动画与文字动画结合起来。使用符合任天堂品牌风格的配色方案和字体。」 最后生成的动画不仅详细介绍了任天堂的历史趣闻,同时采用了动画设计来衔接和过渡不同的页面,整个动画时长 1 分 02 秒。 也有网友直接给 Claude Design 的博客文章和一些推文粘贴进去,就生成了这个 30 秒的动画视频。 所谓的精灵图 Sprite,又叫拼合图,是一个计算机图形学术语,也是目前在 Web 前端开发中常用的图像拼合技术,是指当一张二维图像集成进场景中,成为整个显示图像的一部分时,这张图就称为精灵图。 我们看到这些由 Claude Design 生成的动画,都是使用精灵图来切换显示不同的图像、排版、控制纹理尺寸等工作,保证动画效果的同时提升网页的渲染性能。 实测上手,和来自官方的 7 个实用小技巧 目前 Claude Design 仅向 Pro、Max、Team 和 Enterprise 订阅用户开放,并且有每周额度限制。我们在创建三个 Claude Design 任务之后,基本上都是动效风格比较丰富的项目,占据了 37% 的周额度。 通过 Claude 网页侧边栏的 Design 一行,或是直接输入网址我们可以访问 Claude Design 的首页。 和一般的网页生成 Agent 工具不同,Claude 并没有在首页放一个大大的对话框,而是大多数的传统设计工具一样。主页左边可以让我们新建不同的项目,原型、幻灯片、从模板开始或者其他类型,还有一个设计系统的设置。 在原型设计中,又分为线框图和高保真内容,幻灯片则可以开启「使用演讲者备注」的功能,以及选择已有的模板,从模板开始设计。 输入项目名字,点击创建,来到项目首页。Claude Design 在左侧边栏为我们提供了对话窗口,而在右边则可以用先画草图的方式,让 Claude Design 通过草图来完成设计。 我们输入了一句简单的提示词,「帮我设计一个 Spotify 2026 wrapped 的年度总结动画」,等 Claude 自动跑完所有的流程,它最后生成了一段 44s 的动画,包括年度歌手、音乐风格、收听时长等信息,并且提供了 Tweak,我们可以直接在右侧边栏进行修改。 在测试 PPT 制作时,我们发送了一句简单的提示词,Claude 会生成一份问卷,要求我们回答,最后的 PPT 是什么形态,例如语言的要求、页数的要求、演讲者备注是否要详细、听众技术背景等等。 最后,Claude Design 生成的 40 页 PPT,在内容上不仅要比一些动不动深度研究几十分钟的工具要全面,并且还直接在下方提供了讲稿,还允许我们对主题进行修改,使用深色/午夜蓝/暖色调,以及对字体大小的修改等。 ▲提示词:我要给高中生做演讲,主题是大语言模型的发展–从 2026 到 2030,时长是一个小时,帮我设计一份 PPT。 Claude Design 的设计师 Ryan Mather,在 X 上也分享了一些充分利用 Claude Design 的小技巧。 搭建你的设计系统和核心界面。花一个小时进行设置和完善是值得的。 与工程师实时迭代。通常在一次会议中,就能和工程师一起设计出新功能。因为 Claude 在做原型方面非常快,我们可以把讨论保持在较高层次,一边围绕概念和约束进行头脑风暴,一边看着它们逐渐成形。 使用评论工具进行快速、精准的修改。在完成一个粗略的初稿之后,可能会发现有几十个细节想要调整。用语言去描述所有这些修改会很棘手,所以应该使用评论工具,直接指出并进行修改。 让 Claude 为我们的想法制作视频演示。Claude Design 几乎可以做到我们能想到的任何事情,它更像 Claude Code,而不是一个基于画布的设计工具。 使用连接器(尤其是 docs / slack)。 一旦设置完成,我们可以发送类似这样的提示:「请阅读产品交流会的会议记录,并创建一个演示文稿,探讨所有出现问题的不同设计解决方案」。 让 Claude 即时创建定制工具。通常情况下,不要试图像使用基于画布的工具那样去使用 Claude Design。它是另一种存在,拥有不同的能力。多尝试,玩出点花样!你会发现自己的设计方式已经远远超出了过去的思路。 知道何时放慢节奏,亲手完成。新的图标、点缀插画、命名。有些细节始终会产生超出预期的影响。很容易被 Agent 设计的高速节奏卷入其中。知道何时放慢下来,本身也是一门艺术。 ▲就像每个学校、公司都会有自己的品牌使用指引,规范颜色、字体、Logo 等形象,Claude Design 的设计系统,也能让我们一次性规范这些设计资源。 得益于 Claude 目前强大的生态系统, Claude Design 的能力有机会真正融入到 AI 工作流里,彻底改变过去那些 AI 网页生成类工具里,输出过于泛化、忽视现有设计语言,以及很难以在团队流程中复用等问题。
阿里甩出AI语音转写神器!准确率击败字节腾讯,连方言都能写对
作者 | 王涵 编辑 | 心缘 智东西4月20日报道,刚刚,阿里发布语音识别大模型Fun-ASR1.5,该模型是千问端到端语音识别大模型的新一代版本。 该模型可以识别30种语言,覆盖中文七大方言体系及20余种地方口音,并强化了古诗词诵读的专项识别。Fun-ASR1.5可以分辨出语音中的抑扬顿挫,重点优化了标点预测和文本归一化能力,可以应用于会议纪要、新闻采访整理、法律笔录等场景。 技术团队介绍称,与Seed-ASR和Tencent-ASR模型相比,Fun-ASR1.5在西班牙语、葡萄牙语和英语方面的识别准确率成绩较为突出,均在96分以上。 Fun-ASR1.5在开源多语言测试集中获得多项SOTA 中文方言方面,Fun-ASR1.5则在四川话、闽南话、长沙话、苏州话等13种方言识别准确率上,超越Seed-ASR和Tencent-ASR模型。 Fun-ASR1.5在工业方言测试集中获得多项SOTA 智东西第一时间体验了其音频转写功能。我们上传了一段三星CES 2026“First Look”演讲的录音音频。在原音频中,背景环境声音嘈杂,演讲人使用英语演讲但带有韩语口音,且录制声音较小。 Fun-ASR1.5不仅将演讲内容准确完整地转写了出来,还根据演讲人的语气和内容,对相关语句进行了大写强调处理,提高了会议转写的效率。 智东西实测体验音频转写 目前用户可以在魔搭社区体验该模型,开发者可以通过阿里云百炼平台调用API。 一、能识别30种语言,跨语言切换无需预设 Fun-ASR1.5可精准识别欧洲、东亚、东南亚、南亚及中东主流语种,覆盖中、英、日、韩、法、德、西、葡、俄、阿拉伯语等30种语言。 韩语: ASR结果:저는 이 주제에 따라 한 말씀 드리자면, 사실 저희도 이전에 비슷한 상황을 겪은 적이 있습니다. 马来语: ASR结果:Kejayaan projek ini tidak dapat dipisahkan daripada usaha pasukan, terutamanya kerja keras siang malam oleh jabatan penyelidikan dan pembangunan. 西班牙语: ASR结果:La diversidad cultural es un tesoro invaluable para la sociedad humana, y debemos respetar y proteger todas las tradiciones culturales. 在跨语言切换(Code-Switching)场景下,Fun-ASR1.5可以做到无需预设语种标签,就自动识别并切换,保证转写的准确性。比如,同一段对话里夹杂多种语言,模型也能准确识别,无需提前告诉它接下来要说哪种语言。 英语日语切换: ASR结果:We’ve all had that experience of finally visiting a place we’ve dreamed about for years,only to find that it doesn’t quite live up to our expectations.There’s even a term for this in one of the most visited cities in the world,Paris Syndrome.何年も前から行きたかった場所をやっと訪れてみたら、思っていたほどではなかったという経験は誰しもあることだと思います。 技术团队介绍称,这种多语言能力,源于模型的架构和训练创新。Fun-ASR1.5采取MoE(混合专家)架构,模型内部可以分工协作,听到特定语言时仅激活相关部分进行处理,因而更为灵活高效。 同时,技术团队在模型的训练阶段分级、分阶段地使用精准数据,也可以使模型更能适配真实世界中的复杂语音场景。 二、错字率下降56.2%,古诗词准确率达97% 在中文本土化方面,基于数十万小时真实方言语音数据训练,技术团队称,Fun-ASR1.5的平均字错误率(CER)相比上一版本下降56.2%。 上海话: ASR结果:现在发展了蛮快个现在伊拉用户算大户唻。 客家话: ASR结果:呃,那些吃的不就这样的土笋冻啊,我觉得不好吃。 闽南话: ASR识别结果:但是一个人若是两三两百箍一百外箍安无算贵吧,吼自助餐啊,啊你也有肉咯也有菜咯也有水果咯也有甜点咯,啥物计有咯。 粤语: ASR结果:诶,其实可能有时候觉得去超市都几远下噶。 此外,该模型不仅听得懂,还能“写得地道”,Fun-ASR1.5可原汁原味还原方言,如上海话的“侬”、苏州话“倷”(均指“你”),为下游模型处理方言文字提供了准确的基础语料。 不同于现代口语,文言语法特殊、典故生僻字繁多,具有不少挑战。例如,文言语法简练,省略主谓宾;押韵严格,节奏固定(如五言、七言律诗);多用典故、异体字、古今异义词;诵读时存在拖腔、停顿、吟咏等非自然语流特征。 Fun-ASR1.5对中文古诗词识别进行专项优化。研究团队构建了先秦至近代的古诗词语音-文本对齐语料库,涵盖《诗经》《楚辞》、李白杜甫诗集、苏轼辛弃疾词作等经典文本的真人诵读录音。 在内部评测集中,Fun-ASR1.5对古诗词的字符级准确率达到97%,可应用于国学在线课程和有声诗词,助力文化传承。 ASR结果:蓬山此去无多路,青鸟殷勤为探看。 ASR结果:子夏曰,博学而笃志,切问而近思,仁在其中矣。 三、能自动插入标点符号,口语表达一键规范 语音识别最终都要落脚于生成可直接使用的文本,Fun-ASR1.5在后处理环节也重点优化了标点预测和文本归一化两项能力,大幅降低了会议纪要、新闻采访整理、法律笔录等场景的后期人工校对和编辑成本,具体如下: 1、标点预测:更加智能模型基于上下文语义自动插入逗号、句号、问号、感叹号等标点,使转写结果接近书面表达。例如: 输入语音:“今天天气怎么样啊我想出去走走但又怕下雨”输出文本:“今天天气怎么样啊?我想出去走走,但又怕下雨。” 2、文本归一化(ITN)表现:进一步提升将口语中的非标准表达自动转换为规范格式: 数字:“三千五百六十二” → “3562” 日期:“二零二六年三月二十九号” → “2026年3月29日” 金额:“五万八千块” → “58000元” 电话:“幺三八零零幺三八零零零” → “13800138000” 结语:AI语音模型正稳步落地应用 会议纪要、法律笔录等场景,长期处于“半自动”应用状态,核心痛点是AI识别结果需人工进行大量校对,不仅未能有效提升工作效率,还影响了实际工作推进。 阿里Fun-ASR1.5针对这一痛点进行定向优化,补齐了传统语音识别的部分短板,也降低了各行业引入AI语音技术的门槛。 目前,科大讯飞、百度、字节等企业的语音模型均在持续迭代,AI语音大模型正从技术研发逐步向实际应用推进,语音识别作为AI与人交互的重要入口,其实用性直接关系到行业落地的实际效果。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。