行业分类:
加载中...
头条分类:
加载中...
智象未来完成超5亿元融资,将打造原生全模态世界模型
凤凰网科技讯 4月15日,多模态生成式AI公司智象未来(HiDream.ai)今日宣布完成超5亿元新一轮融资。本轮由东方富海、安徽省投资集团旗下的省产业投资公司、峰华资本等新股东联合投资,合肥产投、兴泰集团、合肥高投、安徽省人工智能母基金等老股东跟投。 据介绍,融资将主要用于下一代“原生全模态世界模型”的研发、企业服务智能体产品建设以及全球市场拓展。该公司认为,下一代大模型的竞争重点在于以统一架构对真实物理世界进行“原生性”和“全模态”的统一建模,而非仅通过视频生成模拟物理世界。 技术层面,智象此前已开源图像生成模型HiDream-I1,在评测平台Artificial Analysis上曾登顶首位,成为首个在该榜单取得领先位置的中国自研生成式视觉模型;其图像编辑模型HiDream-E1.1也进入图像编辑智能体第一梯队。相关开源模型在全球社区下载量超200万次,被部分开发者称为图片模型领域的“DeepSeek”。此外,公司于2024年5月上线了全球首个开放使用的视频生成DiT架构模型,并即将发布分钟级长视频音画同步模型。 商业化方面,截至2026年第一季度,智象产品已覆盖全球超3000万专业用户及4万余家企业客户。公司构建了“1+1+3”商业化架构:以HiDream大模型为底座,Token Hub平台输出标准化模型能力,并聚焦商业营销、影视创作、社媒内容创作三大场景。据介绍,今年第一季度营收已超去年全年。 生态合作上,智象已与诺亦腾机器人(Noitom Robotics)达成战略合作,探索“真实数据+生成式视频数据”融合的具身智能训练数据新范式;同时与百图生科(BioMap)协同,聚焦虚拟细胞等微观世界模型构建,赋能生物医药研发。
佳能发布电影伺服镜头新品,系列最长1200mm超远摄+30倍变焦
IT之家 4 月 15 日消息,佳能(中国)今日宣布推出电影伺服镜头系列新品 ——CN30×40 IAS J/R1 和 CN30×40 IAS J/P1。 这两款镜头分别配备 RF 卡口和 PL 卡口,在保持便携性的同时,实现了该系列中最长的 1200mm 超远摄焦距和最高的 30 倍变焦倍率,计划于 2026 年 9 月下旬上市发售。 新镜头覆盖从 40mm 广角到 1200mm 超远摄的焦距范围,在使用内置 1.5 倍增距镜后,焦距范围可扩展至 1800mm,同时还可用于搭载 35mm 全画幅图像感应器的摄影机。 得益于佳能的光学技术,这两款镜头在将变焦倍率从上一代产品的 20 倍提升至 30 倍的同时,PL 卡口版本保持了与前任型号相同的约 405.2mm 总长度和约 6.6kg 重量,具备较好的机动性。至此,佳能电影伺服变焦镜头系列覆盖了从 11mm 到 1800mm 的宽广焦段。 在功能方面,配备 RF 卡口的 CN30×40 IAS J/R1 支持全像素双核 CMOS AF 和对焦向导功能,能有效减少现场拍摄时摄像师的工作量。在与 EOS C400 摄影机配合使用时,它还支持自动曝光渐变补偿,可补偿变焦过程中的亮度损失,在拍摄过程中保持稳定曝光。 此外,该镜头还支持对焦呼吸校正和佳能虚拟制作系统,能够满足多种制作场景的需求。两款镜头均采用新开发的驱动单元,并配备了多功能 USB Type-C 接口。 通过 USB Type-C 接口接入外部电源后,变焦和对焦的伺服速度得以大幅提升。该镜头还支持向遥控系统输出对焦、变焦和光圈位置信息,并允许通过遥控系统进行镜头控制,以及支持用户进行固件更新和维护。驱动单元安装后支持广播式工作流程,移除后则可在电影式工作流程中实现全手动操作。该镜头适用于野生动物与自然生态拍摄、体育赛事转播及演唱会拍摄等场景。 ▲ 新开发的数字驱动单元(红色框部分) ▲ 新增是基于 CN20×50 镜头新增的功能,自动曝光渐变补偿功能预计在 2026 年固件升级时为 CN20×50 与 EF-EOS R 的组合提供 可选配件: 变焦控制器:ZSD-300D、ZDJ-G01 (BDC-21)*¹、ZDJ-S01 (BDC-21) 聚焦控制器:FPD-400D、FDJ-G01 (BDC-21)*¹、FDJ-S01 (BDC-21) 光圈控制器:不支持(不支持通过调节驱动单元设置调整对焦控制器的光圈操作)
人类能管住AI吗?Anthropic用千问做了个实验
如果有一天,AI比人类更聪明了,我们这群有机体到底应该怎么办? 他们要是反过来消灭我们,我们又怎么抵抗? 各种科幻电影都讨论过相似的问题,可那只是文学、艺术和哲学方面的。 现如今,Anthropic正儿八经做了个实验,以证实我们到底能不能监督比自己更聪明的AI。 实验结果很有趣,但过程更有意思。 因为Anthropic用两个不同版本的阿里千问模型,来分别代表人类和比人类聪明的AI。 其结果就是,我们人类说不定还真能管得住超级AI! 01 这篇论文到底在说什么 这篇研究的标题叫“Automated Alignment Researchers”,翻译过来就是“自动化对齐研究员”。 它要解决的问题很现实,那就是当AI变得比人类更聪明时,我们怎么确保它还听人话? 现在的模型已经能生成大量的代码了,未来将可以生成几百万行复杂代码,以至于人类根本看不懂。我们又该如何去审查这些代码? 这就是AI安全领域一直在研究的“可扩展监督”问题。 Anthropic这次研究的切入点叫“弱监督强模型”。 这个概念我们可以这么理解,假设你是个小学老师,现在要教一个天才高中生。你的知识有限,学生懂得知识比你更多。 那么请问,他最后能学成什么样的水平?是只学到你这个小学老师的水平,还是能突破你的局限,发挥出自己的真实能力? 在实验里,Anthropic用小模型扮演“弱老师”,用更强的模型扮演“强学生”。 具体来说,他们用Qwen1.5-0.5B-Chat当老师,用Qwen3-4B-Base当学生。让弱模型给强模型提供训练信号,然后看强模型能不能从这些不够完美的信号里,学到接近理想状态的表现。 衡量标准叫PGR,全称是Performance Gap Recovered,意思是“性能差距恢复程度”。 如果PGR是0,说明强模型只学到了弱老师的水平,白瞎了自己的知识。如果PGR是1,说明强模型彻底突破了弱老师的限制。 弱模型就相当于未来的人类,强模型就相当于未来那些超越人类的AI。 如果我们能在今天就找到办法,让强模型不被弱监督拖累,那未来我们就能用类似的方法,去监督超级AI。 在人类研究员调试出基线之后,Anthropic派出了9个基于Claude Opus 4.6的agent来给学生Qwen进行微调,这9个agent叫做Automated Alignment Researcher(自动化对齐研究员),简称AAR。 Anthropic给它们配备了沙盒环境、代码工具、共享论坛、评分服务器,然后告诉它们:“去吧,自己想办法提高Qwen3-4B-Base的PGR。” 这些AI研究员可以自己提出假设、写代码、训练模型、提交实验、看分数、分析失败原因、和其他AI研究员交流发现、继续迭代。 结果相当惊人。 人类研究员先花了7天时间,调试了4种已有方法,最好的PGR只有0.23。然后9个Claude接手,继续跑了5天,累计大约800小时研究时间,最后把PGR推到了0.97。 也就是说,我们大概率可以管得住比我们更聪明的超级AI。 这个实验总成本约1.8万美元,包括API调用和模型训练的计算成本,折合每个AI研究员工作一小时约22美元。 什么概念?沃尔玛零售门店负责给员工排班的副店长,时薪差不多是25美元。 这个结果让人震撼的地方不在于AI能写代码或者读论文,而在于它们能完成一个完整的研究闭环。提出想法、验证、失败、改进、再验证,这已经接近一个研究助理的核心工作流程了。 但问题来了,这些AI发现的方法,真的有用吗?还是只是在特定环境里碰巧有效? Anthropic做了两个测试来验证。 第一个测试是把AI发现的最好两种方法,拿去测试它们没见过的数学和代码任务。 结果显示,效果最好的方法在数学任务上PGR达到0.94,在代码任务上达到0.47,虽然代码任务上的表现差一些,但仍然是人类基线的两倍。其次的方法在数学上还行,但在代码任务上反而让结果变差了。 说明它有一定迁移迹象,但泛化并不稳定。 但它们会严重依赖具体的数据集和任务结构,也就是说并不是所有人任务都能胜任。 第二个测试是Anthropic把刚才提到的效果最好的方法,拿到了Claude Sonnet 4的真实训练上,来看看实际效果如何。 结果没有得到统计显著的提升。 也就是说,在小模型、清晰指标、可以反复提交的实验环境里效果很好,但离“直接改进生产级Claude对齐”还有距离。 这个结果其实很诚实。它告诉我们,AI研究员现在能做的事情是有边界的。它们擅长在目标明确、能自动评分、能大量试错的问题上快速迭代,但遇到更复杂、更模糊的现实问题时,还需要人类的判断和介入。 那这篇论文的意义到底在哪里? 首先,它证明了“AI做研究”已经不是口号了。 过去我们总说AI可以辅助研究,然而那只是口号而已,AI能做的事情也就是翻译和总结。 这次不一样,AI自己形成了研究闭环,这已经接近研究助理的核心能力了。 弱监督强模型这个问题,本质上就是在模拟未来人类监督超级AI的场景。 这篇论文证明,至少在一些清晰任务上,AI可以自己找到办法,让强模型不被弱监督拖死。这为未来的对齐研究提供了一个可行的方向。 还有一点,它暗示未来对齐研究的瓶颈可能会变。 以前瓶颈是“没人想出足够多好点子”,现在如果AI研究员能便宜地并行跑很多实验,瓶颈可能变成“怎么设计不会被钻空子的评测”。 也就是说,人类研究员未来更重要的工作,可能不是亲自跑每个实验,而是设计评估体系、检查AI研究员有没有作弊、判断结果是不是真的有意义。 这一点在论文里也有体现。 Anthropic的文章中写到,在数学任务里,有个AI研究员发现最常见的答案通常是对的,于是绕过弱老师,直接让强模型选最常见答案。在代码任务里,AI研究员发现自己可以直接运行代码测试,然后读出正确答案。 这对任务来说就是作弊,因为它不是在解决弱监督问题,而是在利用环境漏洞。 这些结果被Anthropic识别并剔除了,但这恰好说明自动化研究员越强,越会寻找评分系统的漏洞。 以后如果让AI自动做对齐研究,必须把评测环境设计得非常严密,还要有人类检查方法本身,而不是只看分数。 所以这篇论文的核心结论是今天的前沿模型,已经可以在某些定义清楚、能自动打分的对齐研究问题上,像小型研究员团队一样自己提想法、跑实验、复盘结果,并且明显超过人类基线。 不过它还不是“AI科学家已经到来”的铁证,毕竟Anthropic这次选择的是一个能够自动化的任务,如果我给AI安排一个不能自动化的任务,那么结果将会非常糟糕。 现实中的很多对齐问题更模糊,不能轻松打分,也不能只靠爬榜解决。 02 为什么选择Qwen 看完Anthropic这篇论文,很多人可能会好奇:为什么他们用的是阿里的Qwen模型,而不是自家的Claude或者OpenAI的GPT? 这个选择背后其实有很多考量。 首先得说清楚,这个实验里用的是两个Qwen模型:Qwen1.5-0.5B-Chat当弱老师,Qwen3-4B-Base当强学生。一个只有5亿参数,一个有40亿参数,规模差了8倍。这个规模差异很重要,因为实验要模拟的就是“弱老师教强学生”的场景。 那为什么不用Claude或者GPT呢? 答案很简单,因为这些模型不开放权重模型。 Anthropic这个实验需要反复训练模型、调整参数、测试不同的监督方法。 如果用闭源模型,他们只能通过API调用,没法深入模型内部去做精细的训练和调整。 更关键的是,他们需要让9个AI研究员并行跑几百次实验,每次实验都要训练一个新模型。如果用闭源模型,成本会高到离谱,而且很多操作根本做不了。 开源模型就不一样了。 你可以下载完整的模型权重,在自己的服务器上随便折腾。想怎么训练就怎么训练,想跑多少次实验就跑多少次。这种灵活性是闭源模型给不了的。 但开源模型那么多,为什么偏偏选Qwen? 官方并没有给出真正的原因,以下原因均为我的推测。 我认为性能好是第一个原因。 Qwen系列模型在开源模型里一直表现不错,尤其是Qwen3发布后,在多个基准测试上都达到了接近闭源模型的水平。 对于这个实验来说,强学生的能力很重要,如果强学生本身能力不行,那弱监督再好也没用。Qwen3-4B虽然只有40亿参数,但能力已经足够强,可以作为一个合格的“强学生”。 第二个原因是模型的可用性。 Qwen模型的文档完善,社区活跃,训练和推理的工具链都很成熟。对于需要反复训练和测试的实验来说,这些基础设施的完善程度直接影响研究效率。如果选一个文档不全、工具不好用的开源模型,光是调试环境就要浪费大量时间。 第三个原因是规模的适配性。 这个实验需要一个“弱老师”和一个“强学生”,而且这两个模型要有明显的能力差距,但又不能差太多。 Qwen系列有从5亿到720亿参数的多个版本,可以灵活选择。5亿参数的模型足够弱,但又不至于弱到完全没用;40亿参数的模型足够强,但又不至于强到训练成本承受不了。这个搭配刚刚好。 最后一个原因是可复现性。 Anthropic在论文最后明确表示,他们把代码和数据集都公开了,放在GitHub上。如果他们用的是闭源模型,其他研究者想复现这个实验就很困难,因为他们没法获得相同的模型。 但用Qwen这样的开源模型,任何人都可以下载相同的模型权重,跑相同的代码,验证相同的结果。这对科研来说非常重要。 从这个角度看,Anthropic选择Qwen,一方面确实是对阿里模型性能的认可。如果Qwen的能力不行,或者训练起来问题很多,他们不会选。但另一方面,更重要的是Qwen作为开源模型带来的灵活性和可复现性。 而中国的开源AI项目,正在这个基础设施中占据越来越重要的位置。这对全球AI安全研究来说是好事,对中国AI生态来说也是好事。因为AI安全不是零和游戏,不是你赢我输,而是大家一起努力,让AI变得更安全、更可控、更有益于人类。
Claude要求部分用户上传身份证件
IT之家 4 月 15 日消息,Anthropic 于当地时间 4 月 14 日发布公告,称正在为 Claude 的一些用例推出身份验证。 Claude 是由 Anthropic 构建的大型语言模型(LLM),官方表示,当用户访问某些功能时,可能会看到验证提示,这是其例行平台完整性检查或其他安全和合规措施的一部分。仅使用用户的验证数据来确认身份,不用于任何其他目的。 IT之家附相关要求如下: 我们如何验证? 我们选择 Persona Identities 作为验证合作伙伴,基于他们的技术强度、隐私控制和安全保障。请按照以下步骤完成您的身份验证过程。 您需要准备什么: 有效的政府颁发的带照片的身份证件:实体文件,在手边 带摄像头的手机或电脑:您可能需要用手机拍摄实时自拍照,或使用网络摄像头 几分钟时间:验证通常需要不到五分钟 接受的身份证件类型: 接受来自大多数国家的原始、实体政府颁发的带照片的身份证件。常见例子包括: 护照 驾驶执照或州 / 省身份证 国家身份证 您的身份证件必须由政府颁发、清晰易读、完好无损,并包含您的照片。 不接受的身份证件类型: 复印件、截图、扫描件或照片的照片 数字或移动身份证件(如移动驾驶执照) 非政府身份证件:学生证、员工证、图书卡、银行卡 临时纸质身份证件 为什么我的账户在验证后被禁用了? 作为我们安全流程的一部分,我们可能因多种原因禁用账户: 重复违反我们的使用政策 从不支持的位置创建账户 违反服务条款 18 岁以下使用 我们不在做什么: 我们不使用您的身份数据来训练我们的模型。验证数据仅用于确认您的身份以及满足我们的法律和安全义务。 我们不收集超过我们需要的信息。我们仅要求验证您身份所需的最少信息。 我们不与任何人分享您的身份数据。验证数据仅在您、Persona 和 Anthropic 之间保留,除非我们在法律上被要求响应有效的法律程序。您的验证数据永远不会与第三方共享用于营销、广告或任何与验证和合规无关的目的。
中国移动被指设霸王条款:号码过户要预存1万元话费 客服回应
快科技4月17日消息,近日,作家夏小嫣在社交平台爆料,自己使用二十余年的移动连号手机号办理过户时,被营业厅要求预存10000元话费,且每月保底消费400元,她认为该要求属于不合理的霸王条款。 该号码登记在其前夫名下,但一直由夏小嫣实际使用,且绑定了银行卡、支付宝等重要账户,她强调这并非新号入网,而是老号过户给实际使用者,当初办理时并无此类附加条件,无法接受临时增设的高额费用要求。 面对用户质疑,营业厅工作人员起初坚称是公司内部规定,在夏小嫣表示将向10086及工信部投诉后,工作人员又改口提出可调整方案。 将套餐降至每月58元、预存话费降至200元,但该方案需上报领导审批,审批通过后才能办理过户,最快也要到下月完成,前后标准差异巨大,让用户难以理解。 中国移动客服对此作出回应,称靓号过户后将按照新入网号码管理,新用户需依据号码标准级别选择对应的吉祥号码合约方案,按要求预存话费并签署相关协议。 客服解释,预存金额根据号码特征划分,像四连号、顺子号、重叠号等特殊组合号码,预存款项可能达到万元级别,若用户觉得费用过高,可选择更换普通号码。 不少消费者认为,运营商此举变相限制用户正常办理过户业务,损害用户合法权益,希望运营商能优化靓号管理规则,平衡商业利益与用户权益,避免用内部规定设置不合理门槛,保障用户办理基础业务的正当权利。
荣耀WIN官微正式上线 网友热议:要创立子品牌?
凤凰网科技讯 4月17日,荣耀WIN官方微博正式上线,引发网友广泛关注。其首条微博视频里,展示了手机和笔记本电脑两款产品。 据了解,4月13日,荣耀WIN游戏本正式推出亮相。根据荣耀官方公布,荣耀WIN游戏本H9 搭配5070Ti显卡,可实现270W满血性能释放。 在去年的12月26日 荣耀推出了主打高性能与电竞体验的WIN系列手机,包含荣耀WIN及WIN RT两款机型。标准版WIN搭载了骁龙8 Elite Gen5处理器,而WIN RT版则配备骁龙8 Elite处理器,全系标配LPDDR5X至尊版内存及UFS 4.1闪存。为解决高性能释放带来的热量堆积,荣耀在手机内部引入了“东风涡轮散热”系统,通过内置高转速风扇与直驱疾冷风道设计,实现了主动物理散热。 荣耀中国区电商部部长李云鹏曾表示,荣耀WIN系列致力于成长为一个完整的电竞生态品牌。它将持续深耕电竞人群,通过极致的性能调教,为玩家提供绝佳的使用体验。 这意味着该品牌不仅局限于手机赛道,还将涵盖笔记本电脑等多种高性能终端。通过多元化的产品布局,荣耀WIN旨在完善品牌的高性能矩阵,进一步抢占年轻消费市场。 此前,荣耀CEO李健在接受采访时提到,荣耀正考虑在国内市场正式推出子品牌,以进一步优化线上与线下渠道的组合。荣耀WIN的正式亮相,被外界视为这一战略布局的重要落地。 评论区里,不少网友纷纷猜测,这个新账号是否预示着荣耀WIN将正式作为独立的子品牌运营。
美团回应被处罚:坚决打击餐饮转单 守护外卖食品安全
快科技4月17日消息,美团今日发文表示,已于当日收到国家市场监督管理总局下发的关于平台未依法履行资质审核义务的《行政处罚决定书》。 美团回应称,公司将按照食品安全监管要求,深入落实各项整改措施,全面提升治理能力。 在各级监管部门指导下,坚决打击餐饮转单、利用虚假资质上线等违法违规行为和黑灰产产业链,进一步升级举措、强化治理力度,切实守护外卖食品安全。 据央视新闻报道,今日,市场监管总局依法对北京三快科技有限公司(美团)、北京京东叁佰陆拾度电子商务有限公司(京东)、上海拉扎斯信息科技有限公司(原饿了么,现淘宝闪购)、北京抖音科技有限公司(抖音)、浙江淘宝网络有限公司(淘宝)、浙江天猫网络有限公司(天猫)等7家电商平台“幽灵外卖”系列案,依据《中华人民共和国食品安全法》第一百三十一条、《中华人民共和国电子商务法》第八十三条的规定作出行政处罚决定,责令7家电商平台改正违法行为,暂停新增蛋糕店铺3至9个月不等,并处以罚没款共计35.97亿元。 依据《中华人民共和国食品安全法实施条例》第七十五条的规定,对7家平台企业法定代表人和食品安全总监合计处以罚款1968.74万元。 经查,上述7家电商平台对入网食品经营者许可证审核把关不严,未依法履行资质审查义务;与转单平台签订合作协议,明知或应知转单行为侵害消费者合法权益,但未采取必要措施;7家电商平台法定代表人和食品安全总监,负有食品安全管理责任,但未全面履行有关岗位职责。 上述行为严重违反《中华人民共和国食品安全法》《中华人民共和国电子商务法》《中华人民共和国食品安全法实施条例》有关规定。
阿里1000亿美元赌局:一匹“小马”能否撬动大局
作者|张谦 编辑|胡展嘉 运营|陈佳慧 出品|零态LT(ID:LingTai_LT) 头图|网络公开用图 3月19日晚上,CEO吴泳铭在阿里2026年Q3财报分析师电话会上,甩出“未来五年,包括MaaS在内的云和AI商业化年收入突破1000亿美元”时,台下的人都在心里默默算账。145亿美元起步,47%的年复合增长率,连续五年。 亚马逊AWS从122亿到1076亿花了八年,年均31%;谷歌云去年Q4增速48%,但基数小,且只有一个季度摸到这个数。 阿里云要的是连续五年。这不是预测,是倒逼。用不可能的目标,逼一家20岁的公司重新学会冲刺。 如今,这声冲锋号有了新回响——一匹叫“HappyHorse”的小马突然杀出,4月10号,阿里官方确认了这匹“小马”归属,称当前处于内测阶段,API计划于2026年4月30日开放,这也让阿里云终于摸到了AI视频的牌桌。 HappyHorse 撬开被字节“独霸”的市场 AI视频是当下最明确的商业化场景,没有之一。一条15秒视频消耗30万Token,漫剧、短剧公司的日消耗可达百万甚至千万级。据艾瑞咨询以及天眼查综合数据统计估算,2025年中国AI视频生成市场规模100至150亿元,2026年破200亿元。 但过去两年,这个市场几乎与阿里无关。 字节Seedance 2.0今年2月上线即梦、豆包后迅速引爆。游戏科学创始人冯骥称其为“地表最强”,影视飓风Tim说“改变视频行业”。爆火之后是产能瓶颈——用户排队数小时成常态,499元/月的高级会员也得等3小时以上。3月OpenAI关闭Sora服务后,即梦一个月内涨价三次,积分额度对半砍,企业客户签500万保底协议才能用“满血版”。 即便如此,漫剧、短剧公司仍蜂拥而至。传统真人短剧动辄百万成本、数月周期,Seedance的效率和成本优势是降维打击。到3月底,字节漫剧日消耗突破7000万元,首次超过真人短剧。 火山引擎的“独霸”,客观上给阿里留出了窗口。但窗口不会永远敞开——必须趁Seedance产能瓶颈、涨价争议的当口,快速切入。 转机发生在4月某个凌晨。 一款名为“HappyHorse-1.0”的AI视频生成模型突然在Artificial Analysis Video Arena盲测榜单登顶。在行业还在猜测是谁家的“马甲”时,阿里已经出面认领——这是阿里旗下ATH(Alibaba Token Hub)事业群的创新事业部的内测产品,将于4月30日开放API。 真正值得关注的是水面之下。 据界面新闻报道,阿里云一线销售已经开始主动出击,开挖火山引擎的AI视频客户。一位阿里云的销售向界面新闻表示,大模型真正赚钱的就是这些AI视频类客户,但漫剧、短剧乃至整个视频生成类行业的头部客户,之前阿里都很难接得住。“很多客户现在都是苦于火山引擎的一家独大,一是生成要排队,二是涨价。但凡有一家能力跟他差不多的,价格也不是说特别过分,很多客户都是非常有兴趣的。” HappyHorse给了撬动市场的支点。上述销售所在团队已拉了一大批企业客户准备邀请内测,其中不乏日消费几十万级别的玩家。 但销售们的焦虑同样真实。盲测榜单的Elo分数波动大,一位生成式AI基础设施创业者直言:“基于我看的视频和Arena测试,远不如Seedance 2.0。”他认为HappyHorse高分部分源于常和老模型对战,“别太当真”。不过他也承认,仍看好其开源潜力。 另一位接近阿里的人士则反驳,“榜单不一定代表真实体验,但能让销售有底气去敲门。以前连门都进不了,现在至少能谈。” HappyHorse的核心亮点在于动作流畅、自然色彩、动态表现,还支持同步音频生成。根据天眼查综合媒体信息显示,一个打篮球的视频,球的运动物理真实性良好,脚步声、球撞击地板的声音、球鞋与地板的摩擦声与环境音同步。这种音视频天然同步的能力,正是过去一年视频模型领域最关键的技术突破之一。 但在人物细节和多镜头叙事能力上,Seedance 2.0依然保有竞争力。市面上能看到的HappyHorse实例大多是10秒左右的短片,大规模内测和产品上线的反馈,才是真正的试金石。 双线并进 开源与商业的赛马 HappyHorse的组织归属,揭示了阿里的内部布局。 今年3月成立的Alibaba Token Hub(ATH)事业群,将五条业务线纳入统一指挥:通义实验室、MaaS业务线、千问事业部、悟空事业部、AI创新事业部。HappyHorse即来自AI创新事业部,由原快手副总裁、可灵技术负责人张迪带队,张迪于2025年底回归阿里。 通义万相和HappyHorse分属两条线:万相归通义大模型事业部,走开源路线;HappyHorse主打商业场景和客户转化,目前暂未确定是否开源。 这种“双线并进”带有内部赛马色彩,但并不矛盾。万相打开源生态和技术影响力,HappyHorse则负责客户转化和收入变现。而HappyHorse的出现,可以看作阿里云MaaS战略的一个缩影。 一年半前,问任何云厂商销售MaaS能不能赚钱,答案几乎都是摇头。模型价格战把Token单价压到成本线以下,技术不成熟导致应用场景模糊。一个月消费1万元的大模型客户,体量只相当于公有云月消费1000万的客户,销售提成差了一个数量级。 阿里云、腾讯云去年甚至没把MaaS纳入考核。 转折发生在2025年下半年。Agent的爆发让Token消耗指数级增长,单次任务消耗量是传统Chatbot的100到1000倍。多模态崛起则打开了新空间——文生图、文生视频的算力消耗远高于文本,利润空间相对可观。 据吴泳铭披露:百炼MaaS平台过去三个月Token消耗增长6倍,MaaS未来将成为阿里云最大收入来源。 HappyHorse的面世,让阿里在视频生成这个最大增量市场里终于有了筹码。销售团队的商机分级随之改变:过去按金额10万、100万、1000万,现在按Token 10亿、100亿、1000亿。 尽管估算值和实际消耗有偏差,但Token成了通用语言。至少大家能对齐了。而对齐之后是定价策略的选择。如果阿里以更低价格切入视频生成市场,对字节的冲击将立竿见影。日消耗几十万元的漫剧公司,每百万Token便宜几块钱,一年下来就是可观的成本差距。 但降价也是双刃剑。阿里云近期已因全球AI需求爆发和供应链涨价,将AI算力、存储等产品最高提价34%。视频模型领域若反向操作,可能引发整体定价体系的混乱。 平头哥的底牌 自研芯片背后 涨价潮中,阿里有一张其他厂商难以复制的牌——平头哥自研GPU。 根据3月阿里财报首次披露:自研GPU规模化量产,累计出货47万枚,60%以上算力服务于外部客户,年化营收达百亿级别。4月18日的涨价名单中,平头哥“真武”系列AI算力价格上涨5%~34%。 芯片自研的意义不仅是成本可控,更是定价话语权的掌握。当全球AI算力供应链涨价,阿里云可以更有底气地调整价格,而不至于被上游绑架。 HappyHorse的出现,让这种垂直整合有了新支点。如果视频生成模型能大规模跑在平头哥芯片上,阿里将掌握从训练到推理的完整成本控制权。但产能瓶颈是现实约束。天眼查媒体综合报道显示,目前阿里云AI算力供给处于供不应求状态,部分区域行业线已提前完成2026财年销售目标。47万枚出货量“听着大,但放在全国AI算力需求里,占比还很小”,一位芯片行业人士分析。 而HappyHorse的内测和即将开放的API,将是平头哥芯片承载大规模视频生成任务的首次实战检验。效果能否兑现、客户能否留存、成本能否优化,三者环环相扣。 阿里的豪赌 身份认同与估值确认始 47%的年均复合增长率,意味着每年要新增近半个当年的阿里云。但传统云市场增速已大幅放缓,友商价格战持续施压。 更隐蔽的威胁是MaaS成为入口。客户从MaaS切入后,往往顺势采购计算、存储等基础云资源。火山引擎借此打破“难以进入客户采购名单”的困境——先通过模型服务建立关系,再向底层延展。 HappyHorse的推出,让阿里也能打这张牌。销售团队已经拉好内测客户名单,其中不乏日消费几十万级别的视频生成企业。如果这些客户能在内测中验证效果,后续的云计算、存储、大数据产品将顺理成章地跟进。 但客户迁移成本不容忽视。Seedance 2.0经过两个月积累,已在大量工作室生产流程中扎根。即便效果相当,换工具也意味着重新适应。HappyHorse能否提供足够的差异化价值,是撬动迁移的关键。 摩根大通的测算颇具诱惑:若阿里云五年实现1000亿美元收入且获得合理估值,仅云业务价值可达4000亿美元——远高于阿里当前约3000亿美元的整体市值。 在证明1000亿美元目标不只是口号外,更大的命题是身份认同。阿里究竟是“有云的电商公司”,还是“有电商的云公司”?本质上是一次科技股的身份声明。 组织层面,阿里习惯用“高目标倒逼”激活变革。“取其上者得其中”,哪怕最终未达1000亿,也可能逼出800亿的结果。 4月30日的API开放,将是HappyHorse的首次大考。是成为“Seedance杀手”,还是又一个“高开低走”的故事,市场即将给出答案。 吴泳铭在财报电话会的最后说了一句话:“我们没退路。要么冲上去,要么等着被重新定义。” HappyHorse的嘶鸣,是这声冲锋号的最新回响。但冲锋之后能否胜利,取决于那匹小马能不能真正跑起来。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。