行业分类:
加载中...
头条分类:
加载中...
刘强东后退一步,马云马化腾更近了
京东在微信“发现-购物”的一级入口,即将在9月底关闭,后续仍保留“我-服务”中的二级入口。前者曾为京东带来数亿用户以及拉动GMV的增长。 京东确认了这一消息。这意味着,京东在微信生态内不再享有入口优先权,其位置将和美团、拼多多处于同一级别。 不过,京东表示,双方并不是不合作。除了在原有的广告、会员、流量、数据等领域合作外,京东还将与腾讯探索新的合作领域。目前,腾讯持股京东约2.3%。 就在京东微信合作方式调整的同时,市场传出微信和阿里进一步互联互通的消息。 近日,有消息称,淘宝将在微信内部上线小程序;而淘宝,则向微信支付开放“免密支付”功能。截至目前,双方对此皆不予回应。 事实上,淘宝和微信早已开始互通。去年9月,淘宝接入了微信支付,尝到了互通的甜头,QuestMobile数据显示,当月淘宝应用新安装用户量同比增长55%。之后双方又进一步互通,微信端内可无跳转直接完成淘宝交易。 京东不再享有一级入口,微信和淘宝传出进一步“互通”传闻。与此同时,抖音电商则在快速扩张。 日前,抖音电商披露数据,2024年8月至2025年7月,抖音电商商品交易总额(GMV)同比增长34%,其中货架电商GMV同比增长49%。 抖音的崛起,已对传统电商形成了冲击。京东已被抖音超越,后者跻身行业第三,仅次于淘天和拼多多。抖音仍在持续狂飙,其内部早已开始对标“拼多多”;淘天也将抖音电商视为“头号竞争对手”。 显然,电商竞争进入新阶段,直播电商异军突起,传统电商被冲击,面对新的形势,巨头们不得不求变,调整合作策略,寻求增量市场。如此,淘宝和微信站在一起,也并非不可能。 十一年前,京东与微信的联姻,是重塑中国电商格局的里程碑事件。如今,这项长期合作的核心条款正在发生关键变化。 2014年,腾讯入股京东15%,并将不擅长的电商打包卖给京东;作为交换,京东获得微信及手机QQ的一级入口位置及其他支持。合作十一年,京东与腾讯各取所需。 图注:京东公告 微信流量帮京东迅速补上短板。合作两周年之际,京东宣布通过微信及手机QQ吸引了超8亿人次的访问互动。2018 年刘强东接受《财富》采访时又直言,“迄今新增用户中,约1/4来自微信”。 借助微信生态,京东市值一路上涨,险些成为继阿里、腾讯之后国内的第三大互联网公司。而腾讯也间接实现了自己的电商梦。 时至今日,京东对微信流量的依赖度仍然很高。QuestMobile数据显示,2025年8月,微信小程序占京东全域流量的43.9%,较2023年11月的42.6%仍有提升。不过,其中来自微信一级入口的流量占比多少,不得而知。 不过,与微信合作,京东付出的代价并不小。2019年,京东和腾讯续约,京东预计三年内要向腾讯支付8亿美元,包括流量、广告和会员等服务。 实际支出远超预期。根据京东财报,2019年-2021年期间,京东向腾讯购买的广告资源和支付处理服务分别达到22.22亿、32.26亿元、50.1亿元,年均增速超过40%。 图源:京东财报 这笔费用着实不小。当下的京东,正四处开辟需要长期投入的“新战场”。 今年以来,京东已开辟两大战场:进军外卖,计划投入百亿补贴;重拾酒旅,推出三年免佣金政策。同时,京东还需维持自身的价格优势;以及持续布局线下折扣超市、社区团购等业务;在投资方面,京东斥资180亿元购买海外资产,三个月投资了6家机器人公司。 这些业务大多属于长期战略,短期内还难以看到回报,无疑对京东的资金链构成了持续压力。一个明显的例子是外卖业务,京东2025年二季度业绩显示,其净利润从上年同期的126亿元跌到62亿元,同比大跌51%,外卖业务就是主因之一。 钱得花在刀刃上。外卖作为高频消费场景,已经将流量导入了京东生态。财报数据显示,京东2025年二季度活跃用户同比增长40%。刘强东也表示,来京东买餐饮外卖的消费者中40%会交叉购买电商产品。 在刘强东看来,相比去微信买流,亏损的外卖很“划算”。今年6月,刘强东讲到京东外卖业务时就说,“我们亏的钱,相比去抖音、腾讯买流量的钱还是要划算的。”言下之意,京东如今再去微信买流量,性价比不如外卖高。 在资源有限的情况下,京东进行战略优先级排序,放弃续费“微信一级入口”,也就不难理解了。 京东放弃微信一级入口,从水面上看,更多是出于财务考量。对腾讯而言,取消京东的入口“特权”,在与电商平台合作方面实现了一视同仁,这意味着腾讯在和老对手阿里“互通”上获得了更灵活的操作空间。 而这则正是水面之下的深层变局,互联网行业互联互通已成大势,平台之间的壁垒正在松动。尤其是在抖音狂飙突进的情况下,没有永久的朋友,只有永久的利益。阿里和腾讯站在一起,并非不可能。 巨头们进行战略调整的大背景是,中国电商格局发生巨变,抖音的快速崛起成为行业重要变量。 据《晚点LatePost》报道,2022 年抖音电商GMV超过1.6万亿元,仅次于淘宝、京东和拼多多。两年后,抖音以约3.5万亿元的规模超越京东,跻身行业第三,仅次于淘天(约8万亿元)和拼多多(约5.2万亿元)。 尽管抖音否认了上述数据真实性,但其增长势头不容忽视。 抖音最新披露的数据显示,2024年8月-2025年7月,抖音电商增速为34%。而据36氪此前报道,2024年抖音电商增速为30%。在电商行业增速整体放缓的情况下,抖音电商依然保持稳定增长。 更关键的是,抖音正杀入传统电商的腹地。抖音电商是靠着短视频和直播带货模式崛起的,但随着该模式增长见顶,抖音早已转向传统电商的主战场,加大对货架场景的投入。 有接近抖音人士曾表示,抖音电商计划在2025年将货架电商占比提升至50%。36氪报道称,2024年这一占比为40%。2024年8月-2025年7月,抖音货架电商GMV同比增长49%,高于电商整体增速。 这也就意味着,抖音正加速转入淘天、拼多多等传统电商的核心领域,交集越来越多,几大平台之间的直接竞争将不可避免。 面对抖音强势进攻,传统电商平台增长承压。高盛报告显示,2024年618期间,按照GMV增速来看,抖音增速超20%,淘天在10%-15%之间,拼多多为15%-20%,京东为个位数增长。 而这一趋势随着抖音的狂飙猛进,还将继续。 淘天已将抖音电商视为劲敌。据《晚点LatePost》,淘天集团在2024年初已将抖音电商列为头号竞争对手。淘天高管以包裹量举例,淘宝不仅被拼多多超越,也在被第三名的抖音逼近。 这一挑战显而易见,毕竟抖音的优势类目如美妆、服饰,皆是淘宝天猫的核心品类。2025年以来,淘天加大反攻,打起增长战役,在服饰、美妆等品类投入“不设上限”的预算。 淘宝还在直播电商方面上发力,从外部引入头部主播,完善内容生态和寻求用户增长。不过,淘宝引入许多的主播已经停播,如东方甄选早已暂停淘宝直播。 和京东一样,淘宝也通过外卖大战寻求用户增长。为此推出淘宝闪购,并将其入口放在淘宝APP内。今年8月的财报电话会上,阿里巴巴中国电商事业群CEO蒋凡表示,闪购与电商业务产生了协同效应,拉动电商增长。闪购拉动手淘8月DAU增长20%,流量上涨带来了广告和CMR上涨,并提升用户活跃度。 对拼多多而言,抖音的进攻也不容小觑,双方早已向对方的腹地进击。 拼多多早已上线直播、视频和短剧等内容,通过内容流量提升用户粘性;而抖音早已开始建立低价心智,扶持中小商家,加码招揽产业带商家。据《晚点LatePost》报道,2024年以来,抖音电商内部更多在对标拼多多。 双方在价格系统的交锋尤为激烈。例如,抖音内测“自动改价”功能,拼多多紧跟着推出“自动跟价”系统。 无论是卷直播、卷外卖,还是卷低价,平台的目的不外乎是争夺流量。特别是在电商行业增长几近天花板之下,各大平台对用户的争夺已进入白热化阶段。和传统电商平台基因不同,抖音强在内容流量,而这正是阿里、京东、拼多多们孜孜以求的。 这就要求巨头之间开放腹地,将各自的护城河放开,找到最有效的合作方式,发挥所长,实现增长。在这个背景下,月活跃用户数超过14亿的微信(包含WeChat),自然就是个香饽饽。 腾讯手上有两大利器,一是资本,二是流量。京东、拼多多的壮大,都和微信流量浇灌有关;而和腾讯关系微妙的阿里系,则一直徘徊于微信流量之外。 在互联网“拆墙”的大趋势下,巨头们纷纷敞开腹地。譬如阿里京东互相开放,京东物流进淘宝,支付宝进京东等。腾讯和阿里进一步合作,也并非没有可能。 过去几年,淘宝和微信已逐渐实现互通。去年9月,淘宝宣布接入微信支付。阿里巴巴集团副总裁吴嘉透露,接入微信支付后,淘宝天猫的年轻用户、下沉市场用户的使用频次和用户规模在迅速增长。吴嘉也透露,这是淘宝与微信合作的第一步,未来双方会加深包括流量在内的其他合作。 同年10月,互通再进一步:淘宝进入了微信生态。微信端可访问淘宝首页,同时,在微信端内可以直接打开淘宝链接完成下单及支付,无需跳转。 图注:微信内完成淘宝交易 从初步放开支付到无跳转交易,微信和淘宝试探性的“握手”已初见成效。若下一步迈向小程序合作,淘宝将交易场景更进一步植入微信,将意味着两个生态走向深层次“融合”。 融合,旨在寻求增量市场。微信和京东、微信和拼多多的合作,已经充分证明了这一点。 对淘宝而言,流量获取始终是一大挑战,而微信中则有可供淘宝挖掘的市场增量。据QuestMobile数据,微信相对淘宝的独占用户规模为2.45亿,这部分用户中,有1.9亿用户为综合电商用户,更有8610万用户属于每月使用电商40次以上的高频人次。这1.9亿人,正是淘宝可争取的潜在增量。 去年双11之际,摩根大通也在研报中指出,目前有2-3亿微信支付用户还不是淘宝用户,双方互联互通有望为淘宝带来20-30%的增量用户。 而对微信而言,与淘宝合作也有助于强化其电商心智,这对于正发力电商业务的微信来说,也很重要。小程序电商承担重担。2024年第三季度,微信小程序电商GMV达2万亿元。 今年5月,微信成立电商产品部,其负责人向微信事业群总裁张小龙汇报。淘天集团一年约8万亿元的GMV,占据国内电商市场约40%的份额,如此庞大的消费场景,无疑能为微信构建电商生态提供抓手。 目前,淘宝已经实现在微信端内无跳转交易,这也意味着,微信电商生态初步汇聚阿里、拼多多、京东这几大平台,强化其作为购物渠道的用户认知,向用户传递“在微信里也能购物”的信息。 这也符合张小龙对微信电商的想法:商品信息应该成为一个原子化交易组件,能自由地在微信里游走。 打破藩篱,拥抱合作,有利于共赢。特别是在新的竞争格局下,平台互通的意义更加深远,这是巨头们在存量竞争中重新权衡利益、寻求增量的必然选择。未来,谁更开放,谁更能融合,谁就有机会在变局中掌握主动。 参考资料: 《刘强东:外卖之争亏的钱比去抖音腾讯买流量划算》财经网科技 《京东与腾讯牵手两周年:已从微信及手Q获8亿人次互动》凤凰科技 《刘强东:微信给京东带来1/4新增用户》极客公园 《回归常识后,电商生态再迎拐点时刻》晚点LatePost 《抖音电商销售额增速首次放缓》晚点LatePost
文字秒变成片,体验完剪映这些功能:这才是 AI 时代的创作方式
最近一个月科技发布会一个接一个,我们视频同事天天加班,保证热门产品体验第一时间和大家见面。 APPSO 发现,今年视频制作有个明显变化:更炫的效果、更紧的时间。这也成了视频创作者的新烦恼,AI 作为提效的重要工具,但实际体验下来,却常常让人又爱又怕。 爱的是 AI 确实能低成本实现很多原来不敢想的特效、故事,怕的是 AI 工具功能零散、流程割裂——「用 AI 省下的时间,全都耗在了工具切换上」。 最近我发现,终于有产品下决心解决这个问题了。前几天剪映在创作者交流会上正式官宣了「All in AI, All in One」的全新主张,同时介绍了一大波 AI 功能。 从输入文字一键生成视频的「AI 文字成片」,到媲美真人的「AI 配音 3.0」;从实现电影级运镜的「AI 转场」,到能对话改图的「seedream 4.0」……剪映几乎是将 AI 武装到了牙齿。 它最核心的改变,是将过去散落在各个软件中的单点 AI 能力,串联成了一条从脚本、成片到后期精修的无缝创作闭环,实现了真正的「一站式创作」。 话不多说,这次我们就来真刀真枪地实测一下,看看剪映的 AI 能力,到底能不能让我和视频同事提前下班,拥抱国庆长假。 AI 成片,把「想法」直接变成「爆款」 熟悉视频创作的人都知道,要做一条高质量的视频必须遵循一套固定流程,找灵感、写脚本、扒素材、拍摄、剪辑、配音、配乐、加字幕……一套流程下来,没啥,就是费点肝。 现在,随着 AI 技术的进步,个人创作者或者小团队也可以做出媲美影视级的作品了,但上面这个工作流还是没变,基本每个环节都需要不同的 AI 工具。 这也成了创作流程里最「卡顿」的部分:不仅费时费力,甚至需要开多个 AI 产品的会员,在不同的产品间切来切去。 开头用到的剪映「AI 文字成片」功能,直接把这套复杂流程打包成了一站式服务。这样一来,从脚本到成片在「AI 文字成片」就可以完成了。 比如,最近预制菜风波沸沸扬扬,我和小伙伴想用容嬷嬷的毒舌吐槽一番,几分钟后就有了下面的视频。 是不是效果还不错?AI 为这个故事生成的画面、选择的声音都很切题,尤其是那个微波炉,在古风画面里也并不违和。 再比如,马上就要中秋了,我想用 AI 生成一个和赏月相关的短片。把苏轼的《记承天寺夜游》发给剪映「AI 文字成片」,让它改编成古风动画。很快,出来的效果就像语文课本里的画面活了。感觉这个功能就很适合家长或者科普创作者,做历史讲解、故事绘本都不错。 或者我在想,如果给剪映一些更有针对性的提示词,用这个功能制作一条朋友圈专属中秋祝福视频应该也不错。操作难度和现在流行的一句话 p 图没有太多差别,但却更能体现自己的创意。 说到创意,剪映「AI 文字成片」这次还帮我们实现了科幻梦。 我想把《记承天寺夜游》改编成一个科幻故事。虽然我只有一个模糊的想法,但没关系,我只要把想法、主题等碎片信息扔给 AI 成片「写作助手」,AI 成片内置的豆包 Pro 和 Deepseek 模型,直接就能输出完整脚本,不满意还能让它继续改。 你也可以在它生成的基础上自己做一些删减、修改,拿不准的地方还能让 AI 单独润色、扩写或者缩写。 解决了文案的问题,接下来就是选择画风,我根据科幻主题选择了「赛博朋克」。 这里可选的画风很多,APPSO 体验下来质感都在线,不是那种敷衍了事的「AI 滤镜」。 你还可以上传自己的图片,让 AI 学习你的风格,定制专属画风。 然后,就可以等待「AI 文字成片」这个全自动导演交付一条完整的片子了。 你可以看到,过程中它会自动理解你的文案,并生成分镜脚本。差不多几十秒的时间,所有的分镜、音频、画面都已整齐排列好。 如果你对某个分镜画面不够满意,也可以直接调整描述文字,点击图像生成,针对这个镜头生成不同的画面效果。 「AI 文字成片」还会根据脚本文案,自动选取合适的配音和配乐。当然,海量的音色库和 BGM 库也给你备好了,想怎么换就怎么换,主打一个随心所欲,还不用担心版权问题。 现在,我们来看看成片。 无论是人物的动作和表情,太空舱和中国元素的融合,完成度都非常高。不要忘了,这样的成片质量只需要花几分钟时间。 可以说,「AI 文字成片」就像是把一整个制作团队压缩到了一颗按钮里。它甚至会让人觉得「过于简单」,可我们的后期同事跟我说,这种「傻瓜式」的全包服务,对他们恰恰是一种解放。 它让你跳过了最繁琐的「从 0 到 1」阶段,直接进入需要创意和审美的「从 1 到 100」的创作环节。你负责提供灵魂,AI 负责注入血肉,这或许就是 AI 时代的创作方式。 而且,针对专业创作者,「AI 文字成片」还有其他惊喜。不同于很多 AI 生成工具只能抽卡却不能精细编辑,剪映「AI 文字成片」把生成和多轨道编辑结合,任何精细化调整,都可以直接进入「更多编辑」,自动导入多轨道,方便你进行精剪。 这也是「AI 文字成片」最值得好评的地方,不仅不用再在不同平台里来回导素材,也兼顾了粗剪和精剪的不同需求,真正实现了一站式成片。 深入工作流,AI 是无处不在的「神助攻」 如果说「AI 文字成片」是零帧起手的创作,那在处理实拍素材时, AI 更像是无处不在的「神助攻」。剪映把 AI 功能融入到了一个个具体的工序中,让视频创作的效率直接起飞。 画面方面,剪映提供了「AI 一镜到底」,一键就能实现电影级运镜。 这个功能尤其适合国庆旅游时,打造令人眼前一亮的朋友圈内容。不管是城市、村落,还是山川、海滩,AI 会智能地选取画面中适合切入切出的角度,让过渡看起来有呼吸感,把不同的景观拼成一条视觉长卷。 整体的工作流也很简单:上传自己拍摄的素材,AI 会自动识别画面结构和关键元素。接下来,你只需要确认想要衔接的位置,并从剪映提供的几种转场形式中选择最合适的。 剩下的,就交给 AI 完成,它会在两段画面之间自动生成过渡,把原本生硬的切换,润色成一个自然的长镜头。很快,一条一镜到底的风光大片就出来了。 另一个可以让 AI 转场大显身手的应用场景,是营销宣发视频的制作。 这意味着,不再需要反复拍各种角度,也不用担心后期剪辑跳跃,AI 会帮你一气呵成:从场景到产品,从人设到氛围,全都在一个顺畅的镜头里完成。专业感直接拉满,哪怕是业余卖家,也能做出不输专业广告的质感。 比如下面这个案例,在手上只有三张平面照片的情况下,也能做出大片效果吗? 完全没问题,AI 会自动识别摩天轮、旋转木马、人物三个画面里的相似色彩和结构,把原本零散的片段拼接成一个连贯的长镜头。看上去就像摄影师拿着稳定器连续拍下来的,几乎察觉不到切口。 画面顺滑了,故事才真正有了连贯感。但一条好视频远不止画面流畅这么简单,声音同样决定了整体质感。剪映在配音、音乐上的进化,正在补齐创作中另一半的拼图。 我们知道,对于很多创作者来说,录音是个大难题——要么环境嘈杂,要么状态不好,录十遍也找不到感觉。现在,利用剪映的「克隆音色」功能,你直接就能拥有一个声音分身,在不同视频里都能一键调用。 从实测来看,只要上传的音频发音清晰、匀速、没有背景噪音,就能有效保证后续生成的质量。接下来,就来看看伍佰老师魂穿《武林外传》的中秋宴,为大家带来的节日祝福—— 另一个惊艳的升级是「AI 配音 3.0」功能中的「超仿真音色」,直接把 AI 配音带入了 next-level。你仔细听听这个声音——它有呼吸声、有自然停顿、有情绪起伏,已经让人分不清这到底是真人还是还是 AI 。 而「翻唱改词」功能堪称音乐玩法里的隐藏惊喜。逻辑很直白:用户上传任意画面内容,AI 会自动理解素材,针对想用翻唱的歌曲进行改写,让歌词内容与画面场景高度贴合。 举个例子,当我们放入中秋团圆内容的片段时,《烟花易冷》的歌词便变换成了包含桂花、明月的文字,并且完全贴合旋律。 这种「以假乱真」的效果,也让创作者不再为版权头疼,节约修改成本,AI 几分钟搞定专业翻唱效果,成本降低但效率暴增。 无论是画面的流畅衔接,还是声音的细节打磨,剪映这些「ALL in AI」 的功能都在告诉创作者:制作不必再是费时费力、来回倒腾的繁琐任务。无论是画面还是声音的处理能力,剪映都能集于一处,而创作者要做的,就是把注意力放回故事与情感本身。 对于专业创作者精细剪辑的需求,剪映也没有忽视,而是依托于电脑端的「剪映专业版」 ,持续「听劝」升级,新增了多时间线、智能搜索、二级调色、立体声处理等高级功能,显著提升了素材处理与视频精修效率。 最近,剪映还全量上线了字节自研的 seedream4.0 模型,生图、做封面也能在剪映一站式完成。不难看出,剪映在功能的开发、升级上,就是奔着「ALL in One」的目标,基本创作中需要解决的问题,都能在剪映里找到对应的工具,创作的流畅性一下提升不少。 解放 Dirty Work,回归创作的初心 测到这里,其实答案已经非常清晰了。剪映所做的这一切,并非为了炫技,而是指向一个极其质朴的目标:将创作者从重复、繁琐的「dirty work」中彻底解放出来 。 无论是费时费力地找素材、对口型、扒字幕,还是令人头秃的配乐和转场,这些曾经消耗我们大量热情和精力的环节,如今都可以放心地交给 AI 。 这种「AI + 一站式」的定位,本质上是对整个创作流程的一次重构。 我甚至觉得剪映这个名字可能都不能完全反映这个产品新的价值,「All in AI, All in One」的剪映,不能再把它看做一个剪辑类产品,而是一个能覆盖全流程的 AI 创作工具。 它打破了过去 AI 工具功能零散、流程割裂的核心困境,将它们串联成一条完整的、无缝的创作管道 。AI 不再是那个需要你小心翼翼输入指令的「工具箱」,而是变成了藏在创作每一步的「默契搭档」和「隐形脚手架」。 对于像 APPSO 这样的创作者来说,它最实际的价值,就是让编导敢于写下那些曾因时间和技术限制而自我阉割的高光特效,甚至实现过去「不可能完成的工期」。 创作者交流会上,APPSO 还了解到,剪映上线了一款更加特别的产品——「剪小映」。它能自动分析你手机相册里的素材,在你都快遗忘的时候,主动为你生成一段段充满故事感的生活视频 。 如果说剪映的各种 AI 功能是让剪辑更加轻松、流畅,剪小映则代表的是一种更加智能的使用方式,过程中 AI 持续发挥作用,让轻松剪彻底升级为不用剪。它似乎在说:你只管去生活,去感受,记录这件事,交给我 。 最终,当 AI 承接了所有可以被标准化的劳动后,留给创作者的,便是最宝贵、也最无法被替代的东西——灵感、创意和情感的表达 。 从这个角度看,剪映的「All in AI, All in One」,不仅仅是一个产品主张,更是对所有创作者的一次告白:去创作吧,别让任何事分心。这,或许才是 AI 时代,创作最该有的样子。
曝顶级AI大牛,加入阿里通义!事关下一代大模型
智东西 作者 | 李水青 编辑 | 心缘 智东西9月29日消息,据“ 互联网八卦小喇叭”等媒体爆料,全球顶尖AI科学家、IEEE Fellow许主洪(Steven Hoi)已加盟阿里通义,转向通义大模型的相关研发工作。 许主洪拥有超20年AI产业和学术经验,是新加坡管理大学终身教授、曾任新加坡南洋理工大学终身副教授,在AI领域发表了300多篇顶级学术论文,论文被引用超过5万次,曾被斯坦福大学评为全球顶尖1%的AI科学家之一。 作为多模态大模型领域的领军人物,许主洪曾担任全球最大的企业软件公司Salesforce的副总裁,从零开始构建了Salesforce在亚洲的AI研究生态系统;他还于2023年创立了一家多模态AI创企HyperAGI,可以说是业内少有的产学研多栖AI大牛。 许主洪 2025年2月,许主洪加入阿里并担任阿里集团副总裁、智能信息事业群首席科学家,向智能信息事业群总裁吴嘉汇报,负责AI To C业务的多模态基础模型及智能体(Agents)研究与应用。 按原本的定位,许主洪的核心任务大概是组建顶级AI算法团队,整合通义(应用)、夸克、天猫精灵等内部资源,促进多模态交互产品迭代,加速AI To C商业化。 在今年6月的2025上海世界移动通信大会上,许主洪发表题为《多模态大模型发展与演进》的演讲,在演讲中他以夸克App的AI超级框、AI相机等功能为例讲解了多模态大模型的应用场景。 许主洪以夸克为例讲解多模态大模型应用场景 然而,在加入阿里7个多月后,许主洪传出加入通义实验室团队,这意味着他可能将从面向AI To C商业化研发转向更基础前沿的大模型研发。 如果消息属实,这意味着阿里完成了一次重大的人才重配,也标志阿里在多模态大模型研发领域再投重码。 当下,阿里通义大模型正处于“拼迭代速度”、“多模态发展”的关键阶段,十分需要许主洪这样对口的顶尖产学研多栖且有分量的AI大牛坐镇。 在9月底举办的2025云栖大会期间,阿里云智能集团首席技术官、通义实验室负责人周靖人透露,连续发布数十款模型背后有战略考量:全球AI模型进展都在加速,整个通义家族一直在跟全球AI领域的领先者进行你追我赶,AI今天已进入加速期,比拼的是模型迭代效率;同时模型从单模态到多模态的演进是必然趋势,阿里期待接下来在多模态方面还有进一步的创新和突破。 许主洪或是目前阿里最适合牵头做这件事情的人。他曾在在今年5月蚂蚁技术开放日上的演讲中提到,当下,用统一的框架做理解和生成,发展多模态大模型的一大演进趋势。但这一领域发展尚处于的初级阶段,需要实践验证。 许主洪在讲解统一多模态模型产业发展脉络 许主洪指出,统一理解与生成的多模态大模型面临众多技术挑战。在全模态交互挑战方面,当下支持音、视、图、文全模态交互的公开单模型非常少见;在理解与生成统一方面,图像和语意的理解生成统一模型鲜有出现,且理解和生成效果难以平衡。 而在6月的演讲中,许主洪也提到:“多模态Agent AI时代才刚刚开始,未来要真正达到AGI,我们还需要解决很多技术难题,包括多模态大模型的基础能力、Agent智能体的核心功能模块、数据世界的连接与操作、物理世界的交互与控制等等,都有很多的挑战,但是这也是未来多模态大模型行业的机会。” 截至目前,阿里及许主洪方未对此进行置评。
浪潮信息刷新AI推理天花板!智能体产业化竞赛给出高分答卷,8.9毫秒Token生成速度、1元/百万Token
作者 | 程茜 编辑 | 漠影 智东西9月29日报道,在9月26日的2025人工智能计算大会上,浪潮信息连破两项纪录,让智能体产业化门槛一降再降! 一个是国内大模型最快Token生成速度:基于元脑SD200超节点AI服务器,DeepSeek R1大模型Token生成速度仅需8.9毫秒;另一个是百万Token成本首次击破1元,基于其最新发布的元脑HC1000超扩展AI服务器。 而这两大突破的价值,正契合智能体商业化产业化落地的本质逻辑—— 如今,具备自主学习、决策与执行能力、能独立完成复杂任务的智能体,已成为大模型规模化落地的核心载体,其产业化比拼的正是三大核心能力:场景适配能力、交互速度、成本控制。 模型能力能否精准匹配行业真实需求、交互速度是否满足实时场景要求、Token成本能否支撑盈利闭环,最终实现从技术可用到商业可持续的跨越,成为智能体产业化的关键桎梏。 在这背后,算力体系的革新至关重要。当前GPU主导的计算模式与通用架构面临挑战,正逐渐在能效比和成本效益上触及瓶颈,因此业界亟需重新审视并设计AI计算系统,发展AI专用架构以突破瓶颈。 浪潮信息通过软硬件协同设计与深度优化,已经在持续推动AI计算架构的创新与突破上拿出了阶段性重磅成果。 一、直面智能体产业化落地挑战!浪潮信息发力底层架构革新之路 最近爆火的智能体将生成式AI的应用潜力推至新的高度,从为用户提供AI工具和助手,到多智能体协同创造价值的未来图景正在缓慢展开。 一方面,从语言到图像、音视频、3D各类模型连番刷新性能天花板,模型参数从百亿、千亿向万亿飙升,海量数据、后训练阶段算力投入的综合作用下,AI展现出通过学习人类知识具备泛化智能的“涌现”能力。 这正是智能体诞生的基础,其可以根据需求、用户预设的目标学习人类知识主动决策、规划、执行,甚至实现自主迭代进化。 另一方面DeepSeek通过算法创新降低大模型门槛,开源生态繁荣,为智能体生态繁荣奠定了基础。 这一趋势下,智能体产业化的三大核心要素被清晰推至台前:模型能力决定智能体应用上限、交互速度决定智能体产业化价值、Token成本决定智能体盈利能力。 具体来看,模型能力决定了智能体在具体场景中能解决什么问题、解决到什么程度:首先综合性能可以对标甚至超过闭源模型的开源模型是重要支撑;其次具体到不同场景,每个模型推理、交互、垂直领域知识精准度,决定其能否做到在不同场景可用。 交互速度决定智能体解决问题的速度:不同于此前用户与聊天机器人的交互场景,用户对时延的感知并不敏感,最初GPT-3.5每秒生成速度仅为40个token,彼时已经可以满足用户的阅读体验,但这放到智能体交互层面远远不够。 智能体在金融等对时延要求较高的领域,往往需要其响应速度降至毫秒级别,也就是说,即使模型能力再强,慢响应也会让其失去实用价值。 最后是成本,Token成本决定智能体盈利能力,Token成本直接对应企业的算力消耗成本,成本与定价差额决定智能体毛利率,若Token成本过高,企业也会陷入卖得越多、亏得越多的困境。 然而当下推理模型的思考过程会产生成千上万个Token,智能体在执行复杂任务的中间环节也会产生大量中间文本Token。根据Reddit的数据,当前使用AI辅助编程的开发者平均每月会消耗1千万到5亿Token,相比一年前暴涨50倍,目前企业部署一个智能体平均每月的Token成本大概是1000到5000美元。主流模型的Token成本居高不下,这对于其产业化是不小的瓶颈。 因此,随着大模型参数规模扩大、应用场景复杂化,单纯依靠堆算力、堆成本的粗放模式,已难以平衡智能体的性能、速度与盈利需求,从计算架构层面实现技术突破成为适配三大要素、推动智能体产业化落地的最优路径,这也是浪潮信息在布局的方向。 二、从速度到成本双重突破,树AI服务器性能与成本新标杆 在这样的产业背景下,浪潮信息作为全球算力基建核心供应商,其此次连破两个国内纪录的硬件产品,就是最好的例证。 首先是浪潮信息元脑SD200超节点AI服务器,在此之上DeepSeek R1的Token生成速度只需8.9毫秒,既实现国内大模型最快Token生成速度,也标志国产AI服务器Token生成速度迈入10毫秒时代。 基于其独创的多主机3D Mesh系统架构,该服务器单机实现了64路本土AI芯片的高速统一互连,单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用。 生成速度极致压缩的背后,SD200还实现了极低通信延迟、整机高可靠性设计、超线性扩展的推理性能。 SD200达到业界最低通信延迟为0.69微秒,其采用极致精简的协议栈,包括物理层、数据链路层、事务层3层,原生支持Load/Store等“内存语义”,基础通信延迟达到百纳秒级,同时Open Fabric原生支持由硬件逻辑实现的链路层重传,采用分布式、预防式的流控机制,从而实现稳定可靠通信。 为了保证整机高可靠适应超节点的大规模商业化应用,其系统硬件层面通过全铜缆电互连、短距紧耦合传输,实现每十亿小时故障率是传统光模块互连方案的1/100,基础软件层通过创新GPU故障信息转储、跨域故障关联定位等关键技术,实现全方位故障可观测、全自动故障隔离、极速故障恢复,业务软件层通过构建业务故障预测模型实现推理响应不中断。 SD200还通过面向超节点创新优化的通信库、PD分离策略、动态负载均衡等技术,将通信耗时控制在10%以内,实现了Deepseek R1 671B最高16.3倍的超线性扩展率。 与此同时,为了进一步提升SD200的易用性,浪潮信息使其兼容CUDA生态,对PyTorch算子全覆盖,一键迁移典型应用等。 此外,基于多元开放的超节点计算平台、异构融合的软件栈,浪潮信息还将与生态合作伙伴共同构建全场景智能体应用,共同塑造超节点智算应用“北京方案”。 其次是元脑HC1000超扩展AI服务器,推理成本首次击破1元/每百万Token。 浪潮信息首席AI战略官刘军透露,全面优化降本和软硬协同增效是HC1000实现百万Token 1元成本高效生产力的关键路径。其核心是浪潮信息创新设计的DirectCom极速架构以及全对称系统拓扑设计。 DirectCom架构每计算模组配置16颗AIPU,实现单卡成本降低60%以上,每卡分摊系统成本降低50%,其采用直达通信设计、计算通信1:1均衡配比,实现全局无阻塞通信;全对称系统拓扑设计支持灵活的PD分离、AF分离方案,最大化资源利用率。 HC1000还支持超大规模无损扩展,实现从1024卡到52万卡的不同规模系统构建,计算侧通过DirectCom和智能保序机制,网络侧支持包喷洒动态路由,深度算网协同实现推理性能相比传统RoCE提升1.75倍。 这两大硬件一方面拉高交互速度保障实时场景响应效率;另一方面推动Token成本持续触底,为智能体规模化落地提供关键硬件支撑。 三、浪潮信息的算力前瞻逻辑:跟随应用、算法发展布局 当我们剖析浪潮信息两大硬件背后的黑科技会发现,其核心底座是底层基础设施在系统架构、互联协议、软件框架等关键点上进行的协同创新。 智能体产业化已成为行业共识,全球知名市研机构IDC的报告预测,中国企业级智能体应用市场规模在2028年保守估计将超过270亿美元。 然而当前以GPU为核心的计算模式与通用计算架构正面临严峻挑战。 一方面,通用计算架构的优势在于其广泛的场景兼容性,但其痛点是为适配多元需求而预留的冗余设计,往往导致特定场景下算力效率难以突破;另一方面,专用架构聚焦单一领域的性能极致优化,像为AI训练量身打造的等,受限于应用场景的狭窄性,难以形成跨领域的生态规模。 综合来看,计算产业的每一次跨越式发展,本质上都是在通用架构的普适性与专用架构的高效性之间寻找动态平衡,使其在场景需求、技术迭代等方面实现互补,契合当下的产业发展需求。 因此,这一时间节点,随着AI计算需求呈指数级增长,行业亟需全面转向效率导向,重新审视并重构AI计算系统。 我们可以从浪潮信息的布局中,观察到其对计算架构底层创新的诸多思考。 刘军透露,他们追求计算架构创新的原则是跟随应用和算法发展的方向,以应用为导向、以系统为核心,才是进行计算架构创新的有效路径。 具体来看,此次浪潮信息的SD200和HC1000针对的是两个典型场景。 SD200面向对延迟要求敏感的商业场景,HC1000面向的是云计算、互联网、大规模AI服务提供商,这些企业需要为客户的智能体应用提供成本更优的计算基础设施。 今年智能体刚刚起步,面向未来,其产业化落地必然会助推AI算力持续高速增长,仍有三大挑战并存。 首先是系统规模扩展接近工程极限,智能体对多模态交互、实时推理的需求,推动算力集群向更大规模、更高互联效率演进,但硬件与网络的物理限制日益凸显; 其次是算力大规模增长对电力基础设施带来挑战,智能体的高并发交互带来算力功耗的指数级增长,单个智算中心的电力需求已达数吉瓦级别; 最后是算力投入和产出失衡,商业兑现进程缓慢,智能体产业化仍处于高投入、低回报阶段,其面临GPU利用率低、尚未形成成熟盈利模式等困境。 这也进一步印证了,效率导向的重要性。刘军补充说,智能体时代加速发展,从人机交互到机机交互,都意味着思考问题的角度要随之变化。当下应从规模导向转向效率导向,采用算法硬件化的专用计算架构,探索开发大模型芯片,实现软硬件深度优化,是未来的发展方向。 结语:大模型重塑AI生态,算力革命紧随其后 大模型发展日新月异,从唯参数论到应用落地,推理需求增长、智能体出现等,其对底层算力玩家提出的需求也在发生变化。 因此企业在应对AI算力挑战时,不能仅停留在解决当下的性能瓶颈与资源紧张等表层痛点,更需穿透问题表象,深挖制约算力效率提升与规模化应用的核心桎梏,在此基础上,浪潮信息通过前瞻性视角布局技术与架构创新,为未来AI规模化落地筑牢技术根基。
OPPO Find X9 Pro手机核心规格公布:6.78英寸1.5K OLED直屏
IT之家 9 月 29 日消息,OPPO Find X9 系列手机将于 10 月 16 日的新品发布会上正式亮相,号称“移动影像画质革命”。目前博主 @数码闲聊站 已公布其中 Pro 机型手机的核心参数,IT之家整理如下。 据介绍,该机厚度 8.25mm,重量 224g±,将搭载一块 6.78 英寸 1.5K 分辨率 LTPO TM OLED 直屏,采用极窄四等边大 R 角设计,前置 50Mp 自拍摄像头;后置 50Mp LYT828 主摄 + 50Mp 超广角 + 200Mp HP5 F2.1 潜望镜 + 2Mp 多光谱镜头,支持长焦微距。 该机搭载天玑 9500 处理器,内置 7500mAh 电池,支持 80W 有线充电和 50W 无线充电,拥有 IP66 / IP68 / IP69,同时提供 0816 增强版马达、外挂哈苏增距镜、匹配 3D 超声波指纹等特性。 IT之家另附官方此前预热 OPPO Find X9 系列手机影像技术提前解锁的重点内容如下: IT之家附 OPPO Find X9 系列手机影像技术提前解锁的重点内容如下: 五大影像技术 光学技术:AOA 主动光学校准,光学解析力再进一步 色彩技术:丹霞色彩还原镜头,第四代引领照片视频通吃 感光技术:瞬时三曝光,满血版 LYT-828 算法技术:LUMO 超像素引擎并行异构计算,直出高画质 芯片技术:全球首发 OPPO 芯链,3nm 算力全面释放 三大超清画质体验 行业首个「哈苏真 2 亿」直出画质:16 倍解析力提升、哈苏自然色彩、ProXDR 全系支持全焦段「哈苏 8K 超清照片」:4 倍解析力提升、哈苏自然色彩、ProXDR 全球首发「4K 超清实况照片」直出、小红书分享显示全链路:4 倍解析力提升、哈苏自然色彩、ProXDR 哈苏完整体合作升级 光学技术联合研发:哈苏超清四摄系统、哈苏 2 亿超清镜头 专业配件联合研发:OPPO 哈苏专业影像套装、OPPO 哈苏专业增距镜 哈苏体验全面升级:新一代 XPAN 模式、哈苏大师模式 安卓视频体验升级 4K 120fps 杜比视界 HDR:5 倍丝滑慢放、人像肤色保护 4K 120fps 10bit Log:ACES 认证、Rec.709 色彩监看 哈苏大师影调:Log 管线录制、哈苏色彩风格
全球容量最大!中国超重力场大科学装置核心设备正式启动,可实现“时空压缩”效应
IT之家 9 月 29 日消息,据新华社报道,今日,位于浙江杭州的国家重大科技基础设施 —— 超重力离心模拟与实验装置启动了首台离心机主机。这一设施将为科研提供超过地球重力千百倍的“超重力场”,实现“时空压缩”效应,为众多研究领域提供关键支撑。 超重力离心模拟与实验装置由浙江大学牵头建设,包含三台离心机主机以及六座实验舱的 18 台机载装置。本次启动的首台离心机“CHIEF1300”容量为 1300g・t(重力加速度・吨),是目前世界上容量最大的离心机。此外,容量为 1500g・t 和 1900g・t 的两台离心机“CHIEF1500”和“CHIEF1900”也在紧锣密鼓地安装建设中。 据IT之家了解,超重力场是指超过地球重力场加速度(约为 9.8 米 / 平方秒)的重力场。超重力离心模拟与实验装置的离心机主机可产生最大达到常重力 1500 倍的超重力场。在超重力场中,科研人员能够在实验室中以很小的尺寸、极短的时间再现真实世界中的重大灾难、地质演化和极端环境。例如,在 100 倍常重力的实验中,100 米的真实物体可以“缩尺”至 1 米,100 年的污染物迁移过程可以“缩时”至 3.65 天。这种“时空压缩”效应将为国家重大科技任务开展、重大工程新技术研发和验证、物质科学前沿发展等方面提供关键支撑。 “CHIEF1300”的主机室是一间占地约 230 平方米的圆形地下室,位于中央的离心机像是一个能够高速“自转”的巨型“天平”。工作时,半径长约 6.4 米的转臂带动实验装置高速旋转,速度越快,离心力越大,当离心加速度超过地球常重力,就形成超重力场。目前,该离心机的超重力场已调试运转至验收指标,可实现常重力的 10 倍到 300 倍。为了提供丰富且稳定的超重力环境,支持不同学科的需求,该装置采取了深基坑、低气压机室、液冷壁技术等一系列方案,保障主机的高质量运行。 超重力离心模拟与实验装置是将超重力场与极端环境叠加一体的大型复杂科学实验设施,18 台机载装置覆盖深海深地资源开发、防灾减灾、废弃物地下处置、新材料制备等多个领域。在一系列预研实验中,研究人员已取得诸多成果:在深海高压温控实验装置中,复现 2000 米深海的水压,试验深海海床中可燃冰开采的安全性;在超重力振动台中,模拟强震的地质危害,验证水电站坝基的抗强震设计;在造波、造啸及重力流实验装置中,推演 4 米高浪、20 米海啸与海床的互相作用,为海上风电场选址提供参考;在超重力定向熔铸炉中,制备高铁接触网导线材料,具有缺陷少、强度高、延伸率大等性能。 超重力离心模拟与实验装置首席科学家、中国科学院院士、浙江大学教授陈云敏表示,超重力的世界非常精彩,该装置将致力于构建开放共享的国际前沿科研平台,期待与全球顶尖科研力量与团队开展合作,为全球科学研究的持续进步与创新发展注入动力。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。