行业分类:
加载中...
头条分类:
加载中...
小米突然改名!雷军闯了大祸
作者 | 刘三关 来源 | 公关头条(ID:PR_toutiao) “直接改 18 多好,还能比苹果领先一代” “不是说小米产品不好,是感觉硬蹭热度,东西还是16的东西,变化不会很大。” 9月15日,小米17系列官宣的相关话题下,类似的调侃多不胜数; #小米16改名小米17 的话题,阅读量更是高达惊人的2.1亿,小米这场“跳代”大戏,热度爆表。 从一个月前高调预热“小米16”,到突然官宣跳过16用17,再到产品序列照搬苹果的标准版 + Pro+Pro Max; 雷军口中的产品力跨代升级,在很多网友看来,更像一场盯着苹果的“碰瓷”。 改个名字 为何招致网友群嘲? 小米16的预热,从上个月已经开始了。 8月17日,小米集团总裁卢伟冰发布视频,称小米16无论是产品定位,还是产品定义,都会有非常大的变化,很快将会跟大家见面; 此外,8月30日,卢伟冰表示小米下一代旗舰将搭载澎湃OS 3正式版,引发机圈的骚动。 紧接着,数码博主不断爆料,“副屏功能有望超越灵动岛”、“手感压过iPhone 15”... 当时,行业普遍认为,这款旗舰机会成为小米16年发展的标志性产品。 结果,米粉们等来的,却是官宣的16改名17;连 “Pro Max” 的后缀都莫名其妙地沿袭苹果的套路。 而雷总所谓的“跨代升级”,也让米粉们有些失望。 全球首发的骁龙 8E Gen5,是高通常规迭代芯片,性能提升没超10%; Pro 版新增的可操作背屏,友商去年就玩过; 被寄予厚望的玄戒自研芯片,这次在小米17系列连影子都没有。 说白了,这些升级对于一台旗舰机型来说,就是常规优化,把换编号说成跨代,未免有点敷衍。 其他品牌对苹果的狙击,往往会抓某一个重点: 华为攻鸿蒙生态,荣耀啃影像技术,OPPO、vivo 探折叠屏形态;一般品牌不明说,消费者也是看破不说破。 但小米把对标说了出来,虽说确实够真实,但苹果似乎没把这场自嗨式的数字游戏当回事,没给出回应。 社媒上,老米粉的落差最真实,颇有怒其不争的意味: “贴苹果营销太过刻意,有点掉价” “小米17这块外屏。对小米而言也算不上增加很多开发工作量,其本质上就跟很多折叠屏手机的外屏一样” 这种情绪并非偶然,小米8当年跳过数字7,是因为恰逢上市暨成立8周年,有明确的纪念意义。 而这次跳过16毫无征兆,纯粹为了对齐苹果编号,难免让米粉觉得“为了蹭热度丢了初心”。 小米1靠1999元击穿价格壁垒,是打破规则的革命者; 如今市值千亿,却在编号上追着苹果跑,那些“为发烧而生”的锐气,难道已经被磨没了? 对比小米汽车 小米手机为何“越活越回去”? 有意思的是,小米汽车的“硬气”,手机部门却偏偏学不会。 今年1月份,焕新版Model Y登场,特斯拉在其官方公众号向国产品牌宣战:“尽管对比”; 雷军大方迎战:“好的”,网上欢呼声一片。 彼时,却没人说小米 “蹭特斯拉”; 原因很简单,Model Y是中高端新能源的基准线;雷军敢接下这张战书,绝非空喊口号,而是小米汽车用产品力硬指标撑起来的。 SU7后驱版零百加速5.2秒,续航超650公里,对比同价位 Model Y(零百5.9秒,续航555 公里),核心性能直接领先。 销量才是最有说服力的证据。今年8月,小米 SU7 单月销量近2万辆,稳居中高端纯电 SUV 销量第一梯队;更靠近高端的SUV——小米YU7,环比暴涨173.88%,第一次贡献了近半数销量。 小米汽车不仅在“对标特斯拉”的市场站稳了脚,还能向上穿透高端市场,形成“高低通吃” 的产品矩阵,这正是它硬气的根本。 反观手机部门,五年砸千亿研发,未来还要加投到 2000 亿——这个规模,已经足够支撑起多条核心技术的研发线了。 从这次改名来看,所谓的高端化,似乎还没找到大的突破点;跟着苹果改名,难免令人觉得小米依然在追随苹果。 其实,追随本身不可怕。 华为早年也对标过 iPhone,但最终靠麒麟芯片、鸿蒙系统活成了让苹果警惕的对手; 怕的是追随的路上迷失自己。 小米研发出的技术成果,本该是“不蹭的底气”,结果却用来给 改型号做铺垫,这是最可惜的。 数字是虚的 口碑是实的 当然,小米这次急着改名,根本原因还是iPhone 17太恐怖了。 9月12日,iPhone 17 开启预售,京东一分钟内的成交量超过去年全天,256GB版本直接卖爆; 在拼多多等渠道,还有千元级补贴,一套组合拳打得很多安卓旗舰措手不及。 面对这样的对手,小米想提前卡位迎战可以理解。但单纯改名、硬蹭编号,绝非良策。 小米真要拼,就该把“跨代升级”做实,在性能方面拿出真硬货,哪怕只是一两个长板做到极致,也比改个数字更有说服力。 事实上,小米的基本盘并不弱。 历代机型积累的口碑、庞大的线下渠道、完善的生态链布局… 这些都是实打实的底气。如果产品真有跨越式进步,哪怕仍然叫小米16,也绝对不虚iPhone17。 可偏偏,小米选择了最取巧也最易引发争议的方式,结果没让人看到迎战的底气,反倒暴露出一丝慌乱。 这种慌乱,有时候比销量暂时落后更可怕。因为它动摇的是用户信任: 一个连自己的产品节奏和命名战略都守不住的品牌,怎么留住用户的心? 希望这场跳代风波之后,小米能真正放下“苹果依赖症”,把那些真金白银的研发投入,转化成敢为人先的产品; 而不只是跟在别人身后,改一个数字。
摩根士丹利:AI四大催化剂重塑明年互联网格局,巨头中最看好亚马逊、Meta、谷歌
摩根士丹利在最新报告中指出,四项关键的生成式AI(GenAI)催化剂——模型进步、代理式体验、资本支出和定制芯片——正在重塑互联网行业格局。 追风交易台消息,摩根士丹利分析师Brian Nowak在9月16日发布的报告中表示,领先AI模型的持续突破、旨在自动完成任务的“代理式”(agentic)AI体验的普及,正推动行业进入新的增长阶段。这些技术进步不仅会提升用户体验,还将进一步推动消费者支出的数字化。 为支持这一轮技术革命,科技巨头正以前所未有的规模进行投资。该行预测,六大主要科技公司的总资本支出将在2026年达到约5050亿美元,并在2027年进一步增至5860亿美元,这将对公司的自由现金流构成压力,但也为未来的增长奠定了基础。 基于对这些趋势的分析,摩根士丹利在大型科技股中明确了其未来12个月的偏好顺序,依次为亚马逊、Meta和谷歌。该行认为,这三家公司有能力利用AI催化剂来巩固其市场地位并创造新的收入来源。 四大宏观AI催化剂 摩根士丹利认为,未来几年互联网行业的表现将主要由四股宏观AI力量驱动: 模型开发加速:报告预计,顶尖AI模型将继续、甚至加速改进。充足的资本、不断提升的芯片算力以及在代理式能力开发方面的巨大空间,都将推动OpenAI、谷歌、Meta等公司发布新一代更强大的模型。 代理式体验普及:代理式AI产品能够提供更个性化、互动和全面的消费体验,将进一步促进消费者钱包的数字化。要实现大规模应用,仍需克服算力容量、推理能力和交易流程顺畅性等障碍。 资本支出激增:报告预计,到2026年,六大巨头(亚马逊、谷歌、Meta、微软、甲骨文、CoreWeave)在数据中心上的资本支出总额将达5050亿美元,同比增长24%。该行指出,每建设一座吉瓦(GW)级数据中心仍需约400-500亿美元的资本支出。 定制芯片重要性提升:报告认为,第三方公司对谷歌TPU和亚马逊Trainium等定制ASIC芯片进行测试和采用的可能性正在增加。尽管英伟达的软件生态系统构成了一定壁垒,但成本效益和产能限制将促使客户寻求ASIC解决方案,尤其是在推理工作负载方面。摩根士丹利指出,谷歌和亚马逊若能在此领域取得进展,将完全是其当前估值之外的上行空间。 资本支出激增,挤压自由现金流 巨额的资本支出是科技巨头们为AI未来下的重注,但也直接影响其财务状况。摩根士丹利的模型显示,从2024年到2027年,六大科技巨头的资本支出预计将以34%的复合年增长率增长。 报告测算,这种规模的投资将显著影响公司的自由现金流。到2026年,谷歌、Meta和亚马逊的基建资本支出预计将分别占其税前自由现金流(FCF)的约57%、73%和78%。这表明,为了在AI竞赛中保持领先,这些公司愿意牺牲短期盈利能力,以换取长期的技术和市场优势。 亚马逊:AWS加速与零售利润率改善 亚马逊是摩根士丹利在大型科技股中的首选,目标价300美元,评级为“增持”。其看涨逻辑主要基于两大支柱:AWS业务的再加速和北美零售业务利润率的持续改善。 对于AWS,报告分析了其数据中心建设步伐,预计2025年和2026年将新增大量数据中心面积,这为2026年实现20%以上的收入增长提供了物理基础,高于该行目前19%的基础预测。 在零售业务方面,报告指出,亚马逊北美零售业务的利润率仍有显著提升空间。截至2025年第二季度,该业务利润率为-1%,远低于2018年约1%的水平。摩根士丹利的基础模型预计到2028年才能恢复至2018年水平,这意味着其2026/2027年每股收益预测存在进一步上调的可能。 Meta:核心业务改进与“看涨期权” 摩根士丹利同样维持对Meta的“增持”评级,目标价850美元。该行认为,投资者应关注其核心平台的改进、下一代Llama模型的发布以及多个未被充分定价的“看涨期权”。 报告称,Meta利用GPU驱动其核心广告业务的改进,仍有巨大空间来提升用户参与度和变现能力。同时,市场期待该公司在2026年初发布经过充分测试和改进的下一代Llama模型。 此外,Meta AI搜索、商业消息(Business Messaging)等新业务是重要的长期增长驱动力。摩根士丹利测算,仅Meta AI搜索一项,到2028年就可能创造约220亿美元的年收入机会。调查数据还显示,尽管Meta AI发布时间较晚,其用户采用率已迅速追平ChatGPT和谷歌的Gemini。 谷歌:搜索创新与云增长前景 摩根士丹利维持对谷歌的“增持”评级,目标价210美元。该行关注三大核心议题:AI驱动的搜索增长、用户商业行为的潜在转移以及谷歌云(GCP)的增长。 报告指出,谷歌在AI Overviews、AI Mode等方面的创新有望推动搜索收入加速增长,其预测2025年下半年和2026年的搜索收入增速分别为12%和9%。摩根士丹利的调查数据显示,在产品研究和比价等商业行为上,谷歌依然是消费者的首选平台,领先于亚马逊及其他竞争者。 在云业务方面,谷歌的Gemini模型和TPU芯片被视为推动GCP增长的关键。报告提到,Meta等公司已与GCP签订合作关系,这有望为谷歌2026年的云业务增长贡献约300个基点。该行认为,市场尚未充分计价谷歌在定制芯片方面的优势,这构成了潜在的上行催化剂。
迪士尼环球华纳齐告MiniMax,AI版权问题又添新官司
MiniMax被盯上了。 据路透社、彭博社等多家媒体报道,当地时间9月16日周二,三家娱乐公司——迪士尼、康卡斯特旗下环球影业、华纳兄弟探索——联手起诉MiniMax,指控其侵犯知识产权,案件已由加州中区法院受理。 根据起诉书,三大片商对MiniMax的指控有至少两个关键点: ·用户仅需简单指令,就可以让“Hailuo AI”生成知名角色,如小黄人、蜘蛛侠、神奇女侠等;(注:Hailuo AI为国际版,中文版本为“海螺AI”。) ·利用著名版权角色营销自己的AI服务,以“口袋里的好莱坞”作为宣传点。 目前,三家公司通过Variety等媒体发布了联合声明,证实了该法律行动。字母榜向MiniMax方求证,对方表示“无可奉告”。 这已经不是迪士尼等娱乐公司第一次对AI公司“出手”。 就在今年6月,迪士尼还联手环球影业将AI图像(核心业务)公司Midjourney告上法庭,指控其提供未经授权的人工智能生成的版权作品副本。华纳兄弟探索公司本月早些时候也起诉了 Midjourney ,与迪士尼和华纳兄弟探索公司的指控如出一辙。 在更广泛的视角来看,版权问题一直是AI行业的一个老大难问题。就在本月,另一家AI明星公司Anthropic被多名作家集体起诉的案件有了最新进展,尽管Anthropic方面提出了15亿美元的巨额和解金,但法官尚未批准。 除此之外,OpenAI、微软、Meta等知名AI公司都卷入过类似版权诉讼,还有一些侵权争议未走上法庭但是引起舆论争议。而涉及版权的内容不仅有图像,还有文字、视频和音频等。 AI公司不一定会在此类诉讼中败诉,今年Meta就曾以“合理使用(Fair Use)”胜诉,此外AI公司也可以通过和解,或者收购、合作等商业行为规避风险。 很明显,AI版权问题到底该如何定性、如何解决,没有人有确定的答案,大家还在拉扯中试图达成某种共识。 01 这次针对MiniMax的起诉阵容堪称“豪华”。 说迪士尼、环球影业、华纳兄弟探索可能没有实感,实际上,在起诉书中,原告有长长一串。因为这些片商的版权相对分散,集团下还有很多子公司。如迪士尼的漫威、卢卡斯、二十世纪福克斯、环球的梦工厂、华纳兄弟的DC漫画等,通通在原告之列。 起诉书有足足119页,各工作室提供了多例MiniMax涉嫌侵权的例子,并附上了图片。 比如,起诉书中称:“如果MiniMax订阅用户提交一个简单的文本提示,请求角色达斯·维达在特定场景中或执行特定动作,MiniMax就会生成并显示高质量的可下载图片和视频,其中包含迪士尼受版权保护的达斯·维达(以及MiniMax Hailuo品牌)。” 除此之外,起诉书中还举例了华纳兄弟(DC漫画)的版权角色“神奇女侠”以及环球影业的版权角色“小黄人”,Hailuo AI的用户同样可以用简单指令生成其相关图片。 起诉书中还写道,除了用户可以通过文字指令生成版权角色图像之外,“MiniMax 未经授权复制并使用原告所拥有版权的角色来为其Hailuo AI视频服务做广告和推广,向美国消费者进行宣传”。 其举例称,“Hailuo AI官方Instagram账号”曾“展示一张侵犯版权的华纳兄弟探索公司(Warner Bros. Discovery)旗下小丑(Joker)角色的图像。” 而在起诉书开头就写道,MiniMax将Hailuo AI 宣传为“你口袋里的好莱坞工作室”。需要指明的是,起诉书中并未具体列举MiniMax在何处以何种形式如是表达。 此次诉讼,原告的诉求是让MiniMax交出因侵权所得利润,并赔偿原告损失;或者由原告选择,按《美国版权法》规定对每一项被侵权作品判处最高15万美元的法定赔偿金,或法院认为适当的其他金额。 此外,原告还请求法院颁布禁令,禁止MiniMax继续通过其Hailuo AI服务复制、展示或分发这些受版权保护的作品,并要求其承担律师费、诉讼费用及其他法院认为适当的费用。 02 MiniMax目前尚未针对此事做出回应。 MiniMax成立于2022年初(据官网),后跻身“AI六小虎”之列,其他五家分别是智谱AI、百川智能、阶跃星辰、月之暗面、零一万物。 MiniMax自主研发了多模态的通用大模型,其中包括国内首个将Linear Attention架构与MoE结合的开源模型MiniMax-01系列、语音&音乐大模型、图像大模型以及视频大模型。基于不同模态的通用大模型,MiniMax推出海螺AI、星野等原生应用。 这家公司也是较早走向国际的中国AI初创企业,据官网介绍,MiniMax的自研多模态模型及AI原生应用已累计为来自超过200个国家及地区的逾 1.57亿名个人用户,以及来自超过90个国家及地区的50,000余名企业客户以及开发者提供服务。 不管怎样,这次的诉讼对MiniMax来说不是一个好消息。 这也已经不是美国娱乐帝国第一次针对AI公司发起法律诉讼,就在今年7月,迪士尼(连同其子公司漫威、卢卡斯影业、二十世纪福克斯)与环球影业(连同其子公司梦工厂)联手,同样在美国加州中区法院对AI图像生成初创公司Midjourney提起了版权侵权诉讼。 他们指控Midjourney不仅使用其版权作品来训练和开发自家的AI图像生成工具,还用AI工具进一步生成和公开展示相关“复制品”,且未能采取版权保护措施来防止或限制这种侵权输出行为。 值得注意的是,这起诉讼更加强调AI企业在“输出端”的责任,而不仅仅是在“输入端”即模型训练时的版权问题。 而且相比于OpenAI、微软、Meta等巨头相比,不管是Midjourney还是MiniMax,都属于在业内重要但规模并非庞大的初创玩家。 以上两点是针对AI公司的版权诉讼的一个趋势,即这类诉讼着眼的范围和针对的对象更加广泛。 03 自2022年底ChatGPT诞生以来,这波AI浪潮当中一直伴随着传统内容方和AI公司之间的拉扯。 AI生成图像/视频的侵权诉讼之外,还有针对文本、音频等多种内容形式的法律战。 早在2023年初,就已经有Stability AI、Midjourney等AI图像生成公司被艺术家起诉,指控其用版权图像训练。 ChatGPT背后的OpenAI也早在2023年6月就被作者集体起诉,称其使用盗版书籍训练大模型。而在同年年底,《纽约时报》起诉OpenAI和微软未经授权使用其数百万篇文章训练,甚至绕过“付费墙”给用户提供版权内容,该案是生成式AI版权战中的标志性事件,引发多家媒体跟进。 这个官司到现在都还在打,而OpenAI也没闲着。 在法庭上,OpenAI主张“合理使用(Fair Use)”;在法庭外,OpenAI开始和媒体集团达成合作,如以2.5亿美元的价格获得新闻集团News Corp的新闻档案和当前内容来训练和提升其AI模型,而该集团旗下有美国华尔街日报、巴伦周刊、纽约邮报以及英国泰晤士报等诸多知名媒体。 非营利版权组织Copyright Alliance的报告显示,在美国,过去几年已提起超过50起AI侵权诉讼,其中仍活跃的案件超过30起。 其他财力雄厚的公司也在效仿这一做法,如Meta、微软都已经和与一些内容方(包括出版商、音乐公司和创作者)达成了合作协议,只是规模有所不同。 “合理使用”是AI公司面对此类诉讼的一个典型辩护,但是究竟这种辩护能否奏效,目前在美国还没有共识,不同法官可能给出不同的判断。 就在本月初,Anthropic的一起相关案件有了关键进展。 这起诉讼开始于2024年,三名作家集体起诉Anthropic,指控其非法从盗版网站(如LibGen和PiLiMi)下载超过700万本受版权保护的书籍,用于训练其Claude AI聊天机器人。 今年6月,负责该案的法官裁定,Anthropic合法购买书籍并数字化用于AI训练属于“合理使用”(fair use),但从盗版来源下载是非法的。 所以,该案的主要问题聚焦在了“下载盗版书籍”并使用上。最近,Anthropic已经提出了15亿美元和解,这个数字美国版权史上最大的公开和解记录。但是目前法官只是初步认可了和解,但是对于金额和方案还未点头,并要求Anthropic提交“列表”,以做进一步判断。 而Meta则有一起非常类似的案子,也是几名作家告其下载了超过18万份盗版书训练模型。但是今年6月,负责此案的法官驳回了原告的版权侵权指控,认定Meta使用书籍训练AI不构成侵权。法官强调,“训练AI模型的目的是创建新系统,而非复制作品”,因此是合法的,而且还裁定下载盗版不影响“合理使用”,豁免了盗版下载。 由此可见,类似的案件,在不同的地区和法官手中,相似的辩护策略,也可能拿到不同的结果。Meta大胜,给其他AI公司提供了参考,但谁也不能保证成功。 AI发展到2025年,版权问题仍未形成共识,每一起诉讼,都难以猜测结果如何。
真实、残酷的AI就业冲击——从一篇极其精彩的哈佛论文聊起
后台不少读者朋友给我留言,说能不能聊聊AI抢工作这件事。 这其实也反应了一种普遍的焦虑情绪,即大家隐约感觉AI会对工作造成冲击。 但它具体是怎么把一个办公室白领的饭碗给干掉的,很多人并没有真实的体感。 最近我在Twitter上看到了一篇非常精彩的论文,它全局、真切地研究了AI对工作的冲击。 我看了非常有感触,也分享给卫夕指北的读者。 论文来自哈佛大学,由两位经济学博士生Seyed M. Hosseini和Guy Lichtinger操刀。 而他们的导师是劳动经济学的重量级大咖拉里·卡茨(Larry Katz)。 因此,论文是严谨而有分量滴。 论文没有任何情绪渲染,就是用冰冷、庞大的真实数据,剖析了2023年以来美国就业市场的AI冲击具体是如何发生的—— 1 作为读研的时候也被写经济学论文折磨过的学术逃兵,在我看来,这篇论文很厉害的地方不是结论。 而是它抽丝剥茧的行文方式:一个问题扣着一个问题,一个结论跟着一个结论—— 先来看第一个问题,AI是不是真的在冲击就业市场? 这东西不能靠感觉,经济学研究要的是数据。 两位作者的第一步,就是把美国劳动力市场的数据给搬出来,不是总体数据,而是几乎是全量的原始数据。 他们拿到了一个非常牛X的数据集(不知道怎么搞到的,差不多相当于Boss直聘的后台全部数据),来自一家叫Revelio Labs的公司基于LinkedIn的招聘信息收集。 这个数据集包括285,000家招聘的公司,覆盖6200万打工人的简历,超过1.5亿次的招聘记录。 美国总共也就3.4亿人,所以,除掉老人和小孩,真正工作的人很大比例其实都包括在这个数据集里了。 结果一出来,一个清晰的剪刀差出现了—— 从2015年到2022年中,研究的目标公司数据集中,初级岗位(Junior-level)和高级岗位(Senior-level)的就业增长曲线,基本上是手拉手一起走的。 但从2022年中开始,风云突变,高级岗位的就业人数还在昂首向上,而初级岗位的增长开始停滞,到了2023年中,甚至掉头向下了。 两条线从此分道扬镳,一个往上,一个往下。 这就有意思了。 整个经济大环境没出大问题,为什么偏偏是年轻人的饭碗、入门级的工作,突然就不香了? 会不会是AI的原因呢,毕竟,ChatGPT是在2022年底发布的,正好和这个剪刀差出现的时间点完美契合。 2 那怎么证明呢? 转折发生的时间点和AI出现的时间点差不多,这叫相关性,不叫因果性。 万一是别的因素呢?比如经济不确定性,或者疫情后的结构调整? 要锁定原因就是AI,得找到更直接的证据。 这篇文章设计了一个非常巧妙的策略,他们用了一个叫做DiD的方法(Difference-in-Differences, DiD)的方法。 简单地说,就是要应用AB测试的方法,找到找到用AI和没用AI的的两组公司。 但问题是,一家公司用没用AI,如何确定? 总不能挨家挨户去问CEO吧?就算你问了,他说的也未必是实话。 两位作者想出了一个极其聪明的办法—— 他们不去问你用没用AI,而是去看你招不招一类特定的人。 这类人,他们称之为“AI Integrator”。 什么意思? 就是其他都是假的,但招聘数据骗不了人: 如果一家公司招聘岗位描述和工作职责描述中有LLM、Prompt Engineer、GenAI等和大模型生成式AI相关的内容,那说明这家公司是真的在用AI搞生产力了。 这样的公司有多少呢? 作者在全量数据集中找出了10.6 万家,约占所有公司比例为3.7%,且从 2023 年第一季度开始急剧增加。 于是,使用AI的实验组有了,而其他所有公司,自然就是对照组。 3 两组公司一分好,好戏就开场了 作者们对比了这两组公司在2023年第一季度(也就是AI爆发后)前后的初级岗位招聘数量变化,结果令人震惊—— 在AI爆发后,AI采纳者公司的初级岗位就业人数,相对于对照组公司,出现了断崖式的下跌。 在AI扩散的六个季度后,这个差距拉大到了7.7%。 与此同时,高级岗位的就业在这两组公司里并没有出现这种差异,甚至AI采纳者公司的高级岗位增长还更强劲。 到这里,证据链就非常完整了—— 在同一个经济环境里,那些深度拥抱AI的公司,恰恰就是那些对年轻人关上大门的公司。 AI真的在抢初级的工作。 4 接下来的问题是——AI到底是如何抢工作的? 是把人都裁了,还是有别的方式? 论文的数据再次给出了一个出乎意料、甚至让人后背发凉的答案—— 作者们把公司的人员变动拆解成三个部分:新招聘(Hires)、离职(Separations)和内部晋升(Promotions)。 他们的数据发现,AI采纳者公司里初级岗位的急剧萎缩,主要原因并不是离职率的上升。 也就是说,公司并没有因为用了AI,就把现有的大批初级员工给裁掉。 那人是怎么变少的呢? 答案是:不再招聘了。 数据显示,与对照组相比,AI采纳者公司在2023年第一季度后,平均每个季度少招了3.7个初级员工。 对于那些本来招聘规模就大的AI公司,这个数字意味着初级岗位的招聘量暴跌了大约22%。 这是一个更隐蔽、成本更低的替代过程。 毕竟,裁员的补偿成本、沟通成本和PR成本确实不小,不招了就没这个问题。 这其实和我的体感也是相吻合的,我和很多前同事聊天,他们也感叹这两年初级岗位新增的确招的少了。 老的初级员工可能会晋升,或者自然流失,但新的年轻人,对不起,没有你的位置了。 这就像温水煮青蛙,你不会看到大规模的裁员新闻,但就业市场正在对初级岗位的年轻人关闭。 这是一个非常残酷的现实,他们职业第一级阶梯,正在被慢慢抽掉。 5 那是不是所有行业都呈现同样的特征呢,还是不同行业的程度不同。 论文数据显示,这种对初级岗位的压缩效应,在所有行业都普遍存在,但程度不同。 你可能以为受冲击最大的是互联网、软件、设计这些行业。 没错,这些的确受到了很大的影响,但真正的重灾区是批发和零售业。 在这个行业里,拥抱AI的公司,其初级岗位的招聘数量比不拥抱AI的公司,每季度减少了将近40%。 这非常符合直觉,因为批发零售业大量的初级岗位,都和文员、客服、导购等简单任务相关,而这些恰恰是AI最擅长替代的领域。 6 论文最后还观察了一个问题:在AI面前,我的名校学历能保护我吗? 这是最后一个,也是最扎心的一个问题。 两位作者做了一个非常精彩的分析,他们把员工毕业的大学分成了五个等级(Tier 1-5),从最顶尖的精英名校(如哈佛、斯坦福)到比较普通的地区性大学。 然后,他们观察了来自不同等级学校的初级员工,在AI采纳者公司里的就业变化情况。 结果呈现出一条清晰的“U型曲线”—— 曲线的一端:来自最顶尖名校(Tier 1)的毕业生,受到的负面影响相对较小。 曲线的另一端:来自最普通大学(Tier 5)的毕业生,受到的影响也非常小,甚至在统计上不显著。 曲线的底部:遭受打击最沉重的,是那些来自中上等大学(Tier 2和Tier 3)的毕业生, 也就是那些很不错,但又不是最顶尖的学校的毕业生。 为什么会这样? 论文给出的解释是,这背后是一个关于性价比的问题—— 对于公司来说,顶尖名校的毕业生(Tier 1),虽然成本最高,但他们解决复杂问题的能力也最强,AI很难替代,所以公司愿意继续花大价钱雇佣他们。 最普通大学的毕业生(Tier 5),虽然能力上可能没那么突出,但他们的薪资要求也最低,人力成本优势明显。 最尴尬的就是中间层(Tier 2和Tier 3),他们薪资要求不低,脱不下长衫,但从事的很多工作又恰好落在了AI能替代的区间,高不成、低不就,是最容易被优化掉的一群人。 到此,这论文的所有结论都已经给出——真实、残酷、逻辑严密。 (想看论文全文,可在“卫夕指北”公众号回复“哈佛论文”) 7 好了,论文讲完了,回到开头的问题:这篇如手术刀一般的论文,对我们每个普通人,到底有什么启示? 我在看来,一个最残酷的现实就是——如果你一直只能干初级的活,那么你真的危险了 没错,曾经熟悉的、一级一级向上攀登的职业阶梯,其底部正在被AI迅速抽走。 同志们,不能再按部就班了! 怎么办? 我想来想去,列了下面三个点—— 尽快完成原始积累,向上跃迁。 你必须狂奔,因为AI在极速地追。 你必须迅速摆脱初级状态,成长能独立抗事的老兵。 你需要有意识地、主动地承担那些复杂任务,不要沉迷于那些能让你舒适地完成的简单工作。 那是温室,也正是AI的领地。 你的目标是,在最短的时间内,让你的工作内容中,AI不可替代的部分超过50%。 思考什么是你的暗知识和元技能。 我之前说过一句话——“这一轮AI冲击,在任何一个领域,并不是“知道What的人被颠覆,知道How的人被放大”,而是“知道How的人被颠覆,知道Why的人被放大”。 对于公共知识,今天的AI已经满级了,而我们的一个优势是“暗知识”。 什么是暗知识? 我的定义是——只有你才能提供上下文的知识,所以思考一下,在你的具体工作中,你能独特定义的上下文是什么? 这个问题极其关键。 向你的兴趣要ROI。 品位、审美、幽默感这种以前被认为没太多直接用的东西重要性在极速提高,它似乎是今天AI暂时还触达不到的区域。 同理心、共情能力、感染力、领导力这些在过去被视为加分项的技能,现在正迅速成为必需品。 所以,千万不要忽视你的兴趣,多问一问自己,有哪些事情不给你钱你也乐在其中的事,那个边缘的角落或许是你未来竞争力的重要来源。 李继刚最近关于“体力、脑力、心力”的提法很有意思,而兴趣其实是你心力的重要来源。 试一试将兴趣和AI碰撞一下,或许你会有新的发现。 结语 “AI对就业市场的潜在影响是'可怕'的(scary)” 谷歌DeepMind CEO Demis Hassabis这句话并非耸人听闻。 但这位老哥也同时说了另一句话—— “AI会让'激进富裕'(Radical Abundance)的时代到来。” 如何确保在前者向后者推进的过程中不被时代抛弃,是我们每个人都要严肃思考的命题。
已绝食17天,美国男子在Anthropic总部外呼吁其停止AGI竞赛
IT之家 9 月 17 日消息,圭多・赖希施塔特(Guido Reichstadter)已绝食 17 天,他表示自己目前状态尚可,只是行动稍缓,但并无大碍。 据 TheVerge 报道,自 9 月 2 日起,赖希施塔特每天都会出现在人工智能初创公司 Anthropic 的旧金山总部外,从上午 11 点左右一直坚守到下午 5 点。他手持的黑板标语上写着“绝食抗议:第 15 天”,但事实上,他从 8 月 31 日就已停止进食。这条标语向 Anthropic 提出诉求:“停止通用人工智能(AGI)竞赛”。所谓通用人工智能,指的是具备与人类相当甚至超越人类认知能力的人工智能系统。 IT之家注意到,通用人工智能一直是科技公司 CEO 们热衷的“战斗口号”,无论是大型科技企业还是初创公司的领导者,都在竞相争夺这一具有主观性的里程碑。但在赖希施塔特看来,这些公司完全没有正视通用人工智能带来的生存风险。“这些前沿企业的目标,都是研发出具备人类水平、甚至超越人类水平的通用人工智能系统,也就是超级智能,”他在接受采访时表示,“我认为这种行为极其疯狂,充满风险,而且是极大的风险。我认为现在必须立刻停止。”在他看来,绝食抗议是吸引人工智能领域领导者关注的最直接方式。而如今,持这种想法并采取行动的并非他一人。 赖希施塔特提到了 2023 年 Anthropic 首席执行官达里奥・阿莫代(Dario Amodei)的一次采访,他认为这次采访充分体现了人工智能行业的鲁莽。阿莫代当时表示:“我认为,人工智能技术发展导致人类文明遭遇灾难性后果的概率,可能在 10% 到 25% 之间。”阿莫代及其他行业人士认为,通用人工智能的发展是不可避免的,他们声称自己的目标只是成为“尽可能负责任的守护者”。但在赖希施塔特眼中,这种说法是“虚构的谎言”,也是“自私自利的借口”。 在赖希施塔特看来,企业有责任避免研发可能对大规模人群造成伤害的技术;而任何了解这一风险的人,也都肩负着一定的责任。 “我现在所做的一切,本质上就是在履行自己的责任。我只是一个普通公民,但我尊重同胞们的生命与福祉,也关心我的国家民众,”他说,“更何况,我还有两个孩子。” 截至目前,Anthropic 尚未对置评请求作出回应。 赖希施塔特表示,每天在 Anthropic 总部外准备抗议时,他都会向公司的安保人员挥手致意;而当 Anthropic 的员工路过时,大多会刻意避开他的目光。不过他提到,至少有一名员工向他表达了类似的“灾难性风险担忧”。他希望能激励人工智能公司的员工“有勇气像人一样行动,而非公司的工具”,因为他们肩负着更重大的责任,毕竟“他们正在研发的是地球上最危险的技术”。 在人工智能安全领域,无数人都与他有着同样的担忧。该领域的圈子相对分散,对于人工智能长期来看可能带来的具体风险,以及如何有效防范这些风险,存在诸多分歧,就连“人工智能安全”这一术语本身,也充满争议。但大多数人能达成共识的一点是:人工智能当前的发展方向,对人类而言并非好兆头。 赖希施塔特透露,大约 25 年前上大学时,他第一次了解到“人类水平人工智能”的潜在可能,当时他觉得这一技术还十分遥远。但 2022 年 ChatGPT 发布后,他开始高度关注这一领域。他特别担忧的是,在他看来,人工智能正在加剧美国的威权主义倾向。 “我关心我们的社会,”他说,“我关心我的家人,关心他们的未来。我担心人工智能的发展会对他们产生影响。我担心人工智能的应用缺乏伦理约束。同时,我也担心有充分理由相信,人工智能不仅带来灾难性风险,甚至可能威胁人类的生存。” 近几个月来,为了让科技领域的领导者关注这一他认为至关重要的议题,赖希施塔特采取了一系列越来越公开的行动。他此前曾与一个名为“停止人工智能”(Stop AI)的组织合作,该组织致力于“永久禁止超级智能人工智能系统,以防止人类灭绝、大规模失业及其他诸多问题”。今年 2 月,他与该组织的其他成员一同将 OpenAI 旧金山办公室的门锁住,包括他在内的数人因妨碍公共秩序被警方逮捕。 9 月 2 日,赖希施塔特通过 Anthropic 的安保前台,向阿莫代递交了一封手写信件;几天后,他将这封信公之于众。信中要求阿莫代停止研发“自己无法掌控的技术”,并尽自己所能在全球范围内阻止人工智能竞赛;若阿莫代不愿这么做,需向他说明理由。赖希施塔特在信中写道:“为了我的孩子,也因为深知当前局势的紧迫性与严重性,我已在 Anthropic 办公室外开始绝食抗议…… 等待您的回应。” “我希望他能有最基本的礼貌,回应我的请求,”赖希施塔特表示,“我认为这些(人工智能公司的领导者)从未真正受到过个人层面的质问。匿名地、抽象地‘思考自己的工作可能导致大量人员死亡’,与‘面对一位可能因自己的工作而受害的人,以人的身份向对方解释原因’,完全是两码事。” 在赖希施塔特发起这场和平抗议后不久,两名受他启发的人在伦敦发起了类似行动,持续在谷歌 DeepMind 总部外抗议;另有一人在印度加入抗议行列,并通过直播记录自己的绝食过程。 迈克尔・特拉齐(Michael Trazzi)参与了伦敦的绝食抗议,7 天后因两次险些晕倒,并在咨询医生后选择停止绝食,但他仍在支持另一名抗议者丹尼斯・舍雷梅特(Denys Sheremet),舍雷梅特目前已绝食 10 天。特拉齐与赖希施塔特一样,对人工智能持续发展背景下人类的未来感到担忧,但两人都不愿将自己归为某一特定团体或组织的成员。 特拉齐表示,自 2017 年起,他就开始思考人工智能的风险。他给 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)写了一封信,不仅公开发布,还通过中间人转交。 信中,特拉齐请求哈萨比斯“从今天起,为协调未来暂停超级智能研发迈出第一步,公开声明:若西方及中国的所有其他主要人工智能公司均同意暂停前沿人工智能模型的研发,DeepMind 也将同意暂停。一旦所有主要公司均同意暂停,各国政府便可推动达成国际协议,以强制落实这一决定。” 特拉齐在接受采访时表示:“如果不是因为人工智能存在极大危险,我不会如此支持监管。但我认为…… 世界上有些事物,其发展动力在默认情况下会走向错误方向。而人工智能领域,确实需要监管。” 谷歌 DeepMind 传播总监阿曼达・卡尔・普拉特(Amanda Carl Pratt)在一份声明中表示:“人工智能领域发展迅速,人们对这项技术难免有不同看法。我们坚信,人工智能有潜力推动科学进步,改善数十亿人的生活。在我们构建‘人类从技术中受益、同时免受风险侵害’的未来过程中,安全、保障与负责任的治理始终是我们的首要任务,过去如此,现在亦然。” 特拉齐在社交平台 X(原推特)上发帖称,这次绝食抗议引发了他与众多科技公司员工的讨论。他提到,一名 Meta 员工问他:“为什么只针对谷歌的人?我们也在做重要的工作,我们同样身处这场竞赛之中。” 他还在帖文中表示,一名 DeepMind 员工称,人工智能公司“可能不会发布可能造成灾难性伤害的模型,因为机会成本太高”;而另一名 DeepMind 员工则“承认自己认为人工智能导致人类灭绝的可能性很大,但仍选择在 DeepMind 工作,因为该公司仍是最注重安全的企业之一”。 目前,赖希施塔特致阿莫代的信、特拉齐致哈萨比斯的信均未收到回应(谷歌也拒绝回答 The Verge 提出的“哈萨比斯为何不回信”的问题)。但两人仍抱有希望,认为他们的行动能换来对方的认可、一场会面,最理想的情况是,这些公司的 CEO 能承诺改变当前的发展方向。 在赖希施塔特看来:“我们正处于一场不受控制、可能走向灾难的全球竞赛中。若想找到出路,就需要人们愿意说出真相,承认‘我们无法掌控这一切’,并主动寻求帮助。”
多核上万分,联发科天玑9500处理器Geekbench跑分曝光
IT之家 9 月 17 日消息,型号为 V2502DA 的 vivo X300 系列智能手机此前已出现在 3C 认证数据库中,据透露其为卫星通信版本,支持 90W 有线快充。 今日,这款新机现身 Geekbench 跑分,搭载天玑 9500 处理器,单核跑分 3502,多核跑分 10393,配有 16GB 内存。 作为参考,首发高通第五代骁龙 8 至尊版的小米 17 系列单核跑分最高 3812、多核跑分最高 11993,多核成绩超越了苹果 A19 Pro 处理器(单核超 4000,多核超 11000)。 IT之家注意到,三星 Exynos 2600 在 8 月底的跑分显示,该处理器 CPU 单核可达 3309、多核 11256,单核性能略差一些,多核也可以和其他家掰掰手腕了。 已知信息显示,天玑 9500 由 1*4.21GHz Travis+3*3.50GHz Alto+4*2.7GHz Gelas 组成,其中 Travis 和 Alto 是 Arm 新一代 X9 系超大核,Gelas 是 Arm 新 A7 系大核。 GPU 是全新的 Mali-G1-Ultra MC12,采用全新的微架构,GPU 能效预计将提升超过 40%,移动端光线追踪性能有望增长 40% 以上,光线追踪帧率有望突破 100FPS。 其 L3 缓存达 16MB,SLC 10MB,支持 SME 指令集,NPU 9.0 预计 100TOPS,支持 4x LPDDR5x 10667Mbps+4-Lane UFS4.1。 天玑 9500 将由 vivo X300 系列首发,上周 vivo 产品经理韩伯啸已经提前公布了 vivo X300 Pro 卫星通信版的跑分,是历史第一台安兔兔成绩破 400 万的机型。
vivo X300 Pro视频能力挑战苹果 韩伯啸:安卓最强 没有之一
快科技9月17日消息,vivo产品经理韩伯啸介绍,vivo X300系列全球首发支持4K 60fps人像视频,这意味着vivo影像旗舰将在视频赛道上实现全面引领。 回顾过去一年,X200 Ultra通过三大蔡司大师定焦镜头的全焦段无损接力体验,成为媲美相机的“V单”,vivo由此成为安卓阵营里视频能力最强的选择,没有之一。 来到这一代,X300 Pro搭载X200 Ultra同款蓝图自研影像双芯,全球首发4K 60fps电影人像视频:基于V3+能力实现行业首发4K 60fps美颜/虚化,全新升级人像优先策略,支持更多美颜细节,新增冷胶、负片风格,一次满足两大网感视频色彩,更适合拍人的人像vlog神器。 更重要的是,vivo X300 Pro还带来了以下功能。 行业领先的双焦段4K 120fps电影慢动作:4K 120fps视频带来极致的流畅慢放,慢动作视频又清晰、又顺滑,让每一处动态细节都成为高光时刻。 双焦段4K 120fps杜比视界HDR:不仅拥有高分辨率高帧率,更拥有极宽的动态范围、更广色域,影调表现极具电影感,直出就很震撼。 双焦段4K 120fps 10 bit Log视频:保留巨大的后期调色空间,每一帧都精彩,支持监看及一键还原709色彩的能力。更值得一提的是,vivo Log 全面支持ACES专业色彩工作流,让后期调色更高效、更标准。 光有高规格还不够,X300 Pro在主摄和长焦端均支持CIPA 5.5级专业防抖,并且升级了高缓存的EIS防抖算法,拍摄稳定性更好,视频防抖行业领先,对焦稳定性、准确性大幅提高,变焦流畅性明显优于上一代。 韩伯啸强调,vivo X300 Pro正面挑战苹果,更胜友商Ultra机型的视频能力,安卓视频之王不遑多让。
ChatGPT首份使用报告出炉:7亿周活,七成对话与工作无关
大数据文摘出品 ChatGPT首份使用报告出炉了! 近日,OpenAI与杜克大学、哈佛大学的研究团队共同发布了一份长达63页的研究成果,题为《人们如何使用ChatGPT》。这是第一份基于内部对话数据的系统分析,揭示了ChatGPT自2022年底发布以来的真实使用方式。 报告显示,ChatGPT自2022年11月上线至2025年7月,已经拥有超过7亿周活跃用户,约占全球成年人口的10%。这种扩散速度在科技史上没有先例,比互联网和智能手机的普及更为迅猛。 图注:消费者方案(免费版、Plus、Pro)的 ChatGPT 每周活跃用户数,以每六个月为一个时间点快照展示,涵盖 2022 年 11 月至 2025 年 9 月。 与此同时,消息发送量也在飙升。2024年6月,用户每天共发送4.5亿条消息;一年后,这一数字达到26亿条,相当于平均每秒发送2.9万条消息。 来自 ChatGPT 消费者方案(免费版、Plus、Pro)的每日消息量,按用户注册日期分组。 用户结构也在快速演变。最初八成用户是男性,但到2025年中,女性用户比例已反超男性,性别差距几乎消失。 年龄分布方面,近一半消息来自26岁以下用户,但不同年龄群体的差距在缩小。甚至在中老年群体中,使用率也在逐渐上升。 更具全球意义的是,过去一年中,低收入和中等收入国家的用户增长率明显高于高收入国家,显示出ChatGPT的全球下沉效应。 工作与生活的双重渗透 报告打破了一个普遍认知:ChatGPT并非主要用在工作场景。研究发现,超过70%的对话与工作无关。 随着时间推移,用户发送的消息中非工作相关内容的比例逐渐上升,到 2025 年中约占七成以上。 2024年6月,非工作相关消息占比为53%;到2025年6月,这一比例已升至73%。换句话说,用户越来越倾向于将ChatGPT用于学习、教育、健康、娱乐甚至家庭事务,而不仅仅是职场。 在用户对话主题中,实用指导占比最高(28.8%),其次是信息查询(24.4%)和写作(23.9%),而多媒体、自我表达和技术帮助等占比较低。 在具体主题中,最常见的三类是实用指导、信息搜索和写作,占到全部消息近八成。例如,有人向ChatGPT请求运动计划、食谱或教学辅导;也有人用它来生成摘要、翻译或校对文章。 在与工作相关的对话中,写作占比最高(40%),其次是实用指导(24.1%),而信息查询、技术帮助、多媒体等所占比例相对较低。 教育场景尤其突出。报告指出,约10%的所有消息与辅导或教学有关,显示AI正逐渐成为新一代的私人教师。 在工作场景里,写作是最突出需求。40%的工作相关消息与写作有关,其中三分之二涉及修改用户提供的文本,而非从零生成新内容。这表明ChatGPT更多充当“润色助手”和“语言顾问”,而不是完全替代原创。 与公众印象不同,编程需求占比很小,仅为4.2%的消息。至于外界热议的“AI陪伴”,比例更低,仅有2.4%的消息涉及个人关系或角色扮演。 换句话说,人们在现实中更依赖ChatGPT解决实际问题,而不是寻求情感陪伴。 AI在知识经济中的角色 研究团队进一步从用户意图切入,将消息分为“询问、执行、表达”三类。结果显示,49%的消息属于询问,40%属于执行,只有11%属于表达。 “询问”指用户寻求信息或建议来辅助决策;“执行”是让ChatGPT直接产出邮件、代码或表格;“表达”则是单纯陈述情绪或观点。过去一年里,询问类消息增长速度更快,且互动质量普遍更高。 在工作场景中,执行类消息占比更高,接近56%,其中大多数与写作相关。但在高学历和高收入的职业群体中,用户更偏向使用ChatGPT获取信息与决策支持,这与知识密集型岗位的特征高度一致。 在 ChatGPT 的工作相关活动分类中,获取信息(19.3%)、解释信息含义(13.1%)、记录信息(12.8%)占比最高,其次是提供咨询与建议(9.2%)、创造性思考(9.1%)和决策解决问题(8.5%),而其他类别如行政支持、培训教学或设备维护等所占比例极低。 报告还将ChatGPT的对话映射到美国劳工部的O*NET数据库。结果显示,近六成的工作相关消息集中在两类活动:其一是获取、记录和解释信息,其二是决策、咨询、解决问题和创造性思考。 这意味着ChatGPT在职场中的作用更像“第二大脑”或“研究助理”。它并非单纯替代劳动,而是帮助用户做出更好的判断。 报告总结出八个核心结论:非工作使用增长更快,三大主题占据绝对主导,写作是职场首要应用,编程与陪伴类需求微乎其微,用户群体趋向性别均衡,年轻人依旧是主力但差距缩小,低收入国家增长迅速,高学历职业人群最依赖它进行决策支持。 经济意义同样惊人。2024年的一项估算显示,美国用户如果放弃使用生成式AI一个月,需要补偿平均98美元。折算下来,仅美国一年就有至少970亿美元的消费者剩余。 换句话说,ChatGPT的真正价值,已远远超出工作场景的生产率提升,而是正在深刻改变人类的生活方式与思维习惯。
大疆DJI Mini 5 Pro航拍无人机发布:首搭一英寸大底,4788元
IT之家 9 月 17 日消息,DJI 大疆今日正式发布全新一英寸大底全能迷你航拍机 DJI Mini 5 Pro,带来了 DJI Mini 系列迄今为止最强大的性能表现。 DJI Mini 5 Pro 不仅延续了轻巧便携的机身设计,更是 Mini 系列首次采用一英寸大底传感器相机,同时还支持夜景级全向主动避障、无损竖拍、225° 云台旋转、最长 20 公里 O4+ 图传以及全向智能跟随等功能。 作为首款采用 1 英寸 5000 万像素 CMOS 影像传感器的 Mini 系列无人机,DJI Mini 5 Pro 的大底传感器配合 f/1.8 大光圈,具备更宽广的动态范围以捕捉光影细节,还能在暗光环境下拍出更纯净的画面。 ▲ 一英寸大底相机样张 DJI Mini 5 Pro 搭载全新图像处理平台和智能算法,同时还支持录制 4K / 60fps HDR 视频,动态范围可达 14 级。 即使在普通模式下,DJI Mini 5 Pro 也能采用 H.265 编码录制 10-bit 视频,ISO 上限提升至 12800;D-Log M 和 HLG 色彩模式的 ISO 上限则提升至 3200,更高的亮度能够在城市夜景拍摄中呈现更多细节。 ▲ 48mm 人像样张 相较以往 Mini Pro 系列的传统数码变焦,DJI Mini 5 Pro 新增了 48 毫米高画质中焦模式,带来 2 倍变焦能力;DJI Mini 5 Pro 还结合了采用 DJI 人像优化技术,带来更出色的人像亮度、对比度和肤色表现。 DJI Mini 5 Pro 采用可折叠机身,巴掌大小,可收纳进背包或口袋。同时,DJI Mini 5 Pro 内置了 42GB 容量存储。 DJI Mini 5 Pro 机身正面搭载前视激光雷达,前后各配备一对鱼眼镜头,实现前后、左右和上方的感知,下方配备双目镜头和 3D 红外传感器,实现夜景级全向主动避障。在城市夜色下,DJI Mini 5 Pro 可主动探测并避开飞行及返航路径上的建筑等障碍物。 得益于视觉即时定位及地图构建技术,DJI Mini 5 Pro 可在光照条件良好的环境下记忆飞行路线,即使没有卫星信号,也能自信起飞,安全返航。在卫星定位方面,DJI Mini 5 Pro 采用 L1+L5 双频 GNSS 技术,支持更多卫星接收。 DJI Mini 5 Pro 支持多场景定制跟拍,可智能识别多种运动场景,基于最优跟拍策略自动匹配标准、骑行等模式。在标准模式下,DJI Mini 5 Pro 可实时捕捉目标轨迹,保持稳定跟拍高度与距离;在骑行模式下,反应则更加灵敏,可快速应对目标的转弯、加速等动态变化,稳固锁定主角,持续保持理想构图。 此外,DJI Mini 5 Pro 的跟随性能也进一步提升,在空旷场景下,DJI Mini 5 Pro 的最大跟随速度提升至 15 米 / 秒;复杂环境下,还能智能切换至后向跟随模式。 DJI Mini 5 Pro 云台支持 225° 大角度横滚旋转,可实现更自由的运镜,在手动或智能模式下,均可灵活切换视角,拓展运镜路径,丰富画面构图;更有无损竖拍模式,在拍摄高楼大厦、瀑布、车水马龙等画面时,用纵向构图突出主体。 DJI Mini 5 Pro 还拥有多项智能拍摄功能: 大师镜头功能可根据人像、近景和远景的拍摄需求,智能提供运镜模板; 一键短片功能提供旋转、渐远、环绕、螺旋、冲天、彗星、小行星等多种拍摄模式选择; 还可通过自由全景功能,框选目标拍摄主体,自定义拍摄并生成全景图片。 DJI Mini 5 Pro 标配智能飞行电池,最长续航 36 分钟,还可选长续航电池,续航最长可达 52 分钟;充电效率大幅提升,三块智能飞行电池约 115 分钟即可全部充满。 在图像传输上,DJI Mini 5 Pro 最长支持 20 公里 O4+ 图传,采用 DJI 全新自研图传算法,进一步提升抗干扰能力。同时,用户还可以通过 DJI Fly App 在蓝牙有效范围内唤醒 DJI Mini 5 Pro,无需取出无人机和遥控器,即可在 Wi-Fi 6 协议下以最大 100MB/s 速度传输素材;即使在下载过程中切换应用,DJI Fly App 也能在后台下载。 DJI Mini 5 Pro 还支持最高 6000 米起飞海拔,最大上升速度提升至 10 米 / 秒,可应对高原环境的拍摄需求。 DJI Mini 5 Pro 系列共有 4 个版本发售,IT之家附价格如下: ‎DJI Mini 5 Pro 售价 4788 元,主要包含无人机、一块智能飞行电池、DJI RC-N3 遥控器。 ‎DJI Mini 5 Pro 畅飞套装(DJI RC-N3)售价 5988 元,主要包含无人机、三块智能飞行电池、DJI RC-N3 遥控器,ND 套装(ND8/32/128),双向充电管家。 ‎DJI Mini 5 Pro 畅飞套装(DJI RC 2)售价 6988 元,主要包含无人机、三块智能飞行电池、DJI RC 2 遥控器,ND 镜套装(ND8/32/128),双向充电管家。 ‎DJI Mini 5 Pro 长续航畅飞套装(DJI RC 2,内置增强图传)售价 7688 元,主要包含无人机(内置增强图传模组)、三块长续航智能飞行电池、DJI RC 2 遥控器,ND 镜套装(ND8/32/128),双向充电管家。 即日起,DJI 大疆官方商城、京东、天猫、抖音及北京、上海、深圳、南京、杭州旗舰店和线下授权体验店等渠道正式发售。 适用于 DJI Mini 5 Pro 的保障计划 DJI Care 随心换同步上线,提供全方位意外保障解决方案,支付一定置换费便可一键极速换新,并享受官方保修、维修直减、三者险、操作者意外险等多种专属服务权益。 DJI Care 随心换 1 年版(DJI Mini 5 Pro)售价 478 元,提供 1 年内 2 次低价置换权益。 DJI Care 随心换 2 年版(DJI Mini 5 Pro)售价 788 元,提供 2 年内 4 次低价置换权益。
iPhone 17 系列首发评测:你这是典型的安卓iPhone
每年在评测新 iPhone 的时候,爱范儿总会反复问一个问题: 新 iPhone 贯彻了怎样的设计哲学? 今年,苹果给出了三个清晰无比的答案—— 造出极致轻薄 iPhone Air 的,是设计至上的苹果,为此,他们不惜在产品上做出了诸多妥协; 造出性能猛兽 iPhone 17 Pro 的,是技术驱动的苹果,他们用别出心裁的方式,造出了迄今为止最 Pro 的 iPhone; 而造出真香机 iPhone 17 的,是库存克星的苹果,他们用强大的供应链整合能力和自研技术优势,造就了高端手机市场里的价格屠夫。 这种明晰的定位,比前几年依靠屏幕尺寸和处理器性能,使人对大 Plus 和小 Pro 左右为难的情况截然不同。作为一名 iPhone 用户,我很清楚我该换什么手机——朋友圈里比往年晒得更多的订单截图,也佐证了这一点。 由于 iPhone Air 推迟发售,今年爱范儿评测的重心将会放在 iPhone 17 系列上,而经过这一周多的体验,我们得到了一个有趣的结论: 今年的 iPhone 17 系列,比以往任何时候,都更像「安卓」手机——这当然是褒义。 iPhone 17:库存克星 自 iPhone 11 以来,「标准版」的 iPhone 就总给人一种「标配即减配」的印象——但 iPhone 17 是个令人惊喜的例外。 有关 iPhone 17 的一切讨论,都离不开这块全新的屏幕——如果仅从硬件参数上看,iPhone 17 的屏幕几乎就是去年 iPhone 16 Pro 的同款。 这是 ProMotion 推出以来,标准版 iPhone 第一次用上高刷新率屏幕,打破了「ProMotion 必须要 Pro」的魔咒—— 1-120Hz 可变刷新率,支持常亮显示的 LTPO 屏幕,甚至边框宽度都比 iPhone 16 缩窄了不止一点: ▲左边为 iPhone 17,右边为 iPhone 16 ProMotion 高刷屏带来的爽快感不言而喻,哪怕 iPhone 的调度策略不是全时锁定 120Hz,但相比 iPhone 16 上面那种字面意义上的「顿挫感」,仍然是巨大的提升。 更重要的是,今年愿意换标准版的人,大多是 12、13 代的老用户,我们在公众号评论区甚至见到了一位仍在使用 iPhone 7 Plus 的朋友。iPhone 17 加上 ProMotion,对于他们来说是真正意义上的「体验超速」了。 比起 iPhone 16 Pro,iPhone 17 的屏幕户外峰值亮度也更高,一举来到了 3000 尼特,甚至还用上了隔壁三星 Ultra 旗舰以及一些折叠屏机型会用到的抗反射涂层(Anti-reflective coating)。 根据我们的上手体验,iPhone 17 在晴朗户外的可读性相比 iPhone 16(甚至 16 Pro)都有相当程度的提升。其抗反射效果与三星类似,体现为屏幕在户外强光下,玻璃泛白、发灰的情况有所减轻。 只不过 iPhone 17 的屏幕抗反射效果只是相比前代明显,但是距离三星那种「让黑色更黑」的效果还有着不小的差距。哪怕是没有抗反射涂层、只贴了官方 AR 膜的 Z Fold7,也比 iPhone 17 更深邃一些: iPhone 17 今年使用了第二代超瓷晶玻璃,在滑动时有点微微地涩手,且因为抗反射涂层的加入,选贴膜也变得更加考究。无论是为了改善手感,还是想保留抗反射能力,我们都建议优先选择 AR 膜。 更加倒反天罡的是,苹果甚至连 iPhone 17 的充电速度都做出了改进,最高充电功率来到了 35W 左右。 我们用 40W 的充电头实测,iPhone 17 的电量从 0 到 50% 只需要约 25 分钟,而充满则需要 80 分钟——有时候起床发现忘了充电,洗漱的时间临时充一会,也够 iPhone 应应急了。 ▲iPhone 17 充电曲线图,蓝色折线为充电功率,红色折线为电流,绿色折线为电压 至于影像方面,iPhone 17 在两个方面做出了升级——超广角镜头从 1200 万像素升级到 4800 万像素,以及用上了新的正方形 CMOS 前摄。 虽然最近两年各家厂商都在发力长焦,但超广角镜头作为视觉冲击力最强的那个视角,仍然具有相当的不可替代性。本次 iPhone 17 升级到去年 16 Pro 同款的超广角,让拍出类似这样的可用画面成为了可能: 而本次全系标配的这套新的前摄——苹果称之为 Center Stage 前置摄像头——则是一个非常精妙的功能,因为它做到了一件和哈苏 X2D II 100C 差不多的事情: 用更精密的硬件和更复杂的功能,让拍摄本身变得简单。 放在 iPhone 17 上,就是现在 iPhone 可以自行判断你的自拍画面里有多少人、然后根据检测到的人脸数自动调整前摄的缩放和画幅,用更复杂的功能实现了更无感的操作。 根据爱范儿的测试,iPhone 17 会在只有一个人的时候保持普通竖向构图、两个人的时候切换广角但维持竖向,在画面进入第三个人且人脸比较分散的时候切换为横构图——在这个过程中,你的手都是完全不需要扭动,更不需要按任何按钮。 而得益于新的 2400 万像素正方形传感器,无论切换横竖构图,最后拍出来的自拍照分辨率都可以达到 1800 万像素,相比之前的 1200 万前摄仍然是可感的提升。 此外,苹果本次加入的前后同时录像功能也是相同的「机制复杂、简化摄影」的逻辑,虽然这项功能本身不新鲜,但是别忘了——它是建立在 iPhone 行业第一的录像能力和 iOS 无出其右的软件生态基础上的。 在大升级的屏幕和小改进的影像能力之外,iPhone 17 基本保持了与 iPhone 16 一样的三维和重量(17 比 16 略高 2mm、略重 7 克)。屏幕能够从 6.1 升级到 6.3 寸,主要就是得益于显著缩窄的边框。 至少在 iPhone Air 正式开售之前,iPhone 17 依然是整个 17 系列中手感最轻巧的那台。更重要的是, iPhone 17 的最低存储空间升级到了 256GB,加量不加价。 与其说这是 iPhone 17,不如说这是一台少了长焦镜头的 iPhone 16 Pro,特别是有了观感明显的 Pro 功能,你甚至可以当它是 16 Pro「青春版」。 iPhone 17 也是我们今年最推荐更新的机型,如果你是 iPhone 15 之前的用户,这是一个换机的好时机。 iPhone 17 Pro:技术驱动 比起「压倒性好评」的 iPhone 17 标准版,iPhone 17 Pro 的风评倒是褒贬不一,分歧主要集中于外观设计。 在经历过 15 Pro 和 16 Pro 两代钛金属之后,苹果在 iPhone 17 Pro 上放弃钛合金、重新回归了最传统的铝合金。但这并非保守和倒退的体现,而是苹果整了一个更大的活—— 在新的铝合金机身上,苹果尝试了一种新的加工工艺:热锻铝金属一体成型(Heat-forged aluminum unibody)。这是一种手机行业不常见、但在汽车工业领域已经被广泛应用的加工技术。 ▲苹果发布会上演示的一体成型机身|Apple 相比 CNC 工艺只能在成品铝料块上加工,热锻一体成型工艺因为需要在金属的「再结晶温度」以上进行,可以避免金属内部在加工过程中形成不规则结晶区,组成疏松和气孔结构,从而最大程度发挥出铝合金的强度、韧性和抗疲劳性能。 这种一体成型工艺的优点,一上手便知—— 前两代 Pro 的确极大改善了「硌手」的口碑,而 iPhone 17 Pro 更大的边框弧度,又一次将 iPhone 16 Pro 远远甩在后面,甚至可以称之为「手感最好的直屏 iPhone」。 除了手感大升级,从钛金属换回铝合金还带来了另外两项材料优势——由于铝合金比钛合金更容易着色,今年的 iPhone 17 Pro 多出了这个醒目的「星宇橙」,比起前几年的「禁欲系」配色鲜亮不少。好不好看见仁见智,但包你换了新机一眼就能被认出来。 此外,钛金属虽有重量和强度上的优势,导热性能却并不优秀,而铝的热导系数接近钛的 20 倍,iPhone 17 Pro 的散热能力相比 16 Pro 提升是非常明显的。 在聊实际散热手感之前,先分享一些发热测试数据:将 iPhone 16、17 两代 Pro Max 屏幕调至最大亮度,并打开 4K 120Hz 进行录像,这样可以比较好的排除户外机身升温的干扰、更清楚的看到散热路径。 首先是上一代 iPhone 16 Pro Max:从热成像延时中可以看到,16 Pro Max 的发热点位非常集中,主板位置的最高温度接近 45°C,且由于背板玻璃和钛合金中框导热不畅,机身的下半部分始终没有怎么升温,无法有效参与到机身的散热过程中: iPhone 16 Pro Max 4K 120 帧最高亮度录制半小时,最高温点位约 44.8 度 再看全新 iPhone 17 Pro Max: 可以看到铝合金凸台和边框在主板热起来之后不久就迅速升温,沿着左右边缘迅速将温度传导了下去 机身内部新增的 VC 均热板和钢壳电池共同作用,快速把主板上的积热铺开 最终,iPhone 17 Pro Max 的机身最高温度,相比 16 Pro Max 低了两度,且在超过半小时之后也没有继续攀升。 这样的效果转换到游戏场景中,就是我们手持 17 Pro 玩《崩坏 星穹铁道》的时候,可以明显感觉到边框、背板和镜头凸台都在均匀发热,说明处理器的热量被有效传递到了更大面积的机身上、与空气热交换的效率更高。 iPhone 17 Pro Max 4K 120 帧最高亮度录制半小时,最高温点位约 42.6 度 更好的散热表现,意味着 iPhone 17 Pro 能够更有持续性地进行性能释放——无论是拍照、游戏,还是高强度回微信,手机都只是温温地不烫手。散热越好,降频越少,手机当然也没那么容易卡顿了。 同样,升级的散热也能够支持 iPhone 17 Pro 更长时间地高功率充电。实测下来,我们发现 iPhone 17 Pro 的最高充电功率可以长时间稳定在 30W 以上,Pro Max 甚至可以稳定地以 35W 的功率进行充电。 使用苹果官方的 40W 充电头, Pro 和 Pro Max 在 20 分钟以内就能充到 50% 的电量,和 iPhone 17、iPhone Air 等沿用三明治结构的机器相比,整体充电速度快了不少。 ▲iPhone 17 Pro Max 充电曲线图,蓝色折线为充电功率,红色折线为电流,绿色折线为电压 诚然,VC 均热板在 Android 高端手机上已经屡见不鲜,但敢于果断抛弃大面积玻璃背板、将铝合金机身和 VC 共同设计为一个整体发挥效果,我们依然会感叹这确实是「技术驱动」的苹果,才能造出来的产品。 技术驱动这一点,落到 iPhone 17 Pro 全新升级的影像系统上,同样成立——我说的,就是那颗 4800 万像素的 4 倍长焦镜头。 iPhone 16 Pro 上面那颗 5 倍 1200 万像素的长焦镜头,经常被人诟病传感器过小、解析力不够,而 iPhone 17 Pro 将长焦原生倍率缩减到更常用的 4 倍(等效全画幅 100mm),并且将传感器面积扩大了 56%,不仅可以输出 4800 万像素的全尺寸照片,也能进一步裁切、当做的 1200 万像素的 8 倍长焦(等效全画幅 200mm)镜头来用,可以说进可攻退可守。 毕竟 iPhone 17 Pro 系列的主摄仍然是 24mm,从 1x 到 8x 实际上囊括了 24-200mm 的所有焦段——四舍五入,也相当于那颗被誉为「天涯镜」的腾龙 28-200mm 装在 iPhone 上了。 这套大底长焦的配置,也是许多国产影像旗舰手机采纳的方案——其带来的直接优势,就是 iPhone 17 Pro 调用长焦的频率相比 16 Pro 有了明显提升。 与此同时,苹果新的图像处理管线也不再固执己见,变得更愿意用适当的涂抹交换纯净度,显著提高了长焦的可用性: 影像系统的另一个重大更新,是全焦段都用上了 4800 万像素的融合镜头,使得 iPhone 17 Pro 系列的多镜头一致性更上一层楼,且超长焦和超广角镜头都变得更好用了,就算是在弱光或者室内环境,也能拍出质感在线的照片,而不至于满屏噪点: 超广角(0.5x): 超长焦(8x): 可惜的是,尽管 iPhone 传感器面积变大了,总的来说还是不够大……和国产旗舰相比,依然逃不过「底大一级压死人」的命运: 除了硬件升级,苹果还给原相机 app 加上了一款新的摄影风格「珠光」(Bright)。它的出片效果有点类似加两档曝光的富士胶片配方,是社交网络上最流行的色彩风格之一,更能轻松拍出适合亚洲肤色的「白里透红」效果,避免标准风格的黄蜡色调。 如果你用 iPhone 拍人像很多的话,爱范儿甚至建议你可以将「珠光」作为默认的摄影风格来使用。值得一提的是,它并非 Pro 系列独占,iPhone 17 以及更新 iOS 26 之后的 iPhone 16 系列都可以获得。 今年的 iPhone 17 Pro 仍然是「有史以来影像能力最好」的 iPhone。如果你此前就喜欢用 iPhone 拍、在 iPhone 上修、直接用 iPhone 发图的话,iPhone 17 Pro 是近年表现最好的一代,甚至掏出「苹替」Android 影像旗舰的机会都变少了。 至于今年 ProRes Raw 录制规格、Genlock 以及时间码功能的加入,更多是为了方便 iPhone 融入影视剧组中的工作流。 过去的一段时间,我们越来越多地看到 iPhone 出现在一些电影机难以触达的角落,比如《F1:极速狂飙》车身上用 iPhone 相机总成改装的固定机位,以及《惊变 28 年》中用十几台 iPhone 拼搭出的子弹时间相机: 图|TheVerge iPhone 17 Pro 上这些准专业功能(包括 299 美元的 Blackmagic 时间码拓展坞)可以帮助 iPhone 进一步在影视行业片场中站稳脚跟,整体来讲是在向着光谱中「更加专业化」的那一端推进的—— 这也是我们在今年 iPhone 17 全系列机型中看到的最大趋势:iPhone 17 让普适的更加普适,而 iPhone 17 Pro,则是让专业的更加专业。 而那个没有数字代际后缀的 iPhone Air 又代表了什么呢? iPhone Air:设计至上 由于国行 iPhone Air 推迟上市,评测也一并推迟了——编辑部那个对 Air 望眼欲穿的同事,只能自制壁纸解解馋了。 但,这并不妨碍我们为 iPhone Air 定下论调:尽管它既不普适也不专业,但 iPhone Air 代表的,仍然是那个「设计至上」的苹果。 此前,爱范儿曾报道过苹果在接下来两年的 iPhone 路线图,提到了由于要给折叠屏让路,iPhone 18 标准版可能和 e 系列一起推迟到 2027 年春季发布——明年秋季只有 iPhone 18 Pro/Max,和传闻中的折叠屏 iPhone。 图|9to5Mac 这样就将 iPhone 原本完全基于数字划分的机型迭代逻辑做出了调整。 爱范儿猜测:苹果接下来除了按照「秋季 Pro 春季标准版」的规律更新数字系列之外,还会不定期的推出像 iPhone Air 这样不含数字、只描述产品特点的设备。 这样的好处有两个,一是可以将 iPhone 的热度在一年的时间跨度里分配得更平均,避免了此前 9 月份发布、来年 Q2 和 Q3 的销售数据落底,要靠国补/大促「挽尊」的情况。 而是,这样做可以给用于技术验证的 iPhone 机型留下充足的空间,让苹果可以跳出传统的模式,做一些更加大胆的尝试。 今年的 iPhone Air 就是如此,它肯定不如 iPhone 17 实用,也不如 iPhone 17 Pro 好用。这也是爱范儿在开头提到的「妥协」所在——但 iPhone Air 却美得不可方物,更重要的是,给未来的 iPhone 留足了想象空间。 比如类似曾经的 12 寸 MacBook 与 M1 MacBook Air 一样,iPhone Air 的零件集成度非常高,主板几乎完全压在了镜头凸台下方,将剩余的空间全部留给了电池和尾插。 图|Apple Newsroom 这样的布局在 6.5 寸的 iPhone Air 里或许显得有些捉襟见肘,但是如果放在传闻中空间更充裕的「纯玻璃 iPhone」里面呢? iPhone Air 最大的意义,就在于其设计上的各种技术实践——专为无线连接性能定制的 N1 芯片、超高整合度的「高原」(plateau) 主板、抛光钛合金中框……许多激进的设计和妥协的功能,就这样被嵌入到同一部手机当中,有一种矛盾之美。 虽然 iPhone Air 和三星Galaxy S25 Edge 在硬件形态上都是超薄手机,但两者的产品思路是很不一样的。 三星的 S25 Edge 是将现有直板机的技术压缩到极致形成的超薄,优点是实用性更强,但是对于其他形态的指导和借鉴意义就没那么大了,是一种形态终末期的集大成者。 但 iPhone Air 是一款外在虽然近似,但内在和以往截然不同的产品,和当年的 iPhone X 一样,更像是新物种的开端。 当然,客观的现实就是,成熟技术的集大成者就是要比新物种的开路先锋更实用也更便宜,即使 iPhone Air 能够如期上市,我们仍然不推荐大家盲目下订。 更「安卓」的 iPhone,和三位一体的苹果 纵观今年的 iPhone 17 系列,我想你也会有类似的熟悉感:标准版加量不加价,旗舰款堆散热堆影像,还有概念机秀肌肉——所有这一切,不就是典型的「安卓思维」吗? 这里的「安卓」当然是褒义——国补到手价 5499 元的 iPhone 17 标准版截至开放预订前(约发布会后 30 小时左右),在单一电商平台已经积攒了超过 300 万预约量,是去年的十五倍。 可以预见的是,在今年的双十一、明年的 618,甚至明年的双十一时,叠加了平台优惠、店铺优惠和国补「3 buff」的 iPhone 17……没准会在一整年中的大部分时候销量霸榜。 尽管那时一定会有配置比它高、价格比它低的选择出现,但在 4000-6000 高端手机主流价位段,绝大多数消费者的选择是非常朴素的——高刷屏、性能好、充电快、拍照也过得去的新 iPhone,面对标新立异的同名手机,依然有着强大的竞争力。 我们可以用一个常见的商业概念来描述这样的需求:总拥有成本(Total Cost of Ownership, TCO)。不只是硬件,消费者对于系统和生态未来预期的「心理成本」,实际上也是手机 TCO 的构成部分。 而 iPhone 17 搭配 iOS 26,就是这个价位段一套 TCO 相对较低且稳定的选择,一台下单之后不需要担心马上过气的水桶机,同时拥有着现在行业内最强大的系统生态号召力。 iPhone 17 Pro 和 Pro Max 则比以往更加偏向「专业化的影视工具」,非常利好小型制作组、个人频道、规模不大的片场等等——《F1》电影爆火之后,苹果已经在电影制片行业站稳脚跟,后面应该能看到更多 iPhone 参与制作的影视内容。 至于 iPhone Air,我想会逐渐成为下一个世代 iPhone 设计的基准,通往智能手机进化的尽头。 无论如何,我们在今年的三台新 iPhone 上,看到了库存克星的苹果,也是技术驱动的苹果,更是设计至上的苹果——这是属于苹果的三位一体。 我当然希望每年的每一款 iPhone 都能臻于完美,也同样欢迎 iPhone 像「安卓」手机一样好用——只是对于本就竞争激烈的主流价位段,新 iPhone 的到来,可能会给竞争对手们,狠狠上点强度。
腾讯最新开源太牛了,AI一键去油、告别塑料感!登顶Hugging Face模型榜
智东西 作者 | 陈骏达 编辑 | 心缘 那些画风“油腻”的AI生图,终于有救了? 智东西9月16日报道,腾讯近期开源势头太猛了,最新发布的图像模型算法SRPO登上Hugging Face趋势榜首,并在趋势榜前3占2。 目前Hugging Face模型趋势榜前6中,有5个均来自国内企业,被腾讯、百度、阿里包揽。 SRPO由腾讯混元生图团队联合香港中文大学(深圳)、清华大学联合开发,9月13日开源,已发布完整训练代码及技巧,社区量化版本下载量达1.6万次,Github Star数量超过600。 SRPO的全称是Semantic Relative Preference Optimization(语义相对偏好优化),旨在解决当前开源社区中热门AI生图模型Flux生成人像时皮肤质感差、过于油腻的问题。 通过在线调整奖励偏好、优化早期生成轨迹等手段,SRPO可改善图像生成效果,能将模型生成图片的真实度、美学优秀率的人类评估提升超300%。 Flux与SRPO生成效果对比 在取得更好效果的同时,SRPO大幅提升了训练效率,在32卡设置下,仅需10分钟(5.3GPU卡时)就可以完成训练,效率相比DanceGRPO提升了75倍。 开发者可在ComfyUI中使用SRPO,仅需将下图导入ComfyUI即可获取完整工作流,或者直接加载SRPO-workflow的JSON文件。 目前,SRPO已被上传至Hugging Face、Github等开源托管平台,相关技术报告已发布。 论文链接: https://arxiv.org/abs/2509.06942 项目主页: https://tencent.github.io/srpo-project-page/ GitHub: https://github.com/Tencent-Hunyuan/SRPO Hugging Face: https://huggingface.co/tencent/SRPO 开源社区还在其基础上制作了多个量化版本。 量化版本链接: https://huggingface.co/wikeeyang/SRPO-Refine-Quantized-v1.0 https://huggingface.co/befox/SRPO-GGUF https://huggingface.co/rockerBOO/flux.1-dev-SRPO 一、引入新型采样策略,给去噪提供“标准答案” 在SRPO中,研究团队引入了一种用于扩散微调的新型采样策略Direct-Align,可以有效地恢复高度噪声的图像,从而使优化过程更加稳定且计算要求更低,尤其是在初始时间步骤中。 当前主流的方法主要依赖多步采样器(如DDIM)结合直接梯度反传来将生成过程与奖励偏好对齐,计算成本高且容易出现梯度爆炸和优化不稳定。因此,现有方法通常只能优化生成轨迹的后半段。 这种“仅优化后半段”的策略极易导致奖励模型在高频信息上的过拟合问题。实验结果表明,模型会逐渐学会“钻奖励模型的空子”——具体表现为:HPSv2奖励模型会偏好偏红色调的图像,PickScore倾向于紫色图像,而ImageReward则容易对过曝区域给出过高评分。 SRPO的研究团队发现,解决采样瓶颈的秘密就在于扩散模型的前向公式:中间图像是噪声和干净图像的插值。这一发现表明只要掌握噪声先验的参考信息,就可以通过精确插值重建扩散轨迹上的任意中间状态。 基于这一理论发现,该团队创新性地提出了Direct-Align方法:首先对输入图像进行可控的噪声注入,随后通过单步模型推理,最后借助预先注入的噪声作为“参考锚点”进行图像重建。 这种带有“标准答案”的去噪方式,相比ReFL等直接依赖模型预测的传统方法,显著降低了重建误差,实现了更精准的奖励信号传导。 二、有效避免奖励破解,给模型加上“语义方向盘” SRPO的研究团队改进了直接利用奖励信号进行反向传播的方法(例如ReFL和DRaFT)的训练策略,并直接使用负奖励对模型进行正则化,无需KL散度或单独的奖励系统。同时,该团队还首次在模型中加入了动态可控的文本条件,能够在奖励模型范围内动态调整对风格的奖励偏好。 上述调整的原因是,文生图的在线强化学习方法(如ReFL、DRaFT)通过直接采样图片并反传可微奖励梯度,训练效率高,但高度依赖预训练奖励模型,这些模型难以满足多样化、高质量的后训练需求。 例如,用旧奖励模型优化新架构(如SD3、Flux)或提升特定美学维度时,效果有限。传统做法需大量离线优化、微调奖励模型或手工设计复合奖励函数,耗时且难以快速应对新需求。 SRPO的研究团队发现,当前主流的图像-文本双分支奖励模型,可以视为以文本分支的输出为模型参数关于图片特征的函数。这样一来,通过调整文本分支的语义特征,就能有效引导整个奖励模型的偏好方向。 基于此,SRPO的研究团队性提出了“语义引导偏好”机制,通过为奖励模型添加特定的控制提示词(如“真实感”)来定向调整其优化目标。实验结果显示,某些精心设计的控制词能够增强奖励模型在真实感等特定维度的优化能力。 然而,研究团队进一步发现,单纯的语义引导仍存在奖励破解(reward hacking)的风险,而奖励偏差主要源自图像分支(因为文本分支不参与梯度反传)。 针对这一问题,团队提出了创新的“语义相对偏好优化”策略:同时使用正向词和负向词作为引导信号,通过负向梯度有效中和奖励模型的一般性偏差,同时保留语义差异中的特定偏好。 在具体实现上,为了平衡训练效率和负向词强度,团队采用了加权奖励公式的设计,其实现机制类似于无分类器引导(classifier-free guidance)。 实验结果显示,SRPO显著增强奖励模型在真实度等特定维度的优化能力。这一突破性方法为长期受困于高质量数据获取难题的研究者,提供了一条更加直接高效的优化路径,有望显著降低模型优化的门槛和成本。 三、美学优秀率、真实度提升超300%,未出现明显奖励破解 SRPO的研究团队在HPDv2基准测试上对方法进行了评估。HPDv2是一个文生图领域广泛使用的基准,用来衡量模型生成图像的质量,特别是与人类偏好(human preferences)对齐的程度。 在测试中,Direct-Align方法在Aesthetic predictor v2.5(AE)、PickScore等主流评测指标上均已达到SOTA水平,而结合SRPO后,在AE和PickScore等关键指标上更是取得明显提升。 在人类评估方面,与Direct-Align等直接优化奖励偏好的方法不同,SRPO不会因奖励破解而牺牲真实感,能够在不依赖额外训练数据的情况下,将模型的美学优秀率从8.2%提升至38.9%,提升幅度超过300%,图像感知真实度提升同样超过300%。 用SRPO增强后的FLUX.1.dev超过了最新的开源模型FLUX.1.krea,仅需不到1500张图像即可实现有效训练。 更为关键的是,SRPO未出现明显的奖励破解现象,验证了Direct-Align的设计能够有效去除奖励偏差,模型真实感显著提升。 在主流奖励模型上,SRPO也未出现偏色等奖励破解问题。 SRPO具备细粒度的人类偏好优化能力,通过引入控制词能够显著提升在常见风格(如亮度调整、漫画、概念艺术)上的可控性,但在低频风格(如赛博朋克)中则受到奖励模型识别能力的限制。 最后,研究还发现Direct-Align具备类似监督微调的拟合特性,当结合真实照片作为离线数据时,SRPO能进一步增强图像真实感。 结语:系统提升扩散模型真实感,可控性与可解释性将成优化方向 与单纯的数据拟合方法不同,SRPO同时整合了人类偏好信号与强化学习优化。SRPO研究团队认为,这是首个大规模扩散模型中系统性提升真实感的完整方法。 不过,SRPO在可控性和可解释性上仍存在一定局限。该团队计划通过更系统的控制策略、可学习的控制词以及针对控制信号优化的视觉语言模型奖励来提升方法的可控性与泛化能力。
对话腾讯副总裁、腾讯智慧出行总裁钟翔平:在车上点麦当劳这件事,很简单,也很复杂
与腾讯集团副总裁、腾讯智慧出行总裁钟翔平的采访并不像以往的采访那样发生在会议室或者咖啡馆这种场景,而是在位于深圳宝安大铲湾的腾讯新总部与宝安中心地铁站之间的自动驾驶摆渡小巴士上进行的。 这辆小巴士将来会用于腾讯员工通勤的接送,达到了 L4 级别的自动驾驶水平,搭载了腾讯自研技术。 即便腾讯这家公司对大家生活的影响如此之深,但在汽车领域,腾讯做的事情却并不显性,我们当中的大多数人没法像使用微信,玩《王者荣耀》那样亲身感受腾讯为员工准备的自动驾驶小巴士,但这并不意味着腾讯没有影响我们的出行。 相反,腾讯对智慧出行的影响,无论是从链条的长度,还是时间线上的长度,都可能是腾讯所有业务里最为深远的之一。 在车上点个麦当劳,和腾讯云有关系吗? 2025 腾讯全球数字生态大会出行专场上,腾讯发布了 TAI 6.0 智能座舱系统和全域智能化升级方案,通过「端云一体」的新一代座舱大模型矩阵与 AI Agent 架构。在端侧,基于混元深度定制的 LLM ,TAI 6.0 智能座舱系统推理速度提升 81%,并在长上下文窗口中,实现对车身传感器信号理解的准确率超 97.5%。新发布的 VLM 多模态模型在舱内人物识别准确率超 97.5%,舱外环境感知超 98%。 可实现场景与意图的精准理解,并通过自研端云模型协同策略,达成快速响应,意图理解时延小于 500 毫秒、准确率超 95%。AI agent 架构支持微信小程序、LBS、联网搜索等丰富信源扩展和腾讯生态能力,车企与第三方可通过标准化接口轻量接入智能体开发。 围绕出行全场景,TAI 6.0 推出五大智能体: 本地生活智能体:用户可实现自然语言交互,无缝连接车外生活服务,例如智能体可基于用户偏好,主动推荐餐厅优惠信息,也实能现边聊边问的拟人化服务体验,支持下单、支付全流程操作。 全能陪伴智能体「随行Chat」:聚焦车内情感陪伴需求,提供包括儿童故事陪伴、专业知识交流及娱乐八卦互动等多角色在内的聊天服务。 出行探索智能体「哪儿值得去」:场景化出行服务,可主动发现沿途兴趣点,智能生成顺路打卡路线,并提供目的地讲解、提前购票等服务。 出行连接智能体:打破车机与手机的服务边界,依托小程序生态,实现一键连接、内容流转与多用户协同控制,支持音乐、文章等多种内容类型无缝车机同步。 腾讯地图车机版 9.0 升级为 AI 地图导航智能体:实现 AI 指路、AI 服务、AI 陪伴等更人性化的产品体验。 举一个例子就可以理解这些智能体的作用了,以往我们在开车的时候想要点一顿麦当劳吃,那就必须要停车到路边,用手机进小程序点单,然后开车前往取餐。 现在有了这些智能体,加上整个腾讯生态,包括小程序和微信支付,就完全可以通过车内语音交互,找到附近的麦当劳,通过语音沟通,选择想要的餐品,然后在车机内支付,再导航过去取餐,整个流程完全不需要使用手机,驾驶者也不需要停车,甚至可以不需要怎么看车机屏幕就可以完成这一切。 这种场景体验的变化,背后其实是我们怎么看待「车」这种产品,钟翔平告诉爱范儿: 车可以看成两种属性,一个就像让人从 A 点到 B 点的一个载具,这个车从古至今都是有这个能力属性定位的。另外也是因为智能化、移动化发展之后形成一种新的车型,就是移动空间。移动空间这个特性是一个非常重要的延伸。 一个是载具,一个是空间。载具的这个属性的进化,其实将来服务化就是智能驾驶,就是让车自己完成从 A 点到 B点。但是作为空间的时候,它发展的方向就不一样了,它致力的就是让人很舒心,符合他对这个空间场景的期待。比如说有的场景我们希望这个地方是一个会议室,它可能要很方便开会。有的时候我们希望它是一个影院,它是可以看电影。还有更多的场景,是一个游戏室,然后更多的一些娱乐内容,甚至是我们让这个空间比如说让它帮我们订好咖啡,我们到下一个地点可以去取。所有这些都是移动空间带来的用户对它的期待。所有这些我们都会在智能座舱这个方向上更好地地打造。 TAI 6.0 致力于用端侧模型和云端大模型结合,对用户既能够很快的反应,同时也能够更全地去调动云端的能力解决更复杂的任务。腾讯也会将 AI Agent,加上广泛的服务生态,然后再加上位置服务能力这三种能力叠加在一起,形成一个让用户可以在车内结合出行位置,结合他可能期待的也许是咖啡,也许是订座,也许是点餐,或者是一些内容服务,都可以结合这几个放在一起形成最优体验。 有很多内容和服务的组件它原本就在,但是它缺少被用户用语音的方式启动,或者符合场景的方式去调度。我们用 AI 化的方式就完成了这一点,既清晰知道你的地点,知道你的路线,知道你什么时间可能到达哪个地方,这个时候我需要在那个地方提前或者是预约某一个时间,点一杯咖啡或者是点一个座,它都可以帮你去做到。当然这个也结合腾讯很重要的优势,我们有广泛的小程序生态。而且我们车端在很早之前就已经成熟化完成小程序框架,因为框架以及小程序本身就是现成的,我们结合 AI 时代之后,我们让大模型再结合更多的 Agent 的调用,使得它获得更完美的体验。 现在,腾讯的智能座舱产品在 60 多个汽车品牌、超过 1600 万车辆中应用。 我们可以这么理解腾讯在智慧出行上的产业链布局:点麦当劳作为单点场景,牵一发而动全身,从底层的云服务,到地图数据,再到小程序生态,还有支付能力等等,缺一个点就吃不到汉堡了。以此,我们也可以反推,腾讯智慧出行,究竟在出行里扮演了什么角色。 在 AI Infra 这一基础设施层,腾讯提供了腾讯云等服务,涉及高性能计算,高性能网络和高性能存储等服务。而在 AI Platform 的平台层,腾讯提供了自研的混元大模型以及开源的 DeepSeek 大模型等等技术,来提供各种直接的 AI 能力。在 AI Application 应用层,就有我们熟悉的微信各种能力,元宝应用等等等了。 那么问题来了,腾讯拥有几乎全栈的汽车智能化能力,自己也有能力做到 L4 级别的自动驾驶摆渡小巴士,为什么不像 Google 或者百度那样,直接提供自动驾驶整体方案,甚至是 RoboTaxi 服务呢? 钟翔平说: 每家公司有每家公司的定位,因为腾讯在 2018 年进行重要的战略转型升级的时候,当时就在思考如何做产业互联网,我们当时说扎根消费互联网,拥抱产业互联网。但同时我们清晰地对待产业互联网,想清楚我们的定位,我们叫数字化助手。 数字化助手这个定位是经过深度思考之后形成的,因为本质就是强调我们不是站在前面的那个角色,我们其实既是背后的助力者,有一些场景我们也会是伴随着企业客户,成为他们的数字化共建者,但是我们不是进入到他们行业里面去成为那个玩家。所以我们不断强调,我们不做 Robotaxi 也好,不做自动驾驶车,本质都还是遵循数字化助手这个定位。 当然,这个助手不仅仅是相对于用户来说,对于车企或者经销商来说,都能从腾讯获得想要的助力。 比如说,腾讯结合 SD 地图、轻地图、地图数据服务等云化地图能力,与博世、文远智行、元戎启行等出行科技公司携手,提高自动驾驶训练效率。在腾讯的云地图数据和合规服务的支持下,文远知行联手博世仅用 18 个月即完成了智能辅助驾驶方案的量产上车。 同时,腾讯与广汽、长安、蔚来汽车等车企合作,以智驾云专区、AI Infra、大数据等工具和云图一体化的数据闭环方案,加速端到端自动驾驶落地。 在营销服务环节,AI 销售助手,正在借助大模型能力,辅助销售员整合信息、专业应答,推动线索转化从流程化全面迈向智能化。在服务一汽大众等企业时,试驾线索成本降低了 20% 以上,到店转化率提升 30% 以上。 ▲ 腾讯 2024 年展示的「养老机器人」小五 腾讯做自动驾驶能理解,为什么还做具身智能? 如果说一个在车上点麦当劳的场景,能够牵扯出腾讯在出行产业链上的长度和深度,那么关于具身智能的布局,则反馈出了腾讯在一条技术脉络上的长远思考。 在 2025 腾讯全球数字生态大会上,腾讯联合文远知行、黑芝麻、光轮智能等出行科技企业,发布面向具身智能研发场景的全链路工具链。 面对具身智能数据管理存在的全局治理难、多模数据保存与处理难等问题,腾讯推出的智能数据平台已实现 EB 级具身智能多模态数据的统一接入、治理与标注。腾讯也与文远知行联合打造从数据采集到模型部署的全栈 AI 数据闭环解决方案,为具身智能提供精准、丰富的训练数据支持。 此外,基于在自动驾驶领域积累的端云一体化闭环工具链,腾讯可以提供覆盖「数据采集-标注-挖掘-模型训练-仿真评测」全流程的具身智能研发能力。腾讯基于 3DGS、时序建模等技术实现的仿真环境,支持 L2-L4 级自动驾驶算法训练和 VLA 模型验证,并可扩展至具身智能算法开发。 今年 7 月,腾讯 Robotics X 实验室与福田实验室联合发布了具身智能开放平台Tairos 「钛螺丝」,这是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,通过 SDK 和 API 的方式面向机器人行业开放。截止到目前,Tairos 已经与越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技、宇树科技等多家具身智能企业探索合作。 同时,为验证自动驾驶技术在具身智能领域的应用潜力,腾讯以「导盲机器人」为载体,构建多模态感知规划、避障导航与交互能力,为四足机器狗、人行机器人等低速移动智能终端提供「无图」导航解决方案。 虽然自动驾驶和具身智能没有一个字是一样的,但是在钟翔平看来,汽车企业具备布局具身智能产业先天优势,「感知、决策、交互」等自动驾驶基础能力,能够与具身智能体结合,技术上一脉相承。 甚至,它们现在就发生了交集:腾讯自研的四足机器狗,在大铲湾腾讯新总部里,完成了自动驾驶小巴的上下车测试。 ▲ 腾讯新总部 钟翔平说: 车本身就是一个非常成熟的,非常好的实践中的具身智能体。因为车具备了感知能力、智能化的计算能力,然后实践中去打磨具身智能的应该叫物理智能,或者是空间智能。 在这个方向上面我们也沉淀出来一系列的工具集,一系列的工程方法都会应用到具身智能这个方向。 机器人相关的具身智能,会和智能驾驶会有所变化,这个变化主要会在于智能驾驶其实还是跟路本身高度关联,到了机器人也好,或者是到了更广泛的通行区域,更广泛的生活场景中的这种智能体,它面对的场景数据的要求并不是遵循着一个路的模式,这个时候会使得它需要因为数据自由度的扩大而带来的数据的量级急速攀升。当这个数据量级需要急剧攀升的时候仿真在其中扮演的价值和作用其实会更加扩大。 腾讯智慧出行解决方案总经理费玉霞解释了腾讯在这里布局的底层逻辑: 2025 年,Physical AI 成为行业的新焦点,自动驾驶和具身智能是 Physical AI 的不同形态,其核心技术底座高度重合,我们全面升级在自动驾驶领域的积累,积极投入具身智能,取得了阶段性的成果。 现今,具身智能产业正从价值验证迈向规模爆发,但是我们也看到支撑智能算法相对滞后,还有一些困难需要我们共同去解决。困难一研发落地路径长,研发中需要将上百个不同模块的软硬件深度融合,需要懂硬件、懂系统、懂数据、懂算法、懂仿真的专业团队,超过三年的研发投入才有可能有所产出,急需一套工具平台加速研发流程。 某种程度上来说,腾讯在具身智能领域,依旧扮演着「数字化助手」的角色,一来是因为自动驾驶和具身智能的技术脉络是一脉相承的,另一方面,具身智能也是 AI 技术的延续,在 Physical AI 领域的布局,也是 AI 布局的子项,没有哪家科技公司,敢在这个时代忽略 AI 机会。 当然,这一切都还在早期,也正如钟翔平所说: 智能驾驶本身就是一个很好的具身智能实践过程,因为是一个行进在路上的车,让这个车本身变成一个高度的智能化。它要解决的矛盾首先就很多,它要让车能够和人之间如何协调共处,让智能的车和非智能的车如何和谐共处。 其实这些问题在智能驾驶这个方向上已经到了一个相对收敛期。这个收敛的过程所形成的经验,或者是一些思考的沉淀或许是一种很抽象的思维的沉淀,我都会认为对于后续解决不同场景的具身智能会有参考和借鉴意义。 在我们聊这种时间维度的时候,9 年前腾讯成立了自动驾驶实验室与此时运行在宝安中心地铁站和腾讯新总部的自动驾驶小巴士形成了互文。当时腾讯在出行领域还没有形成如今清晰的布局和认知以及定位,但对于自动驾驶全栈方案的探索,形成了如今的工具集,以及提供给车企和自动驾驶科技公司的能力。 所以,今天对于具身智能的前瞻性探索,未来也可能形成这种能力。
腾讯云智能体开发平台3.0亮相,QQ浏览器“Agent助理”预计10月底上线
作者|江宇 编辑|漠影 智东西9月17日报道,腾讯在今日举办的AI Agent产业应用峰会上,系统介绍了腾讯云智能体开发平台3.0版本,并宣布该平台全球开放。同时,腾讯还预告QQ浏览器将在10月底上线“订阅助理”功能,由该平台内置的智能体框架驱动,可自动构建个性化内容推送流。 开场环节,腾讯集团高级执行副总裁汤道生以数字分身身份亮相,完成整段演讲。他指出腾讯AI发展始终锚定两个方向:一是内部多元生态的实践,二是外部产业的真实需求。 他还提到,大模型落地效果较好的场景包括客服、销售话术、知识问答、情感陪伴、文档总结等,需要将语言与逻辑推理能力与企业数据、流程结合,同时具备联网与系统调用能力,完成任务。 针对这些现实需求,腾讯还在会上披露了智能体开发平台3.0的技术机制:通过接入大模型,融合文档解析、知识检索、流程编排等组件,帮助企业将原有的数据、规则与任务流程结构化拆解,并交由Agent完成问答、调用或执行。在处理复杂任务时,平台也支持多Agent协同,并可嵌入企业原有系统中运行。 一、智能体开发平台3.0版本上线,开放全链路Agent开发能力 在本次峰会上,腾讯云副总裁吴运声对昨日发布的腾讯智能体开发平台3.0进行了详细介绍。 据其介绍,腾讯云智能体开发平台面向企业用户提供完整的智能体构建能力,底层能力包括权限体系、数据库、合规机制与运行环境,中间集成RAG引擎、工作流引擎与Agent引擎,同时配套模型广场、插件工厂、构建模板等模块,支持从开发、调试、评测、发布到运营的全生命周期管理。 该平台支持多种模型对接,既包括腾讯混元、DeepSeek等内置模型,也可通过API调用第三方模型。用户可在腾讯的模型广场Ti-ONE中一键授权调用训练所需的模型,符合兼容协议的第三方模型也可直接接入平台使用。 此次升级还引入了“双层权限体系”,支持企业与空间两个维度分别设定访问控制,并细化至知识库条目级别的功能权限与数据权限,满足大型组织的实际需求。腾讯智能体开发平台还提供了实践模板机制,在任务执行过程中自动规划操作路径,并由多个Agent协同完成。 吴运声称,腾讯云智能体开发平台从传统RAG升级为“Agentic RAG”,支持更复杂问题的多轮拆解与检索,结合知识库逐步完成链路。Multi-Agent能力也全面升级,Agent之间的转交路径可在工作流中明确配置,并可与已有系统节点打通,形成更强的业务组合能力。 吴运声还提到,为判断智能体在实际任务中的表现,该平台提供了基准评测、对比评测等多种方式,支持使用裁判模型、规则逻辑或自定义代码进行打分。在对比评测中,开发者可以指定多个模型或多个提示词进行效果比对,用于调优或发布前的评估。 二、B端有落地案例,C端产品陆续亮相,覆盖政企与用户两侧 吴运声现场透露,腾讯智能体开发平台已在质检、巡检、媒体处理、酒店客服、政务办公、营销自动化等多个场景中落地。 例如,在工业质检领域,以往需用上千张图像训练新模型,而通过智能体方式,仅需不到50张图片配合已有插件与大模型能力,即可完成样本分析与缺陷识别; 在智能巡检中,该平台支持对井盖缺失、施工人员着装、水位监测、山火预警等问题的识别和任务执行,不再依赖为每个新场景定制训练小模型。 媒体内容处理方面,腾讯将智能体用于电视台视频剪辑任务中,实现切片、标签、语义检索的全流程接入。吴运声谈道,以往处理春晚这类四小时视频需手动剪为数百段,再靠标签查找;智能体引入后可直接通过自然语言提问,结合多模态理解完成片段定位。 在政务服务方面,腾讯云智能体已应用于宝安区政数局,构建覆盖民生、企业服务、政务办公、社会治理等多个领域的智能体体系,统一调用知识库与接口进行日常响应。在邯郸公积金场景中,腾讯云智能体则将刷脸认证与电子签名集成进工作流,配合原有业务流程,显著缩短办理流程。 酒店服务场景中,腾讯与华住集团合作构建30多条工作流,覆盖酒店信息、周边服务等咨询类任务,减少人工前台压力。 营销领域则实现从人群圈定、商品选择、内容生成、渠道分发到效果分析的五个Agent组合,串联完成营销任务。 此外,吴运声还提到腾讯也在探索个人智能体构建的通用能力,面向内容创作者、知识工作者提供定制Agent方案。峰会上,他也展示了吴晓波、杨国安等IP Agent的案例,均由知识库与多轮问答组成,同时接入数字人形象,可在小程序中实现“模拟本人”的对话体验。该平台可为该类应用提供模板、流程与调试支持,无需开发者自行训练模型。 面向C端用户,腾讯也提到了智能体构建工具“腾讯元器”,可用于一键创建公众号智能体,并结合微信生态完成自动响应。 目前,“腾讯元器”已与多个公众号合作,如中国石化“小石头”已导入历史文章并接入问答服务。 腾讯云副总裁吴永坚还在会上透露,QQ浏览器将在10月底上线“订阅助理Agent”,由ADP Agent框架驱动,用户可通过自然语言设定感兴趣区域与主题,系统将自动生成订阅流,并推送相关企业报告、行业资讯与新品动态。 三、GraphRAG与优图Agent已开源,Embedding模型即将上线 会上,腾讯公布了一系列智能体相关技术的开源进展。 目前,Youtu-Agent智能体开发框架已开放,支持结合开源模型构建可实战部署的Agent系统。 Youtu-GraphRAG知识图谱模块也已上线,减少Token消耗的同时提升图谱构建效率。 接下来,优图实验室将陆续开源Youtu-Embedding、Video-MME V2、Youtu-Parsing等能力。其中,Youtu-Parsing是新一代端到端文档解析模型,在OmniDocBench等榜单上取得领先成绩,可适用于金融、政务、医疗、教育、法律等复杂文档解析场景。 吴运声指出,未来还将陆续更新更多技术工具,以推动智能体生态发展。 结语:从工具到实际应用,智能体正在落地 大模型之后,智能体成为企业持续试验的一种新方向。从语义问答到工作流调用,许多企业正尝试把AI拉入更具体的业务单元里。平台怎么设计、任务怎么落地、开发方式能不能继续压缩,仍有不少细节等待验证。但可以看出,智能体产品化的长跑,已经开始了。
被极氪001震撼到后 奥迪也造了一款全新纯电车
2021年,极氪001首次问世亮相,传言当时奥迪高管们被这款拥有浓厚欧洲美学风格的EV电动车所深深震撼,意识到若想与中国车企竞争,必须需要借鉴中国的技术。 9月16日,奥迪E5 Sportback正式上市,新车共推出四款车型,先锋型卖23.59万元;先锋Plus型卖26.99万元;先锋quattro型卖26.99万元;旗舰quattro型卖31.99万元,叠加万元保险现金权益后,新车实际到手价仅22万元起。 这个定价策略与极氪001高度相似,是后者销量成功的一大重要因素。标准版拉低购车门槛,中配版四驱与后驱同价,顶配版树立产品力标杆。所有消费者都能找到最适合自己的选择,无需纠结,不留遗憾。 曾几何时,谁能料到BBA的纯电新车可以有如此诱惑力的定价。很明显,E5 Sportback就是奥迪真正采用中国“本土化”思维造车的成果,是与特斯拉Model 3、极氪001、小米SU7等热门竞品正面较量的新武器。 奥迪也来造纯电“猎装车” “瓦罐”源于奥迪。 Avant、allroad、RS Avant三大系列共同铸就了奥迪最光辉的旅行车家族,是全球汽车文化极其浓墨重彩的一笔,至今影响着无数用户。这就说明为什么奥迪高管们会在看到极氪001时,内心被深度震撼。因为在纯电时代,对手抢走了奥迪的“掌上明珠”。 E5 Sportback看似新生,实则是种“回归”,更是“重铸荣光”。新车首先继承了奥迪旅行车的经典车身设计线条,车长4881mm宽1960mm高1479mm,轴距2950mm,兼具宽阔空间与宽体运动低趴姿态,前脸首发“星钻光幕”设计,与空气动力学组件及传感器融合构成一体化科技格栅,传承了奥迪“灯厂”的美誉。 新车四驱版车型双电机峰值功率最高可达579kW,零百加速仅需3.4s,峰值扭矩接近800N·m,还配备了奥迪quattro智能四驱系统,搭配Brembo四活塞高性能制动系统,以及CDC连续可变阻尼悬架等。 德系百年工程文化底蕴,被完整地赋予到了E5 Sportback身上,这次奥迪确实给足了诚意。 本土造车,追赶智能化 E5 Sportback另一大特色,就是它融合了奥迪“造中国车”的本土思维,是BBA纯电转型的杰出成果代表。 智能座舱上,新车配备一块59英寸4K超宽贯穿屏,搭配高通骁龙8295座舱芯片和全新本土化打造的AUDI OS操作系统,内置深度定制的火山引擎大语言模型“豆包”,支持多轮对话及车控交互等语音助手能力。 智能驾驶方面,该车是BBA中首个率先采用Momenta中国本土供应商提供的高级辅助驾驶方案,搭载激光雷达和英伟达Orin-X芯片,全面覆盖城市、高速与泊车全场景端到端体验,并开发出行业首个“德系Driving DNA”,提供柔和、敏捷、标准三种辅助驾驶模式,融合中国用户驾驶习惯和纯正奥迪驾控质感。 有Momenta、字节跳动、阿里巴巴、上汽高科等一系列中国供应商的背后支持,可以说奥迪E5 Sportback的智能化表现,直接跃升国内第一梯队,从短板变成优势,大幅超越BBA其他传统车型。 无论是从外观、空间,动力性能,还有定价等各方面看,奥迪E5 Sportback如同“极氪001”再生。而后者在过去国内市场三年里实现了前所未有的销量成功,也凭一己之力引领了纯电猎装潮流,虽引来众多模仿者跟随,但地位和影响力至今无可撼动。 但这次,说实话我同样被奥迪E5 Sportback所惊艳到了。当“猎装旅行车”的鼻祖出手,将德系核心基因与中国本土科技完美融合,这台车所表现出的产品力确实非常吸引人。官方数据显示,新车上市30分钟内订单量便突破10153台。 这次,奥迪纯电猎装或许真的可以重铸荣光。 责任编辑:振亭
iPhone 17发布前,苹果今夏中国手机销量下滑6%未进前五
苹果上海门店 凤凰网科技讯 北京时间9月17日,据彭博社报道,就在iPhone 17发布前的几周,苹果在中国的智能手机销量较上年同期下滑了6%,这一跌幅比新旗舰机发布前通常的销量下滑更严重。 市场研究公司Counterpoint Research的报告显示,在今年第三季度的前八周时间里,苹果并非唯一在夏季销量不佳的公司,小米、vivo 和荣耀的销量也出现了不同程度的下滑。今年7月和8月,中国整体智能机市场销量同比下滑了2%。 中国是全球最大智能手机市场,也是苹果继美国本土之后最重要的市场。苹果CEO蒂姆·库克(Tim Cook)称,苹果第三财季重新在大中华区恢复收入增长,一定程度上得益于政府补贴的推动。 苹果未进前五 不过,苹果仍需努力才能重新夺回市场领先地位。根据Counterpoint的数据,苹果在中国的市场份额仅为12%,位列第六。今夏,小米、OPPO 和华为的市场份额均为16%。而在这个竞争激烈的市场中,排名第一的vivo也仅仅略占优势,市场份额为19%。 新iPhone 17系列被视为苹果多年来对iPhone进行的最重大升级,采用了全新设计和大幅强化的相机系统。该系列将于本周五在全球开售。作为回应,小米已将其下一代旗舰手机的发布提前至本月。小米联合创始人兼CEO雷军表示,他希望小米17能够全面对标iPhone。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
2026款腾势N9发布:零百加速3.9秒、搭载天神之眼B辅助驾驶,38.98万元起
凤凰网科技讯 9月17日,比亚迪旗下高端品牌腾势今日正式发布2026款N9全尺寸SUV,新车共提供三个配置版本,市场指导价格区间为38.98万元-44.98万元。作为腾势品牌的旗舰级产品,N9在智能化配置和豪华体验方面实现了显著提升,实现了内外进阶升级推新。 在外观设计层面,新车保持了腾势品牌一贯的设计理念,采用封闭式前脸搭配分体式矩阵LED灯组,配备AGS主动进气格栅系统以提升空气动力学表现。车顶集成的瞭望式激光雷达设计相对低调,隐藏式车门把手进一步强化了整车的科技感。值得关注的是,新车新增霜云茶、紫瑢金、红雅金、蓝辰银、绿华银等五种双拼配色方案,为消费者提供更多个性化选择。 智能驾驶技术是腾势N9的核心亮点之一。新车搭载比亚迪自研的天神之眼B辅助驾驶系统,硬件配置包含1颗高精度激光雷达、5颗毫米波雷达、12颗摄像头以及12颗超声波雷达,运算平台采用英伟达Orin X芯片。该系统支持端到端无图城市领航辅助驾驶功能,车位到车位自动泊车功能将于第四季度通过OTA升级推送。 车身参数方面,腾势N9的长宽高尺寸为5258mm×2030mm×1830mm,轴距达到3125mm。在通过性能上,新车最大离地间隙222mm,接近角21°,离去角22°,空气悬架调节行程±50mm,最大涉水深度550mm,并标配电动踏板辅助上下车。 N9搭载DiLink 150智能座舱系统,配备13.2英寸液晶仪表、17.3英寸中控触屏、13.2英寸副驾娱乐屏幕,以及50英寸AR-HUD抬头显示系统。座椅布局采用2+2+2六座设计,副驾配备零重力座椅,第二排提供小桌板功能,车内还配备双50W无线充电板、17.3英寸吸顶娱乐屏幕以及车载冰箱等豪华配置。前排和第二排座椅支持加热、通风、按摩功能,第三排座椅同样配备电动调节和加热功能。 动力系统方面,腾势N9采用插电式混合动力技术,搭载2.0T插混专用发动机配合680千瓦前后三电机系统,百公里加速时间仅需3.9秒。续航表现上,新车纯电行驶里程可达230公里,综合续航里程达到1330公里。底盘系统配备云辇-A双腔空气悬架与预瞄调节系统,可实时调整悬架阻尼特性,同时支持后轮转向、圆规调头、蟹行模式等高阶驾驶功能。 2026款腾势N9搭载易三方平台,三电机独立驱动(总功率925匹)结合后轮双电机主动转向,实现11级强风不跑偏、高速爆胎不失控。在鱼钩测试中以210km/h的速度成功避让,刷新了世界纪录。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。