行业分类:
加载中...
头条分类:
加载中...
离谱:为在飞机上免费上网,留学生尝试侵入航司服务器被治安处罚
IT之家 11 月 18 日消息,据中国民航报今日报道,为免费上网,留学生竟在飞行途中尝试侵入航司的机上无线网络后台服务器。上海机场公安近日对违法人员给予了治安处罚。 10 月 29 日,一家负责某航司网络运营维护的网络科技服务公司通过系统监测发现,当日飞行中的一班墨尔本飞上海浦东航班上,有一旅客正对机上无线网络的后台服务器进行漏洞扫描及尝试侵入。企业迅速识别并阻止了上述行为,避免了实际损失的发生,这家企业随后在搜集相关信息后报警。 通过对后台数据梳理分析,发起攻击行为的人员被锁定为旅客艾某,上海机场公安随即依法传唤艾某接受调查。 据艾某交代,其为留学生,在飞行期间听闻旁人说起可在飞机上连接机上无线网络,便通过电脑软件使用网络环境监测、系统漏洞扫描、IP 地址搜集等方法,试图绕过限制,免费长时间连接飞机网络。 艾某侵入计算机信息系统的行为已违反了相关法律,其行为可能造成网络服务公司切断服务器,导致航司在飞的所有航班上的无线网络停止服务,如果侵入成功,甚至会造成航班旅客信息泄露。根据《治安管理处罚法》,上海机场公安已对艾某依法进行查处。 IT之家查询公开资料获悉,入侵服务器属于违法行为,可能构成非法侵入计算机信息系统罪、非法控制计算机信息系统罪等刑事犯罪,具体处罚需根据情节严重程度判定。 刑事处罚:根据《中华人民共和国刑法》第二百八十五条、第二百八十六条,非法侵入或控制他人服务器可能面临三年以下有期徒刑、拘役或管制;若情节特别严重(如造成大规模数据泄露、系统瘫痪),刑期可能升至三年以上七年以下。 行政处罚:若未构成刑事犯罪,可能依据《治安管理处罚法》处以拘留或罚款。
小红书“路书计划”:让 “向往的路线” 落地成行
©️深响原创 · 作者|林之柏 从“世界那么大我想去看看”到“人生就要追逐旷野”,生活越是现代化,人们对自然与自由的向往就越强烈,这也让自驾游的热度常年居高不下。 不过与前几年相比,年轻一代自驾游爱好者的习惯已悄然改变:路线选择上,他们不再只盯着 “此生必驾” 经典路线,也喜欢发掘小众特色目的地;时间与距离不再是束缚,数周深度漫游与周末短途 “出逃” 同样受欢迎;同行方式也愈发多元,既能享受独处时光,也能约上搭子、带上长辈一起出发;游玩体验更趋深入,不再满足于走马观花式打卡,更愿融入当地文化,感受人文温度。 这些变化的本质,是年轻人回归自我诉求、追求真实体验与情绪价值的观念转变——自驾不再是任务式打卡,而是一种自在的生活态度。 当自驾游成为一种生活态度,年轻人的分享欲、讨论热情自然被点燃。在小红书,#自驾探索编辑部话题浏览量超48亿,讨论量超1900万(数据来源:小红书平台,截至2025年11月10日),“身在工位,心在路上”是众多都市人的真实写照。随着内容丰富度、质量的不断提高,小红书也逐渐形成完整的自驾兴趣社区。 今年,小红书正式启动了「路书计划」,线上内容与线下场景体验联动,打造更完整的出行生态。通过优质内容、品牌表达与用户兴趣的自然连接,小红书或许能为自驾游市场注入崭新活力。 年轻人的自驾新潮流: 够“野性”,有所获,有共鸣 年轻人自驾观念变了,旅途前的准备、旅程中的玩法自然也会跟着变。 旅途足够“野性”,是首要诉求。简单来说,就是回归自驾游的本质:自由、不受约束,不局限于特定线路、时段,也不再耗费大量精力、时间做出行准备,这是当代人对日渐标准化、流程化的日常工作、生活的一种“反抗”。但自由不代表完全不做计划、说走就走,而是要以最轻松、高效的方式找到合适自己的线路。 针对短途游,年轻人早已习惯在社交平台找攻略。上小红书搜索“周末宝藏自驾地”、“XX周边1小时宝藏自驾目的地”等关键词,能轻松找到大量经验贴。但对于时间长、路程远的出游而言,零散的攻略还不足以拼凑出令人满意的出行规划——这时候,既充分考虑个性化需求,又兼具地域文化特色的“路书”就能发挥作用了。 小红书「路书计划」就针对性制定了“硬核撒野”、“休闲清野”、“城市漫游”、“周末出逃”、“放假出行”、“时节限定”等不同主题路线,并通过“路书联盟”和全国50+文旅单位、景区合作,最大限度满足各种小众、特殊需求。比如喜欢轻量级出游、欣赏美景的用户,可以选“318秘境花海线”;喜欢极限探索、追求刺激感的用户,可以参考“无人区星空摄影线”、“冰雪国道拓荒线”等选择。 年轻人执着于选择合适线路,说到底是为了让旅途有所获。自驾是过程不是目的,人们最终是想通过长途奔袭带来的肾上腺素飙升纾解身体疲惫,或借短暂的逃离获取心灵的片刻疗愈。 比如你在小红书上搜索“川西自驾”,往往会带着“治愈”、“松弛”等关联词;搜索“青甘环线”、“南疆”则常常和“震撼”、“洗涤心灵”这些关键词联系在一起。为了获得身体、情绪上的充盈感,当代人的自驾游早已不满足于观景、消费这些浅层体验,也不想局限在旁观者视角,而是希望真正接触当地文化,和当地人交流、互动。 然而,自驾游最大局限恰恰在于个人精力、认知有限,对目的地了解不够,难以找到深入当地生活的途径。 针对这个痛点,小红书「路书计划」给出了一些解题新方向: 一方面,邀请头部旅游博主担任“自驾主理人”,结合账号特质和不同主题,分享精选线路,提供深入当地生活的特色玩法。像一直以自立、坚韧形象视人的“50岁阿姨自驾游”苏敏,自驾前往萨纳营地探索独孤小酒馆,呈现一个人的草原冒险;“破产兄弟BrokeBros”则横跨儋州千年古盐田、莺歌海盐场、三亚崖州晒盐村,把当地风土人情、盐文化传承史讲透。 另一方面,由各地文旅部门、自驾俱乐部组成的“在地主理人”,能从本地视角出发,发掘那些只有当地人知晓的特色体验。 除了选好路,选对人也很重要。 从朋友、家人结伴,到社交平台上公开征集自驾搭子,年轻人热衷结伴出行,不仅是为了报团取暖,更是为了寻找生活中的“同频者”,在旅途中获取情绪共鸣。 正因如此,在小红书上随处可见的各种“寻找自驾搭子”、“求自驾搭子群”等帖子里,提及最多的关键词是“有趣”、“三观正”、“尊重自然”,相比各种硬性条件,价值观、个人磁场是否一致,才是年轻人找搭子的最重要标准。 积极求搭子的自驾一族 图源:小红书 同样的道理,人们越来越喜欢在社交平台分享所见所闻,也是想通过分享景色、经历,向更多人传递此刻情绪感悟,让当下这个时刻变得更有价值。 作为拥有UGC创作生态的高活跃度社区,小红书让用户可以随时随地轻松分享。而在此基础上,小红书「路书计划」更进一步地创造了更多线上、线下互动机会:在线上,平台推出了#自驾路线大玩家、#自驾案例情报站、#自驾故事漂流瓶 等栏目,鼓励用户分享;在线下,除了组织自驾社群分享活动,还联合各大餐饮、消费品牌和露营基地等,在30座城市建立了200+家“车聚友好门店”,为自驾爱好者提供线下聚首的场所。 总结起来,自驾之所以迷人,是因为能让人们体验自由快感、充盈的获得感及跨越个体的共鸣感,而小红书独特的兴趣人群、内容和社区生态,让其成为承接自驾人群需求、提供各种情绪价值的天然场所。 首先,内容供给足够丰富且精准,直击不同用户的自驾需求,成为维系高用户黏性的坚实基础;其次,在UGC共创机制下,用户既是自驾体验者,也是内容生产者,源源不断的原创内容让生态自然成长、持续壮大;此外,浓厚的社区氛围下,用户养成深度、高频互动的习惯,形成强情感连接的社区生态。 依托这一系列内容、生态优势,「路书计划」的差异化亮点也被进一步放大。 在线上,它强化平台内容优势,将海量优质自驾内容整理、提炼,形成条理清晰的出行“参考书”——即便用户需求日趋多元化、个性化,也能最大程度匹配不同偏好与要求;在线下则精准补强体验缺口,用平台级资源为内容创作者、文旅产业搭建合作桥梁,打通线上内容与实地体验的壁垒。 借由这一系列创新玩法,「路书计划」实现了线上内容社区与线下真实体验的深度融合:它不再局限于单一的内容输出或线下服务,而是提供从出行前的内容参考、互动决策,到出行中的实地体验,再到出行后的内容分享的全场景服务,真正深入自驾出行的每一环。 从植入到共创, 品牌如何与用户共成长? 用户的注意力在哪,品牌就去哪。随着新一轮自驾潮流兴起,品牌自然也留意到了自驾场景的营销传播价值。 截至目前,鸿蒙智行、东风汽车集团、极氪7X、蔚来换电、一汽丰田普拉多、德国马牌轮胎、深蓝L06等已先后和小红书「路书计划」达成合作,慢慢找到了品牌种草的新思路:摆脱传统的硬植入模式,融入场景、贴近真实情境,让品牌信息、用户体验自然融合到一起。 像鸿蒙智行旗下各大品牌车型,就通过不同出游主题,发动用户共创。其中,智界R7和智界S7推出了草原、极境、大漠等不同主题线路,问界M5 Ultra以“春日逃跑计划”为主题策划春游活动,问界M8探索家庭出行的N种可能,问界M9则发布了“绿树青山线”、“沙漠文明线”和“宁静环湖线”等特色路线,鼓励博主、用户分享沿途打卡点。享界S9T携手中国国家地理,探寻最美自驾路线,驭见人生旷野。 这种由品牌提供核心主题、参考线路,用户自由发挥,用出行经历、打卡攻略等内容一点点丰富主题的形式,有更强的互动感、参与感。 就拿问界M9来说,有人在大西北追逐旷野秋色的时候利用ADS辅助驾驶功能解放双手,更安心享受沿途美景;也有人在成都-雷神王瀑布的数小时长途旅程中通过辅助驾驶减轻压力。旅途中这些难忘经历,不仅让用户和座驾产生了更深入的感情链接,也激发了用户的创作灵感、分享热情,主动把驾驶体验分享到小红书等平台,无形中为品牌、产品完成种草。 鸿蒙智行 X 小红书「路书计划」 东风汽车集团则结合旗下产品的多元化特点,制定不同主题路书,展现各车型优势。比如猛士科技有“越野+智能”的亮点,便推出“夏日野奢指南”路书,吸引乐于冒险的越野爱好者。 岚图FREE+的优势是底盘和长续航,便推出“超理想的FREE生活”路书,吸引注重品质生活的家庭用户关注。小红书多元的受众群体和丰富内容资源,为品牌创造了针对不同目标人群、定点突破的条件。 而瞄准细分场景、特定人群做深度传播也是品牌认可的触达方式,如普拉多聚焦女性群体,通过路书自驾活动展示当代女性坚韧与优雅并行的女性力量,凸显品牌独立、自由、安心守护的形象;极氪7X则聚焦亲子游场景,和小红书「路书计划」合作推出“带孩子看世界”活动,联合bybonnie、镜头下的南瓜、Isa阿柒等博主开启新疆深度游。 比如博主镜头下的南瓜就带着孩子自驾独库公路,让孩子感受一日穿越四季的奇妙体验;而作为跨国家庭的Isa阿柒,则和孩子踏上新疆伊宁之旅,感受不同文化的碰撞。极氪7X在活动中传达的寓教于乐、回归自然等主题,准确切中反“鸡娃”、追求松弛感的社会情绪,活动关联话题#不扫兴的父母 也在小红书获得3.3亿+的阅读量。 而且极氪的核心用户——高学历、高品位、观念开放、注重内涵的都市精英,本就特别关注孩子成长环境,自然更容易被活动主题打动。数据显示,透过这次活动,极氪7X 核心人群渗透率提升117.7%(数据来源:小红书灵犀平台,统计周期:2025年8月5日-2025年9月4日) 图源:小红书 蔚来则从用户对续航里程的关注出发,推出“新境路书”,为蔚来/乐道车主提供G318经典川藏自驾线的免费换电攻略。不少用户踏上这条经典线路的时候,都更真切感受到蔚来充换电网络的作用——有用户感慨G318曾是“新能源车”禁地,但现在可以驾着蔚来ES8一路“勇闯”了;还有用户对于“蔚来已经把换电站建到珠峰脚下“这一实力有了真正的认知…… 事实上,蔚来作为国内最早发力充换电网络的造车新势力之一,目前已在全国建立超过8200座充换电站,覆盖550座城市(数据来源:蔚来官方,统计周期:截至2025年10月),具备完善的服务能力。小红书博主的亲身体验将蔚来充换电服务优势直观呈现,这不仅能为品牌树立旅程“陪伴者”、续航“守护者”的可靠形象,也拉近了品牌和用户的关系。 图源:小红书 当然也有品牌围绕特色场景、路线做文章。例如德国马牌轮胎和旅游博主合作重走茶马古道,借云南崎岖地形和多变路况,展示SUV专用轮胎UltraContact UX7“安全、静音、耐用”的全能表现;并在沿途设置“补能站”提供免费全车检查服务,用更具沉浸感和真实感的场景体验,自然传递品牌关怀理念。 深蓝L06则走潮流路线,联手一条辣cc、项炸炸、卷毛只儿、不吃青椒耶等博主走进上海街头、打卡潮流地标。深蓝L06的祖母绿配色就收获了不少好评,凭借百搭的风格、和上海城市氛围的高适配度,成为备受博主、用户追捧的“出片神器”。 这一玩法的聪明之处在于找准流行趋势与品牌优势的结合点:城市游是近年兴起的自驾新趋势,轻量级、低门槛的特点吸引了一大批年轻“潮人”的追捧,深蓝L06则有着“为年轻人打造的智能轿跑”这一清晰定位,以潮流路线为切入口,品牌可以高效触达目标人群,加深年轻人对品牌的认知。 图源:小红书 品牌用实际行动投票,印证了小红书在自驾赛道的独特优势。透过这些案例,我们也能更清晰感知到小红书「路书计划」的商业化价值。 一方面,线上线下整合营销链路更趋完善。以优质内容激发用户自驾兴趣,用线下体验精准承接需求。一套组合拳下来,不仅从源头牢牢抓住用户注意力,还实现全流程陪伴式传播,在用户出行全周期中逐步建立、巩固品牌认知。相比单次曝光,这种模式能形成更强的长尾效应,实现用户沉淀,商业价值更具持续性。 另一方面,品牌通过原生内容植入的形式与用户共赴自驾美好体验,让彼此的关系得到深化。品牌不是生硬的广告投放者,而是用户体验的共创者,深入参与特色线路规划,让品牌信息真正融入用户出行决策之中。加上开屏、信息流、话题页、活动专区及实体周边等多种形式的自然露出机会,以及线上话题分享、线下聚会等场景的流畅衔接,让品牌与用户的互动从浅层接触转向深度情感联结,提升用户接受度与品牌好感度。 毫无疑问,自驾游是庞大的需求蓝海,平台与品牌的机会正持续涌现。依托独特的内容生态与社交氛围,小红书「路书计划」高效整合各类资源,构建起平台、用户、品牌“共成长场景”,不仅让商业价值高效落地,也有望助力自驾出行行业进一步打开发展新局。
人形机器人量产交付视频遭Figure创始人公开质疑造假,优必选回应
自动播放 优必选官方账号发布的一镜到底、原速原声视频。(01:17) 优必选回应外企公开质疑。 11月18日,优必选(09880.HK)就“人形机器人Walker S2开启量产交付的视频为CG制作”作出回应,称该说法完全失实。 此前,优必选发布了工业人形机器人Walker S2量产交付视频。Figure创始人布雷特·爱德考克(Brett Adcock)在社交平台公开质疑视频中是“fake robots”,大概率是电脑特效制作。 优必选表示,此次视频发布为优必选实现数百台全尺寸工业人形机器人Walker S2正式交付的里程碑,完全是现场真实拍摄。优必选官方账号已针对此不实说法发布了一镜到底、原速原声的视频素材,体现了现场的真实情况。 Figure创始人布雷特·爱德考克的推文截图。 据介绍,优必选此次交付的人形机器人将分批投入产业一线应用,覆盖汽车制造、智能制造、智慧物流、数采中心等重点领域,是优必选实现年内500台交付目标的关键一步,同时标志着优必选人形机器人正式迈入规模化场景应用的新阶段。 2025年初至今,优必选Walker系列人形机器人累计订单金额已突破8亿元。在场景应用方面,优必选已与比亚迪、东风柳汽、吉利汽车、一汽-大众青岛分公司、奥迪一汽、北汽新能源、富士康、顺丰等多家行业头部企业建立合作,推动人形机器人的商业化应用。 优必选表示,面对日益增长的市场需求,公司已制定产能爬坡计划,预计到2026年,工业人形机器人年产能将达5000台,2027年进一步扩大至10000台规模。
翼菲首款人形机器人“鸿钧”发布:全向轮可升降底盘,能拧螺丝
IT之家 11 月 18 日消息,国产工业机器人企业翼菲科技官宣入局人形机器人领域,于 11 月 17 日发布旗下首款人形机器人“鸿钧”。 “鸿钧”搭载了基于多模态大模型技术自主研发的 YiBrain 系统,该系统可与底层控制系统(智能小脑)深度融合,将重构后的任务序列转化为一个个关节运动指令、力矩控制信号和移动导航命令。 该机器人并未采用双足行走,而是搭载升降 + 轮式复合控制架构,自主研发模块化四转四驱全向轮底盘,并搭载多种运动模型实时响应系统,“鸿钧”可以实现前后、横向、斜向、阿克曼转向及自旋的全向全场景移动,支持 2m/s 移动与 360° 转向,具备 62cm 狭窄空间穿行的通过能力。 通过集成 0.4m/s 的升降机构,“鸿钧”实现了身高可调,升降行程可达 0.5m,结合地面滑行实现“三维度空间作业”,宣称可覆盖 95% 以上工业场景高度需求。 为了实现精细装配,“鸿钧”搭载了自主研发仿生机械臂,其采用 313 结构布局,肩部、肘部、腕部分别分配有 3、1、3 自由度,单臂总计 7 自由度,复刻人类手臂。 仿生机械臂臂展 0.6m,峰值负载 5kg,末端重复定位精度≤±0.05mm,可完成多种智能抓取和精细装配。 此外,腕部球形关节构型模拟了人类手腕的万向运动能力,使其能够在任意角度进行拧紧、插拔、按压等复杂动作,可实现 360° 旋转与多角度姿态调整,关节最大速度达 275°/s。 “鸿钧”的灵巧手腕可适配标准电动扳手、真空吸盘、夹爪等通用工具,通过快速换手即可切换作业类型 —— 从拧螺丝到插线缆,从贴标签到抓零件,一台设备就能覆盖多工种需求,无需为单一任务配置专用设备。IT之家附演示图如下: 翼菲科技表示,“鸿钧”具备无需固定工位的全场景适配能力,无需依赖预设轨道或固定部署点位,可根据产线实时需求灵活调整作业位置。无论是产线布局临时优化,还是新品换产需要重构生产流程,它都能快速响应 —— 无需耗费大量时间重新调试部署,也无需承担因固定设备迁移产生的高额成本,融入动态变化的生产环境,避免设备因场景变更暂时脱离核心流程的资源浪费,匹配高频换产的灵活需求。 在小批量、多品类生产场景中,它能根据任务指令快速切换作业类型,无需额外新增专用设备,既避免了“一机一用”模式下设备利用率低的问题,又能衔接不同生产环节,满足多样化生产的核心诉求。 针对短期订单或临时生产需求,“鸿钧”计划实现以“即来即用”的补充劳动力形态快速上线,无需企业配置全套专用自动化设备。其设计目标是与企业现有生产体系无缝协同,无需对现有产线进行大规模改造,预期能有效降低因短期任务带来的设备闲置风险与刚性投入成本。同时,依托通用化属性设计,它有望适配不同批次、不同类型的生产任务,为企业应对市场波动提供更灵活的成本控制方案。
谷歌CEO皮查伊:若AI泡沫破裂,没有公司能幸免
皮查伊 凤凰网科技讯 北京时间11月18日,据路透社报道,谷歌及其母公司Alphabet CEO桑达尔·皮查伊(Sundar Pichai)表示,如果AI热潮破灭,没有公司能够幸免。眼下,AI领域的估值飙升与巨额投资已引发市场对泡沫的担忧。 皮查伊在周二播出的BBC采访中表示,当前的AI投资浪潮是一个“非凡时刻”,但也承认市场中存在“非理性元素”。这一表态与互联网泡沫时期的“非理性繁荣”警告如出一辙。 目前,分析师们已就AI估值是否可持续展开了大量争论。在美国,市场对AI估值过高的担忧已开始对大盘产生压力。英国政策制定者也已指出存在泡沫风险。 当被问及谷歌将如何应对潜在的泡沫破裂时,皮查伊表示,他认为公司能够渡过难关,但也补充说:“我认为没有公司能够幸免,包括我们在内。” 随着投资者押注谷歌有能力与ChatGPT开发商OpenAI竞争,Alphabet股价今年已累计上涨了大约46%。 今年9月,Alphabet承诺将在两年内投入50亿英镑用于英国AI基础设施和研究,包括新建数据中心以及对旗下伦敦AI实验室DeepMind的投资。 皮查伊在谷歌加州总部接受BBC采访时还透露,公司将开始在英国训练AI模型。英国首相斯塔默希望此举能助推该国实现成为中美之后全球第三大AI“超级大国”的雄心。 皮查伊同时警告称,AI将产生“巨大”的能源需求。他表示,随着算力规模扩大,Alphabet的净零排放目标将被迫推迟实现。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
阿里巴巴,为何此时大做“千问APP”?
意料之外却又情理之中,阿里巴巴将战火烧到了AI to C领域,但并不是以外界预料的方式。 11月17日,阿里巴巴正式宣布“千问”项目,全力进军AI to C市场。当天,千问APP公测版上线,基于全球性能第一的开源模型Qwen3,凭借免费,以及与各类生活场景生态的结合,与ChatGPT展开全面竞争。 中国最懂消费者的互联网公司里,阿里永远排在前列,淘宝天猫有真实世界里的消费需求,钉钉里的组织场景,高德里的地理行为,优酷和饿了么的生活方式,诸如这些数据沉淀与业务触点,本质上都是天然的AI应用温床。 如果阿里不把AI推向C端,那才是不合逻辑,这是其商业体系的必然进化。外界更好奇的是:为什么是现在,为什么以这种方式? 此前阿里的AI战略版图中,Qwen开源模型和3800亿元的AI基础设施投资更为人所知,阿里似乎并不急于在C端应用领域大举进攻,但是当国内主流AI聊天应用还在本土市场厮杀,阿里出人意料地选择到全球市场直面ChatGPT。 更值得玩味的是,“千问APP”刚要登陆美国市场,阿里就已经被美国有关部门盯上,就像华为的芯片一般,置于中美AI竞争的宏大叙事之下。阿里能在这一轮全球应用层大洗牌里,抢到一个入口位置么? “千问APP”不争先,争的是滔滔不绝 一家企业的战略资源总是有限的,理想情况下,企业尽可以多线作战,但现实商业世界中,企业必须有所取舍。阿里巴巴的取舍,就是先做好AI云和基础模型,这关乎C端应用的成本下限和智能上限。 C端AI应用真正的商业本质是规模化,日活千万级的使用频率,单次调用成本必须足够低,否则根本无法形成商业闭环。要让AI在C端跑得动、跑得久,底层算力要便宜、模型推理要高效,而这些都有赖于云基础设施。 同样地,C端能不能做出智商碾压级的产品,取决于模型的能力边界。无论是情境推理、跨任务Agent,还是复杂链式操作逻辑,都需要模型层的持续演进。如果基础模型不行,所有C端创新都会卡在“做得出来但不好用”,实际上这也是当前一些C端应用的根本问题。 阿里优先把千问大模型体系、算力调度、推理成本压到极低,把稳定性和智能边界拉到行业第一梯队,如此,C端才有资格去卷体验、卷创造力、卷AI原生的新物种。 没有便宜、强大、稳定的AI云,没有能力不断迭代的基础模型,就不会有真正能跑到全球的消费级AI产品。阿里做C端是必然,但更关键的是,它选择从底层把整个AI竞争力重做一遍。 在2025年云栖大会上,吴泳铭提出,实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能ASI。 他将通往ASI的演进路线总结为三阶段——“智能涌现”“自主行动”“自我迭代”,可以看出,当前人类社会正处于AI掌握工具使用和编程能力以“辅助人”的第二阶段,阿里也遵循这样的发展路径。 对于阿里而言,第一阶段“技术攻坚”已完成,过去一年,阿里集中资源攻克底层模型能力。其自研旗舰模型Qwen3-Max,在性能上已超越GPT-4、Claude Opus等国际顶尖模型,跻身全球前三;其开源模型Qwen已成为全球性能最强、应用最广的开源大模型。 在第二阶段“AI辅助人”的阶段,AI正进入“Agentic AI”时代,核心是从“聊天”进化到“办事”。因此,阿里判断,大力入局C端的时机已经成熟,必须抢先将顶尖模型能力转化为消费者可感知的“办事”产品,在AI应用的下一场硬仗中抢占定义权,与ChatGPT在全球市场展开竞争。 正面对决ChatGPT,靠什么? 和多数C端应用不一样的是,阿里在海外技术圈的“势”,千问与ChatGPT的竞争,本质上不是产品之争,而是三条路线的对撞。 ChatGPT选择的是典型的闭源路线,模型能力封闭、参数封闭、训练方法封闭,开发者只能在它设定的框架里做有限创新。这种模式的优势是体验可控,但代价是生态绑定和创新天花板。 千问走的是完全相反的方向,全面开源、多尺寸开源、持续开源,全世界开发者都能复用中国模型的能力,能力扩散速度更快,阿里把自己的技术变成了“全球基础设施”。 从2023年推出第一代千问Qwen模型,阿里就是国内最早开源自研模型的大型科技公司;第三代Qwen2-72B击败当时最强开源模型Llama3-70B,千问Qwen开始成为全球开源模型性能新标杆;2025年开源全新一代Qwen3系列,性能比肩领先的GPT5、Gemini2.5-Pro等闭源模型,千问Qwen的全球下载量一举反超Llama,成为全球AI社区最受欢迎的开源模型。 斯坦福大学人工智能研究所《2025年人工智能指数报告》指出,中美顶级AI大模型性能差距大幅缩至0.3%,接近抹平,阿里Qwen重要模型贡献度位列全球第三。 除了开源,开放也是千问的一大特点。在产业视角,OpenAI的竞争策略越来越倾向于“生态霸权”,定义各种标准,试图把整个AI应用层变成自己的Plugin市场,这就像移动互联网时代,一个超级App想成为所有App的入口。 而Qwen系列模型正横扫美国硅谷,得到海外企业的追捧。亚马逊用Qwen来训练操作自己的人形机器人;苹果科学家会在Qwen新模型发布第一时间,提供IOS体系的适配,认为千问3与苹果机器学习框架MLX是最佳搭档;英伟达开源的多个模型,基座都来自于Qwen,爱彼迎Airbnb CEO布莱恩·切斯基直言,公司大量依赖阿里千问,和OpenAI相比,千问Qwen更好更便宜。 美国AI专家Nathan Lambert发出“硅谷建立在Qwen之上”的惊叹,谷歌前CEO施密特甚至表示担心这将削弱美国技术领导力,因为大多数国家和公司会选择开源的中国开源大模型。 从商业模式来看,ChatGPT的商业路径非常明确,订阅制、API付费制、功能高级化。这是典型的硅谷商业模式,但也注定了越强大的能力会越贵,越贵的能力会越小众。 阿里选择了另一条更互联网化的路:主力能力免费,广泛使用带来规模优势,用规模反过来拉低推理成本。这让AI有机会像当年的搜索、地图、即时通讯一样,成为全民基础工具。在普惠路线下,AI从精英技术变成大众工具,这就构成了和ChatGPT完全不同的世界观。 千问APP的未来 这可能是中美AI竞争里又一次真正意义上的“路线之争”。ChatGPT做“闭源+霸权+付费”的超级平台,千问做“开源+开放+免费”的全球基础设施。 与此同时,一股千问恐慌“Qwen Panic”,正在硅谷科技巨头中蔓延开来。 就在阿里千问APP开启公测之时,11月14日,英国《金融时报》引述一份美国白宫备忘录报道,华盛顿指责中国科技巨头阿里巴巴为中国军方针对美国境内目标的行动提供技术支持。 然而,报道既未说明具体涉及哪些能力或行动,也未提及美国拟采取何种回应措施。阿里巴巴发表强硬声明称:“有关内容的断言和影射完全不实。我们质疑匿名泄露者的动机,《金融时报》也承认他们无法核实泄密内容。这显然是一场恶意公关行动,其幕后黑手意图破坏美国总统特朗普近期与中国达成的贸易协议。” 中国驻华盛顿大使馆也驳斥了报道内容,表示中国依法反对并打击一切形式的网络攻击。中国驻美大使馆发言人刘鹏宇说:“美方在缺乏有效证据的情况下,草率下结论,对中国进行毫无根据的指责。这是极其不负责任的,完全歪曲事实。中方对此坚决反对。” 于阿里而言,阿里核心管理层将“千问”项目视为“AI时代的未来之战”。 千问APP的战略目标是打造未来的AI生活入口。阿里拥有淘宝等电商生态、高德等本地生活生态、夸克和钉钉等AI应用生态,未来或将都与千问APP打通,用户只需通过一个统一的AI入口,便可指挥它在淘宝上比价下单、调用高德地图规划家庭旅行,或在钉钉上自动生成会议纪要,真正推动AI从生活到生产的全方面提效。 于更大的竞争版图中,以往美国AI主导数据中心、模型能力、闭源产品的全球竞争;现在,中国AI开辟的开放、专业、实用的AI全栈生态正成为新的AI科技叙事。 基于全球领先的AI云计算基础设施,从全球第一的开源模型,到覆盖全球的APP应用,阿里正用千问Qwen为核心冲击“AI未来之战”,也是中国开源模型首次在“应用层”向全球头部AI产品发起正面竞争。 过去十年,全球AI的叙事权在美国,或许从这一刻起,中国用开放的代码、自由的算力、触及每一位普通人的应用,写下了另一种可能。(文 | TechPulse ,作者 | 张帅,编辑 | 盖虹达)
AI漫剧爆火:内容革新还是IP速朽?
2024年,中国微短剧的全国市场规模已达505亿元,并且有望在2025年攀升至634.3亿元。在微短剧高歌猛进的同时,社交媒体平台以及内容平台上出现了一种名为“AI漫剧”的短剧新变种,强势占领着人们的注意力。 简单来说,AI漫剧就是以小说或剧本等文字素材为基础,借助AI生成分镜、角色配音以及背景音乐并融合而成的“动态视觉小说”。今年以来,AI漫剧领域已经出现了《从娘胎开始逆袭》《刷爆无敌模拟系统》《我在末日当僵尸》等多部爆款剧集。 从早期仅为网络小说搭配AI插图的简单尝试,到如今实现全流程AI生成、每集1-3分钟的AI漫剧,内容产业似乎又一次站在了变革的十字路口。 01 当AI“学会”演戏 漫剧其实并非什么新鲜事物。在二次元领域,很早就有一种用AI图片演绎小说情节,为小说引流的“小说漫”。但如今的漫剧,已然发展为独立的剧集形态。 据惊蛰研究所观察,目前AI漫剧大致可以分为沙雕漫与动态漫两类。其中,沙雕漫剧以“熊猫头”等表情包为代表元素,主打剧情荒诞搞笑,用融梗、反转来制造密集笑点,由于制作门槛并不高,其制作成本相对较低,市场需求也相对稳定。 *AI漫剧《龙魂撞醒:奶爸逆袭成神》截图 动态漫则在剧情方面更为丰富,画面制作更为精良。通常情况下,AI动态漫的制作首先会基于剧本,使用StableDiffusion、Midjourney等文生图或图生图AI工具,快速生成符合剧情场景和人物设定的高质量图像;然后通过AI配音工具为角色匹配声音;再借助剪辑软件,将静态或轻微动态的图片进行拼接、运镜,再搭配音效与背景音乐,最终合成一段具有完整叙事感的短视频。 而相比真人实拍的短剧等常见内容类型,AI漫剧的特点和优势就在于“IP视频化快餐”的高效量产。这类漫剧绝大多数改编自市面上已有的热门网络小说,或由专门创作的短篇剧本构成。而经过市场验证的热门网络小说,也成为打造AI漫剧爆款的基础。 例如改编自男频小说《开局物价贬值百万倍》的AI漫剧《开局物价贬值百万倍,我竟成了世界首富》,于2024年年中立项制作,12月登陆抖音后,次日播放总量便高达1304万次,成功跻身多个短剧榜单前列。 *AI漫剧《开局物价贬值百万倍,我竟成了世界首富》截图 今年9月,先后上线的AI漫剧《我的治愈系游戏》与《传武》,也在上线后短短4天内,实现全平台播放量破千万,包揽腾讯动漫漫剧榜前两名。其中,《我的治愈系游戏》改编自白金作家我会修空调的同名小说,《传武》则是阅文旗下腾讯动漫超人气同名漫画的首次动画化尝试。 如果从产业角度拆解AI行业,则会发现目前涉足这一领域的企业主要可分为三类。一是阅文、晋江文学城、中文在线、七猫小说等网文平台,它们手握海量IP,是内容的最上游;二是新兴的AI漫剧制作公司,如万兴科技、捷成股份,它们或自研、或布局各类AI工具链,专注于将IP转化为漫剧产品,是生产环节的核心技术担当;三是短视频平台和内容分发渠道,如抖音、快手、B站等,它们为AI漫剧提供了传播土壤和流量支持,并通过广告、付费点播等方式参与变现。 在产业上下游的合作模式方面,惊蛰研究所也总结出三大主流方式。一是IP开放与分成激励,如阅文、七猫等网文平台开放IP资源,知乎提供资金预付,降低内容创作的版权门槛;二是技术赋能与资金扶持,如芒果TV开放山海AIGC制作工具、提供10万-100万分级资金,网易授权《永劫无间》编辑器“雷火映画”,解决技术与成本难题;三是流量倾斜与多元合作,如抖音、爱奇艺提供冷启动流量,咪咕设立“AI剧”专区,UC、抖音推出保底、买断等模式,搭配全渠道分发,保障内容传播与商业化。 与此同时,AI漫剧作为新兴内容形式也正迎来更加明确的监管框架。 11月8日,据澎湃新闻报道,国家广电总局已明确将动漫微短剧纳入管理范畴,一方面要求2026年2月底前实现全量“先审后播”,重点清理低俗擦边内容;另一方面鼓励“群众参与创作”,推动扶持计划向个人创作者倾斜,提供合规素材库与入门教学。 这种“划边界”与“给支持”的监管思路,为行业从野蛮生长向规范发展奠定了基础,也进一步推动了AI漫剧在内容质量与产业协作上的持续优化。 02 AI漫剧驶入快车道 AI漫剧为什么会火?又是谁在为AI漫剧买单?这两个问题的答案一点也不模糊。 首先移动互联网用户的注意力碎片化已经成为常态。快节奏的生活中,人们已经很难有整块的时间进行沉浸式追剧或阅读长篇大作,甚至有越来越多的人选择在短视频平台观看“cut版剧集”“电影解说”取代追剧、看电影,而单集仅一两分钟的AI漫剧,完美填充了通勤、排队、工间休息等时间缝隙。 此外,AI漫剧精准把握了短视频平台用户的内容偏好,在“滑动观看”的交互模式下,以其强烈的剧情冲突,在短时间内迅速抓住用户注意力,提供了不亚于短视频的“即时爽感”,也复制了短剧爆火的成功路径。 从内容创作的角度来看,AI漫剧也可以理解为剧情向内容延伸的产物。 新华社发布的《文化新观察|文学想象照亮荧屏:网文影视化改编加速》一文提到,在“爱优腾”三大长视频平台2025年的片单中,超三分之一剧集改编自网文IP。改编成为内容创作的主流模式背后,是大量网文爱好者不满足于单纯的文字想象,转而渴望更直观的视觉体验。 但传统动漫和真人剧改编门槛高、周期长,无法满足所有作品的视觉化需求,AI漫剧则以AI为“效率机器”实现了网文内容的视频化、快餐化消费,让文字作品用一种低门槛、低成本的方式动了起来,完成了从静态到动态的内容升级。 可梦AI创始人熊昺辉在接受DataEye短剧观察的采访时曾表示,AI真人短剧每分钟制作成本大幅低于传统真人短剧,降幅超过六成;AI漫剧的成本优势更为突出,每分钟制作成本仅为传统动画短剧的1/5。 与此同时,在市场端,AI漫剧的变现路径也显得清晰而直接。 据惊蛰研究所观察,目前AI漫剧主要的商业模式首先是广告植入,即在剧集前后或暂停界面插入贴片广告、信息流广告;其次采用前几集免费,后续关键剧情需付费解锁或一次性买断全集的付费解锁模式,这与网文的付费阅读逻辑一脉相承;三是利用内容影响力为IP增值与衍生铺路,即借助AI漫剧为原著小说引流、积累粉丝、扩大影响力,为后续开发更高成本的动画、游戏、真人剧及衍生周边铺路,实现IP价值的阶梯式放大。 AI漫剧的流行让内容产业看到的另一个亮点,是AI技术解决了传统视觉内容生产的核心痛点。 一直以来,传统动漫产业因为制作周期长、人力成本高、投资风险大,被视为最苦的内容领域之一。公开数据显示,美国动画电影的制作周期通常为4到6年。例如皮克斯、迪士尼分别出品的《寻梦环游记》《冰雪奇缘》,制作周期均为6年左右。中国动画电影的制作周期虽然相对较短,但《白蛇:缘起》《长安三万里》这样现象级作品的制作周期,也需要3年左右。 *动画电影《白蛇:缘起》截图 一个高质量动画项目动辄需要数百人团队耗时数年完成,上映之后的票房收益也很难有保证。生产环节的低效和终端市场的不确定性,不仅限制了行业产能的提升,也阻碍了IP视觉化内容的全面落地。 而AI技术的介入,尤其是Sora2、即梦等AI工具的快速进步,首先解决了生产环节的问题,极大地压缩了制作周期,让内容产能得到释放。据巨量引擎数据显示,2025年上半年其累计上线量达3000部,复合增长率高达83%,流水规模激增12倍,预计全年市场规模将突破200亿元。 其次,人力成本也随着AI逐渐替代原画师、中间画师等岗位的基础性、重复性工作,实现了大幅降低。在此基础上,主创团队也能够将精力更集中在创意构思、项目策划与质量把控上。这意味着,AI也能够让更多“一人团队”或小型工作室,具备规模化产出高质量视觉内容的能力。 03 AI漫剧起飞,能火多久? 一个赛道,既是“风口”,也必然会是“战场”。 当下AI漫剧前景广阔,犹如两年前处于行业爆发前夕的微短剧。而从短期来看,IP改编常态化趋势已经形成,各大内容平台会系统性地将其IP库进行AI漫剧形式的二次开发,下游制作公司对IP的争夺,不同IP之间的竞争也会更加频繁。 在技术层面,目前AI已经可以生成连续、流畅、光影一致的运动镜头,但在控制角色表情和口型方面仍然存在不足,这无疑将是技术迭代的具体方向。 至于市场层面,AI漫剧的发行多依赖于相对垂直的漫画、网文或短视频平台,但随着多平台渗透的进一步加深,AI漫剧也有潜力诞生现象级的国民IP,推动AI漫剧成为内容消费市场中不可或缺的一部分。 不过,在机遇之下,AI短剧赛道也面临新的问题。 比如,当AI技术降低了行业门槛,人人皆可快速入局生产,市场势必被大量跟风、套路化作品充斥,在内容行业的通病——内容同质化面前,AI能否守住内容的独特性与创意将成为持续发展的关键。 其次,AI虽然降低了人力成本,但存在算力成本这项新增支出。AI生成分镜、角色及成片需持续耗费相当量级的算力,对中小创作团队来说,算力开销在短期内也存在挤压盈利空间的可能。 还有不得不提的一点是版权争议的问题。不同于当下火爆的真人短剧,AI漫剧的核心成本集中在AI算力、技术团队及版权授权,其边际成本极低,一旦技术管线打通,规模化复制能力将远超真人短剧。但AI生成图像所使用的训练数据源是否包含未经授权的艺术家作品,其生成结果是否存在侵权嫌疑,目前在行业内尚未有定论,而这始终是行业悬顶的“达摩克利斯之剑”。 再者,当“AI”的画风和快餐式的剧情套路被反复消费,用户也可能会因为审美疲劳开始逃离,这就对内容的持续创新提出了更高要求。同时也引出一个新的疑问:AI漫剧的长期发展,究竟是建立在AI技术的快速提升上,还是内容品质的不断升级上? 在惊蛰研究所看来,短期之内,AI生成画面带来的视觉新奇感是吸引用户的第一要素。但长期而言,内容的价值高于技术。即使是当下的短剧行业,也正在经历“精品化转型”。目前短剧赛道,好剧本仍面临供需失衡的问题,市场需求远大过目前所供给的,很多爆款短剧都出现过“一本多拍”的情况。而好的故事、好的创意是“短剧精品化”的基石,也是AI漫剧长期发展的内在动力。 在AI漫剧赛道,技术会普及、会过时,今天惊艳的AI画质,明天可能就成为基础配置,因此,AI漫剧乃至未来AI短剧的终极竞争,依然是“剧本为王”。 技术是强大的引擎,但方向盘和目的地,始终掌握在会讲故事的“人”手中。 归根结底,AI是一种前所未有的高效工具,但它无法替代人类的情感与创意。这场由AI掀起的漫剧风暴,最终是吹拂出一片内容产业百花齐放的沃土,还是仅留下一地IP消耗殆尽的狼藉,取决于人们如何驾驭这股力量。
AI视频进入“加速度”时代:30%加速+细节随手P,等等党和抽卡党都有救了
等等党和抽卡党们,这回做视频终于不用等!半!天!了! 相信大家都有这种感觉:每次用AI生成视频,刚按下按钮,屏幕就跳出来一句“前方排队xxx人”,等吧,好不容易排到了,结果还得再磨个两三分钟才能出片…… 而且生成效果到底咋样,几乎纯看运气,不满意还得重新抽卡,这次终于不一样了,等等党有救,抽卡党翻身~ 现在,从点击生成到看到成片,不到一分钟就能轻松产出一条5秒的高清视频大片,画质妥妥拉满,效果be like: 你以为这就结束了?大NO特NO!现在碰到不满意的视频也不用重新抽卡,直接在线精修,想怎么P就怎么P。 周末来得刚刚好,蒙娜丽莎牵着兵马俑走进了魔都街头,这回不当文艺女神,当起了“沪上阿姨”: emm…人都到上海了,手里却还举着杯可乐,怎么看都不太对劲,于是我顺手一改,把可乐P成了奶茶,这样才对嘛,入乡随俗入乡随俗~ 不卖关子,这就是「拍我AI」(即PixVerse)重磅上线的升级版:V5 Fast,视频生成速度提升超30%,此外还上线了「Modify」精修功能,支持端到端视频编辑,生成完还能接着改~ 两项关键能力一起落地,让视频创作第一次有了“快+可控”的完整体验,目前新功能已在「拍我AI」重磅上线,废话不多说,跟我一起roll起来吧! AI视频也实现P图自由了 过去这一年,AI视频从创作者工具变成了商业化生产力。 品牌在用它做campaign,自媒体在手搓各种AIGC新玩法,商家用它做新品素材,而更能感受到变化的,是大众化的使用场景—— 旅行时随手做个vlog、给猫猫剪段日常、记录小朋友的成长瞬间……越来越多人不再只是看别人用AI做视频,而是开始用AI记录自己的生活、讲自己的故事、创作属于自己的灵感。 然而,现在市面上绝大多数的AI视频工具更像是一次生成定生死,一旦要改,流程立刻变得又慢又不确定: 一个细节的错位、一个画面的跳帧都可能让全片重来,角色不稳要返工,元素乱跳要重生,提示词不准又得重新roll,专业团队焦虑,普通用户更无从下手,明明是小改动,时间精力的投入成本却很大。 这直接带来的影响是:对内容团队是流程割裂,对商用制作是交付风险,对普通用户更是一道专业门槛的困扰。 因此,可修改性目前已经成为现在AI视频市场最真实、也最迫切的需求之一。 拍我AI的Modify精修能力,就是顺着这条需求线自然进化出来的,它所代表的是一类真正意义上的「市场创新」。 它把单帧修改变成了模型对全片的重新理解和一致化处理,实现跨帧推理、统一风格、主体稳态等一系列高要求的流程。 这类底层架构的精修方式目前在业内极为稀缺,基本属于拍我AI的独特能力。 也就是让创作者的工作流真正闭环,也让普通用户第一次拥有了拍了视频还能随手改的自由度。 AI视频从“能生成”走向“能被每个人掌控”这一步,终于变得可行了。 元素替换:实物级别的可控编辑 在这次全新推出的「Modify」精修功能中,我们不必再因为某个元素生成得不对、哪一帧出了小差错就从头反复生成,也不用担心提示词没写准、没编辑到位会导致整段视频推倒重来。 现在我们可以想改哪里就改哪里,真的做到了万物皆可替换。 先从我们创作中出现频率最高、需求最迫切的物品替换能力说起,我先让V5 Fast帮我生成了一段“男子在KTV放飞自我唱歌”的视频: 接着我在Modify里把男子换成了一只沉浸式飙歌的小猫: AI不仅保留了原视频里人物的肢体姿势、口型节奏,连服装细节也一起copy过去了,最关键的是整个场景环境都没崩,替换得非常自然。 除了能替换物品、人物外,Modify还能替换背景,我把一个超飒女孩登山的视频丢给了AI: 嗯…感觉这身专业户外装备用来登一座普通小山多少有点“杀鸡用牛刀”!于是我让Modify把背景换成积雪覆盖的雪山,这下才对味儿嘛: 这个替换的难点在于原视频的背景是移动的,但AI不仅完成了背景替换,还自动补足了每一帧的场景一致性,甚至连女孩发丝透出的光线,都和雪山环境的冷色调对上了,可以说是非常周到了~ 这种级别的元素替换能力,实质上把「改视频」这件事从高门槛的专业技能,重新交回给了所有用户。 无论是换物件、调环境,还是修一个不满意的细节,都终于能简单到人人敢下手、人人能做好。 局部修改:从风格到质感都能调 除了能修改那些“看得见摸得着”的视频元素外,一些更抽象、更细微的局部变化,比如光影、质感、整体氛围这种非实体的细节,Modify也完全hold得住。 这类需求在行业里一直是痛点:元素替换容易量化,但无形的局部往往最难改,一不小心就会破坏整段视频的连贯性。 咱们不走简单路线,直接上点难度,先来考验一下AI的风格修改能力。 现在打工人的怨气是真越来越重了,看下面这位小哥,工作崩溃到想直接怒砸键盘(但还是忍住了): 我们就用Modify给他换个画风,试试把这场“社畜崩溃现场”重绘成「美式漫画」风格: 不光是整体风格切得干净,连衣服的褶皱、肢体动作、情绪张力都被1:1保留下来,风格想怎么改就怎么改,还能保持动作一致性,这才叫真正的“可控风格替换”~ 不仅如此,Modify还能对物品的「材质」进行精确修改,我先是用V5 Fast生成了一段黑色亮面跑车驰骋在公路上的视频: 随后让Modify把车身材质替换成红色哑光,在镜头运动不变、光影一致的前提下,AI依然稳稳完成了替换: 亮面换哑光、金属换塑料、皮革换织物,看似只是质感变化,但牵涉光影反射、表面细节、镜头轨迹,一旦处理不到位就会立刻穿帮。 而Modify既做到了替换材质,又保证每帧视觉逻辑都成立。 除了能修改风格和材质,Modify还能同步修改「光线」、「色调」等非实体细节,那些在传统视频制作里最费力、最考验眼力的部分,也终于能交给AI来稳稳搞定。 人物编辑:跟修图烦恼说bye bye 经常拍照的人应该都有这种痛苦体验——给视频「人物修图」真的太、太、太麻烦了! 毕竟图片想怎么修就怎么修,可视频一旦要改就麻烦得多,过去那些在修图软件里拖一拖、点两下就能解决的小调整,放到视频里往往得重做整条。 这次Modify也把这个现实痛点考虑进去了: 视频人物不仅能用一句提示词直接改,还能自由调整年龄、服装、气质,甚至做到“整个状态”一起同步变化。 这是我喂给Modify的一张游客照,一个和长颈鹿合影的小男孩,因为拍摄角度的原因,男孩的眼睛显得有点小,皮肤也有些小瑕疵: 于是乎,我给AI下的指令是,让男孩眼睛更大一点、皮肤更平滑一点,Modify立刻就给出了效果: 眼睛肉眼可见地放大,皮肤也有了明显的磨皮效果,不得不说,这波P图功底确实有点东西~ 再来玩点有意思的,来试试AI邪修术之——年龄修改!我先喂给AI一段老奶奶的视频: 然后只对Modify说了三个字——变!年!轻!结果老奶奶直接年轻了三十岁: 人物能被自由修改,并不只是创意玩法。 在这个过程中,行业得到了更可控的创作能力,但对普通人而言,更大的价值在于:影像不再只能记录当下,它还能记录“可能的样子”。 爷爷奶奶可以看看年轻时的模样,普通人也可以看到自己理想中的自己,AI视频让影像变得更温柔、更有想象力。 此外,Modify还具备「尺寸修改」能力,哪怕第一次生成的比例不太对,也能用一句提示词随心调整,彻底摆脱“尺寸错了只能重生”的麻烦事儿。 随着Modify把「可编辑性」补齐,AI视频终于从一次性生成的模型能力,走向可反复打磨的创作工具。 这不仅让专业内容生产更可控,也让普通人拥有了真正掌控动态影像的权利,未来的视频创作,不再由模型决定,而是由使用它的每一个人决定。 生成提速30%,大片稳出不误事 生成速度一直是AI视频创作里绕不过去的问题。 无论是内容团队、短视频创作者,还是需要频繁验证想法的品牌方,都面临同一个困扰: 目前绝大多数AI视频的生成速度,赶不上用户内容交付的节奏,也赶不上用户灵感增长的速度。 团队需要高频实时产出,短视频创作者需要快速AB测试,品牌方则需要在短周期内验证创意想法,只要生成一慢,所有链路就一起被卡住。 这次爱诗科技上线的拍我AI(PixVerse)V5 Fast,就是在这个现实痛点上做了明显优化。 相比上一代V5模型,V5 Fast生成速度提升了30%+,举个直观的例子就是,原本5秒的高清视频要等1~2分钟,现在只需要在1分钟以内就能看到成片。 原因很简单,以前的Sora、视频版Stable Diffusion都是直接用一个超级大的模型一次性预测几十上百帧,模型看得太多太远,算得特别慢。 而V5 Fast让模型推理结构变得轻量化、帧间计算依赖被缩短,高分辨率的视频生成不再是“倍速变慢”的瓶颈环节。 看似还是那条推理链,但加速点遍布每一个视频节点,速度自然就提升得非常明显。 最关键的是,速度提上来了,效果也没掉链子,动作细节和风格依旧在线,对内容创作者来说,这种“赶得上点”的生成速度,才是真正能用起来的节奏。 为了更直观地对比,我们测试了拍我AI(PixVerse)V5 Fast与市面主流产品在相同提示词&参数条件下的表现,没见过比这更快的: 自动播放 拍我AI(PixVerse) V5 Fast约40秒即可生成完成1080P的5秒视频,等待过程更短、生成体验更连贯。符合社交平台传播的360P和720P生成速度更快,数秒也就完成了。 从Modify精修功能到V5 Fast提速模型,背后是「爱诗科技」在AI视频生成领域持续的技术投入与产品打磨。 今年10月,爱诗科技完成了1亿元人民币的B+轮融资,仅用两年时间就完成了五次模型迭代、八个版本更新,率先在行业内实现了DiT架构、准实时生成、角色驱动视频等关键突破。 更值得注意的,爱诗还是最早在V3.5破10秒大关的(去年12月)。进入2025年1月,V4进入5秒准实时生成时代的平台,在全球已具规模的视频生成平台中生成速度最快。 作为其旗下核心产品,海外版PixVerse与国内版「拍我AI」累计服务超过一亿用户,月活突破1600万,自去年启动商业化以来,收入增长超10倍,成为全球增长最快的AI视频平台之一。 这次发布的V5 Fast模式与Modify精修功能,进一步降低了AI视频的创作门槛,提升了创作自由度,视频生成不再因「慢」和「一次定生死」而被卡住。 生成能跟上节奏,修改能随手完成,AI视频创作的工作流才真正完整起来。灵感不再被速度拖住,视频也不再是一锤子买卖,而是成为人人都能打磨、能调整、能反复利用的创意载体。 更重要的是,那些平时不太被注意、却跟日常生活贴得很紧的小需求,也能被看到、被重视、被满足,AI也不再高高在上,而是开始贴着我们的日常需求去跑,贴着每一个细微的小动作去做。 这次「拍我AI」新功能上线的意义,也正是在这里: 每一个人都可以无差别享受先进AI技术的乐趣。
英伟达看中的AI独角兽又获新融资!谷歌大佬创办,估值超180亿
编译 | 王欣逸 编辑 | 程茜 智东西11月18日消息,11月17日,日本AI独角兽Sakana AI宣布完成1.35亿美元(约合人民币9.6亿元)B轮融资,估值达26.35亿美元(约合人民币187.3亿元),总融资额达到约3.47亿美元(约合人民币24.7亿元),相比一年前的15亿美元(约合人民币106.7亿元)估值增长了约76%。 Sakana AI致力于开发可在小规模数据集上高效运行的生成式AI模型,并针对日语语言和文化对模型进行优化,面向行业需求落地定制化应用。 本轮融资吸引了三菱日联金融集团、Khosla Ventures等原有投资方,以及美国风投机构Factorial Funds、澳洲投行麦格理资本、西班牙金融集团桑坦德集团等新投资方。新资金计划将用于开发AI模型,并扩大技术、销售、分销团队规模。 Sakana AI官宣博客(图源:领英) Sakana AI创立于2023年7月,由大卫·哈(David Ha)、里昂·琼斯(Llion Jones)和伊藤炼(Ren Ito)联合创立,其中Llion Jones是谷歌前研究员,也是提出Transformer架构的论文Attention Is All You Need的共同作者之一。 Sakana AI联合创始人兼CEO大卫·哈曾就职于全球金融服务机构高盛集团,后进入谷歌大脑任高级科学家,曾领导Stable Diffusion图像生成模型独角兽Stability AI的研究工作。今年8月,大卫·哈还登上了《时代》发布的2025年百大AI人物榜单。 Sakana AI联合创始人兼CTO里昂·琼斯先后在Youtube、谷歌担任软件工程师,在谷歌任职期间他与另七位作者共同推出了Attention Is All You Need这一革命性论文。 另一位联合创始人伊藤炼是日本资深科技和风险投资界专家,担任Sakana AI的COO,曾担任日本最大的二手电商平台Mercari的欧洲业务Mercari Europe的CEO,兼任美国纽约大学法学院的高级研究员。 Sakana AI联合创始人,从左到右依次为:Ren Ito、Llion Jones和David Ha 随着新融资的结束,Sakana AI已拿下了3.47亿美元(约合人民币24.7亿元)的融资。Sakana AI此前获得过两轮融资:2024年1月,Sakana AI获得45亿日元(约合人民币2.06亿元)融资,Lux Capital、Khosla Ventures、日本电信公司NTT以及索尼集团参投;去年9月,Sakana AI完成2.14亿美元(约合人民币15.2亿元)A轮融资,英伟达参投成为大股东,使其成立一年估值达到约15亿美元(约合人民币106.7亿元),迅速跃升为独角兽。 Sakana AI以日本本土化生成式AI为核心业务,开发可以生成文本、代码、科研思路等内容的AI模型,针对日本语言进行优化,还提供定制化、专业化模型解决行业问题。 该公司采取了与OpenAI、Anthropic等不同的技术路线,其希望抛弃Transformer架构,以自然进化为灵感降低模型计算成本并提升模型性能,该公司曾研发了AI Scientist、进化模型融合、连续思维机器和 Darwin–Gödel Machine等技术。 今年3月,SakanaAI发布三款日语模型,分别是大语言模型EvoLLM-JP、视觉语言模型EvoVLM-JP和图像生成模型EvoSDXL-JP。时隔一月,SakanaAI发布江户古风聊天机器人Karamaru。除此之外,SakanaAI还于9月开源了ShinkaEvolve,和Transformer架构比,该框架能高效地提出创造性解决方案。 今年,Sakana AI在日本扩大了业务范围,与包括大和证券和三菱日联金融集团在内的本土企业合作,开发了对应的AI解决方案。外媒TechCrunch称,Sakana AI还有更大的目标,其打算进军国防、情报和制造业赛道。 结语:大模型融资热度不减 和法国AI创企Mistral AI、以色列AI创企AI21 Labs类似,Sakana AI要用针对特定地区、行业的专业模型开辟自己的细分市场。Sakana AI称,他们要充分考虑日本文化、语言特点以及各行业的具体需求,用低成本、高效的方式开发面向日本本土市场的基础模型。 Sakana AI再获一轮融资,吸引了日本、美国、欧洲等全球不同地区投资者的目光,证明了其走出的差异化路线得到了资本青睐,资本押注AI持续火热。
一撮钛粉末,如何变成 Apple Watch 最复杂的金属结构?|独家专访
Apple Watch 最新一代的钛金属外壳,始于一撮细密的金属粉末。 没有车床的轰鸣、火星,也没有刀具切割金属时那令人牙酸的摩擦声,钛金属版的 Apple Watch 不是被切削出来的,而是被「打印」出来的。 3D 打印这个词,在很多人的脑海里仍停留在实验室和原型阶段:打印一只概念零件、一段验证思路的模型。而苹果,第一次把它推入了消费电子的大规模量产线。 这还真不是炫技。 为什么是 3D 打印? 传统的金属加工是一道「做减法」的技艺:一整块金属,通过 CNC 加工(数控铣床)从四面八方切、铣、磨,把多余的部分一点点削切成目标的形状,再进行打磨和抛光。 这种方式加工精度极高,却免不了一个硬伤——浪费。 「金属好不好加工,一用刀就知道。」钛的优秀已经被无数行业肯定:轻、强、耐腐蚀,是天生的「工程好料」。但它同时也倔强固执:熔点高、延展性低,加工具有挑战性。刀具磨损比加工铝时快得多,时间被成倍拉长,还要不断处理因「太硬」而带来的种种麻烦。 对 Apple Watch 这样的复杂造型来说,过去工程师常常得先做一个尺寸更大的锻件,再慢慢从里面「雕刻」出想要的形状。就如同从一块巨石中凿出一小尊雕像,壮观,却不够高效。 增材制造彻底改写了这套逻辑。它的思路,则是一次「加」的工艺——将材料一层层堆叠成形,如同用裱花袋挤出蛋糕的纹理,精准而克制。 60 微米、900 层:一枚表壳的成长轨迹 打印从一撮回收的钛粉开始。 「钛金属粉末之前是不存在的,」Kate Bergeron 是苹果产品设计副总裁,还负责所有 Apple 产品的材料创新。她告诉爱范儿,获得并使用可回收的钛粉,本身就是一个巨大的突破。 钛是一种坚硬而活跃的金属,在高温下甚至可能爆燃。为了保障安全,苹果对原始钛进行雾化处理,降低氧含量,并针对激光参数进行了极为精细的调整。 每台打印机配备了一个振镜系统,包含 6 束激光,每束光如同一支细笔,通过振镜系统引导,在粉末表面融化出一层零件的横截面。 完成一层,打印平台下移 60 微米——大约一根头发丝的宽度,再铺上新的粉末层,继续熔化。 经过 900 层的堆叠,表壳的雏形浮现。 打印结束后,零件仍埋在粉末堆里,工程师通过真空吸取的方式清除多余的粉末。 接着,使用超声振动设备,对打印件进行更精细的清粉操作,确保将表壳内部缝隙和细小结构中的残余粉末完全清除。所有粉末都会被回收再利用。 随后,成型的零件被金刚石线锯从底板上小心翼翼地切割下来。 从粗糙到精致:后处理的艺术 增材制造出的金属零件,其表面粗糙度远无法满足消费级产品的外观要求,尤其像 Apple Watch Series 11 这样要求抛光镜面、结构复杂、内外皆可见的产品。 于是,一门叫做「后处理」的工艺开始了。 CNC 精修校正尺寸、喷砂或抛光塑造质感、注塑整合其他部件、最后进行表面处理。Ultra 3 采用细腻喷砂,强化户外的坚固触感;Series 11 则追求几乎照见人影的光滑度。 「我们对精度与结构完整性要求没有任何降低。」Kate 强调,苹果没有因为 3D 打印而牺牲质量。 ▲ 左图显示外壳表面纹理,右图显示抛光表面 拆解网站 iFixit 也从侧面印证了这一点,在显微镜下,Ultra 3 表壳的确隐约可见一些打印层纹。但在硬度测试中,Ultra 3 表壳与前代锻造版本一样,仅在莫氏硬度 6 级才会出现划痕————比早期 Ultra 一代(硬度 5 级即划伤)更为优秀。 环保是一场主动争胜的技术战 如果制造一枚表壳可以用传统工艺解决,为什么苹果要冒着巨大的研发成本绕这么大一个圈? 毕竟,普通用户并不关心 Apple Watch 是不是 3D 打印的。 答案藏在另一个更宏大的承诺里—— 苹果以 2015 年为基准,计划实现 75% 的碳减排。主要路径包括:推动供应链使用可再生能源、采用更低碳的运输方式,以及通过材料创新提升回收比例。 3D 打印正好处在这三个方向的交汇点上。它不仅将钛金属的回收利用比例提升至 100%,与锻造相比,打印可减少约 50% 材料使用量,从源头减少碳排放。 过去我们如果能提高 10%、15% 的材料效率,我们就已经非常兴奋了。而现在,我们将材料使用量直接砍半——从碳排放角度来看,这是一次极其重大的胜利。 在苹果环境和供应链创新副总裁 Sarah 眼中,环保从来不是被动的责任,而是一场需要主动出击的技术战役。而 3D 打印,正是这场战役中的一件关键武器。 她所带领的团队,负责在苹果全球供应链中贯彻两个核心目标:一个是到 2030 年实现碳中和,另一个是终有一日,让每一件产品都由回收和可再生材料制成。 据她透露,苹果目前已完成 60% 的减碳任务,但剩下的减碳部分将越发艰难。 我们寻找的是那种既对地球有益,也对产品本身、对用户体验同样有益的方案。 从 CNC 到 3D 打印:制造的下一次进化 十五年前,苹果用 CNC 工艺打造出 MacBook Unibody 一体成型机身,开启精密制造的革命性时刻,推动了整整一代制造业升级。 苹果能够大规模集成 3D 打印钛金属,其他 OEM 厂商也能有信心跟进。 在过去的一个季度中,我们看到各大品牌将增材制造引入日常产品和运营中——从消费玩具和自行车组件到鞋类平台和工厂备件。这一模式是一致的:试点生产线成熟为可重复的生产,中等产量下经济效益更好,并与数字质量系统更紧密集成。简单来说,增材制造正从新奇走向常规。 专注金属增材制造的专业机构 3DS Pro 认为,金属 3D 打印这件事的意义不仅在于「用上了新工艺」,而是它证明了一件以前几乎没人敢想的事——钛金属的 3D 打印,真的可以规模化做到消费电子所需的光洁度与公差控制。不是几十件的试水,而是数百万件的量产级别。 更重要的是,它所能带来的创造力空间,也被正式打开。 传统的减材加工,总要被刀具、弯折半径、材料延展性这些边界框住思路。但 3D 打印的逻辑完全不同——它可以在元件内部做晶格结构,可以一次成型复杂的中空通道,也可以实现传统方法根本没法加工的过渡几何。 iPhone Air 是一个极好的例子:它的 USB-C 外壳,用的就是和 Apple Watch 一样的回收钛粉,用 3D 打印造出来。在这种工艺下,设计师不仅能保持结构强度与耐用性,还能实现极致的轻薄比例。 「这件事一开始是既令人兴奋又让人有点害怕的。」Kate 说,「因为理论上,它可以打印任何形状。我们已经充分理解了钛金属的打印方式,接下来我们会探索如何将这项工艺应用到更多产品上。」 「现在谈革命还为时尚早。」Kate 谨慎地说,「但它绝对是我们制造工具箱中新增的重要一环。」 接着,她说了一句特别「苹果」的话:「天空才是极限。」 又像是给未来留了个伏笔:「我们很期待设计师们会用这项技术提出什么新的挑战。」 「这绝不是一个终点,而是一个新的起点。」
传苹果iPhone Air主设计师跳槽,被曝投身AI创企
编译 | 王欣逸 编辑 | 程茜 智东西11月18日消息,今天,据外媒报道,苹果又发生一项人事变动,负责iPhone Air的设计师阿比杜尔·乔杜里(Abidur Chowdhury)已离职,加入了一家不具名的AI创业公司。 乔杜里的离职在公司内部引起了不小的震动。外媒报道称,尽管iPhone Air的销量不尽如人意,但乔杜里的离职与这款手机的发布无关。 对此,苹果公司拒绝置评。 在加入苹果以前,乔杜里曾在英国剑桥咨询公司、英国工业设计咨询公司Curventa和英国工业设计公司Layer Design工作。2018年到2019年,他还经营了自己的设计公司Abidur Chowdhury Design。2019年,乔杜里加入苹果公司,彼时正值传奇设计总监、前苹果首席设计官乔纳森 · 艾维(Jony Ive)离开苹果公司。 iPhone Air主设计师阿比杜尔·乔杜里 今年9月,苹果发布了有史以来最薄的手机iPhone Air,其设计被称为里程碑式的创新。iPhone Air的厚度仅5.6mm,采用5级钛金属框架,并搭载苹果最新的A19芯片。 iPhone Air(来源:Apple) 乔杜里在iPhone Air开发过程中发挥了关键作用。在今年9月的苹果新品发布会上,苹果选择让乔杜里为iPhone Air的介绍视频配音,展示其设计过程和特点。外媒报道称,在苹果发布会上露面是一项重要任务,iPhone 17 Pro的设计团队负责人、苹果工业设计副总裁莫莉·安德森(Molly Anderson)就曾在发布会上为新品做旁白,苹果派出乔杜里上场,足以证明其重视程度。 苹果产品的工业设计及其背后的设计团队一直备受瞩目。前苹果首席设计官艾维于1992年加入苹果公司,从苹果联合创始人、首席执行官史蒂夫·乔布斯(Steve Jobs)时期起就开始担任设计工作。自2019年艾维离开苹果以来,苹果的设计团队几乎经历了彻底的改组,许多老成员要么退休,要么跳槽到其他公司,如艾维创立的设计公司LoveFrom。目前,苹果设计团队成员更加年轻化,主要由设计行业的新人和苹果设计团队较年轻成员组成。 苹果设计团队人事变动的同时,有关下一代iPhone Air的讨论热度不减。11月11日,The Information报道称,苹果可能会为iPhone Air配备第二个后置摄像头。11月16日,彭博社记者马克·古尔曼(Mark Gurman)爆料称,下一代iPhone Air可能延期至2027年3月左右发布。 结语:苹果人事持续动荡,产品设计再生变数 11月15日,英国《金融时报》称,苹果首席执行官蒂姆·库克(Tim Cook)最早可能于明年1月卸任,苹果公司硬件工程高级副总裁约翰·特努斯(John Ternus)被普遍认为最可能接替库克。 苹果设计团队今年也处于变动之中,长期担任首席运营官、近几年负责监管设计团队的杰夫·威廉姆斯(Jeff Williams)已于7月宣布卸任,在其卸任后,苹果设计团队直接向库克汇报。此外,由苹果人机交互设计副总裁、液态玻璃核心缔造者之一艾伦·戴(Alan Dye)领导的用户界面团队也同样经历了动荡和多名成员离职。 乔杜里的离职无疑是对苹果设计团队的又一次打击,面对全新的领导层和年轻化的设计团队,下一代iPhone Air命运如何,还要等正式发布才能揭晓。
华为Mate 80系列手机线下备货比例曝光:标准版最多、Pro最少
IT之家 11 月 18 日消息,博主 @数码闲聊站 今日发文透露,华为 Mate 80 Pro Max 和 Mate 80 RS 非凡大师机型都是新一代玲珑双层 OLED 6.89 英寸左右的 1.5K LTPO 直屏。 另外,博主还透露了新机线下备货比例,大致为:Mate 80 > Mate 80 Pro Max > Mate 80 RS 非凡大师 ≥ Mate 80 Pro。据IT之家昨日报道,华为 Mate 80 系列手机已正式官宣并开启预订,采用全新双圆环设计,宣称“实力破圈”。 华为 Mate 80 系列新机已公布配置信息如下: 华为 Mate 80 标准版 华为 Mate 80 标准版包含曜石黑、雪域白、晨曦金、云杉绿四款配色,可选 12GB + 256GB、12GB + 512GB、16GB + 512GB 三个存储版本。从机身正面的开孔来看,华为 Mate 80 标准版有望首次获得 3D 人脸识别功能下放。 华为 Mate 80 Pro 华为 Mate 80 Pro 同样包含曜石黑、雪域白、晨曦金、云杉绿四款配色,可选 12GB + 256GB、12GB + 512GB、16GB + 512GB、16GB + 1TB 四个存储版本。 华为 Mate 80 Pro Max 华为 Mate 80 Pro Max 包含极夜黑、极地银、极昼金、极光青四款配色,可选 16GB + 512GB、16GB + 1TB 两个存储版本。 华为 Mate 80 RS 非凡大师版 华为 Mate 80 RS 非凡大师版提供玄黑、皓白、槿紫三款配色,提供 20GB+512GB、20GB+1TB 两种内存及存储组合(独享 20GB 内存)。
首发三腔空悬,岚图泰山 37.99 万元起,豪华比肩问界 M9
在中国人的精神图谱里,「泰山」从来不只是一个单纯的地理坐标。 更多的时候,它代表着「稳如泰山」的定力、「登泰山而小天下」的格局以及「泰山北斗」所代表的引领之姿。 当岚图将一辆全尺寸 SUV 命名为「泰山」,我们不难从中窥见其暗藏的野心。 随着岚图第 30 万辆整车下线,这家成立仅五年的高端新能源品牌正式迈入规模化新阶段。从岚图 FREE 到梦想家,再到如今的泰山,岚图的产品矩阵逐步覆盖主流高端细分市场。 而泰山的出现,标志着岚图开始向最难啃的 50 万元级全尺寸智能 SUV 腹地发起冲击——这里盘踞着问界 M9、理想 L9,也回响着宝马 X5、奔驰 GLE 的余音。 岚图最新推出的旗舰 SUV「泰山」,选择了一条「高配置+强整合」的路径,将 800V 高压平台、三腔空气悬架、华为乾崑智驾 ADS 4、鸿蒙座舱 5 等当前主流高端技术模块,系统性地整合进一台大六座插电混动 SUV 中。 其策略并非追求单一参数的极致,而是试图在动力、空间、舒适性、智能化和便利性之间达成一种实用主义的平衡。 并且在价格上,岚图此次也给足了诚意,新车共分了三个版本,售价分别为 37.99 万元、40.99 万元和 45.99 万元。 「东方美学」 岚图泰山延续了品牌「鲲鹏展翼」的设计语言,但在体量感和细节处理上更显成熟。 泰山整车尺寸为 5230×2025×1817mm,轴距 3120mm。设计团队通过通过短前后悬、大轮毂(标配 22 英寸)和流畅腰线,营造出了四大黄金比例——长高比 2.87、轮高比 2.25、宽高比 1.114、前悬占比约 40%,弱化了大型 SUV 常见的笨重感,营造出低趴而稳重的视觉姿态。 新车前脸采用封闭式格栅,中央贯穿灯带与两侧日行灯融合为「水击三千」造型,灵感源自甲骨文「水」字。上方密集排列的镀铬饰条构成「光瀑格栅」,点亮后具有一定辨识度。 高配车型可选装 HUAWEI XPIXEL 智慧投影大灯,搭载百万级数字微镜芯片,支持 0.1° 级光束调节精度。 该系统不仅用于照明,还能与车辆感知系统联动,在不同驾驶场景下动态调整光型。例如:变道时投射导航指引光毯;狭窄路段生成与车身等宽的「示宽光毯」辅助判断;泊车时投射轮廓线或辅助箭头。此外,它也支持个性化交互——解锁时投射迎宾图案,节假日自动切换主题动画,甚至可在户外作为移动投影设备使用。 车辆侧面的线条则较为简洁,曲面处理偏柔和,强调光影流动而非硬朗棱线。岚图在车辆的半隐藏式门把手内集成了 24 颗 LED 灯珠,支持迎宾、充电状态、防盗等多种提示。 更值得关注的是岚图称之为「鲲鹏展翼」的电动迎宾踏板。 该踏板采用毫米波雷达感应,用户携带钥匙靠近时,踏板会提前展开 15°作为预迎宾状态;完全解锁后,将在 0.3 秒内展开至最大 120°,位置更低平,便于上下车。踏板整体采用航空铝合金锻造,承重约 200kg,并集成谐波减速器与四连杆机构。此外,踏板表面可以同步投射「鲲鹏展翅」主题动态光效,与前脸灯语形成视觉呼应。 车辆的尾部设计则相对克制,贯穿式尾灯内部采用「山海倒影」意象——上半部分模拟山形轮廓,下半部分为水中倒影,后包围集成了扩散器造型。 岚图为新车准备了 6 种单色漆(黑、灰、金、白、紫)以及鎏金紫和玄墨金 2 种双拼色,漆面强调金属或珠光质感,整体调性偏向沉稳轻奢。 首发三腔空悬 岚图泰山采用 1.5T 发动机+前后双电机组成的插电混动系统,综合输出功率 380kW(前电机 150kW,后电机 230kW),官方百公里加速时间为 5.2 秒。 新车全系标配 65kWh 三元锂电池,CLTC 纯电续航为 350 公里(22 英寸轮毂),综合续航超过 1400 公里。在 800V 碳化硅平台支持下,岚图泰山支持 5C 超充,20%–80% 充电仅需 12 分钟,可补充约 228 公里续航。 能耗方面,岚图泰山 CLTC 馈电油耗为 6.9L/100km,在一众大型插混 SUV 中表现较好。针对北方地区的低温天气,岚图泰山的热管理系统采用 PHEV 专属混合热泵,结合 PTC 辅助加热,在低温环境下可减少采暖对续航的影响,官方称冬季续航可提升约 20 公里。 岚图泰山是国内首款搭载三腔空气悬架的量产 SUV。 相比传统单腔或双腔空悬,三腔结构可通过调节气室组合实现四种刚度模式,配合 EDC 电磁减震器和前双叉臂+后五连杆底盘,理论上能更灵活地应对不同路况。 作为偏家用商务的车型,岚图泰山的整体调校明显偏向舒适,城市道路和高速巡航中,车辆滤震表现细腻,在连续弯道或快速变道时,系统会主动调整悬架阻尼和空簧刚度,抑制侧倾。 此外,岚图为新车配备了最大转角 16°的后轮转向系统,使整车转弯半径缩小至 5.4 米,在狭窄车位或老城区窄巷中提升了灵活性。车辆还提供「蟹行模式」,低速时前后轮同向偏转,便于斜向移动。 空间、舒适与交互的三位一体 岚图泰山的座舱设计围绕「多人、多场景、长时间」出行需求展开,强调物理空间、舒适配置与数字交互的协同。 空间布局是座舱体验的基础。岚图泰山采用了 2+2+2 六座布局,在 3.1 米轴距车身内,岚图尽可能照顾到了所有位置的乘坐体验。 车辆前排头部净高 1070mm,二排 1100mm,三排 948mm;以 175cm 身高为参照,前、二排头部余量超两拳,三排约一拳,无压抑感。 膝部空间方面,二排 83mm、三排 89mm,均超过一拳,成年人短途乘坐舒适,长途亦可接受。 车内通道宽 180mm,配合纯平地板,使得乘客可在二、三排之间自由穿行。尤其在抱婴幼儿或搬运物品时,无需侧身或踮脚,通行效率明显优于多数采用凸起传动轴或窄通道设计的车型, 此外,二排至全景天幕的垂直高度达 1240mm,1.2 米以下儿童可在二排区域短暂站立,便于家长协助穿衣、整理安全带或安抚情绪,提升带娃出行的便利性。 同时新车二排右侧座椅支持 22 向电动调节、零重力模式和 26 点按摩,配备独立扶手屏;三排座椅同样提供通风、加热与电动调节功能并支持 175mm 前后电动滑动可向后调节靠背角度达 30°。座椅支持单独或整体放倒,实现 6 座、5 座、4 座等多种模式切换。 储物空间上,新车后备厢常规容积为 305L,三排放倒后,容积扩展至 1193L,地台接近纯平,可轻松装入 4 个 28 寸行李箱+1 台折叠婴儿车。 岚图泰山同时搭载了鸿蒙座舱 5 智能系统,车内共配备 10 块屏幕,包括 55 英寸 AR-HUD、16.1 英寸中控屏、21.4 英寸二排吸顶屏、3.5 英寸扶手屏等。AR-HUD 投射距离达 7.5 米,可将导航箭头叠加在真实道路影像上,减少视线偏移。中控屏分辨率为 2880×1800,支持 AI 画质增强,可将低清视频源提升至接近高清水平。 新车还首次引入了 MoLA(Mixture of Large Model Agent)架构,即通过大模型理解用户意图,并联动车辆硬件执行操作。例如,用户可通过自然语言设定「电量低于 20% 时自动找充电桩并开启空调」,系统会根据上下文执行一连串动作。 从结构到算法的多层防护 车辆搭载的智能辅助驾驶系统则是我们再熟悉不过的华为乾崑智驾 ADS 4。 硬件层面,系统采用「四激光雷达」方案:1 颗位于车顶的主激光雷达(探测距离 250 米),3 颗分别布置于前翼子板与后保险杠的近距补盲雷达,配合 4D 毫米波雷达、14 颗高清摄像头及 12 颗超声波传感器,共计 32 颗感知元件,构建 360° 冗余感知网络。 软件层面,ADS 4 基于华为自研的 MDC 810 计算平台(算力 400+ TOPS),运行端到端大模型驱动的感知-决策-控制链路,支持车位到车位的全场景辅助驾驶。 岚图泰山的安全设计覆盖被动、主动与电池防护三个维度,强调系统性冗余。 新车车身结构采用 78% 高强钢铝混合材料,其中 A 柱与 B 柱区域使用抗拉强度达 2200MPa 的热成型钢。前后车门均配备双层防撞梁,官方测试数据显示,侧碰工况下的乘员生存空间超出国家标准约 20%。 电池安全方面,65kWh 三元锂电池包底部覆盖 1500MPa 热成型钢护板,并内置 13mm 厚铝合金横梁,用于抵御托底冲击。电池包本身通过 IP68 防水等级认证,并配备毫秒级热失控预警与定向泄压通道,可在单电芯异常时延缓蔓延。 新车全车配备了 9 个气囊,其中侧气帘覆盖全部三排座椅,保压时间长达 6 秒,确保翻滚事故中的持续保护。车辆还按 C-NCAP 与 E-NCAP 双重标准开发了翻滚保护逻辑:碰撞触发后,系统自动解锁车门、切断高压电、启动 eCall 紧急呼叫,并开启双闪与车内照明,便于救援介入。 主动安全则由华为乾崑智驾 ADS 4 系统支撑。除基础 AEB、LKA 等功能外,其 4D 毫米波雷达可在雨雾天气中有效识别静止障碍物,激光雷达阵列支持对行人、两轮车等弱势交通参与者的精准追踪。系统还可与 HUAWEI XPIXEL 大灯联动,在夜间探测到前方行人时,局部遮蔽光束避免眩目,同时投射警示光斑提醒驾驶员。 高端跃迁临界点 成立五年,交付突破 30 万辆,连续九个月月销过万,2025 年前七个月净利润近 4.8 亿元,毛利率稳定在 21% 以上,岚图汽车已成为中国高端新能源市场中极少数实现「量、价、利」正循环的车企。 更关键的是,其用户结构正在发生质变:岚图梦想家在 30 万元以上新能源 MPV 细分市场稳居销量第一,其中超过四成用户来自 BBA 等传统豪华品牌增换购。这意味着,岚图已初步完成从「技术验证」到「市场认可」的跨越。 但真正的考验才刚刚开始。当新势力陷入价格内卷、合资品牌加速电动化反扑、华为系多品牌同台竞技,岚图若想真正跻身全球高端阵营,就必须拿出一款能代表其体系能力上限的旗舰产品——它不仅要堆配置,更要整合底盘、智能、安全、空间与制造品质,形成难以复制的综合体验壁垒。 正是在此背景下,岚图泰山应运而生。作为品牌「三旗舰矩阵」(追光 L 轿车、梦想家 MPV、泰山 SUV)的收官之作,它被赋予双重使命:对外,以 50 万元级定价直面问界 M9、理想 L9 乃至宝马 X5;对内,则是对岚图过去五年自研投入、供应链整合与用户运营能力的一次终极校验。 在 30 万辆交付之后,岚图已证明自己「能造出被市场接受的车」;而泰山的目标,是证明「能造出被世界尊重的中国豪华车」。 无论是三腔空气悬架对舒适边界的拓展,还是 HUAWEI XPIXEL 大灯与 ADS 4 智驾的光感联动,抑或是三排座椅皆可电动调节的空间诚意,都在传递一个清晰信号:岚图不再满足于参数对标,而是试图定义属于中国高端用户的「豪华新标准」。 当然,真正的高端化从来不是靠一款车完成的。它需要持续的产品迭代、全球市场的验证、服务体系的支撑,以及时间沉淀的品牌信任。 但可以肯定的是,岚图泰山的下线,标志着岚图正式告别「追赶者」身份,开始以体系化实力参与豪华汽车市场的规则制定。 这或许不是终点,但无疑是一个值得铭记的新起点。
马斯克抢先谷歌一步放大招,Grok 4.1登顶LMArena,创意写作直逼GPT-5.1
当谷歌 Gemini 3 将上线的消息传得沸沸扬扬时,马斯克更快一步默默放了个大招。 今天凌晨,xAI 的最新大模型 Grok 4.1 直接上线了,响应速率明显提升、幻觉率大幅下降,回答既精准又“有人味儿”。 这次一共发布了 两个“形态”:Grok 4.1 和 Grok 4.1 Thinking。Thinking 版是前者的增强推理变体,二者基于同一底层模型,仅推理配置不同。 值得一提的是,Grok 4.1 对所有人免费开放,除了能在 Grok 官网、X 上使用,还推出了移动 APP 版,iOS 和安卓系统都照顾到了。 如果想要更有深度、更专业的回答,可以一键“让 Think 更努力思考”。 从 LMArena 的最新结果看,Grok 4.1 Thinking 以 1483 Elo 断层领跑,比 Gemini 2.5 Pro 高出 31 分。 即使在不启用思考链的情况下,Grok 4.1 仍保持在榜单第二,显示出底层能力的稳定性。 有不少网友发出了“真香”感叹,Be like: 当然,也有一些质疑声,比如有人指出在生成代码这块儿,Grok 还不太有竞争力。 “双形态”的 Grok4.1 霸榜 LMArena 首先,关于 Grok4.1 和 Grok4.1 Thinking 是什么,我们不妨来看看 Grok4.1 自己的解释: Grok 4.1 是 xAI 于 2025 年 11 月 17 日发布的最新前沿大语言模型(Grok 4 的升级版),在对话智能、情感理解、创意写作、事实准确性和响应速度上大幅提升。 Grok 4.1 Thinking(有时简称 Grok 4.1 Thinking,代号 quasarflux)是同一模型的思考 / 推理模式(reasoning mode),会额外使用“思考令牌”进行链式推理(chain-of-thought),适合复杂数学、编程或多步问题。 Grok 4.1 Thinking 是 Grok4.1 的增强推理变体;二者基于同一底层模型,仅推理配置不同。 在全球最大、最具影响力的大模型盲测平台 LMArena 上,Grok4.1 展现出突破性的实力。 作为行业普遍认可的“非官方标准榜”,LMArena 通过匿名双盲对战和真实用户投票来评估模型质量,是 OpenAI、Google、Anthropic、Meta 等头部公司测试新模型的常规阵地,也常被用于提前投放未公开版本。 因此,在这里的胜出,几乎意味着真实用户偏好和模型综合能力的双重认可,是观察模型真实实力的最可信风向标。 就在这样一个竞争最激烈的公开擂台上,xAI 的 Grok 4.1 系列拿下了极具含金量的一次 “双冠”:Grok 4.1 Thinking 版以 1483 Elo 拿下冠军,而非推理版 Grok 4.1 也以 1465 Elo 获得亚军。 特别值得注意的是,这个“即时响应”的非推理版本,成绩竟然反超所有其他厂商的推理模型,首次让“快模型”也站上了顶级性能的第一梯队,还把前代 Grok 4 远远甩至第 33 名。 亮眼成绩的背后的关键,在于训练方式的重构。 xAI 为 Grok 4.1 引入了大规模强化学习系统,并使用前沿推理模型作为奖励模型,让其能够在训练过程中自主评估、快速迭代。这直接带来了更稳定的风格输出、更可靠的事实判断和更低的幻觉率。 在 Grok 4.1 的后训练阶段,xAI 将优化重点集中在信息检索类提示中的 幻觉 上。 这些底层方法上的改变,很快在实际测试中体现为显著的事实性改进。最新数据显示,Grok 4.1 的幻觉率已从 12.09% 下降至 4.22%,降幅接近三倍,成为本次升级中最突出的进步之一。 为了进一步验证这种“更准事实”的能力,团队还引入了更严苛的外部基准体系。其中最关键的指标之一是 FActScore——由 500 个真实人物传记问题组成,专门用于检验模型在搜索、事实判断和回答一致性上的表现。 在这一测试中,Grok 4.1 的 FActScore 从 9.89 降至 2.97,可信度提升同样显著。结合图表可以更直观看到:在相同的非推理模式下,Grok 4.1 的错误更少、偏差更小,整体输出更可靠。 这意味着在涉及检索、引用或调用外部事实的场景中,新版模型不再依赖语义猜测,而是能更准确地给出基于证据的回答。 换句话说,Grok 4.1 在大模型最难突破的“事实稳定性”方面迈出了关键一步——它不仅降低了错误数量,更压低了“错误的自信”。而这,正是大模型从“能说”走向“可信”必须跨过的门槛。 与此同时,Grok 4.1 的 “情商” 也有显著进步。 在 EQ-Bench 测试中,Grok 4.1 拿下了 1586 Elo 的高分,比上一代整整提升了一百多点。如果光看数字还不够直观,那么图片就更能说明问题:榜单上,Grok 4.1 和 Thinking 版稳稳占据前两名,把一众旗舰模型甩在身后,像 GPT-5 Chat、Gemini 2.5 Pro、Claude Opus 4 这种老牌强者,都被它轻松拉开了差距。 EQ-Bench 是一个由大模型评判的大模型情商测试集,用来评估主动情绪理解、洞察、共情和人际交往能力。它并不靠单轮问答,而是由 45 个角色扮演场景构成,每个场景包含 3 个回合,模拟现实世界里真正的“情绪对话”。模型需要在连续对话中保持风格一致、理解情绪上下文、做出恰当回应。最终结果通过两两对比得出,并以 Elo 形式归一化呈现。可以说,EQ-Bench 可以作为测试各模型“情商”的权威榜单。 为什么 Grok 4.1 能在 EQ-Bench 拿下这样亮眼的成绩? 在官方给出的一张关于“安慰失去猫咪”的对比图中,我们能找到答案。 旧版 Grok 的回复已经算得上温和体贴,但 Grok 4.1 的表达明显更细腻:它不只是在说“我理解你的难过”,还会捕捉到情绪里那些更隐微、真实的细节——比如空下来的睡窝、期待却再听不到的喵叫、那种像潮水一样反复袭来的悲伤。语气更稳、节奏更自然、情绪共鸣更到位,读起来就像在和一个真正懂你的人对话。 这使得 Grok 4.1 在情绪理解方面迈入第一梯队 除了事实层面的可靠性,Grok 4.1 在 创意写作能力 上同样出现大幅跃升。 在 Creative Writing v3 中,Grok4.1 的得分跃升至 1722Elo,较上一版几乎拉开 600 分,文本的叙事节奏、风格延展性与创造性都有质感跃升。 这个基准本身,Creative Writing v3 并不是简单的“单轮评分”。在测试中,模型需要围绕 32 个不同类别的写作提示进行 三轮独立创作,涵盖叙事、风格模仿、世界构建、人物情绪刻画等复杂任务,考验的不是一句话的巧思,而是持续稳定的文本创造能力。评分方式也和 EQ-Bench 类似,通过人工评分标准与模型对战得到标准化 Elo 得分。 在这份榜单中,Grok 4.1 Thinking 和 Grok 4.1 占据第二、第三,两者之间仅相差十几分;而其他强势模型如 O3、Claude Sonnet 4.5、Kimi K2 以及旧版 Grok 3 都被稳稳甩在后面,形成了明显的档位分层。 换句话说,Grok 4.1 已经进入全球最强“创意写作梯队”。 而在官方给出的新旧版本对比中,我们可以明显看出,Grok 4.1 已从“能写段子”的模型跃升为真正具备文学笔触的创作者:叙事更深、情绪更复杂、修辞更成熟、角色更沉浸。 这些升级最终体现在 更好的交互体验 上。Grok 4.1 拥有更稳定的“个性”,对用户意图的理解更细致,风格调节更自然。即便在非推理模式下,它也能稳定输出高质量回答,同时保持极快响应速度。 一个直观的例子是官方展示的旅游攻略对比。旧版 Grok 给出的内容像“百科式景点总览”,信息密度高但缺乏节奏感;而 Grok 4.1 写旧金山,则像一位真正“去过”“懂氛围”的本地向导,会主动提示拍照时间、推荐适合你的路线,甚至带出城市的具体气质,更像在和一个真实的人交流。 在复杂任务处理中,Grok 4.1 的上下文窗口扩展至 256K tokens,Fast 模式下更可达 200 万,使其在长文档理解、持续协作与大型内容生成中保持高连贯度,显著减少“断片”。 总体来看,Grok 4.1 的提升不是单点突破,而是从性能、事实性到情商、创意与交互体验的一次全维升级。 在正式亮相之前,Grok 4.1 其实已经悄悄经历了一轮为期两周的“静默发布”。从 2025 年 11 月 1 日到 14 日,xAI 将一部分真实用户流量在 grok.com、X 以及移动端应用中逐步切换到 Grok 4.1,以观察它在真实环境下的表现。 这一阶段最直观的结果,被清晰地体现在那张 64.78% 的饼图上:在双盲对比、用户不知情的前提下,Grok 4.1 的回答有 64.78% 的概率被用户选为“更好”。换句话说,面对同样的问题,用户在超过六成的情况下更偏爱 Grok 4.1。 可以说,Grok 4.1 展现的更高的情绪理解、更稳的事实性回应、更自然的交互风格,都通过静默测试被真实用户用投票“盖章”。 无论是 LMArena 双冠、幻觉率的断崖式下降,还是创意写作与情感能力的全面增强,新一代 Grok 已从“功能强”走向“体验强”,也为 xAI 在今年的大模型竞争中交出了一份极具说服力的答卷。 我们实测了 Grok4.1 AI 前线也上手实测了 Grok4.1。 首先是 推理能力 测试,我们设计了一道看似正常、实际“有诈”(有 2 组解)的题(各位可以自己动手验证下): “四个同学参加数学竞赛,分别是:小 A、小 B、小 C、小 D。 比赛结束后,他们对自己名次做了如下四个判断: (1)小 A 说:“我不是第一名。” (2)小 B 说:“我也不是最后一名。” (3)小 C 说:“我是第二名” (4)小 D 说:“我才不是最后一名呢。” 已知:这四句中只有一句是真话,且四个人名次两两不同。 问:哪一句是真话?四个人各自的名次如何?请给出推理过程。” Grok 成功找出了 2 组解,还主动修复题目 Bug。 不过需要说明的是,它其实在主动修复题目 Bug 时“翻车”了,Grok 提出,如果把小 C 说的话改为:“小 B 是第二名”,这样答案就有唯一性。 但修改后,结果其实还有多种:第一,如果有只有 B 在说真话,此时名次唯一确定为 A1、C2、B3、D4;第二,如果只有 D 在说真话,此时只能确定 A1、B4,C 和 D 分别为第 2 第 3 名但不唯一。 再来看看 Grok 的写作能力。 我们给出了这样的 Prompt: 用讲故事的口吻,准确且生动地、有感染力地讲述马斯克 xAI 发布 Grok4.1 的事。要求字数:500-600 字,必须包含:发布时间、产品亮点、市场背景等。 Grok4.1 的回答如下,还贴心地统计了字数:578——但是,咱就是说,Grok 恐怕是统计的英文字数(或者数学不好?),我们手工用 Word 统计了字数:861 字。 最后,我们测了一下 Grok4.1 的图像生成能力,效果不错:Grok 根据一段 Prompt 生成了两张图,还真挺像真实照片的(不过细节嘛,大家请自行评价)。 而且还能直接根据图像,一键生成视频,效果如下: 感兴趣的读者朋友们,也可以去上手试试。
蚂蚁灵光App空降!太丝滑了,零门槛生成专属应用
蚂蚁入局AI超级入口之战。 作者 | 陈骏达 编辑 | 心缘 智东西11月18日报道,今天,蚂蚁集团宣布推出全模态通用AI助手“灵光”,支持“自然语言30秒生成小应用”,或是输出3D数字模型、音频、图标、动画、地图等全模态信息。 “灵光”App目前已同步登陆安卓与苹果应用商店,首批上线三大功能:“灵光对话”、“灵光闪应用”、“灵光开眼”,分别对应的是文字对话、应用生成和多模态这三种玩法。 “灵光”的发布,与阿里“千问”App的发布仅仅相隔1天,如今,这两大巨头玩家的动作,或将给AI超级入口的争夺战带来不可忽视的新变量。 智东西第一时间体验对“灵光”App进行了体验。打开应用后,能看到其依然采用了经典的聊天框设计,支持图片输入,不过并未在页面内展示AI助手背后的模型。 蚂蚁集团称,“灵光”擅长对特定话题进行快速研究,生成简单易懂的简报。于是,我们试着让“灵光”解释一下自行车的主要结构。 体验时,我们能明显感觉到“灵光”的输出速度很快,生成一份图文并茂的简报,大约只花了20多秒。体验过程中,我们发现灵光是默认开启联网搜索的,下方的图片并非全都由“灵光”生成,也有来自互联网的图片。 与大部分AI助手纯文本模态的输出不同,灵光最终给出的回答阅读起来更轻松,有一些排版设计的元素。例如,简报中的大小标题采用了不同的字体和颜色,与正文内容区别。 相同的问题交给ChatGPT,它给出的答案仅用Markdown进行了结构化,和“灵光”的回答相比没那么直观、易读。 既然“灵光”是一款来自蚂蚁集团的AI助手,我们便测试了它在金融场景的表现。当被问及今天阿里的股价变动时,“灵光”可以准确地查找今天的股价数据,但不知为何,所有涉及涨跌幅的数据都算错了。 例如,我们查询到的数据显示,今天阿里美股收盘时的股价为157.71美元,较上个交易日收盘价上涨了3.91美元,涨幅为2.54%。“灵光”给出的结果则是阿里当天美股股价下跌2.89美元至157.71美元,跌幅为1.8%。看来,想拿“灵光”研究股市的用户,可能还得等等。 ▲阿里巴巴美股的真实股价涨幅与灵光给出的不一致(图源:腾讯自选股) 我们还体验了“灵光”的闪应用能力。“灵光”可以根据用户的提示词,在几十秒内生成一个应用,并支持将应用保存,以便后续使用。 例如,我们可以让“灵光”打造一个云养猫的互动小应用,并指定它打造特定的互动功能。“灵光”在此类任务上开启了深度思考,会先规划再开发。最后,它生成的结果如下。 也可以让“灵光”做一些实用的小工具,比如记账应用。灵光打造的App页面简洁清晰,可以满足基础的记账需求,还可以在后续使用中根据实际需求向灵光提要求,新增各种功能。 最后,我们体验了灵光的视觉功能——“灵光开眼”。该功能就在输入框的右侧,标志是一只小眼睛。 对着屋里的气温表,我们试着直接打开灵光的视觉功能,可以看到它迅速地识别了气温信息,并在用户开口询问穿衣指南后,几乎无缝地给出了回应。 蚂蚁集团还晒出了“灵光”的诸多其他玩法。比如,视觉功能可以用于厨房的场景。对着家里的几样菜,询问“灵光”,它便能给出菜谱。 “灵光”还可以生成3D模型,全方位展示青铜爵的样子。不过,我们在测试中尝试了很多提示词,都未能触发3D生成的功能。 结语:蚂蚁正式入局通用AI助手 过去一段时间里,蚂蚁集团在AI领域的动作不断。在模型侧,蚂蚁已经发布了1万亿参数的大语言模型Ling-1T;在应用侧,其打造的AI健康类App AQ已经成为国内首个月活超千万的行业专业级AI应用。QuestMobile的数据显示,AQ也是国内第五个月活超千万的AI原生App。 此番推出“灵光”,意味着蚂蚁要入局通用AI助手这条潜力更为广阔,但竞争也相对激烈的赛道。从我们的初步体验来看,“灵光”App或许能凭借更轻松、简单的交互体验,找到一条差异化的道路。
机器人涌向产线:杭州这家公司如何用空间智能构建新工厂
作者 | 李水青 编辑 | 漠影 过去一年,具身智能机器人正加速涌入工厂,从炫技的“表演者”转变为承担搬运、装配等任务的“产线员工”。 这一趋势背后是产业共识的形成。正如黄仁勋所言:“下一波AI是理解物理世界、能推理并执行任务的机器人系统。”李飞飞也强调,空间智能将“真正打破物理与数字世界的界限”。当前,我们正站在这个关键转折点上。 但智能自主的具身机器人规模化落地的最大矛盾,也在此刻被暴露出来: 具身智能体的部署成本仍然偏高,不能指望其在真实工厂里试错。如果每部署一个机器人,就要在真实产线上进行大量试错——停车、改线、重新调试、现场搭建安全防护……每一项都是高昂成本,每一次失误都可能意味着生产中断、设备损坏乃至安全风险。 尤其当机器人从“预先编程”走向“自主决策”的具身智能阶段后,传统的调试与部署模式正面临巨大挑战,刚性产线、数据割裂、被动控制、软件落后等问题严峻……这已成为具身智能规模化落地的“头号拦路虎”。 出路何在?李飞飞曾指出,“空间智能”是AI未来十年的下一个前沿,她创立的World Labs近期推出的Marble世界模型,展示了用极低门槛构建逼真的实时可操控的永久3D环境,为机器理解物理空间提供了全新范式。 实际上,工业界如今也在出现“工业版 Marble”。一场以数字孪生技术为核心,深度融合空间智能的变革正在发生,旨在为具身智能打造一个高保真、可计算的“数字练兵场”。 在这一赛道中,既包括年初推出了面向工业AI的Mega平台的算力巨头英伟达;在国内,更出现了群核科技这样从空间智能出发、构建面向具身智能时代的工业孪生平台的独角兽企业。作为“杭州六小龙”之一,群核科技近期推出了专为工业具身智能时代打造的云原生工业AI孪生平台——SpatialTwin,业内率先支持实时模拟真实工业环境动态、智能体规模化在平台上运行。 一场围绕“未来工厂数字孪生系统”的竞赛,正在悄然打响。 一、机器人进厂:理想很丰满,现实很骨感 在工业4.0浪潮的推动与全球人口老龄化导致的“用工荒”双重背景下,“机器人进厂”已从未来展望转变为制造业的迫切刚需。政策强力引导、资本密集涌入、技术快速迭代,共同将具身智能推向风口浪尖。 机器人大单热潮印证了市场热情:智元机器人年中与富临精工等近百台远征A2-W将落地富临精工工厂;优必选拿下国内某知名企业2.5亿元人形机器人采购合同;智平方与惠科股份达计划三年内部署超1000台轮式人形机器人……这些数字似乎预示着机器人工厂时代正加速到来。 然而,理想很丰满,现实远比想象复杂。 当我们穿越资本与舆论的喧嚣,深入工厂实地考察,会发现具身智能的规模化落地仍面临严峻的技术鸿沟。群核科技SpatialTwin产品负责人吴锴亮在近期的采访中向我们直言:当下工业具身智能还都在尝试,处于类似于自动驾驶L2的探索阶段,面临至少以下三大挑战: 首先是机器人本体的成熟度挑战。具身智能机器人面临着软硬件双重挑战:在硬件层面,运动控制、环境适应性、续航能力等基础问题尚未完全解决;在“大脑”层面,智能体的认知、决策能力距离复杂工业场景的要求仍有差距。 其次是多智能体系统协同及数据孤岛挑战。数以百计的智能体协同作战的复杂系统带来不可预测性。当有一个能自主作业的机器人之后,你怎么来模拟它们的行为?如何预测很多机器人在一起或与工业自动化设备一起协同运转?它的产出是什么?这个问题在没有很好的工具或者计算能力的情况下,是一件很困难的事情。 工业场景的另一大难题则是“数据割裂”问题。由于设备协议各异,数据格式千差万别。生产、物流与机器人的数据系统互不相通,形成坚固的“数据孤岛”,全局协同与优化时寸步难行。 第三是传统工厂架构的适配挑战。现有工厂的“骨骼”(为固定流程设计的刚性产线)与“神经”(基于预编程的控制系统)是基于工业自动化时代的需求构建的,它们缺乏应对具身智能时代所需的柔性、数据连通性和全局优化能力。在具身智能时代,工厂的“骨骼”开始变柔性,“神经”开始变成算法驱动。 解决上述困境的核心突破口,是为机器人创造一个在投入实体工厂前就能完成全流程训练、优化与验证的云上“数字练兵场”。 只有机器人在虚拟环境里“练够了”、“训练好了”、“适应好了”,才可能进入真实工厂。正如吴锴亮所言:“只有通过孪生世界里的无限预演,才能真正预测和优化工厂的产出。”这个练兵场要解决的,不仅是如何让单个机器人更好地工作,更是如何让机器人群落与整个工厂系统协作提升生产力。 群核科技SpatialTwin要做的正是这件事:从工厂设计规划开始,到工厂落成后数字工厂的动态模拟和智能运维,以及更长期的具身智能仿真训练,希望深入工业具身智能时代涉及的各链路,逐一提供相关解决方案。 群核科技SpatialTwin平台视频演示 二、破局关键:打造具身智能的“数字孪生练兵场” 吴锴亮告诉我们,具身智能时代对数字孪生的要求与传统数字孪生已完全不同。 数字孪生在工业领域的落地由来已久。前几年市面上流行“数字孪生城市”、“数字孪生园区”、“数字孪生工厂”项目,通过扫描、AI辅助等方式完成3D视觉空间重建,已经能够通过较低成本解决信息化、数字化和可视化层面的问题。现在以孪生和AI为依托,这个工业世界想解决是完全不同的一个问题——怎么样让有智能的或者自主的机器人在工业里面发挥它的生产力。 这场变革的本质是数字孪生核心需求的根本性转变——从服务于人的“可视化观测”转向服务于机器的“自主决策训练”。 让我们把场景简单展开来看一下,工业具身智能数字孪生平台提出了全新的实际应用需求点。它不仅要让机器人在投入实体工厂前就完成“岗前培训”,更要让整个工厂系统在数字空间中实现持续优化和演进。 实际需求一:一张图,1:1构建适配机器人工作的真实3D工厂 传统工厂设计流程复杂:做规划的、搞仿真的、负责动画展示的各成体系,“各自为政,数据从头开始重做一遍”,费时费力。 具身智能时代的数字孪生平台要能够“一键搭厂”,达到像李飞飞的Marble世界模型效率。从国内视野来看,群核科技的SpatialTwin平台类似一个“工业版Marble”,能够通过群核空间大模型,结合海量工业素材库,实现从CAD图纸到可运行三维工厂的快速搭建。目前,SpatialTwin 已助力杭叉集团的智慧物流仓库方案设计时间从1周缩短至2小时。 通过SpatialTwin平台完成“一键搭厂” 实际需求二:基于真实物理模拟,工厂实时动态智能运维 正如前文提到的,传统工厂运维的痛点之一在于数据孤岛,系统之间并没有充分打通,“中枢大脑”优化无从下手。而在全新场景需求驱动下,支持“全局视角”的群核科技SpatialTwin平台具有差异化,其开放兼容来自工业系统、三方软件和设备的多源异构数据,高精度模拟工业场景流程与节拍,要建立起包括AMR、AGV、机械臂、人形机器人与生产设备等在内的规模化智能体的统一调度,从而实现实时运维。 通过实时仿真渲染,SpatialTwin实现对工厂真实映射和动态仿真推演。当工厂准备引进机器人之前,可以率先在这个数字“双胞胎”里对产线布局进行相关调试验证。投入生产之后,运营人员精准追踪每一台设备、机器的运行状态,通过智能监测与验证,实现智能工厂全局协同和最优化运营。斯坦德机器人与SpatialTwin正联合为国内某新能源车厂打造数字孪生工厂,通过数字孪生构建多系统协同环境。 通过SpatialTwin平台实时运维工厂 实际需求三:仿真练兵,从有限测试到无限进化 机器人训练面临数据稀缺问题,受限于物理场地和时间成本,难以进行充分测试。如果机器人可以在虚拟环境中进行“无限穷举”式的训练,是不是可以大大降本增效? 合成数据解决方案是一大解决路径,群核科技SpatialTwin融合群核空间智能平台SpatialVerse的合成数据解决能力,支持这一路径,通过数据泛化与场景随机技术,可生成海量物理正确的训练场景。这种能力使得无论是通用任务的适应性训练,还是工业场景的专项技能的深度优化,机器人都能持续进化。 通过SpatialTwin平台进行模拟仿真训练 综合来说,一个工业具身智能数字孪生平台的本质,其实是构建未来工厂连接虚拟与现实、算力与生产力的“桥梁”。 而要成为稳固的“桥梁”,这对数字孪生平台提出了全新维度的技术要求革新: 技术维度一:云原生架构——仿真算力成为“水电煤” 具身智能的仿真训练对算力有着近乎贪婪的需求。单个机器人的感知决策循环就需要大量的计算资源,当扩展到数十上百个智能体协同作业时,算力需求呈指数级增长。本地部署的固定算力难以支撑这种弹性需求。云原生架构可实现“算力即水源”的供给模式,基于云原生技术实现“零部署”,能够按需调用高密度仿真算力,满足海量智能体在感知与推理过程中的需求。 技术维度二:物理正确性——虚拟训练必须“真有用” 如果数字孪生环境与真实世界存在物理偏差,那么在其中训练出的机器人技能将无法有效迁移到现实,甚至可能导致“负训练”效果。物理正确性成为数字练兵场的生命线。这要求平台能够高精度模拟工业场景中的光照、材质、摩擦系数、动力学特性等物理参数,确保虚拟环境与真实世界的高度一致。 技术维度三:AI原生——从“模拟场景”走向“训练大脑” 新一代数字孪生平台的核心价值不在于场景的逼真度,而在于能否有效训练和提升机器人的智能水平。这要求平台深度融入AI技术,实现从环境模拟到智能体进化的跨越。SpatialTwin依托群核自研的空间大模型,不仅能够理解物理空间,还能支持机器人在数字空间中完成“感知-理解-决策-行动”的全流程闭环演练。 SpatialTwin平台支持机器人的“感知-理解-决策-行动”闭环演练 可以看到,无论从应用需求还是技术维度来说,具身智能时代的数字孪生平台都在发生剧变。正如吴锴亮在采访中谈到的一个生动比喻:“如果原先的数字孪生是传统油车的话,现在是智能电车。虽然是同样都叫数字孪生,但引擎完全不同。” 要让具身智能企业在工厂真正跑起来,选择传统油车还是智能电车?答案不言而喻。 三、空间智能,撬开万亿“AI+工业”市场 “工业+空间智能”,正是一片方兴未艾的新“蓝海”。 知名行研机构IDC最新预测,2025年全球“AI+工业”市场规模将突破1万亿美元,中国凭借完整的制造业产业链与政策优势,市场占比有望达到35%。与此同时,国务院发展研究中心发布的《中国发展报告2025》预测,中国具身智能市场规模在2030年有望达到4000亿元。这片万亿级的新市场中,空间智能作为关键的“桥梁”基础设施,价值不言而喻。 这一广阔的市场前景背后,是深刻的产业逻辑变革。群核科技创始人黄晓煌在2025世界互联网大会上敏锐地指出,企业的客户正在从“人”转向“机器”。未来机器的数量可能达到人类的10倍,届时能否从向每个人收费,转变为向每一台机器收费,是其2023年启动战略转型的核心方向。 从酷家乐等家居设计软件跨界到工业领域,群核科技并非一日之功。早在2016年工业4.0概念兴起之时,群核就已开始探索从设计到生产的全链路数字化,在家居行业的工业4.0实践中积累了深厚的智能制造理解。这些经验为其进军更广阔的工业领域奠定了坚实基础。 同时在空间智能领域,其过去十余年在技术、数据和生态上的深厚积累,构建了“空间编辑工具-空间数据-空间大模型”的业务飞轮: 超10年积淀的实时仿真能力:其于2013年推出工业级云端CAD软件实现国产替代,如今已拥有全球最大的空间设计平台。其自研的渲染引擎实现了实拍级、物理正确的渲染效果,并且成本仅为行业平均的十分之一,可渲染真实物理世界99%的材质。这项技术从家居到工业场景得以无缝复用。 海量物理正确的合成数据能力:在空间数据层,群核科技沉淀了海量物理正确的三维可交互数据,包括超过5亿的3D场景和4亿的3D模型,拥有全球最大的室内场景认知深度学习数据集InteriorNet。公司基于此推出了群核空间智能平台SpatialVerse,通过模拟物理世界为包括具身智能、AIGC大模型、AR/VR等领域的智能体提供合成数据训练。这为生成物理正确的工业训练数据提供了独特燃料。 百亿级参数空间大模型的理解与生成能力:在空间大模型层,群核自研了百亿级参数的多模态空间大模型,并开源了空间语言模型SpatialLM,该模型让机器具备了类人的空间认知和理解能力。 工具沉淀数据,数据反哺模型,模型优化工具——这个飞轮效应使得群核科技能够快速切入工业赛道,构建起具身智能时代的技术护城河。 结语:机器人进厂的“长征”,从更深的生态合作开始 机器人“进厂”的长征,才刚刚迈出第一步。从单点任务的突破,到整个工厂系统的智能化重构,这条路漫长而艰巨。吴锴亮坦言,量级更高的智能体规模化运行仍在探索中,而孪生技术与真实世界的高度同步、不同系统间的无缝集成,仍需大量工作。 未来的工厂,将是一个由空间智能驱动、由海量具身智能体与人类协同运营的复杂生命体。这条路无法由任何一家企业独立走完。机器人公司构建大脑、空间智能公司提供仿真世界、工厂提供场景、算力企业提供基础设施……当所有角色形成闭环,工业具身智能才会真正到来。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。