行业分类:
加载中...
头条分类:
加载中...
野心VS压力,霸王茶姬和张俊杰的AB面
又一家茶饮品牌冲刺上市。 3月26日,霸王茶姬向美国证券交易委员会(SEC)提交了招股书,申请在纳斯达克上市,股票代码为“CHA”。 霸王茶姬寻求IPO,是新茶饮赛道2021年至今上市热潮的延续: 这几年里,奈雪的茶最先登陆港交所,抢到了“新式茶饮第一股”的名号;茶百道、古茗分别在去年4月和12月登陆港交所;蜜雪冰城从深交所转战港交所,在递交了三次招股书后,今年3月也终于在港交所敲钟。 还没上市的品牌中,除了刚刚递表的霸王茶姬,沪上阿姨也在努力,它去年2月在港交所递交过一次招股书,后来未通过聆讯,又重启了IPO。 茶饮品牌抢着上市,原因无外乎将市场规模持续做大、有更多的资金来应对市场竞争、让生意可以长久经营。 中国连锁经营协会数据显示,2017年至2023年,中国新茶饮市场规模从422亿元攀升到了1933亿元,CAGR为28.87%,预计到今年结束时,市场规模将进一步扩张至2458亿元。 期间,从品类到价格到营销、到加盟商,再到下沉和出海,茶饮品牌的多维内卷一边抬升了规模,一边也让他们彼此越来越像,越难打造差异化。 已经经历过一轮竞争洗礼,跑出了不错速度的更年轻的霸王茶姬,在上述几家品牌中,某种程度上是最有“棱角”的一家。 棱角来自于创始人张俊杰的野心。2017年创立这家品牌时,他给霸王茶姬定下的目标就是要对标星巴克。 棱角也来自于这几年围绕公司的争议,从营销手法到喝了会失眠的产品,再到不少对公司内部管理的质疑,等等。 不过野心也好、争议也罢,翻开招股书,霸王茶姬过去几年里跑出来的高增速足够漂亮,但潜藏的压力,也不容忽视。 01 霸王茶姬关键三年:疯狂开店,大手笔营销 从招股书来看,过去几年,霸王茶姬处于全面狂奔中。 截止2024年12月31日,其全球门店数量为6440家,同比增长了83%;其中大部分门店位于中国,有6284家。 基于不断扩张的门店网络,2022年至2024年,霸王茶姬分别实现4.92亿元、46.4亿元、124.05亿元营收。其也在2023年扭亏为盈,实现净利润8.03亿元,去年进一步上涨至25.15亿元。 往前回溯,霸王茶姬这几年的增长,几乎是爆发式的。 从2017年成立到2022年底,它用了近五年时间才开出了一千家店,其中有超过一半还是在2022年开出的,但在那之后,仅仅在2023年,其新增门店数量就超过了2000家,再到2024年,其新增门店接近3000家。 图/霸王茶姬招股书 乃至对比下来,公司2025年的开店计划都慢了不少。霸王茶姬在招股书中提到,今年其预计在全球新开1000-1500家门店,年初至今已开业207家,另有442家在筹划中。 霸王茶姬的加速,有客观原因,也有主观原因。 站在行业视角,2022年底喜茶开放加盟,一边加剧了茶饮品牌间的规模竞争,另一边,各家纷纷放开加盟制,也是基于当时新茶饮赛道的降温之势所迫。 2022年,新茶饮市场迈入了慢增速周期。 中国连锁经营协会发布的《2022新茶饮研究报告》显示,2022年新式茶饮市场规模约为1040亿元,仅同比增长了3.7%。 同期资本的兴趣也在减弱。据红餐大数据,2021年茶饮品类共披露了30起融资事件,披露的融资总金额超过125亿元,但到了2022年,茶饮赛道共披露了26起融资事件,融资总金额缩减了近三分之二至45亿元。 这一背景下,开更多的店、卖出更多的饮品、影响更多的消费者,成了每一家茶饮品牌都想讲的故事。 霸王茶姬2021年完成3亿元的两轮融资后,开始加速拓店。那一年里,张俊杰提出的扩张计划是,用一年时间冲刺1000家店、两年时间冲刺5000家店。 但真正的转折点出现在2023年。霸王茶姬打造出了爆款产品“伯牙绝弦”,全年卖出了2.3亿杯,过去三年一共卖出了超过6亿杯。 招股书也显示,2024年,霸王茶姬有约61%的GMV都来自于前三大最畅销的产品——做个对比,蜜雪冰城前五大款畅销产品在总出杯量中的占比为41.2%。 有核心爆款的直接好处是,很长一段时间里,霸王茶姬都不愁加盟商,反而要做筛选。 “加盟商为霸王茶姬的加盟资格争得头破血流,因为品牌正处旺盛的声明周期。”此前,一位霸王茶姬的加盟商如此向媒体表示,其还提到,当时霸王茶姬的部分门店可在八个月之内回本,明显短于行业平均两年的回本周期。 另一个视角里,这三年,霸王茶姬也越来越舍得花钱做营销了。 根据招股书,2022年至2024年,霸王茶姬的营销支出分别为7360万元、2.6亿元、11亿元,分别占相应期间净收入的15%、5.6%、8.9%。 对此,晚点LatePost此前曾报道,一位头部茶饮品牌业务负责人提到,他们曾计划请一位流量明星宣传新品,但对方开出的价格奇高,原来是霸王茶姬在几个月前与该明星合作时主动抬高了价格。 02 草根、“枭雄”、野心家,张俊杰迈向更难一步 霸王茶姬年轻的创始人张俊杰,无论如何都会处在聚光灯下,被讨论、被关注。 这源于他不寻常的早年经历: 10岁时父母相继离世、独自流浪七年、18岁才学会认字写字。但他17岁时,就能凭借个人能力成为一家连锁奶茶品牌的云南区域运营负责人。 再后来他在24岁时创立霸王茶姬,八年后的今天已经很接近拥有自己的第一家上市公司。 八年说短不短,但也不算长——现在主流的茶饮品牌中,霸王茶姬是最年轻的品牌,张俊杰也是最年轻的创始人,喜茶的创始人聂云宸也很年轻,但比张俊杰还要大两岁。 这也源于,在带着霸王茶姬从0到1、从1到10的进化过程中,草根出身的张俊杰,有着更大的野心。 去年5月的一次行业论坛上,张俊杰说,霸王茶姬2024年的目标是“销售额整体超过星巴克中国”。 后来,一位熟识张俊杰的90后美妆品牌创始人告诉媒体,对标星巴克,是张俊杰在创业第一天就定下来的目标。 正如暗涌Waves近期在一则报道中提到,一位消费投资人是这样评价张俊杰的:“公众乐见于英雄的企业,张俊杰现在看来至少是枭雄。”这背后实则是,过去几年里,霸王茶姬的几乎所有动作,逆势扩张或是一开始模仿几乎所有品牌,又或是“碰瓷式”营销,最终目的都只有一个: 成功,而且是更大的成功。 对此,很多投资人的解读是,也许因为他曾经一无所有过,所以更渴望成功,“更想把事情做大”,更在意能不能把伯牙绝弦“卖到100个国家”。 这也在无形中塑造了这家公司的管理风格。 一位霸王茶姬管理层此前向晚点LatePost透露,张俊杰在内部推崇华为的狼性文化,要求每个员工“必须兼具匪气和文气、猴气和虎气。”虎气指的是敢作敢为,猴气指的是机敏灵活。 代表性场景是,为了激发团队斗志,每当多人会议、大型活动结束后,参会的在场成员必须齐喊,“我们是霸王人,一群人,一件事,把茶做到骨子里,YES!”,再鼓掌7次。 再到现阶段,张俊杰的野心早已不只是中国市场了,他要带领霸王茶姬迈向全球化。 霸王茶姬创始人张俊杰,图/霸王茶姬官网 前段时间,张俊杰提到,霸王茶姬希望在未来有100多个国家有霸王茶姬的身影,希望一年可以为茶友人提供150亿杯茶,有30万个伙伴遍布全球,通过一杯茶来链接消费者的每一天。 “霸王茶姬的未来只会是一个品牌,通过品牌下的多个品类铺设全渠道,去往全球化。”他这么说道。 甚至霸王茶姬的对标名单里,还新加了雀巢和可口可乐——张俊杰认为,霸王茶姬要用“三杯茶”实现价值创造,对应三个喝茶场景: 第一个场景对标星巴克,打造现制茶空间;第二个场景对标雀巢,把现制现售场景延伸到每个家庭和办公室;第三个场景对标可口可乐,做预制茶饮料。 霸王茶姬招股书中也提到,此次公开募集的资金,其中一部分将用来构建海外供应链网络等等。 目前,霸王茶姬海外市场的156家门店全部集中在东南亚区域,马来西亚占了148家。为了尽快在海外打开市场,2022年时,霸王茶姬签下了羽毛球名宿李宗伟成为其马来西亚地区的品牌代言人。 但其正加速拓展更多市场,这个月底,其美国首店将在洛杉矶正式营业。 当然,长远视角来看,霸王茶姬要想讲好全球化故事,难度无疑又上升了一个梯度。 03 同店GMV增速下滑、加盟商回本周期变长,霸王茶姬也有隐忧 对成长期的企业而言,高速成长会掩盖很多问题,尤其是当这家企业还处在一个竞争高度激烈的赛道时。 茶饮赛道就是如此,它甚至称得上是连锁产业中竞争最为激烈的行业。 但过去几年大家跑马圈地下来,市场加速迈入存量竞争阶段的趋势也在愈发明朗。 比如大家的拓店速度几乎步调一致放缓了。 古茗2023年新增门店数量超过2000家,2024年前三季度仅新增700多家;沪上阿姨在2023年净增2482家门店,2024年上半年仅净增678家。 茶百道在半年报中透露,2024年前半年门店数量新增500多家,仅为2023年整年新增数量的三分之一左右;至于喜茶,今年2月都宣布暂时暂停加盟了。 另一方面,从产品到价格乃至门店,赛道同质化也在日益加剧。 红餐大数据此前公布茶饮品牌上新数据显示,2023年下半年,行业共上新了1066款新品,2024年1月至7月茶饮品牌共上新了971款新品,平均每个品牌每个季度约上新11款新品。 不过平安证券在一则研报中提到,目前新茶饮上新的保质期只有半个月——一个全新的新品上市后,约半个月左右的时间,各个品牌即可陆续完成类似产品的上线。 再到连锁化扩张维度上,由于投资门槛相对较低、标准化程度相对较高,茶饮品类成了餐饮品类中连锁化率最高的品类。2022年以来,几乎所有的新式茶饮品牌都放开了加盟模式,实现了门店数量的快速扩张。 上述背景下,一个微妙的信号是,霸王茶姬之前上市的茶饮企业中,业绩表现也在持续承压。 比如3月14日,茶百道在盈利警告中提到,预计2024年录得经调整净利润在5.8亿元至7.09亿元,经调整净利润将同比下降不超过53.9%;此外,公司预计净利润将在4.32亿元至5.28亿元之间,同比下降不超过62.47%。 再来看奈雪的茶,2024年,集团收入从51.64亿元下跌了4.7%至49.21亿元,同时扭赢为亏,经调整净利润由2023年度的盈利人民币2090万元,转变为2024年的亏损9.19亿元。 相比之下,霸王茶姬近几年在营收、利润侧都呈现出了持续增长态势,但招股书中显露出的同店GMV增速下滑的信号,也尤为明显。 根据招股书,2024年以来,霸王茶姬的同店GMV增速持续下滑,尤其去年下半年以来,负增长开始成为常态——去年四季度,在中国市场全部地区,其同店GMV均转为负增长,整体下滑了18.4%。 霸王茶姬同店GMV增速持续下滑,图/公司招股书 对此,霸王茶姬在招股书中解释,在其扩张的早期阶段,门店渗透率相对较低,供应有限,消费者的高需求促成了更好的业绩表现,不过“随着我们继续扩大在中国市场门店网络规模和密度,消费者需求得到了更好的满足,我们的门店水平也自然而然开始遵循正常化的增长轨迹。” 由此,霸王茶姬潜在的另一重挑战在于,如何持续吸引到加盟商,并让加盟商赚到钱。 根据华福证券,对比不同茶饮品牌的单店模型,霸王茶姬加盟商的整体投入成本相对更高,但对应的,由于门店面积更大、日均销量更多,且单价相对较高,再加上早期门店密度没那么大,市场竞争环境尚未如此白热化,加盟商们能拿到的年收入也会更高,回本周期相对更短。 张俊杰此前在一次论坛上称,2023年霸王茶姬加盟店平均在5.5个月回本。 但如今霸王茶姬的这种优势正在减弱。此前有超一线城市的加盟商向媒体表示,在租金、人力和材料费用几乎不变的情况下,门店的回本周期已经被拉长了。 不过霸王茶姬也在招股书中打了预防针,其提示道,公司有限的运营历史可能无法作为评估其前景和运营业绩的充分基础,公司无法保证能够在未来保持历史增长率。
英国政府计划将AI引入各行各业,老旧IT系统与安全风险成最大障碍
IT之家 3 月 28 日消息,据外媒 TechRadar 今日报道,英国公共财政监督机构发布报告称,指出人工智能推广面临多重障碍,包括过时的传统 IT 系统、数据质量不佳和数据共享受限等问题。 这份报告是英国政府“全面推广 AI”计划的一部分,该计划希望通过吸引 140 亿英镑(IT之家注:现汇率约合 1316.41 亿元人民币)的私营投资,将人工智能技术引入各行各业。 公共账目委员会估算,英国中央政府约 28% 的 IT 系统已进入“生命周期终结”状态,意味着它们无法更新、缺乏供应商支持,或已不具备成本效益。 英国科学与技术部(DSIT)已将这些老旧系统列为优先事项,原因不仅是推动 AI 应用,更重要的是潜在的严重网络安全隐患。 不过,DSIT 警告称,解决方案并非一蹴而就,硬件升级需要时间和资金投入,政府自身也承认“仍需加强对这一问题的掌控”。在 72 个被列为最高风险的“红色评级”旧系统中,仍有 21 个尚未获得修复资金,挑战仍然严峻。 公共账目委员会主席杰弗里・克利夫顿-布朗爵士表示:“政府希望让 AI 成为国家运作的核心动力,但我们的报告质疑,公共部门是否已做好迎接这一变革的准备。” 他进一步指出:“AI 是当代最重要的技术进步之一,政府希望充分利用其潜力当然值得肯定。然而,熟悉我们委员会以往监督工作的人都清楚,政府在数字化建设上的低效表现早已根深蒂固,因此任何关于快速变革的承诺恐怕都只是空谈。”
vivo布局机器人产业,一首科技理想主义者的长歌
在3月25日召开的博鳌亚洲论坛2025年会上,vivo执行副总裁、首席运营官,中央研究院负责人胡柏山正式官宣,vivo成立机器人Lab(实验室),进军机器人行业。 胡柏山表示,vivo将专注机器人“大脑”(AI Agent)和“眼睛”(MR)的技术研发,主攻消费级市场,研发个人和家庭场景的机器人产品。 消息一经发布,瞬时引起行业关注,在众人还未从“手机厂商入局车市”的惯性中抽离,vivo给了当头一击。曲径通幽处,背后原因是vivo长期主义的品牌基因和以人为本的商业逻辑。 在汽车市场已经进入巨头混战的红海阶段,而服务大众的消费级机器人产业却焕发出生机。随着全球老龄化的加剧,未来很多家庭或许都将配备2~3台不同功能的机器人。但家庭场景复杂多变,人类需求千差万别,vivo能否下好这盘棋,才是行业和众多用户关注的焦点。 1 手机与机器人,vivo的“造机”哲学 近年来,科技产业进入了一个微妙时刻。手机厂商纷纷卷入汽车赛道,也不乏汽车品牌开始下场造手机,在手机和汽车互为主角之际,老牌手机厂商vivo给出了不一样的选择。 胡柏山在演讲中表示:“依托于vivo‘蓝科技’在AI大模型与影像领域的十年深厚积累,叠加自研混合现实头显积累的实时空间计算能力,我们会聚焦孵化机器人的‘大脑’和‘眼睛’,让机器人可以‘看得懂场景,听得懂需求,给得了回应’。” “造手机”和“造机器人”有何不同?vivo入局新赛道的底气在哪里? 1.技术的复用 从技术角度分析,手机更多是对二维世界的交互,而机器人则考验的是对物理世界的3D空间感知能力。机器人的视觉感知,依赖的是摄像头和相关算法;触觉感知是通过传感器;听觉感知是依靠麦克风阵列和语音识别算法,这些也是手机研发的核心技术,都将成为vivo入局机器人赛道可迁移复制的技术和势能。 在手机时代,影像旗舰看vivo是众多用户的共识。通过自研+共研,vivo蓝图影像能力行业领先。比如去年发布的vivo X100 Ultra,是安卓阵营中唯一支持3D影像的手机,通过软硬件深度融合,打造沉浸式3D影像体验,可赋能家庭机器人实现精准且高效的3D视觉识别。 再比如AI领域,vivo曾推出5款自研蓝心大模型,成为首个在手机端实现大模型载入的手机厂商。去年,又升级为语言、语音、图像、端侧、多模态大模型,带来人机沟通方式的新革命,这些技术创新都可复用到机器人的“大脑”上,形成自主“感知-决策-执行”的超能力。 2.场景的延伸 作为每个人每天都在用的终端设备,手机行业有着最大基数的消费人群,最前瞻的技术生态,多元的应用场景。胡柏山指出:“机器人是手机行业的未来,它将成为连接物理世界和数字世界的桥梁,依旧会遵循以人为本、回归用户场景创造极致体验的价值准则。” 同时,对C端需求的理解和洞察,没有哪个产业比手机厂商更懂。全球拥有5亿用户的vivo,覆盖了几乎所有用户场景和用户需求,可以为机器人场景落地提供试验场。相比B端工业级逐渐成熟,满足C端需求的家庭机器人更需要vivo这样的厂商入局赋能。 2 风口与价值:科技信徒的平衡取舍 能扛起“造人”大旗,源于vivo这30年来的技术积累,不追风口、不炒概念,以手机为中心向外推演,始终贴近用户的真实需求场景,持续做自身擅长的事,做对的事。 在vivo的经营理念里,排在首位的就是长期主义的“种因哲学”,用10年时间让影像体验从追赶到领跑,在人像、长焦、夜景等场景下做到极致。只有在技术成熟、市场需求明确的情况下,才会入局新赛道,为产业创造更大价值。 与汽车产业相比,家庭机器人的产业周期相对更长,根据vivo的产品节奏,预计三到五年出原型机,正式推出人们理想中的家庭机器人可能需要10年以上。用胡柏山的话来形容,就是“渐进突围、沿途下蛋”的路径,让技术走出实验室,逐步渗透到真实生活中去。 除了长周期之外,机器人产业与供应链及生态伙伴的协作更紧密。vivo一路走来的成绩有目共睹,一定程度正是来自产业链的协同创新。胡柏山指出:“vivo秉承相互成就的‘共生智慧’。提倡与人合作时‘利他共赢’,致力于寻求更多志同道合的伙伴,不断成长共同进化,共建共享‘繁茂的科技生态雨林’。” vivo不做全身硬件,而是要做机器人的“智慧中枢”。这种选择不是逃避竞争,而是采用减法逻辑将资源集中在最擅长的领域,以长期主义赋能产业,与生态伙伴共同前行。而流淌在vivo基因里的人文情怀,则让这场机器人革命更具温暖和爱的属性。 早在2018年,vivo AI全球研究院就已落成,以AI为底层技术,不断为大众用户迭代更优体验,更将AI技术延伸到视觉、听觉、语言等层面,让听障视障人群也能更好地融入社会。在“无障碍通话”、“声音识别”之外,vivo还通过“职业模式”、“无网通信”、“南极/蓝海电池”等多项创新科技,关注每一个个体、每一种需求。 在产业风口与价值创造的两端,vivo以满足用户真实需求为权衡原则,聚焦消费级市场,个人和家庭场景的机器人产品,走进用户的真实生活,回归场景,解决痛点,迭代产品。 在《创新的起源:一部科学技术进步史》一书中,指出所有伟大创新都源于对社会、用户需求的深刻理解和响应。在 vivo 的经营哲学中,技术是冰冷的,但人心是火热的,vivo的终极目标,是以技术为工具,让人们感受幸福,拥有快乐。 3 科技普惠,走到千家万户的生活中去 有数据显示,到 2030 年,美国 70 岁以上人口与 24 - 69 岁人口的抚养比预计达到 25%,日本更是高达 50%,欧洲和中国也面临着类似的严峻挑战。马斯克预测,在未来20年内,人形机器人的数量将超过人类。到2040年,全球将有至少100亿个人形机器人投入使用。 胡柏山在演讲中表示:“当前的AI和机器人,分别代表数字世界和物理世界的顶尖技术成果,但两个世界尚处于相对独立状态,未能完美联接。在新的发展阶段,为联接物理世界与数字世界,vivo致力于创造极致的机器人产品,为用户带来更多美好。” 1.稳健扎实的多面准备。 除了手机技术在机器人赛道的复用,vivo近些年已经在为家庭机器人的研发做着技术准备。比如在2024年9月,vivo公开了一项名为“机器人及其控制方法”的专利,主要用于解决相关技术中涉及的天线难以应对通信环境的变化,导致机器人的通信灵活性以及通信性能较差的问题;11月,又公开了一项名为“基于混合现实的交互方法、装置及电子设备”的专利;另外,vivo也在开始提前布局6G通信,为未来机器人场景储备算力。 技术研发之余,vivo也斥资储备相关团队。早在“官宣”前,就已为进军机器人领域筹备人才部署计划:包括机器人首席科学家、机器人技术规划专家等岗位,覆盖了机器人研发的多个关键领域,工作地点包括东莞、上海等地,最高年薪超过120万元, 2.关注始终存在“沉默痛点”。 目之所及,皆是科技之光可照亮的地方。在满足需求、提升用户生活本质的同时,“独居老人、听障人士、儿童看护”等这些始终存在却并未解决的“沉默痛点”,也应是科技普惠的角落。 胡柏山指出:“机器人会应用在家庭服务、养老、医疗健康、教育等领域,既能干好活,还能很懂你。”可以预见,消费级家庭机器人正逐渐从科幻作品中的想象元素,转变为现实生活中真实的存在。 3.成本可控有望打开普惠之门。 从vivo过往的产品策略及市场表现来看,新目标绝不是制造 “天价机器人”,而是通过技术创新降低成本,让机器人走进普通家庭。 通过复用手机供应链的规模化优势,vivo的入局有望将机器人的核心部件成本降低。科技的价值不在于少数人的特权,而在于多数人的共享,这也是vivo一直秉承的商业理念。 结语: 相关报告数据显示,2023 年,我国家庭服务机器人市场规模达到959.2 亿元,同比增长 32.8%,预计到 2027 年,这一数字将接近 3000 亿元 。 在博鳌论坛现场展示的vivo混合现实头显,就是vivo一个阶段性成果。在下个月即将发布的vivo X200 Ultra上,也会集成vivo在影像领域最新的技术突破。vivo用30年的时间种树育果,如今押注新赛道,也让未来的机器人产业充满了想象空间。 在对未来生活的若干畅想中,机器人除了能顺利完成避障、倒立、空翻等动作,我们更期待那只看似冰冷的机械臂可以为孩子盖上毛毯,为生病的老人端来一杯热水。直到那时,机器人才能完成从“工具”到“伙伴”的转变。
比亚迪最贵轿车发布,仅售62.8万!小米SU7 Ultra有对手了
作者 | 周伟鹏 编辑 | 汤安迪 万万没想到,小米SU7 Ultra的第一个强力竞争对手,居然是仰望U7。 3月27日晚,定位「百万级旗舰轿车」的仰望U7正式发布,四座旗舰版售价70.8万元,五座豪华版62.8万元,两个版本都提供纯电及插电混动可选。 仰望U7,可能是目前地表技术含量最高的量产车,这个价格超出很多人的想象,可以期待一下4月上险量。 与之对比,小米SU7 Ultra起售价为52.99万元。 仰望U7的核心技术 仰望U7拥有三大核心技术:云辇-Z、易四方、水平对置发动机。 目前市面上最先进的全主动悬架,普遍以油液作为介质进行调节,受客观物理限制,响应速度、精度都受限。 为此,比亚迪投入上万人、历时7年打造出全球首款智能悬浮车身控制系统——云辇-Z。 其原理有点像磁悬浮列车,抛弃了传统的液压/空气弹簧,采用四个悬浮电机直接驱动悬架,也就是下图中,车轮旁边巨大的圆柱体。 通过电磁场精准控制电机推力,它将响应速度从行业平均的100毫秒,提升至5-10毫秒。 在行驶过程中能够实现更加精准、即时的动态控制,大大提高行车的稳定性。 同时具备能量回收功能,可将制动过程中的动能转化为电能,为电池充电,延长续航里程。 得益于此,仰望U7首创路肩辅助和悬浮攀阶功能,前者可在行进中动态调平,无感攀登路边台阶;后者可平稳连续上台阶,让坎坷变坦途。 在此前的宣传中,比亚迪还用它挑战车顶咏春。 驾驶员开着一台仰望U7,通过由不同高度减速带铺设的崎岖路段,而车顶上的武者,以单脚支撑的方式重现咏春经典荧幕镜头。 除了提高舒适性,云辇-Z还提升了仰望U7的安全性,单轮爆胎后,悬架会自动抬升受损车轮,剩余三轮独立驱动,三个轮子也能开。 至于易四方技术,大家应该很熟悉了。 在四独立电机的帮助下,仰望U7可以对四个车轮进行毫秒级独立控制,在原地掉头、定轮旋转等功能的基础上,全球首创「平行横移」功能,让车辆「横着走」。 面对一些非常狭窄、平时根本停不进去的停车位,它能通过横移的方式停进去。 搭配双向20°智能后轮转向,和奔驰S级一个尺寸的仰望U7,最小转弯半径只有4.85米,跟比亚迪海鸥差不太多。 得益于比亚迪的垂直整合能力,仰望U7打破了硬件之间的隔阂,将易四方和云辇-Z等技术全面贯通和融合。 仰望U7能实现100km/h高速时,遭遇美式截停——后方车辆侧向追尾后,快速将车身调整至正常姿态,平稳脱险。 具体原理是,车辆瞬间感知到碰撞,云辇-Z瞬间下压,降低重心,抑制车身侧倾。同时,后轮快速转向,回正车身。 它还支持同侧车轮160km/h工况瞬时爆胎保持稳行能力,高速上无需担心爆胎导致意外事故。 此外,仰望U7麋鹿测试最高车速达到95.78km/h,打破了腾势Z9GT创下的记录。 最后说下水平对置发动机,因为仰望U7前舱放了两个驱动电机、两个悬浮电机,又要考虑风阻,剩余空间已经放不下现有的直列发动机。 为此,比亚迪打造了中国汽车首款量产水平对置发动机,保时捷911同款布局,将发动机高度压缩至420mm,远低于直列发动机700mm以上的高度。 由于水平对置发动机的结构可以抵消振动,具有静谧、平顺的优势,仰望U7还将混动和纯电工况的噪声差距,控制在1分贝以内,基本感觉不出差异。 说实话,仰望U7发布会用了大量时间讲技术,看着并不算有趣。但当你仔细回味,会发现那些几句话带过的技术,随便一个拉出来都是王炸。 要是让友商来开这个发布会,PPT能讲个三天三夜,热搜多到能用箩筐装。 不再有争议的外观内饰 与让人叹为观止的技术相比,仰望U7的外观和内饰,此前存在一些争议。 其前脸采用仰望U9同款「时空之门」设计语言,造型凶狠,富有辨识度。 车身尺寸方面,纯电版本为:5265x1998x1517mm,轴距3160mm。 插混版本为:5360x2000x1515mm,轴距3200mm。 内饰方面,座舱以「中轴对称美学」为核心,拥有三块屏幕,中控屏为曲面结构。 全系标配Nappa真皮座椅,支持通风、加热与按摩功能,四座版更配备后排双悬浮屏与双冰箱,车载丹拿铂金证据系列音响。 动力方面,新车拥有1300匹马力、零百加速仅需2.9秒,最高时速270km/h。 能实现77次连续弹射性能无衰减,33米级100km/h-0制动距离。 插混版车型配备52.4kWh电池,综合续航里程1000km。纯电版电池容量达到135.5kWh,CLTC纯电续航720km。 搭载天神之眼A高阶智驾,拥有3颗激光雷达、5颗毫米波雷达、13颗摄像头,508TOPS算力平台,可实现端到端高速和城区高阶智能辅助驾驶。 在今晚的发布会之前,很多人并不看好仰望U7。作为「百万级旗舰轿车」,它的目标人群到底是谁? 和蔚来ET9、尊界S800一样,去抢迈巴赫S级的车主?但因为4悬浮电机等技术,仰望U7的后排空间,在这一级别并不算很大。 针对保时捷Panamera?仰望U7的外观和内饰争议较大,这一套设计不是很符合年轻车主的口味。 但是,当新车价格公布后,所有的不看好都烟消云散。 只要62.8万元,你就能买到云辇-Z+易四方+1300匹马力+水平对置发动机...王炸技术。 这三星堆面具一样的前脸,咋越看越好看了。 在看的各位是什么想法?有下单了的么?
电商之争,拐进正轨
电商之争拐了个急转弯。 去年上半年,各家还在低价竞争的巷道里激战,到了下半年,各家普遍意识到低价内卷并不能带来更多用户,反倒把商家拖入到低利润的陷阱里,经营难以持续。平台们终于踩了一脚急刹车,最典型的动作就是,自淘宝松绑仅退款起,优化仅退款的平台越来越多。 但急刹车仅回答了前半个问题——“不做什么”,至于“要做什么”,今年才变得清晰。 既然整个大盘的用户规模已很难有明显增长,摆在平台面前的核心问题是,为用户提供合适的商品,那么就要留住和吸引一批这样的商家:能创造出吸引这一代消费者的商品,能黏住用户,能长期经营。 平台们纷纷从低价战役抽身,转而扶持商家增长。2月,淘天开启增长战役,紧跟着,3月,拼多多宣布要扶持中小商家。 春节后,一批美妆品牌接到了天猫小二的电话和邮件:小二们透露,天猫在2-3月推出了堪称史上最大力度的支持政策,要在美妆、服饰、运动户外行业打一场增长战。 一位接近阿里人士告诉字母榜,在服饰类目,平台会和商家共同去站外投流,“比如商家在小红书投放了50万,平台最高会再补贴50万。”增长战役的核心是解决商家缺流量、缺复购、缺利润的问题。 在重点行业试点几个月后,在本周的天猫Top Talk上,天猫正式明确了“扶优”、“支持有原创性有创造力的优质品牌”的态度,具体策略集中在新品、品牌会员、现金返佣、全域获客等几个焦点上。 不难看出,这些方向是要整体提高商家的流量、收入和利润。对淘天来说,这种战略恰符合其基因,其优势战场就是在商家一端。它重新正视自己的基因,回到自己的优势战场。 事实上,这也正是行业的大趋势。告别内卷之后,行业正重回增长正轨。 “今年做淘宝,一定要赶紧上新,上新就有流量。另外有原创设计能力的服饰商家上新之后,要报名超级新品橱窗,流量会明显不同。”一位电商从业者建议道。 这与淘宝年初的一项政策有关。 今年2月,淘宝商家后台上线了“新品超级橱窗”板块。服饰商家,每发布成功一个新品,最高可拿3万曝光PV的流量——等于白捡500元广告费,另外完成新品目标的淘宝商家,最高可拿25万元现金券。 一批服饰商家已然看到其中的机会。服饰商家Songmont今年38活动期间上新了13款新品,并报名了新品橱窗,“其中一款新品文琪同款百衲托特上线三周,成交额破了千万”,该商家说。 过去几年,各个平台都在争夺品牌新品,这与新品能带来用户关注的特性有关,同时新品还有打爆成为爆品,获得新客、抢占市场的可能。新品爆发,意味着品牌接下来的增长有了更多确定性。 这正是淘天将新品视作带动站内流量的一环、给新品流量扶持的原因。另外,一旦品牌在平台的新品打爆,无疑会与平台绑定得更深,会在平台投入更多的资源。 “25年第一季度我们发布了近50款新品,款款是爆品”,近日一次公开活动上,小米集团副总裁兼中国区总裁王晓雁透露,今年他感受到天猫在新品资源方面加大投入,比如在首页推荐、搜索加权、直播补贴等方面有扶持计划。 除了服饰类目,本次增长战役的另一重点类目——美妆护肤也从平台对新品的扶持中收益。38大促期间,身体护理类目品牌水之蔻上线了新品果酸沐浴露,该商家介绍,现在新品上线平台会给安排一些资源位,比如小黑盒能提升新品曝光率。新品对全店销售自然也有带动,活动期间,水之蔻全店成交同比增长超100%,首次冲进身体护理类目店铺榜TOP5。 淘天今年在流量端的另一动作是,加大从站外引流的力度。甚至商家投放站外广告的同时,淘天会追加投放。 此前据晚点LatePost报道,这次增长战略最大的不同是,内部认为阿里应该更开放,具备全域意识,协助品牌尤其是中小品牌商家在全网做大,阿里的收入自然也会提升。 而站外引流的平台便是小红书、B站和微博。 一位在小红书做投放的品牌告诉字母榜,他们在小红书做投放时,可以选择走“小红星”订单,监测从笔记引流到淘宝天猫的搜索、成交情况。 可以看到,淘天的流量战略正发生改变。一位电商人士表示,让商家自主去外部平台获取流量是正确的路线,利用好流量平台,能扩大流量池。 New Balance今年在发售471鞋款,就增加了对该新品在站外UD广告的投入,并引流回淘,3月8日当天,这款产品成为百万级单品。 显然,从站外引流回淘,已被验证是行之有效的扩大流量池、同时促进交易的方式。近日,天猫总裁家洛表示会在站外流量方面做“更激进的策略运营”,“未来新一年,品牌通过更多种草、外投回到旗舰店的生意,我们会做更多反哺策略、合作策略,甚至流量加投策略。” 当然,拉新和促活只是这场战役的前半部分,增长战役最终的目标还是更高的留存、复购,以及让商家获得更高的利润。 3月中旬,淘宝内测新版店铺会员产品。主要是在搜索页、商品详情页等位置展示店铺会员信息,比如在搜索推荐页展示会员价、会员券、会员立减、会员加赠等会员权益信息,吸引用户入会。 显然,私域正被淘天视作提升复购的路径。 不过由于很多商家并未意识到经营会员权益的重要性,此前在会员权益方面投入并不积极。淘天方面提前对外宣布,今年会与商家共同出资,提升会员权益。 可以看出,淘天今年的一个方向是与商家共同投入,比如共同出资到站外投放,共同出资做会员权益,这正是行业正在发生的重要转变。 2023年,各大电商平台纷纷推进仅退款,在用户和商家的天平上越来越倾向了用户这一端,虽然这种服务初衷是提升了用户体验,但也被羊毛党钻了空子,商家备受成本之苦不说,平台生态也受影响。 改善营商环境,提高商家收入,成了今年电商平台的主线。 2月初,天猫公布了最新返佣政策,有商家表示,这是近年返佣力度最大的一次,最高可返还60%的佣金。 以服饰类目为例,完成基础目标,排名在前1万,可以享受20%的类目佣金返还;完成挑战目标,且基础目标排名在前1万,可以享受60%的类目佣金返还。 另据亿邦动力网报道,有商家从小二处获得信息,运动户外类目的激励是史上最大力度激励,其返佣激励分为全店和新品两种,其中新品返佣最高达到100%,而全店激励最高可以挑战3%档位,“做到了稳赚,做不到不赔”。 返还佣金政策,相当于直接提升了表现较好的商家收入。 另外,过去一年,仅退款政策带来的羊毛党、运费险成本极大提高了商家的运营成本。一位商家说,一天早上,他发现后台有一单大单,便赶紧通知仓库打包、发货,结果用户收到货很快就退货,“白白损失了一百多元的运费。” 甚至仅退款、运费险已经形成了恶性循环。使用仅退款功能的羊毛党越来越多,退货率越来越高,会导致运费险的金额上升,一位商家表示,其店铺商品的运费险成本很快就从2元多,涨到了3元多,“甚至比发货的邮费还贵。” 想要整体提高商家收入,就势必要改善营商环境。在推进优化“仅退款”、系统化降低退换货成本的基础上,淘宝今年加大生态治理的力度,包括打击职业羊毛党、整治恶意店群及无货源店铺、打击抄款、打击AI假图等。 随着淘天带头转向,其他各大电商平台也正在陆续出台扶持商家的举措,一度被“拼低价”和“仅退款”裹挟的电商商家,重新找回了一条向上生长的道路。 增长战役是淘天的一项长期工程,乐观的是,近几个月的探索已有实际成果的反馈。 最近淘宝公布的数据显示,2025年前三个月淘宝天猫平台日均首购消费者相比去年同期增长数倍。 据此前派代网报道,今天38大促期间,很多美妆品牌首日涨幅超100%,其中,SK2同比增长214.3%,Tom Ford同比增长281.6%,林清轩同比增长356.7%。另据此前天猫公布的数据。38大促开卖首日,KEEN同比增长超330%,伯希和同比增长超320%,昂跑同比增长超240%,北面同比增长超220%,可隆同比增长近170%。 这些类目正是淘宝增长战役率先启动的方向。从阿里最新一季财报看,去年四季度淘天已有转暖的迹象,核心的淘天客户管理收入(包含广告和佣金),增长9%至1007.9亿元,环比增长7%,超出市场预期。接下来就是继续发挥优势稳住基本盘。 阿里巴巴财报电话会上提到,国内电商的中长期目标是稳住市场份额,同时优化用户体验,提高营商效率。增长战役显然是这一中长期目标下的产物。 近期一次会议上淘宝天猫进一步表态,进入“精耕细作”竞争阶段,电商平台的一大策略变化是不卷低价,优化营商环境,集中资源扶持优质商家,进而丰富平台优质供给。 简单来说,电商平台要“向上增长”,而不是继续“无效内卷”。 过去一年,大家普遍意识到,卷低价是无止境的。站在淘天的角度,绝对低价并非它的核心优势,拼命卷低价会无限摊薄商家利润不说,最终还会损害平台生态。 在所有电商平台中,淘天无疑是最早弱化低价战略的平台,它发现了卷低价路线的不可持续性,坚决地回归了自己的优势地带。 淘天的优势在于拥有丰富的商家资源,让商家持续为用户提供合适的商品,是商家未来的增长点,也同样是平台的增长点——这是淘天做新品激励、扶持新商家的原因。 近日,淘宝天猫给优质品牌下了个定义:不单单是GMV头部品牌,更是有原创性有创造力,能引领消费需求创造出好产品获得新用户,产生粘性用户,可长期持续经营发展的品牌。 要让优质商家愿意留在平台,就要从流量和资金端给予支持——这是淘天在站内站外做流量激励,返还佣金,改善营商环境的原因。 对淘天来说,这种战略恰符合其基因,其优势战场就是在商家一端。它重新正视自己的基因,回到自己的优势战场。 这种趋势,并非是淘天一家的变化,而是行业正在进行的改变。扶持有创造力的品牌和商家,不让商家陷入内卷已经是行业共识,淘天率先迈出了这一步。可以看到,商家正迎来近年最好时候。
特斯拉被加拿大针对:取消电动车补贴 禁止参加车展
快科技3月28日消息,据央视财经报道,加拿大政府近日将特斯拉排除在零排放车辆激励计划未来受益名单之外,并冻结已申请但未发放的补贴款项。 报道称,加拿大交通部长弗里兰已确认,她已指示交通部修改相关资格要求,只要“美国对加拿大征收不合法的关税”,特斯拉汽车就不符合补贴资格。 这一举措是对美国近期宣布额外关税的直接回应,美国日前宣布,将对所有非本土生产的汽车及部分零部件征收高达25%的关税,税收新规将于4月2日生效,而加拿大此前出口至美国的税率为2.5%。 加拿大还决定暂定向特斯拉支付总计4300万加元(约合3011万美元)的补贴款项。而上周,温哥华国际车展已以安全考量为由禁止特斯拉参加今年的活动。 车展主办方曾多次要求特斯拉自愿退出本次车展,但特斯拉均未接受,最终主办方决定取消其参展资格。 据了解,随着特朗普扬言要“吞并加拿大”,马斯克近段时间也多次在社交平台上批评加拿大政治,加拿大公众对于马斯克的态度也迅速恶化。 因此,加拿大部分地区近期爆发了针对特斯拉和及其首席执行官马斯克的抗议活动。另有加拿大民众发起国会请愿书,呼吁撤销马斯克的加拿大公民身份,理由是“马斯克在特朗普政府中扮演的角色明显威胁加拿大主权”。
阿里通义千问推出QVQ-Max视觉推理模型:有“眼力”,更有“脑力”
凤凰网科技讯 (作者/彭坤苹)3月28日,阿里通义千问团队发文宣布,正式推出QVQ-Max视觉推理模型第一版。该团队表示,去年12月发布的探索模型QVQ-72B-Preview存在一些不足,而新版本的模型具备强大的多模态处理能力,它不仅能够“看懂”图片和视频里的内容,还能结合这些信息进行分析、推理,甚至给出解决方案。 从数学题到生活小问题,从编程代码到艺术创作,QVQ-Max都表现出了不俗的能力。 MathVision榜单测评图 图源:通义千问官方公众号 在权威的MathVision榜单测评中,通过对模型thinking最大长度的调整,其在解决复杂数学问题的准确率上呈现出持续上升的趋势,充分彰显了该模型蕴含的巨大潜力。 据悉QVQ-Max的核心能力,主要体现在三个关键维度: 细致观察:QVQ-Max对图片的解析能力非常强,无论是复杂的图表还是日常生活中随手拍的照片,它都能快速识别出关键元素。比如,它可以告诉你一张照片里有哪些物品、有什么文字标识,甚至还能指出一些你可能忽略的小细节 深入推理:仅仅识别出图片里的内容还不够,QVQ-Max 还能进一步分析这些信息,并结合背景知识得出结论。例如,在一道几何题中,它可以根据题目附带的图形推导出答案;在一段视频里,它能根据画面内容推测出接下来可能发生的情节。 灵活应用:除了分析和推理,QVQ-Max 还能做一些有趣的事情,比如帮你设计插画、生成短视频脚本,甚至根据你的需求创作角色扮演的内容。如果你上传一幅草稿,它可能会帮你完善成一幅完整的作品;上传一个日常照片,它可以化身犀利的评论家。
吉卜力风格AI图像被病毒式传播,OpenAI奥特曼回应
澎湃新闻记者 乐浴峰 AI创意 在OpenAI最新版本的图像生成技术的“助力”下,大量用户在社交媒体上分享日本吉卜力工作室风格的AI图像。 OpenAI日前在GPT‑4o中推出能够精确、逼真输出的图像生成器。GPT‑4o图像生成擅长准确呈现文本,精确遵循提示,并利用4o的知识库和聊天上下文,包括转换上传的图像或将其用作视觉灵感。事实证明,该图像生成器还非常擅长复制吉卜力工作室的动画风格。 诞生于1985年的吉卜力工作室主要围绕着宫崎骏、高畑勋、铃木敏夫三人运作,宫崎骏、高畑勋负责监督,铃木敏夫负责资金运作、发行、宣传。吉卜力工作室曾制作动画电影《千与千寻》、《龙猫》、《苍鹭与少年》等。 OpenAI CEO山姆·奥特曼也加入了“病毒式”传播,将自己的头像换成吉卜力风格图像,并表明自己已被吉卜力工作室化了。3月26日,他在社交媒体上写道:“>做自己>奋斗十年,试图帮助制造超级智能来治愈癌症或其他>最初的7.5年基本上没有人关心,后来的2.5年每个人都讨厌你的一切>有一天早上醒来看到数百条信息: ‘看,我把你做成了吉卜力的风格,哈哈’。” 虽然许多社交媒体用户对使用新的人工智能工具感到兴奋,但也有人哀叹使用它会削弱宫崎骏的作品。OpenAI没有透露用于训练模型的具体数据,但它对吉卜力工作室风格的准确输出也再次引发质疑,OpenAI是否未经许可使用了吉卜力工作室的作品。 有网友表示,OpenAI非常幸运,吉卜力的积极氛围是OpenAI模型的第一次“病毒式”使用,而不是一些可怕的深度造假废话。对此,奥特曼表示,“不管你信不信,当我们引入新技术时,我们在最初展示的例子上花了很多心思。” 吉卜力工作室在北美的代表拒绝置评,不过宫崎骏此前曾对人工智能动画表示强烈反对。在2016年的一次会议上,有人向宫崎骏展示了一个人工智能动画演示,宫崎骏说:“我非常厌恶。如果你真的想做一些令人毛骨悚然的东西,你可以去做。我根本不想把这项技术应用到我的工作中。”他表示,“我强烈认为这是对生命本身的侮辱。” 最近,好莱坞演员和其他创意人士对OpenAI等人工智能公司削弱用于训练人工智能系统的版权作品保护力度表示担忧。在本月早些时候提交给特朗普政府科技政策办公室的评论中,400多名电影制作人、演员、音乐家和其他人反对OpenAI和谷歌游说“政府给予特殊豁免,让他们可以自由利用美国的创意和知识产业”。 2023年底,一份广为流传的名单披露了数千名艺术家的名字,他们的作品未经同意被用于训练流行的人工智能生成器Midjourney。去年,超1.1万名创意人士签署公开信,谴责未经许可使用人类艺术来训练人工智能,其中提道,“这些模型及其背后的公司剥削人类艺术家,在未经许可或付费的情况下使用他们的作品来构建与他们竞争的商业人工智能产品。”
速腾聚创造出了“机器人之眼”,还开源了算法
作者 | 许丽思 编辑 | 漠影 机器人前瞻3月28日报道,今天,RoboSense速腾聚创发布机器人视觉全新品类Active Camera的首款产品AC1及AI-Ready生态,为行业提供机器人感知开发一站式解决方案。 在机器人、产业爆发的背景下,不仅人形机器人、机器狗快速发展,各类专用设备也迎来大规模的智能化升级,这一切对感知系统提出了更高的要求。传统的传感器堆叠造成的开发和量产难题仍待解决,此外,在AI驱动成为主流的时代,大量机器人开发者仍需要在基础软件的开发中“重复造轮子”,对开发周期带来了挑战。 AC1作为Active Camera系列的首款产品,将激光雷达、摄像头与IMU三大核心传感器进行时空同步融合,实现深度信息、视觉语义与运动姿态的硬件级数据整合,让机器人感知构型摆脱堆叠传感器的传统方法,进化为简洁高效、便于大规模量产的商用方案。 AC1还具备120°x60°融合感知视场(较传统3D相机提升70%)、70米超远测距能力(反射率10%低反物体20米精准检测),以及3cm@1sigma的稳定测距精度,可精准还原远近物体形状大小,帮助机器人实现准确的路径规划,使单设备即可满足机器人避障、建图、定位等全场景需求。 AI-Ready生态可以为开发者提供基础软件工具与开源算法,具体包括AC Studio、WIKI、数据集等板块,从而提升开发效率,缩短开发周期。 AC Studio一站式工具套件,提供包括驱动程序、节点数据采集、数据标定、数据融合、交叉编译在内的开源SDK,帮助开发者快速完成方案部署。 在开源算法方面,AC Studio提供定位、SLAM、3D高斯溅射、目标检测与识别、语义分割、点云与视觉融合、高阶多模态感知等核心算法,让开发者跳过基础算法开发,直接开展场景化功能化的二次开发。 同时,WIKI以开发者文档方式全面收录Active Camera与AI-Ready生态的信息;数据集提供多种场景下的训练数据,将在后续逐步上线,供开发者免费使用。AI-Ready生态帮助行业升级机器人项目流程,让软件快速迭代的开发模式驱动机器人产品化商业化落地。 开发者不仅可以使用AC1来满足人形机器人、无人机等机器人的感知需求,也可以用Active Camera输出的信息来构建数字孪生环境,完成3D扫描建模、环境监测、堆体监测等任务。在自动驾驶、工业机器人、家庭机器人等产品上,Active Camera也有巨大的开发潜能。 目前,Active Camera在内测阶段已与国家地方共建人形机器人创新中心、新加坡ARC实验室、灵宝CASBOT、华中科技大学、北京理工大学机构建立合作关系。
美媒:特斯拉、英伟达豪赌人形机器人 但中国已领先
宇树科技的G1人形机器人 凤凰网科技讯 北京时间3月28日,据CNBC报道,特斯拉、英伟达等美国科技巨头正竞相研发人形机器人,并不断强调它对未来经济的重要性。不过,分析师警告称,他们已经面临输给中国的风险。 所谓人形机器人就是外观和动作上像人类、由人工智能驱动的机器,它预计将在多个领域发挥作用,例如填补工业和服务业岗位的空缺。 随着英伟达CEO黄仁勋等科技领袖越来越多地提及这一概念,投资者对人形机器人的热情持续升温。本月早些时候,黄仁勋发布了一系列用于人形机器人开发的新技术,并宣告“通用机器人时代”的到来。 在机器人制造方面,特斯拉的人形机器人项目“擎天柱”(Optimus)似乎在美国领先,其CEO埃隆·马斯克(Elon Musk)宣布计划今年生产大约5000台。 电动汽车一幕再次上演? 不过,尽管马斯克雄心勃勃的计划可能会让其在Apptronik、波士顿动力等美国竞争对手尚未进入大众市场的情况下占得先机,但他将面临一个熟悉的竞争对手:中国。 上个月,杭州宇树科技曾通过电商平台京东短暂向消费者销售过两款人形机器人。上海公司智元机器人计划在今年生产5000台机器人,和特斯拉的目标一致。 黄仁勋在CES上宣传人形机器人 专家指出,就像比亚迪等中国电动汽车公司开始在年收入上超越特斯拉,利用价格优势冲击对手一样,类似的局面也可能在人形机器人领域上演。 独立研究与分析公司SemiAnalysis的分析师雷克·克努特森(Reyk Knuhtsen)表示:“中国有可能在人形机器人领域复制其在电动汽车行业所制造的颠覆性影响。然而,这一次,这种颠覆可能不仅仅局限于单一行业,可能会彻底改变劳动力本身。”SemiAnalysis专注于半导体和人工智能领域的研究与分析。 价格优势 摩根士丹利在2月份的研报中估计,根据配置和下游应用需求的不同,人形机器人当前的制造成本可能介于每台1万美元到30万美元之间。 然而,克努特森表示,凭借更强大的规模经济和制造能力,中国公司已经在价格上削弱了美国对手的竞争力。 例如,宇树科技在5月发布了面向消费者的G1人形机器人,起售价为1.6万美元。相比之下,摩根士丹利估计,特斯拉的Optimus Gen2人形机器人销售成本可能约为2万美元,而且前提还得是特斯拉能够扩大生产、缩短研发周期,并使用来自中国的高性价比组件。 今年1月,宇树科技在机器人领域引起了轰动。当时,该公司16台性能最为出色的H1人形机器人在春晚上与一群人类舞者一起庆祝春节。 技术进展快 有迹象表明,中国在人形机器人领域的进展远不止于此。摩根士丹利在2月份的研报中指出,过去五年,中国在涉及“人形机器人”的专利申请方面位居全球首位,共申请了5688项专利,远高于美国的1483项。 而且,小米等大型公司以及比亚迪、奇瑞和小鹏这样的电动汽车制造商也在涉足人形机器人领域。 “我们的研究表明,中国在人形机器人领域继续展现出最令人印象深刻的进展,创业公司受益于成熟的供应链、本地应用机会以及强有力的政策支持。”摩根士丹利在研报中称。 美银全球研究部大中华区汽车和工业研究主管李明勋(Ming Hsun Lee)指出,中国将人形机器人视为一个重要行业,因为它们有潜力缓解劳动力短缺问题。 “我认为在短期内,也就是三到四年的时间里,我们会看到人形机器人首先应用于生产线上,以替代部分工人;从中期来看,我们会看到它们逐渐渗透到服务业当中。”他表示。 马斯克曾预测,2025年,将有超过1000台或几千台擎天柱机器人在特斯拉工作。然而,比亚迪、吉利等中国电动汽车制造商已经在其工厂部署了一些宇树科技的人形机器人。 李明勋表示,随着人形机器人的普及,组件成本将下降得“非常快”。他还指出,中国在这类组件的供应链中占据大约70%的份额。 美国全面落后 根据SemiAnalysis在本月早些时候发布的报告,宇树机器人G1是“当前市面上唯一可用的人形机器人,完全不含美国组件。 报告警告称,中国是唯一一个有望从智能机器人系统(包括人形机器人)中获取经济利益的国家,这“对美国构成了生存威胁,因为美国在各个方面都落后了”。 “为了迎头赶上,美国公司必须迅速调动强大的制造和工业基础,无论是在国内还是通过盟国……对于特斯拉和类似公司来说,开始将组件采购和制造重新迁回本土或友岸外包可能是明智的选择,这样能减少对中国的依赖。”SemiAnalysis分析师克努特森表示。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
软硬件全栈自研率超高,魔法原子让人形机器人从“练兵场”走向通用
作者 | 许丽思 编辑 | 漠影 2025年,人形机器人产业正迎来历史性转折点。据摩根士丹利报告,全球人形机器人百强企业中中国占据63%份额,产业生态加速形成,政策红利持续释放——深圳、北京等地明确2027年量产万台目标,行业市场规模预计2035年突破万亿。 技术革新成为破局关键,而大模型与具身智能的融合,正推动机器人从专用功能向场景化智能演进。 3月26日,魔法原子在场景战略发布会上推出行业首创的端到端“原子万象大模型”,独家创建快慢双模协同架构模拟人类认知模式,融合多模态感知、自主导航与运动控制,让人形机器人能够在垂类场景中进行自主规划、自主作业。 软硬件全栈自研,是魔法原子自成立以来就一直坚定践行的发展线路。目前,其已经实现了人形机器人小麦90%以上零部件自研,特别是灵巧手和关节模组这两大核心部件,有分析机构预测,其有望使得产品成本降低60%到70%。魔法原子也成为了少数同时自研人形机器人本体和灵巧手的企业。 技术革新的背后,是魔法原子由需求驱动创新、由场景定义价值的核心研发逻辑。这种对场景的深刻洞察,使其已将人形机器人小麦应用到工厂、商场、会展、新闻传媒等多个领域,后续还将拓展1000个合作伙伴,打造1000个人形机器人落地应用场景。今年,魔法原子预计将有400台人形机器人进入工业、商业场景。 一、实现本体90%以上硬件自研,独创快慢双模协同架构大模型 早些年,波士顿动力Atlas凭借液压驱动的空翻动作惊艳世界,显示出其在动态平衡、复杂地形行走上的巨大优势时,让不少人对人形机器人进入真实场景充满期待。 但后来由于高功耗、高噪音、高维护成本等问题,使其难以进入大规模商业化应用。曾经风光无限的波士顿动力,最后也难逃几经转手后被现代汽车收购的命运。 人形机器人的根本技术路线变革,出现在2020年前后。随着电机技术逐渐成熟,以及功率限制和关节动力输出等难点被攻克,电驱人形机器人迎来了全新的机会,国内的新一波人形机器人浪潮也蓄势待发了。 正是在这个时候,魔法原子开始了自己在机器人领域的研发布局:魔法原子CEO吴长征是中国最早一批参与到四足机器狗研发的人,团队还在全球首次实现了单批次千台量产;后来开始自研人形机器人,并且将关节模组峰值扭矩做到了超过了500Nm,出色的爆发力使其成功实现了全球首个电驱人形机器人空翻。 除此之外,魔法原子采用高强度轻量化材料设计机器人本体,从而降低机器人整体重量,并且不断优化能量管理系统,提升机器人的续航能力。 今年年初,魔法原子发布第一代自研灵巧手产品MagicHand S01,可实现抓、握、双指操作等复杂动作,并支持20公斤以上的负载能力。 数年来在本体研发上的沉淀,让魔法原子的人形机器人小麦的成长速度越来越快:不仅能够实现仿人行走、跑步,还可以在奔跑状态下适应马路、跑道、草地、山坡等多种环境,走路速度从0.3m/s逐渐提升,目前跑步速度可以达到2m/s。值得一提的是,小麦已经实现了90%以上零部件自研。 但要让人形机器人能够在跨场景中处理各种需求、具备泛化操作能力,还需要配备强大的大脑。 吴长征强调,大模型是人形机器人实现能力进化的“智能引擎”,大模型结合机器人,未来机器人的智能化能力存在百倍、千倍、万倍增长的机会。因此,魔法原子坚持研发原子万象大模型,目标就是要构建具备环境适应能力的人形机器人。 原子万象大模型,融合了多模态感知、自主导航、操作抓取、运动控制等功能模块,在端到端框架中实现人形机器人在空间智能、语言智能和行为智能的有机统一。该模型通过模拟人类认知模式,让人形机器人具备了多维思考路径、持续学习机制与类人行为范式,能够在垂类场景中进行自主规划、自主作业。 更特别的是,该模型独家构建了快慢双模协同架构,这种架构理念源自自动驾驶领域的应用验证。具体来说,基于动作专家模型的“快系统”结合了端到端模型和经典控制方案,能够响应环境变化,保障机器人各个部位动作的精准性;基于多模态大模型的“慢系统”负责理解复杂环节,并规划长期任务。 快慢系统的协同,让人形机器人具备深度场景理解能力,可以精准处理语言逻辑、视觉信息及动态环境参数,同步实时运动。魔法原子副总裁陈春玉进一步解释,之前采取明确的指令传递的形式,但人类穷举的指令是有限的,所以现在采取的是特征的向量形式,让模型在任务执行过程中,通过特征向量对小脑运动技能进行规划。这种特征向量虽不可直接表达,但通过训练系统形成了端到端的闭环架构,实现大小脑系统协同,支持复杂任务的动态规划。 二、打造软硬一体的系统性交付,核心部件成本有望降低60%到70% 对人形机器人来说,硬件决定了物理能力的边界,软件则定义了智能的上限。回看魔法原子数年来对硬件与软件全栈自研的坚持,背后是对技术创新和行业本质的深刻洞察。 在吴长征看来,人形机器人的终局,一定是“软硬一体的系统性交付”。不同于智能手机依赖外部软件应用生态来拓展功能、实现“通用”,人形机器人如果要成为全能的物理世界执行者,必须要有一套统一的系统,能使其在多种场景中完成环境感知、理解指令、动作执行。这种深度整合的系统,本身就包含了硬件控制与软件智能。 而从行业发展逻辑来看,软硬件融合也是必然趋势。如果一家公司只做硬件本体,另一家只做系统软件,那么两者在交互效率、功能协同上必然存在鸿沟——就像让不同厂商的大脑和身体配合,短期难以实现真正的无缝高效协作。 尤其是当人形机器人发展到后期,技术路线收敛,可能还会存在一些没有软件能力的本体公司,但这类公司对纯粹系统软件的需求,很难形成规模优势。 因此,企业要想让人形机器人实现通用性,自身必须同时掌控硬件设计与系统开发,软硬件深度耦合,才能让机器人的每一个关节、每一个传感器都能被系统高效调度。 在人形机器人价格居高不下的情况下,坚持全栈自研也是企业推动降本的必然举措。陈春玉提到,特别是灵巧手和关节模组,这两个核心部件据人形机器人接近一半的成本。有分析机构预测,魔法原子通过自研灵巧手和关节模组,有望使得产品成本降低60%到70%。 在智能手机行业中,苹果的成功源于其打造的硬件、系统与生态的闭环,但手机的“通用”是通过外部应用实现的。陈春玉认为,人形机器人行业未来也可能形成类似的“苹果+开发者生态”模式——一边是人形机器人公司打造软硬件一体的整机产品,一边是开发者基于通用本体开发垂类技能,使用者可按需选择。 三、深化场景应用,从工具替代走向人机共生 今年以来,多家人形机器人厂商凭借以极具视觉冲击力的表演、极致运动能力触发公众传播情绪,火爆全球。但也引发不少对人形机器人何时能够实现商业化的疑问,行业的分水岭逐渐到来:到底是追求突破物理极限的运动控制能力,还是在真实场景深耕、技术回归现实需求更为重要? 具身智能的发展是为了让机器人具备高度智能,能自主理解环境、规划任务并执行操作,在这个过程中,机器人的环境适应能力和灵巧操作能力可以说是是重中之重。 越来越厂商开始让人形机器人去到汽车车间、3C制造工厂、物流工厂等实训、应用,例如不久前Figure推出首个VLA模型Helix,并将其应用到Figure 02人形机器人上,让机器人进物流工厂分拣快递。可以看出,当前机器人技术的突破方向呈现出朝着操作能力倾斜的趋势。 吴长征提到,“人形机器人行业的竞争终将回归到‘能否真正创造价值’”。魔法原子一直坚持从场景出发推动创新、让技术回归真实需求,造出来的机器人必须是“有用、易用、有人用”。研发团队一方面通过深入理解工业、商业服务等高需求场景中的实际情况,另一方面不断增强自身供应链的全环节能力,从而推动人形机器人小麦在多个场景中的实践应用。 从去年11月开始,小麦进驻家电制造工厂,在零部件上下料、物料搬运、点胶、产品检测等岗位实训,多个人形机器人还可以实现有序协同作业。从最初的视觉识别、位姿估计和轨迹规划的经典技术路线,进化到快慢双系统的技术路线,小麦已经成长为工厂中的“熟练工”。经过三个月的训练,小麦在高速数字马达上下料工序中的成功率和效率实现了多倍提升,比如在参与点胶工作时,成功率提升了3倍,超过了85%,展现出强大的工业应用潜力。 谈及为什么选择家电制造领域切入,吴长征解释道,家电制造存在“品种多、产线柔性需求高”的特性,既有简单场景,又有复杂场景。人形机器人需要大规模、群体性工序场景做数据采集、训练学习与能力验证,有利于加快人形机器人的落地时间。 在追觅的家电制造工厂中,通过持续采集生产环境中的真实数据,魔法原子已经累计形成数百万条高价值训练样本,这些数据还原了真实物理交互,真正让人形机器人从“能理解”进化到“能行动”。 以家电行业为起点,在家电制造的多样性场景中训练,小麦未来有望能够无缝切换覆盖到各行各业,成为更通用的人形机器人。 而在商业场景中,小麦的身影也出现得越来越频繁,展现了出色的视觉识别、理解和人机交互能力。 在3月的全国两会期间,小麦以特邀记者的身份在演播室与网友进行互动,在街头对路人进行随机采访;在汽车门店,小麦担任机器人导购,主动识别进店用户需求,再通过自然语言向用户介绍车辆参数、功能配置及优惠政策;在多场展会活动上,小麦还负责了迎宾接待、讲解等工作;在美容美发场景里,小麦还会根据用户的发质情况选择吹风机的不同模式。 陈春玉谈道,在大量场景实践的过程中,发现人形机器人存在交互延时、操作技能级有限等问题,团队后续会着重在人机交互流畅性、技能级、决策能力等方面进行优化。另外,为进一步加快人形机器人场景应用步伐,发布会上,魔法原子还宣布将启动“千景共创计划”,将拓展1000个合作伙伴,打造1000个人形机器人落地应用场景。 今年,魔法原子预计量产400台人形机器人。在陈春玉看来,人形机器人迈向量产的路上,还存在两大挑战:一方面是技术工程化问题,从样机过渡到批量生产,需要解决一致性、稳定性和可靠性问题。尽管人形机器人领域缺乏成熟经验,但可借鉴工业机器人、协作机器人及汽车行业的质量管理体系。另一方面,是应用场景拓展,量产后需验证场景需求的真实规模,这依赖于行业整体的技术突破情况。 当人形机器人从人类手里结果越来越多的活,人类又该如何看待与它之间的关系?吴长征觉得,双方从来就不是人形机器人替代人类的关系,人形机器人本质是工具,它的存在是替代现有的工具,比如工业场景中一些柔性作业能力差的工业机器人,帮助人类完成任务。 之后,人形机器人的能力不断延伸,能够解决技工人才短缺的问题。下一个阶段,随着智能化与泛化能力提升,它们将成为人类社会中的新角色——“硅基生命”,人类社会会逐渐进入“双生时代”。到那个时候,人形机器人不只是进工厂,而是可以帮助人类探索未知世界,能够去到深海、太空等极端环境,帮助人类拓展生存边界。 四、结语:技术自研加速通用化的飞轮效应 对魔法原子来说,自研的硬件性能突破、垂直场景的数据积累、软硬一体的系统耦合,三者相互叠加,形成加速通用化的飞轮效应,进一步构建起生态壁垒,也让机器人有望渗透至更广泛的场景。 当行业逐渐迈向规模商业化与量产,这种长期主义的自研积累,会让技术优势如“滚雪球”效应一样放大,加快人形机器人的应用,而应用又会反过来反哺人形机器人,助力人形机器人真正从专用设备变成通用的“硅基生命”。
大模型入门超全指南来了!人大团队力作,内附一线开发经验
作者 | 陈骏达 编辑 | 漠影 2025年,DeepSeek-R1的发布在国内AI领域掀起了一场前所未有的开源风暴。作为一款性能卓越的开源大模型,它不仅开放了模型的获取权限,还主动分享算法细节以及优化策略,激发了整个行业的开放共享热潮。 与此同时,科研论文、技术博客和开源社区的讨论如雨后春笋般涌现,这种开放透明的氛围极大地推动了AI科研知识的共享与传播,吸引了更多研究者和开发者参与到大模型的创新与应用中。 不过,对于刚刚入门大模型的初学者而言,这些论文、研究中涉及的诸多高阶概念或许意味着较高的认知挑战。 一方面,国内外主流AI教科书的成书或更新时间,大多早于本轮生成式AI浪潮,对新近AI技术的发展缺乏全面覆盖。 另一方面,许多大模型“Know How”只能从一线实践中获取,且需要大量算力的投入,但像DeepSeek这样愿意分享此类知识的AI企业,依旧是少数。 令人庆幸的是,已经有一批一线AI研究者在从事大模型基础知识和应用经验的普及工作。 在国内,中国人民大学的科研团队于2023年3月底发布A Survey of Large Language Models论文,全面综述了大模型界的最新研究成果,此后,这篇综述持续更新,截至2025年3月,已有整整16个版本,最新一版文章达144页,引用了1000余篇论文。 去年年底,由上述文章整理而来的《大语言模型》一书,在历经数月的编辑之后,由高等教育出版社正式出版。与英文综述文章的定位不同,修订后的中文版更关注为大模型学习者供整体的技术讲解,对内容上进行了大范围的更新与重组,力图展现一个系统的大模型技术框架和路线图。 《大语言模型》一书由中国人民大学高瓴人工智能学院赵鑫教授和文继荣教授领衔主编,博士生李军毅、周昆和硕士唐天一参与编著,作者团队在大模型领域有着丰富的研究与开发经验,曾主导研发了文澜、玉兰等大模型。 编者团队认为,大模型研发的众多训练细节无法从已有的科学文献中直接获取,通常需要开展实验进行摸索。但实际上,很多研究人员并没有充足的算力资源去完成一次完整的大规模预训练实验,无法获取一手经验,极大限制了学术界在此次AI技术发展中所起到的作用。 然而,学术界在AI研究中的独特价值依然不可替代,且需要在多个领域持续发声并贡献力量。学术界更为长远和多元的研究视角,可以在大模型的基础理论研究中发挥重要作用,或是深入探索如AI安全、AI治理这样短期内难以变现,但对人类未来至关重要的议题。 本书前言中有这么一句话:“人类社会的技术发展从不会因为某个公司或某个国家的技术封锁而停滞不前。”《大语言模型》一书的出版,恰好为学术界提供了获取一线大模型知识和实践经验的渠道。这本书全面覆盖了大语言模型训练与使用的全流程,从预训练到微调与对齐,从使用技术到评测应用,帮助读者全面掌握大语言模型的核心技术。 在核心算法技术的基础之上,编者团队还提供了大量的代码实战与讲解,同时搭配相关的开发工具包LLMBox与YuLan大模型,供读者深入阅读理解相关技术。 书中大量的可视化内容可帮助读者更好地理解相关概念,下方这张图表就呈现了基于LLaMA模型的各类衍生工作,通过继续预训练、指令微调等方法,LLaMA可以适配到不同的语言、多样的领域。 发布之际,《大语言模型》一书也得到了多位知名AI学者的推荐。北京智源人工智能研究院学术顾问委员会主任、美国国家工程院外籍院士张宏江称:“本书内容深入结合了编者在研发大模型过程中的第一手经验,……,可以作为深入学习大模型技术的参考书籍。”北京大学讲席教授、中国科学院院士鄂维南、清华大学智能科学讲席教授、中国工程院外籍院士张亚勤也为本书撰写了推荐语。 在AI技术飞速发展的当下,《大语言模型》的出版恰逢其时,相信无论是普通读者还是专业读者,都能从此书中获得关于AI前沿技术的最新见解。
国产算力的进击:百度智能云将上线三万卡昆仑芯集群
3月26日,在博鳌亚洲论坛2025年年会上,百度集团执行副总裁、百度智能云事业群总裁沈抖透露,百度智能云即将上线三万卡自研国产芯片昆仑芯集群,同时还在继续迭代模型。去年,百度已点亮了万卡的自研芯片昆仑芯P800。这标志着中国企业在人工智能算力领域,取得了新的重大突破。 而国产三万卡集群的启动和投入生产,为今年初以来,大模型应用的爆发和技术的进一步训练,提供了重要的算力保障。 与此同时,在当天的论坛上,沈抖呼吁,要把人工智能真正用起来。现在已有六成以上的央国企和百度合作,基于大模型做行业创新,但更多的企业并没有把大模型用起来。沈抖认为,中国最大优势就在于拥有丰富的应用场景,应该抓住这些应用场景,加速大模型的迭代和发展,真正让中国、让亚洲、让更多的人能用上领先的大模型。 01 大模型应用爆发,算力保障成关键 数智前线获悉,百度智能云即将投产的昆仑芯3万卡集群,一方面通过稳定的算力资源供应,避免因外部因素导致的断供风险,支撑了企业研发和生产的连续性;另一方面,也实现了更低的采购和维护成本,使更多企业,能够以更低的成本获得高性能计算资源。 三万卡大型集群的出现,也避免了计算资源闲置问题。利用云厂商的优势,通过大型集群,为众多企业提供服务,根据不同企业的需求,动态分配计算资源,实现多元算力支撑,企业即开即用。这不仅提高了资源利用率,也降低了企业使用云服务的成本。 这在当下尤为关键。去年以来,人工智能在深度推理、多模态等方面取得明显突破。业内的共识是,AI已成为全球产业变革的核心引擎,今年开年后,正在加速进入千家万户和千行百业,推动AI迈入全民普惠时代。AI推理迎来爆发式增长。 在这种情况下,大模型的应用落地和技术演进,都对可持续的算力保障提出更迫切的需求。 例如,今年开年后,政务在AI上动作极快。深圳福田提出“数智员工”,首批上线70名“数智员工”,“AI招商助手”将企业筛选分析时间缩至分钟级;福建漳州计划陆续推出30个“AI公务员”,聚焦教育、医疗、应急、环保、文旅等领域;北京市监局通过百度智能云千帆接 入DeepSeek,为企业登记注册提供全天候“咨询”。 业内人士告诉数智前线,更多城市看到AI对北京、杭州等地的产业带动后,在统筹政务系统建设中,将AI作为抓手。未来两三个月,不少城市的“一网通办”,将提供更多AI服务。 “在这一过程中,算力面临挑战。虽然DeepSeek等模型,对训练的算力要求降低了,但对推理的需求却增加了,因为满血模型的参数量不小,而且深度推理的‘自言自语’过程,相较于只给出一个答案,会消耗更多token。”资深人士告诉数智前线,“尤其是过去算力建设以训练为主,今年将转向推理为主,政务领域算力将面临一波升级。” 在教育领域,去年秋季以来,高校已成为智算采购大户。在AI for science领域,人工智能在提高科研的质量和产出,像上海交大与百度合作推进AI for science,在新材料发现等上有很大促进作用。 今年以来,不少高校快速接入DeepSeek,在尝鲜后,又将学校里的业务系统对接大模型,结果用户量迅速攀升,并发越来越大。一些高校在教学的实操环节,甚至提出“要为每一间教室分配一些算力”。同时,长尾需求也在暴增,一些双非院校或职校,包括学校的院系甚至教研组,都提出算力需求。 除了大语言模型落地带来的算力激增,今年各行业对多模态的需求,也在拉动算力基础设施的建设。 如宁德时代持续引入多种人工智能技术,展开数智化建设,通过AI技术,保证产线的良率与效率。国家电网联合百度等公司,推出千亿级多模态行业大模型,深入电网安全、新能源消纳及供电服务等核心场景。百度不久前推出的原生多模态大模型文心4.5,已迅速被引入各行业,它支撑的视频捕捉与智能分析,正在帮助连锁行业优化服务和食安管理。这都对算力提出大量多元化要求。 伴随大模型的应用深入,智能体也呈现爆发势头。今年Manus让大家看到了多智能体调用,个人和企业都展现出极大热情。百度近日全量上线国内首个对话式应用开发平台百度秒哒,上线24小时就吸引了超过2万用户体验,创建应用数量突破3万个,相当于每3秒就诞生1个应用。 一些业界人士预言,2025年不仅是智能体“元年”,或许也是智能体的爆发之年。智能体的普及,也正在推升算力需求。 但与激增的算力需求相比,当下国内AI算力供应紧缺。在中国市场,由于美国禁令,国外芯片的供应受到限制,并且由于全球人工智能需求旺盛,芯片交货缓慢、价格上涨。美国还在不断推出新政,进一步限制中国获取先进芯片技术。在这种情况下,中国亟需可持续供应的自主AI算力。 这也促使国产算力的脚步越走越快。在百度智能云三万卡集群月底点亮之外,昆仑芯服务器近日中标招商银行项目,将围绕多个核心业务场景,全面支持招商银行落地大模型应用。而这些多元化算力,将为互联网、金融、能源、工业、教育等众多领域,加速智能化转型,提供坚实的算力保障和支撑。 02 构建三万卡集群的拦路虎,如何击破? 三万卡集群建设,从硬件到软件,技术挑战是全方位的。结合昆仑芯以及百舸4.0的创新技术,在集群点亮过程中,解决了当下人工智能大规模集群面临的关键问题。 例如,包括DeepSeek在内的不少模型,采用了MoE(混合专家模型)架构,通过多专家并行和集群互联技术,降低了对高算力单卡的依赖,并在有限的算力和训练Token资源下,开发能耗更低、推理和训练效果更优的大模型。 根据介绍,昆仑芯P800基于新一代自研架构XPU-P,显存规格比同类主流GPU高出20%-50%,这对MoE架构更加友好。同时,支持了8bit推理、MLA(多头潜在注意力机制)、多专家并行等特性,这些特性实现更大的吞吐、更低时延,进一步降低集群训练及推理成本。 与此同时,百度百舸AI异构计算平台4.0,在3万卡集群建设中,围绕落地大模型全旅程的算力需求,发挥了至关重要的作用。 为了解决大模型训练时高通信带宽的需求,百舸4.0已构建了超大规模HPN高性能网络,将带宽有效性提升到90%以上。 3万卡集群能耗极高,常规的散热方案能耗可达十兆瓦或更高。为此,百舸采用了创新性散热方案,可以有效降低能耗,为企业的模型训练,进一步降低成本。 为了提升GPU 的有效利用率(通常用MFU来表示GPU的有效利用率),百舸不断优化并完善模型的分布式训练策略,将训练主流开源模型的集群MFU提升至58%。 大规模集群执行训练任务的稳定性非常关键。百舸可快速自动侦测到导致训练任务异常的节点故障。同时,通过百度自研的BCCL(百度集合通信库),能快速定位故障并自动化重新调度任务到健康节点,继续完成训练,目前已将故障恢复时间从小时级降低到分钟级,保障集群有效训练率达到98%。 这些技术最终确保了昆仑芯集群的“多、快、稳、省”。 在2025年两会期间,人工智能成为核心议题之一,政府工作报告明确提出“持续推进‘人工智能+’行动”,强调将数字技术与制造业实体经济深度融合,支持大模型广泛应用。这表明,以场景为核心,落地产业,已成为实现人工智能价值的关键路径。 不过,业界认为,大模型落地行业,还有很长的路要走。不少行业和企业在探索场景、治理数据,尝试多元的算力支撑,探讨AI落地价值,并进行人才储备。 在这样的形势下,大模型业界及生态,也在从底层算力、模型、工具链和应用,逐步构建起可持续、全方位的方案。而此次百度即将点亮的三万卡集群,为产业注入了强大动力,将进一步助推企业迎接新一轮科技和产业变革。
GPT-4o的多模态生图,让整个设计圈都开始emo了
GPT4o的多模态生图前天上线之后。 经过两天的发酵,含金量还在不断提升。 在我的群里,已经能看到越来越多的,进入到实际生产环节的例子。 比如@银海的直接做商品图的翻译和合成,这是原来的算法,很难做的效果,但是现在,有手就行。 非常复杂的电商流程,一张原始图,换产品换脸换衣服。 比如@歸藏的直接把UI图放样机里面的例子,如果做过UI或者产品设计的朋友肯定都知道,以前我们在做做展示,或者做汇报的时候,经常做样机做的挺痛苦的。 比如给他头像,画的两套表情包,是可以直接上架到微信表情商店的那种。 来自设计大佬@付遥,用GPT-4o来直接做之前非常流行的3D品牌海报。 比如我一个很喜欢的小红书AI博主@Rico有三猫,用GPT-4o给她做小红书封面。 也用GPT-4o直接做商品图翻译出海。 群友@默月佥在用GPT-4o出蜜蜂的解剖科普图。 一个很专业的公众号AI博主@阿真lrene,不仅用GPT-4o生成复杂的漫画,还能抠图,一键直出透明通道的PNG图。 干死各种抠图软件的不是更牛逼的抠图软件,而是大模型。。。 还有朋友@不知名网友虎子哥,用GPT-4o给他自己家的房子装修。。。 还有一些我确实不知道源头的但是被传播的蛮广的例子(如有作者,欢迎评论区认领)。 给几个家具做一个展示图,这个场景在电商领域无敌。 之前我写可灵的AI模特的时候,很多人问,能不能让模特带首饰?现在,可以了。 还用它,直接P图,消除人物。 老照片一键修复+上色。 甚至,还可以模仿字体做自体设计。 在GPT-4o的冲击下,N多的设计师和创业者,都有点emo了。 比如就有大佬在X上感叹道: 朋友圈里还看到了一张图,是glif的老板,在X上发的。 纪念ComfyUI,纪念一切的AI图像工作流。 OpenAI的一次更新,又屠杀了一堆公司。 又一次深刻的阐明了那句《三体》中的经典台词: 我消灭你,与你无关。 GPT-4o的冲击当然是有,但是,他的上限在哪?能做到什么地步?真的能彻底替代ComfyUI的AI图像工作流吗? 我想弄清楚这个答案。 首先我觉得我还是要跟大家非常简单的用一两句话解释一下ComfyUI,让大家知道这玩意是个啥,我们才好继续往下聊。 ComfyUI是一个非常专业的工作流工具,不局限于AI绘图,AI视频啥的也都可以往里面接。他的界面大概是这样的,很像电路板。 这个就是在Liblib上搭的ComfyUI工作流。 它是以节点方式,把各个工具、各个模型给串起来,形成一整套的工作流,比如一张图进去,经过各种节点和插件,输出一个完全风格不同的AI视频,这都是OK的。 坦率的讲,我不是ComfyUI的专家的,做过的工作流也不多,我觉得在这个领域,我并没有那么强的发言权,所以。 我去请教了一下我的1个好朋友,AI绘图大神@炼丹师忠忠。 我想听听,他的看法。 首先是,GPT-4o对电商设计的冲击到底有多大? 我跟忠忠聊了很久。 最后得到的结论,跟我自己在设计行业里感受到的水温差不多。 对于普通水平的电商设计师,肯定是有打击的,他们原有的技能水平也就只能产出跟gpt4o差不多的图,相对来说意义不大了。 上游的运营专员可以自己操作工具来生产一样质量的图。跟被冲击的插画师类似,可能会变为帮忙修补gpt4o产出的图的bug,还有叠加原图部分细节上去加强细节还原(类似于高低频修复流程)。 生产成本降低后,需求量会变大,原本用不起各种华丽背景图包装的商家,现在也用的起了。 从效果上极简操作就能生图的工具有美图设计室等一堆工具,GPT4o只是在某些效果方面更进一步而已,对于专业级的实际商业生产的影响可能没有那么大。 而从视觉设计角度,对现有的整个开源生态,反而是利好作用。 忠忠举了自己设计的公司IP的例子。 现在,可以一句话把IP的3D模型,直出到品牌海报上,不需要走以前的3D建模+渲染了,大大节省了时间。 同时,更有趣的一点是,GPT-4o可以根据一张IP草图,来生成这个IP的各角度视图。 而这些图,会进一步推动flux等开源模型的微调版本的效果。 你可能会问,都有GPT-4o了,为什么还要去微调flux,在ComfyUI搭工作流用呢?这不是脱裤子放屁多此一举呢? 其实有两个原因。 数据隐私性和精准性。 数据隐私很好解释,就是GPT-4o是一个闭源的模型,后面最多最多也就是开放一个API,让大家接到ComfyUI里面去用,但是,就OpenAI这个尿性,我们给过去的东西,大概率就成他后续的训练素材了。 举个例子,《流浪地球3》2027年上映,要是现在美术组把核心概念图或者设定图直接灌给GPT-4o做一些处理,到时候,《流浪地球3》电影还没上映,设定图你可以直接在GPT-5o里面让它画出来,这特么就炸了。。。 所以,数据隐私性至关重要,在真正的生产环境里,特别是一些大厂里,必须只能用本地的ComfyUI搭,真正的输出,必须是本地环境,用开源的模型。 所以,这个时候,我们就可以用一些不敏感的信息,扔给GPT-4o,来辅助生成数据集,反过来微调自己的flux模型,这个点,真的很有用。 精准性其实也很简单,我们回过头来看忠忠用GPT-4o输出的自己家IP的海报。 先不说其他的细节了,这几处,你是能发现一些明显的BUG的。 这其实在生产环境里,这种BUG是品牌方觉得不可能接受的,就想你给一个手机产品做广告,你把人手机弄变形了,你跟人说不行AI出得就是这样的,你看对面会不会把你挂在电风扇上转着打。 而这个时候,用Flux专门微调的Lora,是可以完美的解决这种精准性和一致性的问题的。 这其实就是普通设计场景和专业设计场景的区别。 GPT-4o当然可以替代大部分的普通工作流,会让ComfyUI里一大批的工作流失去价值,但是这就不代表,ComfyUI失去价值了。 很简单的一点是,在专业的设计工作里,纯对话式的简单界面满足不了复杂专业的需求的。 就像你问一个专业设计师,为什么设计是用PS做设计,而不用美图秀秀来做设计,对方只会把你当傻子。 在真正的专业的AI设计工作里,可控性,很多时候非常的重要。 需要精确的规定重绘区域,需要精确的调节风格效果,出图尺寸比例等,所以在专业生产中需要精确调节的细节,不能指望OpenAI全做成功能。 还有前后处理流程,比如说前置的裁剪,抠图,语义识别,后置的比如对图片的放大,贴回原图细节(高低频修复),再接入其他工作流继续处理等。 自动化一键完成的效率要比多轮对话高很多。 包括在一些精准度要求高的产品和场景上,GPT-4o目前还达不到专业级的水准。 看个例子。 比如我们要把问界M9这款车,换到另一个场景里。车这种产品,跟笔、戒指、香水等等要求的精细度,完全不一样。 这是GPT-4o出的图。 而如果我们用大佬的牛逼工作流呢? 生成出来的效果在整体比例和质感上,是更好的。 对比应该非常直观了。 这里我要给自己叠个甲,我并不是在这里鼓吹,GPT-4o不行,ComfyUI的效果可以吊打GPT-4o。 如果是这样的话,我也不会连更两篇,来给大家看一看,GPT-4o,有多酷,有多强。 我想说的是,GPT-4o,跟当年的SD、Midjorney、Runway、可灵等等AI工具是一样的。 会无差别替代所有这个行业里面的初级执行职位。 屠杀所有曾经在工程层面对大模型进行的一些优化。 然后,一点一点侵蚀更上层的建筑。 它更像是一层层汹涌上涨的潮水,将整个AI图像领域原有的边界打得支离破碎。 都说做AI产品,要看到大模型的边界,在边界之外的安全地带做。 但是现在,你根本不知道边界在何方。 那些看似高耸的技术壁垒与工作流程,如果只是基于简单组装或者初级执行的逻辑,正在被GPT-4o以近乎暴力的方式消解。 绝大多数机械式的制作工作,一旦被强大的多模态理解与生成替代,就会像那些轰然倒塌的围墙一样,被历史的风尘轻易覆盖。 有没有一种第一次工业革命时候,机器代替手工劳动的即视感? 历史总是在不断的重复。 可一如上文所言,这绝不代表ComfyUI之流就会被完全淘汰。 在工业级、专业级的深度工作流里,人们对数据安全、设计精度、可控度的需求不可能凭空消失。 那种图像与视频的多次处理、分层输出、版本管理、脚本化批量运行、自动化节点衔接,只要是大型企业或核心团队,都会很在意。 GPT-4o会在C端和中小B端市场里摧枯拉朽,取代了大量低端或者重复性工作。 而ComfyUI、Flux、ControlNet等开源生态则在更专业的领域继续进化,利用它们精细、可控、可离线部署的特性,为高端客户或机密项目提供服务。 这气势就像云端办公与本地办公的关系一样,前者无限便捷,后者安全可控。 也如同家用轿车与顶级跑车的分别,各自目标用户并不冲突。 GPT-4o也一定会不断进化,去扩大自己的边界蚕食更多的场景。 开源生态也会有各种可以复刻效果的模型、产品出来,从而进行私有化。 没什么能够阻止浪潮向前。 要么成为浪潮的追随者,要么成为浪潮的推手。 这二者,都肯定比做一块沉在海底的礁石,要精彩得多。 你说是吗。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。