行业分类:
加载中...
头条分类:
加载中...
百度创始人李彦宏内部讲话曝光:坚持相信,我们可以改变世界
你真的可以改变世界吗?“我想试试” “你真的认为你可以改变世界吗?回答是,‘我想试试’。” 5月7日,在百度内部颁奖活动中,百度创始人李彦宏致辞表示,坚定、自信、务实是百度二十几年传承下来的文化,“我非常有信心,靠我们这群人、靠我们的执行力、靠我们的努力,我们一定可以改变世界。” 李彦宏谈及,不久前参加Create2025大会并搭乘萝卜快跑时,有路过的参会者曾摇下车窗,对着他搭乘的萝卜快跑喊道,“百度牛!百度牛!”。“看到一辆车在那么拥挤的道路上,能完全没有人地开起来,还是挺震撼的。” 以下为李彦宏致辞原文: 祝贺在场的、不在场的每一位获奖同学和每一个获奖团队,你们是百度的骄傲,是每一位百度同学学习的榜样。 刚才表演节目中的最后一句话,我看了之后还挺有感触的,大家不知道有没有人记得?就是说,你难道真的认为你可以改变世界吗?回答是“我想试试”。 这真的非常能表达今天我们百度同学、百度每一个团队这样一个态度、这样一个attitude——非常坚定、自信,又没有那么骄傲、那么浮夸。我觉得,这也很代表百度二十几年传承下来的务实文化。 我同时也想到一句英文,能跟这个匹配起来,叫做“Those who are crazy enough to think that they can change the world are the ones who do”。这相当于是回答了中文的问题,就是,我们真的可以改变世界。 刚刚我们在武汉举办的Create2025,还是挺成功的,不仅是主会场非常火爆,40节公开课、6个分会场都场场爆满,说实话,参与热情有点超出我预期。 还有一件事情,我也想跟大家分享一下。那天早上,我从酒店到会场是坐萝卜快跑的车。武汉有400多万辆车,早高峰的时候,其实是非常拥堵的,路况很复杂,但是整个过程非常平稳。平时大概要半个小时,那天开了有40多分钟,各种各样的复杂路况都遇到了。 从酒店出来,大概有五六分钟的时候,我看到我车的左边那条道上,过来一辆车,摇下来车窗对着我喊,“百度牛!百度牛!” 然后,他们又举起来参会证给我看,告诉我,他们也是参加百度Create大会的。平时生活在武汉的人,已经有点见怪不怪了,但是真的外地人到这儿,看到一辆车在那么拥挤的道路上,能够完全没有人地开起来,觉得还是挺震撼的。 所以,我们公司这种技术底蕴,其实是能从各个层面展现出来的。获奖团队中,你看有芯片层的、数字人这些应用层的,去年有模型层的。在各个层面,我们在市场上都有非常领先的产品。这是我们所有百度人一起努力的结果。 同时,我觉得大家可能也都能感受到,市场变化非常迅速,技术迭代速度非常快,应该说,是我自己从业30年来没有见过的技术迭代速度。不仅百度在不断地创新,不断有新产品、新技术出来,市场上也不断有各种各样新的技术出来,跟我们进行竞争。某种意义上讲这是好事,它会推动整个市场更快速去成熟,让更多的企业、更多的个人从AI当中获得收益。 当然,这也要求我们能不断地提升执行力,不断地在激烈的竞争中,战胜对手、脱颖而出。我们怎样迅速迭代我们的战略、怎样跨团队协作、怎样吸引和培养优秀人才,怎样坚持我们一直坚持的文化价值观,刚才很多视频里,都已经有不错的体现。 所以我也是非常非常地有信心,靠我们这群人,靠我们这个团队,靠我们的执行力,靠我们的努力,我们一定可以改变这个世界。 谢谢大家!
李想年薪6.39亿?官方澄清:实际薪酬为266万元
近日,有媒体梳理国内部分车企2024年年报,总结了车企高管的薪酬水平。其中,理想汽车董事长、CEO李想的“年薪”为6.39亿元,远超理想汽车执行董事兼总裁马东辉与首席财务官李铁等其他高管。该数据一出,随即引发行业热议。 据了解,李想6.39亿元的“年薪”由两部分组成:一部分是266.5万元的年薪,另一部分是因公司在2024年达到交付50万辆的目标而触发的期权激励,产生超6.36亿元的激励费用。 对此,理想汽车方面回应称,事实上,李想2024年全部实际薪酬为266万元。目前披露的6.39亿元属于公司按照美股上市公司(美国会计准则)对于期权的特殊记会计费用方式,不是李想的实际薪资收益。根据理想的股票激励计划,李想如果想拿到这笔激励费用,除需要完成公司设定的销量目标外,还需要额外支付29.26美元/ADS(美股1ADS=港股2股A类普通股,即1:2的对应关系,目前市场股价约为25美元/ADS)。这意味着,以5月6日美股收盘价格25.68美元计算,李想若要执行该期权方案,不仅没有任何收益,还需要倒贴3200万美元,相当于人民币2.3亿元。 除理想汽车外,《每日经济新闻》记者梳理其他车企的年度财报还发现,这种“高股权激励”的模式在造车新势力的高管薪资结构中普遍存在。 图片来源:每经记者 张建 摄 新势力车企普遍采用“低薪资+高股权”模式 根据理想汽车的财报数据,李想的薪酬由薪金、津贴和实物福利,股份支付薪酬费用,退休金计划供款三部分构成。其中,薪金、津贴和实物福利即常说的年薪,股份支付薪酬费用则是上述提及的激励费用。 单从个人的年薪来看,李想2022年的年薪为156.6万元,2023年为176.5万元,2024年则为266.5万元。从这组数字来看,李想近三年的年薪呈逐步增长态势。不过,根据公开披露的高管薪酬数据,马东辉与李铁的年薪均高于李想。 从激励费用来看,李想在2022年和2023年并没有获得这部分的薪酬,而马东辉和李铁则获得了千万元级别的薪酬。2024年,理想汽车年销超50万辆,拿下新势力年度销冠,李想触发了“里程碑式激励”条款,产生了超6亿元的激励费用。对比之下,马东辉和李铁这部分薪酬仍是千万元级别。 值得关注的是,理想汽车高管薪酬体系的调整折射出新势力企业薪酬管理的一些特性:企业掌门人在未获得激励费用的情况下,年度薪酬低于核心管理团队的现象已成为行业常态。例如,零跑汽车董事长朱江明2024年的年度薪酬要低于高级副总裁曹力;蔚来董事长李斌也在直播中透露,其年度薪酬不到百万元,也要低于蔚来其他一些高管。 此外,新势力企业薪酬管理还呈现出高管薪酬普遍采用“低固定薪资+高股权激励”的组合模式。例如,马东辉2024年年度薪酬为4027.4万元,激励费用占比达61%;李铁同年的年度薪酬为3916万元,激励费用占比达88%;曹力2024年年度薪酬为2242.1万元,其中激励费用达1940万元,占比86.5%。 有观点认为,当前造车新势力多处于初创期,面临高额资本投入与盈利周期延长的双重压力。在此背景下,企业通过设置股权激励占比高的薪酬体系,将核心团队利益与公司长期价值深度捆绑——尤其是管理层激励往往与量产目标或股价指标强关联。该模式在缓解企业短期财务压力的同时,引导团队聚焦战略目标,可形成“利益共同体”效应。 同时需要注意的是,以资本市场表现或销量表现为导向的激励机制,可能诱发管理层为追求短期业绩而忽视战略定力的短视行为。例如,通过激进降价冲销量换取期权解锁,虽能在短期内提振股价,却可能削弱品牌的溢价能力。 传统车企多采取更为稳健的薪酬策略 在传统车企方面,上述两种薪酬特点也存在于一些公司中。例如,吉利汽车集团CEO桂生悦、吉利控股集团CEO李东辉在2024年的薪资总额分别为3201万元、1967万元,而作为掌舵者的李书福,其全年薪酬仅为37.6万元。有观点称,传统车企中,职业经理人的薪酬往往超过创始人或董事长,反映了现代企业治理中所有权与经营权的分离。 此外,激励费用模式也存在于一些传统车企之中。根据财报披露,比亚迪执行副总裁李柯2024年度薪酬总额达1683万元,其中股权激励部分占比逾六成。 不过,国有车企的薪酬浮动并不强烈,这种“低波动”特征源于国企薪酬制度改革的深化。央视网此前报道称,从2025年起,国企工资总额将与经济效益、劳动生产率等指标挂钩,高管薪酬上限进一步收紧。 相比于造车新势力,国有车企的薪酬结构更注重“公平性”。例如,北汽蓝谷董事长张国富(年薪150万元)与普通员工薪酬差距约15倍,这一数据远低于理想汽车高管与普通员工的薪酬差距(李想薪酬约为员工平均工资的2000倍)。 此外,在电动化、智能化转型背景下,技术型高管的薪酬增长较快,体现出企业对核心竞争力的重视。数据显示,长城汽车总经理穆峰(技术背景出身)年薪从2022年的403.6万元增至2024年的610.63万元,涨幅达51.3%,与其推动研发体系升级的贡献直接相关。长安汽车聘请前大众设计师Klaus Zyciora负责欧洲市场战略,其年薪达295万元,超过长安汽车董事长朱华荣的薪酬。 从企业高管的薪酬体系观察来看,传统汽车制造商普遍采取更为稳健的薪酬策略。有分析人士表示,这种与造车新势力之间的薪酬差异,折射出两类企业在战略定位与发展模式上的根本性差异。处于快速扩张期的新兴车企更倾向于实施高比例的股权激励方案,旨在以风险共担机制推动规模跃升;而拥有成熟体系的传统车企则构建了“现金+股权”的复合型薪酬结构,这种设计既能保障核心团队的稳定性,又能有效控制经营风险,体现了不同发展阶段企业差异化的治理策略。 每日经济新闻
马斯克推了阿维塔一把
阿维塔风阻系数遭质疑的风波还在继续,马斯克也来吃瓜了。 最近有位博主,对阿维塔12进行了风阻测试并发布视频,备受争议的是,实测的数据和官方有着明显差距,该博主还质疑国产新能源车企存在风阻系数虚标的现象。 明显让阿维塔炸毛的一句话——竟然和20年前燃油车水平一样。 评测视频流传到外网,还吸引到马斯克的注意,他就随手转发了这个评测视频。 5月6日深夜,阿维塔官方发布微博,隔空回应了马斯克的“随手一转”,称马斯克转发了国内某博主发布的关于“阿维塔12风阻系数”的不实信息,阿维塔12将近期进行风洞测试,“我们也诚邀ElonMusk先生,现场共同见证。” 本来是马斯克的一个吃瓜事件,妙就妙在阿维塔踩准了回复时机,借助一次舆论事件,抬高了自己的格局和声量。 今天热搜词条上挂着的,是“阿维塔 马斯克”这本来毫无关系的两组词。 当然,在此之前阿维塔也有过回应,并且动作很快。如今过去了那么多天,随着马斯克再次登上热搜,让单纯的风阻系数之争不再重要,阿维塔如何自证清白,中国新能源汽车怎么自证清白,成为最迫切的事。 毕竟马斯克身份特殊,首先他是特斯拉掌门人,在市场层面属于竞争对手,再有就是马斯克有着一呼百应的号召力,他给出的结论,势必会影响不少人的观点。 而且在马斯克转发的推文中,还暗暗质疑了中国其它几款新能源产品的风阻成绩。 阿维塔这一战,似乎成了一场关于国际脸面的事儿。 我们再来捋一下时间线。 博主最初发布测试视频是在5月2号,称实测车辆的风阻系数为0.28Cd,远高于品牌方宣称的0.21Cd。 5月3日,阿维塔回应此信息完全失实,阿维塔旗下产品技术参数均以官方发布为准。 该博主也及时回应,称为何其测试之后,全网关于该车风阻系数宣传资料几乎被删干净。 阿维塔高管也加入进来,阿维塔总裁陈卓、阿维塔科技副总裁雍军相继发文回应。 双方打得有来有回,目前最新的状态是,阿维塔将根据国家专业机构的实验室排期,公开测试。当事博主也在一天内也发布多条微博,同步一些最新状态。 根据目前的态势,一场公开的风洞测试免不了了,只有真实的数据才能结束这场舆论风波。 有意思的是,这场风波背后,正是发生在阿维塔销量创新高之际,4月份阿维塔销量达11681辆,同比暴涨122.6%,刚上市的阿维塔06,在上市后48小时内,订单突破12536辆。 销量和流量同时到来,就看阿维塔能不能化危为机,为自己正名了。
大厂Agent混战:复刻Manus的野心与困局
当Manus创始人肖弘直言“产品没有秘密”时,大厂们正陷入技术复刻与流量争夺的双重焦虑。据光锥智能了解,目前多家大厂均在内部开设对标Manus的产品团队。据悉,以擅长内部赛马的字节,内部至少有5个不同团队正在开发智能体产品。 在Manus发布的一个月后,大厂们先后交出了智能体的答卷:字节跳动“扣子空间”以裂变式邀请码席卷职场、阿里“心流”用超长耗时任务塑造研究深度、百度“心响”则带着医疗法律垂类场景突袭移动端。 但在这场看似繁荣的通用Agent发布潮背后,却暗藏着一个尴尬现实—— 所有产品仍未突破已有Agent的能力边界。 从去年开设Agent平台的无人问津,到今年交出60分答卷。可以确定的是,Agent已经通过规划和工具能力跨越了通用Agent的1.0阶段,进入自主Agent的2.0阶段。 当下,扎堆发布的Agent已经能够初步担任起“实习生”的任务,解决那些在人类日常生活中耗时且难度低的任务:比如,根据用户的需求完成一部分资料的收集,并通过大量的信息分析并给出一些可供用户筛选的观点。再比如帮助用户完成基础操作,筛选岗位发简历、给目标发邮件等等。 这场围绕Agent展开的流量入口争夺战,只是2025Agent爆发之年的一个注脚。除了大模型公司和应用公司,更多玩家正在参与其中: 就在今天,联想也发布了面向个人用户的“天禧”智能体和面向企业的“乐享”智能体。其中,个人智能体“天禧”将自主操作和记忆交互作为卖点,并在旗下4款产品中搭载。除了自主完成点单、攻略等操作,它还能根据用户的偏好和习惯,给出匹配的预算和喜好推荐。 在大厂倾尽资源的进攻下,智能体之战现在走到了什么阶段? 批量复刻Manus,谁能抢占流量入口? 4月,通用Agent成为了大厂们发布会和产品更新的关键角色。 先是字节在4月18日发布了通用Agent产品“扣子空间”,上线免费测试,以每人5个邀请码的裂变方式,先行抢占市场;4月22日,阿里旗下AI助手“心流”上线高级研究功能,主打类似OpenAI的智能体DeepResearch式的报告研究;再到百度4月25日正式在开发者大会上官宣智能体“心响”,侧重医疗、法律、绘本等多个适配生活场景的任务体验。 在前有DeepSeek的冲击过后,如何借助成熟产品引流,也成为了智能体接下来上线需要考虑的问题。 目前,大厂多处于内部团体自研的模式,比如字节和百度。但阿里早在Manus点燃市场热情的时候,就已经洽谈了和Manus的合作。目前,阿里除了有自研产品心流的发布以外,其旗下大模型团队通义千问也早在3月就敲定成为Manus中文版的专属模型支持方,先在模型合作上分到一杯羹。 但对于百度、字节和阿里这三家强调AI自研,并且从大模型研发到应用产品均亲力亲为的大厂来说,借自己的力量开发智能体也是非常必要。 扎堆发布的Agent们,各自的产品思路并不相同。 字节的“扣子空间”定位为“精通各项技能的实习生”,给出的各种案例更像是工作上的助手,比如生成行业报告、用户调研分析等。 光锥智能测试后,感觉扣子空间是一个更加面面俱到的及格产品,它不仅接入了高德等MCP,借助工具提升使用能力,在报告输出上也做到了图文并茂,多模态能力突出。但在输出报告的内容深度上,还有进一步优化的空间。 对比来看,阿里旗下的AI助手“心流”上线的高级研究功能,更加接近于深度研究的应用场景。在多次测试过程中,心流显著的特点就是消耗的Token资源更多,耗时长。比如,在“智能体研究”任务上,心流的处理时长超过1个小时,浏览网页的数量也显著超过其他两个产品。 大量资源和牺牲效率的方式,换来了更具深度的生成内容,而这也是心流只能通过审核制申请测试的原因,大规模的开放,对算力消耗和成本来说,都是当前难以平衡的问题。但在对象选取准度上,心流的表现一般,比如在智能体报告中,它选择的产品多为大模型AI助手类,且把Manus融资7500万的信息误放在了扣子空间的分析中。 相比于字节和阿里的通用Agent选择在PC端上线,百度的心响则把首发选在了手机App端,后续才会上线PC端。 不同的智能硬件端,决定了两者面对的受众差异:电脑端面对的多为有工作、学习需求的用户,集中在报告研究、内容分析的领域;而手机端用户则更希望体验AI在实际生活场景中落地的各项功能。 结合百度在医疗、法律等行业的优势,再加上百度过往在AI虚拟社交等方向的探索成果,心响最终的上线形式就变成了主推垂类场景的模样。 目前,心响App的主界面推荐了包括AI相亲、旅游规划、医疗/法律咨询等场景的体验推荐。实际测试下来,心响在医疗、法律等问题上的准确度较高。比如在回答酒驾撞人逃逸问题时,心响调用了多个Agent,最终给出量刑7年的结果,这也和现实中律师意见一致。 但在脱离垂类知识积累的其他业务上,心响的准确度还需要继续优化。比如在要求出一份旅游地点建议的任务执行中,心响明明已经判断出地点不属于朝阳区范围,但依然推荐了不满足用户设定条件的景点。 综合三个通用Agent的测评结果,大厂梯队的AI智能体,目前多数只能用来完成一些基础水平的工作,能力上还没有达到类似Manus般惊艳的效果。 但短期内,大厂们交出的答卷,已经让市场用户开始逐渐对智能体的概念感到兴奋和好奇。 无论是字节还是360的Agent,近期都在大批量开放测试的过程中出现过服务器崩溃的情况,可以说,即使是拥有充足算力的大厂,其消耗程度也远远超出了发布的预期。 而智能体这条赛道,参与的选手不只有互联网大厂和创业公司,凭借硬件优势,有智能手机和电脑的公司也盯上了智能体的前景。 今天,联想就在发布会上发布了面向个人的智能体“天禧”和“乐享”企业超级智能体,针对个人来说,其智能体已经能够完成提供旅游建议、制定行程和下单等各种自主操作。 面对“智能体”这块肥肉,各家虎视眈眈。 Manus还没被超越,但技术红利还能吃多久? 被称作“Agent之年”的2025,大厂和创业公司,都在自己的能力范围内交出答卷。 但三家大厂目前上线的产品,折射出一个残酷现实:大厂们即便坐拥生态与算力,复刻Manus并不是一个能够在短期内完成的事情。 在Manus发布之初,其创始人肖弘就已经给出了自己的观点:Manus没有秘密。 “从产品经理的角度出发,要用就要用最好的大模型,用最好的东西能产生多大的商业价值,产品经理关心的是这个。”肖弘说。 Manus的核心能力建立在模型能力溢出上,但在最早建立市场认知的时刻,Manus在模型能力调用和产品思路两个方面做到了极致: 首先,Agent需要同时处理多模态理解、复杂推理、代码生成等多样化任务,这对底层模型的综合调用能力提出了极高要求。现在市面上能够看到的多数通用Agent,都是采用不只一个大模型,而是多个模型按照不同需求调用,比如需要理解图片内容,就调用多模态能力更强的大模型。 以字节为例,据晚点LatePost报道,扣子团队开发扣子空间时,他们曾考虑优先使用 DeepSeek-R1,测试后发现其调用工具的能力不足。最后,基于能力表现和成本原因考虑。使用了豆包 1.5 Pro 为主的多款模型。 而在拥有更好的模型能力基础上,如何将技术转化为用户体验也是一个挑战。 不过,在各家公司交出的Agent上,均已经有不同的思路展现。比如,在搜索体验上,百度的Agent产品采用“多组关键词+搜索引擎”策略,用多组关键词尝试搜索,而智谱则让自家AutoGLM沉思在小红书、知乎等不同平台搜索,打破了不用应用数据固化的边界。 在短期时间内,当前的技术格局呈现出一个有趣现象:以Manus、GensPark为代表的创业公司,仍在关键指标上保持领先优势。比如,GensPark在GAIA基准测试中的表现已超过Manus。 相比之下,大厂现阶段推出的Agent产品更多是“60分解决方案”,但和Manus的目标相同,大厂们需要在通用Agent相对空白的阶段,率先抢夺一部分市场。 技术路线的差异直接影响了商业化策略的选择,两类玩家正走向截然不同的道路: 目前主流大厂仍以免费策略为主导目标,试图撬走一部分用户,字节、阿里和百度的产品都采取了免费供应的方式。 而成本压力迫使创业公司更早启动商业化。目前,GensPark已积累1万付费用户,其ARR(年度经常性收入)达到2200万美元。而Manus更是在海外市场开出单月39美元的基础版和单月199美元的高级版两种收费模式,定价比肩OpenAI的会员。 不过,从基础大模型到应用产品来看,目前技术优势的窗口期正在缩短,留给创业公司们的时间不多。 现在的大厂们用不到一个月的时间,交出了60分的答卷,当新的通用Agent提升到70分、80分,加上免费策略,势必会对创业公司们造成进一步的冲击。 这场竞赛的终局还处于起始阶段,而在通用Agent能力再跃升之前的一切交锋,只是2025Agent爆发之年的序章。
4月新能源销量:比亚迪等头部玩家秀肌肉,新势力弱势品牌将加速出清
2025年4月,中国新能源汽车市场延续了第一季度的增长态势,整体销量呈现显著回暖趋势。乘联会数据显示,当月新能源汽车渗透率再次突破50%,传统燃油车份额进一步萎缩。 比亚迪、鸿蒙智行(问界/智界)、小米等品牌表现强劲,而部分合资品牌仍面临转型压力。政策红利与技术迭代的双重驱动,叠加消费者对新能源汽车接受度的提升,共同推动市场进入加速期。 头部车企规模效应凸显 比亚迪的领先地位在4月进一步巩固,其乘用车销量达37.26万辆,同比增长19.4%,2025年累计销量突破135万辆。这一成绩的取得,既源于其覆盖全价格带的“王朝+海洋”产品矩阵,也得益于插混与纯电双线技术的成熟。 秦家族以4.58万辆的月销稳居入门级市场,而汉L、唐L等高端车型的推出,则强化了品牌向上的势能。与此同时,比亚迪的全球化布局加速,4月海外销量达7.87万辆,同比增长91.9%,东南亚、欧洲市场成为重点突破方向。 吉利汽车则凭借新能源板块的爆发式增长(125,563辆,同比增144.2%),成为传统车企转型的标杆。旗下银河品牌单月销量近10万辆,同比增长281%,其主打的“高性价比智能电动车”策略切中主流市场需求。吉利汽车新能源1-4月累计销量464,763辆,累计同比增长137.7%。 极氪品牌虽增速放缓(同比增18.7%),但通过领克品牌的协同(销量2.76万辆,环比增9.1%),仍稳住了高端市场基本盘。吉利的市场表现,也是插混产品对燃油车替代作用显著加速的体现。 奇瑞集团和长城汽车则通过差异化路径实现增长:奇瑞新能源车销量6.1万辆,同比增长85.5%,出口业务占比超40%,成为其增长核心动力;长城汽车新能源销量2.88万辆,同比增长28.42%,方盒子车型(如坦克系列)在越野细分市场的领先地位进一步巩固。 传统车企的集体发力,不仅体现在销量增长上,更反映在技术储备与供应链掌控能力上。比亚迪动力电池装机量达26.478GWh,同比增长超40%,垂直整合模式持续释放成本优势;长城汽车在混动技术上的突破,为其新能源转型提供了技术支撑。 新兴势力分化加剧 新势力品牌在4月则呈现“冰火两重天”态势。零跑汽车以4.1万辆的交付量蝉联新势力冠军,同比增长173%,其低价策略成效显著:全新SUV零跑B10以9.98万元起售价上市,首日订单破1.5万辆,直接冲击10万元级刚需市场。 小鹏汽车则以3.5万辆销量紧随其后,同比增长273%,连续6个月交付量超3万,成为唯一实现规模与增速双高的新势力。其MONA M03车型以8.99万元定价,进一步抢占入门级市场,以价换量的效果显著。 小米汽车的波动成为4月市场的一大看点,尽管交付量环比下滑3.4%至2.8万辆,但其SU7 Ultra版本的推出仍引发市场关注,之后将会推出的YU7也让不少消费者期待。不过,此前的舆论压力与竞品的挤压(极氪007、智界S7等),使其品牌力提升与规模扩张短期内双重承压。 蔚来汽车则通过“乐道”子品牌的试水,探索差异化路径。4月乐道交付4400辆,虽环比下滑8.7%,但其“5年免费换电”政策与“可充可换可升级”的电池服务模式,为消费者提供了更多选择。值得注意的是,蔚来ET9的交付与年内8款新车型的规划,显示出其通过密集产品投放抢占细分市场的野心。然而,如何在多品牌战略下维持各车型的竞争力,仍是蔚来需要解决的难题。 华为与阿维塔的深度合作,则为行业提供了“技术赋能”的样本。阿维塔4月销量1.17万辆,同比增长122.6%,华为车BU团队的入驻与股权绑定,加速了其智能辅助驾驶技术与座舱系统的迭代。华为轮值董事长徐直军提出的“引望独立运作”计划,更凸显了华为将智能汽车生态融入全场景战略的野心。这种“车企+科技巨头”的联合模式,或将成为未来竞争的重要形态。 市场结构的变化,还体现在增程式混动车型的快速崛起。2024年9月,增程车型在新能源汽车中的占比已达41%,较2023年提升18个百分点。理想汽车依托增程式技术与家庭场景定位,以3.39万辆的月销量稳居高端市场,其L9车型在40万-50万元大型SUV细分市场中销量领先。问界M7虽受鸿蒙智行联盟内部车型分流影响,销量环比下滑,但华为ADS 3.0系统的端到端AI决策能力仍为其技术背书。增混车型的增长不仅缓解了消费者的续航焦虑,也为车企提供了差异化竞争的新路径。 市场分化的另一面,则是部分品牌的生存压力。深蓝汽车(交付2.01万辆,同比增58%)与岚图(交付1.0万辆,同比增150%)虽保持增长,但规模效应不足导致盈利压力凸显;广汽埃安(交付2.83万辆,同比持平)则面临产品周期与价格战的双重挑战。与此同时,合资品牌的电动化进程加速,一汽-大众(新能源占比提升至12%)、上汽通用五菱(新能源占比超50%)等通过高性价比车型抢占下沉市场,进一步挤压了二线新势力的生存空间。 进入2025年,头部车企通过规模化生产与全球化布局构筑护城河,新势力则在价格战与技术竞赛中寻求生存空间,市场集中度的提升意味着弱势品牌将加速出清。乘联会秘书长崔东树认为,刚刚结束的上海车展上“两少一多”的产品趋势,将给企业一些参考。他认为,燃油车少、小车少、新能源大车多的结构性现象突出,建议汽车厂商全方位促进新车布局,从多元化车型、平衡燃油车与新能源车发展、加强技术创新、精准市场定位等方面入手,满足消费者需求,应对市场变化和挑战。
OpenAI计划将“星际之门”AI项目扩展到美国以外,寻求海外盟友共建数据中心
IT之家 5月7日消息,据英国金融时报报道,OpenAI表示计划通过在海外投资扩大其价值5000亿美元(IT之家注:现汇率约合3.6万亿元人民币)的“星际之门”(Stargate)数据中心项目,以推动“民主人工智能”的发展。然而关于该项目的融资和实施细节,OpenAI 并未透露太多信息。 OpenAI全球事务副总裁克里斯・莱哈恩(Chris Lehane)表示,这项海外投资将“远超我们在美国本土的投入”。 OpenAI首席执行官山姆・奥尔特曼(Sam Altman)于今年 1 月在白宫启动了“星际之门”项目,合作伙伴包括软银首席执行官孙正义(Masayoshi Son)和甲骨文公司负责人拉里・埃里森(Larry Ellison),美国总统特朗普(Donald Trump)也出席了活动。特朗普将该项目称为对美国人工智能基础设施投资的“信心宣言”,并表示在其任期内将投入高达5000亿美元用于相关建设。 目前,“星际之门”项目仅包括得克萨斯州阿比林市一个部分建成的数据中心。然而,OpenAI现在正向其他国家推销该项目,除了其在美国的庞大承诺外,还计划在海外开展10个项目,目标是与美国的传统盟友合作。莱哈恩透露,法国、英国和德国的政治领导人已对发展新的数据中心表现出浓厚兴趣。此前,《金融时报》曾报道OpenAI正在考虑在英国进行投资。 OpenAI表示,其海外项目的合作伙伴将根据每个项目的具体情况而定,而非像美国项目那样由软银主导融资。莱哈恩指出:“各国政府、主权财富基金、私募股权基金以及传统资本都在关注这一项目。我们提供顶尖的人工智能技术,我们的参与有助于吸引这些资本。” 此外,莱哈恩还提到,与OpenAI合作开展“星际之门”项目,并承诺在本国按照民主原则发展人工智能,可能成为美国盟友获取先进美国制造半导体的途径,这些半导体是构建最佳人工智能模型所必需的。 莱哈恩表示:“我们在3月向特朗普政府提交的建议中曾提出,通过吸引投资进入美国基础设施建设,为投资者提供从‘第二梯队’迈向‘第一梯队’的机会。”他透露,目前已有来自世界各地的人士对此表示关注并主动联系。 “星际之门”项目的海外交易计划将与美国政府协调进行。OpenAI的高管们将当前数据中心的建设热潮比作早期互联网基础设施建设的繁荣时期,预计其总成本将达到数万亿美元。
阿里Qwen3能否成为下一个DeepSeek?
4月29日凌晨,阿里巴巴旗下通义千问团队正式发布并开源新一代模型Qwen3。此次发布的Qwen3系列涵盖了多个模型类型,包括2款参数规模为30B和235B的混合专家(MoE)模型,以及6款参数从0.6B到32B的密集模型。 作为国内首个混合推理模型家族,一经推出便迅速引发开源圈的激烈讨论:Qwen3能否成为下一个DeepSeek? 发布后不久,华为计算官方发文称,昇腾MindSpeed和MindIE一直以来同步支持Qwen系列模型,此次Qwen3系列开源后,已在MindSpeed和MindIE中实现开箱即用,完成了Qwen3的0Day适配。海光信息方面也表示,其DCU迅速完成对全部8款模型的无缝适配与调优。 “发布第二天,我们已经完成了本地化部署Qwen3-30B-A3B,用了单卡4090,目前对C端用户开放。”共绩算力COO王鹏告诉《IT时报》记者,目前Qwen3部署成本较低,Qwen3-235B-A22B只需要4张H20,而其小模型的部署成本则更低。亦有算力集群公司的工作人员告诉记者,Qwen3发布第二天已接到客户订单。 成本较DeepSeek大幅下降,仍未解决幻觉问题 与此前的模型相比,Qwen3有着明显提升。 在架构上,Qwen3采用混合专家(MoE)架构,以旗舰模型Qwen3-235B-A22B为例,总参数量高达235B,但激活仅需22B,大大降低了运行时对算力的即时需求。 这一设计使得模型在面对不同复杂程度的任务时,能够灵活调配计算资源,针对简单问题快速响应,复杂问题深度思考,实现“快思考”与“慢思考”的结合,兼顾效率与准确性,为模型应用开拓了更广阔的空间,有望改变行业对模型应用场景适配的传统思路。 预训练数据量的提升也是Qwen3的一大亮点。官方数据显示,其数据量跃升至36T,是Qwen2.5的三倍之多。多轮强化学习的运用,将非思考模式巧妙融入思考模型,优化了模型的智能处理逻辑,进一步提升了模型在推理、指令遵循、工具调用以及多语言能力等方面的表现。 与DeepSeek-R1相比,Qwen3参数量仅为其1/3,成本大幅下降。在部署方面,仅需4张H20即可部署Qwen3满血版,显存占用仅为性能相近模型的三分之一。“这对于中小企业和个人开发者而言,极大降低了使用高性能模型的成本门槛和部署时间。”王鹏表示。 但也有不少AI发烧友实测后在社交平台上指出,Qwen3在长文本能力上的表现并不算突出,有一定幻觉率,但在生成复杂代码、数学推理等方面,思考模式的表现明显好于非思考模式。《IT时报》记者使用Qwen3网页版尝试生成关于“去年五一小长假旅游数据与景区特性关联”的报告,Qwen3“普通”模式未能给出准确数据支持,出现了较高的幻觉率,但在“深度思考”模式下,幻觉率大幅降低,数据更加准确。 祭出AI“双子星”战略,阿里迫切想在C端站稳脚跟 在当下AI赛道,科技巨头们的每一步落子都备受瞩目。 近期,一则有关算力抢购的传闻甚嚣尘上,传言腾讯、阿里、字节跳动纷纷下场,重金争抢GPU算力资源。虽然字节跳动已出面辟谣,称相关信息不实,但这一传闻本身,足以反映科技大厂对AI战略布局的重视与急切。 作为AI发展的根基,算力的重要性不言而喻。阿里此前更是公开表态,未来三年将投入超3800亿元用于云和AI硬件基础设施建设。 当前,阿里集团各个业务板块将AI作为重要KPI,从阿里的整体AI战略布局来看,对AI的投入持续加大,试图强化通义千问与夸克的“双子星”格局。通义千问专注于支撑云上智能,夸克则着力打造端侧入口,协同推动阿里AI To C战略的落地。 与此前最大的不同是,“夸克”和“通义”成为Qwen3的主要体验入口,这两大App所有用户均可免费使用这一最新的开源模型。 “通义App在C端并没有打出声量,只能委以夸克重任。”一位阿里内部人士曾对《IT时报》记者表示。 通义千问凭借在多模态处理和复杂任务推理方面的技术优势,曾为阿里的B端企业服务及开发者生态提供了有力支撑。诸如飞猪旅行借助通义千问多模态模型,实现了用户方言语音规划行程的功能;Rokid AR眼镜搭载其技术后,能够进行实时翻译。通义千问在大模型开源上跑得很快,但是,其“通义”App在C端应用上并没有使出“撒手锏”。 反倒是夸克突破重围,第三方数据显示,2025年3月,夸克的MAU(月活跃人数)达到1.48亿,登上国内AI应用榜首。 2024年底至2025年初,阿里通过一系列组织架构调整和人才布局推进AI To C战略,将AI应用“通义”并入智能信息事业群,整合天猫精灵与夸克团队,并聘请顶尖AI科学家许主洪负责AI To C业务研发。 阿里AI战略仍有诸多挑战横亘在前。通义千问在维持技术优势的同时,如何进一步降低使用门槛,满足中小企业多样化的定制需求,成为亟待解决的难题。其API(应用程序编程接口)价格虽具备一定竞争力,但部分中小企业在技术对接与模型二次开发方面,仍面临诸多困难。夸克同样面临挑战,随着用户数量的快速增长,体验稀释问题逐渐凸显,部分功能在流量增加时响应速度变慢,这就要求夸克必须优化技术架构与服务器性能,以确保用户体验的稳定性。 AI市场竞争激烈,腾讯的混元大模型依托微信庞大的用户基础和生态优势,在微信多个入口为元宝争取亮相的机会,对C端用户形成“茧房式包裹”。字节跳动旗下的豆包借助旗下抖音的推流优势,在2024年11月MAU飙升至5998万,几乎长期霸榜AI应用下载量榜单前三。 虽然手握通义和夸克“双子星”,一条腿迈进开源圈,一条腿迈向C端用户,但在巨头环伺下,阿里AI战略的前路仍充满变数。
美国芯片出口管制砸了自己的脚 NVIDIA警告:反帮华为主导全球标准
快科技5月7日消息,在高科技领域,谁制定标准,谁主导生态,谁就有绝对话语权。 受益于在CUDA生态系统中,NVIDIA 在全球AI应用领域建立标准。随着美国持续对中国祭AI芯片出口管制,反帮华为主导全球标准。 据TH报道,NVIDIA CEO黄仁勋在对美国议员的讲话中写道:“我们正处于一个转折点,美国必须决定是继续引领全球人工智能的发展和部署,还是撤退和收缩。 美国不能通过放慢速度来保持领先。如果我们退缩,其他国家就会介入。全球人工智能生态系统将会在技术、经济和意识形态上四分五裂。” 目前在中国市场,NVIDIA硬件与平台两方面都面临主要竞争对手,在硬件部分面临壁仞科技、芯动科技和摩尔线程的追赶,虽然这些公司市占率仍小,但都采用Imagination Technologies开发的PowerVR GPU IP,且在GPU开发拥有丰富经验。 但目前它们缺乏与NVIDIA CUDA相媲美的生态系统。 能在软、硬两个层面和NVIDIA竞争的中国企业,莫过于华为。 报道指出,华为Cloud Matrix 384系统据称在AI效能方面优于NVIDIA GB200 NVL72解决方案。 此外,华为的AI专用异构计算架构CANN也提供完整的开发资源。 当NVIDIA的AI芯片无法再供应给中国的买家,他们可能考虑改为华为或壁仞、芯动科技、摩尔线程等公司的硬件,这将使NVIDIA每年损失数百亿美元营收、市值缩水数千亿美元,甚至导致中国竞争对手反而成为AI领域的新标准制定者。 事实上,美国已经见证了放弃技术领先地位的后果,华为凭借其提供更廉价、更快速部署的基础设施,在全球5G部署中占据了主导地位。
学而思发布新品学习机:搭载DeepSeek,配备专属1对1 AI老师,“精准学”等功能迎升级
作者 | 陈骏达 编辑 | 心缘 智东西5月7日报道,今天,学而思正式发布了P、S、T三大系列的学习机,并在旗舰机型上推出“小思AI 1对1”智能交互功能,能引导学生主动探索,带来个性化、高效能的智能学习新体验。 本次发布的三款学习机,搭载了由学而思九章大模型和DeepSeek构成的双核大模型。学而思CTO田密介绍,九章大模型是国内首批通过备案的教育大模型,全科解题、全科批改能力处于行业领先水平,多模态批改技术、基于大模型驱动的步骤级知识图谱是本次“精准学”等AI功能升级的核心支撑。 这三款学习机分别面向不同学段和学习需求的学生群体。其中P4标准款首发价2699元,主打性价比;S4经典款能力较为全面,首发价为4899元;T4旗舰款主打智能学习体验,集成了58项AI功能,首发价为7299元。在AI功能之外,这三款学习机还根据新课标要求更新了课程体系。 学而思智能学习负责人赵璞铮称,教育领域存在“高品质、大规模、个性化”难以兼顾的“不可能三角”困境,而AI有望帮助所有孩子获得专属的1对1老师。 一项学而思与北京大学教育学院学习科学实验室共同开展的研究表明,学生在使用学习机时的提问频次与内容,与学业成绩、自我调节水平显著相关。基于此,学而思推出“小思AI 1对1”等创新功能。 “小思AI 1对1”能够主动引导学习,与学生展开连续对话,根据学情动态生成内容,实现因材施教。在答题批改环节,不仅能精准指出错误,还能深入分析原因并给出改进建议。在现场演示视频中,“小思AI 1对1”识别了学生在解题过程中出现的问题、错误,并给予针对性的提示,而非标准化答案。 “小思AI 1对1”还具备情绪感知能力,可及时给予学生鼓励或祝贺。 “精准学”是学而思学习机的特色功能之一。本次新品发布后,“精准学”将升级至3.0版本,打通了学情数据和知识图谱。其中,“过滤学”功能可自动生成课程思维导图,帮助孩子快速把握课程核心内容。 “过滤练”功能则针对学习机内置练习、老师布置作业等,智能分析出未掌握题目、易错题和必考题,优先练习关键题目,避免盲目刷题。 学而思旗下原“随时问”App也全新升级为“小思AI”。新功能则将于6月初上线,旗舰机型用户可免费更新。 结语:推理、多模态技术升级,引发AI学习机竞争升级 中研普华研究报告显示,2024年,中国学习机市场规模已达到约180亿元人民币,预计2025年将突破200亿元大关,年复合增长率保持在15%以上。其中,AI功能已经成为市面上大部分学习机的标配。 介绍新品时,学而思将大部分时间都花在了AI功能与其底层技术能力的解析。2025年以来,在新一轮多模态、推理模型技术迭代的背景下,学而思、科大讯飞等学习机厂商都不约而同地接入了DeepSeek,并进一步优化了产品的解题能力。未来,学习机厂商们在AI教育领域的竞争,或将愈演愈烈。
杨元庆回应Agent落地战略、关税影响、产品是否涨价
作者 | 程茜 编辑 | 心缘 智东西5月7日报道,今天,在2025联想创新科技大会上,联想正式发布超级智能体三大功能,并展示了覆盖全场景的个人、企业、城市超级智能体矩阵。(联想推出多个超级智能体,秀全球首款卷轴屏AI PC,人形机器人现场打太极) 随后,联想集团董事长兼CEO杨元庆,联想集团执行副总裁兼中国区总裁刘军,联想集团高级副总裁兼首席技术官Tolga Kurtoglu,联想集团高级副总裁 智能设备业务集团全球创新中心总经理贾朝晖,联想集团高级副总裁、中国方案服务业务群总经理戴炜与智东西等媒体,围绕超级智能体的独特性、AI落地等进行了深入交流。 杨元庆告诉智东西,目前联想混合式AI优势集包含计算、数据、模型、服务、应用库层面,其中有部分能力需要和第三方合作伙伴合作构建,如网络能力、数据、模型、服务层面。具体来看,联想在构建结构性和非结构性的数据、知识库等需要依赖第三方;模型层面,去需要帮助客户挑选最适合其需求的模型。 戴炜补充说,联想在构建宜昌城市超级智能体时,首先和合作伙伴构建了大模型“超市”,将几乎所有的大模型放在一个平台上,然后再往上迭代成智能体集市。此前,其合作模式是ISV模式,指与某一家公司或组织合作,提供软件产品或服务吗,现在这种合作方式已经远远不够,联想需要和生态合作伙伴共创领域智能体,同时集合领域智能体形成超级智能体集合,最终实现统一调度和协同。 贾朝晖称,个人超级智能体也在以生态合作的模式展开,联想会和业界其他智能体合作,为用户提供完整的解决方案,其独特性在于,让这些方案在联想的设备上能够有不一样的用户使用体验。 一、超级智能体与人深度捆绑,可跨设备、多方式自然交互 杨元庆提到了初代智能体小天和此次升级的超级智能体的不同,小天智能体和设备捆绑,超级智能体是和人捆绑,在保证数据安全、隐私的前提下,可以使用个人所有设备的所有数据来执行任务。 他重申了超级智能体的三个特征:感知和自然交互,用户可以通过各种设备和超级智能体交互,并且以语音、键盘、手势等诸多方式进行自然交互;认知以及在认知基础上帮助(用户)做决策甚至规划一些事情,认知的基础是记忆,超级智能体拥有长期记忆,用户习惯等可以作为其决策的依据;自主规划、自主学习演进,超级智能体可以将复杂任务分解为相对简单的任务,规划采取行动。 关于AI落地,杨元庆谈道,混合式AI是AI落地的最好方式之一。真正让AI有用处,需要和每个人、每个企业相连接,混合式AI的提出,就是要帮助AI在个人和企业层面构建更多应用。未来,每个人都有自己的个人智能体,而非每个设备的智能体。 水平方向上研产供销服都有智能体,在垂直行业上也会有垂直行业智能体出现,将来这些智能体之间互相打通、沟通就是AI落地的方式。 Kurtoglu提到像MCP这样的标准化协议正是市场的发展方向,联想也已经将其融入到现有的部分Agent功能当中。他认为,未来标准化和通用的API将会很重要,MCP是一个起点,也是目前最先进的技术之一。 但他也提到MCP目前是在Agent、工具、应用程序以及数据之间搭建桥梁,但就Agent的核心而言,还有更多功能需要去构建,未来联想将在保证安全的基础上,通过更多的增强功能来支持更多的标准等。 针对联想为企业提供的智能体即服务交付方式,戴炜称,联想百应是智能体即服务的一个典型代表。企业能够在不断使用联想百应的过程中,获得更加个性化的服务,而不是和SaaS服务一样,一旦交付就是固化的软件,只是以分期订阅式的方式获得。 二、内部客服70%请求无需人工干预,正探索用“硅基替代碳基” 围绕AI在国内的探索,刘军谈道,联想有针对个人智能和企业智能两条线。 个人智能方面,去年联想推出AI PC,同时推出第一代个人智能体系统天禧AS。过去一年,联想在AI PC、本地算力、天禧AS能力上都实现提升,用户净推荐指数和满意度、活跃度增长。今天发布的天禧超级个人智能体将是联想又一个重要里程碑,将达到L3(协作级)水平。 联想会基于端-边-云架构,在可信计算环境下给每个人做一个联想个人云,并且未来联想的产品可能会和非联想产品协同,智能体可以全方位实时从不同设备进行采集,并为用户服务。 企业智能方面,联想先拿自己进行实验,不断迭代智能IT引擎擎天。 联想内部,客服部门是首个用AI替代的业务,刘军透露目前联想在中国每年有3000万个服务请求,其中70%的请求已经不需要人工干预。 联想还在做用“硅基替代碳基”,其目标是工作流中的30%要用机器人完成。目前,联想已经可以为企业直接提供服务或者帮企业做AI转型服务等。 对于企业,联想把中国企业细分为两大类客户:政企、500人以下的SMB中小企业。面对政企客户,联想有擎天解决方案和服务,拥有“3+2”五大offerings,三个方案是xCloud混合云方案、智能体矩阵、ESG;两个服务是全周期服务、直接提供服务。 对于SMB企业,联想构建了提供IT运维服务、AI营销和AI办公等的联想百应。 三、联想安全底座:混合式AI架构、中间件的安全设计、推进行业标准、用AI防治AI 在保护用户的数据安全、隐私方面,杨元庆说:“联想之所以提出混合式AI,就是从个人、企业数据保护等角度出发,OpenAI、DeepSeek等发布的模型都是公有AI,需要通过公有云获得问答能力,但这一过程必然会暴露个人的数据。” 这背后的矛盾点是,没有真实个人数据的投喂,用户就无法通过AI获得精准的能力。因此,联想提出的更好解决方案就是,利用可信的设备,让其学习私有数据然后进行推理。对于企业也是如此,企业员工需要AI基于企业财务、产销、客户等数据帮助企业进行精准决策、优化流程。 Kurtoglu补充道,联想会将敏感信息在本地进行处理,同时会对信息去敏,然后在不同设备当中进行安全转移。对于需要上传到云端的数据,联想也会通过不同的数据安全和隐私保护措施来更好处理数据、转移数据。 贾朝晖总结了联想在保护数据安全方面的四个举措,分别是混合架构设计、硬件和操作系统层面中间件有相应的安全设计、合作推进行业安全标准、用AI防治AI。 四、关税对联想产品价格影响较小,两大模式可减弱国际形势影响 面对美国加征关税的潜在影响,当被问到联想的产品是否会在几个月后涨价,杨元庆说:“肯定没有一个绝对的回答。”他认为零部件的供需情况是一个很重要的考量因素,目前高科技产品有豁免条例,所以对价格的影响较小,但未来的不确定性很大。 此外,联想在应对高关税方面已经有诸多经验,通过在中国制造,然后将零部件运到海外进行组装,一方面可以满足交付时间需求,另一方面还能为当地提供就业、税收等。 他透露,联想构筑了全球生产制造基地布局,在10个国家建立33家工厂。其通过端到端整合的“ODM+”模式以及全球资源本地交付的global +local(全球本地化)业务模式,这两者相结合可以帮助其应对复杂的国际政治经济形势。 结语:联想重构个性化AI入口 相比于联想的初代智能体小天,联想超级智能体凭借感知与交互、认知与决策、自主与演进三大核心能力,超级智能体将成为个性化AI的超级入口。 目前,PC作为算力最强的个人终端设备,在智能体时代的重要性不言而喻。作为全球占有率第一的PC厂商,联想或许将凭借超级智能体的解决方案,构建从PC到智能体服务的商业闭环。
00后华人打造AI作弊工具狂揽3800万融资:求职不再是人找人,AI对轰时代来了
一个21岁的华人大学生,因为开发一款AI产品被学校开除,转头就凭借这个产品拿到了530万美元(约合 3825 万人民币)融资。 最近你或许看到过这个传奇故事,这个大学生开发的AI工具,号称能够帮助用户「在一切事情上作弊」。 产品演示,AI在约会中提供建议 这是一个叫为Interview Coder的面试作弊工具,可以隐藏浏览器窗口不被面试官察觉,为用户在考试、销售电话和工作面试等各种场景中获取AI的实时帮助。 创始人Chungin Lee表示,他自己就用这个工具获得了TikTok、亚马逊、Meta等公司的offer。 虽然金三银四已经过去,但工作很难找并不是一天两天了,尤其是 AI 越来越强大的情况下。 仿佛全世界的坏消息都涌了上来:还不会用AI,你就要被淘汰啦。 最近Shopify已经宣布要将AI使用情况纳入绩效考核中,员工如果要申请增加人力,就得先证明这个工作无法由AI完成。 前几个月国内一家公司流出的内部聊天记录就曾引发巨大讨论,就是因为里面惊人的裁员数字。虽然后来CEO发布了公开信表示不实,上美的确有计划整合AI进入业务当中,但好的人才依然是不可或缺的创新基石。 上美的姿态还是太激进了,连AI公司自己都开始调整招聘策略。 Claude背后的人工智能小巨头Anthropic二月更新了许多在招岗位,有眼尖的网友发现,申请表格中有这么一项: 有点滑稽。要知道Anthropic曾经还宣传过,Claude和招聘平台Skillfully的合作,通过协同不同的 AI 模型,定制出专属的 LLM 基础设施,实现了时间成本减少50%,招聘总成本减少70%的成果。 Anthropic开发AI是降低招聘成本,但自己招人的时候却放出了这样的条款。只许州官放火,不许百姓点灯呐。 新时代面试就是AI对轰 无论是用人方还是求职者,对AI工具的依赖都肉眼可见。 美国人力资源管理协会(SHRM)在2023年的调查显示,25%的组织已在 HR 活动中使用 AI,不仅用于简历筛选,还用于分析面试中的肢体语言、表情等。猎聘《2024 年度非凡洞察报告》指出,61%的企业 HR 部门在简历筛选、AI面试等环节使用AI工具,职位对AI工具的需求增长 68%。 以AI面试为例,面对面交流对于招聘来说必不可少。不仅能够进一步挖掘简历上的经验,还能了解求职者是怎样一个人。而用 AI 和数字人,已经成为许多大厂做初面的方式。 招聘网站们也在紧锣密鼓的赶工,迎接 DeepSeek 入驻自家平台。 自动生成岗位描述,5 秒即可分析千人简历,还能自动回复求职者咨询。 还有美团在「招聘做 AI 招聘的实习生」,很奇怪的一个句子,大概是想要找愿意把自己做成数字人的 HR。 第一条和第二条之间,堪称二律背反,但那又怎么样,这说不定可以改变世界。 现在的AI面试官已经很卷了,到了极其精细的程度,并不仅仅是甩几个问题出来回答、录音,而是会判断着装、陈述质量,甚至会检测眼神和表情是否僵硬,以判断有没有读稿。 甚至连瑞幸咖啡都有了 AI 面试。记忆里瑞幸是用全自动机,一键出液,人工摇杯,AI 是能帮助判断什么…… 据说这个AI面试的淘汰率还很高,会直接刷掉人。在AI替人类做咖啡之前,就先开始淘汰人类了是吧。 渗透率到这个程度,求职者怎么可能不拿起同样的武器呢? 像垂直考公培训的粉笔 app,推出了面试模拟功能,连场景设计不禁让人心头一紧。 去年GPT 4o发布时,官方也出了一个面试准备的视频。 专门针对AI的面试攻略也越来越多,人还能被AI给难住不成。 眼下的求职市场,堪称是 AI 之间的对轰。对于普通打工人来说,谁家的模型上了什么榜单不重要,能搞定简历、拿下面试才最重要。 恶性循环 可是,用人单位对于 AI 真的信任吗?Anthropic 的态度可能正反映了这一点:AI 有帮助,但问题也不少。 专门针对 AI 面试的攻坚层出不穷,带来的问题是所有人都千篇一律,而且还都用大模型给出的标准模板。 人人都摆出镜头里最好看的姿态,用最标准的答案。为了迁就模型的理解力,让自己的回答尽可能的结构化、逻辑简单,方便大模型理解。 求职者的削足适履,影响到的是企业的用人多样性。Tim Cook 曾经说过,多样性是苹果在招聘时非常关注的一个维度。对于这样一个跨国巨头来说,多元化的人才结构,有助于理解和洞察不同市场的需求,适应不同的客户群。 每个人的经历、经验不同,哪怕是刚刚毕业的应届生们,实习、上学的经历也各不相同。咨询公司 AESC 去年发表的报告中,指出数字化转型,更需要多样性的团队,在创新能力上可以比同质化的团队高出 35%,更易拿出颠覆性的解决方案。 虽然说打工人就像螺丝钉,只做点微不足道的小事。但人跟螺丝钉最大的区别在于,即便两个人都可以完成同一件事,这两个人始终是不同的两个人。 DeepSeek 在 2023 年接受暗涌采访时,梁文锋解释过自己对于人才的理解。 不要求海外学历、不要求工作经验、从细节招人。连 HR 都出来说,这样的取向在简历初筛阶段很难实现,但到了面试阶段,一般都能看出来。 梁文锋在用人上的独到见解,在今天多多少少像一种都市传说。真正敢不拘一格降人才的用人单位,简直像鬼一样:人人都说有,从来没见过。 更多的用人单位是标榜自己广纳贤士,然后转身开始布局 AI 面试,然后遇上求职者也拿 AI 工具应付,陷入恶性循环。 人才密度永远战胜人才数量 某种程度上 Anthropic 希望求职者不要用 AI,可能也出于类似的心态。春节前,在达沃斯论坛上,Dario Amodei 在访谈里还谈到了对于人才的看法。 「人才密度永远战胜人才数量,高质量的人才互相合作时,会产生某种独特的化学反应。」这是他秉承的信念。 AI 行业日新月异,三个月前 Anthropic 对于竞争,可能还没有很准确的认识。一个农历春节过去,不知道 Dario Amodei 现在是不是已经大跳反了。 Anthropic 的发心可能是好的,但做法却走偏了——在要求求职者不用 AI 之前,应该是公司少用 AI 来一刀切地评估候选人。 《商业研究杂志》刊发的研究显示,当 AI 以标准化、重复化的方式评估候选人时,求职者会担心自己的工作技能和经验没有被准确的解析出来,从而降低接受 offer、乃至入职的意愿。 至于预备打工人,则是要再多一点耐心。找工作是很难,现在也的确并非「是金子总会发亮」的时代。我们只能多一点耐心,用来自我成长,用来跟规则搏斗。一直到自己的光亮成功突围之前,耐心是最有用的武器。
换装横屏——这就是蔚来新5566最大的变化
蔚来终于缓了一口气。 整个 4 月份蔚来一共交付了 23900 台新车,同比增长了 53%,其中蔚来品牌 19269 台,乐道品牌 4400 台。 ▲蔚来近期销量 图片来自:蔚来官方微博 目前,NT2现款车型优秀的性价比,确实引发了市场的热烈反响,但是现在对我们团队来说更大的任务与挑战集中在,2025款「5566」能否上市后不打折还可以延续热销的气氛,我觉得是现在公司内部团队重点准备和观察的指标。(蔚来秦力洪) 对于这个增长情况,蔚来内部的态度是「谨慎乐观」,毕竟在目前新老产品交替的时期,有很大一部分销量来自于清库存,在叠加了降价以及「5 年免费换电」和「5 年 0 息」等因素后,很难说这部分的销量对蔚来的利润率有多大贡献。 ▲蔚来 24 款车型优惠方案 图片来自:蔚来销售 真正想要实现李斌「今年第四季度盈利」的愿望,还是得看接下来换代的 ET5、ET5T、ES6 和 EC6 的市场表现。 根据《西部证券》发布的研究报告,蔚来 ES6 和 ET5+ET5T 车型在 2024 年的总销量分别为 75433 辆和 77379 辆,分别占比 31.32% 和32.31%,两者销量合计占比超 60%,是蔚来销量和营收的绝对大头。 改款「5566」的公开信息并不少,而且大部分都是蔚来 CEO 李斌在直播中泄露出来的,再加上 2 月份「5566」们正式登陆了工信部网站,可以说除了具体价格以外,其他方面的信息都很透明了。 先来看看外观,根据《新出行》整理的现款与工信部申报图的对比汇总,改款「5566」的整体造型设计变化不大,只是在前杠、日行灯、前唇等细节上做了微调,ET5 和 ET5T 也用上了新的 ADB 智能矩阵多光束大灯。 ▲蔚来「5566」新旧款对比 图片来自:新出行 座舱和内饰则做了比较大的调整,蔚来此前已经确认,四台车都将采用与旗舰车型 ET9 相同的横屏设计,换挡拨片也将被怀档替换,此外中控台也进行了重新设计,会提供两个额外的无线充电板和额外的储物空间。 ▲蔚来新款 ES6 谍照 在车主群体中呼声很高的 AR-HUD 抬头显示系统预计也将下放到新款 ET5 和 ET5T 上。 据说蔚来这次也对「5566」的座椅舒适性进行了改进,并且新增了 ANC 主动降噪功能,不过由于 ET5 和 ET5T 换电结构的限制,估计两车坐姿过高的问题很难能得到改善。 ▲蔚来新款 ET5 谍照 智驾方面,新款「5566」的智驾芯片将从 4 颗英伟达 Orin 芯片更换为蔚来自研的神玑 NX9031 智驾芯片,也将搭载天枢 Sky OS 整车全域操作系统和基于蔚来世界模型的 NOP+。 这颗自研芯片的算力官方虽然没有正面提及过,但是业内普遍认为大致与 4 颗英伟达 Orin 芯片相当,约 1000 Tops 左右。 ▲蔚来神玑 NX9031 智驾芯片 在整车的电子电气架构上,「5566」依然将采用 400V 架构,所以整套动力系统和电池容量大概率都与现款相同。 至于为什么不上蔚来最新的 900V 和 NT 3.0 平台,李斌给出的答案是「成本摊销」。目前 3.0 平台的制造成本较高,且400V 在补能的适配性和便利性上都有优势,也能够兼容蔚来已有的大部分换电站。 ▲蔚来新款 EC6 谍照 总结一下,这次新「5566」的换代很大程度上是一次小修小补,蔚来改掉了现款车型上最容易感知的座舱部分,补强了之前竞争力匮乏的智驾部分。 ▲蔚来新款 ES6 内饰谍照 李斌在去年年底的一次媒体群访上,曾经讲过一段对于「二代车型」的看法—— 第二代车这三年,总体上落后于我们自己早期规划 2 年左右,蔚来现在的状态按照 17、18 年的规划,大概 2022 年就应该完成。 迟到两年的「5566」,在这次小修小补之后,或许能为蔚来维持一些市场热度并填补技术空窗,但很难让蔚来摆脱目前困境并实现盈利,尤其是李斌还明确表示了「改款的 5566 肯定不会比现款更便宜」。 还是期待一下乐道 L90 和萤火虫吧。
“最近看的AI项目,全是一个模子出来的”
“天哪,学不完根本学不完。每当你以为能够专心研究某样事物时,就会又出来一个新东西,你又得再分一些精力出来学习。”投资人Leo(化名)总在深夜陷入知识焦虑的漩涡。回忆起Manus公布那晚,他已经准备睡觉,突然微信推送出Manus创始人那条展示视频。他想,不管了,无论如何要睡觉。第二天起来,AI Agent又刷屏了。 1个月前,我们在一间咖啡馆里,聊着彼此都是刚学到的知识点。AI是当下最大的投资共识,他所在机构也把AI设为主要方向。以朱总为代表,盯着的是现实的商业化,考量的是项目能不能成为即刻可用的提效工具,或者说,能不能赚钱。这当然是市场的主流。当我把同样的问题抛给Leo,他的回答则让人意外。 Leo读的是别人嘴里面没用的专业。比起有没有商业模式,他更关心的命题是,当AI越来越先进,除了从纯商业的角度看能带来多少投资收益和效率提升外,是不是还应该同时考虑这种破坏性创新带来的负面影响,以及这种成本是不是现阶段我们能承受的? 从更广阔的维度,他思考的是新科技和新产品对于生产关系的变革。基于此,Leo分析了Agent大规模落地的挑战——因为人是社会性的动物,这导致Agent没有办法去实现更大的想象空间。他对AI应用的投资悲观——因为现有的项目在他眼里都长得差不多,仅仅局限在优化现有流程的层面。他还在等待一个奇点时刻,“当AI从本质上改变了生产关系,能创造出人与人之间、人与物之间交互的全新模式,在这个模式里真得离开AI都玩不转。” 在效率和商业模式主导的投资行业,这是不接地气的思考吗?我不这么认为。 Manus后面,又有Genspark出来,但只有业内人在围观。DeepSeek也正在经历祛魅时刻——短暂的尝鲜后,人们开始抱怨网络上充斥着DeepSeek味道的文章。AI应用像一个模子出来的,AI生成的语句也带着明显的机器烙印。短短数月,世界彻底变了。 这是一场史无前例的技术革命,也必然深刻塑造未来的人类社会。正是在这个意义上,Leo对当下AI投资的困惑和质疑,不一定都对,但也不乏价值。 以下内容根据访谈整理,投中网略作编辑: 自动驾驶会带来新岗位,这是在扯淡 很多纯理工科或者纯金融背景的投资人,不太关注具体的人在技术变革中所遭受的困境。 一个最直接的问题是,AI取代掉人的岗位之后怎么办。很多人的工作没了,而且是彻底没了。工业革命带来了蒸汽机和纺织机,之后出现了纺织工人这样的岗位,但再往后,连纺织工人都不用了。 我以前看过一些文章,预测未来数千年人类社会按劳分配的原则可能会改变。这眼看着机器工作就是比人的效率高,怎么办呢?社会可能不需要那么多人劳作了,那对于那些无法通过劳作获取报酬的人来说,如何应对这种历史的摩擦力呢? 大胆设想一下,国家发钱可能是一个思路,类似北欧那样的税收体系和财富再分配体系,但制度建立需要时间,磨合成合适的样子也需要时间,必然有一部分人的利益来不及得到保障。这些利益受损的人就会成为技术推广过程中的牺牲者。 美国从上个世纪70年代开始加速,发展成今天以金融服务业为主的国家,这个过程中美国工人的利益被牺牲。现在他们为什么要回到一种更低效的经济生产方式呢?虽然金融赚钱是效率最高的,但如果没有做好财富再分配,人民再就业的引导,那些利益受损的人就会用脚投票。 这可能是一个不太恰当的类比,总之我想表达的是,技术不是万能的。我看到一部分人现在有点太乐观了,但这社会怎么会像你想得那样在很短时间内发生翻天覆地的改变。当AI越来越先进,除了从纯商业的角度看能带来多少投资收益和效率提升外,是不是还应该同时考虑这种破坏性创新带来的负面影响,以及这种成本是不是现阶段我们能承受的? 去年7月,当时一个事件引发的说法是,自动驾驶会带来新的工作岗位。我觉得这种说法很扯淡,它是放在了一个很宏观的历史的角度去讲。没错,它确实能够带来一些新的岗位。但是,首先,这些岗位有多少呢?如果他们指的是安全员或者说给自动驾驶的车收集数据的这些驾驶员,能有多少跟这些的士司机的岗位数量相当?其次,新的岗位更偏爱年轻人。他们上网,能更理解技术,更能接受新事物。但那些四五十岁的司机怎么办? 很多人不去讨论AI的伦理,其实这是一个很重要的问题。商业上总会有一个模式出来,前提是先把伦理的问题给解决了。比如说,自动驾驶的车出车祸了,责任是由谁来担?现在很多地方在推车路云协同之类的,但是关键并不在于技术上或者说商业上未来有没有实现的可能,而是恰恰是权责的问题。没有人愿意站出来承担风险,所以就推不下去。 另外,技术本身的发展水平也是一个挑战。自动驾驶出来三四年了,但是直到今年才允许它开到人流和车流量大的地方。背后的原因是,一旦路上车多起来,一定开得很慢,掉个头变个道,都可能磨蹭半天,因为它要保证安全。就跟我小时候过马路似的,其实车离我大概50米远,成年人觉得能过了,但是小孩就觉得我要左看右看,直到视野范围内一辆车都没有。客观的结果,就是我在斑马线前面停了很久。自动驾驶的车也是这样,无论是从安全还是交通效率的角度,都没有办法大规模地开到哪个市区,所以自动驾驶依然会有争议。 技术当然在不断进步,但技术改进,又是一个“鸡生蛋还是蛋生鸡”的问题。因为自动驾驶的训练需要数据,数据需要上路开来获取,但是高峰期的路不让你开,那你就收集不到这个数据,所以技术就总是没法进步到足够好。 当然,行业内早在探索采用仿真数据,包括李飞飞在美国做的World Labs,也包括智慧君当年发布的机器人,它的强化学习也是靠着仿真数据,苹果最近也在搞仿真数据。他们都在试图绕开现实的场景中收集不到数据的问题。我直接打造一个模型,模型里面仿真现实世界里面可能会发生各种各样的问题。问题是,你能仿真到多大的程度?总有一些没有办法求取出来的场景。 比如,路上突然跑过来一只猫,这种问题怎么处理?比如,有人看到老朋友突然变道到机动车道怎么办?很多仿真数据是人建立的,在这种情况下,人的认知的上限就是仿真数据的上限。 相比于过往的任何一次技术革命,AI给每个人带来的影响都更深远持久。之前的技术浪潮只是提升效率,但在不同场景的复用性没那么强,从来没有一个技术能替代每一个人。所以技术推广面临的问题不只是来自技术本身,也不只来自商业,还来自文化传统、监管、以及社会公平正义的要求。 我对AGI的到来有信心,但现阶段多数人还是在赌 说回AI应用,说白了,人类基本就两个需求嘛,一种是save time,一种是kill time。save time就是生产力工具,帮你完成绩效,帮你写个文档,帮你画个PPT。kill time就是陪伴工具,娱乐休闲谈恋爱。 有的创业者试图在二者之间做一个嫁接,比如,在同一个平台上,这边让你用AI生产一个东西,那边再给你搭建一个社区,让你把生产出来的内容发进去,大家一起讨论。但我不是特别理解这个逻辑。无论是效率工具,还是娱乐工具,本质上都是用户直接跟AI互动。我觉得很难在这个平台上交流怎么一起玩AI,这一点都不AI原生。非要我跟你到一个新的平台上聊,我们各自是怎么玩AI的,那我为什么不跟你加个微信聊呢? 现在大家都还在拿移动互联网的思路来做AI的产品,当然这也是因为技术的局限,大家还想象不出来一个AI原生的东西是什么样的。AI帮你写东西,帮你画PPT,都只是把人给替代掉了。AI搜索,也只不过是改变了检索排列和归纳信息的方式,但搜索这个东西早就有了。 我还是在等待一个奇点时刻,当AI从本质上改变了生产关系,能创造出人与人之间、人与物之间交互的全新模式,在这个模式里真得离开AI都玩不转。什么事是离开AI做不了的?一个是技术上实现不了,一个是离开AI的话,这个生意就实现不了。 比如说,AI能够帮一个模式从不成立到成立,我原来用人来做这件事情没有办法形成正向现金流,这个时候我把人替代掉换成AI,现金流变正了。这是一个质变对吧?就是所谓的改变了生产关系。我在等待和寻找这样的东西。 从这个角度来看,现在的项目确实都长得很像,看不出什么区别。你会发现用AI做PPT的,都是先在数据库里放了一堆的PPT模板,然后用AI来写文字,再把文字填充到模板里,再稍微调一下字体。其实从技术实现上来说很简单,壁垒可能就是你原来写的文字有多好,摆放文字的位置合不合理。 从商业上考虑,我再讲另外一件事。在印度,洗衣机是很稀有的家用电器,因为印度用人洗衣服比用机器洗衣服更便宜。所以这背后还是一个商业问题。我知道洗衣机很省人力,而且洗得更干净,但是我用人来洗比用机器来洗更便宜,哪怕慢一点。类似地,在我们国家,如果开启一些业务也比在美国更难,因为美国的人工成本太高了。就拿打车来说,美国打车老贵了,所以这个时候换成打那些无人驾驶的、不用给小费的、以及有补贴的车能省很多。卡车也一样,司机一年工资老高了,把人力省掉以后,利润率暴涨,所以无人卡车这个场景在美国的商业空间也很大。 再看国内,2016、2017年左右的时候,做卡车无人驾驶的图森未来就已经拿了很多融资,但后面出了一堆鸡毛蒜皮的事情。架不住国内人力成本不算太高,所以你打一个真人开的车跟打一个自动驾驶的车,价格没差多少。 所以,我对AGI的到来是有信心的,我对AI会带来很多的商业机会也是有信心的。但现阶段我看到的让我感觉多数人都还只是在赌。当然也有逻辑很顺的场景,比如AI coding,海外的cursor,国内字节的Trae,基本上已经可以满足很多人对写代码的需求,只是独创性的部分还是需要人来实现。 其实创业者都很有激情,很有理想,但还是那个鸡和蛋的问题。技术就这个水平,你看不到他能做更多的事情,所以就只能先做水平以下的产品,产品就不能由量变引起质变。原来的模式没有受到冲击,新入场者就分不到市场上的那杯羹,就只能靠投资人的钱活着。所以说去年AI投资一下子缩水这么多,大家好像不敢再这么下注了,你这什么时候才能有回报呢? 当然,具体到项目上,我们除了看团队看创始人,看这个技术有没有壁垒,产品上有没有一些独到的东西,也看其他投资人有没有关注。别人投了,哪怕我看不懂,应该也是个有价值的东西对吧? 为什么Agent无法大规模应用 现在的共识是,Manus和复刻Manus的产品,还在一个小白装机的阶段。因为它们只是把各个东西拼凑起来,算力的消耗并不是最经济的路径,任务完成的效果也未见得满足人的期待。重点是,它们形成了一个富有启发性的新范式——我们可以围绕这么一个核心的技术这样来操作,也许未来就会有更多人把它做得更好,做成一个可以卖钱的台式主机。 Manus也再次印证了一个AI时代的原则,人们都喜欢白盒。当DeepSeek的R1把思维链展示出来的时候,用户很激动,意识到原来AI是这么思考问题的。当Manus把规划工作的流程展示出来,也让用户觉得很新奇很有意思,而且增加了信任度。当电脑只是一个庞大的机器的时候,它是一个标准的to B商品。后来它走向寻常百姓家,还是因为有可视化的操作系统,用户还是想看到它里面到底在干嘛。 过去,我们把Agent理解成一个类似于插件的东西,比如说豆包里面,有各种AI翻译、AI学术和AI编程的工具。放在一个通用的模型里面,然后你自己主动或者是模型帮你去调动另外一种工具,完成特定的任务,之前对于Agent的认知是这样的。也是因为技术限制,Agent没有办法像今天一样做那么多事。 但今天Agent仍然面临很多技术以及技术之外的限制。我自己有时会幻想,会不会有一天Agent就像钢铁侠的助手小辣椒一样,本身独立存在,像个真正的得力助手。但是技术上能实现吗?能不能打通那么多的数据孤岛,获得那么多权限?就算可以,那有多少人愿意为这个付费? 首先是数据的问题。Manus声称他们是General Agent,你会发现它实现通用能力的方式是给它配个虚拟机,让它像人一样去开网页开视频,调用别的工具。比如说,你让它剪个视频,它其实不会剪,但让它给你打开一个能剪视频的网站,它就能帮你剪了。厉害的点在于,它能理解你的意图,并且找到对应的能用的工具。 我担心的地方是,万一之后这些地方就像是APP之间的数据孤岛一样,把你给屏蔽了,不让你用怎么办?不管是Agent还是AI应用,真正的价值在于垂类深耕。做得太浅了,没办法触动真正的付费意愿。那要深耕某一个领域,就涉及到数据收集和打通的问题。 比如说,医疗垂类Agent,要能帮你完成从线上诊疗到线下挂号到复诊的就医全流程,必须得打通上下游的数据体系。前述到这么多的数据,这么多的服务机构,这件事情很难办。事实上,你能拿到医院的病历数据就已经很难了。咱们现在老说数据不够用,或者数据用完了,前提是互联网上的高质量的公开数据。但更多的数据埋在水下,在各个公司的数据库里,这些都是私有数据,都是商业机密。 在这样的情况下,我不给你这个数据,你拿什么来训练模型?或者是就算你仿真出来一些数据,似乎是具备了某种能力,但真要用的时候还是调不出来。你不知道我的身份证号背后对应的是哪张社保卡,不知道对应的之前的病例都有哪些,不知道这次开药的时候要注意哪些过敏原。当然,国家也在发力打通数据。中央和各个地方最近都成立了数据集团,就是为了把零散的数据收集起来。 算力和成本也是大问题。执行任务的算力消耗和聊个天的算力消耗完全不能同日而语。一个任务可以拆解成几百步,每一步都需要思考和消耗算力,这个是几何量级的算力增加。一个现实的问题是,不是每个人都愿意为这个算力付费。一个员工要是干不好,我可以扣他工资,或者不给他发奖金。但是AI做不好,得是它做完了以后,你才知道它做不好,而且这时候钱已经花掉了。当你不是月结工资,而是每秒结工资的情况下,你肯定不敢给这个员工随便安排任务。你必须得让他做那些确保能做出来的东西,才能保证每一秒的工资都是有回报的。 相当于给你两个选择,A是你做完了再付费,B是边做边付费。这个时候多数客户会在二者之间做一个相对风险小的选择。宁愿上限低一些,也要保下限高一些。 在营销界有一个很重要的概念叫experiencing markting。很多店很多品牌在搞一些旗舰店和体验店,那些店里面没卖多少商品,人家就没打算让你在里面买东西,就是为了塑造一个品牌调性,让你在里面玩,让你体验感受一下原来拥有这个品牌是这种感觉。如果Agent真帮人把这些过程都替代掉,你确实能省很多时间,但是我也丧失了我的生命体验。 再来问一个问题,万一Agent出错了怎么办?以采购为例,你让Agent去采购一个公司需要的零件,零件的编号都特别长,特别细。万一有一个字母或者一个数字出错,完了,它给买成另一个型号了,或者在后面多加一个0之类的,那就是巨大的错误。这种情况下,谁来背责任?Agent公司吗? 反正我认可Agent的前景,但对于它为什么现阶段无法大规模应用有一些自己的思考,不仅仅是从技术的角度出发,而是更多从商业上,或者从社会文化的角度出发。假如我是一个自己要去做这个事的人,我需要这个专属体验,或者说我花不起这个钱。如果我是一个老板的话,我雇佣一个真的人来干某件事,也不仅仅是因为我需要这个人的专业知识,而是也许需要有个人来帮我背锅。 很多人开玩笑说会计是最难被AI取代的东西,因为AI没法背锅。不妨换一个更正面的例子,我招聘一个人,不只是需要他来干活,也需要这个人来跟着公司一起共同成长。AI能背股权吗?AI能给你注资吗?但是你拉一个真人来公司干这个活,他或许真能给你带来钱和更宝贵的资源。有个理论叫六度空间,我跟世界上任何1个人之间都隔着不会超过6个人,AI能做到吗?所以在很大程度上,Agent能否普及不仅仅是有技术的趋势就足够。人是社会性的动物,这点导致Agent没有办法去实现更大的想象空间。 回到那个问题,Agent的投资是一个课题吗?首先,现在没有多少人做出真正值得投的Agent,Manus以及复刻Manus的东西,都没有什么技术壁垒。投资人就是关心壁垒的问题,担心我投了你,万一另外一家做起来了,我不就白投了。就像前面讲的,Manus的意义并不在于它这个产品本身,而在于它打开了一个想象力的空间。哪怕是套壳,但能在这个基础上再加一些独有的壁垒,也许它就能work,就是一个商业上能赚钱的东西。
理想创始人李想再度发声:不追特斯拉 FSD,自己的老师是 DeepSeek
今年 3 月,英伟达 2025 春季 GTC 大会,理想汽车自动驾驶技术研发负责人贾鹏在台上介绍了他们的最新成果:MindVLA 大模型。 这是一个拥有 22 亿参数的视觉-语言-动作(Vision-Language-Action Model,VLA)模型,贾鹏进一步介绍称,他们已经成功将该模型部署于车端。在理想看来,VLA 模型是解决 AI 与物理世界交互难题最有效的方法。 在过去的一年里,端到端架构成为智能驾驶领域的技术热点,推动车企从传统的分模块规则设计转向一体化系统。曾凭借规则算法领先的车企面临转型阵痛,而后发者则抓住了弯道超车的机会。 理想便是其中的代表。 理想去年在智能驾驶上的进步可谓飞快,7 月份就率先实现了全国无图 NOA(导航辅助驾驶),还推出了独特的「端到端(快系统)+VLM(慢系统)」架构,受到行业广泛关注。 今晚,随着理想 AI Talk 第二季进行,我们对李想口中的「人工智能公司」有了更深的了解。 是「司机大模型」,也是你的司机 理想汽车 CEO 李想第一次提到 VLA,是在去年 12 月的与腾讯新闻科技主笔张小珺对谈的 AI Talk 第一季上。当时他说: 我们在做的理想同学和自动驾驶,按照行业的标准其实是分割开的,处于早期阶段。我们做的 Mind GPT,其实是大语言模型;我们在做的自动驾驶,我们自己内部叫行为智能,但是像李飞飞(斯坦福终身教授、前 Google 首席科学家)的定义,叫空间智能。只有你真正大规模去做的时候,你才知道,这两个之间,有一天一定会连在一起,我们自己内部叫 VLA(Vision Language Action Model,视觉语言行动模型)。 李想认为,基座模型到一定时刻一定会变成 VLA。原因在于,语言模型只能通过语言和认知去理解三维的世界,这是显然不够的。「它需要真正向量的,用 Diffusion(扩散模型)的方式,用生成的方式(去认识世界)」。 可以说,VLA 的诞生,既是对语言智能和空间智能深度结合的一次大胆尝试,也是理想汽车对「智能汽车」概念的一次重新诠释。 李想在今晚的 AI Talk 中进一步定义:「VLA 是一个司机大模型,像人类的司机一样去工作。」它不仅是一项技术,更是一个能与用户自然沟通、自主决策的智能伙伴。 那么,VLA 究竟是什么?核心其实非常直白:通过整合视觉感知、自然语言理解和动作生成能力,让车辆变成一个能与人沟通、能自己做决定的「司机 Agent」。 ▲ 导航走 ETC 时,驾驶员可以直接命令系统走人工通道(辅助驾驶开启状态) 想象一下,你坐在车里,随口说一句「今天有点累,开慢点吧」,车辆不仅能听懂你的意思,还会调整速度,甚至选择一条更平稳的路线。这种自然流畅的交互,正是 VLA 想要实现的。李想透露,所有的短指令,都有由车端直接处理,复杂指令则交由云端 32 亿参数模型解析,确保高效与智能兼得。 实现这样的目标并不容易。VLA 的特别之处在于,它把视觉、语言和动作三个维度打通了。用户的一个简单指令背后,可能涉及到对周围环境的实时感知、对语言意图的精准理解,以及对驾驶行为的快速调整,三者缺一不可。 而 VLA 的厉害之处就在于,它能让这三者无缝协作。 从愿景到现实,VLA 的研发是一片无人区。李想坦言:「视觉和动作数据的获取最为困难,没有公司能替代。」 要理解 VLA 的技术底色,还得看看理想汽车在智能驾驶上的演进脉络。 李想表示,早期的系统是「昆虫级别」智能,仅有百万参数,靠规则和高精地图驱动,遇到复杂路况就束手无策。后来,端到端架构和视觉-语言模型让技术跃升至「哺乳动物级别」,摆脱地图依赖,全国无图 NOA 成为现实。 实际上,这一步已经让理想汽车走在了行业前列,但他们显然不满足于此。在李想看来,VLA 的出现,标志着理想汽车的智能驾驶技术迈入了「人类智能」的新阶段。 相比之前的系统,VLA 不仅能感知 3D 物理世界,还能进行逻辑推理,甚至生成接近人类水平的驾驶行为。 举个简单的例子,假设你在一条拥堵的街道上说「找个地方掉头」,VLA 不会机械地执行指令,而是会综合路况、车流和交通规则,找到一个最合理的时间和位置完成掉头。 李想表示,VLA 能通过生成数据快速适应新场景,哪怕初次遇到复杂修路,三天内也能优化应对。这种灵活性和判断力,正是 VLA 的核心优势。 理想的老师,是 DeepSeek 支撑 VLA 的,是理想汽车自研的一套复杂而精妙的技术体系。这套体系让汽车不仅能「看懂」世界,还能像人类司机一样思考和行动。 首先是 3D 高斯表征技术,即用很多个「高斯点」来拼出一个 3D 物体,每个点都含有自己的位置、颜色和大小等信息。这项技术通过自监督学习,利用海量真实数据训练出一个强大的 3D 空间理解模型。有了它,VLA 就能像人一样「看懂」周围的世界,知道哪里是障碍物,哪里是可通行区域。 ▲当记忆车位被占,系统会自动寻找其他车位。还能听懂驾驶员指令,通过墙上的指示牌找到「C3 区」 接着是混合专家架构(MoE),该架构由专家网络、门控网络和组合器组成。当模型参数超过千亿级别时,传统方法会让所有神经元参与每个计算,比较浪费资源,MoE 架构中的门控网络会根据任务的不同调用不同的专家,保证激活参数不会大幅增加。 聊到这里,李想还顺带夸了一下 DeepSeek: DeepSeek 运用了人类的最佳实践…… 他们在做 DeepSeek V3 的时候,其实 V3 也是一个 MoE 的,671B 的一个模型。我觉得 MoE 是个非常好的架构。它相当于把一堆专家组合在一起,然后每一个是一个专家能力。 最后,理想为 VLA 引入了稀疏注意力机制(Sparse Attention) ,说人话就是 VLA 会自动调整关键区域的注意力权重,从而提升端侧的推理效率。 李想表示,在这个新的基座模型训练过程中,理想的工程师们花了很多时间去找到最佳的数据配比,融入了大量 3D 数据和自动驾驶相关的图文数据,并减少了文史类数据的比例。 从感知到决策,VLA 借鉴了人类思维的快慢结合模式。它既能快速输出简单的动作决策,比如紧急避让,也能通过短思维链进行「慢思考」,应对更复杂的场景,比如临时规划一条绕开施工区域的路线。为了进一步提升实时性,VLA 还引入了投机推理和并行解码技术,充分利用车端芯片的算力,确保决策过程快而不乱。 在生成驾驶行为时,VLA 用到了 Diffusion 模型和基于人类反馈的强化学习(RLHF)。Diffusion 模型负责生成优化的驾驶轨迹,而 RLHF 则让这些轨迹更贴近人类习惯,既安全又舒适。比如,VLA 会在转弯时自动减速,或者在并线时留出足够的安全距离,这些细节都体现了对人类驾驶行为的深度学习。 世界模型是另一关键技术,理想通过场景重建和生成,为强化学习提供了高质量的虚拟环境。李想透露,世界模型将验证成本从每万公里 17-18 万元降至 4000 元。它让 VLA 在模拟中不断优化,应对复杂场景如履平地。 说到训练,VLA 的成长过程也颇有章法。整个流程分为三个阶段:预训练、后训练和强化学习。「预训练像学习知识,后训练像驾校学车,强化学习像社会实践。」李想说。 预训练阶段,理想汽车为 VLA 打造了一个视觉-语言基座模型,塞进了丰富的 3D 视觉数据、2D 高清影像和驾驶相关的语料,让它先学会「看」和「听」;后训练加入动作模块,生成 4-8 秒驾驶轨迹,模型从 3.2 亿参数蒸馏到 4 亿。 强化学习分为两步:先用 RLHF 对齐人类习惯,分析接管数据,确保安全舒适;再用纯强化学习优化,基于 G 值(舒适性)、碰撞和交通规则反馈,让 VLA「开得比人类更好」。李想提到,这一阶段在世界模型中完成,模拟真实交通场景,效率远超传统验证。 这样的训练方式,既保证了技术上的先进性,也让 VLA 在实际应用中足够可靠。 李想坦言,VLA 的成功离不开行业标杆的启发。DeepSeek 的 MoE 架构不仅提升了训练效率,还为理想提供了宝贵经验。他感慨:「我们站在巨人的肩膀上,加速了 VLA 的研发。」这种开放学习的态度,让理想在无人区中走得更远。 从「信息工具」到「生产工具」 当下,AI 行业正经历一场从「信息工具」到「生产工具」的深刻变革。随着大模型技术的成熟,AI 不再局限于处理数据和提供建议,而是开始具备自主决策和执行任务的能力。 李想在 AI Talk 第二季中提出,AI 可分为信息工具(如搜索)、辅助工具(如语音导航)和生产工具。他强调:「人工智能变成生产工具,才是真正爆发的时刻。」随着大模型技术成熟,AI 不再局限于处理数据,而是开始具备自主决策和执行任务的能力。 这种趋势,在「具身智能」概念中体现得尤为明显——AI 系统被赋予物理实体,能够感知、理解并与环境互动。 理想汽车的 VLA 模型正是这一趋势的生动实践。它通过整合视觉、语言和动作智能,将汽车打造成一个能够自主驾驶、与用户自然交互的智能体,完美诠释了「具身智能」的核心理念。 只要人类会雇佣专业司机,人工智能就能成为生产工具。当 AI 成为生产工具时,人工智能才会真正爆发。 李想的这段话,点明了 VLA 的核心价值——它不再是简单的辅助工具,而是能够独立执行任务、承担责任的「司机 Agent」。这种转变,不仅提升了汽车的实用价值,也为 AI 在其他领域的应用打开了想象空间。 李想对 AI 的思考,总是带着一种跳出框框的视角。他还提到:「VLA 不是突变的过程,是进化的过程。」这句话精准概括了理想汽车的技术路径—— 从早期的规则驱动,到端到端的突破,再到如今 VLA 的「人类智能」水平。这种进化思维,不仅让 VLA 在技术上更具可行性,也为行业提供了可借鉴的范式。相比一些一味追求颠覆的尝试,理想的务实路径或许更适合复杂的中国市场。 从技术到信念,理想的 AI 探索并非坦途。李想坦言:「我们在 AI 领域经历了很多挑战,就像黎明前的黑暗,但我们相信,坚持下去就会看到光。」VLA 的研发面临算力瓶颈、数据伦理等难题,但理想通过自研基座模型和世界模型,逐步迎来了属于他们的技术曙光。 李想在采访中还提到,VLA 的成功离不开中国 AI 的崛起。 他表示,DeepSeek、通义千问等模型的出现让中国 AI 水平迅速接近美国。其中,DeepSeek 所秉持的开源精神尤为令人振奋,它直接直接促使理想开源星环 OS。李想称:「这不是出于公司战略考量,DeepSeek 给我们那么大帮助,我们应该为社会贡献点什么。」 在追求技术突破的同时,理想汽车并未忽视 AI 技术的安全性和伦理问题。VLA 引入的「超级对齐」技术,通过基于人类反馈的强化学习(RLHF),让模型的行为更贴近人类习惯。数据显示,VLA 的应用使高速 MPI(平均干预里程)从 240km 提升至 300km。 更重要的是,理想汽车强调打造「有人类价值观的 AI」,将道德和信任视为技术发展的基石。从更宏观的视角看,VLA 的意义还在于,它重新定义了车企这一角色。 过去,汽车是工业时代的交通工具;如今,它正在演变为人工智能时代的「空间机器人」。李想在 AI Talk 中提到:「理想以前走的是汽车的无人区,以后走的是人工智能的无人区。」理想的这种转变,为汽车行业的商业模式带来了新的想象空间。 当然,VLA 的发展并非没有挑战。算力的持续投入、数据伦理以及消费者对自动驾驶的信任建立,都是理想汽车需要面对的课题。此外,AI 行业的竞争日趋激烈,国内外巨头如特斯拉、Waymo 和 OpenAI 都在加速布局多模态模型,理想需要在技术迭代和市场推广上保持领先。「我们没有捷径,只能深耕。」李想说。 毫无疑问,VLA 的落地将是关键节点。 理想汽车计划在 2025 年 7 月与纯电 SUV 理想 i8 同步发布 VLA,并在 2026 年实现量产。这不仅是对技术的一次全面检验,更是市场的一块重要试金石。
扎克伯格深度专访:怼苹果,夸DeepSeek,聊AI开源痛点
编译 | 金碧辉 编辑 | 程茜 智东西5月7日消息,据Stratechery报道,4月28日下午,社交媒体平台Stratechery的创始人、记者本・汤普森(Ben Thompson)在Meta总部对Meta的创始人、董事会主席兼CEO马克・扎克伯格(Mark Zuckerberg)进行了专访。 从访谈中得知Meta在AI领域的布局以开源大语言模型Llama为核心,实现了生成文本、数学推理、代码生成等能力的跃升,其关键创新在于仅使用公开数据集训练,并通过1.4万亿tokens的数据量弥补参数规模的不足。这种“小模型大智慧”的技术路径,印证了扎克伯格“效率优先”的AI哲学。 这是继2021年10月和2022年10月之后,Stratechery对扎克伯格的又一次访谈。访谈前,Stratechery已了解了LlamaCon(Meta的新开发者大会)的部分公告,并体验了新的Meta AI应用。 Stratechery在体验Meta AI应用后,扎克伯格透露了这个新应用的更多细节,Meta AI已实现月活跃用户近10亿,成为全球用户规模最大的AI助手之一。其核心功能包括自然语言交互(支持语音对话和文字输入)、多模态内容生成(如通过文本描述创建3D虚拟场景、生成广告素材),以及个性化推荐系统(根据用户行为优化信息流和社交匹配)。 此外,Meta在AR/VR领域的布局(如Orion AR眼镜)与AI结合,探索元宇宙内容生成和智能交互场景,计划通过眼镜设备实现AI助手与用户的全天候无缝互动。 ▲Meta的创始人、董事会主席兼CEO马克・扎克伯格 以下是主持人与扎克伯格访谈全程内容的编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改): 一、元宇宙概念持续推进,LlamaCon因开源模型需求诞生 主持人:马克・扎克伯格,欢迎回到Stratechery。 扎克伯格:谢谢邀请。 支持人:此次采访的契机是Meta新推出的开发者大会。不过在深入这个话题前,我想先回顾下历年开发者大会的历史。例如2007年至2019年的F8大会(这期间停办过几年),还有很多重要发布,包括最初的Facebook平台、开放图谱(Open Graph)、Parse平台等。按最初愿景衡量,这些项目如今要么已终止,要么被大幅收缩。 扎克伯格:这倒是个不错的开场话题。 主持人:这对您来说是种遗憾,还是说这可以看作是吸取教训?您如何看待这段历史? 扎克伯格:不。你看,最初的Facebook平台本质上是一个基于网页的产物,属于移动时代之前的产物。当用户行为从桌面网页转向移动端时,苹果公司直接表态不允许在一个已有的平台上再构建一个具有独立平台功能的生态系统,也不允许应用调用你们的服务。 因此,这套体系曾是我们业务的重要部分,2012年IPO时,游戏和应用贡献了约20%的收入,但现在基本失去了发展前景。于是我们围绕Connect(社交互联)和应用登录(Sign In)等功能尝试了不同版本。 主持人:但有一个很有说服力的观点,我在2013年就提出过,这对你们来说是件好事,它迫使你们蜕变成今天的模样。 扎克伯格:或许我认为我们本可以既达到现在的成就,还能实现更多。回想起来,我们本有机会在应用中构建各种差异化体验。 主持人:是的,至今仍在坚持的功能中,Facebook提供的一种第三方登录功能,允许用户通过Facebook账号快速登录其他应用或服务,而无需单独注册新账号的功能仍然是个典型案例。 扎克伯格:没错,这与开发者希望通过社交网络获取应用安装量等诉求存在关联。但如今其价值已大幅稀释,我认为这本质上是苹果政策催生的产物。 不仅在此领域,他们在多个层面持续宣称“你们没办法开发出那些我们认为有价值的功能”,这种限制性政策导致了我们两家公司间的深层矛盾,我认为这种局面令人遗憾,本应存在更开放的移动生态。 我们只是被告知不可为,现在回顾来看,很难相信这些限制为我们服务的用户或开发者创造了价值。 主持人:对了,你们还有Meta Connect大会。元宇宙概念是否仍在推进? 扎克伯格:当然,毋庸置疑。我们希望通过完整活动来展示所有规划的VR/AR愿景。 主持人:是的,这个方向清晰明确,显然是很完美的一次布局。如今这个全新的开发者大会LlamaCon进展如何? 扎克伯格:二者定位不同。聚焦AR/VR的Connect大会吸引特定类型的开发者与兴趣群体,当然未来所有事物都将融入AI元素。 比如雷朋Meta智能眼镜本质是AI设备,但属于特定产品形态。对于专注Llama模型开发的群体,我们认为有必要打造专属活动,因此诞生了LlamaCon。 回顾F8开发者大会与平台发展史颇具启示。Llama的核心特质在于开源属性,而我们坚信构建开放平台的部分动因,源于移动生态历史遗留问题。 从我们的视角看,那些强加于开发者的诸多限制显得相当武断,这正是开发者渴求开源模型的深层原因之一。尽管从某些方面看,直接调用OpenAI或Anthropic等公司的API接口更为便捷,但必须面对其潜在风险,这些服务商可能随时变更接口规范导致应用功能突变,可对你发起的查询进行内容审查。 若其不认可你的请求即可单方面拒绝响应,且模型自定义空间极为有限。开源生态恰好能打破这些限制,而过往封闭平台带来的“切肤之痛”,使我们对此的认知愈发深刻,也促使我们更坚定地投入开源建设。 现在这个领域已经不光是Llama一家独大,像DeepSeek这些AI模型也做得风生水起。我早就说过,到2025年,大家做开发主要都会用开源模型,现在看来这个预测越来越准了。说的通俗易懂一点,这就是我们整个公司战略最根本的出发点。 主持人:有个新动态,虽然您之前和我沟通时强调这不算大动作,但我觉得外界未必这么看,Llama API究竟是什么? 扎克伯格:我倒不觉得这是小动作。准确地说,这并不是我们打算重点经营的商业项目。 扎克伯格:大家看到付费API上线,第一反应肯定是商业变现。但根据我们收到的反馈,开发者热爱开源的核心原因正如之前所说的那样,他们渴望掌控权、能自由定制、不会被突然断供、使用方式不受限,还能降低成本。这些都是开源的核心价值。但开源模式一直有个痛点… 主持人:其实没人真想自己搭服务器维护。 扎克伯格:是因为托管起来很麻烦,对吧?没错。开源模型的缺点就在于,相比之下,直接调用一些成熟服务的API要简单得多。 当然,现在有很多公司以托管不同的模型为业务,其中也包括开源模型,而且我觉得,有些公司在这方面做得比其他公司要好。最近我们发布了Llama 4模型,我认为我们在发布过程中学到了很多东西。 但我觉得有一点做得不太好,就是我们发布了这个模型之后,很多API供应商在实践的过程中出现了一堆漏洞,所以很多人在对Llama 4进行首次测试时,用的就是这些存在实现问题的外部API供应商。 主持人:不过那都是最近发生的事了,你们当时那么快就决定“不,我们需要在这里提供一个参考API”了吗? 扎克伯格:不,我刚才举那个例子只是为了说明问题。但其实早在Llama 3的时候,你就能在网上看到很多人在讨论:“好吧,我想要一个能提供405B未量化版本的API供应商。我很难判断不同的API供应商采用了哪种量化方式或者走了什么捷径,质量参差不齐,我们就想要一个可靠的来源。” 所以我觉得,拥有一个广泛的API供应商生态系统是件好事,而且很多供应商都做了非常有趣的事情,比如Groq公司。他们通过垂直整合,定制芯片来实现低延迟,这真的很有吸引力。 主持人:你这里说的是芯片公司Groq,而不是AI模型Grok,对吧? 扎克伯格:是的,Grok也很有意思,那是xAI公司创始人兼CEO埃隆・马斯克(Elon Musk)的项目,但我现在说的是芯片公司Groq。 如今,他们的业务是制造芯片,构建一个垂直整合的服务体系,提供超低延迟的API,真的很酷。我觉得有这样能够使用开源模型的公司存在于一个生态系统中是很棒的。 二、AI领域的资源分配,优先支持核心业务,API业务处于次要位置 主持人:也许我应该在你几分钟前提问的时候就给出主题句,Llama API的目标是为行业提供一个参考实现。我们并不是想围绕这个API建立一个庞大的业务,我们基本上就是想做一个非常简单、基础的API,让人们知道这就是我们想要构建的模型,而且它是可行的。你可以直接把你之前调用OpenAI API或者其他API的部分,替换成调用我们这个API的网址,它就能正常工作。而且我们不会大幅加价,基本上就是按照我们的资金成本来提供这个API。如果不加价太多的话,这听起来可能会发展成一项相当大的业务呢。 扎克伯格:但对我们来说,它不会带来很高的利润。 主持人:是的,我知道。你说“就这么个小业务,我们不会收很多钱”,但我不确定这两者是否一致。如果你收费不高的话,为什么大家不都用你们的API,而要去用其他云服务提供商的呢? 扎克伯格:理论上来说,其他把托管模型作为核心业务的公司,应该能提供更有趣、更有价值的服务。比如我们刚才提到的Groq公司,他们通过定制芯片来做特定延迟优化的推理计算,就是很有特色的例子。 主持人:没错。但比如很多人在亚马逊云服务上使用Llama模型。 扎克伯格:对的。亚马逊云服务的优势很明显。如果你是他们的客户,他们本身就有一整套广泛的服务,能满足你不同场景的需求。 主持人:所以如果有人刚开发一款应用,还没有锁定任何云服务,Llama API会是最简单、最便宜的解决方案吗? 扎克伯格:没错。当你刚开始想用Llama 4模型,想找一个能稳定运行的靠谱入门选择时,直接用我们的API就行,它肯定能正常工作。等你后续需要扩大使用规模时,可能会根据自己的需求调整,比如选择自己搭建服务器运行模型,或者用其他更适合的工具。 但关键是,整个开源技术圈需要有一个像我们这样简单好用的“标准版本”,让大家能轻松起步,这对推动技术发展很重要。 主持人:如果某个用户通过你们的API把业务做得很大,你们会不会对他们说“你现在规模太大了,得换个地方,不能继续用我们的服务了?” 扎克伯格:目前还不确定,我们还没深入想过这个问题。 主持人:待定? 扎克伯格:对,确实还没仔细规划过。其实我们内部也在想,为什么我们之前没把API作为一项业务来做。 主持人:这正是我接下来的问题,为什么Meta整体上没有发展云业务,特别是考虑到你们需要从Llama的训练成本中获取回报,毕竟花了这么多钱训练模型,需要通过更多方式盈利。 扎克伯格:对,这里有个很有意思的业务逻辑。对我们来说,把新增的GPU资源分配到内容推荐或广告优化上,总能获得更高的边际收益。我一直为Meta没有提供API服务而辩护,我觉得这是有其合理性的。 主持人:我完全认同,之前就是这个观点。 扎克伯格:没错。所以现在我们认为,Llama的成长本身有价值,而提供参考实现的API能推动它的成长。我们觉得这个东西有存在的必要,但从经济角度看,我不认为它会成为核心业务。 如果未来它真的消耗大量算力资源,而且能盈利,那当然好,我们可以同时做好推荐系统和API业务。 主持人:现在确实存在机会成本的问题。 扎克伯格:说实话,我们根本没法完全算准到底需要多少算力资源,其实我们内部一直在纠结是把更多算力留给Meta公司旗下的Instagram Reels团队优化视频推荐,还是分给其他团队搞新项目。 目前来看,API业务在我们的优先事项里排得比较靠后,因为像内容推荐这种核心业务更需要算力资源。不过,我们有超大规模的数据中心,算力资源很充足。所以拿出一小部分来做这个“标准版本”的API,让大家能轻松上手用开源AI,其实是件划算的事。这就是我们的整体考虑。如果真有用户规模做得非常大,我们可能会再协商具体方案。 主持人:如果有第三方开发者靠你们的API把业务做得特别大,作为平台方的你们是否要求其进行业务调整呢? 扎克伯格:到时候再看。 主持人:船到桥头自然直? 扎克伯格:一般来说,在这个行业里,用户能做大做强是好事。 主持人:当然,这算是个幸福的烦恼。不过回到成本问题,你刚才提到的担忧,也是我关心的,就是模型推理的成本。这些算力资源你可以留给自己用,也可以给外部用户,确实需要权衡。还有个疑问,你们花了几十亿训练模型,怎么才能让这些钱花得更值、回报更高呢?很多投资者觉得你们做API业务能赚钱,估计也是冲着这个来的。另外听说好多公司用Llama模型尝到了甜头,他们是不是该多分担点训练成本呢?你们有没有打算找他们合作,会有公司愿意一起掏钱吗? 扎克伯格:我们和一些公司聊过,但目前还没谈成。随着训练成本持续上升,未来可能会有变化,但现在实际情况是,市场上反而有很多公司开始自己研发模型。 原本我以为一些公司会加入Llama的开源生态,通过标准化来降低成本,结果他们反而纷纷开始自行研发模型。所以未来如何还不好说。但我猜测,未来几年内,模型训练可能需要千兆瓦级的算力集群,行业应该会出现整合。 主持人:总会有公司选择退出吧。 扎克伯格:不一定。你看,我们做财务规划时,是假设自己承担全部训练成本的。如果未来能和其他公司分摊,那是额外的好处,但我们并不依赖这一点。 我觉得这对我们来说反而是个优势。如果你需要,我可以详细解释一下背后的商业逻辑。 三、布局四大业务方向,广告优化、用户参与度提升、商业消息服务、AI原生业务 主持人:我确实想聊聊你们的整体开源策略。一方面,作为行业的观察者,我非常感谢你们的开源举措,你们通过技术开放策略,系统性消除了阻碍AI大规模应用的非理性障碍,加速了实用化进程。另一方面,包括Meta在内的大公司,一直是开源领域的主要贡献者。你曾把Llama比作“开放计算项目”(Open Compute Project),在那个项目中,全球数据中心采用你们的标准,硬件制造商按标准生产,最终都为你们的盈利助力。而你们并不是数据中心提供商,这些都是额外的收益。所以对于Llama,我的问题是开源带来的经济回报是什么?尤其是当你们考虑“或许我们确实需要对模型进行自有适配”时,这仅仅是品牌建设吗?还是说研究人员喜欢开源模式?特别是经济层面的回报。 扎克伯格:开源其实是构建模型之后的决策,对吧?我们不是为了开源而开发Llama,而是因为我们相信,要构建自己想要的服务就必须先拥有这样的模型。 主持人:我接下来的问题是你是打算始终站在技术前沿吗?还是可能落后一段时间? 扎克伯格:从长远来看,我们必须保持技术领先。我们注意到行业里有几个新变化,现在各个公司开始各有专长,有的专注于某个领域,有的主攻特定方向,而我们的业务场景和需求跟别人不太一样。以我们的业务规模来说,开发真正符合自己需求的模型是很自然的事。 主持人:哪些具体场景对你们来说最重要。 扎克伯格:这可能会稍微偏离我刚才的回答。我们现在主要盯着四个业务方向,从最容易落地的到需要长期投入的都有。最基础的一个,就是用AI把广告业务做得更高效。通过优化推荐技术,以后任何想达到业务目标的企业,只要找到我们就行。不用自己制作广告内容,也不用费心研究客户是谁。 他们只需要说“我想要达到这样的效果,愿意花这么多钱,现在绑定银行账户,你们每帮我达成一个目标,我就付一次费。”对吧? 主持人:这简直是史上最强“黑箱”系统。 扎克伯格:对,这就好比一个全能的商业助手。把广告业务拆开来看,包括做广告内容、想创意点子、锁定目标客户和评估广告效果。 我们最早搭建的是评估效果的系统,现在整个业务都是围绕“帮客户实现实际的业务目标”来开展,而不只是看广告被多少人看到。 主持人:按效果付费。 扎克伯格:对,接下来是基础的目标客户定位。过去5到10年,我们基本已经说服企业不要刻意限定目标人群范围。以前企业会跟我们说“我们想接触某个地方18到24岁的女性用户。”我们会回应:“没问题,你可以告诉我们你的需求。” 主持人:没错,但我们保证能以更低成本找到更多潜在客户。 扎克伯格:如果他们坚持限制范围,我们也提供这个选项。但总体而言,我们相信自己比企业更擅长找到真正会对产品产生共鸣的人群,这就是目标定位的部分。 但还有创意内容的部分,企业找到我们时,往往只有模糊的信息,比如想传达什么信息、需要什么视频或图片,而制作这些内容非常困难。不过我认为我们已经接近突破了。 主持人:企业制作的内容越多越好,因为可以测试哪种效果更好,但如果能无限生成内容呢? 扎克伯格:对,或者我们直接帮他们生成。当然,企业永远可以提供自己的创意建议,尤其是当他们想精准调整时。但总体趋势是企业找到我们,告知目标,连接银行账户,不需要准备创意素材、设定目标人群或自行衡量效果,只需要读取我们输出的结果即可。 我猜这将是颠覆性的,可能会重新定义广告行业的范畴。如今广告占GDP的比例可能会大幅提升,因为传统广告受限于“买广告牌或投电视广告”的模式…… 主持人:没错。我记得传统广告占GDP的比例一直是1%或2%,但数字广告已经提升了这个比例。 扎克伯格:确实在增长,但如果未来出现显著增长,我也不会感到意外。 主持人:我完全同意你的看法,你这是在跟本来就认同的人聊这些,大家确实都该接受这个高效的“黑箱”模式。我举双手赞成,那第二个业务机会是什么? 扎克伯格:第二个机会主要是提升用户在消费者平台上的参与度和推荐效果。首先是更精准地为用户展示现有内容,Instagram Reels就在做这件事。接下来,AI不仅会推荐内容,还会帮助用户创作内容,甚至直接生成内容。 你可以把我们的产品发展分为两个主要阶段。第一阶段是用户主要和朋友分享内容、获取信息;现在我们进入了第二阶段,叠加了“创作者内容”层,朋友和关注者的内容依然存在,但我们新增了大量推荐的创作者内容。 我觉得接下来会进入第三个阶段,AI生成的内容会迎来大爆发。创作者做的内容和朋友分享的东西不会消失,但AI根据每个人喜好生成的个性化内容会越来越多,甚至呈爆发式增长。 从大的趋势来看,随着我们走向通用人工智能(AGI)时代,生产力会大幅提高,而人类过去一百年来的趋势也会延续下去。工作时间越来越少,花在娱乐和文化上的时间越来越多。 所以像信息流这种内容平台,以后会占据用户更多时间。而AI在生成内容和精准推荐上的能力越强,这个机会就越大,这就是我们第二个业务机会的关键所在。在进入第三个机会前,我先回答你刚才的问题。 主持人:如果你是创作者,拥有受众是合理的,但如果是普通用户想社交,那该怎么办? 扎克伯格:说实话,普通用户根本不想让内容走红。我的意思是,人们希望真实地分享,而小群体场景让人更愿意分享。现代社交的形态是消息应用的结构更适合这一点,因为你不再只有一个分享群体,而是有各种群聊和一对一聊天。比如我可以和家人分享一些内容,和一起运动的朋友分享另一些内容。 主持人:当年你担心谷歌的社交圈产品(Google Circles),但最终你们通过消息业务实现了类似的目标。 扎克伯格:最后我们是通过消息聊天功能(比如微信这种)实现了这种社交模式,而不是靠朋友圈/动态页那种信息流。要是你还想接着聊这个…… 四、Meta推出独立AI应用,构建专属AI模型 主持人:是的,我想继续。我想聊聊Meta AI,但在我看来还有两个潜在的支柱(或可能成为支柱的方向)。我们之前提到过元宇宙,我认为生成式AI将成为元宇宙的关键。因为即使是屏幕上的游戏,我们在“游戏资产”(如角色、场景等)的创造上也遇到了瓶颈,比如制作成本太高,而生成式AI能解决这个问题。还有一点,用户在这些应用中的体验场景就像一块完整的画布,每一个“像素”都可能被“变现”。比如看到一个网红,她身上的每一件物品都能被识别、标注,链接到对应的商品,只要品牌方注册了相关服务。我觉得你们就像“消费者领域的微软”。微软之所以能持续成功,是因为他们掌握了分发渠道,连接了所有人,而你们拥有类似的“数字分发网络”。正如你所说,未来人们空闲时间更多,花在这些应用上的时间更长,变现方式多种多样。既然如此,为什么还需要专门做一个Meta AI和独立应用呢? 扎克伯格:刚才咱们聊的四个主要赚钱方向,第一个是优化广告体验,第二个是让用户更喜欢用我们的产品,第三个是把消息类应用打造成能赚钱的商业平台,第四个就是专门靠AI驱动的新业务。我重点提Meta AI,因为它现在是这一块最大的产品,每月有10亿人在用。 主持人:你们还有一个新应用。 扎克伯格:现在每月10亿用户分布在我们的全家桶应用里,但我们也推出了独立的Meta AI应用,给有需要的用户使用,它还包括在元宇宙里生成内容等纯AI驱动的功能。我们做财务规划时,并不需要这四个业务全部成功才能盈利,只要两三个方向大获成功,即使算上高昂的模型训练成本,我们也会处于很好的状态。 但关键在于,要在每个领域做出世界级的成果,就需要构建训练专属模型,让它具备实现每个业务目标的能力。根据我以往的经验,企业必须能掌控从底层到顶层的整个技术栈。Meta是一家“全栈公司”,我们一直自己搭建基础设施、AI系统和产品。 目前,每月有10亿用户通过我们旗下的社交应用(如Instagram等)使用Meta AI功能,同时我们也推出了独立的Meta AI应用,方便用户专注体验AI服务。这个应用还支持在元宇宙中生成虚拟内容,比如用文字描述直接创建3D场景或虚拟角色。 在财务规划上,我们并不要求四个核心业务方向全部成功才能盈利。只要其中两到三个方向(例如广告体验优化、商业消息服务、元宇宙内容生成或AI原生服务)实现突破,即使算上高昂的模型训练成本,公司也能保持良好的财务状况。这就像投资组合,分散风险的同时抓住关键增长点。 主持人:我觉得你们自己研发AI模型(比如Llama)的做法挺对的。但问题是,Llama作为开源项目太火了,现在你们办Llama开发者大会,很多开发者会跑过来问“能不能让你们的模型实现某个功能?”但其实你们心里可能在想:“我们做这个模型主要是为了自家的业务(比如Instagram的广告和推荐功能),并不是专门为了满足外部开发者的需求。”对吧? 扎克伯格:我懂你的意思。长期来看,这确实是个有趣的平衡。我们首先是为了自己的业务需求开发模型,然后再开放给有需要的开发者。 比如Llama 4 Maverick模型,它根本不是为任何开源基准测试设计的。所以当人们使用时会觉得“效果不错”,但在某些基准测试中得分不高,不过这并不影响它是个高质量模型。 主持人:之前有个争议,说有些模型是专门为测试训练的,如果用对了模型,得分可能会很高。 扎克伯格:这其实挺有意思的。我们设计Llama 4时的一个核心目标,就是让它比其他模型更具可调控性,因为我们有不同的应用场景,比如Meta AI、正在开发的AI Studio,以及商业消息服务等。 我知道有团队曾通过调控让某个版本的Llama在LMArena(AI模型基准测试平台)上表现出色,因为它确实具备这种可调控性。但目前公开的版本完全没有针对LMArena做优化,所以得分是现在这个样子。 不过无论如何,这是个高质量模型。你提到的关键点没错,当我们为自身业务需求设计模型时,必然会忽略一些开源开发者关注的功能,但开源的魅力正在于此,其他人可以填补这些空白。开源是一个生态系统,而非单一供应商。我们承担了最困难的部分,比如耗资巨大的预训练过程,完成大量基础工作后开放模型,并搭建了参考实现API的基础设施,但我们不打算包揽所有环节。 这为其他公司创造了巨大机会,就像Linux系统催生了围绕它的众多项目,开发出各种功能、驱动程序和工具,以满足开发者的多样化需求,Llama生态也会走上同样的道路。 五、AI在朋友关系维护中具潜力,或能辅助用户记忆细节、规划社交活动 主持人:所以,我可以问这个AI:“为什么我看到这么多关于某个特定主题的视频呢?” 扎克伯格:是的。你可以问它关于你的事情,它会向你解释。我觉得作为一家公司,我们可能对人们的需求非常敏感。一般来说,人们渴望表达自己,希望被理解,希望有归属感,不希望感到孤独。我认为在过去20年里,我们推出的产品在这方面一直非常有效。 展望未来,一个有趣的问题是AI在这种需求中扮演什么角色。有一个有趣的社会学发现,平均每个美国人拥有的朋友少于三个,而平均每个美国人希望拥有超过三个朋友。 所以,理想情况下,你应该帮助他们与合适的人建立联系,这显然也是我们一直在努力做的事情。当人们无法面对面相聚时,他们可以通过我们的应用保持联系,与人互动,结识新朋友。但我猜,未来会有一些新的动态,即人们围绕不同的事物与不同的人互动。 我个人相信,每个人都应该有一个倾诉对象,就像一个可以随时倾诉的人,不一定是一整天,但可以倾诉他们所担心的问题。对于那些没有心理咨询师的人来说,我猜未来每个人都会有一个AI。当然,这并不会取代你的朋友,但它可能会在很多人的生活中起到补充的作用。我觉得在某种程度上,我们可能比那些纯粹提供机械性生产力技术的公司更理解这类需求。 我们也很清楚这里面可能出现的问题,而且我们一直在琢磨怎么让AI在交朋友、聊天这些事儿上发挥好作用,而不是搞砸了。我特别在意的一件事就是,怎么让AI帮你把朋友关系搞得更好。比如说,我有时候会忘记朋友的一些事情,但我又想对他们更好一点儿。 还有那种情况,比如我总是拖到最后才想去做计划,然后又想:“我也不知道谁有空,也不想打扰别人。”要是有个AI能清楚地知道你朋友的情况,那它就能在这上面帮到你。 一个好的个性化AI不仅仅是了解你感兴趣的东西,一个好的助手或好的个性化服务,是要能够理解你的思维方式。我们和朋友相处时就是这样,我们不会只是简单地说“这是我的朋友鲍勃,他喜欢……”,而是要深入了解这个人的生活,了解你的朋友面临什么挑战,以及这些事情之间的相互关系。 主持人:鲍勃的AI能和你的AI对话,能解决一些问题吗? 扎克伯格:我觉得具体的API接口可能还需要进一步研究,因为这里面涉及到很多隐私问题。其实,这在人际关系中也是一样的。当你和另一个人打交道,或者试图帮助别人解决某个问题时,总会有一些问题,比如该分享哪些背景信息。人们在交流中需要保持一定的谨慎,AI也需要做到这一点。 我觉得现在更重要的是,先让AI真正“懂人”,这不是简单记住你表面的喜好(比如“他喜欢打综合格斗”),而是能理解你背后的经历和感受,比如“他为什么喜欢格斗?是不是曾经通过练格斗克服了困难?现在他的生活里有什么开心或烦恼的事?”这种能深入理解人内心世界的能力,才是AI发展最根本的东西。 六、Meta AI多点突破,多款应用及独立网站协同推进开启智能交互时代 主持人:你觉得你们在让AI真正“懂人”这方面能做得比别人更好吗? 扎克伯格:大概率是的。当然,我不确定其他公司是否也在尝试做这件事。 主持人:我一直开玩笑说,那些开发AI的人其实并不太适合去琢磨AI的使用场景。 扎克伯格:是啊,我觉得最明显的一个方向是生产力。从某种程度上说,谷歌、OpenAI这些公司都在朝着这个方向努力,而Anthropic似乎更专注于开发软件代理。 我觉得这些领域未来肯定会冒出特别大的商业机会,至少那些在这些领域做出成绩、有突破的公司会吃到甜头。当然,我不是要单独评判哪家公司好坏,毕竟每家都有自己的长处和短板。 未来可能会有很多大型公司依靠他们的技术和资金来参与这个领域,同时也会有很多初创公司出现。我一直都在思考的问题是如何在深度技术和帮助人们建立连接的结合点上开发出新的技术。 主持人:我觉得这个方向非常有吸引力,而且你提到的这也符合公司一直以来的方向,但我总觉得公司一直以来都存在某种矛盾,甚至在我们之前讨论移动化转型时就体现出来了,你们不得不成为一个娱乐应用,而无法成为一个平台。马克,你想做一个平台,但你现在在一个开发者大会上。 扎克伯格:你不能总是做你想做的事!我觉得如果只跟着市场走,那最终会变得很无趣。我认为你需要下一些新的赌注。 主持人:我觉得你的想法挺有意思的,咱们绕了一圈又回到了“连接人与人”的核心,只不过这次是靠AI来牵线搭桥。 扎克伯格:没错,我觉得这事儿挺有意思的。不过作为行业领先者,挑战在于尝试新东西不一定每次都能成。这就像打棒球,不用追求每次挥棒都击中球,只要比对手击中的次数多,或者当击中的时候能打出更远的全垒打就行。 这个比喻可能不太贴切,但你应该懂我的意思,关键不是永远不出错,而是抓住机会时比别人做得更漂亮。 主持人:我明白你的意思了。如果你在人生中有三分之一的时间是成功的,那你就已经进入名人堂了。 扎克伯格:是啊。过去20年里,我确实有很多事情没做成,或者没达到预期。但我认为,即使这样,还是要有信心去做那些有意思的事,这才是做这些事情的乐趣所在。 主持人:这就不禁让我发出疑问了,那你为什么还要接着做这些事呢?我记起来2017年的时候,你说你打算在应用里少放点视频,因为你希望人们能用它好好交流,而不是光为了消遣。可现在呢,视频到处都是,还越做越大。 扎克伯格:是的。在那段时间里,我觉得自己犯了很多错误,尤其是在听从一些所谓专家的意见时,他们告诉我什么对用户有价值。当然,研究是有帮助的,但我从那段经历中学到的是,大多数人其实都很聪明,他们知道自己生活中什么是真正有价值的。 当有专家说某件事情不好,但用户却说它很好时,十有八九,真正使用它的人才是对的。 主持人:说到这点,我不确定这个观点是否站得住脚,但人们都在用AI来做什么呢?排在前几位的可能是心理咨询师或者人生导师。 扎克伯格:Meta AI的一个主要用途就是“我想讨论一下问题”“我需要和某人进行一场艰难的对话”“我和女朋友有矛盾”“我需要和老板谈一件棘手的事情”“帮我模拟一下这个对话”或者“帮我理清思路,我该怎么开口”。 顺便说一下,我觉得这种情况更适合用语音,因为你在模拟对话,而不仅仅是打字。但不管怎样,我认为这会是AI的一个重要用途。 主持人:如果人们已经在用ChatGPT或者其他类似的工具了,他们心里已经把AI等同于ChatGPT了,那你该怎么让他们来尝试你们的产品呢? 扎克伯格:其实,目前Meta AI每月的活跃用户数量大约有十亿。 主持人:我前几天和谷歌的人讨论过类似的问题。谷歌其实拥有全球使用最广泛的AI产品,那就是AI搜索概览,但大家都说“Gemini只有3000万用户,Meta AI会不会也面临这种情况?没人用Meta AI,看看那些排名靠后的应用。”而你却说“不,我们这里可是有十亿用户。” 扎克伯格:我也不确定,走着瞧吧。我觉得并不是所有的事情都必须成功,但总得有一些能取得重大突破。我觉得没人能精准预测到底哪些事情会成功。 你得先大致判断一下世界会朝着哪个方向发展,然后下一些赌注,看看哪些能成,接着再灵活地把资源加倍投入到那些表现好的领域。 说回你的问题,通常情况下,如果你想在一个领域超越领先者,光靠做和人家一样的事情是不行的,你得做得更好。而所谓的“更好”,有时候可能就是让用户在他们已经习惯的产品里无缝地体验到这种服务。如果人们想通过文字或语音和Meta AI交流,那么在一个他们已经用来聊天的应用里实现这个功能,肯定是很方便的。 七、VR与AR差异化布局,Orion头显提前曝光倒逼技术突破 主持人:换个话题。我一直觉得这和国际局势也挂钩,Meta其实是个“反脆弱”型公司。比如之前大广告主集体抵制你们,结果反而让竞争对手的广告更便宜了。苹果推出ATT隐私政策时,虽然你们受创,但后来发现对手伤得更重。那从商业角度看,会不会担心像关税这种外部冲击连Meta都扛不住?特别是影响中小广告主的话就麻烦了。 扎克伯格:看过去的经济衰退就知道,我们公司能活这么久,什么周期都见过。经济一紧张,所有企业都会收紧预算,只投见效快的东西。在数字营销里,效果可衡量的渠道才是王道,在这方面我们基本是顶流。就像你说的,08年金融危机、疫情期间、ATT冲击等,虽然每次收入都受影响,但我们市场份额反而涨了。 作为创始人掌舵的公司,最大好处就是能看长远。看到市场份额在经济寒冬里增长,我就会加码投资。比如扩建GPU集群来服务更多企业用户。但短期投资者肯定要发出为什么收入不达标还追加开支的疑问。 主持人:这是要增加资本支出啊。 扎克伯格:这种大起大落我们早见怪不怪了,股价暴跌到底都经历过,三年前就跌到过每股90块。 不过公司由创始人掌舵的好处就是,我不怕因为短期业绩差被开除。我们董事会的设置,说的通俗易懂点就是铁了心要搞长期投资。就像大学基金会钱生钱的套路,死磕长远眼光本身就是我们的优势,时间久了自然赚得更多。 主持人:如果你们追求的“长期价值”不包括成为平台,只是做个应用,能接受吗? 扎克伯格:这要看定义。早年我很崇拜微软,觉得做开发者平台超酷。 主持人:确实酷。 扎克伯格:但本质上我们不是这类公司。现在消费者业务和开发者业务有点矛盾,我更聚焦前者。当然在VR实验室和Llama项目里我们还是在赋能开发者。越多人用Llama,英伟达就会优化适配,反过来降低我们的硬件成本,形成良性循环。不过现在最核心的还是做好产品,我认为垂直整合是关键。 说到做智能眼镜,重点不是为了打造什么生态系统,而是我们相信这会是实现“身临其境感”的最佳设备。想象一下,你的AI助手能通过眼镜看到你看到的、听到你听到的东西,全天候像个贴身伙伴一样和你互动。很难想到还有比这更合适的AI“载体”了。 主持人:所以做眼镜才是你的终极梦想?VR只是跳板?VR到底扮演什么角色? 扎克伯格:眼镜肯定是更大市场。全球10-20亿人戴眼镜,十年后这些都会升级成AI眼镜,至少带基础功能,高端版会有全息投影。现在戴隐形的人可能都会转投智能眼镜,毕竟太实用了。 主持人:你现在戴的是平光镜吧? 扎克伯格:对,其实我日常戴隐形。最近才开始戴智能眼镜,因为太方便了。 八、MetaAI加强内容创新,探索AI在社交陪伴和信息流内容中的新应用 主持人:说到VR,最初是连接人与人,未来可能连接人与AI。AI生成内容会让VR更沉浸,解决冷启动难题。除了游戏,设备还能干嘛?等普及了,大家会又回归本质吗?比如和好友虚拟看球赛。 扎克伯格:完全可能。AR眼镜会是未来的手机,VR则是未来的电视。没人会整天扛着电视出门,但人均每天看几小时。随着VR的画面越来越清晰,它会把平板和一些电视给比下去。AR的全息投影再厉害,也没法像VR那样让人完全沉浸进去,因为VR是从头开始打造一个虚拟世界。反正这两样东西以后都会发展得很好。 主持人:Orion头显(Meta开发的先进AR眼镜)什么时候上市?去年我体验过原型机。 扎克伯格:目标几年内,具体看进展。 主持人:为什么提前曝光?这不等于告诉苹果“我们能做但暂不量产嘛”? 扎克伯格:我们需要用户反馈,喜欢开放式研发,总要权衡,竞争对手会看到,但也能倒逼团队进步。 主持人:这会给你们团队施压要求加快进度吗? 扎克伯格:展示成果能提振士气,但开放式和封闭式研发各有利弊。如果你确信能独立做出惊艳产品,保密有理。但大多数创新需要迭代反馈,开放式开发配合长期投入,往往比闭门造车更快出成果。 在AR/VR领域,每次我们突破,友商就重启项目。谷歌AR项目反复取消重启,苹果看到雷朋联名款成功才重拾眼镜。未来10-15年我们会持续公开推进,持续收集反馈。我们比谁都认真,也聚集了全球顶尖人才,我们过往成绩就是证明。 在AI领域同理。有些方向公认有价值,有些还边缘化。比如AI社交陪伴,或信息流内容创新,目前还没实证能成。 主持人:你看到吉卜力工作室用OpenAI而不用Meta AI创作,会失落吗? 扎克伯格:其实用Meta Imagine工具的人也不少。我觉得挺好,行业足够大,容得下多家创新。 主持人:那些作品都发社交媒体了吧? 扎克伯格:对,这样很好。世界上不可能一家公司包揽所有“酷炫”的事。如果你看到别人做出了很酷的事情却无法为之感到高兴,那你大概会成为一个很郁闷的人。 主持人:最后一个问题,我们第一次采访是在你们公司改名为Meta的时候。你现在还满意这个名字吗? 扎克伯格:是的,我觉得这个名字很棒。它让人联想到未来,一个数字世界和物理世界更加融合的未来,而这一切因为AI的发展,比我预想的还要快地成为现实。让我感到意外的是,如果回到过去问我,“我们是会先迎来全息世界的到来,还是AI?”我会猜是全息世界。 所以,AI提前到来是很棒的,但从本质上讲,AI和全息世界都是我们对未来同一个美好设想的一部分。而我觉得,眼镜对于实现这两个目标都很关键。现在,因为AI技术发展得这么快,用AI眼镜的人比以前多多了。 主持人:您回答的非常好,很高兴再次和你交流,非常感谢。 扎克伯格:也很高兴见到你。
联想发布超级智能体矩阵 杨元庆首次定义三大核心功能
凤凰网科技讯(作者/于雷)5月7日,联想集团今日在上海世博中心举办“Tech World 2025”创新科技大会,正式发布覆盖个人、企业与城市场景的“超级智能体”矩阵,标志着端侧AI推理能力已逼近云端水平,人工智能正式进入“强推理+端侧化”新阶段。 联想集团董事长兼CEO杨元庆在大会上首次定义了超级智能体的三大核心功能:感知与交互、认知与决策、自主与演进,并表示这些技术已从概念阶段迈向规模化应用,超级智能体将成为“认知操作系统”。他预测:“未来12个月,端侧AI综合能力将实现至少三倍的提升”。 大会现场,联想正式发布了“天禧个人超级智能体”、“乐享企业超级智能体”以及“城市超级智能体”三大产品线,同时推出新一代联想推理加速引擎。这款由联想、清华大学和无问芯穹联合研发的推理引擎,通过高性能并行解码、异构计算架构和算子融合优化等技术,解决了大模型轻量化与推理效率的行业痛点。 个人层面,联想“天禧”超级智能体可实现跨设备数据调用,具备多模态感知、意图理解和自主任务拆解能力。同时联想发布四款搭载天禧的智能终端:AI元启版moto razr折叠屏手机、AI元启版Yoga平板、全球首款卷轴屏AI PC ThinkBook(屏幕可扩展至16.7英寸)以及3D拯救者游戏设备。现有联想设备用户只需满足特定硬件要求,即可升级安装天禧个人超级智能体。 企业应用方面,联想构建了基于“端-边-云-网”四层架构的混合计算基础设施,推出“万全异构智算平台”作为企业智能体的算力基座。通过突破性的GPU内核态虚拟化技术(与上海交通大学联合研发),该平台有效降低了AI训练成本,加速了推理效率。 “乐享”企业超级智能体深度集成企业全域业务数据与知识资产,覆盖从供应链到市场营销的全业务链条,可化身产品经理、销售人员或采购专员,实现"硅基生命"与实体业务的深度融合。 城市治理层面,联想提出“1×N城市超级智能体”架构——由一个城市核心中枢与多个领域智能体协同工作。该技术已在武夷山和宜昌等城市落地应用,在旅游行程智能规划、文旅资源优化、城市精细化运营等方面展现价值。 大会最后,联想宣布与国际足联(FIFA)世界杯达成技术合作,将为2026年世界杯提供智能基础设施支持,开发AI分析引擎帮助球队与教练实时调整战术,研发球员3D分身技术辅助裁判决策,并为球迷打造沉浸式观赛体验。
ChatGPT做电商,先拆了传统搜索的信息围墙
4月29日,X平台OpenAI的官方账号宣布正在对ChatGPT的搜索功能进行了多项改进,并正式上线了网购功能,随后便放出了一则实机演示视频。 在视频中,当我们向ChatGPT询问“200美元以内口味最接近意式最好用的咖啡机是哪台?”时,它会先从问题中解读出提问者对“家用”“意式风味”以及“200美元预算”等硬性需求,接着便会从信息库中筛选出多款符合条件的咖啡机。 到此还没有结束,如果仅仅是筛选产品的话和百度、Google等搜索引擎的功能也并未相差太多,真正让ChatGPT成为电商的点在于当用户看中了德龙ECP3220这款咖啡机后,仅需点击一次,便会将购买链接、购买建议以及消费者评价多模块显示出来,如同淘宝与京东的布局类似,后续只用点击购买按键即可一键跳转到网站购买。 但这并非是OpenAI对电商的初次尝试,正如其总裁Greg Brockman一直强调的观点“2025年是智能体之年”一样,早在四个月前,OpenAI便正式放出了智能体Operator,其拥有推理以及联网自主执行的任务,用户只需向智能体发布任务,它便能实现网购买菜以及订酒店等功能。 01 ChatGPT转行做导购,AI跨入电商蓝海 回想过去,消费者是如何完成网购流程的?首先是种草阶段,大多数消费者会在小红书等平台了解产品信息以及评价,接着进入比价环节,在淘宝、京东等五花八门的电商平台综合价格、评价以及质量等多个因素综合对比,最终选出一款最心仪的产品。 这种消费流程实在是太冗长了。面对愈发海量的产品信息,消费者时常会陷入一种“选择瘫痪”中,就像很少有人能在几款价格相差不大,功能又基本相似的吹风机中坚决地选择其中一款一样,消费者有时是需要外界来帮他做决策的。 而OpenAI此举,正是盯准了当下消费者在网购决策方面未被满足的需求与传统搜索信息冗余的矛盾。OpenAI上线电商功能,本质上是打通了搜索和下单的商业链路,在其最擅长的AI搜索上,加上了后链路的转化。与其说是OpenAI在做电商,不如说是在做AI搜索的商业化尝试。 那ChatGPT电商的优势在哪里呢? 首先是个性化的服务。AI与传统网页最大的区别在于AI是有逻辑能力与记忆能力的,而传统网页只有强关联词锁定的能力。使用传统搜索引擎搜索资料时或是用传统电商平台搜索商品时,往往会出现“捡了芝麻丢了西瓜的情况”,必须要一次性地把自己的所有需求都输入到搜索框中才能得到相对满意的答案。 而ChatGPT能记住用户过往的需求,用户在一开始输入的需求后续也会一直在AI的筛选条件中。具体理解的话就是第一次向AI提问时提到了“防过敏”这一需求后,后续每次提问也都会将“防过敏”作为筛选的条件之一。 其次,打通了平台间的壁垒。以国内为例,当消费者想购买一台手机时,既可以用抖音商城买,也可以用京东淘宝等传统商城买,但问题在于这些平台并不是打通的,就导致消费者为了去比价和比性能就需要来回切换不同的平台,最后耗时又费力。 ChatGPT打通了沃尔玛与亚马逊等多家主流电商平台的数据,基本做到了“一键全网性价比”。正如视频中展示的一样,直接显示了德龙咖啡机在品牌官网以及沃尔玛等平台的不同价格,想在哪买一键跳转即可。 最后是相对竞价广告更高的信任度。据OpenAI官方透露,它能够通过第三方结构化数据,让推荐结果完全只基于商品评分与需求关联度等硬性指标,而OpenAI官方也曾表示“不会从购买中获得回扣”,也就是说Chatgpt的网购不接受广告植入。 但虽然OpenAI到目前为止对广告呈现出抵抗的态度,但谁也不知道未来的发展走向如何,毕竟OpenAI去年还开辟性地设立了CMO并在超级碗发布了自己的首支广告片,很难保证未来是否广告也会应用到ChatGPT的问答场景中。 但无论如何,OpenAI作为AI行业的先锋品牌,每次举动都能引发一波热潮,正如前阵子其带火的吉卜力风格一样,这次是否又能带动电商行业迎来一阵AI热潮呢? 02 AI电商“闯关”:技术、营销与伦理的三重考验 在Morketing看来,AI电商一定会是新蓝海,但目前无论是从技术上还是从伦理角度仍未达到能引发热潮的程度,可以从技术、营销与伦理三个角度来理解: 首先,目前的AI技术未必每一次都能做出正确决策。ChatGPT购物功能主要是通过像o3/o4-mini模型提问来实现。但当下几乎以OpenAI为代表的AI智能体都面临严重的“AI幻觉风险”,第三方机构曾对目前AI幻觉的现象进行过测试,发现推理能力越强的模型幻觉率反而更高了。OpenAI也曾承认o3的幻觉率是o1的两倍,而o4-mini的幻觉率是o1的三倍。 AI自身的幻觉问题导致的回答错误是一方面,另一方面则在于消费者的多样化表达会加重AI给出错误答案的频率。因为在电商中格外需要AI去理解购物场景下具体的语义表达,但消费者往往会用到“不死板”或是“活泼”之类的不在常规商品词库中的词汇,可能会导致AI导购“会错意”,最后给出驴唇不对马嘴的回答。 所以从技术层面来看,AI自身回答的准确率仍需要改进,对消费者长尾语言的理解能力也需要优化。 其次则是从营销角度来讲,虽然目前OpenAI对广告表现出了一种明显的反对态度,但近期Sam Altman的采访中却表示“或许未来会用一种有品位的方式做广告,即便我本人不太喜欢广告”。并且OpenAI的盈利能力也一直备受争议,因此很难不怀疑未来AI给出的答案有没有“金钱的力量”。 其实当用户的消费习惯从传统的网页搜索后转向AI搜索后,已经有不少品牌或是咨询公司都意识到传统的SEO优化可能不奏效了。要将以前SEO的那套逻辑想办法套到AI智搜上,因此GEO生成式引擎优化策略也逐渐进入了萌芽期,简单来讲就是靠对品牌内容文本的优化来“诱导”AI推荐自己的产品。 但值得注意的一点是,在GEO相关话题下的评论区往往都是以持反对意见为主,有不少人都认为“广告做的满地都是很让人反感。”因此,如何去解决那些利用策略诱导AI推荐自家产品,但自家产品本身又比较一般的品牌也是AI电商需要思考的问题。 最后一点则聚焦于伦理层面,几乎任何有AI模型参与的场景都面临着较为严重的伦理问题,核心争议点就在于AI智能体的推断能力太强了,如同有读心术一般。其实大数据时代后带来的隐私问题就已经很严重了,大部分人都反对各个APP肆意调动数据精准推送而带来的“监视感”。 03 结语 但不可否认的是,ChatGPT的这一创新已经为电商行业打开了一扇新的大门。它让我们看到了AI在电商领域的巨大潜力,也为未来电商的发展提供了一种全新的思路。 尽管目前还存在诸多问题,但随着技术的不断进步和完善,相关规则的逐步建立,这些问题或许都将得到解决。那时,电商行业将迎来一个全新的智能化时代,为消费者和商家创造更多的价值。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。