行业分类:
加载中...
头条分类:
加载中...
特斯拉 Robotaxi 高调开跑:只能坐两人,不能跟安全员聊天
特斯拉的 新阶段 今天凌晨,在经历了 12 年的漫长期待与无数次的跳票之后,特斯拉的 Robotaxi(自动驾驶出租车)终于在德克萨斯州奥斯汀市的街头,悄然开跑。 这场备受瞩目的首秀,呈现出一种奇特的矛盾感。 一方面,其运营规模极其谨慎:仅有约 10-20 辆 Model Y 展开服务,服务范围被严格限制在奥斯汀中南部的电子围栏内,避开了市中心的复杂路况;乘客采取邀请制,包括特斯拉员工、部分车主及 KOL。更关键的是,每辆车的副驾驶位上,都配备了一名「安全监控员」。 而另一方面,其传播声量颇为高调。马斯克亲自在社交媒体上大量转发首批体验者的视频,将这次小范围的内部测试,放大成了一个全球科技圈都在关注的焦点事件。 热烈祝贺特斯拉 AI 软件和芯片设计团队成功发布 Robotaxi!!这是十年艰苦奋斗的结晶。AI 芯片和软件团队都是特斯拉从零开始建立的。 马斯克的字里行间充满了对团队和自研路线的自豪。 掌镜的是特斯拉首席软件工程师段鹏飞,毕业于武汉理工大学,后于俄亥俄大学获电子工程硕博学位 一次「脚尖探水」式的落地 对于那些有幸收到邀请的「早鸟」用户而言,体验一次特斯拉 Robotaxi 的流程,既充满了未来感,也透露着无处不在的谨慎。 那么,体验一次真正的特斯拉 Robotaxi,流程究竟是怎样的? ⬇️ 点击下方观看视频 ⬇️ 首先,你需要通过一个界面颇具赛博朋克风格的手机 App,确认自己处于奥斯汀南部的服务区内,下单成功后,一辆没有驾驶员的 Model Y 便会向你驶来。至于价格,马斯克统一定在了 4.2 美元——一个充满争议的亚文化的数字。 如果你点击了打赏,它会告诉你「这只是在开玩笑」。 当车辆抵达后,其外部灯光会闪烁以帮助你进行识别,但车身并没有像 Waymo 那样独特的标识,仅在车门处印有「Robotaxi」的字样。 上车之后你会发现,车辆会自动同步你的座椅位置,音响系统也会播放你平时最爱的音乐,为你营造出一种「像是进入了自己车」的熟悉感。 有趣的是,也许是为了从形式上强调「无人驾驶」属性,乘客的乘坐位置也受到了严格限定:驾驶位永远空着,副驾属于那位时刻观察路况的「安全监控员」,而你和你的朋友,只能一同坐进后排。 后排的屏幕会进入专属的 Robotaxi 模式,你需要长按屏幕上的一个圆形按钮来开始行程。行程中,你也可以操控空调和影音系统,但前排的中控大屏则无法操作。 根据多位 KOL 分享的体验,Robotaxi 的整个乘坐过程平稳、顺畅,体验甚至比之前的 FSD 更好。一位名叫 Zack 的用户表示:「在减速带上减速效果非常好,停车也非常平稳。」 在乘坐了 3 次之后,Farzad 也给出了它的评价:它对 Robotaxi「平稳舒适」的运行状态毫不意外,但当他意识到这辆实现无人驾驶的汽车,和他买的那辆 Model Y 一模一样时,他的内心受到了巨大的冲击。 一些人性化的细节也值得称赞。例如,下车时,屏幕会提示乘客使用按钮开启后备箱(如果乘客在上车前有打开的话),并附有如何打开车门的图文说明,确保隐藏式门把手不会给新乘客带来困扰。 当然,在这看似流畅的体验之下,是特斯拉近乎「步步为营」的战略考量。 副驾驶位被禁止与乘客交流的安全员、车外待命的远程操作员、严格的地理围栏、避开市中心复杂路口的路线规划、以及仅在良好天气下运营的限制,每一个环节都在尽力规避风险。 坐在副驾的安全员可以让车辆在车道内停下或是靠边 这背后,无疑有 Cruise 在旧金山因事故而全面停摆的前车之鉴,以及 Uber 因致命事故而彻底退出自驾业务的惨痛教训。在自动驾驶的商业化道路上,「安全」是那条一旦越过便万劫不复的唯一红线,特斯拉显然不愿在同一个地方摔倒。 乘客也可以让车辆靠边,或是直接与客服沟通 马斯克上周的表态也说明了这一点:「由于我们对安全问题极度在意,所以(试运营)启动日期可能会有所调整。」 当然,支撑这场首秀的,是特斯拉的技术内核。 这批投入运营的 Robotaxi,搭载的很有可能是全新的 HW5 硬件平台,配备 4 颗 4D 毫米波雷达和 12 颗高清摄像头,其算力范围覆盖 2000 至 2500TOPS,远超现款 HW4 芯片的 400 至 500TOPS。 软件层面,车辆运行的是 FSD V13.3,该版本后续也会向其他 FSD 用户进行推送。 除了展示已经落地的技术,马斯克也总不忘在社交媒体上预告下一个更强大的未来,这已成为特斯拉维持市场高期待值的惯常手法。他透露,一个参数量是现行模型 4.5 倍的更先进 AI 模型,已在内部进行 Alpha 阶段的测试。这种「硬件超前预埋、软件持续迭代」的模式,正是特斯拉试图构建其技术护城河的核心逻辑。 但即便如此,环绕在特斯拉技术路线上的争议与挑战,也从未停歇。 最核心的,依然是其近乎执拗的纯视觉路线。多个分析机构和众多技术专家都曾指出,仅依靠摄像头,在面对太阳强光、恶劣雨雪天气、或光线极差的夜晚等场景时,其感知的可靠性仍面临巨大挑战,这与 Waymo 等竞争对手采用的「激光雷达+毫米波雷达+摄像头」的多传感器融合方案形成了鲜明对比。 与此同时,来自监管层的压力也如影随形。美国国家公路交通安全管理局(NHTSA)目前仍在对特斯拉的自动驾驶系统进行多项调查,而德州的立法者甚至在 Robotaxi 上线前,就公开呼吁其推迟运营,等待更严格的安全法规生效。 *我们可以在得州交通部官网看到所有正在运营的自动驾驶车: https://txdot.maps.arcgis.com/apps/dashboards/f4dd9ee9f87447d3ac3cdef192b3910f 或许,最冷静的一盆冷水,来自特斯拉的前 AI 主管、纯视觉路线的奠基人之一——安德烈·卡帕西。他分享了自己早在 2013 年就体验过 Waymo 前身(谷歌无人车)的一次完美的无干预演示,那次经历曾让他以为自动驾驶「近在咫尺」。 「但如今 12 年过去了,」他感慨道,「我们仍未真正解决这个问题。」 这位大神级人物的审慎,无疑为特斯拉这场看似成功的首秀,增添了一层复杂而深刻的意味。 Robotaxi 撑起特斯拉的下一个十年 在完全了特斯拉 Robotaxi 的初步体验、运营策略以及其背后喜忧参半的技术内核之后,我们才能更清晰地审视马斯克为这场「终局之战」所描绘的、那幅庞大而诱人的商业蓝图。 这套商业模式的核心,被马斯克生动地比作「Airbnb 和 Uber 的结合体」。 一方面,特斯拉将运营一部分自有的 Robotaxi 车队,保证核心区域的服务稳定。 而另一方面,也是其最具颠覆性的一点,是向全球数百万的特斯拉私人车主开放「加盟」入口。 车主可以通过手机 App,一键将自己的车辆在闲置时投入 Robotaxi 网络,随时加入或退出,让汽车从消费品变成可以创造持续收益的资产。 马斯克曾算过一笔账:车主通过共享车辆获得的收入将远超车贷月供,而特斯拉则可以从每笔订单中抽取佣金。这种「轻资产」的扩张模式,巧妙地将车辆、充电、清洁、维护等大量运营成本,转移给了庞大的车主网络,从而有望实现高达 70% 的惊人运营利润率—— 这正是支撑马斯克喊出「Robotaxi 将为公司市值带来 5 到 10 万亿美元增长」这一豪言的底层逻辑。 然而,宏大的愿景与骨感的现实之间,依然横亘着巨大的鸿沟。 马斯克为 Robotaxi 的规模化定下了极其激进的时间表:在奥斯汀试运营的几个月内扩展到 1000 辆,到 2026 年底,在美国将有超过 100 万辆自动驾驶的特斯拉投入运营。 但华尔街的分析师们显然要冷静得多。高盛预计,特斯拉在 2027 年前能部署约 2500 辆 Robotaxi;而摩根士丹利等机构则普遍认为,真正意义上的大规模商业化落地,可能要等到 2028 年左右。 这种预期上的巨大差异,源于市场对马斯克「过度承诺」的深刻记忆。从 2019 年宣称「2020 年实现百万 Robotaxi 上路」,到如今 2025 年才刚刚以 10 余辆车的规模开启内测,时间这位最公正的裁判,已多次修正了马斯克的「PPT 时间表」。 但有趣的是,即便跳票已成常态,资本市场似乎依然愿意为 Robotaxi 这个故事持续买单。 究其根本,是因为 Robotaxi 直接关系到对特斯拉这家公司的最终定义——它究竟是一家增长有限的汽车制造商,还是一家拥有无限想象空间的 AI 和科技公司? 万亿美金的市值,早已无法单靠卖车来支撑。FSD 软件的持续收费、Dojo 超算的算力服务,以及 Robotaxi 所代表的未来出行网络,这些才是支撑其高估值的核心叙事。 因此,Robotaxi 的每一次进展,无论多小,都像一针「兴奋剂」,能直接刺激市场的神经。它的顺利与否,将直接触发对特斯拉股价和未来价值的大幅修正。 可以说,此次奥斯汀的首秀,无论其运营规模多么有限,都标志着特斯拉的 Robotaxi 故事,终于从虚无缥缈的 PPT,第一次走入了触手可及的物理世界。这是一个至关重要的「从 0 到 1」。 正如卡内基梅隆大学的自动驾驶领域教授菲利普·库普曼(Philip Koopman)在评价此次首秀时所言,这更像是「开始的结束,而非结束的开始。」 对于马斯克和他庞大的 AI 团队而言,这场持续了 12 年的艰苦奋斗,或许才刚刚完成了它的序章。 文 | 李华
字节上线“卷王”级产品“探饭”,全功能AI饭搭子
《读佳》获悉,字节的UserGrowth(用户增长团队)做了一个名为“探饭”的AI产品,搭载的是豆包大模型。 开发公司为北京有竹居网络技术有限公司,经查询,为字节全资子公司。探饭主要为用户提供美食相关的智能向导服务,在实际体验过程过程中,还发现通过探饭也能够购买团购套餐或点外卖,以及AI点菜。 堪称全方位的AI饭搭子。 第一部分:从“吃什么”到“怎么吃”,探饭把AI干饭流程卷到极致。 实测来看,探饭的功能较为丰富,不仅可以实现探店推荐、菜品推荐、美食攻略、点菜,还可以实现买团购、点外卖等功能。 在实际体验中,可以直接问探饭美食问题,比如“北京有什么好吃的鲁菜馆”,随后,探饭便会基于地理位置,且按照连锁品牌和小众美食,划分为品牌店和宝藏店,分别罗列出附近的相关鲁菜餐厅。探饭还会给出具体的推荐理由,比如同和居(银泰店)入围了北京市地方菜回头店,有溜肝尖特色菜,还赠送长寿面等。 如果用户对于罗列出来的美食店仍然不好做出选择,也可以通过PK比店功能,进一步筛选出合适的美食店。探饭会从适用场景、特色、推荐菜、优劣势等多个维度进行比拼,并进行总结,让用户进行判断。 确定好美食店后,可以直接在探饭上点击该门店的图片,紧接着会进入该店铺的详情页,可以看到推荐菜、评论、优惠团购、推荐搭配、环境等更多信息。 探饭还支持地图找店,可以在地图上寻找美食店(注:笔者附近暂没看到美食店),确定好店铺后可以进行导航,导航需跳转至高德地图。 第二部分:从推荐到下单,抖音生态让AI干饭形成闭环 除了上述提到的服务外,用户甚至可以直接在探饭中购买团购,如果购买带有随心团的团购,则可以直接外卖到家。 探饭还有AI点菜功能,选择好人数和口味偏好或者忌口,AI就会推荐出合适的团购菜单供用户参考。 这种“AI推荐+生态闭环”的模式,让用户从“被种草”到“下单”的决策时间压缩到几分钟以内,一位业内人士表示:“字节这是要让AI成为本地生活的新流量入口。 不过,探饭目前也并非十全十美。在探店推荐方面,虽然能够广泛搜罗各类餐厅信息,但对于一些较为小众、新开不久,尚未被大众熟知的宝藏店铺,存在信息覆盖不全面的情况,可能导致部分极具特色的小店难以出现在推荐列表中。 不得不说,“探饭”的出现重新定义了“干饭智能化”,当AI能从推荐餐厅、PK比店到完成团购外卖全链路服务,字节实际上在用技术重构用户的饮食决策逻辑。对行业来说,或许正在预告下一个本地生活的流量入口形态。
地表最强法务部,把明星AI独角兽告了
作者 | 陈骏达 编辑 | 心缘 “地表最强”法务部,跟一家AI创企杠上了。 智东西6月17日报道,6月12日,好莱坞影视巨头迪士尼、环球影业及其旗下多家公司联手提起诉讼,指控美国生成式AI独角兽Midjourney的生图服务在未经许可的情况下,将大量IP内容用于训练AI模型,并允许用户生成与原IP形象高度相似的图像。 通过此次诉讼,迪士尼和环球影业不仅希望法院禁止Midjourney的侵权行为,还要求后者为每部故意侵权的作品支付最高15万美元(约合人民币108万元)的赔偿。根据起诉书中提供的不完全统计,Midjourney最终可能需要对涉及总计200部作品的侵权行为支付最高3000万美元(约合人民币2.15亿元)的赔偿。 ▲Midjourney生成的侵权形象与原IP形象对比(图源:起诉书) Midjourney平台上的侵权内容不止包括迪士尼、环球影业的IP,连最近全球爆火的泡泡玛特Labubu也出现在其主页推荐中,被AI“抄袭”了。 ▲Midjourney首页上出现的AI复刻版Labubu(图源:Midjourney官网) 其实,在正式提起诉讼前,迪士尼和环球影业已经向Midjourney发送了停止侵权的警告,但并未收获任何回复。Midjourney不仅持续更新其图像生成模型,还计划在本月推出视频生成模型,这些新服务可能会进一步侵害版权方的权利。 迪士尼和环球影业将Midjourney的行为定性为“典型的版权搭便车”,更是“抄袭的无底洞”。这些行为从根本上威胁了版权法的激励机制,可能对未来的影视作品创新带来负面影响。目前,Midjourney尚未对此案进行正面回应。 Midjourney是全球使用范围最广、最受欢迎的图像生成工具之一,以订阅的形式对外提供服务,月费从10美元-120美元(约合人民币72元-862元)不等。去年,Midjourney公司的营收已经达到3亿美元,估值已超过10亿美元,成为一家独角兽企业。 不过,MidJourney并不是唯一一家遇到类似问题的硅谷创企。今年,OpenAI的GPT-4o的图片生成功能,就因允许用户生成高度模仿吉卜力、史努比等风格的图像,而引发版权争议。 过去几年,好莱坞一直对类似侵权行为持观望与试探态度,迪士尼和环球影业是首批起诉AI创企侵权的好莱坞制作公司。 选择在此时提起诉讼,或许意味着这两家公司认为法律和舆论环境已经成熟。迪士尼的法务部门以超强版权保护、诉讼胜率高、维权手段强硬著称,被业内人士“地表最强法务”,而环球影业也同样拥有好莱坞顶级法务团队。 值得注意的是,这一诉讼特别强调了Midjourney对包括钢铁侠、功夫熊猫、巴斯光年、艾尔莎、史莱克和小黄人等独创IP角色的侵权,而非仅仅关注图像的复制,这意味着对这些形象进行衍生创作可能也构成侵权。好莱坞巨头们打响的第一枪,很有可能引发一波后续诉讼。 一、平台、用户均涉嫌侵权,创始人言论或坐实“明知故犯” 迪士尼和环球影业的起诉,主要围绕着两大指控,涉及Midjourney AI生图技术的训练和分发。 首先是直接版权侵权。起诉书中列举了数十项AI生成形象与原AI形象的对比照,结合这些证据和生成式AI行业常识,迪士尼和环球影业确信,Midjourney在数据抓取、数据清洗、模型训练等阶段都存储、复制了相关IP形象,这一行为构成了直接侵权。 ▲Midjourney生成的侵权形象与原IP形象对比(图源:起诉书) Midjourney不断更新和扩展的模型家族,还意味着每次升级图像服务时,该公司都会重复上述涉嫌侵权的训练流程。原告方推测,Midjourney即将推出的视频生成服务,或将大幅提升其传播侵权副本及衍生作品的能力。 上述推测得到了Midjourney创始人兼CEO大卫·霍尔兹(David Holz)个人表述的佐证。2022年8月,霍尔兹在接受The Verge采访时称,为了收集训练数据,Midjourney“竭尽所能获取所有数据、所有文本、所有图像”。 ▲大卫·霍尔兹 在同年9月接受福布斯的采访时,霍尔兹更是明确承认Midjourney从未寻求获得任何版权内容持有者的授权,来复制和利用其作品。 训练完成后,Midjourney图像生成服务能直接为用户生成侵权内容,这构成了迪士尼和环球影业所指控的第二项罪名——间接版权侵权。 迪士尼和环球影业认为,用户对版权内容进行未经授权的复制,本身就构成侵权,而平台方Midjourney对此应当负有监督控制的责任。 实际上,Midjourney有充分的手段与能力对类似行为进行限制。 在训练阶段,Midjourney能控制并选择哪些内容被用于训练,这也意味着其有权且有能力排除迪士尼、环球影业受版权保护的作品。 在生成阶段,Midjourney可通过对特定提示词、图像的限制,避免生成某些受版权保护的内容,该公司已经对部分公众人物、暴力和不雅图像进行了限制,但并未对IP内容和形象采取相同的措施。 迪士尼和环球影业还试图论证Midjourney的行为构成故意侵权,并分享了向Midjourney发送的两封警告停止侵权行为的信函。这两封信函告知了侵权行为的存在,并明确了涉及的具体IP形象。根据美国相关法律,故意侵权行为的赔偿金额远超普通侵权,最高可判处15万美元的赔偿。 原告方总结道,Midjourney明知且实质性地促成了用户的侵权行为,并鼓励和诱导了这种侵权行为。如果没有Midjourney的故意设计,其图像服务将无法创建侵权内容。Midjourney在其网站展示了大量侵权图像,涉嫌故意利用原告的IP形象来吸引订阅用户,从而获取利润。 迪士尼和环球影业希望法院能发布初步和永久禁令,禁止Midjourney继续侵权,包括停止其图像服务和即将推出的视频服务,并要求赔偿原告的损失。 二、侵权诉讼只是起点,或倒逼AI企业坐上谈判桌 不过,法院禁令和一次性的经济赔偿对迪士尼与环球或许仅仅是一个开始,如何持续稳定地参与到生成式AI产业链条,并从中获利,可能是诉讼背后这些影视公司的另一大重要考量。 好莱坞影视公司并不反对生成式AI技术,相反,这些公司正在积极利用AI技术提升其制作效率与创意表现。今年奥斯卡颁奖典礼上,AI技术的广泛应用已成为业界和观众关注的焦点,多部提名和获奖影片都在制作过程中应用了AI技术。 获得最佳男主角等3项奖项的《粗野派》利用AI优化了主演的匈牙利语发音;获得最佳原创歌曲奖的歌舞片《艾米莉亚·佩雷斯》则通过AI进行声音克隆和调整,提升了角色表现力。此外,AI还被用于部分影片的虚拟换脸、视觉特效增强和场景渲染,提高了制作效率和视觉效果。 尤其值得注意的是,在好莱坞,迪士尼正是推动AI在影视制作中应用的重要力量之一。迪士尼研究院在视觉计算、机器学习和AI已有长达十几年的投入,在今年的计算机视觉顶级会议CVPR上,该研究院共有3篇论文被收录,分别涉及图像压缩扩散模型、视频外绘扩散模型、生成式变形图像等能给影视制作降本增效的技术。 ▲迪士尼研究院部分成果(图源:迪士尼研究院官网) 迪士尼总法律顾问奥拉西奥·古特雷斯(Horacio Gutierrez)也向外媒表达了类似观点:“我们看好AI技术的前景,也对如何负责任地利用它作为促进人类创造力的工具感到乐观。” 《华盛顿邮报》的评论文章认为,好莱坞的真正意图或许并非封杀生成式AI,而是要在产业红利中分得应有份额。 代表Midjourney等科技企业的中间派行业组织“进步联盟”政策专家亚当·艾斯格劳称,制片厂深谙AI的价值,用AI替代部分人工所能节省的巨额成本,好莱坞心知肚明,“这正是主流片厂此前始终按兵不动的重要原因”。 迪士尼和环球选择此时发难,一方面可能是因为业界对AI侵权问题的关注日益增强,另一方面则或与Midjourney即将推出的视频生成服务密切相关,该服务有可能更直接地侵犯其版权和相关权益。 好莱坞影视公司经常战略性地利用诉讼作为其版权和商标权保护和谈判的一种方式,有效地阻止侵权并加强对其知识产权的控制。 具体到这一案件,康奈尔大学数字信息法教授詹姆斯·格里梅尔曼(James Grimmelmann)向《华盛顿邮报》分析道,相比其他AI版权诉讼原告,迪士尼和环球的证据链更为扎实,掌握了用户利用Midjourney生成“小黄人”等IP角色的确凿证据。格里梅尔曼还认为,这场诉讼是“谈判桌上的首轮叫价”,其核心诉求为版权授权机制与内容过滤系统。 迪士尼和环球如果最终胜诉,将有可能倒逼其他AI企业主动坐上内容授权的谈判桌。 三、版权“达摩克利斯之剑”即将落下,AI创企还有翻盘机会吗? 版权问题一直是悬在诸多AI企业头上的“达摩克利斯之剑”,OpenAI、Runway等企业已经因版权问题陷入争议和法律纠纷。不过,法律风险并未让这些企业减缓新模型、新功能的发布,其中有不少生成的内容游走在侵权的灰色地带。 例如,GPT-4o生图功能官方演示并带火的吉卜力风格漫画转绘,已引发侵权争议。 ▲GPT-4o转绘的吉卜力风表情包(图源:X平台) 谷歌日前发布的Veo 3能毫无限制地生成诸多版权内容,也可能造成侵权。 ▲谷歌Veo 3生成的星球大战角色(图源:X平台) 在国内,类似涉嫌侵权的行为屡见不鲜。Labubu、哪吒等近期热度较高的IP形象,在国内部分图像、视频生成平台上可以自由生成和传播。 大部分国产AI图像生成工具也不会拒绝生成小黄人等海外IP形象。 在版权方和普通民众看来,这种对IP形象的复刻与侵权无异,但AI公司们有可能会引用版权法中的“合理使用(Fair Use)”概念来规避法律风险。 无论是中国还是美国的版权法,都为企业使用版权内容留下了一定空间。一般而言,部分地引用、借鉴版权内容并不会被判定为侵权,只有完整地复制、抄袭才面临侵权风险。 2004年,谷歌在中美两国法院均成功援引“合理使用”原则进行抗辩。在图书版权方指控其通过图书搜索和预览服务侵权受版权保护内容的系列案件中,谷歌赢得了部分胜诉。 OpenAI在其最近与《纽约时报》的诉讼中也引用了合理使用的概念,不过由于其生成的内容中包含与《纽约时报》报道原文高度雷同的段落,这一主张未获得法官的支持。目前此案仍在进行中。 其实,我国在AIGC侵权法律责任的判定方面走在全球前沿。2024年2月,广州互联网法院对全球范围内首例生成式AI侵犯他人著作权案件宣判。原告为“奥特曼”IP的被许可方,被告为一家提供文生图功能的AI企业。 ▲判决书截图(图源:垦丁律师事务所) 在用户要求被告公司的生图工具生成奥特曼的相关图片时,该工具生成的内容与原形象高度相似。法院认为,此类行为侵犯了原告对其作品的复制权与改编权,平台对此负有责任。 结语:AI碰上版权红线,合规框架或成刚需 近期,无论个人创作者还是头部版权方,都开始提高对AI侵权的法律维权力度。据媒体The Variety统计,仅在美国就有17起类似诉讼正在进行中。不过,由于AI复制品们在一定程度上也起到了扩大IP影响力的作用,有部分版权方会选择暂时不起诉。 对AI企业而言,版权风险终将影响企业的正常运营。去年,Runway AI在Hugging Face平台上上演的一处开源模型“删库跑路”大戏,正是由于他们使用了一个涉嫌侵权的图像数据库并陷入法律争议。对所有AI企业而言,建立合规的版权框架需要尽快提上日程。
正面刚 iPhone 17 的特朗普手机,还是离不开「中国制造」
美国梦? 中国制造 美国总统唐纳德·特朗普,宣布进军手机行业。 准确的来说,是特朗普家族集团要推出一台新的手机,名为 T1 Phone 8022(黄金版)现在已经开启预售,价格 499 美元(折合人民币约 3584.57 元)。 有意思的是,这台手机将于今年 9 月正式发售,也就是说,要和苹果 iPhone 17 正面交锋了。 作为一台「MAGA」手机,T1 当然宣称自己「自豪地在美国设计和制造」,一封官方邮件表示将在阿拉巴马州、佛罗里达州以及加利福尼亚州生产。 既然不能将 iPhone 拽回国内生产,那就自己出一台「美国制造」手机,特朗普的想法很美好,但现实真的能如这位美国总统所愿吗? 为美国人打造的「美国手机」 再来看看这款手机唯一一张产品图。手机的背面酷似 iPhone 16 Pro,摄像头模组内只有三颗间距略显任意的摄像头,却没见到闪光灯。硕大的「T1」logo 下方,则是充满信仰的星条旗剪影。通体金光闪闪,十足彰显了特朗普商界出身的富豪品位。 机身正面更是 Buff 叠满:大大的 Trump Mobile 字样,经典的「Make America Great Again」标语,只是星条旗下方疑似的指纹识别模块,没能对准中线,背面的摄像头好像也忘了要 P 上一颗闪光灯。 这种个人风格强烈的手机,自然给看惯苹果三星简约审美的老美带来了极大的震撼,却让中国网友们想起一位 10 年前的老朋友: 带有董明珠「一封信」的格力手机 除了这个图,官网还透露了 T1 手机的「详细」配置: 6.8 英寸 AMOLED 挖孔屏 120Hz 刷新率 5000 万像素主摄,200 万像素深度传感器,200 万像素微距镜头 1600 万像素前置摄像头 5000mAh 电池,20W PD 快速充电 USB-C 接口,支持 USB 2.0 协议 3.5 毫米耳机接口 屏下指纹传感器 + AI 人脸解锁 Android 15 系统 12GB RAM 256GB ROM,支持扩展存储卡 这个配置单可以说亮点满满:iPhone 16 标准版都没有的 120Hz 刷新率,比 iPhone 16 Pro Max 还大的电池,以及「外星科技」3.5 毫米耳机接口。而手机最重要的处理器只字不提,不禁让人更好奇和期待。 而以上就是这台手机现存的全部基本信息,官网目前真的就只有这一张连屏下指纹位置和闪光灯都没 P 好的「概念图」,以及这些和山寨机一样没有任何细节的参数列表,以及 499 美元的售价。 如果不是因为「特朗普」的这个招牌,那么这一切看起来都和一个骗局没啥两样,而现在,一切都像是这位不按常理出牌的现任美国总统,再一次和世界开了个玩笑。 「特朗普移动」不只造手机,还为「辛勤工作的美国人」,提供「价格合理、体现其价值观、质量可靠值得信赖」的无线运营商服务。 说好的「处理器 & 内存」,却只有内存 特朗普移动将联合美国三大运营商提供 5G 服务,主推「47」套餐,月费 47.45 美元。值得一提的是,唐纳德·特朗普本人分别是美国第 47 和 45 任总统。 这个套餐的内容也非常奢华,包含了无限的通话、短信和流量(前 20GB 高速流量),附赠 24 小时道路救援,还能免费拨打 100 多个国家的国际电话,没有合同可以随时取消。 类似国内的「米粉卡」和「大王卡」,特朗普移动其实只是一种「虚拟网络运营商」,用的其实还是美国通信「御三家」AT&T、Verizon 和 T-Mobile 的服务。 Apple Insider 则认为,这个套餐的细节也含糊其辞,收费也较高,「无限流量」和其他服务看起来更像是在画饼。 如果说「特朗普移动」还有商业上的可行性,那么「特朗普手机 T1」就可能完全是一场骗局了,事实上,这台写满「MAGA」的爱国手机,背地里很可能还是中国制造。 美利坚爱国手机,中国造? 粗制滥造的 P 图,语焉不详的配置列表,一切都在强烈暗示着,这台手机还只是一个幻想,甚至可能没有一台样机。 我们已经在四月进行了详尽分析,要想实现特朗普「美国制造 iPhone」的想法,需要花费数十亿美元和几年的时间,并且生产出来的 iPhone 成本将是现在的数倍。 原因很简单,一台智能手机的原材料和部件供应链遍布全球,而美国连电池中的钴和锂都炼不出来,各种技术和人力成本会直接毁灭 iPhone 傲人的高利润率。 提到「全美产」手机那自然绕不开 Liberty Phone,这台爱国者手机标榜「全部来自美国电子厂的安全供应链」,配置性能极其落后,并且还是有不少零部件来自中国和越南采购,售价 2000 美元,可以买两台 iPhone 16 Pro。 而在部分参数上甚至超越了 iPhone 的特朗普手机 T1,价格仅售 499 美元。 就目前 T1 给出的配置列表来说,其中最高端的零部件就是这块尺寸堪比 iPhone 16 Pro Max 的 6.8 英寸 AMOLED 屏幕,而美国本土基本没有生产 OLED 的先进技术和产业链。 类似的,虽然可以预料到 T1 不会配备一颗先进的摄像头,但里面的 CMOS 传感器,也大概率需要进口。 如果 T1 真的要完全美国制造,并且按时在 3 个月后交付,还只卖这个良心价格,恐怕需要总统特朗普举国之力才能实现了。 实际上,特朗普集团自己也没把话说太死,还是保留了一些余地,发言人特朗普次子埃里克·特朗普称「(T1 手机)最终都可以在美国制造」,言下之意就是,初期 T1 还是一台「全球化手机」。 T1 手机这些即视感满满的配置和设计,让美国网友和行业专家都一致认为,这很可能只是一台「贴牌手机」,并且很可能贴的还是中国制造的 ODM 手机,也就是专门做来贴牌的公版手机,再通俗点说,很多都成了国内的「山寨机」。 这样的推测一出街,媒体和网友纷纷开始在 Amazon 搜寻 T1 手机的真身,最终锁定在了国内立讯精密闻泰科技出品的 Revvl 7 Pro 和道格 DOOGEE Note 58,以及其他几台国产低端手机上。 值得一提的是,这些低端手机电商价格都在 150 美元左右,最高不会超过 200 美元,也就是说如果 T1 手机真的是这些手机贴牌而成,那特朗普集团能从中赚取巨额的利润。 对于大洋彼岸隔岸观火的我们来说,其实不用过于担心 T1 手机真的会导致相关产业链回流美国本土,从而冲击我们本土的制造业,因为这本质上是对规律的违背,破坏美国在全球化阶段形成的成熟商业模式,即将低附加值的制造工序转移海外,利用劳动力价差来赚取足够高的利润率。 就目前的情况来看,特朗普 T1 手机其实离科技数码很远,甚至也和地缘政治也没太大关系,更像是一门算盘珠子打到人脸上的生意,主要面向的人群,就是那一部分对 MAGA 深信不疑,同时出身比较底层的美国群众,他们学历不高,见识也不多,更不可能了解一台手机背后错综复杂的供应链问题。 那个抽象的产品图就像一个筛选受众的「门槛」,也是这台手机的缩影:只卖给那些愚昧到会相信它的人。 别看一个人怎么说,更应该看他怎么做。我相信,即使这台手机能真正问世,特朗普本人可能也只会用它摆拍几张,最终他手里在用的,还会是一台 iPhone。 *封面图源:Fast Company
苹果折叠屏,这次真要来了
从2019年开始,苹果计划生产折叠屏手机的消息就开始在市场上流传。 ​​2019年5月30日​​,美国专利商标局授予苹果一项可折叠屏幕专利,该专利描述了一种柔性显示屏和保护层的设计,适用于iPhone或其他设备。同时,​​有观点认为,苹果最早可能在​​2020年底或2021年初​​推出可折叠屏手机。 之后的6年时间里,苹果折叠屏的有关消息时有出现,但量产时间表依然不明。 比如,2020年底​​,有报道称苹果将折叠屏部件样品送往富士康进行测试,包括超过10万次的折叠测试,并通过了组装质量控制检查。同期,供应链消息称苹果已启动折叠屏iPhone的研发,但进展缓慢,主要因技术难题(如铰链耐用性、屏幕折痕等)。 2021年​​,苹果曾探索两种折叠形态:类似微软Surface Duo的双屏连接设计,以及三星Galaxy Z Flip的翻盖式小折叠方案,但均未进入量产阶段。此后数年,苹果持续申请多项折叠屏专利,包括​​双螺旋铰链​​、​​碳纤维支架​​、​​UTG超薄玻璃​​等,并与三星合作优化屏幕技术。 而在此期间,包括华为、小米、三星等几乎所有的主流安卓手机厂商,都发布了一代又一代折叠屏手机,并已成为直板机之外的主流手机产品。 直到2025年6月,苹果折叠屏手机终于迎来了明确的量产进展。 据苹果知名分析师郭明錤爆料,苹果供应商鸿海精密(富士康)预计将于2025年第三季度末或第四季度初正式开始生产“折叠屏iPhone”。 不过,许多组件规格(包括备受市场关注的铰链轴承)尚未最终确定。目前已经确定的一个部件是,该设备的可折叠显示屏,这将由三星负责提供。目前,三星计划明年为这款设备生产700万至800万块可折叠面板。 郭明錤还指出,最近市场传闻称苹果已订购1500-2000万部“折叠屏iPhone”,但根据其基于对多个组件的了解,“这一数量可能反映了产品2-3年生命周期内的累积需求,而不仅仅是2026年”。 “这表明,预计将于2026年下半年投入批量生产的苹果折叠屏iPhone,可能会在2027年和2028年每年出货数百万部。”郭明錤补充称。 而在手机折叠形态上,苹果的首款折叠设备将采用类似书本的“左右对开”设计,而非上下翻折的“小折叠”形态。 折叠时外屏约5.5英寸,展开后内屏7.8英寸,采用类似三星Galaxy Fold的对折设计,展开后厚度仅4.5毫米,折叠后9-9.5毫米。屏幕由三星显示独家供应,采用UTG超薄玻璃(透光率超90%),并应用苹果专利的“动态张力系统”和填充聚合物技术,实现“几乎无折痕”效果。 折叠屏的核心零部件铰链创新上,苹果的专利显示采用“双螺旋铰链”和反向转轴设计,减少应力集中,提升耐用性。混合钛合金与碳纤维材料,支持20万次弯折测试,结合液态金属和自研零感折痕技术,折痕深度控制在0.1毫米级。 因结构限制,苹果大概率会取消Face ID,改用侧边集成Touch ID指纹识别。售价方面,苹果的折叠屏手机预计售价​​2000-2500美元​​(约1.44万-1.79万元人民币),是苹果史上最贵机型之一。 从各类零部件的性能参数来看,苹果的折叠屏手机与目前在售机型相比,基本没有太明显的优势。而从量产时间来看,苹果则已经落后市场太多。 市场调研机构最新报告显示,2024年中国折叠屏手机出货量达917万台,同比激增30.8%。其中,华为以51.29%的市场份额稳居榜首,荣耀、vivo、三星、小米紧随其后。 值得注意的是,华为已连续第五年领跑中国折叠屏手机市场。 过去五年间,尽管赛道玩家不断涌入、技术参数竞争白热化,华为仍保持年均50.3%的市占率。据行业消息,2025年以来华为折叠屏市场份额进一步攀升至73%,技术壁垒与生态建设持续扩大领先优势。 全球范围内来看,中国也是全球最大的折叠屏手机市场,贡献了全球出货量的一半以上。 2024年全球折叠屏手机销量约为1600万台,相比2023年增长了2.9%。2024年第四季度,全球折叠屏手机出货量为380万部,同比下降18%。华为在2024年第四季度超越三星,以31.2%的市场份额成为折叠屏手机市场的领导者。 所以,苹果的折叠屏手机面临的市场状况与AI几乎一致——落后于行业之后的战略防守。 自从 OpenAI的ChatGPT于2022年引起公众关注以来,科技公司一直在竞相使用生成人工智能来添加更多功能。 去年,苹果发布了Apple Intelligence,展示了它所谓的“为我们其他人打造的人工智能”。这项技术可以帮助总结文本、创建原始图像,并承诺检索最相关的数据。 但迄今为止,Apple Intelligence出现了一系列漏洞和延迟,而竞争对手仍在不断追赶。苹果通过与 OpenAI 合作,成功填补了产品线的空白,但其承诺的一些重大升级,例如全面改进的 Siri 语音助手,仍悬而未决。在6月份的全球开发者大会上,苹果几乎没有在Siri和AI上投入太多精力,而是专注于操作系统的设计改进。 同样,苹果的折叠屏手机也面临着类似尴尬处境。 在基本形态和硬件供应链都已经固定的情况下,苹果折叠屏想要在这种防守中突围,很大程度将取决于苹果能将折叠屏的软件体验做到何种程度。而后者,又与Apple Intelligence的成熟度息息相关。 如果Apple Intelligence迟迟难以完成优化,苹果折叠屏又做不到更惊艳的硬件突破,那消费者将很难为其折叠屏高昂的售价买单。(本文首发于钛媒体APP,作者| 饶翔宇 编辑 | 钟毅
Marshall Kilburn III 体验:50 小时超长续航,在便携音箱属性下的一次踏实升级
这两年来,Marshall 似乎都将更新的重点放在耳机上。 ▲ Marshall Major V ▲ Marshall Monitor II 像是提升了舒适度和续航的贴耳头戴 Major V,还有续航变强的同时也增加了 SOUNDSTAGE 环绕音效的 Monitor III,还有在保持原有紧凑设计的基础上再增加了一点点播放时长的 Emberton III,这三款都是 2024-2025 年度的 Marshall 重点新品。 对,相信你也看出来了。现在的 Marshall,已经把「续航」作为一个重要的更新点。 最近,他们推出了 Kilburn 系列的第三代 产品,就是一款结合和 Marshall 经典的手提设计,主打长续航和注重 Marshall 招牌声音表现的产品。 包装是标准的 Marshall 模式,带手提的硬纸皮包装盒里面装有分开上下两层的纸皮固定结构,结构上层装有说明书和附属的 USB-C to C 充电线。 双层固定结构下,音箱外层还有海绵纸包裹,确保在运输的过程中不会划伤音箱本体。 Kilburn III 造型设计是 Marshall 的经典模式,机身的上侧和左右两侧都有带荔枝皮纹理的物料包裹,正面是黑色滤声网配金色 Marshall 手写体 Logo 的标志性组合。 为了满足 360° 环绕音效的设计,机身后侧也有 3/4 的位置是被滤声网占据。滤声网的左下方有专门为音箱做得导声孔,右侧则是充放电用的 USB-C 口和 3.5mm AUX 口。 来到音箱的控制面板部分,Kilburn III 的面板设置很丰富,有调整音量、高低频输出的三个旋钮,旋钮旁边有常亮的指示灯显示当前状态。 旋钮左侧有模式切换用的 M 键和蓝牙按键,控制播放和电源开关拨杆则放在了操控区域的两端。 开关虽然用了 Marshall 传统音箱的拨杆造型,但本质上都还是带弹性的摇杆结构。如果可以做成更传统的开关摇杆结构,手感更好也会更耐用。 Kilburn III 这里的设计模式和其他 Marshall 便携式音箱相同,都是把音频接口放在后侧,而不是放到上侧的面板里,不然配上黑色的弹簧 AUX 线,看起来会更有 Marshall 的味道。 提到 Kilburn 系列,自然也少不了它的提手。 提手外侧是荔枝纹理的皮质,内侧就加上了绒布处理,边缘有一定的硬度,整体相对柔软,用来提起这个 2.8kg 的「小音箱」也很合适,拿着走并不会觉得很累。 作为有提手的 Marshall 音箱,Kilburn 在 Tufton 系列这些大哥面前还真的只能算的是小音箱。 273mm x 150mm x 169mm 的机身尺寸也就比常规的邮差包稍大一点,2.8kg 的重量感觉是达到了手提移动舒适度的极限。机身支持 IP54 防水防尘,假日如果想要拿它到户外感受大自然,或者做一些简单的室外小活动,只要是公共交通可以到的地方,并且不需要太长时间的步行,都是 Kilburn III 的适用范围。 当然,你如果本来就是驾车一族,那长时间把 Kilburn III 放在后备箱也很合适。 但如果是在长距离的登高活动,又或者是只能步行才能到的地方,那选 Middleton 和可以多台连接的 Emberton 系列会更合适。 连接性能方面, Kilburn III 支持蓝牙版本从 II 代的 5.0 升级到 5.3,并支持 Auracast 技术。但上一代支持的 aptX 传输编码,这次就没有加入进来了。 考虑到 Marshall 的声音风格,以及大部分时间都主打在共享声音内容和提供氛围音乐的活动场景,声音传输规格升级带来的细节提升对于 Kilburn III 似乎不那么重要。基本上,听流媒体和看视频时用到 AAC 其实已经足够了,这里没有 aptX 的影响并不大。 机身的三款旋钮都采用了无级设计,周边的灯带可以更细致地看到目前调整的音量和高低频输出。搭配 Marshall app,用户可以将目前的输出模式记录预设模式,然后透过短按 M 键快速切换。 续航方面,Kilburn III 能够实现约 50 小时的播放,比只能播放 20 小时的 Kilburn II 要长一倍有多。更长的续航,拿到户外进行大音量播放页不需要担心了。 机身背后的 USB-C 口同样支持 30W 的 PD 通用快充,充电 20 分钟则可以播放 8 小时,整机充满大约是 3 小时。在户外不够电的话,则能够用支持 PD 的移动电源就可以供电。 此外,Kilburn III 同样支持反向供电,可以简单给手机、手表和耳机充个电。 充电口旁边是 3.5mm AUX 音频接口,面对没有蓝牙的老设备,用户可以通过另购一根 3.5-3.5 的音频线连接播放。 只不过,Kilburn III 开机时会优先连接蓝牙,如果你想切换到有线模式,那用之前最好就先把周边无线连接过的设备都先断开。这个设计在 Marshall 的便携式音箱,像是 Middleton 这一类产品里面一直都存在,要是之后能提供一个模式切换的开关按钮,用起来会更加舒服。 声音的部分,Kilburn III 搭载了 2 个 2 英寸全频单元搭配 1 个 4 英寸低音单元的 2+1 三单元组合,全频单元由 2 个 10 瓦的 Class D 放大器驱动,低音单元则由 1 个 30W 的 Class D 放大器驱动。 箱体加入了低音反射式设计,所以我们在机身后侧的左下角看到低音反射孔。 外观的部分也提到,Kilburn III 采用了无盲区的立体声布局,前后都设有滤声网,都是能够发声的设计。所以在家中摆放的时候还是要注意,最好不要离墙太近,以免影响声音。 听感方面,Kilburn III 还是 Marshall 音箱很熟悉的感觉,低频能量感很足,极具冲击力。底部四个带防滑垫的脚给音箱足够的稳定性,听摇滚时足够震撼,歌手和背景之间预留出距离,不会粘合在一起。有些时候,人声的位置还可以再靠前一点,有种主唱靠近你贴脸输出的感觉。 听相对温和,但鼓点带出强节奏感的流行曲时,低频饱满的 Kilburn III 很容易就能够让听者感觉得声音变厚。每一下都铿锵有力的低频加持下,听感也变得再饱满厚实一点。 不过,有些时候低频的输出会太过于主导,给人一种抢戏的感觉,听起来不那么平衡。 另外,Kilburn III 的声音表现也不太适合在小空间里面做低音量播放,空旷的户外和能吃得住这能量的室内空间才是它能发挥的场地。 如果你把它当做书房小音箱,夜间小小声欣赏一下音乐,那未必能够听出它的实力。多带它走到户外,或者投入到在亲朋好友的聚会中,才是它发光发热的地方。 整体来说,Kilburn III 还是一款非常 Marshall 的常规升级产品。 造型上,经典的黑色滤声网搭配金色手写体 Marshall 字体,还有金色面板上附带三大旋钮和拨杆造型的开关,这看起来就很经典很 Marshall。 如果配件里面能够附带一条 3.5mm 弹簧线,又或者把开关设计成真拨杆的同时讲 3.5mm 接口转移到面板上,这会让 Kilburn III 的传统 Marshall 味更浓。 机身精致,放在家中也是一件兼顾好看和兼顾个人声音偏好的摆设。 方便移动的机身搭配相对轻巧的重量,还有 IP54 防水防尘机身和能量满满的声音输出加上不需要担心的续航,让 Kilburn III 拥有了走出去的灵活。 加上前些年精致的户外活动和露营文化的影响,我会觉得这才是 Kilburn III 的主力场景。 定价方面,Marshall Kilburn III 国行售价为 2899 元,目前已经上线。
3B挑战70B!月之暗面Kimi-VL新版开源:数学、视频等多项指标超越GPT-4o
作者 | 李水青 编辑 | 心缘 智东西6月23日报道,月之暗面今日开源多模态模型Kimi-VL-A3B-Thinking-2506,这是其首个开源多模态推理模型Kimi-VL-A3B-Thinking发布两个月后的更新版本,可凭借2.8B激活参数(16B总参数)在多项测评中超越GPT-4o、Qwen2.5-VL-7B等模型。 ▲Hugging Face截图 与之前的版本相比,2506版本提供了多项全新或改进的功能: 1、它在消耗更少tokens的同时思考得更聪明:2506版本在多模态推理基准上达到了更好的准确率:MathVision上得分为56.9(+20.1),MathVista上为80.1(+8.4),MMMU-Pro上为46.3(+3.2),MMMU上为64.0(+2.1),而平均需要减少20%的思考长度。 2、思考过程更清楚可见:与之前的思考版本不同,2506版本在一般的视觉感知和理解上也能达到相同甚至更好的能力,例如MMBench-EN-v1.1(84.4)、MMStar(70.4)、RealWorldQA(70.0)、MMVet(78.4),超越或匹配其非思考模型(Kimi-VL-A3B-Instruct)的能力。 3、扩展至视频场景:2506版本在视频推理和理解基准方面也有显著提升。它在VideoMMMU上为开源模型刷新记录(65.2),同时在通用视频理解方面也保持了良好的性能,在Video-MME上达到71.9,与Kimi-VL-A3B-Instruct相当。 4、分辨率进一步提升:2506版本支持单张图像320万像素(1792×1792),比上一版本提升了4倍。这在高分辨率感知和OS-agent基准测试中带来了显著提升:在V* Benchmark(未使用额外工具)上得分为83.2,在ScreenSpot-Pro上得分为52.8,在OSWorld-G上得分为52.5。 具体来看,与业界顶尖模型和Kimi-VL的两个先前版本的比较,2506版本测试性能明显提升: 在通用多模态方面,2506版本在MMBench-EN-v1.1(Acc)、OCRBench(Acc)、MMStar(Acc)、MMVet(Acc)多项测评的得分超过OpenAI的GPT-4o。 在推理能力方面,2506版本在MMMU(val,Pass@1)、MMMU-Pro(Pass@1)上的测试成绩超过Qwen2.5-VL-7B、Gemma3-12B-IT,不如GPT-4o,但差距有所缩小。 在数学能力方面,2506版本在MATH-Vision(Pass@1)、MathVista_MINI(Pass@1)中得分大超GPT-4o。 在视频能力方面,2506版本在VideoMMMU(Pass@1)、MMVU(Pass@1)、Video-MME(w/sub.)多项测评中超过Qwen2.5-VL-7B、Gemma3-12B-IT,与GPT-4o的差距缩小。 在Agent落地方面,2506版本在ScreenSpot-Pro(Acc)、ScreenSpot-V2(Acc)、OSWorld-G(Acc)测试中得分都超越Qwen2.5-VL-7B。 在长文本方面,2506版本在MMLongBench-DOC(Acc)测试中超越Qwen2.5-VL-7B,与GPT-4o接近。 如下图所示,与30-70B的开源模型对比,2506版本的大部分测试已经超越Qwen2.5-VL-32B、Gemma3-27B-IT,看齐Qwen2.5-VL-72B。 来源:Hugging Face
一场没有“罗永浩”的直播,为百度AI正名
作者 | Yoky 邮箱 | yokyliu@pingwest.com 5500万GMV,这可能是迄今为止,一个AI数字人单次直播带来的最高销量。 过去几年内,数字人直播代替真人主播的传言总是一波又一波,空无一人的直播基地无数手机屏幕“自动地”产生着GMV,这个画面曾经击中了无数网友的心。但现实是,这些数字人们机械重复的动作、无法随机应变的话术反而让真人主播们都松了一口气。 但这次,真正的转折点来了。6月15日,罗永浩数字人在百度直播的第一次亮相,连播近7小时,达成了1300万人次观看、GMV突破5500万的成绩,不仅破了AI数字人圈里的记录,甚至超过了真人的记录——互动量超真人直播间3倍。 一直以来,数字人技术成熟度的一个核心评判标准,都是与真人主是否存在差距,以及有多大的差距。而在此次的直播间,弹幕里“这是真的还是假的”的评论不断刷屏,已经证实了这次AI数字人的惊人效果。 更重要的是,这不是一次炫技式的表演,而是百度AI在真实商业环境的实战演练。当整个行业还在为文生视频的“确定性” ,百度已经用AI为商家和创作者们端起了第一个能真正“养活”自己的“饭碗”。 如何用AI炼成“真”罗永浩? 这背后并非单一模型的技术突破,而是一套多模协同的数字人技术。简单来说,这套技术将语言大模型置于“总导演”的位置,统筹指挥着语音、视觉等各个“演员”,完成了一场几乎以假乱真的演出。 与传统数字人技术形成鲜明对比的是,过去的方案往往采用语言、语音、视觉三条独立流水线,各自生成内容后再强行拼接,这必然导致音画不同步、表情僵硬、言语乏味等问题。 百度的技术方案重点包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成五项创新技术,实现了数字人“神、形、音、容、话”的高度统一。最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。 具体而言,“剧本”模型扮演了总指挥的角色。它在生成时输入的并非只有文本,而是包含商品信息、历史视频、主播人设要求等多模态信息。剧本会生成对视觉和语音的具体要求,即所谓的“标签”,为后续的视觉和语音模型提供方向性指引,从而确保内容、语气和表情在语义上的高度一致性。 百度集团副总裁吴甜告诉硅星人,多模态协同的难点在于多个模型对于要求的理解是一致的。这意味着从剧本(导演)到语音、视觉(演员),整个团队对表演基调有统一认知。同时,各个演员(各模态模型)又保有自己的“发挥空间”,比如语音模型会根据自身对文本的细粒度理解调整语调顿挫,而不是完全被剧本的词语锁死。 以罗永浩数字人剧本为例,基于文心大模型4.5 Turbo生成的剧本,充分展现了主播的个人特色,具备典型的罗氏幽默风格,并能够实现双人主播的内容协同,动态实现丰富的实时互动。 在单体完成“真老罗”的打造后,体现直播生命力的实时互动成为另一个更关键的挑战。面对评论区海量、无序的用户提问,以及与助播的配合上,数字人如何做到实时、自然的回应?这背后是一套动态决策系统。 在直播过程中,模型并非对每个问题都立即回复。系统会对评论区进行智能分析,结合主播当前的讲解节奏,选择合适的时机、合适的问题,以及合适的回答策略进行触发。这种“谋定而后动”的机制,远比简单的“一问一答”更接近真人主播的互动逻辑。 为了彻底解决实时生成的延迟问题,百度采用了“流式生成”的工程化设计。语言、语音、视觉三个模态并非串行等待,而是像流水线一样并行工作,极大缩短了用户感知的时延。同时,系统采用“离在线统一”的方法,部分可预见的交互内容可以提前处理,而需要即时反应的部分则在线动态生成。通过系统性优化,成功解决了生成视频这类高耗时任务的卡点问题,最终实现了丝滑的交互体验。 更进一步地,在双人直播中,大量的打断、复说、抢话等场景对语音合成提出了极高要求。吴甜提到,通过引入“对话上下文解码器”,模型能够结合历史对话信息进行推理,从而实现老搭档之间那种默契、自然的对话流。 在数字人形象生成以及驱动方面,百度通过结合多模态视频理解、跨模态信号生成、视频生成等技术,克服了高可控交互,高精度、长时间一致性保持等难点,实现了高一致性超拟真罗永浩数字人长视频生成。 而且在此过程中,能保证语音、口型、表情与动作始终保持高度同步,从而实现真正的「音、容、话」一致。 从炼成“罗氏幽默”到跑通商业闭环,百度数字人不仅为行业树立了新的技术标杆,更重要的是,它为AI技术如何从“热搜”走向真实的生产线,提供了一份极具说服力的答卷。 不要“超级应用”,要“超级有用” 对于在直播电商红海中拼杀的千万商家而言,现实的挑战正变得愈发尖锐:头部主播签约费动辄千万,自建团队每月固定开销数万甚至数十万,而流量获取成本却在持续攀升。在这种环境下,如何在保证效果的前提下控制成本,成为每个商家必须面对的生存课题。 数字人技术,一度被视为破局的希望。然而,早期的数字人更像是一个“不知疲倦的播报员”,形象呆板、互动生硬,无法传递信任,更遑论激发购买欲。它们解决了“有没有”的问题,却没能解决“好不好用”的核心痛点。市场真正需要的,不是一个仅仅能节省成本的“工具”,而是一个能真正替代真人、创造价值的“战力”。 那么,一个“真正可用”的数字人到底意味着什么?它不仅要形象逼真,更要具备三项核心能力:能理解商品、能与人互动、能建立信任。罗永浩数字人直播的案例,恰恰为这三点提供了行业标尺。它不再是简单的产品复读机,而是能用“罗氏幽默”与观众调侃,能根据实时提问调整讲解策略,最终实现了与真人主播几乎无异的带货效果。 从商业角度审视,这背后反映的是两笔关键账目的变化: 第一笔是成本账。数据显示,数字人直播能平均降低约80%的成本。这意味着商家可以将过去投入在昂贵主播身上的预算,转移到供应链优化和市场推广上,彻底重构成本结构。千元级别的投入,就能获得一个7x24小时在线的主播,这在过去是不可想象的。 第二笔是效率账。在保健品、教育、旅游等需要深度讲解的品类上,知识储备无限、表达精准无误的数字人,其转化效率已开始超越真人。对于拥有好产品但缺乏优秀主播的商家,或是不希望核心名师被直播消耗的教育机构而言,数字人代表着一条全新的增长路径。 “好用”的数字人并非凭空而来,它的出现反映了不同公司在技术路径上的战略分化。当我们从市场应用效果反推其背后的技术逻辑时,百度的选择便清晰地浮现出来。 当前行业的主流叙事集中在卷模型,各家比拼参数规模和基准测试成绩。而百度的路径更偏向卷应用,这一选择的底气源于其在多模态技术上的长期积累。 这种“应用为王”的战略,最终指向的是生产力的规模化落地。复刻罗永浩更多是技术天花板的展示,其真正的商业价值在于将这种能力以低门槛、可复制的方式赋能给广大中小商家。百度电商总经理平晓黎在接受采访时表示,相比追逐头部IP,更倾向于“让更多的中小商家、腰部商家,还有创作达人能够做起来”。 更关键的是,这条路径验证了AI产业期待已久的商业闭环。从行业发展的角度看,罗永浩数字人直播的意义远超一场带货本身。它为AI产业提供了一个清晰的价值验证:技术的最终价值必须通过为实体经济创造可度量的商业成功来检验。这种“超级有用”的路径,或许比追逐“超级应用”的概念更具现实意义。当然,这种模式能否被广泛复制,以及在更多垂直领域的适用性,仍需要市场的进一步检验。
千亿巨头AI子公司赴港IPO:卖智能装备,年入174亿
作者 | 陈骏达 编辑 | 心缘 智东西6月23日报道,6月20日,中国智慧农业龙头潍柴雷沃向港交所提交上市申请,独家保荐人为中金公司。 潍柴雷沃的前身山东福田重工成立于2004年,注册地为山东省潍坊市,注册资本约为1.15亿元。2022年8月,潍柴雷沃更名为现有名称,同年9月,潍柴雷沃在中金公司的保荐下向深交所提交上市申请,但在2024年4月主动撤回了上市申请。 港股招股书显示,潍柴雷沃在中国的农机装备市场、智能农机市场、智能拖拉机市场、智能收获机械市场均位列全国第一,并打造了一套涵盖农业生产全周期的智慧农业整体解决方案,融合了成套智能农机装备与智慧农业服务。2024年,潍柴雷沃的营收达到173.9亿元,同比增长18.5%;同期其经调整净利润为9.8亿元,同比增长12.1%。 其高端化、智能化的农机装备主要解决了“谁来种地”的问题;而结合IoT、AI、大数据技术的智慧农业服务,则助力企业实现“科学种地”。 目前,潍柴雷沃尚未披露其计划募资额,该公司计划将所募集资金用于建设高端农机装备生产基地、生产线智能化升级、智能农机和智慧农业解决方案研发及海外业务拓展等用途。 一、年入百亿、毛利率约13%,中国市场营收占比超9成 智能农机是指融合AI、远程通讯、大数据、云计算、传感器、自动控制等现代信息技术与农业机械装备技术,实现农业生产过程自动化、精准化、智能化的新型农业机械系统。 智能农机显著提升农业生产效率、降低资源消耗、减少人力成本,有望帮助解决中国农业劳动力不足、人工老龄化问题突出、农业经营模式落后等问题。 2022年-2024年,潍柴雷沃的营收分别为159.5亿元、146.8亿元和173.9亿元,同期,其年度利润为7.7亿元、8.7亿元和9.6亿元。2023年,潍柴雷沃的营收同比下降,这与2023年排放标准变化引发的短期需求下滑有关。 ▲潍柴雷沃2022年-2024年营收、年度利润和研发费用变化(智东西制图) 2022年-2024年,潍柴雷沃的研发开支分别为5.7亿元、6.8亿元和8.4亿元,分别占同年度营收的3.6%、4.6%和4.8%,占比逐年扩大。 潍柴雷沃目前已经向全球超过120个国家和地区的客户提供了产品与解决方案,按地理区域划分,海外市场在其营收中的占比正逐年提升,2024年占比已超10%,海外业务收入CAGR(复合年均增长率)超过30.0%。但中国市场仍是其主要市场,占同期营收的比重超9成。 材料成本是潍柴雷沃最大的成本项之一,2022年-2024年,其材料成本分别为125.3亿元、115.8亿元和127.6亿元,占当年度总销售成本89.2%、91%和91.2%。 2022年-2024年,潍柴雷沃的毛利分别为19.1亿元、1.94亿元和23.0亿元,同期毛利率分别为12.0%、13.2%及13.2%。按产品类别来看,潍柴雷沃各个产品线的毛利整体呈增长趋势,农机销售的整体毛利率从2022年的13%增长至13.2%,与业内其他可比企业的毛利率处于同一水平。 二、研发团队规模业内最大,拥有近2500项专利 目前,潍柴雷沃的智能农机设备已经覆盖耕整、种植、田间管理、收获、秸秆处理与粮食烘干等现代农业生产的各个环节,能够满足客户针对不同作物、不同农艺、不同工况和不同规模的应用场景需求。 与此同时,其智慧农业整体解决方案实现将经验与数据转换为自动化、精准化的田间作业指令,赋能各类智能农机装备协同作业,提供高效、科学的农业生产解决方案。 报告期内,潍柴雷沃持续投入上述两大领域的研发,具体研发领域包括农机装备智能化升级、拓展新能源领域、分阶段研发农业机器人、系统升级驱动智慧农业效能升级等。 招股书显示,截至2024年末,潍柴雷沃拥有行业内规模最大的研发团队,总人数超过2500人,硕士及以上学历占比33.5%。该公司构建了“中国+日本+欧洲”全球协同研发体系,以潍坊研发总部为基础,充分利用欧洲、日本等重点区域全球技术资源。 产学研合作方面,潍柴雷沃与中国科学院、中国农业大学等50余家科研机构,以及罗锡文、赵春江院士等顶尖行业专家建立合作,共同承担了110余项国家、省部级重点项目,突破多项行业技术关键技术。 截至2024年末,潍柴雷沃已在中国大陆已取得2443项专利,其中包括1905项实用新型专利、168项发明专利及370项外观设计专利;其在中国大陆以外亦持有49项专利,还主导和参与了26项国家标准、18项行业标准和56项协会标准的制定。 三、客户集中度较低,山东重工为主要供应商 潍柴雷沃能提供高端化、智能化的成套农机产品,拥有涵盖不同马力区间、不同技术路线的拖拉机、收获机械和农机具。 截至2025年4月30日,潍柴雷沃已在20多个省市落地60多个智慧农场项目,服务超2万家种植户。其智慧农业管理平台用户累计超3.74万人次,服务土地面积超800万亩,覆盖全国31个省份,其中500亩以上的大客户超过600家。 潍柴雷沃主要将产品销售给经销商合作伙伴和直接销售客户,后者主要包括农业企业。2022年-2024年,来自其前五大客户的销售收入分别占其当年度总营收的5.5%、6.0%和5.2%,而同期来自其最大客户的销售收入分别占总营收的1.1%、1.4%和1.3%,客户集中度较低。 潍柴雷沃的供应商主要包括原材料、零部件和组件以及车辆发动机的供应商。2022年-2024年,该公司从前五大供应商的采购金额分别占同期总采购金额的22.6%、27.0%和28.7%。同期最大供应商的采购金额分别占总采购金额的10.0%、16.6%和19.3%。报告期内,其最大供应商均为山东重工集团。 四、山东重工为实控人与控股股东,高管均为行业老兵 以下为潍柴雷沃的股权架构图: 山东重工通过潍柴动力和潍柴控股分别持有潍柴雷沃61.10%和27.26%的股权。山东重工合计有权控制潍柴雷沃约88.36%的投票权,为潍柴雷沃的实际控制人和控股股东。潍柴雷沃其他主要股东包括中央企业基金、欠发达地区基金等。 潍柴雷沃的法定代表人为该公司董事长、总经理、执行董事王桂民,于2008年9月加入潍柴雷沃,先后担任多个关键职位,包括执行总裁和总经理。自2024年12月起,王桂民担任潍柴雷沃董事长。 加入潍柴雷沃前,王桂民曾于1991年-2008年在北汽福田长期任职,最高职务为北汽福田总经理助理。王桂民拥有山东理工大学汽车及拖拉机工程学士学位、大连理工大学动力工程硕士学位和江苏大学管理科学与工程博士学位。 潍柴雷沃执行董事兼总经理王健于2024年12月加入该公司,此前他在潍柴动力长期任职,曾担任总质量师和副总工程师等职务。王健拥有武汉理工大学机械工程与自动化学士学位和天津大学机械工程硕士学位。 潍柴雷沃执行董事、财务总监兼董事会秘书王俊伟于2021年9月加入该公司,他此前也长期在潍柴动力任职,并曾担任上市企业山推工程机械股份有限公司的副总经理与财务总监。 2022年-2024年,潍柴雷沃的高管、董事和监事以薪金、花红、股份等形式,分别领取了241万、250万和279万的薪酬。 结语:智慧农业市场迎来发展机遇期 AI技术正快速渗透至农业、传统制造业等行业,助力产业升级。随着AI技术的不断成熟、高标准农田建设推进、土地规模化经营加速及“优机优补”政策实施,智慧农业市场或将迎来发展机遇期。 智慧农业正从 “经验驱动” 转向 “数据驱动”,以智能农机为基础,融合生物技术、信息技术、AI、大数据技术等,实现农业生产全过程的数字化感知、智能化决策、精准作业和智慧化管理。 作为业内龙头企业,潍柴雷沃有望通过在智能农机和智慧农业领域的技术研发、产品创新和市场拓展,成为行业发展的重要推动者。
制糖工厂发布硬糖® C³ 多口智能充电头,以超小体积实现高功率与智能调度的全面突破
广州,2025 年 6 月 18 日 制糖工厂今日正式发布全新 硬糖®充电头 C³(68W,3 个USB-C 端口 ),一款兼顾体积、功率与智能调度的全 C 口充电器,它首次搭载 TimiC(Timing intelligent Charge)时序调度充电方案,实现比传统「拔插时智能分配」更智能、更高效的功率调度体验。 兼顾体积、功率与智能调度的充电头最优选 硬糖 C³ 延续制糖工厂一贯的设计美学,外观精致、质感考究,承袭品牌标志性的复古优雅风格,主打「超便携 × 全 C 接口」的组合,专为差旅场景与极简用户打造。 C³ 代表「Chic、Convenient、Compact」的组合,面对当下用户对高效出行的迫切需求,硬糖 C³ 聚焦那些追求品质、讨厌「带一堆充电头」的旅行者与创作者,希望为他们提供一个兼顾体积、功率与智能调度的充电头最优选: 配备三路独立电路,三枚 USB-C 接口,全面支持主流设备快充,是出行多设备用户的理想选择; 极致小巧、轻盈便携,机身体积仅与 AirPods 相当,轻松收纳于口袋或旅行包中; 68W 总功率支持持续满功率输出,无需依赖温控机制,性能稳定可靠; 三口持续不断连,无掉线、无重启,支持多设备同时流畅充电; 优异的电气性能,输出纹波仅 34mV,远低于国家标准 200mV,更加安全稳定; 复古精致的外观设计,在功能与审美之间实现完美平衡,为日常使用增添质感体验。 无论是出差、旅行还是日常办公,硬糖 C³ 都以轻巧体积和强劲性能,为用户带来更少负担、更高效率的移动充电体验。 智能分配方案再升级,「TimiC 时序调度」更快、更稳、更省心、更安全 在设计之外,制糖工厂在技术层面同样追求极致,不断打磨充电体验,力求做到更快、更稳、更省心、更安全。 硬糖 C³ 首次搭载 TimiC(Timing intelligent Charge)时序调度充电方案,在传统「智能分配」(仅在拔插时按功率分配表分配)的基础上实现显著升级,为多设备充电带来更高效、更精准的调度体验。 ·识别连接顺序,动态优先分配 TimiC 能自动识别设备的接入顺序。当同时插入两个设备时,系统会优先为首个连接的设备分配更高功率,后插设备获得剩余输出,从而保障主设备实现快速、高效的充电。 ·智能调控 + 全程定时调度,高效且不浪费 TimiC 采用「初始智能调控 + 持续定时调度」的双阶段策略,动态优化多设备间的功率分配: 初始阶段:每次设备插拔后的 2-4 分钟内,系统通过内置定时器检测功率变化,按需智能调整分配策略,更贴合设备的即时需求; 持续阶段:随后系统每隔 3-5 分钟自动检测当前用电状态,实时调整功率输出。例如,当主设备充满电后,其释放出的功率可立即转供其他设备,提升整体充电效率。第二个设备由此可获得更大功率,实现更快速的补能。 ·多口同步反馈,输出稳定可靠 每一次功率调整均同步反馈至所有端口,确保多设备同时充电时依然保持稳定、均衡的输出状态。 ·自动复位机制,精准响应插拔操作 无论哪个端口的设备发生插拔或状态变化,系统都会立即重置至初始状态,并重新进行功率分配,确保每一次连接都高效、可靠、无延迟。 注:硬糖充电头 C³ 首次搭载 TimiC 时序调度为基于规则的算法,虽不如小电拼 SDC 的 FluxAI 自由流(市面唯一真正 AI 智能充电方案)技术先进,但在非 AI 技术架构中,TimiC 已展现出远超行业平均水平的智能表现。 关于制糖工厂 制糖工厂CANDYSIGN 是一个专注极致美感和灵活多用电能产品的先锋品牌。秉承「好产品就是一颗糖」的理念,我们融合科技、艺术与时尚,服务全球最具创造力和生产力的个体,打造兼具审美与人文关怀的「明日产品」。以灵活技术与前瞻设计为驱动,我们专注于可持续发展,持续探索数字电能的无限可能。
奔驰纯电CLA高环实测数据出炉:续航里程1071公里,能耗8.26千瓦时/百公里
凤凰网科技讯 6月23日,今日,奔驰官方公布了今年4月全新纯电CLA在测试场高速环道的实测表现。纯电CLA在高速环道中实现1071公里续航里程,平均能耗仅为8.26千瓦时/百公里。在平均车速达到120公里/小时的苛刻条件下,仍能保持572公里的续航表现。 奔驰纯电长轴距CLA与今年四月亮相,这是MMA平台首款国产车型。当时官方表示该车在CLTC工况下续航里程高达866公里,能耗为10.9千瓦时/百公里。 为了实现这样的高速能效,全新纯电CLA搭载了多项关键技术。其中最引人注目的是同级车型中唯一搭载的电动两挡减速箱。该系统采用低速齿比11:1和高速齿比5:1的设计方案,使电机能够在不同工况下始终运行在高效区间内。传统纯电车型在高速行驶时电机转速攀升,导致电驱系统工作效率下降,而该变速箱技术有效解决了这一行业痛点。 此外,为了缓解用户的心理焦虑,奔驰在车辆的续航显示逻辑上也进行了优化,提供了基于多种因素综合计算的三种续航显示模式(最大、最小、个性化),旨在提升里程预估的精准度。 而在应对冬季空调耗电的难题上,该车采用的多源热泵系统能够有效回收并利用来自空气、电驱系统和电池的余热为车内供暖,显著降低了冬季的续航衰减。配合800伏高压平台、碳化硅逆变器以及精细化的能量回收策略,全新纯电CLA构建了一套完整的高效能源利用体系,让电动车长途高速出行变得更加从容。
Switch 2日本销量超越Xbox Series X/S及PS5数字版终身销量
IT之家 6 月 23 日消息,上市仅仅几周,任天堂 Switch 2 在日本的销量就已经超过了 Xbox Series X、Series S 以及 PS5 数字版的终身销量。鉴于其前代产品的表现以及预购的火爆程度,这款游戏机在上市前就已注定会在销售上取得成功。如今,任天堂 Switch 2 已经上市几周,其引起的轰动甚至超出了一些人的预期。 IT之家注意到,任天堂 Switch 2 自上市以来,迅速成为历史上销售速度最快的主机,短短几天内就售出了 350 万台。相比之下,自 2022 年推出以来,Steam Deck 的累计销量在 400 万至 500 万台之间。 根据日本知名游戏杂志《Famitsu》的统计数据,截至 6 月 15 日,任天堂 Switch 2 在日本的销量已经达到 110 万零 1136 台。尽管 PS5 数字版和 Xbox 所有当前世代硬件已上市多年,但 Switch 2 的销量仍超过了它们。Xbox Series X 在日本的销量仅为 30 多万台,而 Xbox Series X 数字版的销量甚至不及 Switch 2 一周的销量。 尽管目前尚不清楚任天堂 Switch 2 能否持续保持如此迅猛的销售势头,但其良好的开局已经为未来的市场表现奠定了坚实基础。任天堂的上一代主机 ——Switch,是美国历史上销量最高的主机,于 2024 年超越了 PS2,并在日本市场售出了超过 2000 万台。随着 Switch 2 的推出,其市场表现无疑将备受关注。
小米YU7发布前夕,李斌雷军积极互动谈讨纯电SUV
凤凰网科技讯 6月23日,小米旗下首款SUV车型YU7发布在即,雷军在微博发布了很多相关信息,车圈大佬也积极在社交网络互动。蔚来创始人李斌与小米集团创始人雷军在社交媒体上进行了公开互动,两位行业领军人物相互预祝对方产品成功还对SUV车型进行了深入探讨。 这一互动源于雷军此前对小米首款SUV产品定位的详细阐释。面对市场对于小米YU7为何不选择当前热门的6座SUV布局的质疑,雷军从SUV概念本源进行了回应。他指出,SUV中的“S”代表Sport(运动),因此小米YU7将专注于运动性能的提升,而非简单迎合市场对大空间的需求。 雷军强调,小米YU7的产品理念是在保证豪华运动性能的基础上兼顾日常使用的舒适性需求。他表示,虽然新能源时代配置丰富度很重要,但驾驶体验同样不应被忽视,小米YU7将在这两者之间寻求平衡。 蔚来方面的回应同样耐人寻味。李斌在互动中明确了乐道L90的产品差异化策略,该车型将于7月上旬开启预售,主打空间与能耗的极致表现。据李斌介绍,乐道L90能够实现三排座椅的舒适性配置,同时提供更大的行李储存空间。 值得注意的是,李斌还强调了蔚来在基础设施方面的优势。全国8000多座充换电站网络成为乐道L90的重要卖点,这一数字体现了蔚来在补能基础设施建设方面的领先地位。 从两家企业的产品策略可以看出,新能源SUV市场正在形成明显的差异化竞争格局。小米YU7专注运动性能定位,试图在驾驶体验上与竞争对手形成区别;而乐道L90则强调空间实用性和补能便利性,依托蔚来的基础设施优势构建竞争壁垒。 这种公开互动反映了新能源汽车行业竞争环境的理性化趋势。随着市场竞争加剧,企业更加注重产品差异化和细分市场定位,而非简单的价格战或营销话术对抗。 从时间节点来看,7月将成为新能源SUV市场的关键时期。小米YU7与乐道L90两款产品的市场表现,将在一定程度上验证不同产品策略在消费者心中的接受度,为行业后续发展提供重要参考数据。
30 块钱跑一趟!特斯拉 Robotaxi 高调落地,马斯克的梦想终于照进现实
今天凌晨,在经历了 12 年的漫长期待与无数次的跳票之后,特斯拉的 Robotaxi(自动驾驶出租车)终于在德克萨斯州奥斯汀市的街头,悄然开跑。 这场备受瞩目的首秀,呈现出一种奇特的矛盾感。 一方面,其运营规模极其谨慎:仅有约 10-20 辆 Model Y 展开服务,服务范围被严格限制在奥斯汀中南部的电子围栏内,避开了市中心的复杂路况;乘客采取邀请制,包括特斯拉员工、部分车主及 KOL。更关键的是,每辆车的副驾驶位上,都配备了一名「安全监控员」。 而另一方面,其传播声量颇为高调。马斯克亲自在社交媒体上大量转发首批体验者的视频,将这次小范围的内部测试,放大成了一个全球科技圈都在关注的焦点事件。 热烈祝贺特斯拉 AI 软件和芯片设计团队成功发布 Robotaxi!!这是十年艰苦奋斗的结晶。AI 芯片和软件团队都是特斯拉从零开始建立的。 马斯克的字里行间充满了对团队和自研路线的自豪。 掌镜的是特斯拉首席软件工程师段鹏飞,毕业于武汉理工大学,后于俄亥俄大学获电子工程硕博学位。 一次「脚尖探水」式的落地 对于那些有幸收到邀请的「早鸟」用户而言,体验一次特斯拉 Robotaxi 的流程,既充满了未来感,也透露着无处不在的谨慎。 那么,体验一次真正的特斯拉 Robotaxi,流程究竟是怎样的? 首先,你需要通过一个界面颇具赛博朋克风格的手机 App,确认自己处于奥斯汀南部的服务区内,下单成功后,一辆没有驾驶员的 Model Y 便会向你驶来。至于价格,马斯克统一定在了 4.2 美元——一个充满争议的亚文化的数字。 如果你点击了打赏,它会告诉你「这只是在开玩笑」。 当车辆抵达后,其外部灯光会闪烁以帮助你进行识别,但车身并没有像 Waymo 那样独特的标识,仅在车门处印有「Robotaxi」的字样。 上车之后你会发现,车辆会自动同步你的座椅位置,音响系统也会播放你平时最爱的音乐,为你营造出一种「像是进入了自己车」的熟悉感。 后排的屏幕会进入专属的 Robotaxi 模式,你需要长按屏幕上的一个圆形按钮来开始行程。行程中,你也可以操控空调和影音系统,但前排的中控大屏则无法操作。 根据多位 KOL 分享的体验,Robotaxi 的整个乘坐过程平稳、顺畅,体验甚至比之前的 FSD 更好。一位名叫 Zack 的用户表示:「在减速带上减速效果非常好,停车也非常平稳。」 在乘坐了 3 次之后,Farzad 也给出了它的评价:它对 Robotaxi「平稳舒适」的运行状态毫不意外,但当他意识到这辆实现无人驾驶的汽车,和他买的那辆 Model Y 一模一样时,他的内心受到了巨大的冲击。 一些人性化的细节也值得称赞。例如,下车时,屏幕会提示乘客使用按钮开启后备箱(如果乘客在上车前有打开的话),并附有如何打开车门的图文说明,确保隐藏式门把手不会给新乘客带来困扰。 当然,在这看似流畅的体验之下,是特斯拉近乎「步步为营」的战略考量。 副驾驶位上时刻端坐的「安全监控员」、车外待命的远程操作员、严格的地理围栏、避开市中心复杂路口的路线规划、以及仅在良好天气下运营的限制,每一个环节都在尽力规避风险。 坐在副驾的安全员可以让车辆在车道内停下或是靠边 这背后,无疑有 Cruise 在旧金山因事故而全面停摆的前车之鉴,以及 Uber 因致命事故而彻底退出自驾业务的惨痛教训。在自动驾驶的商业化道路上,「安全」是那条一旦越过便万劫不复的唯一红线,特斯拉显然不愿在同一个地方摔倒。 乘客也可以让车辆靠边,或是直接与客服沟通 马斯克上周的表态也说明了这一点:「由于我们对安全问题极度在意,所以(试运营)启动日期可能会有所调整。」 当然,支撑这场首秀的,是特斯拉的技术内核。 这批投入运营的 Robotaxi,搭载的是全新的 HW5.0 硬件平台。这套系统配备了 4 颗 4D 毫米波雷达和 12 颗高清摄像头,其算力范围覆盖 2000 至 2500TOPS,远超现款 HW4 芯片的 400 至 500TOPS。 软件层面,车辆运行的是 FSD V12 的「无监督」版本。相比此前的系统,进入「端到端神经网络模型」成熟应用阶段的 FSD V12,在复杂场景处理上具备了更强的拟人化决策能力。 除了展示已经落地的技术,马斯克也总不忘在社交媒体上预告下一个更强大的未来,这已成为特斯拉维持市场高期待值的惯常手法。他透露,一个参数量是现行模型 4.5 倍的更先进 AI 模型,已在内部进行 Alpha 阶段的测试。这种「硬件超前预埋、软件持续迭代」的模式,正是特斯拉试图构建其技术护城河的核心逻辑。 但即便如此,环绕在特斯拉技术路线上的争议与挑战,也从未停歇。 最核心的,依然是其近乎执拗的纯视觉路线。多个分析机构和众多技术专家都曾指出,仅依靠摄像头,在面对太阳强光、恶劣雨雪天气、或光线极差的夜晚等场景时,其感知的可靠性仍面临巨大挑战,这与 Waymo 等竞争对手采用的「激光雷达+毫米波雷达+摄像头」的多传感器融合方案形成了鲜明对比。 与此同时,来自监管层的压力也如影随形。美国国家公路交通安全管理局(NHTSA)目前仍在对特斯拉的自动驾驶系统进行多项调查,而德州的立法者甚至在 Robotaxi 上线前,就公开呼吁其推迟运营,等待更严格的安全法规生效。 *我们可以在得州交通部官网看到所有正在运营的自动驾驶车: https://txdot.maps.arcgis.com/apps/dashboards/f4dd9ee9f87447d3ac3cdef192b3910f 或许,最冷静的一盆冷水,来自特斯拉的前 AI 主管、纯视觉路线的奠基人之一——安德烈·卡帕西。他分享了自己早在 2013 年就体验过 Waymo 前身(谷歌无人车)的一次完美的无干预演示,那次经历曾让他以为自动驾驶「近在咫尺」。 「但如今 12 年过去了,」他感慨道,「我们仍未真正解决这个问题。」 这位大神级人物的审慎,无疑为特斯拉这场看似成功的首秀,增添了一层复杂而深刻的意味。 Robotaxi 撑起特斯拉的下一个十年 在完全了特斯拉 Robotaxi 的初步体验、运营策略以及其背后喜忧参半的技术内核之后,我们才能更清晰地审视马斯克为这场「终局之战」所描绘的、那幅庞大而诱人的商业蓝图。 这套商业模式的核心,被马斯克生动地比作「Airbnb 和 Uber 的结合体」。 一方面,特斯拉将运营一部分自有的 Robotaxi 车队,保证核心区域的服务稳定。 而另一方面,也是其最具颠覆性的一点,是向全球数百万的特斯拉私人车主开放「加盟」入口。 车主可以通过手机 App,一键将自己的车辆在闲置时投入 Robotaxi 网络,随时加入或退出,让汽车从消费品变成可以创造持续收益的资产。 马斯克曾算过一笔账:车主通过共享车辆获得的收入将远超车贷月供,而特斯拉则可以从每笔订单中抽取佣金。这种「轻资产」的扩张模式,巧妙地将车辆、充电、清洁、维护等大量运营成本,转移给了庞大的车主网络,从而有望实现高达 70% 的惊人运营利润率—— 这正是支撑马斯克喊出「Robotaxi 将为公司市值带来 5 到 10 万亿美元增长」这一豪言的底层逻辑。 然而,宏大的愿景与骨感的现实之间,依然横亘着巨大的鸿沟。 马斯克为 Robotaxi 的规模化定下了极其激进的时间表:在奥斯汀试运营的几个月内扩展到 1000 辆,到 2026 年底,在美国将有超过 100 万辆自动驾驶的特斯拉投入运营。 但华尔街的分析师们显然要冷静得多。高盛预计,特斯拉在 2027 年前能部署约 2500 辆 Robotaxi;而摩根士丹利等机构则普遍认为,真正意义上的大规模商业化落地,可能要等到 2028 年左右。 这种预期上的巨大差异,源于市场对马斯克「过度承诺」的深刻记忆。从 2019 年宣称「2020 年实现百万 Robotaxi 上路」,到如今 2025 年才刚刚以 10 余辆车的规模开启内测,时间这位最公正的裁判,已多次修正了马斯克的「PPT 时间表」。 但有趣的是,即便跳票已成常态,资本市场似乎依然愿意为 Robotaxi 这个故事持续买单。 究其根本,是因为 Robotaxi 直接关系到对特斯拉这家公司的最终定义——它究竟是一家增长有限的汽车制造商,还是一家拥有无限想象空间的 AI 和科技公司? 万亿美金的市值,早已无法单靠卖车来支撑。FSD 软件的持续收费、Dojo 超算的算力服务,以及 Robotaxi 所代表的未来出行网络,这些才是支撑其高估值的核心叙事。 因此,Robotaxi 的每一次进展,无论多小,都像一针「兴奋剂」,能直接刺激市场的神经。它的顺利与否,将直接触发对特斯拉股价和未来价值的大幅修正。 可以说,此次奥斯汀的首秀,无论其运营规模多么有限,都标志着特斯拉的 Robotaxi 故事,终于从虚无缥缈的 PPT,第一次走入了触手可及的物理世界。这是一个至关重要的「从 0 到 1」。 正如卡内基梅隆大学的自动驾驶领域教授菲利普·库普曼(Philip Koopman)在评价此次首秀时所言,这更像是「开始的结束,而非结束的开始。」 对于马斯克和他庞大的 AI 团队而言,这场持续了 12 年的艰苦奋斗,或许才刚刚完成了它的序章。 文 | 李华
三星Exynos 2500发布:10核四丛集CPU架构,Galaxy Z Flip7首发
6月23日,三星通过官网正式发布了其新一代旗舰移动处理器Exynos 2500,将由三星小折叠屏新机Galaxy Z Flip7首发搭载,新手机将于7月登场。 根据三星公布的信息显示,Exynos 2500基于三星第二代3nm GAA工艺制程打造,这也是三星首款3nm旗舰智能手机芯片,基于10核四丛集CPU设计,包括 1颗3.3GHz Cortex-X5超大核 + 2颗2.74GHz Cortex-A725大核 + 5颗2.36GHz Cortex-A725大核和2颗1.8GHz Cortex-A520小核组成,GPU为三星与AMD合作定制的Xclipse 950,集成24K MAC NPU和DSP人工智能引擎,支持LPDDR5X内存,最高支持3亿2000万像素摄像头、4K 120Hz显示屏以及UFS 4.0存储,还支持卫星通信。集成的5G基带支持Sub-6GHz频段下行9.64Gbps、上行2.55Gbps;5G毫米波频段下行12.1Gbps、上行3.67Gbps;LTE Cat.24 8CA 下行3Gbps,Cat.22 4CA 上行4.22Gbps。 三星官方还特别指出,Exynos 2500采用先进的3nm环绕栅极 (GAA) 工艺技术制造,通过扇出型晶圆级封装 (FOWLP) 来提供更好的电源效率,同时增强散热性能,并大大降低了芯片厚度。通过采用双着色器引擎结构,Exynos 2500集成的嵌入式Xclipse 950 GPU已从6WGP/4RB升级到8WGP/8RB,并且GPU支持实例变换硬件加速,在启用光线追踪的情况下将每秒帧数(FPS)提高了28%。 此前曝光的Geekbench 6.4跑分测试成绩显示,三星Exynos 2500单核得分为2012分,多核得分为7563分。作为对比,在Geekbench 6.2的测试中,高通骁龙8至尊版单核成绩约为3200分左右,多核成绩约为10,400分左右;联发科天玑9400单核成绩约为2900分左右,多核成绩约为9200分左右;苹果A18 Pro单核成绩约为3400分左右,多核成绩约为8500分左右;小米公布玄戒O1的GeekBench 6.2测试中,单核性能成绩为3008分,多核性能成绩为9509分。 显然,三星Exynos 2500的成绩均大幅低于当前的基于台积电3nm工艺的旗舰SoC。这可能一方面是由于三星自家的3nm制程拖了后腿,但另一方面可能也与三星自己的旗舰SoC设计有关。 三星折叠屏新机Galaxy Z Flip7将首发Exynos 2500处理器,并配备一块3.6英寸的外屏和一块6.8英寸的内屏(展开状态下),搭载高通骁龙8至尊版处理器,新机将于7月登场。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。