行业分类:
加载中...
头条分类:
加载中...
年费超 2 万!马斯克刚刚发布最贵 AI ,Grok 4 号称所有领域碾压博士
马斯克憋了快半年,终于把 Grok 4 端上了台面。 这一次,他的口气依旧不小。早在发布会前就放出狠话,声称 Grok 4 要「重写人类知识库」。等到了发布会上,马斯克再次强调 Grok 4 是目前世界上最聪明的 AI。 可以,熟悉的味道,熟悉的配方。 当然,马斯克夸自家产品这事儿,大家早就见怪不怪,但正如网友所调侃的那样,你可以嘲笑 xAI 员工在办公室帐篷里睡觉或者周末工作到凌晨 4:20,但也得承认,他们的确是当下发展速度最快的 AI 实验室之一。 至于 Grok 4 能不能配得上「最聪明 AI」的称号,还得看后续的实际体验。不过,有一点是跑不了的——它已经成了市面上最贵的 AI,年订阅价格最高可达到 3000 美元,定价策略可谓是相当不讲武德。 世界上最聪明的 AI?世界上最贵的 AI! Grok 的训练路径分为两个核心阶段:预训练与强化学习。从 Grok 2 到 Grok 3,主要依赖预训练方式;而从 Grok 3 升级到 Grok 4,则大幅引入了以推理能力为核心的强化学习训练。 马斯克说得轻描淡写,但训练的动静却不小。 相比 Grok 2,Grok 4 的训练计算量提升了整整两个数量级,相当于增长了 100 倍——而且还在持续扩张。 马斯克表示,Grok 4 已在所有主要学科上超越博士水平。虽然它目前尚不具备发明新理论或提出原创技术的能力,但在他看来,这只是时间问题。 他甚至语言,今年底 Grok 可能就能发明新技术,明年几乎可以确定将具备发现新物理规律的能力。 当然,让 AI 接入现实世界,才是真正的关键。 他表示,Grok 与人形机器人 Optimus 的结合,将形成一个闭环推理系统——提出假设、验证假设、探索现实。这将开启一个智能大爆炸的时代,是人类历史上最令人激动的节点。 在产品形态上,Grok 4 是单智能体模型,而 Grok 4 Heavy 则是多智能体版本。 前者比较好理解,而后者则支持多个智能体并行思考,在推理过程中横向比对、纵向协同,调用更大规模的计算资源以完成更复杂、更精密的任务。 在现场演示中,Grok 4 Heavy 展示了多个场景能力。 比方说,让 Grok 4 Heavy 去预测今年 MLB 世界大赛(World Series)的冠军概率,它通过信息检索、数据建模、概率计算,评估洛杉矶道奇队的夺冠概率为 21.6%,并在 4.5 分钟内完整输出预测过程。 再比如,一个看似无厘头的任务:找出 xAI 团队里头像最奇怪的那一个。依托 X 平台的资料库,模型自动抓取并分析头像风格,最后锁定了联合创始人 Greg Yang。 有趣的是,虽然模型准确理解了「奇怪」这一主观概念,并能在同类中做出相对判断,但在一滑而过的演示中,我似乎看到了 Anthropic 员工 Jan Leike 的头像,看来准确率也有待提高。 除了推理和搜索,Grok 还能生成内容时间轴。 比如,根据 X 平台上的公开发帖,它能梳理出多个 AI 模型的基准测试成绩、厂商更新节奏以及社区反应。用户可以一目了然地看到 OpenAI 的分数表现、Gemini 的更新迭代,甚至是模型之间的微妙竞争态势。 换句话说,Grok 不是只会考试的书呆子,而是真正具备跨场景理解与执行能力的 AI。 目前,Grok 最大的短板依然集中在多模态理解能力,尤其是在图像理解和生成方面,能力仍有待加强。好消息是,下一阶段的基础模型训练已经在路上,预计几周内完成。 演示过程中,在测试「两个黑洞相撞过程」的可视化任务时,Grok 采用了简化的计算方式——使用后牛顿近似(Post-Newtonian approximation)替代完整的广义相对论框架。 尽管存在简化,模型依然准确地呈现了黑洞并合的关键物理阶段,包括「螺旋接近」、「合并」与「振铃阶段」,并能清晰说明所采用的近似方法。此外,它还调用了相关教材、公开搜索结果及实际物理常数进行推理支持,整体逻辑链条严谨、解释清晰。 就纸面参数而言,Grok 4 也交出了亮眼答卷。 Humanity’s Last Exam(人类最后的考试,简称:HLE,)覆盖了数学、物理、计算机、医学、人文社科等超过 100 个学科,共 2500 道闭卷题,测试难度极高,能够真实反映模型在通用知识和复杂推理上的综合表现。 根据 xAI 数据,Grok 4 在不使用任何工具的情况下,得分为 25.4%,超过了 Google Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高配版)的 21%。 而在使用工具的情况下,Grok 4 Heavy 的得分达到 44.4%,远高于使用工具后 Gemini 2.5 Pro 的 26.9%。从整体趋势来看,Grok 4 在扩展训练资源的同时,通过引入工具使用和链式思维,不仅提升了复杂任务的处理能力,也逐步缩小了模型智能与通用认知之间的差距。 非营利组织 Arc Prize 也指出,Grok 在其 ARC-AGI-2 测试中创下新纪录。这是一项视觉推理类基准测试,AI 需识别图像中的模式。Grok 的得分为 16.2%,几乎是当前排名第二的 Claude Opus 4 的两倍。 面对一些常规的基准测试中,Grok 4 Heavy 的分数几乎也快「刷满」分数。在博士级难度的问题集 GBQA 中,尽管整体难度略低于 HLE,Grok 4 Heavy 依然取得了满分成绩,展现出极强的推理与理解能力。 不仅如此,在多项编程相关测试中,Grok 4 Heavy 的表现同样抢眼。无论是 Live Coding、HMMT(麻省理工数学竞赛)还是 USAMO(美国数学奥林匹克),它都远超当前排名第二的模型,技术优势相当明显。 另外,知名分析机构 Artificial Analysis 通过对多款主流大模型在 7 个推理相关基准(MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME、MATH-500)上的综合表现进行评估。 数据显示,Grok 4 位列第一,得分为 73,是目前推理能力综合得分最高的模型。紧随其后的则是 o3-pro(估算值)71 分。 马斯克也强调: 「未来 Grok 将几乎在所有考试中答对每一个问题。而当它答不出某个问题时,它会指出题目的错误之处,或者指出问题含糊不清的地方,并给出不同情境下可能的答案。到那时,传统考试将失去意义。AI 唯一的检验标准将是现实世界:它是否能发明有用的技术,是否能推动科学的突破。所以 HLE 这类测试题库必须尽快更新,因为以当前的 AI 进展速度,它们很快就会过时。」 截至发稿前,Grok 4 和 Grok 4 Heavy 目前均已陆续上线。 目前,Grok 4 和 Grok 4 Heavy 已全面上线。用户可以通过订阅访问,不过,订阅价格就有点「不讲武德」,最高可去到 3000 美元/年档位,成了不少用户吐槽的焦点。 这么一比,OpenAI 、Anthropic 以及 Perplexity 的 200 刀/月套餐都显得实惠许多。 值得一提的是,发布后不久就有网友表示,Grok-4 与 Grok-4-Heavy 模型已经被成功「越狱」。越狱后的能力极其危险,可绕过安全护栏,输出敏感或非法信息,比如化学武器合成步骤、《星球大战1》的完整剧本(涉嫌版权)、甚至勒索病毒(恶意代码)等。 不只会说话,Grok Voice 还有了「灵魂」 除了更强的推理能力,更聪明,Grok 4 这次也在「更像人」这件事上,迈出了一大步。 跟我们熟悉的语音助手不同,xAI 全新语音助手「Eve」不只是能答话,它能表达情绪、有语调变化,甚至还能现场「唱歌」。 在直播现场的演示上,它用一口优雅的英音,唱了一首即兴创作的「Diet Coke 咏叹调」,「O Diet Coke, thou elixir divine…」听起来真的不像是 AI,像是伦敦剧场里的舞台演员在表演。 这次语音模型一共上线了五种声音,包括直播开场的「电影一般的预告男声」Sal,以及支持低延迟、自然停顿、情绪起伏等能力的 Eve。 现场还安排了一段和 ChatGPT Voice 的对比演示,两者轮流复述数字。ChatGPT 时不时「抢答」,有点像没听清就硬接话的同学。而 Grok 的表现更流畅、更贴近人类说话习惯,而且不会打断用户说话。 发布会上提到,自语音模型上线以来,Grok Voice 的端到端延迟缩短了两倍,活跃用户也增长了 10 倍。Grok Voice 正在迅速发展。 马斯克:让 Grok 去开一百万个自动售货机赚钱 几个 Grok 4 API 的应用场景让我印象非常深刻。 比如,在一项自动售货机商业模拟 Vending-Bench中,Grok 被要求自主完成:供应商协商、库存管理、定价策略,连续完成并长期保持盈利。 ▲注:Vending-Bench 是一个专门设计用于测试基于 LLM 的代理,在管理一个简单但长期运行的业务场景中的能力:运营一台自动售货机。 测试结果显示,Grok 4 不仅登顶排行榜,而且它所获得的净资产是其他模型的两倍。连马斯克都开始调侃说:「以后买显卡的钱,可以让 Grok 去部署运营一百万个自动售卖机赚回来」。 在科研领域,Grok 4 已被用于 CRISPR 基因研究和胸片 X 光分析。它能在几秒钟内读完几百万条实验记录和日志,自动筛出最有可能成功的假设。 此外,像是金融领域、游戏开发等项目,都可以通过 xAI API 来使用 Grok 4 来实现。发布会上特别提到了一个游戏设计师,他在 xAI 发布了 Grok 4 预览 API 后,就立刻参与测试。然后,他花了短短 4 小时就做出了一个第一人称射击游戏。 Grok 4 不是终点。发布会最后预告了接下来的路线图,每一项都非常值得期待。 代码模型:这次竟然没有发布 Grok Code,不过 xAI 提到正在训练了,一个「又快又聪明」的代码模型将会在几周内上线。 多模态能力:Grok 4 在图像理解上表现依旧是有限,团队也说正在以更大规模训练下一个版本,预计会在图像、视频和音频理解上迎来质变,到时 Grok 将能「像人类一样看世界」。 视频生成:xAI 说将使用大规模的算力资源,进行视频生成模型的训练。他们的最终目标是做到图生视频,生成可交互的「无尽视频流」,让用户能边看边参与剧情走向。 可能有不少朋友已经发现,这次发布会还有两个熟悉的华人面孔。他们正是 xAI 的联合创始人——吉米·巴(Jimmy Ba)和吴宇怀(Yuhuai Wu)。 其中,吴宇怀(Yuhuai Wu)本科以满绩点毕业于加拿大纽布伦斯威克大学,并在 2021 年获得多伦多大学机器学习博士学位,期间曾师从「深度学习之父」杰弗里·辛顿。 博士阶段,他还曾在 Google DeepMind 和 OpenAI 实习,毕业后在 Google 任职,并在斯坦福大学从事博士后研究。 吴宇怀的研究重点是打造具备强推理能力的人工智能系统,先后主导或参与了自训练推理模型 STAR、语言模型 Minerva 以及定理证明器 Alpha Geometry 等项目,并在《Nature》等顶刊上发表论文,推动 AI 在数学推理领域实现突破。 ▲ 吴宇怀(左二)和吉米·巴(左三) 坐在他身旁的吉米·巴(Jimmy Ba)则是多伦多大学计算机科学系的助理教授,也是吴宇怀博士时期的导师之一。 他同样出身于辛顿门下,是深度学习训练优化领域的关键人物。 最为人熟知的,是他与合作者共同提出了 Adam Optimizer(自适应矩估计优化器)——如今几乎成为深度神经网络训练的默认算法。可以说,他的博士论文为现代 AI 训练机制奠定了坚实理论基础。 不得不说,Gork 4 的到来适逢其时。 前代 Grok 3 的热度来得猛,退得也快。 根据知名市场分析机构 SimilarWeb 发布的截至 5 月 9 日的《2025年全球生成式AI行业趋势报告》,Grok 从三月流量暴涨超 100 万倍,到五月增幅跌回 5200%。 相比前代仓促上线、草草交卷的节奏,这次的 Grok 4 明显放慢了脚步,在产品打磨上也更下功夫。归根结底,马斯克的光环可以帮 Grok 带来第一波流量,但能不能留下用户,还得靠模型本身的硬实力。 只不过,我没记错的话,马斯克当初在 Grok 3 发布时,还信誓旦旦说要把 Grok 2 开源。眼看五个月过去了,这事儿却毫无动静,这次发布会上也没再提半句。 老马啊,可不能宽于律己,严以待人呀。 作者:张子豪、莫崇宇
马斯克推最强Grok 4!人类终极测试干翻OpenAI,包月费超2千元
作者 | 李水青 编辑 | 心缘 智东西7月10日报道,今日,马斯克的AI公司xAI发布其最新旗舰大模型Grok 4和多智能体版本Grok 4 Heavy,并推出史上最贵的每月300美元(约合2153元人民币)的AI订阅计划Super Grok Heavy。 在“人类的最后考试”(Humanity’s Last Exam)中,Grok 4在无需“工具”的情况下取得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%。 配备“工具”的Grok 4 Heavy获得44.4%的得分,优于配备工具的Gemini 2.5 Pro的26.9%。 ▲Grok 4在Humanity’s Last Exam测评中取得第一 “就学术问题而言,Grok 4在各个学科上都比博士水平高,无一例外。”马斯克在直播中说,“有时,它可能缺乏常识,而且它还没有发明新技术或发现新的物理学说,但这只是时间问题。” ▲埃隆·马斯克在直播中发言 xAI还推出了迄今为止最昂贵的AI订阅计划——每月300美元的Super Grok Heavy。订阅者可以抢先体验Grok 4 Heavy,并抢先体验新功能。这些新功能包括但不限于:将于8月推出的AI编码模型,9月推出的多模态智能体,以及10月推出的视频生成模型。 ▲每月300美元的Super Grok Heavy正式推出 直播结束后,马斯克在X上发文称:“你可以将整个源代码文件剪切并粘贴到Grok上的查询输入框中,然后@Grok 4 会帮你解决,比Cursor更好用。” ▲马斯克在社交平台X上发言 除此之外,xAI推出了Grok 4 API。xAI的企业部门仅成立两个月,但它计划与超大规模企业合作,通过其云平台提供 Grok。 近几个月来,xAI不仅拿下100亿美元最新融资,还收购了社交平台X,这也让最新推出的Grok 4成为产业的关注焦点。Grok 4能否成为对打OpenAI计预告今夏推出的GPT-5的有力对手?让我们来一起先睹为快。 一、Grok 4测评赶超OpenAI o3,马斯克:科研能力强过人类博士 马斯克在直播中称,在人文、语言、数学、物理、工程等多个基准测试中,Grok 4都取得了好成绩。“有些人认为AI不能推理,但Grok 4的推理能力可以超越人类水平,比几乎所有学科的研究生同时都聪明。”马斯克说。 xAI的研究人员称,Humanity’s Last Exam测试极具挑战性,总共有2500个问题,包括数学、自然科学、工程以及所有人文学科,问题广泛且都是博士甚至高级研究水平,Grok 4在这些问题上可以得到很好的分数。 Grok 4在无需“工具”的情况下,在“测试中获得了25.4%的准确率,超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3(高版本)的21%。马斯克称,在学术问题方面,Grok 4比每个学科的博士水平都要好,现在没有例外。他预测Grok 4最快今年就能去发明新技术了,两年之内就能发现新物理学说。 在GPQA、AIME25、LCB(Jan-May)、HMMT25等多项测评中,Grok 4都超越了OpenAI o3、Gemini 2.5 Pro、Claude 4 Opus等模型。 而在ARC-AGI-2测试中,Grok 4取得了新的最高得分,得分为16.2%。ARC-AGI-2测试是另一项高难度基准测试,包含类似谜题的问题,要求AI识别视觉模式。Grok的得分几乎是排名第二的商业AI模型Claude Opus 4得分的两倍。 二、训练量级达到Grok 2 100倍,Grok 4将与人形机器人互动 从Grok2到Grok 4,每一次迭代xAI都增加了一个数量级的训练,因此Grok 4的训练量级达到了Grok 2的100倍,这使得智力增长非常显著。 这是xAI第一次像预训练一样扩大训练规模。基于拥有10万块H100 GPU的超级算力中心,训练主要包括两种类型:一个是从Grok 2到Grok 3到的预训练,一个是从Grok 3到Grok 4在推理中投入了大量的算力。 谈及幕后,如图所示,当投入越来越多的训练算力,模型开始逐渐变得越来越聪明,最终在没有任何工具的情况下,解决了四分之一的Humanity’s Last Exam测试问题。 接下来研发人员做的是向模型中添加工具功能。与Grok 3不同的是,研发人员使其更加本地化,将工具放入训练中,从而显着提高了模型使用这些工具的能力。 马斯克透露,今年晚些时候,Grok 4还将融合有限元分析、计算流体动力学等更强大的工具进行训练,将打造非常精确的物理模拟器,比如去做提供精确的黑洞模拟等任务。最终,Grok 4最大的区别在于,其将能够通过人形机器人(如擎天柱)与现实世界互动。 马斯克说,我们正处于智能大爆炸的开端。我们需要确保AI是一个好的AI,安全最重要的事,AI需要最大限度地寻求真理。你可以把AI看作是超级天才的孩子,最终会比你聪明,但你仍然可以灌输正确的价值观并鼓励它长成想要的样子。 除了计算之外,还有一个技术问题是数据瓶颈。研发人员称,在强化学习训练过程中,他们实际上已经没有可用来测试的问题了,已有的问题对AI来说正在迅速变得微不足道。 但马斯克称,最能出色判断事物的就是现实。如果物理学是定律,最终其他一切都是建议。你不能打破物理。因此,我认为对于AI的最终测试是现实。就像你发明一项新技术,比如改进汽车或火箭,它有效吗?现实才是最终的裁判。所以这将是一个围绕现实的强化学习闭环。 三、现场演示:看论文进行现实模拟,语音模式延迟减少一半 xAI研究员在直播中演示了Grok 4回答问题的能力。 Grok 4的一大特点是能够理解世界,并通过利用工具来解决难题。比如要求Grok 4生成两个黑洞碰撞的可视化图像,它有一些清晰的思考过程,比如,为了让它真正可见,Grok 4考虑到通过海浪的形式扩放它的规模。从思考过程看,Grok 4使用了搜索,从一堆链接中收集结果,参考了现有的现实世界数据,而且还阅读了分析引力波模型的本科论文。 除此之外,xAI还演示了Grok 4解答数学问题、创建一个基于X个帖子的时间线、查看Humanity’s Last Exam测试成绩等问题。 在多模态测试方面,Grok 4分数略有下降。马斯克坦言,Grok 4的基本弱点是它部分盲目地理解图像生成偏好。Grok 4的多模态理解能力正在改进,这些问题将在几周内实现改善。 Grok 4的语音模式也进一步更新,已将延迟减少了一半。Grok 4今天推出一系列更具自然性和韵律的新声音,API版本也将发布。 四、推出Grok 4企业API,编程、多模态、视频模型在路上 xAI的企业部门仅成立两个月,但它正在通过其API发布Grok 4,已有各行业企业通过云平台使用了Grok 4。 聚焦现实的自动售货机商业场景,xAI的客户团队采用了大模型管理库存、联系供应商,大多数模型在去进行长线任务时都很困难。但使用了Grok 4 API之后,团队获得了令人印象深刻的结果。它设法运行模拟的时间翻了一倍,得分也翻了一倍,前后能保持较强一致性。 聚焦AI创作游戏方面,Grok 4可以在4个小时内制作的第一人称射击游戏。制作游戏并不一定是对游戏的核心逻辑进行编码,而是去寻找所有资源、文件素材,以创建一个具有视觉吸引力的游戏。对于开发人员来说,你可以专注于核心开发本身,让Grok 4去整理所有资产,自动化完成任务。 未来Grok 4将具有出色的视频理解和改进的工具使用能力,例如可以使用虚幻引擎生成艺术品模型,然后创建一个可在PC或手机上运行的可执行文件。xAI预计第一个真正优秀的AI视频游戏将在明年出现。 除此之外,马斯克透露,团队目前正在加大力度训练编码模型,在未来几周内将推出一个专业的编码模型。编码任务展现了Grok 4的弱点,即多模态能力。就像透过玻璃眯着眼睛看世界,看到所有模糊的特征,并试图感知它。xAI将在下一代模型中看到的最直接改进是,模型在理解图像和音频方面会能力逐步提高。 在视频模型方面,xAI将在接下来三到四周开始训练一个新的视频模型,具备出色视频生成和理解能力。 结语:抢发Grok 4,马斯克对战GPT-5 Grok 4在高难度测试中展现的“超越博士水平”的推理能力,在理解和解决复杂问题方面迈出了关键一步。其通过工具加持实现的新能力,以及雄心勃勃的多模态与视频生成路线图,展现了xAI与即将发布的OpenAI GPT-5竞赛的决心。 在To B端落地,xAI正加速将Grok 4的能力从企业应用到零售、游戏创作等领域。同时,马斯克强调的“安全至上”与“寻求真理”的AI发展原则,以及对现实世界作为最终测试场的认知,为这场席卷全球的智能爆炸提供了不可或缺的思考维度。
IDC:联想二季度PC出货量同比增长15.2%,市占率创历史新高
凤凰网科技讯 7月10日,IDC最新发布的《全球季度个人计算设备追踪报告》显示,2025年第二季度全球PC出货量达6840万台,同比增长6.5%,延续了市场回暖趋势。联想以1697万台的出货量和24.8%的市场份额位居全球首位,同比增长15.2%,增速显著超越行业平均水平。 数据显示,联想的市场份额较去年同期提升近2个百分点,创下历史新高。相比之下,排名第二的惠普出货量为1410万台,同比仅增长3.2%,市场份额为20.7%,较去年同期下降0.7个百分点。戴尔位列第三,出货量980万台,同比下降3.0%,市场份额为14.3%,同比下滑1.4个百分点。 IDC全球移动设备追踪部门研究副总裁让·菲利普·布沙尔表示,尽管美国市场因关税政策面临需求放缓压力,但全球其他地区需求依然旺盛,旧设备更新换代与Windows 11系统升级潮共同推动了市场增长。 联想在全球供应链管理方面的优势日益凸显。在权威机构Gartner发布的Top 25全球供应链排名中,联想位居第八,较去年提升2位,超越沃尔玛、宝马等跨国企业,成为唯一入榜的亚太高科技制造企业。 分析认为,联想的强劲表现得益于其“中国+N”的全球化制造布局和端到端业务模式。该公司在全球180多个国家和地区开展业务,建立了完善的销售渠道和服务网络,能够有效应对复杂多变的全球贸易环境。 在产品创新方面,联想持续推出AI PC等具有差异化优势的产品,满足消费者日益多样化的需求。同时,其高效灵活的供应链体系确保了产品的稳定供应和及时交付。
Grok4王炸,马斯克请保护好身边那俩华人
硅谷AI界真的要被华人占领了。 今天xAI开发布会,直接跳过Grok 3.5,发布Grok 4。 从现场介绍来看,这个新的旗舰模型是各种强强强——上下文窗口25.6万tokens,推理能力是前代的10倍,支持文本、图像、视频等,主打一个多模态全面发展。 在现场,xAI抛出一个又一个眼花缭乱的成绩:Grok 4每次都能拿美国高考SAT满分、 在HLE(Humanities Last Exam,人类最后的考试)中不使用工具也能拿到26.9%…… 马斯克大赞,这是“世界上最好的AI”,还自信地表示,这个模型今年就能实现科学新发现。 而坐在马斯克身边的,又是两位华人。不同于OpenAI发布会往往一人一段轮流讲的风格,xAI发布会上三个人互相接话,更像是一场既有脚本又有思维碰撞的新品讨论会。 其实今年2月的发布会,也是他俩和马斯克排排坐。 其中戴眼镜、坐在C位的是吴宇怀,蓄胡子的是Jimmy Ba。这两位华人均是xAI的创始团队成员。 有意思的是,Jimmy Ba还是吴宇怀的导师。 吴宇怀是出生于杭州建德的“95后”,今年刚满30岁。在杭州新安江一小和紫阳小学、杭州建兰中学读完小学和初中之后,就远赴加拿大读高中。 他从小就性格温和,醉心数学。这一点没变过,到现在他在X平台上的置顶消息依然是“解决数学问题,理解宇宙本质。” 2015年,吴宇怀以满绩点成绩自加拿大纽布伦斯威克大学毕业。随后他在多伦多大学攻读机器学习博士,于2021年取得学位,期间曾接受“深度学习之父” Geoffrey Hinton的指导。读博阶段,他先后在 Google DeepMind与OpenAI实习,博士毕业后加入 Google 研究院,并于斯坦福大学从事博士后工作。 2023年7月xAI成立时,吴宇怀以联合创始人的身份加入。 正是在吴宇怀在多伦多大学读博的时候,Jimmy Ba曾是他的导师之一。吴宇怀在博士论文《Neural Networks for Mathematical Reasoning(用于数学推理的神经网络)》的致谢中专门写道:“我想感谢我的博士联合导师Jimmy Ba……” Jimmy Ba是80后,关于他早年个人信息,公开资料中涉及较少。可以确认的是,他分别在2011年和2014年拿到多伦多大学的硕士与博士学位。也曾师从“AI教父”杰弗里·辛顿。 在谷歌学术中,他的论文过去五年被引用22万次之多,是当之无愧的学术大牛。其中2014年的论文《Adam: A Method for Stochastic Optimization》更是“爆款”,和 Diederik P. Kingma联合提出的‌ Adam已经是目前深度学习工作流默认引用的优化算法之一,几乎所有模型论文都会点一次名,在计算机视觉、自然语言处理等领域被广泛应用。 Jimmy Ba也因此在2025年获得ICLR时间检验奖。ICLR“时间检验奖”专门颁给10年前发表、仍在深度学习界持续产生核心影响的论文,目前只颁发过两届,含金量极高。 说起来也是很凑巧,距离马斯克官宣xAI“天团”过去整整两年了。 2023年7月公布的初创团队中包含12个人,其中5位都是华人。除了吴宇怀和Jimmy Ba,还有: 杨格,本科、硕士均毕业于哈佛大学数学系,曾在微软雷蒙德研究院当研究员。 戴子航,本科毕业于清华,硕士和博士毕业于卡耐基梅隆大学,曾是谷歌的高级研究员。 张国栋,本科毕业于浙江大学,多伦多大学博士,在进入xAI之前,曾在谷歌和DeepMind工作。 最近Meta抢人“抢红了眼”,用OpenAI CEO奥特曼(Sam Altman)的话说就是进别人家抢劫。 Meta已经抢了谷歌、Anthropic、OpenAI,这几天还把苹果负责基础模型的华人高管Rouming Pang也抢走了。 为了这场“豪夺”,Meta的CEO马克·扎克伯格(Mark Zuckerberg)亲自下场,开出四年3亿美元的薪酬,部分人甚至第一年的薪酬就高达1亿美元。 Meta目前公开的“抢”来的14个人里有9个人都是华人,而且几乎都不是在美国本土长大的,而是在中国出生、长大,而后到国外深造。这样的人才,xAI里面可不少。 很好奇小扎什么时候才能闯进xAI家里抢劫。 毕竟两年过去,xAI创始团队里的这5个华人仍然在xAI效力,在抢人大战一直很激烈的硅谷,这可以算是名为“超稳定”的战绩了。 再加上小扎和马斯克已经不对付好多年了,要是真抢到马斯克头上,恐怕又是一场腥风血雨。
Manus肖弘“超级激进”
一直留恋武汉的Manus,突然一步就迈出了中国。 “没人会比创始人肖弘更舍不得离开武汉。”Manus前员工曾正(化名)告诉字母榜,在武汉就读大学,在武汉开始创业的肖弘总给人一种不疾不徐的感觉,武汉这座常年处在夏季、通勤时间能缩短到半小时的城市,也有着区别于北上广深的生活气。 在2022年前后,彼时肖弘仍为自己的Monica寻求投资时,有一线的风投基金告诉AI科技评论,他们最终拒绝给Monica一份TS,原因是Monica是一个面向海外市场的浏览器插件,肖弘却不愿意搬离武汉。“想要做一家海外公司,第一步是要搬到北京,第二步是要搬到海外。海外市场要做大就要拿到美国的钱,我没法想象创始人在武汉怎么做(海外市场)。” 而在今年6月,Manus宣布总部前往新加坡,开启全球化进程。在6月20日前后,在新加坡开始出现Manus的广告牌,当地的程序员、工程师们被Manus的猎头接触,“他们现在在新加坡规模很小,公司的位置在city hall附近,只能说离CBD比较近,目前还在大量招人。”在新加坡工作的林芳(化名)告诉字母榜。 在新加坡,Manus为人工智能工程师和数据科学家开出每月 8000 至 16000 美元的薪资,“在新加坡,有些经验的程序员和产品经理差不多就是这个价。”薛芳补充到,Manus的薪资诱惑力不足,这也是她在被Manus的猎头接触后并未考虑更换工作的原因之一。 图注:Manus 广告牌 图源:Isaac拍摄 曾正(化名)告诉字母榜,包括他在内,不少包括产品设计等偏业务支持属性的员工拿到了赔偿,在离开Manus后也都顺利入职了新公司,“Manus名气在外,比较好找工作。”曾正补充道。 面对字节等大厂的竞争,肖弘在接受腾讯科技的采访中曾表示,创始人必须要持续创新,不仅要提前,而且“当你意识到你提前(领先)的时候,(就应该)更激进,超级激进”。 拿到Benchmark投资的肖弘如今激进一跃,跳上了全球化这艘船,但前方风急浪大,未来难以预料。 在接受腾讯科技的采访,回答全球范围内一道最喜欢的食物时,肖弘的回答是“热干面”。 出生在江西的肖弘,自从升入位于武汉的华中科技大学完成大学学业后,就似乎再未离开武汉。这也是肖弘与其他AI初创企业的不同。在AI六小龙将公司选定在北上广深时,只有肖弘对武汉“恋恋不舍”。 即便今年3月6日爆火、一码难求时,肖弘在北京的分公司选址在海淀人工智能创新街区的epark(花园路社区)。当字母榜7月10日进入这所共享办公区时,发现不少公司都仅有3-4个格子间作为办公场所,Manus在北京工区的规模并不大。 在公司里,肖弘呈现出一股低调、谨慎的风格。“刚来公司的时候,一开始都没认出来肖弘是老板,每天就是穿着T恤,”曾正告诉字母榜,一年前入职武汉Manus公司时,喜欢穿T恤的肖弘总是会隐身在码农堆里。 在夜市文化盛行的武汉,曾正们并不觉得在初创公司Manus工作非常辛苦,“武汉没有北京那么大,从公司加完班还能赶上夜宵,吃完夜宵到家十几分钟,也不会觉得太累”,没有动辄1个小时以上的通勤时间,曾正喜欢武汉这个城市,似乎,这也是肖弘留恋的原因。 在2022年创建蝴蝶效应公司时,包括肖弘在内,没有任何一个founder在海外长期生活过,“我们的英语水平大概巅峰是高中,因为大学大家的英语水平是下降的。”肖弘曾在采访中这样说道。 但肖弘又是敏锐的,对机会,他有着自己的嗅觉。早在3月回答腾讯科技怎样看待这个世界的问题时,肖弘便表示,“今天的中国创业者就应该更激进的全球化。” 对于时刻要准备应对大厂探入的创业者如肖弘而言,国内市场的竞争日趋激烈,而正如他所说,“全球市场应该更大,市场会给学费给founder去上学。” 需要注意的是,肖弘选择前往新加坡,恐怕不止全球化这一个原因。 在Manus 爆火仅四个月后,肖弘就拿到了一轮 7500 万美元的融资,这轮融资由硅谷风投公司 Benchmark 领投,借此 Manus 的估值到 5 亿美元,这似乎是促使肖弘离开武汉的直接因素。 在今年1月,美国通过了一项针对中国人工智能企业的对外投资管制规定,即限制美国对从事敏感技术研发的中国实体进行投资,从5月以来,根据外媒报道,Reverse cfius(反向美国外国投资委员会审查)便针对Manus开始进行调查,随后6月Manus 正式宣布总部迁往新加坡。 对肖弘而言,为了应对调查、拿到融资,把Manus做成一家更国际化的AI公司,搬去新加坡是一个折中的选择,这样不仅能够保持与国内技术人才的接触,还能更方便地以新加坡公司的身份进入国际市场。 在新加坡招人,在武汉裁人,原因也颇为一致。 如今,哪怕肖弘再留恋武汉的热干面,他也势必要激进而求生存。 图注:manus北京工区,字母榜并未在内找到Manus的所属工区 图源:字母榜拍摄 野心勃勃和谨慎这两种特质似乎完美地融合在肖弘身上。 作为并非出身顶级高校如清北的AI创业者,在2022年创建蝴蝶效应以前,2015年毕业于华中科技大学软件工程专业的肖弘,并没有任何AI相关的经验。 在2022年ChatGPT引爆全球AI热情之前,肖弘的创业永远懂得借力。 在校期间,肖弘等人就开发了基于彼时迅速长大的微信的华科版微信校内漂流瓶和微信上墙等功能。 2015年毕业后,肖弘创立了武汉夜莺科技有限公司,在拿到来自腾讯、真格基金等知名产业基金和投资机构数亿元投资后,基于微信生态肖弘推出了帮助微信公众号编辑的壹伴助手,以及瞄准企业微信TO B的微伴助手。 肖弘从校园到创业,几乎左右的项目都围绕着微信生态展开。瞄准场景借力做大做强,而非用技术迭代突出重围,肖弘一早就有了自己的创业逻辑,即在某个超级平台上做产品,成功几率往往会更高。 一面是持续创业的野心,一面是绑定超级平台做细分场景的谨慎,肖弘把“借力”玩出了花。 随着ChatGPT让AI成了投资人趋之若鹜的新潮流,肖弘在2022年成立了蝴蝶效应。 没有AI经验,又嗅到了创业风口,肖弘没有从零开始,他购入了一位华科学长做出的AI插件(ChatGPT for Google),将已有一定用户量的该插件作为基础,2023年推出了定位浏览器插件的Monica。 同年,当国内AI六小龙的智谱、月之暗面等都瞄准了“国产OpenAI”的定位,凭借多轮高额融资半年内突破200亿估值,闯入大模型赛道时,肖弘仍然选择了他最擅长的接力。 和Manus一样,Monica同样整合了众多AI大模型如GPT-4o、Claude 3.5的功能。主要任务就是让用户浏览网页时,可以呼唤Monica聊天和辅助办公,不用调转到GPT-4o、Claude 3.5,也能生成图片、翻译、写作、数据分析,就这样,Monica在海外积攒起了超过1千万的用户。 不像梁文锋、杨植麟这样会出现在论文中、研发一线的创始人,肖弘似乎更热衷于为当下最火热的超级平台们找场景。 这是Manus凭借通用Agent爆火的原因,也是Manus及肖弘引发争议的源点。当Manus作为各个大模型的新容器,其在垂直场景上的表现极大受制于调用的大模型时,Manus的技术护城河在哪里,也被更多的人追问。而随着肖弘前往新加坡,他势必需要拿出更有力的答案。 借力如今的大模型盛世,Manus 用通用Agent在AI应用上占据了自己的用户心智,但大厂的探入必然是肖弘要面对的问题。 无论是国内还是国外,有人、有钱的大厂在探索AI应用场景的同时,似乎也在事实上形成了对Manus的围堵。 就在肖弘推出Manus的两个月后,字节就开源了一款 Deep Research 项目,同样支持多轮对话和多轮任务执行。这个项目同样支持AI 生成计划或报告,还支持生成播客及 PPT。借助火山引擎的语音模型,能够从报告生成双人主持的播客,这对刚刚才补上了自身语言能力的Manus来说,并不是一个好消息。 而在海外,OpenAI的Deep Research尝试更早于Manus。一个是OpenAI自研的具备推理能力,能顾生成专业级研究报告的Agent,一个是接入ChatGPT、Claude的并调试的 Agent Manus,大众对于Manus智能性的怀疑浮出水面。 更不用说,对比起提出星际之门计划,拿下460亿融资的OpenAI来说,刚刚拿到融资的Manus,要守住自己的技术护城河。也要跟上OpenAI的烧钱速度。 回看3月6日Manus爆火后,接受腾讯科技的采访中,肖弘曾提到,Manus首席科学家季逸超曾问黄仁勋:接下来几年,什么事情发生会让你觉得很惊讶?彼时,黄仁勋回答:“Basically nothing”。即任何事情都有可能。 对于当时AI市场的新变化,肖弘表示,“我觉得应该用这样的心态去看这一波,最好不要做空它。” 这或许是如今外界对通用Agent争议不断时,肖弘的心里话。 参考文献: 《对Manus创始人肖弘的3小时访谈:世界不是线性外推,做博弈中的重要变量》,腾讯科技 张小珺Jùn|商业访谈录。 《29岁华科校友获数亿元投资:从华小科起步,深耕微信8年》,华中科技大学启明学院 《Manus创始人肖弘:不做第二个梁文锋》 ,湃动商业评论
天神之眼再升级,比亚迪将为智驾泊车损失兜底
在几乎靠一己之力普及智驾生态之后,比亚迪在主动承担智驾责任方面又前进了一大步。 比亚迪在 7 月 9 日发布消息称: 比亚迪率先实现媲美 L4 级智能泊车。在中国市场,比亚迪对所有天神之眼车辆在智能泊车场景下的安全及损失全面兜底。 印象里,这似乎是除了 Robotaxi 之外,第一次有车企在量产车型上提「L4」级别。 比亚迪也明白「L4 级别」的含金量,没有遮遮掩掩,直接说明: L4 可简单理解为在特定条件下,驾驶员可「脱手脱眼脱脑」,事故责任由车企承担。 这次兜底对用户而言最大的价值就是,在智能泊车中出现的损失,不用走保险流程,可以直接联系比亚迪售后处理,自然也不用担心第二年保费的上涨。 不过兜底范围也有限制,车企兜底的范围仅包括由本车承担的维修费用、第三方财产损失、人身伤害损失,不含出于和解、谅解等目的而额外支付的金额。 目前市面上除了比亚迪之外,仅有鸿蒙智行和小鹏汽车有类似的兜底服务,但都有时间限制或者需要额外购买智驾险。 去年 11 月鸿蒙智行在问界、智界和享界车型上推出了智驾无忧服务权益,权益时长为激活后 12 个月,在泊车场景以及领航辅助场景下的保障权益上限为 500 万元。 小鹏汽车则和保险公司合作,为用户推出了 239 一年的智驾险,可以不限次赔付行车全场景下以及 NGP 退出 5 秒前的车主损失。 相比较之下,比亚迪这次发布的兜底政策则无需额外付费,也没有设定时间限制。 与此同时,比亚迪还宣布将对「天神之眼」进行史上最大规模的 OTA 升级,天神之眼 A/B/C 三大平台的多款车型都将在泊车、行车、安全三大板块十余项功能上获得升级,补齐了之前的诸多短板。 这次 OTA 在泊车方面新增了三速泊车、车头泊入、偏置泊车、窄车位泊车自动收后视镜,并优化了悬空障碍物识别功能,在行车方面新覆盖了环岛通行、复杂场景连续绕行、高速施工路段借应急车道绕行、窄路多把掉头等场景,新增了前车加塞场景下的闪灯鸣笛功能,也实现了识别低矮障碍物,在夜间 80km/h 情况下可实现对两轮车侵入车道紧急刹停,120km/h 触发 AEB 并进行两段式舒适刹停等主动安全功能。 在 2 月份比亚迪宣布全系标配「天神之眼」后的一周,有机构的数据表明,比亚迪的进店量增长一倍,新增订单超过7万,比亚迪股价也来到了历史新高。 但在紧接着吉利等车企跟进之后,由于基础版本的天神之眼 C 的表现问题,「智驾平权」这张牌并未完全达到比亚迪的预期目的,在消费者的普遍认知里,比亚迪算是智驾的「普及者」,但远谈不上「领先者」。 但好在比亚迪进化的速度很快。根据比亚迪的官方微博,比亚迪 5 月销售智驾车型 231059 辆,智驾车型国内占比 79%,截止至 5 月底,比亚迪智驾车型累计已经销售超过 51 万辆,每天产生的智驾数据超过 4400 万公里。 大量的真实驾驶数据和持续多年的研发投入,终于支撑比亚迪打出了「兜底」这张爆点牌。 承诺兜底也意味着比亚迪对「天神之眼」泊车的安全性以及自己的售后体系有相当程度的自信。 这下又轮到友商们彻夜难眠了,但最终的结果必然会是跟进,不然还怎么宣传自己的智驾多先进。 社群里面有位网友看的相当清楚,「从此以后,智能驾驶这玩意儿,别再聊那些虚头巴脑的了,敢不敢负责任,才是唯一的标准。」 从「卷技术」升级到「卷责任」,这或许是比亚迪的一小步,但将推动中国车企向前一大步。
机器人第一股,稚晖君要抢在王兴兴前面了?
就在宇树科技凭借年内IPO消息振奋人心之际,同为人形机器人赛道明星公司的智元,则借助一番意料之外的收购,率先点燃了资本市场的热情。 近期,根据A股上市公司上纬新材公告,智元拟以21亿元左右现金报价,收购公司29.99%股份。后续,智元还将通过其持股平台收购公司至少63.62%、至多66.99%的股份。 一系列交易完成后,上纬新材控股股东将变更为智元恒岳,现任智元机器人董事长兼CEO的邓泰华,将成为上纬新材新的实际控制人。相比邓泰华,智元机器人核心高管中更出名的,当属顶着华为天才少年称号的稚晖君(原名彭志辉),现任智元机器人CTO。 一家估值150亿元、等待上市的具身智能公司,反向收购一家市值30亿左右的上市公司,不免被外界解读为智元想要“借壳上市”。 尽管智元对外否认借壳上市传闻,称暂无在未来12个月内对上市公司及其子公司的资产和业务进行出售、合并、与他人合资或合作的明确计划,或上市公司拟购买或置换资产的明确重组计划。 但外界已经开始将上纬新材这家跟具身智能毫无关联的公司,视为“人形机器人第一股”来看待。 7月8日晚智元收购要约发布后,连续两个交易日内,上纬新材股价接连涨停,总市值从31亿元左右,一路上涨到45亿元左右。资本市场两天内就给上纬新材送去了14亿元大礼包。 智元之前,外界唯一传出上市消息的人形机器人公司只有宇树科技。 今年5月底,宇树完成从“有限公司”向“股份有限公司”的更名,当时就被业内解读为是在为上市铺路。 7月初,《每日经济新闻》报道称,宇树科技计划在2025年底前递交IPO申请,上市地点大概率先选A股,后续再择机登陆港股。 AGI浪潮爆发3年后,被资本推向潮头的一众AI初创公司,纷纷开始在商业压力和争夺竞争空间下瞄向了IPO。 国内大模型领域的AI六小龙,在智谱AI开启IPO进程后,6月底传出MiniMax也在筹备IPO的消息。据直面AI(ID:faceaibang),六小龙中有五家其实都在筹划上市事宜。 如今,争抢IPO第一股的风向,也开始刮向人形机器人。 01 虽然稚晖君名头响亮,但操盘这起收购案的真正主角,则是邓泰华。 邓泰华并非智元机器人初创成员。2023年,稚晖君等人联合创立智元机器人,直到2025年3月,邓泰华才公开被披露为智元机器人董事长、CEO。 但邓泰华与稚晖君渊源颇深:两人不仅是电子科技大学校友,稚晖君在华为工作期间,邓泰华还是稚晖君的直属领导。 这也并非智元机器人首次对外投资和收购公司。天眼查数据显示,智元机器人成立以来共有27次对外投资出手记录。仅邓泰华上任以来,智元便相继注资了卧龙电驱旗下子公司浙江希尔机器人股份有限公司,和博众精工旗下子公司苏州灵猴机器人有限公司。 不过,直接控股一家上市公司,上纬新材还是智元投资史上的第一家,也将创下具身智能企业在科创板的首单收购案例。 上纬新材年报显示,公司专注于新材料的研发、生产与销售,主营业务涵盖环保高性能耐腐蚀材料、风电叶片用材料、新型复合材料以及循环经济材料等领域。2024年,上纬新材收入约15亿元,同比增长7%,净利润8868万元,同比增长25%。 与之前围绕机器人产业链上下游投资不同,上纬新材暂时未开展任何跟具身智能领域相关的业务,这也被外界视为智元想要借壳上市的迹象之一。 但在否认借壳上市消息中,智元官方表态,未来12个月内不会改变上市公司主营业务或者对上市公司主营业务做出重大调整,也不会在未来12个月内对上市公司及其子公司的资产和业务进行出售、合并、与他人合资或合作,或上市公司拟购买或置换资产等重组计划。 至于此次收购的原因,智元给出的解释是,认同上纬新材长期价值和A股资本市场对科技创新和产业创新的服务能力。 但同时,智元也给后续变动预留了空间。在官方公告中明确写道,如果根据上市公司实际情况,需要实施相关事项,智元届时将督促上市公司严格按照相关法律法规的要求,履行相应的法律程序以及信息披露义务,切实保护上市公司及中小投资者的合法利益。 这也意味着,只要满足一定条件,智元仍然有重组上纬新材,从而借壳上市的可能性。 值得注意的是,此次收购的21亿元左右现金,并非完全来自智元融资款。 根据财务顾问华泰联合证券披露的信息,收购资金来源于两部分——合法自有和自筹资金。其中,智元自筹资金拟通过向银行申请并购贷款取得,目前已取得银行的贷款意向函,尚未签订正式的并购贷款协议。 02 越来越难的融资环境和越来越急迫的商业变现压力,使得一众人形机器人公司使出浑身解数,来增加自己的生存概率。 据直面AI不完全统计,ChatGPT带火AI概念之后,2022年以来成立的13家明星机器人公司中,大多都被困在A轮融资中。 智元也是赶在4月份的新一轮融资中,才继宇树科技,成为唯二挺进B轮的人形机器人创企。 在云岫资本CEO高超看来,(具身智能)这一波的爆火是好事,会吸引更多资本和创业者进入,但也要理性看待,“人形机器人现在还没有PMF(产品市场匹配)”。 目前还在持续获得融资的人形机器人公司,更多处于投融资早期阶段。 在智元宣布收购上纬新材前后,星动纪元、云深处、小雨智造、它石智航相继公告融资消息,这些人形机器人公司要么还处在天使轮,要么还徘徊在A+轮融资中。 原因也不难理解。处于早期阶段的人形机器人公司,之所以还在源源不断获得融资,关键在于其早期属性带来的估值窗口期。在这个阶段,估值尚未被大幅推高,投资机构能以相对较低的成本进入,单笔投资风险相对可控。 反观智元机器人,目前已经历了9轮融资。据IT桔子数据,智元机器人在5月24日完成最新一轮B+融资后,估值达到了150亿元,与宇树科技一起并列为当前最贵的具身智能创企。 高估值之下,想要继续获取融资已变得越来越难,不仅新的投资机构难寻,想要追求更高的融资额更是难上加难。 IPO便成了融资环境变难之下,宇树科技和智元等高估值企业的一条可选路径。但另一面是,IPO周期充满种种不确定性。如今,借助对上市公司的掌控,智元不仅可以继续保持独立IPO的可能性,还留有了借壳上市这一备选方案。 更为实际的是,有了上市平台在手,智元也多了一个新的自主掌控的融资渠道。 03 争抢IPO之风,更早已经在大模型领域刮开。 4月份智谱AI开启IPO进程后,6月份MiniMax被爆出正考虑在香港进行IPO。有头部创投机构合伙人向直面AI表示,“六小龙里已经有五家在筹备上市了。” 人人都想争当各自领域的IPO第一股。移动互联网时代的经验屡次告诉人们,作为前无古人后无来者的第一股,往往会因为没有参照,而能享受极高的估值溢价,也就能挤占其他创企的生存空间。 更直观的示例,便是AI 1.0时代的四小龙(商汤、旷视、依图、云从)“AI第一股”争夺战。 从结果来看,四家企业中率先上市的商汤,不仅靠着债券市场的融资持续输血,更是将自己顺利延续到了大模型时代,并成为四家中唯一一家还能跟得上技术迭代步伐的玩家。 与之相反,多次冲击上市失败的旷视转向智能驾驶,原有业务几乎完全裁撤;云从、依图等公司业务不仅大规模收缩,还被迫进行了大裁员。 无论是“大模型第一股”,还是“人形机器人第一股”,这都将不仅是一个现成的可以讲给投资人的新故事,而且能够在实际上为各自的企业增加生存的时间和空间。 但在资本层面之外,智元等人形机器人面前横亘着一系列比大模型更难的挑战。 同样以AGI为目标,人形机器人公司技术上达成泛化性和通用性遭遇的挑战更大,难题之一便在于高水平训练数据的缺乏,不少公司不得不依赖真人动作捕捉来收集数据,成本高且效率低。 更重要的是,相比大模型,人形机器人要花钱的地方更多,既要投入软件迭代研发,又要涉足智能硬件制造。 智元,便恰恰选择了人形机器人中最难的一条路,即押注以软硬一体化的方式开发机器人,同时投资机器人硬件和软件两个方向。 “(智元)第一天就坚决认定通用机器人不是一个局部问题,而是一个系统工程。”在稚晖君看来,“如果你只做灵巧手,或者只做一个模型,你可能成为一个模块化的供应商,如果要真正做出走进我们日常生活的机器人,必须要打通从感知决策到执行,从本体到大小脑的全栈闭环链路。” 与系统工程对应的,则是不可避免的更多系统化困难的出现。收购上纬新材,成了智元不走寻常路标签的又一新佐证。
谷歌出手限制GrapheneOS等第三方安卓ROM用户使用Pixel相机应用
IT之家 10 月 23 日消息,据科技媒体 Android Authority 今天报道,最近更新后的谷歌 Pixel 相机应用似乎与注重隐私的 GrapheneOS(石墨烯 OS)操作系统有些“水火不容”,在部分情况下完全无法打开。 据介绍,更新到 10.x 版本后的 Pixel 相机应用会检测机内是否存在谷歌 Play 服务(IT之家注:GMS),导致用户使用 GrapheneOS 等完全“去谷歌化”(de-Googled)的第三方安卓 ROM 时,打开 Pixel 相机就会直接闪退或直接无法启动。 不过目前还是有方法让 Pixel 相机应用在 GrapheneOS 上正常运行,比如用户可以将应用回退至 9.9.106.773153235.19(Build ID 68469120)版本,这个版本的 Pixel 相机完全不检测 Play 服务,可以正常使用。 同时有部分用户反馈,他们在 GrapheneOS 更新 Pixel 相机后仍可以正常使用,不过他们都安装了沙盒化的 Play 服务,经实测后发现,只要去除所有谷歌软件就会遇到无法打开的问题。 Android Authority 对此表示,谷歌出手做这种限制也不算奇怪,毕竟 Pixel 相机就是谷歌自家的 App,将自家 App 与谷歌生态深度绑定也符合这家公司的核心战略。 从长远来看,GrapheneOS 团队计划推出自研的相机 App,目标是实现与原 ROM 同级的成像质量,同时该系统也计划从明年起扩展至非 Pixel 设备。
英特尔之后,特朗普政府欲用联邦资金入股多家量子计算公司
特朗普 凤凰网科技讯 北京时间10月23日,据《华尔街日报》报道,多家量子计算公司正在洽谈向美国商务部出让股权,以换取联邦资金支持。这表明,特朗普政府正在扩大对其认为是关键经济领域的干预力度。 据知情人士透露,包括IonQ、Rigetti Computing和D-Wave Quantum在内的多家公司正在讨论让美国政府成为股东,以换取政府为有潜力的科技公司提供的专项资金。Quantum Computing Inc和Atom Computing等其他企业也在考虑类似安排。 知情人士称,这些公司正在争取美国政府为每家企业提供的最低1000万美元资助额度。其他科技公司预计也将加入这场资金角逐战。 知情人士称,美国商务部副部长保罗·达巴尔(Paul Dabbar)正牵头负责政府与该行业公司的资金洽谈。达巴尔曾是量子计算行业高管,并担任过能源部官员。商务部的一名官员表示,由达巴尔联合创立并担任四年CEO的Bohr量子科技公司不在此次资助候选名单之列。 量子计算公司Quantum Computing Inc CEO黄宇平(Huang Yuping)表示,政府可能入股量子计算企业的前景令人振奋。Rigetti发言人称,正就融资机会与政府保持持续沟通。D-Wave政府关系负责人艾莉森·施瓦茨(Allison Schwartz)指出,公司致力于提供能解决政府难题的量子系统并获取投资回报。Atom Computing与IonQ两家公司则拒绝置评。 达巴尔负责资金谈判 量子计算公司所寻求的资金来自“芯片研发办公室”。该机构在商务部长霍华德·卢特尼克(Howard Lutnick)对2022年《芯片法案》资金管理体系进行全面改革后,已被重组纳入其管辖范围。卢特尼克近期刚从一项由拜登政府资助的科研计划中收回了数十亿美元资金。 这些谈判再次证明,美国政府试图成为部分公司的股东。特朗普总统和卢特尼克已表示,既然纳税人的资金为企业提供了财政支持和官方背书,那么政府理应分享企业的成长红利。 今年8月,美国政府同意利用89亿美元的联邦补助资金收购英特尔近10%的股份,这一安排将使得美国政府成为英特尔的最大股东。此前,美国已与某稀土材料生产商达成了类似协议,该企业是全美少数稀土生产商之一。美国能源部还曾通过政府贷款换取了某锂业创业公司的认股权证,使其有权以预设价格购入该公司股份。 对量子企业的资助将成为美国政府支持该领域的首个重大信号。量子计算机被视为关键性下一代技术,因其能快速完成现有计算机需耗时万年才能完成的运算。专家表示,这种技术突破将加速新药研发、新材料发现和化学合成进程,同时提升经济各领域的运行效率。尽管近期出现回调,但该领域相关企业的股价在今年仍实现大幅上涨。 从IBM到微软,美国各大公司都在投资量子计算,中国公司同样如此。谷歌周三宣称,其研发的量子计算机运算速度比传统超级计算机快1.3万倍,有望显著加速药物研发与材料科学进展。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
Omdia:预计今年全球微短剧收入达110亿美元,中国市场独占83%
IT之家 10 月 23 日消息,市场调研机构 Omdia 于 21 日发布报告称,微短剧正在重新定义数字时代的优质叙事方式,将社交媒体的即时互动与电视剧的情感表达融合,正越来越受到移动端观众的喜爱。 Omdia 最新研究显示,到 2025 年全球微短剧收入预计将达到 110 亿美元(IT之家注:现汇率约合 780.5 亿元人民币)。作为一种快速发展的短篇剧本视频形式,微短剧通常每集只有两到三分钟并以连载形式呈现,已经成为移动优先的视频娱乐中的重要类别。 对比来看,预计微短剧的收入几乎是免费广告支持的流媒体电视(FAST)频道的两倍,Omdia 预计后者 2025 年全年收入将达 58 亿美元(现汇率约合 411.53 亿元人民币)。 该机构称,微短剧正在重新定义数字时代的优质叙事。其具备短小精悍、易于获取,同时兼具社交媒体的即时性和电视剧的情感深度等特征,在移动观众中越来越受欢迎。 Omdia 研究显示,全球超过 60% 的微短剧收入来自订阅或付费交易,通常采用免费体验后付费的模式。每用户平均收入(ARPU)可达每周 20 美元(现汇率约合 141.9 元人民币)或每月 80 美元(现汇率约合 567.6 元人民币),显示出强大的变现潜力。 得益于庞大的观众规模和移动观看趋势,中国市场贡献了 83% 的总收入。中国之外,美国位居国际市场首位,其次是日本、韩国、英国和泰国,这些市场的微短剧接受度持续增长。 观众愿意为能立刻吸引自己的内容付费。虽然注意力持续时间较短,但参与度更高,Omdia 认为这正是微短剧商业价值突出的原因。 Omdia 分析进一步指出,微短剧有望成为介于社交视频和传统剧本电视之间的数字娱乐生态核心。微短剧的兴起展示了新叙事模式和分发平台如何不断重塑全球观众的观看习惯,也标志着数字内容发展的下一阶段。
高德“鹰眼守护”再进化:不开导航也能预警前方危险
凤凰网科技讯 10月23日,阿里巴巴旗下的高德地图宣布,其主动安全预警系统“鹰眼守护”迎来一项重要功能拓展。即日起,该系统将不再局限于传统的导航模式,用户在仅打开App而不设定目的地的巡航状态下,也能获得前方的安全风险预警。此举旨在覆盖大量习惯在通勤或熟悉路线上使用巡航模式的驾驶者,进一步扩大了主动安全守护的范围。 据了解,此前的“鹰眼守护”系统需要用户设定明确的起终点才能激活。而此次升级后,用户仅需在设置中保持“自动进入巡航”功能开启,高德便能通过其多模态识别能力,在判断用户进入驾驶状态后自动开启巡航模式和“鹰眼守护”功能。这意味着,即使用户只是将高德App作为电子狗或实时路况看板使用,也能享受到来自云端的实时安全提醒。 这项功能升级的背后,是高德交通视觉语言模型(TrafficVLM)的技术支撑。在没有预设路线的巡航场景下,系统需要面对更复杂多变的道路环境,对实时感知和运算能力提出了更高要求。正是借助TrafficVLM强大的场景理解能力,“鹰眼守护”得以在巡航中精准识别潜在风险并向用户发出警报。 该系统由中国安全生产科学研究院与高德于9月28日联合发布,其工作原理是基于海量的匿名车辆行驶数据,通过云端AI大模型分析同向多车速度骤降等异常行为,判断前方可能发生的紧急状况,并通过语音和地图界面两种方式,向后方可能受影响的车辆推送预警信息,为驾驶员争取更长的应急反应时间。 目前,“鹰眼守护”系统已在全国范围内应用,覆盖了包括重大异常事件、弯道来车、无灯路口会车、前方急刹等在内的17个常见及高风险驾驶场景。在刚刚结束的国庆中秋假期期间,该系统经受住了大规模交通流量的考验,累计发出的预警信息超过17.4亿次,覆盖用户规模超3.5亿。数据显示,仅在10月1日当天,高德的活跃用户数就超过了3.6亿,系统单日预警量也达到了2.9亿次的峰值。 高德方面表示,未来将与中国安全生产科学研究院继续合作,推动“鹰眼守护”预警系统的持续迭代与普及,让更多用户体验到超视距的主动安全护航。
NVIDIA H100要上天了!声称计算能力强100倍
快科技10月23日消息,据报道,NVIDIA的H100 GPU即将在下个月展开一段“太空之旅”,AI公司Crusoe近日宣布,计划成为“首个在太空中运行工作负载的公共云运营商”。 这次轨道部署的Crusoe Cloud服务将采用NVIDIA H100 GPU,并部署在战略伙伴Starcloud的AI数据中心卫星上。 合作双方声称,这次部署的H100提供的AI计算能力,将比以往太空中存在的任何计算能力“强大100倍”。 Crusoe和Starcloud 目标是建立一个利用太空太阳能驱动的AI数据中心基础设施,在Starcloud所在的轨道上,太阳光线不受地球大气层的影响,因此可以享受到“几乎无限、低成本的可再生能源”。 据估计,基于太空太阳能的数据中心,其能源成本(包括发射成本)相比地球上的数据中心可降低10倍。 而且在太空中,可以部署大规模的太阳能电池板阵列,且无需考虑土地使用问题,同时运行这些系统也不会对地球能源造成压力。 对于GPU散热这一关键问题,NVIDIA声称Starcloud 将利用深空的真空作为“无限散热器”,解决了传统数据中心在地球上进行热对流散热的难题。 根据目前的规划,Starcloud将于2025年11月率先将H100送入太空,Crusoe随后将于2026 年底在Starcloud卫星上部署其Crusoe Cloud服务,最终计划在2027年初提供来自太空的GPU算力。
AI浏览器,谷歌比OpenAI就差个老板直播带货
2025年,AI浏览器业界每次出新品,谷歌的Chrome浏览器就要被杀一次。 最近一次,当然是OpenAI新发布的Atlas,快讯标题里常现“谷歌最怕”、“Chrome刺客”,结合谷歌股价应时波动、盘中最大跌幅5%的消息,Chrome浏览器看上去真的前途危险。 然而同样的评价,在Perplexity公司的AI浏览器Comet于2025年7月推出后,也能看到,只是声量小得多。 AI浏览器,不管是强调产品的AI性能还是浏览器定位,都绕不开谷歌Chrome。AI浏览器大潮中,谷歌也不会缺席。 当下的AI浏览器热潮里,谷歌、微软等同时拥有自研大模型基座和浏览器产品的巨型企业,习惯将大模型功能渐进地引入既有的浏览器中。 这种路径依赖的好处是整合资源的成本低、产品有可以预期的较强稳健性。弊端则是没法像OpenAI和其他AI创业公司一样,推出与Gemini in Chrome功能相近的新品就能成为市场营销攻势的爆点。 现在AI浏览器的入场玩家增多,但各家产品的功能在逐渐趋同。因为基座大模型的功能逐渐脱离“革命”(revolution)阶段、迈入“进化”(evolution)阶段,各种基准竞赛的大模型跑分无法直接给用户带来ChatGPT奇迹的直观冲击,建基于其上的AI浏览器,也会让用户觉得大同小异。 是的,OpenAI的Atlas浏览器各种惊艳功能,在谷歌5月底宣布的Project Mariner项目、9月中交付的成品Gemini in Chrome能看到大半。 Gemini in Chrome没有开发布会直播,只是Chrome部门副总裁、产品负责人帕里萨·塔布里兹(Parisa Tabriz)于9月18日在谷歌官方网站上发了篇博客文章,展示了Chrome引入Gemini模型后的改头换面。 OpenAI的Atlas浏览器,发布时强调所有页面整合进AI、对用户使用记录和浏览网页的记忆功能。一个多月前谷歌的Gemini in Chrome已经更新了。 在谷歌官方博客的示例中,用户点击Chrome浏览器的Gemini星标,拉出侧边对话框提问,也不用打开新标签页,Chrome更新后的内置AI功能直接从用户浏览记录中唤出用户上周看过的团建活动介绍网页。AI在用户追问“人数低于10的组织少于半小时的团建活动”时,从网页中自动提取正确内容作答。 OpenAI的Atlas浏览器,发布时强调了“智能体模式”。GPT可以直接操作网页、完成工作任务,从“浏览的窗口”进化成“做事的手”。 Chrome在一个多月前也更新了同类功能,示例是用户在侧边栏输入一句之后,AI智能体读了电邮中的菜谱,按菜谱自动在网店里点齐菜品放进网络购物车。除了最初的一句指令和最后的确认支付,用户本人完全不用插手AI智能体的工作流程。 OpenAI的Atlas浏览器,强调“AI随行”(Chat comes with you anywhere),所有页面所有功能即时无缝整合进GPT的全部功能。用户在浏览器里读着网页、听着播客、看着视频,随时可以唤出GPT来总结用户浏览的内容。 正巧,一个多月前的Chrome也演示了同类功能。用户看着YouTube视频,点击Gemini星标问一句“总结这个视频”,AI立马给出大纲总结和要点对应的视频时间戳。 现在再看,Gemini in Chrome和Atlas浏览器的本质区别,可能在于: 1、 基座模型不同,一个是GPT,另一个是Gemini; 2、 发布方式不同,谷歌是负责人闷闷地更新一下官网博客,OpenAI是网红老板领着研发团队做带货视频直播。 也就是说,Gemini in Chrome和Atlas浏览器两个产品没有直观的性能差异,但谷歌和OpenAI两家公司的市场营销方式有显然的时代差异。东海西海心理攸同,老板亲自上镜做直播卖货,是当下的时代精神。 有志于成为AI浏览器行业领军者的公司,大都在过去的一年里,经过“求购Chrome、对标Chrome、用户发现这就是Chrome”的历程。 2024年,美国法院裁定Chrome浏览器“强化”了谷歌对在线搜索市场的主导地位,违反了反垄断法。 11月21日,美国司法部和反垄断执法机构,据此建议强制谷歌剥离出售Chrome浏览器,“永久终结谷歌对这一关键搜索入口的控制权,并使竞争搜索引擎能够进入这个对许多用户来说是互联网门户的浏览器”。 而OpenAI放风要做AI浏览器的第一次信息,于11月22日发布。《The Information》当日报道,“据见过产品原型或设计的人士称”,OpenAI考虑开发一款与其AI 聊天机器人结合的网络浏览器。OpenAI这是直接为Chrome不再被谷歌拥有的可能未来,做接盘的舆论铺垫。 当时眼馋Chrome这块肥肉的,不止OpenAI一家。 在持续三周的补充审讯中,4月22日ChatGPT负责人尼克·特利作为证人,在庭上被问及:如果联邦法院裁定谷歌必须剥离Chrome浏览器,OpenAI是否会寻求收购谷歌浏览器。尼克·特利回答:“是的,我们会,其他很多公司也会。” 2025年5月中,谷歌垄断案的补充审讯阶段结束时,已有逾20名同业证人出席,几乎每一个人都表达了自己公司收购Chrome的愿望。 谷歌首次透露自己在做AI浏览器,也是在同一时期的法庭听证会上。4月25日,在长达数小时的听证中,Chrome产品负责人帕里萨·塔布里兹表示,Chrome团队正致力于将AI深度整合到浏览器中,以增强Chrome代替用户自动执行任务的“智能体能力”。 结合之前的舆论态势,这是谷歌直接在法庭上表示要做OpenAI的竞争对手。2025年5月底谷歌I/O开发者大会上宣布的“Project Mariner”,属于追加的开发进度更新 求购Chrome的动作,直到2025年8月还有公司在做。8月12日,Perplexity AI公司宣布,已向谷歌母公司Alphabet发出Chrome浏览器的收购要约,报价345亿美元,远超这家创业公司的自身估值。 以现在的后见之明来看,强制出售Chrome的建议,是莉娜·汗(Lina Khan)政治生命结束前的遗赠。此位拜登政府任内的美国联邦贸易委员会主席,与她的导师兼同事吴修铭教授(Tim Wu),在成为政府高官之前和之后,念念不忘分拆脸书、谷歌等行业巨头。 而本届美国政府的侧重点不在此。核心决策层“务反前朝之政”的复仇主义、各种放飞自我的奇谲举措,让执行者的待办事务列表里,拆分谷歌主要业务没法在其中排上号。 直到求购Chrome的前景渺茫之后,OpenAI和Perplexity们自己做AI浏览器的决心才坚定。7月9日,路透社报道OpenAI 准备发布一款 AI 驱动的 Web 浏览器。同日Perplexity AI公司宣布推出AI浏览器Comet,专供月费200美元的Max套餐注册用户。10月2日,Comet浏览器免费开放给全球用户。 即使OpenAI 10月22日发布Atlas浏览器,时间选择也是卡着对标谷歌的点。10月20日谷歌AI Studio负责人预告“将有重大更新”后,业界流传一张录屏,称Gemini 3 将在10月22日宣布、11月12日上线。Atlas浏览器的发布时间有强烈的“截胡”意图。 AI浏览器行业,和其他AI产品赛道类似,在2025年迅速从创业公司和大厂间搏杀的狂野边疆,演化成大厂主宰的稳定市场。 最典型的例子是Browser Company和AI浏览器Dia。 2024年Browser Company的估值是5.5亿美元,当时已经停止开发两年前让自己走红的Arc浏览器。按其CEO的公开承认,Arc各种功能的使用率太低,后台数据显示只有5.52%的日活跃用户定期使用多个Spaces,只有4.17%的用户使用Live Folders。 Browser Company的对策是,放弃Arc的同时,用AI工具重做Arc各种功能,产出新品浏览器Dia。Dia浏览器于2025年6月推出后,9月就以6.1亿美元现金的价格出售给澳大利亚软件公司Atlassian。 Dia与其说是服务普通用户的产品,不如说是挽救公司未来的融资工具。Browser Company没有与谷歌们竞争、抢占AI浏览器潮头的雄心,成功解套就得谢佛了。 AI浏览器这个赛道里,“赢者愈赢”的马太效应如此显著,以至于Perplexity AI这种小体量公司被逼到要发钱拉人用自己的产品。10月23日,Perplexity的主页宣布,拉新人成功注册Comet浏览器的Pro套餐用户,按人头每个返还20美元。新注册Comet的用户免费用一个月的Perplexity Pro套餐。 谷歌和OpenAI们做AI浏览器的决心,不会被撼动。 谷歌需要用AI巩固自己的浏览器王座,按市场调研机构Statcounter截止2025年8月的数据,Chrome占全球PC桌面浏览器市场70.25%、移动浏览器市场69.15%。这种“后四名成绩加一起翻倍不如第一名”的局面,如果因为自己并不落后的AI产品而消失,是不会被任何公司决策层容忍的。 而OpenAI需要浏览器这个入口来打磨自己的AI模型。用户在AI聊天机器人里说了什么不一定真实,而网络浏览器这个1993年至今的基础数字工具,能捕获用户最纯正的意图和思维链数据。 每一次点击、每一个搜索、用户每个微决策的时长和结果,都揭示了用户自己都不一定了解或表达出的最诚实选择,同时也是对模型生成答案向真实世界基准值的调校和标注。 网络浏览器,是通往当代人类基础思维与欲望的管线。谁掌握了AI时代的浏览器类产品市场,谁就掌握了最宝贵优质的训练与对齐数据集。 AI大模型与网络浏览器,现在有如大树的根与叶,配合则相互滋养,分离则皆难维续。这是无从改变、也不需改变的未来趋势。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。