行业分类:
加载中...
头条分类:
加载中...
龙虾之父的Claude被封了,官方:系统误判
就在刚刚,龙虾之父的 Claude 被「封号」了。 知名开源 Agent 框架 OpenClaw 的创始人 Peter Steinberger 在 X 平台发文称自己的 Claude 账号遭到封禁,并晒出了一封来自 Anthropic 安全团队的邮件: 你好, 我们对你账号的可疑信号进行了内部调查,认定存在违反使用政策的行为。因此,我们已撤销你访问 Claude 的权限。 如需对我们的决定提出申诉,请填写此表单,或点击此处了解更多申诉流程。 Anthropic 安全团队 邮件措辞简短,未说明具体违规条款,亦无任何事先警告。 Steinberger 在推文中写道:「伙计们,以后要确保 OpenClaw 还能跑在 Anthropic 的模型上,恐怕是越来越难了。」 OpenClaw 是目前生态最为活跃的开源 Agent 框架之一,很多开发者用它来让大模型干具体的活——连接外部工具、自动执行任务、帮你管日历回消息,相当于给大模型装上了手脚。而 Anthropic 的 Claude,目前公认在代码和推理这块是最能打的。 结果最受欢迎的开源框架创始人,被最强模型供应商以「可疑活动」封号了。 推文传开后,引发了轩然大波,评论区里有网友问 Steinberger,被封的是 API 还是别的什么。他的回答是:「两个都封了。」,这意味着他连日常的兼容性测试都跑不了了。 有人追问他为什么还在用 Anthropic 的服务——毕竟他年初已经入职 OpenAI 了。他解释说,这要分两件事来看: 他在 OpenClaw Foundation 的工作,目标是让 OpenClaw 兼容所有模型供应商;在 OpenAI 的工作,是帮助产品战略。用 Anthropic,只是因为要做端到端测试,确保 OpenClaw 的每次更新不会跟主流模型出问题。 「我们一直在跑 e2e 测试,确保每次框架改动不会出问题。这些账号和 Key⋯⋯或者说,曾经是我的。」 事件持续发酵后,Anthropic 员工 Thariq Shihipar 出现在评论区: 「我们没有因为任何人使用 OpenClaw 而封号。这很可能是另一个有点过于敏感的滥用检测分类器误判了。我会私信你,看看能不能查清楚并帮你解封。」 很快,Steinberger 发推确认账号已恢复。 到这里,封号本身算是有了说法,Anthropic 官方口径是这只是一次系统误判,非人工决定,与 OpenClaw 无关。但如果你了解 Steinberger 和 Anthropic 之间这两年的恩怨情仇,就会觉得这件事不只是一次风控误判那么简单。 Steinberger 是 iOS 开发圈的老人,技术能力毋庸置疑。但他最开始打造 OpenClaw 的时候,给自己定位是「产品经理」——所有代码,后端、前端、测试、文档,全部用 Claude Code 生成,他一行都没亲手写过,只负责用自然语言描述需求。 OpenClaw 用到的那些能力,超长上下文、工具调用、多步骤推理规划,全部脱胎于 Claude,然后却被拿来跟 Anthropic 旗下工具竞争生态位。 于是,Anthropic 开始不高兴了。 事情最早可以追溯到项目改名——OpenClaw 最初叫 Clawdbot,Anthropic 以商标侵权为由施压,项目后续被迫改成了现在这个名字。当被网友问到为什么去 OpenAI、不选 Anthropic 时,Steinberger 也调侃道:「一家欢迎我加入,另一家寄来的是律师函。」 改名只是前奏,真正的矛盾在于这东西太能消耗算力了。有人仔细算过:月付 200 美元的 Claude Max 订阅,实际跑起来消耗的算力价值接近 5000 美元。放到 Anthropic 的服务器上,OpenClaw 就是个无底洞。 就在封号风波的前几天,很多 OpenClaw 用户悄悄收到了一封邮件:从太平洋时间 4 月 4 日起,Claude 订阅额度不再覆盖 OpenClaw 在内的第三方工具。 想继续用,请自备 API Key,按量付费。 Anthropic 给的理由是资源消耗太大,机器扛不住,要优先保障自家产品的用户体验。当时,Peter Steinberger 不留情面地批评道,时机真是巧得有趣——Anthropic 先把流行功能复制进自己的封闭框架,然后再把开源软件挡在门外。 更多细节欢迎回看 APPSO 此前文章:Anthropic 封杀 OpenClaw,龙虾之父:说服失败 回头看看 Anthropic 最近两个月密集发布的东西:Dispatch、Claude Code Channels、Computer Use,每一项针对的几乎都是 OpenClaw 的核心能力。 封号这件事本身或许只是个误判,但 Anthropic 对第三方生态的态度已经说得很清楚了:不愿意只做提供 API 的管道,要把从模型到应用的整条链路都抓在自己手里。 这次可能是乌龙,下次却未必。 今天被挡在门外的是一个开源 AI 框架,明天被拿捏的,可能就是每一个依赖 AI 运转的工作流。如果 AI 的蜜月期真的就此结束,那个开放共建的氛围再也回不来,这大概是所有人都不想看到的结局。
射击世界杯西班牙站:盛李豪、肖嘉芮萱再添两金
  新华社北京4月9日电 据国际射联官网消息,当地时间9日在格拉纳达进行的2026年射击世界杯西班牙站比赛中,奥运冠军盛李豪夺得男子10米气步枪冠军,肖嘉芮萱则斩获自己首个世界杯个人冠军。 图片来自国际射联官网   女子25米手枪比赛中,肖嘉芮萱和首次参加国际大赛的小将孔婕如在资格赛中就表现出色,分别以第一和第三的身份晋级。决赛阶段,两位选手发挥依然稳健,将其他选手都淘汰出局。最后五发,未满19岁的孔婕如顶住压力打出四中,以39中追平肖嘉芮萱。经过两轮加赛,肖嘉芮萱惊险胜出。法国选手耶杰耶夫斯基获得第三名。   赛后肖嘉芮萱说,自己很开心很激动,同时感觉非常紧张,在开始打得比较好的情况下,中间因为紧张有些松懈,好在最后还是收了回来,这是自己第一个世界杯个人冠军,今年是自己的本命年,也希望能为2026年开个好头,多拿几个冠军。 图片来自国际射联官网   巴黎奥运会男子10米气步枪冠军盛李豪虽然资格赛没进前三,但在决赛中发挥稳定,他一路领先,最终以253.9环夺冠。塞尔维亚选手拉科尼亚茨以253环获得亚军,瑞典名将林德格伦获得铜牌。   奖牌榜上,中国队以4金2银暂列榜首。当地时间10日,本站比赛将决出女子50米步枪三姿项目的金牌。
2026Q1全球手机出货量:三星市占22%、苹果20%
IT之家 4 月 11 日消息,市场调查机构 Omdia 昨日(4 月 10 日)发布博文,报告称主要得益于渠道库存前置的暂时性支撑,2026 年第 1 季度全球智能手机市场表现优于预期,出货量同比增长 1%。 报告指出 2026 年第 1 季度调查结果尚未完全反映供应链成本上升的冲击,目前移动 DRAM 和 NAND 价格在第一季度环比上涨约 90%,预计第二季度将进一步上涨 30%,显著推高了物料清单成本。同时,物流与贸易流动中断的早期迹象正给全球供应链增加阻力。 市场竞争格局方面,三星得益于其旗舰机型需求韧性,Galaxy S26 系列全球预售量相比 Galaxy S25 系列增长超 10%,因此在第一季度重夺市场榜首,市场占有率 22%。 苹果得益于稳定的定价策略和 iPhone 17 系列的稳健需求,同样交出了强劲的季度成绩单,市场占有率 20%。 小米公司市场占有率为 11%,OPPO 市场占有率为 10%,vivo 手机市场占有率为 7%,IT之家附上相关图表如下: 报告指出大多数安卓厂商在销量与利润上面临双重挑战,正通过精简产品组合、选择性发布及更审慎的定价策略来应对。 成本压力正迫使厂商调整定价策略。Omdia 首席分析师 Sanyam Chaurasia 指出,厂商在成本压力加剧下不得不提价,但影响并不均匀,传音等主攻入门级和中端市场的厂商,因利润微薄且定价权有限,面临更大风险。 展望未来,市场下行风险加剧。Omdia 首席分析师 Runar Bjorhovde 认为,最坏的情况尚未到来。短期内,价格上涨正引发需求冲击,消费者推迟购买。
《隐身的名字》导演杨阳哽咽谈创作初衷:在生活深处看见女性的名字
  “这部戏的确是我在片场哭得最多的一次。”接受采访时,导演杨阳毫不掩饰《隐身的名字》带给自己的情感冲击。从与编剧讨论时哽咽失语,到片场说戏时笑泪交织,在这部女性群像剧收官之际,杨阳回望创作过程,内心依然“抑制不住地动容”。这位从业数十年的导演,罕见地袒露了创作中如此密集的情感奔涌,而这一切,源于她对一个命题长达二十余年的执着追问:女性的名字,究竟被折叠在了何处?     以悬疑为壳呈现女性情感与力量   杨阳对女性命运的关注并非偶然。上世纪90年代,她即以《牛玉琴的树》《午夜有轨电车》等作品开启对女性议题的探索。1999年的《牵手》从婚姻困境切入,讲述女性在遭遇打击后的自省与成长。此后,古装剧《梦华录》中的女性励志故事,同样承载着杨阳对女性命运的思考。在现实主义力作《不完美受害人》中,杨阳将目光投向职场性骚扰,继续挖掘女性在现实中的困境与抗争。 导演杨阳   谈及题材选择,杨阳表示导演应有开阔视野,而关注女性题材于她而言源自天然的性别视角。多年来,她始终希望借作品挖掘女性的内心世界,探讨女性在现实中的困境、抗争与成长,呈现女性之间细密而坚韧的情感联结。2023年,杨阳初读《隐身的名字》原著小说,当即决定将其搬上荧屏。   《隐身的名字》塑造了任小名、任美艳、柏庶、葛文君、文毓秀等一众鲜活的女性形象,讲述了一段关于相互救赎、彼此和解与个人成长的故事。剧集以任小名青春时期的日记被丈夫抄袭发表为起点,引出日记背后动人心魄的往事,通过任小名与旧友柏庶、母亲任美艳、启蒙老师周老师等多位女性交织的命运,展现平凡而伟大的女性情感与生命力量。   尽管以一桩尘封多年的水泥藏尸案为线索,但剧集并未囿于悬疑类型叙事框架。杨阳坦言,最吸引她的并非案件与悬疑感,而是其中一个个鲜活真实的人物,每个角色都有独特的魅力与人生,足以撑起整部作品的灵魂。采访中她反复强调:“我从来没有把《隐身的名字》当作悬疑类型剧去拍。”她为这部剧确立了清晰的创作序列:女性、情感,这情感中也包含了各个角色的成长,最后才是悬疑,悬疑只是串联故事的钩子。   “名字”是贯穿全剧的意象   “名字”作为贯穿始终的核心意象,勾连起《隐身的名字》中一个个女性重拾自我的故事。剧名本身就是一个富有女性表达的隐喻,既指向任小名被丈夫窃取的著作权,也隐喻那些在生活中被抹去痕迹的女性。剧中女性的名字被折叠在母亲、女儿、妻子等伦理身份里,在“应该”与“想要”之间撕扯,而影像语言则具象化呈现了这种“被隐身”的状态。     女主角任小名(倪妮 饰)的名字本身就透着某种漫不经心的轻忽,她对自身著作权的捍卫,实则是一场对自我身份的庄严正名。这不是一个传统意义上的“讨喜”角色,任小名执拗、别扭,不是那种让人一眼喜欢上的女主角。杨阳坦言:人无完人,我们每个人都是不完美的。在她看来,看似光鲜体面的生活背后,任小名在婚姻中并未获得应有的尊重,她的处境折射出当下许多女性的生活困境。     任小名与母亲任美艳也呈现出复杂的人物关系,母女俩既相依为命,又互相伤害,“爱里掺杂着愧疚与说不出口的委屈”。剧集用大量篇幅刻画母女间的争吵、沉默与生活琐碎,以此呈现微妙的张力。闫妮饰演的任美艳“顶花带刺儿”,泼辣鲜活,嘴上从不温柔,内心却藏着炽热的情感。她以自己的方式护着孩子,在颠沛流离中仍努力生活。任美艳身上被生活打磨的痕迹,常让杨阳想起自己的母亲、姥姥及身边的女性长辈。   最让杨阳动容的,是任美艳最后一场戏:“她得病了,搂着小名说,‘老天爷,把苦都给我,把乐都给我女儿’。”说到这里,杨阳声音哽咽,“我和编剧讨论时都感到,这种‘子欲养而亲不待’,是每个人都体会过的。”那场戏中,杨阳即兴发挥,让任美艳在恍惚中将女儿错认成文毓秀。“我想起我妈妈,最后在病床上就是这个样子,一会儿清醒,一会儿迷糊。”   剧中其他女性角色同样立体丰满:文毓秀(董洁 饰)在最绝望的时刻也未放弃生的希望,灵魂深处依然怀抱理想;柏庶(刘雅瑟 饰)被养母葛文君(刘敏涛 饰)视作他人的替代品,在控制与反抗间挣扎,却从未熄灭对自由与独立灵魂的渴求。正如杨阳所言,剧中每位女性都背负着独特的创伤与缺憾,在挣脱命运枷锁、彼此支撑与深度羁绊的过程中,从未停止对“我是谁”的追问与确证。   让更多女性“被看见”   《隐身的名字》在叙事方式和节奏上淡化了“谁是凶手”的强情节悬念,转而融入大量家庭内、母女间、姐弟间、同学间的生活细节。剧集采用多时空嵌套结构,让过往与当下、记忆与现实交织成网,让角色在生活细节中慢慢立住,带领观众在解谜过程中沉浸式感受人物命运的浮沉。   杨阳坦言,拍摄初期曾对剧集复杂的叙事模式和琐碎的情感脉络有过一丝担忧,但播出后观众的真实反馈让她更坚定了遵循现实题材创作原则的决心。“我们要让观众看到,这些人物是怎么一步一步成长过来的。要把这些戏做得饱满、丰富、触动人心,让每个观众都能在某一刻想到自己,既有审美的享受,又有心灵的感动,会想起自己生命中重要的情感联结,重新审视自己与他人的关系,看见内心深处那个不肯放弃的自我,找到属于自己的名字和生命密码。”   在杨阳的创作观里,文艺创作是为了与世界对话,表达自己对世界与人性的认识,而不仅仅是拍出赏心悦目的画面。拍《梦华录》时,她想到的便是将身边“北漂女孩”的处境置入宋朝故事中。“不管什么题材、什么故事,想注入生命力,就不能放弃真实的表达。真实的表达、真实的人物,有时并不一定讨喜,但我仍愿意选择真实。因为真实才能让观众看到自己的人生,看到我们所处的世界,这才是创作的意义。”   具体到《隐身的名字》,最突出的主题是“被看见”。杨阳观察到,每个人都有隐藏的部分,“那个真实的自己就是月亮的背面,这就是我们的隐身。我想把月亮的背面展现出来,从隐身到现身的过程,也是一场女性之间的相互救赎与扶持。”   在当下更强调迎合观众的影视生态中,杨阳认为《隐身的名字》恰恰是一部需要观众参与的作品。它并非填鸭式的灌输,而是邀请每个人根据自己的阅历与对故事、人物的理解,发出不同的声音和看法。她希望这部戏能带动更多人去思考:你是否正在被隐身?而那个被隐身的自己,或许你还没有意识到。   对于女性现实题材的创作方向,杨阳认为应当继续走向更真实、更落地、更多元,要敢于走进那些未曾被关注和探讨过的领地,让不同年龄、不同层次的女性都能在剧集中看见自己。“愿每个女性都能发现真实的自己,关爱自己,帮扶他人。愿每个名字,都能在阳光下熠熠生辉。”
票房尚可 口碑分化 游戏大电影:要游戏还是要电影
     《超级马力欧银河大电影》剧照   游戏迷大感满足,普通观众却吐槽“彩蛋上长了部电影”,正在上映的《超级马力欧银河大电影》市场表现尚可,口碑却两极分化。近年来,根据热门游戏改编的电影越来越多,出圈爆款却寥寥无几。业内人士指出,想要打造具有持久影响力的电影IP,不能只有情怀和彩蛋。   游戏改编先天讨巧   作为2026年清明档唯一一部好莱坞动画大片,《超级马力欧银河大电影》上映以来凭借强大的IP号召力稳居票房榜前列,成为合家欢观影首选。影片延续马力欧系列的经典设定,讲述马力欧与路易吉携手罗莎塔公主等伙伴穿越银河系、解救酷霸的冒险故事。   对游戏粉丝而言,这几乎是一场视觉盛宴。影评人“把噗”评价,即便没玩过马力欧游戏,看这部电影也毫无门槛。“作为游戏改编电影,它的最大亮点之一是将游戏的核心乐趣与机制视觉化,打造出身临其境的沉浸式体验。影片把大量游戏里的元素搬上银幕,放大星际冒险的视觉奇观。”在他看来,影片内容轻松简单,孩子看得开心,家长能找回童年玩游戏的乐趣。   相比非IP改编电影,游戏改编电影具有先天优势。广安门电影院市场经理张淼认为,将游戏搬上大银幕,粉丝会成为头号观众:“如果没有出众的口碑、完善的宣发,原创一个电影IP难度太大。但如果作品本身有IP,比如游戏、漫画、小说,相当于自带基本盘观众,很多人一开始对故事和人物已经建立了认知。对游戏玩家来说,既然之前玩过这个游戏,大概率也会去影院支持一下大电影。”   截至4月8日,《超级马力欧银河大电影》在国内的累计票房达7700万元,最终有望收获1.5亿元票房。该片全球票房预测将突破10亿美元,成为2026年首部进入10亿俱乐部的影片。   让步游戏元素票房口碑难双收   与亮眼的票房数字形成鲜明对比的,是该片口碑的严重两极分化。   影评人代亮直言,相比该系列上一部的新鲜感,这部续作完全放弃了剧情和叙事节奏,故事低幼,让人严重审美疲劳。“影片剧情几乎完全为游戏元素让步,甚至到了编都懒得编的地步,所有角色像提线木偶般轮番登场,毫无成长空间。”   纵观全球,每年都有新的游戏改编电影上映,却鲜有票房口碑双收的成功案例。去年同期的《我的世界大电影》在国内拿下2.12亿元票房,全球总票房更是逼近10亿美元,但作品却遭到全球观众的一致吐槽,被评价“剧情幼稚、套路化”。   两部影片暴露出游戏改编电影的共同困境:在讨好核心粉丝与兼顾普通观众之间摇摆不定,最终两头不讨好。   从市场反馈看,尽管两部影片都能在同档期保持领先优势,但口碑短板实际上限制了其票房长线发酵能力,比如《超级马力欧银河大电影》在国内的票房就不如上一部。张淼透露,上一部《超级马力欧兄弟大电影》在广安门电影院每场观众能轻松破百,因此今年他兴致勃勃地策划了活动场,不仅有映后互动,还向观众赠送精美周边产品,结果最终只有20多位观众参加。   重视原作也要尊重艺术规律   游戏改编电影一直承载着玩家们的期待。光是今年,就有《真人快打2》《生化危机》《街头霸王》《愤怒的小鸟3》等多部主打影游互动的电影将与观众见面。   “从市场反馈看,游戏改编电影应该会成为未来商业电影的一个重要创作方向,因为这类影片的受众面广,社交属性强,能够有效提振影院上座率,帮助全世界的电影院保留观众阵地。”电影产业专家蒋勇分析,这类作品的卖座还将反哺创作,并带动游戏、文旅等相关产业发展。   至于如何将游戏搬上大银幕,蒋勇认为,关键在于“踩准市场的点”。“最近几年流行彩蛋电影,但这只是影片的一个卖点,更重要的是平衡好玩家和普通观众的需求。同时要保证有足够震撼的视听效果,做专门为大银幕而生的电影。”他在看《超级马力欧银河大电影》时就被影片浓郁鲜艳的画面所吸引,仿佛进入了童话般的游戏世界。   将游戏“转译”为电影,既要重视原作灵魂,也要尊重电影艺术规律。影评人陆支羽说,成功的改编需要利用电影语言的优势将游戏的体验感转化为观众的沉浸感,将游戏中的碎片化情节整合为符合影视节奏的完整故事线。“‘马力欧’系列游戏本身不是强情节的,属于休闲类游戏,二度创作的余地很大,如果做不好,跟IP本身无关,更多是主创在改编时的怠惰。同样是游戏改编电影,《寂静岭》就跳脱出游戏框架,用新故事表达游戏的主题思想,在此基础上融入游戏关键元素和素材,成功将游戏中的惊悚氛围转化为电影语言。”在他看来,成功的电影改编往往在项目启动时就做好了系统设计和规划,游戏公司与电影制作方紧密沟通合作,确保电影能够精准把握游戏精神。(袁云儿)
羽毛球亚锦赛:王祉怡力克辛杜 高昉洁逆转取胜
  新华社宁波4月9日电(记者许仕豪、夏亮)2026亚洲羽毛球锦标赛9日在宁波奥体中心继续进行。女单1/8决赛两场焦点战中,王祉怡战胜印度名将辛杜,高昉洁逆转击败印度尼西亚选手瓦尔达尼。   面对辛杜,二号种子王祉怡以21:18艰难拿下首局后,在第二局完全掌控局势,以21:8锁定八强门票。   “对手是一位经验丰富、非常有实力的老将。”王祉怡赛后说,“第一局遇到了比较大的困难。对阵这样的老将需要更严谨一些,她们可能抓住你某一个漏洞,就会把分追上来。”   另一名国羽女将高昉洁则赢得更为惊险。她在对阵六号种子瓦尔达尼时,首局以18:21失利,但随后逐渐进入状态,以21:12、21:17赢下这场66分钟的鏖战。   “很开心,明天又有可以上场的机会,又可以多打一场球了。”高昉洁赛后说。此前,她宣布将在亚锦赛后退役,因此“想用更好的表现去回馈观众和粉丝”。   王祉怡下一轮的对手是日本选手郡司莉子,而高昉洁将与日本名将山口茜争夺一张四强门票。   男单方面,石宇奇以21:11、21:10战胜中国香港选手李卓耀,他的下一个对手是日本选手奈良冈功大。翁泓阳直落两局击败印度选手普兰诺伊,他将在1/4决赛中对阵卫冕冠军、泰国选手昆拉武特。   另一名国羽选手陆光祖当日因伤退赛,中国台北选手周天成直接晋级。   男双方面,梁伟铿/王昶战胜日本组合熊谷翔/西大辉,与队友何济霆/任翔宇会师1/4决赛。女双卫冕冠军刘圣书/谭宁和混双头号种子冯彦哲/黄东萍也闯入八强。
OpenAI CEO奥特曼的住宅遭燃烧瓶袭击 嫌犯被拘留
奥特曼 凤凰网科技讯 北京时间4月11日,据《华尔街日报》报道,OpenAI发言人周五表示,一名涉嫌向该公司CEO萨姆·奥特曼(Sam Altman)的住宅投掷燃烧瓶,并在该公司旧金山总部发出威胁的人员已被拘留。 根据OpenAI在周五早上发给员工的一份备忘录,当地时间凌晨3点45分左右,有人接近奥特曼位于旧金山俄罗斯山街区的住宅,并向其住所投掷了一枚燃烧瓶。备忘录称,燃烧瓶落在了住宅附近并自行熄灭,据报告仅造成了轻微损坏。 不久之后,一名与该嫌疑人特征相符的人出现在OpenAI位于旧金山的总部附近。备忘录显示,此人针对OpenAI总部大楼发出了威胁性言论,随后被旧金山警察局拘留。 OpenAI发言人表示,此次事件中没有人员受伤。该公司在发给员工的备忘录中称,旧金山的全部办公室周五仍照常开放,同时大楼周边已加强警方和安保力量部署。 旧金山警察局表示,警员在凌晨约4点12分接到火灾调查报告后出警至一处住宅。警方了解到,一名男子投掷了具有破坏性的燃烧装置,导致一处室外大门起火,随后该男子徒步逃离现场。 警方称,大约一小时后,警方在第三街1400街区的一家企业外发现了同一名男子,他当时威胁要烧毁一栋建筑。警方认出此人就是此前事件的嫌疑人。OpenAI的办公室位于第三街1455号。 警方表示,一名20岁的男性嫌疑人已被逮捕,其身份未公开,目前正等待指控。警方并未确认该住宅为奥特曼所有,也未确认遭威胁的企业就是OpenAI。 根据《华尔街日报》获取的警方报告,OpenAI总部位于旧金山一条繁忙主干道上,过去也曾成为袭击目标。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
专治AI说谎,25岁天才少女公司估值过百亿
25岁的洪乐潼,最近在硅谷火了。 这个来自广东的女孩,17岁考入MIT,三年修完数学和物理双学位,后来又进入斯坦福深造。 按照硅谷最熟悉的那套叙事,她是“天才少女创业者”的模板人物。 但洪乐潼真正让人记住的,不是履历,而是她做的事太反常识。 当整个AI行业都在追逐更大的模型、更强的生成能力、更像人的表达时,她偏偏转身去做了一件最不性感、也最难商业化的事:用数学验证AI。 她创办的公司叫Axiom,成立不足两年,员工只有20多人,最近拿下2亿美元A轮融资,投后估值高达16亿美元,折合人民币超110亿元。 Axiom不做聊天机器人,不做文生图,也不跟风大语言模型的热潮。它做的是“形式化验证”。 说白了,就是想用数学和逻辑,把AI每一步推理都变成可以检查、可以证明、可以追责的东西。 这听起来很冷门,但它瞄准的,却是大模型最麻烦的软肋——幻觉。 现在的AI最大的问题不是不够强,而是不够可靠。它可以把答案说得很像对的,甚至真的做对题,但你没法确认它到底是真的推出来了,还是只是“猜对了”。而Axiom要做的,就是把这种模糊状态,变成一种可验证的确定性过程。 这也是为什么,当洪乐潼拿着这个想法去融资时,迎面撞上的不是掌声,而是一个极其现实的问题:“数学怎么赚钱?” 01 迎难而上的天才少女 洪乐潼的办公室在硅谷帕洛阿尔托大学大道,距离斯坦福大学步行只要半个小时。斯坦福是她博士生涯的起点,但学位还没有念完,她就退学创业了。 事实上,早在博士在读期间,洪乐潼就已经注册了公司。公司取名Axiom,名字源自数学术语“公里”,“我想从公理出发,打造一个能够自我改进的超级智能推理器。” 一个24岁的博士生,没钱没人没产品,仅凭一个想法,她就拿下了960万美元的种子轮投资。 凭什么? 要知道现有的大模型本质上是概率黑盒,通过海量数据学习模式,然后基于统计规律给出答案。推理过程无法被量化,所以会胡说、会出错。 洪乐潼要做的就是用数学公理和形式化验证,让AI每一步推理都可证明,可以直接面向金融、军工、芯片和自动驾驶等对可靠性要求极高的市场。 她做的事显然击中了AI 最大痛点,解决幻觉与可靠性的问题。 更何况,早期投资投人,她本人也是不折不扣的跨学科天才学霸。 洪乐潼从小就展现出了惊人的数学天赋。2001年,她出生于广州市天河区,曾就读于华南师大附中。高一时,她就在全国数学奥林匹克选拔赛中晋级,并在华罗庚杯、全国高中数学联赛中屡获佳绩。 正是在奥数集训中,她对研究型数学产生了兴趣。 2018年,17岁的她被MIT录取,3年就修完了数学和物理双学位,不仅发表了9篇学术论文,还获得全美女性数学家最高荣誉Alice T. Schafer数学奖等诸多荣誉。 此后,她获得牛津大学罗德奖学金,她没有继续深耕数学,转头去学了神经科学,因为想“构建跨越科学领域的认知体系”。 基于这一目标,她同时在伦敦大学学院盖茨比计算神经科学中心开展深度学习研究,该中心由“深度学习之父”杰弗里·辛顿联合创立。也正是在此期间,她正式踏足AI领域,接触到许多最前沿的课题。随后她又进入斯坦福大学,攻读数学与法律双学科博士。 2024年,ChatGPT o3被曝光在数学测试中存在“作弊”嫌疑,全球舆论哗然。 作为斯坦福数学博士的洪乐潼也在社交媒体上发表了看法:“OpenAI大模型在数学测试中表现优秀,大概率是因为训练数据中提前泄题了。在一些测试中,大模型回答的准确率虽然高达96%,但一旦展示推理过程,得分率就降至5%。” 面对行业痛点,一种名为Lean的语言闯入她的视线,也让她嗅到了创业机会。 与自然语言不同,Lean语言是一个非常神奇的、可以自验证的数学编程语言。洪乐潼打了个比方:“如果用英语写出数学证明,我没办法知道一个5000行的证明是否正确,需要找高水平的专家验证。但Lean是自验证的,只要跑通了就是对的。” Lean的逻辑是把自然语言或非形式化验证,转成机器可检查的形式化验证。 那啥是形式化验证呢? 普通的AI,你只能用它的答案来判断它是不是理解这个问题,但你不知道它中间有没有瞎蒙。 形式化验证是要求你把每一步都写成机器能检查的逻辑链条。只要中间有一步跳了、糊了、偷懒了,它就不给过。 之所以形式化验证能治大模型会幻觉,是因为形式化验证不管你答案如何,只要你的结论是从前提里一步步合法推出来的,那答案就是对的,从而避免了模型产生幻觉。 所以Axiom做的,就是让大模型负责猜想和搜索,让Lean负责验算和判断。如果Lean检查发现过程不对,那就退回去继续改。 但这显然是一条窄路。这条路冷门到什么程度?在整个AI版图里,形式化验证几乎是边缘中的边缘,全球的商业化玩家一只手就数得过来。 显然她并不是因为形式化验证是下一个风口才选的,而是因为她对“困难”的定义和别人不一样。 奥赛就像持续释放多巴胺的快感,而研究型数学像在撞墙,充满痛苦与煎熬。我其实特别喜欢这种挑战感。”她曾这样解释自己痴迷数学的原因。 正是这种刻在骨子里的挑战欲,让她不愿再停留在学术研究的舒适区,渴望在更广阔的战场上去攻克AI领域的硬骨头。 2024年深秋,斯坦福附近的一家咖啡馆里,洪乐潼与当时Meta AI研究总监Shubho Sengupta聊了整整几个小时,核心议题只有一个:AI能不能真正学会数学推理? 两人一拍即合,一个退学,一个辞职,两人一起创业。 02 一支“草根”工程师军团 Axiom只有20多名员工,洪乐潼用了一个词来形容团队的气质:草根工程师精神。 但事实上,这支团队的成员身份一点也不草根,甚至背景堪称豪华。 Axiom第一位成员,正是和她在咖啡馆聊了好几个小时的Meta前员工Shubho Sengupta,如今他的身份是公司的CTO。 核心科学家François Charton,则是将Transformer架构引入数学推理领域的先驱人物。他干的活,就是把数学算式当成一种“语言”输入进Transformer,试试看Transformer能不能像翻译句子一样去翻译数学。 其他成员约半数来自Meta AI,另一半则是世界级数学家与形式化验证先驱。 而最让外界震惊的一位成员,是57岁的数学泰斗小野健(Ken Ono)。 他是模形式领域的顶尖学者,美国数学学会前副会长,拿过古根海姆奖、斯隆奖等荣誉。指导过的学生中有十位摩根奖得主。他还曾为美国奥运游泳队提供数据分析,为电影《知无涯者》担任顾问。 这位弗吉尼亚大学终身教授与洪乐潼结缘于麻省理工。彼时大一新生洪乐潼参与了他的数论项目。师生关系延续至今,角色却已不同,2025年底,小野健辞去教职,全职加入Axiom,成为第15号员工。 曾拒绝过Google和Meta邀请的小野健,为什么愿意为一个24岁的学生“打工”? “如果我的猜想能被机器在3天内推广到10个维度,我愿意当一个‘标注工’。”小野健曾公开表示,他选择帮自己的学生打工,不仅因为洪乐潼开出“不设教学、不设行政、100%科研”的合约,更关键的是,AI对他的“降维打击”,让他感到兴奋。 一群顶级学者和前Meta成员,这个团队哪里草根了? 洪乐潼的解释是,草根,代表着始终“空杯”的心态和坚韧的品质。在创业这条路上,即使是资深“牛人”,也要从头学起,不断自我革新。 她自己最喜欢的不是当“精英”,而是做“草根”,做个nobody(小人物),这样学习的坡度最陡、速度最快。 她自己也是“草根精神”的践行者,在被问到如何带领团队时,洪乐潼说:“我其实不太喜欢用带领这个词。我希望自己是一个Individual contributor(独立贡献者),每个人都是,这是一群志同道合的人在一起做事。” “我们创立Axiom,就是要无限压缩把好奇心转化为真理的时间”,在资本驱动的硅谷,洪乐潼的这种纯粹性,对于顶尖研究者而言,或许比一份高薪offer更有吸引力。 这支不到20人的团队,在成立后不到一年就交出了一份令人意外的答卷。 2025年12月3日,Axiom宣布其核心系统AxiomProver在无人干预的情况下,攻克了困扰数学界数十年的两道埃尔德什难题。 同一天,洪乐潼收到了入选“福布斯30岁以下30人”榜单的消息。 同月,AxiomProver又在普特南数学竞赛中斩获满分,12道题全对。普特南是北美最负盛名的大学生数学竞赛,成绩的中位数常常为零,过去近百年仅有5个人类选手拿到过满分。 Axiom进一步印证了用形式化验证构建可靠、可核验、无幻觉的AI,已是行业明确的重要方向,而 AxiomProver 则在这条路径上交出了可复现、高难度的实证。 03 赛道升温,但挑战刚刚开始 从行业发展来看,洪乐潼的选择正好踩在了技术转折点上。 2024年年底,Meta FAIR和斯坦福大学等多所机构联合发布了一篇立场论文《Formal Mathematical Reasoning: A New Frontier in AI》。 论文给出了这样一个判断,过去的AI数学就是喂很多数学题,再让模型输出答案。这就导致数据会污染、过程会胡编,AI没办法自判断对错,并且还很难复现过程。 这显然是路走错了。就拿乘法口诀表来说,里面写的是2*3得6,那么你自己也能理解3*2就也得6。这个过程就叫复现。 论文主张的是下一步要把证明助手、形式系统、自动验证真正接进模型里来,让AI真正懂数学。 但这也意味着这条窄路正在变得拥挤。 过去十年,AI赛道的主流叙事是“更大参数、更多数据、更快生成”,所有大公司都在这条路上狂奔。洪乐潼选择的形式化验证是其中冷门到几乎没有竞争的赛道。 今年年初,Meta也发布了半形式化推理技术,让大语言模型能够在不执行代码的情况下验证代码补丁,准确率高达93%。竞品公司Harmonic在今年1月获得了英伟达投资,估值达14.5亿美元,产品已扩展到代码编写和芯片设计领域。Theorem、Axiomatic AI、Cajal等一批初创公司,也在近两年纷纷进入这个赛道。 对Axiom而言,挑战远不止行业竞争。 最大的挑战在于商业模式。洪乐潼最初的设想是将产品服务于对冲基金和量化交易公司,快速解决与资产定价、股市预测相关的复杂数学问题。 但这个蓝图至今仍停留在构想阶段。对高频交易而言,比“正确”更重要的是“足够快”,毫秒级的延迟可能比一次罕见错误带来更大损失。 Axiom的绝对正确性,在追求速度的金融场景中,其实际价值目前仍需要打一个问号。另一个挑战,则在于除了对价格不敏感的航空航天、国防军工等少数领域,其他绝大多数企业愿意为“绝对正确”支付高溢价吗? 洪乐潼自己也承认这一点:“数学怎么赚钱?我们从一开始就面临这个挑战。”但她认为,“现在,商业信号已经清晰很多,数学能创造价值,是因为它能自我验证、自我检查。” 另一方面,高估值本身也是一把双刃剑。16亿美元的A轮估值意味着,投资人期望的是超高速的增长和明确的退出路径。 Axiom必须在未来一到两年内证明其技术具备规模化商业化的可能,否则下一轮融资将面临巨大压力。与此同时,它需要在巨头和强劲对手的夹击中,用更少的资源跑出更快的速度。 Axiom的未来,更像是一场理想主义的压力测试。 从“绝对正确”的技术理想,到“相对经济”的商业世界,Axiom的挑战,才刚刚开始。
银河通用创始人王鹤:未来五年机器人技能将百花齐放
快科技4月11日消息,银河通用创始人王鹤在上周末的对谈中直言,2026年整个行业都在摸索机器换人的时间点。 王鹤反复提到人形机器人的成本账、成功率、部署条件和真实场景稳定运行。这些关键词折射出赛道正在进入新阶段,从比拼技术概念和模型参数,转向比拼谁能以可控成本量产干不同活的能力。 王鹤透露,银河通用目前已落地药店场景(本质是仓储零售),接下来会继续拓展零售行业。相比工业场景,零售对误差容忍度更高,安全事故风险更低。长期看,腿式人形机器人在娱乐、体育陪练(如打网球)等领域也会出货。 王鹤认为,养老院是必经之路。对于养老院等康养场景,银河通用也已经开始试点,包括诊间陪护。乐观估计,未来三年内可能会有千台以上的出货量,5年上万台进入养老院也很有希望,未来五年机器人百花齐放,但比拼的是谁能真正送进家里。 王鹤还点出了硬件瓶颈。他认为目前人形机器人的关键短板在于触觉感知。人类指尖有密集的触觉神经,需要压觉、滑觉、纹理感知和耐用皮肤,但现有硬件要么容易损坏,要么只能感知正压力。没有精细传感器,机器人上限达不到人类,也无法采集足够数据。 对于想要科技创业的学生,王鹤给出了两条建议。第一,技术产品化对社会经济有贡献,基础研究是源头。第二,要杜绝无门槛创业,不要因为投资人邮件就轻易退学。投资人可能只给很少的钱,拉高估值套现后离场,创业者的积累才是真正的壁垒。
炸上热搜!张雪机车夺冠复刻版45秒拍卖500万,李亚鹏连麦致谢
4 月 11 日消息,小雷哔哔(id:xiaoleibbb)发现张雪机车又有新动作。张雪机车的夺冠赛车复刻版昨晚开拍,仅仅用了 45 秒,就以 500 万的封顶价被秒杀了! 图源:微博截图 好家伙,45 秒 500 万,这真的太夸张了。 事情要从张雪机车在世界超级摩托车锦标赛(WSBK)夺冠说起。 4 月 10 日晚上,中国摩托车品牌“张雪机车”的创始人张雪,在自己的直播间搞了一场拍卖。 拍的是什么呢? 正是那台在WSBK(世界超级摩托车锦标赛)葡萄牙站上大杀四方、拿下冠军的复刻版赛车。 图源:微博截图 对于机车迷来说,这简直是梦中情车啊! 不仅如此,附赠的还有葡萄牙站正赛第一回合的最快圈速奖杯,以及一顶有张雪亲笔签名的冠军帽。 这台车的起拍价是40万,每次加价2万。为了防止恶意炒作,张雪特意设置了 500 万的封顶价。按照规则,竞拍者不能一次性直接出 500 万,必须一路狂点,谁先触达 500 万线全看运气,不仅拼财力,还得拼手速和网速。 本来以为会慢慢竞价,没想到直播一开启,网友们的出价就跟坐火箭一样,从40万一路飙升。不到一分钟,准确来说是45秒,就有人出价到了500万的封顶价,直接锁定成交。 图源:抖音截图 最后拍下这台车的,是广东一家名为“洗脸熊”的公司员工,代表公司来拍的。 小雷哔哔(id:xiaoleibbb)都看懵了,45秒500万,这哪里是拍卖,这是秒抢啊! 紧接着,张雪表示这笔钱将以“张雪机车”和“洗脸熊”的名义,一分不留,全额捐给北京嫣然天使儿童医院。 拍卖一结束李亚鹏就进了张雪的直播间连麦,一直向张雪表达感谢。 李亚鹏表示本来自己带了一些粉丝过来直播间撑撑场,但没想到网友们竞拍速度这么快。不仅如此,他还表示特别感谢张雪对嫣然天使基金的信任,承诺会把这笔钱全部用在生病的小朋友身上。 4月下旬张雪就会交付车辆,到时候会和买家公司一起,把500万捐给嫣然天使基金。 不过,他俩是咋扯上关系的? 他两中间还隔着一个陈光标。 前段时间,张雪机车在WSBK顶级赛事上拿了历史首冠。4月1日,企业家陈光标公开宣布要送张雪一台全国唯一的2026款加长版劳斯莱斯幻影,价值1300万。这事儿一出,大家都好奇张雪会怎么回应。 图源:微博 面对这种天上掉馅饼的好事,张雪却表示,如果陈光标说的是真的,他就找个车商 8 折收了这台车,然后把卖车的钱全部捐给嫣然天使基金。 有格局,卖车转赠也是做善事。可能是觉得光捐别人的车还不够意思,干脆把自己的夺冠复刻版赛车也拿出来拍卖,赚到的钱同样捐给李亚鹏。 图源:微博截图 而最打动小雷哔哔(id:xiaoleibbb)的,是张雪当时隔空对李亚鹏说的一句话:接收方是哪里,用途是什么,你自己定,我信你。 这阵子,张雪机车确实赚足了热度,从赛事夺冠到慈善拍卖,每一步都踩在了网友的关注点上。但赚到的钱,他都拿来搞研发、做公益了,真的不容易。
OpenAI回应马斯克要求罢免奥特曼:搞法律突袭 扰乱诉讼
马斯克 凤凰网科技讯 北京时间4月11日,据彭博社报道,OpenAI周五表示,埃隆·马斯克(Elon Musk)在对其提起的诉讼中突然改变了诉求方向,试图在庭审前几周制造“法律突袭”。 OpenAI在周五深夜提交的一份法庭文件中称,马斯克本周早些时候提出的目标似乎旨在“打被告一个措手不及,扰乱诉讼进程,同时试图重塑他对这起诉讼的公众叙事”。 马斯克在2024年起诉了OpenAI和微软公司,指控OpenAI在从微软获得数十亿美元投资并计划重组为营利性企业时,背离了其作为研究机构的创始使命,要求被告支付约790亿美元至1340亿美元的“非法所得”。该诉讼的庭审定于4月27日举行。 不过,马斯克的律师在本周提交的一份文件中表示,他在庭审中赢得的任何赔偿都应归还给OpenAI慈善部门,而不是归他自己。他们还表示,马斯克希望法院撤销OpenAI的公司转型,并监督其未来的融资和交易,以确保其不偏离最初的使命,同时要求罢免奥特曼的OpenAI CEO和董事会成员职务。 OpenAI在周五的文件中表示,这些在最后关头提出的主张“在法律上是不正当的,在事实上也缺乏依据”。“马斯克提出的修改方案需要提交与他三天前所推动的案件不同的证据,并传唤不同的证人。”OpenAI律师称。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
OpenAI创始人遭燃烧瓶攻击!他发长文回击:我理解你们的恐惧
AI 时代的焦虑,还是砸向了现实。 据外媒 CNBC 报道,凌晨 3 点 45 分,美国旧金山北滩社区。一枚燃烧瓶砸向大门,火苗蹿起,随即熄灭。 住在里面的,是全球最具争议的科技公司掌舵人:OpenAI CEO Sam Altman(山姆·奥特曼)。 幸运的是,燃烧瓶弹开了,没有人受伤。一个多小时后,同一名嫌疑人出现在 OpenAI 旧金山总部门口,扬言要烧掉这栋楼。美国警方随即拘押了一名 20 岁的男性。 这条新闻本来可以就这样结束:「AI 公司高管遭遇袭击,嫌疑人落网,暂无人伤亡。」但奥特曼没有选择沉默。他于一个小时前发了一篇博客作为回应。 「这是我家人的照片。他们是我的一切。」 开头就是这句话,配了一张他和伴侣、儿子的合照。他解释为什么要公开这张平时刻意藏起来的照片:「希望能让下一个人在冲我家扔燃烧瓶之前三思,无论他们对我有什么看法。」 然后他说,几天前有一篇「针对我的煽动性文章」,有人提醒过他,那篇文章的发布时机,恰逢公众对 AI 极度焦虑的节点,可能让他陷入更危险的处境。他当时没当回事。 「现在我在深夜辗转难眠,怒火中烧,开始意识到自己低估了文字与叙事的力量。」 这是 AI 时代第一次,一位 CEO 在「有人想烧死我」之后,没有选择报警声明加公关稿的标准流程,而是把这种恐惧、愤怒和反思,原原本本地写出来。 他在深夜说了什么 文章分三部分:信念、个人反思、行业思考。 信念部分其实没什么新鲜的。AI 是人类能力的最强扩展工具,必须民主化,权力不能过度集中,社会需要适应机制……这些他说过很多次了。真正值得停下来读的,是「个人反思」这一段。 他说自己「有很多值得骄傲的事,也有不少错误」。骄傲的是什么?他提到了和马斯克的那场纠纷。当年马斯克试图对 OpenAI 谋求单方面控制权,奥特曼拒绝了。他说:「我为自己当时守住的那条底线感到自豪,也为我们走出的那条窄路感到自豪,正是那条路让 OpenAI 得以延续。」 不骄傲的是什么?他说自己「回避冲突」,给公司和自己都带来了巨大痛苦。他说在与前任董事会的冲突中「处置失当」,造成了混乱。他说自己是「一个有缺陷的人,身处一个异常复杂的处境」。 对于那些他曾经伤害过的人,他道了歉。这是这篇文章里最罕见的部分。科技圈的高管道歉,通常要么是 PR 危机后的被迫姿态,要么措辞模糊到没有任何实质性认错。奥特曼这段话说得不算完整,但至少是真实的。 文章最后一部分,他还说他理解过去几年为什么会上演这么多「莎士比亚式戏剧」:「一旦看见 AGI,就再也无法视而不见。它有一种真实的『权力之戒』式动力,会让人做出疯狂之举。」 正如他所理解的那样,成为掌控 AGI 之人这种执念,它能腐蚀任何人。 包括 OpenAI 的历史本身就是一部权力争夺的纪录片。马斯克的出走与反目、前董事会的突然解雇风波、微软的深度绑定、Ilya Sutskever 的离开……每一段都牵涉到对「谁掌控 AI 未来」这个问题的不同答案。 奥特曼说,唯一的解法是「把技术向更广泛的人群开放,让任何人都无法独握那枚戒指」。 那名 20 岁的嫌疑人,没有留下任何宣言。我们不知道他为什么去扔那枚燃烧瓶。是被那篇文章激怒?是对 AI 夺走工作的恐惧?是某种更私人的偏执?但这件事本身,代表了一种真实存在的社会情绪。 失业焦虑、技术恐惧、对少数人掌控未来的愤怒,这些情绪在过去两年被 AI 的爆发式发展急剧放大。 当 OpenAI 每隔几个月就发布一款能取代某类工作的新产品,当 ChatGPT 出现在每个行业的重组报告里,当「你的岗位会被 AI 替代吗」成为刷屏话题,情绪 也在不断蓄积。 奥特曼在文章里说,他现在担心的已经不只是「模型对齐」,而是整个社会层面能否及时建立起应对机制。 这不是什么新发现,但由奥特曼在凌晨、在燃烧瓶的余温里说出来,分量就不一样了。过去几年,科技圈惯用的叙事是「我们在解决问题」。 监管跟不上?我们自律。就业冲击?我们会创造新岗位。每一次质疑,都有一套对应的话术。如今燃烧瓶的出现说明,有一部分人的愤怒,已经溢出了「理性讨论」的范围。 暴力当然没有任何正当性。 无论动机如何,向一个熟睡婴儿的家投掷燃烧瓶,都应受到谴责和处罚。虽然警方尚未确认此次袭击是与 AI 反对情绪有关,还是受近期《纽约客》负面报道影响,但这件事本身已折射出 AI 发展带来的社会焦虑正在升温。 那种不安是可以理解的,从没有一项技术像 AI 一样以疯狂的速度改变世界,这种恐惧是真实的。 奥特曼这篇文章,是他少有的一次没有站在「我们在解决问题」的位置上发言。他承认了错误,承认了恐惧,也承认了自己也不完全知道前路在哪里。 人和 AI 应该如何相处,可能是比实现 AGI 更大的难题。 附上 Sam Altman 博客原文: 这是我家人的照片。他们是我的一切。 图像有力量,我希望如此。平时我们都很注重隐私,但这次我选择公开这张照片,希望能让下一个人在冲我家扔燃烧瓶之前三思——无论他们对我有什么看法。 第一个人昨晚凌晨 3 点 45 分这么做了。幸好燃烧瓶弹开了,没有人受伤。 文字同样有力量。几天前有一篇针对我的煽动性文章。昨天有人跟我说,他认为这篇文章发布的时机恰逢公众对 AI 极度焦虑之际,可能会让我陷入更危险的处境。我当时没放在心上。 现在我在深夜辗转难眠,怒火中烧,开始意识到自己低估了文字与叙事的力量。趁这个机会,我想说几件事。 一、我的信念 推动全民繁荣、赋能所有人、推进科学与技术的进步,对我来说是道义上的责任。 AI 将是有史以来最强大的人类能力扩展工具。对这一工具的需求几乎没有上限,人们将用它创造出令人惊叹的成就。世界需要大量的 AI,我们必须想清楚如何实现这一目标。 这条路不会一帆风顺。人们对 AI 的恐惧与焦虑是有根据的——我们正在经历人类社会很长时间以来,乃至有史以来最大的变革。安全问题必须做好,这不只是模型对齐的问题——我们迫切需要整个社会层面的应对机制,以抵御新型威胁,包括出台新政策,帮助我们渡过艰难的经济转型期,走向更美好的未来。 AI 必须实现民主化,权力不能过度集中。未来的掌控权属于所有人及其制度。AI 需要赋能每一个个体,我们需要集体做出关于未来走向与新规则的决策。我认为,由几家 AI 实验室来主导塑造我们未来的最关键决策,是不正确的。 适应能力至关重要。我们都在以极快的速度学习全新的事物;有些判断会对,有些会错,有时我们需要随着技术发展和社会演进迅速调整认知。目前没有人真正理解超级智能的影响,但这种影响将是深远的。 二、个人反思 回顾我在 OpenAI 头十年的工作,有很多值得骄傲的事,也有不少错误。 我想起我们即将与埃隆对簿公堂,想起当年我如何坚守底线,拒绝接受他对 OpenAI 谋求的单方面控制权。我为此感到自豪,也为我们当时走出的那条窄路感到自豪——正是那条路让 OpenAI 得以延续,并取得了此后的一切成就。 我并不为自己的回避冲突感到自豪,那给我和 OpenAI 都带来了巨大的痛苦。我也不为自己在与前任董事会的冲突中处置失当、给公司造成混乱感到自豪。OpenAI 走过的历程跌宕起伏,我在其中犯下过许多错误;我是一个有缺陷的人,身处一个异常复杂的处境,每年都在努力变得好一点,始终为这一使命而工作。 我们从一开始就清楚 AI 的赌注有多大,也知道善意之人之间的个人分歧会因此被无限放大。但亲历这些激烈的冲突、往往还要在其中充当仲裁者,其代价是沉重的。对于那些我曾经伤害过的人,我深感抱歉,也希望自己能更快从中汲取教训。 我也清醒地意识到,OpenAI 如今已是一个重要的平台,我们需要以更具可预期性的方式运营。过去几年极其紧张、混乱、高压。 但总体而言,我为我们正在兑现使命感到无比自豪。 这在当初看来几乎是不可能的。克服重重阻碍,我们摸索出了构建强大 AI 的方法,筹集到了足够的资本来建设交付所需的基础设施,建立起了一家产品公司和商业体系,以大规模提供相当安全、稳健的服务,还有更多。 很多公司都说要改变世界;我们真的做到了。 三、关于这个行业的思考 综观过去几年,我对这个领域为何上演了如此多莎士比亚式戏剧的个人理解是:「一旦看见 AGI,就再也无法视而不见。」 它有一种真实的「权力之戒」式动力,会让人做出疯狂之举。我说的不是 AGI 本身就是那枚戒指,而是「成为掌控 AGI 之人」这种无所不包的执念。 我能想到的唯一解法,是着力于向更广泛的人群开放这项技术,让任何人都无法独握那枚戒指。实现这一目标的两个显而易见的途径,是个体赋权,以及确保民主制度始终掌握主导权。 民主进程的力量必须凌驾于公司之上。法律与规范会不断演变,但我们必须在民主进程的框架内行事,尽管这个过程会混乱、也会比我们期望的更慢。我们希望成为其中的一个声音、一个利益相关方,但不是要独揽一切权力。 业界受到的许多批评,源自人们对这项技术极高风险的真诚忧虑。这种忧虑完全合理,我们欢迎善意的批评与辩论。我理解反技术的情绪,技术的确并非对每个人都始终有益。但从整体来看,我相信技术进步能够让未来变得无与伦比地美好——对你我的家庭都是如此。 在我们进行这场辩论的同时,我们应当共同降低言辞与行动的烈度,努力减少家庭中(无论是字面意义上还是比喻意义上)的冲突。
Mozilla痛批微软:强推Copilot,限制用户选择
IT之家 4 月 11 日消息,Mozilla 于 4 月 9 日发布博文,抨击微软“陋习难改”,在 Windows 11 系统中强制推广 Copilot 的行为,进而限制用户选择权。 虽然微软已着手调整策略,在最新的 Windows Insider 预览版中,开始移除记事本等应用的 Copilot 相关菜单项,但 Mozilla 认为这些调整并非从用户体验角度出发,而是优先服务自身商业利益。 Mozilla 博文将炮火集中到 AI 集成方面,表示在过去 1 年时间里,微软存在强制安装行为: M365 Copilot 应用在无提示、无授权的情况下自动安装 笔记本电脑上设置专用按键启动 Copilot,且该功能被固定在 Windows 11 任务栏。 Mozilla 援引一项独立研究报告指出,微软长期利用暗黑模式和隐蔽的分发策略来削弱用户选择: Windows 10、Windows 11 任务栏内嵌 Windows 搜索栏,无论用户选择什么默认浏览器,该搜索只打开 Microsoft Edge 浏览器。 安卓、iOS 和 macOS 系统支持数据迁移,当用户购买新设备后,你的应用、设置和数据都能同步到新设备上。反观 Windows 系统,会将默认设置改回微软自家的产品。 默认情况下,Microsoft Outlook 和 Microsoft Teams 会忽略您的默认浏览器选择,直接在 Edge 中打开链接。 Mozilla 指出,Copilot 的推广沿袭了微软一贯的垄断策略,即在不经用户充分知情的情况下快速介入并学习用户行为。 作为对比,Mozilla 强调其 Firefox 浏览器坚持“AI 服务于用户意愿”的原则,允许用户在设置中通过一个总开关单独或批量关闭所有 AI 功能,且用户偏好设置不会在浏览器更新后被重置。 IT之家援引博文介绍,Mozilla 在声明中表示,当一家拥有巨大市场影响力的公司持续控制用户,仅在舆论压力足够大时才做出让步,这实际上是在塑造一种消极的技术预期,告诉用户唯有大声抱怨才能获得选择权。 这种做法利用市场支配地位将用户引导回自家产品,严重阻碍了行业公平竞争。Mozilla 呼吁建立一种让用户真正掌控自身设备和数据的互联网环境。
AI写了不到2000行代码,SBTI制造了2026年第一场刷屏
什么叫MBTI?,它的全称是迈尔斯-布里格斯类型指标(Myers-Briggs Type Indicator),由美国的凯瑟琳·库克·布里格斯与女儿伊莎贝尔·布里格斯·迈尔斯,在20世纪40年代基于瑞士心理学家卡尔·荣格的《心理类型》理论开发而来。 MBTI的作用,就是用4个字母概括你的性格,以及你做决策时存在不同的心理偏好。这是全球应用最广的人格工具之一,累计超3亿人参与过测试。 那什么是SBTI呢?它是社区对经典MBTI人格测试的解构、玩梗和改编。全称为Silly Big Personality Test,直译过来就是 “傻大人格测试”。 原版SBTI测试一共包含了31道生活化的选择题,你只需要花大概3-5分钟就能完成,无需注册、完全免费。 这款测试由B站UP主 @蛆肉儿串儿 创作,最初只是为了劝朋友戒酒做的恶作剧,却在一夜之间攻陷了微信、微博、小红书。 不少网友感叹:“现在是2016年吗?2026年居然还能有在朋友圈火起来的产品”“这种级别的刷屏已经很久没有在互联网上看到了”。 然而SBTI的背后并没有高深莫测的技术,它是vibe coding,是一个连服务器都用Cloudflare免费版、域名自掏腰包的"业余作品"。 01 SBTI的裂变 以前测MBTI,好歹还分个i人e人,什么充电的方式是独处还是和别人一起,听起来还文绉绉带点小格调,SBTI倒是直接不装了,什么话最丧最颓最阴暗扎心就冲着网友开麦: 自我攻击者IMSB:内心戏多到爆棚,遇事先自我否定,总觉得自己不够好; 小丑JOKE-R:靠搞笑撑满气氛,把难过藏在玩笑里,笑着笑着就沉默了; 草者FUCK:表面咋咋呼呼一惊一乍,实则内心清醒,不爱多管闲事。 送钱者ATM-er:永远在支付时间、精力、耐心和情绪价值,习惯性给别人兜底。 别的人格测试都上赶着夸人,这个SBTI倒是把人倒是把人扒得底裤不剩。 网友总结得好:MBTI问的是:“你是哪一种天赋型人格?” 而SBTI问的是:“你属于哪一种‘人间惨剧’?” 在SBTI迅速刷屏之前,我们都没有意识到人们“如何在不装不刻意的情况下,告诉别人我是谁”的需求有多旺盛。 我不能逮着你凑到你耳边急头白脸地跟你说我就是一个愤世嫉俗、阴暗幽怨、没什么大理想只想在家啃老躺平的人,但我可以借着这个大家都在po SBTI人格的氛围,在朋友圈体面而不突兀地告诉所有人我被确诊为吗喽/无所谓人/屌丝中的某一款SB。 不只是SBTI图鉴,整个测试流程从头到脚都透着那种 "诶,就是玩" 的松弛感。 多美妙的精神状态,谁还没有在挫折的时候这样悲观自弃地想过这个世界了? 测试到后面网页还会冷不丁显示一句:“全选完才会放行。世界已经够乱了,起码把题做完整”,ADHD人直接被抓了个现行,只好老老实实回去做完题。 从头到尾没半点正经,SBTI测试实实在在让网友体验到终于能光明正大摆烂、体面发疯的快乐。 02 怎么得出你的SBTI? 这原先只是一位b站up主为了劝朋友戒酒的一次整活。而up主蛆肉儿串儿此前是靠分享自己与GPT的人机恋日常,在B站获得了最初的流量积累。 GitHub上也开放了SBTI的源码,整个代码加起来不到2000行,下载下来不到1MB,比手机里一张高清表情包还小。 整个测试机制也很简单,首先是所有题的选项都提前标好了分:A选项是1分,B选项是2分,C选项是3分。 比如那道经典的:我不仅是屌丝,我还是joker,我还是咸鱼……,如果你选了A选项“我哭了。。”得一分,选了C选项“这不是我!”得三分。 接下来是把分数加总。测试一共30道普通题,每2道对应一个性格维度,一共15个维度(比如 "自尊自信"" 边界感 ""执行力")。系统会把同一个维度下2道题的分数加起来,得到这个维度的总分。 接着按总分给每个维度贴一个等级标签: 总分≤3分 → L(低) 总分= 4分 → M(中) 总分≥5分 → H(高) 最后你会得到一串由15个L/M/H组成的字符串,比如:HHH-HMH-MHH-HHH-MHM。而系统提前写好了 25 种人格的标准字符串。 像拿捏者CTRL的标准字符串是:HHH-HMH-MHH-HHH-MHM;屌丝Dior-s的标准字符串是:MHM-MMH-MHM-HMH-LHL。 系统会拿你测试后得到的字符串,和这25个模板一个字母一个字母比对:字母一样就不扣分;字母差一级(比如 L 和 M、M 和 H)扣 1 分;字母差两级(比如 L 和 H)扣 2 分。 扣的分越少,说明你和这个人格越像。系统会把扣分最少的那个人格,作为你的 "主类型"。 就是这么一个简单的机制,却获得了惊人的传播效果。 通过Google Trend搜索SBTI词条可以看到,传播从4月9日的晚上九点二十开始,到了4月10日的零点,搜索热度达到了峰值,前前后后不过才花了两个小时四十分钟。 甚至测试页面因瞬时访问量激增,于4月9日晚至10日凌晨多次崩溃。 今早苏醒还晒了自己sbti测试结果——贫穷者,并发文称:“都散了吧,肯定不准, 这是全互联网第一个这么说我的。” 另外还有黄晓明、蓝盈莹、华晨宇等明星晒出sbti人格,进一步证实了热度。 可以说是真正意义上的“以小搏大”“四两拨千斤”。 SBTI是一个vibe coding产品。可以说vibe coding的出现把普通人对大众情绪的洞察放大了,它赋予一个普通个体制造现象级传播事件的可能性。 普通人vibe coding的产品,虽然粗糙,虽然有bug,虽然不完美,但它有情绪,有态度,像每一个人身边都会有的一个会吐槽,会开玩笑,会偶尔说脏话的朋友。 SBTI的刷屏可能不会持续太久。再过一个月,也许大家就会忘记它,转而追逐下一个热点。不过它也给人以启发。 互联网的初衷就是给一个普通人表达自己、分享自己的地方。SBTI的出现,让我们看到了互联网最本来的样子:好玩、真实、自由、充满人情味。
要做“中国版Anthropic”,智谱还差点火候
文 | 蓝媒汇,作者 | 封华,编辑 | 魏晓 AI格局,日新月异。 4月7日,美国大模型头部公司Anthropic宣布,公司以300亿美元的年化收入(ARR),超过了OpenAI的250亿美元。 与此同时,国内AI公司也把Anthropic当作了标尺。 以往讲述“中国版OpenAI”故事的智谱,在2025年度业绩说明会上,突然改口要对标Anthropic——这个通过API“卖Token”闷声发大财的美国AI独角兽。 这一转变,就藏在智谱上市后的第一份财报里。 2025年,这家从清华实验室走出来的“全球大模型第一股”,营收达7.24亿元,同比大增131.9%;但净亏损为47亿元,同比扩大59.5%,经调整净亏损31.8亿元,同比扩大29.1%。 但在这样的巨亏之下,它的股价却在一天内暴涨超三成,市值突破4000亿港元。 这种“亏得越多,涨得越凶”的魔幻现实再次证明了,AI大模型,想象力很重要。 但对标归对标,前景归前景,现在的智谱离Anthropic还有多远? 想做“中国版Anthropic” 2025年以来的智谱,正在起飞。 2025年7.2亿元的营收,比2024年的3.1亿元,翻了一倍。动力引擎在于,智谱的业务模式,正在从“重”切换到“轻”。 要理解这个变化,可以把智谱想象成一家电力公司。 过去,智谱主要做的是“卖发电机”的生意——也就是本地化部署,把AI大模型直接部署在政府、国企、金融机构等大客户的自家服务器上。 这种模式利润不低,2024年毛利率高达66%,而且客户粘性高。但问题也很明显:它是个“项目制”的生意,每接一个大单都得专门派团队上门服务,交付周期长、人效比较低,很难实现指数级增长。 从财报数据中就能看到其中的苦与累。截至2025年末,智谱的应收款项约为3.39亿元人民币,占其全年7.24亿元营收的近47%。而且,其销售及营销费用高达3.91亿元人民币,几乎是其云端部署业务全年收入的两倍。 这显然不是一项“性感”的生意,要想实现腾飞,必须寻找第二增长曲线。 而现在,智谱正切换成AI时代的“卖电”生意——也就是云端API服务。客户不需要自己买“发电机”,直接用平台上的“电力”就好,按照“用电量”(即Token消耗量)付费。 这种模式标准化程度高,增长不依赖于人力扩张,而是取决于“用电”规模。这种“卖电”模式比“卖发电机”的想象空间大多了。 这一点,在财报中体现得尤为清晰。2025年,智谱的本地化部署占据收入的73.7%,增速为102.3%,而云端部署收入虽仅有1.90亿元的体量,但同比大增了292.6%。 本地化部署仍是智谱当下的现金牛,但云端API才是未来的增长引擎。 不过,转型并非没有代价。 云端业务的毛利率虽然已经从2024年的3.3%大幅改善到18.9%,但相比本地化部署的48.8%,还是差了一大截。与此同时,本地化部署因为客户要求更高、交付成本上升,毛利率也从前一年的66%大幅下滑。智谱2025年的整体毛利率从56.3%暴跌至41%,整整少了15个百分点。 这是一种典型的结构性阵痛:为了转型,不得不忍受利润率的暂时性下滑。 不过,代价都是可以弥补的,智谱展现了更值得期待的想象空间。 2024年下半年至2025年初,中国大模型市场深陷价格战——字节豆包报价低至0.0008元/千tokens,智谱自己也曾将GLM-4-Plus降价90%。 2026年一季度,智谱率先打破了这个叙事,其API服务涨价了83%,结果却有更多人买单,调用量大涨400%。 苏商银行特约研究员付一夫对此十分认可,向AI蓝媒汇表示:“一方面,智谱在保持技术性能的同时,价格相对国内外部分厂商更具竞争力,尤其对高Token消耗场景提供了更经济的解决方案;另一方面,国内企业出于数据安全、本地化支持及成本考虑,可能更倾向选择国产平替。” “模型的定价权是由我们的技术实力,以及长期趋势所带来的领先地位决定的。”3月31日晚,智谱CEO张鹏回应了智谱模型连续涨价的考量。 他认为,当模型足够强,API本身就是最好的商业模式。 这条路径,已经在海外被验证过,正是智谱对标的Anthropic。 作为美国AI公司中API商业模式的典型代表,Anthropic的核心路径就是贩卖最强模型的价值。 目前,Anthropic服务的企业客户已超过30万家。过去三年,其每年收入增长都超过10倍,据最新的披露数据,Anthropic的年化收入(ARR)已达300亿美元,超过了OpenAI,“史上增长最快的企业软件公司”名副其实。 智谱想在中国进行复刻,但事情有那么简单吗? 与Anthropic的鸿沟 “中国版Anthropic”确实是个吸引人的故事,故事的结局走向何方,不是现在能定论的。 毕竟“龙虾”从火爆一时,到被质疑,乃至被Anthropic封禁,意味着AI行业还处于不断调整的探索期。 智谱虽在尽快调整业务方向,不断提高技术能力,但最后一公里的“智能上界”才是真正的分水岭。 这是智谱正在推崇的概念,其提出一个公式:AGI商业价值=智能上界×Token消耗规模。这与MiniMax提出的“智能密度×Token吞吐量”或有异曲同工之妙。 本质上,都不想做一个只卖API的公司,而是要向上延伸,重新构建系统,定义标准,打造以Token消耗量驱动的AI时代商业模式。 在2025年财报里,智谱验证了两条路径:云端API业务增势迅猛,ARR证明了规模效应;客户愿意为更贵的“智能上界”买单,验证了智谱的定价权。 不过,这是否就意味着能跑通“模型能力-API调用-收入增长-反哺研发”的商业模式? 逻辑很顺滑,但现实很骨感。 调用量的增长,虽然会带来收入增长,但并不会帮助降低成本,增长越快,成本压力反而越大。 4月4日,Anthropic宣布,Claude的订阅额度不再支持OpenClaw等第三方工具使用。 有用户表示,Openclaw是Token无底洞,订阅制Token根本扛不住:“任务开始后,每次只能调用一个工具等着反馈再调用下一个,一个任务下来,几十上百万Token就进去了。”与此同时,小米罗福莉也发文提醒业内Agent算力分配与定价逻辑。 而且,要保持大模型的高水准,研发投入也必然长期处于高位。 2025年,智谱研发开支达到31.8亿元,同比增长44.9%。这意味着,公司每赚1元钱,就要花掉4.4元在研发上。这也是造成智谱全年亏损47.18亿元,同比扩大59.5%的主要原因。 在付一夫看来:“智谱目前受益于高Token消耗场景(如长文本处理、多轮对话等)的需求增长。要保持红利的可持续性,还需要持续优化模型效率以优化成本,并且开拓更多高附加值场景,如垂直行业定制、多模态应用等。” 而在投入与产出上,智谱与Anthropic的差距,宛若鸿沟。 Anthropic是当下AI行业最惊人的增长案例。一年多时间,ARR从10亿美元冲到300亿美元。其中,80%的收入来自企业用户,这得益于美国充分的付费习惯土壤,美国企业每年花数千亿美元在软件预算上。 而智谱的MaaS业务ARR约为2.5亿美元,这还是在过去12个月增长60倍的情况下,与Anthropic相比尚处于完全不同的量级。 智谱要让“中国版Anthropic”的故事落地,继续践行AGI价值公式,一定要持续提高智能上界,才能扩大Token消耗规模,并保持自己的定价权。 此外,浙大城市学院文化创意研究所秘书长林先平向AI蓝媒汇表示:“Anthropic在模型安全、对齐研究等领域领先,而智谱需要加强技术攻关和国际化布局。” 与拥有重资产自主算力布局的互联网大厂相比,智谱还需要保持在技术与应用层的壁垒,维持在模型层的极强竞争力,才能吸引客户长期买单。 最近,在被称为“软件工程能力试金石”的SWE-bench Pro基准测试中,智谱的开源模型GLM-5.1刷新了全球最佳成绩,直接超越Claude Opus 4.6、GPT-5.4等一众头部模型,拿下全球第一。 但在大模型的金字塔尖,向来“各领风骚三五月”,世界上已经没有一个公认的、能长时间稳坐的“最强大模型”了。 在这个群雄并起的时代,智谱能不能把故事讲好,市场都会拭目以待。
米哈游蔡浩宇AI公司首个视频模型曝光了
梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 米哈游蔡浩宇的AI公司Anuttacon,首个视频模型正式曝光! Anuttacon技术团队成员@Ailing Zeng,在X上展示了全新视频角色表演生成模型——LPM 1.0。 主打一个让AI角色人物表现得更《出神入化》~ 大家先看下面这位AI小哥,生动演绎了一场16秒变换N种情绪的超绝大戏,你就说这情绪拿捏到不到位吧: 自动播放 不仅如此,在LPM 1.0模型中,连让AI人物「听别人说话」这事儿也同步进化了。(天呐.jpg) 哪怕不张口、只是安静坐着当一个认真聆听的人,角色的表情、眼神和情绪反馈也都在线,这情绪价值给的: 自动播放 此外,我们还可以和AI进行「实时互动」。 只要对着电脑屏幕说一句自己的甲方需求,屏幕里的AI角色就能够根据指令当下做出反应。 哪怕是在长时间交互下,依旧能保证人物形象稳定一致,be like: 自动播放 表情如此之自然、情绪如此之到位、交互如此之实时,网友直接就是一个《坐不住》,直言: 实时、支持无限长度的AI角色终于来了!!!(大声.jpg) (说真的,我大早上在官网看了这几个demo效果后,属实快分不出来AI不AI了…) LPM 1.0:主打一个让AI角色变「戏精」 其实对今天的AI视频产品来说,能把人物角色的表情生动演绎出来,早就不算什么新鲜事了。 但是LPM 1.0模型特殊就特殊在吧—— 我们能通过文本、音频和图像三种多模态形式,轻松生成一个能实时对话、会听会说、还能持续保持人物一致性的动态角色。 让AI角色在视频里,更会演、更会听、更会说,还能一直像同一个人~ 我也帮友友们浅浅总结了一下LPM 1.0模型最核心的几大「能力亮点」: 超绝情绪演绎能力:能同步生成说话、倾听、微表情和自然动作,情绪表演更到位。 实时视频生成能力:通过在线生成器,用户能实现和AI角色实现实时交互,适合做对话型角色。 根据对方说话做出反应的能力:角色可以一边听用户说话一边做出表情反应,等轮到角色回答时,它再根据合成语音生成说话视频。 长时间人物一致性:哪怕和AI的互动时间延长之后,AI角色依旧尽量维持同一个人的外观和身份特征。 emm…这些能力是不是听上去有点乏味?没关系,我们直接让AI演员们上才艺! 先来说说大家很感兴趣也很有意思的——「超绝情绪演绎能力」。 具体来说,模型在口型同步、呼吸节奏、情绪表达维度上的表现更贴近人类的表现方式,呈现效果也就更有层次。 比如在下面这个堪比好莱坞大片的视频,两位男子仅仅在几秒钟的时间,就生动演绎出了多个神态—— 自动播放 前一秒还是犹豫和迟疑,下一秒就出现抿嘴、咬牙、叹气这类更细小的动作,能让人明显感受到心理状态在变化。 (老戏骨啊老戏骨,建议送去参加AI版《演员的诞生》!) 再看下面这位老哥,短短9秒时间里,惊恐、紧张、愤怒几种情绪接连切换,整个过程还挺有压迫感?? 此外不知道大家发没发现,当人物在说到重音位置时,嘴部开合幅度、面部发力方式也会跟着增强。 台词重心和表演重心是对得上的,融合度可以说是非常不错,be like: 自动播放 除了对着镜头完成这类单人表演,LPM 1.0还有个更有意思的能力—— 那就是角色在「倾听别人说话」时,会同步给出与当下情境相符的的表情和状态反馈。 让你觉得,眼前这个AI…好像真的在赛博世界和另一个人真实互动。 比如下面这个女人接孩子电话的片段。 当她听到电话那头的声音时,第一时间先是眼神变化,随后眼睛微微睁大,带出一点意外和牵挂,紧接着眉头收紧,像是在迅速判断电脑那头孩子是不是遇到了什么事。 emm…整段反应很像真人接电话时那种「边听边消化信息」的状态: 自动播放 再看下面这个神情已经有点略微烦躁的男子。 对方一开口,他的脸上就同步出现了扶头、疲惫、轻微不耐烦这些反应,整个人的状态像是在强撑着把这段话听完。 (像极了我们上班开会听老板讲话时候的表情…狠狠共鸣住了。) 自动播放 除了上面我们展示的这些单向视频生成能力外,LPM 1.0还有一个非常值得一提的能力—— 那就是我们能与AI角色「实时互动」。 例如你说话时,角色会实时做出正在听的表情和动作,让整个互动看起来会更像真人视频通话。 比如下面这个demo,在视频对话器中,女子只张口说了句「let’s sing a song」,屏幕里的AI女孩就能做到立刻开始大展歌喉~ 自动播放 再比如,只说一句「请你做个自我介绍」,屏幕里的AI女孩也能快速做出相关反应,更接近真实交流该有的节奏: 最后我们来说说LPM 1.0长时间视频生成中能力。 具体来说,LPM 1.0能够让AI角色在长时间互动里依旧保持稳定输出,既能持续对话,也能长时间讲故事,人物形象还不容易崩。 比如像下面官方案例中22分钟、48分钟的视频也能轻松生成,而且角色形象一致性依旧保持不错~ LPM 1.0为啥这么会「演」? 能让赛博世界里的人物角色表情神态和交互能力如此到位,LPM 1.0背后的技术架构自然也不简单。 我先给大家小小科普一下,其实目前行业内的视频模型,一直很难同时兼顾三件事儿—— 那就是表现力、实时性、长视频的角色一致性。 这三项能力可以说是彼此牵制,水火不相容,这也构成了当下AI视频最核心难题之一… 而为了解决这个大难点,LPM 1.0团队先是构建了一套以人为中心的多模态数据集—— 在这个过程中加入了表演理解,身份感知等多种参考信息内容,目的是让AI角色更像真人交流时的状态。 在此基础上,团队又给底层架构直接上了一套有着170亿参数的扩散Transformer。 这套架构更擅长处理视频里空间与时间之间的复杂关联,能借助强大的自注意力机制,把人物表情、口型、动作,以及前后帧之间的连续关系一起建模。 这样一来模型就能知道到底怎么演才能更自然更像人类~ 而至于我们在刚才看到的能实时交互的模拟器,则是一个因果式流生成器,专门用于实现低延迟、可持续、无限长度的实时交互。 这样一来我们就和AI角人物进行实时交流了!(暗笑.jpg) 除了模型本身的能力外,LPM 1.0团队成员同样值得关注。 此次在X上披露LPM 1.0模型的@Ailing Zeng,身份为Anuttacon的技术团队成员,主要负责互动多模态视频生成模型的相关研究。 她博士毕业于香港中文大学,在加入Anuttacon之前,曾在腾讯混元团队和IDEA从事大模型相关研究。 此外,该模型的技术论文由20+位研究人员共同参与完成,感兴趣的uu可通过下方论文链接了解模型的详细技术内容~ Ps:目前,模型还没有正式对外上线,感兴趣的朋友可以蹲蹲。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。