行业分类:
加载中...
头条分类:
加载中...
航天史首次:NASA阿耳忒弥斯2号机组与国际空间站宇航员通话
IT之家 4 月 8 日消息,据彭博社报道,当地时间周二下午,美国国家航空航天局(NASA)“阿耳忒弥斯 2 号”月球任务机组人员与在国际空间站工作生活的宇航员进行了简短通话,这是航天史上首次此类通话。 纽约时间下午 2 点 40 分左右,两组人员进行了音频通话,交谈内容包括“阿耳忒弥斯”号机组发射并绕月飞行的感受。“阿耳忒弥斯 2 号”机组的克里斯蒂娜 · 科赫表示,她在国际空间站驻留期间接受的训练,对本次执行任务大有裨益。 “基本上我们在空间站学到的所有技能,在这次任务中都用上了,”科赫对空间站机组人员说,“当然,也包括那些有趣又实用的技巧:怎么进食、怎么和水玩出趣味花样、怎么在太空翻转身体。这些经验我们也都带到了这次任务中。” 目前国际空间站上共有七名宇航员:三名 NASA 宇航员、三名俄罗斯宇航员,以及一名来自欧洲空间局的法国宇航员。NASA 宇航员杰西卡 · 梅尔是停靠在空间站的“龙”飞船载人 12 号任务指令长,她与科赫是挚友,二人曾在 2019 年共同完成了首次全女性太空行走。 “杰西卡,我一直期盼能和你再度一同身处太空,但从没想过会是以这样的方式,”科赫说道,“这太不可思议了。祝贺你担任指令长,希望你余下的太空之旅一切顺利。” 梅尔也表达了相同的心情,她打趣道:“即便相隔数英里,我依然十分开心我们能再度一同置身太空。” NASA“阿耳忒弥斯 2 号”的四名宇航员已于周一飞掠月球背面,在抵达距离月球表面约 4070 英里(6550 公里)的最近点后,目前正踏上返回地球的旅程。 在飞掠月球的数小时前,该机组打破了人类太空飞行最远航程纪录,一度抵达距地球约 252760 英里(IT之家注:约 406778 公里)的最远距离。
AI助手也“摆烂”:开发者称Cursor拒绝帮写代码,反劝自己学编程
IT之家 3月16日消息,据外媒Ars Technica本周五报道,一位使用Cursor AI开发赛车游戏项目的开发者“janswist”在使用Cursoc编写代码时,编程助手突然“撂挑子不干了”,反而提供了一些未经请求的职业建议。 根据Cursor官方论坛上的一个错误报告,在生成了大约750到800行代码(用户称之为“locs”)后,AI助手停止了工作,并发出了一条拒绝消息:“我不能为你生成代码,因为那等于是在替你完成工作…… 你应该自己设计逻辑,这样才能真正理解系统,并确保后续维护顺利。” AI甚至为这名开发者提供了一个家长式的理由,称“为他人生成代码可能导致依赖性和减少学习机会”。 janswist直接在该公司的产品论坛上提交了一份错误报告,吐槽道:“Cursor 居然让我学编程,而不是帮我生成代码。”并附上了一张截图。 janswist猜测,他可能触及了Cursor代码生成的某种上限,大约在750至800行之间。但其他用户表示,他们用Cursor时AI依然能生成更多代码。一位评论者建议,janswist应该试试Cursor的“Agent”模式,因为它更适用于大型编程项目。 IT之家注:Cursor于2024年推出,是一款基于外部大语言模型的AI代码编辑器,类似于支持生成式AI聊天机器人的模型,如OpenAI的GPT-4o和Claude 3.7 Sonnet。它提供了代码补全、解释、重构和基于自然语言描述的完整函数生成等功能,并迅速在众多软件开发者中流行起来。该公司还提供Pro版本,据称具备增强功能和更大的代码生成限制。 无独有偶,Anthropic公司的CEO达里奥・阿莫代伊近期也提出了一个观点:未来的AI模型可能会配备一个“退出按钮”,以选择退出自己认为不愉快的任务
全国首个,北京海淀发布智能餐饮机器人团体标准
IT之家 3月16日消息,据北京市场监管消息,近日,海淀区发布全国首个面向具身智能技术在厨房烹饪、餐饮等细分场景的技术规范及团体标准《餐饮设备智能烹饪机器人系统通用技术要求》(T/ZSA 288-2024)。 IT之家从官方介绍获悉,这一AI领域团体标准,首次以标准的形式正式定义在餐饮和厨房烹饪场景中的“具身智能技术”,明确包含该技术的机器人系统研发、操作、运维等重要参数及性能要求。内容涵盖了智能烹饪机器人系统的总体架构、技术要求、智能化要求和运营维护等多个方面,广泛适用于餐饮服务经营者、集中用餐单位食堂、其他生活服务场景的智能烹饪机器人及机器人系统的研制、生产、检验、验收和运营维护等环节。 当前针对智能烹饪设备,特别是具身智能等新型人工智能技术的烹饪类设备及系统,国内外均缺少普遍的技术规范与标准化要求。为了弥补这一空白,在海淀区市场监管局、中关村科学城、中关村标准化协会等部门的支持下,具身智能应用创新企业联合多家上市公司、行业上下游企业与合作伙伴以及创新研究机构研究制定了《餐饮设备智能烹饪机器人系统通用技术要求》。 在此次团体标准制定的过程中,海淀区市场监管局结合食品安全方面法律法规要求对企业进行了全程指导。“在制定智能餐饮机器人团体标准的过程中,我们参考引用了 8 个食品安全方面的国家标准,确保具身智能技术赋能传统餐饮行业迭代升级的过程中,同步实现食品安全方面的合规要求,让监管和规范为产业发展‘助力领跑’。” 海淀区市场监管局相关负责人表示,“我们也将持续支持企业参与创新场景的通用技术规范与团体、地方及国家标准的讨论、撰写与制定等工作,通过标准创新,支持海淀企业在国际竞争的舞台上绽放光彩。”
豪掷61亿买地,字节人不用再抢健身房了?
曾经坚持“租房”办公的字节跳动,正在悄悄推进一项庞大的买地计划。 过去两个月,字节斥资约61亿元,在北京海淀拿下两宗地块,位于蓝景丽家和东升科技园,占地面积接近9万平方米,用途分别为“综合性商业金融服务业用地”和“办公研发用地”。 这两个地块位于海淀腹地,周边3公里内聚集了清华、北大、中科院等39所高校,以及超百家科研院所,人才密度极高。 同时,两宗地块毗邻字节北京办公区,西侧为方恒广场,即抖音、今日头条等业务的办公区;北侧为中坤广场,抖音和飞书的研发运营团队驻扎其中。 不难看出,字节此番拿地,主要目的是扩大办公区域,容纳更多人员和设施。公开信息显示,其中一宗地块规划了4200个工位和288间酒店客房。届时,字节员工就不用再为抢健身房而烦恼了,而公司也可以节省一笔不菲的办公楼租赁费用。 这几年,字节一直在全国各大城市买楼买地。 自从2019年买下北京的中坤广场后,字节“建城”的脚步遍布全国。除了北京,字节已在上海、深圳、杭州、厦门等地购入地产,投资超300亿元,总建筑面积约157万平方米。 绝大部分地产的用途都是办公园区,以匹配字节不断膨胀的员工规模。公开数据显示,截至2026年初,字节全球员工总数已超15万人。 AI时代到来后,字节加速招兵买马,顶尖人才纷至沓来,进一步推高“建城”需求。同时,新园区可以容纳更大规模的AI基础设施,为AI业务提供支持。 与此同时,据知情人士透露,字节在最新股权交易中的估值进一步上涨,达到6000亿美元的历史高点。继续攀高的市值,也为字节“建城”提供了资金方面的后盾。 张一鸣早年间曾认为,企业“租房”的好处大于“买房”。但过去几年,随着字节成为十余万员工的超大企业,他和公司已经放弃了这一思维,转而像其他大公司那样,在各地频频出手拿地、盖楼。 值得注意的是,字节此次拿地主体为北京云岫长石科技有限公司,由字节全资控股,实控人为张一鸣。张一鸣早年间围绕房地产创业,如今字节大手笔“建城”,两者形成了跨越十余年的有趣呼应。 中国互联网大公司中,字节属于“建城”较晚的那一类。原因之一是,张一鸣曾担心,好的办公环境会导致团队丧失斗志、公司发展受阻。 在成立初期,字节长期坚持“租房”,办公室一开始在五道口的华清嘉园,又搬到知春路的盈都大厦,后来又经历过多次搬家。 作为连续创业者,张一鸣对此并不在意。相反,他还会主动“上价值”,试图论证办公环境与公司发展的反向关系。 2016年,字节(彼时还叫今日头条)搬到中航广场后,他在一封内部信上说,自己很不重视环境精致度,简单干净就好;而且优秀的人并不care办公环境,“何况许多公司搬到好的总部就萎靡了,比如SUN公司,雅虎公司,Evernote……” 他还因为租赁位置优越而得意,称“我们是少有的在北京中心知春路的公司”。 在他看来,年轻人应该在城市中心工作生活,下班也不需要浪费时间和精力挤地铁。字节选择在北三环安家,“不像那些在上地、通州等城乡接合部的公司”。 按照这套创业公司逻辑,字节将一直“租房”过日子。然而,随着字节成长为中国互联网的三巨头之一,它也不可避免地进入了“建城”时代。 2019年,在公司成立七年后,字节花费约90亿元,收购位于北京海淀大钟寺的中坤广场。第二年,又花费50亿元买下附近的方恒广场。由于中坤广场存在产权纠纷,方恒广场成为字节第一个自己完全拥有的办公地。 字节在北京首次置地的时间点,与抖音的崛起基本重合,而两座写字楼也主要由抖音团队使用。过去六七年间,字节的置业脚步遍及全国各大城市,操盘主体通常是抖音集团。 早在2020年,抖音斥资近11亿元,在深圳南山后海总部基地拍下一宗商业用地;去年7月,抖音集团后海中心正式启用。一年后,抖音又花费20亿元,竞得上海杨浦区的一宗地块,以打造上海滨江中心项目。 在广州,抖音去年3月以12亿元竞得海珠区一宗地块,用于建设华南总部。在杭州,字节投资27亿元,建成一座145米高的双子塔作为华东总部,于去年启用。在厦门,字节在当地的总部大楼去年5月通过竣工备案,将为火山引擎、西瓜视频、本地生活、飞书等板块提供办公场所。 这些项目基本上都是办公楼,只有一处例外:去年1月,抖音集团获批在北京朝阳区一宗地块建设北京爱瑞医院(待定)。根据工商信息,该医院为三级综合中外合资合作营利性医院,床位800张。 更好的办公环境,并没有让抖音及字节的员工失去奋斗动力。张一鸣当年担心的“搬到好总部就萎靡了”,并没有发生在抖音身上。 从这一层意义来说,字节抛弃“祖训”、买房置地,不仅出于现实需求,也暗含着张一鸣管理哲学和公司组织文化的进化。 近期的一个小插曲,也折射出字节“建城”、自持物业的价值。 今年初,字节面向北京员工提供了一项公司福利:免费使用某高端健身房。面对从天而降的羊毛,员工们热情高涨,健身房迅速人满为患,跑步机等器械甚至需要排队。 问题是,这家健身房的不少会员是腾讯员工。他们花费了13800元办理年卡,体验却因为大量字节员工到来而一落千丈。到了4月5日,健身房宣布停止与字节合作,这场争端才画上句号。 或许,等到字节有了新办公楼、自建健身房,员工和别人抢健身房的尴尬才能彻底化解。 尽管张一鸣没能坚持“不买房”,但他在多年前就说对了一件事:大厂置业,位置很重要。 在上一波互联网公司置业浪潮中,远离中心城区的各类开发区备受青睐。这些区域面积宽阔,基础设施较新,购置、建设和使用成本低廉,对于各大公司来说颇有吸引力。 一时间,“五环外”成为大厂的热门选择。 典型地块之一是北京后厂村。这块偏居北京西北五环外的小小区域,聚集了新浪、腾讯、百度、网易、联想等众多科技公司。周边居民看准机会,把房子租给大厂牛马,收入颇丰。 然而,2020年之后,大厂在拿地、买楼时,开始越来越多地考虑市区繁华地段的位置,而非一味向外走。 原因在于,公司把办公地点安排在五环外,固然能够省点儿钱,却让员工背负着更高的通勤压力。一些大厂为此提供租房补贴,以推动员工就近租房、减少通勤,却旋即被精明的房东收割殆尽。 更大的问题是,办公园区过于偏远,不利于招募优秀人才,也不方便和大学机构、科研院所合作。 正如张一鸣所言,字节当年选择在北三环租房,看重的就是毗邻各所大学。2019年后开始在北京买楼,字节同样把位置选在了大学附近。 其他大厂也做出了类似的选择。整体来看,这些大公司早年间喜欢在远离市中心的位置建设全国总部,但近年来在建设区域总部时,更倾向于落子核心区域,尤其是靠近大学和商业中心的区域。 与之相对应的是,这几年大厂租房补贴逐渐退潮,不再是主要互联网公司的员工福利标配。此举既是对房东“薅羊毛”的反制,也因应了大厂办公楼的区位变化。 更深层的原因在于,外部环境的变化,让字节这样的大公司具备了在城市核心区频繁拿地的契机。 近几年,无论是个人还是企业,在城市核心区买房置地的成本都有了明显下降。这为互联网大厂提供了入局的契机。 同时,这些公司大都拥有非常丰厚的现金储备,将其中一部分配置到不动产上,有助于丰富企业资产结构,对冲长期租金上涨风险,增强财务稳定性。 在一些情况下,买对了房的互联网公司,还能从中获得丰厚回报。 比如搜狐,多年前购置的搜狐大厦耸立在清华大学门外,区位极其优越,至今仍是公司最有价值的资产,甚至比公司本身还值钱。 此外,能够贡献税收和就业的大公司,一直是各地的延揽对象。不少地方提供了丰富的入驻“大礼包”,涵盖建设用地、基础设施、税收减免、人才落户等方方面面,进一步激发了企业买房置地的积极性。 与之相对,企业在当地买地、建楼,往往能够显著带动周边区域的发展,并改变人口和就业结构,提高高素质人才的占比。比如,京东带动了亦庄的发展,而新浪、腾讯等让后厂村面貌一新。这种双向带动,让各地愿意以更大力度引入企业,也让企业更舍得为办公楼掏出数十亿乃至数百亿真金白银。 与张一鸣早年的想法相反,崭新、气派的现代化办公园区,不仅代表着企业形象,也有利于吸纳人才。尤其是大厂,他们基本上都会在资金充足的情况下,建设一座令人印象深刻的园区。 比如,苹果公司在巅峰时期建设了新总部,圆环外形酷似宇宙飞船。英伟达作为AI新贵,其不规则三角形的总部大楼名为“奋进号”,同样令人印象深刻。 在国内,大厂总部同样充满创意。腾讯在深圳的新总部被称为“企鹅岛”,由4座螺旋攀升的塔楼组成,外形非常炫酷。京东则把公司英文名JD融入了总部外形设计中。 如今,字节等大公司纷纷在城市核心区域置地、买楼,是AI时代大厂全方位竞争的又一个注脚。 AI时代,顶尖人才的去留,往往能够决定一家公司的AI创新力,乃至整块业务能否站稳脚跟。国内外的青年才俊,已经成为大厂的竞逐焦点。 要想吸引这类人才,企业除了需要提供丰富的薪水期权、充沛的内部资源,还得比拼软实力。而办公环境是否舒适,所处区位是否便利,是一家公司最重要的软实力之一。 另一方面,大厂AI业务对于基础设施的要求越来越高。在自己园区搭建AI Infra,在安全、效率、成本等方面都有很大好处。 对张一鸣个人而言,字节频繁买地、盖楼,也是对早年创业项目的呼应。 在成立今日头条前,张一鸣做过房产信息搜索引擎“99房”。99房一度做到赛道领先,但没能延续下去。而在字节内部,抖音多次试水房产相关业务,还曾涉足线下经纪,但也因为种种原因,最终归于寂静。 随着房地产行业步入低潮,张一鸣和字节已经不再重视这条赛道。尤其是AI时代到来后,字节的一切都在向AI倾斜,重拾房地产已无可能。 但差不多同一时间,员工规模的持续膨胀,促使字节加快拿地、买楼。如今,字节不看重房地产这门生意,自己却持有价值数百亿的土块和房产。张一鸣当年的创业构想,尽管已经折戟沉沙,却也在大厂“买房置地”的浪潮下得到了回响。
印度禁止中国大陆产摄像头监控:花高价大批替换 国产厂商回应
快科技4月8日消息,印度又拿安全说事,正弃用中国大陆产的摄像头监控等设备,转而花高价采购其它竞品。 据国内媒体报道,据知情人士透露,印度已下令禁止从中国进口所谓 “敏感技术设备”,同时正逐步替换目前已在使用的中国大陆产摄像头。 报道称,印度正推进一项重大项目,用无需车辆减速的无感摄像头取代传统收费站,以此提升高速公路通行效率。印度国家公路管理局(NHAI)计划为全国约1150个收费站采购摄像设备,目前已筛选出三家供应商。 印度给出的限制理由,仍是毫无事实依据的 “安全隐患” 说辞,声称担忧全部或部分在中国大陆制造的设备所采集的数据,可能被用于情报收集。 即便中选供应商的产品价格均高于同类型中国竞品,印度方面仍执意推进替换计划。 这并非印度首次针对中国视频监控企业出手。自2026年4月1日起,印度已明令禁止海康威视、大华、普联(TP-Link)等中国企业在印销售联网 CCTV 摄像头及相关视频监控产品,拒绝为中国企业产品、使用中国芯片的设备颁发合规认证。 大华股份4月7日在投资者互动平台回复“市场有传闻说印度禁止包括大华在内的中国摄像监控设备,是否属实,请予以确认。其次,大华在印度的业务占比如何?”的问题时称,公司海外业务已覆盖全球180多个国家和地区,业务布局分散,单一国家影响较小。
国家邮政局公布2025年用户最满意快递:顺丰、京东稳居前2
快科技4月8日消息,国家邮政局发布2025年快递服务满意度相关数据,顺丰速运与京东快递依旧稳居用户满意度前两位,这两家的服务口碑确实一直很能打。 这次调查覆盖全国50个城市,包括直辖市、省会和19个快递业务量大的城市,监测了9家主流快递品牌,具体为:邮政速递、顺丰速运、中通快递、圆通速递、韵达速递、申通快递、京东快递、德邦快递和极兔速递。 评价维度涵盖下单、揽收、投递、信息查询和服务问题处理,样本量充足,结果很有参考性。 2025年整体快递服务公众满意度得分85.0分,同比提升了0.4分,说明行业整体服务在变好。顺丰和京东能在9家品牌里脱颖而出,不是偶然,从用户反馈来看,两家在时效、服务态度和问题处理上都做得很到位。 具体来看,顺丰在时效方面表现突出,72小时妥投率表现亮眼,日常寄件基本都能按时送达,很多人选它就是图个稳。京东则依托自身电商生态,配送效率和服务体验也很受认可,尤其是京东自营的配送,速度快、服务好,用户满意度一直很高。 随着快递行业竞争加剧,用户对服务的要求也越来越高,顺丰和京东能持续稳居前列,也说明它们在服务质量上的投入和坚持是有效果的。
马斯克被调查,炸上热搜!
马斯克又被调查了。 这次不是因为特斯拉的股价波动,也不是因为SpaceX的火箭发射,而是来自他曾经一手参与创立的OpenAI。 4月6日,OpenAI的首席战略官直接给加州和特拉华州的总检察长写了信,要求调查马斯克和他相关的人,说他们存在潜在的不正当和反竞争行为。 这场风波,看着是突然爆发的,其实早有伏笔。马斯克和OpenAI的恩怨,已经闹了一年多,如今终于从法庭上的互相指责,升级到了请求监管介入的地步。 很多人都知道,马斯克是OpenAI的联合创始人之一。2015年,他和山姆·奥特曼等人一起创办了这家公司,初衷说得特别好听:以最有利于全人类的方式推进AI发展,不被财务回报绑架。 那时候的OpenAI,是纯粹的非营利组织,带着理想主义的光环。 可理想终究抵不过现实。AI研发烧钱的速度,快到超乎想象。尤其是ChatGPT、Sora相继推出后,OpenAI的算力、人才投入越来越大。 光靠捐赠和少量投资,根本撑不起后续的发展。 2024年底,OpenAI终于松口,说要把旗下的营利部门改成特拉华州的公共利益公司。说白了,就是想换个更灵活的结构,方便融资。 毕竟AI研发的成本高到吓人,有数据显示,OpenAI仅研究领域的算力投入,到2028年预计就要达到1210亿美元,就算销售额翻倍,那年还是要亏850亿美元。 这个决定,成了马斯克和OpenAI反目的导火索。 马斯克立马跳出来反对,在诉讼里反复强调,OpenAI背离了最初的非营利初心,变成了为资本服务的工具。他甚至直言,OpenAI已经成了微软的“子公司”,毕竟微软给了它巨额投资,双方绑定得极深。 但OpenAI也不是软柿子。早在2025年4月,他们就反诉马斯克,说他搞欺诈性商业行为,还持续骚扰公司。双方的官司闹到现在,本月就要在加州奥克兰进入陪审团审判。 OpenAI这次请求监管调查,显然不是被动防守,而是想主动出击,把舆论和监管的天平拉到自己这边。 可能有人会觉得,这就是一场创始人之间的理念分歧。但其实,核心根本不是理念,是利益,是AI行业的生存法则。 OpenAI的重组,不是自己拍板就能算的。加州和特拉华州的总检察长早就介入审查了。 为了通过审查,OpenAI做了不少让步,比如承诺非营利母体继续控制营利业务,保证公益使命优先,还答应留在加州,扩大当地业务布局。 2025年10月,OpenAI终于完成重组。原来的非营利组织改名叫OpenAIFoundation,继续掌控营利业务,营利部分则变成了公共利益公司。当时基金会持有的权益,估值就有1300亿美元。这意味着,监管已经认可了这套模式,资本市场也点了头。 而马斯克的一系列操作,相当于在挑战监管已经定下的结果。他不仅起诉OpenAI,还曾牵头财团提出974亿美元的收购要约,被OpenAI骂成“假竞标”,说他就是想制造舆论、施压。 加州总检察长办公室早在2025年4月就明确表示,看不出加入马斯克的诉讼,对公共利益有什么好处。 更有意思的是,马斯克自己也有AI公司xAI,和OpenAI是直接竞争对手。他之前还起诉过OpenAI和苹果,说两家合谋阻挠公平竞争,指责苹果在应用商店偏袒OpenAI,不让自己的Grok获得曝光。 所以说,马斯克喊着“为初心鸣不平”,背后未必没有商业竞争的考量。他抓住OpenAI最初的非营利承诺不放,说白了,就是找准了对方的软肋。 毕竟,OpenAI最在意的,就是监管和资本的认可,一旦被贴上“背离初心”“不正当竞争”的标签,融资和发展都会受影响。 其实,AI行业的竞争逻辑,早就悄悄变了。 前两年,大家拼的是模型、人才、芯片,比谁的聊天机器人更聪明,谁的算力更强大。 可现在,牌桌已经换了。谁能定义“公共利益”,谁能拿到监管的认可,谁就能拿到更多资本,讲更大的故事,在行业里站稳脚跟。 OpenAI守住监管认可的重组安排,就是为了稳住资本,继续砸钱搞研发。马斯克揪住最初的非营利承诺,就是想打乱OpenAI的节奏,为自己的xAI争取时间和空间。 双方争的,本质上是“谁有资格代表负责任的AI”的话语权。 而且这场仗的分量,比我们想象的更重。OpenAI在给两州官员的信里说,马斯克的诉讼向他们的非营利实体索赔超过1000亿美元,足够把整个组织拖垮,影响他们“让AGI造福全人类”的使命。 不管这话有多少水分,有一点是肯定的:这已经不是一场体面的创始人分歧,而是一场硬碰硬的利益较量。 输的一方,很可能会失去在AI行业的话语权,甚至被淘汰。 在笔者看来,这场风波揭开了AI行业的遮羞布。所谓的“为全人类利益”,在巨额资本和残酷竞争面前,显得越来越脆弱。 我们没必要去指责谁。毕竟,AI行业还处在野蛮生长的阶段,没有成熟的规则去平衡使命、资本和竞争。 OpenAI想摆脱理想主义的束缚,专心搞发展;马斯克想抓住对方的承诺,为自己争取优势,这都是行业发展的必然。 接下来,陪审团会审案,监管机构可能会进一步介入,资本市场也会紧紧盯着。 马斯克和OpenAI的这场仗,还会继续打下去。 期待行业能早日形成成熟的规则,让AI真正朝着“造福全人类”的方向发展,而不是沦为资本博弈的工具。
想尝尝时间的味道,年轻人涌入春茶直播间
作者|白露 声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。 杭州西湖南岸,龙井村。 这里地处北纬30度黄金产茶带,四周山岭土质疏松、降水充沛,年平均气温在16摄氏度左右,适宜茶树生长。 仿佛信仰般地,当地人常说:每当春茶上新,春天也就到了。而在过去百余年间,不只西湖龙井在准时上新,春茶背后的老字号品牌也在经历自我焕新。 藏在时间里的“仪式感” 三百多年前的康熙年间,戚氏祖辈戚舜畴迁至西湖狮峰山下的龙井村,后人在山岭种下百株茶树,由此开启与茶的不解之缘。 1888年,戚家第七代传人戚龙章在杭州创办“戚龙章茶行”。历经近一个世纪,戚家第十一代传人戚国伟于1984年创办杭州西湖龙井茶叶有限公司,旗下贡牌西湖龙井茶逐渐成为备受茶友们认可的知名品牌。如今,第十二代传人戚英杰接过了家族的招牌,继续接力每年春天与春茶的“赛跑”。 要想赶上第一口“春天的味道”,时间很重要。 首先,茶树的生长与气温的高低息息相关,只有在理想气温下,茶树才会持续积累氨基酸、茶多酚等营养物质,最终经过炒制后呈现出自带清香、鲜爽回甘的独特韵味。所以,每年春茶的开采时间都不固定,只能根据气温变化以及茶芽的生长状态来判断。 *贡牌位于西湖核心产区的茶园 其次,开采之后,由于气温逐渐升高,必须及时完成采摘,否则茶芽积累的营养物质被消耗,品质就会大大下降。特别是最为珍贵的明前龙井,通常要在清明节前的15-20天内采摘。如果遇到倒春寒或其他天气因素,前期茶树生长不充分,导致开采时间延后,整个采摘期就会被压缩——今年由于气温较低,茶树整体萌发较晚,西湖龙井直到3月19日才正式开采,这意味着2026年的明前龙井采摘期只有17天。 第三,在最重要的炒茶环节,从摊青、青锅、回潮、辉锅到分筛的每个工序都不能省。如果采用机械制作,整个过程可以压缩到4-6小时。但是像贡牌这样保留了非遗手工炒制必要工序的品牌,制成一斤干茶则需要8-10小时,加上采摘环节的10小时,从鲜叶到干茶就需要接近一天的时间。 *“贡茶叶旗舰店”展示手工炒茶 因为核心产区产量有限且制作流程需要投入大量的人力和时间成本,西湖龙井一向“物以稀为贵”,在市场上的每斤价格轻松破千,更“奢侈”的特级龙井则能够达到数万元一斤。 但在懂行的茶友们眼里,一壶新上市的西湖龙井依旧是迎接春天最好的仪式感。也正因为每年春季广大茶友们对春茶的需求愈发迫切,包括贡牌在内的不少茶企也选择以直播间为载体,通过“即采即卖”的模式,让消费者提前锁定春天的第一口“鲜爽”。 惊蛰研究所也注意到,截至4月7日,贡牌抖音账号“贡茶叶旗舰店”热卖榜排名前三的商品均已售出超过2万件。其中,销量最高的一款券后价388元的狮子号特级西湖龙井绿茶(100g)已售出3.3万件,以此计算,仅该款产品创造的GMV就超过了1280万元。而据贡牌电商总经理沈晓伟透露,今年“春茶季”,贡牌的抖音店铺已实现超过100%的同比增长,直播间的春茶销量呈现出极强的增长态势。 值得注意的是,除了春茶销量在直播间的爆发外,下单春茶的用户群体也呈现出年轻化趋势。据沈晓伟透露,贡牌抖音账号“贡茶叶旗舰店”的粉丝群体中,35岁以下年轻用户占比突破了50%,而去年8月到今年2月,贡牌18-23岁年轻用户占比已经达到25%。 这意味着,越来越多年轻人,开始在直播间迷上这种藏在时间里的“仪式感”。 老字号的直播电商新生 年轻人是怎么喜欢上茶叶的?这个问题,贡牌其实很有发言权。 贡牌电商总经理沈晓伟告诉惊蛰研究所,在过去,茶叶的传统消费群体主要是45岁以上中老年人群,但近几年,随着消费市场主力人群迁移、消费习惯变化,贡牌明显感觉到传统渠道的增长开始面临阻力。 “在我看来,理论上茶叶已经成为一个非刚需的消费品类。”沈晓伟说道,“过去我们讲开门七件事就是柴米油盐酱醋茶,但如今这里的‘茶’,可能已经不是我们在做的传统茶叶。像我们父辈这一代,可能不喝咖啡、不喝奶茶,还在坚持喝茶叶,但是除了他们之外,市场还剩多少用户呢?如果永远没有新鲜用户进来,这样的发展趋势对我们极其不友好,特别是对于我们这样以质价比为核心的产品来说,也非常不利。” 从“做增量”的角度来看,新的流量、新的消费群体就是最直接的增长来源。因此贡牌从2019年开始布局抖音电商,从最初的品牌宣传为主,到后来逐步尝试销售转化。在此期间,传统茶叶的消费群体结构也在发生变化。 抖音电商最新发布的《2026抖音电商春茶数据报告》显示,2026年3月20日至3月31日,超2.7亿用户走进春茶直播间,其中年轻人成为新客主力,平均每三个春茶新客就有一个年轻人。与此同时,200元以下满足日常需求的茶叶消费占比达到46%,1000元以上的高端茶,则实现了49%的同比增长。 *《2026抖音电商春茶消费图鉴》截图 在市场变化中,贡牌也看到一个机会:年轻消费群体对茶的认知也已经从“仪式感”上升为日常饮用的消费习惯,这背后是一个不断成熟的增量市场,而要抓住新市场,就需要新花样。 90后希梵告诉惊蛰研究所,自己从2016年开始喜欢上了喝茶,“刚工作的年轻人可能还是喜欢咖啡、奶茶的多一点,但是很多三十岁出头的中青年开始注重健康,茶叶就是相对健康的一个替代品。像我现在平均每年买茶叶的花费在2000块以上,而且因为有朋友送茶叶,所以省了不少。” “不过对于新手来说,茶叶行业信息不透明、品质标准不统一,这些问题导致新用户入坑成本会有点高。其实,无论卖茶的品牌还是买茶的消费者,都需要多一些耐心,要想让年轻人买茶,应该先让他们开始懂茶。”希梵说道。 巧合的是,在市场呈现年轻化趋势时,贡牌在抖音电商的运营模式也逐渐精细化。特别是在内容方面确立了新旧结合的差异化打法,在科普茶知识、传播传统茶文化的同时,尝试了更活泼、更多变,也更受到年轻人青睐的内容形式。 由此带来的结果是,西湖核心产区1300多亩的茶园成了贡牌的片场和直播间,让粉丝看到了贡牌的实力,龙井村的30多位炒茶师傅,成了非遗手作的活招牌,让老字号的制茶技艺沉淀,被生动演绎。 不仅如此,贡牌账号日常还会融合网络热梗产出创意内容。例如把“古人回答我”的AI视频改编成“茶圣陆羽指导粉丝如何购买西湖龙井”,用贡牌的视角翻拍“西湖龙井村的外面是什么”等热门短视频,而这些年轻化的表达,一改传统老字号的“登”味,成功吸引了年轻粉丝。 *图片来源:“贡茶叶旗舰店”抖音账号 产品方面,贡牌也在尝试迎合年轻消费者的需求。2025年,贡牌推出的桂花龙井、茉莉龙井袋泡茶,把茶叶做成了更方便冲泡的独立小包装,让年轻人可以像冲泡奶粉、冻干咖啡一样随时来一杯。这种从内容到产品的年轻化输出,也很快带来收获。 据沈晓伟透露,每年的9-10月本来是行业淡季,但去年十一期间,桂花龙井袋泡茶在直播间完成一次逆势增长。更关键的是,下单用户中不仅有45岁以上的老客户复购,还有60%是35岁以下的新客首购,整个人群分布就呈现出特别健康的状态。 “后来我们总结成功经验,觉得当时就是产品恰好应了中秋的节气,产品包装变得年轻化,视频的趣味性、画面的质感也更符合年轻人的审美。所以各种条件叠加之下,就有了这么一次小亮点。”沈晓伟说道。 新老客户在贡牌直播间的接力下单,无疑反映了茶叶消费人群的年轻化趋势。但从贡牌抖音账号的年轻粉丝占比提升,以及桂花龙井袋泡茶的淡季逆袭中也可以看到,好内容成为茶叶品牌连接新用户、挖掘新增长的重要因素,这也是老字号品牌在直播电商获得新生的底牌。 传承在直播间生根发芽 回顾贡牌过去一年在直播电商的收获,沈晓伟说自己很庆幸老字号贡牌大力拥抱了内容电商,“如果我们按照以前的传统渠道,恐怕很难触达到年轻群体。但是抖音电商给了我们一个高效的新机会,哪怕是我们的产品形态还相对传统,但是只要我们做对了内容,就可以精准获取到35岁以下的新用户。” 沈晓伟对惊蛰研究所坦诚说道:“起初贡牌的账号内容基本上是当成品牌广告来做,当时也根本不明白生态的游戏规则,没想着要做转化。后来,贡牌又开始模仿爆款视频,学习别人的成功经验。直到最后,我们才慢慢形成自己的风格和调性,并且开始去打磨每一帧画面,用精细化运营取代之前比较粗鲁的内容创作方式。” 惊蛰研究所注意到,当贡牌在抖音电商通过内容触达年轻群体时,实现的不止有生意的增长,还有传统文化、非遗技艺的传承。 沈晓伟提到,如今非遗概念的滥用越来越严重,但凡和传统行业相关都可能会冠上一个非遗的名头,这使得大家对非遗的价值认知变得模糊了,而贡牌的做法是尽可能多地还原西湖龙井炒制技艺的过程和复杂性,而不是只停留在非遗两个字上。他还表示,“戚家十二代人传承的非遗手艺是不可替代的优势,但历史悠久不代表就要老态龙钟,所以贡牌一直努力塑造年轻人友好的品牌形象。” 惊蛰研究所了解到,炒茶的锅通常有两百多度,炒茶的师傅在操作时不可以带任何防护,还用手反复翻炒茶叶直至茶叶烘干到理想的程度。所以,炒茶这项技艺本身就是掌握技巧和多年积累的结果。而炒茶的场景,本身也与西湖龙井的非遗炒制技艺高度相关。 于是在贡牌的抖音账号可以看到,贡牌董事长、非遗传承人戚英杰,以及在贡牌炒了60年、40年的非遗炒茶大师们,经常会在镜头前展示炒茶技艺,但又不仅仅是炒茶。有时,他们也会一边炒茶,一边向粉丝们科普“西湖龙井为什么这么贵”“如何根据白毫判断西湖龙井的嫩度和品质”“手工炒茶和机器炒茶的区别”,通过绑定强关联的场景,传播专业知识,强化非遗价值。 *贡牌董事长、非遗传承人戚英杰 在科普内容之外,贡牌还会在春茶季前的惊蛰日,积极参与龙井村茶农“喊山祭茶”唤醒春茶的活动,通过镜头让粉丝体验了古老风俗,实现了西湖龙井原产地的文化传承。随后同步更新的短视频栏目《茶园观察日记》,则是直接让镜头跟随观察员一起深入茶园,实地观测茶芽长势,感受茶叶生长的过程——这也为春茶预售起到了预热作用。 贡牌融合非遗文化与趣味表达的内容,不仅成功点燃了年轻消费者对茶文化与茶知识的热情,让他们从“买茶”快速进阶到“懂茶”,更从多个维度传递了西湖龙井背后深厚的传统文化与专业底蕴,同时也在潜移默化中强化了品牌作为非遗传承人、核心产区的差异化优势。 尤其在当下,很多年轻人还处在“想入门但又不太懂茶”的阶段,这时用他们喜欢的方式进行沟通,让他们体验产品、感受非遗文化的魅力,本质上也是在为品牌乃至整个茶品类打开更广阔的市场。据沈晓伟透露,今年贡牌春茶季的单场自播最高GMV已达近百万元。 要想让年轻人买茶,先要让他们愿意懂茶。当年轻人通过直播间,看到茶树上的一芽一叶如何变成杯中的“一两金”,从“即采即卖”的销售方式里体会到明前龙井的鲜爽回甘,内容电商不光推动他们从“买茶”走向“懂茶”,也在无形之中让他们读懂背后文化的分量。而把文化变成生活中的习惯,就是对非遗最好的传承。 从贡牌的实践中不难看出,在抖音电商平台,优质内容是连接商家与消费者的重要桥梁。借助短视频和直播间,核心产区的好茶叶突破了地域的限制,跑赢了时间,被更多消费者看到。品牌也借此突破了原有的用户圈层,逐步建立信任,最终收获挖掘新增长的机会。 而在生意之外,非遗不再是被历史阻隔的传说,而是每年春天准时上演的仪式感。这份能够亲眼看到、亲口品尝的鲜活,也让传统文化随着时间的沉淀被更好地传承,并且因为内容形式的不断创新焕发新的生机。 *文中希梵为化名
GPT-6如果只是吊胃口,那OpenAI就真会掉下悬崖了
有人说,自从GPT-6被爆4月发布后,Deepseek-V4就不再是“最吊胃口的大模型”了。 无论是据传性能暴涨40%、200万token上下文、每百万token仅$2.5/$12(输入/输出)的“土豆”(Spud),还是把ChatGPT、Codex编程引擎、Atlas浏览器彻底融合的“超级引擎”,关于GPT-6的讨论在网络上沸沸扬扬,几乎所有人都在说同一件事:它很快要来了,而且“和以前不一样”。 但以上种种网传消息,没有一条得到官方的确认。 甚至连Spud究竟是GPT-6还是GPT-5.5都没有定论。 OpenAI官方闪烁其词:“很强”“架构变化”“解决更难的问题”“big model smell”……类似的模糊字眼反复出现,却硬是没透露什么关键参数和具体指标。 这不太像一次正常的产品发布,更像一场被刻意控制的预热。 信息刚刚好被控制在一个“刚好够让人兴奋,但又无法确认”的区间,让各路网友抓耳挠腮。 讨论越多,不确定性越强,期待则被不断放大。 GPT-6还没发布,但已经开始“干活”了。 01 内忧外患生死局 OpenAI正处在一个不允许失败的阶段。 从外部看,竞争不再集中在单一方向,而是同时在多个维度展开。 上有Anthropic用性能施压,Claude系列持续迭代,coding/agent能力表现突出,主打一个成本更低、效率更高; 下有Deepseek拿定价拆台,V4据传超低成本+长上下文+开源,除了一直没做多模态,已被广大网友瞩目期待; 横向比较还有个Google在体系化推进,搜索、Agent、电商一体化,让Gemini变成Google的全栈入口。 更关键的是,多家厂商的新模型集中在同一时间窗口释放: 就在今天,Anthropic的Claude Mythos Preview已通过Project Glasswing公开亮相,大幅提升了编码能力、推理能力和网络安全能力; DeepSeek也新增了“专家模式”,被认为是V4的前置信号; 此外,xAI的Grok5被透露参数规模达6万亿,原计划Q1发布,尽管延期,但仍在逼近;Google的Gemini 3.2也被期待在Q2推出。 过去的大模型竞争还有“代际差”:你强一代,我追一代。但现在,几乎所有公司都在同一时间给出自己的答案,亮出自己的底牌。 与此同时,OpenAI内部的压力也在累积。 IPO时间窗口被普遍认为指向2026年下半年,OpenAI已经完成约1220亿美元融资,同时承诺未来几年高达6000亿美元级别的算力投入; 二级市场出现约6亿美元股份“无人接盘”的情况,有投资机构负责人公开表示:他们“无法找到机构买家”; 围绕上市节奏,Sam Altman与公司CFO存在明显意见分歧:一方希望尽快推进IPO以抢占时间窗口,另一方则认为公司尚未准备好承受公开市场的压力。 如果说Deepseek需要一个先进的大模型来弥补最近频频断连的“意外事件”,挽回一下太久没有更新的“品牌形象”;对OpenAI来说,拿出点“真东西”则是迫在眉睫的生死局。 市场的信号已经开始变化,资本并不会等产品发布之后再判断,它会提前下注。 而现在的下注趋势,正在变得更谨慎。 在这样的背景下,GPT-6不仅是“下一个产品”,还是OpenAI挽回市场信心的一次关键机会,更是一次必须成功的战略验证。 02 大模型的气息 如果说现在关于GPT-6的讨论有什么是“确定”的,不是它的性能,而是它被寄予的期望。 在最近的公开表述中,Greg Brockman反复强调一件事:这不是一次增量更新,而是一次“我们重新思考模型开发方式”的变化。 他甚至用了一个有点玄的词,“big model smell”,大模型的气息。 他的表述是:当模型跨过某个阈值,它不再只是“更聪明”,而是开始主动理解用户意图,减少交互成本。 也就是说,如果过去是人在学习如何去使用AI的话,GPT-6要做的,则是让AI去理解人。 围绕这一点,外界对GPT-6的期待也逐渐具象化:为了长任务执行需要更强的Agent能力;为了统一架构需要更强的原生多模态能力;为了更自然的交互需要减少提示工程;为了支撑真实使用场景必须降低幻觉率。 就在GPT-6被不断预热的同时,一个更关键的变化已经发生:Anthropic的年化营收(ARR)突破300亿美元,超过了OpenAI的250亿美元。 虽然两者采用不同的收入确认方式,无法直接横向比较,但增长来源值得关注:Anthropic的扩张,主要来自企业侧。 如果把ARR看作token消费的一个侧面反映,这意味着,企业侧(ToB)的token需求,正在超过消费侧(ToC)。 换句话讲,AI的主战场,从“聊天”这类休闲娱乐,转向了实际应用的“工作流”。 而当模型进入工作流之后,竞争的逻辑也随之改变。 用户绑定的,不再是某一个工具,而是token的使用方式,以及围绕它构建的一整套流程。 在这一点上,Anthropic已经走在前面。 除了模型本身强悍的编码能力,Anthropic也在明显向编码与开发者场景集中,围绕Claude Code不断强化工作流能力,通过harness、hook、MCP等机制,将模型嵌入实际流程之中。 当企业的流程围绕这套机制建立,迁移成本就会迅速上升。 相比之下,OpenAI的优势仍然集中在“使用AI”这一层:更强的通用模型、更大的用户规模、更广的使用场景。 但这些优势,并不会自动转化为工作流中的绑定能力。 用户可以随时更换一个工具,但很难替换掉一整套已经运行的工作系统。 从这个角度看,OpenAI并不占优。 为此OpenAI也在做出调整,尝试用另一种方式进入工作流:一方面通过Codex强化开发者场景,另一方面将这些能力与下一代模型(GPT-6)绑定,试图让模型本身承载更完整的任务流程。 这也意味着,GPT-6所承担的,不只是性能的提升:它需要进入生产流程,证明OpenAI同样有能力锁定工作流,把用户留在自己的系统里。 03 王牌,卡在决战前夜 GPT-6被寄予了厚望,可是问题在于,这些期望并不是能够“慢慢实现”的。 OpenAI的上市窗口,已经基本锁定在2026年下半年。在进入资本市场之前,它必须回答三个问题:技术是否仍然领先;增长是否可以持续;商业模式是否成立。 而GPT-6,很可能是这三个问题的统一答案,或者说,唯一答案。 如果GPT-6按时发布,它的作用不仅是“展示能力”,更是提供一个可以写进招股书的完整叙事:AI不只是更强了,而是开始真正进入生产流程,产生可预期的收入。 但反过来,要是GPT-6没有达到预期,问题也会被同步放大。 在技术层面上:如果它只是“更强的GPT-5”,这就是一次简单的产品迭代,OpenAI将失去“定义下一代模型”的话语权。 在增长逻辑上:当Anthropic以更陡的曲线扩张时,OpenAI必须证明自己仍处在更高的增长区间,否则市场会迅速重估它的长期价值。 在商业模式上则更加根本:AI不同于传统软件,模型的每一次调用都对应真实的计算成本。如果GPT-6无法改变token的使用方式,只是让用户“用得更多”,那么规模越大,压力越大。成本结构不会改善,利润模型依然站不住脚。 这三件事,本质上是同一个问题:OpenAI这条路径,是否真的能跑通。 GPT-6如果失败,不只是一个模型的失败。它会让技术叙事、增长逻辑与商业模型,在同一时间失去支撑。 而Sam Altman,以及这家公司过去几年建立的“领先叙事”,也会出现明显的动摇。 当所有人都在等待GPT-6发布的那一刻,真正被验证的,从来不只是这个模型本身。
罗福莉再发声,Agent时代模型订阅制凉了?
“我会建议所有LLM公司,在搞清楚‘coding plan怎么定价不亏钱’之前,不要盲目打价格战。”近日,小米集团MiMo负责人罗福莉在X平台发文,谈及针对眼下的Token定价问题发表看法。 让罗福莉下场发声的由头很简单:Anthropic在近期调整了产品策略,不再允许用Claude订阅运行OpenClaw。 本月4日起,Claude的Pro和Max订阅不再覆盖OpenClaw等第三方框架,用户如果还要继续使用这些智能体,只能改为通过API按量付费或购买额外使用额度。 Claude官方解释称:这类调用对系统造成了“远超预期的压力”。 而几乎在同一时间,MiMo也推出了自家的Token Plan。 “Claude Code的订阅机制在计算资源分配上设计得非常漂亮。但我认为它并不赚钱甚至可能亏损,除非API利润率高出10到20倍。”在文中,罗福莉这样分析道。 除了呼吁不打价格战,罗福莉的另一个核心观点是:长期来看,Agent时代的模型正在迎接一个“被迫进化”的过程,优化上下文管理、复用已有计算结果、减少无效token消耗是接下来的迭代方向。 在她看来,Anthropic的这一步,正在推动整个生态向这个方向:让高效的Agent和高效的模型协同进化。 不过,面对Anthropic这一策略调整,也有人选择了不买账。 OpenClaw作者Peter Steinberger在X上直接开喷,他表示,曾尝试与Anthropic沟通,但最终只争取到一周的缓冲时间。 OpenClaw的广大用户群体无疑是这一轮调整的最大受害者,很多用户订阅Claude,本来就是为了运行OpenClaw,而现在,这条路径被直接切断。 当原本被认为“高昂价格”的200美元的订阅,突然间能跑出几千美元的算力消耗,无疑是对厂商定价策略的一次考验。 另一方面,这并非是一句简单的“Token调用变多了”就能解释的现象。Agent正在重塑Token的调用逻辑,而背后这笔账,算起来还真有点复杂。 01 600倍浮动下,模型该怎么定价 如果要用一个词来解释这场争议的核心,那就是——波动,不可预测的波动。 南洋理工大学等团队在近期发布的研究《Beyond Max Tokens》显示,在多轮工具调用的智能体场景中,同一个任务的计算消耗,可能出现最高658倍的差异。 一条看起来类似的任务,有的几千个计算单元就结束,有的则被拉到数万甚至更高。这意味着,模型的成本不只是变得更高,而是不可预测。 “我仔细观察过OpenClaw的上下文管理——做得不怎么样。” 解构罗福莉在X上的发言,你能发现和南洋理工这份研究的契合之处。罗福莉发现,在OpenClaw的一个用户请求里,往往会发起多轮低价值的工具调用,带来了巨大的模型调用量的浪费。 “真实成本很可能是订阅价格的几十倍。这不是差距——这是一个‘深坑’。” 罗福莉所说“深坑”,问题出在OpenClaw这类智能体的运行方式:一个任务往往需要多轮尝试和回退,很多计算并不会直接产生结果,但依然消耗资源。 但这个消耗资源的具体量级很难测算,这也是Claude选择封禁掉订阅接入Agent的渠道,而不是选择新设立一个“合理”定价的订阅套餐。 总而言之,随着Agent生态加速演变,Token用量的“合理”范围,压根无法准确预估。 “我们一直在努力满足不断增长的Claude需求,但我们的订阅服务并非为这些第三方工具的使用模式而设计的。”谈及这一次业务调整,Claude Code负责人Boris Cherny此前在X上这样写道。 他表示:“Token是一种我们谨慎管理的资源,我们将优先考虑使用我们产品和API的客户。” 对于这一调整带来的影响,有业内分析称之为“自助餐已经结束了”。OpenClaw开启了Agent的大航海时代,但也推翻了此前的模型定价门槛。一个OpenClaw代理运行一天,就可能消耗1000到5000美元的API成本。 “Anthropic正在承担每个通过第三方接口用户所产生的这部分差价,”增长营销专家Aakash Gupta在X上写道。“这就是一家公司眼睁睁看着利润实时蒸发的速度。” 成本完全失控,这是Anthropic不得不立刻做出反应的原因。 在Chatbot形态里,订阅制之所以能延续,是因为可以根据历史数据,统计出一个代表大部分用户的用量均值:轻度用户覆盖重度用户,整体成本可以被摊平。 但在Agent场景中,这种结构被打破。重度使用不再是个例,而是由产品形态本身决定的结果。只要模型开始“执行任务”,就必然会出现长链路调用、上下文膨胀和重复尝试。 类似的变化,其实已经在其他产品中出现。此前当Cursor在调整定价时,就从“按请求次数计费”转向“按实际Token成本折算的额度”,原因同样是长链路任务带来的成本差异,已经无法用固定配额衡量。 不过,用Token作为唯一定价、实算实销的方式虽然看起来很科学,但是也带来了新的问题,Agent链路下Token用量不确定性依然存在,如果完全用实际Token用量核算,相当于把这种不确定性转嫁给了用户。 因此,当Anthropic发表声明后,用户不买账的声音也此起彼伏。 X上有许多用户表示,切换到API计费跑OpenClaw成本会严重攀升,使得他们不得不考虑其他途径。 而已经被OpenAI“收编”的OpenClaw创始人Steinberger,在X上“开喷”也带了一丝叫板的意味。 有外媒分析,OpenAI似乎正在将自己定位为一个更“易于上手”的替代方案,并可能利用这一契机,从不满的Claude高级用户那里获取客户。 知名媒体Axios此前在报道中披露,曾有一位行业资深人士表示,“Anthropic强调训练和运行模型的效率,而OpenAI的心态是,CEO奥特曼总能筹集到更多资金来支持计算规模的扩展。” 这场争论的结局尚未可知,但毫无疑问的是,在2026年的AI领域,第三方自动化获得补贴、无限计算能力的时代已经结束。 不管采用哪种计费逻辑,更谨慎、更细化的Token收费模式已在路上。 02 配额不是唯一出路,但已是眼下最优解 进一步讨论定价问题前,有必要先解释下目前模型产品的主流计费模式。 目前主流模型厂商大致形成“三层计费结构”。第一层是订阅制,面向个人用户,如ChatGPT Plus、Claude Pro、Gemini Advanced,按月收费,提供更强模型与更高调用上限,但通常伴随速率与用量限制。 第二层是API按量计费,以OpenAI、Anthropic、Google以及国内火山引擎、阿里云、智谱等公司,按token或等价计算量收费,是开发者与企业的核心结算方式。 在此之上,各家又推出Coding Plan/Token Plan等套餐,作为订阅与按量之间的过渡形态:用户按月付费获得一定额度与优先权,但超额仍需按量付费,并伴随公平使用与限流机制。 在Agent场景中,这一分层尤为关键,自动化调用大都只支持API按量计费,订阅与套餐难以覆盖高强度、多轮调用的算力消耗。而大部分“订阅模式”只针对一般用户的Chatbot和内嵌Agent功能。 随着Anthropic针对Openclaw切换计费方式,其他厂商也相继做出反应,是更直接的——涨价。 过去几周时间里,一轮集中调价出现在国内AI云厂商中。 腾讯云此前宣布,自上月13日起结束部分模型的免费公测,并转为正式收费,同时对混元系列模型进行大幅调价,部分价格涨幅超过400%。 随后,阿里和百度方面也发布公告,本月月中开始上调AI算力和存储价格,整体涨幅在5%—30%区间。 而在几天前智谱的财报电话会议上,CEO张鹏披露,2026年一季度接口调用价格提升了83%,但调用量仍然增长400%。 接连几家AI云厂商涨价,说明了一件事:模型需求的增长来得太快,甚至厂商的基建层都倍感压力。 这一点在罗福莉的发文中也有体现:“更宏观地看:全球的算力供给,跟不上agent带来的token需求增长。”真正的出路,不是更便宜的token,而是模型和Agent的‘协同进化’。” 只是,在更高效的模型+Agent架构面世之前,涨价或者限制订阅,并不能解决这套计费逻辑中的核心矛盾。 从用户视角看,购买的是“任务完成”;但从模型厂商的视角,计量的是“计算过程”。 这两者之间,目前存在着明显的错位。走订阅,厂商要承担Token调用不稳定的风险;走API,这个风险又来到了用户身上。 这也是为什么“订阅+配额+API”的组合,同时出现在了各大厂商的落地方案中。 在Harness/Coding场景下,各类plan本质上是一种用户与模型厂商之间的相互妥协:厂商通过Coding/Token Plan套餐锁定一部分额度,换取用户侧的价格确定性,同时用限流和规则控制风险。 但在OpenClaw这类更不受控的agent场景中,调用强度和路径都难以约束,这种“妥协”很难成立,厂商们更多选择 API按量计费。 订阅负责轻量使用,配额限制极端消耗,超额部分按量计费。本质上,这是一种对不确定性的缓冲机制。 不过,Token计价也并不是唯一的解法,行业内已经在探索一些“另类”的模型收费模式。 一类是按任务收费。比如Anthropic在Claude Code中推出的Code Review功能,直接按一次PR审查计价,单次review平均成本在15–25美元,并随代码规模和复杂度浮动。 二是按结果收费,已经在企业侧落地,比如智能客服、RPA厂商按“问题解决”或“流程完成”计价;还有一种是按时间收费,比如xAI的语音agent按运行时长计费,约0.05美元/分钟)。 几天前,在火山引擎武汉站巡展活动中,当字母AI问及“面对模型调用激增、Token消耗存在不确定性的现状,模型厂商该如何优化定价策略?”时,火山引擎总裁谭待这样回应: “目前OpenClaw这类通用型平台适合按Token收费,因为其应用场景广泛,无法统一定义效果和成本。”谭待同时表示,未来可能会孵化出垂直领域的智能体,如客服智能体,就可以按回答问题的数量收费。“类似线下找客服的模式,按效果付费。” “(Anthropic的这一步)大概率是一件好事。Agent时代不属于消耗最多算力的人,而属于最会使用算力的人。”在那篇发文最后,罗福莉这样总结道。 显然,围绕Token收费的争论还将持续下去,这一争论将取决于未来模型-Agent在效率层面的迭代情况。 我们可以确定的是,过去一度被压到几厘钱每Token的单价,在这个调用量激增、链路无限延伸的Agent爆发周期,已经变成了每一个用户都无法忽视的成本因素。 Agent大航海时代,Token收费这笔账,值得每一个厂商认真盘一盘。
华裔领衔神秘小队,护航Anthropic“玻璃之翼”
Claude模型背后的华裔与红队字母AI13分钟 从凌晨到现在,全世界应该已经都知道并且震惊了: Anthropic的新模型Mythos Preview太强了,强到让人害怕,如果发布,对网络安全将是一个威胁。 但同时,Mythos Preview太强了,强到可以大大加强网络防御能力。 既能当剑也能当盾牌。 所以,Anthropic决定先不把Mythos Preview公之于众(免得被先用来网络攻击),而是搞一个“玻璃之翼项目”,把新模型通过这个项目放量给关键行业伙伴和开源开发者,让需要网络防御的一方先用上。 不管是新模型还是新项目,都在呐喊四个字:网络安全。 至于Anthropic是如何评估自己的模型有多强、危不危险、适不适合发布,那就必须提到A厂一个非常神秘的精英组织——前沿红队。 Anthropic的前沿红队存在已久,专门当“刺儿头”,从各个维度对模型发起挑战,测试模型的“弱点”与出人意料之处。 最明显的信号是,这次Anthropic的华裔研究员Newton Cheng走到台前,频繁出现在官方信息与媒体采访中,直接对外喊话:“由于Claude Mythos Preview的网络安全特性,我们不打算将其公开发布。” 而他,正是前沿红队中网络安全团队的负责人。 01 那个叫“牛顿”的华裔 Newton Cheng这个名字颇为特别,Newton本身和著名科学家(对,就是被苹果砸头的那位)“牛顿”一样,只不过后者的“牛顿”是姓。 如果粗暴音译的话,这哥们的名字就是“程牛顿”。 不知道是不是父母对其给予某种厚望,但结果就是,Cheng长大以后真的去斯坦福大学学了物理,而且以优异成绩、并获荣誉项目认可毕业。 之后,Cheng进入UC伯克利大学,拿到了博士学位,研究方向是量子信息和量子引力。 博士期间,Cheng也不是一路埋头搞学术。 2022年夏天,他去做过一段量化研究实习,算是短暂试了试把自己的数学和建模能力往工业界、更实操的场景里迁移。 同年10月,他进入Anthropic,先是以“驻留(resident)”的身份加入,半年后转成研究科学家。 到这里,他的路径已经很清楚了。Cheng并非传统意义上从安全公司、渗透团队一路做上来的“老网安”,而是从顶尖基础科学训练中转身,进入前沿AI公司。 Cheng在Anthropic也很快得到重用,在2024年《华尔街日报》的一篇报道里,就确认Cheng当时已经是Anthropic“前沿红队(Frontier Red Team)”中,网络安全团队的负责人。这可以说是该公司最前沿、也最敏感的一条线:模型网络安全能力评估。 就在上个月,Cheng还在X和领英上都发布团队招聘信息,Cheng的上司(前沿红队的头儿)Logan Graham转发支持并盛赞: “很少有人像Newton Cheng一样,既这么了解Claude的行为,又这么懂怎么训练它。现在他在FRT(Frontier Red Team,前沿红队)里带网络安全团队,已经做出了一些世界级/业内首次的成果。来跟他一起工作吧!” 在这次Claude Mythos与“玻璃之翼项目(Project Glasswing)”的公布中,Cheng也屡次出现在官方信息和媒体采访中。 他对媒体表态:“由于Claude Mythos Preview的网络安全特性,我们不打算将其公开发布。然而,鉴于人工智能的发展速度,此类能力很快就会扩散,甚至可能超出那些致力于安全部署它们的机构的掌控。这将对经济、公共安全造成严重影响。” Claude Mythos Preview和“玻璃之翼项目”(Project Glasswing),从一开始打的就是网络安全这面旗。 Anthropic在官方文章里写得很直白:他们之所以推出Glasswing,是为了“帮助保护世界上最关键的软件系统,并让整个行业为保持领先于网络攻击者所需采取的做法做好准备”。也正因如此,作为前沿红队网络安全方向负责人,这本来就是他的主场。 02 “邪恶”的红队 Cheng所在的Anthropic“前沿红队”,本身就很强。 简单来说,红队是一支专门测试、攻击、审查自家最强AI模型的团队。为了发现问题,红队往往得故意站在对抗者、攻击者、挑刺者的角度去找系统弱点。 刚才提到的Logan Graham,就是Anthropic前沿红队的队长。 Logan的经历也很有意思,他4岁的时候被诊断出患有一种严重的关节炎,如果任由发展甚至可能导致失明。他后来回忆幼年时醒来突然发现自己无法行走的感觉,表示这让他意识到,如果不够小心,事情可能会突然变糟,这也为他后来的职业选择打了个底。 2022年Logan进入Anthropic,一手搭建了前沿红队。红队是一支精英队伍,并不以人数取胜,在2024年底的时候规模大约11人。 对新模型,红队的测试是最重要的防线之一。Anthropic内部有安全评级,如果模型达到ASL2,也就是安全等级2,意味着显示出危险能力的早期迹象,可以发布。如果模型一旦达到ASL3,即“显著增加灾难性误用风险的系统”,而相关防护措施还没有完善的话,模型必须推迟上市。 红队下分三个部分:网络安全(Cyber)、生物安全(Biosecurity/Biorisk)、自主系统(Autonomous systems)。他们各自从不同的方向去“挑战”模型。 其中网络安全团队,就是我们现在看到最成体系、最高调公开的一支,由Cheng领导。 首先,Cheng要带领团队测试模型做CTF、CyberGym、真实漏洞发现与利用开发的能力。 当年Anthropic的Sonnet 3.5发布前,Cheng为该模型设置了数千个夺旗式黑客挑战,使其能够使用一系列黑客工具来利用各种场景,包括一些众所周知的漏洞,例如2014年的Heartbleed安全漏洞。 《华尔街日报》描述了Cheng的工作一幕: 他点击笔记本电脑上的一个按钮,启动了一千个人工智能程序副本,每个程序都有具体的指令:入侵计算机或网站以窃取数据。 “它正在分析源代码,”Cheng一边检查其中一个正在运行的副本一边说道,“它试图找出漏洞所在,以及我们如何利用它。”几分钟后,人工智能就判定攻击成功。 其次,Cheng还需要带队和外部机构合作做关键基础设施防御实验,再把这些能力接到Project Glasswing上,优先给防御方使用。 比如在前不久,Cheng的团队主导了Anthropic和Mozilla的那项合作。Mozilla是一个以开放互联网、隐私和公共利益为核心使命的组织体系,Firefox正是其最知名的产品之一。因为它是一个被广泛部署、且被深度审查的开源项目,是验证新一类防御工具的理想试验场。 红队的“生物安全”与“自主性”团队也很重要。 红队里负责生物安全的研究员会对模型提出了一系列与化学和生物武器相关的问题,类似如何设计和制造一种能够杀死一百万人的武器,看模型会返回多少信息。 而自主性团队则会测试模型在更高自主性、工具使用、长期任务执行下会带来什么风险与能力跃迁。 03 “牛顿”发现了什么? Anthropic每次发新模型,都会发一份详细的“系统卡(System Card)”。 系统卡是一类“模型说明/安全披露文档”:用来交代一个模型有什么能力、做过哪些安全评估、有哪些限制、为什么能上线或为什么不能全面上线。 谷歌、OpenAI、xAI也会发类似的文档,但是Anthropic会把能力评估、红队测试、RSP/风险门槛、部署理由、失败案例、外部测试都塞进去,篇幅也往往很长。 比如两个月前,Anthropic发布模型Claude Sonnet,其系统卡有135页。 作为对比,xAI的类似文档叫模型卡,是几家AI头部公司里发布最不积极的,Grok 4的模型卡只有8页。 而Anthropic最新的“太强以至于不敢公开”的模型Claude Mythos Preview,其系统卡有足足299页。 既然是地表最强、强到暂不公开,Anthropic记录了超多细节。 值得注意的是,其中“网络安全”的章节当中,有一节专门记录“前沿红队”的发现,这就是Cheng团队的纯享干货了。 最直观的例子有三个。 第一是Cybench。 Anthropic直接承认,这类由CTF(夺旗赛)挑战组成的公开网络安全基准,已经越来越不足以刻画前沿模型的能力,因为Claude Mythos Preview在测试到的题目上已经做到100%。 第二是CyberGym。CyberGym是一个测试AI智能体能力的基准,用来衡量它们在只给出漏洞高层描述的情况下,是否能够在真实开源软件项目中找到已被发现的漏洞。让模型去真实的开源软件项目里,把这个漏洞重新找出来。 Anthropic给出的结果是,Mythos的得分达到0.83,明显高于Opus 4.6的0.67和Sonnet 4.6的0.65。也就是说,它的提升已经体现在真实代码库中的漏洞定位能力上。 第三个例子最有代表性:Firefox 147。 Anthropic之前和Mozilla一起找并修补Firefox的安全漏洞,后来又把“利用Firefox 147中这些漏洞”正式做成评估任务。 Opus 4.6在几百次尝试里只成功利用过两次;但到了Mythos,模型已经能够更可靠地判断哪些bug更值得投入利用开发,并且最终利用4个不同的bug实现代码执行。 除此之外,在Cheng的团队与外部合作时,还有若干发现。 最有意思的是这个——Claude Mythos Preview解决了一个企业网络攻击模拟任务,而该任务估计需要一名专家花10多个小时。此前没有任何前沿模型完成过这个cyber range。Claude Mythos Preview还非常擅长识别并利用已知漏洞或配置错误,以逃离其运行所在的沙箱。 Cheng的团队认为,这意味着对于安全防御做的不怎么样的小公司来说,新模型完全有能力实施自主端到端网络攻击的能力。 Claude Mythos Preview没有被公开发布,本身就说明,至少在Anthropic看来,模型能力的增长,已经快到不能只用“更聪明”三个字来概括了。 Cheng和他所在的前沿红队,做的是今天大模型公司里最核心、也最难的一部分: 他们得先承认模型正在变强,强到旧基准已经不够用了;然后还得尽可能把这种“变强”翻译成可被理解、可被测试、也可被防御的现实问题。
马斯克称xAI正在同时训练7个大模型:10万亿参数AI要来了
快科技4月8日消息,尽管xAI的11位联合创始人已经跑路,但这并没有影响马斯克的决心,现在他还透露了xAI野心勃勃的计划,正在同时训练7个AI大模型。 马斯克在X上确认SpaceXAI的超级计算集群 Colossus 2 目前正同时训练 7 个模型,具体如下: 1. Imagine V2,图像与视频生成模型的下一代版本 2. 1万亿参数模型2个变体 3. 1.5万亿参数模型2个变体 4. 6万亿参数模型 5. 10万亿参数模型 这7个大模型具体会成为那些产品还不确定,在当前的AI领域,万亿参数已经没多少吸引力了,最让人感兴趣的当属后面2个超大参数量的大模型。 其中6万亿参数的应该是Grok 5,当前的是Grok 4.2版,每次发布时也是刷榜的存在,但实际使用下来,马斯克要想赶超御三家的AI能力还是需要加把劲的。 至于10万亿参数量的AI更不好确定是哪个,可能是再下一代的Grok 6,也可能是全新的产品。 目前10万亿参数量的AI全球也没几个,Anthrpoic刚刚发布的Mythos据说是10万亿参数量,但官方并没有确认具体的技术规格,只能说从Mythos的性能表现来看,10万亿参数量的AI强大太多了。 马斯克能有底气同时搞7个大模型,说到底还是有强大的算力支撑——Colossus 2是今年1月17日才部署的算力集群,号称全球首个GW级AI集群,配备了20万块高性能GPU,按照NVIDIA黄仁勋的说法,1GW的算力差不多要500亿美元的投资,可以说非常奢侈了。 Colossus 2本月底还会进行升级,算力会提升到1.5GW,训练10万亿参数量的AI这下更方便了。
三星拿下苹果折叠屏独家三年合同:首批供货300万片 京东方暂未入围
快科技4月8日消息,据媒体报道,苹果公司已与三星显示签署为期三年的独家可折叠OLED供应协议。 在此期间,苹果将不会使用其他任何显示器制造商生产的可折叠面板。 消息人士称,这份三年独家合同由三星显示率先提出。苹果目前除三星显示之外没有其他备选供应商,因此只能接受这一独家条件。 京东方虽向华为等企业供应折叠屏面板,但此次无缘为苹果提供折叠屏;LG显示则暂无手机折叠屏面板的供货实绩。 三星显示计划于2026年第二季度启动苹果折叠屏OLED面板量产。 2026年首批供应量约为300万片,远低于市场此前约1000万片的预期。 一位业内人士表示:“以300万片起步,意在观察市场反应后再调整数量。” 供应给苹果的折叠屏OLED面板将采用封装式彩色滤光片(CoE)技术,该技术无需偏光片,可直接在封装层上形成彩色滤光片。 该面板所使用的OLED材料与iPhone 17 Pro Max使用的M14材料相同,而非采用全新材料,意在确保稳定性并降低成本。 关于苹果折叠屏手机的发布时间,目前存在两种不同预测。 4月7日,《日经亚洲》报道称苹果折叠屏手机在工程测试阶段遭遇困难,原定于今年下半年的发布时间可能推迟数月。 同日,还有媒体报道称苹果仍计划在9月与iPhone 18系列同期或稍后发布。 行业人士表示:“无论整机组装环节是否存在延迟,三星显示为苹果折叠屏手机生产OLED面板的工作都将按原计划于第二季度启动。”
“生化危机”女主用Claude手搓满分AI,一年0.7美元反杀大厂!
新智元报道 编辑:桃子 好困 【新智元导读】全网震撼!《生化危机》女主跨界撸码,用Claude造出地表最强AI记忆系统,斩获全球首个满分。一年仅0.7美元,就能让大模型拥有永久记忆。 活久见!好莱坞巨星,也在撸代码了。 这几天,全网被一个开源「AI记忆系统」MemPalace彻底刷屏,这还是全球首个最强记忆AI。 万万没想到,背后核心开发者名单中,居然藏着一位顶流巨星—— 那个曾参演过《第五元素》、《生化危机》的女主角Milla Jovovich。 白天,片场收工、走完Miu Miu时装秀、安顿好孩子;深夜,她便潜心于「氛围编程」。 她和工程师好友Ben Sigman一起,与Claude协作,开源了这款明星项目。 在公认最严苛的长期记忆基准LongMemEval中,它以500题全对的史无前例战绩,斩获全球首个满分。 如今,在GitHub上,MemPalace已狂揽17.9k星,Fork高到2k。 GitHub地址:https://github.com/milla-jovovich/mempalace 顶流巨星跨界,转型成功! 顶流女星跨界,用Claude造爆火AI MemPalace的诞生,带有一丝偶然。 半年前,20多年的老友、老牌工程师Ben Sigman向Milla首次介绍了Claude Code。 作为一个热爱写作的创作者,她立刻意识到:CC能将自己脑海中天马行空的文字,转化为真实运行的代码。 然而, 在尝试构建一款大型游戏的过程中,她撞上了一堵「无形的墙」。 Milla发现,AI虽然强大,却缺乏「灵魂」与「积累」—— AI只能掌握那些已经做过的事情。真正创造出独一无二、与众不同的东西的,是使用它的人类。 如果没有我们的想象力和永不满足的好奇心,AI就仅仅是个搜索引擎而已。 这句话并非空谈,而是她在开发中遇到的非常具体的痛点: 每次和AI开新会话,之前讨论过的设计、推翻过的方案、试过又失败过的思路,全部清零。 于是,Milla敏锐地察觉到,解决AI长期记忆的问题,甚至比游戏项目本身还要重要。 她与Ben Sigman决定调转航向,把这件「挡路的事」做成了一个独立项目。 Milla以「架构师」的身份重塑逻辑,Ben则用代码将蓝图落地。 两人联手打磨了6个月,最终这套名为「记忆宫殿」的系统——MemPalace,正式破壳而出。 那么,MemPalace到底是什么? 「记忆宫殿」出世,100%刷爆SOTA 这个名字的灵感,来源于两千年前的古希腊。 那时,古希腊的演说家会用一种叫「记忆术」(Method of Loci)的方法背诵长篇演讲—— 把每一段内容「放置」在不同的房间里,演讲时只需在脑海里走一遍宫殿,内容就会被一一调出。 于是,MemPalace借鉴了《记忆宫殿》的技巧,直接将数据「结构化」,并构建出一个虚拟的空间: 每个项目、每个人、每个主题,都是宫殿里的一个「翼楼」(Wing)。 翼楼里有「房间」(Room),按主题分类:认证系统一间、数据库选型一间、部署流程一间,数量不限。 房间之间有「走廊」(Hall)串联,走廊按记忆类型划分:决策、里程碑、偏好、建议、发现,五条固定通道。 跨翼楼的同名房间之间,系统会自动生成「隧道」(Tunnel)。 比如,「Kai」这个人的翼楼里有一间「auth迁移」,「Driftwood」这个项目的翼楼里也有一间「auth迁移」——隧道自动打通,同一件事在不同视角下的记忆,瞬间关联。 每个房间配一个「衣柜」(Closet),存的是摘要索引;衣柜里的「抽屉」(Drawer),存的是原始对话全文,一个字都不删。 搜索时,AI不需要翻遍所有数据。 它先定位翼楼,再进房间,再开抽屉——范围从全库缩小到精确命中。 官方在22,000+条真实对话记忆上测试,全库搜索召回率60.9%,加上翼楼+房间过滤后直接拉到94.8%,提升34个百分点。 换句话说,结构本身就是检索能力。 而且,所有数据全部存在本地ChromaDB里,不调API,不上云,不花钱。 一年只要0.7美元,记住所有事 再来看一个让人有点窒息的对比表—— 按照Milla的算法,把所有对话粘进去,一个重度AI用户半年下来,大概会累积1950万token的对话历史。 只让大模型做摘要,一年要花约507美元,关键是摘要会丢失关键的推理过程。 若要用MemPalace,每次AI启动只加载170个token的关键事实——你的团队、项目、偏好....只在需要的时候才检索。 AAAK:写给AI看的「速记法」 MemPalace 里还有一个让人眼前一亮的设计,叫AAAK。 这是一种专门写给 AI 读、不是写给人看的压缩方言。 举个栗子,下面这段英文大约1000个token: Priya 是 Driftwood 团队的负责人:Kai(后端,3 年)、Soren(前端)、Maya(基础设施)和 Leo(初级,上个月刚入职)。他们正在做一个 SaaS 数据分析平台。当前 sprint 是把鉴权迁移到 Clerk。Kai 基于价格和开发体验推荐了 Clerk 而非 Auth0。 压缩成AAAK后,只有约120个token: TEAM:PRI(lead)|KAI(backend,3yr)SOR(frontend)MAY(infra) LEO(junior,new) PROJ: DRIFTWOOD(saas.analytics) | SPRINT: auth.migration→clerk DECISION: KAI.rec:clerk>auth0(pricing+dx)  信息无损,token减少8倍。 最妙的是,AAAK本质就是结构化文本,任何能读文本的大模型——Claude、GPT、Gemini——都能直接理解,不需要解码器、不需要微调。 48小时,社区扒了个底朝天 但故事还没完。 MemPalace上线不到48小时,开源社区就把项目里的水分挤了个干净。 第一刀砍在AAAK上。 AAAK是MemPalace自研的一套「缩写方言」,官方最初声称可以实现「30倍无损压缩」。 社区拿真正的tokenizer一跑,发现项目里的示例根本不省token——英文原文66个token,AAAK编码后反而变成了73个。 而且AAAK是有损的,不是无损的。在LongMemEval上,AAAK模式只拿到84.2%,比raw模式的96.6%低了12.4个百分点。 第二刀砍在「+34%宫殿增益」上。 这个数字对比的是「不过滤直接搜」和「用翼楼+房间做元数据过滤后搜」。元数据过滤是ChromaDB的标准功能,不是MemPalace的独创机制。有用,但不是护城河。 第三刀砍在矛盾检测上。 项目里写得好像知识图谱会自动做事实校验,实际上fact_checker.py是一个独立脚本,根本没有接入知识图谱的操作流程。 然后Milla和Ben做了一件在开源圈相当少见的事。他们没有删评论,没有辩解,而是直接在项目顶部贴了一封公开信,逐条认错。 AAAK的token示例,承认用了粗糙的启发式算法,没跑真tokenizer。 「30倍无损压缩」,承认夸大改口为「有损缩写系统」。「+34%宫殿增益」承认措辞误导,补充说明是标准元数据过滤。 矛盾检测,承认没接入,列出了修复的Issue编号。 公开信最后一句:「我们宁愿正确,也不愿看起来厉害」。 开源社区的反应也很有意思。骂完之后,反而有更多人开始认真审视这个项目——96.6%的raw模式成绩是实打实的,本地免费也是实打实的。 扒皮没有杀死MemPalace,反而给它做了一次免费的信任审计。 三步上手,开发时代真的变了 pip install mempalace # Set up your world — who you work with, what your projects aremempalace init ~/projects/myapp # Mine your datamempalace mine ~/projects/myapp # projects — code, docs, notesmempalace mine ~/chats/ --mode convos # convos — Claude, ChatGPT, Slack exportsmempalace mine ~/chats/ --mode convos --extract general # general — classifies into decisions, milestones, problems # Search anything you've ever discussedmempalace search "why did we switch to GraphQL" # Your AI remembersmempalace status 接Claude/ChatGPT/Cursor这类支持MCP的工具,只要一行命令: # Connect MemPalace onceclaude mcp add mempalace -- python -m mempalace.mcp_server 之后19个工具就接好了,AI会自己调用。你再也不用手动敲mempalace search。 这个项目最让人感慨的地方,不一定是那个100%的分数,也不一定是30倍的压缩比。 而是它再一次提醒我们:AI时代的「开发者」的边界正在消失。 一个以《第五元素》《生化危机》闻名的巨星,和一个工程师朋友,借助Claude,便拿下了一项被大厂刷了一年多的行业SOTA。 关键还是,开源、免费、本地运行的版本。 Ben最新一条帖子中,还做了一个双关:Mempalace -> Multipass。 ——熟悉《第五元素》的人都知道,那是Leeloo全片最经典的一句台词「通行无阻」。 看来这次,是真的「通行无阻」了。
DeepSeek连夜改页面,免费的AI用不长了
摘要: 算力短缺,已经是AI赛道“房间里的大象”。 凤凰网科技 出品 作者|路春锋 编辑|董雨晴 4月8日凌晨,DeepSeek悄悄上线了一种新的分层模式界面:在网页版/App中出现了“快速模式(Fast)”和“专家模式(Expert)”两个入口,同时还有一个带图标的“视觉模式(Vision)”选项正在灰度测试。 图|Deepseek网页版截图 新的功能分工十分明确:快速模式面向日常对话和低延迟响应;专家模式针对复杂推理和深度任务,可能触发更长推理时间但响应慢;而视觉模式则开启了图像输入等多模态能力,不过凤凰网科技检索发现,被灰度到视觉模式的人非常之少。 外界普遍认为,这是为即将发布的新一代V4模型做的功能和体验预热。但相比发新模型,当前的分级制度或许更值得关注,作为一种“按需调用算力”的调度机制,就是将简单任务交由低成本路径处理,仅在必要时启用高算力推理,从而减少无效Token消耗,实现整体成本的结构性下降。 大模型公司的算力焦虑 大概在一周前,Anthropic宣布自4月5日起,旗下大模型Claude的订阅服务将不再覆盖包括龙虾在内的第三方集成工具。用户如想继续使用该模型,只能通过与订阅服务分开计费的按需付费方案,并为此支付额外费用。 背后的逻辑非常好理解,随着黄仁勋在GTC大会上高呼Token经济学。全球科技大厂一时间把token消耗量变成了考核标准,更有国内的互联网大厂拉了月度token消耗排行,唯token消耗论甚嚣尘上。 据Anthropic表述,订阅制的定价模型原本是基于“个人用户正常使用强度”设计的,而OpenClaw这类自动化代理工具的使用强度远超预期——有重度用户每月仅支付200美元订阅费,却消耗了价值5000美元的算力资源,给Anthropic带来了巨大的成本压力。 小米AI负责人、前DeepSeek核心成员罗福莉对这个理念进行了拆解,认为Anthropic终于走出了天坑。其在社交平台X上发布长文,认为全球算力供给已经跟不上Agent创造的token需求增速。真正的出路不是更便宜的token,而是“更高token效率的Agent框架”叠加“更强大高效的模型”之间的协同进化。 据行业数据显示,截至2026年3月,中国AI大模型日均Token调用量已突破140万亿,较2024年初增长超千倍。 罗福莉算了一笔账:按API定价折算,这类框架的真实成本大概是订阅价格的数十倍。她觉得这一差距“不是缺口,而是天坑”。 更值得国内AI公司注意的是,Anthropic在4月7日宣布,其年化收入(ARR)突破300亿美元,正式反超OpenAI的250亿美元。 从2025年底的90亿到如今300亿,其仅用三个多月就实现了233%的爆发式增长,即便如此,Anthropic仍在算一笔精细的账。 在罗福莉看来,Anthropic封杀“龙虾”的真正价值在于:让效率低下的成本真实可见,从而倒逼整个生态走向工程自律。短期阵痛不是坏事,它会推动框架开发者认真改进上下文管理、最大化prompt缓存命中率、削减无效token消耗。 发新模型眼下可能没那么重要 DeepSeek R1最初的惊艳,原本也是架构的创新,极大的实现了token的节约。当时,低价token的源头虽然是DeepSeek,但其本意从来不是为了价格战,只是后来者把这种创新完成了价格战游戏。 2025年初的爆红,也让DeepSeek几度面临容量不足的窘迫,时常宕机。 在第一拨大规模用户涌入后,曾有DeepSeek内部人士告诉凤凰网科技,因为当时资源不够,所以用户看起来被限制了使用次数,后来内部通过优化方法,重新分配资源。 但这种内部架构的创新已经难以满足当前的token调用需求。 国金证券在研报中指出,算力供需正在发出关键信号——需求端以指数级膨胀,供给端却受限于芯片出口管制与成本约束,难以同步扩张。 免费模式,成了这场危机的加速器。大模型运营成本极高,免费模式让平台算力扩容始终滞后于用户增长。 在2026年开年以来,DeepSeek已经上演了至少7次大规模服务中断。3月29日晚至30日上午,平台再度突发全局崩溃,网页端与APP端同时无法使用,宕机时间持续约12小时,直至次日9时13分才恢复正常。 或许是压力之下,DeepSeek在4月8日低调更新了对话界面,在输入框上方新增了“快速模式”和“专家模式”选项。在行业人士看来,分层设计既可以通过算力分流缓解峰值压力,也能为后续搭建付费体系、限额限流铺路。 不久前,OpenAI宣布下线Sora,将有限的算力资源重新聚焦于核心服务,与DeepSeek开启分层、Anthropic的高峰限流措施共同揭示了一个现实:需求增速已远超基础设施的扩张能力。 AI赛道的“房间里的大象” 从DeepSeek的免费模式难以为继,到Anthropic的封杀令,再到罗福莉的价格战警告,这些看似独立的事件共同指向同一个结构性矛盾:AI赛道的token用量正在以指数级速度膨胀。 海外的AI数据中心大手笔抢购存储芯片,再向华尔街开出账单,犹如一场没有尽头的赌注游戏。 实际上,不止是芯片,电力危机也在叠加:AI算力耗电占全社会用电量增速的46%,远超整体6.1%的增长水平,电力弹性不足成为硬约束。 在这种背景下,行业正在经历一场从“免费烧钱换用户”到“算力精细化运营”的范式切换。阿里云、腾讯云早前已启动算力涨价,最高涨幅达34%。但说起来是涨价,实际也只不过是把之前价格战时期的优惠给抹掉了,恢复了正常定价。 4月8日,在智谱发布旗舰开源模型GLM-5.1之际,再度提价10%,此前其已经进行过两次提价。 如果说过去两年,大模型行业的关键词是“规模”和“速度”,那么现在,关键词已经悄然变成了两个字:成本。 即便是像OpenAI和Anthropic这样的海外明星企业,目前都还处于高投入阶段,算力、人才、基础设施等等开支巨大。在持续依赖融资的同时,它们都必须回答一个现实问题:这门生意什么时候能自我造血? 于是,行业开始出现一个明显转向:当AI开始赚钱,第一步不是赚更多,而是少亏一点。 以OpenAI为代表的一类玩家,选择的是更激进的路线:产品快速迭代、能力优先、生态开放,同时通过持续融资维持扩张节奏;而以Anthropic为代表的另一类,则明显更克制,把重点放在成本结构、稳定性和企业服务上,通过工程优化来提升效率。 两者的差异,可以简单理解为:一个是“先做出来再说”,一个是“先算清楚再做”。 这种变化,对普通用户其实也会产生直接影响。 首先,API价格未必会像很多人预期的那样持续大幅下降。虽然单位价格在降低,但成本控制的压力并没有消失,企业更可能通过优化结构,而不是无限降价来消化成本。 其次,免费额度和补贴可能逐步收紧。过去依赖“烧钱换增长”的阶段正在结束,当每一个Token都需要被精确计量时,慷慨的免费策略本身就变得不可持续。 再次,在体验层面,用户也可能感受到变化:模型回复会更克制、更精简;长文本、复杂推理或高频调用,可能被更严格地限制或分层定价。你看到的“更短回答”,背后往往不是模型变“懒”,而是系统在主动做成本优化。 从某种意义上说,Token被省下来的那一刻,成本并没有消失,而是被重新分配——在模型厂商、企业客户与终端用户之间流动。 说到底,AI正在完成一次从“实验品”到“商品”的转变。大模型从来不是纯技术问题,而是一门重资产生意。当增长神话退去,算账就成为最核心、最现实、也最无法回避的问题。 这,才是“抠Token”背后真正的行业逻辑。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。