注册 登录
EN
中文
APP下载
logo
icon
数字孪生
icon
大数据获客
icon
人工智能
分类目录
行业分类:
IT/通信
金融财经
市场/营销
交通/物流
节能环保
休闲旅游
农林渔牧
日化用品
数码家电
房产/建材
企业/管理
家具/家居
医疗/保健
新零售
机械/工业
餐饮/食品
其它行业
头条分类:
行业前景
行业动态
行业资讯
行业活动
运营超20年终停服!360doc个人图书馆创始人:无偿转让失败
快科技4月7日消息,日前,360doc个人图书馆网宣布,因无法在确保数据安全与服务延续的前提下找到合适的接手方,网站将于2026年5月1日正式停止所有服务。 360doc个人图书馆创始人蔡智发布致用户的告别信,称“这一次,是真的要说再见了,这两个月,我尝试将360doc无偿转让,最终失败。” 蔡智表示,他和有承接能力的互联网巨头谈过,做过方案,做过试点,也等过、求过、忍过。但最终,被搁置,被推诿,熬尽了最后一丝力量。 对于为何没有选择跨界朋友和创业公司递来的橄榄枝,蔡智很清楚:没有互联网经验、没有AI能力,这个平台接过去,只会变成负担。无法确认他们是否真的会保护好大家的数据与隐私,是否会认真把服务继续下去。 蔡智还透露,有一些心怀叵测的人,试探着能否购买域名和用户数据,但被他坚决拒绝,“8000万用户的数据,一旦流入灰产,后果不堪设想”。 据了解,今年1月,360doc个人图书馆发布公告称,因公司业务调整,寻求无偿转让,希望有能力的团队接手。 公告提到,360doc个人图书馆自2005年上线,至今已运营20年,服务超8000万用户。 因公司业务调整,决定将360doc个人图书馆的全站平台资产(核心技术、数据及运营团队),向具备诚意与能力的伙伴进行无偿转让。 希望接收方有充足的资金实力,不少于500万元,能保障平台安全稳定、持续服务。
百度发布“史上最强”文心大模型4.5及支持深度思考的文心大模型X1,免费开放
IT之家 3月16日消息,百度今日正式发布文心大模型4.5和文心大模型X1,两款模型已在文心一言官网上线,免费向用户开放。 文心大模型4.5已上线百度智能云千帆大模型平台,企业用户和开发者登录即可调用 API;文心大模型 X1 也即将在千帆上线,百度搜索、文小言App等产品也将陆续接入文心大模型4.5和文心大模型X1。 据IT之家了解,文心大模型4.5是百度首个原生多模态大模型,在多模态理解、文本和逻辑推理等方面有显著提升,多项测试表现优于GPT4.5,API调用价格仅为GPT4.5的1%;文心大模型X1则是一款性能上对标DeepSeek-R1的深度思考模型,同时还支持多模态、多工具调用能力,API调用价格约为R1的一半。 据IT之家此前报道,在百度2024年Q4及全年财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,文心大模型4.5将开源,4.5将是百度有史以来最强大的大模型,“希望客户和用户能比之前更方便地体验这款模型”。 百度更早前曾表示,随着文心大模型的迭代升级和成本不断下降,文心一言将于4月 1 日零时起全面免费,所有PC端和App端用户均可体验文心系列最新模型。此外,即日起,文心一言上线深度搜索功能;该功能也将于4月1日起免费开放使用。
彭博评SpaceX两万亿IPO:基本面失灵,马斯克凭“兜售梦想”破局
马斯克 凤凰网科技讯 北京时间4月7日,据彭博社报道,知情人士称,SpaceX将与投行顾问举行会议,对该公司的2万亿美元目标估值进行压力测试,这是其推进史上最大规模首次公开招股(IPO)过程中的关键一步。 在SpaceX与xAI合并两个月后,资深银行家们正准备就这家火箭公司的IPO展开磋商,以确定这一高企的估值是否仍能吸引投资者。知情人士称,该公司目前的市场估值预计将突破2万亿美元,而不到两周前这一预期还是1.75万亿美元。 “你必须相信,马斯克会继续兜售梦想,这也是他们在提交IPO招股书之前一直在做的事情,没有人比马斯克更擅长兜售梦想了。”哥伦比亚商学院兼职副教授、巴克莱银行前全球股票资本市场联席主管戴维·埃里克森(David Erickson)表示。 不靠基本面 按照2万亿美元以上估值计算,SpaceX将超越标普500指数中除五家公司以外的所有企业,仅低于英伟达、苹果、 Alphabet、微软和亚马逊。尽管SpaceX营收仅为这些公司的零头,但其估值将使“科技七巨头”中的另外两家公司Meta、特斯拉相形见绌。 分析师估计,这样的估值意味着按历史销售额计算,其市销率将超过100倍,远高于散户投资者喜爱的Palantir大约79倍,后者目前是标普500指数中市销率最高的公司。 SpaceX估值排名第六 据彭博行业研究估计,SpaceX的火箭发射项目和星链卫星将贡献其大部分营收,2026年有望接近200亿美元,而xAI的营收可能不足10亿美元。 “实际上,这并不是关于基本面的问题,从数学角度来看,没有人能靠基本面达到那个估值,因为数学上行不通。”埃里克森表示。 两次关键发射 知情人士告诉彭博社,在6月的潜在IPO之前,SpaceX预计会进行两次火箭测试发射。金融数据公司PitchBook的高级分析师弗兰科·格兰达(Franco Granda)表示,这两次发射“对IPO的成败至关重要”。 “如果这两次测试中有任何一次失败,IPO甚至可能根本不会发生。这将决定所有人对IPO的态度。”格兰达称。 马斯克上周五在X上发帖称,SpaceX最新一代可重复使用的超重型运载火箭的首次飞行预计将在四到六周内进行。 SpaceX此次上市最多可能筹集750亿美元资金,远超沙特阿美在2019年上市创下的290亿美元纪录。该公司将利用IPO所筹集的资金,资助马斯克关于建设太空AI数据中心以及月球工厂的愿景。 宏大计划 马斯克的宏大计划将需要前所未有的资金,以及横跨他旗下多家公司的资源。马斯克在3月份表示,他的Terafab项目将由特斯拉和SpaceX共同运营,最终将为机器人、AI和太空数据中心生产自有芯片。 PitchBook分析师格兰达一个月前曾称SpaceX的目标估值“合理”,但他提醒说,马斯克不断扩张的愿景可能会给估值带来上行空间,但也会增加越来越多的风险。 “当估值开始超过1.75万亿美元时,问题就变成了:他们在多大程度上可以依赖马斯克的公众形象来推高估值?”他说。 和与xAI合并时的1.25万亿美元估值相比,SpaceX如今飙升到了2万亿美元,也是去年12月公司部分内部人士通过要约收购出售股份时的8000亿美元估值的两倍多。 然而,在SpaceX秘密提交上市文件之前,投资者通过不透明的特殊目的载体(SPV)进行的SpaceX相关私募市场交易活动大幅飙升。私募市场数据公司Caplight Technologies的信息显示,今年前三个月,仅通过这些SPV进行的交易活动价值就达到数亿美元。 Caplight称,总交易量是该数据提供商在去年最后六个月所观察到的交易量的两倍。Caplight 追踪由数百家经纪交易商、注册投资顾问及其他合格机构投资者组成的网络所报告的交易数据。 知情人士称,美国银行、花旗集团、高盛、摩根大通和摩根士丹利在本次IPO中担任牵头角色,SpaceX还在承销商阵容中增加了更多银行。 一位知情人士表示,该公司已安排在周一与阵容更大的银团召开电话会议,并于4月底举行分析师简报会。 这些会议的最终结果,可能取决于马斯克能否让投资者将目光始终聚焦于愿景而非数字之上。 “它曾经是一个资本密集型的优质公司故事。现在你开始加入真正的科幻式计划,而财务数据对他们并不有利。”格兰达表示。 对于彭博社报道的2万亿美元估值,马斯克似乎在4月3日发表的帖子中进行了驳斥,称“不要相信你读到的一切”。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
三星单季利润超腾讯全年,可惜手机业务只是个零头
摘要: 一季度,三星利润达57.2万亿韩元(约2598亿元),逐步逼近英伟达单季度的429亿美元(约2941亿元),已经超过了腾讯2025年全年利润(2248亿元)。 凤凰网科技 出品 作者|路春锋 编辑|董雨晴 “95%利润源于内存”,是“AI通胀”信号 今天,三星电子公布了2026年一季度业绩预告,交出了一份刷新历史的炸裂成绩单:单季营收133万亿韩元(约合881亿美元),利润57.2万亿韩元(约合379亿美元)。 图源|三星电子官网 这一利润数字比去年同期的6.69万亿韩元暴增了755%,是公司历史单季纪录的近3倍,甚至超过三星2025年全年43.6万亿韩元的总利润。 细看这份业绩会发现,数据背后是一场极端的利润结构重构。在三星电子57.2万亿韩元的营业利润中,外界普遍认为“强劲的AI芯片需求是利润增长的关键因素”。其中,美利兹证券预计,三星的芯片部门(Samsung’s chip division)实现了约54万亿韩元的营业利润,约占总额的95%,而其手机、显示、家电等传统业务只贡献了约4万亿韩元。 可以说,这份业绩并非简单的行业周期性复苏,而是AI算力需求爆炸下,全球硬件成本“通胀”的信号。 具体来看,三星利润暴涨的核心,是存储芯片价格的“失控式”上涨。作为AI时代的“数字石油”,HBM(高带宽内存)的价格在很短的时间内经历了一轮史诗级上涨。据TrendForce(集邦咨询)数据,2025年初主流HBM价格约30美元/颗,而到了今年一季度,同规格的产品售价已达120-150美元/颗,涨幅约300%~400%。 而据CounterPoint等三方研究机构测试,三星的HBM产品的整体市占率约25%~30%,仅次于SK海力士。HBM价格上涨,让三星多了一头“利润奶牛”。 更具冲击力的是服务器DRAM(运行内存)。受AI服务器“海量吃内存”拉动,今年一季度DRAM合约价环比暴涨90%~95%,近乎翻倍。TrendForce数据显示,主流服务器DDR5价格单季跳升近一倍,且三星已与客户敲定今年二季度价格再涨30%的协议。 此外,NAND闪存(存储内存)在今年一季度的整体合约价也环比上涨了55%~60%。而三星是全球最大的NAND闪存厂商之一,市占率稳居前列。 从HBM到通用DRAM、再到NAND闪存,涨价已从高端局部扩散至全品类。而作为全球存储龙头之一,三星也凭借在这三大品类上的规模与定价优势,直接吃下了这一轮涨价红利,成为最核心的受益者之一。 硬件通胀背后,由消费者买单? 从三星电子一季度的业绩结构中不难看出,其利润的暴涨并非来自产品创新或销量爆发,而是价格上涨。 这意味着,AI 算力需求正在改写电子行业传统的定价逻辑,让原本周期性波动的存储市场,进入一轮非常规的价格上涨通道。 历史上,DRAM 与 NAND 闪存价格涨跌本是常态,行业长期处于 “供需失衡 — 价格波动 — 产能调整 — 再平衡” 的周期运动中,涨价通常被视为行业复苏的正常信号。 但本轮上涨从根源上就偏离了传统周期:起点是 AI 大模型与算力中心爆发,带动了 HBM 高带宽内存与高性能服务器 DRAM 需求上涨。市场最初判断,AI只会拉动“高端存储”,属于结构性利好。 但现实中的变化更为复杂。一方面,AI 需求并未停留在 HBM 单点,而是快速向全存储品类外溢,普通服务器 DRAM 与企业级 NAND 需求同步激增。另一方面,三星、海力士等厂商将产能优先投向高毛利的AI 存储,进一步挤压普通的消费级存储供给。多重因素影响下,涨价逐渐从高端局部蔓延至全品类。 当全品类存储都同步涨价,他的性质就已经超越行业周期,更像是一场由AI驱动的 “硬件通胀”。 问题是,这种硬件通胀,会如何反噬终端行业? 上游涨价肯定不会止步于芯片环节,必然向下游传导,那么手机、PC、汽车电子等终端行业都将面临成本上涨的压力。三星财报中,存储业务包揽绝大部分利润、手机等传统业务利润被明显挤压,就是这种成本传导的信号。 面对刚性上涨的存储成本,终端厂商会如何应战?是压缩自身利润空间,以价换量维持市场份额?还是将成本压力转嫁给消费者,提高终端售价? 无论选择哪条路径,压力都会沿着产业链传递。AI 带来的上游红利,正逐步转化为下游的成本负担,而这轮硬件通胀的最终买单者,很可能落到每一位普通消费者身上。
微软又需要拯救了吗?
好消息,微软的AI产品终于上热搜了。 坏消息,被人骂上去的。 事情是这样的,微软的旗舰产品Copilot,在超1.1万个GitHub的代码库中,强行插入合作产品及自家产品的广告。 被抓到现行后,GitHub官方赶紧关停了这个功能并道歉。 Copilot现在的处境相当凄惨。 Copilot在“首选AI工具”的付费用户占比从2025年7月的18.8%,跌到了今天的11.5%,被Google的Gemini超越。 2024年3月,纳德拉花重金挖来了DeepMind的联合创始人苏莱曼(Mustafa Suleyman)担任微软AI CEO,希望他能扭转局面。 结果两年过去,微软在AI上依然没什么太大起色。 其实就在前几天,微软好不容易连着发了三个模型,甚至在性能上还在全球领先。 但无人在意。微软的三个模型淹没在信息流里,甚至连个水花都没激起。 大家当天的焦点全都放在了谷歌的试验性小模型Gemma 4上。 2025年10月至2026年3月,微软股价暴跌30%,创2008年金融危机以来最差季度表现,在“七巨头”(英伟达、苹果等)中垫底。 市场已经把微软放到了AI基础设施那桌,跟甲骨文平起平坐。而非OpenAI、Anthropic这样的技术先锋。 尤其是在AI编程这块,微软几乎全程没有参与。 在三年前,微软还是AI界革命最耀眼的那颗星。 可到了今天,产品付费率下滑、股价下跌、技术跟不上时代。微软再次陷入了危机。 纳德拉能救微软于水火之中,甚至因此引领了全球云的时代。 现在,天又降大任给他了,纳德拉还能救微软第二次吗? 01 从云端王者到AI时代的新人 纳德拉2014年接手微软时,公司市值只有3000亿美元,深陷移动互联网失败的泥潭,Windows Phone已经证明是个失败产品。 纳德拉用“云优先”战略拯救了微软。将Azure这个在微软很边缘的业务,做到了年收入超750亿美元,微软的市值一度突破3万亿美元,重回全球科技之巅。 随后,纳德拉花了130亿美元押注OpenAI,让微软在2023年成为生成式AI的最大赢家。 那时候每一次微软的AI发布会都是全球焦点,Azure成为所有AI创业公司的首选云平台。 然而,在进入agent时代后,微软有点萎靡不振了。 作为微软在agent领域最旗舰的产品,Copilot发布了两年,4.5亿M365用户中仅1500万付费,转化率3.3%。 微软每月向每个用户收30美元,一年360美元。你说你卖这么贵就算了,关键产品体验糟糕到怀疑人生。 最经典的高频翻车案例是在Word上。 大量付费用户反馈,哪怕只是“加粗文档里所有的日期”这样的需求,Copilot也无法执行直接操作,反而洋洋洒洒给出10步复杂的手动操作步骤,让用户自己手动操作。 2024年Copilot推出的Recall功能更是灾难。这个功能每隔几秒截屏并保存,方便用户回溯历史操作。 但开发者发现所有截图以明文形式存储在数据库里,没有任何加密,连银行账户和密码都原封不动保存。微软被迫下线这个功能,花一年时间重做安全机制,最后上线时改成默认关闭。 这是Copilot的第一个重大功能,然后如此草草了事,留下了一地鸡毛。 2025年12月,纳德拉开始亲自接管Copilot产品。他告诉工程师,Outlook和Gmail的集成“基本不能用”。他开始每周召集100个高级工程师开会,逐一拷问产品问题。 他把微软AI首席执行官苏莱曼从统管Copilot的位置上调走,让Snap挖来高管雅各布·安德烈乌(Jacob Andreou)接手。 雅各布在Snap一共做了8年的产品,从苏莱曼手里接下来消费级 + 企业级全Copilot产品线的产品、研发与增长,并且直接向纳德拉汇报。 结果就是,Copilot依然不太行。 纳德拉也算是看清现实了,于是在最关键的agent能力上,他让微软完全依赖外部供应商。 3月底推出的深度研究agent同时调用GPT和Claude。为了在自家的office产品上做原生的Claude Cowork,直接和Anthropic合作了一个Copilot版本的Cowork。核心AI能力“不是OpenAI就是Anthropic的,没有一点是自己的”。 账面上看,微软确实拿到了类似甲骨文那样的天价合同。 2025年9月,OpenAI承诺未来向微软采购2500亿美元的Azure云服务。这笔订单让微软的商业剩余履约义务从3920亿美元跃升至6250亿美元,其中45%来自 OpenAI 这一个客户。 但这种大合同在某种程度上成了沉重的财务包袱。 为了交付这些订单,微软2026财年单季度资本支出就达到375亿美元,创下历史纪录。云业务毛利率从69%下滑至67%,预计下季度还要降至65%。 更要命的是,这笔超级大订单让Azure处于“容量受限”状态。 微软把GPU资源优先分配给自家产品和OpenAI,外部客户的订单积压了800亿美元却无法交付。单一客户占据45%的订单积压,这种集中度风险让投资者开始担忧。 所以资本市场不想再给纳德拉面子了。 2025年10月至2026年3月,微软股价暴跌30%,创2008年金融危机以来最差半年表现,在“七巨头”(英伟达、苹果等)中垫底。 与此同时,Anthropic估值从610亿美元飙升至3800亿美元,年化收入190亿美元。 你说微软到底怎么了?难道是说砸钱砸得少了? 我觉得不应该。 2025年,微软全年总资本支出为887亿美元,官方明确其中超70%的资金投向AI基础设施,对应AI专项实际支出约620 亿美元。 微软CFO明确披露,2026年总资本支出中约三分之二将专项投向AI基础设施。 微软绝对是肯往AI里面砸钱的。 可是当Claude可以直接编辑你的代码库、修改你的电子表格、生成完整的演示文稿时,Copilot连打开浏览器都费劲。 这就说明,微软大概是走错路了。 纳德拉第一次拯救微软时,抓住了云计算这个平台性机会。 但AI时代,这套围绕平台建立的产品逻辑好像说不通了。 02 三款新模型够吗? 先回顾一下微软在4月3日发布的三款自研模型。 MAI-Transcribe-1的语音转录错误率3.9%,优于OpenAI的4.2% 和Gemini的4.9%,批量转录速度提升2.5倍。MAI-Voice-1可以在单GPU上1秒内生成60秒音频,长内容语音一致性强。MAI-Image-2的图像生成速度至少提升了2倍。 这是微软首次在能力上拿出“超越OpenAI”的量化指标,它的象征意义比实际意义要重大。 微软明确表态要在2027年“自主打造大型尖端模型”。这三款模型覆盖企业AI最高频的语音和图像场景。微软已经将一只脚伸进河里,试试水的温度。 为什么这么晚才开始做?微软早干嘛去了? 纳德拉一直信奉平台逻辑,“Windows式平台战略”。 在PC时代,微软控制操作系统和开发工具,让别人的应用在自己平台上跑,这个逻辑非常成功。 他把同样的思路搬到AI时代,控制基础设施Azure、开发工具Copilot Studio和企业入口M365,让别人的模型在自己平台上跑。 2023年这个策略看起来很聪明。微软不需要自己做模型,只要把OpenAI的模型集成进来,就能快速推出产品。Azure成为OpenAI的独家云服务商,微软拿到了最好的模型,OpenAI拿到了算力和分发渠道,双赢。 但现在情况是什么呢?就是你微软想要有什么产品,第一时间不是找公司的产品经理去规划,而是要看Anthropic和OpenAI这两位的脸色。 这就是平台战略的致命缺陷。当产品体验的定义权不在你手里时,你就失去了主动权。 还有一个问题,那就是这三个模型远远不够。 这三个是垂直场景模型,不是通用大模型。 agent的核心能力是推理、规划、多步骤任务执行,在这个版块里,微软仍然没有对标GPT-5或Claude Opus 4.6的产品。 Copilot在执行能力上所欠缺的,这三个模型是解决不了的。语音转录做得再好,图像生成再快,也不能让Copilot变成一个真正的agent。 Anthropic用18个月从610亿冲到3800亿估值,靠的就是产品迭代速度,人家能在52天的时间里发72个产品,比我写稿速度都快。 给微软52天,它就能端上来这三个模型。 原因在于,微软的组织架构决定了它做不到这个速度。 正所谓“上不碰应用,下不碰数据”。一个健康的组织,不需要CEO亲自PM产品。CEO应该做的是战略决策和资源配置,产品应该由产品经理和工程师团队负责。 当纳德拉需要亲自来推动产品,每周亲自拷问100个高级工程师时,证明微软AI板块的中层管理已经失去了产品判断力和执行力。 三个模型是“态度”,不是“答案”。它们证明微软确实还是有技术能力的。纳德拉也知道,没有基座大模型自研能力,就一定会受制于人,慢人一步。 所以微软在2026年4月官宣了核心AI战略目标:由苏莱曼带队,计划在2027年推出自研的行业前沿级多模态大模型,目标是在文本、图像、音频能力上达到全球顶尖水平,直接对标OpenAI、Anthropic的旗舰模型,实现AI核心技术的自主可控,摆脱对外部模型的依赖。 微软现在是一步都不敢慢下来。 因为每过几个礼拜,Anthropic、OpenAI的产品就会更好一点,用户的期待就会更高一点,微软追赶的难度就会更大一点。 三个垂直模型只是开始,但留给微软的时间不多了。 03 为什么阿里腾讯字节能冲,微软却被困? 你觉得微软这样是因为它得了大公司病吗? 不是“大”的问题,是“老”的问题。 微软49岁,阿里25岁,字节12岁,腾讯26岁。但年龄不是关键,关键是权力结构的僵化程度。 为什么Copilot推出这么长时间还能发现“基本功能不能用”?因为向上汇报的链条太长了。 向上汇报链条长,会让一线问题被过滤、弱化、延迟,这是大公司常见问题。 很多时候不是“没汇报上去”,而是汇报上去了,却在优先级排序里输给了增长、发布节奏、兼容性或更大的客户需求。 阿里之前的林俊旸、腾讯的姚顺雨、月之暗面的杨植麟,年轻人主导研发方向、主导产品。这种生存压力和年轻人独有的认知,让公司仍然保持着“创业公司式决策速度”。 有什么问题直接沟通去和你的最高Leader沟通,BUG当天修复。 年轻人还有一个很重要的优势,他们是AI的重度用户,他们知道用户真正想要什么。他们不会满足于“能聊天的AI”,他们要的是“能做事的agent”。 他们在产品设计时,就会从用户体验出发。他们的内心OS是“这个产品我用起来哪里觉得不爽”,而不是从技术可行性出发。 更重要的是,这群年轻人敢于推翻上一代的决策,不会被“老规矩”的惯性束缚。 贾扬清在2023年3月正式官宣从阿里离职,结果2023年4月阿里的通义千问大模型就放了出来,前后间隔不到一个月。 微软的组织架构围绕“大客户关系”和“许可证销售”优化。产品好坏由销售团队的话术决定,而非用户体验。 不只是如此,比起做更好的产品,微软的销售团队更愿意找到为烂产品付钱的客户,所以Copilot的E7套餐才敢卖到99美元/月。 字节的豆包之所以能快速迭代,因为它直接面向C端用户,每个功能的数据反馈是实时的。产品经理能看到用户的每一次点击、每一次放弃、每一次投诉。 这种“产品-数据-迭代”的闭环,让豆包能够快速调整方向,淘汰不好用的功能,强化用户喜欢的功能。 如果一个功能上线后使用率很低,下个版本就会被砍掉。如果大家都需要某一个功能,下个版本就会加进来。这种快速试错的机制,让产品能够快速进化。 微软在企业软件模式下很难建立这种闭环,因为它的客户是企业的CIO,不是最终用户。CIO关心的是合同条款和价格,并非产品体验。 微软没有这种“产品-数据-迭代”的闭环。它的反馈链条是最终用户→IT部门→CIO→微软销售→产品团队。等反馈到达产品团队时,可能已经过了几个月,问题早就积重难返。 微软的晋升体系奖励“管理大团队”而非“做出好产品”,导致技术人才要么离开,要么被边缘化。 在微软,一个工程师想要晋升到高级别,虽然也有技术专家(IC)这条路,但是最快的路径是成为管理者,管理越来越大的团队。做出一个改变世界的产品,不如管理1000个人的团队更容易升职。 这种激励机制导致管理岗位越来越多,产品创新越来越少。 前文提到的Copilot现在的主管雅各布就是如此,他是研究产品设计的,专注消费级产品。即便关注AI赛道,核心视角也是产品落地与商业价值,而非AI算法、大模型训练等底层研究工作。 相反,阿里、腾讯、字节在AI上的领导者,都是技术背景的高管直接负责AI产品。他们能看懂代码,能判断技术路线,能在周会上直接拍板“这个方案不行”。 这种决策效率是微软欠缺的。在微软,一个技术决策可能需要经过多层审批,等决策下来时,市场已经变了。 微软的做法是All In一款产品。Cortana失败以后就换Copilot,Copilot再失败就再换别的。这种“押注式创新”风险很高,因为一旦失败,整个公司的AI战略就要推倒重来。 微软的这种模式会导致团队倾向于保守,不敢做激进的创新。 阿里内部曾同时有多个大模型项目在跑,最后通义千问胜出。字节的豆包也是内部竞争的产物。腾讯更狠,QClaw和WorkBuddy这两个功能有重叠的产品更是同期发布。 这种赛马机制更容易竞争出真正的好产品,因为它允许试错,允许多个方案并行,最后让市场和用户决定谁活下来。 失败的项目不会影响整个公司的战略,成功的项目会获得更多资源。 微软还缺少一些生存压力。即使Copilot失败,微软还有Azure、Office、Windows的现金流。股价跌30%很痛,但不致命。 这种“有退路”的状态让微软缺乏紧迫感。 抖音的核心竞争力是算法,能够精准推荐用户喜欢的内容。字节如果慢了,抖音的推荐算法优势会消失,变成垃圾短视频分发平台。 腾讯如果不跟进,微信的入口价值会贬值。微信是中国互联网的超级入口,但如果微信不能提供OpenClaw的连接服务,用户会使用飞书。这个过程是不可逆的。 中国互联网的竞争环境很残酷,慢一步就可能被淘汰,这种压力让大公司保持了“准战时状态”。 当一个公司大到“即使犯错也不会死”时,它就失去了快速纠错的动力。员工知道,即使产品失败,公司也不会倒闭,自己也不会失业,那为什么要冒险创新?为什么要加班加点?为什么要挑战上司的决策? 中国大厂能在agent上冲到前列,不是因为它们“小”或“灵活”,而是因为它们仍然活在“一个决策失误可能致命”的竞争环境中。 压力是最强大的武器,它让公司保持警惕,让员工保持斗志,让决策保持高效。 纳德拉能否第二次拯救微软?答案可能在于他能否让一个市值3万亿美元的巨头,重新找回“背水一战”的感觉。 三个新模型是开始,但远不是答案。
马斯克要用AI挑战英雄联盟最强战队 Faker回应已准备好
快科技4月7日消息,去年11月25日,世界首富马斯克在X平台发布重磅挑战:计划2026年让其xAI公司开发的最新AI模型Grok 5与《英雄联盟》顶级职业战队展开五局三胜制对抗赛。 这场“人机大战”设定严格公平条件:AI需通过纯视觉方式“观看”屏幕(禁止直接读取游戏数据),反应速度不得超过人类极限,以模拟真实职业选手的操作环境。 马斯克明确将目标锁定为全球最强战队 ——拥有6次全球总决赛冠军的T1,这场对决被视为继AlphaGo挑战围棋后,AI在竞技领域的又一次里程碑式尝试。 近日,在韩国综艺节目《孙石熙的提问》中,T1队长Faker(李相赫)与围棋传奇李世石(曾对抗AlphaGo)共同探讨AI挑战话题,并给出最新回应准备应战:“我们已经准备好了,你们呢?” Faker对自己和队友信心满满,他称游戏是以3D形式实现的非常复杂的结构,认为Grok 5可能还没有完全准备好,并强调人类直觉是AI无法追赶的关键,职业选手的临场决策与团队配合具备不可复制性。 然而曾被AI阿法狗打得“道心破碎”的围棋天才李世石则表达了担忧,他深知AI的强悍之处,不太看好Faker击败AI:如果不给Grok 5设定一定的限制条件,李相赫恐怕也不容易取胜。 他随后还找补了一下:但围棋和游戏是完全不同的,所以我认为还是有胜算的,加油!
亚马逊再裁1.4万人:裁员名单完全随机 中国区团队或遭整体裁撤
快科技4月7日消息,据报道,亚马逊计划在2026年5月启动新一轮全球裁员,预计约1.4万名员工将受到影响。 此次裁员覆盖AWS云服务、零售、人力资源等多个核心业务板块,中国区部分团队甚至可能被整体裁撤。 此次裁员最有争议的是裁员名单并非依据业绩、项目等客观标准确定,而是由管理层随机点名生成,被裁员工几乎没有申诉渠道,这种“抽签式裁员”让不少员工感到不安。 据悉,本次裁员主要针对白领及中层管理人员,职级集中在L5至L7,仓储物流等一线蓝领岗位暂时不在调整范围内。 知情人士透露,被裁员工大概率可获得“N+6”的经济补偿,公司还设置了60天的冷静期,方便员工申请内部转岗或做好离职准备。 此次大规模裁员并非偶然,而是多重因素共同作用的结果。 疫情期间亚马逊快速扩张,导致组织臃肿、管理成本攀升,叠加AI技术逐步替代部分流程化岗位,以及全球科技行业普遍面临的成本压力。 公司希望通过精简人员、削减低效岗位,加速向AI战略转型,提升整体运营效率。 此外,裁员过程存在明显不合理现象,部分管理者为优先保留核心技术研发人员,随意扩大非技术岗位裁员规模,导致不少无辜员工成为“替岗者”,进一步加剧了员工的焦虑情绪。 截至目前,亚马逊官方尚未就此次裁员发布正式公告,相关细节仍有待官方。
00后AI天才,广东制造
就在刚刚过去的3月,AI圈被一群00后刷屏了。 当埃隆·马斯克在社交平台敲下“令人印象深刻”几个字时,全球AI圈的目光第一次聚焦到一名17岁的深圳高中生陈广宇身上。 37位署名作者中,陈广宇以月之暗面Kimi团队实习生的身份,成为论文《Attention Residuals》的共同第一作者。与他并列的,是大模型圈赫赫有名的苏剑林——RoPE位置编码的提出者。 论文出圈后,苏剑林在其博文《Attention Residuals 回忆录》中提到,陈广宇与另一作者张宇共同提出了论文中的“Block(XYZ) AttnRes”(分块注意力残差)设计,不仅将训练效率提升25%,还大大缩减了成本。 论文爆火后,外界迅速把目光投向了这名只有17岁的天才少年。 但事实上,就在月之暗面发布报告的前两天,一则融资消息也让创投圈沸腾。25岁的洪乐潼创立的AI公司Axiom,刚刚完成2亿美元A轮融资,投后估值高达16亿美元(约合人民币110亿元)。此时,距离公司成立仅过去一年有余,估值翻超5倍。 而在更早的3月10日,成立仅一年多的公司灵初智能宣布完成天使轮及Pre-A轮共计20亿元融资。其联合创始人陈源培,出生于2001年,曾就读于北京大学、斯坦福大学,师从李飞飞。 有意思的是,这些00后AI新秀竟都是广东人。如果说这只是一种巧合,那越来越多00后选择在广东AI创业,则是另一条有迹可循的轨迹。 2002年出生的OPC极客谢伟铎,把公司设在了深圳,成立半年就把AI语音大模型做到了全球第一,并拥有100多万注册用户以及一批付费用户。就在几天前,他在接受媒体采访时透露,公司天使轮估值达到2亿元。 2000年出生的闵宇恒,在清华AI&Robot实验室孵化出零次方机器人后,把公司总部设在了深圳南山,成立半年融资三轮,总额过亿。 同为2000年的张宇诺,从康奈尔大学辍学后,没有选择硅谷,没有留在纽约,而是直奔深圳南山。他创立的宇灵无限(Skyris),打造了全球第一款能飞起来的AI陪伴硬件,获小红书投资。 当一众AI投资人还在四处狩猎,争抢“投早、投小”的标的时,一群出生于千禧年之后的年轻人正从广东出发,以惊人的速度刷新着AI领域的版图。 A 如果仅仅用“天才少年”来定义这群年轻人,多少有些单薄。拨开光环,会发现他们都有一条共同的成长轨迹——都是从各种高强度的“竞赛”中淬炼出来的,且大都是半路出家,自学成才。 和大多数00后一样,陈广宇对这个世界充满了好奇心。中学时就曾用家长身份注册 Shopify 店铺做电商,还组织过青少年开源社区,开发过 Crypto 机器人,甚至还一度梦想成为职业滑雪运动员。 他还曾参加过美国计算机奥林匹克竞赛铂金组——这是全球顶尖中学生程序员的竞技场。此时的陈广宇已然是一个编程高手。 转折点发生在2025年2月,北京一场中学生黑客松上,他带着“人类第三只机械辅助手”ThirdArm的构想站上演示台。 正是在这场竞赛中,他结识了前YC中国、奇绩创坛创始团队成员董科含,并入选了对方发起的全球 15–17 岁高潜力未来领袖计划,董科含建议他把注意力放到更前沿的技术上。 陈广宇听了进去,用AI辅助大量研读经典论文、跟踪GitHub开源项目。 很快,他在社交平台的技术分享,引起了一家硅谷AI初创公司CEO的关注,并拿到了公司录用通知。 2025年夏天,他坐上飞往硅谷的航班,在一家与OpenAI、Anthropic有深度关联的初创公司实习了7周。 回国后,陈广宇于2025年11月加入月之暗面Kimi团队。在Kimi内部,他又拿下了48小时“黑客马拉松”比赛的冠军,这个成绩让他从实习生中进一步突围,进入了月之暗面研究团队的核心圈。 竞赛,不仅是陈广宇的阶梯,也是洪乐潼的成人礼。 在广州天河区一个普通务工家庭长大的她,很早就展露出数学天赋,是全国中学生数学奥赛广东选区仅有的四位女生之一。14岁的她在草稿纸的边缘写下“MIT”三个字母,自我激励。 2018年,17岁的洪乐潼被麻省理工学院录取,三年修完数学和物理双学位,发表了9篇学术论文,并拿下全美女性数学家的最高荣誉——Alice T. Schafer数学奖,并在2021年成为中国仅有的四位罗德学者之一,前往牛津大学继续攻读神经科学课程。 在此期间,她在伦敦大学学院盖茨比计算单位作为第一作者开展深度学习研究,正式踏入AI领域。之后,她又在斯坦福大学开启数学与法律双学科博士项目的研究。 就在所有人都以为她会沿着学术金字塔一路攀爬时,2025年,她选择从斯坦福退学,创办了Axiom,一家试图用数学证明让AI变得“可靠”的公司。 2024年深秋,斯坦福附近的一家咖啡馆里,洪乐潼与当时Meta AI研究总监Shubho Sengupta聊了整整几个小时,核心议题只有一个:AI能不能真正学会数学推理? 正是这场谈话改变了她的人生轨迹。她瞄准了AI行业的致命缺陷:模型能力越来越强,但可靠性问题始终悬而未决,提出了“可验证人工智能”(Verified AI)的概念,并开发了一套系统,让AI的每一步推理都可以被数学验证,而非依靠概率猜测答案。 2025年12月,在被称为“本科生数学奥林匹克”的普特南竞赛中,Axiom系统12道题全部答对。要知道,在过去近100年的历史中,仅有5个人类选手做到过这一点。 同样跨界而来的还有广东00后陈培源,本科是华南理工大学的土木工程专业的他,却每天在教室后排自学机器人算法。凭借 RoboMaster 全国冠军的履历,他一路闯入北大杨耀东团队,又成为斯坦福 “AI 教母” 李飞飞的访问学者。 在斯坦福,他提出了Psi-CO模型,在全球首次实现利用强化学习在真实世界同时控制双臂、双手进行多技能操作。这个成果让他入选了2025年福布斯《亚洲30岁以下青年领袖榜》。 2024年,华为“天才少年”的offer摆在他面前,但他拒绝了,转头和20年产业经验的老兵王启斌联合创立了灵初智能。 就在上个月,灵初智能宣布完成总额约20亿元的天使轮及Pre-A轮融资,估值一年暴涨7倍。 竞赛淬炼了他们的技术锋芒,自学赋予了他们破界的勇气,当天赋与时代风口相遇,这群广东 00 后很快便从技术新秀,成长为搅动 AI 创投圈的新生力量。 B 当本土天才在广东的土地上破土而出时,另一群来自五湖四海的00后极客,也像感知到温暖的候鸟,精准地降落在了珠江畔。 谢伟铎一开始并没打算创业。几年前,当他为了给自己“手搓”的AI虚拟主播“木几萌”寻找一个完美的声音时,找遍了市面上的所有方案,最后只能无奈地自己动手。 这个“自己做”的决定,最终演变成了广州烁谷科技,以及那个在HuggingFace全球语音合成榜单上,力压ElevenLabs等国际独角兽、霸榜三个多月的“悟声VOCU”大模型。 这家公司的“摇篮”则是位于广州的琶洲模方大模型创业基地,这里流传着“拎脑入住”的说法,创业者不必带着资金和资源,只需要带着聪明的头脑和对技术的直觉。 “场地完全免租,给了我们独立办公室,算力、数据方面也提供了很多免费资源,帮我们节省了大量前期成本。”谢伟铎解释了选择广州创业的原因。 广东提供的不仅是“省钱”的土壤,还有“被看见”的舞台。 闵宇恒、程颐、李宜哲,是清华大学深圳国际研究生院的在读生,于去年1月成立了零次方机器人。短短半年内完成三轮融资,成为创投圈现象级项目。 他们同样把公司总部设在了深圳南山,宽松友好的融资环境,成了吸引这群候鸟极客南下的引力。 “00后登场了。”在“X-Day”西丽湖路演社活动现场,当李宜哲介绍团队成员时,场下投资人忍不住发出感慨,而“西丽湖路演社”正是深圳南山区打造的常态化科技投融资对接平台。 做出同样选择的还有24岁的年轻人张宇诺。 2025年,张宇诺从康奈尔大学辍学。他没有去硅谷,没有留在纽约,而是直接飞到了深圳南山,创立了宇灵无限,做起了陪伴机器人。这款名为BOOBOO的仿生飞行机器人,也是全球第一款能飞起来的AI陪伴硬件。这个听起来有点“玩具感”的产品,却拿到了小红书和厚雪资本的投资。 “国内做AI机器人与消费级大模型,深圳的供应链、人才、资本效率最高,没有第二个城市更适合。”张宇诺在接受采访时这样解释自己的选择。 本土天才竞相破土,外来极客争相奔赴,一内一外两股青年力量在广东汇聚,共同勾勒出中国AI领域最鲜活的年轻版图。 C 天才的破土,离不开适宜的土壤。 如果把地图摊开,会发现一个有趣的现象:大疆从深圳车公庙一间不足20平方米的小仓库起步,最终成了“无人机之都”的代名词;阿里在杭州湖畔花园的一间公寓里诞生,最终成为数字经济的一极;拥有传统汽车工业家底的武汉,在智能网联汽车的下半场悄悄跑到了前面。 把时间轴往回拉,这种“地域影响产业”的法则,在移动互联网时代就已经写好了注脚。 2006年,汪滔还只是香港科技大学的一名研究生。在导师李泽湘的指导下,他开始研究无人机飞控系统。那一年,他拿着父母资助的20万元,在深圳车公庙租下一间不足20平方米的仓库,和两位同学一起创立了大疆。 彼时,深圳已经拥有了全国最完善的电子产业链——从华强北的元器件市场,到遍布关外的代工厂,一个想法从图纸到样机,在这里只需要几天时间。这种“深圳速度”,让大疆的无人机研发如鱼得水。十几年后,大疆在全球民用无人机市场占据超过80%的份额。 这种“地域影响产业”的法则,在如今的AI圈同样适用。为何偏偏是广东,能同时孕育并吸引如此多00后AI天才? 供应链的沉淀固然重要,但比硬件更重要的,或许是允许不同物种共生,更允许“超级个体”野蛮生长,并且为这种生长搭建了“基础设施”。 去年底,广州海珠区明确提出培育“超级个体”,近期将发布OPC创新发展十条,从空间孵化、算力补贴、算法备案、场景开放到金融支撑,十个维度全链条覆盖。 其中,工位费最长12个月全免,购买算力补贴50%,引领性场景项目最高支持500万元。 这些政策细化到了“日均token消耗量”,显然更懂AI创业者的节奏。 除此之外,广东全省推行“算力券”“训力券”“模型券”三券齐发政策,直击AI创业算力成本高、优质模型稀缺的核心痛点;同时举办“众创杯”等各类人工智能创新创业大赛,设立专项赛道,为年轻人才提供展示才华、对接资源的舞台。 不难看出,广东批量生产00后AI天才的图谱,便不再是一个令人惊奇的巧合,而是一个创新生态成熟运转的必然结果。 这些00后正从这里出发,重塑AI的未来版图。
最强AI编程Claude降智 AMD高管吐槽其变得又懒又笨
快科技4月7日消息,作为公认的最强AI编程工具,Anthropic公司靠着Claude系列做到了年化300亿美元的收入,已经超越OpenAI,很多开发者写代码都离不开Claude了。 然而最近的一系列风波之后,Claude的风评也在变差,主要原因倒不是最近的源码泄露,而是Claude大模型升级之后变笨了,俗称降智。 不仅大量开发者在Github上吐槽,AMD的AI业务主管Stella Laurenzo也同样在抱怨,指出2月份升级之后,Claude Code写代码就一直敷衍了事,无法被信任搞定复杂的工程代码了。 Stella Laurenzo表示这不是她一个人遇到的问题,整个工作组的人员都经历了类似的情况,她还给出了具体的统计结果,分析了她和团队发起的6852次Claude代码对话,其中包括234760次工具调用和17871个思维链,表征懒惰情况的思维过早中断、寻求许可等类似违规数量都在大幅增长,3月8日之前是0,现在是每天平均10次。 Claude Code在修改代码之前的阅读次数也大幅下降,从之前的6.6次读取减少到了2次,还会开始重写整个文件,编辑代码的频率也大幅提升。 Github上网友的反馈也是差不多,Claude Code的思维链较浅时,大模型就会默认采取最低成本的操作,不读代码就编辑,不完成就停止了,逃避失败责任,采用最简单的修复而非正确方案。 Laurenzo表态希望Anthropic能公开说明他们是减少还是限制了思维链的Token,导致了Claude Code开始产生垃圾,还要求该公司增加一个最高层级的思维链,以供复杂的工程使用。 在问题没解决之前,Laurenzo表示AMD已经更换了订阅商,质量更高,但她没有说明具体是哪家的——如果说质量,目前能跟Claude一较高下的也就是OpenAI的Codex,但Codex能不能比Claude大模型质量还高,这个还真不好说。
小米罗福莉谈Token价格战:建议LLM公司不要盲目压低价格,会导致恶性循环
IT之家 4 月 7 日消息,小米集团 MiMo 负责人罗福莉昨天在 X 平台发文,谈及最近 AI 业界火热的 Token(IT之家注:词元)价格战。 图源:罗福莉本人社媒账号 罗福莉表示,Anthropic 几天前切断了 Claude 第三方工具订阅通道;并且 MiMo 也在几天前推出了 Token Plan,于是她有感而发: 1、Claude Code 的订阅机制在计算资源分配上设计得非常漂亮。但我认为它并不赚钱甚至可能亏损,除非 API 利润率高出 10 到 20 倍。 我无法精确计算第三方框架接入后带来的损失,但我仔细研究 OpenClaw 的上下文管理后发现它很糟糕。例如在一次用户请求中,OpenClaw 会触发多轮低价值的工具调用,每一次都是独立的 API 请求,而且都携带超长上下文(通常超过 10 万 tokens)。 即便有缓存命中,这种方式仍然非常浪费;在极端情况下,还会提高其他请求的缓存未命中率。 这就导致每个用户实际触发的 API 调用次数往往是 Claude Code 原生框架的数倍。换算成 API 成本很可能是订阅价格的几十倍。这已经不是“差距”,而是“巨大鸿沟”。 2、OpenClaw、OpenCode 等第三方框架仍然可以通过 API 调用 Claude,只不过不能再“搭便车”使用订阅额度。 短期来看,这些智能体的用户会感受到成本压力,费用可能轻松上涨几十倍。但这种压力会迫使上述框架优化上下文管理、提高提示词缓存命中率,减少 Token 浪费。 这种痛苦最终会转化为工程上的自律。 3、我建议各大 LLM 公司,在搞清楚如何设计一个不亏钱的编程订阅方案之前,不要盲目去打价格战。 把 Token 价格压得很低、同时完全开放第三方框架看起来对用户很友好,但这其实就陷入了 Anthropic 刚走出的陷阱。 并且更深层的问题在于,如果用户把注意力消耗在低质量 Agent 框架上,那么面对不稳定且缓慢的推理服务时,就只能使用降级过的节省成本大模型,结果仍然无法完成任务。这对于用户体验、留存来说无异于恶性循环。 4、关于 MiMo 的 Token Plan 计划:它支持第三方工具,按 Token 计费,与 Claude 新推出的额外使用套餐逻辑相同。我们的目标是长期稳定地提供高品质服务,而不是让您冲动消费后弃坑。 从宏观角度看,全球计算资源增长的脚步已跟不上 Agent 带来的 Token 需求增长。真正的出路不是提供更便宜的 Token,而是让“更高效的 Agent 框架” × “更强大且更高效的模型”协同演进。 Anthropic 的这次举措无论是否出于本意,都在推动开源、闭源生态发展,这或许是一件好事。 Agent 时代不属于消耗最多算力的人,而属于最懂得如何高效利用算力的人。
离职员工“被做成AI数字人继续工作”引热议,公司回应称已征得本人同意训练
IT之家 4 月 7 日消息,据“大河报”报道,近期山东一家游戏传媒公司尝试将离职员工训练成 AI 数字人继续工作,可实现咨询、邀约、制作 PPT 和表格等简易工作,引发网络热议,有用户调侃“人虽然离职了,却化为 AI 数字人,永远地为公司服务”。 IT之家参考网传视频获悉,该数字员工在对话框中自我介绍:“您好,我是已离职员工 XX 的数字分身,你可以随时向我提问,我会根据我在职期间的文档回复你”。 网传视频截图 对此,相应公司员工“小宇”回应称,当事同事离职前曾任“人事专员”一职,公司相应行为旨在“探索将基础简单工作交由 AI 完成”,训练本身已征得离职员工本人同意,投喂 AI 的资料也都是本人所上传。 对此,律师指出,如公司未经同意使用离职员工数据训练 AI,则涉嫌违法,离职员工的聊天记录、工作邮件、个人工作习惯等属于《个人信息保护法》界定的个人信息,其中私密沟通内容还可能构成敏感个人信息。 同时,《生成式 AI 服务管理暂行办法》也明确规定,训练数据涉及个人信息的,必须取得个人同意。若未经许可将员工的代码、文档、方案用于 AI 训练,涉嫌侵犯其隐私权及个人信息权益。情节严重的,可能构成侵犯公民个人信息罪,面临三年以下有期徒刑或拘役;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。
美国AI数据中心建设遭遇“电力危机”:一半项目延期,变压器等5年
据彭博社近日报道称,尽管2026年Alphabet、亚马逊、Meta和微软等科技巨头都要投入超过6,500亿美元扩展人工智能(AI),但关键电气元件可用性成为主要障碍,近50%将因电力基础设施短缺和供应链问题受影响。 根据市场情报公司Sightline Climate数据,今年美国将新增约12吉瓦(GW)数据中心,但目前只约三分之一积极建设。 电力基础设施成本虽然不到数据中心总成本10%,但重要性却不容小觑。任何电力链延迟都可能导致整个计划停滞,变压器、开关设备等关键设备更不可或缺。 由于需求激增,美国高功率变压器交货时间大幅延长,从2020年前24~30个月,现在可能需要长达五年。这对AI数据中心是场大灾难,因部署周期通常18个月内。为了解决短缺问题,企业开始转向全球市场,加拿大、墨西哥和韩国成为AI数据中心高功率变压器的主要供应商。 然而,中国进口零件仍占美国功率器件进口40%以上,且某些变压器和开关设备仍近30%。即使有关税和安全问题挡路,美国电气设备产能仍不足,AI公司进口依赖中国短期无法停止。美中紧张关系可能扰乱供应链,增加成本并延后先进AI数据中心部署。 CBRE报告,2025年初以来,约50%计划数据中心已延期或取消,与电力基础设施短缺和供应链问题密切相关。 数据中心电力需求从2022年2%上升到现在4%~-5%,到2030年更达9%。需求激增使美国电网面临巨大压力,许多新申请等待时间超过五年。 因为,AI数据中心建设面临前所未有挑战,将来发展取决于电力基础设施可用性,而不只是资本或计算硬件限制。
Claude封杀龙虾?小米罗福莉站队了
(文/万肇生 编辑/张广凯) 最近几个月,龙虾(OpenClaw)的爆火有目共睹,但在刚刚过去的清明假期间,有一部分龙虾用户破大防了。 全球AI巨头Anthropic已宣布,自4月5日起,旗下大模型Claude(克劳德)的订阅服务,将不再覆盖包括龙虾在内的第三方集成工具。用户如想继续使用该模型,只能通过与订阅服务分开计费的按需付费方案,并需要为此支付额外费用。 Claude就是美国帕兰蒂尔公司“梅文智能系统”战场情报平台中,所嵌入的那个大模型。有报道称,Claude通过分析来自卫星、监控系统及其他情报渠道的机密数据,为美以在伊朗的军事行动提供实时目标锁定与优先级排序,一时间神话了该模型并让其破圈。 但是,Claude封杀龙虾的消息一出,社交平台哀鸿遍野。此举意味着成千上万决定坚持调用这款具有强劲编程能力模型的龙虾用户,都将被迫转入极其昂贵的“按量计费”模式,直面天价的算力账单。对此,Claude Code负责人切尔尼(Boris Cherny)在社交平台X发文解释称,公司的订阅服务并非针对这类第三方工具的使用模式而设计,在订阅服务封禁第三方工具是为了平衡服务器资源,以便更好更可持续地服务用户。 对于官方的解释,用户们似乎并不买账,舆论很快从技术层面转向商业竞争,各种阴谋论、商战剧本甚嚣尘上,其中最引人注目的当属“龙虾之父被挖角”的说法。 封杀令落地:龙虾用户“破防” “龙虾之父”指的是开发者斯坦伯格(Peter Steinberger)。他最早基于Claude开发了名为“ClawdBot”的工具,这名字明摆着致敬Claude,后来在Anthropic的要求下才更名为“龙虾”(OpenClaw)。因此,斯坦伯格本人显然也对Claude的生态系统了如指掌。但就在不久前,斯坦伯格被Anthropic的劲敌OpenAI挖走。这一时间点与此次封禁事件如此接近,很难不让人浮想联翩。 当地时间2月14日,斯坦伯格(中戴帽者)发文称自己即将加入OpenAI斯坦伯格个人账号 另一方面,就在两周前,Anthropic还刚刚宣布为Claude引入“Computer Use”能力。在Claude Cowork和Claude Code中,用户可以直接让Claude操作用户的Mac电脑,实现与“龙虾”相似的功能。 如果将这两件事串联起来,一个典型的商战逻辑便浮出水面。既然竞争对手挖走了我的核心生态开发者,那我就用官方功能直接替代你的第三方工具,再切断你的订阅通道,让你要么用我的官方方案,要么付出高昂代价。这样的剧本听起来合情合理,甚至有些“痛快”。 然而,在小米MiMo大模型负责人、“95后天才少女”罗福莉看来,事情远非简单的商业报复,而是行业普遍的算力浪费顽疾。 4月7日,罗福莉在个人社交账号上发布了一篇长文,对此次事件进行了系统性的剖析。她表示,小米的Mimo近期推出的“Token计划”在计算资源分配方面,再结合Anthropic切断第三方工具使用Claude订阅通道的事情,自己得出了几点看法。 罗福莉拆解的算力账 首先,罗福莉认为,Claude Code的订阅模式是一个设计精美的系统,用于平衡计算资源分配,但可能不赚钱甚至在亏钱,除非Claude的API利润率能达到10到20倍。然而,她经研究发现,龙虾的上下文管理非常糟糕,在单个用户查询中,它会以独立的API请求形式发起多轮低价值工具调用,每一轮都携带很长的上下文窗口(通常超过10万个词元),即使有缓存命中也很浪费。 其次,许多第三方工具在接近大模型一次能处理的上下文限制时,每三步就对工具返回的原始数据进行一次压缩,来防止大模型无法继续任务。但这样做的话,因为缓存内容出现了变化,每次都需要重新计算,缓存命中率自然极低,直接导致计算成本和延迟大幅上升。 这些原因加在一起导致了每个查询的实际请求次数,最终比Claude Code自身的框架高出好几倍。若换算成API定价,实际成本可能是订阅价格的数十倍,“这已经不是简单的差距了,这是鸿沟。”相当于Anthropic在为每一位使用订阅的龙虾用户倒贴钱,龙虾越火爆,那Anthropic亏的就越多。 “短期内,这批龙虾用户可能会感到痛苦,成本轻易飙升数十倍,“罗福莉表示,“但这种压力恰恰会推动这些工具改进上下文管理,最大化提示缓存命中率以复用已处理的上下文,减少浪费的算力消耗。痛苦最终转化为工程规范。” 罗福莉提醒,大模型公司在找到如何设计一个不亏钱的编码方案定价之前,最好不要盲目地打价格战。如果大模型厂商以极低的价格出售算力,同时对第三方工具敞开大门,这对用户来说看似美好,但这是一个陷阱,也正是Anthropic刚刚走出的那个陷阱。当用户把注意力消耗在那些低质量的智能体工具、极不稳定且缓慢的推理服务、以及为了降成本而阉割的模型上,最终结果会发现,仍然什么都做不成。这无论是对用户体验,还是用户的留存来说,都不可持续。 而由于目前全球计算能力,都跟不上智能体所产生的算力需求。因此罗福莉认为,真正的出路不是更便宜的算力,而是协同进化。比如更高效的智能体工具搭配更高效的模型。Anthropic的这一举动,无论是否有意,都在推动整个行业生态系统朝着这个方向前进。“这可能是件好事。智能体时代不属于谁消耗的计算最多,它属于谁用得最明智。” 算力焦虑的终结是效率革命 罗福莉对Anthropic封禁“龙虾”事件的分析,实际上戳中了当前AI行业最深层的算力浪费问题,让人想起2025年初那个震动全球AI行业的“DeepSeek时刻”。 当时,“算力焦虑”推动英伟达股价水涨船高,但DeepSeek-R1横空出世,增量训练成本仅29.4万美元,即便计入约600万美元的基础模型开发费用,整体开销仍远低于行业普遍水平,可它的性能在多项评测中与OpenAI耗资数亿美元打造的模型不相上下。 3月27日,罗福莉在中关村论坛年会圆桌论坛环节分享龙虾的核心价值点。 曾参与过DeepSeek开发的罗福莉,深刻明白结构创新下的效率意义。DeepSeek靠的不是市场鼓吹的GPU集群暴力堆砌,而是从稀疏注意力的工程实现,到在有限算力下把性价比发挥到极致,实现了算法创新与工程优化的合力。就如同罗福莉本人曾在中关村论坛上说过的那样,中国大模型团队的优势,是在低端算力限制下,通过模型结构创新去追求最高效率。 但随着人工智能在各行各业的普及,技术层面瓶颈导致了算力的巨大浪费问题,“算力焦虑”再次卷土重来,并严重推高了内存价格。市场默认的“算力=性能”的粗暴等式,本质其实都是稀缺性幻觉。但算力芯片巨大的内存需求,直接导致多家手机厂商纷纷官宣涨价、消费级显卡延期,最终一圈下来,影响的还是普通消费者。 退一万步说,DeepSeek去年已经给出了可行性,而今年“龙虾”们的涅槃重生,也必将从效率优化开始。
DeepSeek V4又又灰度测试:全新界面、多模态重大升级没跑了
快科技4月7日消息,在众多大模型中DeepSeek V4可以说让大家望穿秋水,目前的预期是本月发布,前几天的几次系统崩溃更让人相信会有升级,今晚又被人发现新的灰度测试。 微博上的程序员大佬@蚁工厂刚刚展示了DeepSeek的一个新界面,目前大部分人还没灰度测试到,这个界面有三个选项——快速、专家及视觉。 核对了一下,目前DeepSeek官网及APP上的界面如下,只有深度思考和智能搜索两个选择。 这么对比的话,DeepSeek未来的新模型可能会有三款,分别是快速版、深度版及多模态版,视觉功能的加入意味着此前传闻的DeepSeek支持多模态已经是板上钉钉了,补上了关键一环。 至于具体的名字,或许就是DeepSeek V4 Lite、DeepSeek V4及DeepSeek V4 Vision版,此前的报道中也提到DeepSeek正在开发的大模型不止是V4一款,至少还有2款大模型,也是用了国产AI芯片。 从2月份发布新模型的测试以来,DeepSeek虽然每次都没有提及具体的升级,但DeepSeek V4应该是箭在弦上,发布时间应该不远了。 当然,一切还要等DeepSeek官方最终发布,如果说期待值的话,除了上面的三款大模型,还希望DeepSeek能出一个面向AI编程的特别版DeepSeek V4,好好杀一下Anthropic的锐气,去年的DeepSeek R1让NVIDIA市值一度暴跌,现在该轮到Anthropic或者OpenAI市值暴跌了。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。