行业分类:
加载中...
头条分类:
加载中...
一口气关店7家 宜家跌下神坛
凤凰网科技 出品 作者|尚志芳 编辑|董雨晴 两天前,宜家中国突然宣布关闭7家门店,决定自今年2月2日起停止运营包括上海宝山商场、广州番禺商场、天津中北商场在内的七家线下门店。 这是宜家进入中国27年来最大规模的门店调整。 这一决定让很多消费者感到意外,引发了广泛讨论。有消费者表示遗憾和惋惜:"以后周末少了一个遛娃的好去处",也有消费者表示理解:"现在网购这么方便,去宜家确实比以前少了"。 “此次调整并非相关门店 ‘无法继续经营’,而是宜家以优化成本、提升效率、重新配置资源为核心所做出的主动转型”,宜家中国相关负责人回应。确实,在宣布关店的同一天,宜家表示未来两年将在北京、深圳等重点城市开设超10家小型门店。 门店"收缩"的同时,宜家的重心开始向小型门店偏移。 01 宜家为啥卖不动了? 1998年,宜家在上海徐汇开设了中国首家门店,彼时的宜家,以其独特的北欧设计、一站式购物体验,迅速俘获了中国消费者的心。 从2021年起,宜家的扩张步伐开始放缓。2022年关闭了贵阳店,这是其进入中国24年来首次关闭省会城市门店。此次一次性关闭7家门店,宜家在华线下触点总数将从41个减至34个,涉及哈尔滨、宁波、南通等多个城市。 收缩的背后,是不断承压的业绩。 数据显示,宜家中国销售额已从2019年的157.7亿元峰值,降至2024年的111.5亿元,降幅近三成。 27年前,宜家在上海开设了中国首家门店,27年后,宜家一口气关闭七家门店,中国的市场环境经历了什么变化? 伴随线上零售,本土家居品牌正以惊人的速度崛起,宜家在设计、价格等方面的优势正在被削弱。 2024年双11,天猫住宅家具品牌销售榜前三名均为本土品牌,源氏木语、林氏家居、喜临门等,而宜家仅排第七。 源氏木语把原本“高不可攀”的实木打成国民入门款,一年光床就卖10万张,其全国门店已从2020年不到100家,到现在已开出1300家门店,覆盖范围延伸至全国多数省份。 而另一品牌林氏木业2024年营收达到82亿元,同比增长7.8%,并陆续在多个二、三线城市开设了超大店。 相比较宜家,数字化转型较慢,而本土家居品牌不同于宜家单一的北欧风格,更能满足消费者个性化的需求定制,宜家自然落了下风。 此外,宜家标志性的"蓝盒子"大店模式,面积庞大、选址偏远,也难以适应消费者对便捷性的要求。 但这仅仅是在中国市场,放眼全球,宜家规模依然可观。截至2025年11月,宜家在全球63个市场拥有504家门店,覆盖欧洲、北美、亚洲等多个地区。这种全球布局的优势,还是其他家居品牌难以比拟的。 02 宜家开始变小 虽然竞争激烈,但宜家不愿完全放弃中国市场,正如宜家中国所言,“中国一直是宜家最重要的战略市场之一。”此次调整只是为了让业务更加聚焦和高效。 关大店,开小店,继续加强线上布局,向即使零售发力,正是宜家对中国市场做出的新的战术调整。 这种“小店”模式也并不是宜家第一次尝试。2020年3月、7月,宜家先后在上海杨浦、静安租下8500㎡、3000㎡试水小业态,但均因转化差、租金高而关停。 于本土品牌相比,宜家的线上布局节奏稍显缓慢。宜家一直坚持“郊区门店、现付自提”模式,直到2018年才开始布局官方自营的线上商城。2025年,宜家入驻京东平台,并与京东在7座城市落地即时零售试点。目前,宜家中国的线上业务占比已达到25.7%,相较于五年前的5%有了显著提升。 另一方面,为了应对国产竞争者,宜家也采取过降价策略,以免被大量高性价比产品与品牌淹没。当时,就有人认为宜家开始着急了,想要重回消费者视野。 宜家表示,未来将继续加强线上布局,对现有商场进行投资,并借助中国创新生态系统,与领先的本土伙伴在数字化、自动化及循环经济等领域展开合作。 但关闭大店的举措也有不少人无法理解,认为宜家本身就没有价格优势,线上渠道也没有本土品牌做的牢固,此次再丢失大店的深度体验优势,宜家就完全失去自我了。 下一步,宜家如何破局?"小店+线上"的转型模式能不能真正读懂消费者的个性化需求,能否追赶上时代的变化,还得市场说了算。
闲鱼发布次元年度消费报告:平台用户规模已超1.6亿
凤凰网科技讯 1月10日,闲鱼平台于1月9日正式上线《2025闲鱼次元年度报告》,首次全景呈现平台二次元用户的消费生态。数据显示,截至2025年底,闲鱼二次元、追星与游戏类用户总量已突破1.6亿,年度二次元消费人数同比增长47%。 报告显示,过去一年中,谷圈、明星周边、硬周边、潮玩盲盒、毛绒玩具、娃圈、四坑及卡牌成为平台交易交易最活跃的次元圈层。其中潮玩盲盒类订单量同比增长达250%,增速显著。 在消费行为方面,用户下单高峰多见于工作日下班后及深夜时段,最晚交易记录可至23点。同时,用户也展现出较强的二手流转意愿,人均年度通过转卖二次元商品回款2541元,人均二次元增值收入282 元。 此外,该报告还公布了年度热门IP榜单。在“异军突起IP”中,星星人、哪吒、达菲和朋友们等上榜;而LABUBU、恋与深空、时代少年团、高达、第五人格则位列“最热IP”前五。商品层面,LABUBU-幸运、LABUBU-I FOUND YOU、DIMMO-米妮的气球等成为年度交易热度较高的单品。 报告发布后,部分用户分享年度消费账单,也有人展示通过低价购入再转手实现收益的案例。报告结合用户行为数据,为其生成“深夜挖宝”“神仙出物咪”等标签,并与二次元角色进行关联。目前用户可登录闲鱼平台搜索“次元报告”查看个人年度消费总结。
刚刚,DeepSeek春节发布计划曝光
每逢节假日,DeepSeek 往往发布新品,也几乎成了 AI 圈的「固定节目」。 据 The Information 最新报道,DeepSeek 计划在未来几周内发布新一代 AI 模型 V4,预计发布时间在 2 月中旬(春节)前后,但具体时间仍可能调整。 报道称,根据 DeepSeek 内部基准测试结果,V4 在编程任务上的表现超越了目前市场上的主流模型,包括 Anthropic 的 Claude 和 OpenAI 的 GPT 系列。 知情人士透露,该模型在处理和解析超长编程提示方面取得重大突破,这对开发复杂软件项目的程序员具有重要价值。 此外,V4 在训练过程中对数据模式的理解能力显著提升,且不会随着训练次数增加而出现性能衰退,解决了 AI 模型训练中的常见难题。 其中一位知情人士表示,用户将能明显感受到 V4 的回答更有条理,这说明新版本的推理能力更强,对于处理复杂任务也更可靠。 从近期动向来看,DeepSeek 的技术发布节奏也有所加快。 上周,DeepSeek 发布了一篇由 CEO 梁文峰参与撰写的研究论文,提出名为 mHC (流形约束超连接)的新架构。该研究致力于解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。 此外,DeepSeek 本周也在 arXiv 低调把 R1 论文从 22 页扩充到 86 页(v2 版),一口气公开了训练全流程、超参数、失败尝试和完整评测。 而针对上述 V4 的报道,截至发稿前,DeepSeek 未对此事作出回应。
刷小红书也要花钱了?
作者|商业消费主笔 黄青春 万万没想到,刷小红书要步入“氪金”时代了。 1 月 6 日,小红书内测“笔记付费”新功能的消息不胫而走,市场将此解读为:平台尝试在广告、电商之外,开辟一条创作者变现的新路径。 坦白说,尽管知乎盐选、公众号付费文章等模式已逐渐被用户接受,但小红书以“笔记付费”抢夺创作者注意力、加速商业化的动作,仍让市场颇感意外——原因在于,这一功能可能加剧平台生态的“马太效应”:头部博主凭借影响力拥有更高付费转化率,而用户付费后对内容质量的要求会更严苛,使得中小博主的变现处境越发逼仄。 对此,接近小红书人士向虎嗅表示,“此次笔记付费功能仍处于产品定向内测期,属于常规产品的更新动作,并非战略规划。” 事实上,小红书在“内容-交易”链路的踌躇不前,亟需新的商业路径破局,而“内容-付费”的成熟模式无疑是试水方向之一——长期以来,小红书创作者的变现渠道集中于广告、带货、开店等,而笔记内容始终缺乏一个可参照的定价体系,平台也迫切需要多元变现方式缓解增长焦虑,“笔记付费”正是其商业化布局的重要补充。 不过,这一功能虽能提升商业效率,但流量变现模式可能对平台内容生态造成一定冲击,加之内容质量难以完全把控,用户很容易因“获得感”差异导致口碑分化,进而影响付费业务整体推进节奏。 小红书摸着知乎过河? 早在 2021 年,小红书就曾推出“知识付费”功能(后更名为“专栏”),允许博主通过直播、视频或 1V1 形式分享经验知识,但彼时的专栏更接近知乎“值乎”的形态,存在明显局限性: 一方面,细分领域大 V 的专业知识分享受众较窄,愿意持续付费的用户寥寥,而通识领域大 V 调动情绪能力盖过专业能力,很难持续产出高质量付费内容; 另一方面,电子书、圆桌、Live 讲座这些付费体系重合度越来越高,平台规避的筛选责任都转嫁成用户试错成本,最终这笔投入产出比尴尬的生意在多数大 V 账号趋于停摆。 如今,内测的“笔记付费”门槛更低、形式更轻量化,显然更适配小红书的内容生态。虎嗅了解到,按照平台公示的内测方案,该功能覆盖的内容形态更泛化,主要面向三类创作者加速变现: 第一类是摄影师、画师、壁纸设计师等视觉类创作者,推出“高清原图付费下载”服务—— 用户付费后可获取高清、无水印的原文件,用于收藏或商用。 目前,国内已有视觉中国、东方 IC 等平台布局视觉素材商用,但这些头部平台长期面临版权保护不完善、钓鱼式维权、防搬运机制缺失等争议,如何妥善解决这些问题对小红书而言是不小的考验。 第二类是输出深度干货、行业洞察的长文作者,提供“单篇笔记付费阅读”功能——创作者可针对长文设置免费试读比例,读者支付单笔费用即可解锁全文。 小红书官方客服表示,“长文笔记付费功能目前为平台邀约制,暂未开放给全部用户,后续会逐步扩大邀约范围”;不过,已有多位小红书创作者晒出邀约提示,“笔记付费”内测门槛并不高:粉丝数≥100 人、近 90 天无违规记录,且完成实名认证即可参与。 某种程度上,“笔记付费”更像针对其他平台上线短图文功能的防守反击,但正如微信“小绿书”难以复刻小红书的笔记场景心智,公众号的长图文阅读习惯也难以在短期内被其他产品替代。 这背后深层原因在于,很多产品会卡出生点位(即产品基因),这在过去、现在乃至将来都会深刻影响一款 APP 的命运——B 站之于二次元、知乎之于问答、虎扑之于体育、豆瓣之于影书评,产品强化用户心智之后,整个社区定位被固化。 即便如此,各大平台仍在积极布局长图文生态:2024 年 12 月 16 日,抖音长图文功能正式上线。据虎嗅了解,该功能支持 PC 端发布最多 8000 字、30 张配图的长文,还可搭配背景音乐;手机端发布功能预计近期上线,届时长图文将以类似视频的形式出现在推荐流中(包含背景图、自动滚动的文字以及背景音乐),用户点击“阅读文章”即可进入详情页。 第三类是连载小说、系列专栏创作者,推出“笔记合集付费解锁”服务:创作者可创建小说集、系列教程专栏,开放前几章免费试读,用户一次性付费即可解锁整个系列。 从行业竞争格局来看,小红书似乎并无明显优势——前有番茄小说、七猫等免费阅读平台,后有阅文集团、掌阅科技、知乎等付费平台,但网文付费实则是小红书“笔记付费”的核心方向: 一方面,付费网文是高潜力赛道。 第三方数据显示,2024 年国内付费网文市场营收超 440 亿元。以知乎为例,其陆续在短视频、短信息流、电商、直播等风口徘徊,一直在积极面对社区向平台转型过程带来的阵痛,试图通过改版来平衡社区与平台属性之间的冲突,终于发现付费网文才是最适配的赚钱方式:2025Q3 付费阅读业务最大收入来源地位稳固,贡献 3.86 亿元营收,占比达到 58.5%;其中,知乎曾披露女性用户占比超 80%,18-40 岁用户占比高达 74.58%,这与小红书用户结构高度契合,为小红书的网文付费业务夯实了基础。 另一方面,网文付费是小红书小说阅读板块探索的延续。 2024 年,小红书通过“无声冲击”小程序上线小说阅读板块,收录第三方平台的免费长/短篇作品,涵盖穿越、甜宠等主流题材;2025 年推出“宝藏写手扶持计划”,投入 1 亿流量扶持原创短篇,进一步扩充网文垂类内容。 无独有偶,2025 年 12 月,字节跳动也正式推出付费阅读 APP“红烛小说”,补全了从免费阅读到付费网文的生态闭环。虎嗅了解到,在此之前,字节旗下番茄小说已通过“千字万金”等激励计划加大原创内容扶持,第二期计划不仅提供最高 800-700 元/千字的保底稿酬,还设置 500 万元爆款奖金池,优质作品更可进入短剧改编池获取额外收益。 不难看出,“付费笔记”为创作者开辟了一条新的变现路径,小红书官方表示,希望通过“笔记付费”让创作者无需焦虑变现、无需迎合算法,“当内容足够好,收入自然会到来”。 然而,理想很丰满,现实很骨感:从知乎、B 站到抖音、快手,多家平台均曾试水内容付费,却未形成规模化效应——因此有分析认为:小红书这一动作是商业化焦虑驱动下的业务冒进。 对此,接近小红书人士向虎嗅表示,社区始终是小红书的立身之本,这一核心定位在任何阶段都不会动摇。“社区可以衍生出多元业务,但本质上仍是产品与公司的根基,其他业务均是在此基础上的延伸。因此,‘笔记付费’不会成为社区定位的转折点,商业化推进也不会让小红书的社区氛围‘变味’。” 归根结底,小红书是以图文为核心的社区平台,垂类增长、业务拓展、商业化探索自始至终都需要围绕着用户需求顺势而为。 小红书为何频频出击? 作为近两年国内增长最快的 UGC 社区,小红书月活破 3.5 亿后,正完成从“生活指南”到“生活兴趣社区”的蜕变。 虎嗅认为,这一转变离不开两个基本面的支撑: 一是用户增长与粘性持续提升。小红书 2024 年 MAU(月活跃用户数) 均值约为 3.3 亿,年末 MAU 已超 3.5 亿;其中,一线及新一线用户占比进一步提升,18-34 岁年轻群体占比超 70%。 与之对应,小红书的用户粘性也在同步增强,虎嗅了解到,2022 年末平台用户日均使用时长约 58 分钟;2023 年用户日均使用时长增长至 66 分钟;2024 年用户日均使用时长进一步提升至 74 分钟,2024Q4 更是达到 77 分钟。 二是用户行为向精神消费迁移。近两年,小红书用户的内容消费重心从美妆、美食等生活刚需转向游戏、二次元等精神消费。这类兴趣内容的消费频次更高、粘性更强,能够突破地域与年龄限制——既让平台跳出区域运营局限,通过内容牵引力自然形成圈层,又不会破坏原有社区氛围。 这一趋势也得到平台数据佐证,虎嗅了解到,小红书 70% 的月活跃用户存在搜索行为;其中,88% 为用户主动发起,三分之一的用户已经养成深度搜索习惯,日均搜索频率达 6 次;通过搜索进入笔记页面的用户,转化率比单纯浏览内容的用户高 30% 以上。 在泛生活内容基本盘稳固后,小红书平台的内容生态愈发丰富,对用户注意力的争夺也愈发凶猛。 虎嗅拿到第三方数据,2025 年上半年,小红书日均新增笔记数达 700 万篇,涵盖图文、视频、商业等多种形态;其中,平台将 50% 社区流量分配给普通用户,笔记发布后会通过自然曝光进行点赞率、收藏率、互动率的赛马机制筛选,数据优于大盘的内容将进入更高梯度流量池。 与之对应,产生了更旺盛的用户消费需求:2025 年 8 月,小红书商家发展部负责人阿方向虎嗅透露,社区每月有 1.7 亿用户存在购买需求,仅‘求链接’类评论每月就达 8000 万条;虎嗅拿到最新数据,截至 2025 年 12 月,小红书社区每月求购需求增长至 2 亿次。 但小红书始终无法回避一个关键问题:如何帮助更多创作者实现流量变现?这在一定程度上加剧了小红书的商业化焦虑。 过去半年,小红书密集推出多项业务动作:先是 2025 年 8 月,内部组建“大商业板块”,由 COO 柯南担任总负责人,与 CMO 之恒协同推进;同月,小红书 APP 进行首页改版,一举将“市集”提升至首页一级入口。 虎嗅了解到,此次改版 8 月初才完成内部测试,仅针对用户测试两周左右,重点监测入口点击率、停留时长、转化率等数据;测试规模从电商深度购买用户逐步扩展至 10% 日活用户,后续将全量开放。 “产品改版尤其影响社区,拍板的是管理层,此次市集能从主站拿下一级流量入口,且开放测试日活用户占比达到 10% 的量,足见管理层对电商(市集)的重视。”接近小红书的相关人士表示。 此外,市集商品图从白底图升级为场景化图片,融入买手笔记、商家笔记等内容,既提升浏览深度、强化场景感知,又凸显社区化体验,与传统货架电商形成差异化心智——这背后的业务考量在于,通过固定入口提升用户主动访问频次,加深小红书“可买”的心智渗透,让“逛市集”成为用户打开小红书的行为习惯。 小红书用户市场负责人来克强调,市集更具温度与烟火气,聚焦“高品质、好价格”的商品供给,是“基于用户对‘发现感’‘惊喜感’的需求,将线下市集场景迁移至线上,打造差异化购物体验,未来将逐步成为中心化购物入口,承载‘发现好货’的核心价值,与社区形成互补。” 接着,2025 年 9 月,小红书正式上线本地生活会员业务“小红卡”,定位为“吃喝玩乐一卡通”,硬闯本地生活,剑指大众点评。 然而,“小红卡”因无法满足大众对本地生活丰富性和便捷性的需求,已于 2026 年 1 月 1 日起暂停试运营;2025 年 10 月,小红书又内测了“快捷售卖”功能,允许用户在笔记下方挂闲置商品链接或在聊天中发送商品卡片,这一度被外界视为叫板闲鱼的二手业务试水。 与此同时,小红书在电商供应链端也持续发力:2025 年下半年计划开展更多产业带招商活动,包括线上线下培训、招商会、选品会等,逐步扩大产地与产业带覆盖范围。 至于内容生态层面,小红书同样动作频频: 2025 年 8 月,将上海复兴岛改造为全球首座“痛岛”,通过设置二次元主题打卡点、举办 Cosplay 互动活动、上线“痛文化”话题等,打造二次元用户线上线下联动的体验场景。这一动作因直接对标 B 站核心用户群体,一度被认为是为抢夺二次元市场。 2025 年 9 月,AMA 趋势在小红书兴起。这一模式原本更契合知乎的问答主场,但知乎的科技讨论多聚焦专业领域,互动形式以长文为主,普通用户参与门槛高;而小红书的 AMA 更轻量化,核心优势在于真实、鲜活的交流氛围,而非单纯进行干货输出。 这两次深入他人腹地的试探,映射出小红书社区的高活跃度与“人味儿”——依赖高质量 UGC 内容形成友好讨论氛围,生态开源且不强制定义圈层,允许内容自然生长,进而反映出平台的核心策略:并非从流量视角生硬嫁接垂类内容,而是顺应行业新趋势、抓住核心用户需求,进而捂热全网讨论。 回顾小红书的生长轨迹:一路从美妆、生活、时尚辐射至酒旅、出行、娱乐、美业等各种生活服务场景,一次次无边界延伸,越发朝着超级平台跨进。 一位小红书内部人士向虎嗅透露,无论哪个内容垂类崛起,小红书内部始终围绕“有价值、有用”的共识做知识推荐,即便 UGC、PUGC 内容井喷,运营方向也不会偏移,以此保证垂类用户的信息更新始终具备实用价值。 综上,从二次元“痛岛”到 AI 领域 AMA,再到如今的“笔记付费”,小红书通过抓趋势的策略,逐步切入 B 站、知乎、网文平台的优势主场——这既是突破社区边界的大胆试验,也暗藏着平台在商业化道路上左突右奔的野心。
罗马仕遭供应商创益通起诉追讨货款,一审被判支付1271万元
IT之家 1 月 10 日消息,1 月 9 日晚,A 股上市公司创益通发布公告披露,该公司作为原告,起诉江门罗马仕科技有限公司(简称“江门罗马仕”)、深圳罗马仕科技有限公司(简称“罗马仕”)一案有了最新结果,法院一审判决被告江门罗马仕应向创益通支付货款 1271.15 万元及相应利息。 公告显示,2023 年 10 月,创益通与江门罗马仕签订《采购协议》,约定由公司按罗马仕要求生产移动电源等产品,付款方式为“月结 60 天”。2025 年 3 月至 7 月,创益通供货总金额 18,014,087.89 元,罗马仕仅支付 2,302,616 元(230.26 万元),尚欠 15,711,471.89 元(1571.15 万元)。创益通诉求法院判决江门罗马仕等支付拖欠货款及逾期利息等。 创益通主要从事设计研发与制造精密连接器、连接线、精密结构件等互联产品,产品主要应用于 5G 通信、新能源汽车、数据存储、医疗、消费电子等领域。 综合IT之家此前报道,罗马仕因充电宝起火爆炸风险,陷入高校禁用、旧品召回、民航禁令、员工讨薪等困境。 1 月 4 日,有消息称罗马仕已在内部启动名为“重生计划”的重组方案,相关立项工作将于 2026 年 1 月正式落地。按照规划,公司力争在 2026 年第一季度完成资金引入与重组工作,同步重新获取新 3C 认证,全面恢复产品销售体系。
大模型第一股,没等来市场狂欢
文 | 市值榜,作者 | 贾乐乐,编辑 | 嘉辛 2026年1月8日,“全球大模型第一股”智谱AI在港交所挂牌。爆发式增长的业绩、上市前超过1159倍的公开发售认购倍数,都拉高了市场的期待值。 不过,上市首日,剧情并未按预想的狂热剧本走。智谱盘中一度跌破发行价,最终收盘涨幅定格在13.17%。 1月9日,同样争夺大模型第一股的Minimax上市,收涨109.09%,智谱收涨20.61%。智谱上市次日的上涨,也不能排除Minimax走势相对强势的原因。 但与前些时日A股科创板GPU公司摩尔线程、沐曦股份上市时动辄数倍的“造富效应”相比,智谱上市两天的表现难免显得不够看,和Minimax相比,也逊色不少。 同是AI浪潮里的弄潮儿,智谱的首秀为何不够惊艳,甚至有些乏味?资本市场是怎么给智谱定价的?长期,智谱的价值怎么看? 一、AI造富神话失灵了吗? 上市地点的选择,是理解股价差异的第一把钥匙。 港股市场的投资者构成是这样的:国际投资者占比约60%,香港投资者占比25%,内地投资者占比15%,且专业机构投资者贡献了85%的交易额。 机构主导的特点,造就了港股市场“总市值和流动性都集中于成熟的大中型龙头企业”与“现金流稳定、基本面优异的个股更受资金青睐”的特点。 换句话说,港股市场比较看重清晰的盈利路径、健康的现金流,以及与国际同行相比是否显得过于昂贵。 这种估值特点也在一定程度上解释了为什么智谱的走势和估值不如Minimax——以经调整净亏损/收入衡量亏损率,Minimax有明显的亏损收缩趋势。 相比之下,A股科创板则提供了一个截然不同的估值环境。这里的投资者对具备“硬科技”属性、解决“卡脖子”问题的公司,抱有较高的耐心,并愿意为其未来的潜力和国家战略价值支付显著的“梦想溢价”。 同样是国产GPU四小龙,壁仞科技、和智谱同一天在港股上市的天数智芯,股价走势也都远不如沐曦和摩尔线程。 从估值来看,以2025年的预测营收中间值和1月8日的收盘市值计算,沐曦和摩尔线程的PS分别为147倍和233倍,壁仞科技约为109倍,天数智芯没有预测值,即使有,也会远低于前三者。 这也可以看出,不同市场对同一技术叙事的定价体系存在一定的差异。 第二个原因在于两者在AI产业价值链中的角色不同,这决定了各自商业模式的风险和回报。 GPU公司是典型的“卖铲人”。在当前的AI浪潮中,算力是毋庸置疑的硬通货和基础设施。无论下游的大模型与应用最终谁胜谁败,对算力的刚性需求都是确定且持续增长的。 卖铲人的生意与整个行业的扩张深度绑定,却不必承担具体应用成败的风险,这种商业模式自带防御性和确定性光环。 而大模型公司,更像“淘金者”。他们直面最终应用市场,空间巨大但同时也伴随着高风险:技术路线迭代快、巨头竞争白热化、商业化落地探索艰难…… 简单来说,市场觉得“卖铲子”比“预测哪里能挖到金子”更靠谱、更值钱。 智谱也有部分业务具有卖铲子属性,比如提供API服务,但业务占比较小,下文详述。所以,智谱需要证明自己不仅在技术上有优越性,在商业上也能成为领跑者,才能赢得更高的市场热情。 最终,所有差异都反映在具体的估值数字上。 券商对智谱的业绩预测,提供了一个可参考的估值锚。 中信证券预计智谱2026年收入约为16.04亿元,并给予其2026年约30倍市销率(PS)的估值,对应目标市值约539亿港元。智谱上市首日收盘市值约579亿港元,与此锚点基本吻合。 30倍PS,承认了其行业地位和成长性。作为参照,几年前,当时的一家人工智能头部企业在上市后不久,国际大行给予的估值仅在16倍PS左右。 尽管没有出现摩尔、沐曦式“暴富”,这也是一笔相当扎实的可观回报,毕竟Pre-IPO轮的融资估值只有240多亿元,上市两天后市值到了698亿港元,约合人民币625.3亿元。 二、顶梁柱太重,增长极太卷 港股的定价体系,意味着我们需要将更多的注意力放到业务本源上,即,智谱究竟在做一门什么样的生意。 智谱的收入分为两部分。 第一部分是本地化部署解决方案。智谱将自家的千亿参数基座大模型GLM部署在客户的私有服务器或专属云环境中,为客户提供高度定制化的专属模型服务。 这项服务通常按项目和后续持续的算力消耗来收费。由于涉及深度定制和私有化保障,它天然面向的是对数据安全、模型可控性有极高要求的大型银行、央企、头部互联网公司等“大B”客户。 本地化部署的特点是客单价高、毛利率也高,2025年上半年这块业务的毛利率约60%。“缺点”也很明显:需要深度定制和贴身服务,难以复制。 “上一年深度合作,下一年就没订单了”的现象也并不奇怪。 在本地化部署方面,智谱的思路是打造一个强大的通用大脑,再让它去学习并解决各个行业的专业问题。 智谱落地的行业比较多,从各行业创收的比重来看,也呈现出越来越分散的态势。招股书显示,未来六个月,还打算优先在消费电子和物联网行业部署模型和场景验证,长期来看,还要进军教育及医疗等高准入门槛的行业。 不同于将AGI当做信仰的智谱,也有一些大模型公司选择聚焦战略,即,放弃基础大模型的竞赛、不再讲AGI的叙事,转而做产业模型或者企业级解决方案等toB行业应用,比如零一万物,和专注于医疗AI的百川智能。 显然,智谱的战略需要更多的资源做支撑,这也对跑通商业闭环、早日实现自主造血能力提出了更急迫的要求。 第二部分是云端部署。智谱把模型能力封装好,变成标准的API接口,像水电煤一样开放给所有开发者和企业。客户按调用量付费,随用随取。这是一种更标准化、更轻量化的服务模式。 显然,云端部署是资本市场更买账的叙事,也是智谱长期战略重点。 不过,国内的云端业务很卷,大厂的API都是白菜价。智谱这块的毛利率在2022年有76.1%,2024年掉到3.4%,2025年上半年直接变成了负数。 所以,智谱需要证明自己能够成为具备“网络效应”和“边际成本极低”的平台型公司。 在上市当天,智谱创立发起人兼首席科学家唐杰的内部信提到,GLM-4.7发布后MaaS平台ARR年化收入超过5亿(其中海外收入超过2亿),从2000万到5亿(25倍)仅用了10个月。 这里描述了两个叙事,一是国际化叙事,毕竟海外开发者付费意愿更强,二是云端业务的爆发性。 但也必须承认,今天的智谱,还是一家深度服务大客户的To B解决方案公司。体现在数据上,2025年上半年,本地化部署才和云端业务收入占比分别为85%和15%。 本地化部署,客单价高、毛利率高,但太重,云端业务太卷,算力还比较贵,2025年上半年营业成本里的计算服务费和研发开支里的计算服务费合计为11.8亿元,是同期收入的6倍多。 所以智谱虽然收入增速很快,但一直处在巨额亏损中。 智谱营收从2022年的5741万元增至2024年的3.12亿元,2025年上半年进一步增至1.91亿元,同比增长超300%,经调整净亏损也从2022年的9741.7万元扩大至2025年上半年的17.52亿元。 面对超过收入8倍的亏损,智谱的态度是:在当前阶段,不追求短期利润好看,而是先把模型调用规模、客户数量和生态渗透率做上去。 也就是,今天的亏损是为站稳明天行业领导地位所必须支付的“战略门票”。 这是一场关乎未来统治权的豪赌。成败,取决于两场同步进行的赛跑。 一场是技术赛跑,它的模型性能必须持续领先,这是吸引所有客户的终极王牌。另一场是成本赛跑,它必须通过技术革新和规模效应,让算力成本的下降速度跑赢收入增长的速度。
吴恩达:图灵测试不够用了,我会设计一个AGI专用版
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 新年新气象!AI大神吴恩达2026年目标公开: 要做一个新的图灵测试,他称之为图灵-AGI测试。 光看名字就知道,这个测试专为AGI而生。 去年是AGI水涨船高的一年,吴恩达在其年度总结中也曾表示: 2025年或许会被铭记为人工智能工业时代的开端。 创新推动模型性能到达新的高度,AI驱动的应用变得不可或缺,顶尖企业人才争夺激烈,基础设施建设推动社会生产总值增长。 学术界和工业界频繁提及AGI概念,硅谷的公司也会为抢先AGI定下季度目标。 但关于AGI的定义至今还没有统一标准,现有基准测试还常常误导大众,使其高估当前的AI水平。 吴恩达注意到该趋势,于是新的图灵测试将试图弥补这一空白。 正如网友所言: 要衡量智能首先要定义智能。 图灵-AGI测试设想 传统的图灵测试在AGI时代显然不够用。 它由艾伦·图灵在上世纪五十年代提出,提出用人机对话来测试机器的智能水平。 在测试过程中,人类评估者需要确定他们是在与人还是与机器交谈。如果机器能够成功骗过评估者,那么就算通过了测试。 但现在的AI显然不再满足于简单的对话交互,而是要构建起经济有用的系统,所以亟需一个能够衡量AI工作能力的测试。 而这就是图灵-AGI测试的核心,要让AI像人类一样智能,并完成大部分的知识型工作。 测试对象将会是AI系统或专业人士,他们将会被提供一台可以访问互联网并配备浏览器和Zoom等软件的计算机。 裁判将通过计算机为测试对象设计一个多日的体验任务,比如作为客服,会先被培训一段时间,然后要求执行接听电话的任务,并需要提供持续的反馈。 只要AI能够像人类一样熟练完成工作任务,就会被认为通过测试。 该测试将聚焦AGI的经济性和实际产出,更接近普世意义下对AGI的初始定义——可用于工作和生产场景的智能。 它也会比基准测试更考验AI的通用能力。 现在几乎所有的AI基准测试,如GPQA、AIME、SWE-bench等,都会预先确定一个测试集。这意味着AI团队都会直接针对已发布的测试集来调整他们的模型。 这就导致很多AI模型榜单排名靠前,但真实物理世界中又能力不够。 去年闹得沸沸扬扬的Llama 4刷榜丑闻就是其中一个典型,明明数据看起来都很不错,但用户真正上手后却傻眼了。 此外,固定测试集只能衡量AI在某一狭窄领域的能力。相比之下,图灵测试可以由评委自由提出任意问题,没有提前限定范围,更能判断系统在通用任务上的表现。 在改进的图灵-AGI测试中,延续了这一设定,裁判可以任意设计体验任务,而受测试的AI或人类测试者均不会事先知道任务内容,这将比基准测试更能判断AGI水平。 同时为了校准社会对AI的期望,吴恩达表示,或许他将举办一场图灵-AGI测试,让所有AI参与其中。 即便最后的结果会是所有AI系统均未能达到标准,但也能平息长期以来对AGI的过度炒作。 这种降温将会为AI领域创造更稳健的环境,让行业重新聚焦于非AGI级别的实际进步,比如开发有实用价值的应用,而不是沉迷于实现AGI的营销噱头。 从长期来说,图灵-AGI测试也会为AI团队设定一个具体的努力目标,而非模糊地实现人类级智能。 倘若真有某一家公司能够通过测试,其成果也必定具备真实价值,图灵-AGI测试将会为真正的AGI突破提供可信的判定依据。 所以接下来,只需拭目以待。
可能被“没收”一半股权,谷歌创始人逃离硅谷
一个工会的灵机一动,搅动了硅谷的富豪圈。 加州最强大的工会之一SEIU-UHW(美国服务业雇员国际工会-西部医疗工作者分会)发起了一项提案,向富人征税。 而且不是从富人的收入里多征税,而是直接将手伸向富豪的“家里”——从净资产当中一次性征收5%的税。 提案还没有通过,甚至预计到11月才会公投,但是其中设定了“1月1日”的追溯日期,也就是说,1月1日开始是加州纳税人且是亿万富翁的,就在征收之列。 要知道,拥有硅谷的加州一直是富豪聚集地,这几年又因为AI浪潮猛添一笔,去年新增的亿万富翁就是几十个,现在总共有200多个亿万富翁。 这么一搞,“加州亿万富翁大逃亡”拉开帷幕。 谷歌创始人佩奇和谢尔盖已经赶在新年之前采取行动。 如果他们不跑,损失的可能不只是5%的净资产,由于提案当中的一则条款,他们持有的谷歌母公司Alphabet的股权,可能被“没收”一半。 马斯克几年前就开始骂骂咧咧,指责加州过度税收、过度监管,并且陆续把掌管的几家公司迁出了加州,房子也都卖了,公司连人全都跑德州去了。 没想到如今看来,作为全球首富的马斯克跑得是真快。 01 谷歌创始人连夜逃离硅谷 谁都不会否认,谷歌是“土生土长”的硅谷传奇。 近三十年前,斯坦福大学的两名研究生拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)捣鼓出一个搜索引擎,后来他们选择正式创业,在亲友家的车库开始了征程。 如今,谷歌已经是市值4万亿美元水平的科技巨头,加州这个全球科技重镇的名号,谷歌的贡献显而易见。 然而,如今佩奇和谢尔盖却在“紧急撤退”,和加州say goodbye。 在2025年圣诞节前的十天里,和谢尔盖相关联的15家公司悄然转移,这些公司为谢尔盖打理生意和投资,包括管理谢尔盖的超级游艇和他在圣何塞国际机场私人航站楼权益的公司。 其中有7家公司,被变更到了内华达州。 佩奇也做了相似的事。 刚刚过去的12月,与佩奇相关的超过45家加州公司提交了申请,要么申请注销,要么申请迁出加州。 此外,和佩奇相关的一个信托本周还在佛罗里达州迈阿密买了一栋价值7190万美元的豪宅。而另有媒体爆料,去年12月他已经在迈阿密购置了一处价值超过1亿美元的豪宅。 也就是说,佩奇已经在迈阿密豪掷超过1.7亿美元买房。 让一切更“实锤”的是,佩奇和谢尔盖共同管理的一个实体,也在圣诞节前夕迁出加州,转至内华达州。 在年底搞这么大动静,而且主题都是“离开加州”,几乎可以肯定这些变化都和一件事有关——加州“新富人税”。 准确来说,这是一项还没有通过的“亿万富翁富人税”提案,其中规定资产超过亿万的人要被一次性交税,金额为资产的5%。 加州总计大约有200位亿万富翁。 人工智能正在推动加州新一轮财富创造浪潮,据估计,去年加州新增了约50位亿万富翁。 虽然还没有通过,但是提案中明确写着,关键的时间节点是2026年1月1日,只要这个日期时是加州纳税人的身份,又是亿万富翁,那就得被砍一刀“富人税”。 据彭博社,已经明确被个人财务顾问确认的,就有6位亿万富翁已经在新年前离开了加州,接下来很可能还会有十几位跟上,掀起“亿万富翁大逃亡”。 在佩奇和谢尔盖之外,另一位硅谷知名亿万富翁蒂尔(Peter Thiel)也已经行动。 蒂尔是PayPal的联创之一,Facebook的首位外部投资者,创办的风投机构有过投资SpaceX、Airbnb、Lyft、Stripe等战绩。 他的家族投资公司Thiel Capital已经不和加州玩了,跑到迈阿密租赁了新办公室,还在跨年前夕(12月31日)公开宣布了这个消息。 02 富人没良心? “新富人税”的消息一出来,争议四起。 这项提案背后包含着公共利益,旨在筹集约1000亿美元,以弥补该州医疗保健、食品福利和教育方面的资金缺口。 富人逃跑,是因为太没良心吗? 其实加州已经是美国收税比较狠的州了。 税率全美最高,最高达13.3%(年收入超100万美元的部分额外加1%的“百万富翁心理健康税”),而且资本利得(卖股票赚的钱)也全额按这个税率收,不像联邦那样有优惠。 所以这样说来,加州其实早就有“富人税”,而且加州富翁确实贡献很大。 根据SmartAsset的估算,顶级1%收入者贡献了加州近40%的所得税,总额超过1220亿美元。 相比而言,前文提到的佩奇和谢尔盖的新选择内华达州,州税为0,交联邦税就行了。而在加州,既要交联邦税,又要交州税,州税又横比很高,对亿万富翁来说向来不算是“划算”的选择。 马斯克就曾经反复叫骂,批评加州过度税收。而且他早就跑路,2020年开始将特斯拉总部迁到德州,2024年又把SpaceX和X也迁了过去,自己也生活在了德州。德州是出了名的低税收州。 再者,这次的“新富人税”和以往都不同,它不是针对收入,而是针对资产(包括股票、房产、游艇等还没卖掉的资产等有一个算一个,全部在内),一次性征收5%。 简单说,之前是“赚了钱再收重税”,现在是“有钱就直接收”,性质完全不同。 比如净资产200亿的人可能要一次性缴10亿,可分5年付。这相当于直接从本金里“割肉”。 而且追溯到2026年1月1日,只要那天还是加州纳税人,就算后来搬走也逃不掉。 金额巨大,还无法通过不卖股票来规避,才让富豪觉得受不了,赶紧把公司实体、房产、居所迁到佛罗里达或得州这种零州税的地方。 除此之外,提案之中的一些条款,也让有的富翁心惊肉跳。 在反对声中,硅谷知名风险投资人、Y Combinator(YC)总裁兼CEO Garry Tan的分析格外吓人。 他指出,佩奇和谢尔盖如果不跑,不是仅仅会被征收财产的5%那么简单,而是他们持有的Alphabet(谷歌母公司)股票的50%都会被没收。 这是因为提案当中有这样一个条款:“对于任何赋予投票权或其他直接控制权的权益,纳税人拥有的商业实体的百分比应推定不低于纳税人拥有的总体投票权或其他直接控制权的百分比。” 关键词是“总体投票权”“直接控制权”。 也就是说,不仅仅看实际的股票价值,还要看你投票权是多大。 佩奇和谢尔盖各持有3%的Alphabet股权,相当于每人有1200亿美元价值的股票。 但是佩奇和谢尔盖有10倍的投票权,所以提案之下,会视为他们有30%的股权,而非3%。 如果这样计算的话,佩奇和谢尔盖仅Alphabet股权这一项,价值会被放大10倍到1.2万亿,而他们每个人相应需要缴纳的税款(5%)就高达600亿美元。 拿着价值1200亿美元的股权,却对应要交600亿美元的税,就是这么来的。 富人是钱多,有的富翁的确也会心系天下并付诸行动,但不代表“人傻钱多”啊。 Tan认为,“新富人税”中的一些定义含糊,只会把科技创新驱逐出加州。 03 悬而未决 争议仍在持续。 反对者认为这只会让富翁逃跑,初创公司也会有所忌惮,最终是加州不光丢了钱,还丢了科技创新的活力。 硅谷传奇投资人科斯拉(Vinod Khosla)以及霍夫曼(Reid Hoffman)在X上发帖,认为加州如果真这么干,就是搬起石头砸自己的脚,失去最重要的纳税人,最终非但不会有所收获,反而会损失惨重。 Facebook前高管帕里哈皮蒂亚(Chamath Palihapitiya)也表达了类似的观点,认为到时候富翁跑了,加州的预算赤字只会更大。 AI编程公司的CEO Amjad Masad则警告,这会破坏硅谷的初创生态。 在一众反对声中,也有很“佛”的加州富翁。 根据彭博亿万富翁指数,黄仁勋是全球第九大富豪,身价1567亿美元。 黄仁勋在接受电视台采访的时候被问到“加州新富人税”的问题,满不在乎地说:“我们选择在硅谷,他们想征收什么税,我们就交什么税。” 他还补充说,他对此“完全可以接受”。 也有声音认为,“亿万富翁大逃亡”是一种夸大。《福布斯》的一篇文章就表示,从历史上看,富翁的流动性远远没有大家想得那样大。 但硅谷富翁是否能和历史上的富翁相提并论,还要打一个问号,毕竟他们往往就是“灵活”“创新”的代表。 说到底,这项法案并非由加州州政府提出,而是由工会推动的提案,需要加州选民公投通过。现在工会正在收集签名,收集到87.5万个签名才可以在今年11月公投。 就算通过,离开与留下的富翁,都依然可以诉诸法律,发起诉讼,继续抗争。 “富人税”,也不是那么好收的。
TikTok将美国员工拆分到不同实体,削减内容创作岗位
据BI报道,TikTok 已确认对其全球内容运营团队进行重组,同时加快品牌合作和盈利岗位的招聘,为即将推出的 TikTok 美国版做准备。 这家短视频平台表示,正在对其全球内容运营团队进行重组,此举已导致美国及其他地区出现裁员。 据Digital Music News报道,美国约有20个内容团队职位受到影响,全球范围内还有数量不详的职位也受到影响。 TikTok发言人表示,这些调整旨在让公司更加专注于重点内容领域。 “我们正在重组全球内容运营团队,以持续加速高质量内容和关键垂直领域内容的增长,”该发言人说。 此次重组恰逢TikTok全球创作者负责人金·法雷尔(Kim Farrell)离职,她在该公司工作近六年之后即将离开。 据Digital Music News援引消息人士的话称,法雷尔的离职与内容团队的裁员无关,但正值公司进行更广泛的组织架构调整之际。 法雷尔本人尚未就其离职发表公开评论。 尽管TikTok缩减了内容运营规模,但其商业扩张步伐却十分迅猛。该公司已在品牌合作和盈利领域新增了一系列人才,其中许多来自美国,这表明TikTok正加大力度深化与广告商的关系并拓展收入来源。 近期的人事任命包括一位前TikTok Shop高管回归,担任全球变现战略主管。 据知情人士透露,自1月初以来,TikTok还聘请了一位前Meta变现合作主管、一位产品战略与运营经理、一位奢侈品牌合作经理以及一位前Spotify客户合作总监,分别负责消费品业务。 TikTok内部已提拔多名员工担任新设立的垂直行业领导职务,包括负责媒体娱乐、汽车和关键客户解决方案的职位。这些调整表明,随着平台寻求将用户规模转化为持续的广告和电商收入,TikTok正更加专注于特定行业领域。 目前来看,TikTok的双管齐下战略正逐渐清晰:一方面精简内容运营,另一方面加大对变现基础设施的投入。 TikTok美国正式成立后,这些优先事项将如何协调一致,将受到创作者、广告商和监管机构的密切关注。 此外,TikTok正准备剥离其美国业务的部分内容,但并非所有美国员工都会加入新实体。 本周,部分美国员工被告知,他们将不会为由管理投资方甲骨文、银湖资本和MGX牵头成立的新合资企业 TikTok USDS Joint Venture LLC工作。 相反,他们将为字节跳动旗下另一家名为TT Commerce & Global Services LLC的TikTok全球实体工作。 此次调整已在发给受影响员工的备忘录中概述,其中包括专注于美国产品、但在交易完成后仍将与TikTok全球运营相关的员工。 去年12月,TikTok首席执行官周受资曾告诉员工,这些业务线将包括某些商业活动,包括电子商务、广告和营销。 根据周的备忘录,其他美国员工,例如那些专注于数据保护或算法安全的人员,将在USDS合资企业旗下工作。 他表示,该交易将于1月22日完成。 TikTok 和字节跳动没有回应 Business Insider 关于此次人事变动的置评请求。
Hinton的亿万富豪博士生
一水 发自 凹非寺 量子位 | 公众号 QbitAI 一张照片,一段往事,一个愈加伟大的人格…… 这就是Hinton最近又在圈内被热议的“江湖往事”。 最开始是一张老照片——1986年CMU首届联结主义夏令营合影。 有人将这张合影誉为AI界的“索尔维会议”,认为只要是玩神经网络、计算神经、计算语言的后辈们,几乎都能在这张照片里找到自家祖师爷。 不信你看,图中圈出来的就是深度学习发明人、诺贝尔物理学奖、图灵奖双料得主Hinton,正是在他的坚持下,神经网络才最终迎来春天。另一位熟面孔是图灵奖得主Yann LeCun,他后来发明的卷积神经网络开启了计算机视觉时代。(ps:LeCun每次外出演讲都会在PPT里放这张图,真爱粉无疑了) 以及同框的还有Stan Dehaene、Mitsuo Kawato、Jay McClelland等一众在认知科学、神经科学和计算机领域登峰造极的大神…… 虽然在80年代这群年轻人还籍籍无名,但几十年后,他们的影响力,正在统治硅谷和华尔街。 是的,因为照片中还有一位当时的青椒博士生Peter Brown,他是Hinton的第一位博士研究生,现任顶尖量化基金文艺复兴科技CEO,不折不扣的华尔街巨鳄。 (ps:通过卷发和眼镜大致推测另一个圈出来的是年轻版Peter Brown,如有错误欢迎大家指正) 40年前,他跟着Hinton在CMU学习语音识别;40年后,他掌舵全球最知名的量化基金,身家亿万美元,早早就让金钱变成了数字游戏。 而且也是因为他,让Hinton显得更加人格高尚。 因为在AI复兴之前的三十年里,Hinton不仅科研经费短缺,个人经济状况也算不上好——后来自曝卖自己到谷歌就是希望给“有缺陷”的儿子留点钱。 但老爷子不曾动用过关系,或者让有资源有能力的徒弟们做点什么。 安贫乐道、遗世独立,贵族风范一以贯之。 Peter Brown:Hinton首位弟子、全球知名对冲基金CEO 想知道Peter Brown是谁,只需看一眼多伦多大学官网统计的Hinton学生名单就知道了。 按照毕业顺序,他算是Hinton带过的第一位博士研究生(按辈分算是Ilya的大师哥)。 这位大师哥早期主要研究语音识别,后来进入IBM工作过一段时间,最后才从AI领域跨界到金融领域。 而在华尔街,Peter Brown如今算是响当当的人物——他是全球知名对冲基金、曾开启量化交易先河的文艺复兴科技公司的现任CEO。 这家公司最早由数学家西蒙斯——梁文锋的偶像创办,在华尔街招收各种金融天才的时候,通过聘用数学、计算机人才,通过机器学习来实现交易,成为了回报最高的基金之一,后来也成为了华尔街乃至全球最知名的量化交易基金。 但现任CEO的Peter Brown,实际不是一开始就踏入华尔街的。 他是AI最早的信徒,也跟随Hinton经历着那个时代里对AI最典型的冷遇。 AI发展里的路线之争 还在高中时,Peter Brown就对傅里叶变换(Fourier Transform)产生了浓厚兴趣,认为它可以用于语音识别。 这里补充一下,傅里叶变换是一种强大的数学工具,用“听一首交响乐”的例子来打比方就是—— 耳朵实际听到的是一个随着时间起伏变化的、非常复杂的混合声波,但经傅里叶变换处理后,你就能分析出里面的小提琴(高频)占多少强度,大提琴(中频)占多少强度……总之它可以用来分析语音。 于是在进入哈佛大学后,Peter Brown的目标相当明确——主修数学和物理。并在人工智能刚刚兴起时,跑到卡内基梅隆大学跟着Hinton学AI,成为其首位博士研究生。 其博士毕业论文也和语音识别相关,主要从信息论视角系统性地探讨了自动语音识别中的声学建模问题。 具体研究内容是什么不重要,重要的是这篇论文发表于语音识别的早期阶段—— 它奠定了基于统计模型(尤其是隐马尔可夫模型)的现代语音识别基础,其思想深刻影响了之后数十年语音识别乃至序列建模领域的发展。 而在博士毕业后,Peter Brown选择加入“蓝色巨人”IBM,并继续从事语音识别、机器翻译以及后来被称为大语言模型预训练和生成的相关技术工作。 尤其在语音模型训练方面,Peter Brown和团队算是遭遇了路线和数据两方面的挫折。 当时学术界的传统派认为,要让计算机处理语言,必须教它人类的领域知识(例如语法规则)。 但Peter Brown和团队却大胆选择了一条背道而驰的路线——坚持使用纯数据驱动的统计方法,完全不输入语法知识,而是让机器从数据中自行寻找概率模式。 这一做法在当时备受冷遇,甚至连他们发表的论文也惨遭审稿人“嘲讽”: “机器翻译信息论方法”早在1949年就由沃伦·维弗(Warren Weaver)提出,但到1950年时已被学术界普遍拒绝。 Peter Brown自述,虽然论文最后还是被接收了,但这一“刻薄的评语”给他留下了深刻印象,于是后来还把这一评语挂在了书房墙上以在遭遇质疑时自勉。 而除了路线,他们还面临着数据和算力方面的挑战。为了搜寻数据,他们甚至连IBM反垄断诉讼中的证词都没放过。至于算力,Peter Brown透露过: 当时使用的IBM大型机算力甚至不如现在的手机。 “深蓝”的幕后推手 不过,在如此艰难环境下(IBM当时已经算很好了),IBM还是交出了后来影响世界的“深蓝(Deep Blue)”系统。而“深蓝”的推出,实际上也离不开Peter Brown这位幕后推手。 据Peter Brown自述,有一次他在洗手间偶遇了IBM计算机科学副总裁Abe Peled,于是赶紧抓住机会提议: IBM只需投入100万美元建造一台能击败世界冠军的国际象棋机器,其带来的广告价值将不可估量(当时公司都觉得在超级碗中插播广告太贵)。 听完这话,Abe Peled起初显得有些恼火,但半小时后便回电同意拨款。不过由于他当时忙着研究语音识别,于是另外推荐了三位研究生好友加入IBM负责具体推进。 后来他还亲自将这台机器命名为“深蓝”,而“深蓝”也不负众望,在1997年击败了国际象棋大师卡斯帕罗夫。据悉这一成就让IBM的市值在赛后一度飙升了20亿美元。 因经济压力加入文艺复兴,一手缔造“神秘赚钱机器” 然而,在IBM干得还不错的Peter Brown很快便由于家庭财务压力,决定转型跳槽。 当时家里迎来了一位新生儿,生活压力骤增,而西蒙斯愿意出IBM双倍薪酬邀请他加入文艺复兴基金。 于是迫于现实压力,Peter Brown决定从巨头IBM跳到了当时还名不见经传的文艺复兴: 在那次开价后,我回到家,看了一眼刚出生的女儿,意识到我别无选择。所以,离开计算语言学去一家无人知晓的小型对冲基金的决定,完全是出于财务原因。 而一进入这家基金公司,Peter Brown很快发现这里的程序员虽然聪明,却缺乏构建大型系统的经验。 于是他和另一个从IBM一起跳槽加入文艺复兴的成员Robert Mercer,引入现代计算机科学方法重写了整个股票系统,并在后来被委任负责股票交易。 从2002年西蒙斯决定退休开始,这两人也开始接管公司除行政外的所有赚钱业务。 直到2009年,西蒙斯正式退休,而他们也成了这家基金公司的联席CEO。2018年,随着Robert Mercer卸任,Peter Brown成了文艺复兴公司唯一的CEO。 文艺复兴这家公司,外界对其最深刻的印象便是“神秘”与“暴利”。它不对外募集资金,仅管理公司员工和少数老客户的资产,却凭借远超同行的收益率,被誉为华尔街“最赚钱的机器”。 其旗舰产品——大奖章基金(Medallion Fund),自1988年至2019年的三十余年间,创造了年化超66%的惊人净回报率(扣除高昂管理费前),成为投资界无法复制的神话。 这家公司的核心武器,正是由数学家和计算机科学家驱动的、完全依赖历史数据与量化模型的系统化交易。 Peter Brown也表示,自己倾向于招聘完全没有金融背景的数学家和物理学家: 教会科学家市场知识比教会金融从业者高级数学要容易得多。 另外值得一提的是,文艺复兴的成功也离不开Peter Brown这位“工作狂魔”的努力。 他自述每周会工作80小时,经常在凌晨2点开始发送工作邮件,截至2023年已累计在办公室里睡了近2000个晚上。 如此付出也让他快速斩获了巨额财富—— 早在2012年,Peter Brown就因公司业绩突出登上福布斯全球对冲基金经理收入榜,当时作为联合CEO,他从公司约33%的净收益中获得了约1.25亿美元的收入,早早跻身了亿万富翁。 而也是差不多那一年,他的博士导师Hinton,也有着自己的人生困境和选择。 他通过一场载入史册的拍卖会,把自己卖给了谷歌。 后来他自曝过,因为缺钱。 Hinton的伟大总是后知后觉 2013年,已经在学术界耕耘数十年、且刚刚凭借AlexNet引爆深度学习革命的Hinton,却做出了一个出乎所有人意料的决定—— 以近乎拍卖的方式,把自己“卖”给了谷歌。 后来人们才知道,促使Hinton做出决定的理由并不复杂,甚至有些朴素——缺钱。 他曾公开提到,自己有一名患有学习障碍的儿子,因为担心孩子未来无法独立生活,所以这才不得不“为了五斗米折腰”加入谷歌。而加入谷歌的这一年,Hinton已经64岁了,一个常人已经普遍退休颐养天年的年纪。 那时候Hinton的身体条件算不上好,后来来看,几乎是以“托孤”心态来做的个人变现。 但即便如此,Hinton也始终显得独立。 在计算机这样的应用科学领域,富学生之上很少有穷导师,既有合作之中的相互回馈,也有人情世故里的裙带门阀。 但Hinton不同,甚至直到最近被“考古”,不少人才发现原来Hinton还有Peter Brown这样的亿万富豪学生,而且是第一个博士生。 不过如果对Hinton有更长时间维度的知人论世,也不难找到背后的文脉相通。 Hinton其人,出生于一个科学贵族世家。如果AI或者科学界有“老钱”,Hinton一家就是老钱。 这是Hinton被整理的家族成员图谱,科学巨人世家,“四世三公”—— 曾曾祖父是布尔代数的发明者、曾祖父最早系统性提出了“四维空间”的概念、曾姑母创作了《牛虻》、父亲是一名昆虫学家…… 而且他的姑妈Joan Hinton还是一位核物理学家,说英文名大家可能不熟悉,但中文名寒春应该还是有人听过。 寒春曾以费米学生的身份加入曼哈顿计划,是该计划中为数不多的女科学家,后因目睹核爆危害后转向反核与和平事业。 在人生后半程,她长期定居中国并投身农业机械化与奶牛养殖——一度被誉为“从曼哈顿计划走来的中国奶牛专家”,同时也是最早拿到中国绿卡的一批人,如今北京昌平的农机院还有寒春塑像。 实际上,初中课本里的《邓稼先》还提到过寒春—— 当时老有谣言传寒春参与了中国原子弹工程,于是杨振宁写了一封信给邓稼先,问他到底有没有这回事,而邓稼先在回信中明确澄清了此事。 这也算是科学界千丝万缕交集里的“量子纠缠”了。 所以对于Hinton,了解他的身世,也就能更容易理解他身上的某些坚持与气质。 当全世界都不看好神经网络时,他可以默默忍受数十年如一日的寒冬,板凳一坐十年冷。 当资本都在为AI狂欢时,他却毅然离开谷歌,因为想更独立地站出来宣讲背后的风险。 美国嫌他老生常谈,他就面向欧洲,欧洲听不进去,他就克服腰疾跑到中国让更多有能力影响AI进程的中国人参与进来。 老爷子总是不合时宜。 但Hinton又始终在一次次更长的时间维度检验中,彰显着伟大。 他似乎是一位严师,因为很少公开夸赞自己的学生——最知名的一次还是诺奖获奖后对Ilya的称赞,因为Ilya因为山姆·奥特曼唯利是图下不顾AI风险而开除了他。 古今中外,不乏知名的老师评价自己的成就时,会把学生的世俗成功作为核心标准。带出了多少身居高位的人,有多少亿万富豪的学生…… 但Hinton代表的是另一类,壁立千仞,超脱世俗。 Hinton几乎没有用Peter Brown的成功来证明过自己的成就,甚至直到最近,不少人才知道“穷困半生”的Hinton还有Peter Brown一样的亿万富豪学生……他穿越黑夜,穿越冷雨,穷且益坚,然后在时间的检验中获得认可、证明和嘉奖。 中国古语说:岁寒,然后知松柏之后凋也。 Hinton其人,松柏长青。
狂签6吉瓦,Meta成全球最大核能买家,囤电备战AI算力
IT之家 1 月 10 日消息,彭博社昨日(1 月 9 日)发布博文,报道称 Meta 公司为满足 AI 日益膨胀的算力胃口,签署多项重磅核能采购协议,总电量高达 6 吉瓦(GW),这一规模足以满足 500 万个美国家庭的用电需求,让其一举超越其他科技巨头成为全球最大的核能买家。 IT之家注:吉瓦是功率单位,1 吉瓦等于 10 亿瓦(1000 兆瓦)。大致相当于两个中型燃煤发电厂的输出功率,或者约 300 多万块光伏板的发电量。 Meta 此次大规模“囤电”有着明确的战略目标:为其即将落地的超大型数据中心保驾护航。其中,位于俄亥俄州、装机容量为 1 吉瓦的“普罗米修斯(Prometheus)”数据中心预计将于今年上线;而位于路易斯安那州、规模更庞大的 5 吉瓦“亥伯龙(Hyperion)”项目则计划于 2028 年投入运营。 面对如此庞大的新增基础设施需求,传统电网的扩容速度显然已无法跟上数据中心的扩张步伐,核能因此成为最佳解法。 在供应商选择上,Meta 采取了“传统核电站 + 新型初创公司”的组合策略。其中,能源巨头威斯特拉(Vistra Corp)将承担主要的供电任务,利用其位于俄亥俄州的佩里(Perry)和戴维斯-贝斯(Davis-Besse)核电站,为 Meta 输送 2176 兆瓦的电力。 除了依赖现有的成熟核电站,Meta 还投资两家公司:由 OpenAI 支持的 Oklo 公司,以及由比尔・盖茨、英伟达(Nvidia)共同支持的 TerraPower。这两家公司目前正致力于开发小型模块化反应堆(SMR)原型机。 图源:Meta 针对此次大规模布局,Meta 全球能源负责人 Uvri Parekh 公开表示:“我们之所以大力投资核能,是因为它能提供清洁、可靠的电力,这对推进我们的 AI 野心至关重要。”
反内卷再次升级,这次能刹住外卖大战吗?
文 | 略大参考,作者 | 杨知潮 01 还未烧起来的战火,被踩下了刹车 2025年,仅仅半年里,外卖大战就烧掉了阿里、京东、美团三家大约800亿的资金,三家的利润受到严重影响。 高额的亏损并没有劝退野心勃勃的阿里:1月8日,据多家媒体报道,阿里面向投资者的最新交流信息显示,淘宝闪购明确2026年核心战略:首要目标是份额增长,会坚定加大投入以达到市场绝对第一。 美团和京东虽然没有回应,但毫无疑问,如果不想拱手放弃自己的客户,他们想不想打,都必须接招。 而无论谁能胜利,这都将是一场可怕的战争,不仅会严重拖垮三家的利润,还会干扰即时零售乃至整个餐饮行业正常的竞争生态。 好在,这场即将发生的新一阶段战争,被踩下了刹车——出手的是国家市场监管总局。 1月9日下午,国家市场监管总局在官方公众号发文:近日,国务院反垄断反不正当竞争委员会办公室依据《中华人民共和国反垄断法》,对外卖平台服务行业市场竞争状况开展调查、评估。 这也是国家市场监管总局对外卖补贴大战的一贯态度,并早在2025年5月、7月,连续两次约谈行业相关企业,要求公平有序竞争。 作为常态下竞争中运营效率最高的美团,也当然乐于见到补贴式竞争的结束。美团官微也发文表示支持和拥护: 1月9日下午,国务院双反委员会办公室宣布启动外卖平台服务行业市场竞争状况调查、评估。美团坚决拥护,将全力做好配合工作。近一段时间以来,外卖市场“拼价格、拼补贴、控流量”等非理性竞争问题突出。美团多次呼吁行业回归理性,坚决反对“内卷式”竞争。美团将以此次调查为契机,和行业内各平台一起,共同落实市场主体责任,公平参与市场竞争,促进外卖平台服务行业创新和健康发展。 这是美团长期以来的态度,早在2025年年中接受媒体采访时,美团核心本地商业板块CEO王莆中就明确表示,美团不想卷,是被动卷入。美团管理层在业绩会上也多次对补贴式的非理性竞争表示反对。 而眼下,三家的竞争,有望回到美团喜欢的节奏中——也是正常的节奏中。 02 战争是场浩劫 战争往往没有赢家。 在2025年三季度:美团出现160亿元的大幅度亏损。阿里巴巴净利润同比下降53%,经调整EBITA下滑超过7成。京东净利润同比腰斩。 阿里巴巴虽然盈利,但毕竟这家公司基本盘在电商,数据是包含了非即时零售业务的。而按照高盛的预计,三季度即时零售业务分别给阿里和美团带来了360亿和200亿的亏损——前者还要多亏一些。 流血的不光是平台,“内卷”还会影响下游的商家——毕竟神仙打架,很容易误伤凡人。 以三家竞争最激烈的茶饮咖啡领域为例,从年初京东外卖崛起开始,饮料这个低单价高频的品类,就成为了三家的争夺核心点,三方不断在此拉扯,试图夺走用户的习惯。 这个过程里,当然可以给商家带来订单,但很多压力也被传导给了商家。据多个茶饮品牌的门店在社交媒体上的披露,外卖的补贴并非完全由平台出钱,门店自己也要参与部分补贴,拉低了毛利率。 哪怕是连锁品牌,也倍感压力,三季度,瑞幸咖啡的配送费用占比从9.1%上升到18.9%,最终导致了当期经营利润率下滑了5个百分点——这还是行业里的大型连锁品牌,更下游的商家,以及小品牌的议价权更低,只会更加艰难。 更重要的是,任何一个市场,都有自己的生态。奶茶品牌之间良性竞争,最终形成一个更健康的格局。 而三家互联网巨头体量太大了,它们一个季度的营销费用,可能是某个餐饮品牌几年的利润。当这些超额资源注入,生态就会被直接扰乱。 假设一下:一家饮料品牌可能由于效率低下,品质平庸,原本应该被淘汰出市场。但由于外卖巨头的涌入带来超额补贴,反倒让它具备了价格优势。这对那些效率更高的竞争对手,是非常不公平的。 它还会影响到下游的价格体系。餐饮行业的价格是长期博弈、市场教育的结果,是利润与销量之间的平衡。而一旦大规模补贴涌入,就会瞬间破坏掉品牌好不容易撑起的价格体系。即便能够带来订单,在长远来看也会损害商家的利益。 美团管理层在业绩会上也曾明确表示:这种“内卷”是无法为行业创造任何真正价值的,也无法助力行业持续发展。 而当不正常的竞争结束,不止美团、京东、阿里可以有更好的利润率,餐饮店、奶茶店、连锁品牌也可以喘一口气了。他们将在未来把精力投入到服务和效率上,而不是思考如何通过外卖平台的补贴冲击低价单量。 03 打文明礼貌仗 当然,外卖的竞争绝对不会结束,也不应该结束。 但竞争的主题,却可以是更良性的。 比如价格战当然可以打,但价格战应该是为利益链条留足利润后,对效率的比拼。 据瑞银与美团举办的路演披露,美团与竞争对手的UE差距为2元左右,但已经收窄,预计长期将稳定在1-1.5元人民币,即同样的竞争格局下,美团可以比竞争对手少亏1-1.5元,或者多赚1-1.5元。 这种数据背后,才是竞争对手之间真正的体系化效率所在,也是真正“创造价值”的部分。 三方的竞争逻辑,不应是用亏损式补贴来弥补这种效率的差距。而应该是:美团努力维护、扩大自己的效率优势,阿里、京东努力缩小,乃至反超美团的效率,从而获得真正的业务护城河。 这个过程更加漫长和困难,它需要整个系统的搭建、算法的优化、配送网络的建设、商家供给的丰富和优化。甚至还包括AI技术的应用,无人机的新兴配送网络搭建。 通过这一系列的努力,编制出一整张网络,建立起自己的即时零售业务网络效应。 这样一旦建成,它就能真正创造价值,缩小整个交易中的损耗,为消费者提供真正物美价廉的商品和服务,并惠及股东和整个行业。
DeepSeek V4爆春节登场!四大杀招突袭全球编程王座,Claude危
新智元报道 编辑:桃子 定慧 【新智元导读】DeepSeek春节憋大招,V4要当「编程之神」!一个月后代码圈变天? 每逢假期,必发新品。 Information爆料称,DeepSeek将计划在2月中旬,也正是春节前后,正式发布下一代V4模型。 而这一次,所有目光都聚焦在同一维度上——编程能力。 目标:编程之王。 据称,DeepSeek V4编程实力可以赶超Claude、GPT系列等顶尖闭源模型。 要知道,如今Claude是全网公认的编程王者,真要击败了它,那可真不是小事儿。 毫无疑问,V4是继去年12月V3的重大迭代版,但内部测试者普遍反馈: 这不是一次常规的升级,而是一次质的跨越。 复刻R1春节核爆,全网期待值拉满 此次发布时间的选择,同样意味深长。 还记得,去年1月20日,恰逢春节前夕,DeepSeek R1重磅出世,在全网掀起了巨震。 R1的上线,最终被证明是教科书级的节奏:讨论密度、传播强度、社区反馈,全部被拉到了峰值。 或许这一次,DeepSeek希望再次复刻这种「时间窗口效应」。 自动播放 回看过去一年,DeepSeek的发展轨迹,其实已经给出一条清晰的叙事线: DeepSeek V3崭露头角,让国际开发者第一次正眼看这个来自中国的团队。 DeepSeek R1才是真正引爆的那个点。 一款开源「推理」模型,把「先思考、再作答」变成显性过程,用相对克制的训练成本,实现了复杂问题上的惊人稳定性。 这种「性价比反差」,直接击中了硅谷最敏感的那根神经。 随后,DeepSeek在国内,推出了由R1+V3加持的聊天应用,短时间内成为了现象级应用。 接下来的一年中,DeepSeek进行了多次模型版本迭代,比如V3.1、V3.2,智能体能力植入等等。 进入2025年,开源早已成为整个行业最大共识。 中国大厂与初创公司密集发布和开源,中国AI的存在感被整体抬升了一个量级,被视为全球开源AI领导力量之一。 上个月,DeepSeek V3.2出世,在部分基准测试上碾压GPT-5、Gemini 3.0 Pro。 这是DeepSeek在一直未推出真正意义上的重大换代模型的情况下,实现的反超。 也正因如此,V4被赋予了比以往任何一次迭代都更高的期待。 剑指编程王座,四大突破曝光 从目前流出的信息来看,DeepSeek V4在以下四个关键方向上,实现了核心突破,或将改变游戏规则。 编程能力:剑指Claude王座 2025开年,Claude一夜之间成为公认的编程之王。无论是代码生成、调试还是重构,几乎没有对手。 但现在,这个格局可能要变了。 知情人士透露,DeepSeek内部的初步基准测试显示,V4在编程任务上的表现已经超越了目前的主流模型,包括Claude系列、GPT系列。 如果消息属实,DeepSeek将从追赶者一步跃升为领跑者——至少在编程这个AI应用最核心的赛道上。 超长上下文代码处理:工程师的终极利器 V4的另一个技术突破在于,处理和解析极长代码提示词的能力。 对于日常写几十行代码的用户来说,这可能感知不强。但对于真正在大型项目中工作的软件工程师来说,这是一个革命性的能力。 想象一下:你有一个几万行代码的项目,你需要AI理解整个代码库的上下文,然后在正确的位置插入新功能、修复bug或者进行重构。以前的模型往往会忘记之前的代码,或者在长上下文中迷失方向。 V4在这个维度上取得了技术突破,能够一次性理解更庞大的代码库上下文。 这对于企业级开发来说,是真正的生产力革命。 算法提升,不易出现衰减 据透露,V4在训练过程的各个阶段,对数据模式的理解能力也得到了提升,并且不容易出现衰减。 AI训练需要模型从海量数据集中反复学习,但学到的模式/特征可能会在多轮训练中逐渐衰减。 通常来说,拥有大量AI芯片储备的开发者可以通过增加训练轮次来缓解这一问题。 推理能力提升:更严密、更可靠 知情人士还透露了一个关键细节:用户会发现V4的输出在逻辑上更加严密和清晰。 这不是一个小改进。这意味着模型在整个训练流程中对数据模式的理解能力有了质的提升,而且更重要的是——性能没有出现退化。 在AI模型的世界里,没有退化是一个非常高的评价。很多模型在提升某些能力时,会不可避免地牺牲其他维度的表现。 V4似乎找到了一个更优的平衡点。 最近一周,CEO梁文锋参与合著的一篇论文,也透露出一些线索: 他们提出了一种全新的训练架构,在无需按比例增加芯片数量的情况下,可以Scaling更大规模的模型。 论文地址:https://arxiv.org/pdf/2512.24880 技术溯源 从V3到V4,DeepSeek做对了什么? 要理解V4可能有多强,我们需要先回顾DeepSeek过去一年的技术积淀。 MoE架构:用更少的计算做更多的事 DeepSeek-V3的核心技术优势在于其创新的MoE(混合专家)架构。 V3拥有高达6710亿的总参数,但推理时每个token只激活约370亿参数。 这种稀疏激活机制让模型在保持超大规模的同时,维持了极高的推理效率。 更重要的是,DeepSeek改进了传统MoE模型的训练方法,采用「细粒度专家+通才专家」的策略——使用大量小型专家而非少数大型专家,更好地逼近连续的多维知识空间。 MLA:让推理更快、更省内存 另一个关键技术是MLA(多头潜在注意力)机制。 这项技术从V2就开始引入,通过将键(Key)和值(Value)张量压缩到低维空间,大幅减少推理时的KV缓存和内存占用。 研究表明,MLA在建模性能上优于传统的分组查询注意力(GQA),这是DeepSeek能够在有限硬件条件下实现高性能的关键。 R1强化学习经验 2025年1月发布的DeepSeek-R1是一个由强化学习驱动的推理模型,其核心技术后来被融合到了更新版的V3中。 这里有一个关键信息:V4很可能继承了R1在强化学习方面的所有优化经验。 如果说V3是「基础能力」,R1是「推理能力」,那么V4很可能是两者的完美融合——基础能力+强化学习优化+编程专项突破。 而且不要忘了刚刚发布的新论文mHC。 mHC:解决大模型训练的根本性约束 就在2025年12月31日,也就是V4爆料前不久,DeepSeek悄悄发布了一篇重磅论文:《mHC:Manifold-Constrained Hyper-Connections》(流形约束超连接)。 这篇论文解决了一个困扰AI行业十年之久的难题:大模型训练的不稳定性问题。 核心思想是什么? 在传统的神经网络训练中,信号在层与层之间传递时会出现放大效应——在不受约束的情况下,信号可能被放大3000倍。 这种失控的放大会导致训练崩溃、梯度爆炸等一系列问题,是阻碍大模型规模化的根本性瓶颈之一。 mHC的解决方案是:利用Sinkhorn-Knopp算法,将神经网络的连接矩阵投影到一个数学流形上,从而精确控制信号放大。结果:信号放大被压缩到仅1.6倍。 实际效果有多强? - 在BIG-BenchHard推理基准上提升了2.1% - 仅增加6.7%的训练开销 - 在高达270亿参数的模型上得到验证 业内专家评价:这项研究可能重塑整个行业构建基础模型的方式。它解决了一个限制大语言模型架构创新的根本性约束。 可以看出,DeepSeek一直在进行底层算法优化、数学工程优化,但不要忘了更重要的一件事: 这些优化都是在「限制之下」完成的,这也正是DeepSeek的厉害之处。 硬件限制下的算法突破 这才是真正的故事 在讨论V4时,有一个背景不能忽视:芯片出口限制。 外媒的报道特别提到,尽管面临芯片出口限制,DeepSeek依然在算法效率上取得了进展。这与其V3/R1系列的高性价比路线一致。 还记得V3的训练成本吗?约557.6万美元。 这个数字在当时震惊了整个AI行业,因为它远低于其他同级别模型——OpenAI和Google的训练成本往往是这个数字的几十倍。 DeepSeek用更少的资源做出更好的模型,这不是偶然,而是算法、框架和硬件协同优化的结果。 V4很可能延续这一路线:不拼硬件数量,而是拼算法效率。 如果V4真的在受限硬件条件下实现了超越Claude的编程能力,这将是一个极具象征意义的里程碑—— 证明在AI竞赛中,聪明的算法可以弥补硬件的不足。 悬念:V4还会有哪些惊喜? 根据目前的信息,我们已经知道V4在编程能力、长上下文处理、推理严密性三个维度上有显著提升。 但DeepSeek向来有低调憋大招的传统。 以下是几个值得关注的悬念: 1.是否会有蒸馏版本? DeepSeek-R1发布时,同时推出了一系列蒸馏版本,让更多用户可以在消费级硬件上体验强化学习推理模型。 V4是否会延续这一策略? 2.多模态能力如何? 目前的报道主要聚焦于编程能力,但V4在多模态(图像、音频等)方面是否有提升?这是一个未知数。 3.API定价会有惊喜吗? DeepSeek一直走极致性价比路线。 如果V4的编程能力真的超越Claude,但价格只有Claude的几分之一,那将是对整个市场的巨大冲击。 4.开源策略会变吗? V3和R1都在MIT许可下开源。 V4是否会延续这一策略?V5、V6呢,DeepSeek会一直开源下去吗? 考虑到编程领域的商业价值,这是一个值得观察的变量。 LMArena上的神秘身影:V4已经在野测了? 如果说以上都是内部消息,那么有一个线索可能暗示V4比我们想象的更接近: 有用户在LMArena(大模型竞技场)上发现了匿名模型,据说就是V4。 有人已经在LMArena上发现匿名模型,据说就是V4。 但由于模型会「撒谎」,还无法最终确认。 这是一个值得密切关注的信号。 如果The Information的报道属实,那么我们只需要再等不到一个月的时间。 届时,它是否能真正超越Claude成为编程之王? 敬请期待。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。