行业分类:
加载中...
头条分类:
加载中...
笑不活了,“日本最高性能AI模型”,是DeepSeek V3改了个名?
好家伙……我真的是直接好家伙! 3月17日,楽天(乐天)集团正式发布了Rakuten AI 3.0模型,号称是“日本国内最大规模的高性能AI模型”。官方宣传的参数量为约7000亿,并且日语特化,Apache 2.0开源许可,还拿了日本经产省和NEDO的GENIAC项目补助。 然而就是这样一个日本国民级的AI模型,不到12小时,爆出惊天大雷。 当天下午,有人打开了Rakuten AI 3.0在Hugging Face上的config.json。 第一行配置,architectures(架构)字段,赫然写着一个在中国家喻户晓的模型:DeepseekV3ForCausalLM. 而model_type字段为deepseek_v3。 也就是说,这个日本“国内最大规模的高性能AI模型”,正是DeepSeek V3。 01 事情的发现过程没有任何技术门槛。 Rakuten AI 3.0发布后,模型权重按惯例上传到了Hugging Face的楽天官方仓库。 任何人点进去,切到“Files and versions”标签页,打开config.json就能看到。 这个config.json是每个大模型都有的配置文件,记录着模型的架构信息。 architectures字段写的“DeepseekV3ForCausalLM”,意思是这个模型使用的是DeepSeek V3的因果语言模型架构。 不是“参考”,不是“借鉴”,是直接声明了模型类别。 往下看,hidden_size是7168,intermediate_size是18432,num_hidden_layers是61,n_routed_experts是256,vocab_size是129280。 这些数字和DeepSeek V3的原版配置一模一样。 说实话,真的是演都不演了。而且现在DeepSeek已经更新到V3.2了,V3幻觉太高,其实不怎么好用的。 难怪楽天的Rakuten AI 3.0号称“参数量约7000亿”,因为DeepSeek V3的参数量就是6810亿。 Hugging Face的模型页面上,标签栏里甚至直接挂着“deepseek_v3”的标签。这不是网友后加的,是模型上传时系统根据config自动生成的。 楽天自己的说法是基于开源社区最优秀的模型开发。 这句话写在官方新闻稿里,还写在Hugging Face的模型卡片里,也写在楽天集团的PR Times新闻通稿里。从技术角度讲,这句话没有说谎。 改了个名字确实也算是开发。 DeepSeek V3是开源模型,许可证也允许这么做。楽天在此基础上用自己的日语双语数据做了微调和优化,这个流程在业界很常见。 但问题在于,楽天在所有对外宣传中,从未提及“DeepSeek”这三个字。 新闻稿里没有,模型卡片的描述里没有,接受媒体采访时也没有。 所以当有人把config.json的截图贴到 X(原Twitter)上时,评论区的反应可想而知。 02 最先传播开来的是一张截图:Hugging Face上Rakuten AI 3.0的config.json 页面,architectures字段里的“DeepseekV3ForCausalLM”被蓝框高亮圈出。 截图下面,有人只写了两个词加一个问号:“deepseek V3?” 这条帖子被迅速转发到Impress Watch的报道推文下面。 Impress Watch是最早报道 Rakuten AI 3.0 的日本科技媒体之一,它的推文本来是一条普通的新闻转发,评论区却变成了另一番景象。 一个叫Ryu的用户写道:“日本终于到了用中国AI冒充日本产AI的时代了吗?” 底下的日语评论普遍都是骂街的,中文评论都是看乐子的,在这里我也就不放出来了,大家自行想象一下那个场景就好了。 诚然,严格来说,楽天没有违反任何规则。DeepSeek V3的开源许可允许商业使用和二次开发,在开源模型基础上做微调也是行业通行做法。 可是这事并没有那么体面。 2025年DeepSeek爆火的时候,日本媒体给它起了个名字,叫“AI界的黑船事件”。 黑船是 1853 年美国海军准将佩里率舰队强行叩开日本国门的历史事件,在日语里专门用来形容外来力量对日本造成的巨大冲击。 把一个中国的AI产品比作黑船,这个措辞本身就说明了很多。 日本政府的反应很快。2025年2月初,日本数字大臣平将明公开表态,称在安全疑虑消除之前,日本公务员应避免使用DeepSeek,或者在使用时格外谨慎。 他特别提到了个人信息保护的问题。随后,日本政府向各省厅发出警告,要求不要在政府设备上使用DeepSeek。 企业层面的动作更直接。 丰田汽车明确禁止员工使用DeepSeek,官方理由是“出于信息安全的考虑”。三菱重工同样实施禁令,即便员工提交内部申请也不会被批准。 软银则限制了公司内部对 DeepSeek 的访问,并禁止员工在工作设备上下载和使用。 可是现在……你怎么让我忍得住不笑啊!
互联网又一时代眼泪!新浪云官宣9月永久下线:结束17年历程
快科技3月18日消息,据新浪云服务团队官方公告,由于业务调整,新浪云服务将于2026年9月16日24时起下线并永久终止服务。 即日起新浪云将停止新用户注册、新服务开通及云豆充值服务,在服务下线完成后,将永久删除用户全部数据。 以下为官方公告: 1、即日起至2026年9月16日,新浪云服务停止新用户注册、新服务开通及云豆充值服务。在此期间,用户账户内已充值云豆及积分可正常使用。 2、已开通服务的用户,请您务必于2026年9月16日前完成业务迁出、数据导出、备份及账户相关信息清理工作。自2026年9月16日起,所有服务将不再可用,敬请用户提前做好业务迁移等准备。 3、为确保用户数据安全,新浪云服务下线完成后,将永久删除用户全部数据,请您务必于关停服务前完成数据迁出、备份等工作。 4、因用户未在规定时间内完成数据迁移、备份或未及时处理账户事宜而导致的任何数据丢失或业务中断,新浪云不承担相关责任,敬请用户提前做好安排。 官网页面显示,新浪云对外的主要产品包括应用云平台Sina App Engine(SAE)、企业云服务、MAE私有云解决方案、云虚拟主机、容器云等。 新浪云项目于09年8月立项,同年11月发布Alpha版,是国内第一个PaaS云计算平台。
OpenAI推出GPT-5.4 mini与nano,低延迟、性能逼近满血版
IT之家 3 月 18 日消息,OpenAI 公司昨日(3 月 17 日)发布公告,宣布推出迄今最强大的小型模型 GPT-5.4 mini 与 GPT-5.4 nano,专为高频且对延迟敏感的任务设计。 IT之家援引博文介绍,官方强调,在代码助手、系统截图解析以及实时图像推理等对延迟要求极高的场景中,响应迅速且能可靠调用工具的小型模型往往比大型模型更具优势。 这两款模型不仅继承了 GPT-5.4 的诸多优势,还专门针对高频工作负载优化,目的通过更快的响应速度和更高的效率,来提升产品体验。 GPT-5.4 mini 在编写代码、逻辑推理、多模态理解以及工具调用方面的表现远超 GPT-5 mini,同时运行速度提升了 2 倍以上。 此外,它在 SWE-Bench Pro 和 OSWorld-Verified 等多项基准测试中,成绩已经逼近体积更大的 GPT-5.4 模型。 凭借极低的延迟,GPT-5.4 mini 特别适合需要快速迭代的代码工作流,能够高效处理精准编辑、代码库导航及前端生成等任务。在多模态领域,它也能迅速解析密集的电脑用户界面截图,出色完成各类计算机操作任务。 GPT-5.4 nano 则是目前体积最小、价格最亲民的版本。作为 GPT-5 nano 的重大升级版,它专为将速度和成本视为首要考量的任务而生。开发者可以将其广泛应用于文本分类、数据提取、内容排序,以及处理简单辅助任务的代码子代理(Subagents)中。 两款模型目前已正式开放使用。GPT-5.4 mini 已全面接入 API、Codex 及 ChatGPT。 其 API 版本支持 400k 上下文窗口,输入与输出成本分别为每百万 Token 0.75 美元和 4.50 美元;在 Codex 中调用仅消耗 GPT-5.4 额度的 30%;在 ChatGPT 中,Free 和 Go 用户可通过“思考(Thinking)”功能体验。 相比之下,GPT-5.4 nano 目前仅通过 API 提供,其输入与输出成本极低,分别为每百万 Token 0.20 美元和 1.25 美元。
6G,从地面伸向天空
移动通信技术以十年一代的节律迭代。 面向2030年的第六代移动通信技术(6G),已进入关键窗口期—— 截至2026年,全球6G的关键技术在验证、标准在立项、原型样机在测试。这些都意味着,6G已不再是白皮书上的技术愿景,而是正走向工程现实。 围绕6G的技术、标准、产业的全球竞赛,已经全面展开。 作为《星船知造》“现代通信与智能网技术展望”系列栏目的第四辑,我们邀请通信行业教授级高级工程师钱鸿生博士为我们撰写了《6G从概念蓝图到工程试验跨越式演进的研究》。 本文为上篇,主要聚焦两个问题: 1,5G仍在深耕落地,我们为何必须向6G迈进? 5G的边界在哪里?6G能解锁哪些5G做不到的事? 2,全球通信竞赛中,中国此刻站在哪里? 5G的边界,挡不住未来的需求 大家经常听到的“1G、2G……5G、6G”,其实是“1G标准、2G 标准……6G标准”,指的都是无线通信技术标准。 比如5G,就是第五代移动通信技术——5th Generation Mobile Communication Technology,简称5G。 这些移动通信技术标准的更迭,从来不是技术人员的自娱自乐,而是每一代都在解锁新的可能、新的场景。当然,每一代也都有自己的边界,有自己的生命周期。 从个人感知看,每代标准都对应着一个时代的记忆—— 1G让我们挣脱了电话线的束缚,笨重的“大哥大”握在手里,是身份的象征,也是移动时代的开始。 2G聊QQ,第一次知道了“在线”是什么感觉。 3G刷微博,叩开了移动互联网的大门,催生出早期的移动应用生态。 4G支撑起了短视频、直播、移动支付,一部手机装下了整个生活。 5G呢?一定程度上,它没有像4G时代那样出现多款国民级应用。但这不是5G的问题。作为一项技术、一个标准,5G解决的是技术侧、网络侧的问题。C端使用感知不强烈则包含了相关应用、产品太少等多个原因。但5G已经构建起了人、机、物全面互联的基础。 更多5G阅读:星船知造《华为之外,1998—2023:芯片背后的持久战》 到了标准主导权的牌桌上,故事又要复杂得多。 1G时代,欧洲制定规则,中国连上桌的资格都没有。整个移动通信市场被七个国家的八种制式瓜分,史称“七国八制”。 2G时代,欧洲的GSM与美国的CDMA分庭抗礼,中国依然是旁观者。 3G时代,格局终于松动。中国的TD-SCDMA、欧洲的WCDMA、美国的CDMA2000,首次并列为三大国际标准。 从1992年引进第一个GSM商用系统算起,我国用了十年时间,发展了2.8亿移动用户,成为全球最大的移动经营网络——也有了自己的底牌。 4G时代,欧洲出局,全球就中美两家标准。同时针对中国企业的“实体清单”出现。 5G时代,可以简单理解为大家共用一套标准,各国分别加入自己的技术:比如华为、中兴、美国高通各自拥有多项专利。整体上看的话,美国5G落后于中国,也因此制裁手段多措并举。 和4G颇为不同的是,5G时代大家不再把5G作为单个通信技术来探讨,而是作为国家发展的基础设施来看待。 移动通信技术每十年迭代一次。 6G的演进,也和此前每一代移动通信技术一样,将历经以下6个阶段👇 1,标准提出 2,标准制定 3,厂商根据标准研发设备 4,电信运营商采购先进设备 5,网络部署 6,业务运营等全过程 目前全球6G正进入标准立项制定与原型样机测试的关键窗口期。 2026年1月,国新办官宣:我国6G研发完成第一阶段关键技术试验,形成超300项关键技术储备,正式启动第二阶段技术方案试验。这标志着我国6G已完成概念验证与技术体系构建,全面进入工程化落地试验时期。 预计2030年前,中国6G将实现规模化组网商用。 中国6G实施时间表,见下图👇 中国6G关键技术试验三阶段实施图,见下图👇 为什么全球大国都必须向6G迈进? 因为5G的10Gbps峰值、1ms时延、地面基站组网模式,在面对全息通信、远程精密操控、海洋沙漠盲区覆盖等未来场景时,显得力不从心:主要是不够快、不够广、不够聪明。 不够快——从性能指标来看,5G峰值速率为10Gbps级别,面对未来的全息通信、超高清三维影像传输、元宇宙沉浸式交互等场景的超大带宽需求就会显得速度不够。 比如,空口时延最低仍需1ms,对于远程精密工业操控、无人系统实时响应、高阶自动驾驶等场景而言,这一时延差距足以影响操作安全与实际体验。 不够广——5G是以地面基站为主的组网模式,存在天然的覆盖局限👇 在海洋、沙漠、高空、极地等区域形成大量通信盲区,无法满足远洋作业、极地科考、应急救援等场景的连续通信需求。 而人类的活动范围正不断向高空、远海、深空延伸,低空经济、卫星互联网、海洋经济的蓬勃发展,迫切需要一张无死角、全覆盖的全域通信网络。 不够聪明——5G的核心能力集中在“通信连接”,缺乏环境感知、分布式计算、智能推理的融合能力。而未来的智能工业、智慧城市、智能交通,需要网络不仅能承担“数据传输管道”的角色,更能成为“智慧感知终端”“智能决策大脑”,实现通信、感知、计算、智能的一体化融合。 在此背景下,6G的核心目标是—— 从“地面覆盖”到“空天地海全域覆盖”:它将突破地面的限制,把信号送上天空,送入深海,送入那些5G无法抵达的角落。 从“单一通信”到“通感算智一体化”:将不再是单纯的连接,而是连接与感知的融合。基站不仅能通信,还能“看见”环境;网络不仅能传输数据,还能计算智能。 总之,5G的使命,是“万物互联”。而6G的愿景,是“万物智联”👇 图说:6G设想启用新的使用场景,包括沉浸式通信、超可靠和低延迟通信、超大规模通信、无处不在的泛在连接等。 6G相比5G,一要“性能跃升”。二要“场景升级”。 先看性能。 根据ITU与IMT-2030推进组2025年发布的最新指标,6G的性能指标相较于5G实现了十倍甚至百倍的提升。将带来七个维度的极致突破。点击下图可放大👇 图:6G网络性能参数估计目标值 上图中有“七大极致性能”: 一是超高速率。 6G峰值速率可达1Tbps~10Tbps级,是5G的10到100倍,体验速率达10至100Gbps。 一部8K超高清电影,1秒下载完成。全息内容、元宇宙交互,不再受带宽束缚。 二是亚毫秒时延。 端到端时延降至0.1毫秒以下,比5G提升10倍。物理世界与数字世界,第一次可以实时同步。远程精密手术、工业机器人协同、高阶自动驾驶,真正实现“零延迟”操作。 三是超密连接:千机同组网,全域皆互联。 连接密度达1000万台/平方公里,是5G的10倍。大规模物联网设备、海量传感器、无人机群,可以同时在线、并发接入。城市级物联,不再有拥堵。 四是超高移动性:极速仍在线,连接不中断。 支持1000公里/小时以上的移动速度。高速列车、民航客机、低轨卫星,在极速移动中依然保持稳定连接。 五是全域无缝覆盖。 深海、沙漠、极地、高空——这些5G无法触及的盲区,6G将一一覆盖。远洋作业、极地科考、应急救援,从此拥有连续稳定的通信保障。 六是感知精度。 厘米级甚至毫米级感知,成像分辨率1至3毫米。网络不仅能传输数据,还能完成环境成像、目标追踪、行为识别,成为真正的“智能感知系统”。 七是绿色高效节能。 网络能效提升100倍,终端感知电池寿命可达20年。5G基站高能耗的痛点,在6G时代有望彻底解决。 当然,这些指标目前仍是目标值。随着标准制定推进,部分参数可能调整,有些极致性能可能无法同时满足。但这不影响6G整体技术方向的确定性。 source:pixabay 再看场景。 下面这些场景并非《星船知造》的概念设想,而是已经在我国6G试验网中得到验证的现实,具备规模化落地基础👇 全息通信与元宇宙交互:跨城市开会,对方坐在你对面。远程全息教学,老师在你身边走动——依托超高速率、低时延与原生AI能力,让人与场景的全息实时互动成为日常。 低空经济与无人机自主调度:大规模无人机群,在空天地海一体化网络中精准定位、实时调度。物流配送、电力巡检、应急救援、农业植保——低空产业的价值被进一步激活。 智能网联汽车与“车路云一体化”:亚毫秒时延、厘米级定位,让车与车、车与路、车与云实现全方位实时交互。L4级以上高阶自动驾驶,有了可以落地的通信底座。 工业数字孪生与无人制造:物理工厂的每一台设备,在数字世界都有一个同步的孪生体。实现柔性生产、预测性维护,推动工业生产智能化革命。 远程沉浸式诊疗与手术:基层医院的复杂手术,由顶级专家远程指导。超高清、低时延、高可靠的6G网络,让优质医疗资源跨越地理阻隔。 空天地海一体化应急通信:地震、洪水、台风之后,地面基站可能瘫痪。6G可以在极端场景下快速构建全域通信网络,为救援指挥提供稳定保障。 智慧能源与全域物联网:风电、光伏、电网,在6G网络上实现源网荷储的智能交互。实时监测、智能调度、故障预警——能源利用效率被推向新高度。 城市级数字孪生与智慧城市:一座城市,在数字世界有一个完全同步的孪生体。交通信号智能调控,安防事件自动预警,市政设施预测性运维。城市治理,从“被动响应”走向“主动感知”。 总之,如果说5G的核心是“实现万物互联”,让世间万物建立起数字化连接,那么6G的核心,便是“实现万物智联”,让所有连接都具备智能感知、智能决策的能力。 五强同台,中国站在哪里? 6G标准话语权的争夺战,几年前就已悄然打响。 2024年,美国、澳大利亚、加拿大、捷克、芬兰、法国、日本、韩国、瑞典、英国——十个国家发布联合声明,拉起一个名为“6G”的联盟。他们要用抱团的方式,完成一次弯道超车。 同一年,英伟达、亚马逊网络服务公司、ARM、爱立信、微软、诺基亚、三星电子、软银,这些欧美日韩的科技巨头,成立了“AI-RAN联盟”。目的也很明确:在6G研发领域抢占关键位置。 很明显,6G正在成为全球科技大国竞争的新疆域。 source:北京香山酒店。1998年,一场在北京香山酒店召开的会议,决定了中国通信产业的命运与走向 今天全球6G的牌桌上,五强同台:中国、欧盟、美国、日本、韩国。各有所长👇 欧盟聚焦网络架构与绿色通信:通过Hexa-X-Ⅱ等项目,联合爱立信、诺基亚开展技术攻关。他们在绿色节能、隐私保护方面积累了一定优势——这很“欧洲”,用规则和标准说话的老派打法。 美国依托半导体优势,布局底层芯片:主要依托Next G联盟,重点布局底层芯片、卫星互联网、AI算法——美国试图用硅谷的基因,在6G的底层筑起一道技术壁垒。半导体是它的长板,也是它最趁手的武器。 韩国在终端器件制造上发力:三星、LG撑起整个阵营。主攻终端器件、射频芯片制造、小型化模组等——韩国人把在消费电子领域练就的制造能力,聚焦到了6G终端产业链研发上。 日本在高频材料与光通信上做积累:日本在高频材料、光通信技术、精密器件上拥有传统制造业优势,通过B5G/6G论坛开展相关研发,试图在核心器件领域卡住一个关键位置。 那么,五强同台,中国站在哪里? 答案是:暂时领先,而且领先不止一个身位。 我国是全球首个完成第一阶段关键技术试验并启动第二阶段试验的国家——2025~2026年是6G发展的历史转折点,我国6G相关专利规模、试验基础设施等均达到全球领先水平👇 一是技术研发进度领先。作为全球首个完成第一阶段关键技术试验的国家,也是首个启动第二阶段试验的国家,核心技术成熟度高。 二是专利布局优势明显。我国6G核心专利占比35%位居世界第一,覆盖6G全核心领域,掌握标准制定核心话语权。 三是产业链体系完善。6G全系列原型样机已经完成开发。核心芯片国产化覆盖率达到85%以上,部分性能达到国际领先水平。 四是试验基础设施完备。多场景、多技术融合的试验环境已经建成。联合各行业开展的示范应用,正在加速6G与实体经济的深度融合。 预计2030年前,中国6G将实现规模化组网商用。 source:unsplash 我国目前已在空天地融合等领域形成一定的技术壁垒,华为、中兴等企业构建起完整的6G产业链体系。 《星船知造》梳理了我国6G关键技术的六大突破性进展👇 它们像六束光,照亮了6G从地面伸向天空的路径。 首先是空天地海一体化网络。 6G要做的第一件事,是让信号抵达那些5G永远无法到达的地方。做到真正的“全球无死角”。 这需要一张立体的网👇 空天地海一体化网络,顾名思义就是——“空”,有低轨卫星星座。“天”,有高空平台站(HAPS)。“地”,有地面宏基站、微基站、室内接入点。三层嵌套,无缝切换,用户穿行其间,却感觉不到信号经历过切换。 2026年,我国成功完成星地协同传输、跨域干扰协调等关键技术验证,突破多普勒频移补偿、星地精准同步等难题,同步精度达纳秒级。 实测显示,我国星地融合网络可在机载、舰载、偏远地区提供Gbps级稳定连接,端到端时延控制在5ms以内,完全具备工程化部署条件。 更关键的是,中国自主研发的低轨卫星通信载荷,已经实现了与地面5G/6G网络的无缝对接。星地接口协议完成了标准化验证、高空平台站技术也同步突破——这意味着,可在20公里高空实现偏远地区、海岛、山区的低成本宽带覆盖。 source:unsplash 二是通感算智一体化。 6G与5G的本质区别之一,就是“通感算智一体化”。 5G只管通信。6G不一样——不仅能通信,还能感知、能计算、能推理。 在6G 移动通信系统中,更高的频段(毫米波和太赫兹应用)、更宽的带宽、更大规模天线阵列使高精度、高分辨感知成为可能,从而可以在一个6G系统中实现通信感知一体化(Integrated Sensing and Communication)ISAC。 通感算智一体化是6G最核心的技术特征,也是6G区别于前代技术的标志性能力。 它将通信、感知、计算、智能四大能力深度融合,实现“一频多用、一网多能”,通信信号不再仅用于数据传输,同时承担环境感知、目标检测、定位追踪的功能。网络边缘节点集成计算与AI能力,无需依赖云端即可完成实时决策与推理。 2026年,我国基于原生AI的6G基站原型完成外场测试,可自主优化资源分配、实现故障自愈,相比传统基站能效提升30%以上,频谱效率提升40%。通感一体化技术实现车辆、行人的厘米级定位与轨迹追踪,结合AI算法可完成行为预测、环境建模,真正实现“通信为基、感知赋能、智能驱动”。 原生AI网络让6G具备“自感知、自决策、自优化”能力,大幅提升网络运行效率与可靠性,降低运维成本。 三是太赫兹、可见光与超宽带通信——突破了超高速瓶颈。 太赫兹频段超高速通信是一种新型的无线传送方式,也是6G实现Tbps级超高速率的核心技术。 与传统的无线网络不同的是它工作在太赫兹频段。 太赫兹(缩写为THz),太赫兹频段是指介于毫米波和红外线之间的频谱范围,其频率范围在0.1THz至10THz之间,频率一般为300-3000GHz范围之内。 这里的频谱资源极其丰富,足以支撑Tbps级的超高速率。点击下图👇 图:传统通信频率与太赫兹(THZ)频率分布图 2026年,我国科研团队在0.3 THz频段实现100 Gbps稳定连续传输,短距离速率突破200 Gbps,传输距离200米,完成室外非视距传输验证,突破技术瓶颈。 核心器件的国产化是另一大重要突破。高速砷化镓功放、高线性度混频器、超窄带滤波器、太赫兹天线阵列——这些曾经依赖进口的关键部件,已经完成国产流片验证,性能达到国际先进水平。 华为研发的ISAC-THz室外通信样机,实现500米240Gbps业界最高速率,正在推进太赫兹通感一体化技术的小型化、组网研究。 此外,可见光通信和超宽带技术也在同步演进。我国可见光通信单灯速率达1 Gbps,支持亚米级室内定位,适用于医院、矿井、核电站等电磁受限场景。超宽带技术实现厘米级定位。技术互为补充,共同构筑6G的“空口超高速接入”体系。 四是光无线融合通信系统。能优化接入覆盖,提升网络体验。 光无线融合(OWC)结合光纤高带宽与无线灵活接入优势,是6G“最后100米”高速接入的关键方案。 2026年,我国基于智能反射面的光无线全双工系统实现单用户10Gbps峰值速率、整网100 Gbps吞吐量,端到端时延低于1ms。 可支撑家庭全息娱乐、工业高密设备接入、人员密集场景高速上网,彻底解决带宽不足、信号覆盖不均问题。 五是新型多址与无蜂窝大规模MIMO。能优化接入覆盖,提升网络体验。 传统基站是“蜂窝”结构——每个基站覆盖一片区域,用户在不同蜂窝间移动,信号在不同基站间切换。切换就会有中断,边缘就会有弱区。 无蜂窝大规模MIMO打破了这种结构。 MIMO多输入多输出(Multiple-Input Multiple-Out-put),简称 MIMO技术,其原理是在发射端和接收端,分别采用多个发射天线和接收天线,能够区分发往或来自不同空中方位的无线信号,在不增加带宽与发射功率的情况下,提高系统的覆盖范围、容量和信噪比,从而改善无线信号的传送质量。 该技术将传统基站的集中式天线拆解为大量分布式天线,通过云化集中处理,实现全网天线协同调度,让用户始终处于最优信号覆盖中——无论你在哪里,都像是被一群天线共同服务。 目前我国已完成该技术在密集城区、工业园区的外场测试。结果显示:小区边缘速率提升50%以上,系统容量翻倍。这意味着,即使在人口密集的场景中,海量物联网设备也能同时并发接入而不拥堵。 六是6G网络内生安全与可信体系:筑牢安全屏障,守护数字安全。 5G时代,发现了漏洞,打补丁;遭遇了攻击,再防御。 6G的思路完全不同——把安全能力嵌入网络架构本身,实现安全与网络的同步设计、同步部署、同步运行。这就是“内生安全”。 中国构建的6G内生安全与可信体系,融合了零信任架构、区块链、量子安全加密算法。每一次数据传输都可追溯,每一条通信链路都经过加密。它可以有效抵御AI对抗攻击、数据篡改、非法入侵等新型网络风险。 2026年,我国建成全球首个6G内生安全试验验证网。完成金融、电力、政务、轨道交通等关键领域安全测试,实现终端身份、数据传输、网络行为全可信——为6G规模化商用筑牢安全屏障。 没有这道屏障,万物智联的时代就始终悬着一把剑。 尾声 从1G到5G,中国移动通信走过了一条漫长的路。 1G时代,我们是观众。2G时代,我们是追随者。3G时代,我们第一次拥有了自己的声音。4G时代,坐稳了牌桌。5G时代我国实现技术、标准、产业全面领先。 今天,6G的赛道已经开启。我国提前布局、主动出击,凭借完善的产学研用协同创新体系、强大的产业链配套能力、扎实的技术积累,迈出了坚实的探索步伐👇 ●我国已完成6G宏基站、小基站、有源天线单元、核心网设备、卫星终端、车载模组、行业终端等全系列原型样机的开发,形成了完整的系统设备与终端产品体系。 ●在核心芯片领域,太赫兹芯片、相控阵芯片、基带芯片、射频芯片、AI算力芯片均实现关键突破,国产芯片覆盖率达85%以上,部分芯片性能达到国际领先水平。 ●截至2026年,全球6G核心专利数量排名中,我国以占比35%位居第一,在通感算智一体化、空天地融合、智能网络、高频通信、内生安全等领域形成优势技术壁垒,为我国6G产业发展奠定了坚实的知识产权基础。 ●华为、中兴、大唐等企业的专利布局覆盖3GPP标准关键接口、核心算法、系统架构等核心环节,掌握了标准制定的核心话语权,能够有效保障我国产业利益。 但我们也清醒地认识到,6G的发展从来不是单一企业、单一行业的独角戏,而是需要政府、科研机构、设备厂商、运营商、行业企业等多方协同发力的系统工程,更是需要全球各国开展技术合作、标准协调的“全球大合唱”。 6G技术突破需要产学研用深度融合,集中力量突破核心芯片、高频器件等“卡脖子”技术。 全球发展需要各国秉持开放、合作、共赢的理念,摒弃零和博弈思维,共同制定全球统一的技术标准与规则,推动6G网络全球互联互通,让6G的价值惠及全人类。 未来,科幻作品中畅想的全息通信、元宇宙交互、无人化工厂,都将一步步从想象走进现实,为人类社会发展注入全新动力。
手机进入全面涨价时代,王腾建议投更多资源在老产品维护和升级
IT之家 3 月 18 日消息,OPPO、vivo 等品牌已官宣对部分产品建议零售价进行调整。这标志着因内存涨价潮,手机全面进入涨价时代。 业内人士指出,现在行业境况是新机发的越晚,物料(内存)价格越高。但如果提前发布,前代旗舰的生命周期又被压缩。IT之家注意到,今日宜休科技公司创始人王腾(原小米中国区市场部总经理、REDMI 品牌总经理)给出了自己的建议: 建议不发,主要手机硬件也很难有大的革新,维持原有的迭代模式很低效。可以投更多资源在老产品维护和升级,留住老用户,开发好手机版 OpenClaw,手机厂商主要靠移动互联网收入为利润,有很多商业价值可以挖掘。 据IT之家今日早些时候报道,内存涨价潮致存储行业迎“黄金期”,消息称三星电子到明年的全部存储芯片产量预计即将售罄。当下为确保供应,客户企业越来越倾向与三星签署长期采购协议,甚至有公司提出签订直至 2030 年的五年合约。 另外,在 MWC 2026 世界移动通信大会上,小米集团合伙人、总裁、手机部总裁、小米品牌总经理卢伟冰也谈到了存储涨价问题,并表示本轮存储涨价是一个长周期,他判断大约会涨到 2027 年底,从 2025 年二季度到 2027 年底接近三年时间,这是在以前的历史上从来没有过的。
黄仁勋大赞“龙虾”:OpenClaw绝对是下一个ChatGPT
黄仁勋接受采访 凤凰网科技讯 北京时间3月18日,据CNBC报道,英伟达CEO黄仁勋(Jensen Huang)周二指出,开源智能体OpenClaw的快速兴起,是人类与AI互动方式上的一大进步。OpenClaw因其标志为红色龙虾,被俗称“龙虾”。 黄仁勋周二在英伟达GTC大会间隙接受CNBC采访时表示:“这是人类历史上规模最大、最受欢迎、最成功的开源项目。它绝对是下一个ChatGPT。” OpenClaw是一个开源AI智能体平台,其功能超越了传统的聊天机器人。与传统机器人仅能回答问题不同,这类智能体能够在仅需用户极少输入的情况下,完成任务、做出决策并采取行动。 英伟达已迅速行动,围绕着OpenClaw引发的热潮进行布局。该公司在周一宣布推出NemoClaw,这是一个企业级的OpenClaw版本,将英伟达的软件栈和工具集成在该平台之上。英伟达的目标是让这些强大的AI智能体安全运行、可扩展,并为实际应用做好准备。 黄仁勋将这项技术描述为一种根本性变革,可能会极大地拓展个人运用AI所能实现的边界。“只需一行代码,你就可以为自己创建一个专属智能体。然后,你只需吩咐这个智能体去做你想做的任何事情。”他表示。 他用一个现实案例阐释了这一概念:设计厨房。通过一个简短的提示,OpenClaw智能体就能自主研究图像、学习设计工具、迭代构思并优化其输出成果。“它会自行去学习如何设计一个厨房,然后带着设计方案回来,并进行自我反思和改进。”黄仁勋在描述该系统如何优化自身工作时这样表示。 黄仁勋补充说,这项技术更深层的意义在于促进个人专业能力的提升。“每个木匠现在都可以成为建筑师,每个水管工也能成为建筑师。我们将提升每个人的能力。”他说道。 不过,以OpenClaw为代表的AI智能体的迅速崛起,也引发了人们对其安全性、隐私性和可控性的担忧,尤其是在这些系统获得独立行动能力之后。 这正是英伟达看到的商机。借助NemoClaw,英伟达正在构建包含隐私保护、监控工具和企业级安全机制在内的防护措施,以确保这些智能体能够安全地大规模部署。化解这些风险,对于开启下一波AI应用浪潮—至关重要。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
三星面临史上最大罢工:6.6万人投票,93.1%赞成
据韩联社报道,三星电子工会联合斗争总部于3月18日对外宣布,在3月9日至18日的罢工投票中,工会以93.1%的投票赞成率获得了罢工权。 此次参与投票的工会包括超级企业工会三星电子分会(拥有超过 60,000 名会员,占总数的多数)、全国三星电子工会和三星电子同行工会。这三大工会的 89,874 名注册会员中有 66,019 人参与投票,投票率为 73.5%,其中 61,456 人投了赞成票,投票赞成率高达93.1%。 △2024年7月,三星电子全国工会总罢工决议大会,当时罢工人数仅6540人参加。 由于此前韩国中央劳资关系委员会已经决定暂停调解,因此,通过此次投票结果,三星电子工会联合斗争总部已依法获得了罢工权。 根据计划,三星电子工会联合斗争总部计划在4月23日举行成员集会,并于5月21日至6月7日举行为期18天的全国总罢工,要求三星电子提高绩效奖金计算标准的透明度,取消绩效奖金上限,并要求工资增长 7%,作为 2026 年工资谈判的关键诉求。 如果此次罢工得以实施,这将是三星电子自 1969 年成立以来遭遇的第二次大罢工,距离上一次2024年7月的25天总罢工仅不到两年。 据悉,三星电子的多个工会于2025年11月组建了联合谈判小组,与三星电子进行了约三个月的工资谈判,但由于劳资双方立场僵持不下,工会于2月19日宣布谈判破裂,并向韩国国家劳动关系委员会申请调解。 韩国国家劳工关系委员会在3月3日的第二次调解会议上决定暂停调解。作为回应,工会采取行动,将联合谈判小组转变为联合斗争总部,并就批准或否决工业行动进行投票,以确保罢工权。 根据三星电子在谈判破裂后披露的细节,该公司提出了一项计划,允许工会在 20% 的 EVA(经济增加值)或 10% 的营业利润中选择一个作为 OPI(超额利润激励)的来源,以回应工会要求绩效奖金制度透明化的要求。 此外,三星电子还提出了各种薪酬福利改善计划,包括工资增长 6.2%,提供 20 股公司股票,提高各职位级别的工资上限,以及扩大长期服务假。 然而,由于工会并未排除在不同业务部门之间区别对待 OPI 的可能性,并降低了基本工资增长的要求,同时拒绝放弃取消 OPI 上限的要求,谈判最终破裂。 业内专家预测,如果针对三星电子的全国性罢工开始,三星电子的营业利润可能损失高达 9 万亿韩元。 近日,三星电子工会联合斗争总部会长崔承浩也警告说,如果罢工持续18天,三星电子将损失至少达到5万亿韩元。 得益于人工智能热潮所带来的“存储超级周期”,三星电子克服了过去两年糟糕的业绩表现,在2025年实现了创纪录的333.6万亿韩元销售额和43.6万亿韩元营业利润。2026年,三星电子正向今年 200 万亿韩元营业利润的“梦想纪录”发起挑战。上个月,三星电子开始大规模生产和出货全球首款高性能 HBM4,并开始重新夺回全球AI内存市场的领导地位。 如果此次总罢工最终实施,三星电子这些计划将不可避免地受到重大干扰。 据了解,超级企业工会三星电子分会的成员中有 70% 到 80% 属于三星 DS(Device Solutions)部门,该部门主要负责三星电子的半导体业务。 三星DS部门在公司业绩中占绝对比例很高,去年第四季度公司20万亿韩元的总营业利润中,DS部门贡献了16.4万亿韩元,因此DS部门参与罢工的程度越高,公司的损失就越大。业绩炸裂!三星半导体业务获利暴涨465.5%,SK海力士暴涨137%! 此外,由于近期中东危机导致国际油价飙升、各种原材料成本增加以及对半导体设备和材料供应中断的担忧等因素,商业不确定性正在迅速加剧。 由于内存价格飙升加剧了盈利能力的下降,负责设备(成品)业务的 DX(设备体验)部门开始采取高强度的成本削减措施,例如要求副总裁以下级别的管理人员在短途航班上乘坐经济舱。 工会决定罢工,给今天在股东支持下召开的三星电子年度首次股东大会泼了一盆冷水。 DS事业部负责人、首席执行官兼副董事长全英铉回应股东们的鼓励,说道:“你们遭受了很多苦难”,并表示“我将尽最大努力确保不再出现像去年那样的反思和担忧”,但不到三个小时后,工会就宣布罢工。 三星电子工会联合斗争总部表示:“绝大多数三星电子员工已明确表示,管理层目前的提议与‘人才优先’的经营原则不符,这是对管理层的强烈警告,要求他们采取行动实现员工的诉求。”并补充道:“我们将通过4月份的集会和5月份的总罢工,逐步向管理层施压。” 三星电子一位官员表示:“公司将尽最大努力顺利完成2026年的工资谈判。” Heungkuk Securities分析师Sohn In-joon表示,由于取消奖金上限(目前为年薪50%)是一个棘手问题,工会与公司达成协议将面临艰难挑战。取消上限可能拉大芯片业务部门与手机、电视等其他事业部的薪酬差距。因为,手机、电视等其他事业部在当前存储芯片价格暴涨、市场竞争激烈的背景下,获利正在下滑。
和李宇春同台亮相太古里,库克二次到访成都有何深意?
3月18日,苹果CEO库克突然现身成都太古里,参加苹果50周年活动。当天,库克身着卡其色春装外套,白底T恤衫,与李宇春等多位艺人同台,还亲切地与观众用中文打招呼。 第一财经记者了解到,此次库克访华一方面是庆祝苹果50周年,另一方面他也是中国发展高层论坛(CDF)的常客。2026年的CDF将于下周在北京召开,这两天已有部分全球企业CEO陆续抵达中国开始访问行程。 这也是库克今年的首度访华。去年10月,库克已经到访过北京、上海,他还现身抖音直播间为iPhone Air带货。 此次库克再次到访中国并选择成都也是苹果公司精心安排设计的,这也是他第二次来到成都。三年前的秋天,库克也曾造访成都。 成都作为中国西部经济的“桥头堡”,与苹果供应链也有着紧密的联系。从精密零部件到整机组装,成都是苹果全球供应链中的关键一环。例如,位于成都崇州经济开发区的捷普科技(成都)有限公司,曾是苹果重要零部件供应商之一,工厂规模庞大,员工数量一度超过6万人。 第一财经记者查询公开信息了解到,捷普科技早期为苹果等客户提供粘合剂、阳极氧化等产品及手机零部件制造。2023年8月,比亚迪电子以158亿元收购了捷普成都等地的制造业务,捷普现已成为“成都比亚迪”的一部分。 此外,富士康成都厂区同样是苹果全球生产体系中的关键力量,多次承担苹果核心产品的生产任务。数据显示,全球每售出两台iPad,就有一台烙有“成都制造”的印记。3月17日,苹果公司首席运营官Sabih Khan也拜访了富士康成都工厂的iPad总装业务。据介绍,富士康成都还扩展了MacBook和Apple Watch的总装线,以及显示屏和外壳生产线。 近年来,成都电子产业制造已成为当地的一张名片。数据显示,全球近一半的高端柔性屏在成都制造。京东方全国首条、全球第二条8.6代AMOLED产线京东方B项目也是四川省投资体量最大的工业单体项目,规模达630亿元人民币,预计今年将实现量产,将为苹果等品牌商提供配套。 库克此次访华正处于苹果在中国新品发售期间。上周,苹果史上最亲民版智能手机iPhone 17e与笔记本电脑MacBook Neo正式在中国开售。此次发售的两款产品打破了苹果以往的价格底线,国补后均低于4000元,反映了苹果在激烈的竞争环境下不得不“放下身段”,作出价格方面的战略调整。 中国既是苹果全球最重要的供应链所在地,也是最重要的市场之一。截至12月27日的苹果季度财报显示,该季度中国市场销售大反弹,收入劲增近40%,达到255亿美元规模。库克在财报发布会上对于在中国市场的这一成绩表示满意。
谁为特斯拉的百万机器人造“关节”?
随着AWE2026上特斯拉第三代Optimus的亮相,马斯克的百万台量产承诺,似乎已近在眼前。 谁在为Optimus造“关节”?过去一段时间,外界众说纷纭,始终未有正式回应。直到最近,五家中国供应商集体赴泰国建厂的消息,首次让特斯拉的“O链”(Optimus供应链)浮出水面。 今年2月,泰国媒体报道称,泰国投资促进委员会已批准新剑传动、贝特科技、三花智控、拓普集团、旭升集团在泰国投资设厂,生产人形机器人结构框架及关节、手臂和手指控制系统,建厂的主要目标市场是为“特斯拉机器人”以及其他主要科技公司(包括苹果、三星和华为)供应零部件。 细看这份“O链”名单,分工一目了然:三花智控生产执行器,为机器人提供“肌肉”动力;拓普集团负责关节模组和执行器等,连接机器人的“骨骼”;旭升集团生产关节等部件;新剑传动和贝特科技生产行星滚珠丝杠,掌控机器人的细微动作。 这些企业大多与特斯拉在新能源汽车领域合作多年。当人形机器人风口来临,它们凭借在精密制造上的技术积累,将业务触角延伸至人形机器人领域,切入机器人的执行器、滚珠丝杠、关节、手臂等关键部件供应链。 今天,我们就来盘点一下,马斯克的“O链”,到底有着哪些熟悉的面孔? 01 最受关注的是三花智控。作为特斯拉的老牌供应商,在媒体报道中,它即将为擎天柱生产执行器,这是人形机器人关节运动的核心部件,相当于机器人的“肌肉”。 三花智控是做农机和空调配件起家的,后来切入新能源汽车产业,在2017年成为特斯拉一级供应商,提供热管理零部件,市场早已将其视为“特斯拉概念股”。 2023年,三花智控开始布局机器人机电执行器业务,包括旋转和线性执行器,并为此投资建厂。2024年1月,三花智控计划在杭州投资38亿元建设机器人机电执行器和域控制器研发及生产基地。 在机器人业务上,三花智控还处于初步阶段,但已经开始和客户合作。2025年上半年,三花智控已配合客户进行全系列产品研发、试制、迭代、送样,并取得了一系列围绕现有产品的创新成果。 尽管三花智控从未承认是特斯拉Optimus机器人供应商,市场消息却总能扰动股价。 去年10月,有市场消息称,特斯拉向三花智控下达了超过50亿元的线性执行器订单,并计划于2026年第一季度开始交付。市场估算,这至少生产18万台特斯拉Optimus人形机器人。 这一消息导致三花智控在A股和港股同时上涨,A股当日上涨10%。以至于三花智控紧急发布澄清公告称“该传言不属实”,不存在应披露而未披露的重大事项。 同样作为特斯拉的老牌供应商,拓普集团早在2016年就已是特斯拉的底盘供应商,后来也切入了机器人业务。 2023年,拓普集团成立电驱事业部,切入具身智能机器人领域。后来,拓普集团拟投资50亿元建设机器人电驱系统生产基地。 除了电驱执行器,拓普集团还布局了机器人躯体结构件、传感器、足部减震器、电子柔性皮肤等。 其2024年年报显示,拓普集团与客户从直线执行器开始合作,后又启动了旋转执行器的研发,然后又开始研发灵巧手电机等产品,已经多次向客户送样。 虽然并未明确客户是谁,但是在媒体报道中,拓普集团即将为特斯拉机器人生产关节模组和执行器等。 另一家特斯拉多年核心供应商旭升集团,即将为Optimus生产关节和骨骼部件。 旭升集团成立于2003年,在铝合金成型工艺上优势突出,长期从事精密铝合金零部件的研发、生产与销售,产品主要供应于新能源汽车的电驱动、电池、底盘及悬挂等系统。 早在2013年,旭升集团就与特斯拉达成合作,成为其一级供应商,为特斯拉的ModelS/X、Model3/Y等车型提供轻量化解决方案。 随着机器人时代到来,旭升集团也开始涉足机器人业务。 去年5月,他在回答投资者提问时称,目前公司已与多家海内外人形机器人客户达成关节壳体、躯干结构件等产品合作。其2025年半年报也显示,旭升集团与国内外多家头部机器人企业建立合作,获得多个客户项目定点。 新剑传动则是为Optimus造“行星滚柱丝杠”的。丝杠是机器人的手臂、腿部、腰部以及灵巧手部位的核心零部件,每台Optimus预计将使用14-16根行星滚柱丝杠。 不同于上述三家,新剑传动并不是特斯拉汽车的核心供应商。但是却早已进入擎天柱供应链。根据中国证券报,新剑传动产品2022年已应用于Optimus。 新剑传动成立于1999年,研发生产滚轧成型蜗杆齿轮、座椅水平驱动器、行星滚柱丝杠、直线型电驱动关节等产品。凭借着在丝杠领域的优势,新剑传动切入了人形机器人领域。 2025年3月,新剑传动董事长单新平接受浙江日报采访时透露,“行星滚柱丝杠是机器人设备的关键零部件......今年,新剑传动迎来了年产100万台人形机器人行星滚柱丝杠产业化新项目,抓住了新风口。” 据杭州市人民政府网站消息,2025年一季度,新剑传动总部暨年产100万台人形机器人“行星滚柱丝杠”产业化项目基地开工建设。该项目总建筑面积约7.1万平方米,计划总投资26亿元,一期投资10亿元。 100万台的产能规划,恰好匹配了特斯拉的长期目标,马斯克曾明确表示Optimus第三代于2026年底前开启量产,目标年产100万台。 去年下半年,更有市场消息称,特斯拉已向新剑传动下达量产灵巧手总成订单,在1000台及以上。 虽然该消息是市场传言,但是去年8月,新剑传动已与信质集团旗下子公司浙江鸿辉电机有限公司合作,在人形机器人灵巧手及关节模组等传动执行器领域展开合作。 乘着人形机器人的风口,今年1月,新剑传动启动了上市辅导工作。 同样为特斯拉生产“行星滚柱丝杠”的还有贝特科技。这家公司成立于2003年,专注于电力电子保护元器件及相关配件的研发,产品用于汽车电子、消费电子等领域。2024年,其全年营收约5亿元。 去年9月,贝特科技被同样做电子保护元器件的扬杰科技收购,以22.18亿元现金收购其100%股权,并签下了未来三年合计5.55亿元的业绩对赌协议。 02 除了前述五家企业,公开信息显示,另外两家特斯拉供应商:长盈精密和蓝思科技,也被市场视为特斯拉机器人的潜在供应商。二者的共同点在于:一方面,它们均为特斯拉的长期供应商;另一方面,两家公司均已切入机器人相关业务领域,并向客户交付了样品。 长盈精密是特斯拉的长期供应商,近些年其业务也涉及机器人。2025年,长盈精密累计交付了约69万件人形机器人精密零组件,其中约80%的产品被送往海外客户手中。这69万件产品覆盖了人形机器人灵巧手、四肢关节、传动系统等多个核心部位的精密零组件。 蓝思科技也是特斯拉的核心供应商,业务也早延伸至人形机器人结构件、功能模组及整机组装等领域。其2025年半年报显示,蓝思科技与国内外头部具身智能企业的合作都取得实质进展,实现关节模组、灵巧手、外骨骼设备等核心部件及整机组装的批量交付。 譬如蓝思科技早已和智元机器人达成合作。2025年1月,蓝思科技向智元批量交付了人形机器人灵犀X1,参与了灵犀X1机器人的关节模组、DCU控制器、OmniPicker(夹爪)等核心部件的生产组装与测试控制。 去年9月,有投资者提问,蓝思科技是否参与了供应特斯拉Optimas人形机器人? 蓝思科技回复称,公司已为多家人形机器人客户批量交付头部模组、关节模组、灵巧手、躯干壳体结构件及整机组装,同时也在配合北美大客户开发人形机器人相关模组。 卧龙电驱也是猜测对象之一。不过去年9月,卧龙电驱否认了“生产的轴向磁通电机和无框力矩电机已进入特斯拉Optimus测试环节,并且已锁定20万台电机订单”这一消息。 恒立液压也曾被传出是特斯拉机器人的供应商之一,业务涉及丝杠生产。据21世纪经济报道,丝杠是特斯拉人形机器人硬件的第一大成本来源、约占整机成本的30%。不过,恒立液压很快辟谣,称公司主要配合客户开展早期研发和样件设计工作,正积极接触国内外众多客户,合作进展涵盖研发与送样等多个环节。 这些猜测都指向一点:中国供应链是特斯拉擎天柱绕不开的一环。 虽然马斯克停产ModelS和X,将加州弗里蒙特工厂改造为生产“擎天柱”的工厂,但是擎天柱的生产依赖中国供应链却是很明显的。 马斯克早在多年前就已经和中国厂商接洽。 观察者网援引《南华早报》报道称,有知情人士透露,特斯拉早在3年前便已开始与数百家中国零部件供应商接洽采购事宜,还与部分厂商深度合作开展研发及硬件设计工作。一些供应商已根据特斯拉的反馈,小批量交付了零部件样品。最近几个月已有供应商向特斯拉寄送了“擎天柱”机器人弧形玻璃头部的全新原型配件。 上述知情人士称,这条供应链将效仿苹果和特斯拉电动汽车,在中国建立强大的零部件供应商网络——从执行器、电机、减速器、轴承、视觉系统、传感器、螺丝到电池的制造商。 03 梳理下来可以看到,这条若隐若现的“O链”,其核心成员几乎都贴着共同的标签:或多或少都与汽车行业相关,大多是特斯拉汽车的供应商。在过去十多年,他们参与了特斯拉汽车的制造,如今,当马斯克将下一场赌注押在人形机器人上时,他们也要为自己做打算。 “最终没人会记得特斯拉曾经造过车”,马斯克的转型,不仅关乎自身发展前景,也对汽车产业链产生了一定影响。 从技术上看,汽车供应链向机器人供应链迁移几乎是顺理成章的事。人形机器人的核心零部件,如执行器、关节、丝杠等部件,与新能源汽车的电驱动系统等有着极高的技术同源性。 更深层次的原因在于,新能源汽车行业经历爆发式增长后,已经逐渐进入平稳期,企业需要新的增长引擎。而马斯克描绘的“百万台量产”,乃至“未来市场价值超过汽车”的蓝图,以及25万亿美元的市场估值,恰好提供了一个充满想象的增长空间。 当然,这场迁移并非单相思。马斯克同样有依赖中国供应链的理由。 一方面是,目前人形机器人的零部件生产大多来自中国企业。 美国贝恩咨询公司合伙人成鑫称:“人形机器人领域约50%至70%的制造能力及核心零部件生产技术都掌握在中国企业手中......在部分核心零部件领域,中国企业的产品在全球人形机器人物料清单中的占比至少达到55%。” IDC数据也曾显示,2025年全球有约1.8万台人形机器人,其中大部分都来自于中国机器人企业。 二是成本问题。据摩根士丹利估计,如果没有中国供应链参与,擎天柱第二代的总成本将从约4.6万美元升至13.1万美元。这对于要将成本控制在2万美元的特斯拉而言,显然是无法承受之重。 中国供应商们渴望抓住时代浪潮,而特斯拉需要在中国寻找一个复刻“果链”奇迹的供应链体系,某种程度上,这是双向奔赴。 只是供应商们虽然渴望订单,但现实却冷静得多。 去年11月,高盛发布了对九家中国人形机器人供应链的实地调研报告,其中包括三花智控、拓普集团等公司。报告指出,这些供应商正在规划中国及海外(主要是泰国,其次是墨西哥)产能,年化产能规划区间约10万至100万台机器人。 但是报告同时指出,高盛所调研的九家产业链公司,尚无任何一家证实获得确定性大额订单,也未能提供清晰的量产时间表。 正如《第一财经》报道,有调研公司负责人表示,作为供应商尽可能做好准备,尽管没有接到规模订单,但产能规划规模是根据大客户给的产能指引进行安排。 这也就意味着,“O链”已经做好准备,就等着Optimus迈出量产的一步了。而按照马斯克的计划,这一时间是2026年底前。
这阵容谁能想到!喜临门发布会定档:王腾、马斯克母亲、前OPPO最美产品经理Monica同台
快科技3月18日消息,今日,今日宜休创始人王腾在微博发文宣布,喜临门智能睡眠新品发布会将于3月20日举行。 王腾表示:“我会和传奇女性梅耶·马斯克(特斯拉CEO埃隆·马斯克母亲)、产品发布官Monica(没错,手机行业的Monica也转行了),一起聊聊AI时代和智能到底能为我们的睡眠创造什么新价值。” 梅耶·马斯克 从王腾晒出的预热海报来看,他将担任喜临门首席产品体验官,Monica出任喜临门产品发布官,而梅耶·马斯克则担任喜临门全球品牌代言人。 三人罕见同框的阵容也引发网友热议,有人直言:“这辈子没想到这三个名字能出现在同一页上。” 值得一提的是,Monica今日还在社交平台晒出AI生成的喜临门工牌,并配文称:“新身份,和大家重新认识一下。” 据了解,去年9月,Monica宣布从OPPO离职,她在OPPO任职的五年期间,曾主导多款热门产品的市场推广与发布策略,并亲自主讲了九场重大新品发布会,被网友称为“OPPO最美产品经理”。 在2024年OPPO K12发布会上,Monica曾现场用高跟鞋暴力踩踏手机,成为当时的名场面。 Monica 此外,今年1月,前REDMI品牌总经理王腾宣布成立新公司今日宜休,其初创核心团队成员背景深厚,均来自小米、华为等一线科技企业,公司将研发重心放在睡眠健康相关产品上。 他认为,通过更多传感器结合大模型技术,可以主动感知人的生理状态,继而做出精准的主动决策与干预,让精力管理真正成为可能。 王腾
清华院长杨斌:确定token的中文译名,已经迫在眉睫了
2026年英伟达GTC大会上,黄仁勋近两小时的主题演讲,全程围绕AI推理时代的产业重构展开,堪称 AI 推理时代的产业宣言。 从硬件架构革新、数据中心转型为模元(token)工厂,到万亿级AI基建蓝图、企业经营逻辑,再到智能体与物理世界AI的未来,token这个词累计出现超过70次,成为串联整场演讲的锚点和主线。 黄仁勋以手势示意“Token King”英伟达token成本全球最低。(图片来源:GTC 2026) 针对这一定义AI时代的核心度量单位,我在2026年初提议过token的AI领域专属中文译名——模元,用以区别于区块链、网络安全等其他场景中的token译名。这次在线上越听黄仁勋的这场演讲,越让我感到这事儿有点儿急迫,“模元”作为token中文译名的推广,真的是越来越重要、越必要。 为什么?因为模元(token)不止是黄仁勋演讲中的高频锚点,更是思考和重构AI经济逻辑、推动AI在中国走向千行百业的关键基石;而一个精准适配、好懂易传播的中文译名——模元,正是AI从专业圈层走向全民“众技”的关键纽带。 黄仁勋在演讲中正式提出“模元(token)工厂经济学”,宣告传统数据中心已告别文件存储的旧定位,全面转型为生产模元(token)的智能工厂。固定功耗下的模元(token)每秒吞吐量、单位模元成本,直接决定AI企业的营收能力与核心竞争力,模元(token)已然成为AI时代的新大宗商品与基础度量衡。 他的这一论断,绝非技术圈层的自说自话,而是揭示了AI产业的底层逻辑:模元(token)是AI时代的核心经济标尺,兼具着信息单位、算力单位、货币单位三重属性,是AI思考的最小单元,也是算力消耗核算基准和智能服务价值度量。于此之上,全球AI产业的运行规则正在被重塑。 前一阶段公布的数据表明,全球大模型日均模元(token)消耗已达30万亿级别,中国模型调用量首次超越美国,占到全球60%以上。小到一次AI问答,大到电影级视频制作,更大到企业级模型训练,都以模元(token)计量,这使其超越一般技术参数,成为智能经济规模与活力的核心指标,也让模元的中文定名,从可以慢慢来的学术探讨变成了实践中的急迫需要。 换句话说,当一个核心且被高频使用的技术名词成为万亿级产业的核心标尺,其中文定名便不再是无关紧要的细节,而是关乎产业共识形成、技术普惠落地、公众认知普及的刚需。 因为各种可以理解的原因,当前AI行业的技术专家、企业高管与投资人,普遍直接使用英文词“token”进行交流,播客、访谈、讲座中,几乎没有统一的中文表述。这倒真不是英文水平高低的问题,即便英文基础良好,如果不怎么懂AI,也难以精准理解token的核心要义,就算翻开字典也是一头雾水;对于未接受AI专业训练、不熟悉英文技术术语的普通大众与传统行业从业者而言,生硬插入的英文名词更会带来强烈的距离感与认知隔阂。 情况是这么个情况,却并不是就该一直这么下去。我们每个人都期待AI真正融入中国千行百业、走进普通人的工作与生活,这就倒逼着我们,必须为这个核心概念,定一个通俗易懂、精严谨准、适配未来的中文译名。 从词源脉络来看,token源自古英语tāc(e)n,本义为“标志、符号、证明”,核心是“可被识别、承载特定信息或功能的基本单元”。历经中世纪商业代币、网络安全令牌、语言学“词例”的演变,进入AI大模型时代,token完成了决定性跃迁——从语言学碎片化单元,升级为AI模型可计算、可处理的最小通用单元,正式取代计算机、互联网时代的“字节”,成为AI时代的基础度量衡。 比较一下:字节是计算机物理层面的存储单位,计量机械均匀、与语义无关,仅记录数据的物理体积;而模元是智能逻辑单元,承载文本、图像、音频、视频等全模态信息,关联模型理解、推理计算、算力消耗与价值创造。这一本质区别,正是计算文明从“数据处理”走向“智能涌现”的核心标志,也让模元(token)成为贯穿黄仁勋2026GTC演讲的核心主线。 在我提出“模元”这个译法之前, AI大模型领域的token也曾有过多种中文译名,但推敲下来,发现都无法匹配AI大模型、智能体时代的核心内涵,难以打破大众的认知壁垒。比如,“词元”被“词”字锁死在文本场景,无法适配多模态、物理AI的应用形态;“语元”囿于语言范畴,窄化了token作为模型通用处理单元的本质;“义节”过度聚焦语义,忽略了token纯特征、结构化处理的属性;而“托肯”“屯”等单纯音译,徒有其音、缺乏实义,普遍接受度低,还会加重非专业人群的理解负担。这些译名要么局限于单一领域,要么缺乏度量衡的严谨性,确实无法承载token作为AI产业核心锚点的价值。 我斟酌再三提出的“模元”这个译法,是专为AI时代量身定制的意译。“模”直指大模型、多模态,锚定AI场景的核心属性;“元”代表最小基本单元,承续“字节”这类中文经典度量单位的命名逻辑,简洁直白、通俗易懂。 这一译法具备三大不可替代的优势:一是对大众友好,对中文世界的非专业受众而言,“模元”没有英文token的距离感,无需专业背景就能感知这是AI世界的基础计量单位;二是对产业实用,对产业界而言,“模元消耗量”“模元效率”“模元成本”“模元预算”等概念,能直接对应AI产业核心指标,让“模元工厂经济学”走出专业圈层,被更多人理解;三是对未来兼容,对未来发展而言,模元不局限于当下的文本推理,更适配智能体、多模态融合、物理世界AI等全场景,具备穿越技术周期的延展性。 如果试着将GTC大会上,黄仁勋演讲中的“token工厂”改为“模元工厂”,“单位token成本”改为“单位模元成本”,原本晦涩破碎的产业逻辑表达会立刻变得顺畅且清晰易懂:从业者明白模元是AI生产的基础原料;投资者理解模元效率是企业降本增效的关键;普通大众懂得,“模元”就是AI时代的“字节”,是走进智能经济的入门钥匙。技术的真正价值,在于从专业重器走向全民众技,而朗朗上口、易于传播的中文译名,正是AI普及的必要一步。 我反复阐释“模元”这个译法的初衷,并不是纠结较真、咬文嚼字,有点儿执意想请大家把“模元”作为惯用词统一起来,真是想为中国AI高普及率搭建必要的语言桥梁,打破专业与大众之间的认知壁垒,让AI核心词汇更易读易懂,让传统行业出身的人在认知和把握AI本质的路上,不用先越过什么语言门槛就能径直探索AI时代的基本规律,促进AI这个进行时很强的科技在中国走向千行百业、走向全民普惠。 按照荀子有言“名无固宜,约之以命”,所谓约定俗成,再合理的“名”,没人用、形不成共识也是白费。期待大家在学术研究、产业分析、政策讨论与媒体报道中,有意识地采纳并使用“模元”这一译法,共同推动这个有根(词源清晰)、有义(内涵准确)、有未来(延伸性强)的词汇,成为理解、参与和拥抱AI时代的日常用语。 马年龙抬头将至,AI 时代的模元经济,正加速演进大变局,却也还只是开局。期待不论产业还是社会,专业抑或日常,以“模元”为计量,向智能而涌现。
OpenAI对话OpenClaw:AI正在重新定义开发者,以一种玩乐的心态去面对AI
图片来源:YouTube Z Highlights: 这和“我只是用AI辅助写代码”完全不是一个层级的变化,而是一种跃迁式的升级——从增强个人生产力,变成真正意义上的端到端构建与交付。 从第一次接触这项新技术,到真正变得高效之间的这段过程里,很多人都会卡在这里——不停地去“超级优化”自己的环境。但这种优化往往并不会真正提升生产力,只是让人产生一种“我更高效了”的错觉。 真正需要优化的,其实是整个代码库,让它更适合协作、更适合持续演进。现在也是一样——要优化的是代码基础,使agent能够在其中发挥最佳效果。 以一种玩乐的方式去接触它。如果你至少有一点动手能力,就去构建你一直想做的东西——脑海里总有一个想做的项目,就尽情玩一玩。 《Builders Unscripted》是OpenAI官方推出的一档聚焦顶尖开发者的硬核对谈节目。在2026年2月25日首期节目中,Peter Steinberger围绕OpenClaw、他在开源领域的历程,以及如何借助 Codex 进行构建展开了深入解析。 Romain:Peter,欢迎来到OpenAI。 Peter:感谢邀请。 Romain:这些年来一直在线上相识相伴,如今终于有机会在Versa里有更多时间相处,内心真的很开心。 Peter:同感。你们的办公室真的很漂亮。 社区热潮:从线上到全球线下现象级爆发 Romain:谢谢,最近这几周真是忙得不可开交。其实一个月前就有一起录视频的想法,要是当时做的话,可能还得专门做个介绍。现在看来,几乎都不用铺垫了。开源项目能登上《华尔街日报》并不多见,取得这样的成绩确实值得祝贺。此刻的感受如何? Peter:有点抱歉,感觉各方面都有些信息过载。不过说实话,今年一开始折腾AI的时候,其实是想激励更多人参与进来。现在走到这一步,仿佛达到了某种“终极形态”,所以内心还是挺自豪的。 Romain:这段时间确实很精彩。过去一周都在旧金山,参加了一些活动,比如Codex Hackathon,同时也主办了一个专门围绕OpenClaw的活动。 Peter:其实这件事本身也是由社区推动的。当时有人提议说应该办一次线下见面会,于是就建了一个Discord频道专门讨论meetup的事。没想到后来来到现场,竟然有将近一千人到场。那种创造力真的让人震撼——现场的设计、氛围、色彩,还有各种各样的想法与项目,能感受到无数人投入其中、满怀热情。 Romain:那一刻才真正意识到,确实创造出了某种“有魔力”的东西。几周前这个项目还不存在,如今却已经有成千上万的人在使用、在支持,甚至专程聚集到旧金山线下见面——这种变化本身就令人难以置信。 Peter:甚至下周在维也纳,也已经有超过300人报名参加。相比旧金山那样成熟、活跃的科技圈,当地的tech scene规模远没有那么大,但依然能聚集起这样的热度,确实令人惊叹。 Romain:现在它已经走向了全球,成为一种现象级的存在。 Peter:是啊,令人惊叹的是,它能够触及不同的大陆、不同的文化。 Romain:确实如此。那么这几天和社区的交流整体感受如何?这段时间花了不少时间和社区成员互动,也和一些后来加入项目的维护者深入沟通。过去这一周的体验怎么样? Peter:这段经历确实很特别。很多人非常喜欢这个项目,也有不少人一上来就期待看到一个成熟、完善的“最终版本”。但对我来说,很长一段时间里,它更像是自己的一个小型试验场。这一整年,都在不断惊叹AI所展现出的各种可能性。对开发者而言,可谓是“生逢其时”。 开发者的黄金时代:AI 重构开发与身份定义 Romain:你觉得在这个时刻作为一个builder最有趣的地方是什么?现在确实是一个非常特别的时期——整个工具链都在发生变化,对“开发者”身份的定义也在不断重塑,几乎任何人都可以构建任何东西。 Peter:当我开始玩这项新技术时,每次都有一种多巴胺飙升的感觉。那时我用Claude code进行尝试,每当它做对一点事情,大概只有30%或40%的概率,但对我来说简直令人震撼——我突然意识到,现在我真的可以构建任何东西。而且通常软件开发总是很耗时、很复杂,而软件本身依然很难。但现在,开发速度快了太多。 Romain:我同意。如果回溯到几年前,大概是2011或2012年左右,当时第一次接触到你做的工作,是你开发PSPDFKit的时候。从外部来看,这个经历很有意思——感觉就像实现了每个开发者的梦想:遇到问题、提供了出色的解决方案、围绕它建立了公司、实现了规模化,并最终出售了它。但我相信,这段旅程绝不可能像表面上看起来那么轻松。 Peter:我的意思是,我并不是某天醒来就决定要开发一个PDF框架——这在我的兴趣清单上几乎排在最末位。事情更多是自然而然发生的,就像一种奇怪的蝴蝶效应:从在Nokia开发的日子开始,到身边朋友有需求,再到美国签证拖延过久,这一系列偶然因素最终促成了我创办公司的决定。 Romain:我觉得有趣的是,在那家公司建立之后,你似乎休息了一段时间。那么,是哪些因素促使你重新回到这一领域的? Peter:最终,我是真的感到精疲力尽。连续高强度工作了13年,运营一家公司很难,当创始人更难。而且这是我的第一次创业,我并没有真正掌握如何缓解这些压力的方法,所以有一段时间几乎到了透支的状态,需要好好放松一下。 尽管如此,我还是关注着科技新闻。看到了GPT Engineer(或者当时叫ChatGPT的早期版本),觉得挺酷的,但并没有立刻让我激动。因为必须亲自体验新技术,仅仅通过阅读是无法真正感受到它的力量的,尽管当时的技术并没有立刻让我产生共鸣,真正让我动手。只有在我准备好、感觉到“好吧,我想再次创造点东西”的时候,到那时我也不想再在传统科技领域构建项目,因为我已经做了很久,而世界似乎也稍微往前走了一些。 当时很多东西还需要被重新构建,而我也恰好有了回归的动力和契机。但当你在一个领域已经非常专业,然后转到另一个领域时,那种难度真是无法用“难”来形容,更像是一种痛苦。你拥有构建项目的广泛知识,但如果没有agentic engineering的辅助,要真正把这些能力迁移过去,仍然需要学习很多东西。我当时想,“不如先看看这AI的东西吧。”真正让我震撼的时刻是,我拿了一个半完成的项目去尝试——其实那个项目早已在完成之前就因精疲力尽而搁置了。 Romain:对我们开发者来说,常常是这样的:大家都喜欢冒出新点子、启动新项目,但真正把它们完成才是最难的部分。 Peter:我经常看到这种情况——完成一个项目真的很难,有时候甚至会失败。但这个项目我想继续推进,同时也想重写它。于是我把整个项目整理成一个巨大的Markdown文件,大概1.5MB,把所有文件都拖进当时的Gemini Studio 2.5,然后让我生成一个spec,我把生成的几行内容整理回来,再拖到Cloud Code里去。接着我执行build,并在主屏幕上做其他操作,而旁边的屏幕就这样跑了好几个小时。 那时候情况要困难得多。有一次,它告诉我“已经100%可以投入生产”,大概是高级Claude 3.5 Opus之类的版本。我试了一下,结果直接崩溃了。于是我接入了Playwright——那是少数我真正会用的MCP之一——让它去构建登录流程,同时沿途检查操作是否正确,比如用来测试Twitter。一个小时后,它居然真的成功了,还展示给我一些成果。 Romain:很多人把OpenClaw看作是你的一夜成名,但我觉得最有意思的地方在于,它其实是过去9到10个月你所做的众多项目的积累。当你看看你的GitHub主页,会发现你已经构建了40多个项目。 Peter:其中大约一半的项目被直接应用在这个项目里。 Romain:我觉得其中很多,你都把它们整合进了OpenClaw。能不能聊聊这段旅程,讲讲这些想法和项目是如何最终汇聚到OpenClaw中的? Peter:我希望我能说从一开始就有一个统一的计划,但其实大部分都是探索性的。我当时想要一些功能或工具,而它们并不存在,于是我就“创造”了它们——或者说,我通过提示让它们出现。为什么?就是因为我想去构建它,一步步来。我希望我的agent能为我做一些事情,但那时我还没有完整的整体愿景。有趣的是,事情最终又回到了原点。比如,我想让它能查看我的WhatsApp,于是我就去实现了,甚至还注册了相关的域名。 我做了一个原型,但当时心想,反正大公司和大实验室迟早会去做这个,所以我就先等等。于是我把注意力放在其他事情上,做了很多实验。那段时间的目标更多是为了好玩,也为了激励别人。到了十一月,我做出了几个版本,但都不算理想。那时我就想,为什么还没有实验室做出这些东西?他们到底在忙什么?于是我就自己动手,做出了第一个版本,这个版本后来就成为了OpenClaw。当时已经到了第五个版本,但我自己仍然没有完全被打动。那感觉是——挺酷的,只花了大约一个小时就搭出了第一个原型。你只需通过提示,就能让各种东西“生成”出来。 真正打动我是在这个周末去马拉喀什旅行时。我发现自己用它的频率大大增加,因为它太方便了。你知道,当地网络并不稳定,而WhatsApp无论在哪里都能用,这种便利性让我对它印象深刻。我用它做了很多事情,比如翻译图片、帮我找餐厅,甚至还能查电脑上的资料,感觉特别酷。我给朋友们看,还让它帮我发短信,他们都想要这样的功能。我当时就想——你们不应该用它,你们还不懂它的厉害。 Romain:这些正是产品与市场契合度的唯一信号。如果连你的朋友都想要你做的东西,即便你从未为他们设计过,它也说明了价值所在。以前这类工具更多是为技术同行保留的。 Peter:真正让我彻底感受到它的价值,是我频繁使用的过程中。有一次,我尝试发送语音消息,心中顿时意识到——这本不应该能实现。 震撼时刻:AI Agent自主解决未预设复杂问题 Romain:跟我多讲讲这个故事吧,我记得我们前几天聊过这个。 Peter:这真的很令人着迷,它让我看到了这些模型在解决问题上的强大能力。我们开发这些工具是为了agentic engineering,但真正的核心技能其实更抽象:如果你想成为一名优秀的程序员,你必须首先是一个出色的问题解决者。而这种能力实际上可以映射到任何领域。 我发送了这条语音消息,屏幕上出现了打字指示器,我心里非常好奇接下来会发生什么——我自己没写过这部分代码,按理说它不应该能工作。结果模型居然直接回复了我,我当时惊讶到:它是怎么做到的?作为模型,它本不能够运行啊。模型当时的处理方式是这样的:它说,“你给我发了个消息,但其实只是一个没有文件后缀的文件。”于是它查看了文件头,发现这是一个音频编码格式。然后它在我的电脑上用ffmpeg转换了文件,我本想把它转写成文字,但电脑上没有安装Whisper。于是它四处寻找,找到一个OpenAI的API key,用curl把文件发送给OpenAI,最后拿回了文字内容——就这样,我得到结果了。 Romain:这确实令人难以置信。这正是把工具和完整的计算机访问权限交给这些agent之后所展现出的力量。它们可以自行组合资源、设计解决路径,哪怕从未为这种具体情境写过一行代码,也能自己想办法把问题解决——这种感觉既震撼又有点好笑。 Peter:我讲这个故事时,有人惊呼:“天啊,它竟然用了我的key,这也太疯狂了!”但其实并非如此。我把OpenAI的API key放在环境变量里,本来就是为此准备的。如果这是一个应该访问OpenAI key的脚本,而我的bot也运行在同一个环境里,那它当然可以访问那个key——我把它放在那里,本来就是为了让它用。这并不糟糕,恰恰是我想要的效果。那就是属于我的一个高光时刻。之后每次把它展示给朋友,或者把它拉进一个小群聊里测试——坦率地说,这个东西本来就是为一对一沟通设计的。如果要放进群聊里,最好选一个信任的人一起尝试。 Romain:真正信任的人。 Peter:因为它并不是为了“随便丢到公共场景里就能自动正确运行”而设计的。它本质上是一个个人助理,是围绕个人使用场景打造的。 Romain:当我把它搭起来时,其实也挺好奇的——这种配置方式有点奇怪,但我很想看看它最终会发展到哪里。后来确实出现了几个“顿悟时刻”:给它的访问权限越多,提供的工具和技能越丰富,它展现出来的能力就越令人惊艳。某种程度上,就像是在赋予它一种“虚拟技能”,能力会随着资源的开放而不断放大。当你让它为一次活动搭建一个网站或应用时,它做的已经不只是生成代码。它会调用你的OpenAI API key,把AI功能直接整合进去,还会自动部署,甚至生成一个可以对外分享的链接。这和“我只是用AI辅助写代码”完全不是一个层级的变化,而是一种跃迁式的升级——从增强个人生产力,变成真正意义上的端到端构建与交付。 Peter:整个11月和12月,我几乎完全沉浸在这件事里。虽然也做了一些其他项目,但大部分时间都投入到了这里。可是在Twitter上,大家似乎并没有真正理解它,我得到的反馈也相当冷淡,反响并不强烈。而现实是,每次给朋友演示,他们都想马上用。我却总说:“不不不,还没准备好。”后来我想,那不如做点疯狂的事情,让大家真正看到它有多酷。 于是我建了一个Discord服务器,直接把我的bot放了进去,几乎没有任何安全措施——那时候连sandboxing都还没做,一切都非常早期。我基本上是在完全公开的环境里开发,相当于用OpenClaw去构建和调试OpenClaw本身。当时模型会说:“你看到这个工具了吗?”我回答:“没有,什么都没看到。”它又说:“那去检查一下你自己的源代码。”接着又引导我去看其他地方。这一切都在公开环境里发生,大家亲眼看到它如何自我排查、自我修正。也正是在那一刻,人们开始真正理解它的意义。 Romain:当时把它放进Discord时,具体给了它哪些访问权限?比如,也让它读取了你所有的推文吗?它对你的信息掌握到了什么程度? Peter:并不是所有推文,太多了,但确实包含了很多我的记忆数据。我其实一直在快速监控它,因为prompt injection仍未完全解决。但新一代模型的表现确实很出色。我有一个“canary”,我的定制MGE,它定义了我的价值观——我希望模型如何运作、如何思考,以及哪些对我来说是重要的。大家对此非常感兴趣,甚至有陌生人进来,试图通过prompt injection粘贴大量代码。但模型直接回应说:“我不看这个。”基本上是在“嘲讽”他们。尽管如此,我当时还是没太有信心。第一晚引起了大量关注之后,我就把它关掉,去睡觉了——睡了十个小时,醒来后再继续。 那天Discord上大概有800条消息,我的agent都在一条条回复。我当时完全慌了,又把它关掉。后来我仔细查看了每一条消息,慢慢冷静下来,因为它实际上没有做任何恶意操作,也没办法获取我的MGE数据。并不是说prompt rejection完全不可能,但它没有人们想象中那么容易被绕过。 Romain:对吧?从整体来看,它实际上是按照预期在运作的。 Peter:是啊,我最大的失误是把它禁用了,但忘了我其实有一个启动守护进程(launch daemon)。启动守护进程主要做什么?如果服务崩溃或者MGE(sol)被终止,它会自动重启,因为你希望服务是可靠的。苹果当初设计它,就是为了保持服务稳定。我没考虑到这一点,所以把它“杀掉”了,结果它在五秒内自己重启,而我就去睡觉了。现在我吸取了教训,也加入了sandboxing。他在Gemini Studio里看到时非常自豪,把它称作“城堡”。我把它放进了一个小型容器,但这些模型真的非常有创造力。 比如第一次我做了一个Alpine Docker容器,里面几乎什么都没有。我当时对Malte说:“嘿,能帮我看看这个网站吗?”它却说:“这里连curl都没有,什么都做不了。”我就对它说:“发挥你的创造力吧。”它居然自己用TCP socket构建了一个curl,还用C编译器编译,生成了一个简陋版本的curl,竟然可以真正访问网站——效果完全正常,简直疯狂。这些模型的资源调度能力和创造力真的令人难以置信。 Romain:当然也遇到了一些挑战。很多人会从安全角度审视项目,期待它从第一天起就做到非常完善、非常稳健。但当时只是把一个开源项目公开出来,本身还处在早期探索阶段。 Peter:每当有人问我:“能不能帮我联系一下你们的CEO、人力资源,或者团队里的其他成员?”我都会忍不住笑。其实就是我一个人在“山洞里”写代码而已。但这恰恰体现出那种认知上的错位——从外界看来,这像是一家成熟公司的成果;可实际上,如果没有这些模型和agent的加持,单凭一个人根本不可能做到这样的规模与复杂度。现在确实有维护者加入,也会收到PRs。但从本质上说,这个项目最初是我一个人完成的——而放在一年前,这几乎是不可能的。当时根本没有这样的模型能力,让一个人可以构建出这种规模和复杂度的系统。所以从传统视角来看,甚至都不该把它当作“一个人能完成的事情”。 Romain:我们不妨就聊聊这个话题。我想很多开发者都会好奇——Peter的生产力到底是怎么做到的?今天早上我又看了一下你的GitHub,过去一年在120多个项目里累计了9万多次contribution。更有意思的是,GitHub活动图在年初几乎是一片空白、浅绿色,到了秋天,尤其是10月和11月,突然变成了深绿色。那段时间究竟发生了什么? Peter:每一代模型都在进步。但变化不仅仅在于agent变得更强,模型本身的“智能上限”也在提升。同时,我对如何驾驭它们的理解,以及自己的workflow也在不断优化。有些人仍然用过去的方式写代码,觉得那套方法不会改变;当他们尝试用AI时,把这种方式称作“vibe coding”。 在我看来,这个词本身就带点贬义。他们去尝试AI,却没有意识到这其实是一种技能。就像拿起一把吉他,第一天不可能就弹得很好。于是因为体验不好,就下结论说:“不行,这行不通。”如果用一种更玩味、更探索的心态去对待它,就必须愿意学习。现在我对不同prompt会产生什么效果、大概需要多长时间,已经有了一种直觉。如果过程变得异常漫长,我就会反思——是不是提示写错了?架构不对?思路出了问题。这和写代码很像。当你在写代码时,也会有一种感觉:某个功能是自然融入整体架构,还是在“对抗系统”、处处别扭。这种判断力需要时间去积累。 走出Agentic Trap:保持简单,专注问题本身 Romain:那么,如果有人希望提升到类似你的效率水平,你现在的coding setup是怎样的?你之前也提到过,很多人把自己的开发环境搞得过于复杂。 Peter:其实我自己也曾这样做过,我把这种情况叫做“agentic trap”。从第一次接触这项新技术,到真正变得高效之间的这段过程里,很多人都会卡在这里——不停地去“超级优化”自己的环境。但这种优化往往并不会真正提升生产力,只是让人产生一种“我更高效了”的错觉。看起来很忙、很高级,实际产出却未必更多。 我写过一篇博客,当时也挺有争议。我只是说,你要把它当成一种对话去对待。模型更像是在跟你交流——这并不完全是传统的pair programming,而是另一种形式,更像ISS,本质上是一场持续的对话,我基本上就是直接告诉它我想要什么。我总会问模型一句:“你有什么问题吗?”因为默认情况下,它会直接尝试解决问题,并自行做出各种假设。而这些默认假设未必总是最优的——尤其要记住,它的训练数据里包含了大量代码,也包括很多较早期、甚至已经过时的代码。因此,通过反问,让它先澄清问题,往往能得到更好的结果。 “你有什么问题吗?”其实是一个非常关键的问题。模型通常是以“空白状态”开始的,它不像我们一样逐步积累上下文。每一次新的session,对它来说都是“我对这个代码库一无所知”。它只能根据当前对话去搜索、定位相关片段,然后尝试解决你提出的那个具体问题。但它们通常看不到完整的全貌。如果要把这件事做好,完整的画面必须先在自己脑海里成型,同时还需要稍微引导模型,告诉它去看看这里、再看看那里。而Codex在这方面更强一些,更擅长先做一次整体性的浏览,再进入具体细节。我用的是一种非常基础的方法。甚至都不用worktree,只是简单地做1到10个checkout。 保持简单,反而让我能更专注于真正的问题本身。我基本不去折腾复杂的分支策略,而是专注于不同的问题模块。理想情况下,当项目规模稍微大一些时,这种方式反而更轻松——可以在彼此不冲突的不同部分上并行推进,而不至于互相“打架”。 Romain:你在构建OpenCloud的过程中大量使用了Codex。那么除此之外,它还在哪些方面改变了你的工作方式? Peter:我尝试过很多工具。但在目前所有工具中,我对Codex的信任度最高——它构建出我想要结果的成功率非常高,“直接就能跑起来”的情况也越来越多。很多人没有意识到,GPT-5.2又带来了一次质的跃迁,几乎可以说是一次“量子级”的飞跃。那种“它真的就能正常工作”的感觉,非常明显。到现在,我仍然会为它已经达到的稳定程度感到惊讶。 Romain:这真的太棒了——可以直接动手构建各种东西。本身就已经非常不可思议。 Peter:是的,我觉得大家真的应该亲自试一试。 Romain:你之前也提到过,现在甚至会发布一些自己都没有逐行阅读的代码。这种做法是如何发生变化的? Peter:大多数代码其实都很“无聊”。无非是把一种数据结构转换成另一种数据结构,最后呈现给用户,或者传递到下一个系统。因此,对于模型生成的绝大部分代码,我其实心里大概有数。我只需要看一下输出流,确认它生成的内容,大体符合我脑海里的心智模型——也就是它“应该”长成的样子——基本就够了。之前带过一个团队,手下有不少软件工程师。这也意味着必须接受一个事实:他们最终写出来的代码,不会完全符合我心中理想的写法。 真正需要优化的,其实是整个代码库,让它更适合协作、更适合持续演进。现在也是一样——要优化的是代码基础,使agent能够在其中发挥最佳效果。而这未必等同于“人类写得最舒服”的方式。这也意味着要接受,生成的代码未必完全是我理想中的写法。确实可以通过prompt把模型往某种风格上引导,但很多问题本身就有多种结构化方式,大多数时候并不存在唯一正确的实现。如果后来真的出现性能问题,再针对那一部分做优化即可。关键是先让系统运转起来,在需要的时候再精细打磨。 Romain:刚才提到对“代码价值”的看法,其实也在改变我看待开源的方式。就拿Open Cloud来说,现在大概有两千个PR处于打开状态。过去在没有AI的时候,每一个PR都需要认真阅读,因为代码本身就是核心价值所在。但现在有时更愿意把它理解为一种“prompt request”,而不仅仅是pull request。真正重要的,往往不是那段具体的实现代码,而是PR背后的想法、意图和方向。代码可以由模型重写、重构甚至重新生成。 Peter:有时候处理一个PR花的时间,比自己动手做还要久。因为我对模型“不具恶意”的信任,往往高于一个从未听说过、之前也没有任何交流的外部贡献者,所以对这样的PR必须更加仔细地审查。但当我看到一个PR,开始做review时,首先会问模型一句:“你理解这个PR的意图吗?”因为我真正关心的并不是代码本身,而是这个人到底想解决什么问题。很多时候,它更像是一个issue,外加一套体量很大的解决尝试。首先,不少人仍然不知道如何真正去yield agent。 其次,他们往往只给出一种非常局部的解决方案,因为他们脑中并没有整个系统的全貌。难点在于,这个小小的新功能如何嵌入到整个更大的系统里?或者这个小修复——它确实只是一个很小的fix——它真的是对的吗?问题会不会其实更偏向某个模块,甚至是一个更系统性、架构层面的问题?如果只是和模型进行对话,它其实非常擅长处理这种情况。当我说“好,现在把这个实现出来”,模型就会开始构建。但在此之前,我会先问它:这个改动的意图是什么?这是最优解吗? 有时它会回答是,但更多时候会说不是。然后我们才会开始一起探索,什么才是更合适的修复方式。这是不是一个架构层面的问题?比如说,如果这是一个消息处理上的问题,它真的只影响WhatsApp,还是也可能影响到Signal?既然如此,是不是应该用一种更通用的方式来解决,而不是只做一个局部修补?这算是一个新功能吗?我们真的需要这个新功能吗?有时候,这样的讨论会持续十到十五分钟。我通常会用语音,因为那种感觉真的就像是在和一个非常聪明的同事交流。 Romain:用语音输入token,其实比打字更轻松。 Peter:当我确认方向没问题之后,会触发一个slash command——比如LPR——它会把整个流程说明清楚:创建branch、完成所有修改、再到把PR合并。我希望建立一个社区,所以即便整个过程用时比自己从头写一遍还要长,仍然会保留原作者的署名。因为我很珍惜大家能够参与其中。 Romain:展望未来,在越来越多贡献者围绕这个项目参与进来的情况下,OpenClaw接下来会走向哪里?另外,是否把自己视为某种“探路者”——为“个人AI agent应该是什么样子”提供一种范式,让未来可能有数十亿人使用类似系统时,有一个可以参照的方向? Peter:是的,我希望在两者之间找到一种平衡:一方面,它应该简单到连我妈妈都能安装;另一方面,它又必须保持有趣、可hack,这本身就很难。大多数开源项目的使用方式是下载一个package直接安装。但很长一段时间里,我的默认安装方式是git clone、build、run。这样一来,源码就直接在本地磁盘上,agent就“坐”在源码之中,并且对这份source code是有感知的。 如果有任何不喜欢的地方,只需要对agent下一个prompt,它就会自行修改——某种意义上,是真正的“自我修改软件”。也正因为如此,很多原本从未给我提过PR的人,现在也开始提交PR。这也是为什么我更愿意把它称为“prompt request”——关键不只是代码本身,而是对“如何构建一个能够长期演进的软件”的理解。与此同时,整个安全行业几乎都在盯着它。这很有意思,但也多少有些令人沮丧,因为其中确实忽略了一些新的东西。举例来说,我做的那个web server,最初只是为了调试而写,后来才把界面做得更好看一些。它本来的设计前提,是只在本地网络、也就是受信任的网络环境中访问。但因为我也希望它能成为某种“黑客乐园”,所以确实提供了一个选项,可以自行修改访问方式。毕竟有些人的部署环境很特殊,比如会使用某些特定工具,或者通过reverse proxy来做转发。 所以当初没有把它做成强限制模式,是有原因的。但现在却有人把它直接暴露在open internet上,尽管我在一份文档里反复强调“不要这样做”,因为那根本不是它的设计初衷。随后就会有安全行业的人指出:它没有登录限制,也没有那些在公共网络上运行服务所必须具备的安全机制。问题在于,那本来就不是它被设计出来的使用场景。确实,当初并不是按那种用途来设计的。但因为它是可配置的,于是就被直接归类为一个CVSS 10级别的问题。所以在这件事上,确实有些挣扎。后来也引入了一位安全专家,把安全作为核心关注点。因为已经意识到,无法阻止别人以非预期的方式使用它。现在更重要的是支持这些不同的use case,同时尽量避免让用户“误伤自己”。 Romain:这正是开源的魅力所在——人们可以拥抱它,并提出一些连我都未曾想到的想法。 Peter:是的,这既是它的魅力所在,也是它的疯狂之处。 Romain:稍微跳出OpenClaw这个话题。这周和不少开发者聊到你即将参加Codex Hackathon,他们都很好奇:Peter是怎么想到这么多好点子的?这些创意从哪里来?不知道是否有一个明确的答案,还是说这更多只是出于个人的好奇心,一路追随自己的兴趣不断探索。 Peter:更像是一种意识到:现在很多事情变得很容易。即便已经有一个开源项目能解决我70%的问题,我也会选择自己动手做——而这在一年前几乎是不可能的。现在的状态是,只需要下一个prompt,把它放在第二块屏幕上,让Codex跑起来,它就开始工作了。 Romain:我们俩都来自欧洲。当我离开旧金山回到欧洲时,我相信你也有同样的感受:很多开发者和工程师还没有真正开始使用Codex和agentic工具。对他们来说,你的建议是什么?在入门时,他们是否应该重新思考自己的工作方式和工作流程? Peter:我的第一个建议始终是:以一种玩乐的方式去接触它。如果你至少有一点动手能力,就去构建你一直想做的东西——脑海里总有一个想做的项目,就尽情玩一玩。必须以一种玩乐的心态去面对这个事物。我记得Nvidia的CEO也说过:“短期内,你不会被AI取代,而是被会使用AI的人取代。” Romain:用得更好的人。 Peter:但如果你的身份认同是:我想创造东西,我想解决问题——如果你有高自主性,如果你足够聪明,你的需求量将比以往任何时候都高。 Romain:现在正是创作者拥抱这些工具、引导好奇心的绝佳时机,也是真正将任何想法付诸实践的时刻,就像你通过这些精彩项目和OpenClaw所做的那样。 Peter:我觉得一年之内,这将会彻底爆发。 Romain:是啊,2026年将会非常有趣。我觉得这是一个非常棒的结束方式。非常感谢你,Peter,抽出时间接受采访。能和你共度时光真是太棒了。我们在OpenAI都非常喜欢你的工作,也很乐意支持像你这样的开发者,坦率地说,你是整个开发者社区真正的灵感来源。再次感谢,我们迫不及待想看到你接下来会做些什么。
日本最强大模型,把日本网友搞破防了
中国一开源,日本就自研。 3月17日,日本互联网巨头乐天集团正式发布了Rakuten AI 3.0,号称"日本国内最大规模的高性能AI模型",乐天介绍其有约7000亿参数,作为一款日语特化模型在多项日语基准超越GPT-4o,还拿了日本经产省和NEDO的GENIAC项目补助。 然后发布当天,这款日本最强大模型就“翻车”了。 有日本网友测试发现,在钓鱼岛事件上,该模型在阐述日本立场时,也明确表示了中国大陆和中国台湾对钓鱼岛的主权主张,而在抗日战争的定性上,该模型则直接列举了包括731部队等日军行径,并称东京审判已经定性了日本负有战争罪行。 这些回答引发了部分日本网友的质疑,认为该模型可能由中国开发。后来更是有日本网友查看了该模型的配置文件后发现,"日本国内最大规模的高性能AI模型",是DeepSeek V3。 而更为离谱的是,乐天一开始就没有放入DeepSeek的MIT许可证文件,被指出之后,才默默以NOTICE为文件名补了上去,提交说明写的是"Add the permission notice",里面的版权声明:Copyright (c) 2023 DeepSeek。 截至目前,乐天集团没有任何公开回应。 “最强日本国产大模型” 根据乐天的官方新闻稿,Rakuten AI 3.0是"基于开源社区最优秀的模型,结合乐天独自的高品质双语数据、技术力和研究成果开发"的,对Deepseek只字未提。 乐天还特别强调,这个模型是GENIAC第三期的成果,学习费用部分由GENIAC提供的计算资源补助支持。 GENIAC是经济产业省与新能源产业技术综合开发机构(NEDO)主导的项目,为日本的AI开发企业提供GPU利用方面的助力。说白了就是国家出钱、企业出力,目标是建立日本的自主AI能力。 值得注意的是,扒开该模型底裤没有任何门槛。 该模型权重上传到Hugging Face之后,任何人点进去,切到Files and versions标签页,打开config.json就能看到。用户发现模型的config.json文件中包含"model_type": "deepseek_v3"这样的条目。architectures写着DeepseekV3ForCausalLM,不是"参考",不是"借鉴",是直接声明了模型类别。 而继续看模型信息就可以发现,hidden_size是7168,intermediate_size是18432,num_hidden_layers是61,n_routed_experts是256,vocab_size是129280。和DeepSeek V3的原版配置一模一样。 所以楽天号称"参数量约7000亿",因为DeepSeek V3的参数量就是6710亿。四舍五入约等于7000亿,这个"约"字用得精髓。 有日本网友无奈的表示:DeepSeek现在都更新到V3.2了,乐天拿个旧版出来包装,套壳都不挑个新的。 翻车不是因为抄 DeepSeek V3是开源模型,许可证允许商业使用和二次开发,在开源模型基础上做微调是行业通行做法,乐天为何会翻车? 严格来说,乐天在法律上确实没有违规。但这件事被冲,不是因为"用了开源模型",而是因为几件事叠在一起。 第一,乐天在所有对外宣传中刻意回避了DeepSeek的名字。之前乐天发布RakutenAI-7B的时候,老老实实写了"基于Mistral-7B开发"。这次突然改成"基于开源社区最优秀的模型"这种含糊说法,明显是故意的。 日本AI研究者うみゆき在X上吐槽:上次老实交代了,这次怎么就故意写得含含糊糊了? 第二,许可证这个操作太难看了。你用了别人的开源成果,连许可证都没放进去,被发现了才补回来。这已经不是透明度的问题了,是态度问题。 第三,也是最致命的——这个项目花的是日本纳税人的钱。GENIAC项目的初衷是扶持日本自主AI能力,结果楽天拿到补助之后,下载了中国的开源模型,做了一层日语微调,然后号称"日本国内最大规模的高性能AI模型"。 有日本博主表示:真正可耻的不是用了别人的模型,而是把这件事说得含含糊糊。如果楽天一开始就说"日本目前还没有从零构建基础模型的条件,所以我们基于DeepSeek做日语优化",这不但不会炎上(指引发大量负面新闻),反而会被视为务实的开发策略。 可惜乐天选择了装。 这个事情放在日本社会的语境下,刺痛感会被放大好几倍。 2025年1月底,DeepSeek在全球爆火。中国AI企业DeepSeek低成本发布了高性能的生成AI模型,其iPhone应用在免费应用排行榜上压过ChatGPT登顶第一,引发了美国股市科技股暴跌的"DeepSeek冲击"。最具冲击力的是AI芯片巨头英伟达股价单日暴跌17%,一天之内市值蒸发近6000亿美元(约合91万亿日元),相当于两个丰田汽车的市值,刷新了单一股票单日市值跌幅的历史纪录。 日本媒体给DeepSeek起了个名字,叫"AI界的黑船来航"。 1853年,美国海军东印度舰队司令长官佩里率领包括两艘蒸汽船在内的四艘军舰来到日本,舰队停泊在江户湾入口的浦贺冲,这就是"黑船来航"。旗舰萨斯奎哈纳号(USS Susquehanna)排水量约2450吨,而当时日本最大的和船不过200吨左右,完全不是一个量级。 喷吐黑烟的蒸汽船的威容,对从未见过这种东西的人来说就是赤裸裸的威胁。据传佐久间象山和吉田松阴站在浦贺用望远镜眺望黑船,两人看到那压倒性的军事力量之后痛感:以日本现在的实力,完全没有任何胜算。 黒船来航被视为日本近代的开端。它终结了持续约250年的江户幕府统治,从那以后,各藩的藩士和藩主掀起了攘夷论的狂潮,最终导致了倒幕。 所以在日语里,"黑船"早已不只是指佩里的那几艘军舰了。它变成了一个固定的文化符号,专门用来形容"外来力量对日本造成的不可抗拒的巨大冲击"——你挡不住、躲不掉、也无法假装它不存在。当日本媒体把DeepSeek称为"AI界的黑船"的时候,潜台词是:这东西的冲击力等级,和172年前那几艘炮舰是一样的。 日本政府的反应也确实像被黑船吓到了一样快。 2025年2月6日,日本政府向各省厅发出呼吁,要求各政府机关在使用DeepSeek等生成式AI进行业务时,必须充分认识风险,并向内阁网络安全中心(NISC)和数字厅寻求建议。日本个人信息保护委员会特别指出:DeepSeek获取的包含个人信息的数据被保存在中国境内的服务器上,适用中华人民共和国的法令。 企业层面动作更直接。丰田汽车、三菱重工业、软银等日本大型企业已全面禁止员工在公司内部使用DeepSeek。丰田明确表示"出于信息安全的考虑,禁止使用";三菱重工即便员工提交申请也不会获批;软银则限制了公司内部访问,禁止在业务设备上下载和使用。不只是这三家,有大型素材厂商表示"与业务中使用的微软生成AI不同,判断风险较高";有大型住宅厂商称"考虑到信息泄露和数据被用于AI学习的风险"而决定禁用。很多企业的做法是只允许使用美国企业等特定服务,其他AI一律禁止。 不只是日本。意大利因涉嫌违反GDPR启动调查并要求删除应用;台湾以国家安全为由全面禁止政府机关使用;美国的国防部、NASA、海军均已屏蔽访问,众议院向全体议员发出了使用限制通知;澳大利亚和韩国也采取了类似措施。 从政府到企业,从日本到全球,DeepSeek在相当一部分国家和机构眼里,就是一个"碰都不能碰"的东西。 结果现在,日本企业拿着国家补助,用的就是这个"碰都不能碰"的东西,换了个名字,告诉你这是日本国产最强AI。 有日本网友在X平台发帖自嘲:算了别生气了,日本AI已经"周回遅れ"(落后一圈),现在唯一的路就是把海外开源模型进口过来追加训练,然后"ハイ国産です~"(哈,国产的哟~),搞"産地偽造国籍ロンダリング"(产地伪造+国籍洗白)。 还有人去乐天的AI聊天官网实际测试,发现代码能力太好了,而且居然支持图像输入——但DeepSeek V3本身不支持图像,Rakuten AI 3.0也没有加图像编码器。这位博主的结论是:乐天AI官网上跑的大概率根本不是自家的Rakuten AI 3.0,而是Claude或GPT系列。自己发布的"日本最强AI",自己的官网都不用。 回过头来看,黑船来航之后,佐久间象山提出了"以夷之术制夷"——引进西方的技术来增强国力,以此对抗西方。 172年后的2025年,乐天确实引进了中国的技术,但没有用来增强国力,而是用来增强PPT。
AI替我干活,我却更累了
一切都要从一篇在技术圈刷屏的帖子说起。 一个名叫Siddhant Khare的工程师,发表了一篇文章《AI疲惫是真实存在的,但却无人提及》。作为开源项目 OpenFGA 的核心维护者,身处技术浪潮最前沿的他描述了自己工作流程的改变。 过去,写代码是一条清晰、流畅且能带来成就感的路径:思考问题、编写代码、进行测试、测试通过后发布。那是创造者的愉悦。 而现在,他的日常变成了一个循环:提出指令、等待输出、阅读输出、评估输出、判断输出是否正确、判断输出是否安全、判断输出是否符合架构设计,修正不符合的部分,然后重新下达指令,周而复始。 他不再是那个亲手构建系统的创造者,而变成了一条永不停歇的生产线上的“质检员”。干完活后,没有往日的成就感,只有一片空白的疲惫感。这篇帖子迅速引发了热烈反响,评论区里感同身受的人很多:“是我本人没错!”“简直是我每天的写照。” 这并非Siddhant Khare的专属困境。波士顿咨询公司的一项研究,为这种AI带来的新型职场倦怠取了一个形象的名字“AI脑疲劳”。症状包括但不限于:注意力涣散、决策迟缓、大脑像一直在嗡嗡响,明明干了很多活,却感觉什么也没干成。 他们对1488名美国职场人的调查显示,已有14%的人深陷其中。 从“创造者”成为“监督者” Siddhant Khare试图用自己的经历揭示一个悖论:AI 让单次任务变快了,却让整体工作变得更累、更耗神。几乎在同一时间,哈佛商学院的研究者和波士顿咨询公司的调查都指向了同一个结论:AI 并没有如预期般解放我们,反而以一种更隐蔽的方式重塑了工作体验,带来了系统性的新负担。 比如,AI让程序员这份工作从“思考-编码-测试” 变成了“指令-审阅-修正-再指令”。Siddhant认为自己工作的核心从“创造”变成了“审阅”,也很难获得那种“心流”状态。 他感慨:当人们在一天内需要处理六个由 AI 生成的不同问题时,大脑不是在创造,而是在进行成百上千个微小的、高强度的判断:这个函数命名规范吗?那个逻辑在边界条件下会崩溃吗?这段代码有没有性能隐患?这种高强度的评价性工作,正在悄无声息地榨干认知资源。 哈佛商学院的研究数据证实了这一点:需要高度监督AI工作的员工,在工作中投入的精神努力增加了14%,精神疲劳增加了12%,信息过载感更是飙升了19%。 在很多关于未来的设想里,AI能帮人类处理很多事,能让人类有更多时间享受生活。实际上,至少到目前,和移动互联网出现以后一样,许多人工作和生活的界限被一台手机彻底模糊。 “当AI以一个随时可对话的窗口形式嵌入工作流,它就变成了一个随身携带、永不关门的办公室。”Siddhant表示,以前,下班意味着关掉电脑,离开那个物理空间。现在,对话框永远在线。 一个“帮我看看这个”的需求随时可以扔进来,AI瞬间给出答案,而人们需要进行确认和反馈。工作就这样悄无声息地滑入了本该属于休息的时间。 “那个本该为我节省时间的工具,为何最终吞噬了我一整天,甚至包括本该属于夜晚的时间?” fomo和潜在的思维能力退化 当你面对龙虾热觉得不知所措,程序员们的焦虑丝毫不比你低。 Siddhant在文章中列出的技术更新清单,是每一个技术从业者所感到疲惫,并且产生措施恐惧症的。 这种指数级的更新速度,让每一个从业者都陷入了深深的焦虑循环。更糟糕的,是知识贬值的速度。人们花费两周时间,精心构建的一套完美提示词工作流,三个月后,可能还不如新模型一句简单的指令。所有投入的时间和精力,仿佛瞬间归零。 另一个正在崩塌的体系是工程师追求确定性的思维。即使AI已经很先进,但输入相同内容很可能输出不同结果。追求确定性的工作突然变成了掷骰子。周一完美运行的提示词,周二可能因为模型的一次微调,就输出完全不同的、甚至错误的代码。 “每一次与它的互动,都必须保持警惕,因为永远不知道它会给使用者一个惊喜,还是一个惊吓。” 为了尽可能让AI能输出想要的内容,Siddhant在工作中花费了很长时间优化提示词,结果有时候会发现自己在这件事上的时间远超自己动手写完整个任务。 更让他害怕的是,在一次没有电脑、没有AI的白板技术讨论中,他诧异地发现,自己从零开始思考、推导一个问题的能力,竟然退化了。长期将初步的思考、代码框架外包给AI,就像长期依赖GPS导航后,逐渐失去了构建心理地图和认路的能力。 以前正是那些独自面对难题时,经历的挣扎、困惑、推导、试错的过程,构建了人们理解的深度。跳过这些痛苦的过程,直接拿到结果,或许能更快地完成任务,但代价是思维的钝化,是理解世界和解决问题能力的肤浅化。 长此以往人们要警惕变成一个只会“审阅”答案,而不会“创造”答案的人。 与AI相处也要照顾好你的大脑 虽然Siddhant抱怨AI带来的困境,但他也冷静分析了目前的状况,并且提出了一些与AI相处的建议,毕竟对于他们这些科技工作者来说,与AI一起工作这件事是不可逆的。 根据他的建议,结合哈佛商学院的学者以及波士顿咨询的研究者的观点,有以下五条具有实操性的建议。 1、建立边界,明确人机分工 AI擅长生成模板代码、撰写文档草稿、自动化测试、快速信息检索。人类擅长顶层架构决策、复杂问题调试、创新性思考、价值与伦理判断。两者并非替代关系,而是互补。 如何找到这个边界?Siddhant的经验是记录。他进行了为期两周的简单记录:什么任务用了AI,花费了多少时间,对结果的满意度如何。数据清晰地告诉他:AI在哪些领域是得力助手,在哪些领域反而是时间黑洞。现在,他知道了何时该用它,何时该亲自上阵。 核心在于:守护好创造性的核心环节,让AI回归工具属性。不要让工具定义你的工作流程,而要用你的目标和大脑去选择和驾驭工具。 2、为AI使用设定“熔断机制” 针对那个让人越陷越深的“提示螺旋”,Siddhant有一条硬性规则:使用AI编码,最多尝试三次。如果三次提示内,AI无法让他得到一个70%可用的内容,他就果断关掉对话框,自己动手写。 这条简单的规则,比他学过的任何高级提示技巧都为他节省了更多时间。它就像电路中的熔断器,在你的认知资源被无限消耗之前,果断切断回路,避免陷入“看似高效,实则低效”的认知黑洞。 同样,为每次AI会话设定时间限制也是一种有效的方法。比如,每次使用AI最多30分钟,计时器一响,无论产出如何,都交付已有成果或转而自己动手。 3、分离思考时间与执行时间 为了防止“思维萎缩”,Siddhant将每天的第一个小时留给了无AI状态。他用纸笔思考,手绘架构草图,用最原始、最缓慢的方式推演问题。这看似低效,实则是为大脑做必不可少的“热身运动”。当思维经过充分预热,再使用AI时,你便能更好地评估其输出,提出更精准的问题,而不至于被它带着跑。 4、接受“不完美”,追求“足够好” 对于追求完美的工程师来说,这是最难接受但最必需的一课。AI的输出从来都不是完美的,它总是“相当不错”,能达到70-80%的程度。如果你强求它产出100分的答案,你消耗在修正、调试、重写上的精力,可能远超你自己从零开始写的成本。 Siddhant接受AI产出70%的完成度。 将每一次AI输出都视为一个初稿、一个起点、一份原始素材。当它出现在屏幕上的那一刻,就在心里给它贴上“草稿”的标签。这种思维方式的转变,能让挫败感减少一半。 5、对炒作周期保持战略定力 面对层出不穷的新工具和新框架,如何避免陷入FOMO的焦虑循环?程序员现在的策略是:关注,但不盲从。他们依然密切关注行业动态,因为这是他工作的一部分,但不再追逐每个新工具上市首周就采用,而是专注于使用一个主力工具,并深入掌握其核心特性。对于新工具,他会等它们经过数月(而非数日)的市场验证后,才进行评估。 文章的最后,Siddhant写下了一段话:“照顾好你的大脑。它是你唯一的头脑,任何人工智能都无法替代。”

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。