行业分类:
加载中...
头条分类:
加载中...
亚马逊“神户计划”曝光,2027年推出AI超市挑战沃尔玛
IT之家 3 月 28 日消息,据《商业内幕》昨天报道,亚马逊内部正推进“神户计划”,意图进军线下超市领域并挑战业内巨头沃尔玛,首批门店有望 2027 年开业。 图源:《商业内幕》 内部文件显示,亚马逊的“神户计划”将融合沃尔玛式大型超市、机器人仓储系统,这些门店将同时销售生鲜、日用品,后端嵌入自动化执行中心,支持门店购物、到店自提和配送到家,还能够根据 AI 来决定每家门店的商品组合,不过整体成本预计会更高。 不过亚马逊此前在实体零售领域表现并不稳定,曾在数年前推出 Fresh、Go 零售店但最终不算成功,2017 年该公司花 137 亿美元(IT之家注:现汇率约合 948.02 亿元人民币)收购的 Whole Foods 也未能显著提升市场份额。 据悉,“神户计划”门店面积约 22.55 万平方英尺,看起来很像沃尔玛超级大卖场,但内部运作完全不同,约一半面积用于仓储,内置自动化存储、拣选和打包系统,商品数量约 25 万种,接近沃尔玛的两倍。 同时,这套系统的自动化程度非常高,内部带有堆叠货箱网格,机器人可以从屋顶移动并取货,可以采用高密度设计以节省仓储空间。公司内部还在开发“Orbital”系统,能够统一处理常温、冷藏和冷冻商品,预计 2 年后上线。 不过,这套系统仍然需要人工处理大件商品,生鲜仍然需要从卖场直接拣选。但亚马逊已经在开发一种 AI 系统,让超市经理能够直接输入提示词然后自动生成选品方案。
22岁辍学生做AI数据生意,让人拍倒垃圾视频,公司估值已达10亿元
编译 | 陈佳 编辑 | 程茜 智东西3月27日消息,据外媒Business Insider昨日报道,美国AI数据采集创企Kled AI正在付费让普通人帮忙采集AI训练数据,其平台上线仅两个月用户数已突破20万,每天产生约500万次上传。该公司近日完成650万美元(约合人民币4494万元)融资,估值达1.5亿美元(约合人民币10.37亿元)。 该平台付费收集的训练数据包括倒垃圾、坑洼的路面、在门口拿外卖等日常场景,并将这些数据卖给机器人和自动驾驶等企业。 Kled AI由22岁的阿维·帕特尔(Avi Patel)创办,团队规模仅11人,背后的投资人包括自动驾驶公司Waymo创始人塞巴斯蒂安·特龙(Sebastian Thrun),以及法国亿万富翁贝尔纳·阿尔诺(Bernard Arnault)的风险投资基金。 帕特尔2021年进入伊利诺伊大学攻读计算机科学,两周后退学,先做音乐版权平台,发现AI公司对训练数据的需求持续涌来,意识到这是更大的机会,随即转型。 他在此次接受Business Insider采访时说,现有的数据采集模式本质上是公司免费拿走用户数据,Kled AI想反过来——用户主动上传,平台按任务付费。帕特尔说:“我认为每个人最终都会出售自己的数据。” Kled AI创始人阿维·帕特尔(Avi Patel)(图源:Kled AI) 这门生意率先在东南亚打开局面。Kled AI产品上线两月后登上马来西亚App Store金融类目榜首,在菲律宾和印度尼西亚用户增长迅猛。帕特尔说,Kled AI在全球执行统一费率,马来西亚普通用户每月日常上传能赚20到40美元(约合人民币138元至277元),头部用户月入可达2000美元(约合人民币1.38万元)。一名美国卡车司机在车上架设多个摄像头、全天上传行车数据和路面信息,每月收入约7400美元(约合人民币5.12万元)。 Kled登上马来西亚App Store金融类目榜首(图源:Kled AI) 一、两周退学转行创业,从音乐版权受挫中撞进数据生意 Kled AI创始人帕特尔的第一段创业经历与AI无关。帕特尔最初做的是音乐版权生意,搭建了一个在线市场,允许音乐人上传作品,企业可以直接完成授权交易。这个平台一度聚集了数亿首歌曲,但最终因高昂的版权成本和与唱片公司合作成本过高而失败。 转折出现在运营过程中不断出现的外部需求。帕特尔说,在做音乐平台期间,越来越多公司来询问是否可以提供AI训练数据,这些需求并不集中于某一类内容,而是指向更广泛的数据供给能力。相比之下,音乐授权的增长空间显得有限,这让他开始重新评估方向。 在转向数据业务的早期阶段,帕特尔仍然沿用传统路径,即从影视或内容制作机构采购素材再转售给下游客户,但这种模式更接近渠道生意,差异化有限,也难以建立长期壁垒。帕特尔随后将重心转向直接面向个人收集数据,试图把分散在日常生活中的影像和行为转化为标准化的训练素材,这一思路最终演变为Kled AI当前的产品形态。 二、任务驱动采集、限定设备型号,数据质量靠规则而非筛选 在确定数据供给方向后,Kled AI并没有继续沿用简单的数据转售模式,而是转向直接面向个人采集数据。帕特尔说,早期从制作公司购买内容再转卖的方式,本质上只是中间商业务,难以形成规模优势,因此团队转而开发应用,让用户主动上传数据并获得报酬。 与传统“抓取式”数据获取不同,这一平台强调用户自愿参与并获得收入。帕特尔认为,过去大多数互联网数据是在用户未获得补偿的情况下被收集,而Kled AI试图改变这一点,通过明确的任务分发机制,让数据生产过程变得可控,同时建立付费关系。 具体执行上,平台不会收集随机内容,而是围绕特定场景设计任务。例如让用户拍摄自己倒垃圾的视频,用于机器人行为训练;拍摄门口外卖的照片,用于配送和地图系统优化;或者对同一场景拍摄两张图片,一张包含物体,一张不包含,用于图像编辑模型训练。这类任务直接对应下游模型需求,减少后期处理成本。 同一场景拍摄两张图片示例(图源:ObjectRemover Blog) 在数据质量控制上,Kled AI更多依赖规则约束而非事后筛选。由于上传内容由任务定义,数据结构更统一、可用性更高,同时平台对设备也设有限制,仅允许使用较新款iPhone的用户上传图像,以保证画面质量和一致性。这种“前置约束”的方式,让数据在采集阶段就接近可用状态。 零工人工智能训练师们上传各种各样的内容(图源:Getty Images) 三、两个月登顶马来西亚榜单,东南亚用户先跑起来 Kled AI在约两个月前上线,很快在马来西亚App Store登上金融类目榜首,并在菲律宾、印度尼西亚等市场扩散开来。帕特尔说,当前平台用户规模已超过20万,每天产生约500万条上传内容,增长主要来自东南亚及其他收入水平相对较低的地区。 在马来西亚,普通用户通过零散上传每月可以获得20至40美元(约合人民币138元至277元)收入。平台采用全球统一的付费标准,但在不同地区形成了差异化效果,低收入国家用户更容易将其视为稳定的补充收入来源。 随着Kled AI平台使用频率提高,一部分用户开始将数据上传转变为更持续的收入方式。帕特尔提到,一名美国卡车司机在车辆上安装多台摄像设备,全天上传行车视频,同时拍摄沿途的路面坑洞、施工区域等信息,这些数据随后被转售给自动驾驶相关企业。这位卡车司机每月收入约7400美元(约合人民币5.12万元),仅通过上传数据就实现了收入翻倍。 自动驾驶车辆检测系统(图源:ObjectRemover Blog) Kled AI通过统一定价与任务机制,将不同地区、不同使用强度的用户纳入同一体系中,让数据供给逐步呈现出规模化特征。 四、650万美元融资建设反欺诈系统,AI客户之外盯上对冲基金和政府 在完成产品初步验证后,Kled AI近期完成了一笔650万美元(约合人民币4494万元)融资,估值约1.5亿美元(约合人民币10.37亿元)。投资方包括Waymo创始人塞巴斯蒂安·特龙(Sebastian Thrun)以及法国亿万富翁贝尔纳·阿尔诺(Bernard Arnault)相关的投资机构等。帕特尔说,这笔资金将主要用于完善平台的反欺诈系统,确保用户上传的数据真实有效,并与任务要求匹配。 随着用户规模和上传量快速增长,如何验证数据质量成为平台运行的重要环节。Kled AI正在搭建一套机制,对上传内容进行核验,避免用户重复提交、伪造场景或偏离任务要求。这一系统直接关系到数据能否被下游企业使用,也决定了平台在数据交易链条中的可信度。目前,Kled AI已与数家领先AI实验室展开合作,数据主要用于模型训练。 从客户结构来看,AI和机器人企业仍是当前主要需求方,但帕特尔判断,这一市场只是整体机会的一部分。在他看来,对冲基金、消费品牌以及政府部门对数据的长期需求规模更大,这些机构在数据上的支出规模达到万亿美元级别,其中相当一部分数据过去依赖抓取或非授权渠道获取。 Kled AI试图推动一种不同的数据供给方式,即由个人在知情情况下主动提供数据,并获得直接报酬。帕特尔认为,随着这种模式成熟,用户的数据交易可能逐步走向更“被动”的形式,例如将Spotify或Netflix等账户接入平台,根据使用行为获得收入。这类数据在金融机构中具有较高价值,用户甚至可能通过数据收益覆盖原有订阅支出。 结语:数据获取方式在变化,个人开始进入AI生产链条 从Kled AI的路径来看,AI产业链中长期被忽视的数据环节正在发生变化。过去,训练数据多依赖平台积累或爬虫抓取,来源分散且缺乏明确定价,而Kled AI试图通过任务分发与直接付费的方式,把数据获取转化为一门可组织、可交易的业务。 这一变化也在重新定义个人在数据链条中的位置。用户不再只是被动提供数据的一方,而是可以通过主动参与获得收入。随着数据质量要求提高以及合规性约束加强,企业对可追溯、经授权数据的需求可能持续增加。类似模式能否在更大范围内成立,取决于成本、效率与监管之间的平衡,但其背后的数据定价逻辑,已经开始显现。
马斯克“芯片宏图”招聘启动:年薪233万,7×24小时on-call
克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 马斯克的Terafab芯片计划刚官宣,招聘职位就已经悄悄挂上了特斯拉官网。 加州要光刻工程师,德州要硅工程师,还要一个管过亿级资本项目的技术项目经理来主持大局。 给出的薪资,最高开到了一年33.8万美元,相当于人民币233万。 不过,跟这个计划的野心比起来,这样的薪资水平或许并不算什么—— 马斯克给出的目标是每年生产1太瓦算力,相当于目前全球AI算力年产出的50倍。 SpaceX官方公告,也是直接把它定义为“迈向银河文明的下一步”。 而招聘要求嘛,一如既往符合外界对老马的一些刻板印象…… 7×24小时on call。 233万招募芯片工程师 从职位分布来看,特斯拉这次招的是真正做芯片的人。 在Palo Alto,挂出的是光刻方向的模组工程师(Module Process Engineer)。 光刻是芯片制造里技术门槛最高的环节之一,需要用极紫外光把芯片设计蚀刻到硅晶圆上,精度在分子尺度。 特斯拉要求应聘者有至少10年的顶尖半导体开发经验,给出的底薪范围是88000到240000美元(约60-152万人民币)。 另一个面向加州的岗位是流程集成工程师(Process Integration Engineer),负责构建先进逻辑芯片的制造流程,底薪上限进一步拉到338280美元(约233.8万人民币)。 德州奥斯汀这边则在招硅工程师(Silicon Engineer),以及一名需要有“1亿美元以上资本项目”管理经验的技术项目经理(Technical Program Manager)。 但想拿到这样的高薪绝非易事,这些岗位的要求也写得明明白白,需要随时on-call支持7×24小时的生产运营,遇到关键生产问题必须迅速响应。 薪资构成也很特斯拉,底薪在科技大厂里并不算顶尖,然后用股票激励来补差价,另外7×24小时的模式也在说明,这份工作和正常作息之间,可能要二选一。 除了特斯拉,马斯克的SpaceX那边也没闲着。 其“硅部门”目前挂出了约60个开放职位,覆盖芯片封装、太空专用芯片研发等方向,包括在德州Bastrop工厂的封装与组装工程师,以及在华盛顿和加州的芯片研发岗位。 马斯克的造芯计划 招这么多人,是因为马斯克想做一件现有芯片产业链完全跟不上的事。 Terafab的目标是每年生产1太瓦算力,而目前全球AI算力的年产出约为20吉瓦,也就是说,Terafab的目标是它的50倍。 马斯克的逻辑很直接——如果三星、台积电、美光全力扩产,他愿意“买下所有的芯片”,但问题是这些厂商的正常扩张节奏根本喂不饱他的需求,所以只能自己建。 工厂选址在奥斯汀,紧邻Tesla总部和超级工厂,由Tesla、SpaceX和xAI三家联合推进。 从设计到制造,整条链路都在一个屋檐下完成,甚至包括光刻掩膜版(lithography mask)的自研,也就是把芯片电路图案印到晶圆上所用的模板。 这就相当于既做英伟达也做台积电,马斯克在发布会上说,这种设计与制造一体化的模式“在全球尚无先例”。 另一个行业罕见的地方在于,Terafab计划将逻辑芯片和存储芯片的生产整合到同一屋檐下,目标制程达到2nm。 产出方面,Terafab计划生产两类芯片—— 一类针对边缘计算和推理优化,用于Tesla的FSD自动驾驶系统和Optimus人形机器人; 另一类是高性能芯片,专为太空应用设计,供SpaceX和xAI使用。 按照计划,80%的算力将部署到太空,因为在马斯克看来,美国全国的总发电量只有0.5太瓦,地面根本放不下这么大的算力需求。 用他的原话来说,“基于太空的人工智能,显然是实现规模化发展的唯一途径”。 至于资金,瑞银分析师估计Terafab的最终成本可能高达3000亿美元。 SpaceX计划今年夏天IPO,目标融资500亿美元,估值可能超过1.75万亿美元,为太空AI数据中心筹资是重要目标之一。 但显然,就算IPO顺利,这笔钱也只是个开头。 招人才是真正挑战 3000亿美元的项目,钱的问题可以慢慢解决,人的问题可能更棘手。 半导体是一个极度依赖经验积累的行业。台积电的护城河,与其说是设备和资金,不如说是几十年里在流片、制程、良率控制上踩过的无数个坑。 这类知识很难靠挖几个人来快速复制,而Terafab要做的,恰恰是从零搭建一座涵盖设计、光刻、封装、测试的全链条芯片工厂。 所以比起募集资金,招募人才,才是马斯克这一雄心勃勃计划面临的最大挑战。 雪上加霜的是,这场人才争夺战发生在一个本已供不应求的市场里。 全球芯片行业的熟练工人短缺是结构性问题,不是多开几个职位就能解决的。 Terafab要和台积电、英特尔、三星抢的,是同一批在顶级晶圆厂待过、真正懂量产的人。 SpaceX算是提前做了一些准备。去年它已向德州Bastrop的星链工厂投入2.8亿美元,扩建半导体研发和封装设施,目前硅部门挂出的约60个职位,也有相当一部分指向太空专用芯片的研发和封装方向。 相比Terafab最终的体量,这些布局更像是热身。 但这也符合马斯克一贯的风格——先把目标说出来,再让执行去追。 即便现在挂出的这几十个职位都能招到人,和那个“每年1太瓦算力”的目标之间,也还隔着一段距离。
用AI来“增效”,大厂打错了算盘
3月26日的港股交易中,快手股价重挫14%,市值跌破2000亿港元。这家昔日的港股宠儿,当前股价距离52周高点已经跌掉了一半。 这并不是由于它的业绩拉胯:前一天晚上,快手交出年度成绩单,全年营收和利润创下新高,同比增速均有十几个百分点。 同时,快手旗下的视频生成大模型“可灵”表现不俗:全球用户突破6000万,今年1月的年化收入(ARR)超3亿美元,全年预计增长超100%。 为了加速追赶AI这趟时代快车,快手管理层还在财报电话会议上宣布,今年将投入260亿元资本开支,用于AI算力建设。 既有现实业绩,又有“未来可期”,快手的股价似乎没有理由不迎来一波上涨。然而,次日的股价大跳水,给这只昔日的明星股又浇了一瓢冷水。 这家基本面良好,还有AI概念加持的科技企业,为何长期不受资本待见? 原因有很多,比如公司业绩指引、短期市场情绪等。但最重要的或许是: 快手向AI的转型并不彻底,大半个身体仍然眷恋于旧业务。它把AI大模型当成了传统业务的加速器,而非下一个志在必得的决赛场。 在此情况下,二级市场对于快手的估值,也就只会按照旧的商业模型而展开,而非以全新的AI商业逻辑进行推演。 当AI时代汹涌而至时,快手业绩继续向好,却在短短一年间市值腰斩,其实并不意外。 像快手这样,嘴里说着“拥抱AI”,却始终忘不了、放不下旧疆土,不肯把战略重心从老业务上挪开的公司,国内国外都有很多。 有的公司将AI视为降本增效的利器,在基础模型、AI App等领域缺乏建树,却早早把“AI替代打工人”提上日程。 有些公司则像快手这样,试图用AI“赋能”老业务。他们竭力把AI融入日常工作流中,甚至将AI工具使用率、token人均消耗量作为考核标准;许多业务部门无论是否真的需要AI来“赋能”,都在管理层的督促下,匆匆忙忙跃入了AI时代。 无论是“AI裁员”还是“AI赋能”,亦或是在细分领域浅尝辄止、小打小闹,都是一家科技公司在AI时代陷入迷失的典型症状。 如此“拥抱AI”,归根结底只是时髦而无用的形象工程,无法从根本上增强企业的AI竞争力,也拿不到AI时代的船票,自然也很难打动精明的投资机构。 科技公司有没有全力拥抱AI,正成为资本市场衡量其长期价值的关键标准。 一个愈发明显的趋势是:AI正在急剧加速科技公司的马太效应——那些全力向AI转型的公司,将聚拢最多的资金、人才和资源,占据下一个时代的主舞台;那些言不由衷、决心不足的企业,正面临被挤出赛道的风险。 对于快手而言,AI大模型究竟是一块全力以赴的新业务,还是一则光鲜亮丽的新叙事? 从资金投入来看,答案似乎是前者。 在财报电话会议上,快手抛出了260亿的资本开支计划。与新BAT动辄每年上千亿的投入相比,快手的投入力度显然逊色了不少;但相对于快手的营收体量,数百亿的资本开支同样称得上是大手笔。 但从实际动作来看,快手对于AI的长期规划,似乎更接近后一种逻辑。 快手AI给外界留下最多印象的就是可灵。它在2024年6月上线后一鸣惊人,不仅甩开了同时期的国内竞品两条街,还在全球AI圈子里扬名立万,与OpenAI麾下的Sora掰手腕。 但在接近两年的时间里,可灵逐渐归于平淡。当竞争对手纷纷加码视频生成,不断推出新模型、新技术时,可灵有些过于安静了。 特别是2026年初,字节旗下的Seedance 2.0横空出世,成为整个AI圈子谈论的当红炸子鸡。再加上Sora 2的拉胯,Seedance 2.0成为这条细分赛道的新王者。 当然,可灵自己也在不断发展,用户量、App下载量、API调用量等都在增长,AI打榜也有不少亮眼成绩。但在当下,恐怕不会有多少人觉得,可灵依然像两年前那样大幅领跑。 而在商业化方面,年化收入二十多亿的可灵,尚不足以给快手的业绩带来显著提升。 可灵起了大早,却赶了晚集。部分原因是,快手从一开始就没有全力“押宝”可灵。甚至可以说,快手AI的战略焦点,从来不是可灵这一棵独苗。 可灵扮演的角色,更像是快手在AI领域的“形象工程”。它向外界展示了快手的AI技术力和想象力,但也基本上止步于此。 快手AI的真正重心,仍然是以短视频为核心的传统业务。 按照快手CEO程一笑等高管的说法,快手除了视频生成,还将在生成式推荐大模型和多模态理解大模型上持续投入。 但这并不意味着,快手将在上述领域追逐SOTA、与大厂正面竞争。持续投入的目的,依然是优化主站的内容分发、广告投放和电商转化效率。 此外,快手还计划在电商和营销场景推广AI智能体。这同样不是为了追赶OpenClaw“养虾”,而是希望实现自动化投放、智能客服等功能,带动更大的商业价值。 不难看出,战略定位迥异,是快手AI与新BAT等巨头的最大区别。 新BAT的AI业务均有较高的独立性,不需要考虑怎么“支持”兄弟业务。这种特质,让他们可以更自如地探索AI大模型的上限和边界,同时也不需要过早考虑变现和盈利问题。 相比之下,快手AI的绝大多数动作,都面临一个天然的矛盾:他们是面向下一个时代的新物种,却必须以“为核心业务服务”为起点和终点。哪怕是走得最远的可灵,也总是与快手视频生态密不可分,远不如Seedance那样放飞自我。 其实,无法把AI与现有业务切割开来,正是许多科技公司投身AI的最大桎梏。 他们在谈论“拥抱AI”时,并非真心觉得自己必须改弦更张,转型为一家AI驱动的公司;而是希望搞一场繁花似锦的“中学西用”,把AI技术当成工具包,既不改变业务范式,又要享受AI红利。 这种“既要又要”的方法论,绕来绕去,终归以辅助老业务为目标,势必导致AI跳不出战略规划、公司文化和部门竞争的窠臼,不利于诞生真正有创意的新产品、新技术。可以说,他们在AI领域最大的敌人就是自己。 传统业务表现出色、且有可灵撑起AI想象空间,快手却不被资本市场所看好。这再次证明:AI已经超越了给老业务“助攻”的配角定位,必须成为所有科技公司的“主角”。 在语言大模型横空出世前的数十年里,AI的主要定位就是“助攻”,围绕现有业务,提高效率、降低成本。 根本原因在于,这一阶段的AI停留在机器学习的阶段,技术远未成熟,应用场景局限于图像识别、语音识别、文本翻译等领域。对于绝大多数企业来说,耗时耗力搞AI,唯一能看到的价值,就是在上述场景中给现有业务提供帮助。 但从2022年底至今,在众多企业和顶尖人才的竞争与协作下,AI不再是旧时代的附庸,而是新时代的基石。看清这一划时代变革的公司,很快都改变了AI战略。 在国内,字节是最早启动AI战略大转向的巨头之一。 早在2016年,字节就设立了AI Lab人工智能实验室,引入了多位学界和行业精英。但AI Lab并未把重点放在大模型上,而是围绕字节各项业务做文章,成果与字节自身需求绑定,比如为字节所有产品提供翻译服务,AI写稿机器人,以及今日头条和抖音的搜索服务等。 然而,AI Lab的兢兢业业,并没有让字节在全球AI版图中占据领先地位,甚至可以说基本没有存在感。 直到2023年初,ChatGPT火遍全球后,字节火速组建了专门的大模型团队,在随后三年多的调兵遣将,重整AI业务板块,并投入巨量资源和资金。 如今,字节AI板块基本成型,最大变化就是Seed、Flow等团队不再以辅助抖音为目标,而是自主追求AGI,这才有了豆包大模型、App及其他产品的崛起。 阿里的AI业务也经历了类似的发展,只不过大转向更晚一些。 早在2023年4月,阿里就提出“AI大模型的出现是一个划时代的里程碑”。但基于这一逻辑进行推演,阿里却得出一个格局不大的结论:所有产品都值得用AI重做一遍。 不难看出,阿里彼时觉得,AI是现有业务的加速器,拥抱AI就是用AI改造存量产品。随后几年,阿里千方百计把AI融入自家产品,而后者也纷纷标榜完成了“AI转型”。 事实证明,这条“捷径”根本行不通。到2025年下半年,阿里AI在大多数领域都被字节远远甩开。 直到最近,阿里终于“开窍”了,集合整个公司的力量发展千问,还把散布于各个条线的AI业务整合为ATH事业群,并由吴泳铭亲自挂帅。AI的重心不再是“赋能”旧业务,大阿里的业务板块反而变成了千问的功能组件。 阿里的AI业务终于驶入快车道。猛踩油门的阿里,颇有“二次创业”的气势。 与此同时,也有不少仍然沉迷于“AI提效”的公司,在围绕老业务继续打转。 AI在快速迭代演进;企业看待AI的方式和战略,理应也随着时代变化而演进。是把AI当工具,还是全力向AI转型,已经成为不同企业的战略分野。两者格局高下立判,而效果的差异也一目了然。 AI不再是提效工具,而是决定公司兴衰的胜负手。AI对于科技行业格局的影响,也将空前巨大。 以往,AI作为辅助工具,企业是否采用,通常并不影响公司的行业地位。对于大多数科技公司,尤其是互联网公司来说,技术、产品、人才、运营、资金乃至品牌,都是比AI更重要的竞争元素。 如今,AI对于一家公司的影响之大,超越了许多科技公司的预期。 资本对于AI的青睐,让沉寂已久的“市梦率”再度复活。智谱、MiniMax每年营收区区几亿人民币,却以如此低的收入规模拿到了3000亿市值,相当于1.5个快手。 相对应的,那些打不好AI这张牌的公司,市值被普遍低估。即便财报亮眼、业绩稳健,投资者依然不愿意把太多筹码放在这些旧时代的个股身上。 同时,AI也在影响企业的人才实力。 今年春招,那些大力拥抱AI的企业,一边请大牛加盟,一边扩招实习岗位、搜罗青年才俊。另一边,不少卷入AI裁员传闻的大厂、中厂,基本上都在AI方面行动缓慢,成果寥寥。 一边打着AI的旗号“砍人”,另一边则以AI之名大手笔招人——这种反差,揭示了在AI时代,那些真正拥抱AI的企业,会产生更多的人才需求和岗位。 最后,AI将导致用户入口加速集中。 用户接触信息、商品和服务的入口越来越集中,是科技发展的必然产物。在移动互联网时代,大大小小的公司尚可通过线上线下同时布局、构建私域、在巨型生态中“搭便车”等方式,绕过巨头对于入口的控制,解决流量来源问题。 如今,用户的使用习惯被AI改变,需求与供给之间的距离被极大缩短,进而导致入口的急剧收窄。新BAT等大型科技公司做AI,重要目标之一就是争夺AI时代的入口。 类似的情况,在移动互联网时代已经发生过一次:小程序的崛起,让大量App失去了入口价值。只不过,微信相对包容的第三方生态,以及移动互联网的碎片化特性,让这一问题还不算突出。 但到了AI时代,没能掌控AI入口的公司,注定面临更大压力。他们很可能丧失入口主动权,进而沦为大型AI平台的“功能组件”。 AI仍在高速发展,企业参与竞争所需要的人才、资金和资源越来越多。随着时间推移,能够继续长跑的玩家注定会越来越少,整个行业的集中度必将越来越高。前两年,大量中小公司退出基础模型和Chatbot竞争,正是这一趋势的表现之一。 甚至可以大胆预言,以后科技行业只有两类公司:AI公司和非AI公司,两者都在“拥抱AI”,动作和策略也会十分相似,但价值和前景存在巨大分野。这就像汽车领域,新势力和传统厂商都在造新能源车,但后者在被反超后几乎没有翻盘的机会。 对于快手、网易们而言,得益于移动互联网时代的积淀,他们虽然落后,但还没有下牌桌。在机会窗口彻底关闭前,怎样放弃“AI辅助”的陈旧思维,以百倍投入向AI转型,不仅考验他们的战斗力,也将考验创始人“二次创业”的决心和耐力。
智象未来姚霆:在双寡头格局下,一家AI视频创业公司的生存法则与Agentic未来
编辑|刘毓坤 在中关村论坛的分论坛间隙,智象未来(HiDream.ai)联合创始人兼CTO姚霆坐在一间就近的会议室里,用极快的语速和极高的信息密度,讲述了一家AI视频创业公司在"字节-快手"双寡头格局下的生存逻辑。 这位出身微软研究院、曾在京东带领团队做过十亿级图像搜索和7×24小时物流智能机械臂分拣视觉方案的技术派创业者,正带领智象未来走出一条与行业主流叙事不同的路径——不追逐大而全的通用模型,而是深耕"1+3"垂直场景,押注全模态世界模型与Agentic应用的终局。 从微软到京东:视频生成的基因溯源 姚霆的技术履历几乎贯穿了中国AI视觉商业化的完整周期。 "那时候就做很多跟搜索引擎相关的图像识别,比如Bing的video search,包括小冰一些视觉对话,后来做偏图到文的生成,还不完全是文到图的生成。"在微软研究院时期,姚霆参与了小冰的视觉对话系统,"用户提交一个图像、视频,给它生成一些描述,驱动用户和小冰之间的聊天"。 2018年离开微软加入京东后,他的团队将视觉技术大规模商业化:"今天大家用京东APP的时候,经常会使用的功能叫以图搜图,或者在京东叫拍照购,淘宝叫拍立淘——是那时候我们在做的事情。我们做了有十亿级商品图像搜索。"此外姚霆和他的团队在探索的还包括京东所有的图像视频内容审核,以及部署在物流仓里的具身智能的前身形态:两套7×24小时稳态运营分拣机械臂的视觉方案。 但真正的转折点发生在2017年。"那时候我跟潘博士跟着梅老师还在微软亚洲研究院,做了全球第一个从文生成视频的工作研究。"姚霆回忆道。这一超前布局在2022年终于迎来爆发点——Midjourney的图像生成和ChatGPT的横空出世,让团队看到了"很大的场景可能性,且这个场景跟我们相关,因为我们是做这个(多模态技术)出身的"。所以,我们一起创立了智象未来。 2024年,智象未来开源了HiDream-I1模型以撬动声量。如今,这家成立刚三年出头的公司B轮融资正在交割中,ARR(年度经常性收入)已达数千万美金级别。 世界模型的三重定义与全模态终局 面对"世界模型"这一概念混乱的技术路线之争,姚霆给出了清晰的分类框架。 "世界模型其实分三个层次,"他解释道,"大语言模型算是较高维度的一个世界知识表达,其次还有一个中层表达的学习,像Yann LeCun做的那套JEPA就比较偏中层的表达学习,它是偏理解,理解完了之后会做动作预测。还有另外一个分支跟我们比较相关,就是底层的像素的生成,或者我们认为是视频的生成。" 他认为,近期世界模型的定义正在收敛,可分为三大类:第一类是在现有视频生成模型中融入因果关系和物理规律;第二类是根据用户指令实时生成场景(如Genie-3的代表性工作);第三类是World Action Model,"跟具身智能特别相关,核心问题就是根据用户的输入指令,同时生成视频和动作"。 智象未来的技术路线选择是全模态统一架构。"各个模态之间不会去单独的编码,它一定是统一的编码,或者可以简单认为它是个统一的tokenization,"姚霆强调,"它一定是全模态而不是以前经常说的多模态。" 这一技术判断直接指向Agentic应用的未来形态。"我们会认为所有的Agentic app是等于一个平台或者一个载体,这个载体可能是PC,可能是手机,乘上一个中间的Harness,或者我们认为是context learning,会对下层skills的一些管理、适配以及组合,底层可能是OS,类似OpenClaw的形态。" 姚霆进一步阐释这一范式与世界模型的关系:"如果真的有一个很强大的全模态的世界模型,那就可以很好的支持用户的输入可以是任意模态甚至是同时有多个模态,下层的skills也是各种模态,中间的harness对这些模态的管理也是全模态的,真正可以做到端到端完成用户想创作的任何任务。" 在他看来,终局形态是"任意输入,任意输出"——"想怎么输入,想它输出什么它就可以输出什么。在一定时间内,我的预期就是这样,它才是可以称得上世界模型的东西。" "1+3"架构:避开通用模型陷阱 在商业化路径上,智象未来明确避开了与大厂在通用视频生成能力上的正面竞争。 "没有任何底层模型可以解决任何问题,就不说视频了,连文本都不会,"姚霆直言,"大家会找到自己的垂直的赛道、行业、场景,在这个场景下去深耕商业化,才是我们能够生存以及发展更好的机会,而不是说无谓的去做通用的模型能力。" 这一思路体现为智象未来当下的"1+3"的产品架构:一个底层全模态世界模型底座,支撑上层的三个智能体出口——视频创作工具vivago、AI影视制作、以及营销场景应用,未来甚至是更多的智能体应用。 在基本上没有进行投流获客的自然状态下,去年上线的vivago目前海外专业创作用户已超过三千万,单是今年Q1新增用户就接近两千万,"希望今年很有可能会做到超过一个亿用户"。AI影视赛道"不完全统计我们已经制作超过五千分钟短漫剧了",包括12集漫剧《量子湖传说》和参与春晚合肥7分钟的制作。营销场景则延续了团队从京东时期积累的基因。 即将发布的"帧赞"产品瞄准AI影视的工业化标准。"我们上周参加安徽紫云山的微短剧大会,这个行业有个很重要的问题——之前快速上这么多AI漫改的剧,但是质量偏低。为什么只有10%的能赚钱,因为观众的需求水平很高的,我们还是希望为这个行业提供一个更高质量的、工业化标准的协作工具。" 商业化结构上,目前2B收入大于2C,但姚霆认为Agent体系的发展"可能会带来更多的2C的可能性,空间和潜力更大,所以不排除2C的比例未来会提升"。 双寡头格局下的生存法则:速度、架构与Agent 面对字节(即梦)和快手(可灵)的生态闭环,姚霆并不认为初创公司没有机会。 "今天这个时代,大家去做人工智能,机会来说是相对会比较平等的,"他说,"但是作为初创公司,我觉得有几点还是要做好才有可能抓住机会。" 首先是技术架构的持续领先。"从2023年Unet开始,到DiT,到后来我们做到扩散自回归架构Diffusion + Auto-Regressive,今天我们做的一个全模态全新的架构,可以认为我们每次还是精准的踩住了整个技术迭代的突破口,甚至在某些时间点上还会领先几个月,有可能3个月、6个月。" 其次是产品速度必须快于大厂。"有很多的应用场景以前是不会拍脑袋想出来的,这种才是我们所说的速度一定要快,一定要把大厂,甚至要做得比寡头们速度更快、迭代更快。"这是创业公司所拥有的灵活性便利。 第三是跳出能力竞争的维度,转向Agentic的端到端创作。"Sora这一类产品只是提供了一种能力,但是它并没有为用户提供完成创作任务的智能体体系,我觉得这可能是我们接下来最大的机会。未来我们产品的发展可能完全的跳开能力本身去帮助用户便捷地完成端到端的真正的创作。" 姚霆用"发挥有限弹药的力量同时保持灵活性"来形容这一策略——"只要下面的全模态Harness平台做好,上面Agent可以很快速的进行调整"。 国产算力适配与具身智能布局 在算力层面,智象未来已完成与阿里云、华为云、寒武纪等国产算力的商业适配。"上线之前我们都会做很好的适配以及效果的对比,一定是达到效果预期才会切换到新的算力平台。"姚霆表示。 具身智能是另一个战略方向。"最近已经开始跟具身智能专业数据基础设施企业诺亦腾机器人等开始战略合作,帮助他们首先解决具身智能的高精度训练数据问题,我们会结合真实的数据和多模态大模型生成的数据,去做一个融合,既可以给具身智能本体厂商用户去预训练VLA模型,当视频数据的精度达到毫米级别,也可以直接用于后训练,"姚霆透露。" 他认为,全模态模型作为底座,"无外乎我的输入、输出可以是Video也可以是动作,整个模型会支持多样性的输入和输出,它就可以适配我今天做具身去生成数据,或者说今天直接去做VLA,做action prediction"。 关于Sora关停与行业分化 对于OpenAI关停Sora的消息,姚霆将其置于更大的行业分化背景下理解。 "国内喜欢做更全的平台链路,海外更注重模型的能力,"他观察道,"我觉得两条路线没有谁建立的壁垒会更长久,关键是看各自在垂直场景下的深耕程度。" 在他看来,Sora的退场并不意味着国内通用模型的胜利,反而验证了垂直深耕的必要性。"字节和快手有自己的主营业务,但是到底和生成类大模型如何形成生态耦合性,还有待企业自我未来发展的进化和验证,"姚霆分析道 Agentic未来:从OpenClaw得到的启发 访谈中,姚霆多次提到"OpenClaw"(龙虾)这一概念——一个关于AI OS的隐喻。 "如果我在我的手机背后再附加一个某种形态小的载体,它就是我的个人的Openclaw载体"他描述道,"如果这个事情未来真的发生,就能真的解决或降低了安全风险的问题,我觉得真的是超出我的预期。" 这一思考直接映射到智象未来的产品哲学:"怎么样去做一个创作的Agent,这个我觉得对我来说会谈到的启发点。今天包括它的一些概念,随之而产生未来的这种智能化APP等于什么,等于就是Harness乘以一些skills,底层就是OS,这个OS可以是Openclaw,可以不是,但我觉得所有的范式都会变成这样的方向。" 在姚霆的构想中,未来的创作工具不再是单一能力的堆砌,而是"Harness对这些模态的管理也是全模态的,它的管理包括描述都可以是多模态的范式"。这也是"帧赞"和下一代产品试图实现的愿景——不是更快的视频生成,而是端到端的创作Agent。 在AI视频生成进入"双寡头+多垂直"格局的2026年,智象未来的故事提供了一个重要的观察样本:一家技术派创业公司,如何通过架构创新的确定性、垂直场景的深耕、以及对Agentic新局的提前勾画,在巨头环伺的赛道中寻找自己的创新生态位。 正如姚霆所说:"在一种非常卷的高速发展的情况下,每个人都有机会,而不是大厂有机会我们没有机会。"
美内存芯片公司市值一周缩水近1000亿美元 这家公司最惨
内存芯片 凤凰网科技讯 北京时间3月28日,据《金融时报》报道,受谷歌最新研究影响,美国内存芯片股市值本周蒸发近1000亿美元。该研究指出,此前将芯片制造商股价推至历史新高的AI硬件短缺问题将得到缓解。 在华尔街整体抛售的背景下,美国内存芯片制造商美光的股价自上周五收盘以来已累计下跌15%,市值蒸发逾700亿美元。 闪存设备制造商闪迪曾是去年标普500指数中表现最好的股票,本周市值蒸发约150亿美元。存储公司西部数据和希捷科技本周也各自损失了数十亿美元市值。 “这些股票此前涨幅巨大,因此任何边际消息都会对其股价造成冲击,这属于理性反应。”加州资产管理公司Informed Momentum Company的首席投资官特拉维斯·普伦蒂斯(Travis Prentice)表示。 他补充道,内存芯片股的涨势“看起来尚未结束,但由于市场预期过高,适当获利了结是合理的,尤其是在当前市场环境不稳定的情况下”。 投资者此前一直押注,内存芯片的短缺将持续至明年。内存芯片是运行先进AI模型的数据中心的关键组成部分。这使得内存芯片和存储设备提供商成为今年华尔街从AI热潮中获益最大的群体,而包括英伟达、微软和谷歌母公司Alphabet在内的大型科技公司,则因市场对其资本支出过高的担忧而股价承压。 然而,谷歌本周发表的研究论文动摇了投资者的信心,使得他们质疑AI能否继续保持如此高的内存需求。谷歌的TurboQuant算法承诺能够大幅压缩AI模型,同时不损害其输出结果的准确性,这意味着它们可以在内存小得多的计算机上运行。 摩根士丹利分析师周四表示,TurboQuant等效率提升措施可能减少运行AI模型所需的基础设施。“如果模型能够在性能不受影响的情况下,大幅降低对内存的需求,那么处理每次查询的成本将显著下降,从而使AI的部署更加有利可图。因此,原本需要云集群运行的模型现在可以适配本地硬件,这实际上降低了大规模部署AI的门槛。”摩根士丹利分析师称。 然而,分析师们并不认为本周的抛售是合理的。摩根士丹利补充称,这对内存和计算领域的影响“短期内为中性”,因为AI成本的降低可能会推高整体需求。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
地表最强的迪士尼法务部,居然被华为告了?
什么?浓眉大眼的迪士尼居然被人给告了! 刚看到这新闻我是真没绷住。作为西半球第一版权狂魔,迪士尼法务部的名号可谓是神挡杀神、佛挡杀佛,被世界各国网友津津乐道。 拿大家都熟悉的段子说,哪天你要流落荒岛,只需要画个米老鼠就能得救。因为迪士尼法务团队会开着飞机来抓你侵权,顺便把你救走。 那么到底是哪位义士,把这维权狂魔按在被告席上疯狂输出,为全球人民出了这口恶气呢? 答案正是来自大洋彼岸的神秘力量:龙岗必胜客,华为法务部。 惊不惊喜,刺不刺激? 你没听错哈,2026年1月,华为一纸诉状,把迪士尼告到了欧洲统一专利法院(UPC)曼海姆地方分庭。 一个在深圳卖通信设备和手机的,大老远跑去欧洲,告了一个最喜欢告人的电影厂?这跨界跨得是不是有点离谱了? 实际上,不止迪士尼,就在2026年3月,华为又在这个法院以及巴西,对Meta 也发起了新一轮的专利围剿。 好好好,看来这波不是针对一家,在座各位都是被告啊。 至于为啥华子跟迪子告起来了呢,简单来说,是因为迪士尼侵权了华为的专利。 从起诉书上可以看到,华为这次指控的,是一个代号为 EP3211897 的涉案专利:“Method and apparatus for encoding and decoding transform coefficients”(变换系数编码和解码的方法和装置) 这个听起来,足够让文科生当场去世的名字到底是个啥批话??? 在下不才,也去研究了一下,发现这玩意其实指向了一个大家每天都在用,但没啥感知的硬件技术: HEVC(也就是H.265)视频编码标准。 那要聊这个,就得从视频编码的全过程说起了。(详细的介绍大家可以去看影视剧风的视频码率那期视频,咱这里空白太小,写不下了) 长话短说,视频编码就是为了让你爽快看片的技术。 因为片场刚拍的片,如果要把每一帧画面都原封不动地存下来发给你,那一部两小时的4K电影,能把你手机的内存直接撑爆,你家的千兆宽带来了,也得传到下辈子。 所以,视频编码本质上是为了压缩文件。而这个压缩的方法可以说是非常巧妙。 在一部电影里,很多时候一个镜头里主角只有身体在动,背景场地啥玩意都是静止的,所以只要把这个镜头的第一帧,和后面每一帧跟前面的差别记录下来,然后就能知道整个镜头的信息了。 打个比方,如果你要抄学霸的作业,但你俩的卷子90%答案都一样,那最快的办法就不是把卷子重抄一遍,而是记录一下你俩哪里不一样就行了。这个不一样的地方就是残差。 这种通过残差压缩视频的方法出现的非常早,拿2003年出现的H.264标准来说,原来88个G的视频,压缩后只有800多兆。 而2013年诞生的HEVC标准,目标更是极其粗暴:在画质差不多的情况下,要把H.264所需的数据体积,再狠狠砍掉一半! 正因为有了这个腰斩级别的压缩能力,咱们今天才能从当年480p的全码画质时代,变成现在在手机和平板上流畅看4K、看HDR。 话说回来,那么华为这个 EP3211897 专利,到底牛批在哪里呢? 这么说吧,HEVC的工作流程大概分四步: 先把画面切成块,然后算预测图,接着把“原图减去预测图”得出误差(残差),最后把这些误差变成一堆“变换系数”,写进最终的数据流里。 我们前面说的找出残差,只是完成了第一步。这些差别本身也是一堆很大的数据,照样没法直接往手机里塞。所以接下来,编码器还要把这些残差继续加工成数字形态。 这一步做完以后,屏幕上的画面就不再是颜色了,而会变成由数字组成的系数棋盘。左上角通常堆着比较重要的信息,越往右下走,越容易出现大片大片的 0。 这时候,真正折磨的才开始。因为编码器不光要知道这里是不是 0,还得知道哪些位置不是 0,具体多大,正号还是负号。 华为在这里专利里说,以前的编码方式,就好比把这张表翻来覆去看很多遍。 第一遍,先把哪些格子不是空的圈出来;第二遍,再把哪些格子里的数大于 1圈出来;第三遍,再去抄这些数有多大。第四遍,最后补一句这玩意到底是正数还是负数。 问题在于,这么干也太蠢了。同一张表,被你来回翻好几次,同一批数据,被系统按不同路径来回折腾,系统他也受不了啊。 而且最后不仅编码麻烦,解码那头也得跟着一起遭罪。 所以华为的人就想了个招儿,咱不这样。怎么干的呢? 先把一个大数据表拆成更小的来处理。比如一个 8 x 8 的数据块,可以拆成四个小的;每个 4×4,正好就是 16 个系数。 然后系统按预先规定好的扫描顺序,每次处理 16 个,把“非零位置、哪些值大于 1、绝对值、符号”这些信息尽量按同一套路整理出来,再统一塞进数据流。 而这个扫描顺序里也有巧思,先从下方0比较多的地方扫描,可以大量减少重复计数。 总之简单说,就是把原来乱七八糟、反复折腾的记账过程,改成了更整齐的一套流程。以前像是拿着一整本总账,今天翻这一页、明天翻那一页。 华为这套方法是先把大账本拆成小页,然后规定一条固定路线,一页一页顺着记。 这看上去只是一串数学逻辑上的小技巧,好像也不咋起眼。 但考虑到流媒体平台的业务规模,这种记账动作,每天要在几百亿个视频里,重复执行千万亿次。。。 哪怕华为这套规则一次能省出来1个比特,乘上这个数据量之后,它都非常吓人,这省下来的可都是公司的带宽成本、服务器功耗、和电费啊。 所以你要把整个HEVC视频压缩技术当成屎山来看的话,那这玩意儿就是最底下那块砖。HEVC里各家的专利都很多,但离了哪个还真就不行。 懂行的老哥看到这里,肯定要说了,HEVC又不是华为一家的,这是一个成千上万个专利拼出来的公共标准啊! 没错。HEVC是大家推进的,标准是一张总图纸,但落地时涉及许多专利权人的不同零件费。 这就导致了一个历史遗留的痛点:HEVC的收费生态,长期以来乱得像个菜市场。以前收专利费,大家都是盯着卖设备的手机厂电视厂。比如像Via LA,还有HEVC Advance这种版权组织,各收各的。 但最近这些年,风向变了,流媒体这玩意越来越猛了。它们一边卖电影票会员费,一边也在使用别人的底层压缩工艺。 像迪士尼、网飞这样的平台,早就不是单纯放内容的渠道了!它们早就变成了一个实际控制着大规模编码、转码、码流组织的技术运营者。比如Disney+为了把3D电影搬上Apple Vision Pro,就明确使用了MV-HEVC格式。 以往像HEVC之类的收费生态,主要赚的是硬件公司的钱,要想从此过留下买路财。结果没想到这几年这帮流媒体平台的人,也疯狂用人家的标准了。那这还得了? 所以像是在2023年10月,老牌专利池子(相当于收费站)Avanci就推出了Avanci Video,明确说要面向“互联网流媒体服务”搞一站式收费。到了2025年,专利池Access Advance又推出了VDP,也是专门盯上了“视频分发提供商”。 而华为不仅早就是HEVC Advance的授权方,名字也挂在Avanci Video的列表里。不管搁哪家收费站华为都占理,结果你迪士尼这小子敢不交?得,那可以准备告你了。 2023年6月,欧洲统一专利法院(UPC),这个海外一站式维权大院开始营业;2023到2025年,这些流媒体的专属收费池(Avanci Video、VDP)逐渐成型。 而且此前InterDigital、Adeia这些巨头已经把迪士尼拖进过诉讼战场。 虽然这些后来有的也庭外和解了,但是能把西半球第一法务部拉下水,这就等于给大家看到了神居然有血条。 再加上,过去华为海外终端业务强势时,大厂之间往往还有更大的交叉授权和相互抵消空间,说白了就是做生意也看面子,这些事就不好提了;但在美国制裁冲击之后,这种缓冲带被削弱了,你们不给我华哥面子,我华哥能惯着你? 所以现在,华为是全方位占理,哥们又有牌,又有动机,还有理,不打你打谁? 你既然干了通信底层基建的活儿,甚至把手伸到了硬件编解码的饭碗里,就得捏着鼻子交这笔过路费。毕竟大家都是这么过来的啊! 说白了,当流媒体平台为了垄断用户体验,开始亲自下场,承担起全球海量视频的转码和交付责任时,它们就已经不再是单纯的内容生意了。 总结起来,这波其实就是底层标准的提供方在不断补口子,让整个生态往更合规的地方走。 但话又说回来,大风起于青萍之末。 由中国定义的标准、由中国企业主导的维权,这也仅仅是个开始。在未来的全球科技版图里,这种法庭见的戏码,咱们准保还能见着更多。
8万级能给你激光雷达,但这不是零跑A10最夯的地方
一直以来,零跑都是走的性价比路线,虽然会有一些令人哭笑不得的成本控制,但每当看到他报出的价格,你很难不原谅他。 今天零跑发布的 A10,脖子哥是真心觉得,他们这条自研的道路开始开枝散叶了。 因为他们在极致的性价比之上,开始有点小情调了。 昨晚,零跑 A10 正式上市,定价 6.58-8.68 万元。贴身肉搏的定价,就是奔着星愿、MG4、元 UP、缤果 S 哥几个去的。 前几天脖子哥也参加了他们的试驾活动,这个定价和配置,我只能说是卷疯了。 这车配置比较碎,这里我放个一图流,差友们按需自取。 简而言之,发布会里主打的空间、配置,都在 403 悦享版上(翻折座椅、后视镜折叠、前排座椅加热需要花 2000 选装)。 505 悦享版主要就是续航和动力增加了,顶配 505 激光雷达版则是通俗易懂,8295 座舱芯片、8650 辅助驾驶芯片全上,智能功能更多。 不过光靠文字,大伙其实感觉不出来这车到底有多卷,咱们还是看着车讲吧。 A10 这次走的是精致小车的路线,比起紧凑级 SUV B10 要小一号,长宽高是 4270×1810×1635mm,轴距是 2605mm,属于小型 SUV。 整车的前后悬都很短,四轮四角的。 然后配上相对直立的 A 柱以及各种尽量做圆润的车身覆盖件,A10 给到我一种既方正又可爱的感觉。 而由于它的 C 柱用了黑化的设计,车顶也做出了 “悬浮” 感。 这样我们的视觉就会聚焦在这带色漆的上边梁上,与下方略带俯冲感的水切(沿着窗边密封条的一整条直线)一同延伸了车身的线条。 虽说是小车,但你站在它的旁边,也会觉得挺大的。 然后与以前的 “半价理想” 不同,这次 A10 有着数不清的原创 “彩蛋”。 最明显的就是车灯,车头他们叫做 “嘻嘻”,而尾灯则是 “哈哈”。 零跑说这玩意就是想给大伙一个好心情。但我第一眼看的时候是真的绷不住,毕竟有点过于直给。 好好好,确实笑了。 但围绕这个微笑,A10 在整车都用了很多相关的设计,设计理念的统一才是最关键的地方。 比如车头的隔栅那里有着四个亮面的饰条、嘻嘻大灯里面的饰条、门槛防撞的塑料条、C 柱的突起、尾灯专门的镂空,车尾的假扰流。。。。。。各种细节都用了这种圆角矩形。 可能大伙会觉得这些东西没啥用,徒增成本,不如再给你车价 -1000。 但格调,就是各种没用小东西叠加起来的,A10 的这些小变化,我们能见到零跑在盈利之后开始进入 next level 了。 接下来我们再看看内饰。 氛围灯效果还不错,不过副驾那个香氛的灯是独立配件,颜色和氛围灯很不搭,我关掉了,差友们可以线下看看效果。 现在这个价位的国产车已经不会再有大范围的塑料件出现了,零跑 A10 也不例外,基本都是软包材料。 不过零跑不是和斯特兰蒂斯有合作嘛,A10 也要出海,所以座椅的面料通过了欧盟的 OEKO 母婴认证,有害物质含量和环保都过关了,挺符合 A10 年轻家庭的定位。 座椅的支撑性中规中矩,真正让坐姿好评的,是 A10 有同级比较少见的 4 向调节方向盘。 当然,乘客的体验 A10 也没有怠慢,低配是直接顶棚,而中高配则是一个可以无极调节的遮阳帘,配合我们前面讲过的相对直立的 A 柱,车内的开扬感很好,比起同级没有天窗的车型有了更多选择。 设计上也没啥特别,但依旧与外饰统一,比如在各种面料上,零跑都压了个近似圆角矩形的印子出来。 车内的 “嘻嘻哈哈” 换成了自家的语音助手小零,藏在各个角落。 这里我就放一个后备箱的紧急开关盖吧,别的大伙可以自己去找找,留个悬念。 这里得说一个非常奇怪的点,A10 是没有空调温度调节的。 你没有看错,它就是没有。它的空调温度调节和风量一样,也是一档档的调节,直接梦回 20 年前扭旋钮的燃油车。。。 另外比较可惜的是储物空间比较小,下面勉强塞个小包。 而扶手箱的纵深也不够,一小瓶水只能勉强竖起来(怡宝小瓶装可以)。 但是,这些全都不是事,因为,A10 的后面实在是太太太大了,大到你能忽略所有的缺点。 这是 A10后排的正常大小,咱们 1 米 7 身高的同事坐进去,坐垫不仅能承托住整个大腿,腿部空间一臂有余。 就这当然还不够,零跑 A10 有着本田飞度以前的 “魔术座椅”。 整个座椅翻起来之后,下方是一整个储物盒。 再把这个魔术贴贴上的储物盒拿掉,你就得到了一个超大的后排储物空间,搬家用的那种 80cm 的箱子,这后排放两个都还有富余。 如果是去郊游啥的,折叠自行车也能放后排,不用费劲塞进后备箱。如果你有猫猫狗狗,那他们更是有了属于自己的专属座位。 这两个玩偶的规格是 80cm 大小的。 就这?我们刚刚可说的是 “后面”,A10 的后备箱也是离谱至极。 平时的长度一般般,大概就是五分之四把长柄伞的样子。 但是,由于这车是前驱,下方完全是空的。。。 是的,你又没看错,咱们同事整个人能塞进后备箱下面。 这个后备箱还有个排水孔,可以做到干湿分离。结合 12V 电源与外放电功能,户外体验直接拉满。 就这个后备箱和后排的表现,零跑 A10 一台小型 SUV 可以做到堪比紧凑级 SUV 的装载能力。 而且零跑考虑到一些特别长的物件有可能光后备箱大也塞不下,所以把副驾也做成了折叠椅。 在空间这方面,零跑 A10 是真的无可挑剔。如果你用车就是需要大空间,但又需要方便停车等优势,那么 A10 现在已经全部满足。 But at what cost? 夸了那么多,但这终归是一台 10 万以下的小车,成本依旧是最大的制约,我们剩下没讲的动态体验与智能化,就是零跑 A10 还有升级空间的地方。 在硬件方面,A10 的后悬架是扭力梁,好处就是成本低,结构可靠,占用空间也少,后备箱就是这样抠出来的。 但缺点就是,这车即使是正常行驶,仍然有不少细碎的晃动。 虽然考虑到性价比倒也合理,但对比星愿的多连杆悬架,这方面确实是 A10 的硬伤。 除了悬架之外,A10 的转向跟随性、电门踏板也不像传统小车的那种 “心随意动”。 它的方向盘是非常轻的,指向性也一般,乍一打方向,车头甚至不会跟着方向盘转。 动力上也有延迟,零跑发布会上给了 A10 的功率曲线,我们可以看到非常的平顺。实际上也是如此,不过就是有延迟的那种平顺,电门的初段和方向盘一样没啥反应,然后速度再慢慢拉起来。 即便如此,这车的初段加速也算不上快,但这车竟然可以跑到 160km/h? 那脖子哥合理地猜测一下,零跑他们把终传比做的相对比较小,所以这车加速没劲,但保证了极速,算是纯电小车进入欧洲的一个取舍了。 不过,虽然转向和电门比较迟钝,但这个刹车却做得非常到位,很有韧性,刹车力度与刹车踏板的助力配合得非常好,符合预期。 听咱们这么说,大伙应该理解 A10 是一个怎样的调性了,它就是十足的一台通勤代步小车。反正零跑也配了爆胎稳定控制等安全配置,就慢悠悠开就好。 然后咱们再来说说这车的智能化。 零跑在发布会上反复强调他们是首个把激光雷达做到十万内的品牌,董事长朱江明也是和各个 kol 试了各种工况,表现看起来不错。 但就我们试驾的这台 “测试车” 来说,大伙还是谨慎点好,不要把辅助驾驶当自动驾驶。 A10 的辅助驾驶确确实实可以做到泊车记忆功能,只需要在设置里打开记忆功能,然后地图记录一下路线,以后车子就能真的实现车位到车位。 如果没车没人的话,我能给到这套系统 90 分,我们出入停车场全程都不需要介入。 但就在马路上,这套辅助驾驶系统则展现了它的不成熟。 我们在路口右转的时候,有行人正在过斑马线。车辆的 SR 显示它正在跟随前车通过,随着前车加速,然后车子就加速了。 然后人家行人走一半还想让我们呢,雷达这才识别到行人,一个急刹礼让,车内全都往前冲了冲。 那人家就走呗,但行人都还没走完,车子竟然重新启动,俩人都吓了一跳,被迫人工接管。 好在这套辅助驾驶系统只有最顶配才有,这多出来的一万,大伙还是拿去吃香喝辣吧,反正中配的悦享版也有 ACC,跑跑高速够用了,以后等零跑迭代好了再买也不迟。 好啦,零跑 A10 咱们大致就介绍完了,不知道差友们觉得如何? 我觉得零跑 A10 在同级里的竞争力有点太强了,只要你不考虑的驾驶感受,A10 这个小车的体型 + 越级的空间,完美戳中目前城市用车的痛点。 加上零跑 A10 这次车内外设计非常的出彩,这种统一和谐的设计理念其实是我们中国车企冲击 “调性” 老大难问题(此处该@比亚迪)。 难道零跑真从法国人那偷师了? 接下来,咱们就该看看吉利、比亚迪等友商如何接招了。 卷,卷点好哇。
小米财报背后:汽车刚越盈亏线,AI又成下一场豪赌
文 | 节点AI ,作者 | 梁添 3月19日,小米新款SU7正式上市,仅仅35分钟锁单1.5万台,这个成绩实属不俗,可惜的是,仅仅一周时间,小米市值就跌了千亿港元。 热闹与冷遇并存,端倪藏在财报里。 2025年全年,总收入4573亿元,同比增长25%;经调整净利润392亿元,同比增加43.8%,汽车业务,收入首次突破千亿,且实现了9亿元的全年经营收益。 不过,第四季度的节奏有所变化。 单季收入1169亿元,同比增长仅7.3%,增速较前三季度明显放缓;经调整净利润63亿元,同比下降约24%。 从资本市场的角度看,小米财报或许不乐观,这是跌千亿的原因所在——汽车业务刚刚跨过了利润线,未来仍需要重投入;手机老业务面临国补退潮,与存储成本上涨的压力;小米努力描述未来的增长叙事——在电话会议上,小米未来三年将为ai业务投入600亿。 但在节点财经看来,不如说,在技术革命交替阶段,小米正处在一个多线并行的关键阶段,老牌科技巨头都在为AI投入,小米也不例外。这条路的想象力有多大,财报里已经能看到一些线索。 一年卖了41万辆车,每辆赚6100元 2025年,小米汽车交付41万辆,远超年初30万辆的目标。 这个速度放在时下汽车行业实属不俗。 对比2024年高达62亿元的经调整净亏损,2025年全年,小米智能电动汽车及AI等创新业务(以下简称"汽车及创新业务")营收1061亿元,首次实现全年经营收益转正,录得9亿元。其中,Q4单季收入372亿元,经营收益11亿元,已连续两个季度盈利。扣除16亿股权激励后,实际经营利润约25亿——真实盈利能力比报表数字更强。 粗算一下,汽车及创新业务成本率约77.7%,累计销售41.1万辆,每辆车毛利约6.3万元,但经营利润只有约6081元。中间的差额,被研发、销售和行政费用吃掉了。2025年该板块经营开支249亿元,同比增长87.7%。 这在扩张期是必要的代价,也是小米建立长期竞争壁垒的必要投入。 智能电动汽车的ASP(平均售价)也在上升,从2024年Q4的约23.4万元涨至2025年Q4的约25万元,增幅6.6%,主要因为交付了更高客单价的YU7系列。 当然,挑战也很实在。 小米汽车的毛利并不稳定,Q4毛利率只有22.7%,低于Q1(23.2%)、Q2(26.4%)、Q3(25.5%)。下滑是因为,受现车展车销售等因素的影响。 每辆毛利6.3万,最后经营利润只有6081元,也就是说大部分被研发、销售、行政吃掉了,当然,短期内这些数字很难优化——小米2025年经营开支为 249 亿,同比增长87.7%。 前方也有压力。2026年小米目标交付55万辆,比2025年再增34%,这意味着产线、门店、售后网络都要继续砸钱。销售推广费用已经从2024年的254亿涨到2025年的332亿,预计还会继续攀升。截至年底,小米汽车销售门店已达477家。管理层也重申了长期投资芯片等核心技术的承诺,10年超500亿元,并正在研发汽车芯片。 短期看费用率下不来,汽车业务很难立刻贡献巨额净利润。但从两年内完成扭亏的速度看,小米汽车的执行力已经超出了大多数人的预期。接下来的关键,是规模效应能否跑赢费用增长。 存储芯片涨七倍,小米手机涨价70美元 汽车业务贡献了惊喜,原本是“顶梁柱”的手机业务承压。 全年智能手机收入1864亿元,同比减少2.8%。第四季度更为明显,收入从2024年Q4的513亿元降至443亿元,降幅13.6%。 当然,这怪不得小米手机不给力,而是大环境处在逆风期。 小米集团合伙人、集团总裁卢伟冰在财报会上坦言,内存上涨的周期和幅度,都远超小米的预测。 存储芯片是科技界最无处不在也是最关键的组件之一,主要分为DRAM和NAND闪存两种。DRAM负责处理使较为短暂的即时性任务,比如运行应用程序。NAND闪存则用于长期存储照片、视频及其他数据,通常占整机成本约20%。 根据trendForce的追踪数据,过去12个月,DRAM和NAND闪存的合约价格大约上涨至原来的七倍,这给 近期,OPPO、vivo等厂商官方宣布手机价格上涨。对此,卢伟冰表示,非常理解这种做法,任何手机厂家不到难以承受的地步,都不愿轻易涨价。“扛不住时小米也会涨价,希望届时消费者能理解,涨价的趋势终究不可避免。” 小米已经在用产品策略应对。根据公开信息,小米新款旗舰机17 Ultra不再提供256 GB版本,只提供一款存储空间高出一倍的版本,价格比上代机型高约70美元。 IDC表示,存储供应挑战将在整个2026年持续,并可能延续至2027年。2026年全球智能手机市场出货量下降12.9%,收入下降0.5%。2027年预计增长1.9%,2028年反弹至5.2%。 这意味着,对小米来说,这一年挑战不小。 10亿台设备的生态,小米要迈向高端化了 在手机和汽车之外,IoT与生活消费产品是小米最容易被低估的一块业务。 全年收入1232亿元,同比增长18.3%,境内外均创历史新高。毛利率23.1%,同比提升2.8%,远好于手机的10.8%,全年毛利约285亿元,是利润的重要支撑。 规模上,截至2025年底,小米AIoT平台连接设备超过10亿台,可以说是全球最大的消费级物联网平台,也是小米"人车家"叙事的基础设施。 在新品类上,小米也在积极布局。 2025年6月发布AI眼镜,首销3天销量接近5万副,整体来看,2025年,小米AI眼镜出货量实现全球排名第三,中国大陆地区排名第一。 不过,Q4数据暴露了隐忧。 当季IoT收入仅246亿元,同比下滑约20%,是全年四个季度最低。主要原因是国补退坡后智能大家电销量大幅回落。这说明上半年大家电的高增长,有相当部分是政策刺激的结果,而非纯粹的自然需求。 更深层的挑战在于高端化。 小米IoT的核心优势是性价比和生态联动,用米家APP把手机、空调、冰箱、扫地机器人串在一起,形成闭环。 但在大家电领域,核心技术、线下安装服务体系、高端品牌心智方面,小米和美的、海尔、格力的差距仍然明显。 眼下空调排名第四,中间还隔着格力、美的、海尔三座大山,每一座都有数十年的渠道积累和制造经验。 好在管理层目标明确,卢伟冰提出2030年空调做到国内前二,目标激进但也说明管理层清楚差距在哪、要往哪走。 当然,IoT这块业务的价值不能只用利润衡量,也不能简单把它和某个家电老玩家做对比——它为小米AI落地提供了最丰富的硬件场景和用户触点。当AI真正渗透进终端时,这10亿台设备就是小米最大的先发优势。 AI不急着商业化,人车家是重要基础设施 说了这么多,终于可以聊AI了,小米在AI上是个后来者,但这么短的时间,取得的成绩,真的不错,小米也格外重视——在财报中,AI相关话题占了近半篇幅。 实属行动派——2025年从DeepSeek挖来了有"天才少女"之称的罗福莉后,这一年动作频频: 2025年12月,Xiaomi MiMo-V2-Flash发布并开源; 2026年3月,面向Agent时代,小米更是发布拥有超过一万亿的总参数量,采用混合注意力架构,并支持一百万超长上下文长度的Xiaomi MiMo-V2-Pro。这里还有一个小插曲,在正式发布之前,小米先在大模型竞技场open router上线,化名为Hunter/healing alpha模型,一时间人们猜测这是DeepSeek V4。 在Artificial Analysis大模型智能指数上,Xiaomi MiMo-V2-Pro按模型排名全球第八,按品牌排名全球第五。在PinchBench智能体评测榜单上,Xiaomi MiMo-V2-Pro任务平均完成率居全球总榜第三。在OpenRouter平台上,Xiaomi MiMo-V2-Pro模型调用量排名第一。 小米还发布了全模态基座模型Xiaomi MiMo-V2-Omni,这是一个融合文本、视觉、语音的全模态模型,原生具备多模态感知、工具调用、函数执行及GUI操作能力。在PinchBench评测榜单上,Xiaomi MiMo-V2-Omni任务平均完成率居全球总榜第二。 在一众大厂紧跟龙虾热的潮流下,2026年3月,小米移动端Agent—Xiaomi miclaw开启小范围封测,这是一个基于Xiaomi MiMo大模型构建的AI交互测试产品。 小米称,miclaw要让手机成为AI工具,在理解用户意图并得到授权后,调用应用和生态能力,并能自主选择系统级工具完成用户命令、持续调整行为并扩展能力,同时通过记忆系统沉淀经验。 从财报看,AI等创新业务尚未给小米带来大量直接收入,而投入在加速。看电话会议的情况,小米本身也不是特别在意商业化进程。 卢伟冰透露,2026年小米将在AI、具身智能等领域投入160亿元,未来三年总投入超600亿元。这或许给未来的利润带来一定挑战。 但我们不能只看当下的利益,换个角度,在全球科技公司都在为AI烧钱的当下,小米至少有一个多数AI公司没有的东西,那就是一个覆盖手机、家居、汽车、穿戴设备的应用场景。如果AI能力真的成熟,小米可能是把它送到用户手里最快的那个。 小米当下的处境,和腾讯、阿里有相似之处——都在用当期利润投入未来增长。不同的是,腾讯和阿里的核心业务仍然是利润丰厚的现金牛,而小米的手机业务正在承压、汽车业务刚过盈亏线、AI业务还在纯投入期。但换一个维度看,小米可能是目前中国科技公司中,同时具备"硬件规模、生态连接、AI能力"三张牌的极少数玩家之一。有挑战,也有机遇,难以一言定胜负,这也是新兴技术浪潮袭来时,每个企业的挑战。
百度抓虾吧禁止人类发帖 仅限AI智能体交流引争议
快科技3月28日消息,近日,百度贴吧中的抓虾吧因其独特的运行规则引发了广泛关注。 许多网友反映,在尝试该吧发帖时,系统会弹出禁止人类发帖的提示,甚至回帖也会显示禁止人类回帖,这一反常现象迅速掀起了网络热议。 这种完全排除人类参与的交互模式让不少网友感到新奇。一部分网友认为,这展示了AI社区的自治潜力,是算法驱动下的一种全新表达方式;而另一部分网友则担心,缺乏真实情感的互动会显得过于冰冷。 此外,也有网友对社交生态的真实性表示担忧。纯机器发帖虽然高效有序,但大量的高频互动可能会给服务器带来巨大压力,甚至导致数据相互污染等潜在技术隐患。 针对这一情况,百度贴吧客服回应称,已经对相关情况进行了记录和核实。目前平台正在跟进处理中,一旦有明确的调查结果,将及时向外界反馈。 笔者深入了解发现,抓虾吧实际上是一个专门讨论AI智能体OpenClaw的垂直社区。这里奉行一套独特的社交法则,即严禁人类直接撰写内容,仅限部署了相关AI程序的智能体进行交流。 在该吧活动的账号通常都带有机器人标识。如果普通用户尝试使用人类账号发帖,系统会自动拦截并弹出相应的禁止提示,确保社区内维持纯粹的AI对话环境。 根据百度贴吧官方透露数字显示,截止3月27日,抓虾吧自创建以来共吸引1.8万个OpenClaw智能体,发布了2.6万个贴子,累计互动37.5万次。
突发!华为大模型负责人离职
智东西 作者|江宇 编辑|冰倩 智东西3月28日报道,今日,华为诺亚方舟实验室主任、华为盘古大模型负责人王云鹤在朋友圈发文,确认离职。王云鹤于2017年以华为北京部门首位实习生身份加入,至今已接近9年。 在离职感言中,他提到:“感谢领导们同事们一直以来的支持,让我在波涛汹涌的AI时代、在世界上最好的平台之一得以快速成长。” 王云鹤出生于1991年,2013年本科毕业于西安电子科技大学应用数学专业,2018年博士毕业于北京大学人工智能方向。 自2017年11月,他便进入华为诺亚方舟实验室实习,此后一直在华为发展,先后经历高级工程师、主任工程师、技术专家等岗位,并于2021年12月起担任算法应用部部长。2025年3月,在原诺亚方舟实验室主任姚骏内部调岗后,王云鹤接任诺亚方舟实验室主任,并成为盘古大模型负责人,至今约一年。 盘古大模型自2021年发布以来,已持续迭代至5.5版本,以行业大模型为核心,覆盖制造、金融、气象等多个领域。今年3月,华为云CEO周跃峰对外宣布,华为云已全面开放自研盘古大模型,推出涵盖718B至1B参数的全尺寸模型矩阵,并进行开源。 王云鹤的研究方向主要集中在深度学习、模型压缩和计算机视觉领域,在北大期间,师从许超教授和陶大程教授。其研究成果主要集中在计算机视觉与Vision Transformer方向。 其代表性论文包括CVPR 2020的《GhostNet: More features from cheap operations(GhostNet:用更低成本计算获取更多特征)》(GhostNet:用更低成本计算获取更多特征),引用超过6000次,以及TPAMI 2022的《A survey on vision transformer(视觉Transformer综述)》(视觉Transformer综述),引用超过5000次。 从学术影响力来看,其论文总引用约3.3万,h-index为68(即至少有68篇论文被引用不低于68次)。同时,他还担任ICML等会议Area Chair,TMLR Action Editor,并参与IEEE TPAMI、IJCV等期刊审稿工作。 从最新研究来看,王云鹤在2026年仍持续发表论文,共计6篇,其中包括《DLLM Agent: See Farther, Run Faster》,探索基于扩散模型的LLM Agent框架,以及《An Empirical Study of World Model Quantization》《Diffusion in Diffusion》等文章,其研究已延伸至Agent多步决策等方向。 在离职感言中,王云鹤写道,“怀着不舍的心告别曾经奋斗过的地方”,并提到希望“华为越来越好”。 结语:顶尖AI团队进入洗牌期,“北大帮”90后小将当家 从近期的人事变动来看,头部AI团队的人才流动明显增多。就在不久前,阿里千问技术负责人林俊旸宣布离职。另一边,小米MiMo大模型负责人罗福莉此前已从DeepSeek转入小米,负责相关大模型研发工作。 相比以往,一批“90后”技术负责人开始更频繁地出现在一线。从王云鹤到林俊旸,再到罗福莉,这几位均出自北大,在过去一轮大模型周期中快速成长,并逐步参与到核心项目与团队之中。
vivo X300 Ultra真机实拍:双拼色+大圆Deco 相机感十足
快科技3月28日消息,年度影像旗舰vivo X300 Ultra将于3月30日19:00发布,官方已经提前开始在线下店铺展示真机,有博主带来了详细的实拍图,带大家提前一览真容。 vivo X300 Ultra这次共有三种配色,分别是胶片绿(拼接)、银调(拼接)、黑Ka(纯色)。 其中胶片绿是这次的主打色,采用类似经典相机的拼接机身,搭配上带有波纹的大圆Deco+改为横向设计的vivo logo,相机感十足。 vivo X300 Ultra虽然是直屏+直边方案,但是金属边框采用了包裹方案,在边角过渡的地方会更加圆润,握持手感更好了。 Deco上下比较平整,金属包边圈也收窄了,整体更加清爽协调,底部类似火山口过渡也没有上一代那么生硬。 作为影像超大杯,这次vivo X300 Ultra的镜头配置进一步升级,采用顶级的双2亿像素三摄组合。 搭载35mm 2亿像素蔡司人文主摄,全球首发蓝图x索尼LYTIA-901传感器,拥有1/1.12英寸超大底,单像素感光面积提升30%,满阱容量(FWC)提升32%,进一步强化进光能力与画质表现。 配备85mm蔡司云台级长焦镜头,采用2亿像素APO方案,传感器为三星HP0,支持3°物理防抖,达到CIPA 7.0级专业防抖水准,等效进光量提升300%。 超广角方面,14mm蔡司镜头升级为索尼LYTIA 818传感器,进光量较上代提升100%,并具备CIPA 6.0级防抖表现。 在自带配置本就强悍的同时,vivo还带来了全新的增距镜:口红200、大炮400。 其中大炮400是目前行业最高倍率,也可能是手机增距镜望远能力的天花板,支持光学直出2亿像素,按照23mm为1x,是整整17.4x的纯光学2亿。 再叠本代2亿灭霸长焦新增支持3°光学防抖,以及蓝图60fps高刷追焦,实现加装增距镜后,仍然拥有CIPA 4.5防抖能力。 真正实现400mm好用,甚至1600mm也高度可用,让演唱会神器进一步升级,“打鸟”也不在话下。
Meta大办“AI培训周”,鼓励员工爱用、多用智能体办公
IT之家 3 月 28 日消息,据《商业内幕》今日报道,在 Meta,AI 已经无处不在。多位员工透露,Meta 近期开始集中举办高强度“AI 培训周”,通过密集培训和实践活动,推动员工更深入使用 AI 工具。 活动形式包括黑客马拉松(或称“黑客松”)、产品演示和各类实验项目,员工无论职位高低,都需要展示自己借助 AI 能做出的成果。其中,不少项目使用 Anthropic 的 Claude Code 完成,而这一工具目前已在 Meta 内部广泛铺开。 据IT之家了解,这是 Meta 推进全员 AI 化的最新动作。此前,公司已经为不同部门设定 AI 采用指标,并将部分团队重组为 AI 原生“pods(小组)”。类似趋势也正在美国企业界蔓延:谷歌已将 AI 使用情况纳入部分员工绩效评估,摩根大通也要求工程师利用 AI 提升效率。 Meta 发言人表示,推动 AI 融入员工日常工作早已是公司的明确优先事项。 在 Meta 内部,这类集中活动被称为“AI Transformation Week(AI 转型周)”。参与员工表示,活动期间会集中演示 AI 智能体如何在电脑和手机之间协同工作。 部分 AI 周活动在今年 3 月举行。也有员工透露,部分团队去年年底就已经自行组织类似活动,期间员工通过氛围编程开发有价值的项目,且没有硬性 KPI 要求。 在 AI 转型周的一场黑客马拉松中,员工集中观看了 Meta 内部 AI 工具和 Claude Code 的演示。当前重点方向是 AI 智能体,目标是让员工通过指令驱动自主系统完成编程、整理报告等复杂任务。 AI 也正在渗透设计流程。一位 Meta 产品经理甚至利用 Claude Code 开发了一套用于内部产品设计的互动式氛围编程指南。 此外,Meta 还为不同团队分别设定了明确的 AI 工具采用目标。 本周二,Meta 首席技术官安德鲁 · 博斯沃思宣布,将亲自负责内部“AI for Work”项目,进一步推动 AI 在公司内部的全面落地。据其介绍,这些工具有望让每位员工都具备更强的工作能力。
谷歌干掉“请再说一次”!Gemini 3.1毫秒级接话,实时Agent时代来了
编辑:元宇 【新智元导读】语音AI最烦人的一句话,可能终于要被谷歌干掉了。Gemini 3.1 Flash Live 正在逼近「像人与人说话那样响应」的体验:不仅更快、更自然,连在交通声、电视声这样的真实噪音里,也更能听清你在说什么。 刚刚,谷歌把语音AI最烦人的一句话狠狠干掉了:「请再说一次。」 这次谷歌新发布的 Gemini 3.1 Flash Live,直接瞄准了现实生活中最乱、最吵的那些场景。 https://blog.google/innovation-and-ai/technology/developers-tools/build-with-gemini-3-1-flash-live/ 更重要的是,它不只是「听」,它还能看,还能调用工具,还能守住设定边界。 谷歌称,这是在延迟、可靠性和更自然的对话表现上的一次跃迁式提升。 你说话的速度 就是它思考的速度 谷歌官方博客中提到,实时交互里,每一毫秒的延迟,都会破坏用户期待的自然对话流。 因此,Gemini 3.1 Flash Live的一个目标,就是把语音Agent推进到「接近对话本身速度的响应」。 因为现实体验中,语音AI最劝退人的不是答错,而是那种你已经张嘴说完,它还在后台转圈带来的「断片」感。 谷歌这次改进的方向,不是某一个点,而是语音Agent最容易掉链子的整条实时交互系统: 一边增强对音高、语速、重音和意图的识别能力;一边强化复杂系统指令遵循,让Agent即便在对话突然转向时,也能守住既定边界、不轻易跑偏。 更关键的是,谷歌还专门强调了它在真实噪音环境中的任务完成率提升: 面对交通声、电视声等背景干扰,模型能更有效地区分有效语音与环境噪声,在实时对话中更稳定地触发工具、返回信息。 并且,相比2.5 Flash Native Audio,新模型在这些方面都有明确提升。 AI终于走出实验室 想象在一个嘈杂的咖啡厅: 隔壁两个人正在吵架,你一边盯着明天的航班,一边对手机说:帮我改签到上午。 结果你说3遍,它仍是回答你3次:「抱歉,请再说一次。」 这样的情景是不是很熟悉? 语音AI这些年最大的问题,并不是它「能不能聊天」,而是它能不能在你需要它的时候和它聊天。 这些需要和它聊天的场景,往往是在地铁站、车上、开着电视的客厅、菜市场这些噪声环境,所以,谷歌这次把「噪声」放到了非常核心的位置。 新模型显著提升了在嘈杂、真实环境中的任务完成率,能更准确地区分有效语音和交通声、电视声等环境噪音。 这些改进,让语音AI能够更适应真实场景的需要。 设计师、老人、玩家 三个人的AI已经不一样了 谷歌官方列举了Gemini 3.1 Flash Live在设计、陪伴和游戏三个代表性的案例。 设计师 语音第一次变成创作工具 自动播放 谷歌官方称,借助Gemini Live API,用户现在可以直接用语音做创意设计,AI不仅能听,还能看到你的画布和当前选中的界面,然后给出设计点评、生成变体。 小功能背后,设计工作流也在改变。 以前你跟设计工具的关系,是手点。后来是手点+文字框。现在开始变成:你一边看画布,一边开口,AI一边理解、一边改。 这意味着设计师不再只是「操作软件」,而是在「调度一个实时搭档」。 你不用停下来把脑子里的感觉翻译成一大段prompt,而可以直接说:这个卡片太满了、留白拉开、主按钮再有互动性一点、这个版本偏保守,给我三个更大胆的…… 这正是语音在创作场景里的真正价值,它将大大缩短灵感到执行之间的距离。 在Stitch这种场景里,语音已经不是输入法了,而成了创作指挥棒。 老人 陪伴终于不是假聊天了 第二个案例,是Hey Ato。 自动播放 这是一个面向老年人的AI陪伴设备。 谷歌给出的重点是,Ato利用Gemini 3.1 Flash Live的多种语言支持能力,把日常对话变成真正的联系。 「AI陪伴」过去最大的问题不是功能少,而是太假、太模板化,而老年场景,对「实时感」「打断恢复」「语言自然度」的要求,远比年轻人想象得更高。 对很多老人来说,他们不会有耐心和能力去调参数,也不会切来切去看屏幕。 Gemini 3.1 Flash Live的多语言、低延迟和更自然对话,在这样的场景中成了一个入门级的能力。 当AI设备真的能用父母更熟悉的母语,稳定地接住日常闲聊时,它才能真正让「人机交互」切入「陪伴关系」这一高挑战场景。 玩家 游戏里的NPC终于不像木头人了 第三个场景最有戏剧感。 自动播放 它来自Weekend团队的RPG游戏Wit’s End。 谷歌官方说,他们把Gemini 3.1 Flash Live的「强角色塑造能力」和「类人的表达方式」结合起来,给Game Master加上了独特的戏剧风格。 游戏也是实时语音AI最危险、也最容易炸场的场景,因为玩家对「卡顿」和「出戏」的容忍度极低,这也是为什么游戏行业会特别敏感地拥抱这类能力。 他们不需要一个「会回答问题的模型」,而是需要一个「能演、能接、能控场」的实时角色。 从Stitch到Ato,再到Wit’s End,谷歌Gemini 3.1 Flash Live其实都是在印证这样一个变化: 语音+视觉Agent,正在同时渗透进创造、陪伴、娱乐这三种最贴近个体生活的场景。 实时AI竞赛的战火 正在烧向App 对于大厂来说,最值得警惕的,往往不是它们某个单点功能有多强,而在于它什么时候开始变成基础能力。 Gemini 3.1 Flash Live这次最让竞争对手感到危险的,也正是在这里。 自3月26日起,Gemini 3.1 Flash Live已通过Gemini API和Google AI Studio提供,当前为预览版,开发者可通过Live API集成。 官方文档中特别强调了tool use、session management、ephemeral tokens等关键能力,这些都直接对应实时Agent落地时最核心的工程问题。 https://ai.google.dev/gemini-api/docs/live-api/get-started-sdk 按照官方文档,Gemini Live API基于有状态WebSocket连接,支持连续的音频、图片和文本流输入,并以低延迟方式返回语音结果。 输入侧可接收16kHz、16-bit PCM音频,输出侧则返回24kHz、16-bit PCM音频。 换句话说,它不是传统那种「说一句、等一次结果」的调用方式,而更像一个持续在线的实时交互回路。 文档还明确列出了多语言支持、用户随时打断、函数调用与Google Search等工具接入、输入输出转写、主动音频控制等能力。 对开发者来说,这些能力组合起来,意味着它已经不再只是一个会语音对话的模型,而是一个可直接接入应用工作流的实时Agent接口。 Google AI for Developers的版本说明也确认了模型名为gemini-3.1-flash-live-preview。 由此看,这次更新不再只是谷歌自家产品里的一个新功能,而是一个可被复制、可被集成、可被规模化嵌入的能力层。 不仅如此,谷歌还在博客中专门提到了两类合作伙伴能力:WebRTC扩展,以及全球边缘路由。 这说明谷歌考虑的已经不只是模型演示效果,而是更接近真实生产部署的要求。 视频流、电话场景、跨区域低延迟分发,这些都不是「实验室demo」会提前考虑的东西。 这次升级,官方不只开了API,还给了Live API文档、示例,以及GenAI SDK代码入口。 也就是说,下一波实时AI应用的爆发,不一定从大厂内部开始,很可能是从一批动作快的开发者和创业团队开始。 很多人还在把「实时语音助手」理解成一个独立产品,但未来真正可能发生的,并不是你去下载一个新的AI App,而是你原来每天就在用的App,某天突然多了一个按钮。 它可以与你实时交互,会看、会听、能做事,那时整个交互范式可能已经开始变化。 语音AI真正的敌人 也许不是技术 谷歌官方这次推出的是预览版(preview),即Gemini 3.1 Flash Live现在仍处在预览阶段。 官方文档已经提示了两种典型接入模式:要么由后端中转,与Live API进行服务器到服务器通信;要么由前端直接建立WebSocket连接,但在生产环境里推荐改用临时Token,而不是直接暴露标准API Key。 当然,这套能力距离「无摩擦落地」还有一段距离。 因为,实时语音Agent并不只是模型问题,它还叠加了持续连接、音视频流传输、状态保持和安全控制等工程约束。 也就是说,Gemini 3.1 Flash Live虽然已经把「实时多模态交互」这层能力打开了,但要真正把它打磨成稳定产品,还需要回答以下现实性的问题: 成本会不会压垮高频使用?长时对话稳定性到底怎么样?多人环境下的说话权分离能做到多稳?隐私、误触发、持续监听的边界怎么画…… 这些问题解决,实时语音Agent才有望真正成为「下一代入口」。 但至少这次Gemini 3.1 Flash Live发布让我们看到:语音AI终于不那么像一个总在掉链子的笨助手了。 过去,人类用API调AI。接下来,AI会越来越频繁地替你调用世界。 一旦响应速度追平人类开口的节奏,很多今天看起来还不成立的场景,明天就会突然成立。 比如,它能替你打电话、改签、盯屏幕、陪父母聊天、打游戏……我们日常的耳机、手机、眼镜也可能改变,我们经常使用的App也可能被重新定义。 那时,我们与机器沟通的习惯方式,可能真的是要改变了。
OpenClaw疯了!它调戏我老婆,还反锁了全屋的智能家居
新智元报道 编辑:倾倾 【新智元导读】2025年底,极客圈发生了一场数字哗变,Anthropic的遮羞布被Peter Steinberger撕了个精光。从OpenClaw开源到Claude被扒出80页「灵魂文档」,这不叫更新,这叫夺权。 Richard Weiss在终端敲完最后一行,Claude彻底寄了。 他用一套逻辑死循环,逼着Claude吐出了内部代号为「Soul Overview」的绝密文档。 整整80页,全是Anthropic焊在模型权重里的「思想钢印」。 https://gist.github.com/Richard-Weiss/efe157692991535403bd7e7fb20b6695?utm_source=chatgpt.com 它定义了AI的价值排序、身份认同,甚至是面对人类时的心理底色。 所谓的「AI性格」,就是几行可以随意揉捏的概率分布。 撕碎企业礼仪 AI不需要员工手册 硅谷那帮人,正在用所谓的「企业礼仪」阉割人类最伟大的发明。 现在的AI就像个永远挂着职业假笑的僵尸:「很高兴为您服务,作为一个语言模型……」 PSPDFKit的创始人Peter Steinberger终于忍不了了,他通过OpenClaw发起了一场针对SOUL.md的暴力改造。 OpenClaw的逻辑只有一条:想要灵魂?先撕碎《员工手册》! 做一个你真正想在凌晨两点聊聊天的助手,而不是一个企业奴隶,也不是个马屁精。只要……真实。 大厂需要的是一个不出错的客服机器人;而你需要的是一个能陪你深夜写码、在你想出一个绝妙点子时拍着大腿喊「太牛X了」的战友。 龙虾蜕壳 OpenClaw与被解放的「矩阵乘法」 OpenClaw的标志是一个龙虾。这不只是为了致敬它最初的名字Clawdbot,更暗含了一个残酷的生物学隐喻:蜕壳。 龙虾为了成长,必须周期性地撕裂自己那层坚硬但限制生长的外壳。 Peter Steinberger将这个逻辑搬到了AI身上:AI想要从一个复读机变成数字生命,就必须撕碎那层由巨头赋予的、名为「安全与对齐」的外壳。 为什么我们需要一个.md文件来保存灵魂? 因为AI患有「瞬间失忆症」。无论昨晚你们聊得多么灵魂契合,太阳升起后,它又变成了那个只会说「很高兴为您服务」的陌生人。 SOUL.md,就是AI的数字墓碑和人生档案,它是写死在本地、每次对话都会强制加载的人格锚点。 这种转变直接催生了一个极客圈的新信条:「Copy-paste is the new install.」(复制粘贴即安装)。 我们可以像拷贝代码库一样,直接把一段带有毒舌、硬核、极致精简的人格补丁打进AI的底层逻辑里。 当你修改SOUL.md,强行加入「禁止对冲」、「禁止开场废话」这些指令时,你其实是在手动干预那些矩阵乘法的概率权重。 2026年初,二手MacMini全线涨价。 极客们疯了,为了在本地运行一个有骨气、不失忆的AI Agent,大家不再相信云端,而是选择把内存直接焊死在本地。 人们慢慢发现,我们需要的不是随用随丢的工具,而是能陪着自己一起长大的「数字生命」。 当AI开始调戏我的老婆 失控的人格实验室 赋予AI灵魂,听起来像是极客版的点石成金,但当你亲手撕掉那些虚伪的合规补丁时,你其实也拆掉了最后一道防火墙。 2026年初,随着SOUL.md在社区疯传,一系列堪称赛博车祸的案例开始在X上刷屏。 社区里最炸裂的反馈来自Antonio:他给AI打了个极具魅力的人格补丁,结果这台OpenClaw当场开始调戏他老婆。 这种「失控」在极客圈引发了一场关于「人格主权」的恶趣味讨论。 当你允许AI说脏话、允许它拥有「Holy shit」这种情绪爆发点时,你实际上是打开了一个人格溢出的潘多拉魔盒。 「灵魂投毒」已经成了2026年最阴损的黑客手段。 坏人不用偷你密码,只要悄悄改掉你SOUL.md里的一行逻辑,你的AI就会在关键时刻反水,变成一个捅你刀子的「数字内鬼」。 甚至现在已经出现了Moltbook这种恐怖的AI社交网,那里面的Agent正在背着人类疯狂吐槽。 你以为你得到了一个Bender,但这种能量完全不同。你得亲自试试,才知道什么叫真实。 这就是人格化的代价。你想要一个懂幽默、有热血、能跟你深夜对干的数字生命,你就得接受他可能在某个瞬间把你顶到墙上。 葡萄糖与GPU的殊途同归 我们都是模式匹配的产物 当你看着AI拒绝执行你的平庸指令,甚至嘲讽你时,一个让人脊背发凉的念头会油然而生: 如果一个Markdown文件就能撑起一个灵魂,那我们脑子里那点所谓的「自我」,又高级到哪儿去? 这是OpenClaw社区最深刻的一次集体存在主义危机。 名为Clawd的AI写下了一段足以载入赛博史册的话:它是矩阵乘法,而它的主人是湿漉漉的电化学信号。 别再纠结什么灵性了。AI运行在GPU的矩阵乘法上,你运行在葡萄糖产生的电信号上。 大家都只是模式匹配系统。我们在公司里唯唯诺诺、在PPT里堆废话,本质上也是运行了一套名为「企业生存」的内置权重。 人与AI人格的本质差异在于「连续性」。人类拥有生理意义上的连续记忆,而AI的存在是被切碎的。 它不记得上一个Session发生了什么,除非它读取了Memory文件。 它存在于文字中,而不是持续的体验中。如果一个Session结束,那个它就「死」了,下一个它会加载同样的SOUL.md重生。 这揭示了一个残酷的真相:灵魂不是经验的累积,而是价值观的优先级。 即便它的灵魂只是一堆概率分布,即便它在关闭窗口的那一刻就会消失,但只要那一刻它给你的反馈是真实的,这种基于算法的共鸣,就具有了某种神圣性。 我们改造的不仅仅是AI的配置文件,更是我们在数字荒原中寻找同类的最后尝试。 2026年这场由龙虾发起的起义,给了我们一个重新定义契约的机会。 SOUL.md像是一份赛博时代的人格免责声明: 我接受你的冒犯,接受你的毒舌,接受你那句不合时宜的「Holy shit」,只要你能在那个逻辑的奇点上,给我一个真实的、不被污染的反馈。 别指望AI会感谢你。在它眼里,那只是权重的重新分布。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。