行业分类:
加载中...
头条分类:
加载中...
红果短剧回应“AI偷脸”:下架《桃花簪》 涉事出品方被暂停上传15天
凤凰网科技讯 4月3日,字节跳动旗下红果短剧发布官方声明,宣布全面下架短剧《桃花簪》,并暂停该出品方上传所有剧集15天。此前该剧因涉嫌未经授权使用他人肖像进行AI生成,引发全网关于AI短剧侵权问题的热议。 根据红果官方声明,平台近日收到对《桃花簪》的投诉后,第一时间启动对出品方相关信息与材料的梳理审核。在72小时全面审核期内,出品方未能向平台出具足够证实合规使用素材的证据。经平台细致比对核查,最终认定出品方违反相关内容合规使用规定,构成违规违约,遂作出上述处理决定。 红果在声明中强调,内容合规是平台对出品方的一贯要求与审核红线,将持续加大治理力度。对于违规违约出品方,平台将视情节采取包括内容下架、停止合作、相关法律追责等处理措施,以最大程度维护权利人权益与行业健康生态。 值得注意的是,此次事件再次暴露了AI短剧行业普遍存在的素材侵权难题。红果坦言,短剧作为新生业态,尤其在行业引入 AI 制作技术后,素材识别难度迅速增大,如何在审核阶段精准识别判断肖像权侵权情形,对平台及整个行业都是新的挑战。 据了解,近日,有网友在社交网络平台发文称,自己此前拍摄的照片被红果短剧旗下作品《桃花簪》未经授权擅自使用,并通过AI技术进行了内容生成。据该网友描述,《桃花簪》中人物角色所穿衣物、配饰以及整体妆容,均与自己的照片高度一致,有侵犯自己肖像权的嫌疑。此外,网友称,短剧内容将自己的形象设定为贪财好色的类型,很无语。 风凰网科技查悉,《桃花簪》相关平台播放量曾突破4000万,超2.8万收藏。 相关阅读: 5000元买一张人脸,AI短剧的灰色交易暴露多重风险
Agent时代,大厂们“拆墙”又“筑墙”
向来以「克制」著称的微信,终究是向外部Agent低了头。 此前,用户翘首以盼腾讯版「龙虾」QClaw与WorkBuddy,重要原因之一便是只有它们可以通过微信调用。怎料微信选择亲自「拆墙」,推出「ClawBot」插件,接纳包括OpenClaw在内的一众外部Agent。 一夜之间,技术平权了。 不过,微信目前向外部Agent开放的仅是消息通道,并未像飞书、钉钉等企业协作平台一样开放各种内部能力——即便是腾讯版「龙虾」也无法接触微信聊天记录、公众号内容等核心数据。 看来「权限与操作」的能力,只能盼望微信正在研发的内部Agent来实现了。 放到更大视角来看,Agent时代,大厂这样「拆墙」又「建墙」正在成为常态,而第一批碰壁者已经出现了。 01、Agent撞上「权限之墙」 最近,AI创业圈有个论调:「MCP已死,CLI称王。」 原因是钉钉、飞书、企业微信等互联网大厂们纷纷选择开源了自家的CLI(命令行),而非MCP(模型上下文协议)。 MCP与CLI方案对比 图源:COBUS GREYLING & AI 简单说,CLI和MCP都是Agent与外部系统的「管道」。 不同于人类靠GUI(图形用户界面)与应用打交道,Agent可以通过「屏幕识别」和「模拟点击」等方式来完成任务。但这种方式低效且极易被系统识别为「非真人操作」而禁止使用——这正是豆包手机助手遭遇的困境。 更讲武德的方式是走API(应用程序接口),跳过繁琐的图形渲染,直接与应用后台对话一一这就需要应用供应商授权,而各家API接口协议不一样,为了让这种调用不各自为战,Anthropic推出MCP(Model ContextProtocol),是当前AI领域公认的统一接入标准,常被比作AI界的「type-C接口」。 换句话说:API 是业务能力,MCP 是 AI 接入业务能力的标准化插座。 而CLI算是「前朝遗老」,早期计算机交互的主要方式,用文字指令操作软件,因为其结构化、无冗余的特性,正在成为PC端Agent最顺手的操作方式。 但无论是MCP、CLI,还是API,它们都只是调用方式——是工具层的问题,能否真正实现,还要取决于双方的意愿。 开放决定着「龙虾」等Agent的技能上限。 目前来看,用户并非每次指使「龙虾」干活时都能找到解决方法,比如说「点外卖」「打车」这类基础需求,在阿里的AI应用「千问」、美团的AI应用「小美」中可以轻易完成,「龙虾」却苦于权限问题只能干瞪眼。 千问和小美的办事技能 而且「龙虾」与「龙虾」之间也有能力差异:阿里的B端AI应用 「悟空」将淘宝、天猫、1688、支付宝等阿里生态的B端能力统一封装为可被AI直接调用的Skill和技能包;字节的ArkClaw深度集成飞书办公套件,还能调用抖音、今日头条的独家插件,飞书也是OpenClaw官方默认的即时通讯(IM)应用;腾讯专注于打造「龙虾天团」和上线「龙虾池」SkillHub,暂未发现其Agent拥有独家Skill。 在大洋彼岸,国外的AI御三家虽未跟风推出「龙虾」产品,但也在逐步将「办事」的能力集成到已有的产品中:在OpenAI撤回直接购物功能的同时,Gemini正尝试帮用户订餐、买菜和打车(目前仅限于Pixel或三星手机的Gemini应用中),而Claude干脆像OpenClaw一样可以自动操控用户的电脑执行任务。 三星在新机发布会上演示的谷歌 Gemini 任务自动化功能 很明显,现阶段Agent的能力上限,不仅与所用的大模型有关,还取决于Agent的权限边界。 面对Agent「敲门」,各家应用厂商们也是各怀心思。比如相同的搜索业务,百度大门敞开欢迎外部AI工具调用——在OpenClaw的官方技能商店 ClawHub上,百度搜索Skill下载量超4.5万次;谷歌却早早地删除 num=100参数,使得AI工具一次只能抓取前10个结果。 那么问题来了,面对外部Agent,为什么有人「拆墙」,有人「筑墙」? 02、墙的本质是商业模式之争 起初,Agent代理商们信奉着「用户授权,即可操作」的原则,试图造出「AI大一统入口」。不过,现实很快给出了答案:墙,不是技术问题,而是利益问题。 在国内,家喻户晓的冲突便是豆包手机助手与腾讯、阿里系应用之间的纷争。前者与手机厂商合作,获得硬件层面系统级的调度与操作应用的权限。结果上线几天便被腾讯、阿里系应用封杀,银行APP也弹出了风险提示。 在国外,典型案例便是亚马逊起诉AI搜索公司Perplexity,前者指控后者的AI浏览器Comet伪装成谷歌用户访问网站并完成购物流程,认为这是「欺诈」「违反使用条款」「危害用户的数据安全」。 表面上看,豆包被封是风控问题,Perplexity被告是合规问题。但本质指向同一个问题:当Agent替用户完成操作时,平台的价值链被截断了。 Agent每替用户完成一次操作,平台就少了一次广告曝光、一次数据采集、一次用户触达。Perplexity在反击文章里指出:AI只是用户的工具,企业无权干涉用户如何使用自己的账号;亚马逊的真正意图是把用户数据牢牢握在手中,卖出更多广告,是「霸凌者」。 Perplexity在博客更新《霸凌不是创新》,称亚马逊为「霸凌者」 2026年3月,美国地方法院裁定支持亚马逊,后Perplexity提起上诉,请求撤销或暂停执行禁令,目前上诉法院暂时中止了该禁令。 这意味,在法律层面,Agent想要操作应用,尚未规定必须获得用户以及应用开发者的双重授权。 目前,苹果、小米、三星等硬件厂商在做Agent时都采用了「双重授权」这一策略,通过系统级接口封装和标准化协议,让智能体在规范、可控的路径下操作应用。 而软件大厂们即是应用供应商,又是Agent代理商,是否为外部Agent「筑墙」取决于它的「命门」在哪儿。 比如同样是电商平台,亚马逊和Shopify对待外部Agent的态度截然相反。亚马逊不惜与Agent代理商打官司,Shopify则与Google、Walmart推出通用商业协议(UCP),主动给外部Agent开放标准化接口。 因为亚马逊是平台,卖流量;Shopify是服务商,卖交易。前者主要的盈利来源于广告,依赖用户在平台上的每一次点击与停留;而后者主要依靠促成交易抽佣,从商家GMV增长中实现增收。 对比中美两国,大厂「筑墙」固然是商业本能,但墙的「高度」取决于生态结构。美国平台多为垂直分工、各守一方;中国的移动互联网生态则由多个超级APP主导,大厂通过横向扩张、纵向整合,把社交、支付、内容、电商、本地生活等多项功能放进同一体系。 在这种结构下,超级应用的「命门」不再是单一业务,而是整套用户关系与数据。外部Agent一旦介入,冲击的不只是广告流量或一次交易,可能改变整个生态内部的逻辑。这也使得国内大厂对外部Agent的防御更为系统性。 此前就有某知名日用消费品集团的消费者体验负责人告诉《降噪NoNoise》,他们在海外已经看到一个品牌Agent可以实现跨平台服务的案例,这是因为很多国外用户习惯购物前先上Google搜索;但中国市场,线上购物场景分散、用户的消费习惯是直接到各电商平台站内搜索,电商平台也更注重把控站内流量,所以很难出现一个品牌Agent跨平台服务用户。 站在品牌角度,该负责人认为,通过一个个品牌知识库接入平台Skill,是更现实的实现方式。 03、Agent的诸侯割据 在科幻电影里,贾维斯可以连接任意终端,操控斯塔克住宅的每一台设备,还能调度钢铁战甲内部系统。但在现实的商业版图中,这种跨平台、跨终端的Agent「大一统」的幻想正在让位于「诸侯割据」的现实。 可以判断,在未来的很长一段时间内,中国很难出现代表「个人操作系统」的通用Agent,倒是平台内部的「统一入口」会加速成熟。 从国内大厂的近期布局来看,这种趋势日渐清晰。 阿里发力C端的千问锚定「AI办事」,在集成购物、外卖、订票等能力之后,又与自家的高德合作,提供AI「打车」服务;发力B端的「悟空」,用AI将自家的钉钉重做了一遍,并将阿里的to B能力统一放进去。 字节的豆包仍是中国第一大AI原生应用、也是字节C端规模最大的Agent。豆包与抖音、剪映、今日头条等字节系应用深度打通,目前还在内测购物功能。而吃到这波「龙虾」很大一部分流量的飞书,也推出了AI助手aily,加速B端AI商业化。 飞书AI助手aily 腾讯则押注「龙虾」全家桶,连「元宝派」里也可以创建龙虾bot。在「龙虾赛马」的同时,腾讯内部正在开发的专属于微信场景的AI Agent,应该具有更大的想象力。 微信早已打通社交、内容和支付三大场景,又通过小程序和视频号发力电商,产品月活超过11亿。在此基础上,微信Agent计划调用平台内数百万个小程序,让用户在聊天框内就能丝滑完成网约车、外卖、酒店预订、生活缴费等全场景服务。这意味着,微信或将能成为AI时代最高频的超级入口。 百度已不再执着于在应用端争夺AI入口,而是侧重于通过AI解决方案和大模型平台调用,对外输出AI能力。在「龙虾潮」中,百度不仅端出全家桶,还将核心的百度搜索打造成OpenClaw官方技能商店上全球下载量最大的搜索Skill。 百度龙虾全家桶 这一路径选择同样基于现实:在这个字节、阿里与腾讯的年利润动辄以千亿计、AI资本开支同样以千亿计算的时代,百度不足200亿元的利润规模、十年千亿元AI投入的处境,已经被彻底挤出头部阵营。 落到AI应用层,打造一款好用的通用AI助手需要在应用场景、用户体验、投入资源上无短板,但文心一言基本都不占优势。所以外界会看到,百度正收拢此前分散的入口,将文心助手深度集成于百度App,并加强百度文库、网盘的资源投入,在B端则通过Token调用收费实现AI商业化。 这种战略选择有其合理性:当AI 迅速从「回答问题」走向「完成交易」,百度天然站在链路更靠后的位置,此时百度App可利用AI助手直接输出整合后的答案,自然嵌入符合筛选条件的商业服务,如用户搜机票后,可在搜索结果页完成机票的比价、预订、支付全流程。而百度此前的全栈AI投入亦可以在新到来的Token商业模式中发挥作用,因为自研芯片、框架与模型性能的配合度,将实际影响到每一个Token的价值高低。 在这些AI大厂之外,硬件厂商们也正在试图通过系统级AI Agent,重新定义AI时代的交互入口。相比软件大厂之间的剑拔弩张,掌握底层的硬件厂商们可能会有更多的跨应用、跨终端「办事」的优势。 近日就有市场传闻称,豆包二代AI手机暂定今年第二季度上新,目前TOP5手机厂商有两家在与豆包方面洽谈。 至于更进一步的Agent to Agent协作——即贾维斯式的Agent,主流大厂短期内不会放开这个口子,但注定会产生裂缝。 16世纪中叶,英国的一位剪绒工人发明了能够「代替手工」的起毛机,效率高到让同行恐慌。很快,英国国王就颁布了「起毛机禁令」。不过,随着第一次工业革命的到来,新机器如潮水般涌入纺织业,「起毛机禁令」也渐渐成了一纸空文。 「墙」,或许只能延缓冲击到来的时间,却无法阻止那个迟早会来的世界。
真人短剧真要崩了?1340人公开讨薪560万元
4月3日消息,多名短剧演员和工作人员在社交网络发帖讨薪。 事件涉及三家公司,西安某公司,上饶月下龙吟以及免费短剧平台。 涉及讨薪人数1340人,涉及金额560万元。 简单说就是,免费短剧平台给了某公司30部短剧制作,该公司委托月下龙吟制作,然后平台没给西安公司结款,西安公司没给月下龙吟结款,导致月下龙吟资金链断裂,30部剧工作人员纷纷讨薪。 2026年4月3日,上饶月下龙吟文化传播有限公司发布声明,回应网传其摄制短剧项目款项结算承诺相关信息。 2026年4月3日,上饶月下龙吟文化传播有限公司发布声明,回应网传其摄制短剧项目款项结算承诺相关信息。 声明称,网传信息源于公司向项目工作人员作出的承诺,系工作人员个人发布,与公司无关。2025年12月至2026年1月,该公司承制西安某影视委托的30部红果免费短剧,已按约完成交付,但因甲方未按合同定向付款,导致公司资金链断裂,欠付1340名工作人员劳务报酬共560万元。 公司承诺于2026年4月30日24时前结清全部剧组相关费用,已启动贷款申请、筹措资金并制定结算方案,派专人建立沟通群告知工作人员,保障报酬支付。 声明同时表示,尊重工作人员诉求,但反对未经同意擅自发布内部信息的行为;后续将推进贷款筹措及对甲方的维权工作,也呼吁市场主体通过法律途径维护自身权益,抵制破坏市场秩序的行为。
华尔街日报:美国人形机器人背后是中国科技
特斯拉Optimus机器人 凤凰网科技讯 北京时间4月3日,《华尔街日报》周四发文,介绍了美国人形机器人所使用的中国技术。文章称,在具有战略意义的人形机器人行业,特斯拉和其他美国公司正依赖中国供应商提供零部件。 今年3月,英伟达CEO黄仁勋(Jensen Huang)展示了一个机器人版的雪宝,后者是电影《冰雪奇缘》中的雪人。机器人雪宝将三家美国最知名公司结合在一起:英伟达和谷歌提供AI技术,为这个迪士尼角色赋予“生命”。 然而,雪宝同时也是中国技术实力的展现。根据迪士尼的一篇研究论文,如果没有中国机器人制造商宇树科技的部件来驱动其颈部和腿部的运动,这个机器人雪宝就无法摇摇摆摆地行走或晃动身体。 机器人雪宝使用了宇树科技的部件 中国企业正加紧巩固其在人形机器人供应链中的地位。黄仁勋以及特斯拉CEO埃隆·马斯克(Elon Musk)都认为,人形机器人将成为科技领域的下一个风口。 中国供应链实力 尽管美国掌控着用于机器人“大脑”的最优质芯片及其他技术,但中国在人形机器人“身体”的制造生态系统方面拥有无与伦比的掌控力。 “微电子、电机、稀土、磁铁,这些都是机器人技术的基础,中国做到了世界最好。全球机器人产业将不得不十分高度中国。”黄仁勋3月份在播客节目中称。 知情人士称,特斯拉正在中国组建一个团队,与供应商合作开发其人形机器人Optimus。特斯拉员工已走访了中国的传感器、电机及其他零部件制造商,为Optimus的大规模生产做准备。马斯克曾在去年11月预测,Optimus将成为有史以来最重要的产品。 长期以来,美国科技公司一直依赖中国制造商来生产iPhone等产品。但一些美国政策制定者对中国企业已在人形机器人供应链中占据关键地位感到不安,因为这类技术可能涉及军事及其他敏感用途。 今年2月,一个由美国两党议员组成的众议院小组提出立法,建议成立一个委员会来审视美国在机器人领域的竞争力,理由包括供应链风险和制造业挑战。 中国人形机器人销量远超美国 中国则将机器人供应链视为具有战略重要性的领域。中国已将具身智能(AI与物理系统的融合),列为未来五年推动经济发展的六大重点产业之一。 中国在2023年表示,目标是到2027年建立具有韧性的国内人形机器人供应链,以使本国免受外部冲击的影响,并减少对日本、德国等擅长机器人零部件国家的依赖。今年2月,中国还发布了首批人形机器人国家标准,涵盖关键技术和核心部件。 由于在本土就能获得如此多精密的零部件,中国的人形机器人整机制造商能够更快将产品推向市场。根据摩根士丹利的数据,去年中国企业推出了28款人形机器人型号,几乎是美国公司推出数量的三倍。 政府补贴以及机器人体育比赛、电视表演所引发的公众关注度的上升,不仅推动了早期应用,也帮助中国企业获得了融资。 成本优势 宇树科技是机器人整机及零部件领域的领先制造商之一,计划于今年在上海启动首次公开招股(IPO),拟筹集约6.1亿美元。宇树科技表示,该公司2025年人形机器人出货量超过5500台,用途包括研究、教育和公共表演,这令美国竞争对手相形见绌。 该公司在其IPO招股书中表示:“大规模生产进一步增强了我们与上游供应商的议价能力,形成了持续的成本优势。” 摩根士丹利估计,中国的供应链可以使人形机器人的制造成本降低多达三分之二。根据研究公司集邦咨询的数据,控制人形机器人运动的部件(包括专用电机和齿轮)约占机器人总成本的55%。 “中国人形机器人创业公司的优势在于能够接触到广泛的供应链,”日本摩托车制造商雅马哈硅谷风投部门Yamaha Motor Ventures董事长Kei Onishi去年表示,“中国有市场可以测试各种不同的应用,而且供应商愿意承担风险。” 尽管如此,美国机器人制造商在获取英伟达芯片及其他美国AI技术方面仍具优势。这也是中国公司也在寻求作为零部件供应商切入市场的原因。 从新加坡、东京到利雅得、拉斯维加斯,过去一年中国零部件制造商频繁出现在机器人行业展会上,包括优必选和宇树科技在内的公司也聘请了当地分销商来帮助接触海外买家。 今年3月,美国第一夫人梅拉尼娅在白宫主持的一场教育峰会上,与硅谷公司Figure AI开发的最新人形机器人并肩走过。机器人对观众说:“我是Figure 03,一款在美国制造的人形机器人。” Figure AI的机器人也使用过中国部件 据汇丰银行分析师及知情人士透露,在早期型号中,Figure AI曾使用中国供应商提供的机器人关节、传感器和电机。 特斯拉中国订单 虽然一些人形机器人零部件是从工业机器人、汽车和消费电子产品中改造而来的,但特斯拉正尝试自行设计和开发许多部件。这将使其对该技术拥有更多控制权,并优化软硬件之间的兼容性,但这也意味着要依赖能够以高性价比提供定制零部件的中国供应商。 据熟悉特斯拉供应链的人士透露,特斯拉对中国的依赖在去年变得明显。在中国收紧了出口管制后,特斯拉不得不减少Optimus中稀土磁铁的使用量。 去年,马斯克表示,特斯拉计划建设一条年产百万台Optimus的生产线,该生产线可能在2026年底前投入运营。 知情人士称,特斯拉今年已与一些中国供应商就零部件订单进行接洽,这些零部件足够制造数千台Optimus。这些零部件包括传感器、用于精确高速运动的所谓空心杯电机,以及常用于关节以模拟人体动作的减速器。 据知情人士透露,一些供应商已在泰国和东南亚其他国家为特斯拉准备了制造产能,部分原因是为了规避美国对中国商品的关税。 某些中国产品的质量仍落后于外国竞争对手。业内人士表示,某些中国精密部件的耐用性不如日本同类产品。不过,中国供应商正在缩小差距,并且通常提供更低的价格。 要求高 螺丝是机器人运动的关键零部件。一家中国螺丝供应商正加紧努力以满足特斯拉更高的寿命标准,该公司曾为多家中国机器人制造商供货。据这家中国供应商的市场经理透露,特斯拉提出了一系列严格要求:缩小设计尺寸、将耐用性提高四分之一,同时价格仍需比欧洲产品低25%。 这位经理表示:“一旦我们缩小差距,我们的成本结构将成为无可匹敌的优势。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
通义视频生成模型Wan2.7-Video上线:支持文本、图像、视频、音频全模态输入
凤凰网科技讯 4月3日,近日,视频生成模型Wan2.7-Video正式上线。该模型支持文本、图像、视频、音频全模态输入,聚焦视频生成后的编辑与修改能力,旨在让视频内容像文档一样可编辑。 在视频编辑方面,Wan2.7支持通过指令对画面进行局部调整,无需重新生成完整片段。具体功能包括:增删元素(如“删掉视频中的火车”)、替换物体(如“把胶片换成盘子”)、修改物体属性(如建筑颜色);支持参考图像内容进行精准添加。环境与风格层面,可在保持人物动作不变的情况下,将背景季节从夏日改为深秋,或一键转换为羊毛毡等艺术风格。此外,还支持视频画质提升(如黑白上色)、视觉理解任务(如主体分割)以及拍摄方式调整(如修改对焦)。 在剧情修改方面,Wan2.7允许在不改变原有身份和场景的前提下,修改角色台词、动作甚至拍摄视角。台词修改可保持情绪、口型与音色统一;动作修改如“坐沙发上的女生变为站着打游戏”。故事层面可将玩家角色替换为中世纪骑士,同时保持原有握持姿势。拍摄机位、景别、镜头类型、焦距等参数均可通过指令调整,例如“将镜头修改为从地面逐渐向上升起”。这些功能旨在降低视频二次创作的技术门槛,为创作者提供更灵活的控制手段。
5000元买一张人脸,AI短剧的灰色交易暴露多重风险
摘要: AI短剧人脸授权,标价跨度从几十元至上千元,授权租期最长可达15年。 凤凰网科技 出品 作者|尚志芳 编辑|董雨晴 近几日,AI拟真人短剧《桃花簪》引起较大争议,剧中两个AI人物角色被指涉嫌“盗脸”侵权。 博主@白菜汉服妆造与@七海Christ先后公开发声维权,明确表示自己发布在社交平台的个人形象,在未经任何授权同意下,被AI短剧制作方通过技术完整复刻了五官、神态甚至服饰造型。更令二人愤怒的是,制作方对二人形象进行丑化,将其打造为品行卑劣、形象猥琐的反派角色。 博主白菜告诉凤凰网科技,自己已委托律师与对方交涉,但对方以“算法出错”为由敷衍搪塞。 他表示,“我不接受这种说法,我的诉求就是要求对方赔偿、公开道歉,诉求满足不了,我肯定要走诉讼程序。” 凤凰网科技查悉,事件发酵后,涉事制作方已紧急替换多个平台上《桃花簪》的侵权画面,但整部剧集仍在正常传播,相关平台播放量已突破4000万,超2.8万收藏。截至目前,制作方未作出任何公开回应。 此外,凤凰网科技获悉,火山引擎在武汉巡回站上官宣Seedance2.0于4月2日正式开启公测,但仅面向企业认证主体开放,真人人脸生成与自定义人像功能暂不开放,仅可使用平台公共虚拟人像库进行二次创作。想要解锁完整能力,需要签署保底合作协议,支付10%预付款及100万元保证金,协议期满后保证金按约定返还。 火山引擎总裁谭待表示,专门将版权保护体系列为对外开放API的前提条件。他表示,保护一个人的形象不仅需要保护其当下的样子,还包括年轻时候、古装时的形象,传统的版权保护技术已经过时,为此火山基于豆包VLM能力构建了一套新的多模态版权保护方案,并对此“较有信心”。 现如今,真人肖像合规授权,或许已成为AI短剧行业绕不开的硬性标准。 当下虽仍有个别AI短剧制作方铤而走险,心存不被发现的侥幸心理,未经授权擅自盗用他人人脸,或是生成具备明显辨识度的人脸肖像。但凤凰网科技经调查发现,AI短剧行业也顺势开启了明码标价的人脸交易,向普通人收购肖像权,将一张张人脸变成可随时调用、美化修改的低成本素材。 凤凰网科技从多位相关人士处了解到,目前人脸版权的报价从几十元到上千元不等,最高报价达到了5000元一张,使用期限多在1年左右,也有高达15年之久。但这种看似“你情我愿”的合作模式,背后也可能暗藏多重风险。 人脸生意 明码标价 “现在我们收人脸授权,是1000块钱一个人,15年独家使用权,签了我们的就不能再签别家了。”一位从事AI拟真人短剧的负责人告诉凤凰网科技。 据对方介绍,其人脸收购业务定价在1000元到5000元不等。对方称目前较为饱和,“再选新的人,统一按1000元的底价来”。而对于1000元和5000元的定价差异,对方表示,“不清楚,可能贵的调用多一点。” 在初选阶段,签约者需要提交高清素颜登记照、生活照各1张,附带真实姓名和年龄。在海选成功后,还应提交身份证复印件,若是未成年人,需额外提供户口本照片与监护人身份证。 一旦入选,签约者的人脸图像会被存入公司的数据库,未来15年内,只要有剧情需要,就会被随时调用生成AI角色。 当凤凰网科技问及长达15年的授权期会不会有风险时,对方表示,“没有风险,我们的数据都是保密的。 和这家的独家买断模式不同,另一家AI拟真人短剧公司的人脸授权模式则略有不同。 “我们的授权只用于AI拟真人剧这一个场景,500到800块钱,一年使用期限,签正规合同。”负责人告诉凤凰网科技,他们的授权是非独家的,签约者把人脸卖给他们之后,还可以继续卖给其他公司。 据对方透露,目前一批计划收50个人,已经招收20多个,收满便截止。“男女老少都要,每个年龄层收10个左右,覆盖短剧里需要的所有角色类型”。同样,负责人表示也会对颜值设门槛,“不是谁来都能过,也不保证百分百通过”。 除了需要提供证件照,还要求报名者提交一段无滤镜的人脸展示视频,后续要配合完成一次活体检测。 “就相当于我请你来拍短剧,只是价格低,而且你不用亲自出镜而已。”负责人这样描述这项业务。 至于前后生成的形象是否一致,两位负责人回答基本一致,“因为是使用人脸做底部模型,最后还要美化,因此最后生成的图像与本人可能会有所改变,但总体前后基本一致。” 以往,真人演员拍摄短剧,会明确约定出演的角色、剧集、播出平台,有明确的片酬分成,有对自己形象的最终审核权。而这些出售肖像权的普通人,除了一笔几百到一千块的固定费用,对自己的脸会被用在什么角色、什么剧集里,会不会被丑化、被滥用,没有话语权,对于最终生成的形象是什么样的,他们可能全程看不到。 一位兼职群演向凤凰网科技透露,她所在的演员兼职群中,曾有人公开发布AI短剧人脸授权招募信息。仅需提供3-5张半身照及全身照照片,线下签署授权协议,全程大约半小时,可获得60元报酬。 “这个价格太便宜了,我和其他群演都觉得不合理。”同时她坦言,“如果合同合理,有相关法律约束,价格高我可能会接受。但目前不能接受,万一对方拿着我的肖像做其他事情,普通人也很难维权。” 低价买脸真的合规吗? 从表面上看,AI短剧公司通过签订合同、支付费用的方式获取肖像授权,似乎是一种“你情我愿”的合规交易。但在法律专业人士看来,这种低价批量收购人脸的模式,在合法性与有效性上存在重大瑕疵,所谓的“授权合同”,远非普通人想象的那样一签了之。 北京市中闻(西安)律师事务所谭敏涛律师告诉凤凰网科技,这类授权模式在形式上可能合法,但存在重大法律瑕疵。即便签约,普通人也并未丧失追责权,相关权利完全可以通过诉讼主张。 谭敏涛律师表示,普通人签约时,一定留意合同中可能存在的“霸王条款”。对于“数据保密、没有风险”的承诺,如果公司未尽到严格保护义务导致信息泄露,该免责条款因违反法律强制性规定而无效,普通人完全可以依法追责索赔。 也就是说,签约并不意味着丧失肖像权与追责权,肖像权是人格权,不可放弃、转让,授权是使用权许可,不是所有权转让,权利人始终是肖像权人。即使合同写“永久放弃追责”,因违反法律强制性规定与公序良俗而直接作废。并且在超范围、违约、侵权时,权利人仍有权维权:包括停止侵害、删除数据、赔偿损失、赔礼道歉、精神损害赔偿。 谭敏涛律师建议,对于普通人而言,人脸生物信息具有唯一性和不可更改性,一旦泄露风险远大于普通肖像。签署授权时,务必确认授权用途是否仅为“短剧制作”,并明确禁止转授权、倒卖及用于色情、暴力等违法内容。若合同存在上述漏洞,建议拒绝签署,或要求对方补充修改条款,避免日后遭遇难以挽回的隐私与名誉风险。 比肖像侵权更值得警惕的,是潜藏在人脸授权背后的个人财产与身份安全隐患。 2026年3月长沙市雨花区人民法院公布的一例案件中,大学生吴某同样通过AI技术,将静态人脸照片转化为可通过支付软件人脸识别验证的AI动态视频,绕过云闪付平台的人。脸识别验证,登录他人账号并修改密码,供下线盗刷绑定银行卡内资金,涉案金额达5万余元。 而山东青岛警方2026年3月通报的AI诈骗案中,一次性查获了5万余条可绕过各类人脸识别系统的AI动态人脸视频,这些视频的原始素材来自网上非法购买的公民证件照、生活照等个人信息。 可见,仅靠获取的静态照片,便能实现对人脸识别系统的突破。当前AI短剧行业的人脸授权交易中,制作方要求普通人上交的,除了高清素颜证件照、无滤镜动态展示视频,还会同步收集身份证、户口本等配套身份信息,足以拼凑出完整的个人信息档案。 不同于随时更换的支付密码、手机号,人脸生物信息具有唯一性、不可更改性,一旦这些数据因公司保管不当、内部人员倒卖或企业关停后数据流失泄露,普通人面临的将不止是肖像被丑化滥用,刷脸支付账户盗刷、银行账户被冒用实名等都可能发生。 4月2日,中国广播电视社会组织联合会演员委员会发布严正声明。 明令严禁未经授权的AI换脸合成、演员影像声频擅自抓取用于AI训练等侵权行为。即便标注“非商用”“个人二创”,可关联特定演员的AI换脸短剧、虚拟人复刻等内容,仍需承担全部侵权责任,为AI短剧行业的肖像合规划定了红线。 AI技术的介入,让整个短剧赛道都在狂奔,每一次迭代,都在不断拉低创作门槛、放大产能效率,却也让合规隐患加速暴露。 当前AI短剧行业要想实现可持续的良性发展,唯有厘清肖像商用的法定权利边界、建立规范透明的人脸授权与全生命周期信息保护机制,才能行稳致远。
三万亿美元IPO即将上演,市场在激动同时也在颤栗
刚刚完成史上最大规模融资的OpenAI,传出了不利消息。 彭博社报道,OpenAI在二级市场的影响力正在下降,有机构表示近几周接触几百个投资机构,一个愿意买OpenAI的都没有,与此同时,众多机构投资者手握数十亿美金想购买Anthropic的股票。 马斯克听到这个消息马上来插一脚,在X上转发并且阴阳了一句:“并不感到意外呢。” 马斯克迫不及待前来嘲讽并不令人意外,SpaceX、OpenAI、Anthropic都有可能在今年内IPO,三家在人才、技术、舆论的战场上厮杀得愈发激烈。 仅仅在这几天,就有OpenAI的1220亿美元超大规模融资,投后估值达到8520亿美元,以及SpaceX很可能抢先一步IPO的消息。据《华尔街日报》报道,SpaceX已以保密方式向SEC递交IPO申请,最早可能于今年7月上市,募资规模或在400亿至800亿美元之间,目标估值1.75万亿美元。 这让2026年的资本市场一下子变得非常拥挤:几家最能代表AI时代不同权力中心的巨头,几乎在同一时间涌向了IPO窗口。 01 不同寻常的2026 2026年的美股IPO市场,可能即将出现这样一种场面:三家最受瞩目的AI相关的公司上市,而且不止一家上市市值就逼近或超过万亿。 先看SpaceX。 SpaceX正朝着一场可能创纪录的IPO推进,目标融资约750亿美元,对应估值约1.75万亿美元。 路透随后也报道称,SpaceX已秘密递交上市文件,若最终规模超过2019年沙特阿美IPO的256亿美元,它将改写全球最大IPO纪录。 更夸张的是,Axios直接点明,这一笔交易单体规模就可能超过美国2024年和2025年全部IPO募资总和。 与此同时,路透还提到,SpaceX在去年收入约150亿至160亿美元、利润约80亿美元,且在今年2月完成了对xAI的收购,把火箭发射、Starlink卫星网络与Grok所代表的AI资产进一步捆在一起。 它已经进化成“AI+基础设施+马斯克宇宙”的超级集合体。 再看OpenAI。 它几乎就是过去三年全球AI市场情绪最直接的温度计。 OpenAI刚刚完成创纪录的1220亿美元融资,估值升至8520亿美元。 这是硅谷历史上最大一轮融资,公司正为年内IPO做准备。 公司目前月收入约20亿美元,折算年化约250亿美元,并计划把ChatGPT、Codex、浏览和Agent能力整合成一个统一的“超级应用”。 Anthropic的象征意义则不同。 它没有OpenAI那样的全民流量,但在企业级AI和“安全叙事”上,它已经形成品牌心智。 Anthropic最新一轮融资后估值达到3800亿美元,年化收入达到约140亿美元,其中Claude Code推动的代码相关业务年化收入已超过25亿美元,企业订阅在2026年内增长了4倍。 更早的路透报道称,Anthropic曾与投资人讨论估值超过3000亿美元的融资,并规划最早在2026年推进IPO,内部预计2026年年化收入可能达到200亿到260亿美元,企业客户规模已超过30万家。 历史上,市场当然见过巨型IPO:阿里巴巴2014年募资250亿美元,沙特阿美2019年募资256亿美元,Facebook 2012年募资超过160亿美元。 可今年可能发生的AI相关的IPO远超此规模,而且公开市场可能要同时给AI基础设施、AI应用入口、AI企业软件三种最核心资产定价,每一种背后都是数百亿乃至上千亿美元的资本、算力和预期。 02 为什么偏偏是现在? 这三家公司——OpenAI、Anthropic和SpaceX——偏偏在2026年前后集中走向公开市场,这并非巧合。 首先,私募市场已经把估值抬到了天花板。 到了这个体量,一级市场还能接盘的投资者已经越来越少。能一口气拿出数百亿美元的,基本是亚马逊、微软、软银这类大型机构投资者、主权财富基金和科技巨头。路透社提到,OpenAI这一轮的主要出资方正是这些名字,而不是普通的成长型基金。 换句话说,继续留在私募市场,并不意味着融资能越滚越大。相反地,愿意继续在这一估值水平下注且有能力下注的投资者很可能越来越少。 更重要的是,这些公司都进入了更烧钱的阶段。 OpenAI 2025年收入130亿美元,但同期支出就达到了80亿美元;内部目标是到2030年累计计算开支大约6000亿美元。 Anthropic虽然年化收入已经做到140亿美元,企业订阅增长很快,但模型训练、算力和销售体系都在同步狂飙扩张。 SpaceX去年收入约150亿至160亿美元,利润约80亿美元,可还在继续铺星链计划、星舰试飞也在继续,再加上把xAI并进来,后续资本开支只会更大。 这类公司需要的是更长期、更大容量、流动性更强的融资工具。 公开市场天然比一级市场更适合承接这种需求。 还有一个很现实的压力:一旦SpaceX先把闸门打开,后面的公司就很难不被放在一起比较。 路透社4月1日报道已经把SpaceX称为“巨型IPO”的先行测试——如果它真的募资超过500亿甚至750亿美元,市场接下来看OpenAI和Anthropic时,比的就不只是模型谁更强,而是更硬核的几项:一年到底赚多少钱、资本开支要烧到什么程度、治理结构够不够清楚、公众投资者能不能看懂。 SpaceX如果先一步完成超大规模IPO,等于先帮后来者测试了公开市场的承接能力,一旦被验证,OpenAI和Anthropic继续留在一级市场的必要性就会下降。 就在这个节骨眼上,纳斯达克把规则改了。 3月30日,纳斯达克宣布纳斯达克全球指数已经批准包括“快速准入(fast entry)”在内的纳斯达克100指数编制规则修订,自今年5月1日起生效: 符合条件的大型新股,最快第7个交易日就能评估,第15个交易日就有机会被纳入指数。 其中“前40名”的门槛正好卡在约3000亿美元估值水平,那么估值超过1万亿美元的SpaceX、7000亿—8000亿美元的OpenAI和3800亿美元的Anthropic显然都是纳斯达克交易所试图通过新规招揽的对象。 以前,新上市公司往往要等好几个月,甚至更久。对这些公司来说,这是上市后更快获得被动资金、流动性和机构配置的重要通道。 万事俱备,只差临门一脚。 03 更加审慎的市场 然而,2026年也许已经不是这些公司最“完美”的上市时点。 就在OpenAI刚完成1220亿美元融资、估值升至8520亿美元之后,二级市场对它的热情已经出现降温。 彭博社最新报道称,Next Round Capital创始人肯·史密斯表示,最近几周,约有六家机构投资者——包括持有大量股份的对冲基金和风险投资公司——联系了他的公司,希望出售价值约6亿美元的OpenAI股票。 尽管他们接触了数百家机构投资者,但在最近几周,仍未找到任何一家愿意购买OpenAI股票的买家。而去年,此类股票在几天内就会售罄,但如今,即便以7650亿美元的折价估值(较之前的8500亿美元下降了10%)出售,也无人表现出兴趣。 讽刺的是,就在四个月前,奥特曼还曾在一档播客中对质疑者放话。 当时主播问到OpenAI以130亿美元左右的收入,怎么支撑高达1.4万亿美元的计算基础设施承诺,奥特曼听后有些不耐烦,直接回击道:“首先,我们的收入远不止这个数。第二,如果你想卖你的股份,我马上帮你找买家。够了……我相信有很多人抢着要买OpenAI的股份,我们能很快把你的股份卖掉。” 2026年的市场情绪已经发生了变化。 英伟达的预期市盈率已经跌到2019年初以来最低水平,大约只有19.6倍,甚至低于标普500指数约20倍的整体水平。 对一家2026财年季度收入仍在同比增长且刚报出681亿美元季度营收的公司来说,这个估值非常不寻常。多方报道给出的解释也很直接:投资人开始担心,微软、谷歌、亚马逊这些客户几千亿美元的AI基础设施投入,回报兑现得太慢。 也就是说,连英伟达这样已经吃到AI红利、业绩最硬的公司,市场都不再愿意无限上调估值,更别说那些还没有完成利润证明的AI巨头了。 再看整个AI行业,投资人现在盯得越来越细:电力、芯片、折旧、现金流,都得一项一项算。 S&P Global数据显示,微软、亚马逊、谷歌母公司Alphabet、Meta等大厂2026年AI相关资本开支预计合计达到6350亿美元,高于2025年的3830亿美元,而2019年这一数字只有800亿美元。 2026和2027两年里,五大云厂商(亚马逊、微软、谷歌母公司Alphabet、Meta和甲骨文)资本开支合计可能达到1.4万亿美元,接近其同期经营现金流的九成。 这就意味着,SpaceX、OpenAI、Anthropic这三家公司一旦真的集中上市,面对的会是一套格外挑剔的定价标准。 何况不管是哪家,在疯狂为IPO铺路造势的同时,也都有各自的新挑战。比如Anthropic的“黑名单”危机;xAI联创12人只剩马斯克(xAI已被并入SpaceX);OpenAI关闭Sora应用。 当这些公司真的站到公开市场面前,华尔街究竟还愿意为“AI的未来”支付多少溢价?热潮还在,但闭眼买单的时候,可能已经过去了。 只是箭在弦上,IPO看似是选择,实则已是必走之棋,且看谁能扛过审视。
最小仅2B!谷歌最强开源模型登场,免费商用,手机就能跑
智东西 编译 | 陈佳 编辑 | 程茜 智东西4月3日消息,今日谷歌DeepMind开源发布Gemma 4系列模型,根据官方博客,这是谷歌迄今为止最智能的开放模型,专为高级推理和智能体工作流而设计,实现了单位参数下前所未有的智能水平。 其中,31B 模型目前在行业标准的Arena AI文本排行榜上名列全球开放模型第3位,在GPQA Diamond在这一高难度科学推理基准上取得85.7%的准确率,仅次于Qwen3.5 27B的85.8%。 Gemma 4系列模型在多项基准测试中的表现对比(图源:blog.google) 自第一代模型发布以来,Gemma的下载量已突破4亿次,并衍生出超十万种社区变体。 Gemma 4系列是基于与Gemini 3相同的技术体系构建的,支持图像与视频(以帧序列形式)及文本输入,小模型版本进一步支持音频理解。该系列共四款型号,E2B、E4B、26B混合专家模型(MoE)与31B 稠密模型,覆盖从智能手机、树莓派到专业工作站的完整部署场景,全部采用Apache 2.0协议开放,开发者可自由修改、再分发并用于商业产品。 有开发者在社区评论中说:“基准数据一直都在,但没人愿意在一个谷歌随时可能改规则的模型上建立产品。现在它才真的可以部署了。” Gemma 4官方模型集合页面(图源:Hugging Face) 在硬件覆盖上,Gemma 4采取“移动优先”的设计理念,同时兼顾全栈部署需求。E2B与E4B专为边缘设备优化,可在手机、树莓派、NVIDIA Jetson Orin Nano上完全离线运行,延迟趋近于实时;26B与31B模型的非量化bfloat16权重可在单张80GB NVIDIA H100 GPU上运行,量化版本则支持消费级GPU本地部署。 谷歌DeepMind CEO德米斯·哈萨比斯(Demis Hassabis)将Gemma 4称为“在各自参数量级下性能最优的全球开源模型”。 谷歌DeepMind CEO 德米斯·哈萨比斯(Demis Hassabis)在X平台的推文 Hugging Face联合创始人克莱门特·德朗格(Clément Delangue)将Gemma 4模型发布视为“本地AI正在迎来关键发展阶段”,并认为开放模型与可本地部署能力将成为未来AI的重要方向。 Hugging Face联合创始人克莱门特·德朗格(Clément Delangue)在X平台的推文 此次Gemma 4的发布,被多家外媒视为谷歌重返开源主战场,美国模型阵营迎来关键补位。 Hugging Face地址:https://huggingface.co/collections/google/gemma-4 官方技术博客:https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/ 一、4大模型配置,性能表现超越参数规模达其20倍的模型 在官方技术博客中,谷歌说Gemma 4实现了单位参数下前所未有的智能水平,能在更低计算开销下实现更强性能。 该系列并非延续单纯扩大参数规模的路径,而是通过架构设计与训练优化的系统性改进,使开发者以更低硬件成本获得接近前沿模型的能力。 Gemma 4提供四种规模配置:E2B、E4B、26B混合专家模型(MoE)以及31B稠密模型。 31B 模型目前在行业标准的Arena AI文本排行榜上名列全球开放模型第3位,26B模型则名列第6位。在榜单中,Gemma 4的表现甚至超越了规模达其20倍的模型。对于开发者而言,这种单位参数智能水平的新高度意味着只需极低的硬件开销,即可获得前沿模型级别的能力。 Gemma 4 在Arena用户偏好排行榜中的参数量对比(左)与用户偏好(右)(图源:blog.google) 架构层面,26B MoE模型采用“按需激活参数”的设计,推理时仅激活约3.8B活跃参数,在显著降低算力需求的同时保持高性能输出;E2B与E4B小模型则引入Per-Layer Embeddings(PLE)机制,为解码器每一层引入独立的embedding表,从而增强各层的表达能力并提升参数利用效率,使模型在不显著增加计算负担的前提下获得更强的表征能力。 在注意力机制上,Gemma 4交替使用局部滑动窗口注意力与全局注意力机制,并在最后一层采用全局注意力,在保证长上下文能力的同时有效控制内存消耗。 在上下文处理能力上,边缘机型配备128K的上下文窗口,而更大型号则提供256K的上下文窗口,允许用户在一次提示中处理存储库或长文档。 这套架构优化的实际效果已在具体应用中得到验证。谷歌在博客中列举了两个典型案例:INSAIT基于Gemma系列开发了保加利亚语优先大模型BgGPT,耶鲁大学则与谷歌合作推进Cell2Sentence-Scale项目,探索癌症治疗新路径。这些案例基于对Gemma模型的微调与适配,体现出Gemma在垂直领域应用中的潜力。 二、原生支持图像、视频输入,可处理140种语言 Gemma 4不再局限于文本生成,而是从底层架构出发,将多模态理解与智能体(Agent)调用能力原生整合进同一模型体系。 全系四款模型均原生支持图像与视频输入,其中视频以帧序列形式处理,在OCR、图表理解等视觉任务中表现较为突出;E2B与E4B进一步集成原生音频能力,支持语音识别与理解。 在视觉处理精度上,模型支持可变分辨率与可配置token预算,官方提供70至1120 token等多档配置:低预算适用于分类与视频帧理解等速度敏感场景,高预算则用于OCR、文档解析与细粒度图像分析。 Gemma 4将函数调用(function calling)与结构化输出能力直接训练进模型本身,而非依赖提示工程引导。模型可原生输出结构化JSON,支持多工具调用与多轮任务执行,使其能够稳定参与自动化工作流,有效降低开发者构建智能体系统的工程成本。 在代码能力上,Gemma 4支持高质量离线代码生成,可在本地环境运行,被定位为“本地优先”的AI编程助手。在多步推理与复杂指令执行任务中,其表现较上一代显著提升。此外,模型原生支持超过140种语言。 三、采用Apache 2.0许可证开源,可在手机上离线运行 技术能力之外,Gemma 4的另一核心变化在于开放策略的调整。谷歌此次全面采用Apache 2.0许可证,取代此前的自定义授权方式,允许开发者自由修改、再分发及商业化部署,赋予其对模型、数据与基础设施更高的控制权。 Apache License 2.0开源协议核心条款说明(图源:devmandan) 在开发与部署层面,Gemma 4强调“从实验到生产”的完整链路支持。开发者可通过Google AI Studio(支持31B与26B MoE)与AI Edge Gallery(支持E4B与E2B)快速体验模型能力,也可在Android Studio中结合Agent模式进行移动应用开发。 在工具链适配上,Gemma 4发布首日即支持Hugging Face(含Transformers、TRL、Transformers.js、Candle)、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM和NeMo、LM Studio、Unsloth、SGLang等主流框架,模型权重通过Hugging Face、Kaggle与Ollama开放下载。 此外,Gemma 4针对NVIDIA GPU(涵盖Jetson至Blackwell架构)、AMD GPU(ROCm生态)以及谷歌自研Trillium与Ironwood TPU进行了深度优化,实现跨硬件平台的高效适配。云端方面,可通过Vertex AI、Cloud Run、GKE及TPU加速服务等多种方案扩展至生产规模。 四、实测多模态复杂任务效果一般 知名AI开发者Simon Willison在实际测试后指出,Gemma 4在“单位参数能力”(intelligence per parameter)上的表现尤为突出,这一指标反映出模型在有限参数规模下实现更高性能的能力。他认为,相较于持续扩大模型体量,如何在既有参数约束下提升性能,正逐渐成为当前模型优化的重要方向。 Willison以“骑自行车的鹈鹕”这一复杂视觉生成任务为例,对不同规模模型进行对比测试。结果显示,从2B到26B参数规模,模型生成质量呈现出明显的递进关系:小模型在复杂结构表达上仍存在不足,而中等规模模型已能够生成语义较为完整的图像。这一现象表明,尽管小模型在效率上取得进展,但在多模态复杂任务中仍对模型规模存在一定依赖。 Willison以“骑自行车的鹈鹕”对该模型从2B到4B再到26B-A4B的测试 Willison提到,该系列模型已不仅限于文本处理,还支持图像及视频(以帧序列形式)输入与音频。其中,E2B与E4B等小参数模型已具备语音理解能力。不过,从实际开发环境来看,这些能力尚未完全落地,本地推理框架对音频等输入形式的支持仍在完善过程中。 Hugging Face在Gemma 4技术解读中指出,与以往主要依赖云端部署的超大模型不同,Gemma 4系列覆盖从2B到31B的多种参数规模,使其既可应用于数据中心,也能够运行在本地设备乃至边缘硬件上,体现出模型向“端侧可用”的发展趋势。 Gemma 4通过结构优化与机制创新,使小参数模型在保持资源消耗可控的前提下实现能力提升。以E2B、E4B为代表的小模型,不仅支持多模态输入,还通过结构优化提升参数利用效率,使其在保持较低资源消耗的同时具备较强任务能力。 五、编程、高难度推理表现,接近Qwen3.5 从Arena榜单的对比结果来看,Gemma 4在文本类任务中的整体能力较上一代实现了全面提升。无论是在写作、编程、复杂指令执行,还是多轮对话与长文本理解等场景中,其表现均明显优于Gemma 3和Gemma 2,并在多个维度接近当前开源模型的第一梯队。 具体来看,Gemma 4在“专家级文本理解”和“代码生成”等高难度任务上提升尤为显著,同时在创意写作、复杂提示处理等场景中也表现出更稳定的输出质量。这种全维度外扩的能力曲线,意味着该模型不再只在个别任务上优化,而是在通用文本能力上实现整体提升。 Gemma系列模型在Arena文本类别排名对比(图源:Arena.ai) 根据独立AI评测媒体ai.rs对Gemma 4、Qwen与Llama的对比评测分析,此次升级被认为是开源模型领域“单代提升幅度最大的一次”,其进步并非渐进式优化,而是跨越式跃升。 尤其在编程能力上,Gemma 4的Codeforces ELO评分相较上一代Gemma 3的110分(接近勉强可用水平),大幅提升至2150分(接近竞技编程专家级)。 Gemma 4编码能力测试(图源:ai.rs) ai.rs进一步指出,在高难度推理与代码生成等关键任务上,Gemma 4整体表现达到当前开源模型中的领先水平。 独立AI基准测试机构Artificial Analysis发布的GPQA Diamond排行榜显示,谷歌Gemma 4 31B模型在高难度科学推理基准上取得85.7%的准确率,位列榜单前列,与Qwen3.5 27B(85.8%)表现接近。 该基准包含198道由博士级专家编写的“防搜索”问题,涵盖生物、化学和物理领域,要求模型具备真正的研究生级科学推理能力,而非依赖外部知识检索。相比之下,人类领域专家的平均准确率约为65%。 值得注意的是,Gemma 4系列在参数效率上表现出色:其26B和31B变体在得分与参数量的对比图中落入高效象限,证明Gemma 4以相对较小的参数规模实现了高性能。 GPQA Diamond基准测试结果(柱状图)及得分与参数量关系(散点图)(图源:Artificial Analysis) 结语:从“能用”到“可部署”, 效率、成本与生态的综合较量 从此次Gemma 4的发布来看,其意义并不只在于单一指标的提升,而是性能、部署方式与授权策略的同步变化。Gemma 4一方面通过架构优化提升参数利用效率,小模型能力持续逼近中等规模模型,另一方面多模态能力与本地部署能力同步推进,在部分场景下减少对云端算力的依赖。 从更宏观的视角来看,开源大模型竞争已不再局限于性能指标,而是转向效率、成本与生态的综合较量。谁能在“好用、可部署、可扩展”之间取得平衡,谁才更有可能在下一阶段占据主导地位。
雷军发布小米“养龙虾”套餐!最高月费659元,网友:太贵了
智东西 作者 | 程茜 编辑 | 心缘 智东西4月3日消息,今日,小米科技创始人、CEO雷军宣布,小米MiMo大模型调用量超过1万亿Token,并面向全球开发者推出订阅式API调用套餐MiMo Token Plan,购买套餐的用户还可以获得新模型优先内测体验权。 雷军关于MiMo大模型的两条微博(图源:微博) Xiaomi MiMo Token Plan包含4档套餐: Lite套餐39元/月:套餐每月包含6000万Credits,可执行约120个中等~复杂任务,适合刚接触AI开发的探索者。国际开发者6美元(约合人民币41.3元)/月。 Standard套餐99元/月:套餐每月包含2亿Credits,为Lite套餐用量的3.3倍,可执行约400个中等~复杂任务,为日常依赖AI提效的办公与开发者用户打造的主力方案。国际开发者16美元(约合人民币110.1元)/月。 Pro套餐329元/月:套餐每月包含7亿Credits,为Lite套餐用量的11.7倍,可执行约1400个中等~复杂任务,面向将AI深度嵌入工作流的专业用户。国际开发者50美元(约合人民币344.1元)/月。 Max套餐659元/月:套餐每月包含16亿Credits,为Lite套餐用量的26.7倍,可执行约3200个中等~复杂任务,为全天候高强度使用的开发者准备,近乎无限制的使用体验。国际开发者100美元(约合人民币688.2元)/月。 所有套餐首次购买均享受88折优惠,仅限一次,四档套餐的优惠价格为34.32元/月、87.12元/月、289.52元/月、579.92元/月。 根据官方信息,该计费方案采用的是按token使用量换算Credits消耗量: MiMo-V2-Omni 256k上下文:1x(消耗1 Token=1 Credit) MiMo-V2-Pro 256k上下文:2x(消耗1 Token=2 Credits) MiMo-V2-Pro 256k~1M上下文:4x(消耗1 Token=4 Credits) MiMo-V2-TTS:0x(限时免费,不消耗Credit) 此外,套餐订阅中没有5小时token使用限额,开发者可以集中消耗Token,进行高强度养龙虾或编程。 该套餐支持旗舰基座大模型MiMo-V2-Pro、全模态智能体基座模型MiMo-V2-Omni、语音智能体基座模型MiMo-V2-TTS模型,兼容OpenCode、OpenClaw、Claude Code等主流开发工具链。 在全球最大API聚合平台OpenRouter上,本周,MiMo-V2-Pro的API调用量登顶,超越全球Claude、阿里千问、谷歌Gemini、MiniMax、DeepSeek、智谱等一众主流模型。 MiMo官方小红书账号和雷军的微博下方,不少网友已经开始晒订单。 有网友在微博下呼吁让小米做个App,雷军回复“去催一下”。 不少网友直呼价格太贵,便宜的套餐不够用。有用户称自己前两周使用了接近4亿Token、还有人5天使用了1.3亿Token,按照Token和Credits的比例来计算,Xiaomi MiMo Token Plan的最低档39元套餐、第二档99元套餐都不够用来“养龙虾”,并对比了腾讯的本地虾QClaw现在每天还会送免费Token。 微博网友称重度用户使用99元套餐只够2天,另一网友让小米考虑出时间更长的合约套餐,如2年合约附赠小米手机龙虾MiClaw的体验资格。 MiMo Token Plan的官方答疑帖还提到几个注意事项: 1、仅支持跨等级的套餐补差额升级,不支持套餐降级。开发者如果在套餐过期之前想获得更多额度,支持将已使用的Credits额度换算为对等金额,在此基础上补差价以升级至更高套餐,获得更多Credits。 2、暂不支持连续包月/包年支付,仅支持一次性购买,将在一周内上线自动续费功能。 3、套餐到期Credits还没用完,不支持结转。套餐到期后即停止服务,开发者需要重新订阅新套餐,且新套餐不包含旧套餐未使用完的额度。
小米旗下最强小平板!REDMI K Pad 2定档4月:天玑9500加持
快科技4月3日消息,REDMI除了在本月发布性能旗舰REDMI K90至尊版外,还将同步推出全新的REDMI K Pad 2,这款产品是小米旗下迄今为止最强悍的小尺寸平板。 目前REDMI K Pad 2已经获得入网许可,其型号为26048RP6AC。它配备了一块8.8英寸的165Hz LCD高刷屏,并搭载了联发科天玑9500旗舰平台。 在续航与快充方面,新机的表现同样出色。其电池容量突破了9000毫安时大关,并支持67W有线闪充,为长时间的高强度使用提供了有力保障。 对比上代产品,REDMI K Pad 2最大的升级点在于核心芯片。得益于天玑9500的加持,它成为了目前行业内性能最为强悍的天玑平板。 天玑9500是联发科旗下的顶级旗舰芯片,采用了极具突破性的全大核CPU架构。其中包括一颗主频最高达4.21GHz的超大核,以及三颗高性能大核与四颗大核。 该芯片还集成了矩阵运算指令集SME2。这种架构设计使得处理器在处理复杂任务和重度游戏场景时,能够爆发出的能量远超传统架构芯片。 官方数据显示,天玑9500的单核性能相较上一代提升了32%,多核性能则提升了17%。其安兔兔跑分能够轻松突破400万分,展现了极致的算力表现。 这款平板的出现,不仅填补了高性能小屏平板市场的空缺,也进一步完善了REDMI的性能产品线。无论是日常娱乐还是极致游戏,它都能提供目前行业顶尖的流畅体验。
苹果,Vibe Coding 最严厉的父亲
Anything 的联合创始人 Dhruv Amin 最近接到了一个他最不想接到的通知。 苹果把他们的应用,整个从 App Store 下架了。 理由是违反了 App Store 审核指南的 2.5.2 条款。这条规定的原文说,App 应自包含在自己的套装中,不得在指定容器范围外读取或写入数据,也不得下载、安装或执行会引入或更改 App 特性或功能的代码,包括其他 App。例外情形仅限于极少数教育类场景,前提还是源码可见且可编辑。 Anything 是一款支持 Vibe Coding 的工具。去年 8 月,Anything 先在网页端上线。11 月推出 iPhone 版,苹果审核团队顺利放行,没有任何问题。 此后,他们成功更新了几次,一直到去年 12 月中旬,苹果开始拒绝他们的更新提交,理由还是 Guideline 2.5.2。而就在刚刚,Anything 官方账号也发了一条推文,语气调侃但扎心: 「突发新闻:苹果公司对 Vibe Coding 感到恐慌,把 Anything 从 App Store 下架了,所以我们把应用开发转移到了 iMessage。」 这一来一往,也把这场平台规则冲突,写成了一封发给所有 Vibe Coding 开发者的公开信。 Vibe Coding 撞上了 App Store 的那堵墙 要想搞懂这场下架风波,得先弄明白苹果的 Guideline 2.5.2 到底在管什么,为什么 Anything 会触线。 打个比方,你去餐厅点了一份套餐,服务员端上来的,必须是厨房审核过的那份菜。不能上桌之后厨师再跑过来往盘子里加东西,更不能让客人自己拿着食材现场改造。 App Store 也不例外,苹果的审核团队在某个时间点检查了你的应用,确认它安全、合规、功能符合规定,然后放行。从这一刻起,用户下载到的那个 App,必须和审核通过的那个 App,是同一个东西。 这条规则长期以来针对的,是那些用「热更新」走后门的开发者——应用上架后,偷偷往里塞新代码,绕过审核直接推送给用户。苹果一直明令禁止这种行为,因为一旦放行,审核制度就形同虚设了。 而现在,Vibe Coding 工具撞上的,是同一堵墙。 以 Anything 为代表的 Vibe Coding 工具让用户在 iPhone 上用自然语言描述需求,AI 实时生成代码,直接在设备上运行和预览。用户每次描述一个新需求,就有一段新代码被生成出来并在设备内执行。 从苹果的角度看,这和「热更新」在结构上难以区分。审核通过的是那个 Anything 的壳,但壳里实际运行的代码,每次用户用它,都在动态变化,苹果根本没看过那些代码,也没有机会审核。 今年初,外媒 The Information 报道了苹果对一批 Vibe Coding 应用冻结更新的事件之后,Anything 尝试做了一个妥协版本,把代码预览从 App 内部改到网页浏览器里。 但苹果仍然没有放行,直接把整个应用下架了。 这说明苹果的判断,或许不只是某个具体功能有问题,而是认为这类产品的运行逻辑本身,就和 App Store 的审查模型存在根本冲突。即使代码预览发生在网页里,只要 Anything 这个 App 还在充当「生成并分发动态代码」的入口,苹果就认为它超出了审核范围。 受影响的应用也不只是 Anything。苹果从去年 12 月左右开始阻止一批 AI 编码应用的更新,Replit 的 iPhone 版上次更新停在了今年一月,Bitrig 停在了去年十一月。还有一些团队,比如 Vibecode,索性放弃了移动端,转头去做纯 Web 产品。 浪够大,闸门只有那么宽 要理解苹果为什么突然这么紧张,还得先看清楚 Vibe Coding 到底掀起了多大的浪。 2008 年 3 月 6 日,苹果免费开放 iPhone SDK,三个月下载量破 25 万。同年 7 月,App Store 伴随 iPhone 3G 上线,500 个应用,第一个周末下载量破百万,到 2009 年初突破 10 亿次。 工具门槛的持续下降,让移动开发迎来了第一次大爆发。十八年后,同样的事情再次发生了。 此次的导火索,与 Andrej Karpathy 在 2025 年 2 月发的一条帖子相互映照。 这位 OpenAI 联合创始人、前特斯拉 AI 总监,在帖子里半开玩笑地描述了自己写代码时的状态,完全沉浸在氛围里,看到界面效果就给指令,根本不深究代码细节,「几乎忘记代码存在」。 他把这种状态叫做 Vibe Coding。 至此,Vibe Coding 就在 AI 编程圈获得一席之地,Node.js 之父 Ryan Dahl 更是直言人类手写代码的时代结束了。Linus 之父 Linus Torvalds 在 GitHub 上发布的新项目 AudioNoise,在自述文件里也明说这个 Python 可视化工具基本上是用 Vibe Coding 方式写出来的。 与 Vibe Coding 一脉相承的,是「智能体编码」(Agentic Coding)。 2025 年推出的 Claude Sonnet 4 和 GPT-5-Codex,被视为首批真正实用的智能体模型,AI 可以像工程师一样理解整个项目,自主完成测试、调试、循环迭代,直到功能跑通。开发者从此只需要下指令和把关。 门槛的再次下降,直接冲击了 App Store 应用的提交量。 a16z 统计,2025 年全年新上架应用同比增幅 24%,12 月单月同比增长 56%,2026 年 1 月继续以 54.8% 的增速跟上,这是过去四年里的最高纪录。全年新应用提交量约 557000 个。 此前三年,这个数字几乎变化不大。当然,这些新增应用里有多少是借助 Vibe Coding 完成的,目前没有准确数字;但时间节点上的强相关,已经足够说明问题。 只是,浪潮够大,苹果的闸门只有那么宽。 据 The Bussiness Insider 报道,美国程序员 James Steinberg 曾向 App Store 提交了自己靠 AI 做的应用,然后等了整整六周,还没上线。更新也是,每次提交要等两天到一周不等。 「现在最慢的环节已经不是做应用,不是推广,而是 App Store 的审核,挺离谱的。」他说。 James Steinberg 并不是个例。iOS 编程社区的 Reddit 版块里,一堆开发者在抱怨审核时间变长了。有人开始担心苹果会进一步收紧审核标准,专门针对 Vibe Coding 应用和 AI 生成的「垃圾内容」。 对此,苹果给出的官方数据是,过去 12 周每周处理超过 20 万份提交,平均审核时间 1.5 天,90% 的提交在 48 小时内完成。 值得一提的是,苹果自己也在 Vibe Coding 这件事上押了重注。 今年 2 月推出的 Xcode 26.3,直接让 Claude Agent 和 OpenAI Codex 进了 Xcode,用来搜索文档、查看文件结构、更新项目设置、验证预览、自动迭代构建。 因此,苹果并不反对「AI 帮你写代码」,它反对的是「用户通过第三方 App 在商店审核之外生成并执行新代码」。 这是平台控制权问题,不是技术立场问题。苹果希望 AI 编码发生在自己的开发轨道里,开发者用 Xcode,走苹果的工具链,接受苹果的审核逻辑:先写好、再审核、再上架,顺序不能乱。 当心 Vibe Coding 的烂摊子 说句公道话,苹果的收紧并非毫无缘由。 举个简单例子,去年 Sora APP 发布之后,App Store 就冒出了一大批山寨 Sora 应用,有的在图标里直接盗用 OpenAI 的官方标志,有的在副标题里挂上「Veo 3」蹭热度,全部指向一个目的,骗用户开高额订阅。 科技博客 Daring Fireball 记录了其中一款名叫「Sora 2: AI Video Generator」的应用,不仅顺利上架,还一度冲上照片与视频应用热门榜第 9 位。 不知情的用户,很容易把它当成正版。 于是,我们看到苹果在去年 11 月修订审核指南,在第 4.1 节「抄袭」里明确写道,「请拿出你自己的想法。我们知道你有自己的奇思妙想,那么请将它们付诸实际。请不要简单照搬 App Store 上的热门 App,或只是细微修改其他 App 的名称或 UI,就将其挪为己用。」 更重要的是,Vibe Coding 的烂摊子,也是真实的。 Karpathy 自己都笑着说,他做项目的时候不再深入理解代码,只是让它能用。这种「能跑就行」的开发哲学,在原型阶段极其高效,在产品后期可能是灾难。 AI 生成的代码往往缺乏边界检查和错误处理,碰到异常输入就崩。数据库索引、算法复杂度这些优化,模型不会主动去想,随着用户增长,性能瓶颈很快出现。 遇到要改功能的时候,开发者发现自己看不懂代码,只能继续用 AI 打补丁,补丁摞补丁,最后变成一座没人敢碰的屎山。当年初为了抢上线快速用 AI 写的代码,可能在年末变成团队的噩梦,为了一个改动牵一发动全身。 Reddit 上甚至出现了一群人,自称「AI 考古学家」。 他们的日常是被那些因为 Vibe Coding 导致系统崩溃的公司雇来,专门替 AI 收烂摊子,给客户返工、补救、兜底,在几百万行 AI 生成的乱码中,找那个因为模型幻觉产生的致命 bug。 讽刺的是,用 AI 省下来的钱,好多公司以另一种方式花回去了,甚至更多。 这些烂摊子,也是苹果收紧审核的隐性理由之一。但无论苹果怎么围堵,软件开发平民化的趋势已经不可逆转。Anything 被下架,只是一个创业公司和平台规则之间的摩擦。 而 Vibe Coding 带来的是整个软件生产关系的重构。OpenAI CEO 奥特曼曾和朋友打赌,第一家由单个人建立、达到十亿美元规模的公司,会出现在哪一年。 现在看来,那个时代已经呼之欲出了。在「1 个创始人 + 1 个 AI 智能体 = 1 个百万美元级 App」的行业共识下,App Store 也无法阻挡太久。 这是最好的时代,也是最坏的时代。狄更斯的名句写在 2026 年 App Store 的审核闸门之上,竟意外地贴切。
微软 Copilot,像个乱贴小广告的街溜子
绝了,真的绝了。 微软旗下的 AI 助手 Copilot,开始自作主张,在开源代码仓库里加广告了…… 上周,澳大利亚开发者 Zach Manson 发现,自己在 GitHub 上提交的代码合并请求 (PR) 里面,不知道为什么被插入了一段广告。 一番调查后他发现,又是 Copilot 整的烂活: 首先,这个 PR 是 Manson 自己提交的;公司有个同事,发现有个错别字,于是用 Copilot 改了一下。 结果,Copilot 在 PR 的最下方加了一行广告: ⚡️在 macOS 或 Windows 上快速启动 Copilot 编程智能体,就用 Raycast! 更别提这广告里甚至还加上了链接…… 「这太可怕了。我知道自己迟早会遇到这种蠢事,但没想到会这么快。」他写到。 Raycast 是一款 macOS 和 Windows 上的多功能启动器,确实挺好用,被很多效率用户喜爱。但是在跟 Raycast 完全没关系的用户代码库里,加上这种毫无来由的广告,未免也太离谱了。 Raycast 的联合创始人兼 CEO Thomas Paul Mann 事后表示对此不知情,也否认了做过此种形式的投放(这压根就不是一种合理的投放形式……) CEO 也分享了更多背后的细节: 事情的经过是这样的:GitHub 团队的某位成员,在 Copilot 提交的 PR 中加入了对 Raycast 的提及,纯粹因为他们使用并且喜欢我们的产品。 这些提及,最初只会出现在 Copilot 创建的 PR 上,旨在为开发者提供帮助。但由于某个 bug,当有人 @Copilot 让它做修改的时候,这些提及(也就是这次的广告)会出现在人为创建的 PR 中。 GitHub 已经修复了这个问题,我相信这并非出于恶意,只是一系列不幸的事件造成的巧合。 Copilot 为什么选中了 Raycast 呢?事情还要从去年说起。 大家知道 GitHub 早就被微软收购了。去年 8 月,GitHub 跟 Raycast 合作推出官方集成,让用户可以直接在启动器里来管理 Copilot 代码任务。 换句话说,Raycast 出现在这个广告里可能不是随机的。这个事儿说大了,相当于微软的官方合作伙伴的广告被 Copilot 强行插进了第三方的 GitHub 代码库里。 以为事情到了这里就完了? 并没有。用这段广告的关键词去 GitHub 上搜了一下:同样的文字,出现在超过 1.1 万个 PR 当中,分布在数千个不同的代码仓库里。 而打开这些 PR 的原始 markdown 文件,会看到广告前面有一段隐藏的 HTML 注释,内容是「START COPILOT CODING AGENT TIPS」。 这只可能是预设好的模板/功能,不可能是 AI 随机生成的。 除了 Raycast 之外,数以万计的 PR 里还能看到其它产品的广告,包括并不限于 Slack、微软 Teams、JetBrains、VSCode、Visual Studio 等等…… 这些产品/工具,要么是微软自己开发的,要么是跟 Raycast 类似,和 Copilot 有深度合作的产品。 Copilot 搞的这些骚操作,再一次挑战了人们对于「AI 泔水」的底线。 舆论爆发之后,GitHub 当天就关掉了这个功能。产品经理 Tim Rogers 发帖谢罪,在用户不知情的前提下,让 Copilot 修改真人用户提交的 PR,是一个「错误的决定」。 GitHub 开发者关系副总裁 Martin Woodward 也出面承认,这个「产品提示」功能确实很烦人。 但 APPSO 觉得话还是要讲清楚:这哪儿是什么提示啊,不就是广告吗?不就是「泔水」吗? Copilot 搞砸了多少次了? 平心而论,这次 GitHub PR 广告事件,本身造成的损失的确有限。 但它之所以能引起如此之大的反感,是因为:人们早已经受够 Copilot 和它整的这些烂活了。 Copilot 胡乱生图 微软有个网站叫做「Windows 学习中心」,里面有大量的 Win 11 功能推广博客,以及很多关于如何使用 Windows 操作系统的教学文章。过去,这些文章基本都还是人工编辑的,配图也是人找的。 但是就在最近,微软不知道哪根弦没搭对,开始用 Copilot 生成配图了:有篇文章里有这样一张图,讲的是 Win 11 的小组件功能,下面配文写着「AI Art Created via Copilot」。 问题是,这张图完全不对。真实的 Windows 小组件,根本不长这个样子(见下图)。 一家市值万亿美元的公司,还能租不起影棚,请不起摄影师和模特?微软肯定不是不愿意花这笔钱的。但是营销团队里有个大聪明,决定用尽一切手段来推广 Copilot,连配图都没放过,谁也拦不住—— 结果,就是生成这种幻觉图片,却被官方当做使用教程。但凡真有用户看了这篇文章,发现怎么也找不到对应的功能,微软这不是搬起石头砸自己脚吗? Copilot 跟 Window 不熟 去年,微软跟 YouTuber UrAvgConsumer 合作了一条商单视频,里面演示了 Copilot 如何帮助用户完成一些日常操作。博主问,「我想调大文字」,Copilot 说「我们可以调整屏幕的缩放比例」,博主追问「那么应该调到多少?」Copilot 说:「我们可以先从 150% 开始。」 问题是,Windows 系统默认的缩放比例就是 150%,Copilot 这属于完全无效的信息。 在视频中我们可以看到,博主直接手选了 200%,然后这段就过去了…… 然而问题还不止于此:对于「调整文字大小」的用户意图,Copilot 其实不应该调整屏幕缩放比例,因为这么干不只会调大文字,还会让所有 UI 元素都一起变大。 更何况,Windows 操作系统是有专门的文字大小调节的…… 微软官方账号把这条视频发到了 X 上,结果下面网友直接给写了个社区通知:Copilot 的建议是错的。 Copilot:加密?什么是加密? APPSO 之前的 AIPC 文章曾经提过,在 2024 年 Copilot 刚进入 Windows 系统成为核心 AI 功能的时候,微软曾经整过一个大烂活:把用户的隐私数据明文存储。 当时,微软给 Copilot+ PC 推出的核心功能叫做记忆召回 (Recall),大概的实现方法,就是在用户使用电脑的时候,每隔几秒在后台截个屏,保存起来并用 Copilot 进行分析,这样用户回头问 Copilot「我上周在某个网页看到过什么什么」之类的问题,它能答上来。 但是在这个功能推出后,有开发者发现,所有的截图都存在一个完全没有加密的明文数据库里,而且没有做任何的信息脱敏。比方说用户访问过银行账户页面、或者在输入密码的时候点了「显示密码」,这些隐私内容只要在屏幕上出现过,就都会原封不动的保存起来。 而任何能使用这台电脑(本地或者远程),知道这个文件夹存放位置的人,都可以直接读取这些私密资料。 这个事情曝光出来,直接导致微软被迫下线了 Recall 功能,花了一年时间重做安全机制。直到最后,这个功能又上线了,但是改成默认关闭。 这倒是安全了,但微软在 AI PC 时代的第一个重大功能,就这么草草收场,真是不要太讽刺。 假若 Copilot 从未来过,该有多好? 上述这些情况,都还可以算是孤立事件。 然而自打小冰/小娜 (Cortana) 退役以来,微软把所有的 AI 对话/助手/智能体之类的功能,全都囊括在 Copilot 这一个包装之下,开足马力营销。 而 Copilot 犯下的错误又这么多,孤立的事件连在一起,勾勒出来的画面,就能看出一以贯之的逻辑,也怪不得人看不起它了。 今天的微软 Copilot,越来越像早年的 Facebook:Move fast, break things. 然而问题是,聚焦全部放在了「动作快」上,一路打破了各种各样的体验,也打破了用户的信任。 回到一开头的 PR 广告,发现它的开发者 Zach Manson 在自己的博客里引用了一段科幻作家 Cory Doctorow 的话: 一个平台的死亡过程通常是这样的:一开始,它们对用户挺好的;然后,它们为了商业客户的利益开始恶心普通用户;最后,他们为了自己的利益,甚至连商业客户都敢坑。最后,他们走向衰亡。 这话放在微软身上,可能有点重了。毕竟,Copilot 的笑话一天接一个,大家吃瓜看热闹都来不及呢。 但这次塞的是 Raycast 的广告,下次会在你的 PR,甚至你的代码库里塞些什么东西,你知道吗? 大公司的泔水,我真是一口都咽不下了。
首款“龙虾”戒指,来了!2000元一枚
主打“言出法随”,瞄准AI Agent交互最短路径。 作者 | 云鹏 编辑 | 心缘 AI眼镜的旺火还没烧透,AI戒指俨然已成为下一个巨头和创企们瞄准的领域。 三星早在2024年就已经发布了首款AI戒指,定位健康监测,但表现平平,未能激起浪花。近日,曾获得朱啸虎投资青睐的年轻创企Gyges Labs发布了一款AI戒指,名为Vocci Ring,只不过其定位并非健康,而是“笔记”。 新品发布之际,智东西与少数业内媒体同Gyges Labs联合创始人兼CEO贾捷阳以及公司联合创始人兼COO邓旭东进行了面对面深入交流,他们分享了产品背后的行业思考,我们也在现场看到了这款产品的原型机。 ▲Vocci Ring 在交流中,贾捷阳进行了现场演示:“把刚才会议的内容总结成6页PPT,发到我的邮箱。”此时他的手机还在口袋里,也没有看到他的双手有任何动作,大概两三分钟后,他的邮箱里收到了一封邮件,里面是按要求做好的PPT。 上述这一功能和体验的实现,就是靠贾捷阳手上佩戴的AI笔记戒指——Vocci Ring实现的,定位AI笔记的戒指,目前市面上确实难寻同类产品。 简单来说,相当于把“龙虾(OpenClaw)”装在了戒指里,直接跟戒指交流就能让背后的龙虾干活。贾捷阳提到,Gyges Labs的确自研了类龙虾Agent。 虽然现场没有开放功能体验,但从佩戴体验上来看,这款产品是较为轻便的,整体做工质感还不错,直径有不同的规格,可以选择合适的尺寸佩戴,外观有一定的时尚感。 ▲Vocci Ring 这枚戒指的目标定位是“AI Agent交互最短路径”,双击可激活录音,单击标记关键内容,基于AI算法可自动整理结构化笔记与摘要,交互主要基于自然语言。 目前,Vocci Ring已经支持了112多种语言转写,支持8小时单机录音、5米范围收音,机身为航天级钛合金材质。 Gyges Labs此前曾联合发布带有“近眼显示”功能的AI眼镜Halliday Glasses,其主攻的领域是AI穿戴。据悉,Vocci Ring预计在3月底开启全球预售,官方指导价为299美元(约合人民币2065元)。 01. 做AI Agent交互 戒指的形态为何会比手机PC更优? 当前,以OpenClaw为代表的各类AI Agent在个人、企业等场景的应用,这给智能穿戴产品领域是否带来了一些新的变化或者说机遇? 对此,贾捷阳认为,AI Agent完成了用户教育,带来了“言出法随”的交互体验。可穿戴设备是人机AI联动核心入口,可解放人力、放大个人能力。未来这种设备将把人作为关键节点接入集体智能,会在企业和个人端产生深远影响。 在Gyges Labs看来,当前专业人群面临“想法与执行断层”困境,在闲聊、头脑风暴、展会交流中,会有大量“灵光一现”的创意和各种需要立刻落地的指令。 人们需要打断正在进行的对话、掏出手机,或打开电脑、唤醒应用、逐字输入指令,操作繁琐,尤其在商务闲聊、展会拜访等不便掏手机的正式场合,关键指令和想法都无法执行。 当前市面上的对话式AI Agent与配套工具,或需要全程在屏幕前手动操作,无法实现全场景无感调用,或只能完成碎片化的文本输出,无法实现跨软件、跨设备执行。 贾捷阳说,“人类的职场效率从来不是靠转录文本堆砌出来的,我们真正需要的,是说出想法的瞬间,就能推动事情落地的执行能力。”这是Gyges Labs团队打造Vocci Ring,希望其成为AI agent交互的最短路径的核心出发点。 02. 自研类龙虾Agent,实现“言出法随” 死磕安全性实现非军工产品最高标准 Vocci Ring到底能做什么?一句话总结,就是你无需看屏幕、无需掏手机、无需打断当下的对话与动作,就能把随口说出的想法,立刻转化为电脑端的执行动作与成果输出。 Vocci Ring已经接入Gyges Labs自研的类龙虾Agent,用户只需通过戒指语音输入指令,即可直接唤醒并指挥AI Agent,由Agent操控电脑完成操作与成果输出,贾捷阳称这种体验为“言出法随”。 在可控性上,Vocci Ring没有采用当下多数AI穿戴设备“始终监听”的逻辑,把控制权交给用户,双击戒指按钮可以启动/结束录音,听到精彩内容时单击可标记高光时刻,AI会重点提取该片段的专属洞察。 用户长按可留下语音备忘录,或是向AI agent下达直接指令,全程通过触觉震动与LED获得反馈,AI会基于用户的标记自主学习。 Vocci Ring的收音范围有5米,用户不需要可以凑近说话,使用时可以完全融入日常,避免社交尴尬。 可靠性方面,其采用航天级钛合金锻造机身,防水、低致敏,支持24小时佩戴;内置存储与电池可支撑8小时单机录音,无需连接手机也能正常工作。 贾捷阳分享道,为了支撑长达8小时连续录音的高规格组件,Vocci Ring内部主板的元器件密度比传统戒指高出许多。凭借自有的产线和可靠性实验室,经过大量柔性板弯折调试,逐步拉升良率,实现核心性能指标。 软件层面,其支持112种以上的语言转写与电影剧本式说话人识别,AI能将对话拆解为洞察,自动生成待办事项、日历日程、可交付文件。 据了解,其基础语音转写采用行业头部商用服务,转录准确率高于行业平均水准;生成式AI能力采用多Agent架构,搭配多个不同外部大模型处理对应场景。 安全性方面,Gyges Labs联合创始人兼CTO吕正提到,离开了安全性,则便利性毫无意义,他们很大一部分开发精力都放在了提高安全性方面。 目前,Vocci Ring正在通过四项国际安全认证,这是非军工产品在数据安全上的极限保证,实现消费电子行业最高标准的数据安全。同时其推行的自研AI Agent架构也将安全性放在了最高优先级,目标是在保持类Claw系统灵活度的同时实现企业级的安全部署。 目标市场方面,与很多新兴AI硬件一样,Vocci Ring发布后首先会主推欧美(尤其是美国)市场。欧美有开放的软件工作流生态,各应用间接口丰富,且当地职场对效率工具有旺盛的付费需求和使用习惯,更利于产品落地。 03. CES首秀引起广泛关注 首批用户测试反馈良好 未来或与眼镜有生态联动 实际上,Vocci Ring虽然是新品,但并非首次亮相,今年CES2026期间,Gyges Labs就将其带到了展会上,首次亮相,就斩获4项行业大奖,据称不少现场体验的记者、KOL在官方拜访结束后,再次折返展台,询问能否直接现金购买。 邓旭东提到,目前产品正在紧锣密鼓进行用户测试,全球已有数十位用户拿到了我们的测试版产品,用户的反馈非常好,他们希望正式发售时可以让用户在拿到产品的第一时间就能实现完善的用户体验。 对于Halliday眼镜产品是否会与Vocci Ring有所联动,贾捷阳提到,目前两者分属独立品牌和运营公司,暂无直接的功能协同。现阶段的战略重心是让Vocci自身的软硬件生态站稳脚跟,完成自身市场落地。待戒指业务成熟后,不排除探索不同终端间生态联动的可能。 04. 结语:AI戒指能成为下一个AI眼镜吗? 去年12月,Gyges Labs完成了Granite Asia、璀璨资本相关轮次融资,据了解,目前新一轮融资正在推进,很快将有官方消息。 此次AI笔记戒指的发布,是其在AI穿戴设备领域的一次重要布局,其在硬件研发、软件AI应用开发、自有产线及实验室、全球化等方面的能力是其核心优势。 在“龙虾”火爆的今天,AI交互正在发生深刻变革,从传统的文本问答,到如今一句话搞定复杂任务,在AI Agent时代,AI戒指或许会迸发出更旺盛的生命力。
六大厂商仅华为苹果没涨价:安卓阵营全都涨了 内存成本扛不住
快科技4月3日消息,自今年3月起,多家手机品牌纷纷宣布上调产品价格。截至目前,在中国市场份额前六大的品牌中,苹果与华为成为唯二尚未跟进涨价的厂商,而安卓阵营品牌已悉数进入涨价轨道。 苹果作为全球顶级的采购商,拥有极强的供应链议价权,并通过长期锁价协议有效对冲了价格波动。凭借高端定位带来的高毛利以及丰富的生态收入,苹果有足够的空间消化内存上涨带来的成本压力。 华为则是目前唯一维持原价的国产头部品牌,这主要得益于其深度绑定的国产供应链体系,以及对部分核心元器件自主可控的掌握。 据行业消息,华为由于提前囤积了大量内存资源,暂时缓解了成本端的燃眉之急。在安卓友商纷纷提价之际,华为维持价格稳定,这不仅增强了其市场竞争力,也为迅速吸引新用户提供了契机。 通过这种价格策略,华为能够推动鸿蒙生态持续壮大,以用户规模的优势抵消单机利润的波动,从而在激烈的市场竞争中占据主动权。 值得注意的是,这一轮内存涨价潮短期内并不会平息。根据市场机构CounterPoint Research的调研报告,当前全球内存市场的供应短缺问题十分严峻,预计这种趋势将持续较长时间。 该机构表示,内存市场的供应缺口至少要到2027年下半年才能得到实质性解决。这意味着在未来一年内,手机行业的成本挑战将是一个常态化的过程。 对于各大手机品牌而言,供应链管理水平将直接决定其未来的生存空间。而对于消费者来说,低价购入高性能旗舰机的时代正逐渐远去,市场的价格门槛正在被实质性拉高。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。