行业分类:
加载中...
头条分类:
加载中...
美欧裂痕加深,特朗普要用科技霸权对付盟友?
荷兰海牙的国际刑事法院 凤凰网科技讯 北京时间6月21日,据《纽约时报》报道,今年2月,当美国总统特朗普签署行政令,因为调查以色列战争罪行制裁国际刑事法院(ICC)首席检察官时,软件巨头微软公司一下子卷入了一场地缘政治冲突中。 多年来,微软一直在为国际刑事法院提供包括电子邮件在内的数字服务。该法院位于荷兰海牙,负责调查和起诉侵犯人权等其他引发国际关注的罪行。然而,特朗普的行政令突然打乱了这种合作关系,因为该命令禁止美国公司向检察官卡里姆·汗(Karim Khan)提供服务。 不久后,微软协助关闭了卡里姆·汗在国际刑事法院的电子邮件账户,使他无法与同事进行联系。就在几个月前,国际刑事法院才因以色列在加沙的行动,对该国总理内塔尼亚胡发出逮捕令。 欧洲震惊 微软迅速遵守特朗普行政令的举动,令欧洲各国政策制定者震惊。这给欧洲敲响了警钟,因为这个问题远不止一个电子邮件账户那么简单,它引发了欧洲的担忧:特朗普政府可能会借助美国在科技领域的主导地位,惩罚反对者,即便像荷兰这样的盟友国家也是如此。 “国际刑事法院的遭遇说明,这种事真的会发生,”荷兰国防部前网络安全主管、现任欧洲议会议员巴特·赫鲁特赫伊斯(Bart Groothuis)表示,“这不再是幻想。” 赫鲁特赫伊斯曾经支持美国科技公司,但他说自己现在的立场已经发生“180度转变”。“我们必须站在欧洲的立场上采取更多行动,捍卫我们的主权。”他表示。 据三位知情人士透露,国际刑事法院的一部分人目前已开始使用瑞士公司Proton提供的加密电子邮件服务。 微软冻结了卡里姆·汗的邮件账户 微软表示,冻结卡里姆·汗电子邮件账户的决定是与国际刑事法院协商后作出的。该公司还表示,在该事件发生之前,公司就已在筹划政策调整,现在已实施以便今后在类似地缘政治情况下更好地保护客户。微软补充称,本月,特朗普政府又对四名国际刑事法院法官实施制裁,但这些人的账户并未被停用。 微软总裁布拉德·史密斯(Brad Smith)表示,这起事件所引发的担忧只是美欧之间“更大信任裂痕的一个表现”。“国际刑事法院的问题只不过是火上浇油。”史密斯称。 目前,卡里姆·汗正因不当性行为接受调查,自上个月起已被暂停职务。他否认了指控。 国际刑事法院发言人表示,法院正在采取措施“降低可能影响法院工作人员的风险”,并“采取广泛行动,确保在面临制裁的情况下所有相关业务和服务能够持续运作”。 科技争执雪上加霜 这起事件在整个欧洲引发了警觉,从中可以看出欧洲各国政府、企业和人民在关键数字基础设施方面对微软等美国科技公司的依赖程度之深,以及想要摆脱这种依赖有多么困难。欧洲担心,特朗普可能会利用科技霸权来获取政治优势,促使该地区加快了开发替代方案的步伐。 曾任丹麦外交官及欧盟外交官、并在微软工作过的卡斯珀·克林厄(Casper Klynge)表示,从很多方面来说,这起事件正是“许多欧洲人一直在寻找的确凿证据”。也就是证明美国可能滥用科技霸权的证据。 “如果美国政府要针对某些组织、国家或个人采取行动,美国公司可能就必须配合,这令人担忧,”现任职于一家网络安全公司的克林厄表示,“这已经产生了深远影响。” 科技领域的争议,导致美欧在贸易、关税以及乌克兰战争等问题上本就日益紧张的关系愈发对立。特朗普与美国副总统万斯曾批评欧洲对美国科技公司的监管方式,而美国官员则已将数字监管和纳税纳入正在进行的贸易谈判中。 欧洲监管机构则表示,他们需要有能力在本国监管大型数字平台,而不必担心会遭受外国政府的政治施压或报复。 “如果我们不在欧洲内部建立足够的能力,那么我们将无法再做出政治决策。”欧洲议会议员亚历山德拉·盖泽(Alexandra Geese)表示。 自2013年斯诺登曝光美国“棱镜”监听丑闻以来,欧洲人一直在努力减少对美国科技的依赖。欧洲立法者与监管机构将苹果、Meta、谷歌等企业视为打击目标,批评它们存在反竞争商业行为、侵犯隐私的服务,以及散布虚假信息和其他具有分裂性的内容。 然而,由于缺乏可行的替代方案,欧洲各国机构仍不得不依赖美国的数字服务。根据研究公司Synergy Research Group的数据,亚马逊、谷歌、微软等美国公司控制了欧洲超过70%的云计算市场,而云计算正是储存文件、检索数据和运行各类程序的必要方式。 微软CEO纳德拉 据一位不愿透露姓名的国际刑事法院律师称,国际刑事法院长期以来一直是微软的客户。微软为该法院提供Office办公软件套件、证据分析与文件存储软件等服务。微软还向该法院提供了网络安全软件,以帮助其抵御来自俄罗斯等对手的网络攻击。 今年2月,在特朗普对卡里姆·汗实施制裁后,微软与国际刑事法院官员会面,商讨如何应对。他们最终决定,微软对法院的整体服务可以继续,但卡里姆·汗的电子邮件账号应被冻结。据一位与他有通信往来的人士透露,他随后将通信转移至另一个电子邮箱账户。 专门研究制裁合规问题的律师萨拉·伊丽莎白·迪尔(Sara Elizabeth Dill)表示,特朗普政府越来越多地利用制裁和行政命令来打击国际机构、大学以及其他组织,迫使企业在合规方面做出艰难选择。 “这简直是一片泥潭,把这些公司置于极为困难的境地。”迪尔表示。她还指出,全球化科技公司如何应对尤其重要,“因为人们和各种组织最担心的正是它所产生的广泛而又深远的影响”。 寻找替代服务 微软与其他美国公司一直试图安抚欧洲客户。周一,微软CEO萨蒂亚·纳德拉(Satya Nadella)访问荷兰,并宣布为欧洲机构推出新的“主权解决方案”,其中包括在“地缘政治动荡时期”提供法律和数据安全保护。亚马逊与谷歌也已宣布了面向欧洲客户的相关政策。 尽管如此,许多机构仍在寻求替代方案。荷兰内政部数字化事务国务秘书埃迪·范·马鲁姆(Eddie van Marum)在一份声明中表示,“数字自主与主权议题已引起中央政府的高度重视”。他说,荷兰正与欧洲服务商合作,开发新的解决方案。 在丹麦,数字事务部正在测试可替代微软Office的工具。在德国,北部的石勒苏益格-荷尔斯泰因州也在采取措施,减少对微软产品的依赖。 在欧盟,官员们已宣布计划投资数十亿欧元,用于建设新的AI数据中心和云计算基础设施,以减少对美国公司的依赖。荷兰籍欧洲议会议员赫鲁特赫伊斯表示,欧盟立法者正在讨论政策调整,以鼓励各国政府优先采购来自欧盟本土公司的科技服务。 “目前的局面难以为继,我们看到欧洲各国政府正大力推动提高独立性和韧性。”Proton CEO严育铨(Andy Yen)表示。 这也让欧洲科技公司看到了从美国竞争对手那里夺取客户的机会。荷兰云服务提供商Intermax集团和瑞士Exoscale公司表示,他们在近期获得了大量新业务。 “几年前,大家还在说,他们(美国科技公司)是我们值得信赖的伙伴。”Intermax CEO卢多·巴乌(Ludo Baauw)表示,“但现在已经发生了根本性变化。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
从AI潜在牺牲品到赢家,谷歌如何在ChatGPT冲击下逆袭?
谷歌 凤凰网科技讯 北京时间11月24日,《商业内幕》发文称,ChatGPT的横空出世“惊醒”了谷歌,促使这家搜索巨头完成了一次重大转型。过去三年,谷歌一直在重塑自身,充分发挥相对于竞争对手拥有的优势。 2016年,桑达尔·皮查伊(Sundar Pichai)在出任谷歌CEO后写给股东的首封公开信中就宣布,谷歌将迈向“AI优先”的时代。然而,2022年末,名不见经传的OpenAI动摇了谷歌的根基。ChatGPT的横空出世打了这家长期自视为AI领导者的搜索巨头一个措手不及。 此后三年,谷歌迅速采取行动以扭转局势,对内重塑了关键业务部门,并积极推动生成式AI融入其核心产品。 本月,谷歌发布的最新AI模型Gemini 3备受好评。关键是,Gemini 3从第一天起就整合进了谷歌最核心的业务:搜索。此举强烈表明,经过三年的蛰伏,公司终于把各项工作安排妥当。 Gemini 3 Gemini 3的发布为谷歌带来了一个久违的胜利:多年来,谷歌首次在AI开发竞赛中确立明显领先地位。它的成功对OpenAI、Anthropic及其他争夺AI主导地位的创业构成了重大挑战。Gemini 3在十几个涵盖多个智能类别的基准测试中表现优异。 “他们是AI领域的赢家,这一点相当明确。眼下,我对他们的战略布局充满信心。”股票研究公司MoffettNathanson的分析师迈克尔·纳坦松(Michael Nathanson)表示。 自我颠覆 其实,在ChatGPT发布时,谷歌AI研究实验室DeepMind已在研发大语言模型,只是高层担心聊天机器人容易出现偏见或错误不愿公开发布。然而,内部人士称,谷歌高层的一个误判在于,用户对ChatGPT的缺点基本上并不在意。 为了应对ChatGPT,DeepMind团队紧急开发了一个名为Sparrow的聊天机器人。据参与该项目的人士透露,Sparrow将比ChatGPT拥有更多的安全防护措施。然而,当谷歌将DeepMind与其内部AI实验室谷歌大脑合并后,这个项目很快被终止,公司随后将所有精力集中在Gemini上。 据谷歌员工透露,皮查伊与高管团队通过打破内部壁垒、精简领导架构、整合模型研发等一系列举措,全力重塑公司AI发展战略。 皮查伊 与此同时,谷歌联合创始人谢尔盖·布林(Sergey Brin)更是重返日常管理岗位,亲自督导AI研发进程。 谷歌还在内部推动将生成式AI融入其所有最关键的产品,包括搜索、YouTube和Android。 在今年5月的年度开发者大会上,谷歌发布了一系列先进的AI产品,并推出经典搜索引擎的升级版:AI模式,以聊天机器人风格回答搜索查询。纳坦松表示,这让部分投资者对公司复苏重拾信心,但其股价在今夏仍然低迷。 “华尔街当时还在争论:谷歌是否会沦为AI时代的牺牲品。”他坦言。 成果显著 过去三年来,谷歌的自我颠覆看似举重若轻。这家公司刚刚首次交出了单季千亿美元的营收答卷,长期位于亚马逊与微软之后的云业务正在全速运转,多年来在内部缓慢推进的专用AI芯片也因各企业争抢算力而迎来爆发式需求。 现任与前任员工指出,谷歌最大优势在于掌握了应对AI浪潮的完整技术栈。它提供了众多产品,包括Gemini、搜索和地图,这些产品已经被数十亿人使用。它拥有一支专注于前沿AI模型研发的研究团队。同时,它的云基础设施不仅支撑着内部的所有AI研发工作,还让最大竞争对手们不得不付费使用。 不过,搜索仍然是谷歌的核心业务,也是这家公司数十年来力求稳定的根基。当创始人拉里·佩奇(Larry Page)和布林创办谷歌时,除了打造世界一流的搜索引擎外,他们并没有明确的商业模式。但是,两位创始人最终被说服,在搜索结果中加入广告。这一模式成为数字时代最具可扩展性的商业模式之一。直至今日,搜索广告仍是谷歌最大的收入来源。 挑战依旧在 现在,谷歌必须弄清楚:其推出的即时问答功能“AI概览”,以及更具颠覆性的搜索重构“AI模式”,在搜索广告方面是否同样有效。 谷歌已无路可退。《商业内幕》姊妹公司EMARKETER的行业分析师预测,谷歌在搜索广告市场的份额明年将首次跌破50%(此前预计为2025年)。到2026年底,EMARKETER预测谷歌的市场份额将为48.9%。 EMARKETER高级预测分析师奥斯卡·奥罗斯科(Oscar Orozco)指出,谷歌搜索业务的持续强劲表现,说明广告主对AI概览的担忧被市场“过度放大”。但他同时警告:“AI仍是搜索业务的长期威胁。随着大语言模型逐步实现搜索能力变现,我们认为谷歌市场份额将持续流失,尽管流失速度较我们去年同期的预期更为缓慢。” 然而,在AI时代重塑形象的过程中,谷歌仍面临重大挑战。OpenAI凭借先发优势使得ChatGPT成为了AI的代名词,谷歌想要扭转这种认知绝非易事。 与此同时,谷歌还面临一些关乎生存的根本性问题。首先,一旦 AI“吞噬”了互联网,谷歌如何才能维护一个健康的网络生态?为了追赶竞争对手,谷歌正在重新构想搜索,不再把它当作一个目录索引,而是把它变成一种无需滚动和点击即可完成的对话。这对互联网的未来意味着什么,仍是一个悬而未决的问题。不过,谷歌的业务不仅可能在自我颠覆中存活下来,还可能因此蓬勃发展。 一位前谷歌高管表示:“它拥有庞大用户群,只要持续推出新产品,没有人能匹敌它的分发网络。无论局势如何,它们最终都会成为赢家。” 谷歌在一份声明中告诉《商业内幕》:“我们历经多次平台变革,每次都是谷歌与搜索业务的新机遇。我们正通过快速迭代、持续创新,为产品、合作伙伴和用户创在新机遇。在AI时代,我们也在这么做。”(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
央视财经评论:泡泡玛特顶流“见顶论”为时尚早
快科技6月21日消息,在当下潮玩市场,泡泡玛特无疑是那颗最耀眼的明星。作为炙手可热的潮玩公司,它旗下坐拥众多国产潮玩IP,其中Labubu更是凭借独特魅力风靡全球。 各地粉丝为了抢购心仪款式,不惜彻夜排队,却常常面临“一BU难求”的窘境,Labubu在二手市场的价格也随之水涨船高,被炒至高位。 然而,本月18日泡泡玛特宣布全渠道大量补货后,市场格局瞬间改变。Labubu在二手市场的价格遭遇“腰斩”,泡泡玛特的股价也连续两天大幅下跌。这一系列变化,让不少人开始质疑泡泡玛特的发展前景。 一直以来,外界对泡泡玛特的高速扩张都存有疑虑。此次产品价格与股价双双下滑,更是引发了广泛讨论:这家潮玩公司是否已经走到了发展的拐点? 针对这一热点话题,昨日晚间,在《央视财经评论》节目邀请的嘉宾中,中国财政科学研究院研究员苏京春给出了专业见解。 她认为,对于单一企业而言,短期出现市场波动在所难免。就潮玩手办行业是否见顶这一问题,现在下定论还为时尚早。 此次泡泡玛特出现的波动,主要有两方面原因。一方面,市场对其能否持续保持高速增长存在分歧; 另一方面,泡泡玛特或许也担忧产品价格过高影响市场健康发展,此次补货有意对价格进行调控。 不过,潮玩手办作为新消费领域比较有代表性的模式,市场潜力依然巨大。只要产品价格适中,潜在消费需求将得到进一步释放,行业发展前景依旧可观。
英国伦敦窃贼只偷iPhone:偷完安卓手机会还给受害者
快科技11月24消息,据英媒报道,伦敦的手机窃贼越来越有选择性,他们在作案的时候通常会将安卓手机归还给受害者,只保留iPhone 。 今年一月,一位叫萨姆的男子路过伦敦南部一家皇家邮政分局时,被八名男子拦住去路,对方抢走了他的手机、相机和帽子。 后来,在发现他的手机不是苹果后,又把安卓手机还给了他。萨姆告诉媒体,窃贼直截了当地告诉他:“我不要三星手机”,然后就跑了。 城市里不少安卓用户都遇到过类似的情况。有些人的手机被偷后,小偷一会儿就把手机扔掉,或者在确认手机品牌后就归还给了他们。 专家表示,造成这种趋势的可能原因是iPhone在全球范围内更高的转售价值。网络安全公司ESET的一位顾问告诉媒体,窃贼追逐苹果带来的利润,因为安卓手机在二手市场上的价值通常较低,一些犯罪分子认为为了价值较低的东西而承担法律责任得不偿失。 过去十年的报告显示,这种偏好由来已久。英国政府内政部此前的数据显示,早在犯罪团伙开始将目标转向向海外走私苹果设备之前,iPhone就一直位列最易被盗机型榜首。 对于安卓用户来说,目前的状况或许只能算是一种安慰:虽然你的手机可能不太受某些人欢迎,但它或许能帮你省去日后的麻烦。
抖音:禁止未经平台资质认证的账号发布法律专业服务类内容
IT之家 11 月 24 日消息,抖音官方今日宣布将试行《抖音社区法律行业公约》,从账号资质规范、内容管理规范两大方面,明确平台治理规则,以及对违规行为的处置措施,以提升平台法律内容质量、规范涉法律内容传播、维护法律短视频科普良好生态。 《抖音社区法律行业公约》显示,平台倡导法律领域创作者在发布专业法律服务内容前,完成平台法律专业资质认证,禁止: 未经平台资质认证的账号发布法律专业服务类内容; 未经平台资质认证的账号信息中明暗示自身具有法律执业背景、可提供专业法律服务; 仿冒法律行业专家、执业律师、司法机关及其工作人员宣称可以提供法律服务; 通过租用、买卖、伪造、篡改律师执业证、律师事务所执业许可证等资质文件的手段申请注册或升级账号。 《抖音社区法律行业公约》还称,平台禁止传播缺少合法依据、虚假不实、刻意博眼球的法律内容,旨在防范法律误导风险,避免用户因错误认知遭受权益损害或承担法律责任。 IT之家从公告获悉,如违反治理规范,平台将视违规情节的严重程度、违规频次、造成的影响等,对内容及账号处以警告、限流、暂停发布、永久封禁、回收营利权限等梯度化处罚。
全国首个“天通+北斗”国产星基高精度定位服务试商用发布
IT之家 11 月 24 日消息,据中国邮电报今日报道,空天地一体卫星互联网创新应用实践论坛于近日在湖北省武汉市举办。会议期间,中国电信正式发布“天通 + 北斗”国产星基高精度定位服务试商用,旨在填补国产自主可控、低成本星基高精度定位服务领域空白,助力北斗规模化应用,支撑我国综合 PNT 体系自主化建设。 天通卫星的星基高精度定位服务能力与 5G+ 北斗融合时空服务平台结合,有助于形成更泛在的天地一体无缝覆盖的数字时空基础服务能力。 中国电信正式发布“天通 + 北斗”国产星基高精度定位服务试商用。依托“天通一号”卫星移动通信系统的资源优势,中国电信卫星公司与中国科学院空天信息创新研究院联合开展技术攻关,建成我国首套全国产星基导航增强系统,可在天通卫星覆盖范围内,不依赖地面网由天通卫星实时广播增强信息,为陆海空天多场景提供实时动态分钟级收敛、厘米级定位服务。 IT之家从报道获悉,“天通 + 北斗”星基导航增强系统重点面向偏远地区、海洋、低空、低轨等无网 / 弱网覆盖的区域提供服务,应用场景包括测量测绘、农机自动驾驶、智驾导航、海洋动力定位、海洋气象监测、海上施工建设、无人机巡检、无人机配送、低空通航等。
小米公布6G前沿技术系列成果,展示卫星通信等原型样机
IT之家 11 月 24 日消息,小米官方今日发文,由中国信息通信研究院与 IMT-2030 (6G) 推进组联合主办的 2025 年 6G 发展大会于 11 月 13 日在北京开幕,小米集团产业标准研究部总经理周珏嘉发表了题为《 6G 智联万物,AI 融创未来》的主题演讲。 周珏嘉从 6G 系统架构的总体考量引入,深入剖析了未来 6G 系统的发展方向与核心设计原则,分享了小米在 6G 空口优化、原生 AI、通感一体化、空天地一体化以及多样化终端类型融合设计方面的最新研究成果,并对小米 6G 的未来发展做出了展望。 周珏嘉重点分享了小米在推动 6G 技术创新方面的系统性思考与最新实践。在空口设计优化方面,他提到在各个物理层设计中都需要考虑前述 6G 空口设计进一步提升性能、降低功耗和复杂度,以及兼容不同设备类型的设计原则。 在原生人工智能( AI )领域,小米提出了“AI 赋能网络”( AI for Net )和“网络赋能 AI”( Net for AI )的双路径战略,强调 AI 需深度融合通信、计算、数据和模型,并特别指出基于实际空口的原型机外场测试( Field Trial )对标准化和商用的关键作用。 在通信感知一体化( ISAC )方面,提出要在 6G 无线通信系统中,通过原生支持通感一体化设计,实现通信与感知功能的联合优化,通过研究 3GPP 感知与非 3GPP 感知的融合,进一步提升感知性能。 对于空天地一体化网络,小米阐述了技术方向,如多星网络部署、兼容弱 / 无 GNSS 终端、覆盖增强等,还介绍了小米公司搭建的基于信道模拟器的卫星通信原型验证平台,该平台完成了终端在无 GNSS 定位信息的情况下接入卫星网络的原型验证,后续将用于验证更多 6G 卫星通信潜在技术方案,助力小米在 6G 卫星通信方面的标准化工作。 在多样化终端类型的融合设计方面,周珏嘉提出,在万物智联时代,6G 移动通信中要广泛支持不同能力终端、不同形态终端同时入网、实时通信的场景,研究方向包括 IoT 设备的融合设计、终端的超低功耗技术以及为 IoT 设备在 Day-1 设计出更简单的通信系统等。 演讲最后,周珏嘉强调轻量、高效、智能的 6G 系统,是构筑未来数字社会的核心基础设施,6G 创新驱动小米智联万物,小米创新能力也将让 6G 智能触手可及。 大会现场,小米展台重点展示了其在 6G 前沿技术领域的两项成果 —— AI 与通信融合原型样机和无源物联网原型样机。 AI 与通信融合原型样机从传输信道与传输内容两个维度对特征进行联合挖掘和利用,在恶劣的通信环境中,能保证关键内容信息传输的准确性。 无源物联网原型样机将无线充能、盘点、定位功能深度融合,主要解决“什么物品”和“在哪里”两个问题,可以提升资产管理的效率和智能化水平。 据IT之家此前报道,在 2025 年 6G 发展大会北京 6G 产业发展分论坛上,北京市经济和信息化局首次集中发布“北京 6G 实验室十大进展”,小米“端到端 AI 无线技术原型验证系统”入选,同期入选的还有移动、电信、联通等知名通讯企业研究成果。
在线音乐三国杀,新旧势力的攻守战
继汽水音乐后,字节将免费模式复制到了在线音乐赛道。腾讯音乐、网易云音乐面临着新势力的挑战,而未来的在线音乐市场格局,并不是非此即彼的。 原创ⓒ财经新知 大文娱组 作者丨江蓠 编辑丨樱木 主编丨九黎 继番茄小说、红果短剧创造免费跑赢付费的神话后,字节正试图在在线音乐赛道上复制这一模式。 近期,字节跳动正式将原来的" 番茄畅听音乐版 "APP升级为“番茄音乐”APP,该款APP延续了一贯的番茄系风格,不仅听歌完全免费,还可以听歌赚金币,以此实现用户激励。这款APP与汽水音乐形成的差异化优势,使字节在在线音乐市场上拥有了更大的竞争力。 近年来,汽水音乐依靠抖音的短视频流量反哺,呈现出强劲的增长态势,番茄畅听音乐版则承接了更多下沉流量,随着番茄畅听音乐版的升级,字节的在线音乐生态无疑更加完整。而字节在在线音乐上的布局,也已经对腾讯音乐、网易云音乐这两大老牌音乐流媒体巨头产生了一定的冲击。 QuestMobile公布的2025年9月移动音乐APP月活用户规模TOP10榜单显示,虽然腾讯音乐、网易云音乐的月活用户仍旧居前,但增速表现却并不算理想:腾讯音乐旗下的酷狗音乐、QQ音乐月活分别下降8.1%、2.8%,酷我音乐更是月活下降8%,排名退至汽水音乐后面。网易云音乐的月活用户倒是没有出现下降,但只实现了1.5%的微增。与之形成鲜明对比的,是汽水音乐高达90%的月活用户增速。而番茄畅听音乐版尽管排名较为靠后,但增速高达92.4%。 图/QuestMobile公布的2025年9月移动音乐APP月活用户规模TOP10榜单 一降一增之间,国内在线音乐市场的新旧势力之争更显清晰。 这一差异化从腾讯音乐、网易云音乐近期披露的三季报中也可以看出。尽管三季度营利双增,但自2023年以来,腾讯音乐月活用户已经连续多个季度同比出现下降。网易云音乐最新披露的三季报显示,三季度公司净收入同比减少1.8%。三季报后公司股价的大跌,也反映出市场对这两家公司长期增长价值的担忧。 从网文到短剧,再到在线音乐,免费与付费之间的较量从未停止。字节的强势入局,正迫使腾讯音乐与网易云音乐进入新的攻防战。未来格局是攻守易形还是多方制衡?一切还未到终局。 01 字节加码在线音乐 面对资源底蕴深厚的老牌巨头,汽水音乐与番茄音乐这两个“新秀”,凭什么能实现月活用户的异军突起? 最主要的原因显而易见:它们并非传统意义上的独立APP,而是抖音生态中的一环。而其之所以实现月活用户的快速增长,也是由于背靠着抖音这座“流量富矿”。 作为国内领先的短视频平台,抖音拥有接近9.4亿的庞大盘月活用户,是毋庸置疑的顶级流量入口。QuestMobile发布的短视频月活TOP10榜单显示,抖音主APP以93641万的月活用户稳居榜首,过去一年同比增长14.7%。 更为关键的是,音乐与短视频内容在抖音内部已形成天然的共生关系。据抖音官方数据披露,抖音投稿用户使用歌曲的占比达到了78%。这种深度的融合,重塑了用户的音乐消费习惯:越来越多人在抖音发现并喜欢上一首歌后,会直接跳转至汽水音乐进行完整收听。收藏音乐的同步功能,也进一步优化了用户体验,使用户在抖音到汽水音乐的切换过程中,实现了“连搜都不用搜”的无缝衔接。 图/抖音截图,点击视频配乐可以直接去汽水音乐听完整版 此外,抖音具备强大的音乐“造星”与“造歌”能力。这让在传统版权方面并不占优势的汽水音乐,得以快速崛起。据悉,汽水音乐TOP1000的热歌中,86%生长于抖音,54%从抖音冷启动爆火。 正是“算法推荐+短视频场景”的平台策略,让汽水音乐自面世之初便一路高歌猛进,奠定了流量基本盘。 而在已有汽水音乐的情况下,字节为何还要加码番茄音乐?这背后,一方面是精准的差异化定位策略。汽水音乐主打相对年轻高级感的社区氛围,尽管有各种优惠,但每月8元的会员费,还是显露出明确的商业化意图。而番茄音乐则瞄准下沉市场的中老年群体,以经典老歌、广场舞曲为核心内容,完全免费,其路径与番茄小说等产品一脉相承,旨在通过广告等模式实现流量变现。 图/番茄音乐App Store截图 事实上,番茄小说、红果短剧早已为番茄音乐的模式成功打了样。据悉,番茄免费小说在月活跃用户方面持续领跑数字阅读方赛道,红果短剧则凭借高速增长,在在线视频赛道,月活已经超过了优酷和B站。在收入方面,据晚点早年的报道,番茄小说的年营收在2022年就已经超过了100亿元。正是番茄小说和红果短剧的成功,印证了基于抖音生态、以免费模式切入特定内容赛道的可行性,为番茄音乐采用类似模式服务特定用户群体,并实现商业闭环提供了有力的前景佐证。 字节系APP,始终在扮演“流量商人”的角色,跳出原有app内容为主的基调,更多的聚焦于用户的注意力生意。同时,生态流量的贩卖,也让其区别于其他APP,构建起独特的生态壁垒。 正是依托这些差异化优势及被验证的商业模式,字节系音乐在腾讯音乐、网易云音乐的围剿下,走出了属于自己的道路。 02 腾讯、网易云另寻增长 在字节系音乐的攻势下,腾讯音乐、网易云音乐也面临着月活用户下滑的挑战。 其中,腾讯音乐独家版权优势的丧失,叠加免费在线音乐APP的分流,其长期依赖的用户基本盘正受到明显冲击。数据显示,三季度腾讯音乐的在线音乐移动端月活跃用户(MAU)已降至5.51亿,同比下滑4.3%,延续了上一季度的跌势。 网易云音乐长期处于行业第二位置,面临的压力较腾讯音乐显然更大。在此背景下,主流音乐平台们一边采取迂回的低价策略应对免费音乐模式的冲击,一边寻找新的增长方向。 为应对免费模式的冲击,腾讯音乐推出面向学生与轻度用户的“波点音乐”会员费更低;网易云音乐近期开放测试黑胶家庭会员,人均月费低至 4.5 元/月。此外,今年以来,网易云音乐还推出了小灯泡送会员、黑胶邀请官、听书领黑胶、5 元 / 月学生黑胶 VIP等多项福利活动。 对于腾讯音乐来说,尽管通过对付费会员体系的深度运营,公司的收入情况在月活用户下降的背景下实现了逆势增长,不过,流量下滑的弊端也正逐渐显现出来:其付费用户数的增速正在放缓。 基于此,腾讯音乐也开始发展非订阅业务,走出自己的差异化路线。其中,线下演出成为一大亮点。三季度,腾讯音乐为G-DRAGON权志龙在悉尼、墨尔本等六城举办了14场演出,场场售罄,吸引观众超15万。薛之谦、张韶涵、GAI等艺人的多场巡演也进一步丰富了其演出内容矩阵。 图/微博截图 此外,平台持续引入如胡夏、NexT1DE等“bubble”厂牌艺人,拓展音乐人生态与用户触达范围。三季度,非订阅业务收入同比增长超过50%,达到24.7亿元,成为继会员收入之外的重要增长极。 网易云音乐则在2024年进行了大改版,删减了广告等打扰用户听歌的不实用功能,意在回归音乐初心。 此外,腾讯音乐和网易云音乐也顺应AI大潮,使用AI技术来改善用户听歌体验。如网易云音乐近期推出大模型音效“AI调音大师”、“智能过渡AutoMix”功能;腾讯音乐通过天琴实验室自研语音合成大模型“琴语大模型”等。 面对汽水音乐和番茄音乐,两家老牌音乐平台正在积极调整策略,寻求新的增长路径,而不同的基因,也决定了其与字节系不同的方向选择。 03 竞争不是“非此即彼” 尽管汽水音乐和番茄音乐,在短视频风行的时代背景下,能够迅速崛起,但其与老牌音乐平台的竞争,本质上并非一场简单的零和游戏。在线音乐新旧势力交锋的背后,是市场在需求分层与场景细化下的必然裂变,也标志着行业正从“大一统”的通用模式,走向“精耕细作”的细分时代。 流量还是内容,似乎成了双方竞争的焦点。 一方面,字节系音乐和腾讯音乐、网易云音乐的用户圈层,存在一定的差异性。近期,里昂发布研报称,由于各平台战略定位及产品差异化,与字节跳动旗下Soda Music直接爆发正面竞争的风险较低。申万宏源的研报也认为,汽水音乐近2年增长快,但自身平台调性(流量模式、商业效率最大化)和在线音乐商业逻辑(创作、版权、平台和用户的生态闭环)匹配难度高。 QuestMobile的数据则进一步验证了这个观点:汽水音乐与QQ音乐、网易云音乐的用户交叉重叠仅为2%–3%,这意味着,汽水音乐的增长并非主要来自对传统平台用户的抢夺,而是更多依托抖音生态的内部引流。数据显示,其超80%的流量均来自抖音。 因此,虽然字节系音乐,和腾讯音乐、网易云音乐的月活呈现一增一降,但从一定程度上来说,字节系音乐是做大了整个在线音乐市场的蛋糕。 另一方面,虽然没有了独家版权的壁垒,但腾讯音乐完整的版权库、背靠微信生态仍旧有着巨大的优势;网易云音乐则凭借其浓厚的社区氛围、高度活跃且富有创意的用户歌单,以及对独立音乐人的长期深耕,形成了难以复制的平台特色。汽水音乐虽然在歌曲界面也引入了热评功能,试图营造社区氛围,但其产品基因与运营逻辑,与网易云存在差异。 图/AI生成 可以预见的是,这场在线音乐的“三国杀”,最终可能不会出现绝对的赢家通吃,而是将形成一种动态平衡的格局。正如当年视频行业从版权大战走向多元竞争一样,在线音乐市场也有望在免费与付费模式的长期共存中,找到各自的生存空间,共同推动行业走向更成熟的发展阶段。 资料来源: 吴怼怼,《汽水音乐凶猛,音乐流媒体重新“三国杀》 海豚投研,《字节发力,腾讯音乐还能“小而美”吗?》 华尔街见闻,《面对字节“汽水音乐”的竞争,腾讯音乐增长要靠“高级会员+线下演唱会”》
智元机器人推出灵心平台:用户可零代码定制机器人“灵魂”与人设
凤凰网科技讯 11月24日,智元机器人今日正式推出名为“灵心平台(LinkSoul)”的智能系统。该平台被官方定位为“机器人灵魂定制工厂”,旨在打破传统机器人交互千篇一律的僵局。通过灵心平台,用户无需具备代码基础,即可利用模块化、可视化的操作界面,对机器人的声音、性格、行为与记忆进行深度配置,实现从角色定义到行为编排的全流程“人格化”编辑。 据介绍,灵心平台核心提供了五个维度的定制能力。在声音交互层面,平台除内置30至40款不同风格的音色库外,重点推出了“音色复刻”功能,用户仅需上传录音片段,即可让机器人获得相似的声音模型。在行为与人设编排上,系统支持用户像编辑视频素材一样自由组合机器人的表情、动作与对话语音。平台具备“一句话生成完整角色”的能力,用户可通过输入特定指令(如动漫IP或历史人物)快速构建机器人人设,也可通过关键词自定义其性格标签。 此外,该平台显著增强了机器人的记忆深度与任务执行能力。机器人不仅能记住用户的身份偏好及过往互动内容,企业用户还能通过上传专业资料,让机器人在客服、导览等特定场景中持续学习进化。在基础对话功能之外,用户能进一步为机器人配置如物品递送、活动主持等具体的任务流程。智元机器人方面表示,灵心平台的推出意在推动机器人从标准化的执行工具向具备个性化特征的智能体转变,让普通用户也能像使用“应用商店”一样设计机器人的交互方式,加速实现“千人千机”的差异化智能生活场景。
Nano Banana,OpenAI你学不会
奥特曼向OpenAI的全体员工发了一封内部信,他坦言道,虽然OpenAI仍处于领先地位,但是谷歌正在缩短差距。并奥特曼也承认,正是由于谷歌最近一系列的产品发布,为OpenAI带来了不小的压力。 事实也正如奥特曼所言,谷歌这次带来的,除了赢得满堂彩的Gemini 3 Pro,还有让整个AIGC圈震撼的Nano Banana Pro。在此之前,所有生图模型的底层逻辑都是临摹世界。通过海量的数据库,寻找最接近描述的图,将其拼凑给你。 而Nano Banana Pro的出现,则彻底打破了这个规则。它并不是在“画图”,而是在“模拟物理世界”。其最大的突破在于,引入了思维链(Chain of Thought)推理机制,先让模型进行思考,再去画图。 在落下第一个像素之前,模型会先在潜空间内进行逻辑推演,计算物体的数量、确定光影的投射角度、规划空间嵌套关系。它不再依赖文本作为中转站,推理结果直接以高维向量的形式指导像素生成。 那么问题来了,为什么OpenAI开发不出Nano Banana Pro? 01 在回答问题之前,不妨先看看Nano Banana Pro,它和OpenAI现在生图主要使用的GPT-4o到底有何区别。 以“三个苹果”的生成任务为例,提示词为:“左侧苹果带有咬痕,中间苹果附着水珠,右侧苹果呈现腐烂状态”。面对这一指令,GPT-4o通常会迅速生成一张色彩明艳、构图完美的图像。 但在细节核验时往往暴露出概率生成的缺陷,中间苹果上面的水珠其排布不符合客观规律,而右边苹果的腐烂看起来又过于刻意。 相比之下,Nano Banana Pro输出的图像不仅数量精确,且每个对象的属性都严格对应——左侧的缺口、中间的折射光感、右侧的氧化纹理,均被精准还原。 这种表象差异的背后,是两条截然不同的技术路径。 GPT-4o的生成机制本质上基于统计学相关性,它在海量训练数据中检索“苹果+咬痕”的视觉特征,并通过概率分布进行拼贴与融合。它并未真正理解“三个”的数量概念,也未构建“腐烂”的物理模型,仅是根据高维空间中的特征距离进行近似匹配。 而Nano Banana Pro引入了思维链(Chain-of-Thought, CoT)机制,将图像生成过程从单纯的“像素预测”升级为“逻辑推演”。在落下第一个像素前,模型内部已完成了一轮符号化的规划:首先确立实体对象(Object 1, 2, 3),随即分配空间坐标,最后绑定物理属性。 针对“咬痕”,它推演的是几何形态的改变;针对“水珠”,它计算的是光学反射与折射的物理规律;针对“腐烂”,它模拟的是材质属性的演变。这是一套从语义理解到逻辑规划,再到执行生成的全链路闭环。 这种机制在处理涉及物理规律的复杂场景时优势尤为凸显。 提示词“窗台上的半杯水,阳光从左侧射入”。 GPT-4o所生成的图片,仅0具备视觉合理性,但在物理上自相矛盾的光影关系。此时,窗台左侧应存在由玻璃杯反射出来的阳光,但是图片中仅存在右侧折射出来的光线。 而具Nano Banana Pro会先行计算光源向量,推导阴影投射方向以及液体介质的光线折射率。这种基于物理常识的推理,使得生成结果不再是视觉元素的堆砌,而是对物理世界的数字模拟。 更为深层的架构差异在于,OpenAI目前的体系存在显著的“文本信息瓶颈”(Text Information Bottleneck)。在ChatGPT中调用绘图功能时,用户的简短指令往往会被GPT改写为一段详尽的Prompt,再传递给图片生成模型。 这一过程看似丰富了细节,实则引入了噪声。文本作为一维的线性信息载体,在描述三维空间关系、拓扑结构及复杂的物体属性绑定时,存在天然的低带宽缺陷。改写过程极易导致原始意图中的关键约束被修饰性语言淹没,造成信息的有损传输。 此外,汉字对于图片生成大模型来说也是一个噩梦。GPT-4o在很长时间里,写字都是“乱码生成器”,甚至让它写“OpenAI”,它都能写成“OpanAl”或者一堆奇怪的符号。 我让GPT-4o以字母榜LOGO为参考,生成一个字母榜的招牌。 但Nano Banana Pro实现了对文字的精准控制。在同样的提示词下,Nano Banana Pro提取出了上方的字母榜,左右两侧的A和Z,以及最下方的弧线,并将这些元素置于不同的图层、不同的材质。 Nano Banana Pro则采用了原生多模态(Native Multimodal)架构,这是一种统一模型的解决方案。 用户的输入在模型内部直接映射为包含语义、空间及物理属性的高维向量,无需经过“文本-图像”的转译中介。这种端到端的映射关系,如同建筑师直接依据蓝图施工,而非依赖翻译人员的口述传达,从而根除了中间环节的信息熵增。 但这也造成了另外一个问题,提示词门槛被拉高了。我们回到一开始三个苹果的提示词上。 这是输入给GPT-4o的提示词,简单易懂,就是在描述画面构成。 而这是给Nano Banana Pro的提示词。看起来就像Python代码一样,通过函数和()来控制生成的图片。 在涉及计数、方位布局、多物体属性绑定(Attribute Binding)等精确控制任务上,Nano Banana Pro表现出色。它能清晰区分不同对象的属性归属,避免了扩散模型常见的“属性泄露”问题(如将红杯子的颜色错误渲染到蓝杯子上)。 当然,GPT-4o依然保有其独特的生态位。其优势在于推理速度与基于RLHF(人类反馈强化学习)调优后的审美直觉。 由于剥离了复杂的逻辑推理环节,其生成效率更高,且更能迎合大众对高饱和度、戏剧化光影的视觉偏好。对于追求视觉冲击力而非逻辑严谨性的通用场景,GPT-4o依然是高效的选择。 然而,当需求从“好看”转向“准确”,从“相关性”转向“因果性”,Nano Banana Pro所代表的“先思考、后执行”模式便构成了降维打击。它牺牲了部分的生成速度与讨好眼球的滤镜感,换取了对物理逻辑的忠实还原。 02 橘生淮南则为橘,生于淮北则为枳。Nano Banana Pro和GPT-4o之所以会有如此的差距,正是因为其开发者,谷歌和OpenAI在AI这条路上,选择两种完全不同的发展方向。 谷歌选择的是“原生多模态”这条路。 就是从模型训练的第一天起,文本、图像、视频、音频就混在一起,扔进同一个神经网络里让它学。在Gemini的眼里,一这些事物本质上没有区别,都是数据。它不需要先把图片翻译成文字,再去理解文字。 这就像一个人从小就会说中文、英文、法文,这三种语言在他脑子里是同时存在的,他不需要先把英文翻译成中文再思考。 而OpenAI走的是“模块化拼接”这条路。 它的逻辑是,让专业的人做专业的事。GPT-5负责理解语言和逻辑推理,GPT-4o负责生成图像,Whisper负责处理语音。 每个模块都做得很好,然后通过API把它们连起来。这就像一个团队,有文案、有设计师、有程序员,大家各司其职,通过开会和文档来协作。 这两种路线,没有绝对的对错,但会导致完全不同的结果。 谷歌最大的优势,来自于YouTube。这是全世界最大的视频库,里面有几十亿小时的视频内容。这些视频不是静态的图片,而是包含了时间序列、因果关系、物理变化的动态数据。Gemini从一开始就是“看这些视频长大的”。 换句话说,Gemini从诞生之初,就理解物理世界的基本运行逻辑。杯子掉在地上会摔碎,水倒进杯子里会形成液面。这些东西不是靠文字描述学来的,而是通过看真实世界的视频,自己总结出来的。 所以当你让Nano Banana Pro画“一个杯子从桌子上掉下来的瞬间”,它不会画出一个漂浮在空中、姿态僵硬的杯子。它会画出杯子在下落过程中的倾斜角度,杯子里的水溅起来的形态,甚至是杯子即将触地时周围空气的扰动感。因为它见过太多这样的场景,它知道真实世界是怎么运作的。 除了YouTube,谷歌还有另一个护城河:OCR。谷歌做了几十年的光学字符识别,从Books到Lens,谷歌积累了全球最大的“图片-文字”对齐数据库。这直接导致了Gemini在文字渲染上的碾压性优势。 它知道汉字在图片里应该长什么样,知道不同字体、不同大小、不同排列方式下,文字应该怎么呈现。这也是为什么Nano Banana Pro能精准识别汉字。 反观OpenAI,它的起家靠的是文本。从GPT-1到GPT-3再到GPT-5,它在语言模型上一路狂奔,确实做到了世界顶级。但视觉能力是后来才加上去的。 DALL-E早期是独立发展的,训练数据主要来自网络抓取的静态图片,来自Common Crawl这样的数据集。这些图片质量参差不齐,而且都是静态的,没有时间维度,没有物理过程,没有因果关系。 所以DALL-E学到的,更多是“这个东西大概长这样”,而不是“这个东西为什么长这样”或者“这个东西会怎么变化”。它可以画出一只很漂亮的猫,但它不理解猫的骨骼结构,不理解猫的肌肉如何运动,不理解猫在跳跃时身体会呈现什么姿态。它只是见过很多猫的照片,然后学会了“猫长这样”。 更关键的是训练方式的差异。 正是因为OpenAI走的是RLHF路线。所以他们雇了大量的人类标注员,给生成的图片打分:“这张好看吗?”“这张更符合要求吗?”标注员们在选择的时候,自然而然会倾向于那些色彩鲜艳、构图完美、皮肤光滑、光影戏剧化的图片。 这导致GPT-4o被训练成了一个“讨好型人格”的画家。它学会了怎么画出让人眼前一亮的图,学会了怎么用高对比度和饱和色来抓住眼球,学会了怎么把皮肤修得像瓷器一样光滑。但代价是,它牺牲了物理真实感。 GPT-4o生成的图片,有一种很典型的“DALL-E滤镜”。皮肤像涂了蜡,物体表面特别光滑,光影过度戏剧化,整体感觉就是“一眼假”。它不敢画出皮肤上的毛孔,不敢画出布料的褶皱,不敢画出不完美的光照。因为在训练过程中,那些带有瑕疵的、粗糙的、不那么“美”的图片,都被标注员打了低分。 而谷歌没有走这条路。Gemini的训练更注重“真实”而不是“美”。世界本就如此,它没有书本里描绘的那么美。 03 那么谷歌又是如何追上OpenAI,以至于让奥特曼发内部信来强调危机感的呢? 谷歌选择在“准确性”和“逻辑”上发力。谷歌将其称为“Grounding”,也就是“接地气”,也就是“真实性”。 为了实现这个目标,谷歌把思考过程,引入了图像生成过程。这个决策会大大增加计算成本,因为在生成图像的时候加入推理步骤,生成速度也就变慢了。但谷歌判断这个代价是值得的,因为它换来的是质的提升。 当你给Nano Banana Pro一个提示词,比如“画一个厨房,左边是冰箱,右边是灶台,中间的桌子上放着三个碗”,模型不会直接开始画。它会先启动思维链: 首先,识别场景类型:厨房。然后,识别对象:冰箱、灶台、桌子、碗。接着,确定空间关系:冰箱在左,灶台在右,桌子在中间。再确定数量:三个碗。然后推理物理逻辑:厨房里通常会有什么光源?桌子应该离冰箱和灶台多远才合理?三个碗应该怎么排列?最后,确定视角和构图:从什么角度看这个场景最合适? 这一整套思考完成后,模型会在内部生成一些“思考图像”,这些图像用户看不到的,但它们帮助模型理清了思路。最后,模型才开始生成真正的输出图像。 这个过程看起来复杂,但它解决了一个核心问题:让模型“理解”而不是“猜测”。 GPT-4o以及市面上绝大多数生成图片的模型,都是靠概率猜,“用户说厨房,那我就把我见过的厨房元素拼起来,大概就对了。” 而Nano Banana Pro则是真正去理解厨房这个概念:“用户说厨房,厨房是用来洗菜做饭的,所以这个厨房需要满足这些空间关系和物理逻辑,我要按照这个逻辑来构建。” 反观OpenAI,它目前的策略是把最强的推理能力集中在o1系列模型上,也就是之前代号为Strawberry的项目。o1在数学推理和代码生成上确实很强,它能解决一些人类数学家都觉得有挑战的问题,能写出复杂的算法代码。 至于图像生成,OpenAI的判断是:目前GPT-4o的“直觉式”生成已经足够好了,足够维持用户体验,足够在市场上保持领先,并不需要继续提升。 还有一个因素是产品理念的差异。OpenAI一直强调的是PMF,也就是Product-Market Fit,产品市场契合度。它的策略是“快速迭代,快速验证”。 DALL-E 3只要能通过提示词和GPT-4拼起来用,那就先发布,先占领市场。后台的架构可以慢慢改,用户看不见的地方可以慢慢优化。 这个市场策略被称为“胶水科技”,其最大的弊端在于积累的技术债太多了。当你一开始选择了模块化拼接的架构,后面想要改成原生多模态,就不是简单地加几行代码的问题了。这可能需要重新训练整个模型,需要重新设计数据管道,需要重新构建工具链。 谷歌慢工出细活,可他们也有自己的难处。 原生多模态模型的维护成本也更高。如果你想提升图像生成能力,就需要调整整个模型。这就是为什么,Nano Banana Pro只能伴随着Gemini 3的更新,没办法自己单独更新。 这种“按下葫芦浮起瓢”的问题,在模块化架构里就不存在,因为当你你只需要优化图像生成模块,根本不用担心影响到文本模块。 所以OpenAI确实没办法训练出来Nano Banana Pro。 然而这并不意味着谷歌可以高枕无忧了,因为AI领域迭代速度太快了。我敢打赌,不出半个月,就会有一大帮生图模型问世,直接对标Nano Banana Pro。
千问突围,阿里与字节“开撕”
//// 千问与豆包、DeepSeek、元宝必有一战,但最直接也最棘手的对手是豆包,阿里等不得。 本文由无冕财经(wumiancaijing)原创发布 作者:贾琦 编辑:程程 设计:岚昇 过去一周,国内AI应用市场突然“炸了锅”。11月17日千问登场,18日蚂蚁灵光上线,阿里系直接在App Store中国区免费榜前六撕开一道口子。 截至11月24日,千问跃升至第4,灵光排名第6,打破了字节跳动长期盘踞的“前五全包”格局。此前榜单前列清一色是豆包、红果短剧、抖音商城、多闪和汽水音乐,除了豆包,其余全是抖音系。 更猛的是速度。根据阿里最新披露,千问公测一周下载量突破1000万,增速超过ChatGPT、Sora、DeepSeek,成为至今增长最快的AI应用,阿里港股盘中一度大涨超6%。 回看2025年,从年初的AI基建到年中的淘宝闪购,再到如今举全集团之力力捧的千问,阿里一路加速,“等不得”成了贯穿全年的底色。 夸克让位 早在11月初就有市场消息称,阿里巴巴已秘密启动名为“千问”的战略级项目,以Qwen最强模型为核心打造个人AI助手APP,目标直指ChatGPT。 但从上线后的千问APP来看,千问与豆包反而更为接近,界面更轻,入口更直接。 即便如此“减负”,千问离成熟的C端体验似乎仍有不小差距。有人直言遇到了一个糊涂的千问,“连用户和自己的话都分不清”;有人吐槽“你们有用千问做数学题的吗,我今天让他做了一道高等代数题,做的太差了,有投广告的钱不如好好改进产品”。 阿里表示,这次发布的是一个初级版本,将用最先进的模型打造一个“会聊天能办事的个人AI助手”,并特别强调“能办事”将会是千问APP的一个重要发力方向。 如果把时间线拉长一点就会发现,千问突然冲上前台C位,似乎并不在阿里原本的计划内。过去一年,阿里真正持续投入资源扶持的其实是另一款C端产品夸克。阿里在夸克上的投入之大,与千问如今的曝光程度相比毫不逊色:先后上线了AI超级框、高考志愿大模型、AI创作平台、AI眼镜、对话助手……几乎每个季度都有大动作。 吴嘉的上位更是佐证。今年3月之前,夸克在阿里内部一直没有独立的架构,3月13日之后才被正式升级为阿里的AI旗舰应用,负责人吴嘉也从阿里智能信息事业群总裁,升级为阿里巴巴集团副总裁、夸克CEO,并直接向阿里巴巴集团CEO吴泳铭汇报。 对此,阿里核心决策层的人士曾表示,吴嘉是阿里内部少数真正带队做成过“大C端产品”的年轻高管,夸克正是其代表作。 然而,这一切在下半年开始出现明显转向。据晚点LatePost报道,早在今年夏天,阿里核心管理层就在讨论启动千问项目。9月后,便从北京、广东调来上百名工程师,在阿里巴巴西溪园区C4楼封闭做千问项目。产品团队虽然仍归属智能信息事业群,但统筹工作却直接由阿里巴巴集团层面主导,更名的决策由CEO吴泳铭亲自拍板。 紧接着,千问的上线节奏肉眼可见地提速:界面焕新、功能重排、对标ChatGPT 的宣传一波接一波……密集程度之高,像是一场仓促却必须拿下的突击战。 几乎一夜之间,夸克“主攻AI搜索、夸克当入口”的叙事,被千问的“全民级AI助理”替代,阿里AI的C端战略中心发生了一个明显偏移。唯一没变的是,具体执行负责人仍是吴嘉。 ▲据悉,阿里所有产品未来将接入大模型,图源网络 阿里给出的解释是:2025年上半年,阿里的确希望通过夸克来尝试AI时代的入口,但随着AI能力的提升,阿里认为对话式AI助手是更好的形式。 另有分析指出,夸克的功能体系庞杂,定位偏工具,即便进行了AI升级,也难以让用户将其视为AI本体。千问则不同,它没有历史包袱,不属于任何一个现有业务板块,可以从零开始定义产品结构,走的是“对话即入口”“任务即场景”的路径。 至于千问上位后,夸克会否被边缘化,还是继续承担阿里在AI to C的入口职责,目前仍没有明确答案。唯一清晰的是,在App Store中国区免费榜上,夸克已经掉出前10,而千问升至第4,蚂蚁灵光排到第6。 豆包逼急 阿里的AI战略雄心勃勃,但过去几年,它的攻势几乎全部压在B端上,导致在C端的应用层面,长期处于一种尴尬状态:知道的人不多,用的人更少。现在,千问被寄予厚望,替阿里补上那块最薄的一环。 问题是,一台手机里能装下几个相似的AI助手? 千问与豆包、DeepSeek、元宝必有一战。但最直接也最棘手的对手,是豆包。10月底阿里官宣AI“C计划”时,就曾有解读认为这个“C”并不单指C端,还取自经典游戏“吃豆人”(Pac-Man),目标直指同在AI应用榜单前列的竞争者豆包。 与阿里对入口形态反复摇摆不同,豆包作为字节跳动旗下的AI助手,产品路径从一开始就极为清晰:不强调模型参数,不端技术姿态,够简单、够顺手、够日常。无论是“用豆包进行压力面试”还是“豆包陪孩子写作业”,几乎都是靠户自发传播出圈。这种贴地气的使用感,正是阿里多年来在C端所缺失。 QuestMobile《2025年9月AI原生App榜单》显示,豆包以1.72亿月活稳居第一,DeepSeek以1.45亿月活位列第二——二者合计用户规模接近3.2亿人,几乎相当于中国网民的三分之一。 ▲2025年9月AI原生App榜单,图源QuestMobile 豆包带来的焦虑远不止用户规模,更让阿里警觉的是其商业化闭环。今年双十一期间,豆包悄悄上链接了。在豆包里问护肤、问家电、问香水,答案不再是网页跳转链接,而是直接附着一个能一键进入抖音商城的商品卡片,从咨询、比对到下单,全过程都能在一个聊天窗口里完成。 这一下,AI第一次与国内电商有了深度绑定,并且能直接产生商业价值。这种模式可能成为AI时代电商交易的一种全新方式,至少是一个重要的补充。而它精准切入的,正是阿里最核心的腹地。 过去十多年,移动互联网的电商闭环一直由阿里主导。但随着AI开始渗透日常生活,最前端的入口被字节通过豆包包抄截胡。入口旁落,就意味着交易可能旁落,这才是阿里真正的焦虑所在。 如果把字节和阿里的业务版图摊开,会发现阿里和字节的对垒,早已不局限于“千问VS豆包”。不管是电商、云服务,还是本地生活,双方的业务已经犬牙交错。 对上一次出现这样的局面,还要追溯到十年前的AT(阿里和腾讯)之争。但那场冲突更多是资本阵营的对弈,彼此在对方主战场上较少正面冲撞。而这一次完全不同,阿里和字节已经卷到彼此的核心腹地。 电商是必争之地,淘宝天猫不可能退,抖音也绝不会停下带货的脚步。到了AI时代,入口之争更是重中之重。豆包想成为人人都能上手的AI工具,千问同样瞄准了下一代超级入口的位置。 这两大生态由此形成了天然对立的阵营:一边是阿里试图从AI重建电商入口,一边是字节从流量链路反推到AI入口本身。双方都在对方的红线边缘试探,用自己的节奏挤压对方的生存空间。 阿里是不是来晚了? 千问官宣之后,外界最尖锐的疑问是:阿里是不是来晚了? 千问团队接受晚点采访时表示,当下国内还没有一款DAU破亿的国民级AI应用,千问此时入局并不晚。 足够厚的技术储备,也是阿里的底气。Qwen系列模型在Hugging Face等全球开源榜长期霸榜,全球累计下载量突破6亿次。9月才发布的Qwen3-Max,在多个榜单上已对标国际第一梯队。 但技术优势并不自动转换成C端优势。“IT桔子”数据显示,2025年8月国内AIGC产品已进入深度调整期,多款图像生成、聊天类工具集体降速,想靠基础能力抢夺市场变得越来越困难。 因此,千问选择的突破口不是模型能力,而是从对话深入到办事。千问团队透露,目前千问还在联合包括淘宝、高德、闪购、支付宝等产品的团队联合开发,希望更深嵌入相关产品,解决用户的实际问题。 比如,当用户问“婴儿冬季护肤”,后台联动淘宝给出合规产品,再由高德引导线下母婴店;如果问“今晚吃什么”,未来可能会直接调出闪购、查看附近店铺库存和配送时效。 这意味着,眼下“千问+夸克”的双线推进,还是今年阿里“整合分散业务、打造统一生活入口”战略的延续。前有高德以扫街榜反哺本地生活,淘宝闪购借外卖场景拉升DAU,后有千问接入地图、外卖、购物等多场景,目标成为AI时代的流量中枢,它们都遵循同一个逻辑——用高频场景撬动生态流量。 这也是阿里最擅长、也最想复刻的路径:让入口连上交易。 但问题也同样尖锐:阿里历史上跨部门协同一直被认为是“拖慢创新的第一障碍”,多个项目折在了资源协调上。千问APP能否打破这一魔咒,仍是未知数。 尽管不确定性很多,千问上线首周的数据还是给资本市场打了一针强心剂。投资者开始重新审视阿里在消费级AI上的潜力。光大证券国际策略师Kenny Ng表示:“千问是否能够带动阿里C端业务,将成为影响公司未来估值的关键因素。市场更将千问的亮相视作‘阿里开始对标 OpenAI 的第一步’。” 换言之,千问的成败,不只是一个应用的问题,更关乎阿里能否重新获得AI的“入口权”,能否重新定义自己的增长曲线。
田渊栋、卡帕西力荐Nano Banana新玩法:论文变漫画、手写解题以假乱真,谷歌这波赢麻了
Nano Banana Pro又被开发出了新玩法。 AI大牛田渊栋强烈安利,用整合了Nano Banana Pro生图能力的NotebookLM,硬生生把论文变成了漫画。 效果be like: 其本人直呼这宣传海报比他自己做的好多了。 确实比直接看论文有趣易懂。 谷歌自己人可能都没想到这种打开方式,只是一味地“真不错”。 评论区更是一片求提示词的声音。 NotebookLM的产品负责人都被炸了出来,回应会尽快优化,让其分享和导出更丝滑。 除此之外,这几天网友还解锁了更多新玩法。 Nano Banana解题字迹像真人亲笔 特斯拉前AI总监、OpenAI创始成员Andrej Karpathy(卡帕西)分享用Nano Banana Pro解题也火了。 不管是随手画的草稿,还是各类示意图,它全都能精准识别。 而且输出的解题字迹还真像是真人手写的: ChatGPT核验后认为Nano Banana手写的这些解法基本全对,只有两处小瑕疵: 一是Se₂P₂应为二硒化二磷,原文未标注规范命名;二是拼写错误,“thiocyanic acid”(硫氰酸)被误写为“thoicyanic”。 在卡帕西看来,现在用文本和大模型对话,就像在敲DOS命令行,图形界面(GUI)还没被发明出来一样,而“智能画布”这种可视化、可直接操作的交互方式,才是大模型未来该有的GUI。 没过几个小时,他又发了一条推文,用Nano Banana Pro定制了每周撸铁计划,还直接生成了可打印的海报。 每天该练啥,一抬头就能看到~周二看起来强度爆表,毕竟我特意要求要爷们儿一点。 以及暗戳戳说了句:不好意思,接下来不刷屏发Nano Banana Pro的相关内容啦。 有网友在玩的过程中还发现,给Nano Banana看一道手写的题,它还会模仿真人笔迹,笔记本的版式各方面的质感都高度还原: 这谁还能分清是不是AI生成的。 还别说,真有人怀疑这就是发帖者手写的。 随后卡帕西验证后表示Nano Banana的确能做到,prompt是起始图片+“解决这道数学题,然后用我的手写字体生成更新后的图片”。 我们截图发给Gemini,Gemini也说是AI生成的,仔细看其笔迹过于完美,每个数字“2”的写法几乎完全一样。 芝士终于在它该在的地方了 凭借Gemini、Nano Banana的强势升级,谷歌这次在AI赛道直接鲨疯了,不仅股价创下历史新高,市值还成功超越微软,妥妥的王者归来。 就在这几天,谷歌CEO劈柴哥还让一个8年老梗圆满了。 2017年,谷歌为安卓手机推出了一个芝士汉堡emoji,把芝士放在了肉饼下面,被眼尖吃货注意到,引发网友群嘲。 劈柴哥当年半开玩笑地道歉,调侃谷歌要“放下所有工作”解决芝士汉堡emoji的错误结构。后来在Android 8.1系统中,谷歌把emoji修正为芝士在肉饼上的版本。 如今劈柴哥再度发推,发了一张Nano Banana Pro拆解汉堡结构的示意图,配文“你懂的”: 图中清晰标注,芝士片必须放在肉饼上面,这样才能正常融化,完美呼应8年前的emoji乌龙,算是把这个陈年梗圆明白了。 马斯克评论区发emoji,大有多年前射出的箭,如今正中眉心的意思。 这看似只是芝士放对地方的小进步,背后却是这么多年AI技术质的飞跃,它意味着AI已经能理解物理世界的逻辑,精准处理物体相对位置、进行空间定位。 正如科技投资人、Coinbase前CTO Balaji Srinivasan所言: 谷歌是真的押上了全部资源深耕AI,而Gemini 3的发布,标志着他们正式夺回了领先地位,至少目前是这样。 参考链接: [1]https://www.businessinsider.com/sundar-pichai-cheeseburger-google-comeback-2025-11 [2]https://x.com/karpathy/status/1992655330002817095 [3]https://x.com/tydsh/status/1992440158839550330?s=20 [4]https://x.com/immasiddx/status/1991918223454003346
月之暗面估值或达40亿美元,或于明年下半年IPO
中国AI企业月之暗面(Moonshot AI)再度成为业界焦点。 据多位知情人士透露,该公司正与IDG资本、腾讯等国际顶级投资机构洽谈新一轮美元融资,估值有望飙升至40亿美元。与此同时,市场传闻其计划在完成本轮融资后,并于2026年下半年启动IPO。 知情人士透露,月之暗面此次融资规模预计达6亿美元,投前估值约40亿美元。若谈判顺利,这将是该公司继2024年8月3亿美元融资后的又一里程碑。 值得注意的是,本轮融资领投方并非此前盛传的腾讯或海外风投机构a16z,而是转向IDG资本,腾讯、五源资本、今日资本等原有股东亦参与跟投。 就在不久之前,月之暗面发布的Kimi K2 Thinking模型凭借460万美元的超低训练成本,刷新了DeepSeek的训练成本记录,在一些开源模型排行榜上超越了GPT-5,一度登顶全球第一,引发行业震动。 尽管Kimi K2 Thinking表现亮眼,但其与GPT-5的差距仍不容忽视。斯坦福大学AI实验室的最新评测显示,Kimi在复杂多轮对话中的连贯性得分比GPT-5低18个百分点。如何突破Transformer架构的天花板,仍是摆在中国AI企业面前的难题。 月之暗面官方否认了“明年下半年IPO”的具体时间表,但仍有知情人士表明其上市筹备已在进行中,公司正在与投行接洽,评估纽交所、港交所双重上市的可能性。 站在40亿美元估值的新起点,月之暗面的IPO征程既是荣耀加冕,更是生死考验。在这个中美科技博弈的关键时刻,其每一步动向都将牵动全球AI产业的神经。 不过,相较于OpenAI 5000亿美元的惊人估值,中国AI企业的估值普遍相去甚远。月之暗面40亿美元的估值上限,仅相当于其美国同行的1/125。 月之暗面目前的营收主要来自B端API调用与定制化解决方案,2023年营收约2.1亿元人民币。相较之下,OpenAI单季度营收已突破10亿美元。但纵向对比国内同行,其38亿美元的投前估值已超过大多数垂直领域独角兽,跻身中国AI赛道第一梯队。 此轮融资之后,Kimi将成为继MiniMax和智谱后第三家跃进300亿元人民币俱乐部的国产大模型厂商。 此外,有消息传言,同为中国“中国AI四小龙”之一的MiniMax,已于7月秘密提交港股招股书,智谱AI亦被曝正在遴选承销商,中国AI新晋独角兽或将逐步开启上市潮。(作者|陶天宇,编辑|李程程)

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。