行业分类:
加载中...
头条分类:
加载中...
强得离谱!实测Nano Banana Pro:甚至不想叫它AI,这是视觉层面的AGI
卧槽 真的,兄弟们 这一次,我真的词穷了 昨晚谷歌继Gemini 3 pro 后又扔出了王炸——Nano Banana Pro(核心就是 Gemini 3 Pro Image 模型) nano banana已经很厉害了,pro我直接跪了 我看着屏幕,脑子里只有两个字在无限循环:离谱 这是 Gemini 3 pro 的大脑直接长出了眼睛和手。它不仅能看懂你在说什么,它甚至比你更懂物理、懂代码、懂财报、懂生物! 为了证明我没瞎吹,我把外网大神们测出来的 名场面 全都搬来了 坐稳了,车速很快,熬夜爆肝奉上! 1. 文字与逻辑的“降维打击”:人类历史上最强的压缩算法 Nano Banana Pro 的渲染能力,让我觉得以前用的都是假 AI 案例一:论文秒变板书 直接把一篇枯燥的学术论文扔进去,要求把它变成教授讲课的白板。 提示词:把这篇论文变成教授的白板板书图像:要有图解、箭头、框图,以及解释核心概念的视觉说明。使用彩色绘制 这里我们把《Attention Is All You Need》论文扔进去,结果?你们自己看: 自动播放 这不仅是画得像,它是真的读懂了论文!拼写,箭头逻辑、核心概念解释……!这基本上是人类历史上最强的压缩算法 案例二:代码直接变图 更骚的来了,有人喂给它一段 Gemini 3 生成的 AI 计算提交记录的 原始 Graphviz 代码(DOT 语言代码)。注意,是代码! 它都不带喘气的,直接一次性渲染出了带 Logo 的完美图表 案例三:博客变杂志 文字排版能力也是天花板级别。把 Gemini 3 发布官方的技术博客扔进去,让它生成一张“放在桌上的精美杂志内页” 提示词:把整段文字逐字逐句地放入一张放在桌上的光面杂志文章照片中,要有照片、精美的排版设计、引语和大胆的格式 看这排版、这引语设计,你说这是设计大师排了一下午我都信 2. 它真的“懂”这个世界(硬核知识库) 以前的 AI 是瞎蒙,Nano Banana Pro 是真懂。因为它背后连着 Google Search 和 Gemini 3 的推理大脑 案例四 & 五:硬核工艺与生活幽默 看看这个关于「PCB电路板制造全流程」 的图。这可是硬核工业流程! 提示词: Explain all the steps in PCB manufacturing: 1. Design & Output: Creation of schematic and layout (Gerber files). 2. DFM Check: Design for Manufacturability review to catch errors. 3. Film Generation: Laser plotting of photo films for each layer (or Laser Direct Imaging). 4. Surface Preparation: Cleaning and roughening the copper laminate. 5. Inner Layer Imaging: Applying photoresist and exposing it to UV light to define traces. 6. Etching: Chemical removal of unwanted copper, leaving only the circuitry. 7. Resist Stripping: Removing the hardened photoresist. 8. AOI (Automated Optical Inspection): Scanning inner layers for shorts or opens. 9. Oxide Application: Chemical treatment to improve bond strength between layers. 10. Lamination: Stacking layers with epoxy (prepreg) and bonding them under heat and pressure. 11. Drilling: Computer-controlled drilling of vias and mounting holes. 12. Desmearing: Chemical removal of resin residue from drill holes. 13. Electroless Copper: Depositing a thin layer of copper to make hole walls conductive. 14. Panel Plating: Thickening the copper layer in the holes and on the surface. 15. Outer Layer Imaging: Applying photoresist to define the outer circuit pattern. 16. Pattern Plating: Plating additional copper onto exposed traces and holes, followed by Tin Plating (which acts as an etch resist). 17. Resist Stripping: Removing the photoresist to expose the unwanted copper. 18. Etching: Removing the unwanted copper (the tin protects the desired circuitry). 19. Tin Stripping: Chemically removing the protective tin layer. 20. Solder Mask: Applying UV-curable ink (usually green) and exposing it to define solderable areas. 21. Silkscreen: Printing component legends, logos, and text (white ink). 22. Surface Finish: Applying a conductive finish to exposed pads. 23. Electrical Testing: Checking for electrical continuity and isolation (Flying Probe or Bed of Nails). 24. Profiling: Cutting individual boards from the production panel (V-scoring or Routing). 25. Final QC: Visual and dimensional inspection before packaging. 它不是在瞎画,它是真的把蚀刻、层压、钻孔等这25个步骤画对了! 反过来,让它画个无厘头的“如何烤面包”: 提示词: 我要个烤面包流程图,要多搞怪、多夸张、多复杂有多复杂 逻辑清晰,文字准确,甚至还自带幽默感! 案例六:视觉版 AGI 甚至在生物学领域,只说一句:“画一个T细胞激活的卡通图,展示信号级联。” 它自己上网查了资料,画出了完整的信号通路! 这就是为什么那位大神惊呼:“这就叫视觉层面的 AGI!” 案例七:实时搜索能力 还有这个 Datasette 开源项目的解释图。提示词只有9个单词:Infographic explaining how the Datasette open source project works, 它自己通过 Grounding with Google Search 搜到了Logo、UI界面,甚至连“Data Ingestion”这种专业术语都搞定了 3. 生产力神器:最强“数据压缩机” 打工人们,这东西能救命。 案例八:财报秒变图 Nvidia Q3 几十页的财报 PDF,扔进去 结果: 一张精美的信息图 案例九 & 十:万物皆可图解 扔给它一张流体动力学的照片,问它“发生了什么物理现象?”它能给你出个图解说明 让它画个太阳系图表并给每个行星加个冷知识注释? 4. 创意与控制力:强迫症被治愈了 最后,聊聊对于创作者最重要的:一致性 和 可控性。 案例十一:14个角色的地狱级挑战 提示词要求生成 14个 毛茸茸的角色挤在沙发上看电视 提示词:中景镜头,14个毛茸茸的角色挤在一张破旧的米色布艺沙发上……整体氛围温暖、舒适且愉快 注意是14(最多支持14)个! 案例十二:时间旅行与幽默感 有个哥们让它生成一个人从出生到80岁的照片 提示词: "Generate the holiday photo of this person through the ages up to 80 years old" 最神的是,它给2020年的照片里的人戴上了口罩 😂。这细节,绝了! 案例十三:真实感 如果不说,你可能以为这是照片。但这是 Gemini 3.0 Pro Image 生成的。角色一致性直接封神 不说了,我得再去跑几张图压压惊,这玩意儿,真神,最后分享一个中文文字渲染图像
小米:补贴退了,汽车真撑得起门面?
小米集团于北京时间 2025 年 11 月 18 日晚的港股盘后发布了 2025 年第三季度财报(截止 2025 年 9 月),要点如下: 1. 整体业绩:小米集团收入 1131 亿,同比增长 22.3%,其中传统业务(手机 x AIoT)收入同比仅仅增长 1.6%,本季度的增长主要来自于汽车业务的带动。 毛利率提升至 22.9% 的相对高位,主要是受到了汽车业务占比提升带来的结构性支撑,而手机业务的毛利率受竞争加剧影响有所下滑。 2. 汽车业务:小米集团本季度汽车相关收入 290 亿元,基本符合预期。其中公司本季度汽车出货量 10.9 万台,单车均价进一步提升至 26 万元。主要是受价格相对较高的 YU7 出货增加,结构性带动汽车均价的提升。 本季度汽车业务毛利率继续提升至 25.5%,而市场预期为25.6%。不过环比上季度小幅下滑,主要是高毛利率的 SU7 Ultra 占比减少。 海豚君测算本季度小米汽车业务核心经营利润为 6.8 亿元(财报中披露的 11 亿,剔除了 4 亿元的股权激励相关费用),首次实现盈利。 3. 手机:460 亿,同比下滑 3.1%,符合市场预期 458 亿。其中小米手机本季度出货量同比增长 0.5%,而小米手机均价同比下滑 3.6%。而在市场竞争影响下,手机业务毛利率本季度继续下滑至 11.1%。 分市场看:小米手机在国内市场的出货量同比下滑 1.8%,而海外市场的出货量增长 2.7%。在国补收紧的情况下,小米手机在国内市场出货和份额同比再次下滑。如果后续存储继续涨价,手机业务不仅是销量问题,毛利率也会承压。 4. IoT:276 亿,同比增长 5.6%,市场预期 381 亿。IoT 增速大幅回落(前三个季度同比增长 40%+),而本季度增速回落主要是受大家电下滑的拖累。 由于大家电的单价相对较高,有的产品补贴力度可能达到了 1—2 千元。因而在补贴收紧后,直接影响了大家电业务的需求。 5. 互联网服务 94 亿,同比增长 10.8%,市场预期 92 亿。增长主要来自于广告业务的带动,而增值服务环比略有回落。其中 MIUI 用户数同比增长 8%,而 ARPU 值仅增 2%。 分地区来看:本季度海外互联网收入 33 亿元,而国内互联网收入约为 61亿元,国内和海外的 MIUI 用户数本季度都继续增长。 6. 利润端:主营业务核心经营利润 67 亿,调整后净利润 113 亿(不认同净利润的调整方式,参考即可,不需过多关注)。 其中小米公司传统业务的核心利润约为 60.3 亿元,汽车业务首次实现盈利为 6.8 亿元。公司本季度核心利润的环比下滑,主要是受传统业务利润缩水的影响。 海豚君整体观点:补贴过了,用什么来回答增长? 小米本次财报情况和此前 Preview 时沟通得已经比较明确了,核心经营数据基本符合此前 Preview 已经下调后的预期。 本次财报主要展现了传统业务的压力:其中手机业务面临市场竞争加剧影响,本季度收入和毛利率出现下滑;同时在“国补收紧”的情况下,IoT 业务本季度增速大幅回落至 5% 左右。 尤其是 IoT 业务中的大家电产品,有没有国补,最终支付价格可能差距在 1—2k 及以上,这直接影响了终端用户的购买行为。原本大家电产品是公司 IoT 业务的主要推动力,而本季度国内大家电收入更是出现了两位数的下滑。 相比于本次财报,此前小米股价从 50+ 港币持续下跌至 40 港币附近,其实也体现了市场对公司的汽车业务和传统业务两方面的双重担忧: a)汽车业务:新品“真空期”+ 订单回落,供求格局可能在明年就会出现逆转。 小米 10 月的汽车交付量已经提升至 4.86 万辆,环比于 9 月又增长了 6000 多辆,受益于公司此前的积压订单和二期工厂的爬坡,这主要体现了小米汽车过往的订单表现。 相比于交付量,市场更为关注的是小米汽车当前的订单情况。从近期的订单情况看,小米的周订单已经下滑至 4—5 千辆左右,大致对应每个月的新增订单不足 2 万辆,这其实是相当危险的信号。 这意味着当前小米订单的消耗量快于新增订单(单月消耗的积压订单大约在 3 万辆左右),而随着小米订单“蓄水池”水位的下降,小米汽车的供需关系可能会从“供不应求”转为“供过于求”。 结合小米汽车官网的预定情况看,当前小米 SU7 基础款在 28—31 周,SU7 Pro 和 SU7 Max 交付周期仅仅 6—9 周;YU7 交付周期仍保持在 32—40 周。 其中 SU7Pro 和 SU7Max 交付周期缩短至年前交付,这可能是公司的一种策略来提高 SU7 整体均价和降低公司对增值税补贴的影响。 综合来看,海豚君预估当前小米汽车综合交付周期仍然达到了 30 周左右,对应将近 40 万辆的在手订单。 在小米公司近期不推出新车的情况下,如果公司保持周订单 4000—5000 辆的状态,结合二期工厂的爬坡表现,海豚君预估公司将在明年年中就将消耗完“囤积”订单,进入“供过于求”的需求导向型情形。 b)传统业务(手机 xAIoT):国补收紧和存储涨价,压低了市场对公司的明年预期。 ①IoT 增速明显回落:在国补政策的推动下,公司 IoT 业务在此前三个季度连续实现了 40%+ 的同比增长。 而随着各地把国补政策调整为“抢券或抽签”形式后(实际是变相“收紧”),本季度 IoT 业务的同比增速大幅回落至个位数增长。(毕竟国补能带来 15%—20% 的折扣,如果没有抢到国补资格,部分消费者可能就会选择不买或延迟购买。) 公司本季度给出了这样的表现,也直接打碎了此前 IoT 业务持续高增的预期。如果明年国补继续“收紧”,在今年高基数的基础上,IoT 业务存在负增长可能性。 ②手机面临存储涨价压力:小米把今年旗舰新品发布会再次提前了一个多月,追着苹果在 9 月末就发布,并全面对标苹果分别命名为 “17/17Pro/17ProMax”。 然而相比于 iPhone17 基础版“加量不加价”的诚意(价格不变,从 128G 提升至 256G),小米本次发布的新机则有些平平淡淡。 换句话说,苹果 17 新品(256G)叠加国补后价格在 5499 元,拉近了与小米旗舰机型之间的价格差距,而小米本次并未给出更具吸引力的价格。 市场对本次发布会是不太满意的,小米公司在发布会后当天股价再次下跌。 另一方面,存储价格的持续上涨,直接影响了明年的预期。存储成本的上升,要么终端厂商承担,要么通过涨价转移给消费者。前者会影响公司的毛利率,后者会影响市场的需求表现。 公司本季度手机毛利率已经下降至 11% 附近,如果存储在明年继续涨价,明年手机等电子产品的需求和毛利率都将继续承压。 综合来看,在“传统业务+汽车业务”双重承压的影响下,公司股价已经出现了频频下跌。在现阶段,相对更重要的是对小米公司在本轮下跌后的底部估值进行测算。 在悲观情形中的假定是小米公司的传统业务在 2026 年实现个位数增长、而汽车业务在下半年结束“供不应求”的局面,预估公司 2026 年传统业务的税后核心经营利润约为 300 亿元;汽车业务的收入约为 2200 亿元。 总的来说,小米公司当前处于多重利空的影响下,而手机新品已然发布和汽车新品发布进入“真空期”,这在短期内很难给市场注入信心。 以下为详细分析: 一、整体业绩:汽车业务成主要推动力 由于汽车业务的加入,现在小米的财报除了之前的“手机 X AIoT”,现在也新添加了“汽车及创新业务”两大类。 小米将“汽车及创新业务”单独分项披露,足以体现公司对汽车业务的重视程度。而公司市值能打破万亿天花板,主要是由汽车业务带来的期待,这也是公司未来进一步突破的关键因素。 1.1 营收端 小米集团 2025 年第三季度总营收 1131 亿元,同比增加 22.3%,市场预期 1125 亿元,公司本季度增长主要来自于汽车业务。 1)原本的业务——手机 X AIoT 业务(传统业务)实现营收 841 亿元,同比增长 1.6%。其中硬件业务表现较弱,手机业务同比继续下滑,IoT 业务增速回落至个位数; 2)本季度小米的智能汽车等新业务实现营收 290 亿元,本季度出货量和均价都有所提升,主要是受 YU7 量产爬坡的带动。 1.2 毛利率 小米集团 2025 年第三季度毛利率 22.9%,市场预期 22.7%。其中本季度手机业务毛利率在本季度再次下滑,汽车是毛利率提升的最大贡献项。 a) 小米老业务毛利率 22.1%,本季度受市场竞争加剧的影响,手机业务毛利率环比下滑。 此外公司传统业务中的其他业务本季度毛利继续亏损 3.5 亿元,其中包含了空调安装等相关服务。如果把这部分毛亏计入 IoT 业务中,IoT 的真实毛利率应该在 22.7% 左右。 2)汽车等新业务毛利率 25.5%, 市场预期 25.6%。本季度汽车业务毛利率环比有所下滑,受相对高毛利率的 SU7 Ultra 车型占比减少的影响。随着 YU7 上市和二期工厂量产爬坡,小米汽车业务毛利率有望再次走高。 综合来看,当前小米汽车业务的毛利率已经超过了传统业务。在规模效应和毛利率提升的带动下,公司汽车业务在本季度已经实现了盈利。 二、汽车业务:积压订单去化进行时 分项中,现在汽车是重中之重,先看汽车:收入 283 亿,加上汽车的周边业务,合计起来是 290 亿,基本符合市场预期。 其中销量 10.9 万基本已知,单价 26 万,环比增长 2.8%,随着公司今年发布的新车型 YU7 量产出货,带动了汽车整体均价的提升。 本季度毛利率 25.5%,环比上季度有所回落,主要是由于相对高毛利率的 SU7 Ultra 在本季度占比减少影响了本季度的毛利率表现。但认为随着 YU7 量产的增加,在规模效应的影响下汽车毛利率仍有望再次走高。 当前小米汽车业务仍然有大约 40 万辆的积压订单,依然是“供不应求”的局面。当前主要关注公司的产能爬坡情况,从 10 月交付量来看,公司当前合计月产能已经达到 5 万辆左右,预估小米汽车在 2025 年末/2026 年初有望达到 7 万辆的月产能,进一步加快“积压订单”的交付。 而随着“积压订单”的消耗,小米汽车的当下最重要的指标不是周销而是周度订单。当前小米汽车的周订单已减少到仅有 4—5k 台,相对较弱。 同时供给侧,随着小米汽车产能的爬坡,汽车的交付周期实际是在缩短的情况下,9 月以来小米周订单未见提升(如果是等待周期的因素,交付周期缩短,订单应该回升)。 由此可见,在其他车企陆续发布新车的情况下,小米面临的市场竞争是加剧了。 如果小米继续维持 4—5K 的周订单表现,那么在明年年中就会消耗完当前的“积压订单”。小米汽车的业绩也将从“供不应求”的局面转变成“需求”驱动型导向。 近期是小米新品发布“真空期”,难以打入相对乐观的展望。后续还要关注小米新品发布情况和周订单的变化,来提振需求和信心。 三、手机业务:继续下滑 2025 年第三季度小米智能手机业务实现营收 460 亿元,同比下滑 3.1%,主要受国补收紧和竞争加剧的影响。 海豚君将小米的智能手机业务进行量价分拆: 量:本季度小米智能手机出货量 4330 万台,同比增长 0.5%。 分市场来看:①国内市场,在国补收紧的情况下,小米手机在国内市场份额同比下滑至 14.6%,受市场竞争加剧的影响;②海外市场,小米手机同比增长 2.7%,海外市场份额同比持平。 价:本季度手机出货均价 1062 元,同比下滑 3.6%。本季度低价机型销售占比更多,导致公司手机均价出现结构性回落。 本季度手机业务毛利率 11.1%,环比下滑 0.4pct,主要是由存储等核心零部件成本上涨和市场竞争加剧因素的影响。而随着存储的涨价,对低价机型的毛利率影响会相对更大。 四、IoT业务:国补退坡,增速大幅回落 2025 年第三季度小米 IoT 业务实现营收 276 亿元,同比增长 5.6%。受国补退坡的影响,IoT 业务中的大家电品类出现两位数的下滑,直接影响了 IoT 业务的增速表现。 本季度 IoT 业务中增长较好的是扫地机器人、移动电源、电动滑板车和可穿戴产品等。 本季度 IoT 业务的毛利率 22.9%,环比提升 0.4pct,受毛利率较高产品(如可穿戴产品等)占比提升的带动。 五、互联网服务:广告仍是核心变现方式 2025 年第三季度小米互联网服务业务实现营收 94 亿元,同比增长 10.8%。本季度主要的增长驱动还是在广告上: a)广告服务:72 亿元的单季收入,同比增长 16.1%。本质上,小米广告所占据的核心广告场景——应用分发和 APP 预装,几乎是各大 APP 厂商必交的分发税,尤其是 APP 预装,其实和手机出货量强相关,广告几乎是躺赚。 b)增值业务:这部分主要是游戏分发、小米电商——有品,和小米金融等。这部分收入约为 22 亿,同比下滑 3.6%。金融在宏观逆风下蛰伏、游戏分发渠道话语权下降,有品电商没啥水花,这部分增值业务基本没啥指望。 整体上,这块业务长期还是依附于硬件出货量的收入逻辑。小米在重新处理的收入归类中,把它总体归于 Legacy 业务。只有将软硬结合后,公司作为手机厂商才能继续讲互联网变现的逻辑。 然而即使将互联网业务归于 Legacy 硬件业务中,整体毛利率也已经被汽车业务反超。 六、海外市场:软件服务持续增长,硬件仍然低迷 2025 年第三季度小米海外收入 401 亿元,同比下滑 0.2%,此前受国内市场国补政策及小米汽车突破的情况下,公司把重心主要放在国内市场,海外市场收入占比下滑至 35% 左右。 具体拆分来看,本季度小米海外互联网业务增长了 19.1%,达到了 33 亿元;而公司的海外硬件收入同比下滑 2%,反映海外硬件市场需求依然相对较弱。 七、利润:汽车业务首次“扭亏为盈” 2025 年第三季度小米三项费用合计 192 亿元,费用率回升至 17%。其中一部分是因为汽车业务导致的,汽车业务经营费用继续增加至 67 亿。 剔除汽车业务看,传统业务部分的经营费用约为 125 亿元,同比环比也均有提升。其中传统业务的经营费用率提升至 14.9%,主要是受小米之家及汽车销售门店增加以及加大研发投入影响。 2025 年第三季度调整后净利润 113 亿,但海豚君一直以来,并不认同小米调整净利润的方式——财务收益不调出,同时自己所投资公司的股息收益不调出。但是这些即使可持续,并非公司主营业务,无法体现盈利的长期持续能力。 整体上,海豚君更加关注的是上面的核心经营利润(收入-成本-三费),它才是更能真实体现公司持续经营主营业务盈利能力的指标。 本季度公司实际的核心经营利润 67 亿,核心经营利润率为 5.9%,主要是受手机毛利率承压及费用端增加的影响。 具体来看,公司本季度传统业务的核心经营利润约为 60.3 亿元,汽车业务的核心经营利润约为 6.8 亿元(财报中提到的 11 亿,未剔除股权激励的 4 亿元)。 作者:海豚君
Nano Banana Pro最全实测:强到离谱
Nano Banana Pro 来了。 再一次炸了! 我连夜测试完新功能,看着屏幕上的结果,心里有数次的卧槽。 真的强到离谱,设计从此不存在了! 01. 完美解决各种文字问题 不能很好的控制文字,特别是汉字,对于一个文生图工具来说,功力至少废了一半。 但这次,Nano Banana Pro 彻底解决了文字问题,而且,真是吊打市面上所有产品! 先看下和之前的对比,这效果已经非常直观了。 图: Nano Banana 前后的文字处理对比 搞定文字对 Nano Banana Pro 似乎根本不是问题,甚至于它的理解力都超乎了想象,比如我直接说: 给这句古诗配图:两岸猿声啼不住,轻舟已过万重山。 提示词:给这句古诗配图:两岸猿声啼不住,轻舟已过万重山。 看到这个的图出来,我只想说:卧槽Σ(°ロ°) 我并没有说上面要有文字,结果这理解力绝了,而且还是竖排的,配图也完美契合了诗的意境。 既然中文这么强,繁体它能搞定吗?我必须让它试试港风。 提示词:霓虹闪烁的80 年代香港旺角街头夜景,有个霓虹灯牌上写着“可口可樂”,一杯可口可乐融合在霓虹灯管设计中 看到没,这个“樂”我是故意写的繁体,非常完美。而且仔细看街头情况,真的很像 80 年代香港的感觉,那些灯牌的字体也真的。。去过的都懂。 再来看一个我们在书中经常看到的那种带注释的插图。 提示词:古籍插画风格。一张精细的中国龙解剖图,展现其内部结构,并用清晰的中文标签(例如:“龙鳞”、“龙爪”、“龙珠”)进行标注。画面风格庄重,带有古代学术气息。 看到这个,我真的跪了,这不会是直接从我们国家的古籍中取出来的吧。 字也就算了,那些印章都清晰可辨。 如果这些都不够震撼,你再看看这个吧。 图:在墙上写字 就问你服不服? 当然,还可以直接换文字。 提示词:上面的文字换成“非常可乐” 这里我说:把上面的文字换成“非常可乐” 谷歌这次真是把文字玩出花了,还可以这么操作: 提示词 :一张极具食欲的美食摄影图,俯视视角。深色的木质纹理桌面上,堆满了鲜红的干辣椒和花椒。这些辣椒被巧妙地排列,组成了立体的四个汉字:“热辣滚烫”。辣椒的表面有真实的褶皱和光泽,周围散落着几颗八角,光线温暖诱人,景深微距。 如果说之前文字,特别是中文是 Nano Banana 的短板,那么我只能说:现在短板都变成了它的优势了! 02 全能视觉设计师 Nano Banana Pro 接入 Gemini 3 和 Google 搜索后,身份彻底变了。 就,它不在只是帮你画你要求的东西,而是可以帮你上网查好信息再画出来。 在路边看到一只超可爱的猫,想知道是什么品种,又懒得去翻百科?现在,直接拍张照扔给它。 提示词:(上传一张布偶猫的照片)制作一张关于这个猫咪品种的信息图,重点突出它的性格特点、起源地和饲养“雷区”。采用柔和的奶油色调,手绘风格。 我有一种预感,小红书马上都要被这种图淹没了。。 它还可以当手工老师,比如说想学折纸(比如千纸鹤),看视频跟不上,看文字看不懂? 我让 Nano Banana Pro 帮我画一张“分步图解”。 提示词:制作一张信息图,展示“如何折一只千纸鹤(Paper Crane)”。包含 6 个关键折叠步骤的分解图,并标注出折痕方向(山折/谷折),极简线条风格。 这玩意这绝了!什么菜谱,一切的一切分解动作都可以让它来搞定了。 提示词:创建一个展示如何制作 Cappucino的信息图表 它不是在瞎画,而是真的理解了从纸张到成品的每一步变化,连虚线标注都清清楚楚。 以前要画半天的说明书,现在几秒钟搞定。 提示词:创建一个展示汽车发动机构造的信息图表 最炸裂的是联网能力。以前 AI 只能画“历史”,但有了搜索,它能画出“现在”。 我让它画一张此时此刻上海天气图。 提示词:通过搜索获取上海(Shanghai)当前的实时天气信息(温度、天气状况、湿度),制作一幅水彩画(Watercolor)风格的天气海报。背景是外滩(The Bund)的标志性建筑剪影,用艺术字体突显核心气温。 通过搜索我们能做的事情就太多了,比如股票行情等等,都可以实时画出来。 这,真的是彻底的解锁了一项新技能。 前所未有。 03. 不止 4K 之前的 Nano Banana 虽然强大,但缺连 2K 都到不了,基本干不了啥事。 而这次,直接上2K,4K 都上了。 图:在 AI Studio 中可以选择 4K 不过这玩意在aistudio 里可以选,在 Gemini 里面还不知道怎么用,直接在提示词里面加“4K”貌似不行,有知道怎么弄的朋友在评论区告诉我一下。 提示词:上海繁忙街头,时尚年轻亚洲女性全身照。穿着有质感的米色风衣和围巾。柔和自然光,景深,面部对焦清晰,复杂的城市背景,Raw原片风格,照片级真实。 Pro 也支持各种常见的长宽比,但比这更牛逼的是同一张图,我们可以切换各种比例,而让人物保持在合适的位置。 图:Pro 可以方便的切换各种高宽比 更离谱的是,它还能控制一张照片的焦点。 提示词:焦点在花上 这次更新在数码后期处理方面有非常多亮点,除了控制景深,还可以控制光线等。。 04 超强的一致性和多图片融合 之前,AI 最大的问题是视觉漂移——角色换个姿势就变脸,品牌换个场景 Logo 就歪了。 Nano Banana Pro 的这次升级简直离谱,它能一次性融合 15 张图(但我测试的时候提示最多上传 10 张)。 图:在 Pro 种一次引用 10 张图片 这 10 张图可以合成一张,比如这样 图:一次融合 10 张图片 这意味着啥?你可以将所有需要的风格、材质和参考资产一次性输入,锚定最终的视觉效果。 对于连载和故事板创作来说,这也是革命性的。它能同时保持最多 5 位人物的一致性和相似度。 图:5 张素材图 可以变成这样 图:5 张图片融合在一起 这彻底解决了连载漫画或故事板中主角“变脸”的难题。 做过连载漫画的朋友肯定懂那个痛,这一帧跟下一帧完全没法保持形象一致。 但昨晚的测试,让我看到了一部“连续剧”。 我突发奇想,让漫威最贱的死侍,穿越到了《龙猫》的公交站。 图:三张图保持角色一致 角色的记忆力测试完了,我们来测测产品。 这对于需要大量视觉资产的电商设计师来说,简直是救命的功能。 首先,我构思了一款虚构的联名跑鞋,并让 AI 精准地画出它的“身份证”。 提示词:设计一张“赛博朋克风”联名限量版跑鞋。配色为黑色和荧光绿。要求鞋面有复杂的机甲纹理、发光线条和醒目的品牌Logo。放在专业摄影棚的白色背景中,细节锐利,专业布光。 接着,我要求 AI 保持这个设计语言,裂变出不同配色,就像一个系列产品一样。 提示词:保持这双鞋的设计和纹理不变。现在生成三双鞋并排展示:分别是原版黑绿配色、火焰红配色和冰晶蓝配色。要求版式统一,细节清晰,像产品目录一样。 这里比较有意思的是,我不需要下载、上传之前的图作为参考,而是直接在对话里面说保持不变就可以了。 最后,我要把它扔进现实世界,看它是否还能记住这双鞋的长相。 提示词:将第一双黑绿配色的球鞋放在一个潮湿的东京街头。特写镜头,地面有霓虹灯反射的水洼,一名时尚模特穿着这双鞋在街上行走,景深效果。 这就是“上下文记忆”的恐怖之处。 它不仅记住了那双鞋的复杂纹理,还能自动处理它在不同光影和透视下的表现。 这简直就是电商设计的神技。 05. 商业海报:直接出图,不玩虚的 最后,看看它能不能帮我们干活。 提示词:一张电影海报,风格为“赛博朋克京剧”(Cyberpunk Peking Opera)。海报主视觉是一名京剧武生站在霓虹灯闪烁的未来城市中。片名《机械霸王别姬》和宣传语:“当传统遇到未来。” 直接就是一张电影预告海报,字体排版极具张力。 Nano Banana Pro 极其强大一个功能是复制海报。 比如左边的是原图,我只要说:把雪碧换成可口可乐,其他不变 提示词:把雪碧换成可口可乐,其他不变 几秒钟,一张新的海报出来了,毫无违和感! 再比如,我说:把人物换成 Elon Musk 提示词:把人物换成 Elon Musk 卧槽卧槽! 以后还需要设计师吗?? 06 漫画 最后聊聊我喜欢的漫画。 之前的 Nano Banana 文字出了不了,因此就完全没法生成漫画,毕竟漫画里面有大量的对话。 而这次,全部解决了。 图:Pro 完美的生成了漫画 07 一些有趣的 本来已经写完了,突然发现网友们真是脑洞大开,也给我涨了各种姿势。 比如这种模仿抖音。。 还有,把我这篇文章直接做成杂志: 🤣 好了,就写到这吧。 回顾这一晚的测试,我最大的感受不是“惊讶”,而是“自由”。 曾几何时,Nano Banana 的出现将“文生图”的维度提升到了一个新的高度,但各种硬伤的限制,又让那个高度变得遥不可及。 而这一次,Nano Banana Pro 带着满满的诚意回来了。 它不仅补齐了所有的短板,更凭借着对中文、逻辑、细节和叙事的理解,再次将文生图的能力拉升到了一个全新的维度。 它不再是一个笨拙的工具,而是我们想象力的最佳拍档。 创作的大门,正以前所未有的姿态向所有人敞开。 限制你的,只有你脑海里那个世界,够不够精彩。
高光业绩难抵消AI焦虑 英伟达市值蒸发1万亿、美科技股集体下跌
英伟达 凤凰网科技讯 北京时间11月21日,据《金融时报》报道,当地时间周四,美国股市遭遇剧烈波动,科技股纷纷下挫。市场对英伟达亮眼业绩的乐观情绪,被AI公司高估值引发的新一轮担忧所抵消。 以科技股为主的纳斯达克综合指数走势遭遇大反转,周四早盘一度上涨逾2%,但最终收跌2.2%。标普500指数下跌1.6%。 作为AI热潮的风向标,英伟达在周三盘后公布了好于预期的强劲季度业绩,周四早盘一度上涨超过5%,但最终却以下跌3%收场。截至周四收盘,英伟达股价下跌5.88美元,报收于180.64美元,跌幅为3.15%,市值蒸发大约1429亿美元(约合1万亿元人民币)。 纳斯达克综合指数先涨后跌 英伟达周三盘后公布的强劲业绩似乎缓解了部分担忧。然而,百达资产管理公司的多元资产策略师阿伦·赛(Arun Sai)表示,市场仍对英伟达竞争对手的估值感到担忧,并关注科技巨头们在AI基础设施上的巨额支出何时能带来显著回报。 投资管理公司英仕曼集团首席市场策略师克里斯蒂娜·胡珀(Kristina Hooper)指出,“几周前开始蔓延的市场不安情绪正在持续加剧”。她表示,由于估值高企,英伟达的业绩“仅能暂时缓解这些担忧几个小时”。 除了英伟达外,AMD股价大跌7.84%、英特尔下跌4.24%、苹果下跌0.86%、特斯拉下跌2.17%、Alphabet下跌1.15%、Meta下跌0.2%、微软下跌1.6%。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
营收5700000000美元,英伟达:泡沫?什么泡沫
2025 年 11 月 19 日,美国东部时间下午 5 点,英伟达发布2026 财年第三季度财报。 这一季的数据很夸张:营收 570 亿美元,同比增长 62%,环比多了整整 100 亿美元(+22%),数据中心业务继续飞奔,网络、计算、汽车、专业可视化全部双位数增长。但比数字更值得编译和整理的,是管理层在电话会里给出的那套逻辑: 他们几乎把所有关于“AI 泡沫”的质疑,重新改写成了一场“三次平台大迁移 + 十年基础设施周期”的故事。 基于这份电话会议记录,本文对管理层的核心观点做了一次系统的编译和梳理。 一、成绩单: 570 亿美元的大头,几乎都来自 AI 工厂 先把关键数字捋清楚: 总收入:570 亿美元,同比 +62%,环比增加 100 亿美元(+22%)。 数据中心收入:510 亿美元,同比 +66%,再创新高,几乎就是整家公司。 网络收入:82 亿美元,同比飙升 162%,靠的是 NVLink、InfiniBand 和 Spectrum X 以太网。 计算部门:同比 +56%,核心驱动力来自 GB300 GPU 的放量,Hopper 平台本季仍贡献了约 20 亿美元收入。 游戏业务:43 亿美元,同比 +30%,主要是游戏玩家和本地 AI 需求的叠加。 专业可视化:7.6 亿美元,同比 +56%,DGX Spark 被点名是关键贡献者。 汽车业务:5.92 亿美元,同比 +32%,自动驾驶解决方案是主力。 盈利能力同样“变态”: GAAP 毛利率:73.4%, Non-GAAP 毛利率:73.6%, 都比之前的指引更高。Colette Kress 解释,主要得益于数据中心产品组合、生产周期时间改善以及成本结构优化。 但也不是全是甜蜜,电话会一上来就坦白了三点风险: 中国收入被“掐断”: 由于地缘政治和本地竞争,本季度原本计划的大额订单没有落地,直接影响了高端数据中心计算产品对中国的出货。Colette 还明确表示,在 Q4 的指引里,“我们没有假设来自中国的任何数据中心计算收入”。 投入成本在上升: 面向 2027 财年,内存等关键元件价格抬头,系统复杂度也在增加。公司一边加大采购锁价,一边强调,仍会努力把毛利率“压在 70% 中段”。 库存和供应承诺同步上扬: 库存环比增加 32%,供应承诺环比增加 63%。管理层的态度是:这是主动为未来更大规模的增长“铺货”,而不是需求不行的被动堆库存。 展望第四季度,指引同样激进: Q4 收入指引:650 亿美元,上下浮动 2%,按中值算环比还要再涨 14%,主要由 Blackwell 架构继续放量带动。 毛利率指引:GAAP 和 Non-GAAP 都预计维持在 70% 中段,尽管投入成本上涨。 从这张“财务快照”可以看出一个核心事实: 英伟达现在的财报,其实就是一张全球 AI 工厂建设进度表。 二、CFO 的视角: 三大平台转型 + 5000 亿 Blackwell/Rubin 收入蓝图 在财务数字之后,CFO Colette Kress 用相当长的一段话,把这季的增长放进了一个更大的框架里: “三大平台转型”还在早期 她强调,客户现在集中在三条主线做投入: 向加速计算迁移: 从传统 CPU 通用计算,转向 GPU 加速计算,把原本跑在 CPU 上的大量数据处理、科学计算工作负载搬到 CUDA 平台上。 向大模型/生成式 AI 迁移: 搜索、推荐、内容理解、广告排序,从传统机器学习体系切换到大模型,重写生产线。 向智能体(Agent)应用迁移: 自主推理、规划、调用工具的“智能代理 AI”,开始渗透到编程、医疗、金融、运营等业务线。 她的判断是:这三件事都还在早期阶段,“会波及所有行业”。 Blackwell + Rubin:到 2026 年底要拿下 5000 亿美元营收 Colette 给了一个颇具争议、但已经被资本市场广泛引用的数字: 从今年开始到 2026 年年底,Blackwell 和 Rubin 两代平台,合计营收目标是 5000 亿美元。 电话会记录里,她再次确认这一目标“正在推进”: 部分收入已经在过去几个季度确认; 接下来还有几个季度会持续兑现; 而且,这 5000 亿本身还有“上调空间”:比如当天刚刚宣布的与沙特的合作,未来三年新增 40–60 万块 GPU;和 Anthropic 的协议,同样是原先规划之外的增量计算需求。 在她的叙事里,英伟达的角色很明确: 要在未来十年走向年均 3–4 万亿美元规模的全球 AI 基础设施建设里,做“首选平台”。 “云已售罄”:GPU 安装基础完全被吃满 Colette 多次重复一个说法:“云服务已售罄(clouds are sold out)”;Blackwell、Hopper、Ampere 等几代 GPU 的安装基础“全部在满负荷运行”。第三季度数据中心收入 510 亿美元,就是在这样的高稼动率之上做出来的。配合这点,她给出了一串“案例库”,说明这些算力在被用在什么地方: 互联网平台: Meta 用基于 GPU 集群训练的 Gem 广告推荐基础模型,让 Instagram 广告转化率 +5%,Facebook 信息流 +3%;用户在 Facebook、Threads 等应用上花的时间明显上升。 基础模型公司: OpenAI:周活用户 8 亿,企业客户超过 100 万,毛利率保持健康;Anthropic:年化营收从年初的 10 亿美元,涨到 70 亿美元。其他名字还包括 Mistral、Reflection、Safe Superintelligence、xAI 等。 垂直场景: RBC 用智能体 AI 把分析师写报告的时间,从几小时压缩到几分钟;联合利华通过 AI + 数字孪生,让内容创作效率提升 2 倍、成本下降 55%;Salesforce 工程团队使用 Cursor 后,新代码开发效率至少提升 30%。 这些例子共同指向一个判断: AI 基础设施的投入,已经开始在真实业务里“找回报”,而不止停留在“创新预算”。 五百万 GPU 的 AI 工厂计划 本季英伟达还宣布了一串 AI 工厂和基础设施项目,总量涉及约 500 万块 GPU,覆盖: 公有云 CSP、主权国家数据中心; 制药、制造等行业的“AI 工厂”; 标志性项目包括:xAI 的 Colossus 2 —— 全球首个千兆瓦级数据中心;礼来(Eli Lilly)的 AI 工厂,用于药物研发;AWS + Humane 的扩展合作:部署多达 15 万台 AI 加速器(包括 GB300),以及一座 500 兆瓦的旗舰 GPU 数据中心。 在这套叙事下,“570 亿营收”只是起点,真正让市场紧张的是: 未来两三年,这家公司打算吃下多大一块 AI 基建蛋糕。 1 三、黄仁勋的“反泡沫”故事:三次平台大迁移 轮到黄仁勋发言时,他没有先谈估值,而是直接回应了“泡沫”这个词: “关于人工智能泡沫的讨论很多。从我们的角度来看,我们看到的是截然不同的情况。” 他的核心论点,可以浓缩成一句话: 世界正在同时经历三次巨大的平台级迁移,而英伟达刚好站在这三次迁移的交叉点。 第一次迁移:从 CPU 到 GPU 的加速计算 摩尔定律放缓,传统 CPU 性能/成本的提升越来越难; 大量原本跑在 CPU 上的非 AI 工作负载——数据处理、科学与工程仿真等——正向 CUDA GPU 迁移; 这一层迁移,本质上是为了延续“算力通缩”:用更低的单位成本获得更多计算。 黄仁勋把这部分定义为“基础且必要的转型”: “在后摩尔定律时代,这是至关重要的。” 第二次迁移:从传统机器学习到生成式 AI 第二层,是我们熟悉的那波浪潮: 搜索排序、推荐系统、广告投放、内容审核等,正在从传统 ML/深度学习体系,迁移到基于大模型与生成式 AI 的范式; Meta 的 Gem 模型就是典型案例:依托大规模 GPU 集群训练,把广告推荐效果实打实抬高了几个百分点,这直接体现在收入上。 在这层上,AI 不再只是“节约成本”的工具,而是直接带来营收增量的引擎。 第三次迁移:向智能体和物理 AI 第三层,是“智能体 AI”和“物理 AI”: 这类系统具备推理、规划和使用工具的能力; 从代码助手(Cursor、Claude Code、GitHub Copilot),到医疗放射影像助手(iDoc)、法律助手(Harvey),再到自动驾驶司机(Tesla FSD、Waymo),都被他归类为“智能代理 AI”; 更往下,是与机器人、工厂、车队、城市基础设施深度耦合的“物理 AI”:利用 Omniverse 做数字孪生工厂的台积电、丰田、富士康、Lucid 等;用 Jetson 平台和 Cosmos 世界模型做人形/移动机器人开发的 Agility Robotics、Amazon Robotics、Figure 等。 在他看来,这一层会带来全新的应用、产品、公司和服务,是最具颠覆性的一层。 英伟达如何把三次迁移“捏”在一起? 黄仁勋的自我定位是非常“野心家”的: 在加速计算的迁移中 ,CUDA + GPU 是最成熟的方案; 在生成式 AI 迁移中 ,英伟达在训练、后训练(推理前的强化、微调)和推理三个阶段,都有一整套软件栈和硬件组合; 在智能体和物理 AI 中 ,从数据中心到机器人边缘设备,一条链路都在用同一套架构。 他说得很直白: “无论是 AI 的每个阶段,还是各种不同的计算需求,我们的架构都是通用的。你可以投资一种架构,然后在所有这些阶段和工作负载上放心使用。” 这就是他对“泡沫”质疑的整体回应: 资本市场看的是市值曲线,而他强调的是:三条不同性质的迁移曲线,正在同时发生,且都压在英伟达的 GPU 上。 四、关键问答: 5000 亿订单、供给瓶颈与中国风险 电话会议的 Q&A 部分,补足了很多关键信息。挑几个重点说。 5000 亿 Blackwell + Rubin 收入,还靠谱吗? 摩根士丹利的 Joseph Moore 追问: GTC 上提的2025–2026 年 Blackwell + Rubin 5000 亿美元收入预期,现在还有没有变化? Colette 的回答是: 目标没变,“我们正在按这个路径执行”; 5000 亿中已经有一部分在前几个季度确认; 接下来到 2026 年底,还有几个季度会持续贡献; 而且,“这个数字有上调可能”:和沙特的协议,在未来三年新增 40–60 万块 GPU;与 Anthropic 的合作,则带来了高达 1 吉瓦算力承诺。 ——这些,都还没算在最初的 5000 亿里。 供应能不能赶上需求?ROI 会不会撑不住? Cantor Fitzgerald 的 C.J. Muse 问了一个所有人都在想的现实问题: 一边是大家担心 AI 基础设施建设太烧钱、ROI 与融资能力成问题; 另一边是你们自己又在说“GPU 全部售罄、云都卖空了”。 那么未来 12–18 个月里,供应会赶上需求吗? 黄仁勋的回答重点有三: 供应链规划: 英伟达的供应链覆盖台积电及其封装、内存供应商、系统 ODM 等,“我们和他们做了非常长周期的规划”;“我们原本就计划迎来一个大年”,而现在的需求增长,印证了他们对三个转型的判断。 需求结构: 不仅仅是“聊天机器人”在用 GPU,从数据处理到推荐系统,从生成式 AI 到各种 agent 工具,哪一层都在吃 GPU,且增速都很快。 ROI 来源: 一部分投资来自通用计算迁移,本质上是为了延续“算力通缩”;一部分投资来自生成式 AI 提升现有业务收入;还有一部分来自全新的 agentic & 物理 AI 应用。 换句话说,他认为需求是真实且多层次的,而不是单一领域炒作。 每吉瓦能卖多少钱硬件?谁来为三四万亿 AI 基建买单? BofA 的 Vivek Arya 问得很具体: 在你口中的 5000 亿里,你假设的“每 1 吉瓦数据中心对应多少美元硬件”是多少? 到 2030 年,全球数据中心 3–4 万亿美元投资中,有多少需要靠供应商融资,有多少可以由客户自己现金流支持? 黄仁勋给出了一组有参考意义的量级(非精确指引): 在 Hopper 这一代,一个 1 吉瓦数据中心,相当于大约20–25 亿美元的英伟达数据中心产品; 到 Grace Blackwell/GB200,可能来到30 亿美元以上; Rubin 一代会更高,因为每瓦性能进一步提升。 关键句是这句: “一个吉瓦数据中心就是一个吉瓦功率。你的每瓦性能,几乎直接决定你的收入上限。” 这背后的逻辑是: 电力是刚性约束:一个园区就是 1 吉瓦电进来,不会无限扩张; 在同样的 1 吉瓦电、同样的机房面积下,谁的架构性能/瓦更高,谁就能卖出更多的硬件票面; 因此,架构效率不只是技术指标,而是收入天花板。 至于“谁来为 3–4 万亿买单”,他的回答更宏观: 不能只盯着美国几大云厂商; 每个国家都会为自己的 AI 基础设施买单; 大多数行业的 agentic AI、物理 AI 才刚刚开始,未来会有一波又一波新的融资主体加入。 中国市场:短期清零,长期仍想“留门” 关于中国,Colette 的表态比较直接: 本季度原计划的大额订单并未落地,H20 销售额仅约 5000 万美元; 原因是地缘政治 + 中国本地竞争加剧; 因此公司在 Q4 指引中,假设来自中国的数据中心计算收入为 0。 但黄仁勋也强调,英伟达会持续同中美两国政府沟通,长期目标仍然是: “要在包括中国在内的所有商业企业中,成为开发者和企业的首选平台。” 这意味着,当前对华高端芯片出口的限制,英伟达视为“节奏问题”,而不是长期放弃的市场。 ASIC vs GPU:为什么英伟达认为自己“不可替代”? Wells Fargo 的 Aaron Rakers 问到定制 AI ASIC 的竞争,问黄仁勋是否改变了看法。 他的回答可以总结为“五个维度的护城河”: 覆盖所有转型阶段: 从通用加速计算,到生成式 AI,再到代理式 / 物理 AI,同一套架构都能胜任。 覆盖 AI 的每个阶段: 预训练、后训练、推理这三步都极其复杂,尤其是链式思维等推理型推理,“事实证明推理是最难的”,而英伟达在三阶段都有很强的系统方案。 覆盖所有主流模型: 自回归、扩散、专家混合(MoE)、各种生物/物理模型—— “我们是唯一一个能把所有这些模型跑在一个平台上的架构。” 覆盖所有云和边缘形态: 从公有云、私有云,到本地 DGX Spark 再到机器人和 PC,一套 CUDA 生态贯穿始终,这大幅降低了开发者的心智成本。 带来真正的需求与多样性: 对云厂商、新创云(CoreWeave、Lambda 等)乃至新公司(Humane)来说,把 GPU 算力“挂上架”后,背后是庞大的模型生态和开发者需求,而不是一个“孤立的 ASIC”。 他最后的总结是: “这不是简单往数据中心里塞一个随机 ASIC 的问题。需求从哪来?多样性从哪来?韧性从哪来?英伟达的生态系统,已经证明它能把这些全部带给客户。” 这一次,泡沫没有破裂。音乐继续。 本文来自微信公众号“硅星人Pro”,作者:硅基版
还在说AI泡沫要爆了 老黄的点钞机都快冒烟了
坏了,这回真让老黄装了个大的。 在最新的财报电话会上,面对满屋子华尔街分析师关于“AI泡沫”的质疑,老黄直接发狂了:泡沫?什么泡沫?我怎么看不见? “我们看到的景象与泡沫论截然不同”,并且放出狠话英伟达已渗透至“每一个云、每一台计算机、每一个机器人系统”。 所以老黄这是拿了什么男频爽剧脚本啊,一边是华尔街上疯传AI泡沫要破了,一边是老黄带着史上最强财报啪啪打脸? 让老黄有这么多底气,就是因为今天凌晨,英伟达三季度财报新鲜出炉。 看完这份成绩单,差评君鉴定为夯爆了。 咱们先简单看下几个关键数据,三季度营业收入570 亿美元,同比增长约62%,净利润同比大幅增长65%,均超出外界预期,而且调整后毛利率为73.6%,依旧守住了70%大关。 从细分业务来看,数据中心还是那个带头大哥,Q3收入同比增长66%。在整个营收的大盘子里,数据中心业务占比已经接近90%,这也表明了目前的市场需求依然旺盛,各大科技巨头抢购热情根本没退。 反观游戏业务,尽管收入同比增长30%,但真的越来越边缘化了,游戏佬们真就成了路边一条了。 原本以为在这一轮AI热潮持续了这么久之后,英伟达多少会显出一点疲态,没想到老黄依旧坚挺。 除了现阶段状态火爆,英伟达还是未来可期的状态。 从2026财年Q4的收入展望分析,英伟达给出了650亿美元的业绩展望,这个数据再次超出市场预期。 于是乎,财报一出,英伟达股票一度暴涨6%,重新站回5万亿市值大关。 除了英伟达本身就是科技圈顶流的原因之外,这次财报获得史无前例的关注度,甚至有人觉得它比美联储开会还重要,主要还是大家伙都在犯嘀咕了。 因为在过去的一段时间里,不管是华尔街的分析师,还是硅谷的投资人,都从之前的无脑AI热,变成了怀疑论者。 他们都在想,现在的AI市场,到底是不是存在巨大的泡沫? 不少人还真就觉得AI不仅是泡沫,而且还快破了。 像是谷歌母公司Alphabet的CEO劈柴哥,之前发出警告,表示当前的人工智能热潮中存在“非理性”成分,一旦潜在的泡沫破裂,没有任何公司能够幸免。 大家不仅嘴上这么说,几家头部机构也已经开始用脚投票。 蒂尔宏观基金出售了53.77万股、桥水基金也减持了接近三分之二、软银更是在10月清仓了所有的英伟达股票。 图自证券时报 在外界不少人看来,这帮顶级机构的操作,就差把“孩子们快跑,泡沫要炸”几个字写在脑门上了。 而他们这么操作的理由,大多数分析都是什么增长见顶、AI板块整体都不大行、市场对AI投资回报率和“循环交易”疑虑在不断加深等等。 可面对这些问题,除了用财报回应外,英伟达高层还在财报会上针对性地进行了全面解答。 首先就是所谓的增长见顶,英伟达这边表示我都忙不过来,怎么个见顶法? 英伟达首席财务官Colette Kress掏出了几组数字,从今年初到2026日年底的Blackwell和Rubin平台收入,已有5000亿美元的能见度。 而且,人家还很凡尔赛地表示,这绝不是上限。。。 因为这还没完全算上英伟达与KSA(沙特白头巾)新签的单子,以及与Anthropic的新合作。 而就在昨天,还有更多英伟达的好消息传来,美国刚与沙特签署了人工智能战略合作伙伴关系,并计划在沙特投资建立多个数据中心项目,那这部分硬件供应商会给谁来提供呢,真的好难猜啊。 另一边,英伟达还在疯狂圈地,不断寻找新客户、开发新平台,像Anthropic就要走了1Gw的Blackwell和Rubin系统容量。 到此,世界上主流AI几乎都是英伟达的老铁了,所以老黄又又又很狂地说,“我们是世界上唯一一个能运行所有AI模型的平台”。 关于循环交易的质疑声,老黄也没藏着掖着,他表示外界虽然有人把这视为“左脚踩右脚”,但核心目的其实是“扩大CUDA的覆盖范围和生态系统”。 他的意思是,你们以为我再刷单,其实是英伟达在布道。咱和这些AI大厂合作,不是为了那点短期财报数据(当然,这确实会让财报里的短期需求变好看),为了把CUDA的护城河挖得更深,这是一盘大棋。 在一片质疑声中,唯一真正让老黄头疼的,反而是产能。 因为现在外部需求旺盛坐实了,可英伟达不一定有货啊,缺芯、缺电都是问题。 所以老黄表示在当前的增速和规模下,任何环节都不轻松,但问题都是“可解决的”。 对此,老黄再次发表了暴论,表示英伟达的供应商们完全可以大胆扩产。 没钱?“只要手里拿着英伟达的订单,哪家银行敢不给贷款?” 听听,这说的是人话吗?这就差明着告诉供应商:我的签字,就是印钞机。 不过,英伟达方面也还是表示,公司对无法向中国付运更具竞争力的产品感到“失望”。 然而,好像缺了中国市场,对英伟达暂时的前景确实没有太多影响,因为英伟达目前对第四季度的预估,是假设没有任何来自中国的数据中心计算收入。。。 如果后面两边协商好了,英伟达可以往国内卖货了,老黄的嘴角上扬角度,我都不敢想象哦。 当然了,不少人也觉得,英伟达夯爆了,也不一定就能反映整个AI市场的真实状态。 毕竟淘金热最终能不能让淘金者赚到钱,看的还是能不能真挖到金子,卖铲子的赚麻了也不能真变出金子来。 但这些对老黄、英伟达来说,好像没那么重要了。 只要硅谷的军备竞赛一天不停止,只要巨头们还存在“怕被时代抛弃”的焦虑,英伟达的印钞机就不会停。 至于以后是泡沫先破,还是AI先改变世界? 看着股价重新站上5万亿的老黄,恐怕只会微微一笑:你们慢慢吵,我先去把下个季度的单子签了。 责任编辑:随心
谷歌Nano Banana Pro亮相:打工人的“图像生成神器”来了
财联社11月21日讯(编辑 史正丞)北京时间周四深夜,AI巨头谷歌麾下的Nano Banana图像生成模型迎来重磅更新——Nano Banana Pro闪亮登场! 作为背景,谷歌于今年8月底发布基于Gemini 2.5 Flash模型的Nano Banana。由于该模型能够将人物或者动漫照片变成栩栩如生的“3D打印手办”,短时间内形成全球范围内的破圈效应。谷歌CEO皮查伊披露,在Nano Banana的推动下,Gemini应用的月活用户数在短短1个季度内,就从4.5亿暴增至6.5亿。 随着本周谷歌发布新一代旗舰大模型,谷歌的图像生成模型也迎来了意料之中的飞跃式升级。 用谷歌的话来讲,Nano Banana Pro能“以空前的控制力、无瑕的文字呈现和增强的世界知识,将用户的构想变成工作室级的设计”。 据谷歌介绍,Nano Banana Pro基于本周早些时候发布的Gemini 3 Pro,不仅在细节表现力、图像分辨率和文本渲染准确性方面强于前一代Nano Banana,还能以不同风格、字体和语言生成本文。新一代图像生成模型还新增了编辑功能,并加入互联网搜索能力。 谷歌强调,Nano Banana Pro是在图像中生成正确且清晰可读文字的最佳AI模型,不论是简短的标语还是长段落均可,支持更加丰富的纹理、字体和书法。同时借助Gemini增强的多语言推理能力,用户可以生成多种语言的文本,或者对内容进行翻译和本地化。 (将一张照片转化为电影分镜,以及翻译饮料包装上的文字,来源:谷歌) 同时基于互联网知识库,Nano Banana Pro还能将现实世界的信息转化为生动形象的可视化信息,例如如何制作一杯豆蔻茶。 谷歌透露,Nano Banana Pro也非常适合用来做PPT或者信息图表,同时会加入谷歌的办公套件Workspace。 Google Labs和Gemini副总裁Josh Woodward介绍称:“Nano Banana Pro在信息图表方面非常出色,可以用来制作幻灯片。它最多可以处理14张不同的图像,或5个不同的角色,并在某种程度上保持角色一致性。” 对于创意产业的工作者而言,Nano Banana Pro也大幅升级了编辑功能,直接将创意的决策权交到使用者手中。 谷歌介绍称,新的编辑功能支持改变相机角度、场景光线、景深、对焦等,同时可以调整多种纵横比,分辨率也从Nano Banana的1024X1024上升到最高4K。 (调整角度或图片焦点) 谷歌正在各项AI工具中推出Nano Banana Pro,包括免费用户在内,都能在Gemini等应用中试用这一新功能(但会有限制配额)。Google AI Plus、Pro和Ultra订阅用户会获得更高的配额。谷歌也表示,该功能随后也将率先在Flow(谷歌的AI电影制作工具)向Ultra订阅用户推出。
黄仁勋努力打消AI泡沫论,市场:“卖铲人”不会说山里没金子!
尽管英伟达第三季度营收同比激增62%至570.1亿美元,并给出强劲的第四季度指引,但投资者对AI估值泡沫的担忧并未完全消散。 周四英伟达股价盘中反转走低,此前该公司发布的超预期财报曾一度推动股价上涨5%。 财报公布后,包括AMD、博通在内的AI生态系统相关股票最初受到提振,但随后均随大盘回落。德意志银行分析师Ross Seymore虽认可业绩亮眼,但指出股票"估值合理",维持中性评级。 英伟达CEO黄仁勋在财报电话会议上直言: 这一表态试图打消市场疑虑。然而,分析认为指望黄仁勋承认泡沫存在本就不现实——没有哪个"卖铲子"的人会告诉淘金者山里没有金子。 业绩超预期但仍存争议 英伟达本次财报表现超过了市场的最乐观预期。 公司预计第四季度营收将达到约650亿美元,显著高于市场预期。更引人注目的是,黄仁勋在华盛顿的演讲中透露,未来六个财季,仅Blackwell和Rubin产品线在海外市场的销售额就将达到5000亿美元。 Quilter Cheviot全球科技研究主管Ben Barringer表示,英伟达在财报电话会议上"试图反驳几乎所有看空理由",包括扩展定律、超大规模客户资本支出以及主权AI等各个层面。 华尔街见闻提及,例如面对市场关注的“循环融资”风险。黄仁勋解释称,对OpenAI、Anthropic等公司的战略投资是为了深化技术合作、扩大CUDA生态系统,并获取“一代人一遇”公司的股份,而非市场担忧的“循环交易”。 所谓循环融资,是指英伟达向AI公司投资,而这些公司又将资金用于购买英伟达芯片。 今年以来,英伟达对OpenAI、微软、Anthropic等数十家公司达成此类交易。仅9月份,英伟达就宣布向OpenAI投资1000亿美元,用于支持新数据中心和AI基础设施建设。 Barringer表示: 然而,这种辩护在部分市场观察人士眼中是必然的。 分析认为这就好比在淘金热中的五金店老板,绝不会告诉淘金者“山里其实没金子”。即使AI繁荣真的存在泡沫,作为最大的既得利益者,黄仁勋也不会承认这一点。 泡沫争论仍无定论 投资者对AI泡沫的担忧并非针对本季度或未来几个季度,而是关注一两年后资本支出能否持续增长。这些巨额投资终究需要产生回报。 历史提供了值得参考的案例。 互联网泡沫时期,思科作为全球网络设备提供商,曾是最重要的"卖铲子"企业。虽然思科的营收增速未达到英伟达当前水平,但也相当强劲,甚至一度重新加速,直到互联网泡沫破裂后断崖式下跌。 另一个参考对象是苹果。iPhone推出后,到2011年前后,苹果的营收增速与如今的英伟达相当。但不同的是,当苹果录得50%以上营收增幅时,其12个月动态市盈率仅约12倍,远低于英伟达目前的估值水平。 英伟达目前宣布派发1美分季度股息。按盘前股价195.60美元计算,股东要想仅靠股息收回成本需要近4900年。 分析认为,如果AI投资真是难以持续的泡沫,不能指望黄仁勋亲口承认,也不会从英伟达当前业绩或短期展望中看出来。增长放缓的路径将决定AI主题股走势,但因果关系也可能正好相反——股价波动反过来影响投资决策。
信心来了 蓝色起源将开发新格伦超重型火箭叫板SpaceX
新格伦超重型火箭(右)效果图 凤凰网科技讯 北京时间11月21日,据路透社报道,杰夫·贝佐斯(Jeff Bezos)旗下太空公司蓝色起源周四表示,将研制一款更大、动力更强劲的“新格伦”火箭变体,初步规划出一个类似埃隆·马斯克(Elon Musk)旗下SpaceX“猎鹰”火箭系列的轨道卫星运载火箭家族。 这款新型火箭被命名为“新格伦9x4”,其名称含义为一级火箭配备9台发动机,二级配备4台发动机,较当前设计方案的各级均增加2台发动机。该消息在“新格伦”火箭上周执行第二次发射任务后公布。在这次任务中,“新格伦”火箭不但首次为美国宇航局(NASA)运送火星卫星,还首次完成了一级火箭的回收。 蓝色起源公司在概述火箭升级计划的声明中表示:“新格伦发展路线图的下一篇章是研制新型超重型运载火箭。” 蓝色起源并未披露更大火箭型号的预期首飞时间。该公司发言人表示:“我们今天不会披露具体时间节点。由于它是从当前的7x2型号迭代设计而来,意味着我们可以快速建造这枚火箭。” 该公司指出,两款“新格伦”火箭变体“将同时服务于市场,为客户任务提供更多发射选择,包括巨型星座部署、月球与深空探索,以及'金穹'等国家安全项目”。 蓝色起源CEO戴夫·林普(Dave Limp)在X上发布了新型超重型“新格伦”火箭的数字渲染图。该火箭比土星五号运载火箭更为高大,后者有17层楼高曾在美国阿波罗计划中将人类送上月球。新9x4发动机配置火箭不仅拥有更大的有效载荷整流罩,其整体高度也明显超出原始“新格伦”设计方案。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
苹果晒M5芯片AI性能:相比M4文本生成提速27%,图像生成快3.8倍
IT之家 11 月 21 日消息,苹果机器学习研究博客于 11 月 19 日发布博文,公布了 M5 芯片的最新性能数据,重点展示了其在运行本地大语言模型(LLM)方面的显著优势。 此次性能评估的核心平台是苹果此前推出的 MLX,这是一个专为 Apple Silicon 设计的开源机器学习框架,它利用统一内存架构,让模型能够在 CPU 和 GPU 之间高效运行。 在核心的文本生成测试中,苹果使用了 MLX LM 工具包对多款开源大模型进行了基准测试,包括不同参数规模的 Qwen 模型和 GPT OSS 模型。 测试结果显示,M5 芯片在生成后续文本 token 时的速度比 M4 提升了 19% 至 27%。苹果指出,这一性能飞跃主要得益于内存带宽的提升,M5 的内存带宽高达 153GB/s,相比 M4 的 120GB/s 增加了 28%,这对于内存密集型的 token 生成任务至关重要。 报告进一步解释了 LLM 推理过程中的两种不同负载。IT之家援引博文介绍,生成第一个 token 主要受计算能力限制(compute-bound),而生成后续 token 则更依赖于内存速度(memory-bound)。 因此,M5 凭借其更高的内存带宽,在持续生成文本的场景中展现出明显优势。苹果还强调,配备 24GB 内存的 MacBook Pro 能够轻松运行参数量达 300 亿的 4-bit 量化混合专家模型(MoE),并将推理负载控制在 18GB 以内。 第一个 tokens 生成速度 后续 tokens 生成速度 内存 (GB) Qwen3-1.7B-MLX-bf16 3.57 1.27 4.40 Qwen3-8B-MLX-bf16 3.62 1.24 17.46 Qwen3-8B-MLX-4bit 3.97 1.24 5.61 Qwen3-14B-MLX-4bit 4.06 1.19 9.16 gpt-oss-20b-MXFP4-Q4 3.33 1.24 12.08 Qwen3-30B-A3B-MLX-4bit 3.52 1.25 17.31 除了文本处理能力,M5 芯片在图像生成方面的提升更为惊人。报告提到,M5 芯片中集成了全新的 GPU 神经加速器,专门用于处理机器学习负载中至关重要的矩阵乘法运算。 得益于此项硬件升级,M5 芯片执行图像生成任务的速度是 M4 芯片的 3.8 倍以上。这一巨大飞跃预示着,未来搭载 M5 芯片的 Mac 设备将在创意设计、内容生成等视觉 AI 应用领域提供远超以往的流畅体验。
搭载英特尔至强6900,双路冷板式全域液冷服务器发布:两大关键技术大降功耗
智东西 作者 | ZeR0 编辑 | 漠影 智东西11月20日报道,在英特尔技术创新与产业生态大会上,英特尔与新华三、英维克、忆联及国内领先内存厂商四家本地生态伙伴,于11月19日发布了基于英特尔至强6900系列性能核处理器的双路冷板式全域液冷服务器,通过协同创新,将液冷、内存、SSD等关键组成部分串联起来,让数据中心PUE低于1.1的能效目标得以实现。 英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立谈道,AI驱动着高效散热和先进液冷技术的演进,这一全域液冷服务器将帮助客户在AI浪潮中抢占先机,并为中国数据中心的能效升级与可持续发展带来便利。 新发布的双路冷板式全域液冷服务器从CPU、内存到硬盘等多个维度来全面保障着数据中心的散热效率与长期稳定。这首先得益于英特尔在CPU与液冷技术上的协同推进。 其系统配备至强6900系列性能核处理器后,凭借更多核心、双倍内存带宽、内置AI加速,算力实现翻倍,可运行数据中心中的各类苛刻AI负载。 该创新方案由全本地生态赋能,实现了关键热源的高比例液冷覆盖,在提升可靠性与能效的同时,显著降低能耗与运维成本,为数据中心散热与能效树立新标杆。 双路冷板式全域液冷服务器依托的还有英特尔的两项关键专利技术——“内存枕木冷板技术”和“SSD/HDD冷板专利技术”。 内存枕木冷板技术创造性地将内存散热片和冷板进行可拆装设计,不仅具有运维方便、兼容性好、易于迭代和可标准化等优势,更是突破传统内存散热上限,在0.297英寸间距下满足DDR5内存最高功耗36W的散热需求。 SSD/HDD冷板专利技术则优化与硬盘冷板的接触面积与流道,为SSD提供了高达25W的单盘散热能力,使得服务器在高负载场景下依然能够稳定运行。 双路冷板式全域液冷服务器的问世,同样离不开本地生态伙伴的深度赋能与紧密协作。 新华三在服务器系统集成和整体解决方案交付方面发挥了关键作用,通过优化冷板安装结构、硬件接口布局,有效避免空间浪费并降低兼容风险。 新华三集团云与计算存储产品部副总经理刘宏程谈道,未来绿色、高效的数据中心必将是一个趋势,新华三践行“ALL in GREEN”绿色战略的坚定实践,期待与英特尔等业界合作伙伴全面协同,在数据中心领域共同推动液冷等绿色技术标准化和产业化、规模化的应用。 英维克在方案落地阶段,通过专业定制化打样和优化设计,精细化调整CPU/内存/硬盘冷板的装配间隙、散热接触度,让冷板覆盖核心部件。 英维克副总裁王铁旺谈道,英维克与英特尔在芯片级热设计上深度协同,从源头优化能效,与新华三在解决方案集成方面共同打磨,与忆联在SSD存储和国产内存液冷领域联合创新,这种“技术-生态-场景”的闭环让全域液冷服务器能满足AI训练、高通量计算等场景需求,并具备规模化落地的成熟度。 忆联聚焦SSD与冷板式全液冷方案的适配,针对SSD的接口布局、散热结构开展定制化设计,优化硬盘与冷板的接触效率。 忆联总经理寇朋韬谈道,忆联SSD是双路冷板式全域液冷服务器的核心组件,创新地将液冷技术引入闪存模组内,为核心器件构建了一个独立高效的热管理路径,这种设计保证了存储盘片在持续满载工况下依然能够维持稳定的高性能,同时有极致的低时延表现,有效避免了因过热导致的性能波动和可靠性风险。 作为长期投入中国市场、积极支持本地生态伙伴发展的重要力量,英特尔与本地独立硬件供应商、OxM等构建的紧密协作还有很多,包括“液冷创新加速计划”、成立UQD互插互换联盟、积极推动冷板液冷团体标准制定等。 面向未来,英特尔计划依托领先的技术与本地创新力量,持续深化与本地生态的协同合作,推动行业迈向高效、可持续、开放共赢的发展新阶段。
世纪破冰!苹果iPhone和安卓手机实现跨平台互通,原生文件互传再无壁垒
IT之家 11 月 21 日消息,科技媒体 Appleinsider 昨日(11 月 20 日)发布博文,报道称谷歌“快速分享”(Quick Share)功能现已与苹果“隔空投送”(AirDrop)实现跨平台互通,首次实现了两大主流移动操作系统间的原生文件互传。 这意味着 iPhone、iPad 和 Mac 用户,现可直接向最新的谷歌 Pixel 10、Pixel 10 Pro、Pixel 10 Pro XL 以及 Pixel 10 Fold 等安卓设备发送文件,打破了长期以来困扰用户的生态壁垒。 IT之家援引博文介绍,要实现这一跨平台传输,用户需进行简单的设置。苹果设备用户在接收来自 Pixel 10 等设备的文件前,必须将“隔空投送”的可见性选项更改为“对所有人开放(10 分钟)”。 完成设置后,接收安卓文件的通知样式及确认操作,将与接收来自其他苹果设备的“隔空投送”文件完全一致。同样,Pixel 10 用户接收文件时,也需开启相应的“对所有人开放”或进入“接收模式”。所有接收的文件将自动保存在安卓系统的“文件”应用中。 谷歌方面强调,此次功能互通在设计上采用了多层安全防护机制,以确保跨平台分享的安全性。整个传输过程充分保障用户隐私,通过安全的点对点(peer-to-peer)直连通道完成,数据不会经过任何服务器中转。 在传输开始前,双方设备都会显示对方的设备名称以供用户核对确认,并且必须获得接收方同意后,文件传输才会启动,有效防止恶意接收。 该功能目前仅支持在双方均开启“对所有人开放(10 分钟)”模式下使用。不过,谷歌表示,希望未来能与苹果继续合作,争取支持“仅限联系人”这一更私密的分享模式,进一步优化用户体验。这项备受期待的跨平台文件分享功能现已对支持的设备开放。
Gemini 3又来炸场!谷歌大热生图模型升级,Nano Banana Pro提供“摄影棚级别”精度和控制
谷歌的最强大人工智能(AI)模型Gemini 3刚发布两天,就来返场送惊喜了。 美东时间20日周四,谷歌宣布,基于Gemini,升级其大热的图像生成与编辑模型。新推出的模型Nano Banana Pro号称能提供“摄影棚级别”的精度和控制,在文本渲染准确性、分辨率和专业控制能力上实现显著提升,旨在将AI图像工具从消费级应用推向专业设计领域。 Nano Banana Pro支持生成最高4K分辨率的图像,可在多语言环境下精确渲染文本,并允许用户像使用专业相机一样控制拍摄角度、景深、色彩和光照等参数。谷歌Labs和Gemini副总裁Josh Woodward表示,该产品在信息图表制作、幻灯片设计等方面表现出色,可保持最多五个角色和十四个物体的一致性。 谷歌的全球免费Gemini用户将能够在配额限制内使用Nano Banana Pro,超出配额后将自动切换回旧版模型,付费AI计划订阅用户则拥有更高使用额度。该模型已集成至Canva、Figma、Adobe Firefly和Photoshop等主流设计工具。 谷歌还同步推出了AI内容溯源功能。用户可在Gemini应用程序App中上传图像,查询其是否由谷歌AI生成,该功能未来将扩展至音频和视频。此举是谷歌将AI技术商业化的最新尝试,也是其在生成式AI竞赛中追赶OpenAI的重要一步。 这一发布延续了谷歌本周在AI领域的强劲势头。周二发布的Gemini 3在推理和编码能力上实现"巨大跃升",周三推动谷歌母公司Alphabet股价创历史新高。周四官宣Nano Banana Pro当天,股价早盘一度涨近5%,但午盘追随大盘转跌,收跌约1%,暂别周三刷新的收盘最高纪录。 攻克AI拼写难题,文本渲染实现突破 AI图像生成模型长期面临的一个核心挑战是文本渲染准确性。虽然部分模型随时间推移改进,但在生成包含多个文本短语的图像时,拼写错误和字体扭曲仍然常见,这限制了其作为专业设计工具的潜力。 Nano Banana Pro直接针对这一问题提供解决方案。谷歌发言人表示,新模型在渲染最终图像前,能够更好地规划文本位置、字体特征及其与其他图像元素的空间关系。该技术可将菜谱文本转换为图解流程图,或可视化天气、体育等实时信息。 Nano Banana Pro支持生成清晰可辨的文本,用户可描述所需字体类型或模拟不同手写风格,还能在图像内生成本地化文本或翻译文字。这使用户能够创建针对国际市场的产品展示、海报和信息图表。谷歌在博客文章中强调,锐利、清晰的文本帮助用户制作富有冲击力的海报、复杂图表和详细产品模型。 不过谷歌也提醒用户注意局限性。新模型在生成信息图表、标注图表或呈现复杂数据时,可能误读信息或产生事实错误。虽然能够生成和翻译多语言文本,但在语法、拼写、文化细微差别或惯用语方面仍可能出现问题。用户应始终仔细检查生成的图像及其中文本的准确性。 专业级控制功能,分辨率跃升至4K Nano Banana Pro为专业用户提供了前所未有的精细控制能力。用户可探索不同拍摄角度和类型,包括广角、全景、特写等,还能调整景深以聚焦图像中的不同主体。 在色彩和光照方面,用户可调整色调分级和光照方向,甚至可将场景从白天转换为夜晚。 模型支持1K、2K和4K三种分辨率的精准放大,并能随意切换纵横比以适配不同平台或用途。 分辨率提升的代价是成本增加和速度下降。原Nano Banana模型生成1024像素图像的成本为0.039美元,而新模型生成1080p或2K图像的成本为0.139美元,4K图像为0.24美元。 在素材一致性方面,模型可在单一工作流程中保持最多五个角色的一致性和相似度,以及最多十四个物体的保真度。对于希望在营销活动中融入自身设计的品牌,模型可接收最多14张参考图像,并在用户文本提示描述的新场景中重新编排它们,同时保留输入素材的特征。 模型还能将草图转化为物体,将手绘笔记转为图表,将创意变成3D渲染建筑。用户可一次创建多张图像,快速高效地探索和审查创意选项。谷歌表示,模型还能创建具有真实细节的风景、植物、人物和动物的逼真图像。 广泛产品集成,付费用户获更高配额 Nano Banana Pro正在谷歌现有AI工具中全面推广。Gemini App将默认使用新模型生成图像,免费订阅用户可在限定配额内使用,超出后将切换回原Nano Banana模型。Google AI Plus、Pro和Ultra订阅用户将获得更高生成额度,这些付费用户还可在Notebook LM中使用该模型。 在美国地区,AI Pro和Ultra订阅用户可通过AI模式在搜索中访问该模型。Ultra订阅用户还能在谷歌视频工具Flow中使用,Workspace客户可在Google Slides和Vids中使用。开发者则可通过Gemini API、Google AI Studio和新IDE Antigravity调用Nano Banana Pro。 谷歌同时将其SynthID技术整合至Gemini应用,用于为AI生成图像添加水印和检测。用户可上传图像,聊天机器人将告知该图像是否由谷歌图像模型创建或修改。谷歌目前为所有AI工具创建的媒体嵌入不可见的数字水印,免费或Pro方案的订阅用户创建的图像还会添加可见水印,订阅最高价Ultra方案的用户则可移除可见水印。谷歌未提及是否计划支持C2PA等其他AI水印标准。 用户增长强劲,商业化进程提速 Nano Banana Pro的前身Nano Banana今年8月面世后在社交媒体上迅速走红,用户将自己或宠物的照片转化为超写实3D小雕像。Woodward在9月的X帖子中写道,该产品帮助Gemini应用在四天内新增1300万用户。 据谷歌发布的数据,Gemini App目前每月活跃用户超过6.5亿,由Gemini驱动的AI Overviews每月用户达20亿。相比之下,OpenAI CEO Sam Altman在10月表示,ChatGPT每周活跃用户达8亿。 Woodward本周四表示,谷歌AI产品需求持续增长,许多用户注册Gemini订阅计划以获得"这些高级模型的更高限额"。他表示,"我们看到大量用户涌向这些产品,这实际上是最好的问题——需求很大,我们正在努力弄清楚如何服务这些需求。" 此次发布标志着谷歌将AI技术商业化的最新尝试。自2022年ChatGPT发布引发生成式AI竞赛以来,谷歌一直在努力追赶OpenAI。上周,OpenAI宣布对GPT-5模型进行两项更新,使其"默认更温暖、更具对话性",并"在日常使用中更高效、更易理解"。目前ChatGPT在苹果App Store免费应用榜单中排名第一,Gemini位居第二。 Woodward表示,公司计划继续扩大AI产品规模,重点包括AI电影制作工具Flow和目前作为有限研究预览版提供的"世界构建"模型Genie。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。