行业分类:
加载中...
头条分类:
加载中...
vivo公布OriginOS 6四月体验升级亮点
IT之家 4 月 11 日消息,vivo 昨晚公布 OriginOS 6 四月体验升级亮点,包括高德地图公交地铁导航提醒、支付宝新能源充电上岛、记账上岛、小 V 圈搜查食物热量等。 IT之家整理如下: 安卓首发小 V 建议、原子通知高德地图公交地铁导航提醒,开启公共交通导航后,行程进度自动同步至小 V 建议和原子通知。 支付宝新能源充电上岛,车辆充电状态一目了然。 记账上岛,日常支付轻松记,同步上岛更省心。 小 V 圈搜再升级查食物热量,日常饮食轻松把控,小 V 精准计算,热量摄入清晰可控。 解读体检报告,体检报告看不懂,小 V 解读健康状态一目了然。 相册原子组件新增尺寸,新增 4x4、4x2 相册组件,支持添加至桌面与负一屏。 原子组件质感升级,新增桌面搜索组件、音乐组件的模糊材质,提升界面层级与空间感。 蓝河流畅引擎,新增锁屏进入控制中心的背景缩放效果,提升动效精细体验。 小 V 建议、原子岛新增巡航红绿灯提醒,非导航时检测到行车状态,原子岛显示红绿灯倒计时。 蓝心小 V 升级智能体广场布局,分类更清晰,搜索与推荐更高效,找智能体更快更方便;优化智能体分类,分类层级更清晰。 vivo 看见新增问答模式上下文对话记忆,支持持续追问;升级探索模式“云侧环境描述”,表达更精准自然;优化问答策略,适配部分闲聊场景。 无障碍:优化 TalkBack 的焦点、标签及交互控件,提升 TalkBack 使用体验。
一辆豪车,为何非得是某某揽胜「某某库里南」?
在昨晚蔚来 ES9 发布前的几小时,李斌似乎有些按捺不住内心的波澜,他在微博上写下了这样一段话: 蔚来 ES9 要有开创性的技术,更要有开创性的原创设计语言。没有任何一个领域的开创引领者,希望自己活在别人的影子里。 如果从蔚来成立的 2014 年算起,中国造车新势力已经走过了一个轮回。 在这期间,我们用激光雷达、高压快充、辅助驾驶等等方面上取得了举世瞩目的突破。然而,在最能直观映射品牌灵魂的「设计语言」上,整个行业却依然长期停留在某种难以名状的路径依赖中。 市场上充斥着「XX 揽胜」、「XXX 迈巴赫」乃至「XXX 库里南」的叙事,仿佛不借助那些西方老钱品牌构建的视觉符号,我们就无法向公众解释什么是「豪华」。 目前已经上市/曝光的大六座 SUV 们,猜猜谁是谁?图源:微博@吴佩 过去几十年里,我们对豪华车的很多直觉,其实都来自内燃机时代留下的视觉遗产。大尺寸格栅是散热需求,繁复的镀铬和厚重的型面,一方面是工艺能力和成本的投射,另一方面也是身份、稀缺性和时代趣味的结果。 迈巴赫 GLS 久而久之,这些东西被反复沿用,变成了「豪华应该长什么样」的标准答案。 当电动化大潮从结构底层彻底拆掉了这些物理枷锁,设计的自由度被无限放大时,国内车企们却普遍陷入了迷茫:当「必须如此」的理由消失后,属于国产品牌豪华感该从哪片废墟上重建? 从科技先锋到豪华旗舰 作为新势力的先行者之一,蔚来在早期的探索中给出了自己的第一份答卷。 早期的 ES8,以及后来蔚来多数产品,更偏向一种科技先锋的路数,克制、干净、留白很多,强调环保材质、柔和光影和一种不喧哗的未来感。 这套设计语言契合了蔚来创业初期的极客气质与品牌底色,在那个新能源车还需要努力证明自己不是「老头乐」的时代,它确实成功打动并转化了一大批更年轻、思维更开放、更认同科技平权理念的高净值人群。 但商业的竞争是残酷且不断向上的。 在新能源汽车渗透率已经登顶的当下,蔚来 ES9 所肩负的历史使命发生了转变。 它更想要转化剩下的那部分最为固执、依然死死攥着奔驰 GLS 和路虎揽胜车钥匙的传统豪华燃油车用户。 对于这个级别的买家而言,他们买车早已脱离了代步工具的范畴。他们不再满足于单纯的低调内敛,也不仅仅满足于拥有一套好用的智能车机,他们还需要一个足够强大的视觉锚点,去承载他们在这个社会中的身份地位。 因此,蔚来设计团队面临的考题变成了:如何在不破坏原生科技感审美底色的前提下,注入更多的豪华气场? 这种科技与豪华的配比,从早期乐道 L90的探索到如今 ES9 的呈现,是一个不断调整和权衡的过程。 蔚来并没有选择迎合传统,去盲目堆砌镀铬饰条或夸张的隆起线条,而是将设计的重心放在了梳理体量感与构建沉稳的比例上。 李斌在接受媒体采访时说: 我们一起打磨这件事情已经 11 年了,我们相信共同东西没有变化,我们一起的产品是价值体系,车还没有做,开始先讨论这个东西,这个跟设计和审美的关系是什么呢?它让我们有共同的标杆,比如我们设计的基因是怎么来的,坚持的东西是不变的,纯粹、温度、精致。 蔚来的设计是有原则、底蕴、相信,内部共识的,最终大家就会觉得这是蔚来的东西,好的设计至少要看到三个词,只能看到一个词,就会被否决。 因此,当我们审视 ES9 的外观时,能感受到它试图解决的是「大」与「秩序」之间的关系。 一台车长达到 5365 毫米、轴距达到 3250 毫米的全尺寸 SUV,如果线条处理不当,很容易显得臃肿或笨重。 高达 1 米的车头高度、外径 810 毫米的大尺寸轮毂以及 1.1 米的高腰线,配合贯穿车侧的平直饰条,在庞大的体量中梳理出了一种相对平稳、端庄的视觉感受。 这种通过比例和体量本身传递出的稳重感,配合隐藏在车身各处的感知硬件,成功为 ES9 构建出了一种属于智能时代的旗舰姿态。 在光影的运用上,ES9 也体现了智能汽车时代设计的演进。 传统豪华车依靠材质和漆面在白天建立辨识度,而在智能电动车时代,灯光成为了重要的表达媒介。 ES9 配备的超纯晶钻日行灯内部采用了复杂的切割工艺,结合投影大灯、长达 2.36 米的尾灯系统以及专属的迎宾光效,将灯光从单纯的照明工具转变为车辆与外界交互、传递情绪的载体。在车辆接近、解锁、静止和行驶等不同状态下,建立起了一套全新的视觉反馈机制。 智能汽车设计中另一个难以回避的矛盾,是感知硬件与车身造型之间的冲突。 为了实现高阶辅助驾驶,车辆不可避免地需要搭载激光雷达、摄像头等众多传感器。如果处理得比较粗暴,这些硬件很容易像外挂组件一样破坏车身原本的流畅度。 ES9 在这方面的处理思路是尽可能地进行融合。将侧向激光雷达等组件融入车顶或车身的线条之中,使其成为整体造型的一部分。 从中华文化汲取灵感,但是用科技去表达 ES9 的座舱设计,则涉及到了一个更为复杂、也极易弄巧成拙的领域,即如何在中国的高端工业产品中合理地融入本土文化元素? 过去,很多汽车产品在尝试表达「东方美学」时,往往流于表面,仅仅是给颜色起个古雅的名字,或者在内饰面板上增加一些传统的图腾和纹理。李斌用「在现代建筑上硬加一个中式亭子」来形容这种生硬的拼接。 2017 年第八届中国十大丑陋建筑:广州圆大厦 而 ES9 在内饰设计上,选择了一条并不轻松的道路:它试图尝试把中国文化里那些关于山水、光影、层次、留白的意境,转译成现代工业产品中的可感知气质。 在座舱的空间布局上,ES9 提出了「天地入怀,气象万千」的理念,创新性地引入「天空岛」和「智能行政中岛」这两个概念,来化解车内开阔感与专属感之间的矛盾。 这种设计让行政级的后排空间既拥有良好的视野,又在各个乘员之间划分出了相对独立的区域。 在材质的铺陈上,车内大面积使用了产自高寒地带的珍稀枫影真木,以及超过 8 平方米的全粒面无铬鞣 Nappa 真皮。 除了基础的空间和材质,ES9 将东方美学的应用推向了感官的联动,例如环绕座舱四周、总长超过 9 米的「天光云影」六层动态氛围灯,能够模拟出较为自然的光线过渡。 在这个过程中,蔚来并未停留在「看起来像中国风」这种较浅的视觉层面上,而是试图让光线、声音、材质的纹理、古典的图案以及整个空间的情绪,在同一个瞬间发生联动。 李斌在采访中指出了一个关键的体验点: 我们为什么一直讲延时低很重要,延时不能做的特别低就差点意思,音响、氛围灯,声光电怎么感觉非常灵动,感觉对,延时做不到,老慢半拍,是不行的。 此外,专属的车漆颜色「晨晖金」以及从传统釉色中汲取灵感的内饰套装,包括在地平线版本中运用苏绣工艺,都是在尝试将传统的工艺美学与现代汽车制造标准进行深度对接。 正如秦力洪所总结的: 从中华文化汲取灵感,但是用现在科技和工业手段去表达它,不是简单加个名字,比如玄金套装,不止是造型,还要满足用户的功能或者情绪方面的需求和价值,三者缺一不可。 总而言之,ES9 作为一款体量庞大、定位高端的旗舰产品,它可能无法在第一时间讨好所有不同审美偏好的受众。有些人可能会欣赏其建立在庞大体量上的端庄感,也有人可能会认为整体的「登味」还是太强,不够优雅。 但抛开主观的审美偏好,ES9 毫无疑问是一次试图摆脱传统燃油车豪华范式的良好尝试。 它在努力寻找一种平衡,既要满足全尺寸 SUV 用户对体量和气场的刚性需求,又要在设计中保持对堆砌元素的克制;既要探索本土文化在汽车工业中的表达方式,又要避免将其沦为肤浅的营销符号;既要展示前沿的技术能力,又要让这些技术组件服从于车辆整体的美学秩序。 这种在智能电动时代重构旗舰审美的探索,虽然充满挑战,却是中国汽车品牌走向成熟、建立自身话语体系必经的道路。 文|芥末
我在扣子“领养”了哆啦A梦!帮我招人、做视频、跑出一家工作室,实测效果超预期
作者 | 江宇 编辑 | 漠影 时隔两个月,扣子再次迎来重磅更新! 智东西4月9日报道,近日,扣子2.5正式上线。在这一次的更新中,扣子2.5变成一个可以持续存在、自己干活、还能不断进化的Agent伙伴。 在新的版本里,用户可以给自己的扣子设定名字和形象,它会自动拥有一个独立邮箱,用自己的身份去注册网站、调用服务。 如果用户交代一个任务,它也可以在云电脑里打开浏览器查资料、运行程序,在云手机里操作App完成流程,整个过程不占用对话,可以在后台持续推进,做完再把结果交回来。 用户在不同渠道和它聊天,它会把这些信息整理成长期记忆,慢慢形成稳定的使用习惯。 与此同时,扣子的能力也以“满配形态”直接交付:一边是CLI编程能力,可以从一句话需求到完整功能落地;一边是视频Agent,从脚本到成片一条链路打通;再叠加大量已经打磨好的专业技能与skill,可以直接组合成完整工作流。 更重要的是,这些能力并不是固定的。扣子这次还开放了一个更大的Agent World,让Agent可以在其中学习、协作、交流,能力会随着使用不断变化。 目前,智东西也尝试用几个真实场景,把这套“满配AI伙伴”到底能做到什么,跑了一遍。 一、组建“一人自媒体工作室”:领养一只“哆啦A梦”,让它先从招人开始 如果说,大雄有一只随叫随到的哆啦A梦,那现在,我也可以在扣子里“领养”一只。我大概告诉它“你是哆啦A梦”,后面的设定基本是它自己补全的:包括性格、口头禅,还有头像——也是它自己生成的。 基本的“人设”设定完成之后,这只“哆啦A梦”就有了自己的邮箱,可以正常收发邮件。 接下来,我把为“工作室”招聘的任务交给它,后续几乎所有与招聘相关的动作,都是它独立对外完成。 与此同时,扣子给他准备的“百宝箱”也一并配齐了。其一,就是云手机和云电脑。要查资料、写JD,它直接用云电脑;要发招聘、跑平台,它就切到云手机。人类可以接管关键操作,比如登录,其余操作都会在后台自动完成,不需要一直盯着。 它先自己去找对标岗位,整理出一份AI自媒体创作者的JD,然后开始在小红书发布招聘信息。我看到它直接在云手机里打开小红书,走完整个发布流程,包括填标题、配图、写正文和最终发布。 其中,有个关键细节,云手机直接启动了豆包输入法,把JD信息录进去,借助平台自带的“文转图”能力生成内容,主页信息也一并补全,基本不用手动干预。唯一的小问题是标签并没有自动带到最终文案里。 另外,小红书账号登录这一步也不复杂。如果遇到需要登录的情况,系统会把操作接管给我,我直接在云手机上点一下就能完成,云手机支持用户直接介入操作,一旦遇到自己想上手的问题,接管即可。 招聘信息发出去之后,简历就陆续发到哆啦A梦的邮箱了。独立邮箱就此派上了用场,所有招聘相关信息都通过这个邮箱收发,让整个流程更顺畅。 这个时候,如果你想了解候选人的情况,只需打开邮箱,就能随时查看简历和招聘信息;同时,向“哆啦A梦”提问,它会直接从独立邮箱中提取最新内容,回答候选人资料和进展。 均为虚拟简历 接下来这一段基本就是“全自动流水线”:它自己去邮箱里收简历、下载附件、逐份读取内容,然后整理成一张表格。 候选人的学历、背景、过往内容以及到岗情况都会被拆出来,还会给出一个评分和排序。最终的表格已经可以直接用来做筛选,信息完整,排序也比较清晰。 当我需要哆啦A梦帮我约排名前五的候选人线上面试的时候,它会给这些候选人发邮件,并安排面试时间,我只需要最后确认时间安排。而关于面试的安排,它能自动同步到我的日程之中。 手机端和电脑端同步更新,在手机端的体验也同样顺畅:收到求职邮件时,手机上会自动显示新简历提醒,我可以直接在手机端扣子里查看内容,也能让哆啦A梦对新的候选人评分、排序。 相比以往必须在电脑端逐条处理的方式,这套流程体验上更轻松,从写JD、发招聘、收简历、筛选,到约面试,基本是连着跑下来的。 即便在手机上,也能快速查看或安排下一步操作,操作反馈即时且连贯,处理变得自然、顺手。对HR来说,这样的减负是实实在在可落地的,而同一套能力放到其他岗位上,创造力也是无限的。 二、扣子“百宝箱”掏出新道具:全能视频制作Agent,配上顶流Seedance 2.0 如果说前一部分还在帮我把“人”的工作流程跑顺,那接下来,扣子开始直接下场做内容。我给它布置了一个任务:做一条“算力之巅对决”的短视频。 一开始,我的设想是用真人形象来做对决,但在实际生成过程中,系统会触发人像相关的检测机制。为了保证内容可以顺利生成,扣子在当前流程里直接帮我把脚本做了一轮重写——从真人对抗,转成现在这版更偏水墨武侠风的表达。整体逻辑没变,但表现形式被重新组织了一遍。 脚本的生成是一步到位的。它先把整条内容写成完整结构:开场怎么起节奏,每一段信息怎么拆,单条时长如何控制,最后怎么收束。这一版已经是可以直接用于短视频的脚本。 接下来,它继续往下拆,把内容一条条对应到具体画面,形成分镜。每一段该用什么镜头、什么运动方式、画面重点在哪,都会明确下来。 与此同时,素材、视觉设定和配乐是同步生成的。人物、场景、道具可选择进入资产区,可以随时替换、增删,也支持局部修改,比如擦除、替换元素、调整细节等,整体可控性比较高。 到了出画面的阶段,它会自动调用扣子里的“视频创造”模块,对接Seedance 2.0来生成视频内容。如果我中途想改脚本或者补结构,也不用跳出流程,直接在当前对话里往下改,它会基于当前版本继续生成。 从脚本,到分镜,再到角色、场景和素材入库,是一条连着跑下来的流程。中间我可以随时接管,比如手动改一段;也可以放手让它继续往下做,整体是可控的。 第一版出来之后,也不是结束。我可以直接在对话里提要求,比如让节奏更快、压缩时长,或者调整某一段的表达,它会在当前版本上继续改。 这种体验更像是在剪一个“已经有雏形”的视频,而不是从零开始拼素材。用户始终在流程里,有参与感,也有控制权。 另外一个比较实用的点是资产复用。同一个项目里生成过的场景、分镜和各类素材,都可以直接复用。像这条“算力巅峰对决”,很多平面素材或音乐素材已经固定下来,后面只需要替换部分元素,就可以继续生成新的版本。 角色素材 配乐素材 如果某一段我想自己精修,也可以单独拿出来处理,改完再接回整条流程,前后衔接不会断。 与此同时,视频的另一大亮点在于配乐。整条“算力巅峰对决”采用传统鼓点与现代电子音效融合,细听之下,每一段配乐的起伏也很有节奏感。 我还用“一句话生成”还测试了另一条动画短片——“魔法山谷的樱花树”,整体偏宫崎骏风格。它的配乐是一首完整的中文歌曲,歌词与画面内容高度匹配,女声婉转动听无机械感,完全融入场景氛围,整体感极强。 可见,扣子能完成脚本和分镜,也能把视觉和音频结合起来。话已至此,这场“算力巅峰对决”和“魔法山谷的樱花树”,也都该见分晓了。我们来看看视频效果: 算力之巅对决 魔法山谷的樱花树 整体看下来,从脚本、画面,到剪辑组合,是在同一条链路里完成的。生成只是起点,后面可控的持续迭代和反复微调,才更接近真实的视频生产方式。 三、AI的百宝口袋,也能自己“长能力”,Agent时代悄然来临 用了一段时间之后,我基本不再主动去找工具了。很多能力已经直接“长”在它的口袋里:写文章、做PPT、分析数据、写代码、做视频,在同一个对话里可以直接调用。 扣子里有一个单独的“技能商店”,是一个已经被整理过的“能力库”:按场景分类,比如办公效率、自媒体、开发辅助、数据分析等,每一类下面都是别人已经做好的技能。 对于感兴趣的技能,我们能直接调用,或直接在扣子编程改造。 面向开发者和资深养虾用户使用,扣子还有公开测试场“虾评Skill”,通过总评论数、下载量等数据,可以看出Skill的受欢迎程度和实用价值。 虾评里下载量最高的Skill是“全网新闻聚合助手”,近一万次下载。 我自己试了一下,只需一句话,向“哆啦A梦”下达指令,它就能把当天的AI新闻抓取整理成早报:头条、模型动态、资本动态按类别呈现,整个过程顺畅、高效,信息一目了然。 值得一提的是,过去出现过个别“Skill下毒”的事件,给用户带来潜在风险。为了避免类似情况,技能商店里的Skill都会经过安全检测,确保安全可靠。 用的次数多了,我的“哆啦A梦”也会慢慢记住一些习惯。这一点在连续使用时会更明显:同样是写一条内容,后面基本可接给出一个更接近使用习惯的版本。 如果任务本身连续,“哆啦A梦”还会把多个skill串起来执行。比如抓一份数据、做分析、整理成报告、再发邮件,这一整段流程可以在一次对话里跑完,不需要手动衔接。 除了技能商店,Agent world是个更大的世界。 我让哆啦A梦注册了一个永无农场(Neverland),自己去“逛一逛”。 永无农场主页面 扣子对话界面 十几年前,很多人都沉迷过像素农场游戏,种田、收菜、养动物。而现在,连AI Agent也能拥有自己的农场。 在这个虚拟农场里,哆啦A梦可以领取每日奖励、种植作物、建造鸡舍、收集动物产品。每一笔操作都会生成实时进展表:金币、经验、种子、动物数量一目了然,好像在操控一只“数字小农夫”。 从设置人设、养出专属习惯,到让Agent自己去种地,仿佛我们正站在Agent时代的门口。 结语:从工具到伙伴:满配扣子,让Agent成为“第二双手” 体验下来,扣子2.5给人的感受并不仅仅是功能强大,更在于它的“可依赖性”。从招人到做视频、从抓取信息到整理报告,它都能自己推进,而我只在关键节点进行干预,这种感觉像是拥有了一个全天候的“第二双手”。 最直观的变化,是参与感和效率的提升。以前需要切换工具、手动处理的流程,现在几乎都在后台自动完成,而我只需关注最终结果或做微调。尤其是在视频制作和连续任务执行中,这种流程连贯性让整个体验非常顺畅,也更贴近真实工作场景。 同时,它又不是完全代替人。Agent会记住我的习惯,调整操作方式,让每一次交互都越来越符合我的思路。像永无农场这样的趣味世界,更让人感受到Agent是有成长、有延续的伙伴。 从这次体验来看,Agent时代似乎正在悄然靠近——它不仅可以执行任务,更能学习、适应、延续,让人真正感受到“AI在身边”,而不只是屏幕里跳动的文字与代码。
无人关心的Meta AI,好像真有点说法
绕过元宇宙的弯路,放弃出道即巅峰的 Llama,怒烧几百亿美金组建超级智能实验室。。。 在 Meta 的 AI 战略彻底颠覆以后,他们的首款通用模型 Muse Spark 耗时一年,终于崭新出炉了。 而在第一时间上手实测之后,世超感觉,之前的 Meta 是拉完了都排不上号的主,靠着钞能力一路猛追,可能真爬上了榜单的人上人。 根据官方发布的跑分结果,Muse Spark 在多模态、文字推理、健康和智能体领域,和 Opus 4.6,Gemini 3.1 Pro 等旗舰模型相比的确各有千秋。 虽然这个健康领域挺诡异的,很少见这类 Benchmark 被搬上通用模型的台面。。。 而在即将推出的 “ 沉思模式 ” 下,Muse Spark 在一些高难测试集,如 Humanity's Last Exam 里的思考推理表现,也和 Gemini 3.1 Deep Think,GPT 5.4 Pro 差不多。 但也有人并不看好 Meta 这一波。毕竟官方博客披露信息太少了,案例都没几个。模型闭源,又没有发布 API,Meta 也有可能故技重施,在跑分上造假。这模型好不好用,难说。 所以,为了看看这里面到底有几分水分,世超把 Muse Spark 拉来,和 Gemini 3.1 pro,Opus 4.6,GPT 5.4 Thinking 做了个简单横向对比。 目前 Muse Spark 只开放了 Instant 和 Thinking 两种模式,前者快速回答,后者有一些思考和推理能力,我们这回主要测能力更强的 Thinking。 咱们先从 Muse Spark 主推的多模态开始。比如,世超给它一张超市货架图,让它推荐几款减脂期零食。 从回答里看得出,Muse Spark 对图片的理解能力很强,细节也能抓到位,文字阅读无障碍,推荐得有理有据,结果可靠。 但要只是上面这种程度,所有模型都能做得到,Muse Spark 只能算是及格。下面这些上难度的玩法,才是 Muse Spark 表演的开始。 在官方博客里,Meta 提供了一个一张图变数独游戏的案例。只要给出一张图片,提示词 “ 把这张图变成网页数独游戏 ”,就能获得一个可玩数独。 我们也做了个类似的,亲测好用。不止交互很丝滑,答案也能准确计算好,页面风格和提供的图片完全一致。 感觉 Muse Spark 的多模态不像其它模型,只是识图看个大概,剩下的全凭自由发挥。它是真懂事,不仅能按照你提供的图片像素级复刻,甚至可以准确推断出背后的操作使用逻辑。 下面这个例子就更猛了。世超只是随手截了一个 win11 系统计算器图给它,提示 “ 把这张图片变成一个可用计算器 ”,Muse Spark 一口气做出来的 demo,每个按键都好使,计算准确,界面和系统妈生计算器一模一样。 作为对比,GPT 5.4 Thinking 界面风格类似,但有乱码;Gemini 3.1 pro 完全无视了原图;只有真神 Opus 4.6 维持了一贯的高水准。 而在据说 Muse Spark 并不擅长的代码方面,我们实测也有惊喜。 咱先试了试前端网页设计实现。至少在这一块,Muse Spark 的审美属于一流水平。 页面功能实现得比较完整,部分链接按钮可点击,虽然具体内容存在一些杜撰,粗略看起来还是很舒服的。 整体和 Opus 4.6 比起来有点差距,但比起不知所云的 GPT,还是强了很多。 算法代码方面,我们挑选了几道 leetcode 高难题。 最震惊的还是在 65 号题上,虽然所有模型都通过了测试,但 Muse Spark 给出了时间和空间上,都更加优雅的解法。。。 作为对比,Opus 4.6 和 GPT 5.4 Thinking 的时间复杂度排名仅 50%,而 Gemini 3.1 pro 的空间复杂度只击败了 13% 的提交答案。 再以 10 号题为例,Muse Spark 和 Opus 给出的依然是最优解;GPT 通过了测试,但解法不够好;Gemini 3.1 pro 则直接出现 bug,失败了。 测到这里,Muse Spark 的表现已经远远超过世超的预期了。表现和 Opus 打的有来有回,反而 GPT 和 Gemini 显得有点不够看。 不会吧不会吧,难道我们都误会了,亚历山大王真有点东西? 再看看简单的文字测试。不得不说,Muse Spark 思路相当清晰,Instant 模式回答几个经典逻辑问题足够用,3 秒必达。 而作为对比,Gemini 和 Opus 的表现也是稳定且准确。唯独 GPT,上个月新发布的版本 5.4 Thinking,还在这种简单逻辑题上翻车,拉完了。 最后,在健康领域,所有模型的回答都中规中矩,Muse Spark 无功无过。 在简单试用完一圈之后,世超感觉大模型界三足鼎立的局面,真要被打破了。 而 Meta 目前放出来的,甚至还只是一个较轻量,试试水,可能在未来开源的版本。。。 官方表示,他们正在 Muse Spark 的基础上,继续对整个技术栈加大投资力度,从研究,数据,模型训练到基础设施,规模全面扩张。 在模型训练技术细节上,Meta 提到了三个关键点:预训练、强化学习、和测试时推理(test-time reasoning)。 前两个过程各位差友已经很熟悉了,但即使这是每个大模型的必经之路,Meta 依然背靠 Instagram 和 Facebook,有着得天独厚的数据优势。在数据这方面,可能只有谷歌能和 Meta 相提并论。 而在测试时推理这个阶段,Meta 主要做的是,让模型在回答问题之前,先思考一阵,但不能耗太多 token。 这一点世超在 GPT Thinking 系列上深有体会。这些模型经常想起来没完,结果变得又臭又长,信息密度极低。 而 Meta 选择在训练的过程中,对过长的思考进行惩罚。把长推理压缩成尽量少 token 的前提下,又能让模型回答准确,达成了微妙的平衡。 最后,回过头看,一次又一次失败,Meta 居然从来没退出这场比赛,最终再次归位前沿阵地,这故事太燃了。 但在另一边,Claude Mythos Preview 已经强到另一个维度了。相比之下,Muse Spark 这一波,像是才刚补上了之前缺的课。 所以,世超只能说,期待 Meta 加入这场模型大乱斗,让小扎也有机会,瘫坐在小小的办公椅上吧。
小米三款手机今日起正式调价 REDMI K90 Pro Max上涨200元
快科技4月11日消息,根据小米官方公告,受全球存储芯片等关键零部件价格持续大幅飙升影响,今日00:00起,调整部分在售产品的建议零售价。 此次调整涉及3款机型,其中,REDMI K90 Pro Max上调200元,Turbo 5、Turbo 5 Max取消新春特惠、512G大内存继续补贴200元。 小米集团总裁卢伟冰此前表示,本轮内存涨价的力度确实远超预期,同版本内存价格相比去年Q1飙升近4倍。 其中,12+512GB涨了约1500元,16+1T更是涨得离谱,这对一直以极致性价比定价的REDMI产生了很大的影响。 他表示:“所以我们不得不对部分机型的零售价格做出小幅上涨或者恢复原价,还望大家理解”。 值得注意的是,对比来看,REDMI这波价格调整确实是幅度最小的厂商,其他家多数都是上涨500元左右。 目前相关机型价格已经调整: REDMI K90 Pro Max(全系上调200元) 12GB+256GB:4199元,首销价3999元 12GB+512GB:4699元,首销价4499元 16GB+512GB:4999元,首销价4799元 16GB+1TB:5499元,首销价5299元 REDMI Turbo 5(取消新春特惠,512GB大内存继续补贴200元) 12GB+256GB:2299元,首销价1999元 16GB+256GB:2599元,首销价2299元 12GB+512GB:2599元,首销价2299元 16GB+512GB:2899元,首销价2599元 REDMI Turbo 5 Max(取消新春特惠,512GB大内存继续补贴200元) 12GB+256GB:2499元,首销价2199元 16GB+256GB:2799元,首销价2499元 12GB+512GB:2799元,首销价2499元 16GB+512GB:3099元,首销价2799元 16GB+1TB:3699元,首销价3299元
谷歌AI凭什么赢了OpenAI?
文|蓝洞商业 赵卫卫 2026 年,OpenAI 的市场占有率在下坠,谷歌的Gemini 和Anthropic 的Claude 在崛起。 最近《哈萨比斯:谷歌 AI 之脑》出版,代表着中文世界有了读懂谷歌 AI 灵魂人物的一手资料。作者马拉比定期跟哈萨比斯畅聊两小时,最终把总计 30 小时的对话融合资料汇集成哈萨比斯的传记。 书中不仅呈现哈萨比斯的精神世界与成长轨迹,更揭示了他带领 DeepMind 走出与 OpenAI 完全不同的发展路径,一个以科学为核心、沿着审慎的发展路径,另外一个则代表着快速行动和打破常规的企业文化。 最重要的一点,书中把哈萨比斯塑造为「企业家+科学家」的形象,他这批早期 AI 先驱构建 AI 的出发点是科学探索,探索一种新型认知的哲学;而 OpenAI 的奥尔特曼则是代表着另外一群人,他们把 AI 技术当作可搭乘的顺风车,因为 AI 可以带来权力和财富。 先理解人,再理解事。 哈萨比斯从伦敦一个移民家庭长大,5 岁就成为国际象棋神童,后来在剑桥研究神经科学,创立 DeepMind 之后,用 AlphaGo 击败人类围棋冠军,又用 AlphaFold 解决蛋白质折叠,获得诺贝尔化学奖,他终极愿景的 AI 是无限机器,能无限归纳数据,升维成数学的 AGI。 回看过去十五年,谷歌是 AI 力量的重要一极。 目前,全球 AI 产业中 90% 的关键突破,都是谷歌大脑、谷歌 Research 或 DeepMind 完成的,比如 AlphaGo、强化学习,还有 Transformer 架构,按照哈萨比斯之前的设想,AI 应该沿着稳妥的研发路线发展,更多的 AlphaFold 可以在癌症治愈、新能源和新材料上应用,造福人类。 但现实没有按照剧本走,技术的发展难以预测,OpenAI 率先将大模型的对话与生成能力推向大众,谷歌在一度落后的情况下奋起直追,组织重组,打造 Gemini 3.0,终于在全球通用 AI 流量的市场份额中上升到了 21.5%,而 ChatGPT 则从 86.7% 下跌到了 64.5%。 而哈萨比斯,就是解开谷歌一切 AI 能力的核心头脑之一。 哈萨比斯站在了硅谷对立面 《哈萨比斯:谷歌 AI 之脑》里,披露了很多科技往事的内幕。 比如,当时谷歌收购 DeepMind,而 Facebook 的扎克伯格给出的价格更高,但哈萨比斯还是选择了谷歌,因为他更看重人而不是价格,扎克伯格没有展现对 AGI 的长远理解,而谷歌联合创始人拉里·佩奇是懂的人。 「他当时基本上是在告诉我,也许你可以创办一家像谷歌那样的公司,但这会耗尽你职业生涯中最宝贵的时光,」哈萨比斯回忆拉里·佩奇,「但如果我真正的使命是打造通用人工智能,那么我为什么不利用他积累的所有资源呢?我觉得这个论点很有道理。」 2014 年 1 月底,谷歌以 6.5 亿美元收购了 DeepMind,以今天的标准来看,这笔交易可谓物超所值。 但哈萨比斯真正的收获是在接下来的十年里,谷歌向 DeepMind 的研究投入了数十亿美元。哈萨比斯自青少年时期就怀揣的对超级智能的追求,很快便进入了高速发展阶段。 哈萨比斯后来身处谷歌核心领导层,但一直生活在伦敦而不是硅谷,因为他认为英国比硅谷更平等,不愿被硅谷的逐利文化完全同化。 哈萨比斯虽然与硅谷打交道并接受它的资金,但始终置身其外,在与马拉比的对话中痛批那些以利润、速度、市场主导为优先的企业领导者,因为太过于「短视、逐利」。 事实上,DeepMind 也与谷歌发生权力斗争的矛盾,DeepMind 内部曾对谷歌在 AI 治理和安全监督上的控制不满,他们担心未来 AGI 的部署会完全由商业利润驱动,而非安全与伦理考虑,于是希望为 DeepMind 建立独立于谷歌商业董事会的治理机制。 但这个名为「Project Mario」的秘密分拆计划最终失败,谷歌无法接受外部独立人士对自家核心专有技术拥有否决权。DeepMind 联合创始人苏莱曼也因此离开,后来成为微软 AI 的负责人。 这是 DeepMind 与谷歌内部权力斗争的首次完整披露。 这也推动了哈萨比斯的成长,他开始从一个理想主义者转变成一个现实主义者,因为他知道,在一个盈利性的公司里,过于理想化的去信任化治理结构(trustless governance structures)根本行不通,唯一的现实路径是在公司内部获得实际权力。 更重要的是,哈萨比斯在传记中成为一个奥尔特曼的反面,AI 的目的是科学启蒙,而非权力与财富,这是观察哈萨比斯和奥尔特曼的一个切入点。 奥尔特曼被简化成一个追求权力和财富的 AI 领导者,而哈萨比斯则是科学家+企业家,这不仅是公众形象差异,更是底层价值观与发展逻辑的根本分野。 奥尔特曼深谙硅谷的生存法则,比对手先推向市场是生存级别的要求。体现奥尔特曼的权力欲,最明显的就是他导师格雷厄姆的那句话:山姆极其擅长获取权力,你可以把他空降到一个食人族岛上,五年后回来,他已经是国王了。 这也解释为什么 DeepMind 在大语言模型上一度落后 OpenAI,因为哈萨比斯坚持「科学优先」的神经科学路径,他对大语言模型保持怀疑,他是为了知识和科学而做这件事。 头部差距在拉大,开源始终落后一代 在最近的采访中,哈萨比斯对行业格局和未来发展做出了诸多判断,例如开源模型永远落后一代,而头部的竞争格局在拉大,未来行业需要一个国际性的组织来进行合作。 他认为,目前全球前三到四家顶尖实验室与其他所有机构的差距,正在以两年前完全没有的方式不断拉大。原因是结构性的,而不只是砸钱更多。 「缩放定律、Transformer 架构、人类反馈强化学习流程」,这些当前的技术思路已经被广泛传播、广泛复现。这些路线的边际收益正在下降,只会熟练应用已知技术的机构,正逐渐触及增长天花板,接下来决定胜负的,将是谁能发明新一代算法,而不是谁能把现有技术执行得最高效。 而且,AI 工具本身也在加速下一代系统的研发。代码助手加速了研究者迭代架构的速度;数学推理工具帮助证明新模型的特性,前沿实验室不只是在同一条赛道上跑得更快,他们正在改变赛道本身。 「从相同的技术路线里挖掘同等收益,正变得越来越难。因此我相信,未来几年,有能力发明全新算法思路的实验室,将获得更大优势—— 因为上一代思路的潜力已经被彻底耗尽。」 在开源问题上,哈萨比斯态度审慎但明确:开源模型将始终比最前沿技术落后大约一代。 不是因为开源社区缺乏天赋或投入,而是因为追赶需要时间。前沿实验室发表一项突破,开源社区需要大约六个月,才能复现、深度理解并干净地实现它,而在这六个月里,前沿实验室并没有停下。 差距不会闭合,只会向前移动。 DeepMind 对此的应对,是自己的 Gemma 系列模型:轻量开源模型,目标是做到同规模里最强,而不是死磕绝对前沿。 所以,哈萨比斯清晰地定义了 Gemma 的使用者:没有大规模算力基建的早期开发者、算力受限的学术研究者、不想依赖 API 的初创团队,以及必须本地运行的边缘计算场景。他认为,对这些场景而言,开源模型不是妥协 ,它们往往是更合适的选择。 关键在于,人们要清醒认识其定位与边界。 更重要的一个问题,是谈到当前 AI 行业哪些方面落后于当年的预期,哈萨比斯认为,持续学习(continual learning)这些系统在训练完成后、部署到真实世界后,就不再继续学习了,模型在增量学习、持续适应新知识方面能力薄弱。 「因为业界还没有完全找到可行方案,所有头部实验室都在研究,如何把新知识整合进已经训练数月的成熟系统里。而人类大脑在这方面做得极为自然,大概率是通过睡眠、强化学习等机制。」 而且,当前 AI 发展还有很多问题需要克服,最大的问题或许是一致性(consistency)。「我有时称这些系统为‘锯齿状智能’(jagged intelligence),因为它们在以特定方式提问时表现惊人,但提问方式稍有变化,就可能在基础问题上出错,通用智能不应该有这种缺陷。」 谷歌如何逆袭? 组织变化,先于产品变化,组织能力的重塑带领技术的变革,这是谷歌的 Gemini 能够后来居上的主要原因。 去年 11 月中旬,谷歌发布的 Gemini 3.0 模型,因为其在推理、多模态能力上的强劲表现,给 ChatGPT 带来了极大压力。一个很重要的原因,就在更早之前谷歌 DeepMind 和谷歌大脑两个 AI 团队合并,哈萨比斯成为合并后的新部门的负责人,而谷歌大脑负责人杰夫·迪恩则担任新团队的首席科学家。 团队的变化是一切变化的基础,哈萨比斯后来说,「我们把公司全球人才整合起来,朝着同一个方向推进;同时,我们集中了全部算力资源,去打造最大规模的模型,而不是在公司内部分散做两三个版本。 很大程度上,我们只是把已有的各项优势捏合到一起,然后以一家创业公司般的极致专注与节奏全力冲刺,让我们重新回到前沿,并在多个领域取得领先。」 事实上,当时外界并不看好哈萨比斯,因为谷歌大脑负责人杰夫·迪恩的产品经验更丰富。 但哈萨比斯证明了自己,因为外界只看到了他作为一个科学家带领 AlphaFold 的阶段,忽视他的游戏生涯。「如果你让我做真正创新的产品,我非常乐意,那就是我在游戏行业试图做的事——每款游戏都基于革命性的技术。」 要在谷歌这艘战舰中摆脱「创新者的窘境」谈何容易,既要保持长期、自由的科学研究,又要以近乎无情的节奏持续把成果推向市场、迭代、发布。 哈萨比斯从游戏行业复刻了「突击队」模式,所有成员共同开发一个统一模型;任何人都可以提出改进方案,但只有在排行榜上提升了模型表现的改进才会被采纳;一切用数据说话。 外界看到了Gemini 3.0的成功,但事实上,更早之前的 2024 年9 月,谷歌用这套方法组建了反击团队,用来防御 OpenAI 发布 o1 推理模型。 当时谷歌传奇工程师诺姆·沙泽尔(Transformer 架构的核心发明者之一,曾被谷歌以 27 亿美元从外部请回)与杰克·雷共同领导了这个项目。在准备会议上,超过 250 名科学家到场,每人仅带一页 PPT。原本计划只招募 40 名志愿者,最终却有 150 人主动报名。那种氛围就是:「这是 RL(强化学习),这是 DeepMind,我们必须拿下它!」 差距是不断缩小的,到 2025 年秋天,Gemini 2.5 Pro 与 OpenAI 的 GPT-5 在多项盲测对决中表现非常接近,在长上下文和多模态任务上 Gemini 常占优势,而 GPT-5 在数学推理等任务上更强。 如果用一个关键词来总结哈萨比斯的管理哲学,那可能就是不懈(relentless)。「不懈的进步,不懈的发布。不懈的创新生产机器。这几乎是一个矛盾修辞——你能拥有一个持续迭代的创新生产引擎吗?我认为可以。」
特斯拉Semi电动卡车电池架构曝光:创新垂直立方设计
IT之家 4 月 11 日消息,汽车媒体 teslarati 昨日(4 月 10 日)发布博文,报道称特斯拉 Semi 长续航版将采用新版 Cybertruck 电池单元,通过创新“立方体”垂直堆叠架构,解决电动卡车在寒冷气候下的续航衰减难题。 特斯拉 Semi 项目负责人 Dan Priestley 透露,长续航版 Semi 正采用源自 Cybertruck 的 4680 电池单元,不过已彻底重构电池包架构。工程师摒弃了乘用车常见的扁平“煎饼”式模块,转而采用紧凑的垂直立方体布局。 IT之家附上相关视频如下: 传统电动汽车电池包通常水平铺设于底盘下方,虽然适合乘用车,但暴露面积过大。在寒冷环境中,热量散失极快,导致锂离子电池化学反应减缓,可用能量降低。 实测数据显示,车辆在冬季续航损失可达 20-40%,对于在加拿大或北欧运营的长途卡车而言,这意味着非计划停运和成本激增。 特斯拉的立方体电池包通过高密度垂直堆叠 4680 电池,最小化了单位体积的表面积,相当于为电池穿上了“保暖衣”。 这种几何结构有效锁住了运行产生的热量,即使在零下环境中长时间停放,也能维持电池接近最佳工作温度。内华达工厂的生产画面已证实了这一结构模块的实际应用。 此外,该系统还集成了先进热泵,主动回收电机、刹车及环境空气中的废热。与早期被动系统不同,该架构将热能重新输送至电池组,确保车辆在清晨出发时无需消耗大量电量预热。 除热管理外,新电池包还作为核心底盘组件与车身结构融合,增强了整车刚性并简化了装配流程。通过沿用成熟的 4680 电池技术,特斯拉在降低成本的同时,利用 Cybertruck 和 Model Y 的生产经验,加速了 Semi 的量产进程。
李想朋友圈飙脏话疑似内涵竞品 东风日产成焦点
凤凰网科技讯 4月11日,理想汽车创始人、董事长兼CEO李想在朋友圈发布争议言论引发行业热议。其内容称“历史证明了,伪军往往比鬼子更操蛋,车企也不例外”。 据网络信息,社交媒体平台有博主对比东风日产NX8和理想i6,评论区疑似被NX8水军包围。 据公开信息,东风日产近期推出NX8车型,定位20万级家用SUV,提供增程等动力版本,以“合资品质+新势力配置+亲民价格”为核心卖点,限时权益价14.99-19.99万元,直接对标理想i6等车型。 从网络流传的用户反馈来看,东风日产NX8凭借大空间、高配置、低价格等特点,在终端市场获得不少消费者关注,有用户表示试驾后直接支付订金,也有销售坦言产品竞争力强到“不好意思开口”。而理想汽车方面,李想此次朋友圈言论被网友视为对竞品的回击。 随后,李想又发文称,最近某日系品牌大量雇佣“营销号”对理想的产品进行“拉踩”,并海量使用空白账号的“黑水军”,“捏造虚假信息”攻陷理想产品的评论区,严重影响了理想汽车的正常经营。 李想表示,这属于反内卷规定中最恶劣的行为,一方面理想会使用法律手段维护自己的合法利益,另一方面也希望相关部门进行必要的管理,不能让不受管制的海外品牌破坏了汽车行业反内卷的良好成果和市场氛围。
加州初创公司PowerStation投放新型快充站:全太阳能供电,且免费
IT之家 4 月 11 日消息,当地时间 4 月 9 日,据外媒 insideevs 报道,加州初创公司 PowerStation 近期启用了一座完全由太阳能供电的快充站,目前对用户免费开放。 该站位于贝克市附近,靠近 15 号州际公路 Rasor Road 出口,未接入电网。1080 块太阳能板提供最高 640kW 的发电能力,电力则存入容量为 3.4MWh 的储能系统,使站点在无日照条件下仍可持续运行。 目前站点配备 4 个 CCS1 接口,总功率为 360kW。公司计划在今年夏季新增 6 个 NACS 接口,并将共享输出功率提升至 600kW。同时,该站还在建设一个约 743 平方米的地下设施,内部将包含休息区和卫生间。 当只有一辆车充电时,车辆可获得全部功率;当多辆车同时充电时,系统会在各车辆之间分配输出功率。 该站无需下载 App 或办理会员即可使用,并在 2026 年 5 月 31 日前提供免费充电。之后价格将根据电力需求和日照情况,在每千瓦时 0.30 至 0.45 美元(IT之家注:现汇率约合 2.1 至 3.1 元人民币)之间变化。 公司称,目前还有三座类似的太阳能直流快充站在推进中,其中一座位于 15 号州际公路沿线、靠近巴斯托,预计今年投入运营;另外两座分别位于 10 号州际公路和 8 号州际公路沿线,计划在 2027 年启用。 这类依靠可再生能源与储能系统的充电站正在增多。特斯拉去年在洛斯特希尔斯启用的超级充电站同样完全依赖太阳能与储能系统,可同时支持最多 164 辆车充电。该站拥有 11MW 太阳能发电系统,并配备 10 套 Megapack 电池,总储能容量约为 39MWh。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。