行业分类:
加载中...
头条分类:
加载中...
我试戴了 Meta AI 带屏眼镜:第一次觉得 AI 眼镜有戏了
哇,整个这个眼镜戴上去的感觉太科幻了! 这是我戴上 Meta Ray-Ban Display 的第一反应。说实话,从看到去年 Meta Orion 样机的表现之后,我的期待值原本没有特别高,但真的把 Display 戴在头上,我突然觉得这个行业有戏。 在 Meta Connect 2025 发布会上,这副售价 799 美元的「带屏智能眼镜」终于揭开面纱。它是 Meta 首款支持显示功能的智能眼镜,通过右眼的彩色光波导 HUD 和配套的 Neural Band 腕带,把「脸上的 AI」从概念变成了现实。 与 Orion 样机类似,Display 采用的显示技术是彩色光波导,这种仅依靠光线在载体内反复折射、将画面反射到镜片中间的技术是目前 AI 眼镜最主流的显示方式。但 Meta 实现了一项很特殊的指标:低至 2% 左右的漏光率。 也就是说 HUD 点亮时,你对面的人完全看不到光波导的反射和漏光,不像是今年早些时候谷歌推出的 XR 眼镜样机那样会有一个明显的反射区域: @梦雅Myra 佩戴的 Display,在类似的角度不会出现明显的屏幕漏光 即使我的朋友站在对面,在屏幕完全点亮时也完全察觉不到。只有从侧面角度,才能看到几排光波导屏幕导线的反光。 只不过,根据外媒 TheVerge 的上手体验,Meta 这块过于透明的屏幕也有一些弊端:由于和你对话的人完全看不到你在看什么东西,可能会感觉你有点心不在焉、视线没有集中在人身上。 至于实际的屏幕显示效果,Display 这块光波导屏幕亮度足足有 5000 尼特,搭配默认标配的光致变色镜片,在光线过强的户外镜片会变成墨镜片,可读性依然非常优秀。 单眼显示与神奇的 Neural Band 之前我一直担心单眼显示会不会很奇怪,但实际体验完全打消了这个顾虑。我已经连续使用了一个多小时,最明显的感受是它可以跟现实世界无缝融合。 虽然 Display 仅有一块位于右侧的屏幕,但它的单眼显示效果与环境融合的很好,因为屏幕的位置和视场角(FOV)都设计的比较低,在直视的时候屏幕的显示区域会落在对方的胸口处,几乎和电影的字幕是完全一样的。 因为扎克伯格比对方矮,需要低头对话 这块 600×600 像素的屏幕虽然面积不大,但能做的事情跟手机很像,换句话说,整个显示界面的设计和逻辑完成度都非常高,几乎不会有使用时不知所措的情况。 比如我用它看 WhatsApp 和 Messenger 消息,整个对话流其实是可以完整显示出来的。通过手指上下滑动翻页,再用语音转文字回复的过程也非常流畅。我甚至在想,真的可以很长时间不用把手机从兜里掏出来了。 而作为 Display 的主要操控方式,配套的 Neural Band 腕带更是改变了游戏规则。 虽然和苹果 Vision Pro 一样都可以通过手指手势操控,但 Display 并不依赖摄像头,而是借助腕带读取手腕的肌电信号(EMG)来识别的,也就是说你的手可以放在身体两侧、背在身后、甚至藏在口袋里,手势依然能被准确识别。 Neural Band 的主要操作方式包括双击中指点亮屏幕、单击中指退出、单击食指确定、旋转手腕放大,以及用拇指在食指上滑动翻页等等。虽然需要一点学习时间,但是掌握难度并不高,灵敏度也是很优秀的。 而 Display 用来处理输入的方式则更加有趣。除了通过耳机上的 6 麦克风阵列做语音输入之外,你其实还可以戴着 Neural Band 直接在平面上写字,腕带会结合肌电信号和陀螺仪识别手写的字母,就像扎克伯格在发布会演示的这样: 扎克伯格在采访中透露了一个有趣的细节:他已经能用这个系统达到每分钟 30 个单词的打字速度,几乎一整天都在用眼镜收发消息。他的高管们甚至能分辨出哪些消息是用眼镜发的——比如那些长度更短、但是秒回的信息。 更重要的是,扎克伯格认为 Neural Band 的潜力远不止于此: (虽然)我们发明 Neural Band 是为了配合眼镜使用,但我认为它最终可能成为一个独立的平台。未来,它不仅能通过思维实现个性化自动补全,还可能成为控制其他设备甚至智能家居的方式。 那些真正打动我的功能 如果说戴着 Neural Band 虚空写字像是变成了钢铁侠一样,那眼镜里的实时字幕功能让我感觉获得了超能力。 唤醒的方式很简单,说一句「Hey Meta, turn on live captions」,对面人口中的英语就会实时显示在屏幕上。在嘈杂环境里,Display 甚至能准确识别你正在看的那个人的声音,多个人同时说话也不会混淆。 并且得益于前面提到过的屏幕位置,戴着 Display 看实时字幕的方式,简直就是把眼前的现实变成了看电影。 虽然核心软件仍依赖手机连接,但这远不只是一个通知镜像。你可以发送文字、接听音视频电话、显示正在播放的音乐、获取逐向导航指引、查看相机取景,还能运行 Meta AI 识别眼前的物体。 发布会上演示的 Live AI 实时视觉识别场景 Meta 的 CTO Bosworth 强调:清晰的文字渲染是让 AI 变得有用的关键——如果 AI 只能语音回复,你获得的信息就有限。而当你提问后它能直接显示答案,这样不仅更直观,也更私密。 这种基于「你能看到结果」的确定感是普通版 Meta Ray-Ban 智能眼镜的纯语音交互无法给予的,并且在实际生活里,语音唤醒 AI 助手在很多场合是不太方便的,Display 语音/手势/视觉混合交互就不会有这种问题。 在体验 Display 的时候,我试着用 Meta 的 AI 功能识别了一幅画。Display 不只是语音回答,还在屏幕上显示了相关的信息卡片,信息密度相比纯语音交互(等 AI 慢慢念完)也更高一些。 这块小屏幕甚至可以用来预览相机画面,以及看视频——虽然 FOV 很小,但画面大小刚好,细节都能看清。如果朋友发来视频链接,你可以直接在眼镜上打开查看并快速回复,整个过程不用掏手机。 总之 Meta Ray-Ban Display 体验下来,我觉得这副眼镜的核心价值有三点: 增大信息密度:哪怕只有一两行字的显示,获取的信息也比纯音频多得多 给予确定感:能看到具体的界面、动画和菜单选项,让眼镜的操作更有把握 成为 AI 的通路:AI 能看到你所见,你也能看到它的反馈,让 AI 更无缝地融入日常生活 这可能真的是下一个 iPhone 时刻 扎克伯格在访谈中的判断很明确: 眼镜将是下一个计算平台。这是唯一能让 AI 看到你所见、听到你所听、全天候与你对话的设备。 全球有 10-20 亿人日常佩戴眼镜。五到七年后,这些眼镜中的大部分会不会都变成某种形式的 AI 眼镜?扎克伯格说:我觉得这就像 iPhone 出现时,大家都还在用翻盖手机,但变成智能手机只是时间问题。 Meta 瞄准的是「优化主义者」和「追求生产力的人」。虽然初期产量只有几十万副,但 Bosworth 预测「我们生产多少就能卖多少」。扎克伯格也暗示,真正的利润不会来自硬件本身,而是「来自人们长期使用 AI 和其他服务」。 体验结束后,我最大的感受是:Display 不再是概念产品或开发者玩具,而是真正可以日常使用的工具。 虽然 799 美元不算便宜(一台 iPhone 17 也是这个价),20 度的 FOV 和 600×600 的屏幕也不算大,但这些都不妨碍它成为我用过最接近理想的智能眼镜。 我觉得 Meta Ray-Ban Display 的目标很明确——减少掏出手机的次数,把那些快速查看和回复的操作都通过眼镜完成。从这个角度说,它确实做到了。 或许正如扎克伯格所说,这就像智能手机替代功能机的时刻。智能眼镜的技术拐点已经到来,只是还未完全普及。而 Meta Ray-Ban Display,可能就是这场变革的开始,可能就是下一个 iPhone 时刻。 文|肖钦鹏,马扶摇
笑Cry!这届Meta Connect大会:“大跌眼镜”
作者 | 陈骏达 王涵 编辑 | 李水青 智东西9月18日报道,今天上午,“年度XR圈春晚”Meta Connect大会正式拉开帷幕!AI眼镜是这场发布会的绝对主角,Meta CEO 马克·扎克伯格戴着AI眼镜小跑进场,一口气甩出三款新品。 Ray-Ban Meta(第二代)AI眼镜在续航和影像能力上迎来大幅度提升,让其更贴近日常佩戴需求。Oakley Meta AI眼镜则主打运动场景,既能充当耳机也能作为运动相机,还联动了Garmin与Strava等运动装备和软件。 上方为Ray-Ban Meta(第二代),下方为Oakley Meta 而带有显示的Meta Ray-Ban Display AI眼镜,可谓是Meta史上最强AI眼镜。这款眼镜与腕带Neural Band的结合,则标志着交互方式的一次大胆尝试,用户不再需要触碰设备,可以靠手腕肌肉的微小动作来完成输入和控制。 腕带Neural Band场景展示 Ray-Ban Meta(第二代)的的起售价为379美元(约合人民2692.3元),Oakley Meta的起售价为499美元(约合人民币3544.7元),而Meta Ray-Ban Display+Neural Band的套装起售价为799美元(约合人民币5675.8元)。 不过,和炫酷的新品、新功能相比,这场发布会上更抢眼的或许是新品AI功能的不断翻车:AI答非所问、Neural Band感应失灵,种种故障让扎克伯格不得不挤出尴尬而不失礼貌的微笑,还把问题归咎于现场的Wi-Fi网络。 除了硬件,Meta还推出了全新升级的Horizon引擎,加速构建虚拟世界的能力。从几分钟扫描现实空间到快速生成沉浸式虚拟环境,Horizon被扎克伯格描述为“元宇宙的基础架构框架”。随着内容和合作伙伴的扩展,Meta试图让虚拟世界与现实世界的融合真正触手可及。 一、AI眼镜起飞!经典款Ray-Ban Meta大更新,但AI功能灾难级翻车 “AI眼镜的起飞,毫不意外!” 在发布环节正式开始前,扎克伯格重申了他对AI眼镜形态的信心,称其为个人超级智能的理想载体。AI眼镜既不会影响用户的感官体验,还能看你所见,听你所闻,并且直接与用户用自然语言沟通。 Meta研发AI眼镜的目标,是打造一款美观、搭载个人超级智能且具备真实的全息显示的眼镜。扎克伯格称,AI眼镜的销售曲线,和历史上最火爆的消费电子产品类似。 扎克伯格还分享了Meta设计AI眼镜的三大原则,首先,眼镜本身必须是美观、舒适、轻盈的好眼镜;其次,技术需要为体验本身让路,也就是说,不能干扰人们的日常生活;最后,重视超级智能,让AI解决生活中最关键的问题。 讲完理念后,好戏正式开场! 作为全球销量第一的AI眼镜,Ray-Ban Meta迎来重磅升级。 首先,其续航直接翻倍,一副充满电的Ray-Ban Meta(第二代)眼镜,日常使用续航达到了8小时。 只需20分钟即可将Ray-Ban Meta(第二代)眼镜充电至 50%,这一眼镜还配备充电盒,可额外提供48小时的续航时间。 摄像方面,Ray-Ban Meta(第二代)眼镜拥有3K超高清视频拍摄功能,并配备超广角HDR,帧率达每秒60帧,就是不知道超高清拍摄时对电池续航有何影响。 除了已经推出的实时翻译功能之外,Ray-Ban Meta(第二代)眼镜还将拥有全新的“对话聚焦”功能,可以在嘈杂的环境中,直接把正在和你说话的朋友“音量调高”,提供更为清晰的面对面沟通体验。 扎克伯格还展示了改进后的Live AI功能,他说道,随着续航的不断提升,Meta AI不再只是用户主动唤起的功能,而是会转变为一项随时待命的服务。 不过,这个“随时”的定义很微妙。扎克伯格称,他们还在攻坚相关技术,目前只能连续使用1-2个小时。 扎克伯格远程连线了一位工作人员,让他展示Live AI功能如何帮助用户下厨。不过,Live AI功能仅仅识别了桌面上的食材,在工作人员多次询问后续该怎么处理食材时,都未能给出正确回答。 两人很有默契地将这一问题归咎于Wi-Fi网络,扎克伯格还吐槽道,Meta花了好几年来研发相关技术,却因为Wi-Fi问题在关键时刻掉了链子。 Ray-Ban Meta(第二代)眼镜的起售价为379美元(约合人民2692.3元),提供多种镜框和配色设计,还有两款限量的透明版本。 二、3545元!全新Oakley Meta智能眼镜能自动拍运动视频,还和佳明联动了 紧接着,全新Oakley Meta智能眼镜也来了,该款眼镜售价499美元(约合人民币3544.7元),最早10月21日能到手。 新款Oakley Meta智能眼镜单次充电可以支持全程马拉松比赛,扎克伯格说这款眼镜甚至在跑完两场全程马拉松后还有剩余电量,但并没有说是按照第一名的用时算还是用关门用时算。 Oakley Meta智能眼镜采用开放式耳机,扎克伯格称其搭配Meta迄今最强的扬声器,音量提升6分贝,在大风中通话也能保持通话音质清晰。 这款眼镜的镜头位于中央,搭配122°超广角,可以拍摄3K画质视频,还搭配了视频防抖功能。不仅如此,Meta还给这副眼镜新增了慢动作和延时摄影功能,该功能将同步今天发布的所有智能眼镜。 在运动方面,Meta和运动智能穿戴设备品牌Garmin(佳明)合作,Oakley Meta智能眼镜内置LED指示灯,可通过周边视觉提醒帮助您保持目标配速或心率区间。 在运动中,用户也可以用语音指令唤起Meta开启视频记录或者随时查看运动数据。 新款眼镜还搭配自动拍摄功能,当用户佩戴Garmin智能手表运动时,眼镜会在达到特定速度、距离间隔(例如每完成一英里马拉松赛程)时自动录制视频,运动结束后系统将自动合成视频片段。 同时,Meta还在与Strava联动,用户可在视频画面中贴上Strava运动数据,非常适合运动、健身博主。 扎克伯格称新款眼镜是Meta防水性能最出色的智能眼镜,达到IP67防护等级,完全不怕淋湿,甚至可以戴着眼镜冲浪。 Oakley Meta智能眼镜的镜片采用可互换的Oakley Prism镜片系统,能根据光线条件或风格需求自由更换镜片的颜色。 三、带屏眼镜+Neural Band黑科技亮相,双手揣兜也能完成点按触控 本场发布会最让人期待的新品,当属Meta首款量产、发售的带屏AI眼镜。 扎克伯格还没进场时,就戴上这款眼镜高调演示音乐播放等功能,走进发布会现场后,却又卖了个关子,把它放在一侧,足足讲了近20分钟,才正式揭晓。 这款带屏AI眼镜的正式名称是Meta Ray-Ban Display,扎克伯格称,它不是原型,用户在几周内就能买到手。 Meta Ray-Ban Display拥有两大创新点。 首先,在显示方面,这款眼镜搭载定制光机,提供全彩高分辨率全息显示。显示位置位于视野的侧面,仅在用户需要时显示,不会遮挡视线。 扎克伯格称,其显示效果足够高清,可以观看视频、查看消息,亮度达到5000nits。 Meta-Rayban Display还拥有全新的互动方式——Meta Neural Band(神经腕带)。这是一款肌电图(EMG)腕带,可以将肌肉活动产生的信号转化为指令。 在演示中,扎克伯格用Neural Band实现了触摸、点按等操作,甚至还能直接用它进行手写输入。他以手指为“笔”,在桌面上快速书写了一条消息,并完成发送,全程无需触摸眼镜或是掏出手机。据说,小扎的手速已经练到了每分钟输入30词。 Neural Band并不需要特别的适配,这是Meta过去几年对20多万名研究参与者的研究成果,几乎适用于所有人。对于那些无法进行大幅度运动或者手指残缺的人士,腕部的肌肉信号同样可以为他们提供控制信号。 显示与Neural Band的组合,解锁了很多新玩法,比如,仅需在手上一捏,用户就能查看短信和彩信,还能接听实时视频通话。 不过,这一功能在现场演示中也翻车了,扎克伯格的右手连续在空中抓了好几次,最终都未能接通电话。这一演示耗时1分多钟,场面一度有些尴尬。 Meta-Rayban Display也提供实时字幕和翻译功能。其中,字幕功能会实时转写当前听到的声音,这对听障人士很有帮助。而实时翻译功能将翻译结果直接放到用户眼前。 不过,这些功能在国内的AI眼镜上已经比较常见,Meta能否凭借其自研翻译模型提供更好的体验,还有待观察。 在混合使用的情况下,Meta-Rayban Display可提供大约6小时的续航,可折叠成平面的充电眼镜盒,可以提供长达30小时的总续航时间。价格方面,Meta-Rayban Display加Neural Band的套装起售价为799美元(约合人民币5675.8元)。 四、几分钟将现实世界扫描成虚拟世界,元宇宙更近了! 除了眼镜,扎克伯格还带来了可以创造3D虚拟现实内容场景的Meta Horizon引擎。 扎克伯格称这款引擎经过全面优化,专为实现元宇宙愿景而生:运行加载速度更快、图形渲染更出色、创作流程更便捷。 用户可以轻松创建无限互联的虚拟空间,体验十分逼真物理效果与交互体验。具体来讲,用户只需用Quest头显扫描房间几分钟,就能将其转化为沉浸式虚拟世界。未来该引擎还能无缝融合Hyper State虚拟场景与现实世界,使其全部接入统一的Horizon生态。 Meta现场展示了他们完全由Meta Horizon引擎渲染而成的虚拟世界画面,在里面甚至有十分逼真的埃菲尔铁塔,视觉表现相较以往实现了巨大飞跃。 只用几秒钟,用户就能直接从家园跃迁至一系列互联世界,新引擎让元宇宙的场景加载与渲染速度提升了4倍以上,转换世界就跟加载网页一样,元宇宙的互联体验更加顺畅。 Horizon引擎还支持更高并发性,同一虚拟世界可容纳的用户数量是之前的5倍,都可以在虚拟世界中看演唱会,再也不怕抢不到票了。 扎克伯格称,Horizon Studio与Meta Horizon引擎共同构成了元宇宙的基础架构框架,未来将有机会在智能眼镜及社交媒体平台上体验到上述升级。 除此之外,Horizon TV也扩充了新的游戏和视频内容,扎克伯格非常激动地宣布Disney+将登陆Horizon TV,环球影业也与Meta达成合作。 结语:Meta Connection大会成智能眼镜主场,扎克伯格全程0个字提到大模型 看完全篇,是不是感觉好像少了点什么?没错,扎克伯格在整场1个小时的Connection大会上,完全没提Llama模型的事情,一个字都没提。 Meta自2025年4月5日发布Llama 4以来,除了在Llama API提供了实验性的更新外,尚未发布任何官方命名的小版本更新。 这倒是不奇怪,毕竟此前Meta成立超级智能部门到处挖人、内部老员工和新员工矛盾不断的“花边新闻”闹得沸沸扬扬,Meta内部研发估计也还处在一个新老交替的变革期。 今年的Meta Connection大会是智能眼镜的主场,与此前的爆料基本一致,大会上发布了新款Ray-Ban Meta、Oakley Meta智能眼镜以及 Meta Ray-Ban Display带屏AI眼镜。 这三款新产品体现了智能眼镜行业技术的进步与突破,也让AI眼镜距离成为真正实用且普及的日常设备又近了一步。 然而,扎克伯格在现场演示AI功能全部翻车,也暴露出当前技术在实际应用中仍存在稳定性、准确性等诸多问题,这或许也是Meta AI被“雪藏”了的原因之一吧。
当微软的 AI 开始指导网球运动,这项运动会变得更无聊还是更好看?
电影《点球成金》讲了一个真实的故事:奥克兰运动家队是美国职业棒球大联盟 MLB 里经济实力很弱的一支队伍,布拉德•皮特饰演的主角比利是这支球队的教练,经历了一场惨败之后,奥克兰运动家队的三名主力被重金挖走,球队前途渺茫。 但是在大数据技术的帮助下,比利不再追求当红球星,而是挖掘在数学模型下具有巨大潜力的球员,最终这支平民队伍在 2002 年赛季拿到了打破 MLB 纪录的 20 连胜,一度成为联名豪强。 也就是说,合理运用技术能力,能够在看重资金实力的顶级职业联赛里获得更多胜机。 ▲ 《点球成金》剧照,经济学硕士彼得利用大数据帮助比尔挖掘潜力球员 类似的事情,正发生在网球运动领域。 2025 年度比利·简·金杯(Billie Jean King Cup)总决赛在深圳湾体育中心开赛,这是该全球顶级女子网球团体赛事首次落户中国。作为比利·简·金杯的全球技术与创新合作伙伴,微软携 Match Insights(国际版)解决方案亮相赛场。 微软基于 Azure 云平台和数据分析技术,量身开发了 Match Insights(国际版)解决方案,可实时处理海量数据,生成统一、精准的战术洞察,帮助教练与运动员在极短时间内做出科学决策,实现从数据到行动的高效衔接。 每场比赛期间,微软智能云 Azure 会处理来自多个数据源的超过 30 万个数据点,并即时生成 1500 余种独特的统计组合。同时,人工智能模型对这些数据进行实时分析,提炼出关键洞察,帮助教练和球员灵活调整战术。该系统还能深入挖掘球员行为、击球选择和局势变化,生成如回合球效率、发球得分率等深度分析数据,为战术制定提供有力支撑。 今年,微软把 Microsoft Copilot 副驾驶的 AI 搜索能力整合进了 ,进一步提升系统的交互智能与全球适配性。比如借助 Microsoft Copilot 副驾驶的多语言自然语义处理能力,运动员和教练可直接使用母语实时提问,例如:「对手在第二盘的反手失误率如何?」或「我在关键分上的发球偏好有哪些?」。 Match Insights(国际版)可以即时解析问题,从海量数据中提取洞察,生成个性化的战术建议。 在 2024 年,比利·简·金杯斯洛伐克队队员Rebecca Šramková 说: 赛前,我预计对手会采用快节奏打法,微软 Match Insights(国际版)提供的所有数据与洞察都印证了这一点。我据此调整了自己的战术,最终赢得了这场比赛。Match Insights(国际版)帮助我分析对手并为每场比赛完善我的策略,使我们的队伍在比赛准备和决策方面具有优势。 在 2025 年度比利·简·金杯(Billie Jean King Cup)赛事期间,我们和微软大中华区首席运营官 Chris Tao,国际网球联合会技术负责人 Jamie Capel-Davies,微软全球战略合作伙伴负责人 Monica Robbins 聊了聊 AI 将会如何影响网球这项运动,以下是对话实录。 Q:更加精细的数据分析和 AI 指导在多大程度上可以提高比利·简·金杯运动员的胜率? Jamie Capel-Davies:这是个很好的问题。我认为 AI 确实在部分团队和技术层面发挥了作用,帮助他们获得了有价值的洞察。 比利简金杯中,大家都围绕「赢得比赛」这一共同目标努力,所以我们能够真正有所作为。我个人印象最深的是去年有一场比赛,一位球员凭借胜利赢得了参赛资格,而我们所提供的,就是为这种关键性的时刻,提供差异化支持。我认为不同团队对 AI 的使用程度和方式各不相同,而且比赛结果还受到很多其他因素的影响。 ▲ 微软大中华区首席运营官 Chris Tao Q:目前,数据和AI主要为人类教练提供辅助功能。那么未来,AI 是否真的可以取代人类教练? Monica Robbins:不是取代人类,实际上是赋能人类。就像你在体育领域看到的那样,AI 的作用是帮助个人在他们所做的事情中取得更好的表现。比如网球比赛中的司线判罚,确实可以完全自动化,但整个过程中仍然需要人的参与。AI 的真正价值在于增强人类专注于关键决策的能力。所以我想对于人类教练来说,AI 不是为了取代他们,而是为了通过更多方式赋予他们力量。 Jamie Capel-Davies:是的,我完全同意。AI 确实带来了很多价值,但有些事情仍然需要人类的参与。AI 可以处理纯粹且客观的数据,但在网球领域,教练的很多工作在短期内是人工智能难以替代的。我们真正感到兴奋的是看到这项技术正在更广泛地应用,它可以帮助提升比赛的公平性。我们拥有大量可用的数据和各种类型的系统,而且这些技术变得更便宜、更易获取,因此在更多比赛中都能提供有价值的洞察。 Chris Tao:我想说的是,微软在人工智能与人类协作方面的基本理念、目标是创造出能够以更好方式帮助人类的 AI 技术,从而提升整体生产力。我们始终认为人类应该处于主导地位,而 AI 则是持续支持人类的、聪明的「Copilot 副驾驶」。最终,我们希望 AI 不仅能在教练领域提供更好的建议,还能在教育等其他领域发挥作用。我们也希望 AI 能在不同文化背景下都表现出色,成为真正意义上的助理教练,具备应对未知问题和不断进化的能力。 ▲ 微软全球战略合作伙伴负责人 Monica Robbins Q:在智能运动领域,AI 已经彻底改变了国际象棋和围棋,模仿和学习 AI 可以带来更高的胜率。然而,有人认为,由于存在最优解,AI 介入的运动可能会失去创造性和观赏价值。网球会出现这种情况吗? Jamie Capel-Davies:我不这么认为。这确实是个值得探讨的问题,不过我自己不下棋,所以无法完全比较。但我觉得 AI 的加入其实是为运动增添了新的维度。虽然 AI 有时会击败人类,而且这种情况越来越常见,但真正有趣的是AI 与人类之间的互动。所谓的「最优解」反而让比赛变得更有看头。网球本身就包含很多要素,比如技术、身体素质、战术等,是一个高度多维的运动。我们尝试用 AI 来强化其中的战术和战略部分——这是非常关键的一环,但也只是众多维度之一。 Chris Tao:我补充一点。在网球领域,我们已经积累了多年成熟的经验,尤其是在数据分析的支持下,我们可以更好地分配资源。你提到一个很重要的观点:在一个高度竞争的环境中,人类应该如何定位自己?是“人类+AI”的协作模式,还是坚持人类主导?你可能还记得上个月在中国举办的 2025 世界机器人大会,那场展览真的很精彩。它促使我们重新思考:如何借助 AI 增强人类能力,而不是让 AI 取代人类在关键领域的作用。 Jamie Capel-Davies:如果我们进一步展开这个话题,我认为 AI 还有潜力帮助球员更好地参与比赛、减少受伤风险。 Monica Robbins:是的,这正是 AI 的核心价值所在。当我们谈论 AI 时,它是在赋能各类应用的负责人,而不是取代他们。我常常会想到一个例子:AI 可以让信息「活」起来,帮助运动员更好地理解自身表现,从而发挥最大潜力。比如从人体力学的角度来看,运动员在特定项目中往往遵循相似的运动原理。而借助 AI,他们可以发现,通过对身体姿态的微调,自己可以跑得更快、跳得更高,或者更高效地完成动作。所以再次强调,这不是关于替代,而是关于提供工具,帮助他们实现更好的自我表现。这也是我们真正关注的方向。 ▲ 国际网球联合会技术负责人 Jamie Capel-Davies Q:AI 或微软的机器学习系统是如何挖掘出传统系统无法识别的数据维度?微软的技术在哪些方面可以补足传统系统的不足吗? Monica Robbins:是的,我可以先分享一些想法,然后 Jamie 可以补充。从根本上讲,这个问题回到了「数据如何实现实时统一」的能力上。传统系统通常是在赛后进行分析,也就是说,你只能在比赛结束后回顾数据,制定策略。而微软的解决方案实现了实时数据处理,这意味着你可以在比赛进行过程中就获取关键洞察,并据此做出即时调整,而不必等到下一场比赛。这是一个非常重大的转变。我们在本次锦标赛中引入的一些新功能,正是围绕如何更深入地理解比赛动态展开的。现在,运动员甚至可以通过自然语言提示在比赛期间获取实时建议。如果我是网球运动员,我可以根据AI的反馈调整我的发球策略,这在过去是无法实现的。 Jamie Capel-Davies:使用 Azure 的一个关键优势在于系统的可扩展性。我们可以根据比赛的节奏和安排灵活调整资源配置。比如本周有些比赛日安排了两场比赛,有些只有一场,我们的系统可以根据实际情况动态扩容,同时保持成本效益。此外,微软的 AI 平台具备模型迭代和切换能力。我们可以根据反馈不断优化模型,并在不同模型之间灵活切换。我们最近就做过一次模型升级,结果显示新模型的反馈质量明显优于之前的版本。这种持续优化的能力,是传统系统难以比拟的。 ▲ Billie Jean King,单打最高世界排名第一,12 座大满贯得主,国际网球名人堂成员 Q:有人使用 AI 来帮助策略,而有人不使用,那么对于这种情况导致的不公平,你们会如何回答呢? Monica Robbins:我们合作的每个组织都肯定会思考的一个问题是,他们如何以完全公平的方式提供解决方案。其中一件事是,现在AI正变得更容易被更广泛的受众使用。实际上,在某些方面,它确实带来了更多的获取机会。但当我们与潜在客户或不同组织合作时,比如与比利·简·金杯合作,关键在于我们如何确保所有团队都能获取相关信息,并确保他们能够充分利用这些信息。确实,像任何新技术一样,总会有一些早期采用者,但这也是推动技术普及的重要力量。我们希望通过这种方式,逐步实现更广泛的技术覆盖。 Chris Tao:是的,这项技术实际上已经在一定程度上缓解了原本可能加剧的不公平问题。过去,资源获取的不平衡确实让一些团队或教练处于劣势,但现在我们正努力让 AI 技术变得更加普及和易用。我们的目标是确保尽可能多的人都能使用这项技术,而不仅仅是少数拥有高端设备或资源的专业团队,比如那些顶级教练。过去可能需要依赖复杂的系统才能进行数据分析,而现在,更多人可以通过更便捷的方式获得同样强大的支持。这意味着,AI 不仅提升了专业教练的能力,也为更多基层用户打开了可能性。我们希望通过技术的普及,真正实现更公平、更广泛的赋能。 Jamie Capel-Davies:我们所做的是与所有团队一起开展培训,以此来帮助降低风险和解决问题,而不是做其他事情。正如 Monica 提到的,不同团队的使用方式可能不同,但我们努力确保每个团队都有机会尝试并充分利用这项技术。微软其实还有一个专门的部门,会对产品进行严格的审查,确保在推出时符合伦理和公平的使用标准。 ▲ 《点球成金》剧照 回到开头所说的《点球成金》电影,大数据技术确实在一段时间里帮助奥克兰运动家队获得了极强的竞争力,但是这项技术的门槛没有想象中那么高,于是其他球队也纷纷跟进,最终抹平了技术能力的差距。 实际上到现在来看,无论是 MLB,还是 NBA,或者足球里的五大联赛,一支球队的技术分析和医疗康复能力,很大程度上决定了这支球队的上限,也决定了球员的职业生命。 在科学的比赛建议,以及更好的医疗康复关照下,像刚刚过了 40 岁生日的莫德里奇,或者 40.5 岁的 C 罗,依旧还保持着不错的竞技状态,能够在顶级赛事中发挥巨大作用。 技术能力在体育运动里一直都是你追我赶,先到先得,并且具备非常大的杠杆效应,而在微观到具体的运动员身上,AI 等技术带来的,不仅是一段时间的提升,也可能是整个职业生涯的延长。
iPhone Air发售延期:背后原因揭开
9月10日凌晨发布的iPhone 17系列的iPhone 17、iPhone 17 Pro以及iPhone 17 Pro Max三款机型于9月12日开启预购后迅速售罄,首批发货时间已推迟至10月中旬,而定位轻薄旗舰的iPhone Air却意外宣布延期上市。苹果中国官网显示,该机型原定于 9 月 19 日同步开售的信息已更新为“发售信息后续更新”,具体上市时间待定。 苹果官方在声明中解释,延期原因与监管机构沟通相关:“全新 iPhone Air 正等待监管审批,我们正与相关部门紧密合作,力争尽快在中国推出。” 这一表态与此前博主爆料形成呼应,苹果对iPhone Air 市场预期过于保守,初期备货量仅占总产量的10%,不足以支撑同步首发。相比之下,iPhone 17占25%,iPhone 17 Pro占25%,iPhone 17 Pro Max占40%。这种错判导致即便监管审批通过,短期内也难以满足市场需求,所以iPhone Air延期是“备货不足”与“eSIM适配”双重因素导致的结果。 iPhone Air作为苹果史上最薄的iPhone,其机身厚度仅5.64mm,重量165g,采用航空级铝合金框架与第二代超瓷晶玻璃,耐刮擦性能提升3倍;6.5 英寸OLED屏幕配备120Hz自适应刷新率,峰值亮度达2000nit,兼顾显示效果与功耗平衡。 性能上采用与Pro系列同源的A19 Pro芯片,支持神经网络引擎加速AI任务;影像系统采用 4800万像素融合式主摄,通过像素聚合技术实现2倍光学变焦效果,配合1800万像素前置摄像头的Center Stage 功能,可自动追踪人像居中构图;电池方面虽为全系最小,但硅阳极技术使其视频播放时长仍可达27小时,支持20W有线快充与20W MagSafe 无线充电。 值得注意的是,iPhone Air仅支持eSIM 激活,用户需前往运营商线下营业厅办理手续。苹果官网特别提示:“国行机型仅支持境内eSIM服务,具体套餐需与运营商确认。” 这意味着即便上市后用户体验仍受限于运营商服务进度。​ 行业预计若eSIM审批顺利,iPhone Air可能于10月中下旬开启预售,但备货不足问题或导致首销期供货紧张。
用户反映苹果iOS 26液体玻璃设计导致应用图标看起来歪斜
IT之家 9 月 18 日消息,科技媒体 MacRumors 昨日(9 月 17 日)发布博文,报道称在 iOS 26 系统上,苹果为图标和菜单加了一层半透明、闪闪发光的外观效果,但部分用户反馈这会产生图标倾斜的视觉错觉,甚至引发头晕。 苹果为 iOS 26 系统引入全新“液态玻璃”(Liquid Glass),为应用图标带来更具立体感的玻璃质感效果,苹果通过在图标四角加入细微的发光与视差变化,实现动态的光影与折射效果。 不过部分用户反馈,使用 iOS 26 时出现了图标似乎倾斜的视觉错觉,有人甚至因此感到头晕或方向感紊乱。相关讨论在 Reddit 上迅速发酵,有条帖子直言“整个 iOS 26 都是视觉噩梦”,在IT之家发稿前,获得超过 3000 个点赞。 从反馈来看,这种倾斜错觉在深色模式、透明模式或着色模式下的深色背景中最为明显。相比之下,色彩丰富的壁纸可以一定程度分散视觉注意力,从而减弱错觉效果,这表明背景与光影交互可能是触发问题的重要因素。 图源:gizmodo iOS 26 系统目前内置“降低透明度”和“减少动态效果”两项辅助功能,但启用后并不能有效缓解这一现象。大多数用户表示,即使开启这些设置,也几乎看不到差别。用户呼吁苹果在未来的 iOS 更新中提供针对 Liquid Glass 效果的独立调节功能,以便在保留美观的同时兼顾视觉舒适度。
苹果放出iPhone Air耐用性视频,59Kg压力抗弯无损
IT之家 9 月 18 日消息,科技媒体 Tom's Guide 昨日(9 月 17 日)发布博文,报道称苹果公司发布了一系列视频,凸显 iPhone 17 系列和 iPhone Air 的耐用性,涵盖抗弯、抗刮及跌落测试,直观呈现新机在日常使用中应对意外的能力。 在抗弯测试中,苹果重点展示了超薄机型 iPhone Air 的结构强度。测试中,机械臂在机身中部(手机最容易弯曲的位置)施加了约 130 磅(IT之家注:约 59 千克)的压力。 视频显示,iPhone Air 在受压后能够迅速恢复原状,平放时无任何残余弯曲。Tom’s Guide 主编 Mark Spoonaur 在现场亲自尝试弯折,也证实了其坚固性。 抗刮方面,iPhone 17 系列全系搭载了新一代 Ceramic Shield 2 玻璃。苹果称其抗刮能力比上一代提升三倍。视频中,测试设备用矿物探针反复摩擦屏幕,留下的痕迹在擦拭后完全消失,未见可见划痕。不过,由于未公布探针硬度,目前尚无法独立验证其三倍耐刮的说法。 在跌落测试中,iPhone 17 Pro 被机器人从不同高度、 onto 不同材质表面投放。结果显示,机身与屏幕均未出现明显裂痕或损伤,反弹现象正常。 相比此前 iPhone 16 Pro Max 在第三方测试中的表现,新机的抗摔性能似乎有所提升。但需要注意的是,实验室测试无法完全模拟现实中的复杂环境。
创历史!GPT-5全球顶尖大赛夺冠,人类屈居第二,北交大团队国内第一
编译 | 程茜 编辑 | 李水青 智东西9月18日消息,今天凌晨,OpenAI和谷歌前后脚宣布,自家模型在全球知名编程竞赛ICPC 2025获得金牌级别的表现。 OpenAI推理系统答对了全部12道题目,并且一次性答对11道题,最难的题目提交了9次后成功,与人类团队相比可排第一;Gemini 2.5 Deep Think高级版本在677分钟内解出10道题,与人类团队相比可位列第二。 ICPC的要求是参赛者在5个小时内解出12道复杂算法问题,解题方案是否完美、解题耗时都会影响积分。 最终139支队伍中获得金牌的只有前四名,分别为圣彼得堡国立大学、东京大学、北京交通大学、清华大学,解出题目最多的是圣彼得堡国立大学,共11道。 ICPC拿下金牌的人类团队 这是继2个月前,OpenAI推理系统、谷歌Gemini 2.5 Deep Think在国际数学奥林匹克竞赛(IMO)之后,又一次在顶尖国际竞赛中证明了自己的实力。 谷歌Gemini 2.5 Deep Think高级版本参加ICPC总决赛的代码已经在GitHub开源。 GitHub地址:https://github.com/google-deepmind/gemini_icpc2025 一、OpenAI拿下满分,谷歌错两道 ICPC是全球公认的历史最悠久、规模最大、最负盛名的大学级算法编程竞赛,每年来自近3000所大学和超过103个国家的参与者竞相解决现实世界的编程问题。 OpenAI和谷歌都参与并获得金牌级别表现,OpenAI推理系统解答了12道题,谷歌Gemini 2.5 Deep Think高级版本答出10道题,最好的人类团队答出11道题。 1、OpenAI:拿下满分,11道题一次就做对 OpenAI推理系统获得满分。 OpenAI提到并没有专门为ICPC训练模型,其采用通用推理模型组合的方式参赛。 比赛中,GPT-5与一款实验性推理模型共同生成解题方案,由该实验性推理模型负责筛选待提交的方案。最终,GPT-5正确解答了11道题目,而最后一道也是难度最高的一道题目由这款实验性推理模型解决。 其模型一次性答对了11道题,最难的问题在第9次提交时成功了。 2、谷歌:答对10道题,45分钟解出8道题 Gemini 2.5 Deep Think高级版本按照ICPC规则在远程在线环境中进行现场比赛,比人类参赛者晚10分钟开始。Gemini总共花费677分钟,解决了12个问题中的10个,其中8个花费45分钟,另外2个问题花费3个小时。 下图是2025年ICPC总决赛中解决每个问题所用的时间,Gemini所花的时间以蓝色显示,最快的大学生团队的时间以灰色显示。 Gemini在3道题目上的解题时间都超过了人类。 ICPC总决赛中解决每个问题所用的时间 此外,谷歌DeepMind还提到一道困住所有人类团队的难题,被Gemini在半小时内成功解答。 问题C要求团队设计一套解决方案,通过相互连接的管道网络将液体输送至一组储液罐,目标是找到一种管道配置,以最快速度将所有储液罐注满。 该问题存在无限多种可能的配置,因为每条管道均可处于开启、关闭甚至部分开启的状态,这使得寻找最优配置的难度极大。 问题C简介 Gemini找到了有效的解决方案:它首先假设每个水库都有一个“优先级值”,代表每个水库与其他水库相比应该获得的优先程度。 当给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。 Gemini发现,通过应用极小极大定理(Minimax Theorem),原问题可转化为寻找能使最终流量受到最大约束的优先级数值。 借助优先级数值与最优流量之间的关联,Gemini在类似碗状的凸性解空间中,通过嵌套三分搜索(Nested Ternary Searches)快速找到最优优先级数值,最终解决了C题。 目前订阅Google AI Ultra的Gemini用户已经可以在Gemini App中使用轻量级版本的Gemini 2.5 Deep Think。 二、ICPC金牌水平,展现大模型抽象推理能力 谷歌DeepMind的博客中提到,Gemini的表现得益于其在预训练、训练后、强化学习技术、多步骤推理和平行思维方面的技术创新。 例如,在强化学习过程中,研究人员训练Gemini为编程人员面临的一些最困难的问题进行推理和生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个Gemini Agent会各自提出自己的解决方案,使用终端执行代码和测试,然后根据所有尝试迭代解决方案。 谷歌DeepMind的内部研究表明,Gemini 2.5 Deep Think高级版本也能在2023年和2024年ICPC世界总决赛中取得金牌级别的表现,表现不亚于全球前20名竞技开发者。 在ICPC上获得金牌水平对软件开发具有直接的实际影响,如果将比赛中最好的AI和人类解决方案结合起来,所有12个问题都会得到彻底和正确的解决。这表明AI有潜力提供独特思路,为人类专家提供补充。 除了数学和编程外,Gemini 2.5 Deep Think高级版本还展示了在抽象推理方面的能力。 这是因为,ICPC的问题需要模型理解复杂的问题、设计多步骤的逻辑计划、完美实施,这一过程与许多科学和工程领域所需的技能相同,包括设计新药或微芯片等领域。 OpenAI的研究人员在X上发布帖子称,他们采用同一组模型参加IMO和IOI竞赛,展示了模型性能以及通用型。 结语:大模型复杂抽象问题解决能力提升 从国际数学奥林匹克竞赛(IMO)到此次的编程竞赛,OpenAI以及谷歌的模型在解决更具挑战的数学、推理难题上迸发出巨大潜力。ICPC全球执行董事Bill Poucher博士称,ICPC一直致力于在解决问题方面设定最高标准,Gemini在这一领域取得的成绩,标志着定义下一代所需AI工具和学术标准的关键时刻。 这些在竞争性编程和数学推理方面的突破共同证明了大模型在抽象推理问题解决方面的性能飞跃,或能与人类专家结合,解决更加复杂的难题。
我让美团的小美给我做了半天助理
作者|江宇 编辑|漠影 智东西9月17日报道,近日,美团正式公测其首个生活类AI Agent“小美”。 作为首个大厂出品的生活类AI Agent,小美究竟能做什么、体验如何,也引发了不少用户的好奇。无论是小美的微信服务号还是小红书官方账号,评论区几乎都在求码,用户纷纷表示“一码难求”。 整体而言,小美的功能简洁、轻便,用起来也完全改变了过往点外卖的习惯:不需要用户点开App翻菜单、不用筛选商家和商品,也不用设置优惠券或查找历史订单,只要用自然语言说一句需求,它就能精准理解、完成下单流程,附上推荐理由和图片菜单。 智东西也拿到了“暗号”(邀请码),第一时间实测,从点咖啡、安排早餐,到出差订酒店、公园推荐路线,看看这位“AI生活助理”究竟能做多少事,又有哪些地方还不够聪明。 一、不用点进APP,只说一句话就能点好餐 对习惯了手动点外卖的用户来说,小美的操作方式更具“AI感”,没有界面、无需点击,只说一句话,它就能帮你完成整套流程,这种体验跳脱了出原有产品的使用习惯。 过去,在美团或者饿了吗上点外卖,其实更像是在逛一个线上商场:打开App、搜索关键词、浏览商家、点进菜单、挑选商品、加入购物车、确认配送、完成支付。虽然这些步骤大家都不陌生,但每一步都要动动手、想一想,流程背后其实藏着很多“小决策”。 而小美的出现,打破了这种“先逛再买”的模式。它就像一个AI生活助理,用户只需要说一句“帮我点个低脂晚餐”或者“我要一杯不含咖啡因的饮料”,它就能自动理解需求、筛选商家、推荐合适商品,连支付都在对话里直接完成。相比传统App界面操作,它没有让用户“更主动”,而是让用户“更省心”。 哪种方式更好,或许见仁见智。但就“省事”这个维度而言,小美确实把点外卖这件事,推进到了一个更极致的阶段:不需要搜索、不需要比价,也不需要决策疲劳,只要把需求说出来,它就能把结果送过来。 对于赶时间、没空操作App的场景来说,比如地铁上、会议间隙,这种一句话搞定的方式,无疑方便得多。 智东西这次也试了试较为明确的指令:“我不喝美式,找一家离我最近的瑞幸推荐一杯饮料。” 在体验开始前,用户需要授权小美获取精准定位信息,并完成与美团账号的数据绑定。这是它完成下单任务需要的基础权限。 在这类意图明确的语句下,小美的响应速度较快,能够结合定位自动筛选附近门店,推荐符合条件的饮品,并在对话界面内直接生成可支付的订单。 由于小编当前地址尚未在美团App中保存,就需要手动添加配送地址,不过整个流程无需跳转,在小美界面内即可完成,整体交互较为顺畅。 跟美团App比,小美的订单页多了一点灵活性。用户可以在它推荐的基础上直接加购其他商品,不用像美团那样先放进购物车再一块结算。这点体验上是轻快了不少,尤其适合用户额外“加购”的场景,一定程度上弥补了小美处理多订单任务中的不足。 不过细看价格那一栏,小美虽然能识别账号里的红包并自动抵扣,但没把红包“膨胀”这一步做进去。毕竟现在外卖平台满减、膨胀、凑单这一套操作早成了用户习惯,小美这边还不太跟得上节奏,多少会错失外卖大战的“羊毛”。 整体操作算是流畅的,推荐完成后,右下角那个“OK”按钮显得非常醒目,点一下就能直接进入支付,支付页也跟美团App几乎没区别。 整个过程看下来,像是一个能听懂、可执行的外卖助手,虽然还有些优惠逻辑没接上,但主流程已经能跑通。 二、不止是点饭,它甚至可以规划你的日常 如果进一步探索小美的能力,会发现它远不只是“能下单”的AI助手,它还可以帮用户安排日程。 比如智东西试着给小美布置一个简单的生活任务:“安排下周工作日每天早上8点送早餐到公司。”从交互来看,小美确实识别出这是一个周期性日程任务,并根据要求给出几套早餐推荐方案。 问题也随之暴露出来:它并没有先询问具体的公司地址,而直接开始推荐,导致系统默认的门店不一定能送达。 更重要的是,小美目前还不支持“预定+定时配送”这一完整闭环。即便用户确认了其中一套早餐方案,它也无法帮你锁定并预定下周的配送订单,而是以“待办事项”的形式把这个推荐挂在日程里,到点再提醒用户来手动确认选购。这种做法更像是一个“闹钟+菜单提示”,真正的下单动作,还是需要用户亲自完成。 从这个角度看,小美虽然在“理解需求和组织任务”上已经走出了第一步,但在“自动执行”这一环节仍然有明显缺口。 在安排日常之外,小美也延续了美团出行场景和即时零售的各项能力。智东西试着给出一句指令:“订个离国贸近的酒店,每晚不超500。”小美能迅速识别其中的价格区间和地理需求,调出几家匹配的酒店,附带价格、位置、简要评论、图片,以及入住退房时间等基本信息。当用户进一步选中其中一家酒店后,小美还会自动补充可选房型,并展示床型、面积、有无早餐等具体信息。 点击订单下方的房型栏,就能进入详情页,对照图片和配置进行确认。这一设计一定程度上规避了“开盲盒”的风险,用户确认旅客信息后即可完成下单。 智东西又测试了另一种模糊指令:“找个附近适合散步的地方。”小美没有简单地推送热门景点,而是进一步分析“附近+适合散步”背后的隐含需求,综合考虑距离、安全性、配套设施等因素,推荐了几处步行距离可达的公园绿地,并提供导航路径,用户可以直接在小美内部调起美团地图,点击即走。 它还能帮用户完成一些长期规划类任务,比如“订购一周低脂晚餐”或“准备几天健康食材”。在这种较模糊但有方向性的表达下,小美会尝试从用户历史订单、消费习惯中提取偏好,结合食材营养结构给出组合建议,并自动整理成待购清单或下单入口。与传统在美团APP里手动搭配、逐条筛选不同,这种“AI助手+外卖APP”对接的方式,省去了反复比对的麻烦。 当然,自动化的背后也意味着牺牲部分“主动性”。用户无法像在美团中那样自由比价、查看全部用户评价或联系客服。 可以说,小美开始具备了成为“数字生活助理”的雏形。不仅能完成任务,还在学习用户的生活方式,从“点什么”到“怎么安排”,逐渐拓展边界。 三、美团自研大模型,为吃喝玩乐专门定制 之所以小美能理解这么多场景中的模糊指令,关键在于它背后的“大脑”是美团自研的Longcat大模型。作为一款MoE架构模型,Longcat总参数量达5600亿,但每次推理激活约270亿参数,具备较高效率与较低计算成本。重要的是,它并非用泛互联网文本训练,而是扎根本地生活,吃下了美团内部海量订单、商户、用户行为等真实数据。 这意味着,它知道用户所说的“点一杯霸王茶姬中我最爱喝的那一款”不是一句通用指令,而是真实菜单项的个性定制,它能准确调出历史订单、读懂订单记录;小美也还可以在导航、推荐、支付过程中不跳出App,这靠的是美团的系统级接口调用能力。这些底层能力,不只是让小美“会说话”,而是让它真的能“把事办了”。 就模型能力而言,小美也偶有“跑偏”。在小红书邀请码“争抢”热度颇高的时候,也有不少网友在该平台晒出不靠谱的案例。 小美虽然具备理解模糊需求、调度服务能力,但本质仍是基于大模型和系统规则运行。一旦面对语义边界模糊、信息不足或缺乏上下文的指令和未覆盖的功能,反而会放大逻辑上的错误。 结语:生活类Agent,站在了AI生活落地的前线 作为一款直接面向消费者的AI Agent产品,小美无疑暴露出了不少问题:不支持定时预定、红包不能膨胀、偶尔抽卡式错乱、部分复杂指令还会“读不懂”等。但也正因如此,它提供了一个观察AI真实落地表现的前线窗口。 在真正走进用户生活的过程中,生活类Agent不是一步到位的产品形态,而是需要长期调教与持续打磨的演化过程。
褒贬不一:苹果iOS 26液态玻璃设计用户评价呈现两极分化
IT之家 9 月 18 日消息,科技媒体 MacRumors 昨日(9 月 17 日)发布博文,简要汇总了苹果 iPhone 用户对 iOS 26“液态玻璃”设计的用户评论,从社交媒体和论坛的用户反馈来看,批评声高于好评,集中在动画卡顿、可读性差、操作繁琐及设计不一致等问题。 苹果于 2025 年 9 月 15 日推送 iOS 26 系统更新,带来被称为“Liquid Glass(液态玻璃)”的全新界面设计,是自 iOS 7 引入扁平化风格以来最大幅度的视觉改动。 苹果为提升视觉层次与交互趣味,将界面元素设计成仿玻璃质感,伴随色彩、形状和阴影的动态变化,并配合大量动画效果。不过对于新设计,用户评价褒贬不一,IT之家基于博文内容,简要汇总如下: 对 iOS 26 “液态玻璃”的主要抱怨如下: 动画运行缓慢,并且旧款 iPhone 上的界面感觉迟钝 不断变化的颜色、形状和阴影让人分心 动画毫无意义 噱头大于实用体验。 基本操作需要点击太多次 气泡和漂浮图标都是卡通风格的 系统对比度太糟糕了 部分应用图标看起来很模糊 设计不一致,有些是平的,有些是玻璃的 UI 元素的突出显示不一致 阅读通知之类的内容很困难 认为新界面加大系统资源占用 也有用户在体验后表达认可: 让 iPhone 使用体验感觉更快 给人一种现代、简洁的感觉,让无趣的智能手机变得更有趣 明亮、有弹性,使用起来非常酷 收到通知令人满意,锁屏键盘就像泡泡一样 上手容易 光的折射和色差的扩散技术令人印象深刻 图标非常漂亮,让人回想起初代 Apple UI 设计
不止大而硬的首款增程SUV,小米竟藏了至少5款新车
就在今天(9 月 18 日),@易车榜 发布了“2025 年 1-8 月部分 30 万级纯电 SUV 车型销量盘点”。 数据显示,小米 YU7 在 8 月的零售量达到 16548 辆,环比增长达 178.9%,增速之快如同坐上直升机。 目前,产能依然是小米汽车的最大困扰,好在二期工厂开启验收,待磨合完毕两个工厂全力开动,预计能缓解产能问题。 不过,毕竟 YU7 已经上市了,许多网友不禁进入“喜新厌旧”模式,不再对其感兴趣,转而把目光锁定在小米后续的新车上。 说起小米的新车,原本可以确定的是下一款车型为首款增程 SUV,然而随着网友们的不断挖掘,发现小米藏了至少 5 款新车。 关于小米藏着的这几款新车,IT之家小编不妨挖挖它们的底。 01. YU7 GT 首先要挖的小米新车,必须是新鲜出炉的,很可能叫做 YU7 GT。 昨天(9 月 17 日)下午,博主 @纽北社会人 在社交平台上发文“看看我在纽北碰到了什么车,你们看着眼熟不”,并晒出了三张照片。 照片中,一辆车身覆盖着伪装的车辆正行驶在赛道上。 尽管该博主并未点名伪装车的品牌和型号,但从大灯设计和贴纸图案等细节来看,基本可以确定是小米旗下的车型。 以及该车的形态与 YU7 高度相似,大概率是 YU7 的衍生车型。 值得一提的是,IT之家小编发现,小米汽车首席车手、动态性能开发负责人任周灿还现身评论区,留下一句“这是什么车”。 鉴于其身份和留言的内容,进一步提升了该伪装车来自小米的可能性。 对于这款新车的型号,引发了网友们的猜想,有人认为是“YU7 GT”,也有网友觉得是“YU7 Ultra”。 其中,“YU7 GT”的呼声要更胜一筹,因为在 8 月中旬,YU7 GT 这个名字就开始流传。 当时有多位博主转发了一张疑似小米汽车的新车规划图,其中有一款代号为“MX11-GT”的车型。 由于 YU7 的代号为“MX11”,因此“MX11-GT”被视为 YU7 的 GT 版本。 说起“GT”车型,想必大家不会太陌生,其全称为“Grand Tourer”,概念源自欧洲长途旅行马车传统,是主打兼具高性能与舒适性的车型类别。 在燃油车领域,法拉利、玛莎拉蒂、奔驰、宝马等品牌都曾发布过 GT 车型;而在新能源行业中,也有不少国产品牌推出过 GT 车型,比如极氪 001、极氪 007GT、腾势 Z9GT 等。 倘若小米日后当真为 YU7 增加一个 GT 版本,应当会进一步加强运动属性。 当然了,YU7 本身已经很运动了,还能再变得有多运动,值得关注一下。 02. SU7 L 既然 YU7 GT 出现踪迹,那么 SU7 是否也会再安排一个衍生版本?答案是“有戏”。 因为在那张小米汽车的新车规划图中,还出现了一个代号为“MS11-L”的车型。 要知道,“MS11”恰好为 SU7 的代号,那么按照汽车行业的命名习惯,“L”往往代表着加长,所以“MS11-L”很难不让人猜测 SU7 将推出一个加长版。 在之前的推文中,其实IT之家小编曾挖过 SU7 L,在 8 月 23 日那天,博主 @风清颂 晒出了一组正在进行路试的神秘伪装车照片,并直言为“SU7 L”。 从其发布的图片来看,该车的线条确实与小米 SU7 接近,但肉眼可见的是要比 SU7 长一块,加长了车身轴距,整体造型很是修长,多了些许行政的气息。 在轴距加长后,后排空间的表现相应就会提升,尾部大溜背的设计倒是得以保留,如此便能满足那些既要颜值又要空间的用户群体。 考虑到 SU7 定位 C 级高性能生态科技轿车,车长达 4997mm,若是真出一个加长版,那将有望达到 C+ 乃至 D 级别。 正如博主所言,在 SU7 的基础上开发一个 SU7 L,不仅开发成本比全新车型低太多,价格还可以往上走。 而那些觉得 SU7 后排乘坐空间体验不佳的用户,痛点就会被加长版解决。 03. 增程 SUV 三兄弟 最后要挖的就是代号为“昆仑”的小米首款增程 SUV 了,种种迹象表明,这款车锁定了小米第三款车型,预计会在明年上市。 说起小米增程 SUV,诚然其庐山真面目不得而知,但谍照被曝光了多次。 最初是在去年 12 月,@微博数码 晒出了小米第三款车型谍照,并强调“外观大变样,定位家用增程 SUV”。 谍照截取自小米汽车家族的冬测视频,视频中还出现了当时尚未发布的 YU7。 在今年 3 月 21 日,博主 @极速拍档 Speedsters 晒出了小米增程 SUV 的清晰谍照,并透露“据规划将在 2026 年推出”。 得益于谍照变得高清,能捕捉到的外观也更清晰,可以看到其尺寸庞大、造型方正、线条硬朗,且配有激光雷达。 而从 7 月开始,小米增程 SUV 谍照流出的频率变得较为密集。 先是在 7 月 8 日,博主 @整车异响咣当咣当 分享了一组小米运输板车的照片,其中便出现了增程 SUV 的身影。 博主表示,该车是小米六座 SUV,似乎只比 SU7 长十几厘米,且不算高,大概是个比问界 M8 长一点点,但矮一截的身材。 后来在 7 月 21 日,博主 @德卤爱开车 又发布了小米增程 SUV 的另一组谍照,声称“小米昆仑 N3 伪装车出现在北京工厂超充站”。 据悉,充电口放在车身左侧,那加油口应该在右侧,时间亮相节点来看应该还是在今年底 - 明年初。 以及在 9 月初,小米增程 SUV 又曝出新谍照,与 YU7 同框出现。 通过对比可以直观看到,该车“又大又硬”,尺寸明显超过了 YU7。 到目前为止,小米首款增程 SUV 的定位已经明确,要进军“大六座 SUV”这条赛道中。 但是,IT之家小编要说但是了,小米很可能规划了不止一辆“昆仑”SUV。 根据德意志银行去年 12 月发布的投资报告显示,“昆仑”系列 SUV 至少有三款。 其中目前被广泛关注的是定位更高的“KL3”,后续还有两款定位略低的车型,代号分别为“KL2”和“KL1”。 04. 总结 YU7 GT、SU7L、三款昆仑 SUV...... 由此可见,小米在现阶段至少藏了 5 款新车。 其中,“昆仑 3”已然板上钉钉,或许最快在年底就会在工信部申报;至于其他几款车型,预估都不会是空穴来风,但更详细的信息还需日后进一步挖掘。 总之,SU7 和 YU7 两款车型的表现堪称“现象级”,小米后续的车型能否将火爆态势一直延续下去,唯有期待。
蔚来2025款新ES6/EC6/ET5/ET5T推送Cedar S 雪松 1.2.0更新
IT之家 9 月 18 日消息,蔚来 2025 款新 ES6、新 EC6、新 ET5、新 ET5T 迎来「Cedar S 雪松 1.2.0」版本更新推送,从智能安全、NOMI、智能座舱、智能底盘四大板块全面提升 25 款新车型智能体验。 IT之家附更新内容如下: 智能安全方面,Cedar S 雪松智能系统新增了追尾碰撞预防及保护(RCM)功能,这是行业首个主、被动安全一体化的 RCM 功能。该功能通过三层安全能力降低被追尾事故发生的可能性及减少二次伤害。用户可以通过设置中的辅助驾驶和安全守护选项开启此功能。需要注意的是,该功能为安全辅助功能,无法避免所有的后方追尾风险,实际场景的安全保护效果可能受到多种因素的影响。 此外,系统还新增了通用障碍物预警及辅助(GOA)功能,能够识别并响应道路上威胁行车安全的障碍物,并在障碍物以不同方向角度出现时,给予驾驶者预警,必要时进行紧急制动。此功能与自动紧急制动(AEB)功能共用开关,用户可通过车辆设置中的辅助驾驶和安全守护页面操作开启或关闭。 此次更新还升级了全向自动紧急制动 AEB,模型优化后自适应调节制动力度,做到不同紧急状态精细应对倒车时面对行人、两轮车和车辆,能更精准地完成预警和制动,避免或减轻碰撞事故带来的伤害。 在 NOMI 智能座舱方面,系统进行了多项升级。NOMI 主动建议功能在雨天路面湿滑时会推荐开启湿地模式,遇到前方扬尘时会推荐开启空调内循环。NOMI 一起摇摆功能新增了 23 个彩色专属表情,新增 9 种 NOMI 舞蹈的动作,新增换电、充电时 NOMI 随音乐一起摇摆。NOMI 快版健康操功能新增了 3 套欢快版健康操,用户可以通过语音指令“来一个欢快的健康操”随机开启。NOMI 成语接龙和看图猜成语功能则为车内娱乐增添了更多乐趣。 智能底盘方面,新增了高速爆胎安全控制功能,创新融合感知拥有毫秒级识别爆胎能力,爆胎发生时迅速对车辆姿态变化做出反应,减小爆胎之后车辆产生的横摆以及可能的转向过度。此外,新增的 AI 风险预警功能通过多模态感知融合算法对道路风险精准识别与分级,识别到车内外存在潜在驾驶风险时,车机仪表盘及 NOMI 会主动触发安全预警,提醒驾驶员减速慢行及后排乘客系好安全带。 在智能隐私保护方面,系统新增了智能隐藏个人信息功能,能够识别多人共乘时自动隐藏来电、导航搜索历史、收藏点等涉及个人信息内容。新增应用锁功能,设置应用锁的应用需验证账户密码后才能打开。新增自动开启访客模式,非车主坐在主驾座椅后,需验证车主账户密码,或切换至访客账户。 智能座舱方面,新增了停车场导航 Beta 功能,可在全国 3,000 + 停车场实现车位级导航,停车场内部智能路线规划和精准引导。功能需手动开启,请在非导航状态下点击导航地图界面的设置按钮-出行设置,打开停车场导航 Beta 开关。 娱乐系统方面,网易云音乐和酷狗音乐进行了升级。网易云音乐行业首发基于实车调音的臻音全景声和沉浸环绕声,以及杜比全景声、超清母带、高清臻音,5 种高品质的音质效果。酷狗音乐则提供了千万高品质正版曲库随心听,自研音效,全方位环绕听感,带来身临其境的极致现场感。 此外,系统还新增了爱奇艺半屏听视频模式,车辆行驶过程中可在半屏和全屏间手动切换,半屏下音频流畅播放。新增 QQ 音乐、NIO 沉浸声、NIO Radio、浏览器、蓝牙音乐、USB 音乐、FM 支持全 / 半屏切换。车机应用全 / 半屏切换功能也进行了升级。
现代汽车加入“增程”阵营:首款车型能跑960km,2027年上市
IT之家 9 月 18 日消息,据外媒 insideevs 报道,现代今天在纽约举行年度 CEO 投资者日活动,并宣布首款增程式电动车将在 2027 年上市。按照此前计划,该车型将于 2026 年在北美和中国投产。 增程车型在电动车平台上加装一台汽油发动机,发动机不直接驱动车轮,而是发电给电池充电。这样既能保留电动车的充电、安静和瞬时加速体验,又能随时加油,从而减缓续航焦虑。 ▲ 捷尼赛思 Neolun 概念车,图源捷尼赛思,仅供参考 现代透露,2027 年上市的增程车型将搭载高性能电池和电机,通过优化电池与发动机协作,实现超过 960km 续航。与现有纯电动车相比,增程车型的电池会更小,例如相当于 30 至 40kWh 的电池,再配合一台小型汽油发动机。 现代表示,和传统方案不同,现代的增程式电动车采用自研高性能电池,用不到一半的电池容量就能提供完整电动车动力性能,既保证续航和性能,又降低成本,让更多消费者可以接受。 IT之家从报道中获悉,现代还确认,捷尼赛思将从 2026 年起推出混动车型,并搭载增程式动力系统。同时,现代计划到 2030 年将混动车型的阵容扩展至 18 款以上。 增程式电动车被视为解决大型电动卡车和 SUV 续航和拖拽难题的方案。大电池虽能提供更长续航,但重量太大反而降低效率,负载时续航会明显缩水。正因如此,中国许多大型车已经采用这一方案。
特斯拉调整 FSD“违规处罚期”:扣分清除周期减半至3.5天
IT之家 9 月 18 日消息,特斯拉正对其 FSD 辅助驾驶系统的“惩罚期”(doghouse)规则进行重大调整,这一变化将受到驾驶员的欢迎。 “惩罚期”是一个假设性术语,用于描述特斯拉对分心驾驶违规次数过多的驾驶员施加的惩罚周期。 据IT之家了解,此前,对于配备座舱摄像头的车辆,若驾驶员累计 5 次违规,特斯拉将对其实施 7 天的 FSD 功能禁用措施;而对于未配备座舱摄像头的车辆,驾驶员累计 3 次违规便会面临相同的 7 天禁用处罚。 同时,特斯拉还设有违规次数减免机制:若驾驶员在 7 天内未新增任何违规记录,每使用 FSD 功能满一周,便可减免 1 次违规记录。 如今,特斯拉调整了违规记录的减免周期,将原有时长缩短一半。只要驾驶员在相应周期内未产生新的违规记录,每 3.5 天便可减免 1 次违规记录。特斯拉 2025.32 版本软件更新的《车主手册》中已纳入此项变更。 特斯拉实施的这些防护机制,初衷既是防止驾驶员分心驾驶,也是为了规避公司自身可能承担的法律责任。事实上,仍有部分用户将 FSD 系统当作完全自动驾驶系统使用,但该系统并非真正意义上的完全自动驾驶系统。特斯拉明确表示,驾驶员在任何情况下都必须保持专注,并随时准备接管车辆控制权:

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。