行业分类:
加载中...
头条分类:
加载中...
让机器人在人群中穿梭自如,港科广&港科大突破社交导航盲区
机器人落地复杂场景,社交导航能力一定是避不开的关键一点。 先简单介绍下,社交导航 (SocialNav,Social navigation) 是指在人机共存的环境中,机器人在遵循社会规范的前提下执行导航任务。 就拿下图来说,机器人需导航至目标点,而目标恰好位于两名行人未来轨迹的交汇区域。 它不仅要灵活避免潜在的碰撞风险,还需与行人保持合适的社交距离。 总而言之,社交导航该任务对视觉导航领域提出了独特挑战: 预建地图的方法难以适应人群密集的动态环境,而现有RL方法存在短视决策和依赖全局信息的问题。 近期,香港科技大学(广州)和香港科技大学联合提出了一种新算法,Falcon。 它通过将轨迹预测算法融入社交导航任务中,实现长期动态避障并提升导航性能。 社交导航的另一个重要挑战则是现有基准的真实性不足。 如下所示,现有基准通常存在以下几方面的局限性: 场景复杂性不足:仅关注机器人与人类的交互,而忽略场景本身复杂性。 人类行为不自然:行人动作僵硬、运动模式失真,难以反映实际场景交互。 针对上述局限性,研究团队构建了两个新数据集——Social-HM3D 和 Social-MP3D,作为社交导航任务的新基准。 该项目论文已被ICRA 2025接收,同时已经挂上arXiv。 代码和模型权重可到GitHub寻找。 Falcon:集成轨迹预测辅助任务的强化学习框架 Falcon算法框架由2个模块组成: 主策略网络 (MPN,Main Policy Network) 时空预知模块 (SPM,Spatial-temporal Precognition Module) 主策略网络:让机器人学会“遵守规则” 模块一,主策略网络,这是Falcon的“大脑”,负责指导机器人如何行动。 其核心是社会认知惩罚(SCP,Social Cognition Penalty)机制,通过设计专门的惩罚函数,避免机器人干扰人类未来轨迹,从而引导智能体规避碰撞风险并保持社交距离。 具体而言,Falcon引入三个关键惩罚项: 障碍物碰撞惩罚 :严厉惩罚机器人撞到静态障碍物或行人。 人类接近惩罚:当机器人靠近行人时,随距离减小增加惩罚。 轨迹阻碍惩罚:如果机器人干扰行人未来路径,则提前施加惩罚。 时空预知模块:让机器人学会“提前规划” 模块二,时空预知模块(SPM),结合轨迹预测与多种社交感知辅助任务,显著增强了机器人对未来环境动态变化的预测能力。 其主要功能包括: 人类数量估计:预测场景中有多少人,帮助评估环境复杂程度。 当前位置跟踪:实时跟踪行人位置,快速响应变化。 未来轨迹预测:预测未来几秒行人路径,提前规划避障。 关键在于,辅助任务仅在训练阶段使用。 在推理阶段,机器人仅依赖主策略网络进行决策。 这种设计简化了推理过程,确保模型在实际应用中的高效性。 特意构建两个新的数据集 现有社交导航基准存在诸多不足,如场景过于简化、人类行为不自然等。 以下表格为现有的社交导航模拟器与数据集统计特性对比: 为弥补这些缺陷,研究人员构建了两个新数据集——Social-HM3D和Social-MP3D,具备以下优势: 真实场景重建:基于高精度3D扫描,涵盖公寓、办公楼、商场等多种室内场景。 自然人类行为:采用多目标导向的轨迹生成算法和ORCA动态避障模型,模拟人类行走、休息等自然行为。 合理人群密度:根据场景面积动态调整人类数量,确保交互密度适中。 研究团队表示,这两个基准既平衡了人机交互的社交密度,同时也避免了过度拥挤。 这一基准为社交导航研究提供了更贴近真实场景的评估环境,并且支持推广到有人环境下的物体导航、图像导航等下游任务。 实验部分 在定量分析方面,实验表明,Falcon在目标达成和社会合规方面表现出色: 其一是目标达成。 在Social-HM3D中达到55.15%的成功率和成功路径效率(SPL,Success weighted by Path Length)。 即使在未训练过的Social-MP3D数据集上,也能取得55.05%的成功率。 其二是社会合规。 在保持社交距离和避免碰撞方面表现良好,达到接近90%的个人空间合规性(Personal Space Compliance, PSC)和接近42%的人机碰撞率。 定量结果表明,Falcon不仅在已知环境中表现出色,还能有效适应未见过的复杂动态环境。 在定性分析方面,下图的定性结果展示了Falcon在不同典型场景中的优越性—— 第一个是人员跟随情境。 Falcon通过预测行人未来轨迹,主动调整速度和路径,保持安全距离。 第二个是复杂交叉路口。 面对行人和静态障碍物同时存在的场景,Falcon提前预测并规划出安全高效的路径。 第三个是正面接近情境。 传统的RL算法Proximity-Aware试图直接从行人面前穿过导致碰撞,Falcon通过预测行人未来轨迹,提前调整路径并安全避开。 3个关键发现 各项实验后,团队有了三个关键发现: 发现1,未来感知算法优于以往实时感知算法。 静态路径规划算法(如A*)无法适应动态环境,而实时感知方法(如ORCA和Proximity-Aware)虽能被动避障,但仍存在延迟反应问题。 相比之下,Falcon能够主动预测行人轨迹并提前调整路径,显著提升了安全性和效率。 发现2,辅助任务有助于提高性能,其中轨迹预测最重要。 下表展示了不同辅助任务对导航性能的影响。 其中轨迹预测(SPM.Traj)效果最为显著,成功率从40.94%提升至54.00%。 发现3,SCP和SPM相辅相成,改善性能并加快训练收敛。 下图图中为消融研究中的训练曲线。 可以观察到,具有SPM和SCP的完整Falcon模型收敛更快,性能更好。 SCP在提升模型性能方面发挥关键作用,尤其是与SPM集成后,整体性能进一步提升(从53.63%提高至55.15%),并加快训练收敛速度。
微软为英特尔和AMD芯片的Copilot Plus PC提供更多AI功能,含实时字幕等
IT之家 4月1日消息,微软正将旗下多项人工智能功能全面开放给搭载英特尔和AMD芯片的Copilot Plus PC。此前,这些先进的AI特性主要面向配备高通芯片的同类电脑。 此次功能更新中最引人注目的是“实时字幕”(Live Captions)。这项功能能够实时将数十种不同语言的音频翻译成英文字幕。微软早在去年12月就开始在搭载英特尔和AMD芯片的设备上测试该功能,而现在,通过最新的Windows 11更新,所有符合条件的Copilot Plus PC用户都可以使用这个强大的工具。 IT之家注意到,除了实时字幕外,本次更新还包括了画图应用(Paint)中的AI工具“协同创作者”(Cocreator)。用户只需输入文字描述,并结合当前的绘画内容,协同创作者便能生成相应的图像。此外,微软还将进一步扩大照片应用中AI图像编辑器和生成器的使用权限,让更多用户能够轻松进行智能图像处理和创作。 值得注意的是,此前这些AI功能仅在采用高通芯片的Copilot Plus PC上提供。微软去年已开始在英特尔和AMD设备上测试另一项名为“Recall”的AI功能。该功能可以截取用户在Copilot Plus PC上的活动屏幕截图,并允许用户进行搜索。尽管如此,微软尚未公布Recall功能何时能够正式向所有用户开放。 与此同时,微软还在搭载高通芯片的Copilot Plus PC上更新了“语音访问”(Voice Access)功能。这是一项辅助功能,旨在帮助用户通过语音控制电脑。微软表示,使用高通芯片设备的语音访问用户现在将能够“使用更具描述性和灵活性的语言与他们的电脑进行交流”。此外,本次更新还新增了将27种语言翻译成简体中文的功能。微软方面透露,计划在未来将这两项语音访问的更新推广到搭载英特尔和AMD芯片的设备上。
亚马逊推出Nova Act:可操控网页浏览器的AI智能体
IT之家 4月1日消息,亚马逊于当地时间周一正式发布了其通用人工智能智能体(AI agent)——Nova Act。该智能体具备操控网络浏览器并自主执行简单网络任务的能力。与此同时,亚马逊还推出了配套的Nova Act软件开发工具包(SDK),旨在帮助开发者利用Nova Act构建智能体应用原型。 据IT之家了解,Nova Act由亚马逊新近在旧金山成立的AGI(通用人工智能)实验室研发,该技术未来也将为备受期待的生成式AI增强版语音助手Alexa+提供关键功能支持。不过,亚马逊方面表示,今日起开放的版本为“研究预览版”,功能尚待完善。 开发者可以通过新设立的专属网站nova.amazon.com获取Nova Act工具包,该网站同时也是亚马逊展示其旗下各类Nova基础模型的平台。 Nova Act的推出标志着亚马逊正式加入AI智能体技术的竞争行列,意在凭借自研的通用AI智能体技术,与OpenAI的Operator和Anthropic的Computer Use等产品展开竞争。当前,多家领先科技公司普遍认为,能够代替用户浏览网页、执行任务的AI智能体将极大提升现有AI聊天机器人的实用性。尽管亚马逊并非首家开发此类技术的公司,但凭借其庞大的Alexa用户基础,Nova Act未来可能拥有最广泛的应用潜力。 亚马逊介绍称,开发者使用Nova Act SDK,将能够为用户自动化处理一些基础性网络操作,例如从餐饮品牌Sweetgreen订购沙拉或是在线上预订餐厅晚餐。该工具包提供了一系列工具,使AI智能体能够浏览网页、填写表单、在日历上选择日期等。 在性能方面,亚马逊声称,在公司内部的多项测试中,Nova Act的表现优于来自OpenAI和Anthropic的同类智能体。以衡量AI智能体与屏幕文本交互能力的ScreenSpot Web Text测试为例,Nova Act得分高达94%,超过了OpenAI的 CUA(88%)和Anthropic的 Claude 3.7 Sonnet(90%)。然而值得注意的是,亚马逊并未公布Nova Act在如WebVoyager等行业更常用的智能体评估基准上的测试结果。 Nova Act是亚马逊上述AGI实验室对外发布的首个公开产品。该实验室由前OpenAI研究员David Luan 和 Pieter Abbeel共同领导。这两位专家在去年被亚马逊聘用以主导其AI智能体研发工作之前,分别创立了AI初创公司Adept和Covariant。 对于一个以AGI为目标的实验室为何会开发订购沙拉的AI智能体,Luan在接受TechCrunch采访时解释道,他将智能体视为构建超智能AI系统的关键一步。他将AGI定义为“一个能够帮助你在计算机上完成人类所能做的任何事情的AI系统”。Luan还表示,其团队设计的Nova Act SDK旨在可靠地自动化执行简短、简单的任务,并为开发者提供了精确定义何时需要人类介入智能体工作流程的工具。他希望借此帮助开发者创建更可靠的智能体应用,即使这些应用不一定是完全自主运行的。 目前,来自OpenAI、谷歌和Anthropic等公司的早期AI智能体普遍面临跨不同领域应用时可靠性不足的重大挑战。根据TechCrunch等媒体的测试,这些系统往往运行缓慢,难以长时间独立工作,且容易犯下人类通常不会犯的错误。亚马逊是否已经找到了克服这些难题的有效方法,还是其Nova Act智能体也将受困于同样的缺陷,市场将拭目以待。
文小言“更像人”了,百度找到做AI to C产品的节奏
在31日的百度AI Day上,文小言宣布完成品牌焕新与功能升级:品牌视觉上换了套“皮肤”,显得更加年轻和清新;功能升级上聚焦模型开发与功能创新,支持多模型融合调度,升级全新语音大模型、图片问答、AI 生图生视频等多项能力。 百度对外介绍新文小言时,十分形象的描述:“如果TA聪明、理解能力强、很会找话题,又很年轻,介绍给你,你愿意认识一下吗?” 文小言再升级 文小言此次升级的核心亮点在于“多模型融合调度”。通过整合百度自研的文心X1、文心4.5等模型,并接入DeepSeek-R1、可灵等第三方优质模型,文小言实现了多模型间的智能协同。 需要补充的是,文心X1发布仅半个月,百度称其是“首个自主运用工具的深度思考模型”;文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,在多模态交互、理解方面更强,原生模型联合预训练能实现更深层次的模态融合。 得益于“自研+开源模型”的组合,用户拥有了选择权,切换到“自动模式”,就可一键调用最优模型组合,或根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。 这也让文小言拥有了更强的“大脑”。以装修方案为例,输出prompt:我的客厅朝向是南偏东,35平米,有一整扇落地窗,请根据我的要求画出浅色奶油风、暗黑轻奢风、跳脱童趣风这三种不同风格的装修效果图,三个户型必须一致。 我选择文心X1模式,文小言就能根据需求点,生成多种装修风格的方案,设计原理、效果图一应俱全。它在推理过程中,图文并茂、自如调用工具的能力让很多人都眼前一亮。 根据百度此前介绍,文心X1利用递进式强化学习训练方法、基于思维链和行动链的端到端训练、多元统一的奖励系统等技术。也可以理解为,这是百度自研大模型的独门绝招,文心X1的推理输出是直接可以图文混合连续完成任务。 多模态理解能力上,文小言再度增强图片理解能力。比如短视频平台上有一类比较热门的挑战:根据图片猜测街景或者所在位置。发起者所上传的图片,标志性、辨识度以及信息量都不是很高。文小言能够很快并准确的分析出答案。 还有“中午吃什么”的世界难题,只要你拍下菜单,告诉它类似的需求:两个人有两百块人民币预算,想要吃得丰富些,应该怎么点餐?文小言在极短的时间内,就能给出一个满意的解决方案。 文小言还进一步提升了全新语音大模型、图片问答、AI 生图生视频等能力。比如,全新语音大模型支持方言对话、复杂知识问答及随时打断等场景,用户可进行语音知识问答或趣味角色扮演。 以小朋友和小言的对话为例,衔接丝滑,不用担心打断后,AI接不上话。还能切换蜡笔小新、孙悟空、熊大熊二等百变音色。不仅如此,其还学会了多种方言。重庆话、河南话、广西话等等都能聊。 图片问答功能让用户可以通过拍摄或上传图片,以文字或语音提问直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI 可自动解析风格并生成同款手机壳、支架等周边产品。 值得一提的是,新增的“图个冷知识”功能更富趣味性,用户可预设“历史学者”“科技达人”等人设视角,为同一图片赋予多维解读。例如,当用户询问“猫窗探秘,为何猫爱窗边的科学真相?",文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。 百度找到做AI to C节奏 回溯来看,这应该是文小言两年来的第二次大规模升级。 2023年3月16日,百度只比OpenAI晚了不到四个月,就推出类ChatGPT生成式AI产品“文心一言”,拉近中国科技公司与海外AI大模型企业的差距。 2024年9月4日,百度把养了一年半的文心一言App升级为“文小言”,其定位也明确为“百度旗下新搜索智能助手”。当时,文小言推出富媒体搜索、多模态输入、文本与图片创作、高拟真数字人等“新搜索”能力;同时,独家首发记忆和自由订阅等新功能。 这次产品升级和定位折射出百度的野心:延续其在传统搜索上的优势,再次定义新搜索。官方认为,区别于其他搜索产品,AI时代的新搜索需要具备AI能力,包括生成式AI、多轮交互、个性化互动、智能体等多元功能。 也就是说,一款合格的“新搜索智能助手”,除了具备传统的信息检索能力,还应该满足用户在搜、创 、聊等多层次的需求,具备更像人、更懂人的特点。 文小言是百度在AI to C上迈出的关键一步,其在搜、创、聊等多个维度实现了对搜索行业的变革。并且,单从名字上看,它的拟人属性就摆在显要位置,在传播上大幅弱化过往百度产品浓重的“工具属性”,与普通用户更有“路人缘”。 我还注意到一个业务动向,文小言完成升级后不久的10月,百度召开了2024年第三季度总监会。第三季度通常是百度的战略季,李彦宏和百度总监级以上管理人员都会参加,可见其重要性。 李彦宏在会上作了近万字的发言,为百度未来一段时期的业务战略定调以及作思想动员。其中,他提到,“文小言”没有必要像豆包、Kimi一样激进推广。后续半年,文小言一直“低调发育”,直到此次再度焕新。但其用户规模、产品体验友好度,一直居于同类产品相关榜单的前列。 还有比较重要的一点是,基于对搜索的全新认知,李彦宏认为,搜索的重构和重建应该分成两步: 首先是搜推融合。他强调,搜索做任何的改变,不仅要看对搜索场景下核心业务指标的影响,也要看对Feed这个核心业务指标的影响。空框推荐(比如百度搜索框中会预置一些词和句子)的本质是一种推荐,因为这个词不是由用户来Input的,只有用推荐的理念来做才是正解。 其次,AI要和移动生态结合。AI需要跟移动生态做进一步融合,比如图像用户界面和自然语言界面怎么结合会更自然,这会是未来搜索发展的一个范式。 我一直认为,AI to C需要解决两个关键问题:用户体验和商业模式。因为只有在这两方面取得突破,基于不断优化使用体验的前提,让AI解决真实场景的用户需求,AI to C才能被用户接受并忠实的留存,进而产生商业价值。 文小言的两次升级,都没有偏离李彦宏设定的两步走策略,也符合这个逻辑。它在不断融合百度移动生态,比如集成诸多智能体,为用户提供服务。同时,百度也鼓励用户创建自己的智能体,并进行分享。为此,百度还设立社区模块,打造交流平台,交流创作经验。 不仅如此,文小言也在融合百度体系内外的技术能力。在此基础上,文小言满足了百度对新搜索的定义。百度也在这个过程中,找到做AI to C产品的节奏:生态层开放,场景层深耕,价值层进行重构。 百度相关负责人在活动现场对唐辰表示,过去 AI App 是模型的展示场,但这对于普通人是不够的。模型就像引擎,但普通用户要的是车,就还得加上车架和座椅,才能满足舒适的驾乘体验。 在体验和交流过程中,我明显感觉到,百度想“开”了之后,其AI To C的产品气质和节奏,正在发生肉眼可见的变化,有一种甩掉包袱的轻快。就像李彦宏在百度产品接入DeepSeek后表示,“百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。” 这或许也是百度持续升级文小言的意义。 但不可避免的,百度AI to C产品还存在着一些惯性问题。比如在功能设计上,百度十分慷慨,希望把自己所有的好技术成果都呈现在用户面前。但面面俱到也并见得是好事,无形中拉高了用户的使用门槛。我在使用搜题功能中,按照提示寻找上传问题的入口,花了很长时间。结果在对话框上方,“解题老师”的快捷入口已经被单独列出来了。 对百度来说,节奏对了,剩下的调试,就是在与时间赛跑,与友商赛跑了。
4年5度IPO,绿茶餐厅未上市已过时?
3月28日,初代网红餐饮品牌绿茶集团港股IPO获证监会备案,距离2021年其首次申请IPO已有4年。在此期间,绿茶集团5次冲击IPO,终于在这个春天迎来了好消息。 惊蛰研究所在《绿茶再次冲击IPO,老牌网红如何翻盘?》一文中,曾讨论绿茶餐厅彼时所遭遇的困境与挑战。如今4年过去了,奔跑在上市路上的绿茶依旧“初心不改”,但餐饮江湖已变。 眼下的IPO顺利备案,无疑代表着绿茶距离其上市目标更近了一步,但也让外界开始重新审视这家餐饮网红品牌的价值:曾经的初代网红,还能“打”吗? 网红绿茶,尚能饭否? 提到杭州菜,恐怕很多网友的脑海里都会第一时间浮现出“西湖醋鱼”的鼎鼎大名。然而,很多人并不知道初代网红绿茶餐厅,其实也有着纯正的杭帮菜“血统”。 2004年,绍兴人王勤松在杭州西湖边的茶园里创办了一间绿茶青年旅社。虽然名义上是青年旅社,但日常也会为南来北往的旅客们提供餐饮服务,而且由于旅社的餐食获得了旅客们的认可,餐饮也逐渐成为旅社的特色服务。 *图片来源:绿茶餐厅官网 在没有小红书的年代,成为网红并不容易,而绿茶旅社里来来往往的游客就成了初代网红成功出圈的重要推手。随着入住的游客越来越多,“绿茶旅社”的餐饮服务也因为游客们的口口相传形成口碑。2008年,绿茶旅社彻底转型成绿茶餐厅,并且因其独特的中式装修风格和亲民的定价迅速吸引了众多消费者。根据媒体报道,当时首家绿茶餐厅还创下了单日14次的翻台纪录。 2010年,积累了两年的绿茶餐厅开始向外寻找可能性,并且在北京开设了第一家分店,而北京的包容性和多元的餐饮文化使得绿茶餐厅再次获得市场认可。 事实上,2010年前后也是中餐品牌百花齐放的一个时期。包括小肥羊、海底捞、俏江南等知名中餐品牌都是在这一期间获得快速发展。而绿茶作为有着杭帮菜“血统”的融合菜,与火锅、烧烤等常见品类以及川湘菜等传统菜系有着明显区别,因此意外获得了差异化的市场空间,每到饭点绿茶餐厅的门口都会大排长龙。 不过,真正让绿茶快速出圈的还是爆款菜品和超高性价比的市场定位。 2014年参加工作的裕阳告诉惊蛰研究所,当时自己每个月的收入只有5000元左右,扣掉在北京租房和日常通勤的成本,每个月的生活费就只剩下3000元左右。“那会儿刚刚工作就想多攒一点钱,所以平时都很少下馆子。而且吃火锅、烤肉这些人均至少要七八十,多的时候要一百多。对比之下,去绿茶有时候五六十就够了,所以性价比特别高。” 裕阳还特别补充到,“绿茶的菜品也很有特色。不像很多地方餐馆都是正儿八经的传统菜肴,口味上也感觉很新奇,现在还能想起来他们家的火焰虾、绿茶烤鸡和面包诱惑。特别是往面包里面加冰激凌的面包诱惑,这种东西我之前从来没见过。” 惊蛰研究所也发现,时至今日,绿茶官网上的“招牌美食”页面依旧把面包诱惑放在首位,而在大众点评上随机打开一家绿茶餐厅的评论区,也是“价格实惠”“面包诱惑好吃”等评价标签占据了醒目位置。 从积极的角度来说,在点评软件和种草社区还不发达的年代,绿茶依靠爆款产品、中式装潢以及性价比成为初代网红,并且将爆款产品延续了十几年,足以反映其获得了充分的市场认可和用户口碑。 但从市场竞争的角度来看,在如今“网红化”已经成为连锁餐饮赛道标准玩法的环境下,面对已经卖了十几年的“爆款”和初代网红的招牌,也不禁令人怀疑,还能有多少竞争力。 网红成标配,绿茶已掉队 与十几年前绿茶快速出圈时的市场环境相比,当下餐饮市场最大的变化是“网红”品牌不再是意外叠加的结果,而是一种基础能力。 大到名字里全是英文的西餐、韩餐,小到街边的咖啡店、面馆,餐饮老板们不一定人人都会运营品牌自媒体账号,但也至少知道上团购平台寻求推荐流量,或者是邀请探店博主为门店引流。而年轻消费者对种草平台上各种“爆款”的前赴后继,也捧红了网红餐饮赛道。 2020年以后,“微醺经济”盛行,而提供舒适的环境、精致的菜品和高性价比酒水的Bistro开始风靡。这种源自法国巴黎的餐厅形式,区别于正餐法餐的高级餐饮,更强调用餐环境和有松弛感的用餐氛围,更关键的是拍照出片。 *小红书上讨论Bistro的笔记 伴随着小红书上带着“chill”标签的笔记文字搭配着昏暗灯光下拍出的精致餐食成为新的流量密码,从北京三里屯到上海愚园路的西餐厅和中餐馆,纷纷在招牌上加上了“Bistro”这个大多数人或许并不知道具体含义的英文单词。 《光明日报》在2022年进行的一项调研数据显示,“能显著提升消费乐趣的仪式感”以40.67%的比例位居Z世代喜好的产品要素排行首位。而当“拍照好出片”成为餐饮品牌的核心竞争力,餐饮行业的“内卷”维度也扩展到了“餐桌”外。仅仅是一个传统的火锅赛道,近几年就涌现出地摊火锅、居民楼火锅等众多新分支。 排除掉味道方面高度统一的川渝火锅本味,有年代感的土味装潢将松弛感进一步下放,红砖墙、木桌椅和旧货市场都不收的“大头”电视机,成为社交媒体上区别于“精致Bistro”的氛围担当。 经历了法餐Bistro的洗礼,接上了本土的地气,近两年的网红餐饮又衍生出了半土半洋的“山系Bistro”。云贵川组成的“西南F3”菜系,用中餐的煎炒烹炸烤结合西餐摆盘和灯光、环境营造的氛围感,一边拉高了中餐的格调,一边又把西餐的溢价打下来,不仅在味道上更能迎合本土中国胃,颜值上也能为追求精致的年轻食客提供满满的氛围感和情绪价值。 有意思的是,“山系Bistro”的网红修炼大法已经成为一种百试百灵的网红公式。不光是“西南F3”,包括创意韩餐、泰餐也开始在门口等位区摆上露营折叠椅、蛋卷桌,店内随处可见鲜花绿植。各种户外、自然元素的堆叠,只为了营造出闹市中的世外桃源的轻松氛围。不管味道怎么样,但拍出来一定是“漂亮饭”。 *小红书用户分享的“漂亮饭” 由此,新时代餐饮网红的秘诀是在餐桌以外的舞台营造充满松弛感、氛围感的用餐体验,然后用七八十到一百多的人均变现。土洋结合的“漂亮饭”不一定能填满食客的胃,但也能满足拥有毛坯人生偶尔需要“精装朋友圈”的“穷鬼”。 回头再看绿茶餐厅,中式装修似乎少了几分特殊的“松弛感”,没有了颜值噱头也失去了高客单的收割利器。对比已经具备标准化复制能力的网红“漂亮饭”, 初代网红显然已经掉队。不过,这并不代表绿茶的结局只有被挤下牌桌。 下沉市场找出路 如果不是IPO获得备案的消息传来,恐怕很多人都不知道绿茶竟然还“活着”,而这种群体印象的产生与绿茶一直以来的发展策略有关。 绿茶的“成名技”是爆款菜式加性价比,从一道推了十几年的招牌菜“面包诱惑”上可以看到,绿茶仍然在坚持这一路线。而这条细分赛道虽然看上去不如“山系Bistro”们的“漂亮饭”有吸引力,但在一线城市以外的市场却格外有生命力。 惊蛰研究所在《“土味”餐厅,越土越火?》一文中曾提到,近两年,一直活跃于地方市场的土菜馆,因为“土味”特色和基于二线市场的实惠定价,吸引了不少年轻人从而逐渐出圈。这一点恰恰与坚持性价比的绿茶不谋而合。 招股书显示,2021年至2023年,绿茶餐厅人均价格分别为60.5元、62.9元、61.8元,2024年前三季度,绿茶餐厅的人均价格甚至进一步下降到57.7元,令人有种“价格回到十年前”的恍惚错觉。而随着理性消费的理念越来越深入人心,绿茶主动舍弃高客单,转而向二三线市场用规模化撬动更大的利润空间,也未尝不是一种以退为进的发展策略。 招股书显示,截至2024年12月10日,绿茶集团已开设461家餐厅,覆盖中国21个省份、4个直辖市以及两个自治区。而在2021年至2024年前三季度,绿茶集团在二线、三线及以下城市总计开设178家餐厅。 此外,按照规划,绿茶IPO所募集的资金将用于门店的继续扩张,于2024年、2025年、2026年、2027年分别开设120家、150家、200家、213家新餐厅。这些门店也将重点向二线、三线及以下城市发力。大有反向上演“农村包围城市”的意思。 需要注意的是,土味餐厅之所以能够在二线市场保持顽强的生命力,一方面是因为二线及以下城市在店铺租金、人员薪资方面所具有的运营成本优势,另一方面,还因为拥有稳定的本地供应链能够压缩食材成本。 *图片来源:绿茶餐厅大众点评用户评论 因此,对于发力二线、三线城市的绿茶来说,即便赌对了市场增长方向,也依旧要面临翻台率提升难、客单价逐步下探等传统问题,最终考验其自身在供应链和经营利润上的把控。 王勤松在2015年接受《中国连锁》采访时曾表示:“我们是50元的人均,花的却是500万元的装修费用,只有满客之后翻台才开始赚钱,绿茶一天翻台率4次是保本,最高是7次。”尽管采访时间是10年之前,但翻台率依旧是绿茶餐厅日常经营的核心指标,而在二线、三线及以下城市要想达到7次翻台率,恐怕挑战不小。 作为参考,“中式正餐第一股”小菜园最新发布的业绩公告显示,其整体翻台率从2023年的3.3次/天降至2024年的3.0次/天,降幅为9.1%。翻台率最低的是三线及以下城市门店,2024年的数据为2.8次/天。另一边,2024年海底捞在一线、二线、三线及以下城市的翻台率则为4.0次/天、4.1次/天和4.0次/天。 作为上市企业,小菜园和海底捞的翻台率尚且如此,绿茶能否在下沉市场找到扩张成本与经营利润之间的平衡,尚难定论。唯一值得关注的好消息是,海底捞在最新财报里首次披露加盟店情况,数据显示截至2024年末,其已落地13家加盟餐厅,超70%加盟申请来自三线及以下城市,表明知名餐饮品牌在下沉市场仍有较大发展空间。这也让作为初代网红餐饮品牌的绿茶,看到了三线及以下城市的门店规模化带来的希望。 *图片来源:绿茶餐厅官网 近几年,餐饮行业在资本市场的表现格外惨淡,呷哺呷哺、九毛九等上市餐饮企业,均遭遇股价暴跌。经营方面,因为消费支出预算减少导致的外出就餐意愿下降,业绩下滑也是普遍存在的行业难点。在市场端,“漂亮饭”的出现曾一度为餐饮行业带来新思路。但在“小众变网红,网红会闪崩”的网红剧本套路下,年轻消费者也在对同质化的“漂亮饭”加速祛魅。 相比之下,初代网红光环叠加高性价比的绿茶,或许能够成为另一种形式的“土菜馆”,继续将爆款、价格再叠加一点点“情怀”作为自身的差异化优势,在下沉市场将理性消费者们发展为新的拥趸。 对于绿茶来说,规模化需要充足的资金,所以上市是它的阶段性目标。而在“网红”品牌快速迭代的餐饮赛道,用规模化继续验证爆款和高性价比在下沉市场的的可行性,也将是其获得行业下半场入场券的唯一方法。
10万台服务机器人,15年海量场景数据,擎朗人形机器人撕开万亿新市场
作者 | 云鹏 编辑 | 漠影 随口说上一句话,机器人就可以为你倒一杯果汁、打一个鸡蛋、将桌子上的碗筷准确放到收纳架上,机器人还可以读懂你的喜怒哀乐,颇具幽默感地给你讲个小笑话。 今天,这些颇具科幻感的场景已经成为各路科技巨头发布机器人新品时的常见演示,AI大模型让AI可以更好地看懂世界、理解世界并与人和世界产生更好的交互。 在大模型能力的快速迭代下,具身智能已经成为当下机器人赛道聚光灯下的焦点,国内资本市场火爆,各路创企涌入,巨头们也纷纷行动,电影中的大管家“贾维斯”,似乎正在向我们招手。 但相比发布会上的“仰望星空”,机器人赛道显然需要更多的脚踏实地,如何让机器人能够在更多场景中落地、实实在在地去服务企业和消费者、解决需求痛点,是更为实际的问题。 服务机器人市场作为机器人领域商用较为成熟的领域,正在具身智能的发展下涌现出新的变量。 近日,有着丰富产品矩阵与落地场景的全球服务器机器人巨头擎朗智能,再度发布了一系列新品,并亮出了基于自身海量真实场景数据打造的具身多模态模型。 其人形具身服务机器人新品XMAN-R1,基于“岗位化、亲和力、安全性”理念设计,已经具备了在服务行业中处理长程任务的理解规划能力,成为业内关注的焦点。 ▲XMAN-R1 擎朗自研的多模态模型正在帮助服务机器人一步步脚踏实地走向场景,解决更加复杂动态化的任务,具身智能核心的泛化能力得到大幅提升。 其实早在去年的WAIC世界机器人大会上,擎朗就已经推出了XMAN-W3这样的产品,在酒店机器人基础上增加了灵活的双臂,这也是擎朗在具身智能领域的前瞻探索,这款可爱的XMAN-W3与XMAN-R1属于同门同系师兄弟。 ▲XMAN-W3 可以说,在具身智能商业化落地方面,擎朗一直跑在前面。 毫无疑问,当下具身商用服务机器人市场正涌现出巨大机遇,而擎朗基于自身15年行业积淀,掏出从大模型技术、软硬件工程化/产品化能力到技术商业化验证三张王牌,已经向着具身商用服务机器人的蓝海迈出了一大步。 一、服务机器人规模化加速,泛化能力如何打破数据瓶颈? 根据市研机构IDC预测,未来全球具身智能服务机器人市场将快速增长,五年后的2030年,市场规模或达到939亿美元(约合人民币6819亿元),复合增长率达到86.2%。 具身智能涌现出的巨大增长潜力,给商用服务机器人赛道的玩家们带来了巨大动力,同时也带来了新的挑战。 近年来,服务机器人在餐饮配送、商用清洁、银行导览、酒店服务等领域已经形成规模化落地,在商超、文娱、医疗、康养等细分领域也展现出强劲的增长潜力。 与此同时,机器人面对的场景越来越复杂、非结构化,比如餐厅、医院等场景充满不确定性,突发情况较多、光线也十分复杂,人类可以依靠经验快速调整,而传统机器人则需依赖预编程规则与强化学习,效率低且难以覆盖长尾场景。 具身智能的核心在于“智能体通过身体与环境的互动来学习”,正是当下行业痛点的良好解法,而这一过程也天然需要泛化能力。 服务行业需要有泛化能力的具身智能机器人,需要具身智能机器人“更聪明更懂人”,克服动态非结构化复杂环境、人与机器的高频交互博弈、全流程闭环这三大挑战,更好地解决实际生活中的问题。 但当前具身智能的泛化面临瓶颈。相对于多模态大模型可以利用互联网文字、图像、视频、音频等数据进行训练,具身智能大模型目前依然缺少可用于训练的高质量、大规模人类操作数据。 正如擎朗CEO李通所说,对于具身智能的发展来说,这是一个“先有鸡还是先有蛋”的问题。 具体来讲,具身智能的数据来源包含遥操作采集(通过手柄、体感设备等遥控机器人完成任务来采集数据)、生产伴随采集(在真实环境中,人类操作员通过穿戴外骨骼等设备,在实际生产中采集数据)、仿真数据合成(在高仿真3D环境中,实现机器人的数据采集)三个主要途径。 根据不同的场景任务,综合三种采集方式,可以显著提高具身智能体模型训练效果,快速实现模型能力落地。 所以相比“一口吃个胖子”,放个吸睛感十足的“大招”,擎朗选择了更脚踏实地真正可行的一条路,优先实现局部泛化。 在擎朗看来,现阶段直接实现完全泛化的具身智能是几乎不可能的,但通过单一任务泛化实现商业落地是可行的,让机器人先专注于特定岗位场景,再逐步扩展其他岗位场景,最终融会贯通。 二、软硬件自研技术齐头并进,擎朗具身服务机器人打出三张关键王牌 在这样的理念加持下,擎朗在具身智能风口找到了自己的准确方向,并率先交出了答卷,此次XMAN-R1的发布以及自研垂类多模态大模型的深度融合,为擎朗在具身智能服务机器人赛道按下了加速键。 具体到XMAN-R1,其核心的设计理念是岗位化、亲和力、安全性。这三方面的关键特性可以说是具身智能服务机器人落地的关键抓手。 在岗位化方面,XMAN-R1可以模拟岗位化姿态或岗位化行为模式,简单来说,就是机器人可以学习人类服务人员的动作逻辑。 值得一提的是,“机器人岗位化”的概念是由擎朗首次提出的,直观理解,就是将服务场景解构为标准化岗位单元,再将机器人定位为标准化的“岗位员工”。 比如一个机器人专门就负责快餐店的汉堡制作,一个机器人可以专门负责炸薯条的制作,而另一个负责打包收款结账。 每一项工作内容都可以被精确描述,结果可以被标准化评估,这无疑更利于在商业环境形成机器人能力的闭环。 与此同时,通过不断的复制“岗位化”工作模式,擎朗的人形具身服务机器人可以不断学习和拓展多样化工作能力,并持续迭代基础动作模型能力,从而实现更广泛的落地场景应用。 在另一个关键特性安全方面,XMAN-R1也可以说是黑科技武装到牙齿。 其搭载了摄像头、激光雷达、深度相机等种类丰富的传感器,在算法层面则采用了擎朗自研的实时空间三维重建技术。 各项技术加持下,机器人具备了很强的环境感知能力,能实时对环境中的静、动态障碍物进行准确识别和未来行为预测,并通过云端大脑对复杂任务进行多级规划,最后结合本地小脑进行自适应运动控制,保障机器人的拟人化动作逻辑。 感控一体的全身运动规划模型,可以在开放式复杂环境中确保人机协作和周边人群安全。 这种云端“大脑”任务理解+本地“小脑”运动规划与控制的模式可以很好地兼顾性能、效率、功耗、成本等多方面因素。 在这背后,擎朗长期积累的海量开放场景语义数据和擎朗具身多模态模型的实时决策能力都发挥着关键作用。 在避障算法领域,擎朗同样有着深厚积累,截至2025年,擎朗智能在避障领域已申请165件发明专利,据查询,在服务机器人领域的授权发明专利数量上,擎朗在中国服务机器人行业居首位。 此外,在各类传感器原始数据处理、平衡性能与精度、降低时延、降低功耗等方面,擎朗也实现了诸多软硬件技术层面的创新。 最后,在亲和力方面,这次XMAN-R1的外观更模拟人体比例,富有亲和力的设计可以让它更好地融入商业环境中,机身流畅精炼的线条可以兼顾科技感与力量感。 在这三大特性之外,擎朗自身服务机器人生态在协同性方面也涌现出巨大潜力。 在擎朗看来,人形具身服务机器人不是对现有产品的替代,而是对现有机器人生态的完善和升维,去解决服务行业的最后一环任务难题。人形具身服务机器人会与专用型具身服务机器人实行岗位化分工,融入整个擎朗的机器人服务生态。 从餐饮领域的配送机器人T10、酒店场景的服务机器人W3到清洁机器人C30、医疗领域的X101和工业领域的S100,人形具身服务机器人XMAN-R1将成为擎朗服务机器人生态矩阵的关键一环。 人形具身服务机器人具备较强的通用性和适应性,能够执行复杂、非结构化的任务,可以与在特定任务上具备高效率和高精度的专用机器人形成很好地“互补”。 比如在餐厅中,XMAN-R1可以独立完成取酒倒酒、放置托盘等配餐动作,并通过机器间任务调度,将餐品交接给配送机器人T10,后者会按最优路径送餐,最终完成服务闭环。 可以说,通用具身服务机器人与专用具身服务机器人的协同必然会是未来智能机器人发展的重要方向之一,两者的结合可以充分发挥各自的优势,更高效、更灵活执行任务。 总体来看,从机器人的内在到外在,从各类自研软硬件技术到机器人生态协同,从岗位化专用做到极致到泛用性的高效迭代,在具身服务机器人该怎么做这件事上,擎朗已经趟出了一条切实可行的新路子。 三、每天数亿条数据、数千万次人机交互背后,具身智能商业化落地加速 面对具身智能的火爆,所有机器人企业都面临着新的机遇和挑战。行业到底会如何发展?企业要如何抓住需求、快速迭代产品技术、拓展市场? 在擎朗看来,具身智能的发展必然要先做好“专用”这一环,这也是具身服务机器人商业化落地的最佳路径。 李通提到,通用人形机器人的未来是非常光明的,擎朗也非常认同这一方向,但当下数据不足已经成为行业的核心痛点。 只有先通过专用机器人创造场景入口,积累数据反哺技术,才能进一步迭代使得具身智能可以拓展边界,进而拉动更多专用设备部署,形成良性的商业闭环。 从行业视角来看,擎朗的做法显然有极高的参考价值,在各个领域打造一群“专家机器人”,通过高度岗位化的场景海量获取高质量数据,快速迭代模型和算法,不断提升机器人的泛化能力。 最终,当无数细分领域的专家机器人的能力被汇聚起来,真正泛用、通用的人形具身智能机器人,也就离我们不远了。 未来,真正的“大管家”具身服务机器人,也许会由一个通用大模型作为大脑,而各类来自于各领域“专家”的优秀小模型则会让机器人在处理各类任务时都能游刃有余、专业高效。 在与擎朗CEO李通的深入交流中我们感受到,擎朗对于通用具身智能未来的发展是积极乐观的。 从创业之初,擎朗就一直希望做能够服务好企业和消费者的服务型机器人,在这条路上,不断有新的技术涌现,从深度学习强化学习到如今的AI大模型、具身智能,新的技术都会成为擎朗优化机器人体验的利器。 在过去的15年里,擎朗完成了专用服务机器人的产业化和商业化普及,成为全球最大的商用服务机器人企业。 ▲擎朗智能机器人生态矩阵 从餐饮、酒店到医院等场景,擎朗累计部署了超过10万台配送、清洁等专用机器人,服务网络已经覆盖了60多个国家和地区。 这样深厚的积累,正是擎朗可以在具身智能浪潮中快速跑在行业前列,能做好具身服务机器人的突出优势之一。 十几年的服务机器人行业经验,让擎朗积累了海量的服务场景数据,涵盖餐饮、酒店、医疗、工业等场景。这些数据对于擎朗具身多模态模型的能力提升有着极大的促进作用。 通过各个场景的视觉、语音等多模态数据的训练,使得擎朗的多模态大模型具有优秀的场景感知与任务理解能力,这正是其它机器人企业所不具备的。 正如李通所说,机器人不仅是效率工具,更是数据入口——擎朗智能每天产生超数亿条环境感知数据、数千万次人机交互记录,拥有全球最大的商用机器人场景数据源。 “专用机器人的价值不仅是完成任务,更是为通用化提供数据。” 与此同时,十余年来,擎朗对商业服务场景中的客户需求、场景特点、交互方式等非常熟悉,擎朗会花大量的时间去了解客户的整个流程的操作细节。 展望未来,AI大模型赋能继续加速、多模态感知技术加速迭代,具身服务机器人加速走向“通用泛化”,机器人会通过模块化技能库组合应对新任务,会像人类婴儿一样,通过感知运动经验自主构建物理规律认知。 而已经实现全场景渗透、全品类布局、全球化拓展,掌握技术、市场和模式多重优势的擎朗,已经成为撕开万亿蓝海市场的核心推手。 结语:服务机器人赛道掀起具身智能浪潮,擎朗提前交卷 海量真实场景数据而来的具身多模态模型、软硬件工程化/产品化能力、充足的技术商业化验证,这三个关键优势已经成为擎朗在具身智能时代的最硬底牌。 此外,擎朗智能保持着开放生态与尖端设计的能力,如今擎朗机器人已完成市面上多款热门AI大模型的接入,并实现应用场景的成功落地;旗下机器人产品频频斩获德国红点奖、德国IF设计奖等世界级顶尖奖项。 当下商用服务机器人市场正处于技术革新的关键年,国产化替代加速、覆盖场景加速扩展,具身智能必将成为全球商用服务机器人的核心角逐焦点,AI将给服务机器人赛道带来哪些新的变量,又有哪些产品将惊艳登场,我们拭目以待。
iOS 18 迄今最大更新推送, 实测苹果的5.5G有什么不同
4 月的第一天,苹果 iOS 18.4 正式版如期而至,几乎可以说,这就是 iOS 18 发布以来最大的一次版本更新。 其中最值得关注的,当然是全新的 5G-A 网络支持,以及正式支持简体中文的 Apple 智能。 话不多说,下面一起来看看 iOS 18.4 有什么不容错过的全新功能。 5G-A 有多快? iOS 18.4 首先为国行 iPhone 带来了 5G-A 网络的支持。5G-A 又名「5.5 G」,也刚好差不多在一年前这个时间节点,国内运营商纷纷启动 5G-A 商用,不少 Android 手机都早已跟进,苹果这波更新只能说虽迟但到。 5G-A 好处都有啥?虽然还不是 6G,但 5G-A 相比较 5G,速率更高,延迟要更低,前者的理论速率是后者的十倍。并且 5G-A 基站在每平方公里都支持超过 100 万台终端连接,意味着在人流密集的商场、演唱会 5G-A 的通讯会更顺畅。 不过,国内目前还没有完成 5G-A 的全面覆盖,目前只应用于一些主要城市的部分地区。爱范儿所在的 TIT 园区,刚好就能接收到 5G-A 信号。 升级 iOS 18.4 后,iPhone 15 和 iPhone 16(除 16e)系列在地区支持的情况下会显示「5GA」,iPhone 13 和 iPhone 14 系列,以及 iPhone 16e 据悉仅支持中国联通、中国电信的 5G-A 信号,并且不会在状态栏显示。 经过实测,5G-A 在测试速度和实测中,确实要比 5G 要更快一点,不过信号不佳的地方,支不支持 5G-A 都没啥不同。 Apple 智能会说中文了,但说得不是特别好 需要注意的是,这里的「中文版」指的是海外机型能用上支持中文的苹果 AI,而不是 Apple 智能上线国行 iPhone,国内的小伙伴想用上 AI 还要再等等。 就目前而言,Apple 智能的重头戏在文字生成的「写作工具」上。这个功能没有特定的入口,能够选取任何文字进行调用,可对文字重新润色、做成表格或者提取摘要。 ▲ 图源:哔哩哔哩@大耳朵TV 「写作工具」更强的能力在文字创作上,用户可以选择写好的文字进行校对,也能选中文字进行改写。苹果提供了三种润色的风格:「友好」「正式」「简洁」,以面对不同的场合。如果有自己的想法,还能输入具体的修改需求。 ▲ 「祝你休息愉快」是哪里的表达…..图源:哔哩哔哩@李大可爱玩 要是一个字都不想写,Apple 智能还能联动 ChatGPT,直接让它根据需求生成长文。 ChatGPT 的助力不仅限于写作工具,打开 Siri 的 ChatGPT 扩展后,也能直接用普通话调用更聪明的聊天机器人回答问题。简单的口头问题不用说,还能让其总结网页、识别图片、解数学题……总之,ChatGPT 有的能力,都能通过 Siri 在 iPhone 上更方便地实现。 ▲ 图源:哔哩哔哩@李大可爱玩 接入 ChatGPT 的 Siri 可以说终于有了「智能助手」的能力,但更强的情景感知、跨应用和应用内操作等深度的系统级能力,还需要等待苹果自研的 AI Siri,而上个月苹果已经宣布这个功能将至少推迟到明年。 AI 通知摘要和全新的「优先通知」都正式上线支持中文。目前来看,一些简单的通知准确度会更高,而像是微信这些多条的聊天信息,AI 理解起来会有一点问题,摘要结果会不太准确。而打开「优先通知」之后,AI 会将它认为更重要的信息置顶显示。 ▲ 图源:哔哩哔哩@李大可爱玩 iOS 18.4 还为 iPhone 15 Pro、iPhone 16e 两台没有相机控制的机型带来了视觉智能入口,用户可以设置可以用操作按钮呼出视觉智能,也可以在控制中心添加一个方便的开关,可以用来翻译看到的外文,或者调用 ChatGPT 识别物体了。 ▲ 图源:哔哩哔哩@大耳朵TV 并非所有的 Apple 智能功能都已经支持中文,两个「文生图」功能——Genmoji 表情生成和图乐园图片生成目前依旧只支持英文。 就目前而言,Apple 智能的使用体验还算中规中矩,对中文的支持还有点水土不服。 最近苹果高管频繁访华,或许也意味着苹果正在努力推进国行 Apple 智能的进度,相信官网上的「为 Apple 智能准备好」很快能变成「支持 Apple 智能」。 其他值得一提的功能更新 如果你用的是国行 iPhone,刚好所在地也不支持 5G-A,那么 iOS 18.4 还剩下什么亮点? 首先控制中心新增了一个名为「环境音乐」的板块,包含四种风格的纯音乐歌单:「安睡助眠」、「放松减压」、「提升效率」、「平衡身心」,点击就能播放,播放界面类似 Apple Music,但要更加简单。 「照片」App 有不少细节上的变化: 图库新增了一个「不在相簿中」的筛选选项,可以筛选那些没有被放入任何相簿的图片 相簿选项新增一个「封面照片」的选项,点击后每个相簿的卡片会变成大图封面的样式,还新增了「按修改日期排序」的选项 「照片」的设置选项中,有一个显示最近查看和共享的切换开关,它将在实用程序列表中显示或隐藏最近查看和最近共享的相册 「最近删除」重新加回了一键全部删除和全部恢复 可以说,都是一些小的更新,不太可能扭转这个新「照片」应用惨淡的口碑。 全新的邮件「分类收件箱」也正式支持中文,可以在右上角的选项卡中切换。 就目前的情况来看,中文邮件的分类并不算准确,不建议使用。 ▲ 苹果自己的「Find My」成「推广」了 App Store 中暂停应用下载的逻辑有所变化:以前是终止了就要重下,现在暂停后可以恢复下载。 Safari 浏览器中,点击搜索框现在会出现最近的搜索历史,这个新功能可以在设置中选择关闭。 还有全新的 7 个 Emoji:眼袋、指纹、甜菜、枯树、竖琴、铲子、萨克岛旗,想必这个「眼袋」将成为打工人的新宠。 如果你手头有 Vision Pro 头显和 AirPods Max,那么 iOS 18.4 还将为你带来两个特别实用的更新。 首先是一个全新的「Apple Vision Pro」应用,能够用 iPhone 方便地查看头显目前的状态,包括设备的型号、系统版本和序列号,以及镜片参数等等信息,苹果也会在这个 App 中推广新的 Vision Pro 内容,像是沉浸式视频、应用和游戏,还有一些使用 Vision Pro 的技巧和功能介绍。 值得一提的是,今天一同推出的 visionOS 2.4 也为海外 Vision Pro 用户带去了第一批 Apple 智能功能支持,包括写作工具、图乐园、 Genmoji 表情生成和自然语言搜索等功能。 更新 iOS 18.4 之后, USB-C 的 AirPods Max 支持 Apple Music 的 24 位 48kHz 无损音频播放,不过需要使用耳机附带的 USB-C 连接线,以有线的形式才能聆听。 来到第四个版本,iOS 18 也可以说进入到了「成熟期」,接下来的大版本更新预计都只会是小修小补,当然,对于国内用户来说,还有国行 Apple 智能这个大菜还没上。 说是「成熟期」而不是「完全体」,主要还是因为 Apple 智能的「心脏」——AI 增强 Siri 的无限期跳票,导致 iOS 18 注定无法实现一年前 WWDC 上面描绘的美好愿景。 距离今年的 WWDC 还有 70 天左右的时间,希望苹果今年这个要用上全新风格的 iOS 19,别再让我们失望。 你还在 iOS 18.4 中发现了什么新功能?欢迎在评论区告诉爱范儿。
宝马绝不背叛驾驶
在 2025 年的汽车新闻发布会上强调「驾驶」是一件有点反常识的事情,毕竟我们看到的汽车新闻发布会一般强调的是智能驾驶、智能座舱,以及舒适享受,驾驶仿佛是应该丢给司机,或者那二三十个传感器和几颗芯片去干的事儿。 当然,汽车新闻发布会上不再强调「驾驶」,好像也有点反常识。 一年一度的宝马创新日活动上,「驾驶」反而成为了所有讲解的关键词,真就是智驾时代的锐利异类。 看路还是看屏?宝马始终希望你看路 在聊智驾和人驾之前,其实还有一个比较隐性的矛盾摆在面前:汽车内外的显示设备越来越多,除了仪表屏和中控屏之外,可能还有 HUD 抬头显示、电子后视镜显示屏和贯穿远端屏。当然,后排娱乐屏,车外点阵屏等等也出现得越来越多。 也就是说,现在的司机位,不光是要耳听八方,眼观六路,还要眼观三四屏。 显然,这和专注驾驶安全驾驶是矛盾的。 虽然宝马在屏幕的使用上没有国产车那么激进,但显示设备越来越多,多媒体内容越来越丰富的趋势无法阻挡,实际上,宝马还是 HUD 抬头显示的普及者,早在 2003 年,宝马 5 系车型上大规模应用 HUD 抬头显示。 宝马给到的解决方案是 BMW 新时代操作系统 X 里的全景 iDRIVE 人机交互解决方案。 关注宝马新闻的朋友应该对操作系统 X 和全景 iDRIVE 人机交互解决方案不太陌生,它们首次亮相在 2023 秋季的德国国际汽车及智慧出行博览会(IAA MOBILITY)上,不过当时还属于概念设计,许诺在 2025 年真正上车。 这不,2025 年这就到了。 所以,这一套蕴含了大量人体工程学和人因研究的人机交互解决方案预计今年就能和消费者见面了。 首先最重要的一点,就是全景 iDRIVE 人机交互解决方案基于一个大前提:座舱「视觉锥」概念。 座舱「视觉锥」以驾驶者视线为轴心,将车内的交互信息分层防止,最重要的驾驶信息位于视线中央和焦点处,娱乐和舒适功能则位于视觉椎的底部周边视野,让合适的信息,以合适的界面,出现在合适的时间,尽量不干扰驾驶,最终让驾驶者减少视觉焦点和切换时间和频率。 因而,基于「视觉椎」概念,全景 iDRIVE 人机交互解决方案就被划分为了四大交互界面: BMW 全景视域桥 中央信息显示屏 3D 视域前景显示 全新多功能方向盘 如果不说 BMW 全景视域桥也是一种 HUD 抬头显示,想必很多人会以为这一条横亘在前挡风玻璃下方的长条显示区域是显示屏,但实际上,它还是投影,只是投影到了挡风玻璃下方的纳米涂层深色区域。如大家所见,投影效果有着堪比高分辨率显示屏的清晰度和色彩表现。 这里主要显示的是驾驶相关,比如当前时速,导航信息等等,还有就是在视线稍右方显示娱乐相关信息。 在全景视域桥更上方,则是 3D 视域前景显示,这也是一种 HUD 抬头显示,只不过信息呈现更立体,与显示世界的融合更贴合,主要是显示能够帮助驾驶员更专注于驾驶相关的信息, 比如关键的驾驶辅助、导航信息等。 最让人疑惑的,则是那个不规则的中央信息显示屏。 相比于普通的的长方形中控屏,宝马全景 iDRIVE 人机交互解决方案的这个中央信息显示屏有三点不同: 以平行四边形形状向驾驶侧靠拢,并进行了不规则的切割 屏幕向驾驶侧倾斜 17.5°,针对驾驶员视线进行了优化,并尽量缩短方向盘到显示屏的距离 中央信息显示屏带矩阵背光,保证了屏幕内容在任何光线下的可见度 另外,中央信息显示屏与全景视域桥可以双屏联动,用户可以在中央信息显示屏中选择天气、音乐等信息,往上滑动,流转到全景视域桥上进行显示。 不难看出,宝马之所以这么设计中央信息显示屏,还是基于视觉椎的概念,以及尽量保证驾驶者视线在视觉椎之内,保证驾驶的安全性。 最后的交互和屏幕无关,甚至和视觉的关系已经都不大了,宝马尽可能地减少了非方向盘区域之外的实体按键,并且在方向盘划出了专门交互区域。这里用到了「主动触觉反馈」和「分层显示」两项硬件技术,简单讲就是能够让用户实现「盲操」,不必看方向盘上的功能指示就能实现各种操作。 目的嘛,当然也是不让驾驶者分神,始终让视线集中在道路上。 在整套全景 iDRIVE 人机交互解决方案上,宝马还进行了为期 3 年的测试,通过行业独家眼动仪追踪测试,以避免系统中的微动画令驾驶者分心。 这是宝马给智能座舱时代看路还是看屏的一个回答,无论当下把智能驾驶和智能座舱描绘得多么吸引人,座舱内的生活多么精彩舒适,但宝马依旧想强调的是,驾驶者在汽车内的定位,依旧是专注于「驾驶」这件事。 智能驾驶,还是极限马力?宝马希望驾驶不要这么简单 与一些厂商喜欢宣传绝对意义上的马力大小不同,关于汽车驾驶参数层面,宝马倒是给出了两个数字:18000 牛·米扭矩,3G 横向加速度。 这是宝马新世代驾趣概念车的参数。 宝马表示:新世代驾趣概念车在 18000 牛·米轮上扭矩时,可以在连续弯道中实现超 3G 横向加速度。入弯时,系统会自动分配前后轴制动力,保证车身姿态平稳优雅;在冰雪路面紧急避障时,制动力还可以预判侧滑趋势,把失控苗头扼杀在没发生时。 之所以能够在如此极限的条件下,实现车辆的稳当控制,是因为宝马前不久发布的「驾控超级大脑 Heart of Joy」,这是宝马为新世代车型开发的智能驾控集成系统,通过高集成度和智能化设计,首次将动力及底盘控制二域合一,令动力传动、制动、充电、能量回收及转向等核心子功能进行高效集成,并通过全新线束系统和高速数据传输技术所构建的全新数字神经网络,最终,令决策链路延时小于 1 毫秒,信息处理速度较以往系统提升了 10 倍,实现了对车辆整体动态驾驶高效的全面思考与处理。 一般来说,我们会认为国内汽车厂商长于电子电器架构,智驾和智舱,机械层面的东西还是德国人更擅长,不过宝马还是希望用这个「驾控超级大脑 Heart of Joy」告诉大伙儿,机械层面的东西他们固然擅长,但是电子电气架构的创新,他们也能搞定,并且电子电气架构和机械素质,是没法分家的。 另外,宝马最近频繁对外释放了自己对于智能和驾驶的思考: 这(驾控超级大脑 Heart of Joy)不是让车变得更聪明,而是让它真正听懂驾驶者的每一寸肌肉记忆。(宝马工程师) 我们不生产车轮上的智能设备,而是将智能融入汽车的骨骼血脉。(宝马集团大中华区总裁高翔) AI 不是替代人类,而是让我们找回最初爱上驾驶的理由。(华晨宝马 CEO 戴鹤轩) 之所以这么说,是因为宝马在「驾控超级大脑 Heart of Joy」之外,还发布了 BMW 动态性能控制系统(DPC)。历来宝马都以驾控见长,这不仅仅是工程师们的手工打磨调校,也是宝马的百年赛道经验,BMW 动态性能控制系统(DPC)可以理解为,宝马将这些过往的赛道经验,比如勒芒耐力赛的耐久,M 车型的狂暴运动等等变为了代码,写入了这个系统。 在此系统下,驾驶的动态控制理论上就可以 OTA 了,动能回收不仅仅是为了节能,也可以和制动、转向联动,最终让驾驶者能在几乎不使用制动踏板的情况下,凭借能量回收的精细力度就能实现汽车转向减速需要,达到车随心动,本能驾驶的结果。 过往我们老是用「开宝马,坐奔驰」来形容这两个德系豪华品牌的不同,当「开宝马」遇到了不少人所期盼的「智能驾驶,车坐不开」以及「马力不够,电机来凑」挑战时,宝马对于驾驶的思考就尤为值得玩味。 如上所说,宝马对于驾驶这件事,依旧审慎严肃,既不希望驾驶员在智能驾驶的帮助下分神于智能座舱,也不沉醉于尚不完善的智能驾驶愿景,或者大马力带来的加速快感,而是希望驾驶者专心开车,轻松开车,最后享受开车,从开车中获得乐趣。 这就是标题所说的,宝马绝不背叛「驾驶」。
vivo Y300 Pro+:1799 元,你能买到一款能打电话、能拍动态照片的 7300mAh 超轻薄充电宝 | 新品画报
3 月 31 日,vivo 带来了 Y300 系列的新成员 vivo Y300 Pro+,这是一款把续航和充电技能点满的手机。 Y300 Pro+ 搭载目前容量最高的 7300mAh 超薄蓝海电池,轻松支持两天以上的使用。 手机支持 90W FlashCharge 快充,0-100% 充满需要,充电 10 分钟能有 3.8 小时的使用时间。它还支持 55W PPS 快充和 44W UFCS 融合快充,充电到 80% 后还有绕过电池直接供电给手机的「久充健康供电」模式。 还有,Y300 Pro+ 反向充电功率来到了 7.5W,手机有空时能给身边的耳机、手表等小物件补电,真的变成了一个能打电话的超轻薄充电宝。 是的,Y300 Pro+ 仅重 199g,星空银配色版的厚度也只有 7.89mm,在 7400mAh 大电池手机这个条件下绝对算得上轻薄。 机身采用双面全等深设计,曲面屏幕和背板延伸到中框的位置做到了流畅过渡,裸机状态下不管是贴手感还是后盖延伸到正面的顺滑感都非常好。 手机有微粉、简黑和我们手上这款星空银三种配色,星空银后盖上有类似星云流动的纹理,表层做了非常细腻光滑的磨砂纹理。机身内用上更坚固的金刚磐石架构,支持 12 小时抗雨和 IP6X 的防尘。 Y300 Pro+ 的后置镜组采用精工星环后置镜组设计,中置大圆环的环形结构内加入和后盖配色纹理相似的处理,让它看起来更有自家旗舰手机的感觉。 模组中心部分藏下一个环形补光灯,和一个用 5000 万像素索尼 LYT-600 CMOS 传感器为主摄的双摄组合。 机器正面是一块 6.77 英寸 120Hz 超亮护眼屏,是手动最高亮度 800nits,全局峰值为 1300nits,局部峰值亮度甚至能达到 5000nits,上手观看给人最直观的感觉就是通透锐利,屏幕整体观感要比其他同定位机型要好不少。 性能方面,Y300 Pro+ 搭载高通骁龙 7s Gen3,最高支持 12GB+512GB 储存组合,运行 120fps 王者荣耀和最高画质的和平精英都表现流畅。 最后看看价格,Y300 Pro+ 有 4 个储存版本: 8GB+128GB:1799 元 8GB+256GB:1999 元 12GB+256GB:2199 元 12GB+512GB:2499 元
美国人形机器人独角兽,又要融资超28亿元!软银参投
作者 | 许丽思 编辑 | 漠影 机器人前瞻4月1日报道,据The Information消息,美国人形机器人创企Agility Robotics正在以17.5 亿美元(约合人民币125亿元)的投资前估值融资4亿美元(约合人民币28.7亿元)。私募股权公司WP Global的风险投资部门将领投这笔融资,软银也参与其中。 Agility Robotics成立于2015年,总部位于美国俄勒冈州奥尔巴尼,由卡内基梅隆大学机器人领域专家Jonathan Hurst和Damion Shelton联合创立,团队核心成员来自俄勒冈州立大学动态机器人实验室。该公司专注于开发双足人形机器人,解决物流、仓储等场景中重复性高、劳动强度大的问题。 2022年4月,Agility Robotics完成了1.5亿美元的B轮融资,投资方包括DCVC、Playground Global、亚马逊产业创新基金(AIIF)、索尼创新基金等。 其中,亚马逊的参投也意味着Digit机器人进入其仓储生态,Digit不久后也进入亚马逊从事筛选、搬运物料箱至流水运输线的工作。 2023年12月,全球最大的纯合同物流供应商GXO宣布,人形机器人Digit正在他们旗下的Spanx工厂进行试点测试,Digit在仓库中执行物流任务,包括从AMR上移动货箱并将其放置在传送带上。 2024年6月,GXO与Agility签署了一份多年期协议,决定在GXO的物流运营中全面部署Digit。两个月后,Agilit表示,Digit已经在GXO仓库完成了10000个订单的搬运。 2024年11月,Agility Robotics完成了1.5亿美元的C轮融资,德国汽车零部件巨头舍弗勒投资,同时签订采购协议,计划在其全球100家工厂部署Digit。此后,Agility Robotics成为人形机器人领域首个突破10亿美元估值的公司。 2024年3月,微软前高管佩吉·约翰逊(Peggy Johnson)加入Agility Robotics并担任CEO。去年10月,Agility Robotics全球首家人形机器人生产工厂RoboFab在美国俄勒冈州塞勒姆正式投入运营。 之后,Peggy Johnson开始快速推进RoboFab工厂的产能扩张,计划2025年实现年产能1万台 Digit,并通过自动化产线将单台成本从25万美元降至行业可接受水平。她还希望到2025年底,机器人能够与人类协同工作。 Agility对外表示,它一直专注于安全,设计软件和硬件以防止其机器人伤害周围的人。到 2027年初,它将推出一种足够安全的机器人,可以与人一起工作,而不是局限于自己的工作区域。 Agility还正在测试OpenAI、Anthropic和Google的大语言模型以及开源模型,以取代人类对其机器人的指令,不过其并未在其客户目前正在使用的机器人中使用这些AI模型。 即便机器人造型、能力看起来平平无奇,不如近来扎堆炫技的人形机器人那么耀眼,所聚焦的场景也一直都是仓储物流领域,但是从Agility的商业化落地情况来看,这家公司可以说是领先了特斯拉、FigureAI、1X等行业热门玩家。Peggy Johnson曾多次公开表示,只有真正能投入使用,并为企业赚钱的人形机器人才是有意义的。
黑莓手机即将回归?全键盘、安卓15、AI黑科技,有点猛
小雷想问在座的各位,有用过Blackberry黑莓手机吗? 在全键盘手机里头,有一个牌子大家肯定印象深刻,它就是黑莓。不过现在市面上几乎看不到它的身影了。 图源:网络 但据海外消息,一家英国的创业公司准备正在搞一个全键盘手机项目,把黑莓没做完的产品重新做出来。嚯,到时候黑莓手机可能会重新回归到咱们的视线。 这款“黑莓”新机将具备5G网络,采取AMOLED屏,拥有12GB运行内存,出厂配置Android 15系统,并且支持生成式 AI 技术。让人惊喜的是,为了让大家找回以前的感觉,这款手机还会配上电容式键盘。而且小雷还听说,开发团队打算在保留那个标志性的键盘的同时再加入全面屏,想想就有些小激动。 从爆料图来看,咱们只能勉强看出上面有"Blackberry Patents"、“QWERTY”和“The world's first”这些字样,能感觉到设计师是在向黑莓致敬。更有消息说,这家公司还打算再做一款用全新 QWERTY 键盘的设备,现在正在跟黑莓公司商量授权。 图源:网络 值得注意的是,因为黑莓已经不做智能手机生意了,就算这家创业公司真的把类似黑莓的手机做出来了,也可能不会用“黑莓”这个名字。做出来的手机看着和黑莓有点像,但已经不是以前那个真正的“黑莓”手机,期盼黑莓手机回归的小伙伴们注意嘞。 既然提到了黑莓,那咱们来回顾一下黑莓手机以前的一些事儿。 以前黑莓手机可是商务精英们的标配。在智能手机的发展历史里,它就像个传奇一样。小雷比较好奇为啥叫“黑莓”呢?就是因为它用了标准的 QWERTY 英文键盘,那键盘看起来就像草莓表面一粒粒的小种子。 图源:黑莓手机官方旗舰店 1999年,黑莓850手机成了第一款在美国得到监管部门批准、能在美国卖的黑莓设备。一直到 2006 年,黑莓手机才正式来到咱们中国市场。 在2006 年到 2010 年那段时间,黑莓手机十分风光,在美国智能手机市场,它占了接近一半的份额,RIM 公司市值接近800 亿美元。但后来市场环境变了,黑莓在 2016 年就宣布不做手机生意。不过TCL 和黑莓签了协议,除了少数国家和地区,TCL 能在全球大多数地方用黑莓的安全软件、服务套件等。 对于跟小雷一样喜欢全键盘操作的小伙伴,这款手机确实十分令人期待。不过现在还没有确切的消息说这款手机到底什么时候发布,连个大概的时间范围都没有。虽说黑莓手机将“回归”的消息让人挺有盼头的,但到底会不会真做出来目前还不好说,得打个问号。所以小雷也是劝小伙伴们先别太激动,还是冷静点看待这事儿。 但不管怎么说,对于那些想念以前带经典 QWERTY 键盘手机的人现在也算有个盼头。在现在这个市场环境下,要是实体键盘手机能重新回来,说不定能给现在千篇一律的智能手机市场带来点不一样的新鲜感。 话说回来,要是黑莓手机又重出江湖,用的是以前那种实体键盘还装上了安卓系统,你会因为情怀而去买它吗?小雷可能会!
2万亿估值!OpenAI宣布完成2900亿新融资,重新开源,GPT-4o生图功能免费开放
作者 | 陈骏达 编辑 | 心缘 智东西4月1日报道,今天,OpenAI宣布完成400亿美元(约合人民币2905亿元)新融资,投后估值达3000亿美元(约合人民币21787亿元),他们透露,这笔资金将投入AI研究与计算基础设施建设。CNBC称,这是私营科技公司有史以来规模最大的一轮私募融资。 另据外媒援引知情人士的消息称,本轮融资由软银集团领投,他们提供了75%(约300亿美元,折合人民币2179亿)的资金,其余100亿美元资金由微软、兴盛资本(Thrive Capital)、Coatue与Altimeter提供,他们都曾参与OpenAI之前的融资。 在官宣融资的博客中,OpenAI还透露,目前ChatGPT的用户数量已经达到5亿人,较2月底的4亿人有明显增长。 ▲OpenAI官宣新融资的博客(来源:OpenAI官网) 相关协议显示,400亿美元融资将分两阶段到位:首期100亿美元立即注入,剩余300亿美元将于年底前完成。这笔融资中约有180亿美元将会投入到OpenAI的“星际之门”项目中,打造美国本土的AI数据中心网络。 目前,OpenAI的实际控制权仍掌控在其非营利实体手中,控制权转移计划尚未完成,这影响了OpenAI进一步融资和盈利的能力,也带来了一定的法律风险。 融资协议显示,OpenAI计划将公司转变为共益企业(PBC)模式,从而兼顾盈利与公共利益。若OpenAI在年底前未能完成转型,软银有权将投资总额缩减至200亿美元。 据CNBC援引PitchBook数据称,OpenAI本轮融资之前最大的私营科技企业私募交易是蚂蚁集团在2018年完成的140亿美元融资,之后是Juul Labs在2018年的128亿美元融资,以及2019年滴滴全球的108亿美元融资,Databricks在2024年12月的100亿美元融资,以及OpenAI在2023年的100亿美元融资。 这笔融资使OpenAI成为全球最具价值的私营企业之一,与火箭公司SpaceX(估值3500亿美元)及字节跳动(4000亿美元)等并列。 就在官宣新融资的同一天,OpenAI还宣布将会在未来数月内发布一款开放权重的大语言模型,这是自2019年OpenAI开源GPT-2以来,他们的第一款开源模型。 在正式开源之前,OpenAI会在美国、欧洲、亚洲等地举办开发者活动并收集反馈,之后发布原型模型。 OpenAI还在今天向所有免费用户开放了近期爆火的ChatGPT图像生成功能,这项功能原本仅有付费用户才能使用。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。