行业分类:
加载中...
头条分类:
加载中...
小米“跳级”
“改变,任何时候都不晚”,在今年度的演讲中,雷军以这句话总结了公司五年的转型历程。 从2020年深陷“缺乏核心技术”的质疑,到如今凭借自研芯片玄戒O1、征战纽北赛道的汽车,小米试图彻底摆脱“组装厂”标签,向科技企业转型。 2020年,尽管小米已跻身世界500强,年营收突破2000亿元,但雷军坦言当时内心充满焦虑:行业竞争激烈,团队疲惫,外部质疑声不断。经过半年深度复盘,小米决定向科技公司转型,并启动造车与造芯两大高投入业务。雷军将这一决策形容为“同时供家里两个孩子上大学”,甚至押上公司前十年的积累。 五年深耕终见成效。玄戒芯片搭载小米15S Pro上市之后,小米高端系列手机持续摸高,根据canalys数据,2025年一季度全球高端手机出货量中,荣耀跌出前五,小米以81%增速首次挤进前五。 不过,小米的野心远未止步,其试图在高端化战略中更进一步——取代苹果,自己坐在牌桌的最中心位置。 iPhone 17发布五天后,雷军公开宣战,“小米17将全面迎战iPhone。”小米总裁卢伟冰也强调,从五年前对标学习到今日正面竞争,小米已具备与苹果直接抗衡的勇气。 这次秋季发布会,小米一口气推出了手机、平板、家电等多个新品,其中手机数字旗舰被雷军称为“小米史上最大的战略变革”。 小米17 Pro背屏创新,是本次产品中最大的亮点。正面手机,背面玩游戏,背屏支持个性壁纸、AI壁纸、动态通知、便利贴和大头贴模式等多种功能,手机背屏不再是单调的装饰,而是真正实用的交互界面。 电池续航方面,也是小米在技术突破上的重点。标准版小米17搭载7000mAh小米金沙江电池,采用16%硅含量技术,续航能力直接拉满。并且在售价上,小米延续了品牌一贯的性价比优势。4499元的起售价,在兼顾价格的同时,也能推动小米手机持续向上突破高端市场。 无论是背屏创新,还是电池续航的突破,技术突破的背后是小米过去五年投入超1000亿研发、体系化创新能力的积累。这些真金白银的投入,成为雷军想要挤掉库克C位的底气。 A 2025年秋季发布会上,小米17系列首次以“标准版、Pro、Pro Max”三杯矩阵精准对齐苹果iPhone 17系列,从学习到对标,是小米认为自身体系化创新能力已经到了可以与苹果分庭抗礼的阶段。 早在15天前,苹果也推出了号称近五年来更新幅度最大的iPhone 17系列。新机全系标配120Hz高刷新率屏幕,大幅提升内存容量与电池续航,引入VC均热板散热系统,并重点优化了信号连接能力。在性能层面,iPhone 17系列全线搭载A19芯片,并首次展示自研的C1X与N1协处理器。 iPhone 17系列的表现,被成为苹果史上最全面的堆料。挤爆牙膏的苹果,也被外界认为是其竞争策略的关键转折,其核心目的并非追赶或模仿,而是系统性封堵自身短板。 过去几年,苹果常被批评不够创新,往往会采纳并优化市场上已被证明受欢迎的技术。比如此次标配的高刷功能,早已是安卓旗舰五年前的标准配置,这符合库克所说的“不抢最先,只做最好最稳”的策略。 然而这种安卓厂商先行试错,让苹果在降低风险的同时,也被外界贴上“创新乏力”的标签。 苹果发布会当天,作为竞争对手的小米总裁卢伟冰在社交平台大方称赞“设计非常惊艳”,五天后,转头就向苹果下挑战书。雷军也在社交平台称,小米17系列全面对标iPhone,并正面迎战。 宣战的口吻里,没有对竞争对手的恐惧,只有兴奋。 今年二季度,在竞争激烈的4000-5000元价位段,小米以24.7%的市场占有率高居中国大陆市场首位,同比提升4.5%。在5000-6000元价位段,市占率达到15.4%,同比大幅提升6.5%。 纵观手机发展史,智能手机时代从屏幕革命开始,每一次屏幕革命都能带来更进一步的交互创新。2007年,初代iPhone以多点触控屏颠覆实体键盘;2013年,三星曲面屏开启形态探索;2019年,折叠屏尝试换道超车。 然而,除了初代iPhone的突破性创新外,苹果在后续的曲面屏、折叠屏等屏幕形态革新中均保持观望。正是苹果在创新路径的“傲慢”,给了小米突破的机会。到了2025年,小米在安卓机市场中领跑,做出了背屏创新,在交互体验上又创造了新玩法。从交互体验上来看,小米又领先苹果一程。 过去两年,小米手机均价已经从2023年Q3的997元升至2025年Q1的1211元,涨幅达12.2%;高端机型销量占比提升至35%。全球高端市场也有所突破,在58个国家智能手机出货量前三。 B “高端化是小米的生死之战”,在小米17系列发布会上,雷军回顾了过去五年的艰难探索。自2020年启动高端战略以来,小米累计研发投入超过1000亿元,最终在小米17系列上实现了从芯片、屏幕到影像系统的全面突破。 今年第二季度,小米单季度的研发投入高达78亿元,创下历史新高,同比增长41.2%。而研发投入主要聚焦在“芯片、OS、AI”三大技术支柱上。 为了向上突破芯片,小米还制定了大芯片业务,并计划“十年投资500亿”。截至2025年4月,玄戒累计研发投入已超135亿元,研发团队规模超过2500人。 本次发售小米17搭载的玄戒O1,就是小米在松果初代造芯失败后重启的造芯业务,今年5月,小米成功发布首款3nm旗舰SoC“玄戒O1”及手表芯片“玄戒T1”,成为中国大陆首家、全球第四家具备3nm旗舰SoC自主研发设计能力的企业,填补了中国大陆在3nm先进制程芯片设计领域的空白。 雷军也袒露过去在研发投入上的承受的压力,造车和重启造芯,几乎是同时做的决策,把小米前十年攒下的家底全押上了。“说实话,同时供家里两个孩子上大学,压力巨大。” 这种压力也逐渐转化为成果。 搭载玄戒O1的高端产品,如小米15S Pro、小米Pad 7 Ultra和小米Pad 7S Pro,在市场上也取得了一定反响,其中小米15S Pro在电商平台迅速售罄,市场对小米自研芯片也用行动进行投票。 市场调研机构CounterPoint Research的最新报告显示,虽然苹果的市场占有率仍为第一,但是2025年上半年小米在高端手机市场同比增速达55%,远高于苹果的3%。 除了芯片的助力之外,澎湃OS构建跨端互联,AI大模型技术突破端侧部署,两者全面赋能“人车家全生态”战略,这些基础技术的突破,也为小米系列产品的创新奠定了基础。 以小米17 Pro为例,表面上看技术突破围绕着背屏相关,实际上在屏幕背后,影像和续航方面,小米也有所重构。 卢伟冰透露,背屏的研发投入超过10亿元,仅这块屏幕就做了单独设计、开屏和研发。为了支撑背屏的交互体验,小米影像系统上搭载2亿像素潜望式长焦镜头,在背屏页面的操作下,也能自拍出高画质的照片。 为了解决两块屏幕的耗电问题,小米在续航方面也作出了创新,小米17系列全线配备7000mAh超大电池,支持120W秒充技术,从根本上解决了双屏待机的续航痛点。 站在18年手机创新史的视角下,小米此次对背屏交互的探索,其意义不仅在于一个新颖的功能,而挑战了智能手机交互形态下长期停滞的现状,为行业寻找下一个可能性。 C 2020年,站在十周年节点的小米陷入了一场深刻的战略反思。面对“下一个十年去向何处”的拷问,雷军最终明确了路径,大规模投入底层核心技术,从互联网公司转向硬核科技企业。 此后五年,小米研发投入从2020年的93亿元增至2024年的241亿元,2025年预计将达300亿元,研发团队规模从1万人扩张至2.26万人,实现翻倍增长。这场转型带来了根本性变化。截至2025年上半年,小米研发投入累计超1000亿元,并计划未来五年再投入2000亿元。 五年前,小米确立了“技术为本”的铁律,将发展路径从互联网公司转向硬核科技企业,这一转变带来了公司战略的全面升级。2023年,小米宣布从“手机×AIoT”升级为“人车家全生态”战略。 这一转变标志着小米从产品思维跃迁至场景思维。此前“手机×AIoT”虽连接设备,但仍以手机为中心。而“人车家全生态”通过澎湃OS实现200多个品类、超10亿设备的无缝协同,这种打破硬件界限的交互,让技术真正围绕人的需求流动。 为支撑这一战略,小米在组织架构上进行了大幅调整。12个高管团队中,只有3位是原有成员,其余9位均为引进的汽车和芯片领域专业人才,包括总裁卢伟冰在内的新领导团队带来了全新的技术视野。 可以说汽车突围,也是小米在高端市场的关键拼图。2021年3月,雷军宣布小米集团将成立一家全资子公司负责智能电动汽车业务,首期投资100亿元人民币,预计未来10年投资额100亿美元。 事实上,小米SU7 Ultra在立项后曾一度被砍掉,但团队在21天连续会议后咬牙重启,只因高端化是小米的生死之战,是小米必须突破的难关,最终实现小米SU7 Ultra位列今年50万以上轿车销量第一,相当于在50万以上豪华市场,每卖出三辆纯电车,就有一辆小米SU7 Ultra。 雷军透露,小米SU7的用户有超过50%来自豪华品牌车主,56%的小米SU7车主同时是苹果手机用户。这表明小米已突破“性价比”标签,在高端市场建立认知。 小米的创新成果不仅体现在单一产品上,更表现在生态协同效应上。 2025年第一季度,小米将造车与造芯并行为核心战略,押上前十年积累的家底,催生了玄戒3nm芯片、小米汽车等成果。 AIOT大家电业务也在国内迎来增长。2025年第二季度,小米智能大家电的收入创历史新高,同比增长达66.2%。其中,空调产品出货量同比增速超过60%,冰箱产品出货量同比增速超过25%,洗衣机产品出货量同比增速超过45%。 手机、芯片、汽车、家电等业务在小米持续井喷,除了顺应市场消费需求之外,还得益于“人车家全生态”给集团业务带来的反哺。 比如购买小米汽车的用户中,有很大比例会同步购买小米手机、智能家电等产品,形成“全家桶”式消费。汽车业务成功吸引大量豪华品牌车主和苹果手机用户,彻底扭转小米“性价比”的固有认知。 这些创新产品的集中涌现,体现了小米在核心技术上的积累已进入收获期。截至2024年末,小米AIoT平台已连接的IoT设备数首次超9亿,拥有五件及以上连接至AIoT平台的用户数超1830万。 纵观全局视角,小米17系列的发布,是小米高端化战略进入了一个承前启后的关键节点。它既是对过去五年“硬核研发”的总结,也清晰地勾勒出未来发展的轮廓。小米已不再依赖单一爆款产品,而是通过芯片、汽车、OS等底层技术的协同,构建可持续的创新飞轮。
滴滴公测AI出行助手与MCP服务,打车逻辑迎变革
凤凰网科技讯(作者/于雷)9月26日 滴滴出行今日正式开启其AI出行助手“小滴”的公开测试,版本号为Beta v0.8,此举标志着传统的“先选车型,再定目的地”的打车模式正迎来新的变革。用户现在可以通过自然语言直接下达复杂的出行指令,由AI来完成车辆的匹配与调度。 据了解,用户将滴滴App升级至最新版后,通过特定入口即可体验。与传统网约车流程不同,这项新功能的核心在于“先说需求,后匹配车辆”。用户无需再从快车、专车或特惠等众多分类中预先做出选择,而是可以直接通过语音或文字输入个性化需求,例如“明天早上送家人去机场,需要一辆空间大、服务好的新车”,或者“送老人去医院,希望司机开得稳,车内要宽敞”。 接收到指令后,AI出行助手“小滴”会智能解析用户的核心诉求,结合当前的时间、路况等动态信息,从滴滴的运力池中筛选并整合出最多3个最符合条件的出行方案,供用户最终确认。滴滴方面建议,在测试期间,用户可以尝试提出更细致的要求,如“希望车内安静”、“偏好新能源车”或“寻找更经济实惠的选项”,描述越具体,AI匹配的精准度就越高,同时也能帮助该功能进行更快速的迭代学习。 除了核心的个性化叫车功能,该助手还整合了多种场景化服务。它能够根据天气预报辅助用户在雨天提前预约车辆,或在用户需要赶飞机时,结合路况规划出发时间并推荐便于放置行李的车型。此外,订单查询、智能客服等基础功能也已集成其中。 值得注意的是,伴随此次公测,滴滴还同步上线了MCP(Machine Co-pilot Platform)服务。这项服务主要面向AI开发者,通过简单的配置,开发者便能将滴滴的出行能力快速集成到自己开发的智能体(Agent)中,使其具备自主规划行程、实时叫车、查询订单乃至自动支付的能力。此举旨在鼓励开发者基于滴滴的核心出行能力,探索和构建更多元化的AI应用场景。 目前,滴滴的MCP服务已支持呼叫特快、特惠快车、快车、优享、专车和豪华车等多种车型。滴滴方面表示,未来将在确保安全的前提下,持续探索技术开放的可能性,与开发者共同建设一个开放的AI生态。
Lessie,会让猎头失业吗?
原标题:找人不求人?Lessie 让“人脉玄学”变成算法游戏 作者|Moonshot 编辑|靖宇 过去,找人是一门玄学:无论是要找投资人、找行业专家,还是要找一位契合的 KOL,传统方法都仰赖人脉引荐、行业微信群,或是在 LinkedIn 里大浪淘沙。 找到人,再搭上话,这是敲开合作的大门的第一步,往往也是最困难的一步。 电影《天下无贼》的经典台词|图源:douban 但一款名为 Lessie 的 AI Agent,正试图把这种「玄学」变成标准化流程。 Lessie 的定位简单直接:People Search AI Agent。一句话描述它的能力:帮你从互联网与数据库里快速找到任何人,并自动化完成初步联络。 创始人、投资人、KOL、潜在客户、行业专家、合作伙伴……只要你能用自然语言描述需求,Lessie 就能迅速在全球范围内挖掘到合适的人选。 实际体验之后,我发现「人找人」的需求,AI 虽然可以显著提高效率,但短期还得靠人来介入校验,没那么容易被 AI 取代。 01 AI LinkedIn? 与传统的 SaaS 网站或单一数据库不同,Lessie 的目标并不是做一个更快的搜索引擎,而是把「找人」做成一条闭环的服务:识别需求(Identify)、汇总多源数据(Source)、智能筛选(Review)、建立初步联络(Connect)。这四步,构成了 Lessie 的基本逻辑。 Lessie 的找人流程分了 4 步走|图片来源:Lessie 第一次用 Lessie,我就被它的专业程度和理解力惊到了。 我写一句模糊的需求,例如「帮我找此前报道过 AI 初创公司,在主流科技媒体工作的技术记者。」Lessie 会立刻像个专业 HR 一样去进一步精确需求,比如「在哪些知名科技媒体平台」、「发表过几篇报道」、「个人档案中侧重方向」、「平均文章阅读量」等等数据。 我可以随时修改并添加新的需求,比如把平均阅读量改成「10 万+」。 公司找能写「10 万+」的媒体老师更简单了!|图片来源:极客公园 十分钟后,Lessie 就表示成功找到了一些符合需求的作者,并且罗列出了每个人供职媒体、职位、和可以直接跳转的 LinkedIn 主页。 列表带着 LinkedIn 链接|图片来源:极客公园 而后我再次添加新需求:「请筛选出发表过长文报道的记者。」Lessie 会再次理解所有需求,重新再筛选一遍。 筛选结果也还算令人满意,15 个候选人都来源于 The Verge、Wired 等知名科技媒体,或《纽约时报》、《华盛顿邮报》科技专栏的作者,基本符合我的要求。 不过,「重新筛选」的等待时间比较漫长(约 30 分钟,团队告诉极客公园如果是非排队情况下,能做到 15 分钟级别,且还会持续优化),但相比过去一边刷新 LinkedIn、一边靠关键字碰运气的漫长搜寻,这种效率已是降维打击。 我又换了个领域继续测试 Lessie,这次是偏专业向的要求「寻找全球范围内,擅长稀有金属回收的科研人员或实验室负责人,需有近两年发表论文或申请专利。」 这一次,Lessie 对任务的理解和筛选精度更高,处理需求的全过程也很清晰:先了解该领域的最新研究趋势和关键技术,再找到研究机构和科研人员信息,再匹配用户需求。 多轮筛选后剩下的老师们|图片来源:极客公园 最终,Lessie 成功帮我找到 7 位候选人,并且给出了公司、职位、邮件、所在地等具体信息。 在找到人后,Lessie 可以自动生成联络邮件,每一封发送出的邮件会根据不同联系人的名称、职位、公司名称进行调整。你可以调整邮件文风,或是附上自己的背景介绍。 此前,我能想到的找人方法,得 Google 最新的领域论文找到作者,再去翻大学或研究机构的网页,找邮箱发邮件,找到一个候选人都得半个小时。 显然,Lessie 这种一口气找多名候选者,再群发邮件的方式,确实大幅提升了效率。 搜索 Shopify 上的电商人才|图片来源:极客公园 而后我又拿出一个小众需求考验它:请帮我找在东欧地区经营跨境电商、主营宠物用品的企业主或运营负责人,要求在 Shopify 上年销售额至少 100 万美元。 需求足够精准,也足以测试 Lessie 跨行业、跨地域、同时调取不同平台数据的搜索能力。 最终 Lessie 给我筛选出了 15 位候选人,的确都是在东欧地区做宠物用品跨境电商企业的 CEO 或 COO,公司销售额也都在百万美元以上。 跨行业、跨领域、跨平台,从模糊到具体,从大众到专业,Lessie 似乎已经靠 AI,攻克了「满世界找人」这一大痛点? 然而,找得到,不代表找得准,当我在更广、更深维度地使用 Lessie 时,它的边界逐渐显露。 02 AI 找人,仍需人工验证 不过,Lessie 给出的候选人名单,并不是所有人都经得起人工查验。 上文曾惊艳到我的「擅长稀有金属回收的研究员」项目里,我点进一个候选人的 Linkedin 主页,其主页极其干净,只有「某国家实验室,资深研究科学家」一句话介绍。 此位专家非我们想要寻找的专家|图片来源:极客公园 把名字输入 Google,我发现这位大牛从 1990 年起就在 ORNL(美国能源部下属的国家实验室)担任研究员,有近百篇期刊文章,研究履历足足十页。 正当我惊讶于 Lessie 对人才深度的发掘能力时,细看履历才发现,这位是研究水生生态和渔业生物学的专家,和稀有金属的关系,只是研究稀有金属排放对鱼类健康的影响。看起来在某些小众的专业领域,AI 的幻觉还存在优化空间。 我又给 Lessie 一个「找网红合作」的找人需求, 让它去找「欧美地区,在 TikTok 或 YouTube 做短视频内容的宠物类博主,粉丝至少 20 万」,Lessie 如期给出答案,随机点进几个主页,画像也基本符合预期。作为过去在网红营销领域深耕的团队,在网红的数据领域上,确实做得还不错。 欧美宠物博主检索任务|图片来源:极客公园 随后我又把搜索范围改到了东南亚,但这次结果有些变化。第一轮搜索后,Lessie 只为我找到了一位生活流博主,内容和宠物关系不大。 重新跑了一轮后,给出的 18 个候选人中,大概能选出 6 位合格者。 东南亚范围内,找到博主属于生活流,并非单纯专业宠物博主|图片来源:极客公园 通过这个尝试,我发现在东南亚地区的 case 领域,Lessie 很难一次筛出同时符合多个条件的创作者。后续根据 Lessie 产品经理反馈,目前东南亚的数据还没有开始大规模的训练,以及一些小语种的问题,模型存在幻觉,因此还没有那么准确。 综合这些体验,Lessie 的优缺点已经很鲜明。 它能做到逻辑清晰的搜索流程、对需求的快速理解、多源数据库的广度,以及自动化外联的便利。尤其是对于跨境电商、B2B 拓展、专业猎头等典型海外场景,它的效率确实可以让找人的成本骤降。 但它的短板同样明显:在一些小语言的地区。多条件匹配上容易出现稳定性的问题,模型在一些小众场景还存在幻觉,在这些场景里,还需要前期人工校验。 从更大的视角看,Lessie 的核心想法是值得肯定的。它代表了一类新的 AI Agent 产品:把以往高度依赖人力的找人,转化为可以复制、可量化的数据。 Lessie 给我的感觉,像是一册被赋予智能的「现代电话簿」,它确实把我们从翻查电话本的年代,带进了一个可以用自然语言就能「触达全世界人才」的 AI 时代。 正如 Lessie 产品经理提到的,Lessie 覆盖的核心是更广泛的「商业关系找人」需求,它能帮创始人找潜在客户、帮市场团队找高匹配度的 KOL、帮产品经理找外部专家做深度访谈,帮 BD 找合作伙伴、帮投资人找下一轮被投项目的创始人。在这些场景下,Lessie 的价值不仅是节省搜索时间,而是把过去依赖人脉的「关系撮合」变成可量化、可复制的流程,让团队能在几分钟内找到对的人,并完成第一步接触。 但找人这件事,不只是信息的罗列。Lessie 可能是一个高效的入口,一个起点,但目前看起来,人找人这件事,完全「去人化」依然很难,这既是它的局限,也是它的魅力。想要做好人与人的链接,必须要在各个领域都积累起专业的数据,然后让模型降低幻觉。这点对于 Lessie AI 来讲,即是挑战,也是赋予它未来做出差异化的机会。 不过,对于当下「增长和营销」需求日益高涨的国内外公司来说,Lessie 不失为一个量大管饱的工具,能在第一时间帮助创业者,发现相对靠谱的人才和通路,这也是 Lessie 团队目前主攻的方向。
纽约时报:中国机器人数量比世界其他地区总和还多
There Are More Robots Working in China Than the Rest of the World Combined 中国已开始在工厂中推广使用更多机器人,以改变制造业并成为主导制造商。 中国合肥的一条汽车装配线上,机器人正在工作。中国的机器人公司,例如电动汽车和人工智能行业,都受益于国家对增长的推动。纽约时报 2025年9月25日 中国制造和安装工厂机器人的速度远远超过其他任何国家,美国位居第三,这进一步加强了中国在全球制造业中已经占据的主导地位。 国际机器人联合会(International Federation of Robotics)周四发布的一份报告显示,去年中国工厂共安装了超过200万台机器人。该联合会是一个面向工业机器人制造商的非营利性行业组织。报告发现,中国工厂去年安装了近30万台新机器人,超过了世界其他地区的总和。而美国工厂安装了3.4万台。 中国工厂不仅使用越来越多的机器人,而且制造机器人的技术也得到了提升。政府利用公共资金和政策指令,推动中国企业成为机器人以及半导体和人工智能等其他先进技术领域的领导者。 在全球范围内,机器人和人工智能在制造业中扮演着日益重要且具有颠覆性的角色。工厂机器人种类繁多,从焊接汽车零部件的机器,到将箱子抬到传送带上的机械爪。随着科技帮助工厂提高效率,一些工厂正在减少工人数量,并改变其他工厂的角色。 工业机器人年安装量 来源:国际机器人联合会 过去十年来,中国开展了一场广泛的运动,致力于在工厂中使用更多机器人,成为机器人的主要制造国,并将该行业与人工智能的进步结合起来。 科技研究公司 Omdia 的首席分析师苏连杰表示,中国企业受益于国家的推动,这与中国电动汽车和人工智能产业的发展相呼应。 “这不是巧合,”苏先生说。“这是中国企业多年投资的结果。” 中国大力推进工厂自动化,是其成为世界制造业强国的关键因素。自2017年以来,中国工厂每年安装超过15万台机器人。与此同时,制造业产出也大幅增长。截至今年年初,中国工厂生产的制成品占全球总量的近三分之一,超过了美国、德国、日本、韩国和英国的总和。 与前一年相比,去年工厂机器人使用量排名仅次于中国的前四个国家(日本、美国、韩国和德国)的机器人安装量均有所下降。其中,日本安装了4.4万台机器人。 2015年,中国政府将提高机器人领域的全球竞争力作为“中国制造2025”计划的首要任务,旨在减少先进制成品的进口。 “你可以看到这个战略的效果有多好;没有战略,一个国家总是处于劣势,”机器人联合会秘书长苏珊娜·比勒说。 据该联合会称,中国在全球机器人制造领域的份额去年上升至全球供应量的三分之一,高于2023年的四分之一。此前处于领先地位的日本的市场份额从前一年的38%下降至29%。 直到去年,中国工厂安装的进口机器人数量还多于国产机器人数量。但去年,中国安装的近五分之三的机器人也是国产的。 总体而言,中国工厂中机器人的数量是美国的五倍。 Robotic carts at the Zeekr auto plant in Ningbo, China, haul heavy loads around the building. Qilai Shen for The New York Times 该联合会的数据不包括人形机器人,这种两足机器人目前主要仍处于实验阶段。但政府的支持已带动了人形机器人初创企业的蓬勃发展,并催生了一个生产机器人专用部件(如电动关节)的公司生态系统。 总部位于科技热点城市杭州的人形机器人初创公司宇树机器人(Unitree Robotics)本月早些时候宣布,计划于今年年底上市。宇树最新的基础型人形机器人在中国的售价约为6000美元,仅为美国机器人制造商波士顿动力(Boston Dynamics)产品价格的一小部分。波士顿动力是美国机器人行业的领先企业。 不过,Omdia 的苏先生表示,中国企业在制造人形机器人的一些关键部件(包括一些传感器和半导体)的能力方面落后于外国竞争对手。 他说,许多零部件的顶级版本仍然由德国和日本等在机器人制造业长期领先的国家生产。 “如果要组装一个真正顶尖的人形机器人,它几乎完全不是中国制造的,”苏先生说。“也许会有一两个中国制造的零部件,但总的来说,整个系统会非常国际化。” 但在工厂机器人方面,中国拥有多重优势。中国拥有大量能够安装机器人的熟练电工和专业计算机程序员。然而,即使是中国也存在机器人安装专家的短缺,其年薪飙升至近6万美元。 中国的人工智能产业非常注重利用新技术来跟踪和改善工厂设备性能的各个方面。 上海专注于自动化领域的供应链顾问卡梅伦·约翰逊表示,中国企业“正在利用人工智能来判断哪些机器运行良好,哪些机器略有偏差”。他还补充道,在中国以外,“人们还没有将其视为一种制造工具,至少目前还没有,而且不像中国人那样。” 本文作者:梅根·托宾 (Meaghan Tobin)驻中国台北,主要报道亚洲商业和科技新闻,重点关注中国。 基思·布拉德舍尔(Keith Bradsher)是《纽约时报》驻北京分社社长。此前,他曾担任《纽约时报》驻上海、香港和底特律分社社长,并担任驻华盛顿记者。疫情期间,他一直在中国大陆生活和报道。 本文印刷版刊登于2025年9月26日《纽约时报》B版第1页,标题为:中国机器人数量超过世界其他地区. 本文出处:https://www.nytimes.com/2025/09/25/business/china-factory-robots.html
摩尔线程顺利过会,“国产GPU第一股”即将诞生
已融资上百亿,股权遭机构疯抢。 文丨直通IPO  作者丨邵延港 9月26日,国产GPU创业公司摩尔线程通过上交所审核,迈过冲刺科创板上市的关键一步,继续冲刺“国产GPU第一股”。 据悉,摩尔线程科创板IPO申请于2025年6月30日获受理,期间完成两轮问询。自受理至顺利过会,摩尔线程的IPO闯关路还不到3个月。此次IPO,摩尔线程凭着80亿元的募资计划,拿下科创板今年在审最大IPO。 来源:上交所官网截图 摩尔线程创立于2020年,专注于全功能GPU芯片设计。公司创始人张建中,曾在英伟达工作了14年,他最后的职位是英伟达全球副总裁、大中华区总经理。在英伟达期间,张建中将英伟达在中国的市场份额从2008年的不足50%提升至2020年的超80%。 张建中凭借在英伟达十余年积累的人脉,挖来了英伟达、英特尔、AMD、微软等巨头的核心工程师,组建一支让投资人心动的创业团队。 据摩尔线程招股书显示,在IPO申请之前,摩尔线程背后就已经站着红杉资本、小马智行、国盛资本、纪源资本、腾讯、联想、海松资本、策源电子基金、洪泰基金、五源资本、策源资本和谐健康、厚雪资本等数十家知名投资机构,融资金额超百亿元。 按照摩尔线程最后一轮融资情况,52.25亿元对应的7002.8217 万股股份,摩尔线程的投后估值为298.45亿元。在胡润研究院发布的《2025全球独角兽榜》中,摩尔线程的估值为310亿元。 尤其是在摩尔线程的最后一轮股权变动中,摩尔线程未增发新股,不少机构只能高价向原有股东收购老股。据摩尔线程问询函回复,2025年1月至2月,厚雪资本、深创投、青岛图灵、久奕投资、温州科信等机构的入股价格已经到了新的高度。 资本的疯狂涌入,导致股权结构上,摩尔线程无单一持股 30%以上的股东,不存在控股股东;张建中直接持股11.06%,同时通过一致行动人协议和员工持股平台,合计控制摩尔线程36.36%的股份,为实际控制人。 作为国产GPU创业公司,市场对其抱有极高期待。在摩尔线程上会前,二级市场中投资了摩尔线程的上市公司早已对外宣称投资事宜,公司股价出现一定的涨幅。 与此同时,沐曦、燧原科技、壁仞科技等GPU初创企业也早已踏上IPO征程,随着摩尔线程上市审核通过,这家创立仅5年的国产GPU公司或将率先登陆资本市场。 (首图来源:摩尔线程)
硬件业务四年亏损近5000亿,扎克伯格哪来的底气挑战苹果?
扎克伯格佩戴Meta智能眼镜 凤凰网科技讯 北京时间9月26日,据《华尔街日报》报道,硅谷流行一句话:做硬件不易。对脸书母公司Meta来说,硬件不仅难做,还超级烧钱。 过去四年里,Meta的硬件部门“现实实验室”累计经营亏损略高于680亿美元(约合4852亿元人民币)。而且,这还只是投资者知道的数字。毕竟,Meta直到2021年才开始披露这块以硬件为核心的业务的财务情况。早在2014年,它就以20亿美元收购了虚拟现实设备制造商Oculus。 该业务虽然推出过几款小有成绩的产品,但远不足以扭转亏损。根据研究公司韩国IDC的数据,过去四个季度,Meta大约出货了280万副雷朋Ray-Ban智能眼镜。这个数据还算不错,但也只相当于同期苹果利润丰厚的iPhone出货量的约1%。Meta上周发布的新款智能眼镜恐怕也难以力挽狂澜。分析师预计,现实实验室部门今年的运营亏损将接近200亿美元。 AI时代的机遇 但是,Meta正在下一盘大棋,而且目标极其宏大。该公司显然认为,在AI时代,苹果在消费级设备上的主导地位并非牢不可破。Meta CEO马克·扎克伯格(Mark Zuckerberg)认为,智能眼镜对于他所描绘的“超级智能”愿景至关重要。“超级智能”指的是超越人类智慧的AI。 不过,该公司还未实现这一目标。但AI正在提升智能眼镜的功能,这类产品最初基本只是安装在面部的相机。Meta最新推出的Ray-Ban Display智能眼镜增加了实时字幕等功能,可在嘈杂环境中显示对话者的语音转文本内容。从理论上讲,由更强大AI模型驱动的未来智能眼镜或将实现全情境感知,例如当用户注视未组装的家具时,能立即获得逐步组装指导。 “我们设计眼镜的初衷,就是让人们在新技术成熟时能第一时间获得新功能。”扎克伯格在上周发布新智能眼镜时表示。 Meta眼镜要比苹果Vision Pro便宜得多 换句话说,Meta的眼镜走在了时代的前面。新款Ray-Ban Display能够将数据直接投射到镜片上,并配备创新腕带实现手势操控。新眼镜引发了广泛关注,尤其是其799美元的起售价,远低于苹果Vision Pro头显的3500美元。但是,扎克伯格现场演示的翻车表明,Meta的眼镜可能仍需进一步打磨。 大胆投入 不过,鉴于该公司在AI上的巨额投入,扎克伯格积极探索用户与AI交互的新方式是正确之举。智能手机和个人电脑目前是接触AI的主要入口,但随着该技术催生出不适用于这些设备的新功能,这种局面可能改变。Meta并不是唯一一家在这一方向上探索的公司。OpenAI已经通过收购团队的方式与前苹果著名设计师乔纳森·艾维(Jonathan Ive)合作,打造一系列“AI伴侣”。该公司将这些AI伴侣描述为继PC和智能手机之后的“第三大核心设备”。 Meta年研发投入超苹果 这些硬件领域的后起之秀看起来处于劣势,毕竟苹果拥有数十年设计精良、利润丰厚的硬件产品经验。但Meta也有自身优势,其中之一就是能够把产品推向其庞大的日活用户群,规模接近35亿人。此外,Meta核心广告业务带来的丰厚利润也能支撑大量投入。截止到6月的12个月里,Meta的整体营业利润率为44%,比同期苹果高出12个百分点,尽管其现实实验室部门亏损严重。 在扎克伯格的热忱及其投票权对公司的绝对掌控下,Meta向AI的转型也显得更为大胆。Meta在研发和资本支出上的投入远超规模更大的苹果,并拥有更多核心AI技术,例如Llama系列大语言模型。 摩根士丹利分析师布莱恩·诺瓦克(Brian Nowak)指出,Meta新款智能眼镜彰显了该公司在构建AI平台方面进行“全栈式布局”的重要性。他在写给客户的报告中补充称,Meta“领先的自主硬件、AI原生集成和独特数据集,是把握这一巨大机遇的关键差异化优势”。 Meta推出的“面部计算机”,或许最终会成为与AI天然契合的产品。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
一加全新一代“风驰游戏内核”开启 李杰:推动手游进入165帧时代
凤凰网科技讯 9月26日,一加游戏大会2025在北京举行。一加中国区总裁李杰宣布,一加将引领手机行业迈入165超高帧时代,带来最强165帧游戏首发阵容,与《三角洲行动》、《英雄联盟手游》、《王者荣耀》、《和平精英》等多家手游共同布局165超高帧游戏生态,推动手机游戏体验“大换代”。同时,一加15还将首发搭载独家自研芯片级游戏技术——全新一代“风驰游戏内核”,它与最新发布的第五代骁龙8至尊版旗舰平台底层联合,将以“Ultra”级的极致性能表现,为用户带来更低功耗、更高帧、更持久的游戏体验。 此前发布的“风驰游戏内核”与“电竞三芯”两大独家游戏黑科技,就为用户带来了极佳的流畅游戏体验。而基于第五代骁龙8至尊版旗舰平台的全新一代“风驰游戏内核”将更进一步,充分释放性能潜能,实现165超高帧持久满帧的极致体验。 一加全新一代“风驰游戏内核”首次协同调度CPU、GPU与NPU三大核心处理单元,在自研能量感知模型、智能复合队列、一体化融合调频三大技术的加持下,实现满血165帧全栈部署,并在能效管理、帧率稳定与画质表现三大维度实现全方位突破,实现芯片内核调度器效率优化29.8%,内核负载降低15.6%,整机功耗降低11.7%。全新一代“风驰游戏内核”还带来了1% Low帧, 在《王者荣耀》120帧模式下,可带来1% low帧119.5帧的极致体现。
刚刚,vivo祭出“灭霸”影像技术全家桶,全面硬刚苹果,X300系列首发
作者 | 云鹏 编辑 | 漠影 智东西9月26日报道,刚刚,vivo在影像技术沟通会上提前预告了即将在X300系列上落地的诸多影像技术创新,vivo X300系列核心在影像画质、极限场景、旅拍人像及视频创作四个方面进行了重点升级。 vivo X300 Pro搭载了独家全新蔡司2亿APO超级长焦,vivo与三星独家定制的蓝图×HPB传感器,有1/1.4英寸大底,其基于底层像素架构优化与结合VCS仿生光谱技术,信噪比表现出色。 这枚长焦支持硬件4倍无损光学直出,可在85mm焦段的镜头上实现340mm光学信号直出,据称已大幅超过现有行业标准。 光学方面,其采用了1G+5P浮动潜望镜组、萤石级FCD100低色散玻璃镜片与经典蔡司T*镀膜。vivo将模组防抖能力推向了CIPA 5.5级,曝光时长缩短为原来的二分之一,手持长焦拍摄稳定性与成片率更高。 算法层面,NICE 3.0光学重建引擎与MAGIC 2.0画质还原引擎,通过RAW域建模与亿级数据集纹理仿真,可以让20倍以上变焦拍摄成片率提升20%。vivo X300将这颗2亿蓝图×HPB旗舰级传感器用作主摄。 vivo专门针对演唱会场景进行了优化,针对舞台光线复杂、主体高速运动的痛点,新人像算法整合了零延时多帧与NICE 3.0光学重建引擎、MAGIC 2.0画质还原引擎以及GTR 3.0质感人像引擎,在昏暗环境下能精准捕捉舞台上的人脸细节,还原氛围感。 像素级摩尔纹三重剔除算法,可以解决拍摄大屏幕时的废片难题。 录拍双系统分时架构允许用户在录制4K视频时,通过独立影像通路拍下多帧融合照片,相较上代舞台模式分辨率提升355%,成片率提升35%。 针对赛事抓拍,vivo新设计了长焦抓拍系统架构,蓝图极限追焦引擎在自研X-Track追焦算法基础上,联合联发科定义了专为实时追焦服务的影像超能效NPU以及Imagiq实时对焦引擎。 软硬协同下,追焦稳定性提升200%,并能在480mm超长焦段进行每秒12张的高画质连拍。 人像摄影一直是vivo的重点。vivo联合联发科发布了行业独家“AI定制美颜”功能,依托vivo在AIGC上的技术积累和天玑9500端侧AI能力,系统能够学习用户的修图偏好,实现一键批量精修,将半小时工作量缩短至最快10秒。 蓝图影像芯片V3+与天玑9500 SoC,配合自研影像芯片 VS1,行业首发了4K 60fps电影人像视频,据称可在人像虚化、肤质呈现与光影层次上媲美专业电影。 动态人像方面,vivo改善了安卓端Live Photo普遍存在的封面与动态画质不一的痛点,首发了“Live Photo路人消除”功能,通过自研视频消除大模型,智能、自然地移除背景干扰。 专业视频方面,此次vivo全球首发了蓝图×索尼LYT-828传感器,支持“Hybrid Frame-HDR”等技术,动态范围100dB+,在夜景、逆光等场景下表现更好。 vivo与联发科双方从影调、色彩、曝光、功耗、流畅度等维度进行平台级联调,实现了多焦段满血版4K 120fps杜比视界HDR视频录制,安卓首发了4K 120fps双轨EIS防抖,支持拍摄4K 120fps 10bit Log,认证ACES工作流。 长达5小时43分钟的4K 60帧稳定录制能力,解决了专业创作者的“续航焦虑”。 结语:vivo死磕影像,底层自研技术突破成关键支撑 今天vivo在手机影像方面的迭代思路:不是单一维度的技术炫技,而是创作全流程,从照片、视频的拍摄到后期剪辑制作,形成完整闭环。影像从“军备竞赛”,变得更加注重实际的用户体验。 我们看到,从芯片到算法,vivo进行了诸多底层技术创新,在旗舰机影像大战愈发焦灼的今天,技术为王仍是硬道理,vivo X300系列即将于10月13日正式发布,届时vivo还会带来哪些惊喜,我们拭目以待。
谷歌掏出自家最强机器人大脑,一句话完成垃圾分类,关键技术解析来了
智东西 作者 | 陈骏达 编辑 | 云鹏 智东西9月26日报道,今天,谷歌DeepMind推出Gemini Robotics 1.5系列机器人模型,通过思维链机制和模型协作,进一步提升机器人的自主性,使其能够感知、计划、思考、使用工具和行动,以更好地解决复杂的多步骤任务。谷歌将其称之为把AI agents带入物理世界的重要一步。 谷歌DeepMind本次发布的两款模型分别为Gemini Robotics 1.5和Gemini Robotics-ER 1.5。前者是谷歌目前最强大的VLA(视觉-语言-动作)模型,能将视觉信息和文本指令转化为机器人的控制命令,主要充当机器人的小脑。这一模型在采取行动前会思考,并展示思考过程,还能在不同的机器人本体上进行学习,提升学习效率。 Gemini Robotics-ER 1.5则是谷歌迄今为止最强大的VLM模型(视觉语言模型),能对物理世界进行推理,更像是机器人的大脑。它原生具备调用数字工具并创建详细的多步骤计划,进而完成任务的能力。该模型在空间理解基准测试中实现了最先进的性能,具身推理能力远超GPT-5、Gemini 2.5 Flash等模型。 搭载上述两款新模型的机器人,也因此解锁了完成复杂长链路任务的能力。比如,你可以让机器人查询当地垃圾分类要求,将桌面上的物品放到正确的垃圾桶中。模型能准确理解这一复杂需求,并驱动机器人完成任务。 开发者可以通过Google AI Studio中的Gemini API使用Gemini Robotics-ER 1.5模型,而Gemini Robotics 1.5目前可供部分合作伙伴使用。谷歌还发布了Gemini Robotics 1.5系列模型的技术报告。 一、基于Gemini基础模型打造,训练数据来自3款机器人 对机器人而言,大多数日常任务都需要上下文信息和多个步骤才能完成,这对目前的机器人而言颇具挑战。为了帮助机器人完成复杂、多步骤的任务,谷歌DeepMind让Gemini Robotics 1.5和Gemini Robotics-ER 1.5两款模型在同一个Agent框架中协同工作。 具身推理模型Gemini Robotics-ER 1.5像大脑一样协调机器人的活动。该模型擅长在物理环境中进行规划和做出逻辑决策,也具有先进的空间理解能力,能以自然语言与用户进行交互,对任务是否成功和任务进展进行评判,并且可以调用谷歌搜索等工具来查找信息,或使用任何第三方用户定义的函数。 Gemini Robotics-ER 1.5为每个步骤提供自然语言指令,而Gemini Robotics 1.5利用其视觉和语言理解直接执行特定动作。Gemini Robotics 1.5还帮助机器人思考其行动,以更好地解决语义复杂的任务,甚至可以用自然语言解释其思维过程,使其决策更加透明。 这两个模型都建立在Gemini系列模型之上,这使得它们能够继承Gemini的多模态世界知识、先进推理以及工具使用的通用能力。之后,两款模型使用不同的数据集进行了微调,以专注于各自的角色。当它们结合起来时,可以提高机器人泛化到长任务和多样化的环境的能力。 Gemini Robotics 1.5系列模型共同使用的训练数据集由三种模态组成:图像、文本,以及机器人传感器与动作数据。 训练所用的机器人数据集是多本体(multi-embodiment)的,涵盖了数千个多样化任务,从抓取与操控,到双臂协作,再到人形机器人执行日常复杂任务。这些数据采集自多个异构机器人平台,包括ALOHA、Bi-arm Franka和Apollo人形机器人。 Gemini Robotics 1.5系列模型能开箱即用地完成跨本体任务 除了机器人专属数据集,训练数据中还包括来自互联网的公开文本、图像和视频数据集,使得模型不仅具备机器人相关技能,还能借助大规模世界知识提升泛化能力。 为了确保训练的高质量与安全性,所有数据在使用前必须经过严格处理。谷歌DeepMind通过多阶段筛选,确保数据遵循相关政策,去除低质量样本与不符合规范的内容。 数据集中每张图像都配备了原始描述与合成描述,这些合成描述由Gemini和FlexCap模型生成,帮助模型捕捉图像中的细节与上下文语义。 训练过程中使用了最新一代硬件,包括TPU v4、v5p与v6e,并结合JAX与ML Pathways框架,以实现高效并行训练与跨平台扩展。 二、靠动作迁移机制实现跨本体,让机器人学会“三思而后行” 作为一款VLA模型,Gemini Robotics 1.5的使命是“理解指令并将其转化为动作”。为了实现这一目标,研究者在训练中引入了一个关键机制——动作迁移(Motion Transfer, MT)。 MT的作用是打破不同机器人之间的“壁垒”。在传统方法中,如果一个机器人学会了某项技能,往往需要额外训练才能迁移到另一个机器人。 而在MT的加持下,Gemini Robotics 1.5能够在不同实体之间直接实现零样本迁移(Zero-shot Transfer)。也就是说,即便模型只在ALOHA机器人平台上学过“打开抽屉”,它也能在Apollo人形机器人上完成同样的任务。 这一能力来自于MT机制对动作与物理的统一建模,它能对齐不同平台的数据并提取其中的共性。 除此之外,Gemini Robotics 1.5还具备了具身思考(Embodied Thinking)的能力。它在执行动作之前,会生成一条以自然语言形式呈现的“思考轨迹”。这条轨迹帮助模型将复杂任务拆解为更细致的步骤。 例如,当接到“帮我收拾桌子”的指令时,模型可能会先在思考中分解为“拿起杯子”、“移动到水槽”、“放下杯子”等小步骤。这种方式不仅降低了从语言到动作的直接映射难度,也让模型在执行过程中更具鲁棒性。 如果杯子在移动过程中掉落,它会立刻调整思考轨迹,改为“重新拾起杯子”,而不是简单判定任务失败。 与Gemini Robotics 1.5不同,Gemini Robotics-ER 1.5并不直接操控机器人执行具体动作,而是专注于具身推理(Embodied Reasoning),负责高层次的任务规划与决策。 在训练中,Gemini Robotics-ER 1.5针对机器人任务所需的关键能力进行了特别优化。首先,它能够完成复杂的任务规划,把长远目标拆解成一系列合理的子任务。 其次,它具备较强的空间推理能力,可以结合视觉与时间信息,理解物体的相对位置与运动轨迹。最后,它还能够进行任务进度估计,实时判断任务是否成功、完成度如何,并据此调整后续动作。 Gemini Robotics-ER 1.5能完成的部分任务 Gemini Robotics-ER 1.5在15个学术具身推理基准测试中实现了最高的综合性能,超过Gemini Robotics-ER 1.0和GPT-5等模型。 它能够将语言描述准确地映射到视觉目标上,比如“指向桌子左下角的蓝色杯子”,或是基于多视角信息实时判断机器人动作是否达成目标,这对长序列任务的稳定执行至关重要。 在整个体系中,Gemini Robotics-ER 1.5的定位是编排器(Orchestrator)。它接收人类指令与环境反馈,制定总体计划,再将这些计划转化为Gemini Robotics 1.5能执行的具体动作指令。它还具备调用外部工具(如网络搜索)的能力,确保机器人在面对复杂场景时依旧能够灵活应对。 不过,具备更高自主性和执行能力的机器人,也可能带来安全风险。为此,谷歌DeepMind已经开发了新型的安全和对齐方法,包括顶层的安全判断机制和更为底层的安全子系统(如用于避免碰撞的系统)。 谷歌DeepMind还发布了机器人安全基准测试ASIMOV的升级版,这是一个用于评估和改进语义安全性的综合数据集,具有更好的边缘场景覆盖率、改进的注释、新的安全问题类型和新的视频模式。 在ASIMOV基准测试中,Gemini Robotics-ER 1.5显示出最先进的性能,其思维能力极大地有助于提高对语义安全的理解,更好地遵守物理安全约束。 结语:机器人模型跨本体化共识逐渐形成 与传统依赖单一数据和特定平台的训练方式不同,Gemini Robotics 1.5系列模型通过多本体数据、动作迁移机制,以及具身思考与推理范式,让机器人能够跨平台迁移技能,并在复杂环境中展现出类似人类的适应能力,扩展了机器人模型的通用性。 而这也成为不少厂商打造机器人模型的目标之一。日前,宇树开源的机器人世界大模型UnifoLM-WMA-0,虽采取了不同的架构,但也同样具备适配多种机器人本体的能力。跨本体化,或许已经逐渐成为行业的共识与新赛道。
卡位端侧AI爆发前夜,上海海思瞄准三大方向:场景智能、AI Agent、物理AI
智东西 作者 | 程茜 编辑 | 漠影 端侧AI迈入快车道,终端芯片厂商正在发力! 2025年8月,国务院印发《关于深入实施“人工智能+”行动的意见》,将“人工智能+”作为重点行动,推动AI从技术实验向行业实践转化,重点支持移动终端、穿戴设备、智能家居等八大类消费级AI终端创新。 可以看到,端侧模型部署已成为行业公认的技术趋势,曾经依赖云端的智能服务,如今伴随着模型压缩、推理加速技术等发展正加速向终端设备迁移,再到当下端侧设备的多模态融合、端云协同发展,使其成为千亿设备智能化变革的核心驱动力。 如今,端侧大模型正让每一台终端都具备懂场景、懂用户的智能,开启“万物智联”的全新阶段。​ 站在端侧AI爆发的起点,在本周中国人工智能产业发展联盟(AIIA)与上海海思联合举办的端侧AI论坛上,上海海思介绍了面向端侧AI的最新进展。 上海海思将聚焦场景智能、AI Agent、物理AI三大方向,打造差异化的解决方案。 场景智能也叫专用智能,其基于主要在终端上的计算能力,使得设备拥有更强的环境感知、一定的决策能力;AI Agent的计算能力则侧重于端云协同,同时基于多模态能力提供更自然、智能的交互。 这背后,端侧AI的高效实现,离不开终端设备、终端芯片、开发者之间的深度协同。因此,上海海思聚焦于在开放的生态之上构建丰富的中间件和具有竞争力的端侧AI解决方案,为千亿终端的智能化重构提供全方位能力支撑。 一、从万物互联到万物智能,终端芯片厂商面临三大挑战 想要实现智能无处不在,端侧AI的技术突破与大规模落地不可或缺。 一方面,端侧大模型的落地部署已具备成熟的现实土壤。 从2022年底至今,云端大模型的影响力已贯穿千行百业,在企业核心业务体系、消费者日常生活中都逐渐普及,大模型性能的持续提升、软件迭代速度的加快,推动模型知识密度显著提高,为端侧大模型从技术构想走向实际落地,创造了关键前提条件。 另一方面,端侧AI优势显而易见。 端侧AI将部分计算能力迁移到手机、PC、家电等终端本地,使其在保障数据安全、保证体验丝滑方面具有天然优势。此外还有成本,从商业模式角度来看,端侧部署的模型往往采用一次性交易,云端模型服务是订阅制,相比之下,用户更倾向于选择一次性支付的“确定性成本”。 在这些因素的综合作用下,端侧AI发展提速,而这也反向对支撑其运行的终端芯片厂商,提出了更高的能力进阶要求。 具体来看,其挑战主要集中于三大方面: 首先端侧设备本身品类繁杂,其形态多样、应用场景多元、所需算力跨度极大,这就要求芯片适配不同的开源模型,才能满足各类设备的差异化需求; 其次企业需要跨平台进行业务部署,中间还要穿插模型的调优、适配环节,会导致端侧AI落地周期增加; 最后是端侧设备本身体积小且企业对成本更为敏感,如何平衡性能、成本之间的关系也是一大难点。 事实上,终端芯片厂商在端侧AI的发展进程中始终处在关键环节,从模型轻量化运行、能效比平衡到场景化适配都是如此。 而上述挑战落地到芯片侧,最终转化为对多元化产品、成体系解决方案、完整生态架构的硬性要求,因此终端芯片厂商的角色也从单纯的硬件供应商,向着连接开发者、设备厂商、场景方的枢纽角色延伸。 上海海思在端侧AI的最新布局,与这一产业发展逻辑高度契合。 二、聚焦三大端侧AI发力点,配套系列化不同算力芯片方案 放到具体的场景侧,上海海思基于自己的布局以及对智能的理解,瞄准了三大领域:场景智能、AI Agent以及物理AI,上海海思相关技术专家谈道,这一既覆盖当下成熟的应用场景,也包含带有前瞻性的未来智能形态。 首先,场景智能的发展是其中落地面较广、应用程度更深的。 这一领域的终端设备与我们日常生活息息相关,从连接到智能家电,从音视频到显示无一不涵盖其中。在连接层面,其将AI应用于家庭路由器,实现AI超级组网、抗干扰,上海海思依托于曾经在通信行业超100万种场景的积累,可以识别10种以上干扰源,使得抗干扰性能提升30%。 智能家电领域的冰箱、洗衣机、空调现在几乎已经进入“无AI不家电”时代,例如空调基于eAI MCU实现了节能16%、冰箱实现超过10%的节能、洗衣机增加了AI称重、偏心检测,端侧屏显设备基于AI Touch可以防误触防水等功能。其中,海尔、美的、海信等品牌厂商的空调、冰箱已经搭载上海海思的解决方案,空调实现了靠近防直吹、靠近亮屏等AI感知能力,当用户靠近空调时,设备自动调整出风方向。 端侧屏显AI Touch 与此同时,在安防和机器智能领域,上海海思同样提供了从1T级到100T级算力的芯片和解决方案。以安防领域为例,大华周界大模型基于上海海思的解决方案,应对传统周界算法在小目标误判率高、距离远目标小无法被探测、误报运动类人形目标等痛点,使得误报率下降90%,检测距离提升70%。 大华周界大模型 其次是AI Agent。2025年,被业界称作AI Agent落地的元年,端侧正是Agent触达用户的核心入口之一。 基于MCP工具的端侧多设备协同能力、RAG知识库的本地离线调用特性,端侧设备的应用体验将与云端形成差异,其可以无需依赖网络即可实现低延迟响应,还能通过联动本地传感器、摄像头等硬件,实时融合环境数据。 在这一层面,上海海思提供系列化的端侧芯片,例如精准过滤背景噪音,提取清晰的语音指令,减少AI模型的Token消耗,进而提升端侧AI的运行效率。 目前的典型场景就是可穿戴设备,依托AI Agent的自主决策与交互能力,使其得以向轻智能形态升级,能够精准感知用户潜在意图,不再被动等待指令,而是主动推送贴合需求的个性化服务。 最后是物理AI,相比于前两大领域,这一层面的发展还处于早期。上海海思已率先展开在无人机等领域的探索。 因为应用场景不同,导致这些场景对视觉感知和AI应用的差异较大,无人机需要高精度环境避障、四足机器人需要实时导航、适应不同地形,人形机器人更是集大成者,需应对复杂场景交互,对算力、感知精度的要求更高。例如朝歌科技基于上海海思解决方案打造的充电机器人,可以在不同天气、工况下给新能源汽车自动充电。 在人形机器人领域,上海海思已经与千寻智能展开合作,通过优化芯片的视觉处理单元,大幅增强人形机器人的图像识别与环境感知能力。下一步,双方还将在智能计算、感知、连接、模拟层面协同发力。 千寻智能人形机器人精准叠衣 对于物理AI这类前沿领域,上海海思目前的核心就是联合生态伙伴,共建物理智能的丰富产品应用,为相应技术成熟的产业发展铺路。 这正是上海海思面对从日常场景到前沿探索的端侧AI完整布局体系。 三、从单点产品到开发平台,上海海思用全栈生态、场景、产品支撑, 端侧AI的发展,本质是一场将大模型、芯片、终端设备、开发者等要素紧密连接的变革,而上海海思就是串联各个环节的关键。 从其整体的布局来看,上海海思已经形成智慧家庭、消费电子、汽车电子三大场景,超高清音视频、星闪联接、开源鸿蒙、端侧AI四大生态,以及显示、视觉、联接等10大产品的完整业务体系,为端侧AI规模化落地搭建了坚实的底座。 如此全栈的布局就需要强大的生态底座支撑,通过统一的生态平台让分散的技术、产品、解决方案真正适配碎片化的智能终端场景,破解端侧设备形态多样、场景复杂的行业难题。 为了支撑这一体系,上海海思还推出了ModelZoo平台,集成15大类、100多个开源模型。上海海思相关技术专家称,对于技术人员储备不足的企业,该平台可提供 “一条龙” 式全流程解决方案;而针对开发需求明确的用户,平台则配套了系列化工具,满足其高效开发需求。 围绕上述的布局,以及产品、解决方案、生态的深度协同,我们可以预见,上海海思将在端侧AI时代扮演至关重要的角色。 不过从目前端侧设备的智能水平来看,其真正实现思考与行动闭环还有一定距离,但明确的演进趋势已然显现:未来每一台智能终端都将具备一定的原生推理能力,端侧AI Agent可调用云端智能体应用,终端设备与物理世界产生交互或将成为常态。 由此而衍生出,对开发者提出新的要求,其需要云端统一的训练和推理环境、模型、工具链、编译等,这些正是实现端侧AI高效部署、释放高效智能的关键所在,而这也与上海海思构建全栈生态的方向高度契合。 从行业应用到更广泛的大众场景,从虚拟交互到物理世界的深度融合,端侧AI的智能化蓝图正依托上海海思搭建的生态体系徐徐展开。 结语:上海海思聚焦端侧AI高效规模化部署 模型在端侧部署,其本质就是端侧高频实时AI应用的高效实现与规模化落地,这一过程中,既包含对成熟、传统行业设备的智能化升级,如安防、传统家电等领域,还包含新兴产业对AI原生能力的诉求,如人形机器人、AI原生硬件等。 在这背后,上海海思正将20余年积累的智能终端芯片研发经验以及对不同场景的深入实践、经验积累,转化为推动端侧AI加速爆发的关键助推器。
海外卖爆的 AI 卡片在中国发售,入口比模型本身更重要
在 AI 硬件圈,有一张「小卡片」悄悄火了很久。 它像一张银行卡,厚度不到 3mm,能吸附在手机背面。这枚名为 Plaud Note 的设备,只为一件事,记录对话,并用 AI 帮助用户挖掘对话中的价值。这个简单直接的思路,让它在全球积累了超过 100 万用户。 9 月 22 日,这张小卡片背后的团队 Plaud,终于带着它和功能更强的升级版 Plaud Note Pro,在深圳召开了中国内地的首场发布会。 在国内,记录对话的 AI 产品现在看来是一片红海,前有科大讯飞这样的巨头一直深耕该领域,后有层出不穷的公司跟进,像是钉钉、Anker、360 等。 Plaud 的回归,不仅是一个产品发布,更像是新一代硬件创业浪潮的一个缩影。这些企业,它们从诞生之初就拥有全球化视野,在海外市场证明自己后,再带着技术与理念进入中国。 这份技术和理念,能否经得起国内用户的检验,一起看看他们发布了什么产品。 和 AI 的实时协同,从一张卡片开始 「意图」,这是整场发布会我听到最多的词,大模型如何理解我们的意图,大模型最想要什么,我们为什么设计这个产品? 答案都回到了「意图(intention)」,Plaud 合伙人兼中国区 CEO Peter 不断重复这个词,来解释大模型时代,不仅仅是处理原始数据,而是要理解我们的意图,才能真正突破智能的边界。 ▲ Plaud 合伙人兼中国区 CEO Peter(莫子皓) Plaud 此次的旗舰新品 Plaud Note Pro,最大的亮点在于首次实现了「人与 AI 的实时协同」 (Human-AI alignment in real time)。 想象一下,在会议中,当讨论到关键决策或重要数据时,不需要打断对话,只需轻轻一按机身上的按钮,就能实时将这个时间点,和相关信息同步给背后的大模型。 这等于在告诉 AI:「注意,这里是重点」。而通过这种方式,大模型能够更好地理解,对话的语境和我们的意图,从而生成更精准、更具洞察力的摘要。 这跟平时我们和大模型沟通,写了一大堆 prompt,是不一样的;因为我们输入的文本,是没有时间维度的。 Plaud 则是让 AI 从一个录音结束后,被动整理信息的工具,变成了在对话发生时的智能伙伴,实时地与我们的意图对齐。 为了实现高效的记录,Plaud Note Pro 在硬件上的亮点,也集中在了更丝滑和无缝的体验上。 当被问及产品为何「能用且好用」时,Peter 显得颇为自信,他提到 Plaud 创始人团队,有做手机、造机器人的,做现在的产品属于「降维打击」。 这种经验,也的确保证了基础体验的可靠,Peter 分享其他用户的体验评价,「连蓝牙那一刻,就知道这个团队不简单」,因为 Plaud 的蓝牙连接体验,同样非常丝滑。 首先是轻薄,机身是银行卡般的大小,厚度仅为 2.99mm,重量 30g。这种对极致轻薄的追求,也带来了妥协。在沟通会上,当被问到充电接口,并非通用 Type-C 的问题。 团队坦言,这是为了保证产品极致轻薄而做的取舍,但也收到了很多用户的反馈,正在努力寻找解决方案。目前采用的充电方案,是类似大部分手环的触点充电。 第二是专业的收音,Plaud Note Pro 内置 4 个全向 MEMS 麦克风阵列,配合 AI 声学波束成型技术,可在最远 5 米的范围内,实现录音棚级的音频捕捉。 对比前代产品,Plaud Note Pro 还可以通过算法自动识别,录音环境是电话通话,还是面对面对话,而不需要手动切换录音模式。续航方面,单次充电可支持最长 50 小时的连续录音,满足一周的工作需求。 硬件作入口,软件是核心 「能不能不买你们的硬件,只用你们的软件?」 面对这个问题,Peter 的回答很坚决:「我们不做这种事情。」 他认为,做单纯的软件服务会分散精力,更重要的是,Plaud 坚信软硬件结合才能提供最佳的智能体验。 这背后,是 Plaud 「AI 原生科技公司」的自我定位。硬件只是捕捉信息的入口,真正的处理和价值生成,都发生在云端的 AI 引擎 Plaud Intelligence 中。 ▲ Plaud 网页版首页 对比前代,除了音频,现在还可以捕捉文本、图片信息,并结合「一键标记」功能,为 AI 提供更丰富的上下文,具备多模态能力。 其次就是和大部分 AI 纪要产品、以及通义听悟类似的功能,通过优化整合 DeepSeek R1、千问、豆包等多个大模型,将语音转写成文字,还能区分不同的发言人,并支持多达 112 种语言。 在模型的选择上,Plaud 的策略并非「兼容并包」,而是「只支持最好」。 Peter 坦言,在中文转写上,国内模型表现更好;但在更深层的因果关系和深度思考上,海外顶尖模型仍有优势。但他们仍然坚持使用「最贵、最好」的模型和服务,因为「更好的价值」本身就是产品的核心,而非成本。 基于在海外的两年运营,Plaud 内置了从全球 3000 多个模板中优选出的专业模板,覆盖不同行业和领域。它可以根据你的角色和习惯进行智能推荐,从多个视角分析对话,提供更丰富的总结。 ▲ 模版社区 最后一项是 Ask Plaud,和知识库的 AI 问答一样。我们可以基于录音的完整上下文,向 AI 进行深度提问,所有答案都能追溯到录音文件具体的信息来源。新版本还增加了智能建议追问、跨文件查询等功能。 以上所有功能,用户都可以通过 Plaud APP(支持 iOS 和 Android)及网页端来实现。 多款海外产品首次在中国区推出 除了旗舰 Plaud Note Pro,Plaud 还带来了另外两款针对不同场景的产品,它们都支持全新升级的 Plaud Intelligence,也同样是需要配合手机 App 使用。 Plaud NotePin S,可穿戴的 AI 纪要产品,它的前代是已经在海外发售的 Plaud NotePin,目前这款在中国区首发的新品,主打「解放双手,随心记录」。 主要的特点是,它可以通过项链、手环、背夹、磁吸片等多种方式佩戴。同时,它的重量只有 17.6g,拇指般大小,但续航也做到了 40 天待机,和 20 小时连续录音,并配备 64GB 存储。 Plaud Note,卡片式 AI 纪要开创者,这是一款在 2023 年就推出的产品,而到现在,市面上已经有相当多的公司,在做同样类型的卡片式 AI 纪要产品。 尽管 Plaud Note Pro 在性能上提升明显,但据 Plaud 合伙人兼全球销售负责人 Raymond 介绍,经典款 Plaud Note 在海外依然维持着非常高的销量,因为「有很多消费者,还是喜欢这种机械拨动的形态」。 ▲ Plaud 合伙人兼中国区 CEO Peter 莫子皓(左);Plaud 合伙人兼全球销售负责人 Raymond 孙驰(右) 当被问到如何在国内众多同类产品中脱颖而出时,「用户价值」是创始人提到最多的词。他认为,为用户带去 SOTA(最佳)的体验,是 Plaud 应对竞争的态度 。 目前,Plaud Note Pro、Plaud Note、Plaud NotePin S 三款产品,已经在国内主要电商平台发售,具体的发售价格如下。 ▲ Plaud Note 1149 元,Plaud Note Pro 1299 元,Plaud NotePin S 1249 元 而针对每款设备都能用上的 Plaud Intelligence,也有标准版、专业版、和卓越版三个会员计划,主要的区别体现在,可录音的时长限制,分别是 300 分钟、1200 分钟、和无限时长,对应的价格是免费、339/年、和 1099/年。 而国内版和国外版的 Plaud Intelligence 订阅价格也有所不同,国际版配置了像 Gemini 2.5 Pro、GPT-5、以及 Claude 4 这些模型,所以专业会员的订阅价格是在 99.99 美元(人民币 700 多),而国内版则是 DeepSeek、豆包、千问等模型。 APPSO 也第一时间拿到了 Plaud Note Pro 产品,根据发布会现场透露的信息,Plaud Intelligence 将在下个月更新跨平台同步、多维度解读等多项功能。我们也会在更新之后,同步分享我们的使用体验。
vivo X300系列蓝图影像公布:首发蔡司2亿像素APO长焦与索尼LYT-828
凤凰网科技讯 9月26日,vivo今日举行X系列影像技术沟通会,正式对外阐述了其影像战略的重大升级。据介绍,vivo影像将从过去专注单点技术突破,转向以“场景解决方案”为核心,旨在系统性解决用户在演唱会、体育赛事、旅行人像等复杂场景下的真实使用痛点,推动移动影像体验的整体进化。 作为新战略落地的首款产品,即将到来的vivo X300系列在影像架构上进行了系统性革新。其中,最引人注目的是其“蔡司影像大小王”的产品组合。具体来看,vivo X300 Pro将搭载独家定制的蔡司2亿像素APO超级长焦,其传感器为与三星联合研发的“蓝图×HPB”,拥有1/1.4英寸大底,并实现了行业领先的CIPA 5.5级防抖。而标准版的X300则采用了差异化路线,将这颗同款的2亿像素旗舰传感器用作主摄像头,这意味着标准版机型也将具备极强的解析力。 针对演唱会、体育赛事等极限场景,vivo X300系列提出了系统级的解决方案。其创新的“录拍双系统分时架构”允许用户在录制4K视频的同时,通过独立通道拍摄高品质的多帧融合照片,解决了以往只能模糊截图的痛点。同时,通过与MediaTek的深度合作,其追焦性能和长焦抓拍能力也得到显著增强,能够在480mm超长焦段进行每秒12张的高画质连拍。 在人像摄影领域,X300系列在提升画质美的基础上,增添了更多实用和创新的功能。例如,与MediaTek独家合作的“AI定制美颜”功能,可学习用户的修图偏好,实现批量处理。动态照片(Live Photo)体验也得到优化,并首发了“Live Photo路人消除”功能。此外,该系列还将行业首发4K 60fps电影人像视频,由vivo自研的V3+影像芯片与天玑9500旗舰平台协同实现。 视频创作能力是此次升级的另一大核心。vivo X300系列将全球首发蓝图×索尼LYT-828传感器,该传感器拥有出色的动态范围。通过对整个视频处理链路的重构,X300系列实现了全焦段、满血版的4K 120fps杜比视界HDR视频录制。更关键的是,vivo打通了从拍到剪的生态链路,独家实现了剪映App对4K 120fps杜比视界视频的原生编辑与导出,极大地提升了专业视频创作者的工作流效率。 据官方公布,vivo X300系列新品发布会将于10月13日正式举行,届时将揭晓更多产品细节。
曝华为Mate 80系列将于10月21日发布 或搭载麒麟9030
近日,有博主从华为WATCH GT 6 Pro智能手表的预售时间安排推测,华为Mate 80系列很可能在10月21日发布。 华为Mate 70 该博主梳理的时间线显示,华为WATCH GT 6和FreeClip 2于9月24日率先发布,而WATCH GT6 Pro安排在10月14日开启预售。按照华为惯例,预售开启后通常等待7天会安排发货,发布会则提前7天官宣。同时,此前有爆料称WATCH GT6 Pro会等待华为Mate 80同步上架销售。综合这些线索,博主认为所有信息似乎都指向10月21日这个时间点。CNMO注意到,当天恰逢周二,这与华为经典的发布会档期选择高度契合,进一步增加了该推测的可信度。 除了发布时间的推测,还有数码博主曝光了华为Mate 80系列的诸多重磅升级信息。在系统与芯片方面,华为Mate 80系列新机将首发搭载HarmonyOS 6.0系统和麒麟9030芯片。 通信方面,华为Mate 80系列将搭载新一代自研通信基带,支持5G-A(5G-Advanced)技术,并兼容低轨卫星通信。同时,该系列还将支持低轨卫星通信功能,结合eSIM架构,拓展了手机的使用场景和通信边界。 影像方面,华为Mate 80 Pro+和RS版本将配备5000万像素1英寸超大底传感器,支持十档物理可变光圈(F1.0-F16),配合RYYB滤色阵列,能够在暗光和逆光环境下显著提升拍摄能力。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。