行业分类:
加载中...
头条分类:
加载中...
内存价格疯涨!多家厂商下调出货预期 只有一家在上调
快科技2月12日消息,市场研究公司Counterpoint Research发布的最新报告显示,2026年第一季度以来,全球内存价格相较于2025年第四季度末已经飙升了80%—90%。无论是DRAM、NAND还是面向AI领域的HBM,全品类价格均创下了历史新高,这种史无前例的涨幅正深度冲击着全球消费电子供应链。 据知名数码博主爆料,受内存等核心物料涨价的影响,目前主流手机厂商普遍持悲观态度,基本都在下调2026年的新机出货量预期。在这一片减产潮中,仅有一家品牌逆势上调了年度目标,其内部设定的出货目标大约在7000万台左右,且中国市场依然是其核心基本盘。 虽然博主并未指名道姓,但评论区不少网友纷纷猜测,这家敢于在寒冬中逆流而上的品牌很可能是华为。 这种猜测并非空穴来风,根据权威机构近期公布的第三方销量数据,华为凭借强劲的势头领跑新年手机市场,以18.6%的市场份额成功拿下了1月份中国手机市场的第一名。其中Mate 80标准版表现最为抢眼,单品激活量已迅速突破150万台,成为去年下半年国产旗舰阵营中单品销量最高的机型。 不过从宏观角度来看,2026年手机行业整体仍将面临下行压力。存储成本的剧增正极大地压缩厂商的利润空间,并最终推高终端售价,抑制消费者的购买欲望。 研究机构TrendForce在报告中指出,受存储器价格持续走高的拖累,预计2026年全球手机产量将下降10%,总量萎缩至11.35亿台左右。如果未来几个月内存价格得不到有效控制,市场衰退的幅度甚至可能进一步扩大到15%以上,手机行业的洗牌期或许比预想中来得更早。
手机开发者模式怎么开启 开启后普通用户能做什么:一文看明白
作为手机评测编辑,日常在测试手机性能时,经常需要用到“开发者模式”,这个模式是系统隐藏的高级设置界面,一般面向开发者或高级用户,主要用于底层系统调试。 一般来说,普通用户几乎用不到这个工具,但用不到,并不代表不能用。事实上,“开发者模式”提供了不少能提升日常用机体验的小惊喜,普通用户用起来也毫无压力。 安卓手机如何进入开发者选项? 今天,我们就以安卓手机为例,一步步解锁它的“隐藏玩法”。 首先,我们先来解锁手机的开发者模式,步骤其实特别简单,跟着操作就能轻松完成。 打开手机桌面的“设置”APP,一直往下滑,找到最底部的“关于手机”选项,然后找到系统版本,有的手机或许没有“关于手机”选项,但不要紧,找到类似关于系统,或者系统更新的选项,也能找到的选项。 找到“版本号”后,接下来,我们只需要连续点击“版本号”就可以解锁,点击过程中屏幕上会提示即将开启开发者模式。之后我们返回设置主界面,就能在“系统设置”或“其他设置”分类下,找到新增的“开发者选项”。 点进去之后,就能看到和你上传的截屏中一样的界面,密密麻麻的设置项。因为并不是面向普通用户的,所以很多设置项大家也没必要去了解,大多数都用不到。这里笔者挑了几个,能让你收获不一样的用机体验。 这些功能可以试一试: 在开发者模式中,有三个和“动画缩放”相关的设置,分别是窗口动画缩放、过渡动画缩放和动画程序时长缩放,它们的默认设置都是1x,也就是正常的动画速度。 很多人觉得自己的手机用久了,切换APP、打开菜单时的动画有点慢,不够跟手,这时候我们就可以把这三个选项都调整到0.5x,调整完成后再操作手机,就能明显感觉到动画速度变快了,操作响应也更迅速,哪怕是日常刷视频、聊微信,也能收获更轻快的体验。 如果是追求极致效率的朋友,甚至可以直接关闭动画,操作起来会更干脆利落,完全不会影响手机的正常使用。 如果你的手机经常因为后台APP太多而卡顿、耗电快,那么“后台进程限制”这个功能就很适合你。在开发者模式中,这个选项提供了多种选择,比如“不超过4个进程”“不超过2个进程”等,我们可以根据自己的使用习惯来调整。 比如平时只常用微信、抖音、浏览器这几个APP,就可以选择“不超过3个进程”,这样系统就会自动清理后台的闲置APP,释放更多的内存,不仅能让手机用起来更清爽,还能一定程度上节省电量,解决手机越用越卡的小烦恼。 除了提升流畅度,还有一些功能能解决我们日常用机中的小痛点,让手机变得更实用。比如“USB调试”和“无线调试”,很多人平时需要把手机里的大文件、照片传到电脑上,或者从电脑上备份数据,开启USB调试后,只要用数据线把手机和电脑连接起来,就能轻松实现文件传输和数据备份,不用再依赖繁琐的云同步,传输速度也更快;而无线调试则更方便,只要手机和电脑连接在同一个Wi-Fi下,不用插数据线,就能实现手机和电脑的连接,不管是投屏演示,还是无线传输文件,都能摆脱数据线的束缚,用起来特别省心。 如果平时喜欢拍手机操作教程、录屏分享,那么“显示触摸操作”和“指针位置”这两个功能就特别实用。开启“显示触摸操作”后,我们点击手机屏幕时,屏幕上会出现一个小小的白点,滑动屏幕时,还会显示滑动的轨迹;“指针位置”则会显示触摸的具体坐标和滑动轨迹,这样一来,我们录屏或者拍教程时,观众就能清晰地看到我们的操作步骤,再也不用反复解释“点这里、滑那里”,尤其适合喜欢分享手机小技巧的朋友。 还有一个特别贴心的小功能,就是“保持唤醒状态(充电时)”。平时我们充电的时候,手机屏幕会过一会儿就自动熄灭,如果想在充电时看视频、查资料,或者把手机放在桌面当时钟,就需要频繁按电源键唤醒屏幕,特别麻烦。开启这个功能后,只要手机处于充电状态,屏幕就会一直保持常亮,不用再反复按电源键,既方便又省心,而且不会对手机屏幕造成损伤。 除此之外,还有一些有趣又实用的小功能值得一试。比如“蓝牙音频编码器”,如果你的蓝牙耳机是支持高清编码的高端型号,比如索尼、森海塞尔的部分机型,在开发者模式中,我们可以切换蓝牙音频编码格式,比如选择LDAC、aptX HD等,这样就能获得更清晰、更细腻的音质,听歌的体验也会大幅提升。还有“模拟颜色空间”,这个功能可以模拟色盲、色弱人群的视觉效果,比如“全色盲”“红色盲”等模式,如果你是色弱用户,开启对应模式后,能更清晰地分辨屏幕上的颜色;普通用户也可以偶尔玩玩,体验一下不同的视觉风格,也能更理解色弱人群的视觉感受。 另外,通过开发者模式中的网络诊断相关设置,我们还能查看Wi-Fi的信号强度、连接频段、IP地址等详细信息,如果家里的Wi-Fi信号不好,就能通过这些信息判断是距离问题还是频段干扰,方便我们优化路由器的位置,提升Wi-Fi信号质量。 这些功能最好不要碰: 讲到这里,可能有朋友会担心,万一不小心调错了设置,把手机搞坏了怎么办?其实大家完全不用慌,开发者模式虽然功能多,但只要避开那些“高危选项”,就不会有任何问题。这里也给大家梳理一下,普通用户一定要避开的几个功能,千万不要轻易触碰。 比如“OEM解锁”,开启这个功能后,虽然可以刷入第三方系统,但非专业玩家操作很容易导致手机变砖,还会让手机失去保修,得不偿失;还有“调试应用”相关的设置,比如“选择调试应用”“等待调试器”,这些都是给开发者调试APP用的,普通用户开启后,不仅没用,还可能导致APP异常、隐私泄露。 另外,像“启用严格模式”“禁用权限监控”“修改Wi-Fi MAC地址”等系统关键设置,也不要轻易修改,否则可能会破坏手机系统的稳定性,导致手机频繁重启、功能失效,甚至出现网络异常、被运营商限制服务等问题。 最后: 其实说到底,开发者模式是一个开放给大家的“实用工具箱”,不是只有程序员才能使用。对普通用户来说,我们不需要弄懂里面所有的设置,只要挑对那些简单、实用、安全的功能,一样能够体验到玩机的乐趣。 当然,开发者模式毕竟存在一些风险,也存在一定门槛,不是非必要,还是不建议大家尝试。另外,如果开启了开发者模式,一定记得关闭,确保用机安全。
高通被取代!iPhone 18 Pro首发C2基带:支持5G卫星连接
快科技2月12日消息,苹果计划在今年秋季亮相的iPhone 18 Pro和iPhone 18 Pro Max上,首发搭载其备受期待的自研基带芯片C2,这一举动标志着高通基带在苹果手机上正式退场。 据相关报道显示,苹果C2基带芯片的开发工作早在去年iPhone 16e发布后不久就已经紧锣密鼓地展开。相比前代产品,这颗芯片最核心的升级在于全面支持毫米波与sub-6GHz网络。 更重要的是,它引入了对NR-NTN技术的支持。这是一项革命性的通信标准,它允许iPhone在没有传统基站信号的情况下,直接连接卫星来访问互联网。 随着这项技术的落地,iPhone 18 Pro和iPhone 18 Pro Max将成为全球首批支持这种新型卫星连接模式的智能手机。简单来说,苹果C2基带与NR-NTN标准的结合,被业内视为5G卫星连接技术的一次重大变革,它彻底打破了地理环境对通信的限制。 回溯以往,苹果从iPhone 14系列开始就引入了卫星通信功能。但在当时的条件下,该功能主要用于紧急救援,用户在偏远地区通过卫星发送信息与外界取得联系。而即将到来的5G卫星连接则完全不同,它利用庞大的低轨道卫星基础设施,填补了地面蜂窝网络的空白。 在实际使用中,iPhone 18 Pro系列将能够把每一颗运行中的低轨道卫星视为一个普通的移动基站。这意味着用户不仅能发送求救信号,甚至可以在荒郊野外像往常一样浏览网页或收发邮件,实现真正的全场景互联网访问。 不过需要指出的是,受限于各地法律法规及卫星运营商的覆盖范围,这项强大的功能在发布初期仅在部分地区开放。根据目前的供应链消息,美国和加拿大极有可能是首批支持5G卫星互联网接入的地区。
日产奔驰墨西哥工厂获多家车企青睐,消息称比亚迪、吉利有意竞标
IT之家 2 月 12 日消息,今天晚间,据路透社报道,比亚迪、吉利已进入日产–奔驰墨西哥工厂收购案的最终竞争名单。知情人士透露,在美国关税导致墨西哥汽车工厂关闭与裁员加剧的背景下,中国正试图在墨西哥建立新的制造支点。 消息称共有九家公司表达收购意向,包括来自中国的奇瑞、长城,以及越南“造车新势力”VinFast。长期以来,墨西哥整车制造主要由美国、欧洲和日本品牌主导,生产的车型大多出口美国。 墨西哥已成为中国车企重要出口市场。咨询机构 AutoForecast Solutions 估算,中国品牌市场份额已从 2020 年的零提升至去年的约 10%。据悉,墨西哥年汽车销量约 150 万辆。 据IT之家了解,墨西哥汽车产业高度依赖美国市场。墨西哥汽车工业协会 AMIA 数据显示,2024 年墨西哥生产 400 万辆乘用车,其中 280 万辆销往美国。自去年 3 月美国对墨西哥制造汽车征收 25% 关税以来,产业持续承压。 位于墨西哥中部阿瓜斯卡连特斯的日产–奔驰工厂 2017 年投产,即将正式关闭。业内人士表示,多重因素导致停产,美国关税成为最后一击。 奔驰在该厂生产 GLB 车型,目前计划将产能转移至匈牙利,以便以更低关税向美国出口。奔驰未明确说明是否与关税有关,仅透露现款 GLB 车型生产周期结束。 日产在该厂生产英菲尼迪 QX50 与 QX55,两款车型销量低迷,目前已决定停产。日产表示,关闭工厂反映“更广泛的战略调整”。在全球重组过程中,日产还将关闭墨西哥城外另一座工厂。 对于中国车企而言,墨西哥被视为拓展拉丁美洲市场的关键枢纽。阿瓜斯卡连特斯州政府表示,九家表达兴趣的车企大多生产混动和电动车型,主要面向墨西哥及拉美市场。 收购阿瓜斯卡连特斯工厂无需获得墨西哥政府批准。该厂年产能 23 万辆,配备熟练劳动力及完善运输基础设施。
NASA与SpaceX完成“Crew-12”任务最后审查,明日发射前往国际空间站
IT之家 2 月 12 日消息,美国国家航空航天局(NASA)与太空探索技术公司(SpaceX)团队已完成载人 12 号任务(Crew‑12)飞往国际空间站的最后一项重大审查 —— 发射就绪审查。任务负责人已批准进入发射倒计时程序,仅需等待上升轨道的天气条件满足要求。 据悉,发射暂定于美国东部时间 2 月 13 日(周五)早上 5:15(IT之家注:北京时间 2 月 13 日 18:15:00),不早于该时间点执行。任务将使用 SpaceX 龙飞船与猎鹰 9 号火箭,从佛罗里达州卡纳维拉尔角太空军基地 40 号航天发射复合体升空。 发射场天气有利概率为 85%,主要关注因素为积云。团队仍在持续监测载人 12 号飞行路径上大西洋沿岸的偏高风速,此前正因这一因素,发射日期从 2 月 11 日推迟。 本次任务乘组包括: 指令长:NASA 宇航员杰西卡・梅尔 驾驶员:NASA 宇航员杰克・哈撒韦 欧洲空间局(ESA)宇航员索菲・阿德诺 俄罗斯联邦航天集团(Roscosmos)宇航员安德烈・费佳耶夫 四人将乘坐龙飞船前往这座轨道实验室,执行为期 8 个月的乘组轮换任务。他们自 2 月 6 日抵达发射场后,已在佛罗里达州 NASA 肯尼迪航天中心进行隔离。 载人 12 号任务是 SpaceX 为 NASA 商业载人计划执行的第 12 次空间站载人轮换飞行,也是第 13 次载人任务。若 2 月 13 日顺利发射,载人 12 号乘组预计于 2 月 14 日(周六)下午 3:15 抵达国际空间站。
理想MEGA拖车AI渲染视频一览 由Seedance 2.0生成
【CNMO科技消息】2月12日,前泡泡网DIY硬件群组总监“硬哥”根据汽车博主“SugarDesign”制作的理想MEGA拖车渲染图生成了一条AI视频。生成该视频的AI工具正是近日大火的Seeddance 2.0。 理想MEGA拖车渲染图 视频中,理想MEGA拖车采用原本车型经典的银色配色,车身采用流线型设计。车身前半段为MEGA本体,后半段为拖车部分。 作为字节跳动推出的新一代AI视频生成模型,Seeddance2.0采用双分支扩散变换器架构,可同时处理视频画面与音频生成,仅需上传一张图片或输入文本提示,就能在60秒内输出包含远景、中景、近景切换的多镜头序列视频,且原生适配16:9、21:9等电影级比例。 据CNMO了解,理想MEGA定位为理想汽车旗下首款纯电旗舰MPV,针对家庭长途出行与户外场景设计。动力与续航方面,该车搭载理想自研5C超充纯电平台,配备140kWh麒麟电池组,CLTC工况续航里程达750km;支持5C超充技术,充电12分钟即可补充500km续航。 辅助驾驶方面,MEGA标配理想AD Max 3.0系统,搭载1颗激光雷达、12颗高清摄像头及Orin-X芯片,可实现城市NOA、高速NOA及拖挂场景下的自动循迹功能,拖车模式下ESP电子稳定程序会自动调整参数,确保行驶稳定性。车身尺寸为5350mm×1985mm×1850mm,轴距3200mm,提供6座豪华布局;第二排配备航空级座椅,支持加热、通风、按摩及180°旋转,中央扶手集成车载冰箱与无线充电板,车顶配备可开启全景天幕。
Seedance 2.0杀入豆包!海外网友翻墙跪求
▲头图由AI生成 智东西2月11日报道,今天,陆续有不少用户发现,字节跳动已在旗下AI助手App豆包内开启视频生成模型Seedance 2.0的灰度测试。 用户只需打开豆包,点击下方的创作按钮,进入视频生成功能后,已被纳入灰度测试的用户就可看到模型2.0(Seedance 2.0)的选项。 自2月7日在即梦等平台灰度上线以来,Seedance 2.0就让整个AI视频圈炸了锅。 《黑神话·悟空》背后的游戏科学创始人兼CEO、制作人冯骥在体验后Seedance2.0后,盛赞该模型为“地表最强”,并判断道:“AIGC的童年时代,结束了。”a16z的合伙人Justine Moore则感叹道:“AI视频模型的图灵测试已经被攻克了。”一位学习了7年数字电影制作的网友在体验后说,这个模型让他感到害怕,他所学习到的90%技能,Seedance2.0都能实现。 过去,往往是国内用户费尽心思去体验国外的AI工具,而这次,Seedance 2.0作反而成为海外网友“争相体验”的对象。 由于该模型在部分国家和地区尚未开放,不少海外网友在社交平台频频“催上线”、询问开放时间;还有人专门制作了详细教程,分享如何通过中国手机号完成注册,并一步步体验Seedance 2.0的完整流程。 Seedance 2.0上线豆包App后,智东西也第一时间进行了体验。我们尝试了从日常场景到超现实场景的多种创作,发现模型对复杂提示词的理解能力明显增强,同时音画同步和视觉效果的呈现也更自然,较字节的上一代视频生成模型,实现了可感知的大幅提升。 01. 实测长提示词指令遵循 高难度乐器演奏、超现实场景也能还原 据字节官方技术文档,Seedance 2.0在物理规律、动作表现、指令遵循等领域均有明显提升,还支持了图像、视频、音频、文本四种模态输入,这意味着用户能以更多的方式控制模型的输出,满足创作需求。 不过,目前在豆包App中,Seedance 2.0暂时仅支持文本和图像两个模态的输入。每个用户每天可以获得200视频生成积分,而用Seedance 2.0生成一个10秒的视频,需要耗费20积分,也就是说每个人可以体验10次。 我们的首个测试案例是长文本提示词输入,下方提示词精确定义了画面里的主体、动作以及音效,看看Seedance 2.0能否准确还原。 提示词:突然,前方街角的阴影里,一只漆黑的猫像一道闪电般窜出,身形轻盈而敏捷。女孩被吓得微微后退一步,雨水顺着帽沿落在她的肩膀上,溅起一圈细小水花。镜头侧面缓缓跟随,捕捉她的手伸出,试图触碰黑猫。猫的耳朵竖起,眼睛在路灯下闪着绿光,它轻巧地一跃,消失在湿漉漉的街道深处。 女孩愣了一秒,低头看着自己微湿的手指,嘴角悄悄上扬,露出一丝忍俊不禁的笑意。她摇摇头,雨伞下的脸被灯光映出温暖的光晕。随后,她调整步伐,撑开雨伞,加快了前行的脚步,雨水拍打伞面,伴随着她鞋底溅起的水花,融入街道的喧嚣中。 音效提示词:猫叫声轻响,随即消失;雨点拍打伞面滴答作响;远处偶尔传来汽车轰鸣声和脚步声,街道弥漫湿润气息。 在大约等待了30秒后,豆包向我们发送了生成结果。提示词中描述的几个关键动作都在视频中得到了呈现,同时,画面中人物的衣着、样貌在不同的镜头中都保持了一致,视觉效果比较稳定。 自动播放 音效方面,Seedance 2.0的配音与画面内容调性一致,而像是猫叫声、脚步声这些声音则与画面内容匹配,基本实现了音画同步。 美中不足的是,对于“雨水顺着帽沿落在她的肩膀上”这部分的描述,Seedance 2.0未能还原。平心而论,液体的渲染对大多数视觉生成模型来说还是较为困难的。 紧接着,我们又尝试了一个涉及音画同步的高难度场景:乐器演奏。此前,在我们的体验中,大部分视频模型都无法准确地将音乐与画面的演奏动作同步,要么节奏对不上,要么手指动作与音符不符,要么整体演奏显得生硬、不自然。 Seedance 2.0拿到的提示词如下: 街头音乐表演,鼓手敲击节奏、吉他手弹奏旋律,观众随节奏轻拍手,音乐是拉美风格。 Seedance 2.0的生成结果可以说是较为惊艳的,在音乐风格上,它满足了我们的“拉美风格”限定词,背景中的人物、建筑风格也符合拉美风的要求。 自动播放 乐器演奏方面,鼓手的桶鼓轮奏动作与音乐的鼓点,基本达到了8成的契合度,这要比我们之前测试的字节视频生成模型好得多。 而在吉他手的演奏中,画面中手部按压的和弦和视频里模型生成的音乐也是基本契合的,左右手的手法都是自然、连贯且细节丰富,琴弦拨动与音符节奏高度对应。 细看还可以注意到,背景中观众拍手的动作和视频里的声音是精准卡点的。 我们的最后一个纯文本提示词考察的是一个超现实场景,这种场景在模型训练数据里可能分布较少,考察的是对罕见视觉元素、超现实组合和非日常场景的生成能力。 画面开场是一座夜晚的城市,全景俯拍,城市灯光闪烁,街道像河流般流动。随后,镜头慢慢拉近,出现几栋建筑缓缓离地漂浮,建筑底部闪烁着微光能量。空中漂浮的汽车像鱼群般游动,偶尔从建筑间穿梭而过。主角是一位身穿银色风衣的少年,脚下踩着悬浮板,从高楼之间穿行而过。 镜头切换至近景,少年伸手触碰漂浮的建筑,触碰瞬间建筑表面出现液态光纹,建筑缓缓旋转、折叠,随后化作光粒飞向夜空。背景出现巨大月亮,月亮上投射出城市倒影,光线折射在漂浮建筑和人物身上。 Seedance 2.0遵循了我们的镜头提示词“全景俯拍”,而提示词中相对少见的“悬浮板”、“漂浮汽车”这些元素,模型也能做到合理、真实地呈现。 自动播放 而在最后一个动作中,像是“液态光纹”、“化作光粒飞向夜空”这些复杂的画面要求,Seedance 2.0也能准确还原。 02. 图生视频出现物理Bug 结合豆包模板后玩法更多 在日常使用中,还有一大需求就是输入图像,生成视频。相比纯文本生成,图生视频往往对模型的结构理解能力、主体一致性保持能力以及动作补全能力提出更高要求。 模型不仅要“看懂”图像中的人物、环境和构图关系,还要在此基础上合理延展动作与镜头。同时,如何在生成过程中保持人物样貌、服饰细节与整体风格不发生偏移,也是衡量图生视频能力的重要标准。 我们首先上传了一个沙滩场景和一位小男孩的肖像,要求Seedance 2.0生成图中男孩在沙滩上奔跑的画面。上传图片作为输入后,可以明显感觉到模型的生成速度变慢了一些。 其实,这轮对话中Seedance 2.0的生成效果并没有此前那么超乎预期。在没有明确要求的情况下,模型生成的画面是慢动作的,这是不少AI视频生成模型的常见问题。 自动播放 从画面内容来看,我们上传的沙滩、男孩的特征基本都得到了保留,不过从物理准确性上来看,男孩在跑过沙滩的时候并没有留下脚印,有点穿帮了。 并且,在上传图片后,豆包会提示无法自定义模型比例,它将根据参考图自行选择比例。在这次案例中,它默认选择了男孩肖像图的竖版比例,其实并不符合我们的需求。 于是,我们更换了提示词的顺序,把沙滩这一背景前置了。不过,最后模型还是选择了竖版的视频比例,而且,第二次生成的画面出现了更为严重的物理规律Bug:男孩踢球的力道明显不足以让足球在天空中飞那么久。 自动播放 上线豆包后,Seedance 2.0还可以与豆包原有的多种视频生成玩法结合,提供新的体验。 比如,我们试着体验了由Seedance 2.0驱动的AI采访玩法,这一玩法支持上传人物图像,或者选择已经保存好的“分身”出镜。 一开始,我们想试着让Seedance 2.0生成马斯克与阿尔特曼这两位AI圈顶流争论的画面,但是或许是由于触及模型的安全机制,这类需求被模型直接拒绝了。 于是,我们换了一位相对没有那么知名的人物,上传了其照片。拿到生成结果后,可以明显感觉到这一模板是偏恶搞向的,画面左侧的受访者突然蹲下,头部被夸张地“拉长”,随后又像弹簧一样猛地“弹”回原位。这样的变形效果虽然充满戏剧性,但突兀而荒诞,观感上多少有些“掉San值”。 自动播放 之后,我们又上传了扎克伯格的画面,并采用官方的全息投影模板。画面中,扎克伯格带上了一个类似苹果Vision Pro的VR头显,随后整个人物逐渐转为半透明质感,背景中浮现出粒子光效,整体呈现出明显的“全息投影”视觉风格。 自动播放 我们又尝试了另一个模板“游戏追逐”,这个模板会生成一则猛兽追逐画面中主角的视频,我们上传了一只小狗的画面作为参考图。 不过,可能由于这一模板是针对人类的,对动物作为主角的画面并不适配,小狗跑起来的样子不太符合生物规律。 自动播放 03. 结语:视频制作工作流 或将被AI重塑 整体体验下来,Seedance 2.0的表现确实有明显提升。无论是长文本指令的理解与还原、复杂音画同步场景的精准匹配,还是超现实画面的稳定生成,它都展现出了明显强于以往模型的综合能力。 当然,它仍存在一些可以改进的地方,其中物理细节还有明显的优化空间。但在动作连贯性、人物一致性与镜头语言执行力上,Seedance 2.0已经开始接近成为可商用的创作工具。 随着Seedance 2.0开始进入豆包这样的大众产品,普通用户也开始能低成本、高频率地尝试视频创作。未来,视频的生产方式、创作门槛乃至内容形态,都可能被重新定义。
北大团队Nature发文:建成全球首个大规模集成光量子通信芯片网络
凤凰网科技讯 2月12日,北京大学物理学院王剑威、龚旗煌团队与电子学院常林团队在量子通信领域取得重要技术进展。该联合团队在国际学术期刊《自然》(Nature)发表论文,宣布成功研制出全功能集成的量子密钥发送芯片及光学微腔光频梳光源芯片,并基于此构建了全球首个基于集成光量子芯片的大规模量子密钥分发(QKD)网络——“未名量子芯网”。 该研究攻克了量子通信网络在扩容与小型化方面的技术瓶颈。据论文数据显示,该网络实现了20个芯片用户节点的并行通信,节点间通信距离达到370公里,成功打破了无中继传输的距离界限。在衡量网络性能的关键指标“组网能力”(客户端对数×通信距离)上,该系统达到了3700公里的水平。这一成果验证了通过集成光子技术实现大规模、长距离量子保密通信的可行性。 图1 基于光量子芯片的“未名号”大规模量子密钥分发网络:a,双场量子密钥分发芯片网络架构。b,20个QKD芯片和微梳光源芯片实物照片。 在硬件架构方面,研究团队采用了磷化铟(InP)和氮化硅(SiN)的混合材料体系。中心服务器节点部署了氮化硅光学微腔频率梳作为种子光源,利用自注入锁定技术,产生了线宽仅为40 Hz(赫兹)量级的超低噪声相干暗脉冲频率梳,替代了传统方案中复杂的桌面级激光器。用户端则采用了20枚全集成的磷化铟光量子芯片,单芯片集成了激光器、调制器等关键模块。测试结果显示,芯片关键器件的良率达到97.5%,并在晶圆级制造工艺下保持了高度的一致性。 此次研究采用的是双场量子密钥分发(TF-QKD)协议,结合波分复用技术,有效解决了多用户网络中的信号干扰与相位追踪难题。实验表明,即便在370公里的长距离光纤传输中,系统仍能维持低误码率运行,且码率突破了线性界的理论极限。该技术路线为未来降低量子通信设备成本、提升网络扩展性提供了新的芯片级解决方案。
中国AI,摘掉“贫油”帽子还要多久?
二十世纪,谁掌握石油,谁就掌握工业世界的命脉。 沙特阿美长成了全球最赚钱的公司,三桶油撑起了中国工业化的底盘。 二十一世纪,这门生意换了个名字,算力。 它像极了石油——勘探难、开采贵、运输堵。更关键的是,它不是挖出来就能用,得炼。 过去两年,舆论把聚光灯全打在大模型身上。谁发个新模型,刷屏三天;谁参数破万亿,沸腾一周。 模型当然重要。 但押注AI时代,真正具备“沙特阿美”潜质的,不是模型公司,是算力。 | 模型是面子,算力是里子 一个扎心的事实:模型会过时,算力不会。 今天你用的Transformer架构,三年前还没火;三年前的冠军模型,今天已无人问津。技术路线收敛、算法迭代加速,每一代新模型都在淘汰上一代。 但算力呢? 英伟达至今供不应求;万卡集群建好了,可以跑三代、五代模型。 模型是消费品,算力是耐用品。 更残酷的是:模型层卷出花来,最后全在给英伟达打工。 2025财年,英伟达毛利率75%。这意味着你花100块买卡,75块是“生态税”。 这不是卖显卡,这是卖矿。你挖矿,他收租。 所以谷歌拼了命搞TPU,不是它芯片设计有多牛,是它受够了“租客”身份,想当房东。 但垂直一体化是超级玩家的游戏。谷歌、微软、Meta可以,大多数公司不行。 那千行百业怎么办? | 现在:中国AI的“贫油困境” 回头看,中国AI产业过去两年像极了上世纪五十年代——明知道地下有油,就是打不出来。 不是没卡。 互联网大厂手里囤着几十万张卡。但那是英伟达的卡,租约随时可能断,供应随时可能掐。 更致命的是:卡是散的。 A公司卡在A机房,B公司卡在B机房,彼此不通,调度不动。你要训一个万亿模型,光适配就折腾半年。 这叫算力碎片化。 再加上芯片管制掐源头,生态壁垒卡中间——三重夹击下,中国AI产业其实一直在“节油模式”下运行。 不是不想踩油门,是油箱漏了。 | 转折点:从“拼卡”到“拼基础设施” 2026年工信部一纸通知,把算力正式定性为新型基础设施。 “1+M+N”算力互联互通节点体系——翻译成大白话:国家要建统一的算力电网了。 以前每家自己发电,效率低、浪费大、还不稳定。 现在国家说:我来统一规划、统一标准、统一调度,你们接上来用。 就在这时,郑州传来消息:国家超算互联网核心节点上线,三套曙光万卡超集群投入运营。 这是全国首个实际投入运营的超3万卡国产AI算力池 。 注意“实际投入运营”这五个字。 很多万卡集群建好了,但“建好”不等于“能用”。网络不行、调度不行、容错不行,几千张卡跑起来,效率还不如几百张卡。 而郑州这个池子,把“卡”变成了“池”——可被稳定调用、可被统一编排、可被持续运营。 就像油田炼成了汽油,接上了管网。 | 光合组织在干什么?帮行业“建炼厂” 2月10日,光合组织在郑州开了个会,国产万卡算力赋能大模型发展研讨会,说白了就一件事:怎么让国产算力从“有”变成“好用”。 他们干了件很具体的事:把供需双方关在一个屋子里。 算力方、模型方、应用方,过去各干各的。算力方抱怨没需求,模型方抱怨卡不好用,应用方抱怨成本太高。 光合组织做的是:把门锁上,今天不出解决方案谁也别走。 结果出共识了:自主算力是生存底座、供需协同是进化飞轮、全栈攻关是破局利刃。 这些话放在两年前,是口号。放在今天,是路线图。 | 确定性才是稀缺品 回头看AI产业的价值逻辑: 模型赛道,赢家通吃,但通吃的是谁,没人知道。今天你是明星,明天就被开源追平。 应用赛道,百花齐放,但花能开多久,没人知道。流量成本一涨,利润就没了。 只有算力,是铁打的营盘。 它不是靠灵感迭代的生意,是靠长期投入、系统能力堆出来的护城河。今天落地的万卡超集群,三年后依然是保值资产。 二十世纪,石油定义工业强国的版图。 从“贫油”到炼油产能全球第一,中国经过了几代人的努力。 而AI时代,算力版图正在重绘。 并且这一次,我们手里有钻机,有炼厂,还有正在铺开的管网。
一台晚会能办成什么样,取决于机器人
【文/观察者网专栏作者 心智观察所】 2月8日晚八点,上海。200多台机器人在镁光灯下翩翩起舞,与演员黄晓明同台变魔术,和开心麻花的喜剧演员搭档演小品,还有一台名为“精灵·璇”的仿生机器人,用逼真到令人恍惚的面部表情唱了一首《未定义的关系》。这是由上海智元机器人主办的全球首个大型机器人晚会《机器人奇妙夜》,被网友戏称为“机器人春晚”。 机器人和黄晓明表演魔术 整场晚会通过美洲、中东、东南亚等地同步直播,50分钟的时长虽然不长,却创下了多个行业纪录:首个机器人小品、首个机器人魔术、首个人机共舞华尔兹。智元机器人首席运营官邱恒在演出后说了一句颇有分量的话——“这可能会是人类理解机器人能力的‘ChatGPT时刻’。” 这句话或许稍显大胆,但它折射出的行业自信并非没有来由。就在不久前,百度“文心Moment大会”的具身智能分论坛上,来自傅利叶、开普勒、加速进化、乐聚机器人和地瓜机器人的五位行业代表围坐一堂,对具身智能产业的现状与走向进行了一场坦率而深入的讨论。一场晚会与一次圆桌,一个在台前展示能力的极限,一个在幕后剖析产业的真实。 两者叠加在一起,恰好拼出了当下中国具身智能产业最完整的截面:技术正在加速成熟,商业化的轮廓隐约可见,但通往规模化落地的道路上,仍然横亘着数据匮乏、标准缺失和路线未定等层层关卡。 一台晚会能办成什么样,取决于机器人能做到什么程度。 以往的机器人表演,通常依赖预先编程或人为遥控,机器人充其量是一个执行单一指令的工具。但《机器人奇妙夜》试图证明的是,当200多台不同类型的机器人需要在同一个舞台上完成歌舞、小品、魔术、走秀等多种形态的演出时,老办法已经完全不够用了。 智元机器人的技术团队表示,这次晚会依靠的是具身智能的系统能力——从复杂运动控制到高精度群体协同,再到初步的情感表达——才实现了“舞台级系统智能”的标准。灵犀X2机器人在舞台上连续完成后空翻、前空翻、踢腿、侧空翻等一连串高难度动作;手语翻译机器人全程为听障观众提供无障碍服务;甚至有一台机器人复刻了12年前马年春晚“小彩旗”旋转整台晚会的经典画面。 更值得关注的是技术路径背后的平台能力。智元自研的“灵创”平台实现了零代码操作:用户无需编程基础,只需上传一段人类动作视频,就能完成从真人表演到机器人复刻的端到端转化。“灵心”平台则内置了三四十款风格各异的音色,还支持“音色复刻”——上传一段录音,机器人就能拥有相似的声音。 这些平台能力的意义,远不止于办一场晚会。智元合伙人姜青松直言,它们将加速机器人在文娱商演、门店接待等场景的高效落地。换言之,舞台只是第一站,平台化的技术底座才是通向更多应用场景的关键基础设施。 而首形科技带来的仿生机器人“精灵·璇”,则从另一个维度展示了具身智能的技术纵深。不同于追求更高关节自由度和更灵活运动能力的主流路线,首形科技将技术聚焦于“人脸”——自研的情绪基座系统CharacterMind,融合了语言、表情、语音、语境等多模态信息,让机器人不仅能听懂语言,更能“读懂”语言背后的情绪。高性能无刷微型电机还能精准控制眼角微蹙、嘴角轻扬等细腻的“微表情”。当技术的精度细化到面部肌肉的毫米级控制时,机器人与人类之间的交互界面正在被重新定义。 如果说《机器人奇妙夜》展示的是具身智能“能做什么”,那么“文心moment大会”的圆桌讨论则更多地在回答“该往哪走”和“走到了哪里”。在那场讨论中,五位行业代表对市场结构的判断高度一致:当前的具身智能市场,呈现出B端务实、C端想象的双轨格局。 B端市场的优势在于需求的确定性。工业场景的客户会明确提出量化的指标——连续工作8小时、负重20至30公斤、多少年收回成本。这种清晰的需求使技术落地有了精确的方向。开普勒在宝马工厂的焊接上下料场景、加速进化在教育科研领域的深耕、乐聚在政企展厅的应用部署,都是在确定需求下的精准交付。但另一面是定制化的沉重负担:不同工厂、不同工位的需求差异巨大,要求企业投入大量精力逐一适配。开普勒软件平台负责人詹犇提出的硬件解耦思路——根据场景灵活切换灵巧手、夹爪、足式、轮式——本质上就是试图用模块化的方式降低定制成本。 C端市场则是另一番景象。乐聚机器人合伙人王松回忆起2016年创业时的尴尬:观众看到35厘米高的机器人,上来就问“能洗衣服、拖地吗?”这份期待的落差至今仍有现实意义——即便是全尺寸的人形机器人,在家庭场景中的能力边界依然模糊。但圆桌嘉宾们不约而同地将康养和医疗视为C端的突破口。逻辑很清晰:老龄化社会的刚需、相对可控的场景、用户对辅助功能而非完美功能的宽容度,让这个领域成为具身智能走进家庭的最佳切入点。 傅利叶从康复领域起家的基因,某种程度上印证了这条路径的可行性。但正如王松提醒的那样,当前机器人的“小脑”(运动控制)和“大脑”(AI算法)能力,在家庭复杂场景下的安全性仍然不够可靠。 有趣的是,晚会之后上线的机器人租赁平台“擎天租”,似乎正在打通B端与C端之间的灰色地带。999元即可租一台“奇妙夜同款”机器人上门,用于情人节互动、生日派对、亲子活动、春节拜年等场景。擎天租的数据显示,春节前两周平台订单量环比增长约30%。这种轻量化、可复制的使用方式,正在让机器人从“围观对象”转变为节日消费和社交体验中的新选择。擎天租CEO李一言认为,这种模式是机器人走向C端、实现规模化应用的重要前提。 中国大陆具身智能产业发展里程碑事件(@心智观察所制图) 回到产业的底层逻辑。如果说两三年前,行业的关键词还是“端到端全栈自研”,那么到了2025年,“生态”已经成为绕不开的话题。傅利叶CEO办公室战略客户总监时晖的感慨颇能代表行业的心态转变:十年前做康复机器人时,没人谈生态,大家都在强调从头到尾自己搞定一切。但现在,产品开始成型,模块可拆解,商业化链路开始打通,生态建设的条件终于成熟了。 乐聚机器人合伙人王松一针见血地指出了核心原因:人形机器人是一个极其复杂的系统,涵盖结构、硬件、小脑、大脑到应用的全链条,没有一家公司能够独立完成所有环节。更关键的是,当前行业在最优构型、算法架构、操作系统标准上都尚未达成共识,整个产业仍处于“野蛮探索”的阶段。在这种背景下,闭门造车的风险远大于开放协同的成本。 地瓜机器人开发者社区总监徐国晟从芯片厂商的视角提供了另一个观察维度。他反复强调的“做好基建”,实际上是在为整个产业链降低门槛。一个560T算力的芯片交付给本体厂商后,对方的反馈往往是“在调,但进展很慢”。问题不在于算力不足,而在于从模型到端侧部署的链路太长、技术门槛太高。如果芯片厂商只卖芯片,本体厂商就必须从头“造轮子”,这种低效会严重拖累产业的整体发展速度。因此,芯片端主动提供算法适配、本体厂商开源软件框架、大模型平台寻求数据共享,这些信号共同表明,单打独斗的时代正在结束。 但开源并非灵丹妙药。詹犇提出的软件分层策略更具现实意义——面对能力强的高校团队,开放到电机层的底层API;面对应用集成商,提供运动、视觉的中层接口;面对展厅客户,只需要预设好的动作库。这种“因材施教”的开放策略,既保护了核心技术壁垒,又最大化了生态的包容性。加速进化开源的Booster James架构,也是在软件层面降低开发者的接入成本。这种有选择、有层次的开放,或许是比全面开源更适合当前阶段的中国路径。 如果说生态建设是产业的“面”,那么大模型与机器人的结合则是产业的“点”——也是当前最令人期待又最让人焦虑的技术议题。在文心moment的圆桌上,所有嘉宾谈到这个话题时态度都变得格外谨慎。王松的表述最为直白,当前大模型与机器人的结合仅仅停留在最上层,要么做简单的语音交互,要么做任务级的规划调度,与本体操作层的结合并不紧密。 这个判断点出了具身智能当前最大的技术鸿沟。大模型能告诉机器人“面前是一个苹果”,但如何削皮、如何抓取、下一步做什么,这些操作层的决策仍然无法由大模型直接完成。这不是模型能力的问题,而是数据和算法架构的双重制约。徐国晟用了一个形象的对比:大语言模型可以从互联网上获取海量文本数据进行训练,但具身智能的数据必须靠机器人在真实环境中一次次采集和标注。即便上海拥有国家机器人创新中心的异构机器人数据采集场、130台机器人持续工作,相比训练通用大模型所需的数据量,仍然是杯水车薪。 更棘手的是技术路线的不确定性。大模型领域经过数年探索,Transformer架构已成为事实标准。但在具身智能领域,大脑(感知决策)与小脑(运动控制)是分离还是融合?是走端到端的VLA路线,还是保持分段式架构?这些根本性问题仍在激烈争论之中。这也从侧面解释了为什么行业对“垂类小模型”寄予厚望——既然通用大模型短期内难以在操作层实现突破,那么在特定场景下用有限数据训练专用模型便成了更务实的选择。 开普勒与百度文心合作的工业焊接垂类小模型、加速进化在机器人足球场景的持续积累,都是这一思路的体现。 站在2025年初的时间节点上,如何评估具身智能的商业化阶段?从《机器人奇妙夜》和圆桌讨论中拼出的图景来看,答案或许是:刚刚翻过研发期的最后一页,正在书写工程化落地的第一章。 积极的信号确实越来越多。歌舞娱乐类机器人已初步实现稳定营收;机器人租赁模式开始跑通,有人愿意为机器人的服务付费;魔法原子、银河通用、宇树科技、松延动力四家公司接连官宣与央视马年春晚达成合作,机器人上台正在变成常态。智元自身也公布了涵盖讲解接待、文娱商演、工业智造、物流分拣、安防巡检、商用清洁、数采训练、科研教育等八类核心场景的定制化方案。加速进化的李章宇在圆桌上透露了一个值得关注的现象:已经有一部分人拿着机器人做租赁展演、进校园课程,并且实现了盈利。当商业的正向循环开始建立,产业的飞轮就有了转动的第一推力。 但冷静审视,制约因素同样清晰。在工业场景中,机器人解决物品泛化问题后效率可提升30%至90%,商业价值明确,但稳定性暂未达到工业级标准,距离大规模商业化普及仍有较长距离。行业在最优构型、操作系统标准、数据共享机制等基础层面尚未形成共识。大模型与机器人操作层的融合停留在浅层。数据匮乏的瓶颈远未突破。换句话说,当前的具身智能产业既不是“概念炒作”的泡沫期,也不是“万事俱备”的爆发前夜,而是处在从技术可行到工程可用的艰难爬坡阶段。 傅利叶的时晖给出了一个值得重视的时间判断:2025至2026年是推动生态建设的关键时期。原因有二:产品开始成型,模块可拆解;商业化链路开始打通,前端生态可以分层。这个窗口期可能只有两三年——抓住了,中国具身智能产业就有可能在全球竞争中占据先机;错过了,可能又要等待下一个周期。 从更长远的视角看,具身智能的终局图景是清晰的。时晖的判断值得认真对待:它会像物联网、互联网、AI一样,成为千行百业的基础设施。但通向这个终局的路径,大概率不是某个“iPhone时刻”式的单点爆发,而是逐步渗透、场景驱动的渐进过程。工厂里的搬运机器人、医院里的康复助手、展厅里的讲解员、商场里的互动伙伴,每一个场景的成熟都是在为最终的大规模普及铺路。今天的《机器人奇妙夜》本身或许就是这条路上的一个路标——它证明了具身智能的“舞台级”能力已经就位,接下来要做的是把这种能力从舞台搬到车间、搬到病房、搬到千家万户。 去年9月30日,智元机器人全国首家开放式具身智能体验中心在无锡正式开业 徐国晟在圆桌讨论中描绘了这样一个场景:“这个房间里会有很多具身机器人帮我们倒水、拍照、做会务。”这不再是科幻小说里的想象,而是可以看见路径的未来。但在那一天到来之前,产业需要的不是冲动和狂热,而是王松所说的“野蛮探索阶段”应有的清醒:保持开放心态、快速迭代试错、建立柔性供应链。 从《机器人奇妙夜》的灯光璀璨到圆桌论坛的冷静剖析,中国具身智能产业正站在一个微妙的临界点上。技术的锤子已经磨得足够锋利,但真正能敲开商业化大门的那颗钉子——稳定性、标准化、规模化数据——还需要整个行业耐心而坚定地去锻造。开放、协同、务实、耐心,或许正是这个阶段最需要的四个关键词。机器人走出实验室的前夜,黎明的曙光已经依稀可见。现在的问题不再是“能不能”,而是“怎么做”和“多快”。
AI教母李飞飞最新访谈:AI的下一个前沿不是语言,而是空间智能
图片来源:Fortt Knox Z Highlights: 真正重要的是,整个人类社会、整个全球人口都能参与到AI当中,因为这是一项文明级别的技术。 AI是新一代的计算方式。这意味着:任何依赖芯片、依赖计算的设备、系统或场景,最终都会依赖AI计算。 空间感知智能(spatial perceptual intelligence)是智能的关键支点。我们日常生活中的绝大多数行为,以及整个人类文明中的工作,都依赖于空间、感知与具身智能。 李飞飞曾是Stanford Human-Centered AI Institute的创始主任,如今是World Lab的联合创始人兼首席执行官,在空间智能领域引领创新。本次访谈是她2月4日在Fortt Knox节目上,与主持人Jon Fortt关于AI发展及公司最新情况的探讨。 AI是一种文明级技术,不能只由“少数人”塑造 Jon Fortt:李飞飞博士,感谢你接受《Fortt Knox》和CNBC的访谈,也感谢你抽出时间。人们称你为“AI教母”,因为你在塑造今天商业世界正在进入的这一现实中,做了大量奠基性的工作。事情的发展,和你当初预想的一样吗? 李飞飞:是,也不是。 首先,没有任何一个人可以“独占”一个学科。我们今天所处的现代AI这场巨大变革,是几代科学家和技术人员共同努力的结果。对于我们这些在这个领域已经深耕很久的人来说,我们当然一直相信AI的力量,也相信这门科学所能达到的高度。它是一种文明级别的技术。 但我必须说,过去——我可以说近十年,尤其是最近这几年——AI发展的速度,真的超出了我们很多人最狂野的想象。看到整个产业全面拥抱AI,同时整个社会也从各种不同的角度、不同的维度,带着非常强烈的情绪在讨论AI,这种感觉至今仍然有点不真实。但与此同时,它也让我感受到一种沉甸甸的责任。 Jon Fortt:你做了大量工作,来确保在AI的开发过程中,有更广泛的人群和视角能够参与其中,也能获得使用AI的机会。比如你曾多次谈到女性在AI领域中的角色。我想请你帮我们勾勒一下,你眼中“利害关系”究竟在哪里。 因为过去,我们讨论的是文学作品中不同视角的代表性,讨论的是媒体中的多元表达。但现在,我们几乎是在直接构建世界的版本,而这些版本将会反过来影响现实世界如何运转。为什么让多种多样的声音参与其中如此重要? 李飞飞:这不仅仅是“多一些不同的声音”这么简单。真正重要的是,整个人类社会、整个全球人口都能参与到AI当中,因为这是一项文明级别的技术。无论我们谈的是医疗健康、农业、教育的变革,还是机器人、能源与可持续发展,我们生活的每一个方面、工作的每一个方面,都会受到这项技术的影响。 人们经常问我:什么是AI?该如何理解它的影响范围和覆盖面?我常用的一个例子——其实也不完全是类比——是去想一想“芯片”可以存在于哪里。我们常常把芯片想象成那种体量很大、能耗很高的东西。但事实并非如此。现在几乎每一个灯泡里都有一颗非常小的芯片。你的冰箱里有芯片。汽车里有芯片。飞机里则有大量的芯片。只要有芯片的地方——从最微小的芯片到大型芯片——就有计算能力。因为芯片是计算的硬件基础。 而AI是新一代的计算方式。这意味着:任何依赖芯片、依赖计算的设备、系统或场景,最终都会依赖AI计算。所以你就能理解,这项技术的影响有多么深远。因此,它的“利害关系”就是——一切。当然,它会分阶段到来,但在这个时间点上,我们的学界、我们的社会,必须理解这项技术的深远意义。 Jon Fortt:我最近思考这个问题的一个角度是这样的。几个月前,也就是去年夏天,我有机会去曼谷参加CNBC举办的一场活动。在那里,我见到了我一位高中时期的老朋友——Kasimatharn Pippachai。他当时正在SCB10X工作,参与一个叫Typhoon的项目。这个项目的目标,是构建原生泰语的AI模型,而不是依赖英语、普通话等等其他语言。在那次拜访之后,在和我这位老朋友聊完他们正在做的事情之后,我开始用一种完全不同的方式去思考“本土化AI”的意义。 如果AI真正理解你的语言、你的文化、你的生活方式,那会怎样?而如果它不理解,如果你根本没有参与到这个系统的构建中来——谁会被包括进来?谁又会被排除在外?关于语言与文化如何深刻影响AI的理解方式,以及如果这些因素没有被纳入设计中,哪些人可能会被系统性地忽视——我们对这些问题的讨论,是否已经足够多了? 李飞飞:是的,我确实经常在世界各地旅行,与来自各行各业的人交流,包括欧洲、APEC地区以及美洲各国的政府与机构。我认为,人们、国家以及不同区域都非常清楚本土化AI的必要性。 我们现在的讨论重点常常放在语言模型上,这当然非常重要。你刚才举的例子,本身就是一个语言模型的案例。但AI并不只等同于语言模型。即便我们只聚焦在语言模型这一点上,本土化AI对人们来说也是至关重要的。不同地区、不同背景的人,拥有不同的文化、语境、共同经验以及情境细微差别。无论是艺术家、制造业从业者,还是其他任何行业的人,这些差异都必须被AI理解和尊重。 而且我认为,推动这件事的不只是“自上而下”的政策意图,并不是因为我们觉得“应该这么做”。真正的驱动力来自市场,来自人们本身的需求。我看到来自很多地区、很多政府,都对构建本土化AI表现出非常健康、积极的兴趣。 语言模型不是终点,空间智能是AI下一前沿 Jon Fortt:你提到AI不只是语言,这是一个很好的过渡,引向World Labs。你关注的不仅仅是文本提示和回复,而是沉浸式的、受物理规律影响的三维交互。我想这其中会涉及材质、触感,甚至在某个阶段,可能还能做烹饪模拟之类的事情。你认为在未来五年、十年,这样的技术会带来什么样的能力?你会把它和你多年前在图像领域所做的工作,做怎样的类比? 李飞飞:我的职业生涯是从计算机视觉开始的,它是AI的一个子领域。就像我一些同事是从自然语言处理起步一样,最终自然语言处理与AI的其他分支共同推动了GPT这样的技术出现。 在整个职业生涯中一直从事视觉AI研究,让我深刻意识到:空间感知智能(spatial perceptual intelligence)是智能的关键支点。 从进化的角度、从人类自身的角度来看,我们并不是只靠“说话”来生活的。我们早上醒来,会拥抱自己的孩子。会给他们做早餐。会开车送他们去上学。我们自己去上班。点一杯咖啡,并且知道该如何端起它、喝下它。 我们日常生活中的绝大多数行为,以及整个人类文明中的工作,都依赖于空间、感知与具身智能。因此,在语言模型之外,AI的下一章、下一个前沿,正是空间智能。这也是为什么我们在不到两年前创立了World Labs。我们专注于打造下一代前沿模型,让AI能够推理、理解、交互,并生成三维、四维的世界。这些能力将赋能大量应用场景,包括:模拟、机器人、创意产业、设计、教育、医疗健康、制造业,以及更多横向扩展的空间智能应用领域。 Jon Fortt:因为这在某种程度上就相当于“图像捕捉”的进阶版本,它可以教会系统理解事物是如何运动的、相互碰撞时会发生什么、是否会碎裂,或者是否具有韧性。这些东西,单靠语言是没法完整描述的,对吗? 李飞飞:是的,确实无法做到。 首先,这已经不只是“用图像来进行推理”那么简单了,因为那仍然是一种相对被动的方式。而通过世界建模(world modeling)与空间智能,AI可以变得具有主体性(agentic)。它可以被计算、被规划,能够为具身智能体(embodied agents)提供更主动的能力。 就像我刚才举的例子,比如说你在做一顿饭,哪怕只是做一份很简单的意大利面。你当然可以用语言来描述这15分钟或20分钟的过程,但那仍然是一种高度有损的信息表达。比如你是怎么调酱汁的,你是如何把意面放进水里的,意面在水里发生了什么变化——这些细微之处,几乎不可能只用语言来准确描述。 而现实世界中的大量物理过程,不管是由人类发起的,还是人类与非人类系统之间的交互,本质上都超出了语言本身所能承载的范围。 Jon Fortt:最后一个问题。我知道你今天还有很多事情要做、很多人要见,非常感谢你抽出时间。你们在World Labs所做的这些事情,有一个应用场景很自然地会让人想到——那就是游戏产业。这里既有巨大的商业价值,也有创新空间和团队协作的可能性。我们应该在多大程度上期待,你们的这些工作会体现在更快、更高效的游戏开发中,并以此作为一种扩散影响力的方式? 李飞飞:是的,你说得完全对。游戏和互动式体验,确实是我们非常兴奋的一个市场方向。就在去年,大约两个月前——现在还只是二月初——我们发布了自己的第一个模型,以及一个名为Marble(World Labs出品)的产品原型。已经有非常多的游戏开发者在使用这些工具,玩得很开心,也不断向我们展示他们正在制作的作品。当然,目前这些还不是3A级别的大型游戏,而是体量更小的项目,但这本身就已经让我们非常兴奋。因为这意味着,我们已经开始真正赋能游戏开发者的创造力与创新能力。 Jon Fortt:非常期待接下来会发生什么。李飞飞博士,感谢你接受我的采访。 李飞飞:谢谢你,Jon。
清华大学3D打印新突破!速度提升50倍
快科技2月12日消息,清华大学今天发文称,该校戴琼海院士团队历经五年攻关,研发出计算全息光场(DISH)三维打印技术,相关成果发表于《自然》。 该技术将传统体积3D打印的曝光速度提升50倍,毫米尺寸复杂结构的曝光时间仅需0.6秒,远超传统体积三维打印技术曝光的30秒水平。 打印过程实拍,不到一秒即可完成毫米尺寸物体打印 传统3D打印技术各有短板,逐点、逐层打印精度高但效率极低,毫米级物体加工动辄数十分钟;现有体积打印虽提升速度,却受景深、材料粘度限制,精度和适用范围大打折扣。 团队创新将计算光学反向应用于3D打印,通过操纵高维光场构建三维实体,改写了传统打印的底层逻辑,还攻克了光场高速调控、光路高精度矫正等多项技术难题。 这项新技术实现了多重突破,不仅打印速度大幅提升,还兼容从近水粘度稀溶液到高粘度树脂的各类材料,解决了传统技术材料选择单一的问题。 打印容器无需特殊设计,可在流体管道内实现批量连续打印,拓展了应用场景。 同时,技术将打印景深从50微米拓展至1厘米,1厘米范围内光学分辨率保持11微米,打印最细特征达12微米,实现速度与精度的双重提升。 该技术整合多学科优势,未来在生物医学、工程制造等领域应用前景广阔,可实现生物组织原位打印、微型组件批量生产等等。 DISH技术系统设计图
苹果遭遇“黑色星期四” 回应Siri更新跳票:仍计划在2026年推出
苹果Siri 凤凰网科技讯 北京时间2月13日,据CNBC报道,苹果公司在周四遭遇了自去年4月以来最糟糕的一个交易日。此前有报道称,苹果语音助手Siri在AI方面的更新再次跳票,而且其新闻应用遭到监管部门审查。 截至周四美股收盘,苹果股价下跌5%,抹去了今年以来的全部涨幅,2026年迄今为止累计下跌近4%。 彭博社在周三报道称,苹果备受期待的Siri AI更新已在公司内部被推迟至5月甚至更晚。该更新原计划在几周内推出,但苹果现在可能会将各项功能在数月内分批逐步推出。 苹果对CNBC表示,公司仍将按计划在2026年推出Siri更新。 另外,美国联邦贸易委员会(FTC)已警告苹果,不得在其Apple News新闻平台上压制保守派内容。 FTC主席安德鲁·弗格森(Andrew Ferguson)在致苹果CEO蒂姆·库克(Tim Cook)的信函中称,“Apple News基于文章或出版物的意识形态或政治立场来压制或推广新闻文章的任何行为或做法,都可能违反美国防止企业误导消费者的相关法律”。 上个月,苹果新一季财报超出了华尔街预期。不过,该股近期也受到华尔街对大型科技公司在AI领域投入过多支出的担忧所影响。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。