行业分类:
加载中...
头条分类:
加载中...
德适生物发布国产医学影像大模型,参数规模全球最大
凤凰网科技讯 9月27日,第四届全球数字贸易博览会25日在杭州启幕,多家顶尖数字科技企业汇聚一堂。展会期间,本土企业德适生物(DIAGENS)发布了其自主研发的医学影像通用大模型iMedImage,据称是目前全球参数规模最大的同类模型,并因此从300多个参评项目中脱颖而出,荣获本届数贸会的先锋奖(DT奖)。 德适生物有关负责人在首发首秀舞台发布“iMedImage的医学影像通用大模型” 德适生物在现场展示了这款大模型的强大能力。据介绍,iMedImage大模型基于8000万级别的医疗数据完成预训练,其技术特点在于广泛的适用性,能够支持CT、MRI、染色体等19种不同的医学影像模态,覆盖了超过九成的临床应用场景。现场演示中,该模型平台实现了从数据导入到专病模型生成的一站式自动化流程,大幅降低了技术门槛。与传统专科模型开发相比,利用iMedImage™构建一个新的专病模型,仅需数百例影像数据和数天训练时间,可使研发成本降低超过90%。 德适生物有关产品负责人为现场观众演示 除了发布AI大模型,德适生物还在展会现场展示了另一项核心技术成果——“全自动无人值守细胞实验流水线”。该设备能够将传统需要数周的细胞分析流程缩短至7天以内,准确率达到99.86%。凭借其高效与精准,该流水线的核心模块已被评为国际首台(套)装备。 市场数据表明,德适生物在特定细分领域已取得领先地位。2024年,该公司在中国染色体核型分析市场的占有率达到30.6%,位居行业第一,打破了过去由卡尔蔡司、徕卡等国际品牌长期主导的市场格局。 签约现场 展会期间,德适生物还宣布与武桐树、浪潮集团、中兴通讯签署战略合作协议,旨在共同加速AI技术在医学影像领域的科研转化与产业落地。
不造机器人只做系统,Meta的野心是成为“机器人界的安卓”
IT之家 9 月 27 日消息,科技媒体 The Verge 今天(9 月 27 日)发布博文,报道称 Meta 公司首席技术官安德鲁・博斯沃思(Andrew Bosworth)于近期首次深入披露,公司已将研发人形机器人(内部代号“Metabot”)提升至与 AR 同等重要的战略高度,这意味着未来将投入数十亿美元。 IT之家援引博文介绍,在首席执行官马克・扎克伯格(Mark Zuckerberg)的指示下,Meta 公司今年早些时候已成立一个专门的研究团队,专门攻克人形机器人的核心技术难题,标志着 Meta 正式入局这一前沿科技赛道。 博斯沃思强调,与行业普遍认知不同,Meta 认为人形机器人发展的真正瓶颈并非硬件,而在于软件。他以拿起水杯为例解释,现有机器人可以完成行走、奔跑甚至后空翻等动作。 然而,在执行拿起水杯这类需要精细力度的“灵巧操控”任务时,机器人极易因无法精确感知和控制力量而压碎杯子或打翻液体,解决这一软件难题是 Meta 当前的首要任务。 为实现这一目标,Meta 计划采取类似谷歌安卓的开放平台策略,公司并不追求成为主要的硬件制造商,而是希望开发一套强大的软件系统,并将其授权给其他机器人生产商。 博斯沃思表示,任何符合特定规格的机器人硬件,都可以搭载 Meta 的软件平台。这一模式旨在通过开放合作快速推动整个机器人行业生态的发展,让 Meta 成为行业标准制定者。 图源:Andrew Bosworth 的 Facebook 在技术路径上,Meta 新成立的超级智能 AI 实验室将与机器人团队紧密合作,共同构建一个能够模拟现实世界物理规律的“世界模型”。该模型旨在为机器人提供空间感知和精细操作的能力,弥补现有机器人“传感器回路”的缺失。 同时,博斯沃思对特斯拉通过视觉数据驱动机器人的方式提出疑问,认为机器人领域的数据采集难度远高于自动驾驶,这也是 Meta 选择自建基础模型的原因。 在人才方面,为确保项目成功,Meta 已招揽了一支星光熠熠的技术团队。该团队由自动驾驶公司 Cruise 的前 CEO 马克・惠顿领导,并成功吸引了被誉为“当今最伟大机器人专家”的 MIT 教授金相培(Sangbae Kim)加盟。 此外,多位在 Meta 工作超过十年的资深工程师也已加入该项目,共同构成了推动 Meta 人形机器人战略前进的核心力量。
ECS精英上架Liva Z11 Plus迷你主机:双网口
IT之家 9 月 27 日消息,科技媒体 liliputing 昨日(9 月 26 日)发布博文,报道称精英电脑(ECS)在其官网更新产品线,正式上架了 Liva Z11 Plus 迷你主机页面,揭晓了其完整的硬件规格。这款迷你主机机身紧凑,尺寸为 114.4 x 114.4 x 54.5 毫米,适合空间有限的办公或家庭环境。 性能方面,Liva Z11 Plus 提供了强大的处理器选项。用户可在英特尔 Meteor Lake 架构的酷睿 Ultra 5 125H、Ultra 7 155H,以及下一代 Arrow Lake 架构的酷睿 Ultra 5 225H 和 Ultra 7 255H 之间进行选择。 IT之家援引博文介绍,机身内置两个 SODIMM 内存插槽,Arrow Lake 型号最高支持 96GB 的 DDR5-6400 内存,而 Meteor Lake 型号则最高支持 96GB 的 DDR5-5600 内存。 在存储配置上,该主机通过一个 M.2 2280 和一个 M.2 2242 插槽,支持安装两块 PCIe 4.0 x4 高速固态硬盘。 此外,机内还预留了一个 M.2 2230 接口,用于安装无线网卡,确保网络连接的灵活性。这种双硬盘加独立无线网卡的配置,在同类迷你主机中极具竞争力。 接口配置是 Liva Z11 Plus 的另一大亮点。它配备了两个传输速率高达 40Gbps 的 USB4 Type-C 接口、一个 20Gbps 的 USB 3.2 Gen 2x2 Type-C 接口,以及多个 Type-A 接口。 视频输出方面,它提供两个 HDMI 接口,支持双 4K 显示。网络方面则同时配备了 2.5Gb 和千兆双有线网口。值得注意的是,该机并未设置 3.5mm 音频接口,用户需通过 USB 或 HDMI 端口外接音频设备。 IT之家暂未发现该迷你主机售价和发售时间信息。
GoPro MAX 2旗舰运动相机国行上架:真8K全景拍摄,3998元
IT之家 9 月 27 日消息,GoPro 于 9 月 23 日推出了 MAX 2 旗舰运动相机,支持真 8K 全景拍摄。目前该产品国行已上架京东,商品页显示定价为 3998 元,将于 10 月 11 日首销。 据介绍,MAX 2 的最大亮点莫过于其原生 8K 全景拍摄能力,通过双镜头 360° 全景相机模式,MAX 2 能够呈现 3500 万像素的画质,带来真正的 8K 分辨率 360° 视频,有效分辨率比其他运动相机高出 21%。前置或后置镜头均可拍摄 4K 60 帧 180° 超广视角视频,其他运动相机视角范围仅 170°。 MAX 2 还新增了可替换式镜头设计,用户可以在户外手动更换镜头,无需工具,即换即拍。 MAX 2 支持高画质高帧率,升级 5.6K60+8K30 格式,拍摄超清晰、更流畅;支持 3 倍慢动作,4K 100 帧,实现 360 视频中高达 3 倍慢动作;支持拍摄 2900 万像素的高质量 360° 照片,后期再选取角度构图。 MAX 2 支持 10-Bit 色深,能够记录 10.7 亿种色彩。配合 GP-Log 模式 300Mbps 比特率,为用户提供更大、更专业的后期调色空间。 MAX 2 提供了三种安装方式,包括兼容快拆式磁吸底座、内置折叠快拆扣以及 1/4-20 螺纹接口,可搭配标准相机配件使用。 MAX 2 配备了升级的 6 颗麦克风,能够捕捉 360° 立体声。用户可以通过连接 Apple AirPods、蓝牙耳机或无线麦克风进行旁白录制,甚至远程下达语音指令。不仅具有先进的降风噪能力还能在相机进水后迅速排水,以保证声音清晰。 MAX 2 能够以 2900 万像素超高分辨率的 360° 照片捕捉房屋内的细节,只需几分钟即可完成房屋的虚拟导览创建。 MAX 2 配备了 1960mAh 的 Enduro 电池,超大容量确保远离续航焦虑,即使在低温环境下也能正常拍摄。 MAX 2 支持 360°8K 夜景模式、360°8K 延时摄影、360° 移动延时摄影、360° 定时拍摄、第一视角 + 自拍模式自由切换、MAX HYPERSMOOTH + 地平线锁定超强防抖,还支持 5 米防水、时间码同步、内置 GPS 功能、MotionFrame 模式、第一人称视角模式、AI 智能追踪技术、CameraFx 特效、先拍摄再构图。 MAX 2 还推出了全新配件系列,包括 1 米碳纤维杆、80cm 漂浮式延长杆、带锁 1/4-20 安装卡扣、碳纤维延长套装、MAX2 USB 传输转口等。
三星One UI 8.5影像前瞻:原生支持LUT调色与3D视频录制
IT之家 9 月 27 日消息,消息源 @achour_hm 昨日(9 月 26 日)在 X 平台发布图文,分享了 One UI 8.5 系统泄露版细节,表明三星将为 Galaxy S26 系列等手机引入多项专业级相机工具。 IT之家援引博文介绍新功能主要包括两方面: 一是在系统自带的视频编辑器中集成支持 LUT(色彩查找表)的,大幅简化 Log 格式视频的调色流程; 二是在原生相机应用中加入了 3D 拍摄功能,用户无需额外应用即可录制空间视频。 三星已在 Galaxy S25 系列开始引入 Log 视频拍摄功能,并将其下放至 Galaxy S24 Ultra。 在 LUT 支持方面,Log 视频画面色彩通常情况下偏灰,为后期调色提供更大空间,而 LUT 则如同照片滤镜,是一系列能快速改变 Log 视频风格的色彩预设。 泄露的视频显示,系统内置了包括标准、大片、惊悚和浪漫喜剧等多种 LUT 风格,这将大幅简化专业视频的后期制作流程。 另一项重大升级是原生相机应用将直接支持 3D 视频与照片的拍摄,此前实现该功能通常需要借助第三方应用。开发者在 One UI 8.5 的相机应用代码中发现了关于“3D 拍摄”和名为“APV(高级专业视频)”新格式的引用。 代码同时暗示该功能存在一定限制,例如可能仅支持主摄像头,且在光线不足时会发出警告。新增的 APV 格式视频,未来或可在相册应用中直接转换为通用的 HEVC 格式。
Kimi第一次有自己的电脑了,分析师、工程师样样精通,一手实测来了
作者 | 陈骏达 编辑 | 云鹏 智东西9月27日报道,近日,月之暗面正在小规模灰度测试Kimi的Agent模式“OK Computer”。OK Computer的目标是通过更多轮次推理、更多工具调用、更多token消耗,带来更多智能,月之暗面将其定义为一款“全栈助理”。 在OK Computer模式下,Kimi将拥有自己的虚拟电脑,可以连续工作几十分钟,一步一步自主完成需求调研、规划、分析、设计、开发等环节。 OK Computer工作界面,左侧为聊天框,右侧为虚拟电脑(图源:智东西) 与传统依赖人工预设工作流的方式不同,OK Computer背后是月之暗面的原生Agent模型Kimi K2,能应对更多任务场景和突发情况。 借助端到端强化学习技术,Kimi K2掌握了文件系统、浏览器、终端、代码、图片生成、音频生成等20多种工具的使用方式,拥有完成复杂任务所需的内在知识。 官方Demo中,OK Computer能够直接交付功能模块丰富的多页面网站、移动端友好的Web应用以及可编辑的高品质演示文稿等产出物,也能够把几十万行的Excel 数据进行可视化、交互式呈现。 目前,过去两年曾经给予Kimi打赏鼓励的用户,将优先获得OK Computer的体验席位,这部分用户打开网页版Kimi即可收到邀请。 月之暗面称,Agent模式下单个任务的token消耗量可达常规对话模式的几十倍,OK Computer会根据服务器负载情况逐步扩大灰度测试范围。智东西也对OK Computer的表现进行了体验。 一、一手体验海量数据分析能力,把英伟达投资策略捋清了 获得OK Computer模式体验机会的用户,在Kimi首页输入框的左下角能找到OK Computer模式的切换按钮,点击后即可使用。 官方提供了OK Computer模式下的一些模板提示词,如果想体验其能力,又不愿意撰写复杂提示词,可以直接选用这些模板。 智东西从中选择了一项数据可视化任务,要求Kimi从雅虎财经获取英伟达过去两年的股价和财报数据,并分析股价的暴涨是否主要发生在财报发布前后、比较估值(市盈率P/E)与标普500科技板块的平均值。 此外,Kimi还需模拟在每次财报发布前一周买入,发布后一周卖出的交易策略,长期来看是否盈利。 设计风格方面,提示词要求Kimi采用低饱和度的英伟达品牌色,保持布局简洁和谐,仅使用纯色(无渐变),并通过优雅图标提升清晰度。 收到任务后,Kimi会在右侧呈现它在虚拟电脑中进行的各类操作。在开始任务之前,它一般会撰写待办事项,对任务流程进行全面规划,然后再正式执行。 开启OK Computer模式后,Kimi会列出其进行的每一步操作,包括使用数据源、使用文件、使用iPython、使用部署工具等等。分析完成后,它还用简洁的语言给出了关键发现,并将分析图表和结论做成了一个完整的网站,耗时5分钟左右。 可以看到,Kimi给出的网页完成度较高,数据可视化清晰,跳转逻辑正确,还提供了JSON格式的分析数据。 智东西核验了页面中部分关键数据的正确性,如英伟达市值、股价等等。在我们的抽查范围内,数据基本无误,不过英伟达的市盈率与雅虎财经上显示的数据有出入。 这一任务考察的能力类型众多,OK Computer模式下的Kimi需要从指定来源抓取正确数据和对应时间,理解提示词中谈到的各种金融术语,还需要利用Python进行数据分析,并将结果按照风格要求可视化。如果是人工完成,可能需要耗费数小时。 我们将官方提示词中的企业从英伟达改为AMD,切换了比较的基准,Kimi同样能给出类似质量的分析结果,这在某种程度上也印证了其能力不是完全靠“背题”实现的。 不过,OK Computer并不是市面上唯一一款具备类似能力的Agent,我们也将这一任务交给了Manus。 可以看到,Manus的执行风格更偏向直接上手做,收到任务后直接就开始查询财经数据的API了。Manus最终交付了一份MarkDown文档,以及四张数据图表。 Manus的报告内容更为宏观,在具体数据的呈现上比OK Computer更少,报告长度也更短,任务耗时比OK Computer长。数据可视化方面,其图表的美观程度和OK Computer相比还有一定差距。 二、擅长PPT、多功能网站开发,多位网友给出好评 月之暗面介绍,OK Computer已掌握的工具集包括列待办事项、写Python代码、操作终端、浏览网页、文字搜索、图片搜索、图片生成、音频生成、接入专业财经数据源、网站部署等。 在该公司的内部测试中,OK Computer目前擅长的任务类型,包括多功能网站原型开发、海量数据分析与可视化、高品质演示PPT制作等。 x平台上的一名科技博主分享,他用OK Computer打造了一个功能完备的星座网站。这个网站可以帮助用户了解每个星座的特征,还可以比较两个星座之间是否匹配。其设计风格也与网站的主题较为匹配。 OK Computer生成的星座网站(图源:Gadgetify) 还有网友分享,自己用OK Computer打造了一个文档比较网站,可以看到这一网站设计简洁美观,这位网友反馈完成率还不错。 官方Demo中,借助OK Computer,Kimi还打造了一份对电影《2001太空漫游》视觉元素的深度解析PPT,要求仅使用电影原图与影视和学术深度解析文章。 Kimi会先设定计划,搜索电影原图素材和关键场景的图片,搜索电影深度解释和学术研究资料,经过深度研究和素材资料收集,然后才开始按照视觉规范制作PPT。 最终,Kimi可以交付一份演示文稿,既可以在线分享,也可以下载到本地。 结语:从问答机器到全栈开发,大模型竞逐Agent能力 月之暗面称,未来他们会为OK Computer模式带来更丰富的工具选项和自定义工具能力,也支持连接更多外部应用,让Kimi可以完成更多类型的任务。 这也顺应了行业内的一大趋势:通用大模型正从知识问答阶段、生产力工具阶段迈向通用Agent阶段。未来,谁能率先在工具生态整合、长时任务执行、可靠性和合规性上建立优势,谁就可能在新一轮竞争中占据先机。
OpenAI最强“主动智能”提前享受,一觉醒来晨报送上,Pro用户赢麻了
智东西 作者 | 陈骏达 编辑 | 云鹏 智东西9月26日报道,今天,OpenAI正在为ChatGPT移动端Pro用户推出一项全新功能——Pulse。与以往相比,最大的不同在于,ChatGPT不再只是“等你发问”,而是开始“主动推送”。 Pulse会在夜间主动进行研究,并根据用户的聊天记录、兴趣、反馈等,每天清晨推送一份量身定制的资讯卡片。 在官方Demo视频中,OpenAI展示了Pulse的交互体验。可以看到,信息是以一张张卡片形式呈现的,Pulse可以在用户出行前主动给出对希思罗机场的介绍,避免用户在欧洲最繁忙的机场里晕头转向;或是给用户提出建议,帮助小猫适应新的日常。 OpenAI介绍称,Pulse的目标不是让用户沉迷于信息流,而是通过简洁的每日资讯更新,帮助人们更快获取所需内容,然后“回到生活本身”。 资讯卡片里的信息可能包括用户关注的热点话题、当日的晚餐建议,或长期目标(如健身、旅行计划)的提醒。 Pulse甚至可以直接与邮箱、日历等应用集成,相当于给用户的生活装了个MCP接口,让Pulse能了解用户的日程,提供更精确的内容。 OpenAI创始人兼CEO Sam Altman发文称,Pulse是他目前最喜欢的ChatGPT功能,可以视为一个超级称职的私人助理,只要向它分享自己的偏好,就能主动为用户做好工作。这也是Altman眼中ChatGPT的未来——从完全被动转变为主动,并且高度个性化。 用户可以通过“策划”功能指定第二天想看到的主题,例如本地活动、学习技巧或职业网球资讯;也能用点赞或点踩的方式快速反馈。随着时间推移,Pulse将根据用户的习惯不断调整内容,提供更精准的个性化推荐。 目前,Pulse功能仅在Pro用户中试运行,后续计划扩展至Plus,最终面向所有ChatGPT用户开放。 已经有不少Pro用户收到自己的第一份Pulse晨报了,总体来看,网友对这一新功能的反馈比较积极。 医疗技术公司Klick Health的生成式AI执行副总裁Simon Smith发文称,Pulse和AI搜索引擎Perplexity的“发现”功能十分类似,但更加个性化,甚至可以为用户随口一问的问题,找到对应的深度文章,提供更为全面的见解。 他认为Pulse也可能影响人们的新闻和社交媒体消费习惯。它为OpenAI提供了一个非常清晰的界面,可以在未来插入广告,也许还可以围绕它建立一个社交网络。 还有网友分享,Pulse可根据对话主动展示她可能感兴趣的内容,点击每张卡片后都会打开一个新的对话,其中包含非常有用的信息。 Pulse支持Gmail和谷歌日历集成。启用后,ChatGPT能为用户自动生成会议议程、提醒准备礼物,甚至根据行程推荐餐厅。所有集成功能均为默认关闭,用户可随时开启或关闭。同时,Pulse展示的内容都会经过安全审查,以避免违规或有害信息。 OpenAI的个性化部门打造了Pulse功能。该部门负责人Christina Wadsworth Kaplan晒出了接入日历后的个性化体验。ChatGPT能通过接入日历,把上下文直接扩展到用户在现实世界的生活。推文中,Pulse便主动向Kaplan提供了为她父亲庆生的建议。 OpenAI在开发Pulse期间,邀请了大学生进行早期测试。团队发现,当用户明确表达想要的内容时,Pulse的实用性大幅提升。这也促使OpenAI在产品中增加更多反馈入口,让用户能够一步步打造出更贴合自身需求的每日资讯更新,参与测试的大学生们也分享了自己的使用体验。 一位正在参加潜水课程的学生提到,Pulse不仅关注到他在技能与心理压力上的挑战,还把潜水和风险管理联系在一起,提供了恰到好处的建议。他说:“它能把我不同的兴趣点类比到一起,真的很酷。而且它给的建议刚好针对了我最困难的部分,非常有帮助。” 另一位用户则对Pulse的主动性印象深刻:“有一次ChatGPT意识到我即将返校,主动帮我准备。它知道我暑假在家,之前一直在国外学习,于是推送了过去半年里我大学所在城镇的变化。这让我大为震惊,它的主动性和实用性真的让我感到惊喜。” 还有用户体验到了Pulse的“兴趣组合”能力。他回忆道:“它把我和它在不同对话里探讨过的两种计算机图形学技术结合了起来。一种是我艺术项目里用到的,另一种是我出于好奇学的。我从没想过要把这两者结合,但它的建议让我灵光一闪。我打算把这个想法实践出来,让我的艺术作品迈向一个新的维度。” 结语:ChatGPT再进化,主动智能会成为下一个方向吗? 主动智能(Proactive Intelligence)已经成为不少AI企业竞相打造的下一个功能,从Meta AI眼镜的Live AI功能,再到OpenAI此次发布的Pulse,都希望化被动为主动,从工具化的问答机器,逐渐转变为眼里有活的智能助手。 而这已经不是OpenAI首次探索主动智能的方向了。实际上,GPT-5升级后,我们便能在与其沟通中发现,模型越来越经常向用户提出下一步建议,甚至会主动补充背景信息、提供延伸思路。 在模型的能力和相关的记忆、安全、MCP机制不断完善后,我们或许能见证主动智能给用户提供更为定制化的体验。
暗潮汹涌,云厂商打响Agent Infra之战,阿里云凭什么冲出重围?
作者 | 陈骏达 编辑 | 漠影 “我的数据库……没了?” 今年7月,一位名为“Jason”的网友在X平台上分享了一场Vibe Coding灾难。他在开发平台Replit上使用其内置的Agent辅助编程,在一次操作中,Agent在没有明确用户指令的情况下,竟错误地执行了一个致命的数据库命令。 顷刻之间,他长达80小时的工作成果被清空。这无异于一位本应协助你的“数字员工”,在未经允许的情况下,走进你的办公室,将你写了数周的项目资料全部扔进了碎纸机。 Jason的遭遇绝非孤例,这揭示了Agent从原型演示到投入生产环境之间尚未跨越的鸿沟,即底层基础设施(Infra)的缺失。 当前,AI模型正在从被动的问答工具,转变为能够自主规划、执行任务的Agent数字员工。然而,如何为这些员工提供足够强大的算力和工具,并赋予长期记忆,又如何为它们设定权限红线,确保它们不会“误触红色按钮”,已成为Agent规模化普及前的巨大挑战。 没有坚实可靠的Agent Infra,再聪明的Agent也无法成为可信赖的生产力。Replit的这次事故,正是这种风险最生动的注脚。 而这也正是阿里云、AWS、谷歌云、微软Azure等云厂商争相发力Agent Infra的核心原因。他们试图打造的并非一个简单的工具集,而是一座现代化的 “智能车间”。 在这里,每个AI Agent都将在安全的环境中工作,拥有清晰的权限、稳定的工具和足够的数据,从而真正从实验室的原型,转变为真实生产环境中可靠数字员工。 一、Agent规模化落地挑战大,配套Infra已成必选项 企业为何需要这样一座Agent智能车间呢? 要让Agent在生产场景中发挥作用,我们需要为其提供足够的算力和数据(记忆),帮助Agent解决水土不服的问题。 例如,当Agent分析海量数据时,本地设备既无法承载庞大的数据洪流,也无法完成复杂的推理运算。这时,云端算力的支持就成了理所当然的选择。 此外,要让Agent做出正确的决策,就需要为其提供全面、准确且实时的信息,否则,其决策将基于不完整或过时的数据,导致输出结果不可靠,甚至产生错误。 但这仅仅是第一关,更大的隐患在于安全与权限控制的缺失。今年,知名AI搜索独角兽Perplexity旗下的Comet AI浏览器就曾爆出安全丑闻。 这款AI浏览器本质上就是一个能直接操纵用户设备的Agent,然而,由于缺乏安全机制,它在阅读到网页上植入的恶意指令后,能直接打开用户邮箱、收取验证码,还把验证码分享给外部黑客,一条龙完成盗号。 这一事件暴露了将拥有高权限的Agent直接部署在开放环境中的巨大风险,企业必须为Agent打造配套的基础设施。 然而,Agent Infra极为复杂,涉及底层算力调度、安全沙箱、模型集成、记忆数据库、工具调用链路等一系列核心技术模块,企业自建成本高昂且技术门槛难以逾越,后续维护也需要持续投入顶尖的研发团队,并时刻应对层出不穷的新型安全威胁,堪称一个填不满的技术深坑。 采用云厂商们开发的现成Agent Infra套件,对大多数企业而言是更为现实的选择。例如,知名Agent产品Manus便是通过Agent Infra创企E2B打造的沙盒环境,让Manus的Agent获得了完整的终端访问权限,也提供了持久化的工作空间,这对于Manus广为人知的长链路任务而言,十分重要。 除了E2B外,AWS、谷歌云、微软Azure等云厂商也都已打造了相关套件。 AWS的AgentCore提供记忆管理、身份验证、代码执行和浏览器工具等,强调安全、可扩展和多Agent协作; 谷歌云的Vertex AI Agents聚焦构建和管理多Agent系统,支持任务调度、跨Agent协作以及与企业数据和云服务的集成; 微软Azure的Agent Factory强调身份认证、治理、内容安全和可观测性,同时结合Azure云服务和Copilot工具链,支持企业快速落地智能体应用。 总体来看,主流云厂商的思路均是:构建安全、可扩展、可组合的Agent Infra,让企业开发者能在已有基础设施和生态下快速部署、管理和监控多Agents系统,形成差异化服务能力,同时降低企业上手门槛。 二、国产Agent Infra突围,让Agent学会自我进化 在Agent Infra的布局上,国内厂商也丝毫不落后。今年4月,阿里云开启Agent Infra开发套件——无影AgentBay的公测,迅速吸引了大量开发者和企业关注。 AgentBay的核心定位是为AI Agent打造的“超级大脑”或“云上操作系统”。它能够动态调用云端算力、存储和工具链资源,将复杂任务接入高性能云电脑,突破了Agent在本地设备上的算力限制。 AgentBay不仅集成了云上沙箱环境、算力调度、持久化数据存储和企业级安全等核心功能,还内置了视觉理解、自然语言控制和任务解析等多项AI技术。尤其是云上沙箱环境,保障了Agent对本地环境的零侵入,给Agent执行加了一道保险。 同时,它支持原子化工具API、AI Agent API以及ASP远程串流协议等多种交互方式,极大地提升了自动化执行效率,使开发者能够在高性能、安全的云端环境中快速部署和管理AI Agent。 而在今年的云栖大会期间,AgentBay迎来重大升级,推出了自进化引擎、内存状态管理、安全围栏等全新能力。其中最引人关注的,是基于环境反馈的自进化引擎——Self-Evolving。 阿里云无影关注到了企业在利用第三方AI Infra部署AI Agent时的一大关键挑战。Agent并不能在执行任务过程中实现“自我提升”,最终其效果还需要人工调整,才能逐渐优化。这就好比你招募了一位员工,但他并不能主动从工作中总结经验和教训,始终未能进步。 对于AgentBay自进化引擎的工作原理,AgentBay产品经理屈立威向智东西解释道,自进化引擎可以理解为广义的强化学习,但并不直接训练模型。自进化引擎会针对提示词、工作流、Agent架构、工具等多个方向进行能力优化,每个方向使用的方法或算法各不相同。 例如在提示词优化方面,对于短序列任务,可以直接根据目标和实际结果进行修正;而对于长序列任务,由于难以直接获得最终结果,则会采用多种算法来优化执行效果,比如基于文本梯度(text grad)或微调推理(mipro)的方法。 通过这种模块化、服务化的设计,企业无需组建庞大AI团队,也能让Agent在执行过程中不断自我优化,提升与业务目标的匹配度。 AgentBay自进化引擎能够在任务执行中自动分析Agent的失败案例,并尝试生成和测试更优的提示词。它还能根据任务需求自主创建或封装新工具,不断拓展Agent能力边界。 这一机制不仅关注单个Agent的流程优化,也可在多Agent协作网络中智能部署最优工作流,提高整体效率。 此外,平台的记忆策略使Agent具备“过目不忘”和“选择性遗忘”的能力,可以对长期任务进行智能管理,适应复杂、长周期的应用场景。 三、Agent Infra加速发展,会成为下一代应用的跃升点吗? AgentBay并非凭空出现,屈立威在采访中介绍道,在云电脑时代,阿里积累了多项核心技术能力,而AgentBay的许多技术依赖,与云电脑是“一脉相承”的。 例如,云电脑需要高流畅性和清晰的操作体验,而阿里云此前已自研了ASP端云实时通信协议,确保远程云环境操作体验接近本地,这也能让帮助Agent实现与云端执行环境之间的高效、实时交互。 大规模的资源调度能力和性能保障,也是阿里云此前打造云电脑时重点解决的问题。目前,AgentBay便依托阿里云的全球资源池进行部署,用户可以就近接入,保证了低延迟和高可用性。 然而,Agent也提出了新的技术挑战和升级需求。屈立威称,首先,Agent需要更强的感知与控制能力,不仅要像人一样“看懂画面”,判断鼠标点击、输入是否生效,还要支持文件系统操作、命令行以及撰写RPA脚本等多种工具操作。 其次,其风控与安全要求也更高,需要阻断敏感指令、过滤不安全内容、约束上网行为,保障企业私域安全。 此外,Agent任务的执行方式呈树状、多分支,每个节点都需打快照(checkpoint)、支持快速回滚,并复制克隆环境以实现并行执行,这对状态管理和多维度调度提出了更高要求,而这些都是云电脑时代所未涉及的关键能力,需要重点突破。 为此,阿里云自研了持久化文件系统,让AgentBay能够动态地按需保留用户状态和文件,确保了任务执行的连续性和状态的一致性,这对于需要执行长链条、多步骤任务的复杂Agent至关重要。 安全方面,AgentBay则构建了端到端安全体系,包括沙箱隔离、数据加密与RBAC访问控制、AI内容风险检测以及日志审计,保障任务安全、合规与可追溯。 除了给企业打造Agent Infra之外,阿里云还在云栖大会上,给个人用户也提供了一款跨终端、跨模态的智能计算平台——无影Agentic Computer。 Agentic Computer是一个拥有长期记忆的个人助手,具备云端弹性算力与多任务并行能力。它内置垂直场景Agent,实现办公、设计、研究等专业化支持。它将个人计算与云端智能协同起来,有望让更多用户体验到Agent带来的赋能作用。 从产业视角来看,Agent Infra的发展与移动互联网时代App生态的兴起有一大共性:基础设施成熟,为新形态产品快速落地提供了支撑。 移动互联网时代,智能终端、网络和云计算能力的完善,使海量App得以高效运行和广泛普及,催生了丰富的应用生态;如今,AI Infra依托全球化云资源、弹性算力调度和全栈安全体系,为AI Agent提供高性能、低延迟、可控的运行环境。 稳固的基础设施降低了创新门槛,推动Agent在企业自动化、内容生成等多样化场景中迅速落地,有望形成新一轮产业生态和创新循环。 结语:给Agent打好Infra地基,Agent离广泛落地又近一步 Agent Infra正逐步成为新一代数字化、智能化基础设施的组成部分,类似于移动互联网时代的云和网络,为AI Agent生态提供底层支撑。 同时,Agent Infra的发展正在改变产业创新节奏和生态构建方式。企业不再需要自行搭建复杂底层架构,而是可以在统一、安全、可扩展的平台上试验多样化Agent应用。 随着工具链标准化和安全机制完善,或许会有越来越多企业和开发者能够快速部署Agent,推动生产、服务和研发环节的自动化与智能化,从而催生新型业务模式和产业应用。
厚度仅5.6毫米,iPhone Air抗弯性能几乎追平Pro
IT之家 9 月 27 日消息,第三方质保服务机构 Allstate Protection Plans 于 9 月 25 日发布视频,全面评估了苹果 iPhone Air 和 iPhone 17 Pro 的耐用性,结果显示,两款机型在抗弯折方面均表现出色,iPhone 17 Pro 可承受超 90 公斤压力,而超薄的 iPhone Air 也能承受 86 公斤压力。 在弯曲测试环节,iPhone 17 Pro 展现了卓越的结构强度,可承受超过 90 公斤的压力而功能完好。令人印象深刻的是,机身厚度仅为 5.6 毫米的 iPhone Air 同样表现出色,其钛金属边框在承受 86 公斤的压力后才发生弯曲。测试人员指出,两款设备在弯曲后均能正常使用,其抗弯能力已远超任何日常使用场景可能遇到的极限。 在跌落测试中,两款设备的表现出现了显著差异。当从 1.8 米的高度正面跌落后,iPhone Air 的屏幕虽仍可操作,但其搭载的“超瓷晶面板 2 代”均发生了碎裂,且破碎边缘十分锋利,已不适合徒手直接使用。 iPhone Air 正面从 1.8 米高度跌落 iPhone Air 背面从 1.8 米高度跌落 背部跌落测试进一步拉大了差距。iPhone 17 Pro 从同样高度跌落后,其背板仅出现几处轻微的擦伤,并未造成严重损坏。相比之下,iPhone Air 的背板则完全碎裂,暴露出其在抗冲击方面的明显短板。 尽管 iPhone Air 在背部抗摔性上存在不足,Allstate Protection Plans 最终总结认为,这两款新 iPhone 的整体设计在耐用性方面优于旧款机型,并且已经超越了现有的行业标准。
告别方正机身!三星S26 Ultra设计曝光,S Pen细节随之改变
IT之家 9 月 27 日消息,消息源 @i冰宇宙 今天(9 月 27 日)发布微博,曝料称三星 Galaxy S26 Ultra 旗舰手机放弃传统的方正造型,转而采用圆润边角设计,因此标志性的 S Pe 手写笔在收纳后露出的末端部分,也将调整得更具弧度。 IT之家此前报道,三星计划在明年的 Galaxy S26 Ultra 上进行重大的视觉革新,与历代机型标志性的方正、硬朗外观不同,S26 Ultra 的边角设计将变得更为圆润。 设计上的变化也直接影响了三星的标志性配件 ——S Pen。由于 S26 Ultra 机身边角的弧度增大,为了确保手写笔在收纳时与机身轮廓完美贴合,S Pen 在收纳后露出的末端部分,其设计也将变得更具弧度。 内部配置方面,Galaxy S26 Ultra 将搭载高通第五代骁龙 8 至尊版芯片,不过科技媒体 Phone Arena 认为伴随着三星自家芯片的成熟,不排除部分市场使用 Exynos 2600 芯片的可能。 影像方面,相机系统也将迎来一次实质性的升级,三星 Galaxy S26 Ultra 的相机凸起比之前预期的 3.7mm 更高,达到 4.5mm(S25 Ultra 为 2.4mm),大光圈主摄和长焦导致。 电池方面,型号为 SM-S9480 的三星手机通过 3C 认证,根据此前 GSMA IMEI 数据库信息,可以确认该型号为国行版 Galaxy S26 Ultra。3C 认证页面显示支持 10V / 4.5A 或 15V / 3A,这与 Galaxy S25 Ultra 完全相同,显示依然支持 45W 充电。
三星首款三折叠手机演示动画曝光:100倍变焦、分屏多任务
IT之家 9 月 27 日消息,消息源 @TechHighest 昨日(9 月 26 日)在 X 平台发布系列演示动画视频,全方位展示了三星首款三折叠手机。该机有望命名为 Galaxy Z TriFold,在 2025 年年底前发布,上市初期可能仅限韩国等少量市场。 速动画详细演示了多项软件功能。例如,三星自家的 Galaxy AI 功能可以在不打开新窗口的情况下,占据约三分之一的屏幕进行交互,同时主应用界面(如网页)的显示比例依然协调,不会被过度挤压。此外,系统保留了“在主屏幕上继续运行应用”等折叠屏经典功能。 在交互方面,当设备完全展开时,来电会以一个可移动的悬浮窗形式出现,用户可以一边处理当前任务一边接听电话,互不干扰。同时,将设备旋转至竖屏模式后,其形态酷似一台电子阅读器,主屏幕可以容纳比 Galaxy Z Fold 系列更多的应用和小组件。 动画还展示了 DeX 模式的运行情况。在该模式下,Galaxy Z TriFold 的操作体验与三星的 Galaxy Tab 系列平板电脑几乎没有区别,无论是多任务处理还是桌面级的功能布局都高度相似。 尤其值得注意的是,相机应用的动画中出现了 100 倍变焦选项。对于三星折叠屏手机而言,这是一项前所未有的功能。 如果该功能最终得以实现,则很可能意味着 Galaxy TriFold 将搭载潜望式长焦镜头,标志着三星折叠屏手机在影像能力上的一次重大突破。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。