行业分类:
加载中...
头条分类:
加载中...
Sora关停13天后“欢乐马”横空出世 国产视频模型为何能打?
《科创板日报》4月10日讯 3月25日,OpenAI宣布正式关停旗下视频模型产品Sora。仅13天后,国产视频模型“欢乐马”HappyHorse横空出世,并以1300的高分迅速屠榜Artificial Analysis。 据悉,Artificial Analysis是当今权威的AI评测平台,在该平台视频竞技场前15名榜单中,可以看到字节跳动Seedance 2.0、昆仑万维SkyReels V4、快手可灵3.0等一众国产视频模型的身影。相比之下,以谷歌Veo为代表的海外视频模型仅占据寥寥几个席位。 图源:Artificial Analysis Artificial Analysis视频竞技场的排名核心依据为“人类盲测投票+Elo评分系统”:在同一提示词下,平台随机选取两个模型生成视频,用户仅根据观看体验,投票选择“更好的一段视频”,随后被选中的模型得分,落选的模型失分,并依照分数实时生成排名。根据当前结果,显然国产视频模型在盲测中更受用户偏好。 国盛证券援引业内人士表示,由于AI生成的视频画面具备一定随机性,因此每次生成的内容未必满意,用户需要同一提示词使用多次,才能得到满意的结果,业内俗称“抽卡”,单个镜头的抽卡次数可以高达7次之多。 面对同样的随机性,为何国产视频模型生成内容更符合用户审美? 从逻辑上看,模型生成的内容能否获得用户青睐,与模型自身能力并无绝对关联,却更多取决于视频质量(如人物一致性、生成稳定性)本身。而这正是国产视频模型厂商的发力方向。 以HappyHorse为例,150亿参数或许不及Sora、谷歌Veo等“参数巨兽”,但作为目前全球首个原生支持音视频联合生成的视频模型,其原生支持英语、普通话、粤语、日语、韩语、德语、法语七种语言的唇形同步,词错误率在同类开源模型中最低。 此前爆火的快手可灵、字节跳动Seedance也具有相似的特质。根据对比测试,可灵2.0文生视频大模型与Veo2的胜负比为205%,与Sora的胜负比为367%,在人物一致性、生成稳定性等方面遥遥领先;而Seedance 2.0凭借强大的中文理解能力、多模态的文件输入功能以及对视频叙事连贯性的深度优化,在多维度叙事、创意生成方面形成独特优势。 除了稳定可控的“提示词-生成-成片”路径,国产视频模型还具有独到的平台生态优势。 诚然,字节跳动、快手等不仅是视频模型厂商,更是拥有完整AI模型系列的内容平台型玩家。一方面,如中金公司所言,拥有通用大模型的综合参与者在进军垂类模型时或拥有一定协同优势,仅简单基于大模型开发的应用或竞争力不足,而需要深度整合通用大模型和垂类模型化学反应。从这个角度,综合巨头确实存在体系化优势。 另一方面,上述机构强调,以快手可灵等为代表的产品核心定位是创作者创意工具或社区,其用户更关注输出内容质量、价格、一致性等维度。太平洋证券表示,AI视频工具是模型能力转化为实际生产力的载体,因其既依赖于模型技术支撑,又需专业视频内容制作实践积累。未来,拥有技术领先优势的AI视频工具公司更易依托自身创作能力与平台生态,产出优质视频内容。
紫荆AI医院线上虚拟诊室并开放测试 医生分身智能体加速进化
凤凰网科技讯 4月10日,由清华大学智能产业研究院(AIR)孵化的企业紫荆智康正式对外发布“紫荆AI医院”线上虚拟诊室。该虚拟平台即日起面向全球执业医生及在读医学生开放测试申请,核心机制在于支持医生端用户构建并训练个人专属的医生分身智能体。 作为虚拟医疗体系的基础模块,系统现已覆盖26个临床科室,并生成了大规模超拟人的AI患者智能体。医生用户选择专科后,系统将随机推送匹配的虚拟患者。在此场景下,用户需完成问诊、开具检查单、诊断及出具处置意见的全流程模拟诊疗。平台能够高精度还原现实流程,自动生成并返回检查检验单与医学影像报告。诊疗结束后,系统会展示多位医生对同一虚拟患者的决策分布,且操作失误不会对虚拟系统或用户真实职业声誉造成负面影响,为低年资医生与医学生提供了低风险的演练环境。 在功能架构上,线上虚拟诊室与现实诊室保持一致,并集成了多项AI辅助诊疗工具。平台支持图文及语音互动的对话系统,并可通过提取对话信息流进行病历实时自动撰写。在交互过程中,系统内置的实时深度推理模块会动态更新诊断与治疗建议。同时,平台具备在权威医学知识库及文献库中进行决策证据实时搜索与验证的能力,确保医疗建议的可信度。目前系统已上线中英双语支持及自动翻译功能,以实现跨语言接诊。 成立于2024年9月的紫荆智康,其底层架构源自清华大学团队提出的Agent Hospital虚拟医疗世界模型。通过此次发布的线上虚拟诊室提供的大规模AI患者接诊量,医生分身智能体的“伴生式进化”周期将被大幅压缩。达到一定等级的成熟医生分身,后续可直接贯穿至线上及线下真实诊室辅助出诊。目前,符合条件的用户可通过其官方渠道申请测试。未来紫荆智康还计划向合作实体医院开放真实诊室模式,并提供专科AI患者等定制化环境部署服务。
揭秘“夫妻用AI写公众号年赚200万”生意经:曾靠“程前朋友圈”破圈
原标题:揭秘“夫妻用AI写公众号年赚200万”生意经:曾靠“程前朋友圈”破圈,付费平台年费999元 蓝鲸新闻4月10日讯(记者 孙煜 郝妍)用AI写公众号年赚200万?最近这对夫妻站上了舆论的风口浪尖。 “夫妻用AI写公众号年赚200万”被封,曾靠“程前朋友圈”破圈 4月9日,“夫妻用AI写公众号年赚200万”登上微博热搜。这对夫妻名叫“六六”和“七哥”,她们通过AI创作、发布公众号文章变现,并创立AI一站式创作平台“爆了么”,提供“低粉爆款对标+智能提示词生成+一键高效创作”等服务,声称年入200万。 这种创作模式很快引发了平台的关注,4月9日晚,“爆了么AI”账号被封,微信方面回应媒体称,微信公众平台一贯鼓励真人创作。近期,平台关注到利用自动化工具替代真人创作的行为,《微信公众平台运营规范》再次明确:公众号和服务号不得利用AI、脚本、接口或其他自动化方式,替代真人完成内容创作、发布等流程,也不得传播、推广此类自动化创作的教程或服务。一经发现,平台将视违规程度对相关账号采取相应的处理措施。 “夫妻用AI写公众号年赚200万”之所以能够爆火离不开大v短视频内容的助推。 3月31日,程前朋友圈发布了《夫妻两人在家用AI写公众号文章,一年赚了200万》的访谈。截至发稿,该视频收获超600万曝光、19万点赞和超15万收藏,是其最近一个月最热门的作品。 值得一提的是,4月1日后,程前朋友圈开了5场带货直播,上架商品多为AI相关的付费订阅课程。其中,到手价299元的《深度解析50个热门创业项目·人工智能行业专题篇》”的出品方之一为程前朋友圈,讲师系前述访谈节目的主持人、程前合伙人光羽。第三方数据显示,该课程目前的累计总销售额约为50-75万。 深扒“爆了么”生意经:卖课是核心,自称拥有“万人副业社群” 中国有句古话:闷声发大财。为何“六六”和“七哥”却要将自己的故事讲出来? 事实上,靠 AI写公众号赚流量费只是其财富的一部分,“公众号内容创作”之下,其实是一门卖课的生意。 蓝鲸新闻了解到,目前“爆了么”的收入来源主要分为两部分,分别是公众号内容流量分成、付费社群/平台服务。 她们开发了AI一站式创作平台“爆了么”,其实就是将他们在公众号通过AI创作内容赚取流量分成的模式开发成程序,想通过同样思路赚钱的人就可以通过该平台复制这一商业模式。目前该平台售卖的会员主要有四种,分别是59元的基础月卡、129元的专业月卡、349元的专业季卡和999元的年卡。以年卡为例,购买该会员后,会员可以绑定20个公众号,一日导出文章2万篇。 这种内容生产模式完全与自主创作无关,从选题到写作到排版发布,全部都是系统生成的大量低质文章,完全是创作本质的背离。 除此之外,“爆了么”还拥有自己的社群,其中其知识星球社群定位为“帮打工人提升财商认知、搞钱技能、自媒体运营能力,引导打工人找到副业、赚到钱”,该社群目前拥有超6000人。另外,她们还及时根据热点开发不同类型的实战营,比如视频号带货、微博热点创作、券商开户羊毛项目、程序员接单引流项目等,其中不少项目需付费参与。以“公众号爆文”项目为例,“爆了么”称该项目截至目前有1600多人参与,学费19.9元,以此计算,该项目收益超3万元。 据“六六”介绍,目前她们拥有“万人AI副业社群“,公众号合作分成有5000多合作达人。 截至记者发稿,“爆了么”付费创作平台与相关社群仍在正常运营。 不过,当批量生产低质文章、兜售“速成捷径”成为一门生意,不仅背离了创作的初衷,也触碰了平台规则的红线,“六六”和“七哥”的这场“造富神话”也注定落幕。
deepin25.1发布:升级Linux内核6.18,系统级“Claw 模式”上线
IT之家 4 月 10 日消息,deepin 操作系统今日发布了最新的 25.1 版本更新。 该版本基于 deepin 25 正式版积累的多轮内测成果,在 AI 能力、内核版本、桌面环境、文件管理器以及系统安全等方面进行了更新与修复。其中,高版本内核从 6.12 升级至 6.18,引入了新的内存管理与调度机制,并重构了 UOS AI 相关功能。 在 AI 能力方面,deepin 25.1 对 AI 写作智能体进行了重构,支持用户上传本地参考资料,由 AI 先生成逻辑大纲,用户可手动调整后再生成正文,生成后可直接在 AI 界面编辑并导出为 PDF、Word 或 Markdown 格式。所有核心论点标注参考来源,支持一键追溯。 同时,新增系统级“Claw 模式”,用户可通过自然语言指令让 AI 自动执行打开应用、调整设置、批量处理文件等系统任务,该模式还原生集成了飞书、钉钉、QQ 等主流应用的接口,授权后 AI 可代为完成跨平台信息收集与文档汇总。 系统内置技能中心,支持导入或创建自定义技能,兼容 OpenClaw 体系。此外,AI 随航功能允许用户在任意软件、网页或 PDF 中划选文字后唤出 AI,实现翻译、总结、解释等操作。模型调度方面,默认集成 DeepSeek 3.2、GLM 4.7 等模型,系统根据任务难度动态匹配最优模型。 内核方面,deepin 25.1 将高版本内核由 6.12 升级至 6.18,合入了 6 个大版本的主要功能特性。此次升级引入了新的 Slub 内存分配机制和交换表基础架构,以降低内核内存操作开销并改善 Swap 性能。针对 Ext4 和 XFS 文件系统进行了底层优化,提升了大文件顺序读写等场景下的性能。同时加入了来自 CachyOS 的 BORE 调度器,以提升桌面和游戏应用的交互流畅度。硬件兼容性方面,新增对英特尔 APX 等新硬件特性的支持。官方提示,对于采用英特尔 Ultra 系列处理器等较新设备的用户,建议选择 6.18 高版本内核以获得更好的驱动支持;若设备包含兆芯、龙芯、飞腾、海光、芯动等非上游支持硬件,则建议选择 6.6 内核以避免驱动未受支持。 桌面环境方面,任务栏支持应用打开多窗口时图标拆分显示,该功能需在控制中心设置。控制中心增加了鼠标大小调节选项。修复了多屏扩展模式下拔掉外接屏后“多屏显示”设置项未及时消失、副屏壁纸不显示及无法进入锁屏界面等异常问题。文件管理器支持右键固定顶部标签页,支持跨窗口拖拽,预览图片时侧边栏支持拖拽放大,并优化了文件分组的视觉显示。 应用与组件方面,邮箱新增邮件打印功能,修复了 POP 协议下星标邮件重复的问题。影院和音乐应用修复了蓝牙耳机 A2DP 场景下的播放卡顿、杂音及高 CPU 占用问题。应用商店修复了 IPv6 场景下无法加载及部分应用安装失败的问题,优化了标签集合页、应用更新界面和评论页的显示异常。终端修复了日志异常打印、DTK 缩放场景下标签拖拽样式异常以及多窗口下关闭窗口时动画卡顿的问题。UOS AI 修复了主界面加载异常、知识库问答未生效、中文 NLP 输入异常及部分架构功能不可用的问题。玲珑环境同步升级了玲珑 NVIDIA 闭源显卡驱动至 580.119.02 版本,修复了因驱动问题导致影院、邮箱等应用显示透明的问题。对于从 25.0.10 版本升级的用户,若玲珑环境 NVIDIA 驱动未同步升级,使用玲珑应用时将触发更新提醒。 安全与稳定性方面,修复了多项内核安全漏洞,合入了近期累计的 CVE 安全更新。修复了 BOOT 分区占满导致升级失败、控制中心更新检查缓慢等问题,优化了系统更新和快照还原的磁盘空间占用,增强了断电更新异常提示。 已知待修复问题包括:高分屏笔记本新建账户首次登录时系统缩放比例未完全自适应(显示为 100%,实际默认设置为 125%,进入系统后恢复);控制中心一级菜单项或在右侧菜单界面操作时,当前一级菜单项会固定展现蓝色焦点框;在雷神终端模式下终端标题栏显示为白色;双屏场景下拔插扩展屏后注销系统并唤起启动器,启动器在副屏展示。上述问题已纳入修复计划,将通过后续系统更新推送解决。 对于新设备首次安装 deepin 25 操作系统的用户,或现有 deepin 25 用户长期未更新或希望体验 AI 新特性的,官方推荐使用本镜像进行全新安装。若当前系统运行正常且保持更新(含正式版 25.0.10 及内测版 25.0.13),用户也可通过“控制中心 → 系统更新”直接升级至 25.1 版本,无需重新安装。
GSMA高管解读MWC2026三大趋势,机器人点球大战将登陆上海
作者 | 杨睿琪 编辑 | 刘毓坤 凤凰网科技讯 4月10日,GSMA举办了一年一度的“Post-MWC思享汇”活动。GSMA首席执行官洪耀庄(John Hoffman)与GSMA大中华区总裁斯寒共同复盘了刚刚落幕的MWC 2026,并对外披露了将于今年6月在上海举办的MWC上海的最新筹备情况与核心亮点。 “历经8年,本次活动已经成为GSMA年度日程中一个重要的节点。”洪耀庄在开场中表示,这既是复盘巴塞罗那MWC内容、分享前沿行业洞察的契机,也是为上海MWC预热的重要时刻。 2026年是MWC在巴塞罗那举办的第20周年。洪耀庄坦言,从3G迈向5G、智能手机的崛起,到移动互联成为推动数字化经济的重要力量,行业经历了巨变。 在参会数据方面,本届大会的参会者达到10.5万人。但洪耀庄也坦诚地指出:“非常遗憾的一点,据不完全统计,因为我们开幕日是在3月2日,由于受中东冲突的影响,我们预测大概有5000人是未能按时出席的。”他分析了三个主要原因:机场关闭、中转或航班停运;部分通过巴基斯坦转机的旅客未能如时到达;受影响最大的是来自中国和亚洲的参会者。 尽管如此,大会仍然吸引了来自207个不同国家和地区的参会者,其中18%为企业C级高管,媒体及行业分析师超过2600名。值得注意的是,“所有参会者当中有58%其实是来自移动行业以外的其他的垂直领域”,洪耀庄强调,这表明MWC的平台不仅是一个移动行业的盛会,更影响着整个数字生态系统和数字化转型。 在展示亮点上,洪耀庄特别提到了两个案例:一是由荣耀推出的“机器人手机”在现场展示;二是来自小米的超跑,“这不仅仅是一辆概念车,并且在今年将会投产”。他认为,这证明了MWC不再是一个单纯的移动行业盛会,而是面向全链接生态的核心平台。 洪耀庄将本届大会的核心趋势提炼为三个:人工智能、下一代网络和B2B服务。 关于人工智能,他指出:“本届大会最核心的一个主题非人工智能莫属。”AI已深入融合到终端应用,除了荣耀的机器人手机,华为即将推出的“未来AI解决方案”可实现网络的独立运维。此外,具身智能的落地应用也受到关注,包括Agibot的人形机器人在场中行走自如。洪耀庄提到,“我知道在中国大家对人形机器人可能说司空见惯了,但是对世界上其他的参会者来说还是会让他们眼前一亮。” 从战略角度,他认为行业处于深度变革期,而AI处于变革核心。根据GSMA的研究报告,“大约有45%的运营商将会将AI驱动的收入来源列入他们的战略重点。” 关于下一代网络,5G-A和6G仍是热议焦点。全球行业的核心共识是:全面完成5G独立组网的部署仍然非常重要。洪耀庄指出:“中国是该领域的领军者,5G连接数量已经达到了12亿,其中80%为独立组网。”相比之下,很多国家在5G独立组网部署上仍相对落后,中国的宝贵经验可以为他们提供借鉴——因为在中国,5G在智能制造、医疗等行业已释放出显著价值。同时,5G独立组网的部署也为AI的大规模发展提供了坚实基础,并为未来中国的6G发展提供了先手优势。 此外,卫星通信和非地面网络的发展也是未来网络演进的重要趋势。洪耀庄表示,这类技术可以拓展网络覆盖面积,同时在支撑应急通信、提升网络韧性等方面具有突出价值。在MWC巴塞罗那上,包括中国移动和中国电信在内的运营商在该领域达成了重要合作。 关于B2B服务,随着垂直行业参与者人数增加,数字产业逐渐成为MWC的核心组成部分。洪耀庄特别提到了本届大会新设的“未来机场”展区:“这个专门的展区是为航空企业提供了一个展示的平台,可以呈现他们是如何利用连接技术去赋能未来机场的塑造。”他认为,这一变化并非偶然——在过去几年中,运营商已经实现了战略转型,从基础的连接服务提供商升级成了数字生态合作伙伴。未来4年,预计企业将把营业收入的10%用于数字化转型,该领域前景突出。 在洪耀庄的发言之后,斯寒用中文介绍了MWC上海的最新筹备情况。她首先谈到了对MWC上海战略意义的思考:“今年是第13届,在中国的文化当中12届是一个轮回,13届对于你来说是一个新的蜕变。” 今年MWC上海的主题为“众智启新”,旨在体现移动通信、人工智能以及智能基础设施如何重塑中国、亚洲乃至全球的经济与产业格局。斯寒透露,在今年的MWC巴塞罗那上,GSMA与GTI联合发布了《Mobile AI白皮书》,指出“泛在移动连接已成为人工智能规模化普及与普惠应用的重要基石”。该白皮书引用了Omdia的数据预测:到2030年,全球5G连接数将达到88亿,占全部移动连接数的60%以上,为人工智能规模化应用搭建一个非常坚实的连接平台。 此外,GSMA还将在MWC上海开幕式首日发布《中国移动经济报告》,用最新数据帮助理解移动通信在各个地区的部署规模及其影响力。 大会议程围绕四个主题展开:智能基建、智联共生、企业智变、移动AI。特色展区包括:移动AI创新先锋专区、聚焦卫星与非地面网络的“未来星座”卫星产业专区、国际创新展团、城市创新展团,以及覆盖网联汽车、低空经济等领域的行业数智未来专区。 在参展商方面,斯寒表示阵容不断扩大,除了中国移动、中国电信、中国联通、华为、中兴通讯、中国信科、联想、荣耀等熟悉的企业外,长飞光纤、高通、长江存储等也已加入展商和赞助商行列,“他们体现了中国科技生态的底蕴,以及非常多元的活力”。 同时,MWC上海将强化初创企业的角色,4YFN展区将重新回归,聚焦AI、移动通信、机器人、智能基础设施等领域,促成初创企业、大企业和投资人之间的对接。 在本次采访中,最引人注目的发布莫过于MWC上海期间将举办的人形机器人点球大战。斯寒表示,这一赛事旨在“展示机器人这种自主协同的技术和未来”,而连接技术在射点球的过程中至关重要。 她详细介绍了赛程:机器人的比赛从大会正式开幕的第一天开始训练,比赛将在第一天和第二天的上午进行,第二天晚上举办庆祝和颁奖仪式,第三天还有庆祝派对。赛事将决出冠军、亚军、季军,并颁发最佳射手、最佳守门员、最佳进球庆祝动作奖。 “借助MWC上海的国际影响力,这个赛事也会再次展现中国以及世界在具身智能这个领域的突破,从运动的控制到环境的感知到自主决策和精准的执行。”斯寒表示,“简单地来说,它会证明基于硅基的智能,能够在动态、真实的环境中运行,它的意义会超出足球场本身。” 该赛事的组委会包括GSMA、AI百人会、AIIA以及新华网等机构。斯寒强调,这不仅是比赛,更是一个“行动的号召”,邀请中国及国际的高校、科研机构、初创企业共同参与。 在回答《解放日报》记者关于为何选择点球而非全场对抗赛的提问时,斯寒解释:“我们其实需要强调的还是他们在训练的过程当中能够运用到移动通信网络赋能他们动作的自主、协同,而不是在背后用遥控器来遥控的动作。”她还提到,今年上海展期间正值世界杯举办期间,“硅基和碳基做这样一个映射”,这是一个有意义的探索。“我们希望这是一个开端”,未来将与更多合作伙伴共同推进。 在回答关于运营商联合倡议的问题时,斯寒透露,在MWC巴塞罗那期间,GSMA已联合中国三家运营商发表了“Mobile AI创新联合倡议”。对于上海MWC,她认为更值得期待的是“他们能够把这个倡议里面的内容和创新做更多的展示”。 最后,斯寒总结道,MWC上海的目标是成为“连接中国创新、引领全球数字生态发展的桥梁”,加速移动通信、AI和产业变革的深度融合,打造一个让创意从研究走向现实影响的平台。 “我们非常期待在今年的6月份和各位在MWC上海相聚,也和大家一起共同谱写连接加人工智能的下一个篇章。”
K-pop也要拥报AI,打造“机器人偶像”的创企Galaxy拟在首尔纽约两地IPO
IT之家 4 月 10 日消息,据彭博社 4 月 8 日报道,韩国一家初创公司 Galaxy 正在用 AI 与机器人重构 K-pop 产业,并试图颠覆传统 K-pop 偶像体系。此前,该体系依赖多年的人才选拔、训练以及对真人艺人的长期运营管理。 Galaxy 提出一种融合 AI 角色与等身机器人“偶像”的全新路径,目标是在内容生产中摆脱对真人表演者的限制。创始人兼 CEO 崔容浩(音译)表示,“我们希望从头到尾都用 AI 完成一切。我们想证明这种模式能够带来怎样的影响,尤其是在与权志龙这样的 IP 结合时。” ▲ 崔容浩,图源 Galaxy Corp 公司成立于 2019 年,正在筹备可能成为首个赴海外上市的 K-pop 经纪公司。崔容浩透露,公司正考虑在 2027 年同时于纽约和首尔上市,目前已累计融资约 1.5 亿美元(IT之家注:现汇率约合 10.27 亿元人民币),并计划在今年推进一轮海外 Pre-IPO 融资。其认为,亚洲市场对 AI 技术的高接受度正在推动这一趋势发展。 崔容浩现年 37 岁,2023 年末与权志龙达成合作后开始受到关注。 Galaxy 并未自行开发 AI 引擎或机器人系统,而是与技术公司合作推进内容生产。以权志龙为核心的 AI 广告和音乐视频已在韩国大量传播,同时公司也与宇树科技合作开发并控制机器人系统。 公司正在推进更具规模的下一阶段布局。Galaxy 目前正与伦敦《ABBA Voyage》团队合作,计划在亚洲复制虚拟演唱会模式,预计可容纳约 3000 人,并计划在 2027 年末落地。崔容浩表示,权志龙的表演内容已经在伦敦完成录制。“真人无法一年 365 天持续演出,虚拟形象可以。过去数百万人想观看权志龙的演唱会,但只有 1% 的人能够到场,而通过这种模式,99% 的人都能看到演出。” 公司还计划在今年下半年推出一个四人虚拟女团。崔容浩表示,音乐和视频制作将部分使用 AI 工具,成本有望较韩国传统约 200 万美元(现汇率约合 1369.1 万元人民币)的 MV 制作预算降低 90% 至 99%。 目前,虚拟成员仍依赖真人进行动作建模,长期目标是实现完全自动化。崔容浩表示:“我们已经创造出一种人类声音,无论谁说话或演唱,都可以转换为这种 AI 声音。但舞蹈和表演仍需要真人来表达情感,因此这一部分仍依赖人类,不过,在虚拟 AI 中不再需要考虑外貌因素。” Galaxy 的整体规划分阶段推进:今年推出虚拟偶像组合,明年推出对应形象的机器人偶像,2028 年再引入真人表演者。“我们正在把三者整合为一个多元宇宙。” 从长期来看,Galaxy 设想两种路径:一是将真人明星转化为可规模化的虚拟 IP,二是从虚拟偶像出发再延伸至现实世界,从而形成真人与虚拟角色之间的循环体系。
谷歌Gemini AI解锁新技能:生成交互式图表和3D模型
IT之家 4 月 10 日消息,谷歌正不断强化 Gemini 的可视化能力,当地时间 4 月 9 日,Gemini 的最新更新带来了交互式 3D 模拟与模型功能,用户通过简单提示即可生成动态内容。 据外媒 Neowin 报道,相比过去以文本和静态图示为主的回答方式,Gemini 在更新后能够提供“可操作的模拟”,让用户以更直观的方式理解复杂概念。 这一功能支持多种使用场景,包括模拟复杂物理系统、观察分子结构变化,以及演示月球绕地运行过程等。以轨道模拟为例,用户可以通过滑动控制调整初始速度和引力强度,实时观察轨道如何形成或发生变化,而不再受限于固定图示。 在使用方式上,用户只需在提示中加入“向我展示(show me)”或“帮我可视化(help me visualize)”等指令,并选择“Pro”模型即可。例如输入“可视化分形的生成过程”,即可看到分形生长,并可调整分支角度、长度比例和迭代次数等参数。 若用户想要探索量子物理领域,则可以输入“展示双缝实验如何运作”,Gemini 将提供波长、波速以及缝隙间距等参数选项,使波动变化能够实时呈现。 谷歌宣布该功能正逐步向所有用户开放,教育版与 Workspace 账户则暂不受支持。据IT之家了解,这一更新是在此前可交互学习功能基础上的进一步扩展。 此前,Gemini 已支持在生物、物理、化学和数学领域生成可点击的交互式图示,用户可以通过点击不同区域获取详细说明,从而逐步理解复杂知识结构。
法拉第未来“FF中国”App上架华为应用市场
IT之家 4 月 10 日消息,法拉第未来旗下“FF 中国”现已正式登陆华为应用市场,版本号为 0.0.3(3),包体积 14.8 MB,分类为“资讯”App。 IT之家参考详情页,用户可以在应用中了解 FF 官方资讯和产品信息、联系专属共创顾问获取一对一定制服务、与法拉第未来互动、了解及预订 FF 91 汽车。 Faraday Future App 是 FF 以用户为中心打造的移动互联网出行生态系统解决方案。在这里,不仅可以了解和预订属于您的 FF 91,获取 FF 官方资讯,还可以在 FF 社区与志同道合的朋友交流: 未来主义者社区:第一时间了解 FF 官方资讯和产品信息,与 FF 未来主义者们一起交流,找到兴趣爱好相同的朋友。 FF 专属共创顾问:FF 为您分配专属共创顾问,提供给您一对一高端定制服务。 UP2U 价值链共创:与 FF 一起成长您可以深度参与到 FF 的产品设计、研发、生产制造、营销、服务、运营的全流程全生命周期中,并通过互动和反馈,与 FF 一起共同创造价值,您将获得 FF 成长值和 FF 未来主义共创积分。 了解并预订属于您的专属 FF91:了解并快速预订属于您的 FF91, 获得 FPO (Futurist Product Officer) 资格,与 FF 产品总监和资深工程师一起讨论先进技术,参与 FPO 专属活动,并获得专属奖励。
云端裸奔、端侧瘸腿?这款龙虾盒子亮了:数据不出盒,能力不打折
作者 | 李水青 编辑 | 漠影 当AI Agent框架OpenClaw(昵称:龙虾)热潮席卷而来,起初被忽视的安全风险在同步放大。 设想一个场景:你刚输入的一段公司财务数据,可能在毫无感知的情况下被上传到云端,泄露商业机密。云侧“养龙虾”的便利背后,是隐私几乎“裸奔”的现实。 于是,很多人把目光转向了端侧。把AI装进一个本地盒子,数据不出家门,总安全了吧?但端侧盒子又陷入“瘸腿”的尴尬:算力不够、能力不足、体验割裂。 安全与专业,仿佛成为一道无法兼得的选择题。 就在这样的背景下,近期,清华系AI基础设施服务商无问芯穹推出了首个端云一体全模态安全脱敏的龙虾盒子——InfiniClaw Box。 这款产品试图给出一个全新答案:既不让数据外流,也不牺牲大模型能力。 听起来像 “既要又要” 的悖论,它究竟如何实现? 一、云侧裸奔,端侧瘸腿,养龙虾陷入“不可能三角” 当前“养龙虾”的核心矛盾,是一个经典的技术三角问题:安全、能力、成本难以同时满足。 要理解InfiniClaw Box试图实现的价值,得先看清当前“养龙虾”真正的痛点在哪里。 1、云侧:便利背后,是一个巨大的“数据敞口” 首先看云侧。以 OpenClaw 为代表的云端智能服务,确实带来了前所未有的效率提升,但其背后的“数据敞口”问题同样不容忽视。 用户输入的财务数据、医疗记录、企业机密等高敏信息,往往需要上传至云端进行处理。这种模式下,数据的流转路径不透明,边界不清晰,安全责任也被层层稀释。 对个人用户来说,这意味着隐私泄露风险;对企业而言,更是合规与信任的双重挑战。 2、端侧:看似安全,但算力不足+脱敏单一 于是,很多人转向端侧盒子——把AI模型部署在本地硬件上,数据不出家门,看起来完美解决了隐私问题。 但现实很骨感。端侧盒子的本地算力有限,难以高效支撑复杂任务。你想让它处理一段会议录音,它卡顿半天;你想让它分析一个视频,它直接报错。更麻烦的是,现有的端侧脱敏方案大多只覆盖文本,遇到语音、图像、视频等多模态数据就束手无策。 端侧盒子安全是安全了,但专业能力大打折扣。 于是,一个尴尬的局面出现了:真正高价值的应用场景,比如政务处理、金融分析、医疗辅助等,既不敢上云,也没法落端。用户被困在中间,进退两难。 无问芯穹InfiniClaw Box的产品定位,正是卡住了这个空白带——既保留云端强大的模型能力,又确保原始隐私数据绝不离开本地。 听起来像是既要又要,但技术上,它确实给出了一个可落地的方案。 二、三段式隐私守护,隐私数据绝不上云 面对上述行业困境,InfiniClaw Box给出的核心解法,是一套端云协同的三段式安全架构:本地脱敏–云端处理–本地回填。 这一方案试图通过端到端的全流程闭环,实现真正意义上的“隐私数据绝不上云”。 1、本地智能脱敏,原始数据不离开设备 第一步是智能脱敏(本地)。用户输入的所有数据,无论是文本、图像、音频还是视频,首先会进入InfiniClaw Box的本地处理单元。这里部署了一个本地多模态大模型,它会对全模态数据进行语义特征的理解与提取。 但仅靠大模型还不够。为了确保脱敏的准确性和全面性,系统还会结合一个预定义的安全信息知识库与脱敏模板,进行二次校验。它会自动识别并替换所有敏感信息:姓名、手机号、身份证号、公司机密、财务数据、医疗记录……凡是需要保护的,一个都不放过。 最终,系统生成一份完全“干净”的通用请求。原始隐私数据?根本没有离开过这个盒子。 2、云端处理,脱敏数据上云 第二步是云端处理。这份完全脱敏后的请求,会通过无问芯穹的大模型服务平台,无缝接入云端。用户可以低成本调用GLM-5、Kimi-K2.5、MiniMax-M2.5、Step-3.5等行业头部智能体大模型,利用云端最强大的计算能力完成复杂推理、知识检索、内容生成等任务。 换句话说,云端获得的是“能力输入”,而不是“隐私输入”。云端看到的,是一份已经脱敏的通用请求。 这就好比你把一份文件里的所有人名、地名、数字都替换成了代号,然后交给一个顶级分析师去处理,分析师能给出高质量的结论,但他永远不会知道那些代号背后真正的秘密。 3、本地回填,精准还原 第三步是本地回填。云端返回的结果,会在InfiniClaw Box本地进入一个“隐私重构引擎”。这个引擎的作用是:在不泄露任何隐私数据的前提下,将被替换的敏感信息进行精准位置感知的自动回填。 什么叫“精准位置感知”?就是系统知道原始数据中哪个位置原本是什么敏感信息,它会把云端返回的结果中对应的占位符,精准地替换回原来的真实数据。整个过程确保数据在“脱敏-推理-回填”全链路中实现隐私数据零出域、结果语义无损恢复。 最终输出的结果,在表达完整性、上下文一致性上,与纯云端处理完全一致。用户看到的是一个完整的、自然的答案,但背后所有的隐私保护动作都悄无声息地完成了。 总的来说,这套机制在技术上实现了隐私安全与大模型能力的解耦融合,并达到“数据不出盒、能力不打折”的最终效果。” 通过这三段式架构,InfiniClaw Box真正兑现了它的承诺:安全养虾不裸奔,云端智能本地享。 三、全模态+芯片优化,端侧龙虾真正“能听会看擅思考” 安全只是底线。一款产品能不能真正用起来,最终取决于它的能力边界。InfiniClaw Box在能力侧做了两层突破:全模态适配和芯片级优化。 1、全模态适配:解锁更多安全场景 大多数端侧盒子只能读取文本知识库,就像一个只会看书的呆子。但InfiniClaw Box凭借其独特的全模态脱敏能力,突破了这一局限。 它支持多种硬件设备的灵活组合,能够广泛接入并融合多元信源。举个例子:你可以把家庭摄像头、智能门锁等设备连接到盒子上,它就能实时获取视频画面,并对画面中的敏感信息,比如人脸、车牌,进行脱敏处理。你也可以通过外接麦克风精准接收语音指令,把会议录音交给它处理,语音中的敏感人名、公司机密,同样会被自动识别和替换。 未来,InfiniClaw Box将可无缝接入个人电脑、智能眼镜、手机、平板等移动生产力工具。这意味着,你可以在更多场景中使用它:开会时让它实时转录和脱敏,出差时用手机连接它处理敏感文件,甚至戴着智能眼镜让它帮你识别眼前的人脸信息并做隐私保护。 标准化开放接口的提供,进一步拓展了它的应用边界。政务处理、投资研报、智慧办公……产品内置了80余个面向这些垂类场景的专业Skills,让端侧智能从“能用”走向“好用”。 2、释放国产端侧芯片潜能,性能飙升10%-40% 全模态能力再强,如果跑不动,也是白搭。InfiniClaw Box在性能优化上下了真功夫。 在主流端侧芯片上部署多模态大模型相关的算子时,InfiniClaw Box通过主控智能体主导的深度NPU、GPU算子融合、张量布局寻优,以及极致的显存复用策略,让Attention和GEMM等核心算子实现了10%到40%的加速。 这是什么概念?原本需要3秒钟处理的任务,现在可能只需要2秒甚至1.8秒。对于端侧设备来说,这是非常可观的性能提升。而且,这种优化不是针对某一款特定芯片的“特调”,而是一套可以快速适配多样化终端硬件配置的方案。 据悉,无问芯穹已与爱芯元智等伙伴在端侧芯片优化与龙虾盒子等方面展开深度合作。未来,InfiniClaw Box将进一步打通适配更多端侧芯片,持续探索本地龙虾在国产端侧芯片应用上的更多可能性。 单打独斗做不成端侧智能,InfiniClaw Box构建了一个开放协同的生态体系。 其深度合作伙伴包括爱芯元智、AMD、此芯科技、M5stack、财搭子、万象智维、酷爱科技、跃向等,涵盖芯片企业、智能终端设备企业、应用企业等多个维度。通过从芯片到应用的纵向打通,InfiniClaw Box试图打造一个可扩展的端侧智能平台。 结语:安全与专业兼顾,端侧龙虾进入可用阶段 安全和专业,一度被认为是端侧智能难以兼得的两个方向。无问芯穹InfiniClaw Box提供了一个新的可能——通过端云一体的三段式安全脱敏架构,让隐私数据不出盒,同时让大模型能力不打折。 全模态适配、芯片级优化、80余个垂类Skills、开放的生态协同……这些能力加在一起,让InfiniClaw Box不仅仅是一个安全的盒子,更是一个能用的工具。 政务处理、投资研报、智慧办公、家庭安防……那些曾经因为数据敏感而不敢上云、因为算力不足而无法落端的场景,现在有了第三种选择。安全养虾不裸奔,云端智能本地享。这句话,正在变成现实。
20亿!清华系AI创企又融资,阿里云领投
作者 | 杨京丽 编辑 | 李水青 智东西4月10日消息,AI视频公司生数科技今日宣布完成近20亿元人民币B轮融资,由阿里云领投,中网投、九安海棠、好未来、光合创投等投资人战略投资,原有股东星连资本、达泰资本、建发新兴投资、BV百度风投、卓源亚洲等追加投资。 这是继今年2月超6亿元A+轮投资之后,生数科技两个月内拿到的第二笔大额融资。叠加此前多轮,其公开融资总额已超25亿元,投资方阵容涵盖阿里云、百度、启明创投等头部机构。 生数科技称,本轮资金将用于推进“通用世界模型”研发,试图从视觉、听觉、触觉等多模态数据出发,理解物理世界,这被公司视为迈向物理环境AGI的关键一步。另外,就在昨天,生数科技旗下视频生成模型Vidu全系列已登陆阿里云百炼模型广场。 一、两个月融超25亿,阿里云入局领投 生数科技近年来融资节奏明显加速。2024年6月,公司完成数亿元Pre-A轮融资,由北京市人工智能产业投资基金和百度联合领投;2025年9月,博华资本领投A轮,百度战投、启明创投等跟投,同为数亿元规模;今年2月,中关村科学城公司和星连资本领投A+轮,金额超6亿元。如今B轮20亿元落地,叠加此前各轮,公开融资总额已超25亿元。 值得注意的是,阿里云此前从未出现在生数科技的股东名单中,本轮直接以领投身份入局。 二、从Vidu到Motus,视频公司正在长出机器人的“手脚” 生数科技由清华大学教授朱军于2023年3月在北京创立,朱军现任公司首席科学家。2024年4月,公司国内首个全面对标Sora的文生视频大模型。产品迭代上,今年1月发布的Vidu Q3 Pro在第三方评测平台Artificial Analysis上跻身全球前十,支持最长16秒声画同出、多镜头组合与精准切镜。 据公司此前披露,2025年其用户和收入均实现超10倍增长,产品覆盖全球200多个国家和地区,客户横跨动画、广告、影视等行业。 生数科技在中关村论坛发布通用世界模型战略(图源:中关村论坛) 但生数科技的野心不止于“生成视频”。2025年12月,公司开源了Motus模型,能通过处理视频、音频等多模态数据控制机器人,并已与多家AI硬件和模型厂商签署部署合作。公司认为,基于多模态数据构建的通用世界模型,比大语言模型更能自然地捕捉物理世界的运行方式,这正是当前LLM技术路线最明显的短板。 三、Vidu上架百炼次日即领投,阿里加码AI视频赛道 4月9日,Vidu全系列模型正式上线阿里云百炼模型广场,支持文生视频、图生视频、参考生视频等全功能API调用。据生数科技介绍,依托百炼平台,Vidu并发处理能力提升数倍。一天后,B轮融资落地,阿里云成为领投人。 Vidu上架阿里云百炼模型广场(图源:阿里云) 拉长视角看,阿里在AI视频和世界模型赛道已密集出手:一方面,阿里自己研发了HappyHorse模型,登顶Artificial Analysis盲测榜单;另一方面,阿里还在投资AI视频公司,上月领投3D生成平台Tripo AI的5000万美元(约合人民币3.4亿元)融资,去年9月领投爱诗科技的6000万美元(约合人民币4.1亿元)融资,后者已于今年发布了自己的世界模型产品。 结语:资本已经开始下注AI视频赛道 两个月内连融两轮、累计超25亿元,生数科技的融资节奏折射出,资本对AI视频赛道的高度看好。阿里云直接领投B轮,背后既是对Vidu商业化能力的认可,也是其在AI视频赛道“自研+投资”双线布局的延伸。 对生数科技而言,从视频生成工具走向通用世界模型,意味着技术边界和商业想象力的同步扩展,但能否真正让AI“理解”物理世界,仍需在模型能力、落地场景和持续投入之间找到平衡。
取代龙虾的是爱马仕?狂揽4万星的Hermes Agent,不只是OpenClaw平替
在之前那篇讨论 Harness 该怎么翻译的文章,有读者留言说可以叫 Hermes 爱马仕。 本以为是谐音梗,没想到确实有一个 Agent 产品叫 Hermes,而且在 GitHub 的热门榜单上,整个月都排名第一,目前已经累计有 4.8 万个 Stars。 和这段时间以来爆火的 Agent 龙虾不同,一个是支持所有操作系统和平台的专属个人 AI 助手,Hermes 的介绍写着「the agent that grows with you」,与你共同成长的 Agent。 听着就很高级,但这确实是 Hermes Agent 的独特之处。 它有一套内置的学习循环框架,OpenClaw 靠的是修改配置文件,联合多个 Agents 来处理各项复杂的任务,Hermes Agent 是一个单一的 Agent 框架,它的能力会随着实际使用的运行时间增加而不断增强。 它解决的问题是,当所有人都在讨论 agent 能做什么,但没人注意 agent 用完之后什么都不留下,而 Hermes Agent 现在能记住「什么方法有效」。 社交媒体上也不少推荐 Hermes Agent 的帖子,有人说刚刚从 OpenClaw 转移到了 Hermes,是他做过最明智的选择。 还有人分享「爱马仕橙皮书」,表示 Hermes Agent 是一个被严重低估的产品,它算得上目前最强大的开源 AI Agent 框架之一。 Hermes Agent 由 Nous Research 团队研发,查看 GitHub 上的发布记录,从 3 月中旬更新 V0.2.0 版本到昨天发布 V0.8.0,每次更新都有大量代码提交合并,以及实用的功能更新,是一个非常活跃的开源项目。 ▲首次推出是 2 月 25 日,https://nousresearch.com/releases Karpathy 之前分享的 LLM Wiki 笔记大法,利用大语言模型和 Obsidian 笔记工具,完成对自己知识和研究库的搭建,也被立刻加入到了 Hermes 的内置技能里。 Hermes Agent 不仅支持安装在电脑上,通过 Termux 终端模拟器,还能安装在 Android 手机上。模型和网关的配置与 OpenClaw 类似。 值得一提的是,目前还没有被 Claude「封杀」,我们仍然可以通过登录 Claude 的 Pro 及以上会员直接完成大模型配置。同时,Hermes Agent 也提供了自家的,基于订阅模式的 Nous Portal 登录。 ▲Nous Research 团队的 Hermes 4 模型 今天,小米大模型也发文正式宣布,「Xiaomi MiMo 已接入全球顶级 Agent 框架 Hermes Agent,并且限免两周。」 Hermes Agent 官网:https://hermes-agent.nousresearch.com 凭什么是 OpenClaw 真正的对手 OpenClaw 的核心是把我们的 AI 从聊天框里彻底拉出来,接入到实际的工作、学习和生活中,真正执行任务。它能连接微信、企微、飞书,能跑终端命令、控制浏览器,帮我们发邮件、管理日程安排等。 但 OpenClaw 有一个缺陷是它无法从我们日复一日的使用中,自动学习进化。 OpenClaw 的记忆是静态的——我们把信息写进配置文件,它读取,会话结束,等下次再读。它不会主动地从执行过程里提炼什么,也不会因为我们纠正过它一次,下次就自动做对。 所有的工作流用过一遍,还是需要我们提醒它,打包成 Skill 或者专门的提示词等。 虽然现在有一些专门的 Skill 被设计用来赋予 OpenClaw 自学习的能力,但是、 Hermes Agent 是从底层架构的学习循环,到记忆系统,和 Agent 执行内部,都把「越用越懂你」作为重点。 Hermes Agent 的特别之处是一个闭合的学习循环 Learning Loop。 每次任务完成后,Hermes 会检查:这次执行值不值得写下来?触发条件很具体,工具调用超过 5 次、中途出过错然后自己修复了、用户做过纠正、或者走了一条不明显但有效的路径。满足任何一条,它就会在 ~/.hermes/skills 目录里生成一个 Skill 文件。 和技能市场上那些被广泛使用的 Skill 一样,这份自动生成的文件是下次可以直接跟着走的操作流程。名称、描述、步骤、涉及的工具调用,全部写清楚。格式遵循 agentskills.io 开放标准,理论上是可以跨兼容 agent,在 OpenClaw、Claude Code、Cursor 等工具内使用。 技能文件不是一次写死。Hermes Agent 在后续执行中发现更好的路径,会直接修改。修改优先用 patch,打补丁的方式,只传入旧字符串和替换内容,而不是整体重写。 这个选择背后有两个考虑:全量覆写容易把原来好用的部分一起破坏掉,而 patch 只碰有问题的地方,更安全,token 消耗也更少。 记忆,是 Agent 最难处理的问题 另一项和 OpenClaw 的差别,是记忆系统。 前几天,《生化危机》女主角 Milla Jovovich 和工程师 Ben Sigman 联合发布了开源 AI 记忆工具 MemPalace,两天内获得超过 23000 个 GitHub stars。 它的设计灵感来自古希腊演讲家的记忆技法,把要记的东西放进一座想象中的建筑的不同房间,需要时走进去取。 整个系统分成五层:Wing(项目或人物)、Hall(记忆类型)、Room(话题)、Closet(压缩摘要)、Tunnel(跨话题引用)。仅靠这个层级结构,MemPalace 称检索准确率就从 60.9% 提升到 94.8%。 MemPalace 的核心判断是:不应该让 AI 来决定什么值得记,AI 的判断不可信,不如全存下来,让检索来决定什么有用。 月初 Claude Code 50 万行代码泄露事件中,另外一种关于记忆的解决方案则是依靠 AI,有网友发现 Claude 会使用做梦的方式,用 Auto Dream 来自动整理我们的记忆文件。 Hermes 的记忆系统也经过专门设计,一共分四层,每层负责不同的事,在不同的时机被调取。 第一层叫常驻提示记忆。两个文件,MEMORY.md 和 USER.md,存放需要在每次会话开始时自动加载的上下文。总字符上限只有 3575 个,这个数字是 Hermes Agent 故意收窄的,目的是强迫我们筛选,而不是什么都往里塞。 第二层是会话归档。每次对话写入 SQLite 数据库,用全文索引检索。Hermes Agent 需要历史上下文时,主动发起查询,把检索结果经过一次 LLM 摘要,只把和当前任务相关的部分注入进来。 ▲文档链接:https://hermes-agent.nousresearch.com/docs/user-guide/features/memory 第三层是技能文件,也就是上面说的学习循环的产出。默认情况下,系统提示里只加载技能的名称和简短描述,全文按需调入。这个设计的效果是,技能库可以从 40 个增长到 200 个,而上下文成本几乎不变。 第四层叫 Honcho,是可选的用户建模层,被动地在跨会话之间积累你的偏好、沟通风格和领域知识。适合把 Hermes Agent 当成日常个人助理长期使用的场景。 这四层的分工原则也很清楚,如果某件事需要在每次对话里都出现,放第一层;如果只在特定话题出现时有用,留在第二层等检索;如果是可复用的操作流程,让第三层处理;如果是用户的长期画像,交给第四层。 一条消息到达 Hermes Agent,无论来自 Telegram 等第三方网关,还是命令行,进入同一套同步执行引擎:生成任务 ID,从记忆层构建系统提示,优先复用缓存版本,避免重复构建,发送前检查上下文长度是否接近上限,调用模型。 ▲图片来源:https://mranand.substack.com/p/inside-hermes-agent-how-a-self-improving 除了在任务执行的过程中会使用学习循环自动更新,Hermes 在每次会话中间还会触发一个叫周期性微调(Periodic Nudge)的机制。 在没有用户输入的情况下,系统会定期自动向 agent 发一条内部提示,要求它回顾最近的操作,判断哪些值得写入记忆。完全不需要用户触发,Hermes Agent 自己决定什么值得保留。 上手 Hermes Agent 需要多少成本 和安装 OpenClaw 一样,Linux、macOS、WSL2 直接一行命令,Android 机上使用 Termux 也支持安装。 Hermes 有提到不支持原生 Windows,我们需要另外安装 WSL2,Windows Subsystem for Linux,简称 WSL,是一个在Windows 上能够运行原生 Linux 二进制可执行文件的兼容层。 安装命令会自动处理大量依赖,包括 Python 3.11、Node.js v22、ripgrep、ffmpeg、虚拟环境、全局命令、LLM 等配置。安装完成之后的界面也 Claude Code 那些终端工具一样,通过一些具体的命令来实现和 Agent 的交互。 在模型配置上,可选推理服务商范围很宽:Nous Portal(订阅制,零配置)、Anthropic(直接用 Claude,可以用 API key 或 Claude Code 授权)、OpenRouter、DeepSeek、Hugging Face、阿里云 DashScope(Qwen 系列)、GitHub Copilot,还有任何 OpenAI 兼容接口,包括 Ollama 本地模型。 还有小米的 Xiaomi MiMo-V2 系列,包括支持百万上下文 Token 的 MiMo-V2-Pro、全模态的理解能力的 MiMo-V2-Omni,以及 Flash 模型。小米还提供了 4.8-4.22 为期两周的限免试用,更新 Hermes Agent 到最新版本,通过 Nous Portal 秒飞调用小米大模型。 Hermes Agent 还有一个 Auxiliary Models 模块,它是 Hermes 里专门处理「侧任务」的一组轻量模型配置,不负责主对话,但负责很多高频、关键、又不值得占用主模型的工作。 例如像是图像分析、网页提取、Skill 匹配、记忆处理等不同的任务会自动分配不同的模型。在默认情况下,辅助任务会自动检测并优先使用 Gemini Flash,无需手动配置。 这和 Anthropic 今天推出的 advisor 功能类似,都是适合主模型昂贵,但想把边角任务切到便宜模型的机制。Hermes 则是直接把「多模型编排」做成了底层架构。 消息平台方面,支持列表和 Openclaw 类似,Telegram、Discord、Slack 和飞书是功能最完整的几个,语音、图片、文件等各种格式都支持。一套网关进程连接所有平台,会话统一管理。 Hermes Agent 其实很难说是一个花几分钟安装完了,就能快速上手用起来的工具,它更多的是一套我们需要运行和维护的基础设施。 如果我们只是想要一个能在手机上发消息控制的 AI 助理,OpenClaw 会是更简单的路径,写一个 SOUL.md 配置文件,跑起来,接上 Telegram,完成。 Hermes Agent 适合的场景是,我们有一些重复的、会演化的工作流,同时我们愿意让 agent 从使用习惯中积累经验,我们会期待希望三个月后的 agent 和第一天的 agent 不一样。 在社交媒体上,一些网友分享使用 Hermes Agent 的应用实例,包括像是商业自动化,把企业的客户关系管理 CRM 和知识库连接在一起;以及营销管理,将内容生成和社群平台的发布统一自动化;还有经典的代码生成等软件工程项目等。 随着我们在各个真实的业务场景中应用这些技术,一个不争的事实是:Agent 正在加速杀入真正的生产环境。 对于 Hermes,有人说它只是 OpenClaw 的一个「轻量级平替」,也有人说它是单一智能体的一次进化。但无论如何,Agent 的演进路线,绝对不会止步于 OpenClaw 设定的框架。 而不管是 Hermes 还是 OpenClaw,现在所有的开源 agent 方案,都还留着各自的缺口。能让 agent 真正打穿主流、成为普通人日常基础设施的那个形态,大概还没出现。 解决了复杂的记忆系统,还有庞大的 AI 安全问题,给了 AI 手脚又要想着怎么给他上枷锁 Harness,还有安装太复杂,门槛太高,似乎总有各种受限的地方。 只能说,Hermes 这次确实给了 Agent 一个新的方向,它让 Agent 从一个用完归零的工具,变成了能从失败里学到东西、能记住教训的一种搭档关系。
马斯克造火箭放卫星挣的钱,都被AI烧完了,一年还亏340亿
编译 | 陈佳 编辑 | 程茜 智东西4月10日消息,据外媒The Information今日援引两名知情人士报道,埃隆·马斯克(Elon Musk)旗下太空探索技术公司SpaceX 2025年全年营收超过185亿美元(约合人民币1267亿元),净亏损近50亿美元(约合人民币342亿元)。上述财务数据为SpaceX与旗下AI子公司xAI的合并口径,此前从未对外披露。 亏损的根源并非商业航天。据此次知情人士透露,SpaceX的火箭发射与星链卫星互联网两大核心业务合计录得约80亿美元(约合人民币548亿元)的调整后息税折旧摊销前利润。这意味着该公司主营业务具备较强盈利能力,能够持续产生现金流。 但xAI的芯片采购与数据中心建设资本支出高达130亿美元(约合人民币890亿元),比火箭与卫星两大部门资本支出之和还高50%,直接将合并口径的调整后利润拉低至约65亿美元(约合人民币445亿元)。 SpaceX成立于2002年,是美国最大的私人航天公司。2026年2月2日,SpaceX以约1万亿美元(约合人民币6850亿元)估值收购xAI,以建设轨道数据中心,将AI算力从地面搬入太空。 SpaceX计划今年6月启动IPO,目标估值高达1.75至2万亿美元(约合人民币12.6至14万亿元)。据The Information今日报道,SpaceX已于本月启动投资者会议,并向潜在投资者发出为期两天的IPO路演邀请,选址德克萨斯州南部与田纳西州,分别对应星舰发射基地与在建数据中心。 SpaceX位于美国加州霍桑的制造工厂(图源:Getty Images) 一、SpaceX主营赚钱,AI板块吞噬利润 SpaceX 2025年的亏损结构并非来自商业航天业务本身。两名知情人士披露的数据显示,Falcon 9火箭发射服务与星链卫星宽带服务两项核心业务合计录得约80亿美元(约合人民币548亿元)的调整后息税折旧摊销前利润。 火箭与卫星这两个业务板块联系紧密,Falcon 9火箭的绝大多数发射任务均搭载星链卫星,而非其他公司的有效载荷。 拖累SpaceX整体盈利的是其AI业务。SpaceX于今年2月将xAI纳入旗下,xAI是马斯克为对标OpenAI而创立的AI大模型公司,旗下产品为Grok。 据Business Insider4月9日报道,xAI已开始大规模引入SpaceX工程体系和高管团队,并被明确纳入IPO前整体业务体系中。 SpaceX与xAI合并后,xAI的芯片采购与数据中心建设支出高达130亿美元(约合人民币890亿元),是最大单项资本开支。 芯片、火箭及卫星的折旧费用也是SpaceX最大支出项之一,金额超66亿美元(约合人民币452亿元);另外两大高额成本分别为股权激励支出与利息支出,各自均接近20亿美元(约合人民币137亿元)。 SpaceX Starship在轨示意图(可用于发射轨道数据中心)(图源:Universe Today) 二、传IPO路演已启动,马斯克要在太空建数据中心 The Information今日报道,SpaceX本月正在举行投资者会议,并向投资者发出了为期两天的IPO路演邀请函,地点设在德克萨斯州南部和田纳西州,前者是新型火星飞船星舰(Starship)的发射基地,后者正在建设数据中心。 SpaceX IPO并非突然推进,而是经历了多个阶段的持续曝光与确认。 2025年12月9日,彭博社报道,SpaceX正在推进2026年IPO计划,目标估值约1.5万亿美元(约合人民币10.3万亿元),融资规模将远超300亿美元(约合人民币2055亿元),有望成为史上最大规模IPO。 同年12月11日,Ars Technica记者发文分析“SpaceX为何很快将上市”,并在X上分享。 马斯克随即在X上回应Ars Technica的相关报道称“一如既往,准确”,亲口确认了上市计划。 马斯克对Eric Berger(Ars Technica资深太空记者)帖子的直接回复 2025年12月12日,彭博社进一步披露,SpaceX已启动内部股权转让,以约8000亿美元(约合人民币5480亿元)的估值向员工和内部投资者出售股份,该公司内部文件明确提到IPO的募集资金将用于星舰火箭的“疯狂发射频次”、太空AI数据中心以及月球基地建设。 2026年4月1日,TechCrunch报道称SpaceX已向美国证监会秘密递交上市申请文件,目标估值提升至约1.75万亿美元(约合人民币12.6万亿元)。 据路透社4月7日援引知情人士报道,合并实体拟于今年6月8日进行IPO,目标估值高达1.75至2万亿美元(约合人民币12.6至14万亿元)。 在看好SpaceX的投资者眼中,该公司的吸引力在于其在商业航天市场的主导地位,目前其送入太空的有效载荷数量远超竞争对手。 马斯克为这场AI押注描绘的愿景是将数据中心发射入轨道,利用太空中更高效的太阳能和天然散热条件,绕过地面数据中心面临的能源瓶颈。 他称此次合并是在打造“最具雄心的垂直整合创新引擎”。但这一路线目前仍停留在构想阶段,商业可行性尚待验证。 马斯克提出的轨道AI数据中心概念图(图源:Getty Images) 三、CFO上任半年即离场,xAI 11位联合创始人已全部出走 就在上述财务数据曝光的前一天,The Information4月9日据两名知情人士报道,xAI首席财务官安东尼·阿姆斯特朗(Anthony Armstrong)已离职。 阿姆斯特朗曾是摩根士丹利银行家,并在马斯克收购社交媒体平台X期间担任顾问,去年10月出任xAI首席财务官,统管xAI与X的财务运营。 在SpaceX完成对xAI的整合后,合并实体的财务负责人由SpaceX首席财务官布雷特·约翰森(Bret Johnsen)担任,阿姆斯特朗向其汇报。 据TechCrunch和Business Insider报道,到今年3月28日,与马斯克共同创立xAI的11名联合创始人已全部离开,包括主导预训练团队的曼努埃尔·克罗伊斯(Manuel Kroiss)和马斯克的核心运营助手罗斯·诺丁(Ross Nordeen)。 这11人大多来自谷歌、DeepMind、微软研究院及OpenAI等机构,是马斯克当年为抗衡OpenAI专门组建的精英团队,其中不少人是华裔。 马斯克本人曾在X平台上发文说,xAI“第一次没有造对”,正在“从根基重建”。 马斯克谈xAI的问题 结语:航天盈利与AI烧钱,SpaceX招股书里的双重估值难题 SpaceX此次财务数据曝光,一边是已经跑通商业模式的火箭与卫星业务,另一边是仍在烧钱、尚无明确盈利时间表的AI基础设施版图。两者被马斯克捆绑进同一张招股书,意味着潜在投资者必须同时为两种完全不同的逻辑定价,一种是可预期的现金流,另一种是对轨道数据中心这一未来叙事的估值溢价。 过去三年,AI算力军备竞赛已将芯片采购、数据中心建设推向天价,微软、谷歌、亚马逊每年资本开支均超千亿美元。连盈利能力强劲的科技巨头,在AI资本开支持续放大的背景下,估值同样承压。SpaceX的不同在于,它试图将这场竞赛从地面搬进轨道,而这条路在工程上尚未经过验证。
曝三星多款Galaxy手机在印度涨价,主要涉及A、F系列
IT之家 4 月 10 日消息,爆料人士 Abhishek Yadav 今天在 X 平台发文,分享一张疑似是三星通知零售商调价的邮件截图。 截图显示,三星自 2026 年 4 月 10 日起将在印度调整多款机型价格,A 系列、F 系列多款机型均有不同程度涨价。 IT之家附具体机型调价详情如下: Galaxy A06 5G: 4GB+64GB:原价 12499 印度卢比(现汇率约合 926.2 元人民币),现价 13499 印度卢比(现汇率约合 1000 元人民币) 4GB+128GB:原价 13999 印度卢比(现汇率约合 1037 元人民币),现价 15499 印度卢比(现汇率约合 1148 元人民币) 6GB+128GB:原价 15999 印度卢比(现汇率约合 1186 元人民币),现价 17499 印度卢比(现汇率约合 1297 元人民币) Galaxy A07(4G): 4GB+128GB:原价 15999 印度卢比(现汇率约合 1186 元人民币),现价 16499 印度卢比(现汇率约合 1223 元人民币) 6GB+128GB:原价 17999 印度卢比(现汇率约合 1334 元人民币),现价 18499 印度卢比(现汇率约合 1371 元人民币) Galaxy A17: 6GB+128GB:原价 20499 印度卢比(现汇率约合 1519 元人民币),现价 21499 印度卢比(现汇率约合 1593 元人民币) 8GB+128GB:原价 22499 印度卢比(现汇率约合 1667 元人民币),现价 23499 印度卢比(现汇率约合 1741 元人民币) 8GB+256GB:原价 26499 印度卢比(现汇率约合 1964 元人民币),现价 27999 印度卢比(现汇率约合 2075 元人民币) Galaxy A36: 8GB+128GB:原价 32499 印度卢比(现汇率约合 2408 元人民币),现价 33999 印度卢比(现汇率约合 2519 元人民币) 8GB+256GB:原价 36499 印度卢比(现汇率约合 2705 元人民币),现价 37999 印度卢比(现汇率约合 2816 元人民币) 12GB+256GB:原价 40499 印度卢比(现汇率约合 3001 元人民币),现价 43499 印度卢比(现汇率约合 3223 元人民币) Galaxy A56: 8GB+256GB:原价 40999 印度卢比(现汇率约合 3038 元人民币),现价 42999 印度卢比(现汇率约合 3186 元人民币) 12GB+256GB:原价 44999 印度卢比(现汇率约合 3334 元人民币),现价 46999 印度卢比(现汇率约合 3483 元人民币) Galaxy F17: 4GB+128GB:原价 16999 印度卢比(现汇率约合 1260 元人民币),现价 17999 印度卢比(现汇率约合 1334 元人民币) 6GB+128GB:原价 18999 印度卢比(现汇率约合 1408 元人民币),现价 19999 印度卢比(现汇率约合 1482 元人民币) 从上述数据来看,本次涨价幅度在 500 印度卢比- 3500 印度卢比(IT之家注:现汇率约合 37 元- 259.3 元人民币)之间不等。如果本次消息属实,印度地区零售商可能很快就会按新价格销售相关机型。
华为畅享90 Pro Max首周激活量突破40万:超越iPhone 17全系列 位居第一
快科技4月10日消息,华为在3月23日正式发布了畅享90 Pro Max,起售价定为1699元。这款定位千元市场的机型一经上市,便在手机行业引发了巨大的震动。 根据最新的行业数据,华为畅享90 Pro Max的首周激活销量已经突破40万台。这一成绩不仅超越了同期的iPhone 17全系列机型,更让它一举夺得W14单周单品销量冠军,助力华为品牌份额攀升至25.9%。 事实上,这种强劲的势头在预售阶段就已显露。该机曾斩获京东平台1000至2000元价位段的热卖榜冠军,充分反映出普通消费者对于高品质千元机的巨大需求。 随着畅享90系列的全面上市,华为手机业务已经成功完成了从千元机到顶级旗舰的全价位段布局。这标志着华为正在以极其稳健的姿态,逐步收复曾经失去的市场份额。 作为华为旗下的最强千元机,畅享90 Pro Max的核心杀手锏之一在于其极致的续航表现,它内置了容量高达8500毫安时的巨鲸超能电池。 在核心体验方面,该机出厂搭载全新的鸿蒙6系统,并配备性能出色的麒麟8000芯片。软硬件的深度协同优化,为用户带来了丝滑的系统流畅度以及更全方位的安全守护。 针对耐用性痛点,畅享90 Pro Max还引入了旗舰级的玄甲机身结构,机身内部嵌入了高强度铝合金框架,不仅抗压性强,更大幅提升了整体的防护等级。 值得关注的是,该机已通过CQC和SGS的双五星级耐摔认证。这种硬核的抗摔性能,对于户外工作者或追求设备长久耐用的普通用户来说,具有极高的实用价值。
Anthropic的奥本海默时刻:最害怕 AI 的公司,正在造最危险的 AI
Anthropic 发布了它有史以来最强大的模型 Claude Mythos,将不对公众开放——越说越好奇了,这到底是有多强? 不公布的原因是,模型可能「构成前所未有的网络安全风险」(poses unprecedented cybersecurity risks)。历来所有的模型都会在网络安全的赛场上测试它们的能力,迄今为止,只有 Mythos 获得了这样的「高评价」。 最害怕 AI 的公司,正在造最危险的 AI,这件事跟你我有关。 A 社自己都害怕 在 Mythos 发布之前,Anthropic 就私下向美国政府高官发出警告:Mythos 使得大规模网络攻击在 2026 年变得更加容易实现。 4 月 7 日,Anthropic 的红队安全团队发布了 Mythos Preview 的技术评估报告,这份报告是近年来 AI 安全领域最重磅的技术文档之一,其中让 A 社决定不公开发布的地方在于: Mythos Preview 能找到每一个主流操作系统和每一个主流浏览器中的「零日漏洞」级别的 bug,并自主编写攻击代码。 在网络安全领域,「零日」指的是开发者发现这个漏洞后,修复它的时间是 0 天——在被发现的那一刻,它已经可以被利用了,防御方没有任何准备时间。 在之前的推送中我们也提到,Mythos 找到了 OpenBSD 中存在 27 年的 TCP 协议漏洞、FFmpeg 中存在 16 年的视频解码器漏洞、FreeBSD 内核中存在 17 年的远程代码执行漏洞(CVE-2026-4747)、一个未披露名称的生产级云计算 VMM 的内存损坏漏洞,以及多个主流浏览器的沙箱逃逸漏洞。这些 bug 都已经存在十年甚至二十年之久,之前从未被任何人或工具发现。 为什么这些 bug 能藏这么久?显然不是因为它们太简单而被忽略,是因为太复杂:需要跨多个维度的推理,加上精确的触发条件。 目前安全行业最主要的自动化工具是 fuzzer(模糊测试器),给程序喂大量的随机输入,看它会不会崩溃。Fuzzer 擅长发现「输入 X 导致崩溃」这种简单关系。 Fuzzer 不会「推理」,它只会盲测。比如 OpenBSD 的安全漏洞,需要理解两个看似无关的条件组合在一起才会爆炸;FFmpeg 那个 bug 需要构造一个精确命中特定数值的视频文件,正常使用或者随机测试,可能永远不会撞上。 但人呢?人总会推理吧?但人类审计员需要考虑规模问题。这些项目都有几百万行代码,人眼不可能逐行检查每一个文件。而且存在一种心理盲区:当一段代码已经安全运行了 27 年,任谁都会想当然地认为「应该有人查过了」。 Mythos 的质变在于它第一次同时具备了两种能力,推理和针对性实验。传统工具是「盲测」:随机输入,观察结果。人类审计是「推理」:读代码,推理漏洞,验证。 Mythos 把两者合二为一,它读懂代码的语义,提出「这里可能有漏洞」的假设,然后自己启动程序、加调试逻辑、运行实验来验证或推翻假设,循环往复。 Anthropic 强调,这些能力不是专门训练的结果,而是模型在代码、推理和自主性方面的通用改进的副产品——它们是「涌现」的。让模型更擅长修复漏洞的同时,也让它更擅长利用漏洞。上一代模型 Opus 4.6 在自主漏洞利用方面的成功率接近 0%。Mythos Preview 在同一个测试中,成功率从 2 次跳到了 181 次,都不是阶梯式提高,是平地起高楼。 Anthropic 的首席科学家 Jared Kaplan 对《纽约时报》说,他希望让更多人意识到这项技术的能力,因为这意味着模型不只是有找到漏洞、发现问题的能力,也有利用问题的能力,自动把漏洞变成可用的武器。 另一位安全研究者 Logan Graham 提出了一个更尖锐的问题:全球有大量关键基础设施运行在老旧代码上,它们过去的安全性主要依赖一个前提——攻击它们需要大量人力,「如果这个安全范式本身不再成立呢?」 你依赖的系统,正在失去保护 网络安全是个有点高大上的词,实际上,它和每个上网人的日常息息相关。 最典型的是 FFmpeg,这个开源的视频处理库,负责视频的解码、编码和转换。YouTube、Netflix、Bilibili、微信视频号、VLC 播放器,几乎所有需要播放或处理视频的软件都直接或间接依赖它。你每天在手机上看视频的时候,FFmpeg 的代码很可能正在你的设备上运行。 这样基础的设施,代码里藏着一个 16 年的漏洞,16 年来都没有人发现,想来问题也是不大了——直到 Mythos 出现。 Mythos 在这些系统中找到的漏洞,曾经没有造成问题,只是因为找到这些 bug 需要大量的人类专家时间——现在,这个阻碍不存在了。 《纽约时报》4 月 6 日的报道描绘了更广泛的图景:AI 正在从根本上改变网络安全的攻防格局。黑客使用 AI 加速攻击,防御方也只能用更多的 AI 来回应,人类安全专家正在被挤出攻防第一线。 第二天,TIME 报道了 Google 和量子计算初创 Oratomic 的最新研究,AI 辅助下的量子计算机破解互联网加密协议的时间可能比预期提前数年。Oratomic 的研究团队使用 AI 工具优化算法,将构建危险量子计算机所需的量子比特数减少了 100 倍。联合创始人 Dolev Bluvstein 说:「我们用了 AI 来加速这项研发,毫无疑问。」 Cloudflare 的安全研究员 Bas Westerbaan 的评估更是直接,「几乎世界上每一个系统都会变得对量子攻击者脆弱。」 发现问题,就会负责到底吗? Anthropic 是硅谷最常举起「负责任 AI」大旗的公司之一,创始人从 OpenAI 离职,理由就是担心 AI 安全。A 社每年发布大量安全研究,而与此同时,也是 A 社,制造了一个对网络安全最有杀伤力的武器。 负责任披露和威胁示警之间,只有一层薄薄的边界。顺着 Mythos 的发布,Anthropic 也牵头成立了 Project Glasswing,先把这个工具给到防御方(关键基础设施和开源项目),让他们在类似能力的模型广泛可用之前修复最重要的漏洞。 这是最反直觉的部分:发现这些问题的公司,恰恰是一直在警告这些问题的公司。Anthropic 没有在假装一切安全。它在大声说:我们造了一个危险的东西,我们知道它危险,我们正在尽力让防御方先行一步。但他们也知道,其他公司的类似模型很快就会跟上。通过公开展示危险性,Anthropic 同时实现了两个目标:它建立了自己作为安全权威的地位,也向潜在客户证明了 Mythos 的能力上限。「这个模型强大到连我们自己都害怕」,这句话既是警告,也是广告。 而与此同时,你的浏览器、你使用的云服务、你的视频平台、你的加密通信——这些系统的安全范式正在被重新定义。它们所披着的安全罩,正在变得越来越脆弱。过去它们「安全」是因为攻击者需要大量的人力和时间来发现和利用漏洞,现在一个模型几小时就能完成同样的工作。 AI 安全已经不是一个行业话题。你的浏览器、你的密码、你对 AI 助手的信任——这些都在这场变革的射程之内。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。