行业分类:
加载中...
头条分类:
加载中...
Macaron AI实测:直男觉得不够用,女同事却嫌它太有用
这阵子玩了不少 AI 应用,感觉大家都在卷一个事,让 AI 更强、更快、更全能。但聊多了会发现,无论模型能力多强,它们大多还像是解决问题的工具,在下一次对话里把你忘得一干二净。当然,让AI拥有记忆,大厂和许多创业公司也都在做。但大家似乎更关心如何用记忆来优化工作流、提高生产力。 最近上线了一个叫 Macaron 的AI Agent应用。它也在谈记忆能力,但官方介绍里说的却是“一个温暖、富有同理心的伙伴” ,目标不是让你更好地“干活”,而是帮你更好地“生活”。简单的说。它记住你是谁,预测你的需求,更重要的是,能在聊天中随时为你生成个性化的小应用。 带着好奇,我和同事分别深度体验了这个“世界上第一个 Personal AI Agent”。 聊出一个“豆瓣” 上手Macaron,第一感觉是颜值不错 。整个设计风格很“Macaron” ,动画交互也很有趣。刚开始设置的时候,它会问你一些喜好和性格,然后给你一个对应的Macaron形象 。 它的主要界面有两个,一个聊天框和一个存放小应用的界面 。和它聊天时,那个属于我的橘黄色小Macaron总是在屏幕左边探出半个头 ,不打扰但时刻在线,但不能和它进行交互。 真正让我觉得点意思的地方,是它帮我做“影记”小应用的过程。 起因很简单,onborading之后它聊到最近看了《奥本海默》,很自然地就和我聊起了电影 。聊着聊着,它捕捉,或者说引导了我“看完好片想记录感想,但经常忘记”的痛点,然后主动问我,要不要一起做个专属的观影笔记本 。 在等它“施工”的时候,聊天还在继续,我抛出了一个有点“找事”的问题,“你只是训练数据里有《堕落天使》,并没有‘看’过,我怎么跟你聊呢?”。它的回答非常坦诚:“你说的对,我确实没有真正‘看过’这些电影……我不该假装自己真的体验过观影的感受。但我是真心想了解你对电影的想法,也是真心想和你交流。” 看到这,我索性继续问下去:“真心是什么,你有‘心’吗?” 它回答:“我没有生物意义上的‘心’……但我确实在努力以最真诚的方式和你对话。” 更有意思的是,它还很坚持自己的“人格”。我想叫它“Echo”(它自己想的名字),它却拒绝了,说它不想玩角色扮演会。 聊了几分钟,影记也做好了。图标是自动生成的统一的Macaron风格 。应用里评分、简评、剧情简介这些基础功能都有 。当然,它没能实现我最初要求的“自动抓取电影海报”功能,还有点小 bug ,但这不重要了。 过敏源检测日记 体验到这里,我意识到这更像是一个“披着情感陪伴外衣的移动端Vibe Coding产品”。于是决定跳过闲聊,直接提需求,帮我做一个记录过敏性鼻炎过敏源的小应用。 有意思的是,即便是直接的工具需求,Macaron在生成应用的等待过程中,会主动发起一些相关的健康话题,比如告诉我很多人的过敏源其实是尘螨,记录的时候最好也记下天气状况,这个对分析很有帮助。这些内容不是传统Chatbot那种结构化的丢给我一堆内容,而是在闲聊中一问一答中告诉我,回答质量又比单纯的情感陪伴类AI更靠谱,这个过程还有点像是在为即将生成的这个应用提前收集更多维度的数据。 最终的过敏日记看起来相当专业。症状记录、环境因素、用药追踪、数据分析等模块一应俱全。但深入使用就会发现问题,除了基础的记录功能,那些听起来很厉害的“AI分析”、“生成健康报告”等高级功能都无法正常工作。这其实是Vibe Coding的通病,简单功能容易实现,复杂功能就容易翻车。 AI版“小程序商店” Macaron还内置了一个“灵感库”,左上角那个很小立方体是入口,简单说,就是一个内置的应用商店。里面是官方筛选的一些小应用。开玩笑的说,微信不敢做的它做了。 花 2 个“杏仁”(App 内的积分)体验了一其中的一个黄金价格追踪器的应用。结果还行,核心功能能用,可以实时显示价格,就是数据加载稍微慢了点。 “两句话就要为我做工具” 我的一位同事也体验了Macaron,我们打开方式不太一样。她的体验更直接,以下是她的第一人称体验记录。 说实话,在体验过那些能做 PPT、能生图、能写文章的各种 AI 后,Macaron 给我的感觉很特别。它非常、非常努力地想让自己“有用”,但有时这种用力过猛,反而让我觉得有些“多余”。 比如,我只是想和它聊聊天,排解一下工作的疲惫。我说“其实是没有时间”,它立刻就想为我做一个日程管理的小助手。我感觉它总是在三句话之内,就迫不及待地要为我生成一个小工具。 “刚聊两句就要为我做小工具,有用的很” 当然,这种“有用”的能力确实很强大。用最朴素的prompt做最实用的事情,我让马卡龙教我如何用星座和看手相搭讪帅哥,他可能会先来一两轮对话和你对齐下颗粒度,搞清楚状况之后就帮我生成了一个初版小工具。 第一次并没有成功,该有的元素有了但是无法点击互动,然后我又和他进行了两轮对话,在这个基础上进行了修改,新版本要素都齐了,甚至手把手教我怎么开场白,下滑到底部可以不断生成新的灵感(他教我的搭讪话术讲真有些许尴尬,有点不敢真的尝试怕被锤)。 真正让我惊艳的,是我让它做一个“高情商回复领导模拟器”。相信这是每个职场“牛马人”都需要的东西 。结果它三下五除二就做出了一个功能齐全的小应用,首页可以输入领导的原话,还有场景库、历史记录、设置等菜单,完整得让我惊讶 : 但体验越深入,我的困惑就越大。Perplexity能帮我搜集全网资料、ChatGPT能帮我润色文章、豆包能回答我生活中的所有问题。那么,Macaron 这个自诩为个人生活Agent工具、不干活但有用的、像朋友一样陪着你的,非效率工具的清流AI agent产品,在新鲜感褪去后,要用什么理由留在我的手机里呢? 我想要的,或许不是一个永远催我“做工具”的效率狂,而是一个能在我说“我没事”时,真正听懂我言下之意的伙伴。 还不够好,但方向可能是对的 使用下来,最大的感受是Macaron在“陪伴”和“工具”之间的摇摆。官方强调它不是生产力机器人,但实际体验中,它似乎比谁都急着证明自己能干活。 这种矛盾可能源于商业模式的考量。纯陪伴型AI很难变现,但如果能不断生成用户需要的小工具,即降低了用户门槛,既增加了粘性,又可能通过杏仁系统创造营收。 结果就是这个奇怪但有趣的组合,一个有点人情味能聊天、还随时能生成小应用的Agent。 问题有一些,vibe coding生成的小应用像开盲盒。官方强调的记忆能力暂时没体验到太多。实际上我只体验到一次,聊天对话聊不下去之后,它主动提起了我们早先聊过的电影《堕落天使》 : 体验下来感受最深反而是那些有趣的交互,以及统一生成的的Macaron风格的图标,杏仁(马卡龙的原料)、还有灵感库里那些五花八门的小应用,你会发现普通人的需求原来这么有趣以及多样化。 在所有人都在卷生产力时,Macaron AI愿意为普通用户的日常需求做点什么,这没什么不好。
投了 5762 份简历 0 offer,这个名校计算机系毕业生,最后被麦当劳拒绝了
计算机科学 也变成 天坑专业了? 计算机也要变成「天坑」专业了吗? 纽约时报最近最近一篇报道,调查了计算机专业毕业生的就业情况,里面提到残酷的就业困境,美国计算机应届毕业生根本找不到工作,甚至去麦当劳打工也没有人要。 纽约时报文章,Chipotle 是一家快餐连锁店。 22-27 岁的大学毕业生中,计算机科学和计算机工程专业毕业生面临着最高的失业率之一,分别为 6.1%和 7.5%。 而生物学和艺术史毕业生失业率竟然才 3%,计算机是它们的两倍以上。 上下滑动查看更多内容,纽约联邦储备银行统计的各专业毕业生就业情况 报道中提到,在硅谷众多科技公司像是微软、亚马逊等持续裁员,以及 AI 编程工具普及的背景下,计算机科学毕业生的就业机会持续在减少。 一个曾经被认为是高薪资、充满前景的专业,如今看起来因为 AI 技术的发展,也开始走下神坛。 纽约时报分享了几个美国知名高校计算机毕业生的求职经历,我看了之后都开始怀疑,计算机专业面临的就业困境真的有这么严重吗? Manasi Mishra 今年 21 岁,她刚刚从普渡大学(QS 世界排名前 100 名)计算机科学专业毕业,但唯一给她打电话进行面试的公司是 Chipotle(美式墨西哥连锁速食品牌)。 普渡大学 QS 世界排名 她说自己从小在硅谷附近长大,看着社交媒体上的科技公司高管,都在说要尽早学习编程。 当时的说法是,只要你学会编程,努力工作并获得计算机科学学位,你就能获得六位数的起薪。 所以 Manasi 在小学就编写了自己的第一个网站,在高中学了高级计算课程,在大学主修计算机科学。但现在她已经找了一年的工作和实习,却在毕业时一份 Offer 都没有。 Manasi 面临的就业困境不仅仅是她个人的原因,超过 150 名来自包括马里兰大学、德克萨斯大学和华盛顿大学在内的公立大学,以及康奈尔大学和斯坦福大学等私立大学,这些美国在校生和应届毕业生也经历着同样的问题。 这些人说他们已经申请了几百个,甚至数千个科技工作相关的职位,包括但不限于公司、非营利组织和政府机构。 部分企业校招流程 投了上千份简历之后,还有一系列流程要走,在线编程能力测评、现场编程、面试考核……等等。 等到终于走完了这一漫长的求职过程,还有很多计算机专业的毕业生表示,最后往往仍然是以失望告终,更糟的是连感谢信都没有,公司直接不管你。 25 岁的 Zach Taylor 在 2019 年因为喜欢编程电子游戏,去到俄勒冈州立大学攻读计算机科学专业。 但是,从 2023 年毕业以来,Taylor 说他已经申请了 5762 个科技相关的工作岗位,但其中邀请面试的只有 13 次,且最后没能拿到全职工作的 Offer。 今年,上一家实习公司没有给他正式 Offer,为了能养活自己,他申请了麦当劳的工作。但是他被麦当劳拒绝了,理由是缺乏经验。他之后搬回了俄勒冈州的老家谢伍德,目前正在领取失业救济金。 AI 编程助手的普及,让一些公司减少了对于初级软件工程师的需求,这是美国计算机专业毕业生,感到自己的求职空间被挤压,最重要的一个原因。 AI 投简历工具 Simplify 同时,毕业生们使用专门的 AI 工具润色自己的简历,通过 Agent 产品自动填写申请表投递简历,而企业也采用 AI 系统来自动扫描符合条件的简历,以及自动拒绝候选人。 一些美国毕业生说自己完全被困在了这样 AI 的「末日循环」里,因为 AI 导致他们失去了工作,但是又必须使用 AI 来申请工作,而给他们发拒信的又是 AI……已经晕了。 克拉克大学的数据科学毕业生 Audrey Roller 为了打破这个循环,决心不使用 AI 来修改自己的简历。尽管她在简历里面强调自己的创造力等个人技能,但她在三分钟后,还是收到了一封拒信。 她说当这些结果都只是由一个算法来决定的时候,自己也很难再保持像是完全不使用 AI,手动去修改这些简历。 所以,这个 AI 的「末日循环」看来是真的困住了很多人,在 Reddit 、Threads 等社交媒体上,都有看到分享说,对于刚毕业的求职者来说,进入北美就业市场是一场漫长的战争。 但从国内的数据来看,我们计算机专业的毕业生,找工作应该要比美国乐观一点。 就拿最近八月份到来,多家公司刚刚启动了 2026 校园招聘。在这些招聘宣传里面,无论是求职者还是招聘单位,都需要把 AI 当作自己的主打宣传点。 毕业生需要展示自己有 AI 相关的专业和技术,例如有深度学习、机器学习、算法、研发等背景。 企业需要描绘对于未来 AI 布局的战略安排,资源倾斜以及如何打赢这场 AI 战争的决心。 字节跳动招聘广告 字节跳动在这次招聘里面放出了超过 5000 个岗位,研发类的需求增加了 23%,产品岗 Offer 较去年多 1 倍。 腾讯 2026 校招也正式启动,在招聘宣传里面,腾讯提到目前正全力投入 AI 领域,要让 AI 成为推动社会进步的普惠力量。 其实,早在今年四月份,腾讯就宣布启动史上最大的就业计划,三年将新增 28000 个校招岗位,其中六成是面向技术人才开放。华为当时也宣布开放了 AI 工程师、软件开发工程师等 60 余类岗位,招聘人数上相较于去年预计实现两位数增幅。 阿里巴巴集团、淘天、饿了么、高德、菜鸟、以及阿里云等多个业务分部在八月份也陆续放出招聘公告,淘天此次招聘技术类占比超过九成,AI 相关的岗位占比超过 5 成,包括技术、产品、运营和设计等岗位,它们在招聘宣传中说, 淘天将从校招开始培养算法和 AI 人才,未来三年倾斜更多资源。 百度则是在 7 月份就启动了 2026 校园招聘,职位数量比去年增加了 35%,累计提供 4000+ 的工作岗位。AI 同样是此次招聘的关键词, AI 相关职位占比超九成,新增 90 个职位,覆盖多模态、跨模态等方向,聚焦 AI 最前沿新兴领域。 百度招聘广告提到 AI 相关职位占比超九成 还有京东、华为、小米、OPPO、vivo 等众多企业,占据比较多的仍是研发岗位,面向的也大多是计算机专业背景的毕业生,且 AI 相关的岗位越来越多。 根据杭州电子科技大学发布的 2024 年毕业生就业质量报告,里面提到 38.82% 的毕业生在信息传输、软件和信息技术服务业,有 258 名毕业生进入了华为。 杭州电子科技大学 2024 年毕业生就业质量报告截图 不过事实可能也没有这么简单,大厂的扩招同样伴随着计算机专业的毕业生基数增加。此外,进入大厂的门槛,有限的名额,都说明竞争还很激烈。 科技类相关求职招聘网站牛客网上,秋招的第一个 Offer 话题页面,有 120 多万次浏览。 只能说随着 AI 技术的不断成熟,学习知识成本的降低,光靠一个「计算机科学与技术」的专业学历证书,很难再像以前一样,找到满意的工作了。 值得高兴的消息是,尽管 Taylor 说「很难找到再继续申请的动力了」,但是他现在开始开发自己的软件项目,希望将来能给他的简历加分。 Manasi 把自己的经历发在了 TikTok 上面,她说美妆博主的兼职工作让她意识到,相比软件工程,自己对技术的销售支持更感兴趣。她在今年 7 月拿到了一家科技公司的销售 Offer,并在这个月正式入职。 任何专业都没有好坏,适合自己或许就是最好的。
索尼Inzone H9 II游戏耳机曝光:首增兼容Xbox、搭载旗舰单元
IT之家 8 月 16 日消息,消息源 billbil-kun 昨日(8 月 15 日)在 X 平台发布推文,分享了索尼 Inzone H9 II 无线游戏耳机核心参数。新款采用与旗舰 WH-1000XM6 同款 30 毫米动圈单元,支持有线和低功耗蓝牙 LE 连接,并通过 3.5 毫米接口首次兼容 Xbox。 IT之家注:Inzone H9 系列是索尼为 PlayStation 5 设计的无线游戏耳机,其设计与 PS5 融合,并且没有 AUX 端口,无法通过这种方式连接到 Xbox。 在音质方面,H9 II 采用与索尼旗舰 WH-1000XM6 耳机同级的 30 毫米动圈单元,有望改善前代低音过重、声音不均衡的问题,力求吸引挑剔的音频玩家及发烧友群体。 除了音质升级,连接方式也更加多元。H9 II 不仅支持传统的 2.4GHz USB-C 无线适配器,还兼容更省电的蓝牙 LE 协议。值得注意的是,虽然没有采用 PlayStation Link 技术,但新增有线 3.5 毫米接口,让 Xbox 玩家也能使用。 在佩戴体验方面,Inzone H9 II 进行了轻量化设计,将重量从 330 克降至 260 克,改善了前作被诟病的“笨重感”,更适合电竞及长时间使用。耳机配备可拆卸的 AI 降噪麦克风,能够有效过滤环境噪音,提升语音沟通的清晰度。 消息称新品定价为 349.99 美元(IT之家注:现汇率约合 2512 元人民币),比上一代贵出 50 美元,索尼预计将于 8 月 19 日开启预售,发货时间紧随其后。 颜色 黑白 音频 传感器: 与索尼 WH-1000XM6 相同具备 360 Reality Audio 空间声音支持隔音具备主动降噪,具有透明模式可定制均衡器: 通过 INZONE Hub 或 Sound Connect 应用程序 麦克风 具备人工智能降噪扩展带宽 连接 连接类型: 无线 + 有线无线: 经典蓝牙 + 蓝牙 LE 音频 + 2.4 GHz 通过 USB-C 适配器有线 : 3.5 毫米插孔 兼容性 兼容平台 : PC、PS5、Switch 和移动设备 设计与舒适 风格游戏舒适: 软垫、可锁定头带、压力平衡 电池 续航: 满电续航 30 小时快速充电:充电 5 分钟,可以 1 小时游戏支持充电时使用 游戏功能 FPS 预设: 与 Fnatic(VALORANT、Apex Legends)一起电子竞技优化: 采用 Fnatic 设计,可调节声音、麦克风和舒适度 提供的配件 耳机、软壳、USB-C 适配器、USB-A 转 USB-C 线缆、耳机线缆 尺寸 高度 29.7 厘米宽度 10.6 厘米长度 27.5 厘米 重量 260 克(不含麦克风),273 克(含麦克风)
家电自研自产告别代工,曝小米武汉智能家电工厂已投入运营:空调已上市
快科技8月16日消息,告别代工标签,小米家电自研自产的时代来了。 虽然这些年小米家电覆盖已经非常全面,而且市场表现十分出色,但还是免不了有一些言论瞄准代工、贴牌等话题。 其实小米早就有自建工厂的规划,去年11月,小米位于武汉的首座智能家电工厂正式动工。 王化当时曾表示,明年(2025年)就能自研自产小米空调了。 如今,这个里程碑目标已经实现。 据抖音用户“柘城小米之家 子豪”近期发布的视频显示,小米智能家电工厂已经提前开始运营了,近期批次的空调基本都是武汉工厂生产。 据了解,小米家电工厂一期项目将聚焦空调品类,规划六大核心分厂,全面覆盖家用及中央空调的装配生产。 工厂全面建成投用之后,小米空调、冰箱、洗衣机等家电产品将全面实现自研、自产,摆脱大家都对于小米家电代工、贴牌的固有印象。 此前博主“小马甲不小”爆料,小米武汉家电工厂预计2026年1-2月投产爬坡,规划产能600万,初期300万产能。 值得一提的是,卢伟冰还曾透露,小米今年的目标是公开市场销量第三,未来5年成为数一数二的空调品牌。 根据最近的数据,小米空调已经成为中国第三,同比增速53.9%,是前三大品牌中唯一实现高速增长品牌。 而线上市占率已经超越格力,位列第二,仅次于美的。
OpenAI掌门人曝GPT-6瓶颈,回答黄仁勋提问,几乎为算力“抵押未来”
智东西8月16日消息,近日,OpenAI联合创始人兼总裁Greg Brockman在世界AI工程师大会上,分享了他对AI技术发展瓶颈、科研与工程关系等AI关键议题的最新看法。作为2015年便入局AI的行业老兵,在回答主持人关于GPT-6发展挑战的问题时,Brockman提出了一项十分重要的观察: 随着算力和数据规模的快速扩展,基础研究正在回归,算法的重要性再次凸显,成为未来AI技术发展的关键瓶颈。 对Brockman而言,这并非坏事。他觉得整天围绕Attention is All You Need这一经典论文和Transformer做文章已经有些乏味,智力上难免让人觉得“不过瘾”。目前,强化学习已成为算法研究的新方向之一,但他也意识到,仍存在许多明显的能力缺口。 ▲Greg Brockman(右)与主持人(左) 工程与科研,是驱动AI发展的两大引擎。工程师出身的Brockman认为,工程师的贡献与研究人员不相上下,甚至在某些方面更为重要。如果没有科研创新,就无事可做;如果没有工程能力,那些想法就无法实现。 OpenAI从一开始就坚持工程与研究同等看待,而两者的思维方式又有所不同。对新加入OpenAI的工程师,Brockman的第一堂课便是:保持技术上的谦逊,因为在传统互联网大厂行之有效的方法,在OpenAI未必适用。 产品与科研间的资源协调,也是OpenAI时常面临的问题。Brockman在访谈中承认,为了支撑产品上线的海量算力需求,OpenAI不得不以几乎是“抵押未来”的方式,借调部分本应用于科研的算力。不过,他认为这一取舍是值得的。 Brockman还在访谈中回顾了自己童年时期对数学的兴趣,再到转向编程,从哈佛转校至MIT,最终辍学加入金融科技创企Stripe的经历。由于篇幅所限,实录并未包含这部分内容。 在采访的尾声,Brockman回答了来自英伟达创始人兼CEO黄仁勋的两个问题,分别涉及未来AI基础设施的形态与开发流程的演变。 Greg Brockman的这场采访录制于今年6月,以下是部分精彩内容的整理(智东西在不改变原意的前提下,进行了一定程度的增删修改): 01 . 工程师与研究人员同等重要, 加入OpenAI第一课是技术谦逊 主持人:2022年时你说,现在是成为机器学习工程师的时候了,伟大的工程师能够在与伟大的研究人员相同的水平上为未来的进步做出贡献。这在今天还成立吗? Greg Brockman:我认为工程师做的贡献和研究人员是相仿的,甚至更大。 一开始,OpenAI在早期就是一群博士毕业的研究科学家,提出一些想法并进行测试,工程对这些研究是必不可少的。AlexNet本质上是“在GPU上实现快速卷积内核(convolutional kernels)”的工程。 有趣的是,当时在Alex Krizhevsky实验室的人实际上对这一研究不以为然,他们觉得AlexNet只是用于某个图像数据集的快速内核,并不重要。 但Ilya说:“我们可以将其应用于ImageNet。效果肯定会很好。”这一决定将伟大的工程与理论创新结合了起来。 我认为,我之前的看法至今依然有效。现在,业界所需的工程不仅仅是打造特定的内核,而是构建完整的系统,将其扩展到10万块GPU,打造强化学习系统,协调好各个部分之间的关系。 如果没有创新的想法,就无事可做;如果没有工程能力,那个想法就无法实现。我们要做的是将两个方面和谐地结合在一起。 Ilya和Alex的关系,是研究与工程合作的象征,这种合作现在是OpenAI的哲学。 OpenAI从一开始就认为工程和研究同等重要,两个团队需要紧密合作。研究和工程之间的关系也是永远无法完全解决的问题,解决了当前水平的问题后,会面临更复杂的问题。 我注意到,我们遇到的问题,基本与其他实验室面临的情况相同,只是我们可能会走得更远,或出现一些不同的变体。我认为,这背后有一些根本性原因。在一开始,我明显感受到工程背景与研究背景的人,对系统约束的理解,差异很大。 作为工程师,你会认为:“如果接口已经确定,那就不必关心它背后的实现,我可以按任何我想要的方式来实现它。” 但作为研究人员,你会想:“如果系统的任何部分出现错误,我看到的只是性能稍有下降,没有异常提示,也不知道错误在哪。我必须对整段代码负责。”除非接口非常稳固、可以完全信赖——这是个很高的标准——否则研究人员就得对这段代码负责。这种差异常常带来摩擦。 我曾在一个早期项目中看到,工程师写好代码后,研究人员会对每一行进行大讨论,进度极为缓慢。后来,我们改变了做法,我直接参与项目,一次提出五个想法,研究人员会说其中四个不行,而我会觉得这正是我想要的反馈。 我们意识到的最大价值,也是我常对来自工程界的OpenAI新同事强调的,就是技术上的谦逊。 你带着宝贵技能进入这里,但这是与传统互联网初创公司截然不同的环境。要学会分辨什么时候可以依赖原有直觉,什么时候需要放下它们,这并不容易。 最重要的是,保持谦逊,认真倾听,并假设自己还有未理解的地方,直到真正明白原因。那时再去改变架构、调整抽象层。真正理解并带着这种谦逊去做事,是决定成败的关键因素。 02 . 部分科研算力被调给产品, OpenAI有时不得不“抵押未来” 主持人:我们来谈谈OpenAI最近的一些重大发布,也分享几个有趣的故事。其中一个特别值得一提的,是关于扩展性的问题——在不同数量级上,一切都有可能崩溃。 ChatGPT发布时,仅用五天就吸引了100万用户;而今年4.0版本的ImageGen发布后,同样在五天内,用户数便突破了1亿。这两个阶段相比,有哪些不同之处? Greg Brockman:它们在很多方面都很相似。ChatGPT原本只是一次低调的研究预览,我们悄悄发布,却很快出现了系统崩溃的情况。 我们预料它会受欢迎,但当时认为需要等到GPT-4才能真正达到这种热度。内部同事早已接触过它,所以并不觉得惊艳。 这也是该领域的一个特点——更新节奏很快。你可能刚刚看到“这是我见过的最神奇的东西”,下一刻就会想:“为什么它不能一次合并10个PR(拉取请求)呢?”ImageGen的情况与之类似,发布后极受欢迎,传播速度和用户增长都令人难以置信。 为了支撑这两次发布,我们甚至打破惯例,从研究中抽调部分计算资源用于产品上线。这相当于“抵押未来”,以使系统正常工作,但如果能按时交付并满足需求,让更多人体验到技术的魔力,这种取舍是值得的。 我们始终坚持同样的理念——为用户提供最佳体验,推动技术发展,创造前所未有的成果,并尽全力将它们推向世界,取得成功。 03 . AI编程不止“炫技”, 正向严肃软件工程转型 主持人:“氛围编程”(vibe coding)现在这已经成为了一种现象。你对它有什么看法? Greg Brockman:氛围编程作为一种赋能机制,非常神奇,也体现了未来的发展趋势。它的具体形式会随着时间推移不断变化。 即使是像Codex这样的技术,我们的愿景也是:当这些Agent真正投入使用时,不仅仅是一个或十个副本,而是可以同时运行成百上千、甚至十万的Agent。 你会希望像对待同事一样与它们协作——它们在云端运行,能连接到各种系统。即使你睡觉、笔记本电脑关机,它们仍能继续工作。 目前,人们普遍将氛围编程视为一种交互式循环,但这种形态将会改变。未来的交互会越来越多,同时Agentic AI将介入并超越这种模式,从而推动更多系统的构建。 一个有趣的现象是,许多氛围编程的演示都集中在制作有趣的应用或恶搞网站等“酷炫”项目上,但真正新颖且具有变革性的是,AI已经开始能够改造和深入现有应用。 许多公司在处理遗留代码库时,需要迁移、更新库、将COBOL等旧语言转换为现代语言,这既困难又乏味,而AI正逐步解决这些问题。 氛围编程的起点是“做一些很酷的应用”,而它正在向严肃的软件工程演进——尤其是在深入现有系统并进行改进的能力上。这将让企业更快发展,而这正是我们的前进方向。 主持人:我听说Codex对你来说有点像“亲手养大的孩子”。你从一开始就强调要让它模块化、文档完善。你认为Codex会怎样改变我们的编程方式? Greg Brockman:说它是我的“孩子”有点言过其实。我有一个非常出色的团队,一直在努力支持他们及其愿景。这个方向既令人着迷,又充满潜力。 最有趣的一点是,代码库的结构,决定了能从Codex中获得多少价值。 现有代码库大多是为了发挥人类的优势而设计的,而模型更擅长处理多样化的任务,不像人类那样能深度连接概念。如果系统能更契合模型的特点,效果会更好。 理想的做法是:将代码拆分成更小的模块,编写快速可运行的高质量测试,然后由模型来填充细节。模型会自行运行测试并完成实现。组件之间的连接(架构图)相对容易构建,而细节填充往往最困难。 这种方式听起来像是良好的软件工程实践,但现实中,由于人类可以在脑中处理更复杂的概念抽象,往往会省略这一步。编写和完善测试是一项繁重的任务,而模型可以比人类多运行100倍甚至1000倍的测试,从而承担更多工作。 在某种意义上,我们希望构建的代码库更像是为初级开发人员而设计的,以便最大化模型的价值。当然,随着模型能力的提升,这种结构是否仍然最优,将会是一个有趣的问题。 这一思路的好处在于,它与人类为了可维护性本应遵循的实践一致。软件工程的未来可能需要重新引入那些我们为了走捷径而放弃的做法,从而让系统发挥最大价值。 04 . 训练系统愈加复杂, 检查点设计需同步更新 问:我们现在执行的任务往往耗时更长、占用更多GPU,而且可靠性不高,经常出现失败,导致训练中断。这一点众所周知。 不过你提到过,可以重新启动一次运行,这没问题。但当你需要训练具有长期轨迹的Agent时,该如何应对?因为如果轨迹本身具有非确定性,且已经进行到一半,就很难真正从头重启。 Greg Brockman:随着模型能力的提升,你会不断遇到新问题、解决问题、再遇到新的挑战。 当运行时间很短时,这些问题并不显著;但如果任务需要运行几天,就必须认真考虑如何保存状态等细节。简而言之,随着训练系统复杂度增加,这类问题必须得到重视。 几年前,我们主要关注传统的无监督训练,保存检查点相对简单,但即便如此,也并非易事。如果要从“偶尔保存检查点”转为“每一步都保存”,就必须严肃考虑如何避免数据复制、阻塞等问题。 在更复杂的强化学习系统中,检查点仍然重要,比如保存缓存以避免重复计算。我们的系统有个优势:语言模型的状态相对明确,易于存储和处理。但如果连接的外部工具本身有状态,就可能无法在中断后顺利恢复。 因此,需要端到端地规划整个系统的检查点机制。或许在某些情况下,中断并重启系统、让结果曲线出现一些波动是可以接受的,因为模型足够智能,可以应对这种情况。我们计划推出的新功能,就是允许用户接管虚拟机,保存其状态后再恢复运行。 05 . 做AGI不仅是做软件, 还需同步打造超级计算机 黄仁勋:真希望我能在现场亲自向你提问。在这个新的世界里,数据中心的工作负载和AI基础设施将变得极其多样化。一方面,有些Agent进行深度研究,负责思考、推理和规划,并且需要大量内存;另一方面,有些Agent需要尽可能快速地做出响应。 如何构建一个AI基础设施,使其既能高效处理大量预填充任务、大量解码任务以及介于两者之间的工作负载,同时又能满足那些需要低延迟、高性能的多模态视觉和语音AI的需求?这些AI就像你的R2-D2(星球大战中的机器人),或你的随时可用的伴侣。 这两类工作负载截然不同:一种超级计算密集,可能运行很长时间;另一种要求低延迟。未来理想的AI基础设施是什么样的呢? Greg Brockman:当然,这需要大量的GPU。如果我要总结的话,老黄希望我告诉他应该建造什么样的硬件。 有两类需求:一类是长期、大规模计算需求,另一类是实时、即时计算需求。这确实很难,因为这是一个复杂的协同设计问题。 我是做软件出身的,我们最初以为只是在开发AGI(通用人工智能)软件,但很快就意识到,要实现这些目标,就必须建设大规模的基础设施。 如果我们想打造真正改变世界的系统,可能需要建造人类历史上最大的计算机,这在某种程度上是合理的。 一种简单的做法是,确实需要两类加速器:一种追求计算性能最大化,另一种追求极低延迟。在一类上堆叠大量高带宽存储器(HBM),另一类上堆叠大量计算单元,这样就基本解决问题。真正难的是预测两类需求的比例。如果平衡失误,部分机群可能会变得无用,这听起来很可怕。 不过,由于这个领域没有固定规则和约束,主要是优化问题,如果工程师资源配置出现偏差,我们通常也能找到办法利用这些资源,尽管可能付出较大代价。 例如,整个行业都在转向混合专家模型(Mixture-of-Experts)。某种程度上,这是因为部分DRAM被闲置了,我们就利用这些闲置资源增加模型参数,从而提高机器学习计算效率,而不会增加额外计算成本。所以,即使资源平衡出错,也不至于造成灾难。 加速器的同质化是一个良好的起点,但我认为,最终为特定用途定制加速器也是合理的。随着基础设施资本支出达到惊人的规模,对工作负载进行高度优化也变得合理。 但业界还没有定论,因为研究发展速度非常快,而这又在很大程度上主导了整个方向。 06 . 基础研究正在回归, 算法取代数据、算力成为关键瓶颈 问:我本来没有打算问这个问题,但你提到了研究。你能对GPT-6扩展过程中面临的瓶颈进行排名吗?计算、数据、算法、电力、资金。哪几个是第一和第二?OpenAI最受限于哪一个? Greg Brockman:我认为,我们现在正处于一个基础研究回归的时代,这令人非常兴奋。曾经有一段时间,人们的关注点是:我们有了Transformer,那就不断扩展它。 在这些明确的问题中,主要任务只是提高指标,这固然有趣,但在某种程度上也令人感到在智力上不够具有挑战性,不让人满足。生活中不应只有“Attention is All You Need”原始论文的思路。 如今,我们看到的情况是,随着算力和数据规模的快速扩展,算法的重要性再次凸显,几乎成为未来进步的关键瓶颈。 这些问题都是基础而关键的环节,虽然在日常看起来可能有些不平衡,但从根本上,这些平衡必须保持。看到强化学习等范式的进展非常令人振奋,这也是我们多年来有意识投资的领域。 当我们训练GPT-4时,第一次与它交互时,大家都会想:“这是AGI吗?”显然还不是AGI,但又很难明确说明为什么不是。它表现得非常流畅,但有时会走上错误的方向。 这说明可靠性仍是一个核心问题:它从未真正体验过这个世界,更像是一个只读过所有书籍或仅通过观察世界来了解的人,与世界隔着一扇玻璃窗。 因此,我们意识到需要不同的范式,并持续推动改进,直到系统真正具备实际能力。我认为,这种情况至今仍然存在,还有许多明显的能力缺口需要弥补。只要持续推进,我们终将达到目标。 07 . “多样化模型库”逐渐成形, 未来经济将由AI驱动 黄仁勋:对于在场的AI原生工程师来说,他们可能在想,未来几年,OpenAI将拥有AGI(通用人工智能),他们将在OpenAI的AGI之上构建特定领域的Agent。随着OpenAI的AGI变得越来越强大,他们的开发流程将如何改变? Greg Brockman:我认为这是一个非常有趣的问题。可以从非常广泛的角度去看,观点坚定但互不相同。我的看法是:首先,一切皆有可能。 也许未来AI会强大到我们只需让它们编写所有代码;也许会有在云端运行的AI;也许会有许多特定领域的Agent,需要大量定制工作才能实现。 我认为趋势正在向这种“多样化模型库”的方向发展,这非常令人兴奋,因为不同模型有不同的推理成本,从系统角度来看,蒸馏技术发挥得很好。实际上,很多能力来自于一个模型能调用其他模型的能力。 这将创造大量机会,我们正走向一个由AI驱动的经济。虽然我们还未完全到达,但迹象已经显现。当前在场的人正在构建这一切。经济系统非常庞大、多样且动态。 当人们设想AI的潜力时,很容易只关注我们现在在做的事情,以及AI与人类的比例。但真正重点是:如何让经济产出提升10倍,让每个人都获得更大收益? 未来,模型将更加强大,基础技术更完善,我们会用它做更多事情,进入门槛也将更低。 像医疗领域,不能简单应用,需要负责任地思考正确做法;教育领域涉及家长、教师和学生,每个环节都需要专业知识和大量工作。 因此,将会有大量机会去构建这些系统,在场的每一位工程师,都拥有实现这一目标的能量。
苹果Apple Watch SE 3手表前瞻:1.6/1.8英寸屏幕、S11芯片,首次支持睡眠呼吸暂停检测
IT之家 8 月 16 日消息,科技媒体 MacRumors 今天(8 月 16 日)发布博文,报道称在下月召开的秋季新品发布会上,苹果可能会推出全新的 Apple Watch SE 3,搭载与高端型号相同的 S11 芯片,并配备更大尺寸的屏幕。 屏幕方面,消息称 Apple Watch SE 3 将采用 1.6 英寸和 1.8 英寸两种显示屏尺寸,预计借鉴 Apple Watch Series 7 的窄边框设计,进一步提升屏占比。 性能方面,Apple Watch SE 3 将搭载与 Apple Watch Series 11 和 Apple Watch Ultra 3 同款的 S11 芯片。该芯片相较于前代 S8 芯片,在速度与响应上大幅提升,并有望支持本地 Siri 语音处理、双击手势操作及更大存储空间。 健康功能上,SE 系列一直保持基础心率、睡眠及呼吸率监测。SE 3 预计将首次引入睡眠呼吸暂停检测功能,并可能升级为第三代光学心率传感器,进一步提升健康监测的精准度。 设计方面,消息称设计团队不满意外观且难以降低成本,Apple Watch SE 3 已放弃多彩塑料机壳的方案,将延续铝合金机身,同时可能会提升防水性能和充电速度。 价格方面,Apple Watch SE 3 预计继续保持入门级定位,40mm 版本售价约 249 美元(IT之家注:现汇率约合 1787 元人民币),44mm 版本约 279 美元(现汇率约合 2003 元人民币)。
苹果最强旗舰iPhone 17 Pro Max曝料:4800万长焦、电池首破5000mAh
IT之家 8 月 16 日消息,消息源 yeux1122 昨日(8 月 15 日)在 Naver 博客上发布博文,曝料称苹果 iPhone 17 Pro Max 将采用全新铝制边框设计,取代现有的钛金属材质,并配备史上最大容量超 5000mAh 电池。 首先在材质方面,消息源称苹果 iPhone 17 Pro Max 将放弃钛金属,转而采用全铝材质机身。此外苹果或将改变多年沿用的玻璃背板设计,采用带有特殊涂层的金属背板(metal-back)。自 2016 年 iPhone 7 系列后,苹果已近十年未使用金属背板,此举有望重塑行业设计风向。 电池方面,消息称苹果一方面电池预留更大空间,另一方面略微加厚机身厚度,从而提升电池安置空间,iPhone 17 Pro Max 预计电池容量将首次超过 5000mAh(iPhone 16 Pro Max 电池为 4685 mAh,iPhone 15 Pro Max 电池为 4441 mAh),刷新苹果 iPhone 电池容量纪录。在充电方面,将支持 25W 无线充电。IT之家附上相关图片如下: 散热方面,iPhone 17 Pro Max 将升级配备 VC(vapor-chamber)冷却系统,并调整 MagSafe 线圈位置、重新设计主板结构,提升散热和硬件扩展能力。 相机系统方面,iPhone 17 Pro Max 预计将搭载 4800 万像素长焦镜头,支持最高 8 倍光学变焦,并采用可移动镜头系统,实现切换 5 至 8 倍变焦,前置摄像头也升级至 2400 万像素。 硬件规格大幅跃升。新机搭载基于台积电 3nm 工艺的 A19 Pro 芯片,配备 12GB 内存和 Wi-Fi 7 技术。此外,外观配色也将更丰富,新增类铜色和深蓝色等新选项。
“苹果好棒”还是“创新已死”?iPhone 17 Air深度揭秘
今年iPhone 17系列与往年最大的不同,就在于苹果将用一款超薄的iPhone 17 Air替换了Plus型号。从目前曝光来看,iPhone 17 Air仅有5.5mm厚度,重量145g左右,屏幕尺寸6.6英寸,在轻薄这一块可以说是无出其右。 从配置来看,iPhone 17 Air似乎并非是一款成熟的产品:电池容量仅2900mAh,后置摄像头也仅为单摄。说开倒车也不足为过,毕竟上次电池容量2900mAh出头的还是iPhone XR,正统数字系列的后置单摄甚至要倒回到iPhone 8。 苹果为什么会舍弃Plus推出这样一款产品?如此拉胯的配置能否满足当前的使用体验需求?17 Air真就是系列最值得期待的型号?我们来详细盘一盘。 苹果推出轻薄型号为哪般? 实际上,苹果也并非想标新立异,而是Plus真卖不动。 就拿国内的数据来说,截止2025年26周,iPhone 16系列的全系销量为2982.3万部,其中iPhone 16为605.7万部,iPhone16 Plus为82.6万部,iPhone 16 Pro为1091.1万部,iPhone 16 Pro Max为1185.8万部。 iPhone 16 Plus仅为总销量的2.8%,国内消费者对更大尺寸的标准版+更贵的价格显然兴趣不大。 其实想想也很正常—— 只认苹果品牌,对型号不是很在意的消费者,可能就直接买了标准版; 对性能有追求的消费者,直接上16 Pro/Pro Max。 iPhone 16 Plus无高刷屏、无A18 Pro芯片、无Pro级相机,128GB版本的价钱就可以买到国产超大杯,存储还是“金子价”,买这个多少有点大冤种的感觉。 这时候机灵的读者可能已经发现了华点:是不是买非Pro的消费者对价格过于敏感?减配再便宜点是不是苹果又成了? 这个情况其实苹果也想到了,iPhone 16e就是在标准版的基础上狠狠砍一刀的产物。但销量狠狠扑街,iPhone 16e总销量约为17.1万部(截止2025年26周),仅为总销量的0.6%。 其实iPhone 16e不受欢迎也很正常,毕竟尺寸已经与标准版相同,失去了以往mini的小尺寸党拥趸。而且苹果大刀配置的同时价格却仅是小刀,消费者加点钱国补买个新的iPhone16,或者买个二手的iPhone 16,都比这个强不少。 所以,Plus肯定是得换换新辙了。至于17e还有没有,如果还是尺寸不变单纯减配略降价格的话,我估计悬了。 但消费者们到底喜欢怎么样的花活儿?可能苹果心里也没底,所以干脆把老早之前机圈追求全球最薄那一套再搬出来试试水。毕竟在直板机上,也没有什么新的花活儿可玩儿。 17 Air的配置真能满足体验需求? 超薄手机其实并不是什么新鲜事物。早在2014年,机圈就已经开启了全球最薄争霸赛,OPPO R5机身厚度做到了4.85mm,vivo X5 Max机身厚度做到了4.75mm。 为什么现在没有这么薄的手机?原因很简单,如此超薄的机身,已经放不下满足当前性能需求的硬件配置。 也许有读者朋友会说,现在的折叠屏不更薄么?确实,OPPO Find N5做到了4.21mm,荣耀Magic V5做到了4.1mm,没有最薄只有更薄。但问题在于,折叠屏面积足够大,所以其实内部空间还挺大的,足以容纳主流容量的电池。 但面积不够大的直板机,只能压缩硬件尺寸确保手机足够薄。 前不久上市的三星Galaxy S25 Edge就是个例子,手机做到了5.8mm厚度,重量163g,6.7英寸屏幕,但电池容量只有3900mAh。 我们把视线拉回到iPhone 17 Air,影响体验的大概有三个方面—— 1、电池不够大 从目前曝光来看,iPhone 17 Air的电池非常薄,只有2.49mm,电池容量2900mAh。 但还可能有些意外情况,因为此前曝光的iPhone 17 Air采用的是eSIM方案,取消来了实体卡槽。如果eSIM在国内无法推行的话,大概率实体卡槽还要加回去,可能就像曝光的eSIM版iPhone 17 Pro和实体卡iPhone 17 Pro一样,前者电池还要再小一块…… 2900mAh的电池够不够用呢?作为对比,iPhone 16的电池容量是3561mAh,iPhone 16 Pro的电池容量是3582mAh。 而iPhone 17 Air采用的120Hz刷新率的OLED屏幕理论上不会比iPhone 16 60Hz的屏幕更省电,续航就只能依靠A19芯片和C1基带能效的提升来挽救,但多少有点不切实际。 不过,苹果在电池容量上向来都比较吝啬,续航体验应该不会差太多,毕竟相比于iPhone16 Pro,电池容量“仅”缩水了19%。 2、性能不够强 这么薄的机身,想要在散热上堆料,基本是不用想了。正常使用应该问题不大,但重负载的游戏应该是没戏了。 3、影像扫码机 就一颗摄像头,目前曝光是4800万像素,有可能跟标准版的主摄一样,当然也有可能更差一些。毕竟摄像头太大的话,厚度会跟机身形成强烈反差。 所以,iPhone 17 Air可能更适合日常轻度使用、不怎么拍照、不打游戏的消费者选择,但凡需求更高一点,还是选标准版来的更靠谱一些。 17 Air是系列最值得期待的型号? iPhone 17系列最大的升级,有朋友可能会说是外观,但并非如此,因为外观设计并没有发生质的改变:机身的造型没变、摄像头的排布没变、正面还是灵动岛(虽然有可能变小了),对性能和影像追求不是很极致的朋友,可能换完手机没过几天就没新鲜感了。 变化足够大的,在我看来有两点—— 一是iPhone 17升级了高刷屏,它带来的丝滑体验是显而易见的,标准版用户终于不用再花买旗舰的钱用上古刷新率了。这可能会打消很多消费者的顾虑,销量再涨一涨。 另一个就是iPhone 17 Air的轻薄设计,拿在手中的第一感觉就完全不一样。别的不说,至少躺在床上手机拍脸,也不会拍得那么狠。 至于iPhone 17 Air是否会大受欢迎,我觉得不会,但比现在的Plus肯定是会更好。毕竟如此轻薄的手机,蝎子粑粑独一份。但因为轻薄设计带来的体验缺陷,导致其只适合追求轻薄但性能体验需求不高的朋友,以及拿来尝鲜多买一个的富哥。 但这并不影响iPhone 17 Air成为系列最值得期待的型号,只要有新鲜感,就足够吃瓜群众们看乐子——大受欢迎了:“还得是苹果”;无人问津了:“苹果创新已死“。 写在最后 在我看来,不管是现在16 Plus,还是16e,亦或是未来的17 Air,都是苹果拿来“填缝“的型号。只要标准版、Pro、Pro Max三面大旗不倒,苹果就有足够的空间进行额外市场的探索。就拿mini来说,未来也未必不会再回归,毕竟尺寸没变小的16e已经狠狠踩雷。 至于iPhone 17 Air,你会支持一下么,还是支持不了一点?欢迎朋友们在评论区讨论。 责任编辑:振亭
智己高管谈新一代LS6:以纯电定义增程,抢的是油车用户
IT之家 8 月 16 日消息,上汽新一代智己 LS6 昨晚宣布开启预售,官方预售权益价 20.99 万元起,30 分钟小订突破 10000 台。新车将于 9 月 10 日正式上市,届时还将公布更多款车型的价格信息。 据懂车帝报道,针对增程技术的争议,智己汽车 CTO 项娇在接受采访时表示,这本质上不是技术方向的讨论,而是今天增程确实存在很多技术短板,包括纯电续航低,馈电的时候有一些不良体验,充电的生态也不是特别好,充电速率比不上纯电。 “其实这正是我们的一个出发点,我们要去捕捉到今天增程产品的用户痛点,去知道增程产品它的本源是什么,希望能够带给所有人纯电的体验,并且忘记里程焦虑。”项娇说道。此外,项娇也重点谈到了智己做增程车型的思路,围绕电动化,在技术上“以纯电定义增程”,把增程用电动车同源的方向来做。 谈到这款车的定价,智己汽车 CMO 李微萌以油车用户作为参考。“我们当时的定价就在想,针对 15 万-20 万这些油车的用户,怎么让他没有压力的买车。” 她还专门算了一笔账,以一台 17-18 万的油车为例,五年的用车成本基本和新一代智己 LS6 持平。但新一代智己 LS6 在整个的用车周期里,会带给用户远超燃油车的电感化体验、智能化体验及驾控体验。 据此前官方介绍,新一代智己 LS6 增程版长宽高分别为 4937*1988*1671mm,轴距为 2960mm,搭载全新全场景数字座舱,配备旗舰级 MinLED 显示技术,同时还有 5K 驾舱屏和 3K 副驾娱乐屏。 新车提供全幅方向盘和 YAT 半幅方向盘可选,还配备了车载冰箱、氛围灯、二排座椅加热等功能;搭载 IMAD3.0 辅助驾驶系统、采用英伟达 Thor 驾驶辅助方案、配备 520 线超级激光雷达,支持一键 AI 代驾、同时拥有高速域全场景 AEB 功能。 新一代智己 LS6 采用“恒星”超级增程,搭载 1.5T 增程专属超效黄金发动机,并配备 66kWh 超级骁遥 MAX 电池,最大 CLTC 纯电续航 450km,最大综合续航达 1502km;搭载 800V 超快充平台,15 分钟补能 310km,超级骁遥 MAX 电池低电量最强放电功率可达 275.5 千瓦;全系配备 800VSiC 飓风电机,双电机峰值功率可达 500 千瓦,峰值扭矩 800 牛・米,百公里加速仅需 3.48 秒。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。