行业分类:
加载中...
头条分类:
加载中...
爆火的AI玩具,全行业等待一个“成功案例”
AI玩具创业热潮,第一阶段的答卷来了。 过去一年,越来越多的年轻人将「AI玩具」创业视为一条出路。 在中关村的一个AI主题沙龙中,一位刚刚从互联网公司离职的运营岗员工表示: 「不想上班了,想做一款AI玩具,卖向海外。趁着风口,应该很有前景。」 在抖音、小红书、视频号等社交媒体中,随便点开一个「AI玩具」主题的帖子,在评论区几乎都能找到抱有类似想法的年轻人。 同样,出入国内外各种科技展会,你会发现,不论是展示技术解决方案,还是展示完整成品,只要是和「AI玩具」相关的展位,几乎都会吸引到最多的客流量,被围得「水泄不通」。 打造一个像科幻电影中有情感、有智慧的AI陪伴机器人,似乎成了一门触手可及的生意。 人们希望AI玩具提供情感陪伴价值|图片来源:the Guardian 然而,热闹的表象掩盖不了尴尬的事实。 过去一年,美团、百度、阿里、字节、微软、安克创新等大厂背景的创业者,带着一线基金的投资,扎堆入局,打造「有情感、有灵魂」的AI玩具。但是,一年过去,鲜少有团队真正推出了能在市面上售卖的产品。 一家接触过上述多位互联网背景创业者的语音技术公司负责人,感概创业者们面临的压力,「语音模型发展速度不达预期,导致产品实际效果还不达预期,影响了产品的上市进程。很多公司拿了投资机构的钱,马上就要一年了,到时如果产品还没有推出,可能不太好对投资人交待。」 而即便是推出了产品,反馈也不太乐观。目前,玩具上市公司、互联网背景创业者推出的大多数AI毛绒玩具,价格在四、五百元左右,主打的功能是聊天对话、讲故事。 从买家反馈来看,产品交互复杂、语音聊天AI味儿重、频频断网、响应迟顿等问题十分突出,让人很难有耐心听它说话。 多位AI玩具技术方案商向极客公园推测,目前在售的四五百元价位的AI毛绒玩具退货率可能在30%以上。 另一方面,大量涌现的AI玩具技术方案商,也正在堵住雄心勃勃的「AI创业者」的路。一位华强北的技术方案商对极客公园表示,「春节过后,手里一下子多了几十家玩具厂商客户。其中有一款蓝牙玩具产品在添加了AI对话功能之后,销量重回巅峰。」 互联网精英们曾经宣称要打造的「有情感互动、有灵魂」的产品,已经率先被「华强北」们所兑现,并且以100多元的成品价格迅速推向市场,将利润空间无限压低。 华强北既能带给草根们快速致富的希望,也在无情地浇灭着互联网人的创业梦。 01 第一批 AI 玩具,本质上是卖「语音盒子」 事实上,我们拆解一下市面上第一批在售的比较知名的AI玩具,其实质基本是:毛绒玩具+语音盒子。 比如,上市公司奥飞娱乐推出的「AI喜羊羊」,实丰文化推出的「AI魔法星」,原天猫精灵合伙人创立的BubblePal,这些产品都是将项链形的挂件,挂在毛绒玩具脖子上,而挂件本身内置了能够联网的Wi-Fi模组,实现用户与AI大模型的聊天对话。 目前市面上在售的具有代表性的AI玩具|图片来源:网络 FoloToy推出的Magicbox智能对话盒子,简单讲,是一个搭载了AI大模型的电路板套件,体积小巧,可以内置于任何玩具里,用户可以设定其角色。 它们主打的聊天、讲故事、播放音乐等功能,与一个接入了大模型的蓝牙音箱并无二致。 这就是我们目前在市场上能够看到、买到的第一批AI玩具。 一位技术方案商观察到,很多澄海的源头玩具厂找来谈合作,「他们可能也感知到了这是个新方向,他们只是想出点钱,先试试,而不是说建立研发团队。」 他总结道,中低端的玩具厂商更多是将AI当作营销噱头,不指望它带来高溢价、高毛利,而是希望趁着AI风口热度,多出货,多清理掉一些库存。因此,产品价格普遍在 100元左右,价格较低,用户购买之后,即便觉得语音聊天功能不好用,通常也在可忍受范围内,不一定会退货。 「其实大家也不确定,给玩具加了聊天功能之后,究竟能产生多大的价值。」他说,「从实际的玩具行业来看,一个纯毛绒玩具一般在百元左右,如果加了一个AI盒子之后,用户可能也不会为此付出更高的溢价。如果溢价高了,很可能退货率也高了。」 目前购买AI玩具的用户,愿意付出更高的溢价,很大程度上也是冲着语音聊天的功能。因此语音聊天效果的好坏,几乎决定了一款产品的成败。 而语音聊天效果的好坏,往往不掌握在AI玩具创业者自己手中。 从技术层面看,目前上市的AI玩具更多是调用豆包、百度、声网等第三方语音识别或合成方案,再接入大模型。 大模型决定了聊天助手的智慧,语音识别、合成等环节决定了语音聊天的效果,比如是否响应快、是否足够拟人化、智能打断、是否具备情感理解能力。 以上决定对话聊天效果的因素,无论哪一个,AI玩具厂商都无法自己控制。 另外,AI硬件品牌rabbit创始人在极客公园旗下播客《开始连接》中,复盘过去一年的AI创业时提到一个关键词:失控。他表示,AI时代的创业,与以往最大的不同在于:开发者对最终效果失控了。 「AI模型是黑盒子,它的表现有不确定性。开发者做Multi-agent,把Reasoning(推理)、Planning(规划)、Execution(执行)都交给AI,能做的只是看结果、反向优化。天已经变了。」 可以说,仅仅以大模型为产品卖点的「AI玩具创业者」并不掌握AI玩具核心卖点。同时,也无法控制自身的研发进度。 02 玩具赛道,不是AI创业者的「捷径」 一切似乎都没有朝着互联网人的预期迈进。 过去一年,无论是互联网行业,还是一线投资机构,纷纷将玩具视作AI落地的最快途径。火山引擎、阿里云、百度云等云厂商在各地举办「AI硬件」、「AI玩具」主题的闭门活动,不断给「AI玩具」造势,其宣传口径大多如出一辙: 「AI玩具具备坚实的应用推广基础,有望成为最快爆发的AI终端之一。」 「AI技术正以燎原之势重塑玩具产业」 「AI玩具600亿市场狂飙」 「短期内AI玩具是AI较为理想的落地场景」 「AI硬件有望成为AI时代的流量入口」 现在看,创业者曾经对AI玩具商业模式的诸多设想纷纷被打破。 互联网人曾经设想AI玩具靠持续向用户收取模型调用费、订阅费,来实现大模型落地的设想被推翻。尤其在DeepSeek开源之后,顶级大模型的价格、获取门槛不断下降,涂鸦智能、小智AI等厂商直接将AI助手调用免费化。大模型依旧吸引人,但是以大模型能力为卖点的商业模式,被击碎。 大模型的获取门槛在迅速降低的同时,硬件的技术门槛也在迅速降低。 DeepSeek的开源、高性能,助推了大量AI玩具技术集成方案商在2025年春节前后涌现,推出整套AI玩具技术方案,提供完整的芯片、大模型接入、实时音视频能力。他们迅速拉低了AI玩具技术创业门槛。 行业人士透露,较低配置的语音盒子,几十元就可以搞定。而这个成本还在继续降低,「之前行业里主要是高端的方案,最近几个月卷起来了,现在都在压成本。」 AI玩具技术方案商「轻语AI」主打Wi-Fi模组业务,简单说就是将芯片封装为模组,集成天线、抗干扰电路等组件,缩短开发周期(传统硬件需半年,模组方案可缩短至1个月)。其相关负责人观察到,芯片原厂正在通过开放底层能力降低技术门槛,推动行业泡沫化。他预测,「今年可能多出几百家竞争者。」 AI硬件的开发门槛越来越低,已经降低至「小学生」难度。开发难度的降低,带来的是各种形态的AI硬件的诞生。 比如,免费的开源AI硬件项目「小智AI」,大量用户通过自行购买麦克风、喇叭、电路板等组件,通过DIY的方式亲手制作能够语音聊天的形态各异的小玩具,或是用AI聊天控制智能家居等等,极富想象力。极客公园获悉,在过去两个月里,接入小智AI的设备增加了10万台,以每月翻倍的速度在高速增长。 一个新的共识正在达成:仅仅依托于硬件集成能力,将大模型能力当作卖点的「AI玩具」创业团队,优势将不复存在。玩具首先要好玩,「科技含量」是次要的。AI玩具并不是展示AI技术能力的竞技场。 AI玩具市场仍处于早期的产品定义阶段。依托于大模型提供的交流能力,开辟「情感科技」新赛道或许是会有更长远的未来。 AI毛绒玩具Ropet|图片来源:kickstarter 比如,最近推出的AI毛绒玩偶Fuzozo将重心放在自研的多模态情感模型(MEM),将大模型、语音能力的技术提升更多交于合作伙伴之后,提升自身在陪伴、玩法、情感互动上的能力。其不失为一条更贴近玩具本质的路。以及,在kickstarter上众筹20万美元的 AI毛绒玩具Ropet,也是同样。 一位从业20余年的智能硬件公司老板,最近也开辟了AI玩具业务,「我的团队成员,很想做这个事情,很有热情。」但他坦言对于AI玩具并不看好。 「短期内可能会卖出去一些,但长期挑战太大。」 他认为,能否持续围绕IP打造文化内容、升级玩法,形成自己的品牌护城河,是这项业务的核心。「这个非常有挑战,中国的企业最强的是第一快速,第二低成本。品牌打造、渠道建设目前比较薄弱。」 不过,他旋即补充道,「但是团队年轻人的热情,还是要支持一下。」 期待第二批AI玩具的亮相。
融资64亿,超级独角兽诞生:648亿
今天,在这个超级卷的赛道,跑出一个超级独角兽:AI编程工具公司——Anysphere。 据外媒5月5日报道,Anysphere 完成一轮9亿美元(64亿元)融资,估值达90亿美元(648亿元)。令人意外的是,这距离其B轮融资仅4个月。 Anysphere主营业务一览 这是个美国创业公司,成立2022年,由4个麻省理工学院学生创立。AI创业,果然是年轻人的天下。 这件事背后,对国内AI创业,有哪些启发? 01  AI编程工具赛道,超级有前景,但也超级卷。 一位深耕AIGC行业3年的创业家对铅笔道表示:“从长期看,AI编程一定是有前景的,但这个方向,做的人太多了。” 在国外已经是白热化,各大巨头均主导着不同生态,比如GitHub Copilot、Cursor和Devin——并形成了一定规模化。 国外AI编程工具竞争格局 GitHub Copilot与微软深度整合,总用户约有1.8亿,付费用户约180万;Cursor-Fast(Anysphere旗下产品)年收入突破2亿美元;OpenAI则是砸30亿美元收购竞品Windsurf。 AI编程工具赛道,国外已经是神仙打架,恐怕没有创业者什么份了。 那么,国内呢?百花齐放,也是巨头纷争。但在商业化阶段上,略微次于国外,新玩家的机会略大一些,巨头还没形成规模效应。 比如字节跳动,推出基于豆包大模型的MarsCode(面向国内)。此外,百度有Comate,阿里通义有灵码。 在商业模式上,国内性价比更高,基本采用的策略是:基础功能免费+高级功能付费;而国外更贵,每月20-500美元的订阅费。 这也更侧面说明:国内付费用户还在培育阶段,国外更成熟。 图注:国内AI编程工具竞争格局 02  既然这个赛道这么卷,Anysphere为什么还能跑出来。它的身上,是不是具备一些特质? 铅笔道调研发现,其中的一个关键因素是:在AI写代码这件事上,它的产品更好用。 市面上大多数编程助手,仅能处理单文件或片段代码。而Anysphere不同,它利用算法能够解析代码库上下文,并预测使用者意图。在这个前提下,Anysphere不仅能生成代码,并且还能像一位资深工程师,理解开发者的逻辑与架构。 因此,这个赛道到底在卷什么,一个阶段性方向就是:在卷谁的产品更好用,即比拼产品力。 这也侧面说明了:虽然AI编程工具很卷,但依然处在竞争的浅水区,处在野蛮生长到成熟阶段的过渡期。 产品力不够的前提下,意味着行业还有大量用户的需求未被满足,意味着市场的钱还远远没有被赚够,意味着行业虽卷但真正的强者尚未出现:大并不意味着强,多并不意味着强。 国内竞争,更是如此,核心还是产品不好用。 铅笔道调研发现,国内产品往往有数个痛点:1、能写70%代码,但剩余30%出毛病;2、上下文失明症;3、只见局部,不见全局,不能理解框架,不能理解跨文件的调用关系。 那么好了,从目前的水平看,这些产品是在提高效率还是降低效率?写70%的代码简单,查30%代码的BUG更费劲。 所以,国内AI编程工具看似卷,其实阶段更早期,更有机会。毕竟国外的Anysphere,算是一个收入规模化的标杆;而在国内,一款规模化付费的产品都没有。 从披露的数据看,国内付费用户更愿意使用Cursor,约有超30%流量来自中国;而本土化的中国产品,谁都没有披露付费数据,多数在测试培育阶段。
滴滴五一大数据:异地打车订单大增,全国需求TOP10景点出炉
凤凰网科技讯 5月6日,滴滴出行今日发布五一期间大数据,数据显示,今年“五一”期间打车需求同比去年上涨17%,创下历史新高,异地打车需求更是大幅上涨29%。 数据显示,五一期间餐饮美食、大型交通枢纽和商圈购物场所成为打车需求量前三的场景,而旅游景点、酒店宾馆和宠物服务场所的打车需求涨幅最为明显,同比分别上涨30%、28%和27%。 长线旅游成为今年“五一”出行的一大亮点。据滴滴数据,常驻地与目的地相距2000公里以上的异地打车需求同比大幅上涨38%,西部旅游热度尤为突出。和田与乌鲁木齐、拉萨与日喀则、酒泉与张掖、西双版纳与丽江等地区的长距离出行占比超过20%,显示出“西游”热潮的持续升温。 随着气温回暖,海岛游也成为热门选择。平潭岛、北海银滩和青岛金沙滩进入假期打车需求前十的景点,前往平潭蓝眼泪海滩和连云港连岛的打车需求同比分别激增123%和57%。此外,古城古镇游也颇受欢迎,整体打车需求同比上涨46%,其中泉州古城、大理古城、大同古城跻身全国打车需求前十景点。 年轻一代的消费偏好显著改变了传统出行模式。变装旅拍成为体验式文旅的热门玩法,相关打车需求同比上涨54%,其中一半需求来自00后和95后用户。同时,演出、赛事和漫展成为假期出行的重要驱动力,时代少年团海口演唱会现场的打车需求同比上涨超200倍,多地音乐节举办地的打车需求较节前上涨超300%。 自驾游市场同样火热。滴滴租车数据显示,“五一”期间租车订单较去年增长13%,再创新高,其中超七成订单来自90后、00后用户。成都、广州、西安、乌鲁木齐、北京成为最受欢迎的租车目的地,而惠州、秦皇岛、拉萨等地的租车订单较节前大涨70%以上。 出境游与入境游也呈现强劲增长。香港成为内地游客热门目的地,在香港使用滴滴打车的订单量同比上涨265%。同时,在近期过境免签政策优化的推动下,入境用户滴滴打车单量同比去年增长75%,韩国、新加坡、马来西亚、泰国、俄罗斯的外国用户使用频率最高。 今年“五一”假期的出行数据不仅反映了消费市场的强劲复苏,也展现了人们对深度文化体验、个性化旅游方式的追求。从传统景点打卡到沉浸式体验,从近郊游到长线西部之旅,多元化的出行方式正成为新常态。
94岁,巴菲特尽兴了
尽管铺垫了很久,沃伦·巴菲特(Warren Buffett)卸任CEO的消息,还是让人们感到突然。 当地时间5月3日,在美国内布拉斯加州奥马哈,一年一度的伯克希尔-哈撒韦公司年度股东大会上,94岁的巴菲特坐在桌后,对台下宣布了决定:卸任伯克希尔的CEO职位,年底交棒给负责非保险业务的副董事长格雷格·阿贝尔。 “这就是今天的新闻亮点,”巴菲特说,“谢谢你们到场。” 人们起身,为执掌伯克希尔60年的巴菲特鼓掌。 掌声一直持续,以至于巴菲特劝大家“喝杯可乐冷静一下”。 实际上,巴菲特早就透露退休的计划,并且在至少四年前、他90岁那年宣布了接班人选。但此番正式宣布,除了他的孩子,其他人都不知情,包括接班人阿贝尔。 掌声究竟为何雷动?只是因为伯克希尔受益斐然、不负股东期望?是因为巴菲特是世界上最成功、最富有的人之一?是因为他是“奥马哈先知”“股神”?他收购时,伯克希尔被政府免税多年,是一家苟延残喘的纺织公司。他退位时,伯克希尔已经是一家多元化的投资控股公司,是“万亿美元俱乐部”中唯一一家非科技企业。 除了卸任CEO的消息之外,巴菲特在活动上进行了数个小时的讲话与答股东提问。和往年一样,仔细汇报伯克希尔这一年的经营状况、喝可乐、讲关于人生的至理名言。 答案也许就在其中。 巴菲特的退位,是尽兴而归。“人生得意须尽欢”,对于巴菲特来说,金钱游戏既让他得意,也令他尽欢,由此形成一个紧密的循环,让他94岁高寿依然乐此不疲。 他的人生,也是尽兴而暮,如今依然每天喝五杯可乐,依据市场情绪挑选麦当劳早餐。这次在现场,他还为“不良生活习惯”辩护,称自己不怎么运动:“94年来,我想喝什么就喝什么,想做什么就做什么,我打破了所有关于我本该发生的事情的预测……” 这也许才是掌声中更浓重的情绪:钦佩与羡慕。也许不是每个人都想要成为股神,甚至不是每个人都想成为富翁,但是恐怕没有人不想在回看人生的时候点点头,说:我已经尽兴了。 一位在奥马哈现场的年轻人在接受采访时说:“我认为他就像一座灯塔,指引我们活出精彩的人生——用正直、智慧和幽默活出精彩的人生。” A 风吹过1930年的奥马哈,吹不来金钱的气息。 城市里开始出现小轿车,但路上更多的是有轨电车和马车。肉类加工和包装在当地是支柱产业,当时世界上最大的牲畜市场之一就坐落在这里。而住在这里的,大多是白人工人阶级。 最关键的是,美国那次载入史册的大萧条正在蔓延,四分之一的人失业,这其中也包括一名失意的年轻人霍华德·巴菲特。他没有听从父亲的指示去卖保险,而是跳入潮流,当了股市坠入谷底,父亲的杂货铺没有接纳他。 霍华德的父亲和爷爷一样以开杂货铺为生,也一样吝啬,几乎可以算一毛不拔。 就在这时,第二个孩子出生。他早产,体重不足三公斤,被取名沃伦·巴菲特。霍华德不知道的是,“巴菲特”的名字将因为这个孩子而被世人所熟知。 不知怎的,就好像这个孩子带来了好运,走投无路的霍华德建立股票公司,却生意兴隆,从此经济情况触底反击,再也没有过过清贫的苦日子。 巴菲特后来多次称自己中了“卵巢彩票”——他在种族隔离的30年代,出生在白人中产家庭,父母给予爱,也让他接受良好的教育,而不用为此付出任何努力。这样的起点,已经比大多数人高了。 在谈及“卵巢彩票”的时候,巴菲特也强调了“男性”。他的妈妈,也就是霍华德的妻子,有很高的数学天赋,但在大学二年级辍学结婚,成为家庭主妇,也成为了一个典型的“不快乐的母亲”。她经常对孩子诉说自己做出的牺牲,直到孩子泪流满面。以至于多年后她去世,巴菲特带着罪恶感升腾起一种释然的情绪。 巴菲特八成继承了妈妈的数学天赋,对数学几近痴迷。同时,他又继承了巴菲特家族的男人对金钱的痴迷,很小的时候就立志要在三十五岁成为百万富翁。即便彼时他家族中从未出过百万富翁。 7岁的时候,巴菲特不读童话,而是读《赚到1000美元的1000种方法》。霍华德会在每个孩子满10岁的时候,带其去美国东海岸,想去哪里随便挑,而巴菲特选择的是纽约证券交易所。 在丰盈知识与开阔眼界之外,小小的巴菲特实践,到处“搞钱”。挨家挨户推销口香糖,转卖可乐。甚至在11岁的时候进行了第一笔股票投资,虽然那次他没能在股价波动时稳住阵脚,在股价翻好几倍前就卖出,但感受到了成为一名资本家的快乐。 在很久以后,巴菲特已至望百之年,还会想起父亲带他见识纽约证券交易所的那个遥远的下午。那是他“尽兴”的起点,他刚年满10岁就找到了“兴”之所在。 B 时间步入20世纪40年代,“山姆大叔”和巴菲特都有了新的生活。 美国走过大萧条,走过二战,并迎来战后经济复苏。巴菲特的父亲霍华德已经从政,当上国会议员,举家搬到了华盛顿州。 在这里,巴菲特进入了著名的伍德罗威尔逊高中。虽然在学校的成绩和表现剧烈波动,但他依然醉心搞钱。送报纸、当推销员、搞游戏机公司……1947年高中毕业时,巴菲特已经积攒了6000美元。 如果按照巴菲特自己的想法,毕业之后他会继续做生意。也许在某个平行宇宙,1947年之后的巴菲特按计划做起灵车出租的生意,之后不知会走上什么职业道路。 但在这个宇宙,在父亲霍华德的坚持下,巴菲特开始申请大学,并最终进入宾夕法尼亚大学沃顿商学院。 巴菲特惜财的特点显山露水。这一特点贯穿他的一生,甚至在他已经财富自由时,暧昧对象问他要10美分,他都要专门跑去把25美分的硬币换开,惹得对方追着他抗议。 进入商学院时,巴菲特不过16岁,他仅仅在这里读了两年,就觉得“不划算”。教的东西没什么了不起,学费还很贵。于是他毅然转学回到内华达拉斯大学,回老家读完了本科。在这里,学费低廉,他又继续赚钱,毕业时已经有近万美元积蓄。 让他彻底走上投资道路的,是硕士生涯。说来也巧,巴菲特是在申请哈佛大学失败之后,才进入哥伦比亚大学的。他冲着教授本杰明·格雷厄姆(Benjamin Graham)而去,而格雷厄姆也成为了他的贵人。 格雷厄姆是华尔街备受尊崇的投资大师,他的两部重要著作《证券分析》(1934年,与戴维·多德合著)和《聪明的投资者》(1949年)奠定了价值投资理论的基础,强调通过深入分析公司的财务状况和市场价格,寻找被低估的股票进行投资。 而“价值投资”,也成为了巴菲特投资思维的一枚“钢印”,伴随他此后几十年的投资生涯。 师从格雷厄姆,巴菲特像是被打通了投资的任督二脉,从此一发不可收拾。他贪婪地吸收知识,并一心想毕业之后给格雷厄姆打工,以学到更多真本事。 虽然研究生毕业之后,巴菲特曾为一些原因回到奥马哈待了几年,并且在那里结了婚。但他终究还是得偿所愿,举家前往纽约,进入格雷厄姆的公司。 事实证明,巴菲特年纪轻轻为自己选择的路都很正确。回到奥马哈那几年,巴菲特曾经在父亲的股票经纪公司工作,因为要给客户推销股票,只挑好的说,让他感到很痛苦。但是在这里,他如鱼得水。 巴菲特风格开始成型。还是回到“价值投资”,既然是要寻找被低估的股票,就要深入分析,既然要深入分析,巴菲特就深入到自己力所能及的极限。比如直接去正在研究的公司实地调查,甚至当“卧底”。从办公室到“田野”去,这对几岁时就挨家挨户推销口香糖的巴菲特来说并不算很大的挑战。 举两个例子。1954年某日,巴菲特伪装成证券分析师潜入GEICO总部,连续6小时“拷问”财务总监洛里默·戴维森,发现其车险赔付率比行业低12个百分点。这次突袭促成格雷厄姆-纽曼买入GEICO 50%股份,该股2年内上涨462%。 为验证该公司市净率0.48的真实性,巴菲特连续3周蹲守其布鲁克林车厂,统计高峰时段电车满载率(达93%),并混入维修车间测量铁轨磨损度,最终测算出固定资产重置成本是账面价值的3.2倍。 这些都是在格雷厄姆的公司结结实实的实践经验,不断加强巴菲特的“价值投资”信仰。 短短两年多的时间,巴菲特开始有更多的想法。“师父”格雷厄姆偏爱“烟蒂策略”(买像是要燃尽的烟蒂一样的便宜货),但是巴菲特已经萌生“以合理价格买优质企业”的想法。格雷厄姆退休时,拒绝了巴菲特的合伙建议,公司最终解散,而巴菲特奔向下一站。 他回到了奥马哈居住,再也没有离开。而在这片生养他的土地上,他很快成为了“奥马哈先知”。 C 如果停滞不前,“尽兴”会来得早一些,而巴菲特在迅速进化。 回到奥马哈之后,巴菲特用三万美金买下一栋房子,从此就再也没挪窝。彼时他已经积累17万美元的财富,在1956年已经足以让他和家人衣食无忧。但他还是一贯的“吝啬”,过着很朴素的生活,并且开始着手开办合伙人公司。 巴菲特惜财、喜欢资本游戏,但他在私人笔记中写道:“设定截止日期,是为了避免成为金钱的奴隶。”长期主义的思维已经开始显现,他到处拉投资,并向首批合伙人承诺“10年内退休”。 这并非因为他真的有退休计划,而是一种策略目标的设定。第一是用复利倒逼,通过限定时间框架,迫使自己在短期内实现高年化收益率;第二是缓解投资者对长期资金锁定的担忧,吸引认同长期价值理念的资本。 二十九岁的时候,巴菲特已经成立了几家合伙人公司,事情进展得很不错,但对他来说也只是不错。 直到他和人生中的第二位贵人相遇,那就是查理·芒格。 一见面,原计划20分钟的咖啡小聊,变成了长达四个小时的促膝长谈。芒格当时还在当律师,但他自学了格雷厄姆的《证券分析》,字字珠玑,并提出“以合理价买伟大企业”的雏形观点。 芒格还当场心算出自动贩卖机的单杯可乐利润率,巴菲特用笔一算,误差仅有0.2%。当巴菲特抱怨某银行股财报难懂时,芒格反问:“为何不先确认管理层是否在说谎?” 知识、观念、情绪都在咖啡厅的空气中无形碰撞,芒格说的笑话,把巴菲特逗得满地打滚。 短暂分别之后(期间二人每天大煲电话粥),巴菲特说服芒格也开始做投资,并最终放弃律师生涯。从此以后,“我和芒格”被巴菲特挂在嘴边。芒格不仅给巴菲特介绍了很多有力的投资者,还和他才思相通,令他如虎添翼。 合伙人公司越来越多,股票投资也做出了名气,巴菲特开始被称为“奥马哈先知”,因为他好像总是能预测股价,总能带人赚钱吃肉。 32岁那一年,巴菲特的个人资产已经达到102.5万美元,提前三年达成年幼时的“百万富翁”目标。 在价值投资和长期主义的核心思想指引下,在芒格的陪伴下,随着管理的资产不断扩大,巴菲特逐渐不满足于股票投资,而是开始投资控股其他公司。由此,他才真正由交易员转变为了一名企业家。 巴菲特“还不错”的人生阶段即将成为过去,他的名号也将飞出奥马哈,飞出美国。 D 没有危机与危机的解除,何谈“尽兴”? 巴菲特在超过半个世纪的职业生涯里,自然蹚过河。 他在一步一步拓宽自己投资的边界,也在一步步逼近危机,那就是收购一家美国本土的纺织公司。 这场收购,仍然始于格雷厄姆的“烟蒂策略”股票投资。这家公司符合格雷厄姆“市净率<0.67”的标准,巴菲特购入股票。两年后,其董事长要回购,口头承诺11.5美元/股的价格,却在正式文件中改为11.375美元/股。 0.125美元/股的价差,激怒了巴菲特。他转而开始增持,并最终控股。但是这几年的时间,这家公司已经“断崖式衰老”了,纺织厂设备因技术过时贬值73%,存货因为化纤革命而滞销。 虽然股价上涨,但巴菲特发现,一次赌气,让自己手里多了一个沉重的累赘。他做出各种努力,如引入成本控制专家等,但一番折腾下来,单位成本不降反增。 一直到1967年,巴菲特成功将保险公司“国民赔偿公司”纳入囊中,情况才有了变化。 事实上,情况完全变了。有了保险公司的“浮存金”,巴菲特不再需要合伙人基金和银行借贷融资。而浮存金没有到期日,没有强制赎回的压力,这种“永续性”让巴菲特的投资事业突然获得了前所未有的自由。也让他得以就此大胆实践“永远持有”的长期主义策略,从自格雷厄姆传承的“捡烟蒂”,迈向“种森林”的康庄大道。 而那家“砸”在手里的纺织公司,也得以焕发新生。巴菲特关闭了所有的合伙人公司,整合保险业务,将那家公司转变为了多元化投资公司。 这家改头换面的纺织公司的名字从未改变过——伯克希尔·哈撒韦。 巴菲特在2010年股东大会所说:“如果当年斯坦顿先生爽快支付那0.125美元,今天的伯克希尔可能只是我投资履历中的一行脚注。” 有时候,一个足够巨大的错误,当遭遇足够聪明的纠错机制,反而能裂变为超级成功。 芒格说:“忘记自己的错误本身就是一个可怕的错误。”在此后的许多年,巴菲特念念不忘当年的错误,两年前还念叨这个“300亿美元的错误” 这是巴菲特进化路上的里程碑,也是他最终能“尽兴”的要素。 此番教训直接推动巴菲特在1972年收购喜诗糖果时,接受芒格的“溢价买优质企业”理念(当时市盈率11.3倍,远超格雷厄姆学派警戒线)。 这场认知革命也最终孕育出1998年可口可乐、2016年苹果等传奇投资。说到底,是长期看好可口可乐和苹果产品。尤其是后者,打破了巴菲特不投科技股的惯例。不投不是因为不看好,而是他和芒格都“不懂科技”,投也不是因为突然懂了,而是按照分析指标,输出结果指向了苹果。 巴菲特最为人熟知的那句“别人恐惧我贪婪”,看似“冒险”,实则也是生发于此。由于是抱着“永远持有”的心态,只有价值本身的判断是最重要的。至于股市哀鸿遍野时加仓,那是因为本来就看好,买个好价钱罢了。 2008年9月雷曼兄弟破产,华尔街陷入至暗时刻。巴菲特却以50亿美元购入高盛优先股,获10%年息及认股权证,附加“黄金降落伞”条款:若股价暴跌,伯克希尔可低价增持。市场质疑巴菲特“接飞刀”,但他只看到两点确定性:美国政府必救“大而不能倒”的投行; 高盛的客户网络和人才储备远未被股价反映。 这笔交易最终获利46亿美元。 在巴菲特的投资传奇中,不乏这样的例子。但剥开外壳,总能看到那个六十年不曾改变的核心:价值投资,长期主义,复利。 在二十多岁时,巴菲特贪婪地从他的贵人格雷厄姆那里汲取营养,后来他也成为了别人的导师,甚至是精神图腾。“巴菲特午餐”最高被拍卖至1900万美元,所有人都想从他那里取经。 2006年段永平以62万美元拍得机会,从巴菲特那里受到的最大影响是“做对的事情比把事情做对更重要”。看似鸡汤,但段永平真的实践后成效斐然,他将其转化为“不为清单”制度,砍掉步步高所有毛利率低于25%的产品线,后放弃陷入价格战泥潭的“小天才”。 从这个角度看,巴菲特看似复杂的人生背后,反而是一种简单和专注,也许这才是“人生尽兴”的奥义。做喜欢的事、一直做,投资好的公司、长期持有,与认可的人共事,友谊长存。 如果是无名之辈这样说,兴许都会被认为太过天真,但是巴菲特是最好的倡导者和最大的受益人。 巴菲特终于“意满离”,卸任伯克希尔CEO职位。 他面前摆着最爱的可乐和喜诗糖果,嘴里念叨了芒格无数次。这位挚友在两年前去世,终年99岁:“查理总说我做了太多事。他认为如果我们一生只做5件事,我们最终会比做50件事要做得更好。” 风再次吹过奥马哈,有金钱的味道,但这似乎并不是最重要的。
医疗自诊依赖AI聊天机器人存风险,专家呼吁谨慎使用
IT之家5月6日消息,在医疗资源紧张、等待时间长、成本不断攀升的背景下,越来越多的人开始借助像ChatGPT这样的人工智能聊天机器人来进行医疗自诊。据一项最新调查显示,大约六分之一的美国成年人每月至少会使用一次聊天机器人获取健康建议。 然而,过度信任聊天机器人的输出结果可能会带来风险。最近一项由牛津大学主导的研究指出,人们在向聊天机器人提供信息时,往往难以提供能够获得最佳健康建议的关键信息。 “研究揭示了双向沟通的障碍。”牛津互联网研究所研究生项目主任、该研究的共同作者亚当・马赫迪(Adam Mahdi)在接受 TechCrunch 采访时表示,“使用聊天机器人的人并没有比依靠传统方法(如在线搜索或自己的判断)的人做出更好的决策。” 据IT之家了解,为了开展这项研究,研究人员招募了大约1300名英国参与者,并向他们提供了由一组医生编写的医疗场景。参与者需要在这些场景中识别潜在的健康状况,并使用聊天机器人以及他们自己的方法来确定可能的行动方案(例如,去看医生或去医院)。 在研究中,参与者使用了为ChatGPT提供支持的默认人工智能模型GPT-4o,以及 Cohere的Command R+和Meta的Llama 3。研究结果显示,聊天机器人不仅使参与者更难识别相关的健康状况,还让他们更有可能低估自己所识别出的健康状况的严重程度。 马赫迪指出,参与者在向聊天机器人提问时常常遗漏关键细节,或者收到难以解读的答案。“他们从聊天机器人那里得到的回答常常是好坏参半的建议。”他补充道,“目前对聊天机器人的评估方法并没有反映出与人类用户互动的复杂性。” 与此同时,科技公司正不断推动将人工智能作为改善健康状况的一种手段。据报道,苹果正在开发一款能够提供与运动、饮食和睡眠相关建议的人工智能工具;亚马逊正在探索一种基于人工智能的方法,用于分析医疗数据库中的“健康社会决定因素”;微软则在协助构建人工智能,以对患者发送给护理提供者的消息进行初步分类。 但无论是专业人士还是患者,对于人工智能是否已准备好用于高风险健康应用都存在分歧。美国医学协会建议医生不要使用ChatGPT等聊天机器人协助临床决策,而包括 OpenAI在内的主要人工智能公司也警告不要根据聊天机器人的输出结果进行诊断。 “我们建议在做出医疗决策时依赖可信的信息来源。”马赫迪表示,“就像新药物的临床试验一样,在部署聊天机器人系统之前,应该先在现实世界中进行测试。”
没有大厂敢跟小红书
“小红书取消竞业,预计大厂无人敢跟。” 专注互联网大厂及AI领域的资深猎头方述(化名)告诉字母榜,继近日小红书全员信宣布5月1日起取消所有员工竞业协议后,其余的互联网大厂内,除了私底下员工群内聊得火热外,大厂们却没有跟进的动作。 原因昭然若揭,“普通员工的竞业收缩一下无妨,真到了猎头争相去挖的AI人才,恐怕哪家都不肯在这个节骨眼取消竞业。”方述补充道。 与大厂普遍沉默相对的,是小红书取消竞业一度冲上热搜,北京市社科院研究员王鹏则评价称此举是“对人才流动的史诗级松绑”。 小红书全员信 尽管小红书在全员信中写道:“我们希望点亮一盏小灯,向环境发出不一样的信号。”但这场“松绑”背后暗藏分野。取消常规竞业的背后,对AI实验室等核心部门是否仍存在“特殊条款”并未在全员信中展示,对此字母榜询问小红书方,截止发稿前暂未得到回复。 事实上,方述坦言:“AI人才争夺已进入‘核威慑’阶段,竞业协议就是那枚按钮。” 不用提各家大厂的AI实验室是否会取消竞业,甚至就连AI六小龙都会禁止公司员工私下参与AI行业内的各样活动,HR会在各类活动、coffee chat里“巡逻”,一旦被发现参与就会触发警告,而这一切,都仅仅是为了“这些员工不被猎头接触到而有可能被挖走。”方述表示。 目前来看,小红书全员信投下的炸弹,火力范围局限于频繁引发争议的常规竞业。 就在去年底,阿里正式起诉前通义千问大模型技术负责人周畅违反竞业协议,加入竞争公司字节。一旦阿里胜诉,周畅将面临可能超过百万的赔偿(竞业赔偿通常为离职前12个月收入的1至2倍,涉及高管职位会更高),如今,这场官司仍悬而未决。更早之前,目前担任抖音电商总裁的康泽宇,因为从百度跳槽到字节时被法院认定违反竞业协议,向老东家百度赔付了80多万元。 在AI大模型竞争的下半场,新玩家如小米仍在络绎入场,老玩家竞争烈度不断升级,竞业这一块,恐怕无人敢跟小红书。 A “现在的AI相关岗位薪资标的有多高,竞业就有多严重。” 某头部互联网大厂AI业务组员工王颖(化名)告诉字母榜,此前她就职某AI六小龙之一,尽管她并不是技术岗位,但是在入职时也要默认签署竞业协议。而竞业协议往往夹杂在一大堆入职需要签署的文件内,并不起眼。 而竞业年限的长度、协议的弹性程度,往往和薪资以及岗位核心性相关,“拿的钱越多一般就越核心,竞业限制就更大。”王颖补充道。 “入职的时候谁都不想多生事端,即便注意到了不合理,也只能选择签字。”王颖表示,相比起传统的互联网业务,AI业务组原本就有更高的保密性,除了严苛的保密协议外,往往入职时就会受到竞业震慑。 事实上,和王颖曾经一同在某大厂AI业务组对接过的王震(化名),就上演了一出竞业协议下的惊险奇遇。 作为技术岗,王震同样在入职时就被迫签了竞业协议。离职后,王震拿到的竞业补贴却只是原岗位月薪的50%,考虑到房贷压力,更因为AI技术发展迭代过快,担心“不接触一线容易被淘汰”,王震悄悄入职了某竞对企业。 为了保密,在试用期的前三个月他都是用新花名活跃,还总是绕到公司后门进入打卡。 但即便如此谨慎,“家门口的摄像头在离职后拍到过好几次有人蹲守,圈子就这大,有风传说我入职了竞对,”王震告诉字母榜,随后他发现,有人用他的名字向竞对公司点外卖,这意味着一旦外卖被领走,就坐实了他违反了竞业协议。 王震听说过,有位同事从没接触过重点项目,更没掌握过商业机密,因为劳动合同里就有竞业协议,从深圳搬到北京,但也因为同一招被拿到证据,最终面临80万的赔偿款,还要把在前司一年的收入退回。 迫于无奈,王震只能申请在竞业限制解除前都远程办公。“只要不去办公室打卡,不被拍到在竞对公司初入的照片就算安全。”幸运的是,王震的请求被批准。因此整整一年多,王震一直居家办公,直熬到最近竞业限制解除,才正式入职。 “现在大厂AI组的竞业,是我见过最严苛的,几乎限制了离职员工在上下游所有企业的入职可能,搞得离职员工全都进小红书当AI博主了。” 据方述了解,由于新能源汽车如比亚迪、手机厂商如小米都组建了自己的AI业务组,这些原本与AI大模型并不相关的企业也都被列入了竞业名单。 这导致离职的员工们无处可去,几乎无法入职任何一家大厂,最终涌向了小红书,“大厂正批量给小红书提供AI博主”方述笑称。 不过,“能正经上班赚工资,谁愿意在小红书等时不时才掉落的商单呢?”某AI博主直言,在煎熬等待竞业限制解除的时间里,做自媒体发帖是他能活跃在AI领域的唯一方式。 可以看到的是,当竞业成为大厂AI赛道的制裁手段,大厂员工们并不能按照自己的意愿流动,而弹性竞业之下,大厂员工们尚未迎来真正的自由。 “离开前司的那一刻,换城市、搬家、换手机号,换一切联络方式,才能保证暂时的安全。”王颖补充道。 B 事实上,大厂人苦竞业久矣。 大厂竞业一度被戏称自己为“牛马”的大厂打工人视为奴隶条约,“离职想拿到赔偿就必须签竞业协议,甚至有的人入职时就签好了(竞业协议),离职自动生效,明知不合理,但想顺利入职只能选择忍。” 某大厂核心业务打工人亦深受“竞业”所害,她告诉字母榜,即便离开前司时只是最普通的执行层员工,为了拿到赔偿,也为了不惹上传说中的大厂法务部,她选择去出海企业工作。直到竞业到期解除才重新回到大厂。 作为大厂用来保护自身商业秘密的一种法律手段,竞业协议在一开始,是公司限制“两高一密”人员在限期内(不得超过两年)跳槽竞争对手的方法。也就是针对“高级管理人员、高级技术人员、其他负有保密义务的人员”的一种特殊手段。因为一旦员工违反竞业协议,需要返还全部竞业补偿金的同事,赔偿两倍的近12个月的平均薪资,能够起到有效的震慑作用。 而作为补偿,企业按月付给劳动者一部分工资,补偿标准一般为劳动合同解除或终止前 12 个月平均工资的30%。 不过,近年来,竞业越来越泛化了。 根据西南政法大学经济法学院副教授熊晖等研究,以“竞业限制”为案由,在“无讼案例数据库”中的556份判决书中,(2015-2019年),在以“负有保密义务的其他人员”身份受到竞业限制的人员中,77%是基层员工,其中甚至包括保安、保洁、前台等。除了高管、技术人员外,实习生、劳务派遣、兼职、外包等人员也进入了大厂竞业协议的扫射区。 恶性竞业也频繁出现。 “有的大厂会弹性竞业。也就是刚开始竞业的第1个月拖着不给补偿金,在员工放松警惕入职下家的时候拿到证据反诉,”方述表示,还有部分校招生,在入职时签订竞业协议文件时并不清楚,结果因为跳槽被原公司发起竞业限制,面临数十万、百万的天价赔偿。 在大厂竞业不断泛化引发争议的同时,也衍生出了“竞业鄙视链”。 新BAT(字节、阿里、腾讯)+MMP(美团、小米、拼多多)代替了老BAT(百度、阿里、腾讯),“在某个赛道上排名靠前的大厂一般会将竞业范围限制在同在第一梯队的大厂,比如去年某老牌互联网公司还在竞业名单内,今年就因为某领域业务滑落已经取消了。”王颖补充道。 “有时看某公司的行业排名,只需看他是否是严格规定的竞对公司就足够了。”在某一方面,竞业协议也为打工人提供了另一种维度的筛选视角。 C 其实,当互联网大厂们迈过高速发展的上升期,高流动率就成为了势必要面临的问题。取消常规竞业也好,取消大小周也好,都是聚人心的一种手段。 此次小红书的公开信里,不仅有取消竞业,还有取消大小周,以及开启期权回购项目,员工成长项目等等。在大厂逐渐因为内卷成为打工人围城的当下,这可以算是一种新的信号。 不过,新人们仍然面临着新的博弈。 作为2025届校招生,李然(化名)拿到大厂offer时,发现合同新增加了“AI特别条款”:若入职后参与大模型研发,离职后2年内不得加入“任何使用Transformer架构的企业”。对此,HR的解释是“为了保护你的职业安全。” 而入职后,还面临代码监控系统等等举措,即通过系统自动识别敏感操作并触发“职业行为评估”,无论是截图、录屏,都会受到监测,“HR说是为了防止泄密,我只感觉一举一动都会被记录下来,非常窒息。”李然表示。 而更多的校招生如李然,都面临“弹性竞业”。甚至有的大厂会将校招生离职竞业当做直属管理岗KPI的一部分,成了对管理岗团队稳定性的考核指标之一。即虽无书面协议,但校招生离职如果不启动竞业,直属的管理员工就要承担责任。 对于校招生们来说,进入大厂后,可能是明面上的竞业不再可见,但暗地里的弹性竞业“防不胜防”。 不过,进入AI大模型卷出新高度的下半场,各家对人才的争夺愈发激烈。在各家大厂开高薪挖人的风潮之下,或许大厂们需要思考的是,怎么挖人,以及让挖来的人待得住。 OpenAI曾在2022年经历前批核心研究员出走,招聘陷入低谷期,2023年,随着OpenAI愈来愈靠近下一个科技大厂,对大厂员工的吸引力大幅增加。根据晚点Latepost报道,有大厂工作经验的贡献者,超过40%在这一年加入,远超以往水平。其中,在AI领域有深厚积累,但在大模型领域动作迟缓的两家公司——Google和Meta为OpenAI输送了最多,分别是119人和103人,仅这两家的贡献率就占近四成。 对于大厂们而言,在拿出千万年薪、百万年薪挖人的同时,持续技术迭代保证领先性,也是一种凝聚团队的关键因素。 从无限连带责任制的竞业协议,再到如今的弹性竞业,大厂竞业无疑进入了新的阶段,无论大厂们是否会跟进取消竞业,真正的留住人才,才是大厂们接下来的必修课。
微博第一次办游戏动漫展,你打几分
01 冲动的诱惑,还是时代的召唤? 热衷办活动的互联网公司,微博必定算一个。微博之夜、电影之夜、文化之夜、超级红人节,数都数不过来。但要说办游戏动漫展,它还真是头一回。 对于微博游戏动漫展(WEIBO ACG WORLD,以下简称“WAW”)的火爆场面,很多朋友其实早有心理准备。5万多平的空间里设置4大主题展馆,提供包含游戏、电竞、动漫在内的综合逛展体验,100+次元顶流嘉宾阵容,150+热门游戏&电竞&动漫IP厂商加盟以及各种人气谷子大放送。更不用提近7万的参与总人次,光看数据都能想象到现场的盛况。 即便如此,当亲眼看到无数小年轻以百米冲刺的劲头奔向WAW会场,在各大展区前排成望不到尽头的队伍,大家还是被二次元的热情震惊到了。买谷吃粮、追星打卡、扩列找搭子根本忙不过来,四大主题展区想要全部仔细体验一遍,三天都不够。 我最大的个人感受还是,WAW是目前市场上为数不多的,不用担心自己体力不支的游戏动漫展。有些免费物料能在线上提前收集、领取,再到线下换领,对低电量群体、社恐不要太友好。 在感受WAW的热闹之余,广大群众还很好奇,都2025年了,微博才开始做游戏动漫展,这是冲动的诱惑,还是时代的召唤? 如果站在产业发展的角度,这是水到渠成、顺势而为。过去两年,《黑神话:悟空》《哪吒2》等作品的火爆,让人们再次意识到,ACG产业依旧有蓬勃的生命力。艾媒咨询数据显示,2024年中国泛二次元用户规模高达5.03亿人,预计2029年将突破5.7亿人。仅在微博一个平台,泛次元内容兴趣用户总量就已经超过3亿,其中72%的兴趣用户有过相关消费行动,可见用户基数大且消费力可观。 全面兴起的“谷子经济”也已证明,生活化、大众化正在成为二次元消费新阶段的必然趋势,越来越多人愿意给ACG兴趣花钱,哪怕他们并不是所谓的核心用户。不少濒临倒闭的传统商城通过举办谷子主题展、二次元快闪活动等方式,成功实现绝地求生。地方文旅也不断试水ACG产业,来拉动线下消费。 在人们越来越生活在线上的虚拟时代,线下在重建人和产业、人和城市、人和人的真实链接。而这其中,游戏动漫展又是一个承载情感的好载体,自然成了市场发力的重点。 这些高光原本更多地照在南方城市,上海、广州、杭州、长沙等地的二次元经济明显更加旺盛,这是产业特征,也是产业的局限性。历经20多年的发展,游戏动漫展需要进一步突破和升级,不得不对内容和产业完成扩容。 WAW来得正是时候,北方游戏动漫展空缺的一块,终于补上了。这个过程里,经过长期积累酝酿的微博,也得到了一个造势的机会。 02 游戏动漫展的格局打开了 即便对普通路人来说,游戏动漫展都已经不是什么新物种。平台挑选良辰吉日,让厂商、创作者、玩家齐聚一堂、相互奔赴,基本都是这么玩的。 但我们要注意的一点是,规模不一样,参与方不一样,影响力也就不一样。 在绝大多数动漫游戏展,通常只有游戏、动漫、科技品牌有机会摆摊,极少数爆款作品、网红厂商才会被重视,才能借此获得更多注意力。如果继续保持这样的运作逻辑,多元的内容无法得到呈现,新用户的消费需求也将难以满足,最终只会是对二次元产业的消耗。 对于WAW,很多现场游客表示最没想到的是,追电竞选手的、追人气画师的、追虚拟角色的、追游戏主播的,都坐到一张“桌子”上吃饭了,三代同游逛展的画面就这么照进了现实。 这背后正是微博举办动漫游戏展的突破之处,它并不是孤立地运作ACG文化的一个或几个分支,而是尽可能调动更多内容和产业资源,一口气集齐游戏动漫IP、电竞战队、电竞选手、知名Coser、人气声优等阵容,让每个人都能在这个专属“乐园”里找到参与感。 就说游戏、动漫这一块,WAW不只有《王者荣耀》《恋与制作人》《第5人格》这些爆款作品,还专门设立独立游戏试玩区,让33款风格迥异的原创游戏作品能被人近距离所感受,备受期待的《明末:渊虚之羽》都来做了首次线下试玩。谁敢说,这里面没有下一个“未来之星”“国产之光”呢? 相较传统的游戏动漫展,WAW被广大用户频繁点名叫好的,还是星光见面会。 在这里,大家能见到KPL王者梦之队、iG电子竞技俱乐部的专业电竞选手,跟他们在趣味问答、游戏互动等环节里,沉浸式感受电竞人的热血燃感。至少到目前为止,这些办游戏动漫展的平台里,微博是电竞生态最庞杂的,也是最懂电竞文化的。 除此之外,人气Coser、声优、画手等创作者也是任君选择,且每位创作者都有宠粉的保留项目。顶流Coser卡琳娜官宣到场之后,#卡琳娜浪姐后漫展首秀#的话题就已登上微博热搜,她出现在漫展更是让粉丝们近距离接受了一次颜值暴击,评论区里流淌的全是羡慕的泪水。 而为了把线上注意力更多地延展到线下,在活动正式落地之前,平台还专门设置了见面心愿征集的环节,让广大网友尽情留言许愿,对参与漫展的创作者表达自己的爱和心愿。这个过程里,漫展嘉宾跟粉丝朋友已经有过互动的铺垫,对活动的期待值也随之走高,这无疑是一次有效的预热。 当然,传统的漫展也会利用社交媒体来做传播,几乎所有的漫展也都跟微博有过合作,这些展览的话题、物料也都依靠平台来分发、发酵。值得注意的是,这种方式调动的资源难免有限,肯定不如微博直接下场更有动静。 第一次办展不容易,第一次办展能有如此成绩更不容易。 这一切建立在微博庞大的二次元生态之上。过去十多年,微博早已聚集大量二次元创作者,吸引了超过3亿的ACG的兴趣用户,占到平台月活将近一半。在今天,但凡有点热度的作品都会到此营业,只看游戏这一品类,目前已有600多款游戏入驻平台,其中官微粉丝量前10游戏累计粉丝数超过10.7亿,足见覆盖范围之广。 其他平台办游戏动漫展,都会邀请微博上的创作者站台。现在轮到微博搭台子,他们自然更愿意捧个人场。更何况,这对于创作者来说,也是一次难得的出圈机会。 在内容产业,如果只考虑单一领域的问题和机会,往往要承担更高风险、更大压力以及更多客观的局限性。游戏动漫展寻求突破,接下来就得跳出传统思维,打开格局、提升“产能”和“容量”。 换句话说,二次元产业需要更多WAW这样的大型活动,把资源分配给更多展商、作品、创作者,让活动不再是几个IP、几家公司或几个群体的事情,而是所有人都能接入其中得到滋养。 比如在抢票阶段,WAW就成功抢跑了一波,跟猫眼娱乐展开合作,让线上娱乐内容、票务和线下活动深度结合。有了这么一个庞大的流量入口,微博动漫展极大提升粉丝参与度,最终掀起抢票热潮。 这是微博游戏动漫展的本质优势,也是社交平台给这个产业带来的根本性变化。 03 二次元经济,用社交价值上强度 很长时间里,游戏动漫展的重点都在线下,把兴趣用户尽可能地带到现实空间,让用户在互动过程里跟作品、IP产生更强烈的情感链接,最终刺激他们释放消费力。既是同好盛会、圈层仪式,就意味着普通路人无法理解其中的快乐,也难以走进其中。 现在情况正在起变化,每一个特定的时期里面,用户的消费习惯会不太一样。随着年轻一代成长为社会中坚力量,他们喜欢的东西自然也成了主流文化。曾经被视作小众的二次元文化,如今早已渗透到普通人生活的方方面面,这在《黑神话:悟空》、《哪吒2》、谷子经济的走红过程中都已得到反复论证。 在这种趋势下,游戏动漫展肯定也不能再局限于“特供”某些群体,而应该拥抱所有年龄层用户,想方设法在大众层面形成充分的感知度。 一个不得不正视的现实情况是,线下活动必定会受到空间和时间的限制,即便投入再大的成本和资源,容纳量也会存在极限值。国内那些热门的游戏动漫展,活动落地时也是相当热闹,但在把流量有效转化成商业影响力这一点上,始终差点意思。 我之前采访过一个游戏厂商,他们当初也喜欢跑去各大动漫展摆摊,后来因为投资回报比太低,“费劲卖点周边不值当”,慢慢也就放弃折腾了。 这种难题还是要回线上找解法。说白了,以前办展的平台具有一定内容把控力,但在品牌传播上存在短板,最终还得依靠大众舆论场来做话题、做热点。 相形之下,微博不只有丰富的二次元内容生态,还有活跃的用户生态、浓厚的消费氛围,以及配套的宣传资源,可以打通线上线下,把社交传播链条缩短、社交网络打开,从而撬动更大产业价值。不是单纯在成熟市场里内卷,而是建立新的玩法、新的生态,乃至新的产业链。 这种线上线下与动漫展IP深度捆绑打造的多元互动形式,利用平台多重产品组合灵活入局、强势输出,可以帮助展商及品牌借势IP流量占据社交舆论主阵地。与此同时,微博用户极具包容性和创作力,他们是消费者,也是参与者。WAW落地后,他们真情实感地在发博分享体验感受,这些话题进一步在线上发酵,又会形成新的讨论、新的热点,实现海量UGC内容沉淀,进而给活动输送更多热度,形成强烈的长尾效应。 品牌自然也不会错过,一个年轻用户浓度如此高的场合,它们也在WAW玩出了新的花样。益禾堂带来和《魔道祖师》动画联动的限定饮品,优衣库则亮出了跟《王者荣耀》合作的十周年限定服饰,这些新品一下就戳中了年轻朋友的心巴。红米手机、三只松鼠、一加手机等品牌,也在不同展区、不同场景变着法儿地刷脸,让人想不注意都难。咱就说,扫码领券、限定周边抽奖这种,谁能抵挡得住? 内容为点,社交做线,微博游戏动漫展编织出一个庞大的网络,把创作者、品牌方、消费者都包裹其中。眼下WAW已经结束,但这并不意味着传播彻底进入了尾声,相反,那些在展馆亮相过的作品、IP、创作者依旧在微博活跃着,给新老粉丝提供新内容、新话题、新能量,在相互陪伴中等待下一次双向奔赴。 在微博游戏动漫展,我们终于看到这不仅仅是圈层活动,而是一次全民的快乐团建。从线上到线下再回到线上,微博的到来补齐了传统动漫游戏展所缺失的社交链路,一个完整的次元产业链闭环也由此形成。
闲鱼经济,火在小红书?
作者|娅沁 “马上离开北京去上海,坐标xx,自提的可以联系”,90后女生徐清颜,因工作变动需要从北京迁往上海,4月14日晚上,在小红书上发布了一条二手闲置帖。她把桌子、电视、卷发棒、自拍杆、豆浆机等二十来件闲置物品陆续发在了评论区,价格大多在50元以下(原价的2到3折)。这也是徐清颜在该账号上发出的第二条帖子。 不到一日,该帖就获得了600多条评论,账号的关注人数也从寥寥个位数增至70余人。“可能因为我价格确实太低了吧,很多都是全新没用过的,小红书的人很识货。”徐清颜说,目前已出的闲置超过一半,这样的反应速度让她感到惊讶。 值得注意的是,在这条帖子的评论区,不少网友借楼发布自己的闲置转让信息,还有人求购心仪的闲置好物,自发将评论区变成了一个热闹的“闲置集市”。 从分享生活方式的内容社区扩展到交易闲置物品的二手平台,当小红书被年轻人开发出全新的打开方式,不仅意味着平台的价值正在被重新定义,也反映出原有的二手市场有了新的用户需求和痛点。 小红书兴起“二手生意” 过去,卖闲置上专业二手平台是共识;如今,越来越多的年轻人却在小红书挂二手、聊交易,甚至直接在评论区“摆摊”。 在小红书的搜索栏输入“二手闲置”,相关词条的浏览量已突破15.3亿,讨论量高达2498.2万,且数据仍在持续上涨。从家具家电、服装鞋包、美妆个护,到电子产品、图书音像、玩偶手办,各类常见的二手闲置都能在小红书找到。 庞大的内容数据背后,是一个个鲜活的交易故事。有人因为装修想回血,急于转手家中的中古柜、电视柜、落地空调等大件家具;有人下定决心断舍离,给自己衣橱里的闲置衣服找主人;也有人想节约婚礼开支,在婚期前寻找闲置婚纱、敬酒服、婚鞋、喜糖盒…… 除了国内用户热衷于在小红书处理二手闲置,在海外留学或工作的网友们也在通过小红书完成“传递”。 一位在美国俄亥俄州哥伦布市生活的华人博主由于工作变动,将闲置的沙发、吸尘器等物品以视频形式发布在了小红书。该博主分享道,“已经在FB上卖了一些,想在小红书上碰碰运气。”该帖发出后,仅过了10多分钟便有人来询价。 惊蛰研究所在蹲守小红书二手闲置帖以及评论区的过程中发现,流量大、“刀客”少,反应速度快,即当下俗称的活人感,是不少卖家选择小红书出闲置的主要原因。比如,有网友分享,自己在小红书上陆陆续续出了30多单,在某二手交易平台才成交3单,就连这三单还是从小红书上引流过去的。小红书的反应速度依赖于其庞大的用户基数。数据显示,2024年年末,小红书月活跃用户数均值稳定在3.3亿左右,2024年6月,日活用户达到1.29亿。 一些买家选择小红书,则是因为除了捡漏到性价比超高的好物,还可能偶遇到免费赠送的惊喜。不少用户会发布免费闲置帖,有的是闲置衣物、行李箱等日常用品,也不乏闲置电脑、相机等电子产品。有时,个别卖家还会在文案的最后附上一句“欢迎大家上门来看来挑,来聊天喝个咖啡也可以”。这些情绪价值满满的转让帖,让基于陌生社交关系的二手交易又多了一些温度。 外部因素也在推动着用户走向小红书。“小红书对流量的分发会更准确,90%都是住在附近能自提的。大家可能随手刷到了,发现价格合适,离得也近,很容易成交。”在徐清颜看来,传统二手交易平台更依赖搜索,并且充斥着职业卖家,其中不乏黄牛,大家反而不容易淘到好货。 此外,全国最大的综合性二手交易平台闲鱼自2024年7月宣布对所有商家收取0.6%的手续费后,不少忠实用户深感落差,在社媒上表示不满。有网友直接发帖找闲鱼平替平台,也有网友建议小红书上线线上二手交易平台。 内容社区的“二手风险” 事实上,小红书平台上也存在官方认证的二手商家。但或许是受限于平台调性、内容社区的产品属性及运营策略,这些二手商家并没有实现太大的发展,商家数量有限、商品品类也不够丰富,整体经营数据同样表现平平。 根据惊蛰研究所观察,小红书二手商品板块中,二手数码产品(如打印机、手机、相机)和二手奢侈品(如包包)占据了主要版面。在随机浏览的50个商品中,约90%的销量不足100件,其中不少商品甚至零销量。 值得注意的是,此前小红书还要求二手奢侈品类目商家具备《鉴定机构合作关系证明》或《奢侈品鉴定资格证书》等专业资质,但在2024年4月1日已取消该项要求。但从搜索结果来看,小红书上的二手奢侈品商家并不活跃,且大部分二奢商家发布笔记的目的,都是为线下门店引流。 当然,当用户搜索特定商品如“二手家具”并筛选店铺时,虽然能看到相关商品列表,但呈现的往往是单调的图文信息,不佳的销售数据,也基本找不到有价值的用户评价。与个人闲置帖的活跃氛围相比,这些官方二手店铺的流量极其有限,也缺乏互动性和真实感。 不过,小红书上虽然汇聚了大量的二手闲置信息,但实际交易主要通过三种方式完成:线下自提(同城交易)、邮寄和第三方平台交易。其中,第一种和第三种方式最为常见。 具体来看,根据观察,对于100元以下的低价商品,同城的买卖双方更倾向于选择自提。比如前文提到的徐清颜,她90%的闲置物品都是通过这种方式完成交易的。而对于500元以上的高价商品,出于安全考虑,买卖双方通常会选择通过闲鱼等专业平台进行交易。例如,有宝妈在小红书上发布奶粉转让信息后,最终选择在闲鱼以1050元的价格成交。当然,也有部分用户会直接要求必须通过平台交易,否则就取消买卖。 相较于线下自提和平台交易,邮寄交易的风险也会更高一些,因为这种交易方式完全依赖于买卖双方的信用基础。小红书上有不少用户分享了因脱离平台交易而受骗的经历,这些案例往往如出一辙:买家通过微信与卖家达成交易意向,在支付定金或全款后,随即被对方拉黑,最终钱货两空。 近日,一位小红书博主就发帖讲述了自己购买二手iPhone的受骗经历。据该博主描述,在与卖家通过小红书互关后,对方提议绕过平台交易。双方协商采用“先付定金后付尾款”的方式,在添加微信后,卖家发来了快递预约截图以博取信任。然而,在博主支付定金后不到一分钟,就被对方立即拉黑。类似这样的交易骗局,往往让受害者只能自认倒霉。 与成熟的二手交易平台相比,小红书本质上仍是内容社区。因此缺乏成熟的交易体系和售后纠纷处理机制。所以,小红书的“二手市场”只是信息的集散地,而非真正的交易平台——用户在这里获取商品信息后,如果绕过专业平台进行交易,也意味着要承担更高的被骗风险。 用社区的方式打开“二手生意” 二手闲置交易在小红书上的兴起,本质上是社交价值的一种延伸。 1974年,美国社会学家马克·格拉诺维特(Mark Granovetter)提出了弱连接理论,该理论指出,在社会网络中,那些看似不紧密、不频繁的弱连接往往能带来更为丰富和异质性的信息。这一理论最初用于解释职业市场中的信息流动,其实对理解社媒时代的二手交易行为也同样适用。 对于用户而言,在小红书上进行二手交易,可能起初只是将其作为一个补充渠道,但小红书独特的内容种草和社交信任机制,在陌生社交关系基础上,帮助有需求的交易双方完成对接。 在专业二手交易平台,用户往往追求的是“快速成交”;而在小红书,交易过程本身也成为一种社交体验(当然,欺诈行为除外)。在小红书的社区氛围中,用户之间的交流不仅限于商品本身,更延伸至生活方式的分享。这种基于共同需求和相互信任建立的联系,让交易过程变得更加顺畅愉快。 这种社交化的交易模式催生了许多特色场景:有用户自发创建“电子地摊帖”,邀请大家将闲置物品集中展示;遭遇交易骗局的买家会详细分享受骗经历,提醒其他用户提高警惕;还有用户通过展示用二手物件改造的房间布置,意外引发一波“求同款”的热潮……这些互动让简单的物品交易升华为充满人情味的社交体验。 于是,小红书不够完备的交易体系,原本看似是一个劣势,却在不经意间产生了一种“筛选”作用,将传统二手交易平台上常见的职业“刀客”排除在外。这反而使得小红书的二手交易市场得以保留更多真实用户的身影,他们怀着真诚的态度进行交易,注重物品的实际价值和使用需求,而非单纯追求价格的极致打压。 小红书上二手交易的兴起,反映出年轻人对高效交易和社交价值的多元需求。甚至在高效之外,真实需求和内容种草的交易体验,有了更高的优先级。 对于年轻人来说,二手交易的重点不只是交易,而“二手社区”独特的社交体验找到了二手交易市场新的打开方式。这种方式或许不够高效,但足够有趣且令人期待。 年轻人对社交体验的重视也为专业的二手交易平台带来了一些启发:当二手交易只是大多数普通人偶然产生的实际需求,平台是否能够从体验层面让用户拥有更多归属感、获得感?毕竟平台的首要任务是能够先留住用户,其次才是从用户身上转化出更多的商业价值。 *文中徐清颜为化名。
大模型集体“挂科”!全新中文网页检索测试:GPT-4o准确率仅6.2%
你以为大模型已经能轻松“上网冲浪”了? 新基准测试集BrowseComp-ZH直接打脸主流AI。 BrowseComp-ZH是一项由港科大(广州)、北大、浙大、阿里、字节跳动、NIO等机构联合发布的新基准测试集,让20多个中外主流大模型集体“挂科”: GPT-4o在测试中准确率仅6.2%;多数国产/国际模型准确率跌破10%;即便是目前表现最好的OpenAI DeepResearch,也仅得42.9%。 目前,BrowseComp-ZH的全部数据已开源发布。 研究团队直言: “当前主流模型,距离成为真正懂中文互联网的智能体,还差得远。” 为什么我们需要中文网页能力测试? 如今的大模型越来越擅长“用工具”:能连搜索引擎、能调用插件、能“看网页”。 但众多评估工具都只在英文语境下建立,对中文语境、中文搜索引擎、中文平台生态考虑甚少。 然而,中文互联网信息碎片化严重、搜索入口多样、语言表达复杂。 中文网页世界到底有多难?举几个例子你就明白了: 信息碎片化,分散在百度百科、微博、地方政府网站、视频号等多平台 常见的语言结构中含有省略、典故、代指,关键词检索常常“跑偏” 搜索引擎本身质量参差,信息“沉底”或“走丢”都是常事 因此,英文测试集“翻译一下”根本不够。 需要从中文语境原生设计,才能真正衡量大模型是否能在中文网页上“看得懂”、“搜得到”、“推得准”。 BrowseComp-ZH是怎么炼成的? 研究团队采用了“逆向设计法”:从一个明确、可验证的事实答案出发(如某个画种、机构、影视剧名),反向构造出多个约束条件的复杂问题,确保以下三点: 百度/Bing/Google三大搜索引擎首屏无法直接命中答案 多个主流大模型在检索模式下也无法直接答对 经过人工验证,问题结构清晰,且仅有唯一答案 最终,他们构建了289道高难度中文多跳检索题目,覆盖影视、艺术、医学、地理、历史、科技等11大领域。 大模型集体“翻车”?DeepResearch勉强破四成,绝大多数连10%都不到 在BrowseComp-ZH的测试下,多款国内外主流大模型集体“翻车”: 尽管这些模型在对话理解、生成表达方面已展现强大实力,但在面对中文互联网的复杂检索任务时,准确率普遍低得惊人: 多数模型准确率低于10%,仅少数能突破20% OpenAI DeepResearch以42.9%位列第一,仍远未“及格” 研究者指出,这一结果说明:模型不仅需要会“查资料”,更要会“多跳推理”与“信息整合”,才能在中文互联网中真正找到答案。 四大发现,揭示中文网页任务的“模型死角” 1. 仅靠记忆不行,得真本事 纯靠参数记忆(无搜索)的模型准确率往往低于10%,说明“硬背”不靠谱。 2. 有推理的模型,表现更好 DeepSeek-R1(23.2%)比DeepSeek-V3(8.7%)整整高出14.5%,Claude-3.7也比Claude-3.5提升了12.2%,推理能力成为关键变量。 3. 搜得多≠搜得准,多轮策略才是王道 具备多轮检索能力的AI搜索产品全面胜出: DeepResearch:42.9% 豆包Deep Search:26.0% Perplexity Research模式:22.6% 相比之下,只检索一次的模型(如Kimi、Yuanbao)准确率低至个位数。 4. 搜索功能“翻车”?接入反而变差 最典型的反例是DeepSeek-R1,开启搜索功能后准确率从23.2%断崖式跌至7.6%。 研究指出,模型未能将网页检索信息与已有知识有效融合,反而被误导。 数据集开放!欢迎模型开发者挑战 BrowseComp-ZH的全部数据已开源发布。 研究者希望此基准测试能成为推动LLM在中文信息环境落地的试金石,助力构建真正“会用中文上网”的智能体。 下一步,他们计划扩充样本规模,拓展问答形式,并深入分析模型推理路径与失败案例。
彭博社:中美主导AI模型竞赛 中东、欧洲“掉队”
阿联酋G42 CEO肖鹏与OpenAI CEO奥特曼 凤凰网科技讯 北京时间5月6日,彭博社周一发文称,在生成式AI热潮刚刚开始兴起时,中东、欧洲的一些公司曾经跃跃欲试,希望抓住这一机遇。但是现在,随着中国和美国的公司主导了AI竞赛,中东和欧洲的公司不再追求尖端模型的开发。 2022年底,ChatGPT横空出世。仅仅几个月后,阿联酋的研究实验室就声称开发出了能够与之叫板的竞品。其中最知名的是“Falcon”和“Jais”,前者是一款在阿联酋政府支持下构建的开源AI系统,后者则是一个以该国最高山峰命名的模型。 梦想很丰满、现实很骨感 “AI的未来并非遥不可及的梦想,而是一种当下已然存在的现实。”阿联酋科技巨头G42 CEO肖鹏曾在2023年表示,当时该公司刚刚推出了Jais大模型。 但如今,阿联酋打造本土具有竞争力AI模型的梦想仍遥不可及。Falcon在用户数量和性能公开排名方面远远落后于美国公司的领先模型。与此同时,G42也已从Jais项目中撤出资源,转而专注于在OpenAI等其他公司的AI模型基础之上开发定制功能。 G42开发的大模型Jais 肖鹏今年4月在接受彭博新闻采访时表示:“在早期阶段,我们根本不知道基础模型能走多远,也不知道要到达下一个阶段需要付出怎样的努力。以阿联酋的体量来说,自研大模型并不现实。” 在生成式AI热潮爆发两年多后,全球开发更尖端模型的竞赛越来越像是中美两个国家之间的竞争。少数美国公司继续在AI开发中处于领先地位,它们在芯片、数据中心和人才方面投入了数以十亿美元计资金,以打造最大、最强的模型。与此同时,中国正在迅速赶上,并通过向市场投放大量低成本、开源模型来扩大其影响力。而大多数其他国家,即便是像阿联酋这样富裕的国家,也大多处于中间位置,难以脱颖而出。 在中东和欧洲地区,越来越多曾经前景光明的AI项目要么失败了,要么几乎被放弃。德国的Aleph Alpha曾被誉为欧洲版的OpenAI,去年也做出了与G42类似的决定。英国的Stability AI是AI模型领域的早期开拓者之一,但是由于管理方面的问题,该项目已逐渐偃旗息鼓。就连法国Mistral这样获得大量风险投资支持、还受到本国政府大力扶持的企业,也几乎没有展现出它具备了强劲商业吸引力或者能够引发开发者兴趣的实力。 大模型已落后 和其他市场一样,中东地区的企业正在重新审视从头开始构建前沿AI模型的成本是否值得。G42云业务部门Core42主管基里尔·埃特米莫夫(Kiril Evtimov)表示,如果G42继续投资,Jais可能会成为一款有竞争力的“前沿模型”,“但这是否是我们抢占市场的正确商业策略?答案或许是否定的”。 2023年,阿联酋成立了一家新公司AI71,号称是专为Falcon打造的商业化平台。但是,该公司发言人表示,AI71最终效仿了G42和Aleph Alpha的做法,转向开发面向特定商业用途的AI工具,使用包括Falcon在内的多个模型。 尽管Falcon仍然是阿联酋最具竞争力的产品,但它难以跟上美国Meta和中国DeepSeek等开源替代品的发展步伐。2023年,Falcon背后的阿联酋技术创新研究所(TII)曾宣传,该AI系统在Hugging Face开源模型排行榜上排名第一。然而,截至上周,Falcon在该平台的排行榜上已进不去前500名了。 DeepSeek TII的一位代表称,Falcon模型目前已经被下载超过5500万次。和Meta的Llama系列模型下载量相比,这简直是小巫见大巫,因为Llama的下载量已超过10亿次。该代表还表示,他们将很快宣布Falcon与网络安全、机器人技术和云服务公司的整合。“一个模型的价值不仅体现在其最初的基准性能上,还在于它如何随着时间的推移促进并推动更广泛的创新。”该代表在声明中说道。 与此同时,G42还在探索其他途径来参与当前的AI热潮,而非仅仅依靠模型开发,其数据中心业务正在海湾地区扩张。该公司与人共同创立的投资基金MGX已经投资了美国的AI公司OpenAI和xAI。 主权模型 一些国家仍在试图在AI发展方面挑战美国和中国。今年1月,印度政府表示将支持 18项不同的提议来构建基础AI模型。一位部长承诺,这些基础模型将“与最顶尖的模型竞争”。去年,沙特AI机构还与IBM合作,通过该公司的云服务推出了其自研国家模型ALLaM。 牛津大学AI教授迈克尔·布朗斯坦(Michael Bronstein)在迪拜举行的“机器能看见”(Machines Can See)会议上表示,各国追求这些所谓的主权模型,是为了对AI 系统的训练方式拥有更多控制权,要么是为了影响其运行方式,要么是为了减少对外国技术的依赖。 但他同时指出,开源模型的盛行意味着这些方法几乎没有保持竞争力的可能。(作者/箫雨) 更多一手新闻,欢迎下载凤凰新闻客户端订阅凤凰网科技。想看深度报道,请微信搜索“凤凰网科技”。
传苹果爆改iPhone发布节奏,首款折叠屏终于要来了
编译 | 王涵 编辑 | 漠影 苹果今年要搞大动作! 智东西5月6日消息,据外媒The Information报道,有知情人士透露,苹果或将在今年9月推出一款厚度约为5.5毫米的超薄iPhone,随后在2026年推出折叠屏手机。 此外,苹果还计划在明年改变新品的发布时间,高端机继续秋季秀肌肉,但更便宜的标准版要挪到次年春天“错峰出道”。 库克这波操作究竟是“憋大招”还是“玩心跳”? 一、苹果史上最薄手机:厚度仅5.5mm,无法插入实体SIM卡 与此前流出的对iPhone 17的爆料相一致,此款超薄iPhone预计厚度只有5.5mm(毫米)。该产品若能问世,将是苹果有史以来发布的最薄手机。 ▲超薄iPhone爆料图1 但“鱼和熊掌不可兼得”,追求超薄机型就不可避免地会在其功能与性能上有所妥协。据消息人士透露,超薄iPhone将只配备1个扬声器和1个摄像头,而不是2个扬声器+3个摄像头的常规组合。 除此之外,知情人士爆料其电池续航时间也将缩短。内部测试显示,超薄机型的电池续航时间不及旧款iPhone。能够在一天内不充电使用这款超薄手机的用户比例将在60%至70%之间,而其他机型的这一比例在80%至90%之间。知情人士还透露说,为了解决这个问题,苹果正在开发一款专为超薄机型设计的、包含电池组的手机壳。 ▲超薄iPhone爆料图2 由于近年苹果iPhone产品的迭代仅有小幅升级,用户换机意愿持续低迷。苹果“押宝”该款超薄手机有望重振iPhone销量增长并加速用户换机周期,毕竟iPhone的销售额占苹果总营收的一半还多。 变革意味着机遇,但也同时伴随风险。为了追求超薄,该机型没有留出实体SIM卡的空间,而中国法规尚未批准销售搭载e-SIM的智能手机。这一限制或将影响超薄iPhone在中国市场的销售表现。 此外,知情人士还说,由于这是一款全新的产品,没有历史需求可供参考,所以在9月开始预售之前,苹果无法预判制造商正在搭建的生产线能否满足需求,甚至难以判断是否会出现产能过剩。 另有两位知情人士称,基于上述原因,为该机型预留产能的制造商正在评估:若超薄机型市场表现不佳,他们能否迅速将生产线转向其他型号的生产。苹果在亚洲的制造合作伙伴仅能分配给超薄机型约10%的产能,其余大部分产能将保留给iPhone 17 Pro和Pro Max,这两款机型将分别占总产量的25%和40%左右,剩余产能将留给标准版iPhone 17。苹果发言人对此拒绝置评。 二、iPhone 18系列取消胶囊型切口:前置改为开孔式,为屏下摄像头过渡 超薄iPhone的发布将标志着苹果iPhone规划更大转变的开始。除了超薄机型外,爆料还透露了iPhone 18系列的更多变动。据悉,iPhone 18系列将包括超薄iPhone、Pro和Pro Max的迭代版本,以及新的折叠式iPhone。 知情人士透露,iPhone 18 Pro和iPhone 18 Pro Max的前置摄像头将为开孔式,仅在左上角开一个小孔。这一设计将成为至少一款2027年iPhone机型的前瞻性方案。该机型将把前置摄像头集成至屏幕下方,做到屏下前置摄像头,告别胶囊型切口,实现真正的全面屏。这一创新将恰逢初代iPhone发布20周年纪念。 据智东西此前报道,苹果有望计划明年发布首款折叠屏iPhone。一位参与制造的人士表示,这款书本式折叠设备的展开时内屏对角线尺寸略小于8英寸,闭合时外屏对角线尺寸略小于5.7英寸。 ▲iPhone折叠屏手机假想图 三、提振销量,优化产能,苹果调整新品发布窗口期 三位参与iPhone供应链的人士称,在2026年,苹果还计划将iPhone的不同机型错峰发布,即在当年秋季发布更高端、更昂贵的Pro机型,标准版iPhone和更加经济实惠的机型,即iPhone 18和更经济实惠的iPhone 16e的后续机型,推迟到次年春季发布。 其实在此之前,苹果通常也会在春季推出其入门级智能手机SE系列,只不过该系列机型更新周期较长,往往每隔数年才会迭代一次。例如,今年2月,苹果发布了iPhone SE的后续机型iPhone 16e。消息人士称,发布更高端的iPhone的5-6个月后,再发布下一代基础版可能会提振销量。市场分析公司Asymco创始人Horace Dediu也曾提到:“提前推出高端机型,稍后发布低端机型,可能会让早期采用者先购买更昂贵的机型。” 此番调整,还可能让苹果在提升多款机型产能时更加游刃有余。通过分阶段发布产品,苹果可以避免同时调动大量制造人力和设备,从而优化生产资源的配置。据曾在苹果供应链工作的人士透露,为保证秋季新品发布前储备充足库存,新iPhone通常在夏天就启动量产。由于假日购物季的订单高峰通常集中在冬季前,生产需求会在此期间达到峰值。而到了次年1月,随着订单量逐渐回落,苹果的制造合作伙伴往往难以全年维持同等规模的工人数量和设备运转效率。 结语:苹果的“创新突围”能否平衡创新与耐用性? 此次爆料中,有两个创新点较为引人注意,即超薄机身与屏下前置摄像头。 超薄iPhone纤薄至5.5毫米的机身设计,不禁让人联想到iPad Air系列曾因追求极致轻薄而付出的“代价”。作为苹果首款采用全金属一体化机身且厚度骤减至6.1毫米的平板电脑,初代iPad Air虽以“全球最薄平板”的称号惊艳市场,却因机身刚性不足导致用户在日常使用中频繁遭遇“折弯门”事件:仅需单手握持或轻微施压,机身便可能出现不可逆的弯曲变形,甚至有用户反馈将其放入背包后因挤压而永久变形。 而智能手机使用场景远比平板复杂,频繁单手操作、裤袋挤压、跌落冲击的风险大大增加。能否在纤薄与耐用性之间找到平衡点将是这款新机面临的最大挑战。 此外,进入全面屏时代后,智能手机厂商们为了追求更高的屏占比,开始研究前置摄像头的摆放位置以及形态变化,比如刘海屏、水滴屏、物理升降式结构的前置摄像头等,屏下前置摄像头也应运而生。 苹果虽非首家尝试将传感器与摄像头集成于显示屏下方的智能手机厂商,但就目前已经应用该技术的国内手机产品来看,其技术效果尚未达到理想状态。用户用肉眼仍能直接看到前置摄像头,并未能做到完全隐形,且自拍效果都有一定程度的折损。 苹果的屏下前置摄像头若能突破现有技术瓶颈,实现“真·全面屏”与影像质量的双重突破,或将再次掀起智能手机的技术创新浪潮。
意外泄露!谷歌Android新版设计语言细节曝光
编译 | 王涵 编辑 | 漠影 智东西5月6日消息,据谷歌官网发布的开发者大会日程及一篇意外流出的博客文章披露,该公司将在今年5月20日至21日举行的Google I/O开发者大会上推出新版Android设计语言。 此次发布的设计系统将从“Material 3”升级为“Material Design 3 Expressive(情感化设计)”,泄露的博客内容显示,新版设计将着力打造“能与用户建立情感连接”的交互界面,将通过“大胆的形态与色彩运用,创造令人愉悦的用户体验”。。 该博客最初由9to5Google发现,随后谷歌迅速撤下文章,现已被互联网档案馆保存。 一、加强情感共鸣,Material Design团队打破行业同质化 Material Design作为谷歌2014年推出的开源设计系统,详细规范了Android应用的视觉、动效及交互设计标准。其重大更新“Material You”(即Material 3)于2021年5月发布,首次实现界面风格随用户壁纸色彩自动适配的个性化功能。 Material 3 Expressive被谷歌称为“设计领域的大胆新方向”,是其设计系统“有史以来研究最充分的更新”。该设计倡导应用突破“整洁但乏味”的传统范式,打造能与用户建立情感连接的界面。除全称外,其也被简称为“M3 Expressive”或“情感化设计”。 与单纯依赖数据的传统方式不同,Material 3 Expressive源自跨学科协作研究。2022年,Material Design团队开始反思行业同质化现象:“为何所有应用都如此雷同乏味?难道不能增强情感共鸣吗?” 过去三年间,研究团队通过46项独立研究、数百轮设计迭代,并联合全球18000名用户开展多阶段测试,综合运用眼动追踪技术、定量问卷与焦点小组访谈、对照实验设计以及可用性任务测试评估等研究方法,最终构建了一套平衡美学与功能性的设计体系。 博客中提到,该体系的设计原则严格遵循实证研究结论,同时融合人机交互领域的经典方法论,确保设计师在应用创新组件时,既能实现设计创新,又能维持用户操作效率与体验的一致性。 二、创新造型,大胆配色,情感化设计要素提高用户体验 谷歌称:“情感化设计的根基在于色彩、形态、尺寸、动效与容器的创新运用”,其特征表现为“通过大胆的造型与色彩组合,创造愉悦的用户体验”。这些要素能有效引导用户关注界面关键区域:突出核心操作,合理归类相关元素。 例如本次更新的代表性创新之一的“浮动工具栏”。概念图中可见药丸状底栏不再占满屏幕宽度,留出边缘空间强化全屏设计感——类似当前Google Chat的界面处理。 博客中说,谷歌研究发现情感化设计使用户“识别关键操作速度提升4倍”,“导航效率显著提高”。在电子邮件应用的案例中,新版发送按钮采用更大尺寸、键盘上方定位及对比色设计,相较传统顶部工具栏布局,用户发现速度提升达四倍。 与此同时,研究及用户测试还发现,相较于严格遵循《iOS人机界面指南》的非表现性设计,各年龄段用户均更倾向于选择“运用得当的表现性设计”。谷歌称,表现性设计自带“酷感”,具体体现为品牌调性的提升。 研究数据显示,采用表现性设计后,品牌在用户认知维度呈现以下变化:亚文化契合度感知提升32%,反映该设计有助于增强品牌与特定用户群体的关联性;现代感指标增长34%,表明品牌形象更具新颖性与前瞻性;叛逆感指标增幅达30%,体现表现性设计可能强化品牌突破常规的差异化定位。 结语:Material 3 Expressive迭代聚焦包容性与开发适配 此次“Material 3 Expressive”虽非颠覆性变革,但标志着Material You设计语言的迭代升级。博客着重阐述了更新背后的研究依据:实验证明更具表现力的设计能显著提升可用性。谷歌提到,这种通过突出关键元素引导用户操作的设计模式,可带来“显著的性能提升”。 值得注意的是,博客中称该设计还能在一定程度上弥合“数字鸿沟”,降低老年人使用门槛,实现跨年龄层的公平体验。但谷歌同时强调,情感化设计并非“放之四海皆准”,应用开发者在定制界面时仍需遵循既有的设计规范与标准。 大会日程中“用Material 3 Expressive打造卓越用户体验”的环节证实,新版设计系统将于本月开发者大会正式亮相。根据环节说明,开发者将学习运用“新型情感化设计模式”来提升产品吸引力、易用性与用户黏性。谷歌计划同步发布设计资源与Alpha版本代码,以便开发者在正式发布前进行适配测试。 作为影响Android平台应用开发规范的核心设计体系,此类更新或将革新应用程序的构建方式与用户体验,进而升级Android设备的使用感受。
AI搞定所有家务!π0.5突破泛化极限,UC伯克利系出品
自动播放 【导读】具身智能最大的挑战在于泛化能力,即在陌生环境中正确完成任务。最近,Physical Intelligence推出全新的π0.5 VLA模型,通过异构任务协同训练实现了泛化,各种家务都能拿捏。 近年来,机器人取得了显著进展,能表演杂技、跳舞、听从指令,甚至完成叠衣服、擦桌子等复杂任务。但机器人面临的最大挑战并非灵活性,而是泛化能力——在新环境中正确完成任务的能力。 想象一个你家中的清洁机器人:每个家庭布局不同,物品摆放各异,机器人必须在多个层面上实现泛化。低层面上,它需学会如何抓起未曾见过的勺子或盘子;高层面上,它要理解任务语义,如衣服应放进洗衣篮、用何种工具擦拭溢出物。实现这种能力既依赖强大的操作技能,也需要常识理解,而现实中可用于训练的数据又极其有限,这进一步增加了困难。 即使近年来的机器人在灵巧性方面有所突破,往往也是基于特定场景和相似数据训练出来的。 因此,如果我们希望机器人成为我们日常生活的一部分,在我们的家中、杂货店、办公室、医院和其他“杂乱”的环境中工作,机器人就必须具备更加强大的泛化能力。 今天,美国具身智能公司 Physical Intelligence 推出了一个基于 π0 的视觉-语言-动作(VLA)模型 π0.5,其利用异构任务的协同训练来实现广泛的泛化,可以在全新的家中执行各种任务。 实验表明,这种知识迁移对于有效的泛化至关重要,而且他们首次证明,端到端学习型机器人系统可以在全新的家庭中执行长程灵巧操作技能,例如清洁厨房或卧室。 π0.5是如何工作的? π0.5 背后的主要原理是异构数据的共同训练:通过在各种不同的数据源上训练 VLA 模型,不仅可以教它如何物理地执行不同的技能,还可以教它如何理解每项技能的语义背景,推断任务的高级结构,甚至从其他机器人转移物理行为。 协同训练的概念很简单:由于 VLA 源自通用的视觉语言模型(VLM),因此它们可以在包含动作、图像、文本和其他多模态标注(例如边界框)的任意组合的示例上进行训练。这包括通用的多模态任务,如图像字幕、视觉问答或物体检测;面向机器人的任务,如带有动作的机器人演示;以及“高级”机器人示例,这些示例由带有适当语义行为标记的观察结果组成。演示还包含“口头指令”,即一个人通过自然语言一步步指导机器人完成一项复杂任务。该模型既可以对下一步要执行的语义步骤进行高级推理(类似于思路链推理),也可以进行低级预测,以向机器人的关节输出运动指令。 π0.5 的协同训练任务示意图,其中包括来自多种不同机器人类型的各种机器人数据源,以及包括高级子任务指令、指示和网络数据在内的多模态数据。 虽然协同训练的基本原理并非新事物,但训练一个能够广泛泛化的 VLA 需要合理地组合协同训练任务。VLA 需要由多种协同训练任务组成的“课程”,以便在所有必要的抽象层次上实现泛化。在实验中,他们训练了 π0.5 模型的不同版本,这些版本排除了完整训练混合的不同部分,只留下使用在实验中使用的相同机器人收集的移动操作数据(约 400 小时)。 评估完整的 π0.5 训练混合与排除各种数据源的消减相比。网络数据(WD)在泛化到分布外对象方面的差异最大,而来自其他机器人(ME 和 CE)的数据在所有评估条件下都很重要。 他们评估了两种实验条件:全面清洁任务;以及分布外泛化(OOD)评估,要求机器人将提示中指示的特定物体移入抽屉。对于这两种评估,都测量了成功率和语言理解率。在所有情况下,来自其他机器人(ME 和 CE)的数据对策略性能产生了巨大影响。在 OOD 案例中,他们还发现与包含网络数据(WD)的策略性能存在差异,这提高了机器人正确识别数据中未包含的新物体类别的能力。 为了更好地量化 π0.5 能够实现的泛化程度,他们进行了一项扩展研究,其中改变了训练数据中不同环境的数量。他们还在比较中加入了基线模型,该模型使用所有其他数据源的数据外,还直接使用来自测试环境的数据进行训练。该模型(用水平绿线表示)可以直观地了解,如果消除了泛化到新环境的挑战,VLA 在该场景中的表现如何。 评估在与训练混合中的其他数据集共同训练时,性能如何随训练环境的数量而变化。当使用所有可用的训练环境时(图中最右边一点),π0.5(黄色)与直接在测试环境(绿色)中训练的基线模型性能相似。 这些结果不仅表明,π0.5 的泛化性能会随着训练集中不同环境数量的增加而稳步提升,而且仅仅经过大约 100 个训练环境,它的性能就接近了直接在测试环境中训练的基线模型。 训练和推理 π0.5 构建于 π0 VLA 基础之上,经过联合训练,能同时输出动作和文本标签,因此可在高层和低层控制机器人。在运行时,它先生成一个文本形式的“高级”动作,再细化为一组连续的低级关节动作(每组称为一个 50 步的“动作块”)来执行该动作。 这一流程延续了他们此前的 Hi Robot 系统思路,不同之处在于 π0.5 将高级决策与低级控制统一由同一模型完成,类似于“思维链”模式。 模型本身包含离散自回归 token 解码和通过流匹配进行的连续解码,例如 π0。离散解码路径用于推断高级动作,而连续流匹配路径用于推断低级运动命令。 π0.5 使用的高层/低层推理程序。该模型首先生成一个用语言表达的高级动作,基本上是“告诉自己”应该采取什么步骤来完成任务,然后利用其流程匹配动作专家来选择运动指令。 如果换个房子试试呢? 他们通过让 π0.5 控制机械手,在训练数据中从未见过的新房屋中完成清洁任务,以评估其泛化能力。对 VLA 来说,这是极具挑战的测试。尽管 VLA 曾展现出出色的泛化能力,如理解语义指令、与人互动、组合技能等,但这些能力多在与训练环境相似的场景中实现。 此前,他们的 π0-FAST 虽能通过 DROID 系统推广到新环境,但仅限于如移动物体等简单任务。而此次实验中,π0.5 被放入全新家庭,需完成收拾碗碟、整理床铺、清洁地板等复杂任务。这些任务不仅耗时,还要求机器人执行如用海绵擦拭等复杂动作,理解任务语义,并将其拆解为多个环节,每步都需与正确的物体互动。 最后,π0.5 模型可以接受不同粒度的语言命令,从“把盘子放进水槽”这样的高级提示,到指示模型拾取特定物体或朝特定方向移动的详细单个命令。他们在下方视频中展示了一些语言跟随的示例。 下一步:更泛化的物理智能 这项工作表明,VLA 能够实现出色的泛化能力,即便面对如清洁厨房或卧室这样复杂且多变的机器人任务,也能有效应对。π0.5 能够让机器人完成在训练数据中从未遇到过的新家庭环境的清洁任务。 尽管 π0.5 还不够完美,常在高级语义推理和动作执行指令方面出现错误,但研究人员希望,通过让机器人从多样的知识来源中学习,π0.5 能够帮助我们更接近实现广泛泛化、灵活应变的物理智能。 目前,这些机器人可以通过语言反馈进行改进;未来,它们还可能借助自主经验,在更少监督的情况下不断优化,或在不熟悉的情境中主动请求帮助和建议。尽管如此,在知识迁移、模型构建技术,以及数据来源的多样性等方面,仍有大量进步空间。 参考资料: https://mp.weixin.qq.com/s/T3sufjvlfjW5oFtWhCf9-g
AI智能体,是不是可以慢一点?ToB产业观察
Manus爆火之后,产品过度营销曾使其一度饱受业内争议——不自研大模型,而是基于第三方大模型进行工程化包装,实现通用AI智能体(Agent)的能力。在创始团队看来,极致的套壳就是一种胜利。 大模型应用套壳其实是个微妙的话题。特别是在此之前,无论是DeepSeek还是OpenAI,亦或是加入基础大模型混战的知名科技企业、AI大模型创企,都以标榜自家的基础大模型自研技术能力为荣。 也因此,大模型研发作为一项需要卷算力、卷数据、卷算法的系统性底层工程,且赢者通吃,市场的聚光灯也始终聚焦于头部企业。对于只做上层应用的AI套壳或“借鉴”企业而言,尽管市场爆发的可能性高,但始终不掌握底层核心技术,往往被认为缺乏风险承受能力。金沙江创投主管合伙人朱啸虎甚至直言:“所有AI应用都是套壳应用,说有壁垒是忽悠人的。” 尽管如此,笔者注意到,仅在一个多月的时间内,部分大模型大厂已正快速下探到Manus所在的赛道——AI智能体。而另据外媒报道,Manus背后的公司“蝴蝶效应”获得了由美国风投Benchmark领投的一轮融资,融资金额达7500万美元。该轮融资让Manus的估值提升至近5亿美元。 这种迹象表明,市场需要借DeepSeek-R1大模型普及和Manus应用爆火的催化,去化解过去企业智能化转型过程中遗留的大量业务需求和技术空白。AI智能体在产品设计、商业化服务、安全治理等方面,既是新问题,也是老问题。 大厂下探AI智能体,很努力 目前大厂正加快布局AI智能体。 据相关媒体报道,Manus出圈前后,字节就搞了至少5个团队在开发不同AI智能体产品。而据百度官方,新上线的“心响”APP则由一群95后组成的团队,在30天内研发出来。 目前字节推出了智能体协作平台“扣子空间”,通过部署多类型AI智能体,调用精通各项技能的“通用实习生”与各行各业的“领域专家”两种专业身份处理任务。基于“扣子空间”,初步提供两种专家Agent,一是针对股票分析的“华泰A股观察助手”,另一个则是针对行研分析的“用户研究专家”。 而百度亮相的体“心响”APP,则是一款宣称对标Manus的通用AI智能体,涵盖超200个任务类型,包括日常的例行任务、城市旅游规划,专业性较强的深度研究、法律咨询、健康咨询等。 而与Manus合作密切的阿里也动作频频。最早在3月份,阿里就与Manus达成战略合作,双方将基于通义千问系列开源模型,在国产模型和算力平台上实现Manus的全部功能。近日,阿里旗下AI智能体“心流”开启了高级研究模式公测,用户可填写问卷等待邀请。该智能体宣传称能像人类专家一样,自动帮做研究、写报告、写代码。 为了进一步达成AI智能体生态的构建,上述厂商也不约而同先后拥抱MCP机制。 4月9日,阿里云百炼上线业界首个全生命周期MCP服务,同日,腾讯云上线正式发布“AI开发套件”,蚂蚁集团旗下的OceanBase也已实现MCP协议的对接。百度则引入基于百度搜索的MCP Server发现平台和MCP Server服务。目前阿里百度腾讯字节旗下一部分AI智能体产品均支持MCP协议,大厂的生态作用也可进一步凸显。 民生证券指出,A2A协议主要聚焦于智能体之间的通信,而MCP则有助于连接工具和资源。基于类MCP协议+Agentic-based决策路径将成为未来AI智能体的主流范式,大厂有望通过MCP协议引入大量生态伙伴,推动国内AI智能体产业发展。 “我们是不是可以慢一点” 但一路向前狂奔的AI智能体技术是否在迎合当下用户的真正需求? 在安全风险性层面,安全往往是验证一项技术的关键。鉴于AI智能体的设计初衷是自主执行决策、任务或目标,并且理想情况下是在无人监督的情况下,因此风险更高,必须更加密切地关注其使用情境,以降低可预见的风险。 “从整个AI智能体的技术发展来说,它不管是在“攻”还是“防”,现在都是发展初期,没有看到特别多的案例。”Gartner研究高级总监赵宇告诉笔者。 从需求侧,最近一段时间与中国企业客户的交流中,赵宇发现,“客户现在整体的认知相对不足。至少有七成或更多的客户并不了解AI智能体是什么,更罔论与之相关的安全风险。” “虽然有一些甲方IT负责人已经认识到问题,但这样的声音还不太普遍。他们希望是不是可以放慢AI的步伐,把一些配套的安全治理、风险控制等能力补充起来。”赵宇说。 例如,AI本身的幻觉、提示注入攻击、数据泄露等带来的风险问题,在AI智能体的应用中可能会被进一步放大;AI智能体自主决策的风险,无论是被恶意攻击者利用还是其本身的完备性和能力,带来的是无法防控、不可预测的风险;物理环境层面的风险,同样不容忽视。 此外,随着多智能体协作运行模式的流行,这种模式确实提高了任务效率,但也导致访问控制漏洞的出现,比如访问控制级联失控,以及资源的竞争和冲突。多个智能体协同时,风险级别与安全管理的复杂度急剧上升,传统的安全工具将很难进行监控和异常行为检测。 “多智能体在交互过程中可能需要访问相同资源或者执行任务时,可能会产生一些冲突,那么就会导致系统资源被过度滥用或者任务执行效率降低,就会影响整体的业务和系统稳定性。”赵宇指出。 而在厂商侧,由于AI智能体自身的发展还处于初期,市面上对其安全风险和控制措施的研究同样处于早期阶段。 赵宇进一步指出,部分AI厂商、大模型厂商或AI智能体厂商,都没有配备相应专职的安全团队。厂商目前交付的产品是否可以通过安全测试,或者是否存在有被攻击者可利用的漏洞,等等这些在安全性上都是存疑的。其次,现在大部分企业不管是厂商还是甲方企业,还是比较关注短期的商业利益,所以对于长期安全风险的重视程度其实也不太够。 此外,AI安全可能也需要全局性工作,很难从单一厂商的安全措施就可以覆盖掉整个链条的风险。 正确认识AI智能体 技术常有常新,无需过度画饼。到底何为AI智能体?这个概念其实已经出现审美疲劳。更快速的变化在于,围绕AI智能体(Agent)延伸而出的Agentic AI、Agentic Workflow、MCP、A2A等新名词,已经成为最近一段时间更炙手的话题。 例如,Manus演示视频展示的是一个独立的智能体:AI智能体可在短短几秒钟内对简历进行分类、对候选人进行排名,以及在电子表格中格式化数据。用户还可用于分析股票市场趋势、从互联网上抓取数据,甚至可以从头开始创建一个网站。 按照微软的说法,以后每个人都会使用多个智能体,同时会有大量专业智能体,而不是只有一个超级智能体。那么,每个智能体都有自己的角色和职责,大量多个智能体需要通过通信和协作来达成目标。这也是Anthropic、谷歌两家公司分别提出MCP、A2A的原因,其本质上都是在解决智能体搭建的效率问题。 当下来看,业内对AI智能体的实践目标是使其真正意义上适应复杂的应用场景。AI智能体要构建一个能够自主决策、与环境交互的智能体,需要解决感知、理解、规划、执行等多个环节的技术难题,且各环节之间需要高度协同,从被动执行固定指令到主动进化,其技术架构和实现方式远比传统的软件系统复杂。 比如在自动驾驶领域,当前车企针对端到端自动驾驶系统的改造逻辑,正是对传统系统中的感知、融合、预测、规划、控制、定位等技术模块进行AI融合,在业务流程上体现出的不是简单模块间的拼接。 那么,AI智能体或多个AI智能体,在主动适应复杂工作流程的过程中,就不可能像RPA等技术在严格划分的场景中有效运作,而是基于动态环境和业务流程的变化,以最佳方式实现预期结果。 因此,在应用和实践AI智能体之前,对其原理、成本及风险性等诸多需要考量的关键因素进行解构。 可能对于有多年智能化探索经验的客户而言,希望“慢一点”的本质在于,在AI智能体领域的治理能力和认知的提升,重要的不是听一个个花式技术名词,而是怎么能在大量的实践和基础夯实中找到成功的故事共鸣。
iPhone 17 Pro 新配色曝光,苹果为何如此青睐蓝色?
蓝苹果 最新爆料称,今年 iPhone 17 Pro 将采用「天蓝色」的新配色,类似今年 M4 MacBook Air 上那种带有金属光泽的浅蓝色,将取代 iPhone 16 Pro 上的「沙漠色」。 从 5 年前的 iPhone 12 开始,每年的 iPhone 不会缺席的一个配色就是蓝色,几乎成为了黑白之外的常驻的第三色——前年的 iPhone 15 甚至没有白色,不少喜欢白色的用户都选择了那个低饱和的蓝色。 关于苹果的这个「天蓝色」,我们已经在 M4 MacBook Air 评测中专门聊过。这个色阶上最浅的蓝色,在不少环境中都更像是银灰色带了一抹蓝。 刚好去年 iPhone 16 Pro 的「沙漠色」,是一种偏金属质感的亮金色,可以大胆猜测今年的「天蓝色」的 iPhone 17 Pro,可能也会是以浅色钛金属为基底,带有一丝浅蓝的光泽。 不止 iPhone,蓝色已经遍布了 iPad、Mac 在内几乎每个苹果产品线,从鲜艳的「天蓝色」,到深邃的「午夜色」,以及 iPhone 16 上带有紫色调的「群青色」,同样都是蓝色为基底,但做出了相当迥异的观感,用不同的色阶适配不同的场景。 图源:小红书@电丸便利店 爱范儿在与苹果副总裁 Bob Borchers 的专访中也提到了这个有趣的现象,得到的答复如下: 我们为每款产品量身定制颜色。比如 MacBook Air 的天蓝色版本的妙处在于,它与工业设计产生了美妙的协同效果。当你观察它时,呈现出迷人的渐变效果。所以,我们选择颜色的标准是:既要彰显产品故事,突出设计语言,又要给用户多元选择。 蓝色并不是一种常见的「自然」色,自然界鲜少有动植物或者矿物自带蓝色,因此古时候要做出蓝色颜料,并不简单。不久前,Scott Alexander 写过一篇《她的外袍颜色》,其中就讲述了中世纪由于宝蓝色颜料相当稀有,因此在那个宗教盛行的时代,只能用来创作圣母玛利亚画像的外袍。 几个世纪以来,人类不断从植物、矿物甚至微生物中提取蓝色,直到科学家发明出更廉价的合成蓝颜料,梵高才能画出最经典的《星空》。因此,蓝色普及的过程,可以说折射了科学技术的发展道路,又因为这种色彩在生物中并不多见,很自然成为技术的代表色。 于是你会发现,《银翼杀手》中充满了蓝光,而日常生活中 Windows 会蓝屏,不管是 iOS、iPadOS 还是 macOS,UI 的主题色也主要以蓝色为主。 《爱死机》中的 Zima Blue,借蓝色讨论生命的终极意义 又因为我们潜意识中将其和大海、天空的深度绑定,蓝色天然传递出可靠性与专业度的感觉,并且冷色调能给人带来沉稳和理性的视觉观感,为科技品牌所青睐,当作品牌以及产品的代表颜色。 需要补充一个「蓝厂」vivo iPhone 在很长一段时间都走的「黑、白、灰」色系,但 5C 和 XR 这两次彩色系 iPhone 的探索,蓝色都没有缺席,并且除了 iPhone 11 代代都有蓝色。 图源:512 Pixels 除了色彩品味上的偏好,苹果总喜欢推出蓝色系产品,更是一种商业上的考量。 比起强烈吸睛的红色,带有一点性别刻板的粉色,蓝色是一种普适性很强的颜色,无论男女老少都不会排斥,可以说是在因人而异的主观审美之中,求得了一个较大的公约数。 自 2000 年潘通开启年度色评选以来,蓝色系的颜色上榜过六次,是最流行的色系之一,足以见其受欢迎程度。 但不是所有的蓝色都能被用户喜爱。越浓郁的颜色,传递出来的情绪会更丰富,因此观感上会更复杂,iPhone 12 和 iPhone 13 上的深蓝色,在刚推出的时候,就收到了用户的不少吐槽。 iPhone 12 上大名鼎鼎的克莱因蓝,被吐槽「像拖鞋」,图源:Tom's Guide 与之相对,饱和低更低的蓝色,会更受到欢迎。 这其中的代表,自然是 iPhone 13 Pro 淡淡的「远峰蓝」配色,这是苹果第一次在 iPhone 上尝试低饱和的蓝色,结果不仅叫好还叫座,第三方调查显示有 37% 的用户都选择了这个配色。 天蓝色或许会很接近远峰蓝,图源:Apple Insider 这种带有金属光泽的蓝色,和「天蓝色」非常相似,不仅兼顾了 iPhone Pro 系列一直以来比较极简的配色,保持专业性的冷峻同时,也带有一丝活泼,可谓是「克制的感性」。 对于 iPhone 而言,尽管每年的更新点都有所不同,但肉眼就可感知的配色更新,总是最能成为吸引用户热议的亮点。所以说,时隔 4 代重新回归 iPhone 17 Pro 的这抹淡蓝色,不只是设计的考量,更是一个吸引眼球的由头。 没办法,在产品没有突破性进展的年份,科技也只能以「换壳为本」。
马斯克现在拥有一座城市,他说这是人类登陆火星的起点
支持者们满怀期望 反对者们深深担忧 Space X 火箭公司在美国德克萨斯州南部的总部在 5 月 3 日正式成为了一个城市,它同时拥有了一个颇具科幻色彩和未来感的名字——「Starbase」。 如果翻译成中文的话,或许可以称呼为「星舰基地」。 根据当地官方公布的投票结果,在当地居住的 218 位选民中,共有 212 票支持了将星舰基地正式设立为城市的决议,其中大部分为 Space X 的员工。 这次投票同时选举出了星舰基地的市长 Bobby Peden(鲍比·佩登),他目前是 Space X 的副总裁,其余的两位市议员也在 Space X 工作。 这意味着,Space X 公司将获得对该地区更多控制权,主要集中在城市规划、土地开发和基础建设方面,但 Space X 火箭的发射和着陆仍需要获得美国联邦航空管理局的批准,火箭发射台的废水排放、环境评估以及重大设施建设也仍将受到监管。 Space X 的火箭正在升空 马斯克在社交平台上发帖庆祝了此事,称星舰基地「现在是一个真正的城市了!」。 根据《纽约时报》的介绍,Space X 在过去的几年里一直在其发射场周围——即德克萨斯州与墨西哥边境附近建造一个类似公司城镇(Company Towns)的地方。 注:公司城镇(Company Towns)特指工业革命时期企业掌控社区资源的模式,往往带有垄断争议。 Starbase 的城市区域及边界 图片来自:纽约时报 SpaceX 同时正在申请将年火箭发射次数从 5 次增至 25 次,并尝试获得附近海滩的管理授权。 Starbase 是 SpaceX 的发射基地,从 2019 年底开始,该地成为了 Space X 火箭的重要发射场地之一。但是由于每次发射火箭或者测试引擎时,公司都需要向县政府申请关闭公众海滩和附近道路,但是审批和评估手续往往复杂繁琐,如果获得批准,Space X 不再需要申请和审批就可以关闭道路和海滩,从而可以更频繁的进行实验和火箭发射。 Space X 发射台及附近海滩 图片来自:纽约时报 在外媒曝光的一些规划图中,我们能看到星舰基地目前正在规划建设更多的员工住房、火箭制造设施和一些商业建筑,目前得知的有超市、咖啡馆、寿司店和一所投资约 2000 万美元的私立学校「Ad Astra」(拉丁语,中文含义为奔向星辰,公司子女可优先入学)。 Starbase 的部分区域规划 图片来自:纽约时报 马斯克曾多次表示,星舰基地是「人类登陆火星的起点」。通过企业闭环管理,SpaceX 可以试验资源分配、公共治理等模型,为外星殖民地积累经验。这种「地球版火星城」的设想,还包括全自动驾驶交通和太阳能供电系统。 这次投票获得成功通过对马斯克本人也意义非凡。 在过去的几个月里,马斯克因深度介入了特朗普的选举和政治活动而受到猛烈抨击,其担任美国「政府效率部」负责人期间展开的大规模裁员和削减开支的活动也引发了美国各地对他本人和特斯拉公司的大规模抗议。 Starbase 附近的马斯克雕像 特斯拉今年第一季度的营收同比下降 9%,汽车业务收入同比下降 20%,净利润同比则暴跌 71%,同时也有消息传出由于股价下跌和部分投资者的不满,特斯拉董事会开始认真考虑寻找马斯克的继任者,这一说法被后来被特斯拉董事长罗宾·德诺姆否认。 在各种压力的作用下,马斯克在 4 月 22 日的公司财报电话会议上表示,从5月开始,他将大幅减少管理政府效率部的时间,将把更多时间投入特斯拉。同时,马斯克也正准备卸任其在政府效率部的官方职务。 针对特斯拉的抗议活动 当然,这一投票结果也招致了不少批评和抗议,自2019 年建成以来,Space X 发射场就不断受到当地居民和环保人员的抗议乃至诉讼。 2024 年,Space X 公司就因为倾倒废水而被美国环境保护署和德克萨斯州环境质量委员会罚款近 150000 美元。 火箭发射时的扬尘 反对者认为 Space X 在当地的活动对周边的自然环境和社区造成了负面影响,火箭发射或者爆炸时都会产生巨大的噪音、扬起大量的粉尘并造成严重的光污染,这不仅会引发附近的建筑和道路交通问题,也对附近濒危的海龟、豹猫、候鸟等野生动物和栖息地造成了干扰和破坏。 他们担心在星舰基地正式成为城市之后,Space X 会进一步获得对周边地区的控制权,甚至能在某种程度上绕过监管,让公共资源成为私产。 抗议者们的标语 在「X」软件上有两段评论很能反映支持者和反对者们的意见。 支持者们满怀期望,「我们怀着深邃的胸怀和热忱的愿望,站在人类文明变革时代的门槛上,通过踏上前往火星、月球和星星的大胆旅程,我们拥抱作为多行星物种和航天社会的命运。」 反对者们则深深担忧,「马斯克先生,请把海滩留给地球人——至少在我们学会呼吸火星空气之前!」 发射场及其周边 文|芥末
160人卖了217亿,AI应用首个大额套现项目,CEO解密成功秘诀
编译 | 陈骏达 编辑 | Panken 智东西5月6日报道,今天,据外媒披露,AI编程独角兽Windsurf将以30亿美元(约合人民币217亿元)的估值卖身OpenAI,这也成为OpenAI史上规模最大的收购。近日,在一场长达70分钟的深度采访中,Windsurf创始人兼CEO Varun Mohan回应了外界对这家创企的诸多好奇与疑问。 Mohan认为,AI真正值得深挖的差异化价值在应用层,Windsurf的目标是每隔半年到1年就颠覆现有产品的状态。不过,要打造具备竞争优势的AI应用,不能仅靠“套壳”,也需要长期稳定的技术投入与创新。 自2024年底发布同名AI原生IDE产品Windsurf以来,该公司经历了惊人的增长:4个月内用户数破百万、年度经常性收入(ARR)超过1亿美元、企业客户数量超过1000家。 与重技术轻营销的科技创业者不同,Mohan认为“企业销售很有价值”。其市场团队规模现已超过工程团队的规模,达到80人,这也是他们开拓摩根大通、戴尔等超大型客户的关键。 目前,Windsurf的团队仅有不到160人,遵循“精简公司”理念,招聘录取率低于0.6%。Mohan称:“我们希望找到那些真正具有高度主动性的人,因为如果不去创新,不去尝试一些疯狂的事情,公司就会停滞不前,甚至死亡。” Windsurf的工作强度极高,不欢迎投机取巧、搭便车的员工,会奖励用最少资源完成最疯狂项目的员工。只有当团队严重超负荷,达到近乎“脱水”的状态时,Windsurf才会招新。同时,团队间的人员和资源流动十分灵活,可根据需求自由调配。 在采访中,Mohan完整回顾了Windsurf由AI基建赛道转至AI编程赛道的创业历程,并分享了他的创业感悟。他还谈到了AI应用该如何避免沦为“GPT套壳软件”、自研模型与外部模型的选用逻辑和他眼中Windsurf与Cursor等竞争对手的差异化优势。 ▲左为Lenny’s Podcast主理人Lenny Rachitsky,右为Windsurf创始人兼CEO Varun Mohan 以下是Mohan接受科技播客节目Lenny’s Podcast采访视频(录制于今年4月)的完整编译(为提高可读性,智东西在不违背原意的前提下进行了一定的增删修改): 一、手握万卡集群转型AI编程,专攻To B市场 Lenny Rachitsky:请你简单分享一下Codeium的历史,以及Windsurf是如何从Codeium发展而来的。 Varun Mohan:公司是在4年前成立的。4年前AI编程这一概念尚未出现,ChatGPT也还没有诞生。我们公司最初是在开发GPU虚拟化和编译器软件。在此之前,我从事自动驾驶汽车领域的工作。我的联合创始人,也是我从初中就认识的朋友,在Meta从事AR、VR工作。 我们都相信深度学习会影响很多行业,不仅仅是自动驾驶汽车,还包括金融服务、国防、医疗健康等领域,而且我们认为这些深度学习应用很难构建。当时,我们的产品让用户能够在没有GPU的计算机上有效地运行这些复杂应用,我们会为用户处理使用GPU的复杂问题,并大幅优化这些工作负载。 到了2022年中期,我们已经有了几百万美元的收入,管理着超过1万块GPU。当时我们只有8个人,而且实现了自由现金流为正。但我认为,随着生成式AI模型开始变得越来越好,我们构建的很多东西不再那么有价值了。 这对公司来说是一个非常艰难的时刻。当时我们只有8个人,但我们在想,人们还会继续训练那些非常定制化的情感分类器模型(用于社交媒体推荐机制)吗?还是会直接问GPT:“这是积极还是消极的情感?”可能是后者。 在一个每个人都要运行生成式AI模型的世界里,一家基础设施公司能有什么差异化因素呢?最终每个人都会运行相同类型的基础设施。 我们决定相信,生成式AI会成为下一个互联网。在这种情况下,我们应该去构建下一代伟大的应用,就像谷歌、亚马逊那样。我们进行垂直整合,利用我们的基础设施、推理基础设施去构建了当时的Codeium。 我们公司是GitHub Copilot的早期用户,也意识到编程领域在未来几年将会受到AI的巨大冲击。我们利用了我们原有的基础设施,大规模运行我们自己的模型。 在最开始我们甚至训练了自己的模型,它非常简单,纯粹是一个自动补全模型,当用户在输入时,我们会补全接下来的1-4行代码。我们目前在所有开发者使用的IDE中免费提供这个产品,包括VS Code、JetBrains、Eclipse、Visual Studio、Vim、Emacs。 我们之所以能免费提供上述服务,是由于我们具备算力基础设施的技术背景,能够大幅优化这些工作负载。不久之后,我们建立了企业业务,与戴尔、摩根大通这样的大公司合作。 对他们来说,更重要的不仅仅是代码自动补全或者与代码库对话,而是能否提供一个安全的解决方案,同时针对公司内部所有私有数据进行个性化定制。我们利用我们的基础设施,投入大量资源确保我们能深入理解这些大公司的代码库。 这就是从Windsurf成立以来到大概半年前,我们所做的业务。目前,我们的这些业务并未终止,但我们已经意识VS Code等主流IDE限制了我们能为客户提供的AI服务的上限。因此,我们决定构建我们自己的IDE,加入一些新的Agent能力。 二、Transformer一统天下后,AI的差异化价值在应用 Lenny Rachitsky:你的回答中有很多有趣的线索。其中之一就是,AI的价值究竟会在哪个环节积累?很有趣的是,你们几乎是从最底层的GPU基础设施开始,然后转向了人们所说的“GPT套壳软件”(虽然实际上不是)。在这方面,你们公司有什么经验教训可供分享吗?你认为在AI世界中,在AI工具栈中,价值最终会在哪里? Varun Mohan:也许我可以先分享一下我对创业公司的一个深刻体会。通常情况下,你最初认定要做的事情很可能并不是最佳选择,这对创业公司的创始人来说是一个非常棘手的问题。 一方面,你需要有一种非理性的乐观,坚信自己正在做的事情具有独特的价值,否则你根本不会踏上这条创业之路。如果事情是显而易见的,那么大公司早就已经做了。 但另一方面,你又必须保持高度的现实主义,因为大多数非常规的想法往往是不可行的。所以,这就像是在走钢丝,你需要在这两者之间找到平衡。你要坚定地推动自己所相信的未来,但同时,当新的信息出现时,你又必须敢于否定自己原有的信念。 从基础设施的角度来说,我们最初的假设是模型架构会非常多样化和复杂,这主要是基于我们在自动驾驶汽车领域的经验。当时,存在许多不同类型的模型架构,比如卷积神经网络、图神经网络、循环神经网络、长短期记忆网络这样的轻量级神经网络,以及点推力网络等。我们可能需要处理十几种不同的架构。 在那个时候,我们觉得这种复杂性如此之高,如果有人能够帮助用户解决这种复杂性,那么这里面就会产生巨大的价值。 然而,到了2023年中期,情况发生了变化。看起来几乎所有的东西都将是基于Transformer架构的,这说明我们之前的假设是错误的。在这种情况下,我们意识到,大部分价值可能不会仅仅积累在基础设施层面,至少这是我们目前所相信的。 那么,真正的差异化价值究竟在哪里呢?我们相信,应用层是一个可以深度挖掘的领域。在这里,我们可以通过多种方式为开发者构建更好的用户体验和更高效的工作流程。我们坚信,在如何让开发者的生活变得更好的这一点上,是没有上限的。 Lenny Rachitsky:你提到的第二个点我觉得很有趣,就是你们是如何从已经在正常运转的商业模式中转型的。你们已经在赚钱了,人们都很喜欢你们的服务,有数百万美元的年度经常性收入。 你们是如何知道该追求什么新目标的呢?我听到的一个很有趣的观点是,一旦你建立想法的基础假设发生改变,就是时候重新思考这个想法,也许尝试其他东西了。 Varun Mohan:我认为,在创业过程中我们必须接受一个事实:我们会犯很多错误——这是不可避免的。对我们公司而言,有一个关键转折点:当时我们已经融资了2800万美元,却突然决定彻底转型,而且是一夜之间做出的决定。这不是渐进式的调整,因为我们深知创业公司最需要的是专注。 如果你同时做两块业务——一边做着你认为没有价值的工作,一边又想开拓新领域——你注定会在真正重要的事情上失败。这个道理看似简单,但关键在于:你必须从一开始就承认,你的大多数假设可能是错的。你要做的是全力验证这些假设,而不是固执己见。拥有一个好想法固然重要,但绝不能对它过度执着。 我们努力打造一个追求真理的企业文化。在公司里,每个人的想法都会不断被检验。比如当初开发Windsurf时,虽然不算彻底转型,但也是一个重大决策。创业就是不断下注:有时对,有时错。但最理想的状态是,即使决策失误,团队士气依然不受影响——这样你才有调整的余地。 有个例子可以说明我们的成长速度:今年一年的工程产出量,将超过公司成立至今的总和。这意味着每年都像一次新生,让我们能测试全新的假设。也许我们最初的假设本就是错的。 Lenny Rachitsky:这太令人振奋了,让我想起Ari Levine在播客上说的话,他的T恤上有一句话“爱上问题,而不是解决方案”。这感觉就是你所描述的态度。 三、开发者工作流转变,IDE同步升级 Lenny Rachitsky:让我们来谈谈Windsurf。对普通人来说,最简单的理解方式是什么? Varun Mohan:Windsurf本质上是一个IDE(集成开发环境)——也就是用来构建软件和应用程序的工具。但有趣的是,很多使用它的人可能根本不知道“IDE”这个概念,这点我们稍后再聊。 为什么要开发Windsurf?为什么不能直接用Visual Studio Code这类传统IDE呢?当我们观察到AI能力的爆发式增长时,我们意识到技术构建方式将发生根本性变革。 传统IDE就像个文本编辑器,开发者手动编写大量代码,而系统只能提供基础反馈,比如“这里有个bug”或“编译错误”。但AI时代完全不一样了——IDE应该能直接改写整段代码。这就是Windsurf的核心突破:它代表着开发工具与AI协作的全新范式。 未来,AI可能负责超过90%的软件开发工作,在这种情况下,开发者的角色和他们在IDE中做的事情可能是审查代码。我们需要在IDE中构建自定义的审查流程,使用户更容易去做这件事,因为开发者并非把所有时间都花在写代码上。 我们构建这个产品的基本前提是:过于基础的UI界面会严重限制产品的潜力。举个具体例子——我们的自动补全功能最初只能完成简单的代码补全。但当我们推出Windsurf Tab这个新产品时,情况发生了质的变化。 ▲Windsurf Tab功能 Windsurf Tab的创新之处在于能够提供内联式的代码重构建议。在Windsurf环境中,我们可以为此打造完全定制的交互界面。相比之下,在VS Code中由于API限制,我们不得不采用变通方案:需要在用户光标旁动态生成图像,因为平台无法支持更自然的展示和编辑方式。 ▲VS Code开发界面 这个差异带来的效果令人震惊:完全相同的机器学习模型给出的修改建议,在Windsurf环境中的用户接受率直接提升了3倍。这个数据给了我们重要启示:虽然底层技术确实至关重要,但如果用户无法有效获取技术创造的价值,那么技术优势就会被严重浪费。 这个案例让我们确信:有时候构建一个全新的交互界面和用户体验层(就像Windsurf所做的)可能才是释放技术潜能的正确方式。优秀的用户体验设计能够将技术优势转化为用户可感知的实际价值,这正是我们产品演进的关键方向。 四、自研模型与外部模型并行,拥有独特代码库演变数据 Lenny Rachitsky:Windsurf使用的模型是Claude Sonnet系列的吗? Varun Mohan:让我来解释一下Windsurf的工作机制。我们使用了一个非常强大的规划模型,比如Claude Sonnet系列模型,它在规划方面表现出色。GPT-4o也不错。我们会尝试让Anthropic的Claude Sonnet系列模型尽可能多地进行高级规划。 之后,我们会运行公司内部的模型,为Agent提供高质量的检索支持。Agent需要理解代码库的其余部分到底有什么功能,我们的自有模型会分解并理解整个代码库。 如果代码库有1亿行代码,我们不可能把它全部发送给Anthropic的模型。这不仅是因为它包含超过15亿个tokens,远远超出目前最大的上下文长度(超出三到四个数量级),而且从成本和延迟角度来说,这么做也不划算。 另一方面,我们的模型能够非常快速地对软件进行编辑。我们有一些基于流行开源模型进行后训练的定制模型,它们可以快速地对代码库进行编辑。我们选择这么做,是因为这样速度更快,而且这些模型能够在上下文中包含更多的代码库,从而比Anthropic的模型更好地应用更改。 我们的目标始终是构建最好的产品,尽可能提高上限。我们会根据需要构建和训练模型,但如果在某项任务上,开源模型或Anthropic的模型表现更好,我们就会直接使用它们。 Lenny Rachitsky:你们构建的模型,都是基于开源模型的吗? Varun Mohan:负责检索的模型是我们完全自主研发的。但很多负责其他功能的模型是基于开源模型的。负责编辑和自动补全的模型,这也是内部开发的。就像你在输入时,我们会做一些与自动补全相关的事情。 我想我们看待问题的方式是,我们能做到最好的部分,我们就去自行训练模型,但我们不会仅仅为了自尊心,而去做一些我们做不好的事情。 Lenny Rachitsky:有没有什么训练模型相关的趣事? Varun Mohan:一个有趣的事情是,我们从用户那里得到了大量反馈,每小时可能有数千万条。这些反馈包括用户对我们产品的喜好和不满,尤其是关于自动补全功能的偏好数据。这些数据很独特,因为它们来自用户输入时的代码片段,通常是不完整的,而不是像在GitHub上那样完整的代码版本。 我们拥有大量这种不完整的代码数据,这让我们在开发代码补全模型方面具备独到优势。现有的前沿模型很少接触这种类型的代码,所以我们利用这些偏好数据来训练模型,努力做得更好。 对于检索来说,情况也是一样的。我们可以通过用户是否接受检索后的代码更改来判断检索是否准确。这是一个很好的反馈信号。 我们的思路是,对于单纯的代码规划,AI很难提出一个连贯的论点,我们也没有特别的理由认为自己在这方面会做得最好。但如果是面对一个复杂的中间代码库,需要进行一些更改,我们就有优势了。因为我们看到了代码的演变,积累了数百万用户的代码演变数据,我们觉得自己可以在这方面做得很好。 Lenny Rachitsky:我觉得有趣的是,这是另一个差异化因素,也是公司在这个领域最终能够胜出的原因。如果你处于领先地位,你就会比其他公司拥有更多的数据。 Varun Mohan:是的,这也是我喜欢从零开始构建产品的原因。这是一个很有潜力的领域,但最终还是要看对代码的理解。否则,你就会陷入一个很模糊的境地,搞不清楚自己到底比别人强在哪里,公司也就很难找到明确的竞争优势和差异化的发展路径。 Lenny Rachitsky:如果只是简单地依赖像Claude这样的基础模型,和市面上那些只是给Claude套个壳的应用做同样的事情,那根本谈不上什么差异化。 Varun Mohan:这其实也取决于具体的做法。但如果只是处理一些很高级的网页元素,界面做到一定程度后,很难比现有的前沿模型做得更好。这种情况下,还不如直接接入这些现成的模型,直接拿来用。 五、AI编程解放工程师,回归工作本质 Lenny Rachitsky:你们当时做的一个大胆决定是,最初客户都在熟悉的现有IDE中工作,但后来发现这无法满足需求。于是你们决定说服大家切换到一个全新的东西,因为它会好得多。我觉得很多人可能没有意识到,说服工程师去使用一个全新的工具有多难。这确实是一个巨大的挑战。 Varun Mohan:是的,当然。Lenny,有一点很重要,很多开发者确实使用Visual Studio Code,但也有很多人用Java、C++等语言编程。他们可能用JetBrains家族的IDE,比如IntelliJ。 对我们来说,我们仍然会在这些平台上构建产品。我们只是觉得,Visual Studio Code虽然是一个主导性的IDE,但它限制了我们能给客户提供的用户界面。 Lenny Rachitsky:Windsurf目前的发展势头如何?我听到你们这个领域里其他竞争对手的数字都很惊人,你能分享一些数据,让大家了解一下吗? Varun Mohan:嗯,有几个数字可以分享。我们在4个月前推出了这个产品。在这段时间里,超过100万开发者试用了这个产品。当然,我们也有数十万的月活跃用户。 Lenny Rachitsky:你认为在未来几年的编程会是什么样子?会与今天有多大的不同? Varun Mohan:工程师主要做三个方面的工作,对吧?首先是“我应该解决什么问题?”,然后是“我应该如何解决它?”,最后就是“去解决它”。 每个在这个领域工作的人可能都越来越确信,所谓的“解决它”,其实就是“我知道该怎么做,然后就去做”。随着AI的发展,AI可能会处理绝大部分执行工作。 随着我们公司在理解代码库方面的工作日渐深入,这种“我应该如何解决”的问题也会逐渐清晰。如果你深入理解了组织内部的环境和代码库,并且考虑到最佳实践,那么“我应该如何解决它”就会变得更加明确。当公司也明确了这些问题后,整个解决方案也就水到渠成了。 所以我认为,工程开发最终会回归到最初希望工程师做的事情:我们需要解决哪些最重要的业务问题?我们的应用程序或产品需要具备哪些最重要的功能?去优先考虑这些,并做出正确的技术决策去实现它们。我认为这就是工程开发可能的发展方向。 六、计算机专业的价值,在于问题解决能力的培养 Lenny Rachitsky:这是否意味着没有人需要计算机科学学位呢? Varun Mohan:这个观点有些夸张了。现在很多构建全栈应用的开发者,至少在几年前,他们可能上过大学并学过操作系统课程。 理论上,他们并不是真的经常去深度使用操作系统,比如内核调度器之类的,但这些原理帮助更好地理解开发过程中遇到的问题,比如为什么他们的应用程序很慢?为什么某些设计决策比其他的设计更好? 这种对底层原理的理解,不仅使他们成为比其他工程师更好的工程师,而且也赋予了一群从未真正理解这些原理的人实际构建复杂系统的能力。这本身就是整个技术发展过程中一个值得注意的现象。 Lenny Rachitsky:我不知道你是否有孩子。假设你有孩子或者亲戚要上大学,你会建议他们学计算机科学吗? Varun Mohan:会的。我毕业于麻省理工学院,公司里工程团队的很多人都是校友。其实,我们在工程计算机科学中学得最多的并不完全是如何写代码,更多的是如何思考问题、如何分解问题的原则,以及如何用一种有趣的方式解决这些问题。 举个例子,我很喜欢的一门课是分布式系统课。这门课上要阅读文献,并理解一些设计决策是如何做出的。我认为这更像是一门解决问题的课程,这个专业也正是关于如何在当前计算机的约束条件下,解决具体问题。 比如这是内存运行的速度,这是你在1个周期或1秒内可以进行的运算数量。基于这些,你需要做出一些权衡并解决问题。在这种情况下,计算机科学几乎就是问题解决的代名词。 Lenny Rachitsky:我听到的是你仍然想要培养的技能,无论计算机科学专业如何演变,学生都需要构建关于计算机和系统如何工作的心智模型,了解并行处理、内存、硬盘、互联网之类的东西,然后就是解决问题的技能,能够解决有趣的问题。随着AI的兴起,你认为人们还应该投资哪些技能? Varun Mohan:我认为一个可能被低估的重要特质是主动性。在大学里,学生们往往被明确告知该做什么,沿着既定的路径前进。 然而,我认为在社会和学校中,我们可能没有足够重视那些真正具备主动性的人。这些人渴望去创造和建造,他们的目标不仅仅是从大学毕业,然后进入一家大科技公司,按照既定的指令去工作,比如在这个网站上把像素放在哪里。 我认为这种主动性在过去10年左右可能一直被低估。但如今,它正变得越来越重要。对于创业公司来说,这是一项至关重要的技能。显然,这也是我们正在寻找的特质。 我们希望找到那些真正具有高度主动性的人,因为我们深知,如果不去创新,不去尝试一些疯狂的事情,公司就会停滞不前,甚至死亡。所以,我们正在努力寻找这样的人才。 不过,我必须指出,对于大多数软件工程岗位来说,情况可能并非如此。只要看看某某大公司的招聘要求,以及一般的软件工程面试流程,你就会发现,这些场景中可能并不特别强调主动性。 七、遵循“精简公司”理念,团队超负荷才会招新 Lenny Rachitsky:让我们谈谈招聘,我知道你们公司试图保持精简,这是现在所有AI创业公司的共同主题,你如何知道什么时候该招聘某人? Varun Mohan:我喜欢精简公司的理念,但我不会把它神化。比如说,我们不会盲目追求成为那种凭借10%或20%规模,获得5000万、1亿、2亿这样的收入的企业——这不是我们在内部推崇的东西。我们真正推崇的是:成为能够实现我们野心所需的最小规模公司。这才是目标。 打个比方,Lenny,如果我告诉你:“嘿,我要造一辆自动驾驶汽车,而我的团队只有10个人。”你肯定会理所当然地说:“Varun,你不是认真的吧?”——你说得对,因为在那样的规模下,我确实不可能是认真的。所以关键在于:要实现你那个疯狂的雄心壮志,最少需要多少人? 我们正在尝试的项目,是要彻底改变软件的构建方式——我们在内部经常提到这一点。我们的目标是将开发应用程序所需的时间减少99%。这非常雄心勃勃,长远来看,我们不可能仅靠10%、20%、30%或40%规模的工程团队来实现它。我们认为这里的上限非常高,这是第一个关键点。 如果能成为一家规模很大、却依然像创业公司一样运作的企业,那才是真正的理想状态。这就是梦想。 在招聘理念上,我们的原则是:只有当某个职能确实超出我们的应对能力时,才会招人。比如我们正在开发推理技术——除非团队已经超负荷,否则我们不会轻易增加人手。原因很简单:如果你为一个职位招人,但并不真的需要他们,最终往往会产生一些奇怪的职场政治问题。 这并不是因为人们不好——大多数人的初衷都是好的。但当你招了并不真正需要的人时,会发生什么?他们会自己找点事情做,对吧?这是人之常情。他们会去说服组织:“这件事很重要。”但事实上,它可能并没那么关键。作为创业公司,我们根本没有精力应付这些。 对我来说,理想的状态是,每个人都像在举手求救,仿佛在说:“我真的撑不住了,我们真的需要多一个人。”这时候我们才会招人。我喜欢用一个比喻:我希望公司像一个脱水的实体,每次招聘就像补充一点水分——只有当我们再次脱水时,才会去招人。 八、公司凭借单点突破取胜,奖励用最少资源完成项目的员工 Lenny Rachitsky:我非常喜欢这个比喻。听起来很痛苦,你需要等到应付不过来,然后告诉老板,我快要“脱水而死”了,但我也知道这是一种非常令人兴奋的工作方式。 Varun Mohan:这种模式其实有很多优点。我们非常尊重和信任在公司工作的人,这反过来又迫使我们进行优先级排序。 团队永远不会要求去做不重要的事情。事实上,如果他们手上有两件事情,他们会告诉我:“嘿,我手上有两件事。我没办法同时做两件,我只能做一件。”然后他们会优先选择最重要的那件事。 这其实回到了一个我认为对创业公司和传统公司都适用的原则:你不是通过把10件事情都做得还行来获胜的,而是通过把一件事做得非常好来获胜。也许你在其他9件事情上会失败,但这并不重要。这是我经常告诉团队的事情。 这和学校很不一样。在学校里,你的目标是优化总GPA分数,但对公司来说,我只需要在最重要的那件事上拿到A+,其他事情上拿F都没关系。当然,这里的F并不是指做错事,而是说降低那些不重要事情的优先级。这种模式实际上迫使组织进行优先级排序,这真的非常好。 而且,Douglas(Windsurf联合创始人)和我,我们可以明确地告诉团队,这是目前最重要的两件事。但如果我们在说这两件事是最重要的同时,又让团队的工作量增加了20%,那最终会发生什么呢? 这几乎是一个强制机制,迫使我们进行优先级排序,确保公司内部的人员不会被过多的任务压垮,或者避免那些已经应接不暇的人被逼到极限。 Lenny Rachitsky:每个在大公司工作的听众肯定都能理解你说的情况。当公司人太多的时候,每个人都得找事情做,他们也会提出各种想法。你知道,他们都想展示自己的影响力,想在绩效评估中表现得更好。这就是大公司人多的典型现象。 当你们公司有人实在应付不过来的时候,他们是怎么向你表达招人的需求的? Varun Mohan:当面临在短时间内完成某件事情的压力时,我们有一个核心信念:对于软件开发来说,如果想做出真正伟大的成果,就不能简单地说“我想在一个月内完成”。 除非你认为自己比其他人聪明得多,否则按照这个时间尺度,根本打造不出拥有高复杂性和差异化的产品。 我们确实拥有一个非常优秀的工程团队,但我们也不认为我们的团队优秀到可以在三周内完成其他人需要6到9个月才能完成的事情。相信自己能做到这一点其实是有点愚蠢的。 我们的招聘流程有着极低的录取率,不太可能很快地找到合适的人才并让他们加入公司。这点所有人都很清楚,无论是那些想要更多人手的人,还是对我们自己。 我们还努力确保在工程团队中,一个人对公司创造的价值与他所在的团队规模无关。公司内部有一些项目是由直接负责的个人来推动的。如果一个项目很重要,那么人们可以从一个项目转移到下一个项目。 公司里不存在“某人拥有某个团队”的概念。公司最有价值的人是那些能够用尽可能少的人完成最疯狂项目的人,这才是我们应该在内部奖励的。 Lenny Rachitsky:目前Codeium有多少人? Varun Mohan:我们有接近160人,工程团队超过50人,市场营销团队规模也不小。 九、招聘实际录取率低于0.6%,工作强度极高 Lenny Rachitsky:我们谈到了如何判断什么时候该招聘,那你在面试和招聘的人身上寻找什么特质呢? Varun Mohan:我们在招聘时非常注重的一个关键点是,我们有很高的技术门槛。假设候选人确实达到了技术要求,我们真正寻找的是那些对我们实际要解决的使命充满热情,并且愿意努力工作的人。 我们不会试图说服人们:“我们是一家很轻松的公司,在这里工作很棒。”相反,我们会坦诚地说:“这是一个非常令人兴奋的领域,但竞争也非常激烈。如果公司的人不够努力,我们可能就会失败。” 我认为我听到的最大的警告信号之一是,当我问候选人:“你愿意多努力工作?”有些人最终会回答:“我更喜欢用巧劲(work smart),而不是单纯靠努力。” 这时,我通常会问他们一个问题:“如果我们的公司有很多聪明且努力工作的人,你的差异化在哪里?”这种候选人只会拖累团队。 公司就像一个巨大的团队项目。当公司有数百名工程师时,问题不在于那个不尽责的工程师本身,而在于他们所在的团队。团队会有疑问:“这就是公司内部的标准吗?这是我们的期望吗?” 如果告诉你,团队里其他四人都不在乎这个项目,你会觉得自己该有多在乎呢?肯定不会太多。 对我们来说,更重要的是打造协作文化,工作不是单打独斗,人们知道可以依靠其他人来完成复杂的任务。 Lenny Rachitsky:你问的问题本质就是:“你愿意多努力工作?”有许多人会追求工作与生活的平衡,他们会想:“你怎么敢要求我工作那么长时间?” 我很喜欢你们一开始就说明白:如果你在这里工作,就得非常努力,加班加点。这是一个竞争激烈的领域,我们靠聪明工作和努力拼搏来取胜。你之前提到过,你们工程师的录取率大概是候选人的0.6%? Varun Mohan:0.6%可能是完成面试题之后最终留下来的比例。面试题本身就筛选掉了可能10到15倍的人。 Lenny Rachitsky:我最近经常听到这样的问题——随着像Windsurf这样可以解决许多问题的工具出现,你们到底要如何进行面试工作? Varun Mohan:我们允许候选人使用AI工具,因为我们相信这些工具能大幅提升生产力。如果有人加入我们却不习惯使用这些工具,那会是个问题。 我们也会邀请候选人到公司现场,观察他们如何在白板上思考问题,以及他们的临场发挥能力。我们希望看到的,不是他们简单地把问题输入语音转换器,然后扔给ChatGPT来获取答案。我们有办法甄别这一点。 我的观点是,工具固然重要,但我们更看重的是解决问题的能力。如果一个人解决难题的唯一方式就是依赖ChatGPT,那对我们来说可能就不太合适了。 十、市场营销并不可耻,是ToB业务刚需 Lenny Rachitsky:好的,接下来谈谈你们的市场营销经验。和大多数人一样,你们一开始时没有销售团队,但你们意识到这是一个巨大的失误,也意味着机会。现在你们的销售团队和市场营销团队规模很大。 Varun Mohan:是的,我们在公司历史的早期就做出了这个决定。一年多前,我们聘请了一位销售副总裁,现在公司内部的市场营销团队已经超过80人(目前公司有近160人)。这在公司内部是一个相当大的职能部门。 这里有一点背景故事——当我们创立公司时,我们有几位天使投资人是市场营销从业者。其中一位是Carlos Delatorre,他曾是数据库公司MongoDB的首席营收官(Chief Revenue Officer)。 我们从来没有把销售看作是一件负面的事情。我认为销售其实很有趣。不过,有些创始人并不喜欢销售,他们觉得销售是业务流程中比较负面的部分,认为一切都应该靠产品自身来推动增长。 事情并不是非黑即白的,企业销售其实很有价值。不过,也许是因为我们当时是一家GPU虚拟化公司和基础设施公司,我并不知道如何扩大销售职能,所以没有雇用销售人员。当时,我就是那个负责销售产品的人。 说到底,如果我连逐步销售产品都做不好,那我就不知道我们如何能把销售变成一个可扩展的流程。如果我自己都做不到,又怎么能让别人来扩大规模呢? 另一方面,对于Codeium来说,有很多大企业主动找上门来。到了2023年中期,我们开始行动起来,我和公司其他几位同事一起开始着手销售产品。我们同时和大企业开展了数十个试点项目。通过这些项目,我们很快意识到,在这个领域,我们需要建立一个面向大型企业的运营模式。 到了2023年底,我们果断聘请了一位销售副总裁,随后很快就把销售团队扩大了。试想一下,如果你想把产品卖给财富500强企业,仅仅靠刷信用卡肯定是行不通的。 十一、产品可理解超大规模代码库,是重要差异化优势 Lenny Rachitsky:让我们谈谈Cursor。我不想在竞争对手身上花太多时间,但这是每个人在想到你们时总是会想到的。我认为你们在这个领域算是领先的玩家。你们与Cursor的不同之处是什么,以及你们认为如何能在这个领域长期领先? ▲Cursor开发界面 Varun Mohan:我可以分享几点。在产品方面,我们投入了大量精力,以确保对超大规模代码库的理解能达到非常高的质量水平。这其实也是我们最初的起点。 我们与世界上一些最大的公司合作,比如戴尔和摩根大通。像戴尔这样的公司,单个代码库就超过了1亿行代码。能够快速理解这些代码库并进行大规模修改,是我们花费了很多时间去攻克的难题。 为此,我们建立了一套自己的模型,能够在数千个GPU上并行处理这些庞大的代码库,并对它们进行排序,以便找出对任何代码库问题来说最重要的代码片段。基于我们的基础设施背景,我们搭建了大型分布式系统来完成这项工作。这可能是一点。 Lenny Rachitsky:我想补充一些,我认为人们可能会低估这点有多重要。之前我们播客也采访了Bolt和Lovable(均为AI编程创企)的创始人。这些公司的产品是为了从头开始构建产品,为你写代码。 相比之下,Windsurf可以加载数千万乃至上亿行代码,比如Airbnb或Uber所拥有的代码库,理解企业有什么代码、这些代码如何工作,哪些地方可以修改而不会出故障,这是非常困难的。这是一个很大的差异化因素,Windsurf现在正在这个优势上继续发展。 Varun Mohan:是的,没错。我们花了很多时间在理解代码库。另一件方面是要理解所有与代码库相关的用户交互。我们的服务不仅仅局限于Windsurf,也非常专注于支持像JetBrains这样的IDE。 70%到80%的Java开发者在基于JetBrains的IDE中编码,我们不需要去构建一个与JetBrains竞争的产品,JetBrains是一个非常可扩展的产品,而VS Code则不是。 对我们来说,我们的目标不仅仅是满足可以切换到我们IDE的用户子集,而是我们想给每个开发者这种Agent开发体验。如果这意味着有Java开发者在JetBrains中写代码,那也没问题。 Lenny Rachitsky:有趣。所以你是说JetBrains是一个非常大且可扩展的产品,你们不觉得有必要直接与它竞争。相反,你们想要增强开发者的体验,不管他们使用什么IDE。 Varun Mohan:没错。我们与许多拥有超过1万名开发人员的大企业合作,其中超过50%的开发人员使用JetBrains。JetBrains是一个非常庞大的产品。 JetBrains公司本身是一家私营企业,每年能创造数亿美元的收入。这是一家非常非常大的公司。对我们来说,这正是另一个关键点。我们希望在开发人员所在的地方与他们相遇,无论他们使用什么平台,我们都会提供支持。 我们在安全性方面也有优势,这对许多企业而言很重要。Windsurf获得了FedRAMP认证,这意味着我们可以向大型政府机构销售产品。 Windsurf还配备混合使用模式,这意味着所有存储在用户端的代码都保留在用户的管辖范围里,而代码是公司最重要的知识产权之一。从大公司的角度来看,我们具备处理复杂问题的经验。 十二、如何用好Windsurf?需求明确与耐心是关键 Lenny Rachitsky:好的,Varun,我们别再卖关子了。来做个Windsurf的现场演示,让大家看看它是什么样的。我会在演示过程中问你一些问题。 Varun Mohan:好的。先说一下背景:这是一个非常基础的React项目。现在里面什么都没有。如果你打开任何文件,它就是一个默认的React应用项目。 你可以给Windsurf发送一张图片,告诉它你希望项目看起来是什么样的。我这张草图画的就是一个“狗狗版Airbnb”网站。 Windsurf的优势之一就是可以在既有的项目上进行开发。我们要做的就是告诉它:“把这个React应用改造成一个基于这张图片的狗狗版Airbnb网站,并进行预览。” 它会开始执行代码,读取代码库。它不知道当前代码库的实际样子,所以它会去分析代码库,找出需要进行的更改。我们可以先等一等,看看它会怎么做。不过,我们也可以边等边继续聊天。 Lenny Rachitsky:我想问你一个问题,如果你能坐在每个第一次打开Windsurf的用户身边,在他们耳边悄悄说几句话,帮助他们更好地使用你的产品,你会说些什么? Varun Mohan:第一条建议就是要有耐心,既要耐心又要明确需求。当你要求应用程序去做一些更改时,它可能会做出许多不相关的更改。而我认为最能避免这种情况的就是尽可能明确你的需求。 我建议人们一开始先从小的更改开始。如果有一个很大的目录,不要一开始就重构整个目录,因为如果错了,它可能会破坏20个文件。用户会逐渐了解产品的优点和局限,并懂得怎么从中获取价值。不过,每3个月左右,产品能力就会需要重新评估。 Lenny Rachitsky:隐含的意思是,要对模型的能力有一个直观上的感觉——明白自己的需求该具体到什么程度,又可以抽象到什么程度。随着时间的推移,你会逐渐建立起这种感觉。 十三、AI深度理解用户行为,可准确预测用户意图 Varun Mohan:我们现在已经有了网页预览,不仅可以修改代码,还能指向不同的部分,进行针对性修改。比如让直接选中一个元素,让Windsurf将其背景改为红色。产品能够实时展示应用的构建过程,这一点很有帮助。 你可以完全在应用层里操作,甚至不需要查看代码。当然,这个修改看起来很糟糕,但从某种意义上说,如果我想这么做,我就可以去操作。 我们只有很多交互方式,不仅仅是通过点击来更改组件。就像我之前说的,AI的目标现在已经发生了很大变化,它现在可以为你修改大量的代码,而开发者的任务现在变成了审查AI生成的代码。 在这次播客中,我不会审查所有生成的代码,但假设我想修改其中一些代码。比如我想把变量从“title”改成“titleStr”,我只要手动修改一个,然后告诉AI继续执行。 Windsurf不仅知道Agent做了什么,它还知道用户做了什么。我们的目标是让用户所做的每一件事,AI也都知道,并且能够预测意图。因为它对代码库有深入的理解,它应该能够找到所有需要更改的地方。 它能够在应用空间操作,还能在用户的代码空间中进行操作,弥合两者之间的差距。它不仅为非技术人员构建应用提供了便利,也为亲自编写代码的开发人员提供了便利。 有趣的是,上方案例中的模板应用也是由Windsurf生成的。我们的大多数用户都是在0到1构建应用。 当我们推出Windsurf时,我们让公司里的每个人都用它构建一个应用,包括市场团队和销售团队。有一个令人惊讶的统计数据:我们节省了超过50万美元的SaaS产品费用,因为我们现在的市场团队已经用Windsurf构建了应用,而不是购买它们。 例如,我们的合作伙伴关系负责人没有购买合作伙伴门户产品,而是自己开发了一个。他以前从未开发过软件,但我们设法在公司内部安全地部署了这些应用,为我们公司开发高度定制化的软件,以更高效地运营。半年前我完全没有预料到这点。 十四、垂直领域软件将遭受AI猛烈冲击,本地开发模式不会消失 Lenny Rachitsky:你不需要说出具体的公司名字,但我想知道,有越来越多的开发者和公司自行打造产品,对SaaS企业来说,哪些领域你们最不看好? Varun Mohan:我的观点是,那些非常垂直化的细分产品将会面临巨大的竞争。以销售产品为例,在我们这样的公司内部,很难让顶尖工程师去构建一个世界级的销售产品。他们对这类任务没有足够的兴趣,或者去构建投资级的法律或金融软件产品对我们来说也非常困难。 这些SaaS企业的护城河在于,他们对打造这些软件有自己的想法,并且有足够的工程师去实现软件开发。而我们公司不愿意做这件事,所以以前我们总是出去购买软件,因为没有其他选择。 但现在有一个令人兴奋的变化:领域专家可以构建他们最终想要的工具。这些垂直领域的软件公司为什么能够存在呢,原因在于它们有很多功能。这种“大杂烩”的功能对很多公司来说都适用,但每个单独的公司可能只需要其中的10%的功能。 但问题是,每个单独的公司都没有能力维护或构建针对这10%功能的定制软件。但现在这一切都改变了,他们现在可以做到了。现在可能只需要5分钟,甚至可以更贴合你的系统。 Lenny Rachitsky:现在,业务人员不需要知道任何关于产品构建的知识。只要用一种很糟糕的方式描述一下,就像是一个糟糕的产品经理在向工程师提需求。但令人惊讶的是,AI真的能做出不错的产品。 Varun Mohan:完全正确。这表明能动性是很重要的。如果产品经理有一个想法,就没有理由不让这个想法更完善。其实有许多产品经理总是有想法,但他们对如何执行这些想法非常不确定。现在,那些有想法、有能动性的人,可以自己去证明他们想要的东西,而不需要任何外部资源。 Lenny Rachitsky:我想谈一个很重要的点。你提到Windsurf不需要从样板代码库开始,它不是一个抽象化的应用构建器,而是一个实际的IDE。它在本地机器上运行,而不是云端。这很重要,因为它允许用户在本地运行并使用所有必要的库。 Varun Mohan:是的,这很重要。很多开发者喜欢在本地构建,因为有些依赖项很难在云端安装,比如Nvidia的驱动程序。我们希望为用户提供在任何环境下都能高效构建的灵活性。本地IDE和开发方式已经存在了几十年,短期内不会消失。 十五、每隔半年到1年颠覆产品状态,永远都需要更多工程师 Lenny Rachitsky:你们的团队结构和运营方式很有意思。处于产品团队运作的前沿,每天都在探索未来,你们的团队结构、工程师、产品、设计等方面有什么独特之处吗? Varun Mohan:我们的核心工程团队没有传统的产品经理。因为我们为开发者构建产品,从某种意义上来说,我们的开发者更像传统的产品经理。如果我们的产品没有价值,那可能就是我们招错了人。 在企业端,我们需要与很多大型企业合作,这些需求不是工程师能直接理解的。比如,客户可能会要求FedRAMP合规性,这需要专门的产品战略人员来理解客户需求并结合我们的技术能力,以构建一个能够帮助客户大规模扩展的产品。 不过,大部分情况下,我们是一个以开发者为基础的产品。 Lenny Rachitsky:你们的工程团队结构是怎样的? Varun Mohan:我们的团队结构很扁平,尽量采用“两个披萨团队”的模式(亚马逊贝佐斯认为,如果两个披萨还不足以喂饱一个团队,那这个团队规模就太大了),保持小规模。 团队规模太大时,领导者很难深入了解技术细节,而在这个快速变化的领域,纸上谈兵是很危险的。我们的团队非常灵活,能够快速调整优先事项。 Lenny Rachitsky:你们有多少产品经理? Varun Mohan:我们有近160名员工,其中3人负责产品战略的工作。我们还有招聘、财务、营销等内部职能。 Lenny Rachitsky:你们还在招聘工程师,尽管有人说AI将编写90%的代码。这是否矛盾?会不会有一天你们不再需要这么多工程师? Varun Mohan:这取决于增加工程师是否能带来额外价值。AI编写了大部分代码,但这并不意味着工程师生产力提高了10倍。工程师的工作不仅仅是写代码,还包括审查、测试、调试、设计和部署。 即使AI提高了部分效率,但考虑到技术需求的复杂性,我们可能永远都需要更多工程师。 Lenny Rachitsky:对于像摩根大通这样的大公司,每年有170亿美元的软件预算和超过5万名工程师,你们的产品能帮助他们提高效率。 Varun Mohan:摩根大通这样的公司意识到,技术开发的回报率提高了,不投资更多技术的机会成本也增加了。这意味着他们需要招聘更多工程师,而不是减少。 Lenny Rachitsky:这是对工程师职业的一个有利信号。如果像你们这样的公司开始减少工程师招聘,那可能是行业的危险信号。 Varun Mohan:是的,目前大家都在积极招聘工程师。我认为进入工程领域仍然是一个很好的选择。 Lenny Rachitsky:在构建AI产品和Windsurf的过程中,你学到的最反直觉的事情是什么? Varun Mohan:一个奇怪的现象是,大家都在关注短期内的胜利,比如每周的更新。但我们公司内部更关注长期目标,比如3到9个月后的事情。我们的目标是每隔半年到1年就颠覆现有产品的状态。这种长期投入才是我们成功的关键。 Lenny Rachitsky:这让我想起Captions公司说他们有两份路线图:一份基于用户反馈和数据,另一份是基于对未来的押注。这是很明智的。在创立Codeium之前,有没有一件事,是你希望你能提前知道的? Varun Mohan:我希望我能更谦逊,更快地接受自己可能是错的这一事实。很多时候,我们事后发现,如果早几个月做出某个决定就好了。 虽然外部看来这些决定很及时,但内心总希望更早行动。我们需要更频繁地重新评估假设,即使这让人不舒服。 Lenny Rachitsky:在结束之前,你还有什么想和听众分享的吗? Varun Mohan:认为最好的办法是亲自去尝试这些工具。在未来一年里,能够充分利用这些工具的人将获得巨大优势。很多人甚至不知道这些工具的存在,他们将会非常低效。所以,尽快去尝试,看看这些工具如何帮助你和你的团队。 用它来构建应用,修改现有的代码库。如果你是一个产品经理,能够快速修改代码并推送更改,你会赢得工程师同事的尊重,也能完成更多工作。这个工具的潜力是无限的。 Lenny Rachitsky:这一点被低估了。Windsurf不仅可以构建新应用,还可以修改现有的代码库。比如在摩根大通这样的大公司,你可以直接用它来完成任务,然后推送到GitHub并发起拉取请求。 Varun Mohan:是的,现在一切都开放了,工作不再受限于角色。这是一个机会,让公司的基层到高层都能发挥作用,更高效地工作。
联合国开发署:AI成全球发展新曙光,中国领跑AI赛道
IT之家5月6日消息,联合国开发计划署今天(5月6日)发布《2025年人类发展报告 —— 抉择时刻:人工智能时代的人类与可能性》报告,指出人类发展进程正经历前所未有的放缓,而人工智能有望为发展注入新动能。 IT之家注:该报告综合健康、教育和收入水平等维度,用“人类发展指数”来评估全球发展进程。数据显示,2024年全球所有地区的人类发展指数增长均陷入停滞。 报告包含的一项最新调查显示,民众对人工智能带来的变革既保持理性认知,又怀有积极期待。 全球半数受访者认为自己的工作可能被自动化取代。而更大比例(十分之六)预期人工智能将为就业带来积极影响,创造当今尚未出现的新职业机会。 仅有13%的受访者担忧人工智能会导致失业。相比之下,在中低人类发展水平国家,70%的民众预计人工智能将提升工作效率,三分之二的人计划在未来一年内将人工智能手段应用于教育、医疗或工作领域。 报告指出中国在研究、机器人技术和数据生态系统领域占据核心地位,肯定了中国在人工智能研究领域所处的全球领先地位,尤其在机器人技术和计算机视觉方向表现卓越。 中国在留住顶级人工智能人才方面取得重大突破 ——2023年有47%的海外培养中国人工智能人才选择回国发展,较2019年29%的比例实现大幅提升。 与美国侧重自然语言处理和人工智能安全不同,中国的人工智能发展更加注重工业应用(如机器人技术),形成差异化发展路径。 开发署署长施泰纳表示: 过去数十年来,世界本有望在2030年前实现极高人类发展水平,但当前的发展减速对全球进步构成了真实威胁。 在人工智能快速渗透人类生活各个方面的当下,我们应该重视其促进发展的潜力。几乎每天都有新能力涌现,虽然人工智能并非万能灵药,但我们所做的选择将可能重燃人类发展之火,开辟新的道路与可能。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。