行业分类:
加载中...
头条分类:
加载中...
爱奇艺副总裁兼文学事业部总经理岳建雄离职
三言科技4月8日消息,今日,爱奇艺副总裁兼文学事业部总经理岳建雄宣布离职。他在朋友圈发文称,因个人能力无法带领文学业务有更好的发展,现在起将离开爱奇艺。 他表示自己在爱奇艺的五年多,爱奇艺各项业绩表现都得到历史性大幅度增长,内容品质与品牌影响力不断提升,轻舟已过万重山。虽然公司驶上了快车道,自己中途下车,但自己还是永远对爱奇艺这个平台感恩与祝福。 至于未来规划,岳建雄认为国内很难再有做平台的机会,过去积累的经验或许很快会过时。目前是AIGC新浪潮,无论最终选择做什么,“只要热爱我就奔赴”。 以下是全文: Last day,由于个人能力无法带领文学业务有更好的发展,现在起我将离开爱奇艺。 回望这五年多的时光,我见证了爱奇艺上市后的飞速发展、复苏后的高质量增长,也经历了自已职业上的欣喜、焦虑、转型与挫折,还有人到中年后的感悟与成长。就像公司不久前发布的2023年度财报:会员、营收、利润和现金流都得到历史性大幅的增长,内容品质与品牌影响力不断的提升,轻舟已过万重山。是的,爱奇艺已经驶上了快车道,我却在中途下了车,虽然人生的道路方向各自不同,但我将永远留下对这个平台的感恩与祝福。 感谢时代,庆幸在青春年华里遇上中国互联网黄金二十年。只要你身在其中,无论出身、学历还是胖瘦美丑,都有机会获得时代带给我们的红利。那是一个英雄辈出的年代,你有机会在街头拐角的小咖啡屋与未来首富当面畅谈或者给你一个offer带你一起飞。如果你有激情与想法,或许有机会在某次向投资大佬唾沫横飞的演说后拿到一笔钱,让你去创业实现梦想。即使你中间错过一趟车,总有下一趟车把你载走。我爱折腾一路从厦门到广州,又从广州到北京,从搜狐到创业E陪诊,又创业失败后到了凤凰网,再从凤凰网来到了爱奇艺,一路颠簸流离,乐在其中。 感谢TIM,低调谦和、真诚包容、鼓励创新,不动声色的善良,给我一次又一次的机会与耐心,给我从产品到内容转型的机会。业务方面我先后折腾过爱奇艺极速版、爱奇艺号、晃呗(360度横转竖短视频)、爱奇艺文学、AIGC小说转短剧,让我有机会从产品与内容不同的视角理解影视行业与平台各个业务线的策略,也让我有机会认识了中国最优秀的作家、编剧、导演、演员、制片人。转型做内容后,探索了东北新文学,有了像《妈妈的南方宾馆》、《死水奔腾》、《杜鹃鸟》这样气质独特的作品;尝试了新武侠,也有了《一去兮》、《云起时》、《无归者的复仇》这样类型融合的新武侠小说;偶尔也有《重生怪兽什么鬼》动漫向IP作品,实现了IP原创“零的突破”,抛弃了“人傻钱多”的“大IP”迷信,然而离再造一个“晋江”的目标仍非常遥远。 感谢杨工,把我介绍到爱奇艺,在工作与业务上默默的支持我,教导我如何去看业务的本质,客观不偏激的看待问题,让我更加深入了解数据与业务的关系,行知合一,用结果说话。 感谢文峰,真诚温润,三言两语直指问题本质,我从IIG转岗PGC后还让我留在IIGStaff群里,那是一个能开玩笑讲八卦与真话的地方。在您润物无声的支持下,我负责的老极速版也经历过10个月从200多万增长到近1400万短暂高光,又在随刻业务遇到挑战与困难时给予的理解与担当。 感谢晖台,在PCG我有幸见证了您的智慧与远见。了解了长视频平台资金并非行业竞争的唯一壁垒,背后更重要的是持续的人才积累、行业资源的把控、科学的内容评审与管理机制,以及商业智能系统的建立。您那激扬的文字与演讲、人文怀情、唯一比第一重要,与时代共情的对话,审美抬高一寸,思想向前一步的艺术要求。这些深刻的洞察让我明白爱奇艺剧集为何独树一帜,正是这些看似不起眼,实则至关重要的因素。 感谢作家们,王阿城、白絮、丁甲、夜来、白饭、青山、李师江、张翼、天爱、李斯坦。。。,感谢您对我们编辑与平台的信任,把作品交给我们,无论最后是否有机会改编成影视,您在作品上绽放的才华必将被这个时代铭记。感谢公司的各个工作室与片方的制作人们,佩服您有自已独特的眼光,敢于创新创作,敢于给新作者机会,让爱奇艺文学的绿树散出了枝丫,结出了一些果实。 要感谢的人太多,特别是与我先后共事过的小伙伴们,我就不一一感谢。很幸运在这里与一批中国当代影视与IT行业最有才华的人成为同事。我会记得,周例会上Tim说XX你今天不用介绍,你有《赘婿》,你有《青春有你》、你有《人世间》、你有《狂飙》、你有《苍兰决》,你有《莲花楼》。。。,桃李不言,下自成蹊,好的作品胜过最华丽的PPT。 也想过悄悄的离开,默默的祝福。知道离开爱奇艺,平台赋予我的光芒与尊重也会随之消失。不知道走前远方的道路会是什么样的泥泞。最后决定离开前还是用文字与一直关心与支持我的朋友、同事、合作伙伴打声招呼。这段经历虽然并不辉煌,人生的历程不是收获了什么,而是与您的萍水相逢、擦肩而过或寒喧或拥抱或告别。 时代的洪流汹涌澎湃,无情凶猛地拍打在每一个人身上。国内很难再有做平台产品的机会了,过去积累的经验能力也许很快就过时。迎来的是内容创作者最好的时代,近几年见识过互联网行业上最赚钱的一批人都是内容的创作者:短视频平台头部主播、UP主,长视频平台头部演员、导演、编剧、作家,短剧的头部制作方、投流方等。 一代人终将老去,但总有人正年轻。这不又迎来了AIGC新浪潮,智能电车、短剧、移动医疗、出海。。。,乱花渐欲迷人眼。无论最终选择做什么,只要热爱我就奔赴。 就此告别吧,山水一程,感恩相遇,不念过往,不畏将来,后会有期。
Redmi王腾,能否成为下一个卢伟冰?
作者|叶二 编辑|魏晓 再有两天,就是Redmi Turbo 3的发布会了。 作为Redmi刚刚官宣的全新系列首发产品,Redmi Turbo 3 承担着打响头炮的重任,同时对于王腾来说,他将以Redmi 品牌总经理的身份,替代卢伟冰成为Redmi发布会的主讲人。 今年2月3日,雷军在微博宣布,集团总裁卢伟冰将兼任小米品牌总经理。与此同时,卢伟冰也将成为后续小米手机发布会的主讲人。Redmi这边,则是由王腾接下卢伟冰身上原有的Redmi品牌总经理一职。 而此次Redmi Turbo 3的发布会,主角正是王腾,他将以主讲人的身份,主导这场重头戏。 变的是人事,不变的是Redmi之于小米的权重。 市场共识,Redmi正是小米手机销量的重要支柱,很长时间以来都承担着小米手机走量的重任。 卢伟冰在去年11月曾对外公布,过去十年(2013-2023),Redmi手机的全球销量突破了10亿台。 AI蓝媒汇综合公开数据了解到,小米自2011年发布手机以来,到2023年年底,一共销量了11.76亿。简单计算下,Redmi在小米销量的占比高达85%。 可谓是最大的销量功臣。 现如今,在小米开辟汽车这一全新领域,以及小米手机品牌持续站稳高端市场的背景下,Redmi能否守住原有的中低端市场,甚至也能讲出新故事,就变得尤为重要。 而这,也正是王腾的挑战。 五年前,卢伟冰入主Redmi,完美执行了小米的双品牌路线,给雷军夯实了这条大粗腿。 现在,则轮到了王腾,就看他能否复制卢伟冰的成功了。 或者说,“小旋风”能否再现“小金刚”的爆款神话了。 要知道,卢伟冰入主Redmi时,是从“小金刚”Redmi Note 7开始的。卢伟冰说,小金刚的诞生,全面拉升了入门机的品质基线,也开启了Redmi的品质革命。至今,Redmi Note系列手机的全球销量也突破了3.55亿台。 俨然大获成功。 而王腾,则为Redmi带来了“小旋风”——Redmi Turbo 3。 据介绍,此次Redmi Turbo 3将搭第三代骁龙8s,是全新骁龙8s旗舰芯首次落地中端的产品,并且是“超越想象的旗舰性能、AI 超强实力,前所未见的高颜值、好手感、超强品质,更有耐用抗摔、长续航全面兼得。” 同时,对于Redmi来说,Redmi Turbo 3还是全新Turbo 系列的首发当头炮。 此前,Redmi官宣了新十年产品定位,重新梳理了产品线。 其中最大的变化,正是推出了全新的Turbo 系列,不再作为原有的Note系列的后缀,而是独立出来,定位中高端性能,要打造新生代性能旗舰,重塑中端性能格局。 按照王腾的说法,“整个中端,产品百花齐放,但性能做得特别好的很少,我们把Turbo这个系列独立出来,就是希望在中端这个档位开展旗舰性能普及旋风。” 押注性能,这也正是王腾为Redmi讲出来的新故事。 虽说发布会还未开场,但已然造势充分。 小米这边,卢伟冰过来“指导工作”,在4月1日给王腾送了一副象征Redmi战斗精神的“拳套”,寓意Redmi“敢K·O,不服就干”。雷军也来亲自打气,Redmi Turbo 3 首销成功的话,给Redmi团队送台小米SU7。这两大手机圈流量亲自为Redmi Turbo 3保驾护航。 王腾自己也没闲着,一边发微博,去抖音直播等,在社交媒体场合为Redmi Turbo 3宣传造势,一边还要与友商隔空互怼,身体力行地将“不服就干”贯彻下去。 是的,Redmi Turbo 3产品不仅必须得赢,对于王腾来说,口水战更不能输。 以前机圈口水战中,Redmi冲在最前的是卢伟冰,很少有败绩。现在呢这一重担,同样交到了王腾手中,而对手则主要是一加的李杰。 由于产品主打性能,Redmi Turbo 3与一加此前刚刚发布的一加Ace 3V是直接竞对,这几天,王腾与李杰这两人没少互相暗怼。 比如Redmi Turbo 3发布首批性能评测时,一些游戏数据表现上略逊竞品一加Ace 3V,王腾就说,“个别友商耍小聪明,测试过程偷偷降亮度或画质”。 李杰则回应,“有个5000mAh的产品,号称续航比Ace 3V就差一些,那当然,游戏性能调度那么怂,如果一加Ace 3V采用相同调度策略,那续航表现可以远远超过现在的成绩。如果不玩游戏,日常使用,一加 Ace 3V 可以说完胜,大家可以随便对比测试。” 诸如此类,一个是“敢K·O,不服就干”,一个是“不要怂,就是干”,打的是不亦乐乎。 可以预见,未来很长时间,在王腾主导Redmi这一性能新故事期间,都将与一加李杰进行直接缠斗。 这不仅是Redmi能否再次破局的关键,同样也是手机厂商高管换血之后考验新生代的较量了。
GPT那么强,居然说不了恰好10个字?
作者:仰旗 | 中国科学院大学、中国科学院物理研究所博士生 审核:王磊 | 中国科学院物理研究所研究员 导读 最近,大家可能都听说了各种风靡互联网的聊天机器人,它们的背后是GPT模型。(GPT(Generative Pre-Trained)是一类模型,但下文中的GPT均由某著名GPT模型友情参演)。作为强大的大语言模型,GPT已经展现出了令人惊叹的实力。写邮件,学英语,帮忙看文献,已然成为了许多人的生活好帮手。作为一个聊天机器人,它在很多任务上已经达到甚至超越了人类的智能水平,这实在是令人非常佩服。但今天我们不是要夸它,而是要展示一个看似很简单的事情,但是GPT却完全无能为力。 其实GPT还是识数的,如果这样问它 咦?“博古通今”的GPT肯定有办法理解“10个字”的意思,但是为什么无法正确输出只有10个字的话呢?小编知道GPT为什么会搞不定这件事呢,这就是本文要解释的事情。 自回归模型 要解释为什么GPT无法胜任这么简单的任务,我们首先需要从GPT的底层原理——自回归模型开始讲起。千万不要被这个看似抽象的词吓到,实际上这个概念非常简单。 自回归模型能做的事情其实和猜单词类似,我们可以以英语课堂上的一个小场景为例。 ......在猜错了一些明明概率很高的字母之后,学生终于猜出了第二个字母是’h’。 那下一步呢,下一步就要考虑什么样子的字母或单词接在'ch'后面比较常见,概率比较高。这时候学生就要考虑概率 当中的 ,对于不同的字母表现如何,学生们当然要猜 更大的,因为这样更有机会猜对。学生又翻了一通词典,按照出现频率的大小估计概率,再用概率依次猜出了第三个,第四个字母,是chat。 学生的猜谜的例子其实就是自回归模型和GPT工作模式的生动诠释,GPT在工作的时候就像猜词一样,只是把字母换成了token。 token:自然语言处理术语,指处理文本的最小单元,一个token可能是一个字符,一个单词,甚至一小段话。 更一般地说,GPT会依据给定地语境,在可能的不同输出选项中计算概率,并按照这个概率进行输出。也就是按照 的大小进行输出。 确实,在GPT的实际应用中,没有老师来纠正学生的答案。但可以将学生猜词例子中老师的指正视为GPT在训练时使用的数据集进行的训练。在训练过程中,GPT会利用数据集来调整 当 前 输 出 当 前 语 境 以提高回答的准确性。 我们跟GPT说的提示词,可以类比为老师最开始说的第一个字母‘c’,然后GPT要开始根据这个初始输入来组织和生成输出。它会先猜自己输出的第一段话语,等效于‘h’。然后根据‘ch’这个新的“当前语境”再逐步猜后面的字母/语素。 那么什么时候停下呢? 聪明的小伙伴们可能已经意识到了一个问题,在没有老师指正的情况下,GPT似乎可以无穷无尽地猜下去啊,反正猜了一个再猜下一个,永远没有终止啊。GPT说话虽然经常说一堆车轱辘话,但是最后好歹还是会停下来的。是什么让这个猜谜停下来了呢? GPT是这样解决这个问题的。工程师们知道,想让GPT把无穷无尽的猜词停下来其实很简单,只需要“扩展”一下语素表,让“停下来”这个操作是一个新的语素就行了。如此一来,GPT在猜词的时候,就会一直猜一直猜,猜到语素“停下来”才停下来。 该停下来,但是概率不让啊 既然已经知道了自回归模型的工作原理,我们就可以回头来看一开始的问题了。在小编的例子里,GPT的“内心”或许经历了这个计算 请 说 一 段 话 , 恰 好 包 含 个 汉 字 。 生 活 不 止 眼 前 的 苟 且 GPT是很冷酷无情的,它根本不管你是不是只要10个汉字,也并不是很在乎你的需求,它眼里只有这个概率分布,只想按照这个概率进行抽样。 而当GPT说完九个汉字,应该在一个字里结束输出的时候。GPT对概率表进行了搜索,发现在所有输出当中,仅输出一个字的概率太小了(这也意味着这种情况的训练语料太少了),只能不管前面“恰好10个汉字的要求”进行输出了。 GPT欠缺的两种能力 缺少规划 自回归模型每次抽样都是根据当前信息(当前语境),在抽样的过程中对全局缺少规划。 从人类的观点下看,如果有恰好10个字的要求,那就不应该一口气说9个字,应该每说一个字,都得斟酌下看看剩下的字数能不能组成一句完整通顺的话。可自回归模型(GPT)才不管这些,它十分盲目短视地,每次只管当前的 当 前 输 出 当 前 语 境 并不很在意总回复的概率 总 输 出 初 始 语 境 是不是足够好。 反省和修订 自回归模型不具有“反省并修订”的能力。 人类基本都会反省吧。说了错话做错事,至少也得心里想着:对不起对不起,不能这么干,我要弥补下。 换到说恰好10个字的任务中,肯定有许多人和小编一样,估计错了10个字的量,一口气说多了。 小编:今天天气很不错,阳光真... 怎么办?已经10个字了?我也要通不过图灵测试了吗!赶紧修改一下,把“很”删掉,就能多出来一个字了。 而GPT那可是金口玉言,说一不二。每一步说出来的话就会被放进新的“当前语境”中。它不会对自己已经抽样了的内容进行删减和修订,在逐次猜出token的过程中,将错就错,一错再错..... 换而言之,GPT虽然能看到自己之前的输出,但是却不具有反省并修订的能力 所有的人工智能模型都这样吗? 并不是所有机器学习模型都有这个缺点,例如围棋战力单位“狗”(AlphaGo),在其蒙特卡罗搜索树算法中,如果搜到了胜率过低的结果,会修订之前的选择。 这也教导我们,要培养良好的规划能力和自我反省和自我改进的能力。不然即使“博览群书”如GPT,也只会像它一样,完成不了说恰好10个字的简单任务呢。 编辑:仰旗、穆梓
马斯克的烦与恼
文 | 佘宗明 马斯克,最近比较烦——不是「梦见和饭岛爱一起晚餐……遍寻不着那蓝色的小药丸」的那种烦,而是「跌跌不休,时不我与的哀愁」的愁云惨淡。 让他烦的,与其说是特斯拉股价的萎靡不振,不如说是困境背后的困境。 纵观人类科技发展史,几乎每次技术革命,都会带来科技企业的K型分化和版图重构。「AI的iPhone时刻」到来后,美股七巨头(微软、苹果、英伟达、谷歌、亚马逊、Meta、特斯拉)也隐隐呈现出分化之势。 在K线上方,坐在「头号赢家」位置的微软、英伟达、OpenAI谈笑风生,处在第二梯队的Meta、亚马逊、谷歌也喜笑颜开。 在K线下边,市值被微软赶超的苹果凄凄惨惨戚戚:「谁能比我惨?」只见更下边的特斯拉说了一句:「这不还有我吗?」 今年以来,在Sora引爆的AI行情刺激下,标普500指数唱起了「上春山」,实现了2019年以来的最佳开局。贡献了近1/2涨幅的微软、英伟达、Meta、亚马逊,直接被市场策略师称作「新一代Fab Four(披头士四人组)」。 跟「待到AI山花烂漫时,Fab Four在丛中笑」形成鲜明对照的,是没跑赢大盘的苹果——今年开年以来,苹果市值已跌去逾12%,不光是全球市值第一的位置不保,就连第二都可能被势头正劲的英伟达抢走。 比苹果更惨的,是特斯拉:4个多月时间,特斯拉市值跌掉了约1/3,跟2021年11月初的峰值(1.2万亿美元)比更是跌去一大半。有看好特斯拉的死忠分析师恨铁不成钢:想过会差,没想到会这么差。 受特斯拉股价下滑影响,今年3月初仍是全球首富的马斯克,净资产先是被亚马逊创始人杰夫·贝索斯、LVMH掌门人贝尔纳·阿尔诺赶超,这两天又被死对头马克·扎克伯格超过。 仅1个月时间,马斯克就从全球首富位置跌落至第四。 全球首富名号保不保得住,马斯克未必在乎,但特斯拉能不能止跌,马斯克不能不Care。 前不久,小米汽车SU7发布,很多中国网民调侃:雷军不再是雷冖,马斯克要慌了吗? 事实上,马斯克可能会慌,但不大可能因「小米知时捷」的SU7而慌。他要慌,更多的也是AI而非新能源汽车本身。 对马斯克而言,山姆·奥特曼带来的威胁,可比有雷布斯雷斯克双重buff加成的雷军要大多了。 01 马斯克有烦恼。但如果认为马斯克的烦恼主要源于新能源汽车销量承压,那大概是错看了马斯克。 马斯克确实会因特斯拉卖不动了而烦。 虽说「全球市值第一车企」的交椅难以撼动,但特斯拉跟三四年前的狂飙劲头不可同日而语。 今年一季度,特斯拉实际交付量只有38.68万辆,与2023年同期相比下滑了8.5%,与2023年第四季度相比降幅达到了20.2%。 这是内外交困的结果: 内,特斯拉主打的两款车型Model 3和Model Y,已到生命周期晚期,在中国新能源汽车品牌堆配置越堆越猛的当下,其产品力优势正被削弱。 外,欧美许多国家都在回调汽车电动化步伐,全球新能源汽车市场增速放缓,新能源汽车主要消费国中国新能源汽车赛道已卷成一团,全球头号纯电动汽车制造商名号一度拱手让给比亚迪,德国工厂生产节奏因环保人士纵火而中断,零部件运力受到红海危机影响……都是掣肘。 德国工厂断电停产,对特斯拉生产节奏造成了不小冲击。 尽管马斯克拿比亚迪垫背:「比亚迪的销量比上一个季度下降了42%,这个季度对每个人来说都很艰难」,可EV与DM-i双线出击的比亚迪玩的是车海战术,秦PLUS DM-i车型价格下探到10万以内的链式反应正在显现。 马斯克也确实会因看衰言论而恼。 投资人罗斯·格伯说:「马斯克承担特斯拉一季度业绩惨淡的全部责任。是他的‘有害行为’导致特斯拉的车卖不出去。」 马斯克回怼「他真是个白痴」。 路透社援引知情人士的话报道称,特斯拉已放弃低成本汽车计划——马斯克老早就放出了风声,说特斯拉未来将会在德国工厂生产价值2.5万美元的入门级平价电动汽车Model 2。这相当于说马斯克放弃了该计划。 马斯克飙起了脏口:撒谎成性,苟延残喘! 02 特斯拉的确来到了它的新危急时刻,可危机不只在于「不好卖了」,更在于特斯拉的「AI+机器人」的类AI Agent故事还没讲好。 毕竟,一直以来,在马斯克嘴中,特斯拉「几乎所有的长期价值都将来自AI和机器人」。 今年1月初,面对比亚迪的销量赶超,马斯克就重申:「两家公司没有可比性,因为特斯拉的定位是一家人工智能+机器人公司,而不仅仅是一家汽车公司。」 所以,特斯拉又是推出全自动驾驶系统Autopilot,又是推出人形机器人概念机。 特斯拉此前推出了机器人Optimus。 马斯克把特斯拉描成AI+机器人公司,也许表明了他的前瞻眼光——现在看,新能源汽车或许是人类在科技大停滞期间押注「下一个iPhone」押错了的替代品,真正开启「工业革命级」产业变革的,似乎是AI,下一步锚定智能化的新能源汽车只是AI的试验田。 过去十多年里,人类都处在iPhone开启的移动互联网周期里,随着移动互联网衍生的各个业态越来越卷,科技巨头们都在发力下个革命性的次世代技术。 被押注的领域主要有两个:元宇宙和新能源汽车。AI也曾是重点方向,但自谷歌的阿尔法狗战胜李世石后,AI界就没太多爆炸性进展了。 Meta和苹果发力元宇宙,但Meta的元宇宙平台Horizon Worlds跟苹果的AR眼镜Vision Pro都不怎么受市场待见。 特斯拉发力新能源汽车,跟产业侧结合得更紧密的新能源汽车落地空间巨大,只不过,汽车的「互联网价值」跟iPhone还没法比。 去年ChatGPT的问世,则让资本市场调整了估值逻辑坐标系:生成式AI成了那棵对的「科技树」,曾经炙手可热的新能源汽车股的地位被AI概念股取代。 特斯拉股价下跌,与其说是销量不行,不如归结为形势不利:其市值在2020年至2021年火箭式飙升时,正值新能源汽车成热门风口;它如今股价萎靡不振,则跟AI成为新的历史性风口直接相关。 正因如此,苹果会放弃投入了10年的造车项目,聚焦于生成式AI。也因如此,马斯克开始更多地把精力用在AI上。 03 马斯克把更多精力用在AI上,主要体现在了两方面:1,发力自动驾驶;2,推AI大模型。 对于AI,马斯克的底色本是「对齐派」。 2015年跟山姆·奥特曼创办OpenAI时,马斯克就是奔着让OpenAI对抗谷歌的DeepMind、应对AI潜在风险去的。 2017年,马斯克曾表示,AI开始变得比核弹头更危险,因为它可以不受限制地复制自己,而人类无法控制它。 去年3月,ChatGPT正火的时候,马斯克带头呼吁暂停超强AI研发6个月。之后他还表示要推出TruthGPT对抗ChatGPT。 马斯克还多次呼吁对AI实施监管。去年11月1日,在全球首届人工智能(AI)安全峰会上,马斯克就说,「我们来这里的真正目标是建立一个洞察框架,这样至少会有一个第三方裁判,一个独立的裁判,可以观察领先的AI公司在做什么,至少在他们有担忧时发出警报。」 今年2月底,马斯克起诉OpenAI跟山姆·奥特曼,理由也是OpenAI违背了造福人类非营利的宗旨。 马斯克起诉OpenAI和山姆·奥特曼,是今年2月的科技圈热点事件。 但在AI时代大幕已启的背景下,马斯克很难逆行,只能顺势。 在3月下旬的Abundance 峰会人工智能辩论研讨会上,马斯克表示,「即使人工智能技术有 1/5 的可能性会对人类构成威胁,但其利大于弊,我们仍然值得冒险进行研发。」 马斯克说这番话,难言突兀:颓势渐显的特斯拉,需要服下一颗强效的「AI回春丹」;他自己,也需要在AI领域复刻特斯拉曾经的高光。 今年3月25日,特斯拉宣布将向美国客户提供全自动驾驶(FSD)为期一个月的免费试用;4月5日,马斯克又在X上宣布:特斯拉将在8月8日发布无人驾驶出租车(Robotaxi)产品。 尽管马斯克否认不再推低价车型Model 2,但很显然,推自动驾驶出租车成了比推低价车型优先序更高的事项——在他眼中,智能驾驶的快速推进比新能源汽车的销量提升更迫切。 去年11月,马斯克成立的AI公司xAI(延续了他对字母X的偏好),推出了AI大模型Grok,今年3月,马斯克又将3140亿参数的Grok开源。 也算是「虽迟但到」了。 不论是全自动驾驶还是Grok模型,都是马斯克在AI棋盘中的落子。 04 目前看,特斯拉的自动驾驶技术沉淀在车企中确具领先优势,Grok-1.5在多方面的能力也超过了之前热门的开源模型Mistral Large、Claude 2等。 那,这能让马斯克跟特斯拉走出眼下的「下行走势」吗? 不能说没有,但难度不小。 马斯克曾说,实现完全自动驾驶能力对特斯拉至关重要,如果做不到这点,特斯拉的价值将「基本上归零」。 但就算做到完全自动驾驶,恐怕也难有AI之于OpenAI 和英伟达那样的加成:自动驾驶终究是AI场景化应用,还有着长尾场景的低容错特征,相形之下,资本市场好像更愿意给AI底座搭建者和算力供应者「发电」。 苹果在自动驾驶汽车跟生成式AI的「二选一」中选了生成式AI,就跟生成式AI是更大的风口相关。 在生成式AI是风口中的风口的当下,自动驾驶作为AI在垂直领域的应用,对股价跟市值的加持作用大概率会受限。 那,马斯克的xAI能追上OpenAI吗?关键看马斯克能否抓住追赶头部大模型的窗口期了。 前几天,马斯克在X上跟网友互动时,面对网友「如何看待AI语言类旧模型价格剧烈下跌至新模型的1/60,这是否意味着需求曲线非常陡峭或供应过剩」的提问,他表示:对AI大模型的需求将呈现强烈的幂律分布现象,类似搜索(Google、Bing等)和碳酸饮料(可口可乐、百事可乐等)领域。 幂律分布决定了,AI大模型领域会开启残酷的淘汰赛,只留下极少数头部玩家。 马斯克对Grok模型进行了开源。 Grok能不能后来居上、跻身头部,有着巨大的不确定性。 考虑到xAI是马斯克创立的,这样的不确定性中也会夹杂着很多确定性。 耐人寻味的是,马斯克的xAI跟特斯拉眼下尚不存在归属关系。美国知名投行韦德布什(Wedbush)之前就警告,马斯克在特斯拉之外开发AI将对特斯拉构成巨大利空。 马斯克就在据此跟特斯拉董事会博弈,要求给他至少约25%的投票控制权(他现在持有13%的股份),否则他宁愿在特斯拉之外开发AI。 Grok模型会给特斯拉加持,还是会拖特斯拉后腿,还不好说。特斯拉能不能开启微软、英伟达、OpenAI那样由AI驱动的性感增长曲线,也不好说。 05 三四年前,马斯克几乎是网民心中不二的全球科技界C位人选。 但这两年,C位更多地被山姆·奥特曼跟黄仁勋占据。 那,马斯克还能带领特斯拉重回巅峰,还能夺回过去几年被自己牢牢占据的C位吗? 答案是不容易,但在时间揭晓终章前,谁也不能轻易说「不能」。 毕竟,他可是马斯克。
从手机厂变身车厂,小米的挑战才刚刚开始
别再用手机厂的老眼光看小米了,小米现在的真实身份其实是一家车厂。 多年以后,大部分人想到小米时,脑海中闪现的第一画面甚至有可能会与智能手机毫无关联,而完全由智能汽车占据。这款智能汽车不一定是最近刚上市的小米 SU7,不过这一未来很有可能出现的情况,其起源却要从小米 SU7 说起。 3 月 28 日晚,小米投资百亿、打磨三年的小米 SU7 正式上市。 上市当晚,小米 SU7 的大定量如绚烂的烟花般节节盛开 —— 4 分钟破万,7 分钟破 2 万,27 分钟破 5 万,24 小时突破了 88,898 台,令放烟花者自得,看烟花者惊羡。毋庸置疑,对于小米来说,这是充满历史意义,注定要被载入小米史册的一晚。 6 天之后,历史意义仿佛迈着小碎步一样,快速地再次到来 —— 4 月 3 日 早上 8 点 08 分,雷军在微博上宣布「从今天开始,小米正式成为一家车厂」,同时,雷军还带着开玩笑的语气让大家把自己称作「雷厂长」。 从小米 SU7 上市到雷军宣布小米正式成为车厂,在短短的六天时间里,一个全新的小米宣告诞生。 这意味着,在雷军的带领下,小米这艘在风急浪涌的大海中行驶了 14 年的大船,如今正不回头、也不能回头地驶向一片更加广阔,然而风却更急、浪却更高,并且更拥挤的海域。 在这片海域中,小米这艘船很大,但却急需变得更大。 01比 3 年还要漫长的 6 天 6 天时间可以多漫长?在小米汽车这里,6 天的漫长程度恐怕要甚于过去埋首造车的 3 年。 原因很简单,在小米 SU7 上市之后,雷军宣布小米成为车企之前的 6 天时间里,围绕着小米汽车,谣言和美言漫天乱飞,贬低和捧高针锋相对,前辈的打击和同辈的追击接踵而来...... 总而言之,伴随着混杂在一起的善恶好坏,泼天的流量涌向了小米汽车,它将小米汽车推向了罕见的高度,但也随时将小米汽车砸的头晕脑晃。以致于从小米 SU7 上市第二天开始,麻烦就不断产生。 被用放大镜看问题 3 月 29 日,有下单小米 SU7 的用户称锁单时没有二次提示,导致自己误触后锁了单,因而退不了定金。为此,很多用户还建立了维权群。 面对突发的口碑危机,小米汽车官方迅速做出了回应,表示在小米汽车 APP 的购车流程中,共计会有三次提示,并提醒了用户在锁定配置前慎重选择。 紧接着,小米 SU7 撞路沿后爆胎、座椅磨损包浆、未交付便掉漆、后轮螺丝脱落等问题频频爆出,将小米汽车一次又一次地送向了热搜。虽然这些问题小米汽车最终都进行了一一回应,但造成的坏影响小米汽车却要付出更多的时间去慢慢挽回。 这边用户口碑危机屡屡发生,那边友商们的集体行动又开始了。 3 月 30 日,凯迪拉克率先发难,在椰树牌风格的图片上写了「对不起军儿,我们帮你把 50 万以内也挺好的 SUV 造出来了」、「我们既不像保时捷,也不像特斯拉,我们只想美美地做自己就好」等嘲讽度拉满、完全不留情面的文案。 相对于凯迪拉克的逞嘴上功夫,新势力出招就更加下狠手了。 4 月 1 日,极氪 007 推出后驱增强版,价格仍然保持 20.99 万不变,但增加了价值 1.2 万的科技全感套装,与小米 SU7 滚在一起赤身肉搏;蔚来推出最高 10 亿元油车置换补贴,为自家的 ET5、ET5T 举起了盾牌;特斯拉 Model 3 原价 1.2 万的星空灰车漆免费选配,特斯拉官方还在微博上说「体验标杆 Model 3 之前,请不要轻易做出选择」,并配以狗头表情 —— 这一个狗头的信息量堪比千言万语。 有意思的是,智界 S7 绝对是小米 SU7 的一大劲敌,这也是华为和小米这对老对手在汽车行业的首次正面对决。目前,智界 S7 正按兵不动。不过据相关报道,智界 S7 将会在最近再次上市,到时不知会掏出什么样的利器与小米 SU7 分个高下。 与友商们的行动一起来的,还有各路大佬让小米汽车稳居热搜高位的辣评。 比如贾跃亭就在微博上对小米欲贬先扬,他先表示「小米汽车的首次发布非常成功,体现了中国新能源汽车产业链在近几年的日臻成熟和中国制造体价比的巨大优势」,紧接着便峰回路转,直言「小米造车的执行力和营销能力诚然值得点赞,但是,山寨文化、走捷径模式和 follower 思维却被很多人奉为圭臬,令人担忧」。 最近一直在宣传 AI 的红衣教主,360 集团董事长周鸿祎也发表了对小米汽车的看法,他的观点则比较偏向于小米。周鸿祎表示,如果小米汽车能够站稳脚跟,对小米品牌无疑是一个巨大的提升,让小米的用户和非小米的用户对小米的认知发生巨大的改变,小米手机也可以打一场高端翻身仗。 最看好小米汽车的还得是罗永浩,他对小米汽车的称赞近乎于一种膜拜,罗永浩说: 小米很可能继平价手机市场之后,在大众消费车市场上重新上演良币驱逐劣币的史诗性一幕。 此外,我在朋友圈里也看到了来自一位行业资深咨询师的很有价值的观点,他认为「三年造车不鸣,一鸣泯然众生,这不是小米没能力,而是行业对电动车的想象力基本见顶」。围绕着电动车,行业究竟还能迸发出什么想象力,是个值得思考的问题。 营销老兵的素养 在小米 SU7 上市后的 6 天里,由用户、友商、行业人士形成的舆论大军紧紧将小米汽车围在垓心,这是泼天的流量,同时也是天大的压力。对此,雷军甚至在微博上说: 我们真的压力很大,大家用放大镜在看问题。 尽管被舆论大军围在垓心,但小米汽车显然没有自乱阵脚,依然按照自己的节奏为小米 SU7 用尽全力带货。 自小米 SU7 上市以来,雷军始终坚持每天在微博上更新小米 SU7 的内容,与网友进行互动,广结善缘,及时回应一些重大的问题,比如最近的小米汽车何以 3 年就能造出完成度如小米 SU7 这样高的车。 在 4 月 3 日的小米 SU7 首批交付仪式上,雷军亲自到场并为车主开门,继续为小米汽车收揽好感。 与此同时,小米汽车官方也始终与用户保持同频,收集用户的各种问题,并做出解答。目前,《小米 SU7 答网友问》已经更新到了第十集,有效地减少了用户的购买疑虑。 其实,应对舆论、拿捏营销都是小米,这个互联网营销老兵多年摸爬滚打练出来的看家本事,而如何将目前这泼天的流量转化成实际的订单,再将订单保质保量保满意度地转化成用户手中的汽车,才是对小米最新的考验。 02雷军还得战战兢兢下去 在过去埋首造车的三年时间里,雷军说自己一直战战兢兢。如今小米真的成为车厂了,恐怕雷军还得继续战战兢兢下去 —— 未来还有更多个漫长程度堪比 3 年的 6 天。 一方面,相对于手机,汽车的单品价格遥遥领先;汽车用户的购买决策周期长度遥遥领先;汽车用户的要求复杂程度遥遥领先。 这意味着,小米汽车不仅仅要把产品稳扎稳打地做好,还得付出大量的时间和真金白银去构建品牌价值、服务能力以及做好用户关系维护。毕竟,这些方面都在深深影响着用户的购车决策。 另一方面,如今新能源汽车市场的内卷程度,好似一群置之死地而后生、只要今天不管明天的草莽英雄同时争相痛饮一缸烈酒,在明面上一个比一个能喝、敢喝、说干就干,但其实,有的「会须一饮三百杯」后还能继续推杯换盏;有的饮罢三杯即烂醉如泥;有的别说喝酒了,想碰到缸沿都得抖擞出一身的力气。 所以,要从手机厂转变成一家真正的车厂,在推出小米 SU7 之后,还有重重难关在等待着小米汽车。 难,但避免「走向平庸甚至衰亡」 首先一个关键问题就是品牌,这是小米汽车和小米手机最根本的联结,也是二者相互赋能最核心的纽带。 在这里跟大家分享一个故事。3 月 29 日,我在高铁上听到有人讨论小米 SU7,他们的大意就是认为小米是一个廉价的品牌,不仅觉得小米 SU7 定价 20 万以上还是贵了,而且对小米汽车第一次造车就能造出来一款好车存疑。 这其实就代表了一部分用户的看法,也揭开了小米品牌的一大伤疤 —— 小米品牌不具备足够的高端价值。 早在 2022 年春节后的一次小米集团战略讨论会上,小米就明确了「高端之路是小米成长的必由之路,也是小米发展的生死之路」的共识。 因为就手机市场来看,雷军认为「高端成功会为整个品牌提供极强的虹吸效应,会极其显著地吸引其他品牌用户的换机需求」。同时作为一家科技公司,高端产品是科技公司系统化能力的集中体现,在雷军看来,「如果不能以高端市场表现持续倒逼能力提升,那么长期看,这家公司必然会走向平庸甚至衰亡」。 然而无论是在手机市场还是在汽车市场,在通常的认知中,高端往往意味着高溢价,并且这部分高溢价往往来自于一种社会普遍认同的符号价值。这明显与小米所坚持的产品性价比有很大的冲突。 不过在雷军看来,坚持性价比的同时也可以做高端,核心就在于体验。通过造车完成人车家的生态闭环当然就是这一思路的集中体现,而造车也就自然而然地成为了提高小米品牌价值的关键路径。 可眼下的一个现状是,小米汽车的品牌价值其实源于小米手机,小米汽车要反哺整个小米的品牌价值,还有很长的路要走。 同时,雷军坚持用性价比做高端的路线,长期来看,恐怕要么孤胆英雄式的改变汽车市场以高溢价做高端的方式,要么被汽车市场以高溢价做高端的方式改变。 难以估量的适应成本 另一个关键问题就是小米汽车的服务能力。 从整体上说,纵然小米已经有了 14 年的与用户打交道的经验,但那都是手机用户,小米服务汽车用户的经验还是零。而且,服务手机用户的经验难以复用到服务汽车用户上,毕竟如上述所言,汽车用户的购买决策周期更长,汽车用户的要求更复杂,而且稍有不慎,就会引起用户集体维权,甚至不时奉上写信拉横幅式的重拳出击。 从具体上说,小米汽车目前在全国 29 座城市建了 59 家门店,然而根据官方数据,有的门店的单日人流量能达到 10,000 人次,如此一来,用户看车是人从众的景象,试驾还需要排队好几天,体验势必大打折扣,部分订单也就因此白白流失。 此外,小米汽车在全国共有 29 家交付中心,而目前小米 SU7 的锁单量已经超过 4 万,再加上今年一年的产能都用完了,导致小米 SU7 的交付周期已经延长到了 24-27 周,SU7 Pro 25-28 周,SU7 Max 29-32 周。由于交付周期过长,又会造成部分订单的白白流失。 除了销售和交付,维保也是问题。目前,小米汽车的部分交付中心起着服务中心的作用。当然,这是远远不够用的。 订单流失尽管很可惜,但小米汽车毕竟尚在起步阶段,这几乎就是无法避免的问题。好在,销交服体系可以通过时间来补足,而这则又可以充分发挥小米 14 年来积累下的组织效率能力了。 在补足销交服体系的同时,还有一个挑战也在考验着小米汽车 —— 汽车制造的工艺水平。 随着小米 SU7 交付量的提升,小米汽车工厂的制造工艺水平会面临着极大的考验。正如雷军所说,「大家在用放大镜看问题」,小米 SU7 一不小心就会被质疑工艺水平。 在制造工艺这一方面,用户肯定远比小米汽车的产品经理严格。一旦制造工艺出现问题,就会很容易给用户留下深刻且长久的坏印象,比如在燃油车里,说起烧机油你肯定会想起某个品牌,说起水箱漏水你肯定又会想起某个品牌。 不过,如果小米汽车的制造工艺稳定发挥,时间一长,小米汽车给用户留下像「人走车还在,一车传三代」这样的江湖美名也不是不可能。 在保证了产品和服务之后,小米汽车还得丝毫不能松懈地投入研发,并以适当的节奏推进 OTA 更新并加速智能驾驶的推送和迭代,以时刻维持小米汽车在智能化和电动化浪潮中的竞争力。 同时,小米汽车更得继续以保持甚至超越小米 SU7 的水准,来满足用户对小米汽车接下来的产品的期待,并在商业成功和用户高期待之间找到一个合理的平衡,让自己在新能源汽车市场中的根扎得更深、更稳。 一言以蔽之,从手机厂变成车厂,小米需要支付大量的适应成本,而其中某些成本甚至很难用钱来衡量,譬如重新摆正对供应商的态度、警惕在运营手机业务时形成的惯性思维等。 尽管从手机厂变成车厂,小米面临很多问题,但为了解决这些问题,小米一方面从雷军开始,自上而下的高效推动变革;另一方面则手中有粮、心中不慌,集团的千亿现金储备可以逐渐转化为明晃晃的战斗力。 值得一提的是,面对转变,小米汽车的出发点是非常清醒的,就像雷军曾经说的: 我们要清醒地认识到,再次踏入全新的领域,必然面临诸多挑战。汽车行业复杂度之高、投入之大、周期之长、容错率之低,都需要小米以战战兢兢、如履薄冰的踏实、敬畏之心来面对。况且,目前业内的主流选手比我们早出发至少 6 年,作为一个后来者,我们必须保持谦逊、保持敬畏,全力追赶,才能胜出。 03写在最后 小米不是一家年轻的企业,却是一家初生的车厂。 由于历史的积累,小米拥有可以直接复用到造车上的资源、经验,但同时也可能受限于过去所积累的资源、经验。这是小米成为车厂后尤其要小心的问题。 此外需要强调的是,小米变成车厂,不是小米手机的放大,而是小米在一块全新的土地上,重新埋种,然后再经历一次生根、发芽,最终成长成一根参天大树的过程。 在生根发芽的时候,是小米手机在呵护着小米汽车成长。长成参天大树后,小米汽车将反过来为小米手机遮风挡雨。 再进一步说,在当下宣布成为车厂的时间节点上,小米固然没有通过小米 SU7 带来新能源汽车产品上的颠覆性,但却以巨大的声势和初步的商业成功继续让中国车市卷上加卷。 而伴随着小米 SU7 正式上市以及小米成为车厂,这一轮中国新能源汽车产业革命的新手入场口正式宣告了关闭,接下来将是完完全全的淘汰赛。 撰文:Isaiah 编辑:308
“逃离”OpenAI!36人出走,已拿600亿融资
作者 | 程茜 编辑 | 心缘 最近OpenAI频繁高薪挖人,把马斯克惹毛了。 马斯克在社交平台X上公开爆料:OpenAI一直在高薪挖特斯拉工程师,甚至还想把特斯拉前CV负责人Ethan Knight挖走,还好马斯克自家AI公司xAI眼疾手快,从OpenAI手中成功截胡。 不怪OpenAI着急,就像马斯克说的,硅谷AI人才争夺战已经到“疯狂”的程度。 即便是在AI产业影响力如日中天的OpenAI,也不能仅凭技术领先来留住人才。据智东西统计,已有至少36人从OpenAI出走,31人选择创业。这些由前OpenAI员工创办的公司合计融资金额超过90亿美元(折合约647.93亿人民币)。 其中与OpenAI纠葛多年的马斯克创办的xAI已经将其大模型Grok-1开源,正式向OpenAI“宣战”;OpenAI前研究副总裁Dario Amodei携十余位同事成立的大模型创企Anthropic,成为OpenAI的最强对手,估值超过180亿美元;OpenAI前研究科学家Margaret Jennings打造的AI搜索引擎创企Perplexity,投资方里出现了亚马逊创始人贝索斯、英伟达等知名投资者的身影…… 从投资阵容来看,这些创企已经站到了资本的聚光灯下,其投资者既有Andreessen Horowitz、红杉资本、Y Combinator等顶级风投玩家,还有英伟达、微软等行业巨头,就连OpenAI CEO Sam Altman本人也出现在了投资方名单中。 除去出走创业,还有5位员工未披露最新的工作动向,或者选择加入其他AI创企、独立研究机构等。 可以确定的是,从OpenAI出走的36位员工,已经成为科技界“黑马”。 01 . “再造”OpenAI? 已成其强大竞争对手 其中最显著的一大员工出走方向就是大模型,并且几家创企已经摇身一变成为OpenAI的强劲对手。 出走员工中有一位已经“双进双出”OpenAI的大牛Andrej Karpathy。他是OpenAI的创始成员之一,2015年至2017年在OpenAI担任研究科学家,随后进入特斯拉领导自动驾驶的计算机视觉团队。随着GPT-3.5、GPT-4等OpenAI一系列AI前沿进展发布,2023年2月,Karpathy再次回到了这家AI领域最热门的公司。 Andrej Karpathy(图源:个人主页) 今年2月,Karpathy再次离开OpenAI,在推特官宣了新进展,先是新项目minbpe上线GitHub,专为大语言模型分词中常用的BPE(字节对编码)算法创建最少、干净以及教育性的代码,该项目标星量一日破千,如今已经达到7.6k。随后又开讲授课,2小时13分钟课程手把手教学如何构建GPT Tokenizer(分词器)。 2021年,时任OpenAI前研究副总裁的Dario Amodei带着他妹妹丹尼拉·阿莫迪(Daniela Amodei)在内的逾十人研发小组出走成立Anthropic。上个月刚刚冲击GPT-4,将其拉下大模型神坛的Claude 3系列,就出自这家创企之手。 Anthropic创始人:左为达里奥·阿莫迪(Dario Amodei)、右为丹尼拉·阿莫迪(Daniela Amodei)(图源:TWIML) Claude 3系列在多个性能基准测试中超过GPT-4,并且可以处理照片、图表、技术图纸等文件识别、上下文窗口达到20万tokens。 该公司累计融资金额已经达到73亿美元,获得谷歌、Zoom、Salesforce的投资,成为继OpenAI之后,众多明星投资者的重金押注对象。 另一位备受瞩目的前OpenAI员工就是特斯拉创始人、CEO Elon Musk。2018年,Musk因利益冲突选择离开其与Altman等人联合创办的OpenAI后,多年来,一直对OpenAI转向商业盈利和闭源模式怨气颇深,如今已经一纸诉状将OpenAI告上法庭。 特斯拉创始人、CEO Elon Musk(图源:Medium) 去年7月,马斯克成立AI创企xAI,四个月后就发布了可以实时获取社交平台X数据的聊天机器人Grok,但只向付费用户开放。Grok基于Grok-1大模型研发, 该模型在具有330亿参数的原型大模型Grok-0基座上训练。今年3月中旬,马斯克宣布正式开源Grok-1,该大模型的参数量达到3140亿。 值得一提的是,xAI团队中的Kyle Kosic和Igor Babuschkin都曾在OpenAI担任研究员、技术人员。 Kyle Kosic(左)Igor Babuschkin(右)(图源:领英) 在融资方面,xAI至今未曝出具体的融资规模,但去年12月,美国证券交易委员会(SEC)网站的文件显示,xAI已经递交申请,拟通过股权融资筹集10亿美元。 并且该公司已从四位投资者手中筹集了近1.35亿美元资金。 除了上述几位明星玩家,最后一家创企Adept的声量较小,但其去年已成新晋独角兽,且顶级风投Greylock与行业巨头微软、英伟达等均在其投资方阵容,总融资额超过4亿美元。 OpenAI的原工程副总裁David Luan,与两位Transformer论文神作合著者阿希什·瓦斯瓦尼(Ashish Vaswani)和尼基·帕玛(Niki Parmar)联手成立Adept,并打造了大模型ACT-1,可以基于用户指令分步骤操作电脑,Excel、Salesforce、Figma等一系列日常办公软件的使用。 更具体点就是,只要你在文本框中输入一句指令,可以是“做一个xxExcel表格”,也可以是“用Photoshop修一张图”,AI都能帮你自动完成。 Adept AI团队合影:第一排右一戴维·栾(David Luan)、第二排中间阿希什·瓦斯瓦尼(Ashish Vaswani)、第二排右一尼基·帕玛(Niki Parmar) 这些曾在OpenAI任职的大牛,已经成为如今大模型产业的灵魂人物,其一举一动都牵引着整个AI产业的神经,且有望打造出与OpenAI并驾齐驱的创企。 02 . 扎根AI+行业应用 多个爆款产品已亮相 在大模型底层技术研发之外,还有众多从OpenAI出走的员工将目光瞄准了AI+行业应用,在深耕技术的同时,将AI与不同行业或用户的需求相结合。 从这些创企的主要业务及产品来看,主要可分为三类:面向消费者的AI应用、面向企业的AI应用平台、机器人解决方案。 1、消费者AI应用:挑战谷歌霸主地位,天使轮获Altman投资 OpenAI前研究科学家Aravind Srinivas 2022年创立AI搜索引擎创企Perplexity,就喊出了要与搜索引擎霸主谷歌较量的口号。其产品与谷歌搜索最大的不同是,用户提出问题后,搜索界面给出的不再是数个链接,而是基于已有链接的完整回答。 Aravind Srinivas(图源:X) 这一产品的成立不到两年就拿到1亿美元融资,估值增至5.2亿美元(折合约37.24亿人民币),最新一笔融资还囊括了亚马逊创始人贝索斯、英伟达等知名投资者的身影,且据《华尔街日报》上月报道,Perplexity即将敲定一笔新的融资交易,估值约为10亿美元,晋升独角兽。 2021年初,OpenAI前设计师Ludwig Petterson打造了办公场景的即时通讯应用Quill。 这一工具可以用于员工聊天、创建频道、集成其他应用程序、进行视频语音对话等。不过在更新了上传自定义表情、添加多个电子邮件账户等一系列新功能后,2021年12月底,Quill的官方推特显示,其已经被推特收购。 Ludwig Petterson(图源:RocketReach) 值得一提的是,当Quill只是Petterson脑海中的一个想法时,他就拿到了Altman等投资者手里的200万美元种子轮投资。 2、企业AI平台:囊括安全、对话、金融,OpenAI已成客户 OpenAI前技术人员Tim Shi,曾参与开放域平台World of Bits和测量和训练游戏中AI智能水平OpenAI Universe等多个项目。 Tim Shi(图源:领英) 2017年,他离开OpenAI后,创办了智能客服AI平台Cresta AI,可以基于生成式AI等技术为销售、客服提供实时对话指导,提供全流程的AI辅助。该公司的产品客户包括全球众多知名企业,如希尔顿、洲际酒店集团酒店及度假村、保时捷等。目前这家创企已经获得1.51亿美元融资,估值已经达到16亿美元。 Gantry的创始人是OpenAI前研究科学家Josh Tobin,以及OpenAI的创始工程师和基础设施负责人Vicki Cheung,这家创企主要是帮助企业部署AI系统,提高大规模AI系统的安全性。这家创企已经拿到2830万美元融资。 Josh Tobin(左)Vicki Cheung(右)(图源:Gantry官网) OpenAI前应用团队成员Margaret Jennings,创办了企业AI安全平台创企kindo,已获得700万美元融资。其公司主要帮助企业解决生成式AI安全性、合规性和集中管理的问题,使企业能够安全、私密地利用AI。 Margaret Jennings(图源:个人主页) 该平台使企业能够连接到任何私有、开源或商业AI模型,并支持200多种SaaS集成,员工可以利用这些集成来创建无代码、AI驱动的工作流程。 OpenAI前运营负责人Jeff Arnold创办的金融科技创企Piolt,为企业提供财务自动化报告,获得总计超1.5亿美元融资,并且,OpenAI已成为该创企的客户。 Jeff Arnold(图源:Piolt官网) 3、机器人:工业、家庭机器人研发,最高拿到2.22亿美元融资 2017年,OpenAI前技术人员Pieter Abbeel、Peter Chen、Rocky Duan从OpenAI离开,成立了提供机器人工业解决方案的Covariant,已经获得了2.22亿美元融资。 上个月,这家公司宣布推出机器人基础模型RFM-1,为机器人提供了类似人类的推理能力。演示视频中,该系统可以对“拾起红色物体”、“在穿鞋之前拾起你脚上的东西”等较为复杂的指令做出正确反应。 Rocky Duan、Peter Chen、Pieter Abbeel(左起第二至第四)(图源:Covariant官网) 机器人创企Daedalus成立于2017年,由曾经在OpenAI创建机器人团队,并担任技术负责人的Jonas Schneider创立,已经获得4100万美元融资,诺基亚旗下NGP Capital、Y Combinator都在其投资方之内。 该公司目前接受的订单主要来自医疗设备、航空航天、国防和半导体等行业,其下一步思路是打造利用AI驱动的工厂来制造定制精密零件。 Jonas Schneider(图源:领英) 家庭机器人研发商Prosper Robotics成立于2021年,创始人Shariq Hashme是OpenAI前技术人员。该公司打造了一款可以洗碗、洗衣服、清洁地板、准备沙拉等简单饭菜的机器人,并预计在未来几年内上市。 Shariq Hashme(图源:Business Insider) 事实上,OpenAI成立初期,机器人团队是其重要组成部分之一,但由于机器人产品商业化投入巨大,需要较长周期的市场验证。2021年7月,OpenAI宣布解散机器人团队,无限期中止对机器人领域的探索。 聚是一团火,散是满天星。 OpenAI推出的现象级产品ChatGPT、Sora,催生了全球AI创新与创业的繁荣。在我国,科技大厂与创业新秀们同样积极奔赴生成式AI热潮。 4月18-19日,2024中国生成式AI大会将在北京举行,50+位重量级嘉宾将同台分享。免费报名或购票通道开放中,期待你的参会~ 03 . 隐形创企、独立研究…… 创业者在科技界“遍地开花” 除了这些与OpenAI此前研究方向距离较近的,还有一批研究人员开启了新的赛道,如做独立研究、入局生物技术研发、加入投资公司等。 其中有一些技术人员的履新动向仍处于隐形阶段。 3月1日,OpenAI内部的开发者关系负责人Logan Kilpatrick宣布离开OpenAI,其负责的主要是支持开发人员使用OpenAI API和ChatGPT进行构建。 Logan Kilpatrick(图源:GitHub个人主页) Kilpatrick在OpenAI的职责是,帮助开发人员使用他们的API和ChatGPT插件进行构建。 不过目前,这位最新离开的大佬尚未公布下一步的工作动向。 离开OpenAI后,Kilpatrick还发布一条推文发表了对于开源AI的看法,“开源AI对于开发者、企业、人类来说都是净赢”。不知他的离开与OpenAI没有开源是否有较大的关系。 去年3月,领英创始人兼Greylock合伙人Reid Hoffman宣布,他将退出OpenAI董事会,他希望投资使用OpenAI软件的公司,这可能会导致利益冲突。Hoffman是OpenAI直接竞争对手Inflection AI的联合创始人。 Reid Hoffman(图源:Greylock) Anthropic创始人Amodei带领数十人小组离职后,与他同一部门的Paul Christiano也选择出走,成立了独立研究机构Alignment Research Center(ARC)。他曾在OpenAI领导开发了根据人类反馈进行强化学习(RLHF)的方法,但他认为随着AI越来越强大,这种方法可能行不通,因此他成立ARC希望找到方法迫使大模型说实话并揭示其“知道”的一切。 Paul Christiano(图源:个人主页) 此前OpenAI CEO阿尔特曼被辞退大戏中,还有一位员工被波及,那就是Altman的助理Alex Cohen。离开OpenAI后,Cohen仅用了16分钟就找到新工作——无人机、AI技术创企Roofer的首席AI研究员。 Alex Cohen(图源:X) 在AI领域之外,还有一些从OpenAI出走的员工将目光放到了其他科技赛道。 OpenAI前创始团队成员Matt Krisiloff的创业项目是生物科技公司Conception,该公司的体外配子(IVG)技术将降低不孕夫妇的风险。从长远来看,还能称为广泛进行胚胎基因筛查的关键平台。 Matt Krisiloff(图源:NPR) OpenAI前特殊项目经理Maddie Hail的公司Living Carbon,基于科学研究成果,恢复生态系统,改善生物多样性,并增强光合生物从大气中吸收和储存碳的能力。 Maddie Hail(图源:Carbon Herald) 04 . 结语:OpenAI造就硅谷新“黑帮” OpenAI几乎站稳了当下大模型产业的霸主地位,在其中的工作经历也成为这些创业者的一大亮眼标签。 随着这些创企的技术研发加速、产品落地,这一大标签正在慢慢被撕下,取而代之的是这些知名大牛打造的爆款产品等。 在科技行业,这些创业玩家正一步步走向聚光灯下,在自己的赛道拔地而起。
你在小红书上关注的美女博主,可能是AI
撰文/ 黎炫岐 编辑/ 李觐麟 在近年来,虚拟偶像、虚拟主播(VTuber)似乎已经不是什么新鲜事,人们就算没有成为虚拟偶像的粉丝,也一定都曾听说过初音未来的名字。只不过,一提及“初音未来们”,人们脑海里首先出现的标签或许还是“二次元”。但如今,在小红书等社交平台,一大批AI博主正凭借足以“以假乱真”的美图,吸引诸多粉丝。 她们往往在个人简介中标明“赛博天使”“没有感情的机器人”“AIGC生成”或“虚拟博主”,但仍有不少粉丝将其误以为是真人博主,更有人在评论询问“能否加个微信”。 事实上,不仅有赛博颜值博主,还有赛博萌宠博主,但背后的逻辑都是通过大模型生成统一形象在不同场景、不同穿搭下的不同类型照片。而随着流量涌来,赛博博主们也开始思考起自己的变现路。 粉丝过万、点赞上千,博主却是AI? 在小红书上,点开一位粉丝量过万的博主笔记:“在四十岁这个年龄,我们拥有着宝贵的人生经验,以及内外兼具的自信和美丽……”配图一张逼真的工作照。评论区的第一条便有人误以为真,问道“还招人吗?”直到有其他网友提醒“AI虚拟生成不知道啊?假的”,许多网友才恍然。 而另一位粉丝量超过两万的颜值博主,在个人简介里写明“赛博天使,我只是一个没有感情的机器人”,且在每篇笔记前标明AI二字,仍有不少网友难分真假,发出“这个模特好好看”的感慨,且有多篇笔记点赞量超过两千,目前所有笔记获赞与收藏量已经近八万。 再一位旅游博主,时而身穿露脐短袖出现在海边,时而一袭国风汉服出现在樱花下,又或者身着白色毛衣和毛线帽打卡餐厅,不仅穿搭和场景多变,发型发色和首饰等也常有变化,但“脸”始终是同一张脸。而这些笔记下,常有人发出疑问,“这真的是AI吗?” 小红书上的AI颜值博主 事实上,这些凭借颜值出圈的博主,无论是邻家少女,还是成熟女性,都是由AI绘画大模型生成而来,只是因为脸部参数相同,且穿搭多元,细节越来越逼真,加上背后的运营会为这些AI生成的形象塑造一个具体人设,便很容易被误以为是真人网红。以至于有网友调侃道,“AI越来越像真人,网红越来越像AI。” 除了有AI颜值博主,还有AI萌宠博主。日前,在小红书上,一条标题为“会做饭的猫真的很加分”的笔记收获了2.8万赞和4000+收藏,这组由AI生成的图像中,一只小猫正爪握锅铲,做着一碗石锅拌饭。 而博主“橙子的橙啦”则专门发自己创作的AI猫猫,在小红书拥有5.7万粉丝,48万点赞和收藏,账号置顶的一条笔记中,一只胖乎乎的加菲正在cos《繁花》里的宝总,穿着西装吃泡饭。 小红书上的AI宠物博主 锌刻度搜索发现,在小红书上,类似于“橙子的橙啦”这样的AI萌宠博主并不少,名为“是壮壮丫”的博主主要发布一只名为“壮壮”的柴犬AI作品,在这些AI绘画作品中,这只柴犬既会生病,也会逛街,还会上班。而当它生病时,评论区不乏“好好休息”“壮壮,姨姨好舍不得”的关心;当它出去买菜时,评论区则有人表示“记得买点肉肉吃”;而当它在洗碗时,网友们则立即夸奖它“不止听话,还很勤劳!”……目前,该博主已有1.8万粉丝,获赞与收藏量超过十万。 赛博网红,何以变现? 当流量涌来,这些“赛博网红”也开始设法变现。 其中,AI颜值博主主要仍在培育自己的私域流量,在这些博主的主页,往往能看到其“群聊”入口,而群聊的目的通常是“拿原图”或“拿教程”。而博主“人工智颜”的账号介绍则写明“想要定制自己的写真照片、定制生成特定服装图等需求都可联系我。” 锌刻度发现,AI写真私人订制是目前最主要的变现方式。“其实目前这个行业刚刚起步,客户还是不算太多,大部分客户也是出于好奇,会提出一些特定的服饰要求让我们生成图片。”小红书上一位AI画师告诉锌刻度,除此之外,也有一些客户是希望生成自己的AI写真照。 其中,小红书上一位长期发布AI美女写真的博主背后是一家摄影工作室。据其提供给锌刻度的详细价格表,基础套餐价格为:单人套餐为1000元一套,共8张精修照片,但仅限现有风格套系;定制风格为1500元一套,共8张精修照片,但其中包含500元定制费。除此之外,还可充值享优惠价,充值3000元可送一套。而这个价格甚至比市面上许多真人写真的价格更高。 一AI写真工作室提供的价格表 该工作室的客服告诉锌刻度,购买定制AI写真的流程是,“先发送10张左右你的照片,再说具体要求,然后付款,(我们会)48小时内出图联系你,再视频选片,最后精修你选的照片。”其中,照片需要6张正面和4张其他角度用来建立脸部模型。 而要求可包括胸围、偏好(性感 ,青春,御姐,萝莉)、头发(齐腰 , 短发 ,刘海,发色)等等。 此外,该客服表示,“我们工作室是会员制的,提供一次脸模之后我们会为会员保留下来,如果整容了可以重新为会员免费练新脸模。” 此外,还出现了AI模特试装,以小红书上“图鱼家的AI工作室”这一账号为例,此前该博主曾发布多篇“AI模特在线营业”“AI模特试装营业日”的笔记,并表示“工作流越来越稳定了”。尽管目前其仅有六百多位粉丝,但这在国外已有了成功变现的案例。 据报道,Clueless公司利用人工智能(AI)创造出来的模特和网红艾塔娜·洛佩斯。几个月前,她的月收入为4000欧元。日前,她在接受西班牙媒体的一次特别“采访”时说,现在她的月收入已达1.2万欧元。 除了颜值博主,AI萌宠博主同样在寻觅变现之路,据青年横财发展会,从后台查询,AI宠物头部账号的广告报价不算便宜,5.5万粉的“橙子的橙啦”图文报价15000元,同样是5.5万粉的“空一凉”图文报价7700元。比小红书千粉百元的(粗略)报价方式高出不少。从各个AI动物作者的笔记中时常可以看到产品露出,不仅有猫粮、猫罐头等宠物用品,也有眼镜、汽车、奶茶等。 不过,目前流量更多仍倾斜于头部账号,许多跟风而来的AI博主目前的粉丝和流量并不多,这也让赛道整体的变现路更困难。 高流量背后:低成本、低门槛 、高风险? 据锌刻度了解,目前上述AI博主发布的图片大多由海外AI画图程序StableDiffusion、Midjourney等生成,但也有部分博主开始使用国内的AI绘图软件或小程序。 “从大模型本身来看,算力要求很高,对于训练数据的数量和质量要求也很高,但是对于这些使用者而言,其实门槛是比较低的。”算法工程师郑义(化名)告诉锌刻度,一般而言,为了保证AI博主人设的统一性,创作者需要设定“用同一张脸”的参数,但不断训练和调试其他数据,从而生成不同场景、不同穿搭和不同妆容的图片。 而在AI颜值博主“cyberAngle”的笔记评论区,也常能看到运营者对此的讨论,当有人询问“有这个模型吗,有没有参数”时,博主也会回复“都是现成的模型,那几个dolllikeness调调配比混出来的”。 当然,由于现成模型不够完善,需要不断训练和调试,所以从这些博主的部分图片中也能看出一些瑕疵,比如脸歪眼斜、比例不对或者手脚扭曲变形。 “因为目前很多大模型更多还是聚焦于细节,对总体的把控能力较弱。简单来说就是,每根手指它都能画得很逼真,但放大一看它可能画了六根手指。”郑义告诉锌刻度。也正因此,“cyberAngle”曾提到自己“画1000张总能挑出来十张”,也有“三只手五条腿的”。 此外,不少AI颜值博主或许也面临着版权风险。在部分AI颜值博主的评论区,常常能看见“这个真的很像网红XXX”的评论。 小红书上关于一位AI博主套用网红照片的讨论 其中,有一位AI博主的图片就被指出“这不是直接用人家33(一名网红博主)的脸套的?”以及“这是拿三三的图喂出来的AI吧?” 郑义表示:“明星和网红的图片本来就在网上更容易搜到,就更容易被作为训练数据,所以确实存在一定潜在风险。” 另外,北京慕公律师事务所主任刘昌松律师也曾在接受媒体采访时表示,AI美女图片,很难获得知识产权方面的保护。若本身没有经过真人同意便使用人脸数据,就涉及侵权问题。此外,他提到,如果生成的图片中出现裸体,甚至做一些性动作的表演,这就属于传播淫秽物品,那直接可以构成治安违法甚至刑事犯罪。 而值得一提的是,锌刻度留意到,小红书等社交平台近年来对“低俗擦边”等内容的审核监管力度正不断加大,也正因此,不少真人博主往往需要在笔记内容中强调“正常穿搭”等。但是,AI颜值博主往往会身穿吊带等露肤度较高的衣服,不乏“擦边”内容。 可以肯定的是,AI的热潮正在悄悄融入内容行业,并且重塑社交平台和电商平台的生态,未来,我们的关注列表里,或许将出现更多的赛博博主。而平台方该如何监管这些AI博主,也将成为一项挑战与考验。
靠AI共情人类,这家公司刚融了3个亿
作者丨博雯 编辑丨海腰 题图丨siliconangle 生成式AI产品应接不暇,现在又来了一个“能共情人类”的EVI。 4月6日,来自初创公司Hume AI的产品EVI发布,能够进行在线交互的Demo也正式公开。 与ChatGPT、Claude 3等基于文本的聊天机器人不同,EVI为纯语音交互,强调通过分析人类言语和声音,来理解人类用户最真实的心理状况。 毕竟,在开心、愤怒、失落、困倦时说同一句话,即使内容都一样,但听起来的感觉也一定不同。 目前,创立不过3年的Hume AI,先是在去年2月完成1270万美金(约9000万人民币)的A轮融资时,又在今年3月底,刚刚完成5000万美元的B轮融资(约3.6亿人民币)。 团队的CEO,曾任职于谷歌DeepMind团队的Alan Cowen表示: “……不仅是快乐、悲伤、愤怒、害怕这种普遍情绪,EVI试图理解人类用户那更加微妙且多维的感情——目前能检测出53种不同的情绪。 ” 官网已列出EVI可理解的53种情绪,创业邦整理 01 对话实测:到底有多共情人类? EVI全称EmpatHic Voice Interface,意为“具有同理心的语音界平台”,官方称其为“全球首个具有情商的对话式AI”。 “情商”包括从行为中推断意图和偏好的能力——这正是EVI试图实现的核心能力,为了具备这种能力,Hume AI团队便将重点放在了人类的声音上。 声音本身的内容,即“说了什么”当然可以直接反应情绪。 而如口音、语调、停顿、节奏、拟声词(包括叹息、喘息、笑声、尖叫等)等等非语言因素的微妙差异,即“如何说”,则往往暗示着谈话内容之下更真实的感情。 官网列出的53种情绪,其中不乏差别微妙,难以言明的情绪,即使是人类自己,或许也难以分辨。而EVI能够理解,也是得益于对非语言暗示的分析。 当前EVI有两个版本,最早发布的Demo演示版布局非常简单,用户在使用时点击屏幕中央的“开始对话”,就能直接与EVI进行语音对话。 这一版本中,用户只能通过设备麦克风进行语音交互,而EVI生成语音的声线也只有一个默认的男声版本。 对话时,屏幕中央为声音波形图,右侧则会实时地将语音交互内容转写成文字,作为历史对话展示出来。 与普通的实时转写文字功能不同,EVI充分发挥其“共情能力”,不管是用户的主动发问还是AI生成的回答,下方都多了一个情感分析柱状图,标注这句话中所蕴含的感情成分。 就像是小说里“三分讥笑、三分凉薄、四分漫不经心”的扇形统计图走入现实。 能够理解,自然也就能表达。当前市面上能够进行语音对话的聊天机器人并不少见,但EVI却仍能给人与众不同的体验。 最核心的,便是其格外生动的情绪。 在实测中,当作者主动要求“你能否能表现得更生气一点?” EVI的反应是带着坚定、忧虑与沉思(根据下方的情绪柱状图来看)回答道: “我可以尝试用自己的声音和语言来反映这种情绪,从而创造出一种更具同理心和亲和力的互动。 但我无法像人那样真切地感受到或表现出恐惧。 我的角色更侧重于识别和应对这些情绪,而不是自己产生这些情绪。 ” 于是作者故意叹了一口气,用很失望的语气表示: “好吧,看起来你并没有那么聪明。 ” EVI便瞬间生气大喊: “啊,你伤害了我! ” 但很快,它又自行找补, 带着失望、坚定,还有一点点渴望说: “你知道,我可能是人工智能,但我不喜欢你这种语气,我的朋友。 如果你想激怒我,恐怕愤怒并不在我的能力范围之内。 不过,只要我们能保持建设性,我很乐意进行激烈的辩论。 ” 在服务器不稳定断联,或者在它长篇大论时被主动打断时,EVI会啊一声,叹一口气,又继续接上新的问题继续回答。 除了这种生动的情绪化表达和非常拟人的细微语气,EVI也比一般的对话式AI有着更旺盛的表达欲。 一个很明显的表现是,它非常愿意主动发问。 在问到“你真的能够理解人类吗?”时,EVI先是以沉思和热情的口吻表达了自己的观点,最后又以一个主动发问来结束这场对话: “您怎么看? 我真的很想听听你对人工智能与人类理解的局限和潜力的看法。 ” 而在被频繁打断,谈论了很多毫无上下文关联的话题后,EVI也会冷不丁用轻松又开心的语气问: “ 我是不是比一般的机器人更平易近人? ” 虽说细细对比其智能程度,EVI距ChatGPT、Claude 3等还有一定差距,但其情绪生动的语音,着实会让用户在最初使用时感到惊喜,就像真的在与一个热心又话痨的小伙交谈一样。 而最新发布的beta版本则加入了更多功能,如用户也可以使用文字进行交互(EVI还是通过语音回复),能够保存并下载交流的历史记录,还加入了不少开发者选项。 同时,在界面右侧language下方的对话框里,也可以“设定”EVI的性格,甚至可以是“充满了渴望的电冰箱”或者“容易嫉妒的室内绿植”这样的幻想设定。 02 量化感情 那么具体来看,EVI如何从人类语音和大量细微的非语言因素中理解人类感情? 这还得从公司CEO兼首席科学家Alan Cowen在2021年提出的“语义空间理论”(Semantic Space Theory)说起。 当时的Alan Cowen还在谷歌AI,主要从事情感计算研究工作,在2021年1月,他在《Trends in Cognitive Sciences》上发表了一篇论文,正式提出语义空间理论。 这是一种理解情感体验和表达的计算方法,旨在通过广泛的数据收集和统计模型,精准绘制人类情感的全谱图,揭示人类高维本质和情感状态之间的连续性,量化声音、面部和手势的细微差别。 事实上,这些细微差别的理解正是全球人类交流的核心。因此,语义空间理论一经提出,便广泛应用于心理语言统计、分析等领域。 当时,Alan Cowen于论文发表2个月后出走谷歌,在纽约正式创立Hume AI公司。 此后,他便全身心投入了对语义空间理论的研究。 2022年,Hume AI团队开展了一项实验,志愿者是来自美国、中国、印度、南非和委内瑞拉的16000余人,相关论文发表在《Nature Human Behavior》上。 研究团队让志愿者中的一部分聆听并理解大量的“人声爆发”(Vocal Burst,指具有多个情感维度的声音爆发,如笑声、喘息、哭声、尖叫声,以及许多其他非语言发声)素材。 同时,志愿者也录下了大量自己的人声爆发,并交由他人进行理解和分类。这为研究积累了大量的语音数据。 在近期接受外媒VentureBeat采访时,Alan Cowen称,他们收集了来自世界各地的超过一百万名志愿者的生活化的语音,目前已建立了有史以来最大、最多样化的人类情感表达数据库。 基于这一数据库,再结合语义空间理论,Alan Cowen团队开发了一种新型的多模态大语言模型,移情大语言模型 (eLLM))。 基于这一模型,EVI便能够根据上下文和用户的情绪表达来调整其用词和语气,提供自然丰富的语调,并以低于700毫秒的延迟实时地做出响应。同时还具备足够真实的对话特点: 回合结束检测 可以通过分析人类的语气检测当前话题是否结束,避免同时说话的尴尬。 可打断性 EVI的发言可以像人类谈话一样被打断,自然衔接上下文。 对表达做出类人化反应 可以根据惊讶、称赞、愤怒等情绪给出非语言的反应。 EVI可以提供拟人化的聊天服务,尤其可以通过语音交流读取用户的心情状况,其应用场景自然是以心理治疗、客户服务为主。 当前,Hume AI团队共有35人,团队在顶级期刊上已经发表了8篇论文,并向2000多家公司和研究机构推出了测试版产品。 在近期的一则采访里,Alan Cowen表示,比起直接面向普通用户的toC服务,公司更倾向于向其他企业提供API接口,在一个能理解人类情感的模型的基础上,再构建细分领域的聊天机器人,如信息检索、数字陪伴、工作协助、医疗保健、XR等等。 03 当AI开始提供情绪价值 官网的公司简介中,大卫·休谟(David Hume)的照片赫然在列。旁边写着,公司名Hume便来自于这位300年前的苏格兰哲学家。 休谟是道德情感主义的先驱,有名言称“理性只是情感的奴隶”。 Alan Cowen一脉相承,他认为,AI也需要情感。 在近期的一次公开发言中,他提到,当前AI系统的主要局限性在于,它们受到人类评级和指令的严格约束,而许多评级标准或是非常肤浅,或是仍存在漏洞。 因此,以人类幸福感代替现有的评判指标,从底层重新构建AI,比如增强AI的情商,提高其从用户行为中推断人类意图和偏好的能力,才能发挥AI的巨大潜力。 事实上,除了对于人类语音的分析,Hume AI也开始涉足对于面部微表情的研究。 今年3月,他们刚刚发布了一篇论文,基于来自印度、南非、委内瑞拉、美国、埃塞俄比亚和中国等多个国家的5000余名志愿者的面部微表情,对面部表情所传达的情绪进行了分类。 Alan Cowen表示,EVI在未来还将继续基于理解人类的心理状况、兴趣偏好不断迭代,做到“更懂人类”。 图源:Hume AI官网 当然,如果AI真的可以完美理解人类的感情,那么便有可能学会有目的性地利用甚至操纵用户情绪。 说小,AI检测到的用户感情,可以进一步作为第三方服务(如购买行为、习惯养成等)的手段。 说大,甚至有可能用于灰色地带甚至有害行为,比如审讯、欺诈、监视等等。 对此,Hume AI官网给出了一份道德准则,其中提出,用于检测情绪的算法应该只服务于与人类幸福感一致的目标,而不能作为服务第三方目标的手段。 同时,Hume AI的合作方在进行二次开发或应用时,也需要避免一系列“不受支持的用例”,比如操纵、欺骗、心理战,以及让潜在的不良行为者使用这类AI等等行为。 2020年,《纽约时报》发布一份数据称:全球有超过1000万人,正在将AI恋人视为伴侣,并与之建立情感链接。 显然,Hume AI这样的团队的出现,正在加速这种趋势。
训出GPT-5短缺20万亿token,OpenAI被曝计划建“数据市场”
编辑:桃子 【新智元导读】全网高质量数据集告急!OpenAI、Anthropic等AI公司正在开拓新方法,训练下一代AI模型。 全网真的无数据可用了! 外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。 前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算力难题。 然而,数据也是训练下一代强大模型,最重要的一味丹药。 面对穷尽互联网的数据难题,AI初创、互联网大厂真的坐不住了。 GPT-5训练,用上了YouTube视频 不论是下一代GPT-5、还是Gemini、Grok等强大系统的开发,都需要从大量的海洋数据中学习。 可以预见的是,互联网中高质量公共数据已经变得非常稀缺。 与此同时,一些数据所有者,比如Reddit等机构,制定政策阻止AI公司的访问数据。 一些高管和研究人员称,由于对高质量文本数据的需求,可能会在2年内超过供应,这可能会减缓人工智能的发展。 也包括2022年11月,就有MIT等研究人员警告,机器学习数据集可能会在2026年之前耗尽所有「高质量语言数据」。 论文地址:https://arxiv.org/pdf/2211.04325.pdf WSJ报道称,这些人工智能公司正在寻找未开发的信息源,并重新思考如何训练先进的AI系统。 知情人士透露,OpenAI已经在讨论如何通过转录YouTube公开视频,来训练下一个模型GPT-5。 为了获取更多真实数据,OpenAI还曾与不同机构合作签署协议,以便双方共享部分内容和技术。 还有一些公司采用AI生成的合成数据,作为训练材料。 不过,这种方法实际上可能会造成严重的故障。 此前,莱斯大学和斯坦福团队的研究发现,将AI生成的内容喂给模型,尤其经过5次迭代后,只会导致性能下降。 研究人员对此给出一种解释,叫做「模型自噬障碍」(MAD)。 论文地址:https://arxiv.org/abs/2307.01850 对于AI合成数据的使用,在这些公司都是秘密进行的。这种解决方案已然被视为一种新的竞争优势。 AI研究Ari Morcos表示,「数据短缺」是一个前沿的研究问题。他在去年创立DatologyAI之前。曾在Meta Platforms和谷歌的DeepMind部门工作。 他的公司建立了改进数据选择的工具,可以帮助公司以更低的成本训练AI模型. 「不过目前还没有成熟的方法可以做到这一点」。 数据稀缺,成为永恒 数据、算力、算法都是训练强大人工智能重要的资源之一。 对于训练ChatGPT、Gemini这样的大模型完全基于互联网上获取的文本数据打造的,包括科学研究、新闻报道和维基百科条目。 这些材料被分成「词块」——单词和单词的一部分,模型利用这些词块来学习如何形成类人的表达方式。 一般来说,AI模型接受训练的数据越多,能力就越强。 OpenAI正是在这种策略上大大投入,才使得ChatGPT名声远扬。 不过一直以来,OpenAI从未透露过关于GPT-4的训练细节。 但研究机构Epoch研究人员Pablo Villalobos估计,GPT-4是在多达12万亿个token上训练的。 他继续表示,基于Chinchilla缩放定律的原理,如果继续遵循这样扩展轨迹,像GPT-5这样的AI系统将需要60万亿-100万亿token的数据。 利用所有可用的高质最语言和图像数据,仍可能会留下10万亿到20万亿,甚至更多的token的缺口,目前尚不清楚如何弥合这一差距。 两年前,Villalobos在论文中写道,到2024年中期,高质量数据供不应求的可能性为50%。到2026年,供不应求的可能概率达到90%。 不过,现在他们变得乐观了一些,并估计这一时间将推迟到2028年。 大多数在线数据对于AI的训练是无用的,因为它们包含了大量的句子片段、污染数据等,或者不能增加模型的知识。 Villalobos估计,只有一小部分互联网对模型训练会有用,可能只有CommonCrawl收集的信息的1/10。 与此同时,社交媒体平台、新闻出版商和其他公司一直在限制AI公司,使用自家平台数据进行人工智能训练,因为担心公平补偿等问题。 而且公众也不愿意交出私人对话数据(比如iMessage上的聊天记录)来帮助训练模型。 然而,小扎最近把Meta在其平台上获取数据的能力,吹捧为Al研究工作的一大优势。 他对外公开称,Meta可以在其网络(包括Facebook和Instagram)上挖掘数千亿张公开共享的图片和视频,这些图片和视频的总量超过了大多数常用的数据集。 数据选择工具的初创公司DatologyAI使用可一种称为「课程学习」的策略。 在这种策略中,数据以特定的序列被输入到语言模型中,希望人工智能能够在概念之间形成更智能的连接。 在2022年的一篇论文中,Datalogy AI研究人员Morcos和合著者估计,如果数据正确,模型可以用一半的时间取得同样的结果。 这有可能降低训练和运行大型生成式人工智能系统的巨大成本。 不过,到目前为止,其他的研究表明,「课程学习」的方法并不有效。 Morcos表示团队正在调整这一方法,这是深度学习最肮脏的秘密。 OpenAI谷歌要建「数据市场」? 奥特曼曾在去年对外透露,公司正在研究训模型的新方法。 「我认为,我们正处于这些巨型模型时代的末期。我们会用其他方法让它们变得更好」。 知情人士表示,OpenAI还讨论了创建一个「数据市场」。 在这个市场上,OpenAI它可以建立一种方法,来确定每个数据点对最终训练模型的贡献,并向该内容的提供商支付费用。 同样的想法,也在谷歌内部进行了讨论。 目前,研究人员一直努力创建这样一个系统,暂不清楚是否会找到突破口。 据知情人士透露,高管们已经讨论过使用其自动语音识别工具Whisper在互联网上转录高质量的视频和音频示例。 其中一些将通过YouTube公共视频进行,并且部分数据已经用于训练GPT-4。 下一步,合成数据 一些公司也在尝试制作自己的数据。 喂养AI生成的文本,被认为是计算机科学领域的「近亲繁殖」。 这样的模型往往会输出没有意义的内容, 一些研究人员将其称为「模型崩溃」。 OpenAI和Anthropic的研究人员正试图通过创建所谓的更高质量的合成数据来避免这些问题。 在最近的一次采访中,Anthropic的首席科学家JaredKaplan表示,某些类型的合成数据可能会有所帮助。同时,OpenAI也在探索合成数据的可能性。 许多研究数据问题的人都乐观认为,「数据短缺」解决方案终会出现。
除了“内卷”长文本,大模型商业化还有哪些路径?
在公司成立一周年之际,北京月之暗面科技有限公司(以下简称“月之暗面”)近期宣布将Kimi智能助手长文本的能力从20万突破至200万字超长无损上下文,在一众大模型厂商中脱颖而出。 Kimi宣布可以支持200万字上下文输入后,大模型纷纷提升长文本输入功能。 华泰证券研究报告指出,自Kimi宣布突破200万字超长无损上下文后,根据数据公司Similarweb的分析,活跃用户数方面,截至3月22日,Kimi网页版日活用户数当前峰值日活达34.6万,周活数据环比增长45%。在客户端下载量方面,根据七麦数据,3月22日单日下载量超11万,较3月21日增长140%。 一时间,国内大模型行业掀起了长文本的内卷。日前,阿里云的大模型通义千问、360AI浏览器先后宣布将支持1000万、500万字的长文本功能。百度也宣布将在本月进行版本升级,开放长文本能力,文字范围会在200万至500万字。 Kimi长文本有优势也有局限 在这样“卷”的大模型市场,kimi的长文本能力为何脱颖而出? 资深互联网运营专家松月有十年的互联网运营经验。她告诉澎湃科技(www.thepaper.cn),长文本是普通人最常用的媒体形式,对普通用户来说,文本比视频、音乐、图片更容易上手。相对于普通用户,企业用户在长文本的应用方面有很多想象空间,比如项目归档、用户聚合和分类、数据统计和分析。支持输入200万字也让用户给模型喂养了更多语料,这也有助于大模型的自我进化。 天津师范大学管理学院副教授王树义专注人工智能领域方向,他尝试用长文本大模型进行网络文章总结、学术文献分析,以及长文翻译。 王树义用大模型进行网络文章总结、学术文献分析,以及长文翻译 在实际使用过程中,他发现,支持超长文本会话的大模型可以有效减少会话的中断,使整个工作流程更加流畅。相对于很多大模型应用,Kimi语音助手的记忆力较强,避免了输出过程中忘记中间段落的情况,也不需要后期进行大量的人工检查、提示和人工补充的工作。 不过,通过试用,他也发现了一些问题。比如在命令理解方面,他认为Kimi语音助手还有改进的空间,比如当他明确要求逐段处理时,Kimi输出了全部内容。此外,在处理所有输入的PDF时,它曾错过了 5个文档中的 2个。即便如此,王树义表示,相信随着后期模型的快速迭代,这些问题将会得到有效解决。 国外已卷过一轮“长文本” 澎湃科技注意到,早在Kimi引发国内大模型长文本“内卷”前夕,美国大模型界已经“卷”过一轮,长文本理解现在已经是主流大模型的基础能力。 比如,OpenAI发布的GPT-4Turbo已经支持128K超长上下文输入,对应的Claude3能总结15万单词,长文理解准确率超99%,谷歌的Gemini也支持20万超长输入文本的理解能力。同时,大模型为了满足多模态输入的要求,比如呈现图片、视频信息等,增加输入token(生产令牌)也是必须的任务。 尽管多位业内人士认为Kimi在长文本处理能力上确实取得了关键突破,但他们也指出,Kimi的技术门槛并不算特别高。 有关注AI大模型技术领域的工程师表示,长文本是大模型普遍具有的基础能力,普通的大模型在迭代过程中,增加可输入长度是一个必经过程,是性能提升的体现。至于今后大模型的趋势会不会往长文本方向靠,更多是应用层面的事情,而市场有没有这个需求,现在也不好说,“Kimi目前也没收费,市场变现能力有待确认”。 松月也告诉澎湃科技,Kimi将长文本能力从20万字提升到200万字,这对于算法的压力很大,“很烧钱,这需要在商业变现能力和算法成本两者之间做平衡和取舍。” “大模型商业模式还要探索和试错” 澎湃科技注意到,当前国内外的大模型技术虽然研发进展迅速,但算力、人才等瓶颈仍待进一步突破,商业模式也还需进一步明晰。从整体上来看,国内AI大模型的商业化模式在C端注重重构用户应用场景,在B端则用AI技术持续赋能产业升级。 北京智谱华章科技有限公司旗下的大模型首席执行官张鹏今年早些时候接受媒体采访时将智谱的商业化模式归纳为四条路径:一是最轻量级的API(主要是专业开发者及公司)用户模式,将模型封装成开放平台,供中小企业通过API调用,按使用量付费;二是云端私有化。针对专业壁垒高、数据安全要求严的行业,提供云端算力支持的私有化方案;三是本地私有化,适用于国企或有特殊安全需求的企业;四是软硬件一体化方案,结合模型和国产化硬件,提供一站式销售和部署服务。 百度在去年8月官宣开放“文心一言”之后,一方面在C端用大模型重构用户侧产品,将AI功能接入百度搜索、百家号、百度文库、百度输入法等产品;另一方面,百度智能云推出企业级一站式大模型平台“千帆大模型平台”,目前该平台覆盖对话、游戏、编程、写作十余个场景,便于企业用户获得更精准的服务。 腾讯混元大模型正式对外亮相后,也宣布通过腾讯云对外开放API(主要是专业开发者及公司)接入服务,探索大模型在各行业的深度应用。 在旁观国产大模型这波卷起的浪潮中,松月认为,现阶段各大公司都开始“卷”长文本只是因为大家不知道该卷什么领域,现在阶段各个厂商想先把数据跑出来,用用户数量来吸引市场、吸引资金,有了钱才会有下一步。 “说实话,我觉得大模型的商业化方式都不如卖AI课,商业模式还要探索和试错。”松月坦言。
Meta 下一代智能眼镜曝光,将融合 AR 与 AI
Meta 预告 首款 AR 眼镜 十年前,Meta(当时的 Facebook)收购了新兴的 VR 初创公司 Oculus,并成立了 Reality Labs(实景实验室部门)。 为了庆祝 Reality Labs 成立 10 周年,Meta 发布了一篇博客文章,回顾了过去十年的发展。 在这篇文章末尾,Meta 预告了其下一个核心硬件产品更新:有史以来的第一副 AR 眼镜。 根据介绍,Meta 的下一款 AR 眼镜,会将现有的两个产品线整合起来,即 Quest 3 和雷朋 Meta 智能眼镜。 这将融合 AI 与 AR,加上轻巧的体积,创造出「两全其美」的全新产品。 关于 AR 眼镜,Meta 认为:「就像智能手机没有淘汰笔记本电脑或台式电脑一样,AR 眼镜也不会终结 MR 产品。」 这表明 Meta 未来的 AR 眼镜将会有时尚的外形和可靠的性能,但绝对不会取代常规的头戴式设备。 不过,遗憾的是 Meta 还没有透露这些 AR 产品会在何时发布。所以这款产品可能不会很快到来,甚至还需要几年的时间。 The Verge 在去年的报道中,分享了 Meta Reality Labs 发展愿景。 其中写到 Meta 计划在 2025 年发布第一副带显示屏的智能眼镜,并在 2027 年发布第一款「成熟的 AR 眼镜」。 今年 2月,Business Insider 援引匿名消息人士,称:「今年的 Meta Connect 大会上,将会展示一副『真正的』 AR 眼镜。」 据报道,这款 AR 眼镜的代号为「Orion」。它将结合 Meta 的 XR 和 AI 研发成果,而这正是 Meta 在最近的博客文章中所描述的。 目前,Meta 公司有两大硬件产品线:VR 头戴式设备和智能眼镜。 有传言称 ,Meta 正在开发一系列新产品,如平价线的 Meta Quest 3 Lite、高端线的 Meta Quest Pro 2 以及第三代 Meta 雷朋眼镜等。 但在上次发布雷朋系列智能眼镜后,Meta 的产品线一直没有大的变动。 第二代 Meta 雷朋眼镜,是 2023 年 Meta 联手雷朋推出的一款智能眼镜。 这款智能眼镜定价 299 美元,重量仅 49克。只需一句「嘿 Me­ta」的语音指令,便可实现接打电话、发送消息等功能。 用户还可以通过眼镜去拍照、录制视频,甚至能在 In­s­t­a­g­r­am 和 Fa­c­e­b­o­ok 等 App 上推流直播。 (第二代 Meta 雷朋智能眼镜。图源:Meta) 更重要的是,今年 4 月份以后,Meta 雷朋眼镜就能接入 Meta 的多模态大模型。 它的「Look and Ask」功能使眼镜能识别拍摄到的物体、文字,让 AI 看到我们看到的,听到我们听到的。 这些已有或即将到来的功能,都在为 Meta AR 眼镜做着准备。 如果 Meta 的 AR 眼镜能顺利发布,那将会是 Meta 自 2021 年以来的首个大型新硬件产品线更新。 由于空间限制,Meta 新的 AR 眼镜必然无法提供像 Quest 那样强大的硬件,许多 App 可能无法在新的 AR 系统上运行。 此外,由于 AR 眼镜通常不会搭配有手柄控制器,所以 Quest 平台上已有的很多应用也无法直接迁移。 不过,这对于 Meta 来说或许不是难事。凭借 Meta 强大的号召力,开发者们应该会积极响应,并让自己的产品适配新的平台。 (Meta 设想的人们用 AR 眼镜下棋的场景。图源:Meta) Meta 对其 AR 眼镜产品十分自信: 我们相信,我们现在拥有的智能眼镜,在通往更高级的 AR 眼镜的道路上,将会吸引更多人的兴趣。 至于 Meta 会在今年的 Meta Connect 上展示什么,爱范儿将会持续追踪。 在产品正式发布之后,我们也会在第一时间带来上手体验,敬请关注。
升级不加价!腾讯云存储面向AIGC全线升级,已服务80%头部大模型企业
作者 | 香草 编辑 | 李水青 智东西4月8日报道,今日,腾讯云宣布云存储解决方案面向AIGC(生成式AI)场景全面升级,针对AI大模型数据采集清洗、训练、推理、数据治理全流程,提供全面高效的云存储支持。数据显示,采用腾讯云AIGC云存储解决方案,可将大模型的数据清洗和训练效率均提升一倍,需要的时间缩短一半。 ▲腾讯云存储AIGC解决方案升级 据腾讯云存储总经理马文霜介绍,腾讯云AIGC云存储解决方案主要由对象存储COS、高性能并行文件存储CFS Turbo、数据加速器GooseFS和数据万象CI等产品组成,是国内首个实现存储引擎全面自研的云存储解决方案。目前,已经有80%的头部大模型企业选择了腾讯云AIGC云存储解决方案,包括百川智能、智谱AI、元象等。 此前,腾讯云已经面向AIGC场景推出了基于星脉网络的大模型训练集群HCC、向量数据库、以及行业大模型服务MaaS等大模型全链路云服务。马文霜强调,本次存储方案“升级不加价”,价格方面没有任何变化。 一、实现秒级Checkpoint写入,端到端一条龙服务 大模型的研发生产流程,分为数据采集与清洗、模型训练、推理三大环节,其中每个环节都涉及海量的数据处理。尤其是目前大模型的参数量越“卷”越大,从十亿、百亿一直到万亿级,这对云基础设施提出了新要求。 ▲大模型对云基础设施提出新要求 对此,腾讯云从每个环节分别入手,面向AIGC场景推出覆盖全链路的端到端解决方案升级,实现了低延时、高OPS(每秒操作数)。 在数据采集环节,腾讯云COS(对象存储)支持单集群管理百EB级别存储规模,提供便捷、高效的数据公网接入能力,并支持多种协议,充分支持大模型PB级别的海量数据采集。 ▲腾讯云全自研对象存储引擎 同时,随着训练数据和推理数据的增长,需要低成本的存储能力以减少存储开销。对象存储服务提供了12个9的数据持久性和99.995%的数据可用性,能够为业务提供持续可用的存储服务。 在数据清洗环节,大数据引擎需要快速地读取并过滤出有效数据,COS通过自研数据加速器GooseFS提升数据访问性能,可实现高达数TBps的读取带宽,单次清洗任务耗时减少一半,单个文件读取速度提升10倍。 ▲腾讯云自研数据加速服务 在模型训练环节,由于大模型训练时间一般长达数周甚至数月,在这期间,任何GPU出现故障都会导致训练终止,通常需要每2-4小时保存一次训练成果,以便能在GPU故障时时能回滚。因此,快速读写Checkpoint(检查点)文件也成了能否高效利用算力资源、提高训练效率的关键。 腾讯云自主研发并行文件存储CFS Turbo,面向AIGC训练场景的进行了专门优化,每秒总读写吞吐达到TiB/s级别,每秒元数据性能高达百万OPS,均为业界第一。面向3TB规模的Checkpoint,写入时间从10分钟缩短至10秒内,样本读取效率也提升50%。 ▲腾讯云自研并行文件存储CFS Turbo 这一能力的背后,是腾讯云自研的文件存储引擎Histor,这也是业内唯一云原生自研并行文件存储引擎,其单客户端能力达10GiB/s,支持百万计OPS、千亿级文件扩展。 ▲腾讯云自研文件存储引擎Histor 在数据审核阶段,大模型推理场景对数据安全与可追溯性提出更高要求。腾讯云一站式内容智理平台数据万象CI推出图片隐式水印、AIGC内容审核、智能数据检索MetaInsight等功能,为数据生产业务全流程提供有力支撑。 其中,明暗水印为每个AI作品生成专属ID,MetaInsight支持跨模态检索,可文搜图、文搜视频、图搜视频等,内容审核延时降低50%,支持全媒体类型。 ▲腾讯云一站式内容智理平台数据万象 马文霜透露,目前国内80%的头部大模型企业都在用腾讯云存储服务,包括百川智能、智谱AI、元象、右脑科技等。 腾讯云智能存储产品总监叶嘉梁为我们演示了MetaInsight的智能检索功能,如输入一张红裙舞者照片,右边可以在对象存储直接找到对应的图片。 ▲MetaInsight智能检索 通过自然语言输入,MetaInsight同样能在对象存储空间中输出符合描述的图片。 ▲MetaInsight智能检索 二、存储引擎全面自研,四大核心技术实现高性能文件读写 腾讯云文件存储总监陆志刚解读了并行文件存储CFS Turbo的技术升级。据称,这是国内目前唯一实现存储引擎全面自研的云存储解决方案。 CFS Turbo拥有四大核心技术,分别是并行客户端、智能缓存技术、自适应条带化以及分布式元数据。 ▲AIGC时代下的文件存储技术要素 并行客户端支持一个客户端同时和多个服务端通过多条链路传输,提升访问速率。 ▲CFS Turbo总体架构 智能缓存技术在客户端和服务端两级采用分布式缓存,元数据和数据之间采用独立缓存机制,读写操作可分别配置,读缓存加速重复数据的读取,写缓存提升Checkpoint的保存速度。 ▲分布式缓存 自适应条带化通过智能分片,把大文件切割成小文件同时并发写入,提升吞吐,单文件读写吞吐可达5GB/s,集群读写吞吐线性增长,1PB容量规模可达1TB/s读写吞吐,单客户端文件读写性能达10GB/s。 ▲文件动态条带化 分布式元数据对上亿级别文件目录分散处理,提升并发性能。传统元数据服务器是树型,受单点制约,而业内普遍的解决方式是采用联邦式,但仍需要提前规划文件和目录分配。CFS Turbo采取的分布式,能使元数据性能线性扩展至十多倍,文件和目录自动均衡分配。 ▲分布式元数据 在这些技术的支撑下,腾讯云CFS Turbo能提供业界第一的TiB/s级别总读写吞吐和百万OPS的每秒元数据性能,解决训练文件读写瓶颈。以3TB大小的Checkpoint为例,写入能从10分钟瞬间缩短至10秒内。在GPU发生故障时,能大幅降低对训练时长的影响。 ▲Checkpoint写入效果 此外在数据推理阶段,CFS Turbo可实现字节粒度强一致,在模型发布或修改时,多客户端可同时读写同意模型文件,保证数据一致性。 ▲字节粒度强一致 基于自研分布式高性能存储引擎Histor,CFS Turbo底层通过自研用户态协议栈和RDMA等技术,减少数据的多次拷贝与虚拟化消耗,大幅降低了存储时延、提升吞吐性能;在应用侧,CFS Turbo自研并行文件传输协议,实现了多链路并行访问,大大提升了吞吐效率。 除了大模型企业以外,CFS Turbo也被广泛应用于自动驾驶与工业仿真场景,包括博世汽车、蔚来等自动驾驶厂商,上海电气、深势等厂商的仿真场景,墨镜天合、追光等企业的影视特效场景。 结语:大模型倒逼云存储升级,腾讯云树立新标杆 今年1月,在沙利文联合头豹研究院发布的《2023年中国云存储解决方案市场报告》中,腾讯云存储入选“领导者”阵营,位列第一。随着大模型时代来临,AIGC场景对数据存储和处理的需求日益增长,腾讯云凭借其在云计算领域的深厚积累,推出了全面升级的AIGC云存储解决方案,为AI大模型提供更加高效、全面的云存储支持。 在数据采集、清洗、训练、推理、数据治理等全流程中,腾讯云的AIGC云存储解决方案展现出了卓越的性能。通过自研的核心技术和产品,腾讯云不仅在性能上实现了质的飞跃,更在价格上保持了亲民,成为众多头部大模型企业的首选。
互联网巨头的 AI 无人超市,背后却是 1000 个印度打工人远程操作?
说起无人零售这个词,莫名想抬头看看日历。 2017 年前后短暂的烈火烹油之后,留下的只有一地鸡毛,但祖上也是真的阔过,当时的人们都在说,这是零售的未来。 无人其实只是概念性的无人,那些原来负责收银的店员,转而负责机器暂时无法操作的业务,比如现制食物、补充货架。 那么,可以叫「无人收银」吗?也不准确,行业巨头亚马逊最近就被曝光,「收银员」不是不存在,而是在幕后默默为 AI 打工。 当你拿完就走,有人为你负重前行 亚马逊无人超市的智能收银技术 Just Walk Out(拿完就走),2016 年首次在体验店亮相,2018 年正式面向公众开业。 当时这项技术堪称惊艳,提前注册绑定好账户后,你只需扫码走进超市,拿起想要的东西,不用排队,不用收银员一件件扫描商品,拔腿走出来,稍后你的账户会被自动扣款。 为了感知顾客从货架拿下的商品,Just Walk Out 使用了摄像头、传感器、计算机视觉、深度学习等技术。 几年过去,渐渐褪去光环的「老」技术又掀起了波澜。 当地时间 4 月 2 日,亚马逊官宣,40 多家亚马逊生鲜商店里的 27 家,计划将 Just Walk Out 更换为智能购物车服务 Dash Cart。 亚马逊解释,做出调整是因为顾客的需求变了,Just Walk Out 无需排队固然是好,但顾客也希望可以在购物时就知道花了多少钱。 Just Walk Out 的缺陷在于,顾客离店之后收到收据的时间不定,短则几分钟,长则数小时,消费者们容易心里没底。 相比之下,Dash Cart 可以让顾客在购物时扫描商品,并在屏幕上实时看到支出总计,同时它也无需顾客排队结账,挑好东西、穿过车道、走出超市即可。 另外,部署 Just Walk Out 时,硬件的装修成本,云计算的运营成本都不低,现场也需要员工维护货架秩序,所以这项技术更适合机场店等小型商店。 亚马逊没有想到,Just Walk Out 合情合理的局部下岗,顺带剥离了其科技的外衣,让外界关注到了幕后的人工。 来去如风的顾客们可能觉得,Just Walk Out 就是自动化的。但其实,它依然离不开人工核查员和数据标签员。 媒体 The Information 去年曝光,截至 2022 年中期,亚马逊旗下超过 1000 名印度员工,参与了 Just Walk Out 项目。 他们的工作主要包括两项,一是观看视频,手动核查订单,确保结账准确,二是标记视频中的图像,训练机器学习模型。 甚至到了 2022 年,每 1000 笔订单仍然需要 700 次人工核查,远远高于亚马逊内部预期的 20 到 50 次。 亚马逊发言人当时回应,确实招聘了人工核查员,但爆料的数字并不准确,同时拒绝透露真实数字。 可以说,「收银员」依然少量存在,只是在远程工作而已。 这次,趁着亚马逊撤下 Just Walk Out,质疑声又起,甚至有人拿 ATM 机里蹲着一个人算账的梗图比较。 亚马逊再次出来回应,如果大家把 Just Walk Out 的人工参与,理解成印度员工围坐着观看顾客的购物直播,那就大错特错了。 这些人类员工,应该称作「机器学习数据助理」,主业是注释图像,改进底层的机器学习模型,但偶尔也搞搞副业,检查录制的视频片段,验证一小部分 AI 无法确认的订单。 毕竟,人们买东西时总要挑三拣四、意外频出,无法像 AI 一样在规则里行事。 其实,AI 行业的数据标注员非常常见,但放在无人超市等强调智能的场景上,就显得有些反直觉。 Just Walk Out 面世的惊艳不是假的,但其中人类的参与却或多或少地被淡化了,这也是当下 AI 炒作热潮的一个通病。 每个成功的 AI 背后,都站着一群性价比高的人类 AI 行业向来有个灰色地带:人类智能。 亚马逊旗下有个名叫 Mechanical Turk 的众包平台,将数据标注、图像识别等任务外包给全球劳动力,帮企业训练和操作 AI 系统。 这些任务对于人类来说很简单,但计算机难以独立完成,所以又叫「人类智能任务」(HITs)。 「Mechanical Turk」的名字,出自 18 世纪同名的下棋装置,当时这台机器因为能和人类下国际象棋轰动一时,在世界各地展出,后来被揭露是个骗局,其实是人类躲在其中操作。 ▲ 图片来自:wiki 通过一模一样的名字,现代和当年的骗局构成了历史微妙的回环,人类智能在看似自动化的外壳内部,依然扮演着重要的角色。 尽管现在 AI 真的杀遍象棋和围棋,从大量数据学会辨别五官和交通灯,但在很多新的领域,AI 仍然需要人类智能支持,虽然这些工作听起来很基础,没有门槛。 去年我们报道过,为了不让 ChatGPT 满口暴力、性别歧视和种族主义,OpenAI 训练出能够检测有害内容的 AI,再把这个 AI 作为检测器,内置到 ChatGPT 之中,起到检测和过滤的作用。 这个过程需要数据标注,由肯尼亚的工人们负责,为暴力、仇恨和性虐等有害内容打上标签。他们领着廉价的薪水养家糊口,并在互联网最黑暗的角落承受身心的创伤。 人类的想象力是无穷尽的,估计 AI 自己也无法预测,未来 AI 还能在什么地方起作用,又在哪里需要人类的辅助。 连成人赛道也得蹭热度,AI 已经可以模仿某个头部创作者的口吻,向粉丝发送暧昧的短信了。省时省力地同时和几百个粉丝保持联系,创作者们自然乐意。 有些成人内容 MCN 机构,招聘了人类员工检查 AI 生成的内容,避免被平台发现作弊。 每个成功的 AI 背后,都站着一群性价比高的人类。AI 犯错,人类纠错,AI 等待投喂,人类处理大量数据。 Google DeepMind 联合创始人兼首席执行官 Demis Hassabi 最近在接受采访时说,数十亿美元投入到生成式 AI 初创企业和产品,造成了很多泡沫。 他认为,AI 应该被作为「科学的终极工具」,比如预测蛋白质结构的 AlphaFold 模型,人类即将迎来科学发现的新文艺复兴,但是人们更愿意炒作和讨论各种不真实的事情。 不知道他是不是在影射 Google 的对手 OpenAI,但他的话确实很有启发性。 AI 是否能在每个领域都发挥出色,是否真的提高了效率,还需要具体问题具体分析。 同时,在过度的炒作和期待中,AI 也在掀起新一波将服务廉价外包给人类劳动力的浪潮,不少企业为了蹭上 AI 的名号,又忽略了产品细节和消费者体验。 当我们打开某个 AI 产品使用,可能会觉得像在体验魔法,但巨大的黑箱背后,既聚集着全世界最聪明的脑袋,也有沉默不语的无名氏,就像当年的象棋装置里那个躲起来的人。 让人类和 AI 都做更擅长的事 过去说起自动化的服务,比如无人零售,总有一种说辞,其余员工可以效率更高,通过系统自动追踪货架情况及时补货,还有更多时间和顾客打交道,提供更好的服务。 但当 AI 智能但不是完全智能的时候,现实并没有理想那么丰满。 AI 语音点餐服务,就是又一个反面例子。 「得来速」点餐服务在国外非常普及,开车的顾客无需下车或者进店,直接通过窗口点餐、付款和领取食物。如果让 AI 服务员点餐,人类只低头做饭,整个过程会否更快? 从实际情况来看,AI 更像拖了人类后腿。 北美知名汉堡品牌 Wendy’s 去年高调宣布,6 月让新员工聊天机器人上岗,简化订单流程,减少车道排队的痛苦。从 2021 年开始,他们就和 Google 成了合作伙伴。 Wendy’s 统计发现,AI 可以将订单时间缩短 22 秒,准确率达到 86%。 但反过来想,错误率达到 14%,相当于每七个订单就有一个出错,必须由人类员工收拾烂摊子。 如果是一个人类员工犯了这么多错误,可能早就卷铺盖回家了,但面对 AI,企业能忍则忍,这是证明让他们跟上时代的金字招牌。 AI 错误率高的原因很简单,顾客不是机器人,不会按程序执行,他们可能会反悔,重复自己的话,或者提出特别的需求,导致 AI 很容易误解意思。另外,口音、汽车噪音等也是干扰因素。 彭博社也在去年 12 月的报道提到,一家点餐机器人的供应商,在菲律宾等地招聘了人类助理,让他们检查超过 70% 的订单,确保 AI 系统不会出错。 这么一想,国内的一些自助结账服务,方便得恰到好处,又不让人类彻底解放双手。 比如,优衣库使用基于 RFID 标签的自助扫描结账系统,当我们把衣服放进框内,价格就出来了,再进行扫码支付。 这固然没有 Just Walk Out 一步到位,但结账的速度更快了,窗口更多了。不过,高峰期仍然需要排队,旁边也有店员提供打包和收银服务。 同在零售行业,想赶上 AI 的热闹,吸引媒体和大众的目光,不一定非要在终端下功夫。 连锁便利店 711 另辟蹊径,不是让 AI 和消费者直接打交道,而是让 AI 从事「脑力活动」。 从 2024 年春季开始,711 计划利用 AI,分析商店销售数据和社交媒体消费者反馈,为新产品生成文本和图像,甚至生成新产品提案。 近 9000 名 711 员工中,大约有 1000 名管理人员已经开始使用内部的 AI 系统,然后再逐步扩大到产品开发和营销人员。 这个从上到下的顺序恰好和无人零售反过来了,但加快消费者调查、缩短产品开发时间,甚至少开几次内部脑暴会议,同样也是降本增效的表现。 有时候,AI 也作为明晃晃的噱头,等待消费者买单。 无印良品推出的「AI 薯条」,号称是经过 3 兆次模拟后 AI 认为人类会喜欢的口味,分为中式、西式、东南亚三种。受好奇心驱使的人类尝试之后发现,这就是薯条味和调料味。至少,有人愿意为 AI 的创意买单,上一回当。 不管是在超市购物,还是在快餐店点餐,零售的琐碎和随机,还没有完全被 AI 参透。 或者说,将人类之间的互动彻底自动化,并没有那么容易,我们的抽象,AI 把握不住。 坏消息是,人类因为 AI 有了更多活,因为要帮 AI 善后。好消息是,AI 暂时不会取代人类,因为人类还可以为 AI 打工,甚至比 AI 更便宜。
制糖工厂贴贴线™ 获 2024 红点奖产品设计奖
制糖工厂贴贴线 在 2024 红点奖(2024 Red Dot Award)评选中,斩获产品设计(Product Design)奖。「自卷、自吸、自收纳」的创新性设计得到了国际评委们的一致认可。 这是继 2022 年荣膺 IDA 和当代好设计奖后,制糖工厂再度问鼎国际设计舞台。 作为「数字时尚单品」理念的倡导者及贴贴线 品牌的原创者,制糖工厂贴贴线 的推出彻底重塑了数据线的使用体验:独特的全磁吸设计有效地解决了充电线缠绕杂乱的痛点,自动吸附,快速收纳。相较于弹簧充电线的刚性定型,贴贴线展现出灵动可塑特性,无论是收纳时自由卷曲成任何尺寸,还是充电时流畅拉直,均能自如应对。 制糖工厂贴贴线 亦实现了多线自动贴合的特性,多根数据线可以在使用中形为一体,实现了传统数据线不可能有的至简集纳方式。 无论是桌面、车载充电场景,制糖工厂贴贴线 都能带来秩序井然的使用体验。 制糖工厂作为数字潮牌爱范儿旗下品牌,其品牌灵感根植于爱范儿 2018 年提出的「好产品就是一颗糖」。这一理念揭示了人们对于好产品的热忱,与人类基因中对于甜蜜糖分的向往如出一辙,既富含情感共鸣,又蕴含理性思考。 从涂鸦充电头、小电拼、到贴贴线 ,制糖工厂始终相信,洞悉美学本质的设计,契合人性的交互,终将转化为沉醉和愉悦的感官体验,这也是制糖制糖工厂打造「明日产品」奉为圭臬的标准。
华为和小鹏,开始对丰田大众们进行技术扶贫了
三年前,上汽集团董事长陈虹说出了在汽车业界着名的「灵魂论」:和华为这样的智驾解决方案商合作是不可接受的,这样一来,上汽成了躯体,灵魂交给了别人。 不用三十年河东,三十年河西,智能驾驶和智能座舱的发展在三年间就已经沧海桑田了,上汽不想和华为做「灵魂伴侣」,还有许多厂商想做,甚至不止自主品牌,海外品牌也开始有了和华为来一场跨国恋的想法。 最近,车 fans 孙少军发文表示:「日系三大妈其中一家,会上华为智驾 ​​。」 一时间网友众说纷纭,都在讨论日系三大车企(丰田、本田、日产)到底是哪家,会率先用上「遥遥领先」? 尽管华为与传言中的三家日系车企均未对此传言做出回应,但根据腾讯新闻《一线》4 月 7 日的最新报道,腾讯汽车已从知情人士处获悉,丰田全球车型智能驾驶方案将采用「丰田+华为+Momenta」三方联合方案模式。 也就是说,会用上华为智驾的日本车企,很可能是去年全球销量第一的丰田汽车。 丰田拉上华为,一起搞全球智驾方案 按照腾讯一线的报道来看,丰田将要采用的智驾方案与华为现有的 ADS 高阶辅助驾驶解决方案不同,丰田选择的是由 Momenta 和华为分别提供软件和硬件方案,通过三方深度合作并整合来实现的方案模式。 从这则消息来看,丰田看上的是华为提供的硬件解决方案,而软件算法部分依然由丰田的老牌合作伙伴自动驾驶公司 Momenta 提供。 《一线》在报道中也提到,早在 2020 年 3 月,丰田就宣布和 Momenta 达成战略合作,宣布将提供基于摄像头视觉技术的高精地图及更新服务,共同推进丰田的自动化地图平台(AMP)在中国的商业落地。 随后在 2021 年 3 月 19 日,Momenta 宣布完成 C 轮总计 5 亿美元的融资,这一轮融资中,丰田作为战略投资方之一参与了领投,这不仅为 Momenta 提供了资金支持,也加深了双方合作关系。 在硬件逐步变得成熟的状态下,软件算法成为了传统汽车厂商最看重的地方,也正因为企业基因的固化,导致传统厂商往往难以在短期内实现软件和算法的明显突破。于是,包括丰田、奔驰、宝马在内的车企,都会对外寻求技术合作伙伴并投资对方,用稳定持股来推进合作方式,就像 Mobileye 和 Momenta 这样的自动驾驶公司。 事实上,华为和丰田的合作其实早就已经开始,只不过双方此前仅聚焦于座舱领域。 刚刚上市的第九代凯美瑞就用上了全新的 Toyota Space 智能座舱,其车机是由丰田联合华为共同打造,不但搭载了主流的骁龙 8155 车机芯片和 12+128GB 的存储组合,而且还配备了高阶版语音识别系统,支持声纹识别和面容 ID 识别功能。 对于华为而言,做好智能座舱就像是「呼吸一样简单」,而凯美瑞这套车机的好用程度,似乎只取决于丰田愿意开放多少能力,让这套车机变得更加地「鸿蒙」。 回到智驾方面,如今「重感知轻地图」的「无图智驾」方案已经成为了行业主流。相较于 Momenta 的基于视角高精地图自动驾驶方案,华为 ADS 方案已经基本摆脱了高精地图的束缚。 例如首发于问界车型的 ADS2.0 ,已经实现「有图无图都能开」的 NCA 智驾表现,在全国的高速、高架、快速路都能用智驾的基础上,进而实现了城区 NCA 功能。 另一方面,董车会也留意到,随着自然资源部逐步收紧导航电子地图制作甲级测绘资质,momenta 在测绘资质复审换证期间并未通过审核,因此也失去了测绘资质。跟不上时代趋势的高精地图,也因此遭到了大量车企的纷纷解绑,转而投入到无图智驾的技术路线上。 从这个角度来看,丰田若想做出能在中国市场落地的商业智驾方案,势必也要选择无图智驾的技术路线,或许还要放下身段地「舍弃一些灵魂」。 日企「投华」不是首例,外企热衷于请教中国老师 在丰田选择与华为合作之前,外国车企向中国车企伸出橄榄枝的例子,比比皆是。 去年 7 月,大众宣布与小鹏汽车达成技术框架协议。在合作的初期阶段,双方将面向中国的中型车市场,共同开发两款大众汽车品牌的电动车型,两款新车将基于小鹏 G9 所用平台打造,预计将在 2026 年上市。 除此之外,大众也选择了惯常的投资持股再推进合作的方式,向小鹏汽车增资约 7 亿美元,收购小鹏汽车约 4.99% 的股份(以每 ADS 15 美元的价格收购),来向外界传达大众×小鹏这是「稳固的长期战略合作」关系。 无独有偶,与奥迪一直保持着合资关系的上汽,也确认将与奥迪共研纯电平台。 对于奥迪而言,这样的选择也是必然的,为的是在竞争日渐激烈的电动车市场里,缩短车型开发的时间周期和研发成本。 根据澎湃新闻的报道,奥迪与上汽的洽谈内容涉及三电系统、下车体、智驾系统等智己电动汽车架构。事实上,上汽旗下与奥迪气质比较相符的品牌,也的确是 IM 智己。如果一切顺利,我们应该可以在 2026 年看到这部披着奥迪外皮的智己新车。 外国车企进入中国市场,以往都是采取合资开设新公司的方式在国内销售汽车。但随着中国车企在新能源汽车制造上的技术领先,我们开始迎来中国汽车品牌的「反向合资」趋势。 2023 年 10 月,全球第六代汽车制造商 Stellantis 集团与零跑汽车达成战略合作,Stellantis 集团投资 15 亿欧元(约合人民币 116 亿元)获取零跑汽车 20% 的股权,成为战略股东。 作为交易的一部分,Stellantis 和零跑汽车计划以 51:49 的比例,共同组建「零跑国际」合资企业。基于这个合资关系,Stellantis 集团将会在海外市场进口、销售甚至是生产零跑汽车相关产品。 标榜全栈自研的零跑汽车,在战略合作重也掌握了技术主动权,重新定义了中国车企和海外车企之间「用技术换市场」的关系。 回过头来看丰田汽车的电动化之路,其实华为并非他们在华合作的第一个伙伴,早于 2022 年,丰田与比亚迪合资成立的比亚迪丰田电动车科技有限公司,携手一汽丰田研发并推出了 bZ3 纯电车型。 作为一款「中国特供车型」,丰田的 bZ3 使用了 e-TNGA 平台,装载了比亚迪的刀片电池和弗迪电机。由于 bZ3 直接使用了比亚迪的三电技术,还由比亚迪代工生产,所以这部车也被称之为是一台挂着丰田牛头标的比亚迪轿车。 从技术模仿,到技术领先,再到技术输出 我一直认为,中国汽车市场的发展趋势其实和中国手机市场的发展趋势有着许多相同之处。 都是从对外模仿,到自主创新,再到产品领先出口的过程。 中国汽车也是如此,从油车时代的技术模仿,到电车时代的技术输出,中国车企如今取得了在电子层面的局部技术领先优势。 ▲图片来自 俄罗斯理想 L9 车主 @timelabpro ​​ 去年差不多也是这个时候,久违的国际 A 级车展「上海车展」再度开办,但舞台中心的主角变成了一众中国自主品牌,许多跨国车企高管频繁出现在中国自主品牌的展台上参观学习。可以说,中国汽车给老外带来了一点小小的新能源震撼。 ▲ 梅赛德斯-奔驰董事会主席康林松坐在腾势 D9 上体验 例如梅赛德斯-奔驰董事会主席康林松在腾势展台驻足;多个保时捷高管亲临比亚迪展区围观比亚迪的最新车型;宾利、法拉利、兰博基尼等超豪华汽车品牌高管也到仰望展台进行考察。 还记得保时捷高管在 2017 年上海车展看到众泰 SR9 时面露难色,如今一众外企高管看到中国新能源发展进步之快,虽然面带笑容,但恐怕内心早已五味杂陈。 事实上,在过去几年时间,中国新能源汽车渗透率从行业低谷的 5%,迅速跃升至 30% 以上,而且今年有望突破 40%。抛开逐渐减少的「国补」因素,究其原因是中国汽车企业对创新有着更高的渴求,市场竞争也成为了全球范围内最为激烈的地方。 由此可见,中国汽车逐渐成为全球电动汽车行业的灵感发源地,不断迭代更新的中国新能源汽车已经成为了全球各大车企的学习对象,中国新能源正在引领变革趋势。 即便是在刚刚闭幕的泰国 2024 曼谷国际车展,比亚迪以 5345 张订单排名全场第二,仅次于长期在当地布局的丰田汽车,创下了属于中国汽车品牌的历史。 同时当我们望向整个榜单,订单排名的前六位被中日两国车企直接瓜分——比亚迪、名爵、长安和丰田、本田、铃木形成了分庭抗礼之势。 「洞中方七日,世上已千年。」在三电技术、智能互联,以及座舱舒适度等方面,中国新能源汽车正在快速刷新着行业的认知高度。 无论是一众自主品牌的造车新势力,还是称霸全球动力电池市场的宁德时代,甚至是在汽车玻璃关键成型工艺等核心技术领域取得突破的福耀玻璃,都证明了当前已经有不少中国企业,在全球供应链主导权、关键核心技术、自主知识产权等方面,已经可以同世界一流企业看齐。 如今在欧洲,每 10 辆新能源汽车中,就有 1 辆来自中国。可以预见,随着中国汽车出海规模的不断加大,中国汽车的技术领先优势也会变得越来越明显。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。