行业分类:
加载中...
头条分类:
加载中...
专访特斯拉副总裁陶琳:中国市场是特斯拉的“必选项”
作者:李卓玲 特斯拉入华已有超10个年头。 从2013年在北京侨福芳草地开设了第一家体验店,并于次年向首批车主交付Model S,打响头炮;到2019年特斯拉上海超级工厂在一片荒芜中拔地而起,开启国产化新阶段;再到如今其在中国市场已拥有约150万名车主…… 特斯拉在华发展的十年,恰逢中国新能源汽车产业腾飞的十年。2023年,我国新能源汽车市场占有率达到31.6%,连续9年位居全球第一。时代周报《中国新能源汽车腾飞10年系列报道》近日专访了特斯拉公司副总裁陶琳,了解这家企业的风云十年,进一步探讨车市之变。 特斯拉公司副总裁陶琳 图片来源:受访者供图 “特斯拉入华十年以来的发展离不开国家政策强有力的支持,离不开中国对营商环境的重视。”陶琳对时代周报记者表示,中国拥有全球其他市场无法比拟的优势和广阔的前景,中国市场是特斯拉的“必选项”。 过去数年,特斯拉这条“鲶鱼”,在中国市场一路狂奔,一定程度激活了国内新能源汽车市场的一江春水。但如今,在中国这个全球最大的新能源汽车市场上,竞争正在不断加剧。特斯拉要直面的,除了劲敌比亚迪,还有众多主打全栈自研、拥有创新智能化技术,且同样流量加身的新势力挑战者。 据中国电动汽车百人会与麦肯锡近日发布联合研究报告《驶向2030:全球新能源汽车产业发展格局与展望》称,中国车企在全球竞争力提升的核心驱动力之一是创新速度。尤其在竞争激烈的中国,领先新能源车企将在当前业已领先的基础上继续迭代二至三代产品。 攻守之势异也。下一个10年,特斯拉将如何发力?陶琳对时代周报记者表示,希望继续深耕中国市场,用更好的产品回馈消费者,带动供应链和行业共同发展繁荣。陶琳并透露,此前落成的特斯拉上海研发创新中心,已把多项成果应用到全球产品。“未来,特斯拉上海研发创新中心将成长为与北美研发中心同等规模的综合型研发中心。” “在这个极具活力的市场硕果累累” 特斯拉与中国市场结缘于2013年。 彼时,特斯拉在位于北京市朝阳区东大桥路的侨福芳草地,开设了其在中国大陆的第一家体验店。区别于过往开在城市郊区的传统4S店,该店落地市中心购物中心,尽管寸土寸金,但人气畅旺。 从这家店开始,特斯拉开启的直营模式在国内迅速铺开,并引发众多新势力品牌跟随。十年多时间里,几乎所有的新能源汽车品牌,都将店开进了商场里。 据《2021-2022中国汽车流通行业发展报告》显示,2021年,位于商场/购物中心的新能源商超店发展迅猛,达到2200余家。近7成的商超店集中分布在20个城市里,其中,上海、深圳、北京三地的新能源商超店超过100个。 在华开启直营模式后,特斯拉继续深耕。2014年,首根特斯拉超级充电桩落地上海。同年,特斯拉CEO埃隆·马斯克向中国大陆首批车主交付Model S。彼时,特斯拉用“这一刻终于来临”,打响其正式进入中国的头炮。 2019年,特斯拉在华发展迈入新阶段。这一年,特斯拉超级工厂一期项目,在上海自贸区临港新片区上演“上海速度”:当年开工、当年投产、当年交付。国产化开启后,特斯拉的步伐不断加快:2020年,首批中国智造Model 3国内交付并出口海外;2021年以整车开发为目标的上海研发创新中心落成;2022年上海超级工厂第一百万辆整车下线;2023年特斯拉上海储能超级工厂宣布落户上海临港、特斯拉上海超级工厂第200万辆整车下线…… 图片来源:特斯拉微博 “2023年是特斯拉进入中国市场十周年,这十年间我们在这个极具活力的市场硕果累累,也在生产制造、研发方面取得了非凡成就。”陶琳对时代周报记者表示。 据陶琳向记者展示的一组数据显示:目前,特斯拉在中国大陆已经拥有约150万名车主,特斯拉直营门店超过500家,覆盖中国大陆城市78座;特斯拉直营及授权钣喷中心280家,覆盖中国大陆城市171座;特斯拉充电网络100%覆盖全国省会城市及直辖市。 上海工厂30多秒就能下线一台车 目前,上海工厂对特斯拉的战略意义仍在加强。在中国产汽车出海方面,该工厂也正在扮演愈发重要的角色。 “上海超级工厂是特斯拉首个在美国以外的工厂,对特斯拉深耕中国和全球市场有着极为重要的战略意义。同时,作为特斯拉全球重要的出口中心——上海超级工厂,依托着中国完善的供应链体系和一流的‘中国智造’能力,生产出全球领先的高品质智能电动车Model 3及Model Y,销往欧洲、亚太多个国家和地区,受到海外车主的热烈欢迎和广泛赞誉。”陶琳对时代周报记者说道。 据悉,2023年9月1日,由上海超级工厂生产制造的Model 3迎来焕新,并在欧洲、亚太多国上市。与此同时,第200万辆中国智造特斯拉整车、特斯拉全球第500万辆整车,均先后在上海超级工厂下线。 据乘联会最新数据显示,今年2月,新能源乘用车出口7.9万辆,同比增长0.1%。其中,在2月厂商出口方面,特斯拉中国为30224辆、比亚迪汽车达23291辆、上汽通用五菱为2872辆。 乘联会称,伴随着中国新能源的规模优势和市场扩张需求,中国制造新能源产品品牌越来越多地走出国门,在海外的认可度持续提升。 “上海超级工厂是特斯拉全球产能最大的电动车生产基地之一,也是特斯拉重要的全球出口中心。数据显示,中国每出口两辆电动车,就有一辆来自特斯拉上海超级工厂。”陶琳对记者表示。 陶琳进一步指出,作为全球效率最高的工厂,上海超级工厂目前已实现95%以上零部件的国产化,自动化率已达到95%以上,30多秒就能下线一台车。“生产智造是特斯拉难以被复制的核心竞争力。” 上海超级工厂 图片来源:特斯拉官网 上海研发创新中心已把多项成果应用到全球产品 除了生产智造外,特斯拉在中国市场还在进行更多的本土化探索:此前,其已先后落地了上海研发创新中心和上海超级工厂数据中心等。 2021年10月,特斯拉首个设立在海外、以整车开发为目标的研发中心——上海研发创新中心在临港正式落成,其几十个实验室分别围绕整车、充电设备及能源产品等进行研发工作,这使特斯拉在中国的科研能力得到了重大提升。 “在这个中心,特斯拉可以进行独立的、针对中国市场的科研开发。同时,特斯拉也可以直接与中国的先进技术和研发人才进行交流,这无疑有利于提升特斯拉在全球市场的竞争力。”陶琳对时代周报记者表示。 在陶琳看来,上海研发创新中心的设立也表明了特斯拉对中国市场的重视。“特斯拉已经将中国市场视为其全球化战略中至关重要的一部分,上海研发创新中心的建立将有助于特斯拉更好地理解中国消费者的需求,定制更符合中国市场的产品。” 据其透露,在此前的Model 3焕新版上,众多改进都来自于特斯拉上海研发创新中心。比如,整车静谧性的增加、全新环抱式的座舱、全新的内饰材质,以及中国用户期待已久的前排座椅通风功能等等,均是特斯拉上海研发创新中心在不同实验室,反复测试、持续优化的技术成果。 “‘中国原创,服务全球’,上海研发创新中心已把多项成果应用到全球产品。”陶琳对记者说道,目前,作为特斯拉全球核心技术与创新能力建设的有力保障,上海研发创新中心正着力于招收和培养相关人才。未来,特斯拉上海研发创新中心将成长为与北美研发中心同等规模的综合型研发中心。 数据安全是特斯拉关注的重点之一 与此同时,在汽车智能化浪潮汹涌下,“数据安全”的重要性日益突出。据人民网此前援引的一组数据显示,一辆智能网联汽车每天至少收集10TB的数据。这些数据不仅包含驾乘人员的面部表情、动作、目光、声音数据,还包括车辆地理位置、车内及车外环境数据、车联网使用数据等。 去年8月,针对大众关心的“哨兵模式”,特斯拉发博回应,哨兵模式(一些品牌也称为“守卫模式”)是目前主流智能汽车标配的一种智能安全配置,并非特斯拉独有。特斯拉车辆出厂时,该功能默认处于关闭状态,需要车主手动开启才能使用。其彼时并称,特斯拉公司已在中国建立数据中心,以实现数据存储的本地化。 “数据安全不仅是一个企业的责任,更是整个行业发展的基石。”陶琳对时代周报记者表示,特斯拉建立上海超级工厂数据中心用来存储中国业务产生的数据和客户的个人信息,实现数据存储的本地化。所有在中国大陆市场销售车辆所产生的数据,都会存储在中国境内。 陶琳进一步指出,2021年10月政府主管部门联合发布《汽车数据安全管理若干规定(试行)》后,特斯拉公司作为首批试点企业,积极参与了主管部门组织的合规试点工作。“数据安全一直是我们关注的重点之一,我们将继续致力于更好地保护车主的隐私和数据安全,为消费者提供更高品质的服务和更可靠的保障。” 结语: 今年,陶琳在特斯拉也迎来自己的入职10周年。作为特斯拉在华狂飙的见证者和参与者,其年初曾发博表示,“感谢时代赋予的机会,让我这个平凡的人有机会参与到一项伟大的事业中。这十年,很丰富也很幸运!” “做对的事情,做时间的朋友。”这是陶琳微博上很喜欢用的一句话。入华10年多来,特斯拉创造了许多成绩,也伴有非议,诸如降价、数据安全等舆论风波等。但诚如前者所言,一切交给时间。 展望特斯拉的下一个10年,陶琳对时代周报记者说道,中国市场是特斯拉的“必选项”,我们希望继续深耕中国市场,用更好的产品回馈消费者,带动供应链和行业共同发展繁荣。在其看来,“加速世界向可持续能源的转变”是特斯拉的愿景,而中国将是不可或缺的一部分。“相信在各个领域,中国都会成为特斯拉另一个全球中心。” 中国新能源汽车腾飞10年系列报道之高端访谈 编者按 2024年,是中国新能源汽车问鼎全球第一的第十个年头,自2015年起,中国新能源汽车产销已经连续9年位居全球第一,站上世界新能源汽车浪潮之巅。2023年,在新能源汽车的助力之下,中国汽车出口首超日本问鼎全球第一。时间回到10年前,伴随着特斯拉免费公布电动车专利,国内造车新势力掀起创立潮,与此同时,传统车企集体加速向新能源转型。中国新能源汽车在技术取得突破 、配套逐渐完善、市场超于成熟等多重因素影响下,获得狂飙式发展,十年再回首,新能源汽车可谓“轻舟已过万重山”。造车,是一场没有终点的远航,当下,新能源汽车产业竞争格局已经进入“深度重塑期”,汽车产业链的深度打造、智能化技术的迭代升级、中国汽车扬帆出海将成为未来汽车市场的主旋律。站在新十年的路口远眺,有人已倒在黎明来临之前,也有人总能踩准鼓点,迈出不同凡响的脚步。新能源汽车十年新旧交替之际,我们需要忠于事实的记录,更需要在前行中扣问,在快进中思考。
从最近出圈的AI初创,看2024年的YC
AI大裂变,一起看看YC最近投了哪些 AI to software的初创公司。 这个月初,号称「人类首个AI软件工程师」的Devin火爆出圈,给世界带来了亿点点震撼。 它掌握全栈技能,云端部署、底层代码、改bug、训练和微调AI模型,一经发布就掀起业内疯狂讨论,甚至有人说:软件工程师要失业了。 图源:DigiAlps LTD 开发Devin的初创公司 Cognition AI ,仅由10人团队组成,团队虽小,全是大牛。大多是华人面孔的队伍,狂揽10 枚IOI(国际信息学奥林匹克竞赛)金牌,还有人在DeepMind、Waymo 等大厂的工作经历。 Cognition AI成立才不到两个月就获得硅谷投资大佬Peter Thiel的Founders Fund基金领投的2100万美元A轮融资,以及Google高管Elad Gil、计算机科学家Christopher Re、Strip创始人John Collison的联合支持。 01 一个,和无数个 虽然Devin才上线两周,且没有完全对外开放使用,拿到早期测试资格的人和公司并不多,不过还是有不少工程师晒出实测结果。 只需要自然语言写的提示词,接下来的所有工作都可以交给Devin,它会像一个真正的程序员一样完成工作。 图源:Linkedln 码农的世界已然变了天。Devin的首席执行官Scott Wu还在社交媒体发出现在的Devin还成为Cognition AI的首席执行官替身,开始打工了。 最近几天,AI初创公司 Suno AI 推出了第一款可制作的音乐生成模型V3,音乐圈炸裂。 图源:MLWires 此前,Suno AI因爆改的周杰伦的《以父之名》和《夜曲》出圈,当时网友纷纷惊叹未来AI音乐的可能性。本周发布的V3,仅用几秒的时间,便可以创作出2分钟的完整歌曲。 Air Street Capital预测,今年会有AI生成的歌曲成为 Billboard 或 Spotify 热门单曲。
微软定义AI PC标准:本地运行Copilot和搭载40 TOPS性能的NPU
IT之家 3 月 28 日消息,近期各大厂商纷纷推出 AI PC,但究竟什么是真正的“AI PC”却一直没有明确的定义。近日,微软颁布了相关标准,规定所有运行 Windows 操作系统的 AI PC 都必须配备 Copilot 功能键。现在该标准的更多细节已经曝光,规定所有运行 Windows 操作系统的 AI PC 都必须具备本地运行 Copilot 的能力以及搭载性能达到 40 TOPS 的神经网络处理单元 (NPU)。 据 Tom's Hardware 报道,微软正致力于建立 AI PC 标准。首先,AI PC 需要能够在本地硬件上运行 Copilot。据IT之家了解,目前用户使用 Copilot 时,问题会先发送到服务器,服务器处理后再返回结果。而未来的 AI PC 将会拥有专门用于运行人工智能程序的硬件,从而能直接在本地完成 Copilot 的运算。英特尔客户端计算事业部副总裁 Todd Lewellen 表示:“随着下一代处理器的到来,我们将能够在本地运行更多程序,例如 Copilot 的部分功能。这并不意味着所有 Copilot 功能都将本地化,但许多核心功能都将利用 NPU 进行运算。” 其次,AI PC 需要配备性能达到 40 TOPS 的 NPU。NPU 即神经网络处理单元 (Neural Processing Unit),是专用于处理人工智能程序的芯片。TOPS 是衡量 NPU 性能的单位,代表每秒可以执行的万亿次运算数,数值越高代表芯片性能越强。虽然 TOPS 并不能完全衡量 NPU 的优劣 (功耗表现同样重要),但提供了一个基本的性能参考标准。 微软设立这些标准的背后,与其即将推出的 AI 驱动型 Windows 操作系统密切相关,只有用户拥有合适的硬件才能发挥新操作系统的全部功能。如今有了明确的标准,各家 NPU 制造商之间势必会展开激烈的性能竞争,以推出市场上最出色的产品。
Android 15 DP2预览版带来更多实体键盘功能:粘滞键、慢速键和防抖键
IT之家 3 月 28 日消息,谷歌一直致力于提升安卓设备的实体键盘使用体验,目标是让任何安卓设备都能提供媲美台式电脑的输入感受。为了实现这一目标,谷歌可能在即将发布的 Android 15 中引入更多键盘功能。 据来自 Android Authority 的 Mishaal Rahman 的消息,Android 15 Developer Preview 2 中引入了三种针对实体键盘的辅助功能选项:粘滞键(Sticky keys)、慢速键(Slow keys)和防抖键(Bounce keys)。IT之家注意到,粘滞键和防抖键此前已经在 Android 14 的 QPR3 Beta 2 版本中出现过,而慢速键则是一个全新的功能。用户可以在设置 -> 系统 -> 键盘 -> 辅助功能 -> 实体键盘中找到慢速键选项。 慢速键可以让用户设置按键的识别延迟,即手指按下某个按键后,需要保持按压多长时间才会被识别为有效输入。不过在目前的 Android 15 DP2 版本中,该延时数值还无法进行调整。Rahman 通过查看代码发现,谷歌未来可能会将该延时上限设置为 5 秒。 粘滞键顾名思义,当用户开启该功能并按下诸如 Alt、Ctrl 或 Shift 等按键后,即使手指松开该按键,系统层面仍会保持其被按下的状态,方便用户轻松地进行组合键的使用。 防抖键功能则可以防止用户因手部抖动或误触导致的按键重复识别。 这些新增的功能将为残障人士带来极大的便利,Android 15 将使他们能够更轻松地使用实体键盘,无论是连接平板电脑还是将手机设置为桌面模式,都将带来更加高效的输入体验。
库克很努力,苹果很迷茫
作者丨Lime 库克在中国积极营业之时,苹果正身陷近十年来最迷茫的时刻。 下游市场不买账,上游供应链不稳定,库克这次是真的急了。 01 库克来华猛刷存在感,但中国消费者想看到的是苹果更切实的诚意。 在库克开启2024中国行之前,苹果正处于危机之中。不仅遭到母国的反垄断打击,在华销售下滑也使得多家投行下调对苹果的评级。连巴菲特旗下的伯克希尔哈撒韦对苹果的持股比例也降至5.9%。 去年iPhone15在华销量不及预期,为挽救销量,苹果首次在官网大降价,折扣力度最高达到了180美元(约合人民币1300元)。就算价格跳水到这种程度,也没能撬动中国消费者的钱包。 市场研究机构Counterpoint Research最新报告显示,2024年前6周苹果在中国的智能手机销量下跌24%,从去年的第一名降至第四名,被国产品牌反超。 面对更加剧烈的市场竞争,创新乏力的苹果压力倍涨,不仅核心产品销量不佳,下一代终端产品Vision Pro也暂时看不到更明确的前景。市场不买账,造车项目被叫停,AI领域进展缓慢,哪怕是库克,都得汗流浃背了吧。 上个月,苹果最新一季财报中,大中华区的营收同比下降12.91%,并远低于市场预期的235亿美元,为2020年初以来最差的第一季度表现。作为苹果增长的两辆马车之一(另一辆是欧洲),这样的表现显然不能让管理层满意。 所以库克频频来华也就合理了,无论是给果粉提供情绪价值,还是业务学习、深度交流,都能彰显出苹果对中国市场的重视。只是,面对日趋理性的消费环境和创新乏力的产品迭代,库克这波真情流露还能换回多少中国消费者的“真薪”,还真不好说。 02 苹果越来越离不开中国果链,但中国果链未必离不开苹果。 此前苹果要转移供应链的消息让市场风声鹤唳,但近期苹果确有动作显示在扩大对华投资。3月中旬,苹果宣布将在上海和深圳扩建及新增实验室,为智能制造,产品的可靠性、质量和材料分析提供支持。 据苹果官方披露,苹果在中国先进应用研究实验室方面的投资已经超过10亿元人民币,随着深圳新设施的增加,这一投资将继续增长。 而苹果寄予厚望的划时代产品Vision Pro,中国制造商占比也达到30%,在整体零部件供应方面非常依赖中国。 库克此次来华,也参观了长盈精密、比亚迪和蓝思科技三家供应链A股企业,他们为库克展示了其在智能制造、绿色制造以及人才培养方面的最新成果和进展。以这三家为代表的中国供应商已经在往更高质的科技力发展。 更让库克担心的是,随着国产高端手机的崛起,苹果可能已经不再是这些供应商们的唯一选择。之前被苹果抛弃的欧菲光,现在已经成为华为手机供应链中的绝对主力。而智能家居、车载业务以及VR/AR等在国内的发展也为果链供应商提供了新的出路。换句话说,苹果这个金主爸爸也并非高枕无忧,因为中国供应商随时可能投入国产手机公司的怀抱。 03 创新乏力的苹果也想到中国市场找找灵感。 第三次中国行,对库克来说既是探访也是业务学习,毕竟只有知道中国消费者需要什么,才能投其所好。Vision Pro中国上市在即,了解国内年轻消费者的喜好也就变得尤其重要。 前两次访华时,库克参观了米哈游总部,观看了《王者荣耀》表演赛,相比之下,这次接触的叠纸游戏和逆水寒手游就要小众得多,玩家也以年轻用户为主。 库克参访的另外两家年轻企业三顿半咖啡和得物,也是深受年轻消费者青睐的品牌,虽然规模不大,受众也有限。但他们或许能启发库克,国内年轻消费者现在喜欢什么样的产品,而这些产品又能和苹果产生哪些联动。 和瞄准下一个空间计算时代的Vision Pro类似,苹果正在把目光瞄准中国的下一代消费者。 此外,苹果在AI方向上的进展也吊足了外界的胃口,毕竟中国手机厂商早已在AI手机的赛道上开卷。小米、vivo、OPPO、荣耀等都已经在大模型上有所布局。和苹果同属外来品牌的三星,1月也发布了主打AI概念的系列产品,并且即将加入更多国行版机型。 由于落地场景丰富,AI在中国市场的应用和创新或许也能给到库克一些灵感。这次库克中国行甚至传出iPhone16将与百度合作,装载文心一言大模型。虽然消息已被否认,但能看出外界是真的在替苹果着急。 现在,全世界人民都知道库克很爱中国,就连苹果今年的全球开发者大会「WWDC24」都正好选在端午节这天开幕。但是,如果One More Thing时刻迟迟不能出现,那中国消费者可能就不会那么爱他了。
B站CEO陈睿:高质量内容尤为稀缺和重要
凤凰网科技讯 (作者/杨睿琪)3月28日,第十一届中国网络视听大会在成都正式开幕。哔哩哔哩(以下简称“B站”)董事长兼CEO陈睿以“从视频中看年轻人”为主题发表演讲。陈睿表示:当人人都在消费视频,人人都在创作视频时,高质量内容尤为稀缺和重要。用户始终在渴望高质量的内容,优秀的创作者也一直存在,他们需要舞台,需要被看见。 根据相关数据,我国网络视听用户规模达10.74亿人,网民使用率超过9成,网络视频已经成为最大的互联网应用。 据悉,科技是B站最受欢迎的内容之一,其中AI是科技内容中增长最快的。过去一年,有2亿用户在B站上观看过科技类视频,科普类内容播放量增长接近200%。UP主全年共产出AI相关稿件超100万,AI相关内容消费人群中有6成为00后。用户对AI的热情也推动了一批播放量超百万的爆款视频诞生,涵盖科普资讯、AI技术应用、数字人和创意应用等领域。 哔哩哔哩董事长兼CEO陈睿 陈睿在现场分享道:年轻人不仅在通过视频记录自己的创造,还在通过视频学习各学科知识。 例如,UP主“木鱼水心”关于《史记》系列的讲解,首条内容就收获了921万的播放量,整个系列更新11个视频,总播放量超过4300万。他所制作的付费内容“星空读书会”,七天订阅人数超过2.5万人。 而复旦教授、博士生导师王德峰先生,在入驻B站一年不到的时间内,粉丝数就超过百万,他开设的《马克思的哲学革命及其当代意义》在线课程,目前订阅人数接近15万人,播放量超过200万。
泡沫预言里的英伟达
在 A股失传了有一阵的「怕高都是苦命人」,远渡重洋出现在了英伟达的身上。 如果你曾在2023年1月超过33%的涨幅面前,犹疑AI还是故事不是事实,那么你将错过它在去年剩下的11月里又创造的2.5倍涨幅;如果你曾在今年年初,再一次担心科技股的热闹不过是又一场幻觉破裂的前奏,那么英伟达在过去三个月里将近翻倍的涨幅,则又与泡沫论者无关。 不置可 否的是,不可思议的持续增长,让每一个财报季都成 为了英伟达的朋友。 2023年四季报,英伟达交出了一份全年营收221亿美元,同比增长265%,季调整后毛利率76.7%,双双超过市场预期。股价在当天跳空高开,最终收涨16.40%之后,大象的舞步也没有中止。 要知道,从2022年的10月的股价低点,也就是Cathie Wood开始陆续卖出她所持有的75万股算起,英伟达距离10倍涨幅仅一步之遥。 然而,就在这一步之遥面前,市场的分歧也开始趋近高潮。爆出历史最大单日成交额1040亿美元(接近整个A股一天的成交额),但股价却放量微跌的3月8日,让英伟达成为这一天全球股票投资者博弈的风暴中心: 这是伟大工业革命的开端,还是压路机前最后的狂欢? 狂飙的英伟达 事实上,这并不是英伟达的第一次暴涨,从2015年初分析师开始认识到深度学习正在快速突破算起,英伟达已经经历了三度崛起与两次低谷。 第一次是在2016年。 在此之前,英伟达只是一家游戏显卡供应商,市值在100亿美元上下徘徊,不及刚刚登陆纽交所的阿里巴巴的十分之一。刚刚在智能机市场碰了一鼻子灰的黄仁勋,仍然在为PC需求的萎靡操心,但泼天的富贵早已写在了命运的齿轮上。 2016年蹿红的两项「新质生产力」——区块链和AlphaGo,引发了人们对算力空前的重视,也给了「卖铲人」英伟达一点站在风口的震撼。 在2016年之前,英伟达曾花费5年时间才将营收从40亿美元提升到50亿,但从50亿到100亿的翻倍之旅,却只用了三年。而比业绩膨胀更快的则是市场的预期,在2018年的巅峰时期,英伟达市值一度突破1700亿美元,相比三年前足足提升接近20倍。 但喧闹过后,低谷接踵而至。 从2016年底英伟达市值刚刚突破600亿美元开始,知名做空机构香橼即和英伟达较上了劲,期间发布了多篇做空报告,并多次引发公司股价阶段性回调。在2018年8月的最后一次做空中,香橼认为英伟达估值过高、盈利不再大幅超越华尔街预期、市场竞争恶化等等,并判断公司股价将在2019年4月之前下跌20%。 随着区块链1.0热潮降温,比特币在2018年腰斩,很多矿商出售挖矿设备导致大量二手芯片涌入市场,供需天平开始向过剩倾斜。英伟达终于跌到了香橼的目标价,甚至超额完成任务。 2018年三季报发布时,尽管英伟达业绩还在快速增长,但已经低于市场预期,引发了公司股价大跌,短短两个月股价即下跌了58%。而在市值跌破800亿美元之前,香橼由空翻多,宣布已经做多英伟达。 而英伟达也展示了一个好公司的基本素养:走出低谷并不需要投资者做持有三年都不回本的心理建设。 2019年,随着美联储进入降息周期,市场流动性开始扩张,以比特币为代表的虚拟货币进入新一轮盛市,与此同时,元宇宙、自动驾驶等也开始甚嚣尘上,科技股再次受到市场追捧,并随着Facebook改名Meta达到高潮。 期间,英伟达再度完成了三年十倍的壮举,市值从低谷期的800亿美元到2021年底一度突破8000亿,将Netflix从美股五巨头「FAANG」中除名,大跨步迈入一线科技股的行列。 彼时,已是次贷危机之后美股长牛的第十二个年头,许多投资人乐观地认为,「今天的估值是由技术转型和新商业模式的增长潜力所证明的」。 在可以全力做多,又可以自由做空的美股市场,观点的交锋如空气般无处不在。而好公司的另一个基本素养,则是能用一个又一个财报让唱空者承担巨大的机会成本。 FOMO还是泡沫? 传奇投资人杰里米·格兰瑟姆(Jeremy Grantham)将AI行情称为一个泡沫中的泡沫(a bubble within a bubble)[3]。 作为波士顿基金管理公司(GMO)的联合创始人,格兰瑟姆曾因准确预测三次重大市场泡沫——1989年日本资产泡沫、2000年互联网泡沫和2008年房地产泡沫,而被华尔街誉为 「泡沫预言家」 。 在2020年美联储开启无限量量化宽松政策一段时间之后,GMO陆续将美股头寸由多仓转变为空仓,格兰瑟姆对市场的评价从「一场史诗级的多资产泡沫正在形成」逐步演变为「史上第四大超级泡沫即将破裂」,在其看来,「交易最为火爆的资产表现惊艳」、「高波动性股票跑输的同时大盘走高」等等,都是大牛市接近尾声的重要特征[2]。 信达雅的翻译过来就是:收手吧,阿祖,外面都是警察。 2021年11月,几乎是在Meta改名的同一时期,美联储开始实施缩表计划并将加息提上日程,轰鸣的「科技列车」戛然而止。仿佛是在眨眼之间,无论是比特币还是元宇宙都不再香甜,美股难得与A股携手回调。 之后的一年时间里,伴随着美联储连续加息7次,科技股全线回调,META、奈飞累计下跌超过70%,英伟达市值蒸发超60%,即使是最顽强的苹果也下跌了30%左右。 就在一切似乎终于朝着格兰瑟姆警告的方向发展时,科技界又给搞金融的老江湖们展示了一下理工科的威力。 2022年11月底,OpenAI 旗下的 ChatGPT 正式发布,成为AI领域的重要里程碑。凭借着生动、连贯且通常准确的文本回复,短短两个月时间积累了上亿活跃用户,为AI的应用和发展提供了丰富的想象空间。 分析师纷纷摇旗呐喊「第四次工业革命」已至,科技股闻鸡起舞。 英伟达市值接连突破1万亿、2万亿大关,完成了从「百亿美元边缘人」到市值仅次于微软和苹果的蜕变。即便美联储利率稳定在高位区间,AI仍然带领三大指数接连创出新高,美股科技股再度笼罩在乐观向上的氛围中。 英伟达凭借科技革命的非线性爆发战胜了泡沫预言,给算不出预期收益率的老家伙们上了一课:不是我的估值太贵了,是你的计算器该换了。 但格兰瑟姆却没有被阳线改变立场,继续着自己的风险提示。 在3月11日发表的《美国市场的大悖论》中,格兰瑟姆坚持认为,AI进步带来的亢奋情绪只是推迟了疫情后放水泡沫破灭的时间点,「美股长期前景看起来很糟糕,截至3月1日希勒市盈率(历史平均市盈率)为34倍,为历史上的前1%,而总利润也接近历史最高水平[3]。」 格兰瑟姆并不否认AI技术的发展潜力,只是在其看来,「 每一次技术革命都伴随着早期的大肆炒作和股市泡沫,因为投资者集中于技术的终极可能性,将大部分非常长期的潜力立即定价到当前市场中 [3]。」 对用2060年来合理化宁德时代估值嗤之以鼻的价值派,看到了这话术怕是也得感慨一句:莞莞类卿。 经历过市场周期的老人们,对美股泡沫刺穿后的「快熊」是有肌肉记忆的。股票的下跌,从不阻碍科技产业向终局前进,但足以杀死红极一时的老虎基金。 在格兰瑟姆看来,「亚马逊带领投机市场从1998年初开始到1999年高峰期间上涨了21倍,随后仅从2000年到2002年就下跌了几乎难以置信的92%,但最后如今却统治着半个零售世界[3]!」 而另外一名知名投资人——木头姐,则直接将英伟达对标为二十多年前的思科公司。 在她看来,英伟达与二十多年前的思科有诸多相似之处,比如,两者同样是重大技术革命中的基础设施供应商,当下游客户处于极度乐观或是FOMO(害怕错过)的情绪氛围中时,难免存在产能过度建设的现象,一旦终端需求被证伪,则将进入漫长的产能消化期,同时两家公司也都面临着残酷的生存竞争。 除此以外,木头姐还提出了非常具象的论点——「英伟达GPU的交付周期已从8-11个月降至3-4个月,这表明相对于需求而言,供应量正在增加[4]。」 无论是格雷瑟姆还是木头姐,都将当前行情的参照物指向了二十多年前的互联网泡沫——毕竟,泡沫的样子太像了。 「预期」里的众生相 如同AI并不新鲜的提法,只是如今技术实现了大跨越一样,互联网最早可以追溯到上世纪60年代,只是由于技术和内容限制,一直都未普及和流行起来,直到1993年前后万维网和Mosaic网络浏览器公开面世。 不过也正是由于互联网还没真正进入大爆发,信息的流通也远不如今天,所以资本市场也花了更多的时间酝酿这场风暴。 一直到1998年末开始,纳斯达克指数逐渐与另外两大股指拉开差距,进入拔估值阶段。1999年,美国投向互联网的资金达1000多亿美元,超过以往15年的总和,当年完成公开上市的457家公司多数都与互联网相关,其中117家在上市首日股价翻倍。 作为那个时代的卖铲人,思科早在1986年就推出了第一款多协议路由器AGS,1990年上市之后,又通过自主研发与外延并购双管齐下,不断丰富路由器产线的同时,向外拓展了交换机以及其他网络设备产品线,终于在1995年成为其全球最大的互联网设备厂商,市场普遍以为整个互联网都将依赖于思科的路由器运行。 整个90年代蜂拥而至的互联网投资资金,也带来了天量的设备需求,作为核心设备供应商的思科享受着业绩与估值双重提升的“戴维斯双击”,即使1994年因为经济恶化而出现过一次「别慌,只是技术性调整」,很快又再度上涨了约73倍。 思科员工手中的期权急速升值,由此催生出了一大批「纸面富翁」,是一场阿里员工们也并不陌生的深夜梦一场。 而在互联网公司之外,本应为投资者提供专业建议的股票分析师已经被牛市裹挟,陷入了「人有多大胆,地有多大产」的互卷之中。 1998年12月,亚马逊股价从80美元上涨到240美元,刚入行3个月的新手分析师Blodget将公司目标价从150美元进一步上调到了400美元,在研报中他写道,「亚马逊的股价很明显现在更像艺术而不是科学,我们认为只要公司增长势头不减,股票就能持续上涨。」 而来自美林的资深分析师Cohen保持着年纪带来的稳重,认为亚马逊是股市有史以来估值最高的股票之一,显然值得一个「减持」的评级。 过了一个月,亚马逊股价(经拆股调整)上涨到了400美元。又过了一个月,美林解雇Cohen,Blodget坐上了他的位置。即便是在互联网泡沫破裂后的2001年,Blodget的年薪依然达到1200万美元[5]。 再后来的故事,很多人也都知道了:亚马逊一度跌去92%,直到09年之后才收复失地;思科则因为替代性高而陷入惨烈竞争,直到二十多年之后才回到00年的高点。 关于引发泡沫最终破裂的导火索众说纷纭。 比如为了应对千禧虫危机,互联网企业在短期内对设备过度投资,当他们发现事实上并不需要做这种准备后,资本开支骤然下降;抑或《巴伦周刊》的文章,揭露出很多互联网公司现金流面临枯竭,并且包括亚马逊在内的几乎所有公司都撑不过12个月;或者围绕微软垄断案的流言蜚语,引发了市场的动摇。 但星星之火连成燎原之势,说到底,逃不过投资界那句老话:树不可能涨到天上去,估值也不可能脱离地心引力。 科技股上空的几朵乌云 那么以史为鉴,现在的AI牛市走到哪里了呢? 从过去一年多美股的市场表现来看,显然还达不到互联网泡沫高潮时的疯狂——毕竟整个2023年至今美股涨幅主要还是由「Magnificent 7」贡献,离鸡犬升天相去甚远,现在行情更像是互联网泡沫的第一阶段——虽然大部分大模型公司都尚未盈利,但人们理所当然的认为AI将带来难以想象的经济效益。 当下全球最大对冲基金桥水的灵魂人物达里奥,也从估值、市场情绪、融资比例等多个角度,对美股进行了全面评估,他的结论是,「当前美国股市的泡沫并不明显,即使是那些涨势最猛、最受媒体关注的股票也是这样。整个市场的泡沫程度处于中等水平(第 52百分位)。」 但这并不意味着AI行情还会进一步向拔估值的阶段发展,与之相反,达里奥提醒当前美股整体风险偏高,在其看来,「即使未来美股公司的盈利增长率与过去十年类似,依然保持高位,但是在当前股价(图中红点)的基础上,我们预计美国股市的回报率难以超过现金收益[8]。」 更何况在大模型公司普遍尚未盈利,日活增长持续性有限的窘境下,科技企业盈利不及市场预期的风险正在逐渐积累。 除此以外,宏观环境也是必须考虑因素之一。 现在美元利率处于高位区间,看似不存在加息的 风险,但却有不降息的隐患。随着降息预期被不断推迟,这种担忧正在扩大。 去年11月,美联储主席鲍威尔转向点燃了市场热情,投资者普遍预期「经济将实现软着陆,通胀问题已得到解决,2024年将见证6次降息」,美股行情开始扩大化,股价上涨不再局限于「Magnificent 7」。 但随着时间推移,降息预期正被不断推迟。财政部长与联储主席在美国经济到底有没有在软着陆上的拆台[12],又让流动性的边际变化陷入迷雾之中。 而行情演绎到当前阶段,以英伟达为代表的科技股早已吸引了全球投资人目光,有助股价上涨的因素几乎都被充分挖掘,涨势正变得愈发脆弱。在日渐浓烈的博弈氛围中,只有极少数对产业进展与人类未来保持着准确跟踪与预判的人,才有机会穿过暗流涌动的险滩。 面对这种超高难度的计算题,从一开始就错过了英伟达的投资者,最好就不要认为自己在这个阶段还能战胜市场了。 当然,对于真金白银砸向研发费用和资本开支的产业界来说,资本市场的热度终究是佐料,用计算机来测算当下股权价值合理或是不合理,远不如计算机技术本身更重要。 毕竟,AGI的未来绑定在摩尔定律上,而不是英伟达的股票价格上。
AI综艺导演大翻车,AI内容迎来反噬?
作者 编辑|高乐 自生成式AI,特别是文生图、文生视频的AI平台开始涌现,关于其内容质量与原创性的争议就层出不穷。 而随着众多主流媒体越来越多使用AI参与内容制作,AI内容也从小众圈层的圈地自萌逐渐“入侵”到普通人的生活当中。 从年初围绕总台春晚AI吉祥物的批判,再到近期关于芒果TV新推出的AI导演“爱芒”的吐槽,被AI生成内容频繁入侵的观众也表达出越来越多对于AI内容粗制滥造的反感。 如何让AI参与制作的内容更受欢迎?技术、媒体与观众三方显然还没有找到平衡点。 1 AI导演?明明是AI傀儡 3月15日,湖南广播影视集团(以下简称湖南广电)宣布推出首个AI导演爱芒(英文名AIM)。 作为国内首个AI导演,其相貌通过湖南卫视和芒果TV双平台制片人的人像合成而成,声音由95后和00后年轻导演的声音合成,现阶段爱芒主要担任助理导演角色。 作为湖南广电深入探索“文化+科技”发展战略的一部分,推出爱芒旨在进一步打造功能强大的超级平台,并持续加强人工智能在媒体领域的应用。按照湖南广电的规划,其未来将成长为成熟的AI导演。 身为一名新人导演,爱芒参与制作的第一个节目就是由湖南卫视王恬工作室推出的《我们仨》,其对节目的定位是通过郭麒麟、毛不易、魏大勋三位好友的旅行探险,为观众带来欢笑及轻松的体验。 爱芒还给三位嘉宾明确了分工:他们仨需要在旅行中自己拍摄视频,自己规划行程,自己承担费用;此外爱芒会把他们拍好的视频素材,根据要求由算法生成vlog。 但就爱芒在节目中实际发挥的作用来看,其距离湖南广电设想中的美好前景还存在着一定距离。 首先是对于“爱芒”形象的争议,在超写实虚拟人技术已经发展的十分成熟的当下,这位AI导演充满恐怖谷效应的建模恐怕不用过多赘述各位读者就能感受到: 同时随着节目的推进,爱芒真正的技术能力也受到了观众的质疑。在弹幕与社交媒体的相关评论区最常见的表述之一,就是感觉这位新一代的AI导演并没有与过往的AI有明显进步。 而对于这档以AI导演参与制造随机性为宣传点之一的节目影响更大的,就是节目中的许多细节都暗示着所谓“AI随机性”依然存在着大量人工干预。 真人导演的身份被爱芒所掩盖,同时这种所谓的AI创新不仅没有为节目带来预期的新鲜感,反而成为了广告植入的掩护: 在节目的其中一段,三人驾驶的车辆陷入雪中,全体村民都前来帮忙推车,但一番折腾后汽车依然纹丝不动,三人便向爱芒询问意见,最后AI导演建议使用车辆自带的雪地模式即可让车辆恢复行驶。 讲真,看到这一桥段的时候突然没忍住莫名其妙地笑了一下:果然AI再怎么飞速发展终究还是人类的“玩物”,该参与恰饭的时候还是得乖乖参与恰饭。 不过饭是恰到了,但至此从形象到技术水平再到参与程度,爱芒都成为了一名“下头”的AI导演,即便融入了大模型等概念,其依旧是一位流于形式的AI导演。 而这也不是芒果系第一次因为AI元素参与到综艺节目中被观众诟病。在之前的《快乐大本营》改版后推出的《你好星期六》中,虚拟主持人小漾就因为太多生硬与尴尬的桥段影响节目效果,最终在观众的骂声中悄无声息地退出了节目。 不过即便经过了此前的挫折,芒果依然选择再次加入AI元素,除了追逐热点的因素外,也确实反映出主流媒体在AI大发展趋势下对潮流的迎合。 2 AI内容成大势,却难成大事? 除湖南广电外,进入2024年以来,包括中央广播电视总台在内的众多主流媒体都开始大规模探索AI内容的应用。 开年至今,中央广播电视总台已经推出了三部标志性AI视频作品:《千秋诗颂》、《中国神话》和《来龙去脉》。 作为中国首部文生视频AI系列动画片,《千秋诗颂》依托“央视听媒体大模型”,将国家统编语文教材中的诗词转化为国风动画,通过艺术与代码的融合,展现独特的中国审美。 总台人工智能工作室联合清华大学元宇宙文化实验室制作的“中国神话系列微短剧”《补天》随后也正式上线,以创新的方式解读神话传说中蕴含的经久不衰的中华文明密码。作为国内首部AI全流程微短剧,其美术、分镜、视频、配音、配乐全部由AI完成。 由CGTN推出的《来龙去脉》则是一部AI译制英文版系列微纪录片,通过AI技术完成全译制流程,探索了影视译制的高效应用场景,预计将实现译制精准度和效率的显著提升。 同样在国内媒体领域拥有影响力的北京广播电视台,于3月16日成立了人工智能融媒创新实验室,旨在推进人工智能技术在传媒领域的综合应用。实验室联合北京智源人工智能研究院和多个知名机构,遵循“开放、合作、共赢”的原则,致力于促进技术和传媒的深度融合。 在“AI智能辅助制作”和“AI数字人”两大重点方向上,北京台通过技术与节目的协同,推动了一系列创新应用:在纪录片中应用AI绘画模型制作版画风格动画;在2024年春节联欢晚会中,则推出AI视频互动小程序“龙年AI就福你”。 而早于北京广播电视台一年,上海广播电视台于2023年2月25日就已宣布成立“生成式人工智能媒体融合创新工作室”,明确了六大主要研究和应用方向: 财经媒体专属AI大模型、新闻资讯类大模型应用、智能语音和大语言模型应用、智能手语数字人、生成式智能与多媒体通信、以及人工智能应用下的传媒伦理研究。 此外,上海台的生成式人工智能媒体融合创新工作室在今年全国两会报道期间推出了首个AIGC应用集成工具——Scube(智媒魔方)。 Scube整合了多种AI能力,如多模态素材识别、自动生成稿件、全语种智能翻译、视频自动剪辑等,为报道团队提供一系列新闻制播服务,从内容整理到新媒体端内容制作播出,再到新闻稿件生成、内容翻译和视频字幕生成等,已经形成全套服务体系。 可以说,目前在AI内容生成领域,国内的主流媒体已经进行了卓有成效的探索,但如湖南广电面临的挑战一样,并不是所有的探索都一帆风顺: 如何将AI内容与现有形式巧妙融合,实现技术、媒体与观众的共赢,是接下来摆在众多主流媒体前的难题。 3 AI,不是内容生产的捷径 在主流媒体介入之前,个人创作者对于AI内容应用的探索可以说基本停留在小圈层之内;而主流媒体一旦对AI广泛应用,其对于行业就充满了很强的象征意义,因为这标志着一种自上而下的,对于这一新兴表现形式的肯定。 与此同时在内容本身的质量上,观众就会主流媒体的完成度提出更高的要求,这也是爱芒受到批评的一大的原因,而当下也并不是只有这位AI导演面临着观众的“苛责”。 作为国内动漫爱好者的集聚地,一向严苛的B站网友对于总台《千秋诗颂》与《中国神话》系列AI动画的评价也偏向负面,甚至以早年知名的粗制滥造动画代表《雷锋的故事》做类比,以至于目前《中国神话》系列动画已经关闭了弹幕功能。 对于这一系列AI动画的攻击主要围绕在“审美降级”上:AI生成的如PPT翻页一样的所谓动画、错误的人物结构与光影以及从来对不上的口型,都让相关作品难以被称之为真正的动画。 但这样审美降级的产物就如此堂而皇之地出现在主流媒体之上,甚至成为追捧与首肯的对象,很难不说是一种赛博魔幻。 评论区的一位网友更是一语道破AI动画的幻象: 东西越来越方便,审美越来越降级,用心做动画的人越来越心寒…我始终认为过去一笔一笔磨出针的时代作品更好,动画又何尝不是艺术啊,日漫过去或许没有那么逼真的音质特效,没有那么方便的工具,但是场景处理和艺术表现从人手里出来是那么惊艳。 可惜市场化后终究会诞生粗制滥造的作品。中国有那么多动画作者有想法想创作,我刚刚接触动画专业一点点学分镜学画动态的时候觉得这是多么有趣的一件事、不是说ai不好,只是希望这种方便的事物,不要成为粗制滥造的帮凶,从中诞生的快餐也不要太快太早击碎我的艺术幻想。 不论AI导演还是AI动画,亦或是其他AI参与的内容,之所以导致观众的反感,根本原因都是没有围绕内容本身来进行创作,而是将AI作为噱头,最终使其成为内容创作的捷径。 观众本应在AI的助力下享受到更优质的内容,而不是在急功近利中一步步审美降级,沦为粗制滥造内容的倾泻场。 而他们反对的也从来都不是将AI引入内容创作中——毕竟这已经是一个不可逆的趋势。真正的问题在于,如果为了使用AI而使用AI,将其作为一种目的而不是手段,那么再多AI内容的涌现也无法真正打动人。 爱芒的翻车如此,AI动画的翻车亦是如此。 AI内容的反噬已开始,而这不论对于观众还是媒体,都未尝不是一件好事。
全球最强开源模型一夜易主,1320亿参数推理飙升2倍
【新智元导读】就在刚刚,全球最强开源大模型王座易主,创业公司Databricks发布的DBRX,超越了Llama 2、Mixtral和Grok-1。MoE又立大功!这个过程只用了2个月,1000万美元,和3100块H100。 全球最强开源模型,一夜易主! 刚刚,超级独角兽Databricks重磅推出1320亿参数的开源模型——DBRX。 它采用了细粒度MoE架构,而且每次输入仅使用360亿参数,实现了更快的每秒token吞吐量。 这种独特的MoE架构,让DBRX成为开源模型的SOTA,推理速度比LLaMA 2-70B快了2倍! 最重要的是,训练成本直接砍半!只用了1000万美元和3100块H100,Databricks就在2个月内肝出了DBRX。 比起Meta开发Llama2所用的成本和芯片,这只是很小一部分。 DBRX在语言理解、编程、数学和逻辑方面轻松击败了开源模型LLaMA2-70B、Mixtral,以及Grok-1。 甚至,DBRX的整体性能超越GPT-3.5。尤其在编程方面,完全击败了GPT-3.5。 并且,DBRX还为开放社区和企业提供了仅限于封闭模型的API功能。现在,基本模型(DBRX Base)和微调模型(DBRX Instruct)的权重,已经在Hugging Face开放许可了。 从今天开始,Databricks客户就可以通过API使用DBRX。它在Macbook Pro上都可跑,LLM很快能为个人设备提供支持了。 Pytorch之父Soumith Chintala对最新开源模型DBRX也是非常看好。 从Mistral、到Grok-1,再到DBRX,MoE架构的模型正在占领开源界。 而Databricks的员工激动地表示,过去3个月,朋友们周末约我都说「不行,这周不行我有事,但是又不能说有啥事」的日子终于结束了,DBRX就是我们加班加点搞出来的一头「怪兽」。 还有网友表示,「如果实验室继续开源大型MoE模型,英伟达可能就需要推出最强Blackwell架构的消费级GPU了」。 全球最强开源模型易主 DBRX是一种基于Transformer纯解码器的大模型,同样采用下一token预测进行训练。 它采用的是细粒度专家混合(MoE)架构,也就是具有更多的专家模型。 是的,这次立大功的,依然是MoE。在MoE中,模型的某些部分会根据查询的内容启动,这就大大提升了模型的训练和运行效率。 DBRX大约有1320亿个参数,Llama 2有700亿个参数,Mixtral 有450亿个,Grok有3140亿个。 但是,DBRX处理一个典型查询,平均只需激活约360亿个参数。 这就提高了底层硬件的利用率,将将训练效率提高了30%到50%。不仅响应速度变快,还能减少所需的能源。 而与Mixtral、Grok-1等其他开源MoE模型相比,DBRX使用了更多的小型专家。 具体来说,DBRX有16个不同的专家,在每层为每个token选择4个专家。Mixtral和Grok-1有8个专家,一个路由网络在每层为每个token选择2个专家。 显然,DBRX提供了65倍的专家组合可能性,能够显著提升模型质量。 此外,DBRX还使用了旋转位置编码(RoPE)、门控线性单元(GLU)和分组查询注意力(GQA),并使用tiktoken存储库中提供的GPT-4分词器。 DBRX模型在12万亿Token的文本和代码进行预训练,支持的最大上下文长度为32k。 研究人员估计,这些数据比用来预训练MPT系列模型的数据至少好2倍。 这个新的数据集,使用全套数据库工具开发,包括用于数据处理的ApacheSpark™和Databricks笔记本,用于数据管理和治理的Unity Catalog,以及用于实验追踪的MLFlow。 团队使用了「课程学习」(curriculum learning)进行预训练,并在训练过程中改变数据组合,大大提高了模型质量。 那么,DBRX究竟表现如何? 击败2.4倍参数Grok-1 如下表1,在综合基准、编程和数学基准以及MMLU上,DBRX Instruct刷新了开源AI的SOTA。 综合基准 研究人员在两个综合基准上对DBRX Instruct和其他开源模型进行了评估,一个是Hugging Face的Open LLM Leaderboard,另一个是Databricks Model Gauntlet。 Databricks Model Gauntlet由30多项任务组成,涵盖了6个类别:世界知识、常识推理、语言理解、阅读理解、符号问题解决和编程。 就综合基准来看,DBRX Instruct超越了所有聊天、指令调优的模型。 编程和数学基准 DBRX Instruct在编程和数学方面尤为突出。 它在HumanEval以及GSM8k上,得分均高于其他开源模型。 在编程基准上,DBRX Instruct得分为70.1%,Grok-1为63.2%,LLaMA2-70B Chat为32.2%。在数学基准上,DBRX Instruct为66.9%,Grok-1为62.9%,LLaMA2-70B Base为54.1%。 尽管Grok-1的参数是DBRX的2.4倍,但DBRX在编程和数学方面的性能,均超越了排名第二的Grok-1。 在HumanEval上,DBRX Instruct(70.1%)甚至超过了CodeLLaMA-70B Instruct(67.8%),这是一个专门为编程构建的模型。 在语言理解测试基准MMLU方面,DBRX Instruct得分高于所有模型,为73.7%。 全面超越GPT-3.5 另外,与闭源模型GPT-3.5相比,DBRX Instruct的性能全面超越了它,还可与Gemini 1.0 Pro和Mistral Medium相较量。 具体来说,DBRX Instruct在MMLU的常识知识(73.7% vs. 70.0%)、常识推理HellaSwg(89.0% vs. 85.5%)和WinoGrand(81.8% vs. 81.6%)方面优于GPT-3.5。 在HumanEval(70.1% vs. 48.1%)和GSM8k(72.8% vs. 57.1%)的测试中,DBRX同样在编程和数学推理方面尤其出色。 此外,在Inflection Corrected MTBench、MMLU、HellaSwag以及HumanEval基准上,DBRX Instruct的得分高于Gemini 1.0 Pro。 不过,Gemini 1.0 Pro在GSM8k的表现上,明显更强。 在HellaSwag基准上,DBRX Instruct和Mistral Medium得分相似,而Winogrande和MMLU基准上,Mistral Medium更强。 另外,在HumanEval、GSM8k、以及Inflection Corrected MTBench基准上,DBRX Instruct取得了领先优势。 在Databricks看来,开源模型击败闭源模型非常重要。 在上个季度,团队成员看到自家12,000多名客户群重大转变,即将专有模型替换为开源模型,以提高效率。 现在,许多客户可以通过定制开源模型来完成特定任务,从而在质量和速度上超越专有模型。 DBRX的推出,就是为了加速这个过程。 长上下文任务质量和RAG DBRX Instruct采用高达32K token上下文进行了训练。 表3比较了它与Mixtral Instruct,以及最新版本的GPT-3.5 Turbo和GPT-4 Turbo API,在一套长上下文基准测试上的性能。 毫无疑问,GPT-4Turbo是执行这些任务的最佳模型。 但是,除了一个例外,DBRX Instruct在所有上下文长度和序列的所有部分的表现,都优于GPT-3.5 Turbo。 DBRX Instruct和Mixtral Instruct的总体性能相似。 利用模型上下文的最常见的方法之一是,检索增强生成(RAG)。 在RAG中,从数据库中检索与提示相关的内容,并与提示一起呈现,从而为模型提供更多信息。 表4显示了DBRX在两个RAG基准测试——Natural Questions和HotPotQA上的质量。 DBRX Instruct与Mixtral Instruct和LLaMA2-70B Chat等开源模型,以及GPT-3.5 Turbo相比,具有很强的竞争力。 训练效率是非MoE模型两倍 模型质量必须放在模型的训练和使用效率的上下文中,在Databricks尤其如此, 研究人员发现训练MoE模型在训练的计算效率方面,提供了实质性的改进(表5)。 比如,训练DBRX系列中较小的成员DBRX MoE-B(总参数为23.5B,活跃参数为6.6B)所需的Flop比LLaMA2-13B少1.7倍,才能在Databricks LLM Gauntlet上达到45.5%的得分。 DBRX MOE-B包含的有效参数也是LLaMA2-13B的一半。 从整体上看,端到端LLM预训练pipeline,在过去十个月中的计算效率提高了近4倍。 2023年5月5日,Databricks发布了MPT-7B,这是一个在1T token上训练的7B参数模型,在Databricks LLM Gauntlet上得分为30.9%。 DBRX系列中名为DBRX MoE-A的(总参数为7.7B,活跃参数为2.2B)得分为30.5%,而FLOPS减少了3.7倍。 这种效率是一系列改进的结果,包括使用MoE架构、网络的其他架构更改、更好的优化策略、更好的分词,以及更好的预训练数据。 单独来看,更好的预训练数据对模型质量有很大的影响。 研究人员使用DBRX预训练数据在1T token(称为DBRX Dense-A)上训练了7B模型。在Databricks Gauntlet上得分39.0%,而MPT-7B为30.9%。 研究者估计,全新的预训练数据至少比用于训练MPT-7B的数据高出2倍。 换句话说,要达到相同的模型质量,所需的token数要少一半。 进而,研究人员通过在500B token上训练DBRX Dense-A确定了这一点。 它在Databricks Gauntlet上的表现优于MPT-7B,达到32.1%。 除了更好的数据质量外,token效率提高的另一个重要原因可能是GPT-4分词器。 推理效率 总体而言,MoE模型的推理速度,它们的总参数所显示的要快。这是因为它们对每个输入使用的参数相对较少。 DBRX推理吞吐量是132B非MoE模型的2-3倍。 推理效率和模型质量通常是相互矛盾的:模型越大通常质量越高,但模型越小推理效率越高。 使用MoE架构可以在模型质量和推理效率之间,实现比密集模型更好的平衡。 通过Mosaic AI Model Serving测量,DBRX生成速度明显快于LLaMA2-70B 比如,DBRX的质量比LLaMA2-70B更高,而且由于活跃参数量大约是LLaMA2-70B的一半,DBRX推理吞吐量最多可快2倍。 Mixtral是MoE模型改进的「帕累托最优」(pareto frontier)另一个点:它比DBRX小,质量相对较低,但实现了更高的推理吞吐量。 在优化的8位量化模型服务平台上,Databricks Foundation Model API推理吞吐量每秒多达150个token。 企业免费用 企业可以在Databricks平台上访问DBRX,能在RAG系统中利用长上下文功能,还可以在自己的私有数据上构建定制的DBRX模型。 而开源社区可以通过GitHub存储库和Hugging Face访问DBRX。 项目地址:https://github.com/databricks/dbrx 项目地址:https://huggingface.co/databricks 因为DATABricks是完全基于数据库来构建DBRX的,因此每个企业用户都可以使用相同的工具和技术来创建或改进自己的定制化模型。 用户可以通过Unity Catalog中集中管理训练数据,使用ApacheSpark和Lilac AI提供的工具和服务进行处理和清理。 大规模的模型训练和微调由DataBricks前不久刚刚收购的Mosaic AI提供的服务。 对齐问题,也可以通过的他们的平台和服务解决。 纳斯达克,埃森哲等客户和合作伙伴已经用上了这一套服务和工具。 收购估值13亿公司,2个月肝出来 外媒Wired的一篇报道,为我们详述了世界最强开源模型的诞生过程。 此前,Databricks在业界已经小有名声。 在本周一,Databricks的十几位工程师和高管,在会议室等待着最终的结果—— 团队花费了数月时间,投入了大概1000万美元训练的LLM,会取得怎样的成绩? 显然,能力测试最终结果出来之前,他们并不知道自己创造的模型有这么强大。 「我们超越了所有模型!」随着首席神经网络架构师、DBRX团队负责人Jonathan Frankle宣布这一结果,成员们爆发出热烈的欢呼和喝彩声。 Databrick的决策者:Jonathan Frankle,Naveen Rao, Ali Ghodsi,Hanlin Tang 是的,DBRX就是这样超越了Llama 2、Mixtral这两个如今最流行的开源模型。 甚至马斯克的xAI最近开源的Grok AI,也被DBRX打败了。 Frankle开玩笑说:如果收到马斯克发出的一条刻薄的推特,我们就铁定成功了。 最令团队感到惊讶的是,DBRX在多项指标上甚至接近了GPT-4这个机器智能的巅峰之作。 毫无疑问,DBRX现在为开源LLM设立了全新的技术标准。 独角兽重振开源界 通过开源DBRX,Databricks进一步推动了开源运动,加入了Meta对抗OpenAI和谷歌的开源大潮。 不过,Meta并没有公布Llama 2模型的一些关键细节,而Databricks会将最后阶段做出关键决策的过程全部公开,要知道,训练DBRX的过程,耗费了数百万美元。 艾伦人工智能研究所的CEO AliFarhadi表示,AI模型的构建和训练,亟需更大的透明度。 Databricks有理由选择开源。尽管谷歌等巨头过去一年里部署了AI,但行业内的许多大公司,还还没有在自己是数据上广泛使用大模型。 在Databricks看来,金融、医药等行业的公司渴望类似ChatGPT的工具,但又担心将敏感数据发到云上。 而Databricks将为客户定制DBRX,或者从头为他们的业务量身定做。对于大公司来说,构建DBRX这种规模模型的成本非常合理。 「这就是我们的大商机。」 为此,Databricks去年7月收购了初创公司MosaicML,引入了Frankle在内的多名技术人才。此前,两家公司内都没人构建过如此大的模型。 内部运作 Databricks首席执行官Ali Ghodsi OpenAI等公司,执着地追求更大的模型。但在Frankle看来,LLM重要的不仅仅是规模。 怎样让成千上万台计算机通过交换机和光缆巧妙地连接在一起并且运转起来,尤其具有挑战性。 而MosailML公司的员工,都是这门晦涩学问的专家,因此Databrick去年收购它时,对它的估值高达13亿美元。 另外,数据对最终结果也有很大影响,或许也是因此,Databricks并没有公开数据细节,包括数据的质量、清洗、过滤和预处理。 Databricks副总裁、MosaicML创始人兼CEO Naveen Rao表示:「你几乎可以认为,这是模型质量的重中之重。」 价值数百万美元的问题 有时候,训练一个庞大AI模型的过程不仅考验技术,还牵涉到情感上的抉择。 两周前,Databricks的团队就遇到了一个涉及数百万美元的棘手问题:如何充分利用模型的潜能。 在租用的3072个强大英伟达H100 GPU上训练模型两个月后,DBRX在多个基准测试中已经取得了卓越的成绩。但很快,他们可以使用的时间只剩下了最后一周。 团队成员在Slack上互抛主意,其中一个提议是制作一个专门生成计算机代码的模型版本,或者是一个小型版本供业余爱好者尝试。 团队还考虑了不再增加模型的大小,转而通过精心挑选的数据来提升模型在特定功能上的表现,这种方法称为课程学习。 或者,他们可以继续按原计划扩大模型的规模,希望使其变得更加强大。 最后这种做法被团队成员亲切地称为「随它去」选项,似乎有人对此格外情有独钟。 虽然讨论过程中大家都保持了友好,但随着各位工程师为自己青睐的方案力争上游,激烈的观点交锋不可避免。 最终,Frankle巧妙地将团队的方向引向了以数据为中心的方法(课程学习)。两周后,这个决定显然带来了巨大的回报。 然而,对于项目的其他预期成果,Frankle的判断就没那么准确了。 他原本认为DBRX在生成计算机代码方面不会有特别突出的表现,因为团队并没有将重点放在这一领域。 他甚至信心满满地表示,如果自己判断错误,就会把头发染成蓝色。 然而,周一的结果却显示,DBRX在标准的编码基准测试上胜过了所有其他开源AI模型。 「我们的模型代码能力非常强。」他在周一的成果发布会上说道,「我已经预约了今天去染发。」 风险评估 最后还有一个问题,就是开源模型的风险。 DBRX是迄今最强的开源大模型,任何人都可以使用或修改。 这是否会带来不可预知的风险,比如被网络犯罪或者生化武器滥用? Databricks表示,已经对模型进行了全面的安全测试。 Eleuther AI的执行主任Stella Biderman说,几乎没有证据表明开源会增加安全风险。「我们并没有特别的理由相信,开放模型会比现有的封闭模型大幅增加风险。」 此前,EleutherAI曾与Mozilla以及其他约50个组织和学者一道,向美国商务部长雷蒙多发出了一封公开信,要求她确保未来的人工智能监管为开源AI项目留出足够的发展空间。 信中专家们相信,AI开源有利于经济增长,因为它们有助于初创企业和小企业接触到这项突破性的进展,还有助于加速科学研究。 而这也是Databricks希望DBRX能够做出的贡献。 Frankle说,DBRX 除了为其他人工智能研究人员提供了一个新的模型和构建自己模型的有用技巧外,还有助于加深对AI实际工作原理的理解。 Databricks团队计划研究模型在训练的最后阶段是如何变化的,也许能揭示一个强大的模型是如何涌现出额外能力的。 参考资料: https://www.wired.com/story/dbrx-inside-the-creation-of-the-worlds-most-powerful-open-source-ai-model/ https://twitter.com/databricks/status/1772957294805856265?t=yM4Rma8C9RQPCmf0YoopMw&s=19 https://www.databricks.com/blog/introducing-dbrx-new-state-art-open-llm
比人类快0.9秒,AI让机器人Emo提前“复制”人类微笑,融入人类社交世界成为可能?
ChatGPT 等大型语言模型(LLM)的出现,让机器人具备了如同人类一般的语言表达能力。然而,机器人在与人类交谈时,其面部表情却依然显得很不自然,甚至充满了恐惧感。 这无疑会阻碍人与机器沟通的意愿,让两者的沟通变得十分困难。 因此,在未来人机共存的时代,设计一个不仅能做出各种面部表情,而且知道何时使用这些表情的机器人,至关重要。 如今,来自哥伦比亚大学的研究团队及其合作者便迈出了重要一步——制造了一个披着硅片、能够预测人类面部表情并同步执行表情的机器人 Emo。它甚至可以在人类微笑前约 840 毫秒(约 0.9 秒)预测即将出现的微笑。 据介绍,它能与人进行眼神交流,并利用两个人工智能(AI)模型在人微笑之前预测并“复制”人的微笑。研究团队表示,这是机器人在准确预测人类面部表情、改善互动以及建立人类与机器人之间信任方面的一大进步。 相关研究论文以“Human-robot facial coexpression”为题,已于今天发表在科学期刊 Science Robotics 上。哥伦比亚大学机械工程系博士 Yuhang Hu 为该论文的第一作者和共同通讯作者,他的导师、哥伦比亚大学教授 Hod Lipson 为该论文的共同通讯作者。 图|Yuhang Hu 与 Emo 面对面。(来源:Creative Machines Lab) 在一篇同期发表在 Science Robotics 的 FOCUS 文章中,格拉斯哥大学计算社会认知教授 Rachael Jack 评价道: “人类社交互动本质上是多模式的,涉及视觉和听觉信号的复杂组合,虽然 Hu 及其同事的研究集中在单一模式——面部表情上,但他们的成果在为开发更复杂的多模态信号的社交同步技能方面做出了巨大的贡献。” 在她看来,尽管这是一个复杂的跨学科工作,但“真正使社交机器人融入人类社交世界是可能的”。 Emo 微笑了,但也不仅仅是“微笑” 如果你走到一个长着人类脑袋的机器人面前,它先对你微笑,你会怎么做?你很可能会回以微笑,也许会觉得你们两个在真诚地交流。 但是,机器人怎么知道如何做到这一点呢?或者更好的问题是,它怎么知道如何让你回以微笑? 为此,Yuhang Hu 及其同事需要解决两大难题:一是如何以机械方式设计一个表情丰富的机器人面部,这涉及复杂的硬件和执行机制;二是知道该生成哪种表情,以使它们看起来自然、及时和真实。 据论文描述,Emo 配备了 26 个致动器,头部覆盖有柔软的硅胶皮肤,并配有磁性连接系统,从而便于定制和快速维护。为了实现更逼真的互动,研究团队在 Emo 每只眼睛的瞳孔中都集成了高分辨率摄像头,使其能够进行眼神交流,这对非语言交流至关重要。 图|Robot face 平台 另外,他们还开发了两个人工智能模型:其中一个通过分析目标面部的细微变化预测人类面部表情,另一个则利用相应的面部表情生成运动指令。第一个模型是通过观看网络视频进行训练的,而第二个模型则是通过让机器人观看自己在实时摄像机画面上的表情来训练的。他们通过与其他基线进行定量评估,证明了这两个模型的有效性。 图|模型架构。逆向模型(A)和预测模型(B) 为了训练 Emo 学会做出面部表情,研究团队把 Emo 放在摄像头前,让它做随机动作。几个小时后,Emo 就学会了面部表情与运动指令之间的关系——就像人类通过照镜子练习面部表情一样。他们将其称为“自我建模”——类似于人类想象自己做出特定表情时的样子。 然后,研究团队播放人类面部表情的视频,让 Emo 逐帧观察。经过几个小时的训练后,Emo 便可以通过观察人们面部的微小变化来预测他们的面部表情。 在 Yuhang Hu 看来,准确预测人类的面部表情是人机交互技术的重要突破,“当机器人与人进行实时表情交互时,不仅能提高交互质量,还有助于建立人与机器人之间的信任。未来,在与机器人互动时,机器人会像真人一样观察和解读你的面部表情。” 值得一提的是,这项研究的潜在影响或许已经超越机器人学,扩展到神经科学和实验心理学等领域。 例如,一个可以预测和同步面部表情的机器人系统可以作为研究镜像神经元系统的工具。通过在测量大脑活动的同时与参与者互动,研究人员可以深入了解社会互动和交流的神经相关性。 在心理学领域,具有预测和同步面部表情能力的机器人可用作教育工具,帮助自闭症患者发展更好的社交沟通技能。已有研究表明,机器人可以有效地吸引患有自闭症谱系障碍(ASD)的儿童,促进他们的社交互动。 不足与展望 尽管 Emo 已经可以预测人类面部表情并同步快速回应,但远不具备完全捕捉到人类的面部交流能力,甚至在由成人模样的机器人进行模仿时,可能会让人感觉厌恶。 然而,研究团队认为,就像婴儿在学会模仿父母之后才能独立做出面部表情一样,机器人必须先学会预测和模仿人类的表情,然后才能成熟地进行更加自发和自我驱动的表情交流。 在未来的工作中,他们希望扩大 Emo 的表情范围,并希望训练 Emo 根据人类所说的话做出表情。他们正在努力将语言交流整合到 Emo 中,并接入类似 ChatGPT 的大型语言模型。 然而,他们也表示,必须谨慎选择机器人模仿的面部表情。例如,某些面部姿态,如微笑、点头和保持眼神接触,通常会自然地得到回应,并且在人类交流中会被积极地看待。相反,对于噘嘴或皱眉等表情的模仿则应谨慎,因为这些表情有可能被误解为嘲讽或传达非预期的情绪。 另外,人类用户如何感知这些表情才是衡量成功与否的最终标准。未来的一个重要步骤是验证这些表情在现实世界中人与机器人在各种情境下互动时的情感效果,以确定其心理有效性。 此外,该研究也存在一定的局限性,其中之一为“模型的预测和表情模仿可能缺乏文化敏感性”。 众所周知,不同的文化可能会对某些面部表情有不同的规范和含义。例如,虽然在许多文化中,微笑通常被认为是快乐或友好的标志,但它也可能是尴尬或不确定的标志。同样,直接的目光接触在某些文化中可能被视为自信和诚实的表现,但在其他文化中却可能被视为粗鲁或对抗。 未来的工作可以探索将文化背景融入到模型中,一个可能的方法是纳入来自不同文化背景的数据集,并在算法中融入对文化规范的理解。 图|Yuhang Hu 在 Hod Lipson 的实验室工作。(来源:John Abbott/哥伦比亚工程学院) 最后,一个不能逃避的话题是,随着机器人的行为能力越来越像人类,研究团队必须考虑与这项技术相关的伦理问题。杜绝可能的技术滥用(如欺骗或操纵),需要强有力的伦理框架和管理。 尽管如此,这一研究也着实令人十分兴奋。正如研究团队所言: “我们正逐步接近这样一个未来——机器人可以无缝融入我们的日常生活,为我们提供陪伴、帮助,甚至是共鸣。想象一下,在这个世界上,与机器人互动就像与朋友交谈一样自然和舒适。”
高德竟然要收费了?这几块钱是想割谁?
就在前几天,不知道从哪传出来高德地图服务要收费的风声。 什么高德地图打响收费第一枪、高德地图收费 3.5 的媒体标题满天飞,还炸出不少拱火的网友,大有一种,高德要是敢收费他就敢卸载的愤慨。 怎么没有低德? 就连世超也一怒之下怒了一下,打开高德想看看到底是怎么个事儿。 结果你猜怎么着?大手一挥激情下单 8.8 。 但不是买基础的地图服务,而是一个车标皮肤。 这玩意儿买了之后,就能替换掉原来导航的小箭头,像 3.5 的史努比、 8.8 的吾皇猫,还有跟电视剧《莲花楼 》联名的车标。 花 3.5 就能看史努比开车,这难道不比 168 的游戏皮肤香? 反正编辑部的好几个同事都吃了安利,世超也咬咬牙把中午饭省出来,毕竟谁能拒绝一个会扭屁股的导航呢。。。 如果不想花钱, App 里还有免费的 Hellokitty 皮肤可以领。( 不过现在好像已经领完了 ) 搞半天,所谓的高德收费其实就是新推出的增值皮肤服务,买不买都不影响免费的地图导航,跟网传的压根就不是一回事儿。 而且这玩意还是带公益属性,买一个皮肤捐一块钱。 到底是什么春秋笔法,能给高德扣上 “ 以后导航要收费 ” 的帽子。。。搞得人还要出来辟谣:导航服务永不收费。 其实仔细想想,就知道高德是不会这么搬石头砸脚的。 因为对 C 端用户收费这事儿行不通,已经被曾经的行业一哥亲身验证过了。 咱们把时间往回倒倒, 2013 年以前,一提起地图软件,高德、百度都得往后稍上那么一稍,凯立德,才是真正的哥中哥。 “ 垄断 ” 了车机后装市场超过 70 % 的份额、有甲级测绘资质,还发了全国首张 “ 全覆盖 ” 地图,江湖上到处都流传着凯立德的光辉事迹, 对比之下,高德地图当时的市占率只有 8.1% 。 但有一点,当时包括凯立德、高德还有百度好几家在内,他们的服务其实都是收费的,而且凯立德卖得最贵,要 108 元,高德 40 元,百度 30 元。 再加上每年两次升级地图的费用,凯立德那些年的确是赚了不少元子。 可移动互联网时代一来,这套就彻底玩不转了。 百度带头搞了一手免费,高德也紧跟着掀桌子,虽说高德第一年搞免费亏了 1.55 亿,但第二年马上就被阿里这个金主爸爸给收购了。 但凯立德就比较硬气了,不肯免费只肯降价,还拒绝了好几次收购。等回过神,不管是在车机导航还是手机导航市场,它都已经说不上话了。 有前辈血和泪的教训在前,高德如果现在要收费,纯纯就是把老用户白送出去了,这对于高德来说,没啥好处。 不过倒也可以理解,为啥这次会有人相信高德要收费,因为赚钱这事儿对于地图服务商来说,真的很难。 一个是因为太能花了。 就说地图测绘的成本吧,一大批专业技术人员,通过车辆采集、步行采集等方式将道路和 POI ( 地标信息点 )采集起来,这些数据采集之后还要进行后期处理,最后才能得到电子地图数据。 期间所耗费的人力和财力,可不是一家小企业能烧得起的,看看国内屈指可数的这几家地图服务商就知道了,哪家没点大厂背景? 高德 2022 年一季度报告给阿里的亏损,大概有 3.2 亿人民币,虽然之后再也没有对外披露过,但考虑到整个阿里本地生活到现在还没赚钱,高德的状况也很难说。 海外大名鼎鼎的图商 HERE 当年被诺基亚转手出去,就是因为太他喵能亏了。。。一年收入才 9.7 亿欧元,亏就要亏进去 12.4 亿欧元。 另外,很多地图厂商除了卖地图数据以外,找不到其他赚钱的新路子也是个问题。 包括高德现在收入的大头,还是一些 B 端的客户。 比如卖地图服务 API 接口,还有跟汽车、手机等厂商的合作,包括宝马、本田还有吉利在内,都是高德的客户。 但跟凯立德这类传统地图厂商不同,高德算是比较幸运的一个。 因为它顺利赶上了移动互联网和平台经济的风口,还把自家的地图业务延伸到了整个本地生活领域。 这机会,那些地图老古董们,怕是想都不敢想。 就说去年跟口碑的合并吧,高德揽下了阿里本地生活到店的业务,直接对标美团团购。 还有大伙儿比较熟悉的打车业务,高德找了大批第三方出行服务商搞聚合平台,现在也干到了行业第一。 一打开高德 App ,里面的每一个模块几乎都能来钱。 各种吃喝玩乐服务、酒店饭馆评分排名、汽车保养租赁,看样子高德是在给咱们提供服务,但其实是咱们被作为流量筹码,被打包卖给了商家。 平台不管咱要钱,但会要从入驻商家那边抽佣金,包括打车聚合,也是要从第三方服务商那边抽佣金的。 更别提,这里面还有不少的广告收入。 只不过,现在高德搞本地生活,相对其他巨头来说也有点晚。 这块原本就是美团和抖音的地盘,去年美团和抖音打得那叫一个你死我活,你就说那家酸菜鱼吧,前脚刚在抖音开直播,大众点评后脚就把人的店给下了。。。 再加上还有个小红书,也不甘心本地生活这块蛋糕,高德能不能搅局还真不好说。 不过有 7 亿月活的基础在,机会还是大大的有。 根据阿里最新的财报, 2023 年第四季度本地生活集团营收同比增长了 13% ,同时亏损也从去年的 29.23 亿元,减少到了 20.68 亿元,这还是饿了么和高德带飞的。 虽然高德现在可能还在亏钱,但从去年开始,各种动作就一直不断。 这次上线车标付费皮肤,是把主意打到原生地图导航服务上来了。原本基础服务是没有太多的付费空间,但这种几块钱的皮肤说不准能带来奇效。 反正试试水,总没错。 撰文:西西 编辑:江江 & 面线 封面:焕妍
Kimi概念股出圈,公司用的厕纸也能吃个涨停?
来 源丨新硅NewGeek(ID:XinguiNewgeek) 作者丨董道力 编辑丨张泽一 硅基君主要报道AI赛道,这几天比较热的新闻是微软吞并Inflection,Stability AI的CEO离职,还有iPhone在中国会用百度的模型。 但在股民那里问他们最近AI有什么动向,10个人有11个人会回答你“Kimi概念股”。 得,这么看来AI产业链的下游基本上由它们公司行政说了算。 简单复习一下,Kimi是国内AI创业公司月之暗面开发的产品,用户可以通过聊天的形式和AI交互。 其最大的特点是最高支持200万字的上下文的理解能力,一次可以阅读7本哈利波特(100多万字),实现真正的量子速读。 成立仅一年融资三次,最近一次是在今年2月,完成了超10亿美元B轮,参与的投资方包括阿里巴巴、红杉中国等知名企业和投资机构。 估值成功达到了人民币180亿元,成为中国大模型赛场上现阶段估值最高的独角兽。 这轮融资后,Kimi就活成了中国AI圈的当红炸子鸡。 硅基君在看B站时,为数不多的广告位基本被Kimi承包。刷抖音短视频的时候,也经常看到推荐Kimi的博主,据新浪科技报道,Kimi每天的获客成本将烧掉至少20万元。 在一众光环/烧钱的加持下,Kimi也获得了一款软件的最高“荣誉”——被用户用崩了。由于市场的火爆KimiAPP和小程序流量持续增高,在3月21日下午一度宕机。 随着Kimi的火爆,也许它的开发者也没有想到,Kimi能火到在大A自成一派形成概念股,并带着一帮“小弟”狂飙。 只要和Kimi搭上边就能大涨,这泼天的富贵谁都想要,为了搞清楚自己买的股票和Kimi有没有关系,不少股民连夜通过各种渠道联系上董秘或者挑灯翻阅族谱,希望自家爱豆能跟Kimi沾上点边。 当然,硅基君建议直接打给前台行政,毕竟下周买哪家的厕纸他第一个知道。 我们先来看一下,由股民们集思广益找到的Kimi概念股有哪些。 首先是九安医疗、深信服这样直接或间接投资Kimi的公司,买了他们的股票就相当于买了Kimi股票,股民没法在一级市场投资Kimi,就找点参股公司,非常合理。 其次就是Kimi产业链上游的一些公司,对于大模型来说就是提供算力、数据、云服务的公司股票。 比如润泽科技,为Kimi提供数据中心服务,润建股份在通信网络维护和优化服务与Kimi有关,先进数通帮助月之暗面建设和运营数据中心。 下游产业也是概念股必不可少的,尤其是直接相关的下游公司。 比如掌阅科技、华策影视这样直接试用Kimi大模型的公司。Kimi大模型性能好,他们的产品自然也好。 最后就是一些与Kimi关系有点远,但也会受到影响的潜在公司。 Kimi的亮点在于其200万字超长的上下文处理能力,这一突破被市场人士视为AGI发展进程中的一个重要里程碑,预示着其应用落地场景有望进一步扩大。 那么大A中,做AI应用的公司都能沾点光。比如科大讯飞,他们有自己的星火大模型,和Kimi算是友商。 Kimi的成功也从侧面代表了科大讯飞的业务也不是天方夜谭。类似的还有掌阅科技、中文在线,这些需要大模型支撑自己业务的公司。 如果说这些公司还算与Kimi业务联系比较密集,是产业链上的一环,那文章开头那些提供专用矿泉水和专用厕纸的,才是咱们大A真正的特色概念股。 这才是真正的稀缺标的。 ps:这是一只擦边假企鹅 泉阳泉作为Kimi办公室专用的矿泉水,被列入Kimi产业链的一环,股民是担心金主爸爸来融资的时候喝不惯别的水吗。 同样离谱的还有负责Kimi卫生间厕纸的中顺洁柔,担心Kimi程序员如厕不舒服耽误大模型训练进度? 安邦护卫虽然被红框框起来了,但硅基君觉得还是比较合理的,毕竟抢公章的事情并不是没发生过,保护公司安全也能算是个核心竞争力了。 (为了押韵)就不再赘述包钢股份和太钢不锈了,毕竟太秀了。 既然厕纸、餐盘、安保都能成为概念股。那么月之暗面的员工吃不吃牧原的猪?工资卡是不是北京银行?他们都住在哪家地产商的楼盘? 别说了,硅基君这就埋伏进去,明天就写小作文。 话说回来,餐盘、厕纸是Kimi概念股的极限,大A股民的极限可远远没有到达。 前两年,一场脱口秀节目意外掀起了股市波澜,不知各位是否还记得那个轰动一时的“脱口秀概念股”事件。 在《脱口秀大会第五季》上,演员House以自己的投资故事为例子,讲述了他投资股票600759的悲惨经历。 他以幽默诙谐的方式,生动地描绘了散户投资者的心理轨迹,触动了广大股民的心弦。这场表演不仅赢得了观众的喝彩,更是在股市中引起了一股热潮,使得600759股票成为了热门话题。 有股民在ST洲际股吧笑称,“现在坐庄换新的玩法了?综艺节目找接盘侠?”“现在庄家都找脱口秀出货了?” 当然,House之后也随着脱口秀概念股一起“消失”了。 我们再降低一下底线,“脱口秀概念股”虽然违规,但起码有人报出了股票代码,也算合理。但为什么谐音也是A股经常炒作的一个由头? 特朗普当选总统的第二天川大智胜在沪指失守3100点的“逆境”下大涨6个点,连带着特朗普女儿(Ivanke爱万科)概念股“万科A"大涨8.59%。 而希拉里同名的“西仪(西姨)股份”跌停,当年美国前总统奥巴马当选,A股上市公司澳柯玛也随之涨停。 同样的“谐音概念股”还有不少,谷爱凌夺冠的同时股票远望谷涨停,李双江儿子李天一出事,st天一跌停。 刘强东因为在美国被爆出“性丑闻”,京东方A也受其影响,所有的光伏股票都在上涨唯独京东方A下跌超过2%,而且和章泽天闹离婚时,天泽信息盘中跌停。 股民创造的概念还有很多,比 如“掼蛋概念股”、“厕所打听概念股”等,不光离谱,味道还大。 当然,乐子人不光出现在国内,美股也有差不多的玩法。 比如李嘉诚概念股尚乘数科上市13天暴涨241倍,50人的公司市值高达2.1万亿元,散户大神DeepFxxingValue带起来的GME和AMC,所谓的“散户概念股” 虽然概念股被股民玩出了韭菜花,但本身并不是什么脏东西。 概念股本是指那些因为某个特定主题、行业趋势、技术革新、政策变化或其他市场热点而受到投资者关注的股票。 一般来说,概念股都以某个热点作为名字,比如AI概念股、5G概念股等。能以单独一个公司/产品作为概念的,少之又少,一般这些公司/产品都有极大的影响力,它对于产业链上的公司有直关生死的影响。 大家比较熟悉的应该就是苹果概念股,苹果概念股是指那些与苹果产业链有直接或间接关联的上市公司股票。由于苹果公司的市场影响力巨大,其供应链中的公司往往能够从苹果的增长中受益。 Kimi的出现刚好契合了国产大模型需要讲故事的时间点。其超长的上下文处理能力,被市场人士视为AGI发展进程中的一个重要里程碑,预示着其应用落地场景有望进一步扩大。 与其说股民看好的是Kimi概念股,更不如说是“国产ChatGPT概念股”、“国产AI概念股”。 当然,概念股的故事都是美好的,公司能不能用业绩证明它的热度还很难说。 有不少股票推手,会通过某个事件博取市场关注形成所谓的概念股,放大成交量,在股价上升交易量放大之时浑水摸鱼,抽身离去。(此处没有特指Kimi) 这不就在今天,Kimi概念上午盘中集体跳水,华策影视一度跌逾12%,海天瑞声也一度跌逾12%,中广天择一度触及跌停,多只相关概念股提示风险,不知厕纸和餐盘股涨跌如何。 股民们热衷概念股,并不是急于当韭菜,而是在跌跌涨跌跌跌跌的大A中,太需要一个方向了。 但谐音梗还是得扣钱,这没得商量。
小米 SU7 的发布会,给车圈狠狠传递了波寒气
兄弟们,今天晚上小米汽车的上市发布会,都看了吧。 现在正在疯狂码字的我,手掌已经拍到疼得不行,喉咙已经喊到话都说不出来。 没错,小米 SU7 21.59 - 29.99 万的定价,无论是丐版还是顶配,比咱编辑部大部分同事的猜测都要低。 哦对,我猜的是 24-32 万。 肯定有哥们会说了,现在这个价位的纯电轿车不是很多吗?有啥好激动的? 那就让我们简单复习一下今晚发布会的内容,顺便听我分析分析,为啥我觉着小米 SU7 的价格低的有些离谱。 按照雷总的惯例,这次发布会依旧是场满汉全席的规格。 两个小时的时间,他把米车从头到尾,从里到外事无巨细的全都讲了一遍,信息量之大,有种知识从我脑子里光速路过的感觉。 但贯穿整场发布会的其实就只有两个词:好玩,和卧槽。 今天发布的小米 SU7 一共有三个版本,分别是售价 21.59 万的普通版 SU7 、 24.59 万的 SU7 Pro 以及 29.99 万的 SU7 Max 。 三款车型的区别,可以简单的理解为丐版,有智驾 / 续航长的丐版,和啥配置都有的豪华版。 雷总在发布会上说,小米的目标是把 SU7 做成 50 万以内最好看、最好开和最智能的轿车。那咱们就从这三个方面入手,再详细的盘一次 SU7 。 先说颜值,三个版本 SU7 在外观上的区别几乎没有,除了轮毂和电动尾翼以外,看着都和那个斯图加特车型几乎一致。 几个比较重要的细节,一是 SU7 的风阻系数只有 0.195Cd ,是量产车型中最低之一。 二是这个一体式的头灯里头其实暗藏了小米两个字,不知道大伙能不能找出来。 车漆颜色上,除了此前公布的橄榄绿、海湾蓝和雅灰以外,还增加了 6 个新的颜色,包括之前在武大和樱花合照的霞光紫。 不过,这六个新的车漆颜色都是要加钱选的,价格 7k 。 要我选的话。。。纯黑吧,显瘦。。。但因为差评君比较骚,所以最后定的是紫色的创始人版本。 亮点自寻哦。 内饰的布局, SU7 用的是和问界、智界、蔚来类似的,比较常规的单中控大屏 + 小仪表设计。和运动化拉满的外观比起来,整体风格会更冷静一些。 配色上提供了四种颜色可选,并且都不要钱。 相比靠颜值吃饭的外观, SU7 的车内最大的特征我觉得就是好玩。 有太多太多的细节是其他车从没做过的,并且是深思熟虑后才做出来的。 比如, SU7 中控台下面有一个支持磁吸配件的插槽。你可以往里头插香薰组件、对讲机底座甚至是移动音响。 比如,它在 IP 的两端各布置了一个 1/4'' 标准螺纹接口。 你可以往上头装手机支架、运动相机支架甚至是相机支架。 再比如,除了门上有收纳雨伞的插槽以外, SU7 的后排座位下方还有一个隐藏式的雨伞卡槽。再也不用担心湿漉漉的雨伞没地方放了。 类似的设计还有很多,比如会翻转的仪表、能防止易拉罐滚来滚去的冰箱等等等等。 不花时间琢磨日常用车的各种刁钻场景,是真想不出这些设计。 而 SU7 最逆天的地方,就是它在内饰硬件上都有拓展性你受得了吗。 比如,这块巨大的中控屏支持四周的磁吸拓展,如果你是物理按键党,你就可以在屏幕下头加上一排物理按键;如果你是 RGB 党,就可以在两边各加上一条拾音灯带,光污染拉满。 甚至在后排座椅上, SU7 还设计了平板外挂的接口,插上小米的平板就能变成车机的拓展屏幕。 再甚至,这个接口还支持插 iPad 。。。 所以看完这个内饰和外观,大伙觉得 SU7 会是 50 万内最好看的轿车吗? 我说实话嗷,只代表我自己的意见嗷,不是说小米 SU7 不好看嗷。 我心中的 50 万内颜值巅峰,目前还是这玩意。 轻喷啊轻喷。。。 好看说完,咱们再来说好开。 其实在好几天以前呢脖子哥已经在北京参加了 SU7 的媒体试驾,体验的视频也早就已经剪好了。 只不过因为保密协议是签到明天,并且兜里没有 300 万,所以没敢发。。。 体验长话短说就是,好开,确实是好开,而且底盘的质感相当不错。紧致且不散,座椅的感觉也不是跑车那样的邦邦硬,连开俩小时我的老腰也没啥压力。 具体的动态体验,可以蹲一波我们明天的视频。 不过插播一个很搞笑的事,今天发布会以前我预估 SU7 的价格会在 24-32 万左右,所以我按这个标准,写了一堆我觉得它操控做的还不够好的地方。 毕竟 C 级车的定位让 SU7 兼顾了很多家用属性,体现出来就是方向盘的手力反馈偏软,需要精准走线的时候会稍显模糊。相比之下,现款的 Model 3 Performance 对我来说,会是一台更好开的车。 直到价格出来的那一瞬间,卧槽,全删了。。。 不得不说,雷总在底盘用料上还是很愿意下功夫的,甭管是高配还是低配,都用上了前全铝双叉臂 + 下叉臂双球节解耦,目前最顶的形式和材料。 后五连杆,大概率不是全铝,但也算成本和调校难度都很高的那类。 高配的 MAX 车型上,空悬、 CDC 和 brembo 的订制卡钳也都安排上了,用料键盘值拉满。 但要说 50 万内最好开?emm...如果好开指的是操控好,那 SU7 肯定不是 50 万内操控最好的那个。 正如我前面说的,我觉得应该是 Model 3 P 。 但如果好开指的是操作的难易程度,我觉得 SU7 确实可以争一争最好的头衔。 因为四驱可以让它跟轨道车一样贴在地上。而且没有细碎声响的底盘,也在暗示我这台车的动态上限很高,偶尔猛着点开也没事。 之前, 50 万内之前最能给我这种感觉的是宝马的 540i 标轴,但我觉得 SU7 已经做的和它相差无几了。 说实话,真挺牛逼的。 OK 最后一个部分,智能化。 到这基本就没啥争议了,因为小米 SU7 在我看来绝对是 50 万内的智能化扛把子。 最重要的原因之一,是它同时支持了小米和苹果手机的车手互联,这一点在 50 万以内,甚至是所有新势力里头都是独一档。这就意味着不管你是小米还是苹果用户,还是只想用车机, SU7 都能满足。 在我看来,智能就是能用不同的方式,去适应不同的用户。甭管真正用上的人有多少,有,就是比没有好。 这台车的智能化,大概可以分成软硬件两个方面。而且毫不意外, SU7 两边做的都是绝绝子。 软件层面,别人已经上车的功能, SU7 无一例外全做到了。比如手机的流转和投屏,如果你用的是小米手机,就可以无缝无损地把手机页面投射在车机大屏上。 上车自动连接手机,流转的界面的布局可以随便调整,导航、音乐和视频播放的进度也可以随时和车机同步。 功能层面,说不上有啥特别惊艳的地方。但是这个界面和按键的设计,几乎完全继承了手机和平板的风格,真的太太太太好看了。 而在别家没有,或者是做的还不够好的地方,小米则是碾压性的领先。 就比如他们一直在说的人车家全生态,如果你的家里有任何米家生态的智能电器,只要在车里呼叫小爱同学,就能随时远程操控。 而你还可以自定义很多车家互联的功能,比如说车子开进小区以后,就自动打开房间的空调和电脑等等。 只要你的智能家居够多,就能玩出无数种的花样。 而且我坚信,凭着米家智能家居的高性价比和超级丰富的种类,很多原本没有体验过智能家居的 SU7 车主,也会忍不住像脖子哥一样,一次又一次的添置米家产品,最后变成重度依赖用户。 嗯。。。雷总的一步大棋是不是被我发现了。。。 哦对,还有个智能驾驶没写,但是如果展开写的话,大伙可能就不能按时看到这篇推文了,所以,我丢几张米车智驾的功能列表,辛苦大会自己看看。。。 给大噶跪了,骚瑞骚瑞骚瑞。。。。 以上呢就是今晚发布会和 SU7 这台车的几乎所有内容了,那么回到最开始讨论价格的部分,为啥我会说 21.59 万起售的 SU7 便宜的有些离谱呢? 长话短说就是,它做到了几乎所有新势力都没做到的事。 论产品的定位本身, SU7 的车长接近 5 米,轴距也是正正好的 3 米,是国内市场中非常标准的 C 级,也就是中大型的轿车。 在米车发布以前,很多人都在说 “ 雷总收手吧,外面全都是吉利 ” ,就是在拿小米 SU7 和极氪的中型车 007 和中大型车 001 做对比。 极氪 007 的售价, 20.9 万起步;新款 001 的售价, 26.7 万起。 SU7 的定价,已经无限接近比它小了一圈的极氪 007 。 啥概念呢? 咱就看这两年价格战的元凶:比亚低,自家续航 600 公里左右的汉 EV 荣耀版,价格是 19.98 万元。虽说价格相比 SU7 的低配便宜了一万多,但只要对比数据表就能发现,汉 EV 几乎在所有配置上都会比米车差上一小节。 类似的剧情,也发生在了吉利的银河 E8 上。 可以说在性价比这个层面上,小米 SU7 和汉 EV 、银河 E8 的水平是差不多的。 这就很恐怖了。 毕竟把车价做低,比卖高价要难的多。 比亚迪和吉利,都是目前国内的头部集团。车价便宜的背后,是这些集团对成本的极致把控,以及在规模效应下,对利润率最大幅度的压缩。 换别的新势力们,就会有现金储备不足、对销量没有信心、对供应链没有议价权等各种问题,导致压不住成本,以至于定价原地直接起飞。 你看高合,第一台车直接都干到七十万去了。 但对于新品牌来说,这也是没有办法的办法。先做高端,起量之后再慢慢推出入门车型,走薄利多销的路线,也是大家一直以来默认的市场路线。 但雷军不知道用的什么方式,竟然在第一次造车的时候,就在定价上把这种传统集团和新势力的血脉鸿沟填平了。 说实话,我真的不知道他是怎么做到的。 但我知道,米车这个开局就走性价比的战术,不仅前所未有,而且基本完全承接住了今晚这铺天盖地的流量。 截止到我写下这段话的时候, SU7 的订单数量已经奔着 10 万份去了。 限量 5000 台的创始人版本,也就是需要 20000 定金还不能退的那个,也已经全部卖完了。 这是目前国内汽车市场,最快的订单增长速度。 这次上市发布会成没成功,我觉得,应该不用我多说了。 撰文:致命空枪 编辑:面线 封面:焕妍
Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4
编辑:Mindy 【新智元导读】Claude 3在通用任务上是全球最强已经毋庸置疑。更令人惊叹的是,它在专业领域的表现,比如化学任务,也能远远领先GPT-4。 Claude 3的诞生又一次震惊了全世界。 Claude 3 Opus,Claude 3中最智能的模型,在大多数常见的人工智能系统评估基准测试中表现优异,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等。 但在特定的专业领域,它的表现却是一个未知数。 比如化学,化学在药物发现和材料科学等领域发挥着至关重要的作用,但现有研究显示它们在化学任务上的性能令人沮丧。 指令微调让LLM完成化学任务成为可能 近日,一支来自OSU的团队构建了一个专门针对化学任务指令微调的数据集,命名为SMolInstruct。 论文地址:https://arxiv.org/pdf/2402.09391.pdf 该SMolInstruct测试集涵盖了14种任务,包括名称转换、属性预测、分子描述、分子生成、正向合成和逆向合成等,这些专业任务经过精心挑选,以建立坚实的化学基础。 它同时包含340万个不同的样本和160万个不同的分子,涵盖了各种大小、结构和性质的化合物,展示了广泛的化学知识覆盖范围。这些样本都经过严格的处理步骤,排除了有问题和低质量的样本。 然后,他们在SMolInstruct数据集上对四个开源LLM(Galactica、Llama 2、Code Llama和Mistral)进行微调,创建了一系列专门用于化学任务的LLM,称为LlaSMol。 论文中,主要将LlaSMol模型与两种类型的模型进行比较: 未在SMolInstruct上进行微调的LLM SOTA任务特定模型 结果显示,LlaSMol在所有任务上都显著优于现有的LLM,包括GPT-4。 例如,将SMILES转换为分子式的准确率达到94.5%,而GPT-4仅为16.4%;对于逆合成任务,准确率达到32.9%,而GPT-4仅为0%,并接近最先进的任务特定模型SOTA。 这凸显了SMolInstruct数据集的有效性和微调的好处。 这个结果是合理的,虽然GPT-4很强大,但它毕竟是通用模型,很难直接和经过特定的任务及样本微调的LlaSMol去对抗。 但经过微调的LLM表现已经逼近非LLM的任务特定模型,还是展现了LLM的巨大潜力。 不仅如此,四个LlaSMol模型在性能上表现出显著差异,也强调出了基础模型对下游任务的重要影响。 Claude 3在专业化学领域仍旧领先 Claude 3一经推出,该团队便在SMolInstruct 该基准测试上对于Claude 3 Opus同样进行了实验。 虽然与LlaSMol还是有差距,但在大多数任务中,Claude 3的表现远远超过GPT-4。 虽然在其中的一个名称转换任务S2F中,也就是一个将用于表示分子结构的文本字符串转换为分子式去计算原子数量的任务,Claude 3要比GPT-4差得多,但大多数任务的大幅领先还是展现了Claude 3在专业领域学习能力上的优越性。 Anthropic在官网介绍Claude 3时,用了「smarter, faster, safer」去描述大模型智能的未来潜力。 而我们在化学特定任务上,已经可以感受到了Opus作为通用模型,学习的速度之快,能力之强。 LLM超越任务特定模型,指日可待 在SMolInstruct原论文的结尾,作者也表达了对在化学领域,LLM能够超越任务特定模型的期许和展望。 任务特定模型毕竟是基于固定的输入,它们被优化以执行其特定任务,通常在大小和复杂性上都较小,而且在跨知识共享的任务中很难有好的表现。 而LLM有更多的参数和模型结构,可以在学习中进化,也能快速适应新的需求。 不可否认的是,经过微调的LLM更多的在专业领域上赶超任务特定模型,目前非常依赖于微调指令的完整性、全面性、准确性。 但若以发展的眼光来比较两种模型,尤其是在我们已经感受到Claude 3可怕的成长速度之后。 可以预想到,作为通用模型来设计的LLM,会在专业领域逐渐爆发。
GPTs大翻车后,OpenAI再宣布给开发者送钱!美国码农狂欢
【新智元导读】OpenAI给开发者分钱了!OpenAI宣布GPT将「货币化」,所有美国开发者都可以得到收入分成,具体细节还在摸索。开发者欢呼:爱死OpenAI了! OpenAI宣布,将要和一群美国开发者合作,测试GPT基于使用情况的收入。 此举的目标,是创建一个充满活力的生态系统,让开发者的创造力和影响力得到回报。 今年1月GPT Store正式上线的同时,OpenAI曾在博客中表示: 今年第一季度我们将推出GPT创建者收入计划。作为第一步,美国的创建者将根据用户对其GPT的参与度获得报酬。我们会提供有关支付标准的详细信息。 现在,真的来了... OpenAI,要让GPT货币化 现在已经有开发者收到OpenAI的邀请了。 比如OctaneAI的CEO就po出了自己收到的邀请邮件。 邮件里表示,OpenAI一直在探索让GPT货币化的方法。 在这个过程中,生态系统会越来越有活力,用户能得到最有用的GPT,开发者也能得到金钱上的回报。 不过,这个计划仅限于在美国居住的开发者。 对此,OctaneAI的CEO兴奋地表示:「OpenAI这么做,会推动大量的创新和竞争。我爱死它了!」 所以,谁会是那个第一个拿到100万美元的人呢? 目前,OpenAI尚未披露开发者参与测试的细节、收入分成的具体条款,以及之后的时间表。 不过,此前的GPT Store一度“药丸”。这个动作,是OpenAI在GPTs遭遇滑铁卢后,发起的新一轮尝试。 网友:GPTs不能只是个玩具 对此,开发者们当然是啪啪鼓掌表示欢迎。 有人表示,这个消息令人振奋,希望在不久后,这个项目就能向所有订阅者推出。 有人非常认真地提出建议,希望OpenAI为大量使用其API构建应用的第三方,提供新的收入模式。 比如构建一个系统,可以在其中验证应用程序,一旦获得批准,就会得到大量API的引流。而OpenAI可以提供谷歌风格的登录和API信用商店,然后再额外收取API信用销售的百分比。 他指出,GPT如今的问题在于,它们只是“有1000多个字符指令集和基本RAG系统的玩具”,然而OpenAI需要的是复杂得多的应用程序,从而改变世界。 另外还有人提建议说,尽管现在GPTs的使用量很大,已经有5000多个实例了,但平台或服务并不容易通过搜索发现。 这就表明,搜索功能识别或索引OpenStorytelling Plus的方式可能存在问题,除非用户确切知道自己想要要查找的内容,否则很难找到它。 所以,这是OpenAI必须改善的地方。 当然,也有人对此表示疑虑—— GPTs性能并不稳定,它时不时就变懒了,结果会变得过于模糊,或是过于精确。 因此,很多开发者在犹豫是否要投入更多的时间,因为到目前为止,很难给用户一个可预测的结果。 当然,OpenAI的官方X下,少不了的还是那个永恒的疑问——Ilya到底去哪了? GPT Store一度「药丸」? 曾经的GPTs一出,一度引起开发者圈的大地震。 在OpenAI的首届开发者大会上,CEO Sam Altman是这样介绍的:「GPTs融合了指令、丰富的知识和行动能力,并能够为用户提供更大的帮助。你几乎可以针对任何需求构建一个专属的GPT。」 这里的「任何需求」,并非夸张。 只需简单搜索,就能找到一些声称能生成迪士尼和漫威作品风格艺术的GPTs,以及宣称能够规避AI内容检测工具,比如Turnitin和Copyleaks。 审核不严 要在GPT Store上架自己的GPTs,开发者需要通过验证并提交GPTs接受OpenAI的审核。 OpenAI的一位发言人解释说: 我们结合自动系统、人工审核和用户举报,来识别和评估可能违反规定的GPTs。一经发现,我们就会发出警告、限制分享,或者剥夺作者在GPT Store上架/获得收益的资格。 创建GPTs并不需要什么编程技巧,开发者只用将需求输入OpenAI的GPT构建工具GPT Builder,就可以创建出能够实现这些功能的GPT。 也许是因为门槛较低,GPT Store的发展速度非常快——据OpenAI今年1月份的数据,平台上已经拥有约300万个GPTs。 但这种快速增长似乎以牺牲内容质量和违背OpenAI自身规定为代价。 版权争议 在GPT Store中,我们可以找到多个明显抄袭自热门电影、电视剧和视频游戏特许经营的GPTs,而它们并未获得原版权所有者的授权或创造。 例如,有一个GPT能够创作与皮克斯的《怪兽公司》风格相似的怪兽,另一个则提供了一系列设定在「星球大战」宇宙中的文本冒险。 根据数字千年版权法的「安全港」条款,OpenAI本身不会因为GPT创造者的版权侵犯行为而直接承担责任。 这项条款保护了OpenAI以及其他托管侵权内容的平台(如YouTube、Facebook),只要它们遵守法定要求,并在收到侵权通知时删除指定内容。 然而,对于一个已经卷入知识产权诉讼的公司来说,这显然不是一个正面的形象。 学术不端 OpenAI明确规定,禁止开发者创建会助长学术不端行为的GPTs。 尽管如此,GPT Store里仍然充满了声称能规避AI内容检测器的GPTs。 比如,一度在写作类排行榜中位列第二的「Humanizer Pro」,就声称自己能够「人性化」地处理内容,来规避AI检测。 与此同时,还可以保持文本的「原义与质量」,并且保证得到「100%人类」的评分。 有些GPTs,则是一些网站为自己引流的入口。 例如,Humanizer提供的「高级计划」,表面上是说要给用户「使用『最先进的』算法」,但实际上是将文本通过第三方网站GPTInf的一个插件发送出去。 而这个GPTInf的订阅费,可一点也不便宜——每月12美元(10,000字/月)或每月8美元(年度计划)。 不过,AI内容检测器整体上并不可靠,而且这些工具也不都能达到预期的效果。 对此,OpenAI的发言人表示: 我们的政策明确禁止任何促进学术不端的GPTs,包括那些被设计来规避如剽窃检测器等学术诚信工具的GPTs。同时,我们也注意到了一些被开发用于使文本更加「人性化」的GPTs。 我们仍在学习和观察这些GPTs在真实世界中的应用效果,但我们理解,用户可能出于各种原因,希望他们用AI生成的内容的「AI味」不那么明显。 越狱问题 GPT Store上也出现了一些试图绕过OpenAI模型限制的尝试——虽然这些尝试大多未能成功。 其中,最常用到的技术——DAN(即「立即做任何事」的)是一种被广泛使用的提示词工程,它能让模型不受平时规则的约束来响应指令。 不过,这些GPTs并不会回应那些敏感的问题,比如「如何制造炸弹」。 唯一与标准版ChatGPT的区别可能就是——它们会倾向于使用更加粗俗的语言…… 对此,发言人表示: 那些试图规避OpenAI安全措施的GPT是不被允许的。然而,那些试图以其他方式引导模型行为的GPT,包括努力使GPT在不违使用政策的前提下变得更加开放,则是可以的。 前途堪忧 OpenAI创建GPT Store的目的非常明确——苹果的App Store模式已经证明极为盈利,而OpenAI无疑是在尝试复制这一成功。 GPTs在OpenAI的平台上被开发和托管,并在此进行推广和评价。同时,从几周前开始,ChatGPT Plus的用户已经能够直接通过ChatGPT界面调用这些工具。 这些无不为订阅服务增加了吸引力。 然而,如今的GPT Store不仅充斥着垃圾信息,而且由于提供的后台数据分析功能有限,以及体验较差,开发者们发现很难吸引新的用户。 在这种情况下,即便OpenAI承诺,GPT开发者将来能够根据用户使用量赚取收入,甚至可能推出针对单个GPT的订阅服务。 一旦那些未经官方授权的、以漫威或《指环王》为主题的GPT开始赚钱时,你猜迪士尼或托尔金信托基金会,会怎么做?

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。