行业分类:
加载中...
头条分类:
加载中...
AI“分裂”好莱坞
作者丨 kiki 编辑 | 山核桃 美编丨渔 夫 在以大模型为代表的新一代技术席卷整个世界时,科技巨头与早期技术使用者正想着如何更好地加速技术推广,一股「AI是否会让人们失业」焦虑感已经在慢慢弥漫。 大洋彼岸外,好莱坞可能这股技术浪潮中,面对这一问题,态度最激进、冲突最明显的存在。所谓的「激进」是指,在此前好莱坞旷日持久的大罢工中,不少演员和编剧们都对人工智能展现出了担忧,而这场斗争核心就是他们希望自己不会被人工智能所取代。 尽管罢工已经结束,但「矛盾」的另一面也已经出现。在好莱坞内部,一股新的分裂已经形成——一边是创作者们对新技术充满了恐惧与不确定性,另一边却是好莱坞的巨头们已纷纷选择拥抱AI。 《名利场》(Vanity Fair)在近期的一篇文章里发出这样的感慨:“好莱坞即将经历类似于二十多年前音乐行业所发生的混乱。” 当不断涌现的新平台和新工具可以让普通人在客厅里创作一部如《奥本海默》一样长片时,好莱坞的工作室又该如何与之竞争? 事实上,在创作者们恐惧「被AI夺走饭碗」,并为之做出努力和抗争时,好莱坞的巨头们早已提前做出了自己的选择。 当我们谈到「好莱坞」时,宏观来看,其实是在讨论「巨头的生意」。 在过去数十年的资本博弈中,从曾经代表好莱坞黄金年代的「八大时期」,到索尼吞并哥伦比亚,亚马逊收购米高梅、迪士尼收购福克斯,AT&T收购时代华纳,一系列的变局下,如今的好莱坞已形成了迪士尼、索尼、华纳兄弟探索、派拉蒙、环球影业「五大巨头」的基本格局。 比起编剧们对AI的恐惧,巨头们对AI的布局早就写在了日程表里。 去年早在编剧们罢工之前,迪士尼就成立了一个AI特别工作组,内部研究AI的广泛应用,用以控制制作成本。今年2月,迪士尼公布了其年度创业孵化器计划,五家入选公司中有三家是AI初创企业。而华纳兄弟探索早在2020年就曾联手Cinelytic,开发AI系统来辅助电影发行。 另一边靠着大模型技术震惊好莱坞的「OpenAI们」也正抓紧一切机会讨好好莱坞巨头们。 今年3月底,OpenAI曾与派拉蒙、环球和华纳兄弟探索等高管见面,推广展示其Sora模型,并已经向一些大牌演员和导演授予了Sora的访问权限,据参与该会议的人士透露,OpenAI明确请求工作室的高管们帮助其推广Sora。 同样是「文生视频」领域「当红辣子鸡」的Runway,其技术早已介入《瞬息全宇宙》等好莱坞大片中。Runway此前曾报告称,其第二代文生视频模型Gen-2相关服务的用户数量已达数百万,这之中就包括了一批制作和动画工作室的专业人士。 好莱坞巨头们之所以对AI明星公司采取如此积极的态度,背后与其自身的困境离不开关系。 罢工只是好莱坞当下困境的一个缩影。过去一年,好莱坞巨头们的生意也越来越难做。2023财年,华纳兄弟探索的工作室业务总收入同比减少12%,派拉蒙电影娱乐业务的收入则同比减少20%,这背后表面是受「罢工余波」影响,但深层原因则是——好莱坞的内容似乎越来越不被观众们买账。 从北美票房收入的历史成绩单来看,尽管2023年的90亿美元是近三年来最好的成绩,但事实上,从2009年开始,北美票房收入一直稳定在100亿美元上下。而那些真正叫好又叫座的影片,已不再是曾经的超级英雄,而是《芭比》和《奥本海默》,这或许也是为什么迪士尼被夺走票房霸主的原因所在。 索尼影业主席兼CEO汤姆·罗斯曼就曾表示,罢工之后,好莱坞所面临的挑战甚至更加严峻:“制作具有强烈文化期待和可看性更高的影片。如果能达到这样的高标准,就会成功;否则,就完蛋。” 更重要的是,电影制作成本也越来越高。据《名利场》统计,不包括营销成本,电视节目的预算每集就在600万美元到2500万美元之间,而大多数主流电影的制作成本更是高达1亿至2.5亿美元。 票房不及预期下,成本又急剧攀高,好莱坞巨头们更加看重投入产出比,在成本控制上会更加小心翼翼。 回归之后的迪士尼CEO罗伯特·艾格曾在电话会议中明确将 AI称为一种颠覆性技术,并承认AI有能力为迪士尼「创造效率」。此前,迪士尼股东还呼吁迪士尼应尽快推出AI战略,因为「股价有望翻倍增长」。 因此,某种程度上,AI技术其实在好莱坞一直存在,好莱坞巨头们也一直都在积极布局。只不过,行业的不景气叠加以大模型为代表的AI技术能力的发展大大超出了预期,两重原因下,进一步放大了好莱坞的技术焦虑。 在巨头们的宏观生意之外,将视角落于好莱坞创作者的内部,在对AI的态度上,其实也早已出现了明显的分裂。 在一场关于创作者的峰会上,正在出现这样的景象。有些好莱坞的编剧们想要讨论和计划他们如何使用AI撰写大纲的过程,但因为被编剧工会的领导发现,而退出了峰会。 这是好莱坞的真实景象:一部分创作者真正积极接纳AI,甚至参与AI创业,还有一部分创作者依旧对AI技术持怀疑态度。 《火星救援》作者安迪·威尔,他既是一名科幻作家,同样也是一名编剧,在他看来,人工智能能够写出比人类更好的故事,他甚至预言:“在我的生命结束之前,我的职业实际上将会消失。”洛杉矶电影制片人Paul Trillo在试用Sora之后表示:“对它的更多实验性用例感到兴奋。”他认为,制作人可以通过Sora开始生产更多产品。 身兼数职的好莱坞知名电影人泰勒·佩里在看到OpenAI的Sora后,选择立即暂停8亿美元的工作室扩建,他也在决定在两部即将公布的电影中选择使用AI。 还有的创作者其实早就直接进入了AI创业大军。比如《头号玩家》主演泰尔·谢里丹参与创立的AI初创企业Wonder Dynamics,这家初创公司的产品Wonder Studio主攻CG动画特效,据了解,目前这一工具已应用在电影制作中。 但上述技术的早期使用者,或者说是好莱坞创作者群体中的头部,他们的态度并不能代表所有人。 演员、编剧们所担心的其实并不是AI技术本身,而是AI技术快速发展下,一些「未被看到、未被解决的问题」。 首先,是版权。 多年以来,好莱坞一直在扫描群演的身体,并将其数字化用于电影制作,以实现大规模创建逼真的数字人物。一些群演和头部演员担心他们的形象、肖像、声音等被技术被滥用。 此外,在电影智能制作过程中,同样设计大量数据和素材,那么其原创性和独创性又该如何界定?从技术上调查取证也十分困难。不久前,欧洲编剧联合会(FSE)和国际编剧协会(IAWG)的成员就通过了一项联合决议,呼吁应「道德使用」人工智能,不利用作家或其作品。该决议中明确提到,只有人类作家,而不是人工智能模型,才能获得原创作品的版权。 其次,恶性的竞争。 好莱坞底层的打工人们更关注是稳定的生存状态。WGA(美国编剧工会)指出,过去10年,编剧薪酬中位数下降了4%,为23%(考虑通胀因素调整后),但拿着最低标准每周或每集标准收入的编剧比例却在上升,能分的蛋糕越来越少。 而当更多工作室利用AI降本增效,可能会导致不良的价格竞争,因为资本总是趋利的,工会想要为创作者争取更多的利益,资本则想压价,AI成了助燃剂,所带来的可能是整个好莱坞创作生态的恶化。 一面是积极拥抱技术,另一面则是分裂的现状,好莱坞的危机是当下AI技术飞奔下的一个「隐喻」——在科技巨头都在宣扬技术红利时,如何跨越「技术鸿沟」这一问题,被人们所忽略了。 如果你了解好莱坞的历史,某种程度上,好莱坞的每一次变动都与技术息息相关。 从无声电影到有声电影,从制片厂到电视技术,再从流媒体的侵入,过去的数十年,新技术旧技术以各种可能的方式对好莱坞进行了拉扯、推动和打击,但好莱坞依旧向前。 但如今,情况发生改变,如今真正使其产生分裂的,表面是一个尚处于早期推广阶段的先进技术,但实际上其实是被忽视的「技术鸿沟」。科技巨头们忙着合纵连横,扩充生态,电影巨头们忙着寻找生存之计,挽救业绩表现。 唯一忽略的是,如何更好地理解「人」的需求,制定跨越鸿沟的策略,而非只是沉浸在对科技的幻想中。 从这一点来说,好莱坞如今的矛盾也给人更多的启示,一项高科技从小众到大众,技术固然关键,但如何弥合技术鸿沟,需要解决更多眼前现实问题。
被AI改变的00后娱乐习惯
作者|顾 韩 编辑|李春晖 初见文生图、文生视频的震撼还清晰如同昨日,硬糖君的记忆更停留在AI绘画导致LOFTER用户销号事件——可能是这个冷门社区近年来站得最高的一次。但不到两年时间,AIGC已经随风潜入夜。 如果说AI翻唱、AI换脸、AI绘画还是在借助新工具进行自我表达,那么在互动同人文、AI智能体的方兴未艾中,最年轻的那波年轻人,已经毫无障碍地将表达本身也交给了AI。 事实正是如此。硬糖君本以为“人哄人”的工作将是人工智能留给我们这些大活人最后的保留地,却忽略了情绪价值这东西关键是量大管够随时随地、质量倒在其次了——这谁能赢过AI? 当然,反对AI绘画的人依然在反对,在LOFTER尽力维护tag的纯洁性、或者在微博互助避雷。但在音视频等其他领域,许多借助AI工具的二创形式正在成为各自生态中冉冉升起的新分支,给意料中的、想不到的利益相关方带来冲击。 我们总在思考AI对传统文娱生产带来的升级与冲击,以及当下主流人群是否会接受AI内容。但也许AI剑指的,既不是原来那些内容,也不是原来那些人。 已成气候的音视频AI整活儿 大概因为受众里乐子人的含量较高,即便有过林俊杰告UP主、热巴粉丝整顿网红、《一念关山》换脸出圈等事件,音视频AI整活儿还是顺风顺水走到了今天,部分赛道已成气候。 首先自然是AI换脸。这项名为Deepfake的技术早在2014年就已出现,于2019年主流化,不再局限于上游专业使用。拥有近50支百万级视频的UP主“电影七十二变”正是在2019年底发家。可能是受当时“彪学”热的影响,他的早期选题多为“东北喜剧人X经典电影”,例如范伟换马东锡、沈腾换钢铁侠。 如今五年过去,换脸玩法更加百花齐放。热门CP化身唐僧与孔雀公主、演员换进女爱豆直拍、明星(主要是男明星)泥塑性转,都曾红火一时。 2023年,随着《长月烬明》《以爱为营》《一念关山》等剧集选角引发争议,AI换脸在内娱找到了真正的用武之地——热剧换脸。创作者们更多、更卷、更具热点思维,许多古早男神女神被换到争议人物身上,拉踩原主于无形,替群众出一口恶气。 其次,AI翻唱,也就是搞出过“AI孙燕姿”趣闻的声音克隆,先使用歌手干音调教模型,再让它开口唱任何你想让它唱的歌。 这类二创中有温情圆梦型的,例如让减产的、已逝的歌手唱新歌,让南韩爱豆唱中文——“XX啊,原来听得懂你唱歌的感觉是这样子的”,让平时只有几句词的成员唱整首。也有大量整活儿向的,例如让猴哥翻唱欧美经典,让《海绵宝宝》角色组团翻唱Kpop,既仿声又换脸的欧美群星版《北京欢迎你》等。 同样是在2023年,随着工具与创作者越发成熟,这一赛道出现了像热剧换脸一样更具热点思维与攻击性的玩法:翻唱Kpop新歌,现役团体互翻,或是前辈翻唱后辈,对比之意同样不言而喻。 包括日前,音色一直备受争议的韩团LE SSERAFIM在科切拉音乐节大翻车,UP主“-欧典欧典欧典欧典欧-”迅速推出了欧美Diva对同一曲目的翻唱,云上豪华版“浪姐”了属于是。 相比这两种经典拉踩模式,还有一些爆款蹭的是新技术与新工具的热点,火得一阵一阵的,不具持续性。例如去年年底随翻译工具HeyGen流行过的郭德纲用英语说相声,还有近期的“钢门音乐”。 “钢门”梗源自一位肛肠科医生在诊断中的发言。事实上,这本该是一次类似于之前废话文学、发疯文学的仿写潮,但由于一键成曲的Suno横空出世,B站音乐区在此次玩梗大赛中拔得头筹。很多UP主将全套“钢门”文案输入软件,为其选定曲风,生成了一批煞有介事的无厘头歌曲。 除此之外,传统的视频二创中用到AI辅助的地方也越来越多,如AI修复画质、AI朗读文案。根据硬糖君观察,这次《如懿传》吐槽热除了遇上了B站对中长视频的扶持,很可能也是搭上了AI解放生产力的东风。三四十分钟的视频,文案可以全由AI来读,UP主只负责控制节奏、以及在声线选择上玩出更多花样。 千人千面“同人文”,自主“摆拍”同人漫 “厌男却又是异性恋的孩子们终于有办法谈恋爱了!” 3月,一支女子与ChatGPT对话对得脸红心跳的外网视频在微博热转,其中AI语音语气自然生动,甚至能听出一些个性。类似情况也在国内发生,目前市面上主打AI社交的APP已经有十余款,还有不少产品集合了类似功能、或者对其跃跃欲试。 但是,先别急着搬出科幻片来强调赛博人机恋的后果,若你仔细看,年轻人们使用这些陪聊AI的方式堪称五花八门。 “不是ChatGPT/作业帮用不起,而是星野更有性价比。”星野就是这些APP中目前相对热门的一款。除了拿它当自由度更高的乙游玩,有人用它来查资料、练口语,有人用它来辅助小说、剧本创作,有人则是将“设圈”玩法移植过来,为自己的OC(原创角色)创建智能体、或者直接用它捏OC,称之为“崽”,自己与它互动或者开放它与其他用户互动。 此外,不少用户会为自己钟爱的游戏、小说、影视角色甚至三次元明星创建智能体。同类APP筑梦岛由阅文开发,其界面设计就会更注重引导用户创建非原创角色。不难想到,这很可能连着阅文IP孵化前置的大棋。 基于这些非原创角色,用户可以收获类似互动梦女文、互动同人文的体验。前者简单来说像是橙光游戏上的玛丽苏游戏的进化,不再是僵硬的选项与既定的剧情,而是千人千面实时生成。后者用户可以不以“我”的身份、而是以CP一方的身份与另一方互动,看能够触发怎样的新剧情。 说到AI与同人文,更符合正常想象的同人文工具其实是彩云小梦。它主打AI续写,只要给出一段文字、甚至一个关键词,它就可以一次性生成几百字内容,并且有多组选择。用户只要不断调整校准,故事就可以一直编下去。 早在2021年,彩云小梦就对其续写功能进行了一轮传播,当时B站也涌现出不少彩云小梦测评与名著离谱续写。但是显然,它走到今天依然半凉不热。 究其原因,可能是人们对AI写文的态度比较复杂。很多人愿意AI来接管生活中那些无需情感和文笔的文字工作,可这并不包括网文和同人文。好的网文是值得付费的精品,好的同人文是同好之间的灵魂共振,用AI容易给人偷工减料、虚情假意的感觉。创作者尽可以用,但圈子很难接受。 “AI角色创作平台”捏Ta可能也面临类似窘境。简单来说,它提供的是同人漫的一键生成,玩法包括“文字捏”、“图片捏”与“CP捏”。前两种就是输入文字或上传形象生成漫画,“CP捏”则是选定角色与姿势让他们来个亲密合影。 据相关报道,2023年4月上线微信小程序以来,捏Ta的社交媒体曝光量达到约2.5亿次,多次位列视频号动漫游戏日榜前十,团队近期也拿到了超千万元融资。 不过,由之前LOFTER事件就可看出同人圈子对AI绘画的态度。捏Ta在抖音、小红书的反响确实不错,但在同人文化扎根更早更深的微博、LOFTER和B站,目前还是官方账号在自嗨。一旦被发现,估计得先来一轮审判。 AI改变了什么? 不难看出,AIGC拉低了创作的门槛,再次解放了生产力,但这无疑也会对传统的二创形式与已有的二创生态造成冲击。 例如, AI换脸红火之后,曾经是B站一大标签的邪门拉郎(如伏地魔X林黛玉)就很少再有出圈爆款 ,AI翻唱与一键成歌则加速了传统鬼畜的消亡(今日的“钢门”,昔日的“金坷垃”)。内核依然是解构拼贴恶搞,但显然AI来得更快、更有时效性。最终决定数据的不再是手艺和心意,而是算法、是热点思维,如此很容易打击到传统剪刀手、传统鬼畜创作者的热情。 而创作生态这方面,就是一个微缩版的“AI抢走人的饭碗”:AI语音代替真人CV,AI绘画威胁真人画手。 养OC的“设圈”与画画的“绘圈”之间,一方约稿、一方接稿的“民间产业链”已运转多年。如果有一天“设圈”大量迁移到星野这类APP上,形成内部闭环,面向真人画手约稿需求就会继续减少,从前服务于设圈内容发布与交流的社区也会面临相应的用户流失。 不过,这主要还是创作者一端的想法。无数事实证明,什么版权,什么伦理,什么艺术与行业的未来,消费者才不care。就像热剧换脸,跳脚的从来只有脸被抠走的流量的粉丝,大部分人则乐见其成。喜欢老演员的能见到他们时隔多年“演”新戏,乐子人能享受更极致的攻击拉踩。 追星女想多看自担、CP粉想吃粮、宅男想看涩图,说起来是内容需求,其实是情绪需求。因此产出的方式、手艺的高低,说重要也重要,说不重要也不重要。这大概也是为什么流水线化的免费网文、粗糙的小程序短剧能够大行其道,一切都是为了那一刻的情绪价值。 而最终,技术进步指向的都将是“人心不古”——这些工具能够迅速兴起是代际差距的结果,也将进一步加剧代际差距。 不同代的人有着不同的成长环境、不同的使用习惯。例如对于90后的硬糖君来说,在网上发自己照片这件事,心里总有一个过不去的坎儿,能免则免。移动互联时代的新网民对此则从来不假思索,大方真人出镜或者在评论区分享这、分享那。 而00后、10后的许多文娱习惯,都在为AI进入提供便利。TA们本就在玩语C释放戏精天分,和设定中二的智能体对话也不觉尴尬。TA们也本就在追星或者玩乙游,花钱买沉浸、买情感,对于真实和虚拟有着与前代不同的看法。此外,同人圈子到00后活跃的阶段,交易和外包逐渐成为常态,为爱发电、我手写我心,这些曾经的“铁律”早就在动摇。 反过来说,00后、10后成长过程中接触的是比传统PS修图更重的短视频滤镜,20后更是从出生开始就暴露在AI绘画、AI写真与数字人博主的“无暇”攻势之下,审美不可避免地会受影响。 其实眼下这种分歧已经初见端倪。在粉丝产出的内容中,站姐图越修越光滑,修图与混剪的调色也越来越失真。下游影响上游,古偶剧是磨皮也挨骂,不磨也挨骂。 矛盾集中爆发在抢先一步“AI化”的女演员身上。永远和别人处在不同图层的鞠婧祎,以“建模脸”著称的张予曦,在大众舆论中常被质疑、在短视频平台却备受钟爱,正因为她们在正片里就已经是很多人通过后期追求的样子。 所以说你们这些“老年人”,现在看不惯网红脸,没准等10后成为主流人群,影视里全是网红脸。就像60后的国字脸审美一样,90后的瓜子脸审美也是一种历史产物。 继续发散思维,就算传统文学与影视不会完全让位于对话体、互动剧,就算AI写剧本、写小说未必会超越真人、颠覆传统创作规律,可如果IP角色化身陪聊AI成为年轻人心目中的常态呢?是否会影响到上游故事与人物的设计? 如何服务AI时代成长起来的受众,对创作者来说,现在思考这些问题已经不算未雨绸缪了。
加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化
加州理工团队解决了形式化研究神器Lean运行LLM推理时的核心技术挑战,可以让LLM在Lean中提出证明策略,允许人类以无缝的方式干预和修改。 Lean Copilot,让陶哲轩等众多数学家赞不绝口的这个形式化数学工具,又有超强进化了? 就在刚刚,加州理工教授Anima Anandkumar宣布,团队发布了Lean Copilot论文的扩展版本,并且更新了代码库。 论文地址:https://arxiv.org/pdf/2404.12534.pdf 最新实验表明,这个Copilot工具,可以自动化80%以上的数学证明步骤了!这个纪录,比以前的基线aesop还要好2.3倍。 并且,和以前一样,它在MIT许可下是开源的。 而对此做出巨大贡献的,是一位华人小哥宋沛洋,他是UCSB的荣誉CS本科生,加州理工学院计算+数学科学(CMS)系的SURF研究员。 网友惊呼:所以,陶哲轩现在的数学研究可以原地加速5倍了? LLM提出证明策略,人类无缝干预 团队就发布了这个Lean Copilot的工具,希望启动人类和LLM的协作,编写出100%准确的形式化数学证明。 它解决了一个核心技术挑战:在Lean中运行LLM的推理。 通过这个工具,我们就可以让LLM在Lean中提出证明策略,允许人类以无缝的方式干预和修改。 之所以开发这个项目,是因为自动化定理证明在如今仍是一项艰巨的挑战。 我们都知道,LLM在做数学和推理任务时,时常会犯错误、产生幻觉,十分不可靠。 因此,到目前为止,数学证明大多是手动推导的,需要仔细验证。 像Lean这的定理证明工具,倒是可以形式化证明过程的每一步,但人类编写起Lean,着实很费力。 在这种情况下,Lean Copilot的诞生就显得意义重大。 让陶哲轩多次震惊的神器:数学家还不会用就完蛋了 LLM可以作为辅助人类证明定理的工具,这一论点已经被陶哲轩多次证实了。 他前脚刚在博客里预测,26年AI将和搜索、符号数学工具结合,成为数学研究中值得信赖的合著者。 紧接着,佐证他观点的研究就如雨后春笋一般源源不断地冒出来。 去年6月,加州理工、英伟达、MIT等机构的学者,就构建了一个基于开源LLM的定理证明器LeanDojo。 9月,微软亚洲研究院、北大、北航等机构的研究人员,通过97个回合的「苏格拉底式」严格推理,成功让GPT-4得出了「P≠NP」的结论,破解了这个千禧年难题。 在第97轮对话中,GPT-4得出结论,证明示例在没有穷举法的情况下无法求解,证明了结论为P≠NP 去年10月,陶哲轩在GPT-4、Copilot的帮助下,直接发现了自己论文中的一处隐藏bug。 在用Lean4形式化第6页论点的过程中发现,他发现表达式在n=3,k=2时,实际上是发散的。 这个不太容易看出的bug能被及时捉住,多亏了Lean4。原因是,Lean要求他构建0<n−3,但陶哲轩只假设了n>2。由此,Lean无法基于负的0<n−3得到反证。 这一发现直接让陶哲轩瞳孔震惊。 而在去年年底,陶哲轩直接成功地用AI工具,完成了形式化多项式Freiman-Ruzsa猜想证明过程的工作。 最后,依赖关系图已经完全被绿色所覆盖,Lean编译器也报告说,这个猜想完全遵循标准公理。 在这个过程中,所有最前线的数学研究者,都在第一时间感受到了AI对于数学研究颠覆力量的直接冲击。 Lean Coilot,让Lean更好用 而今天,Lean Copilot的这项研究,让Lean直接变得更强大了。 在这篇论文中,团队基于Lean Copilot构建了一些工具,用于建议证明步骤(策略建议)、完成中间证明目标(证明搜索)和使用LLM选择相关前提(前提选择)。 实验结果也充分表明了,跟Lean中现有的基于规则的证明自动化相比,Lean Copilot在辅助人类自动化定理证明上,是有效的。 Lean Copilot提供了一个通用框架,可以通过CTranslate 2在本地,或者在服务器上运行LLM的推理。 通过这个框架,用户就能创建各种自动化证明工具。 Lean是一个在数学家中很受欢迎的证明助手。如下图所示,Lean中的一个证明,是由一系列被称为策略(tactics)的证明步骤组成。 从整个定理开始作为初始目标,策略反复地将当前的目标转化为更简单的子目标,直到所有目标都被解决。 用户在由VSCode驱动的IDE中交互编写策略,在右边的infoview面板中显示目标。 生成策略建议 利用Lean Copilot,团队构建出了suggest_tropics,一种用LLM生成策略建议的工具。 而它本身,也是一种策略。 应用时,它将当前目标输入LLM,并且从LLM获取生成的策略候列表。 它会查看每个选项,看它们是否会 1)导致错误;2)结果没有错,但不能完成证明;3)顺利完成证明。 如果是1),这个策略就会被删除。 只有无错误的策略,才会显示在右边的视图面板中。 其中,成功完成证明的策略,使用绿色标记(类别3);没有错误改变证明目标,但未完成证明的策略,使用蓝色标记(类别2)。 注意!当所有列出的策略都属于类别2时,这个信息对于用户来说,可能极有价值。 在这种情况下,剩余目标的信息,可以直接帮助用户选择策略,作为下一个中间证明步骤。 看到建议后,用户可以选择是否接受,或使用它们作为灵感来源,制定新策略。 比如,我们在Lean代码中定义了一个定理add_abc,它的初始目标如图3右所示。 当我们输入suggest_tropics时,会在右边看到策略建议。 第一个策略显示为绿色,表示证明已成功完成。 接下来三个建议均为蓝色,这就表明无法直接完成证明,但不会导致错误。 因而,它们很有可能是有效的中间证明步骤! 同时,剩余子目标也显示了出来。 而Tactic state字段显示No goal,是因为至少有一个策略建议可以被证明。 搜索完整证明 此外,因为人类和机器都不能始终如一地产生正确的策略,因此在这个过程中必须回溯、探索不同的替代方案,这个过程就是证明搜索。 当是上面所说的Suggest_tropics,仅能生成当前步骤的策略,不具备搜索多策略证明的能力。 为此,团队将其与基于规则的证明搜索工具aesop结合起来,构建了一个基于LLM的证明搜索工具。 Aesop会将最佳优先搜索作为Lean的策略实施,并且允许用户配置搜索树的扩展方式。 搜索树是由作为节点的目标组成。 起初,它只有原始目标作为根节点。在每一步中,aesop都会选择最有希望的未扩展节点,通过应用策略对其扩展,将生成的节点添加为子节点。 而当aesop找到一条从根源到可轻松解决的目标的路径,就证明搜索成功了! 因此,aesop的性能关键取决于用户是否配置了有效的规则集。 这就可以看出,aesop缺乏灵活性。因此,Search_proof通过在每一步中由suggest_tropics生成的目标相关策略,来增强aesop的规则集,让它变得更加灵活。 对于图3中的原始目标,用户只需输入search_prrof,找到可以解决目标的完整证明,就显示在了信息视图中(图5右)。 可以看到,由于发现了成功的证据,所以剩余的Tactic state是No goals。 选择注释好的前提 此外,定理证明中另一项具有挑战性的重要任务是,找到减少或完成证明的相关前提。 除了源码库和标准库中有大量前提,Lean还有一个大型数学库(Mathlib)。 然而,从所有库中搜索候选前提,极其困难且耗时耗力。 所以许多人都试图,能在Lean,或其他的证明助手中得到辅助,或自动完成这一过程。 在Lean中,最先进的前提选择方法是,直接在Lean中实现的基于随机森林(random forest)的框架。 然而,前提选择任务非常适合检索增强型LLM,即在大模型训练期间训练检索矩阵(前提嵌入),以估计证明目标与候选前提之间的相关性。 给定推理时的证明目标,首先将目标编码成一个向量,然后在前提嵌入和目标向量之间执行矩阵向量乘法。 然后,为了选择前k个前提(其中k可以是一个超参数,决定用户想要返回多少个前提),这时只需返回得分最高的k个前提。 而要在Lean中执行推理任务,除了Lean Copilot提供的快速推理外,还需要一个高效的矩阵乘法库和一个C++的numpy矩阵阅读器。 研究人员采用了来自CTranslate2的矩阵乘法函数,和来自Libnpy的C++快速numpy文件阅读器。 他们再次通过FFI机制,将这些数链接到Lean。 因此,前提选择的策略可以非常高效地运行,因为前提嵌入可以预先计算,所有后续操作都可以使用上文介绍的库在C++中快速完成。 在获得返回的前提后,研究者进一步用有用的信息对其进行注释。 这里将所有前提所分为两类:可直接在当前环境中使用的前提(范围内前提)和不可直接在当前环境中使用的前提(范围外前提)。 这取决于是否导入了所需的软件包。 如果已经导入了前提所需的包,则可以轻松使用该前提。如下图6显示了带注释的范围内前提。 图7所示是带注释的范围外前提。 下面举个使用「前提选择」的例子,对于图3中的定理add_abc,可以直接在证明中输入select_premises(图8左)。 然后,相关前提的列表,就会出现在信息视图中(图8右)。 对于这个简单的定理,可以清晰看到所选的前提确实相关,因为它们都与自然数和加法规则有关。 在这种情况下,所选的4个前提都在当前范围内,这意味着它们的模块已经导入。 如上,便是研究人员通过Lean Copilot构建的三个实用的证明自动化工具,用于策略建议、搜索证明和前提选择。 81.2%的证明步骤,全都自动化了 通过Lean Copilot框架,研究人员凭经验提出了假设——在Lean交互式定理证明(ITP)中进行人机协作是有益的。 由于Lean中的定理证明过程,主要以策略证明为主。 因此,在具体实验中,作者主要评估了用于「策略建议」,以及「证明搜索」的证明自动化工具。 总而言之,aesop是当前是一种用于证明搜索,最先进的基于规则的证明自动化工具。 研究人员在两种情况下,验证了基于LLM的搜索证明与aesop相比的有效性: (1)自主证明定理(LLM独立完成) (2)协助人类进行定理证明(人类与AI协作) 此外,研究者还将搜索证明与策略建议进行了比较,以证明除了单一策略建议之外,搜索证明体现的优势。 研究Lean Copilot如何有效地帮助人类进行ITP的过程,类似于人类在软件编程中使用Copilot的范式。 也就是说,当我们面对一个目标时,首先会调用Copilot,看其是否可以直接解决问题。 如果不能,我们会进一步简化目标,然后再次尝试Copilot。然后,一直重复上述过程,直至Copilot成功解决剩余目标。 而研究人员便是通过这样的迭代协作范例中,去查看每个证明自动化工具可以自动化多少人力。 具体结果,如下表1显示。 证明搜索(search_proof)可以自动证明64%的定理(50个中的32个),明显高于aesop和策略建议(suggest_tropics)。 当用于辅助人类时, 证明搜索仅需要平均1.02个手动输入策略,这也比aesop(3.62)和策略建议(2.72)更好。 最后,对于每个测试的定理,作者计算了三个工具中每一个可以自动化的证明步骤的百分比。 结果发现,证明搜索可以自动完成定理中约81.2%的证明步骤,明显高于策略建议(48.6%)和aesop(35.2%)。 总之,证明搜索的性能比策略建议,要高出1.67倍,比基于规则的基线aesop高2.31倍。 通过Copilot在Lean中进行本地LLM推理 Lean Copilot中的tactic建议、证明搜索和前提选择,这三个任务在本质上可能看起来不同,但对于用户体验的要求是相似的。 它们都需要足够快速地生成响应,具有适中的计算需求,同时在Lean中运行。 用户之所以有这些要求,是因为Lean本身在大多数情况下都能非常快速地提供环境反馈(比如剩余目标,错误信息,类型信息等)。 这种快速,跟证明定理的本质是一致的——它需要连贯的推理。 如果Lean Copilot需要用户等待很长一段时间,那么人类和AI之间的协作就很难发挥作用。 同样,我们也非常希望满足低计算的需求。因为Lean中的定理证明本身不需要GPU,可以在用户本地的笔记本电脑上运行。 因此,能够在大多数硬件(包括没有GPU的笔记本电脑)上高效运行,对于Lean的用户就非常重要。 因为用户在编写证明时,可能无法访问支持CUDA的GPU。 因为需要满足快速推理和低计算需求,而且所有流行的高效深度学习框架都是在Python中,团队想到的一个自然的解决方案,就是在Python中托管模型(本地或远程),然后从Lean向模型发出请求。 然而,这种方法会受到进程间通信的开销的影响,并且它需要用户执行额外的设置步骤,并不适合Lean的传统工作流程。 为了克服这些问题,Lean Copilot通过外部功能接口(FFI)在Lean中本地运行LLM。 FFI是一种机制,可以用一种语言编写的程序调用另一种语言的子程序。 Lean部分用c++实现,可以与c++高效互操作。 程序员可以在Lean中声明一个函数,但在c++中实现函数体。实现会被编译到一个共享库中,并动态链接到Lean。 默认情况下,我们采用的是LeanDojo预训练的repver模型。它基于一个编码器-解码器转换器,BVT5,它将输入字符串映射到输出字符串。 Lean Copilot通过将模型包装成一个对字符串操作的c++函数,使其在Lean中可运行,该函数可以通过FFI在精益中调用。 华人作者立大功 最新论文中的三人团队,也是23年6月开源平台LeanDojo其中的作者。 论文地址:https://arxiv.org/pdf/2306.15626.pdf Peiyang Song(宋沛洋) 宋沛洋是加州大学圣巴巴拉分校创意研究学院(CCS)的计算机科学荣誉本科生,导师是Richert Wang和Phill Conrad 。 与此同时,他还是加州理工学院计算与数学科学系(CMS)的SURF研究员,由Anima Anandkumar教授和Kaiyu Yang博士共同指导。 另外,他还是UC伯克利建筑实验室的研究员,与Tim Sherwood和Dr. Jeremy Lau(谷歌)一起合作。 他的研究兴趣是机器学习(ML),涉及自然语言处理(NLP)和计算机视觉(CV)等应用领域,以及系统和编程语言(PL)等基础理论。 宋沛洋最近的研究主要有两个方向。 一是神经符号推理和人工智能数学(AI4Math),将大模型与交互式定理证明器(ITPs)相结。 另一个是基于时序逻辑的高能效机器学习。 Kaiyu Yang(杨凯峪) 杨凯峪是加州理工学院计算+数学科学(CMS)系的博士后研究员,导师是Anima Anandkumar。 他曾在普林斯顿大学获得了博士学位,导师是Jia Deng,还曾与Olga Russakovsky、陈丹琦一起工作。 他的研究重点是神经符号人工智能,旨在使机器学习能够进行符号推理,希望通过两个方向实现: (1)将机器学习应用于符号推理任务,如形式逻辑或自然语言中的数学推理和定理证明; (2)将符号组件引入机器学习模型,使其更具可解释性、可验证性和数据高效。 目前,他正在研究能够理解和推理数学的人工智能。数学推理是人类智能的一个重要里程碑,它有可能改变科学和工程中的许多重要问题,比如解决偏微分方程和公式验证。 Anima Anandkumar Anima Anandkumar现在是加州理工学院计算和数学科学教授。 她的研究兴趣主要集中在大规模机器学习、非凸优化和高维统计等领域。 特别是,她一直在带头开发和分析机器学习的张量算法。 张量分解方法具有极高的并行性和可扩展性,可应用于海量数据。它可以保证收敛到最优解,并对许多概率模型(比如Markov模型)输出一致的估计结果。 更广泛地说,Anandkumar教授一直在研究加速非凸优化的高效技术。 本文来源:新智元 (ID:AI_era),原文标题:《加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化》
AI生成录音:韩国一女子被假冒马斯克诈骗7千万
快科技4月23日消息,AI是把双刃剑,有人已经利用它伪装成名人实施诈骗了。 据韩国媒体近日报道,去年7月份,韩国一女子被冒充埃隆·马斯克的社交媒体账号诈骗7000万韩元(约合36万元人民币)。 当时,受害女子在社交软件上被一个自称是埃隆·马斯克的账号添加为好友,该账号还向她发送了工作照片和身份证件的照片,并详细描述了一系列私人活动,例如“孩子们每周末都会去SpaceX玩”和“乘坐私人直升机前往特斯拉工厂所在的得克萨斯州”等。 不止如此,该账号还通过视频通话进一步诱导信任,出镜的是一名酷似马斯克的男子,男子还称自己爱上了这名女子,双方在网上开始了频繁互动。 过了一段时间,该账号发来信息表示“要为世界做一件很棒的事情”,那就是“很高兴我的粉丝能通过我成为富翁”,并提供了一个银行的账号信息,暗示投资可以致富,被骗了的女子多次向该账号汇款,累计金额达到7千万韩元。 这当然是场不折不扣的骗局,今年韩国媒体报道披露了这桩诈骗,制作组尝试与这个冒充是马斯克的账号进行电话沟通,不过对方以“美国现在是清晨,太早了”为理由,提议改用短信方式交流。 为安抚受害者,该账号还发送了一段录音,声称“我是埃隆·马斯克,希望听到这个录音文件后能放心”,但专业人士分析这段录音后确认其由AI合成。
全国首例AI声音侵权案一审宣判 自己声音被AI化出售获赔25万元
站长之家4月23日 消息:据央视新闻报道,今日上午,北京互联网法院就全国首例“AI声音侵权案”作出一审判决。该案涉及配音师殷某的声音权益被AI技术滥用,引发社会广泛关注。法院最终裁定,被告方未经合法授权,擅自使用殷某的声音开发AI文本转语音产品,构成侵权行为,需书面赔礼道歉并赔偿殷某各项损失共计25万元。 殷某作为一名资深配音师,意外发现自己的声音被AI技术处理后,以“魔小璇”的名义在“魔音工坊”APP上出售。对此,殷某深感愤慨,遂将“魔音工坊”的运营主体北京某智能公司等五被告起诉至北京互联网法院,要求停止侵权、赔礼道歉,并赔偿经济损失和精神损失。 然而,五被告在庭审过程中均坚称自己未构成侵权。北京某智能科技有限公司表示,其APP中的声音产品来源合法,系从被告某软件公司获取。软件公司则声称其使用的声音来源于被告影音文化传媒有限公司。影音公司则指出,他们曾与原告合作,并约定由原告录制形成的作品著作权归其所有。此外,涉案产品的平台运营商和经销商也均表示自身不存在侵权行为。 面对各方争议,法官在判决中明确指出,声音作为一种独特的人格权益,具有强烈的人身专属性,任何自然人的声音都应受到法律的严格保护。法院强调,对录音制品的授权并不等同于对声音本身的授权。未经许可,擅自使用或授权他人使用录音制品中的声音,即构成侵权行为。 此次判决不仅为殷某维护了合法权益,也为今后类似案件的处理提供了重要参考。法院明确表示,将坚决维护声音权益,打击任何形式的侵权行为,为声音创作者提供有力的法律保障。
想要像周冠宇一样开上F1,究竟有多难?
上个周末,鸽了五年的 F1 上海站,终于回归了。 中国车手周冠宇也终于顺利完成了自己的首个 “ 主场 ” 。 在自己家门口比赛嘛,那牌面必须拉满:平时只让前三名停车、接受采访的大直道,这次还特地给周冠宇留了个专属车位,让他能在完赛后享受现场观众的欢呼。 这儿给不熟悉 F1 的差友们安利一波,它和奥运会、世界杯并称 “ 世界三大体育赛事 ” ,周杰伦、谷爱凌,甚至姚明都是它的忠实粉丝。 作为一个从舒马赫时代就开始追 F1 的老车迷,脖子哥虽然中间 “ 弃坑 ” 了好多年,但两年前周冠宇进了 F1 ,就重新开始看了。 而也正因为是中国赛车圈开天辟地的第一名 F1 正赛车手,周冠宇现在的商业热度那是相当的高,像是 ROG 、宇舶表、轩尼诗、汇丰银河、 Dior 、 lululemon 、极氪,都纷纷选择了小周作为代言人,妥妥的人生赢家。 但想要跟周冠宇一样靠赛车成为人生赢家,难度还是相当高的。 必须得满足两大条件:一是要天赋够高,二是家底够厚。 为了检验车手的天赋,国际汽联特意制定了一套系统性的升级制度——每位车手都需要按照卡丁车 - F4 - F3 - F2 - F1 的顺序打怪升级。99% 的选手都会被淘汰,与 F1 无缘。 但周冠宇显然不是其中之一。他 8 岁接触卡丁车, 10 岁时就赢得了全国卡丁车锦标赛八个分站的全部冠军。11 岁就远赴英国一边练车,一边上学。 之所以要去英国,主要原因还是那是全球赛车氛围最浓郁的国家,一共诞生过 168 位 F1 车手,光是现役的 20 名 F1 车手中,就有 3 名是英国人。这还没算那些跟周冠宇一样,在英国练习赛车的外国人。竞争压力山大。 但周冠宇呢,也刚好在这时展现出了自己的赛车天赋。15 岁之前就相继获得全美洲卡丁车锦标赛、全英卡丁车锦标赛、欧洲卡丁车锦标赛的年度总冠军,最后还在世界总决赛中获得季军。 顺理成章地,周冠宇就去到了级别更高的 F4 。 出人意料的是,周冠宇在 F4 的第一年就拿到了意大利 F4 年度亚军、成功晋级 F3 。 从这儿开始,周冠宇就能算是正式进入 F1 席位的竞争中了。 因为按照国际汽联 FIA 的规定,每个人在成为 F1 车手之前,就必须先在 F2 、 F3 ,以及其他国际顶级联赛中取得较高名次、赚取超级积分。 而只要集齐 40 个超级积分,就可以换取超级驾照、拥有开 F1 的资格了。 至于超级积分具体的获取规则,则是这样的: 这些积分都会有 3 年的有效期,所以到了 2021 赛季开始前,已经开了 3 年 F3 、 2 年 F2 的周冠宇只累计了 18 个有效的超级积分,距离 40 分的目标还差 22 分。 于是在 2021 年,周冠宇不仅要参加了 F2 ,跟着车队满世界飞,还得额外抽空参加另一项亚洲 F3 锦标赛,目的就是能确保能攒够 40 个积分。 但前面说了,想要成为 F1 车手,光有天赋可不行,还得加钱。 脖子哥大概算了一下,至少得要一个小目标,且上不封顶。 主要原因就是这个赛车和其他篮球、足球这些传统运动不太一样。人家踢球、打球可以领工资,但车手参加赛车比赛,有不少是倒贴的。 就拿周冠宇来说,他在英国练习卡丁车的费用差不多是 5 万英镑一年,且没算日常的生活开销。 而 F3 、 F4 跟卡丁车的形式差不多,也是需要车手自费开销的,一年的成本大约在 80 到 120 万美金左右。 在这两个级别,周冠宇一开就是 4 年。 但更花钱的还在后面,作为进军 F1 之前最重要的跳板,不少 F2 车队的 “ 生存之道 ” 就是把席位 “ 卖 ” 给渴望进入 F1 的年轻人,每年的席位费用打底是 200 万美金。 从 2019 ~ 2021 ,周冠宇在 F2 又开了 3 年。 而周冠宇开了 1 年 F4 、 3 年 F3 、 3 年 F2 ,这这这,至少 1000 万美金就这么烧没了。 但 1000 万美金对 F1 来说仅仅只是开始。 前面提到了,车队就这么 10 支,其中除了法拉利、奔驰、红牛这样不差钱的大车队之外,还有不少活在 “ 温饱线上 ” 、勉强做到收支平衡的小车队。 而周冠宇加盟的索伯,就是一支总部位于瑞士的私人车队。他们在选择车手的时候,就得在一众满足实力需求中,选择商业价值最强的,这也就是所谓的 “ 付费车手 ” 。 我不是说 “ 付费车手 ” 实力就不行啊。除了极个别像维特尔、汉密尔顿、维斯塔潘这样的顶尖天才,大多数车手想要在 F1 证明自己,都必须经历这一步。 比如周冠宇,长距离表现好、很会保护轮胎、发挥也稳定。虽然成绩不算突出,但各项能力对于 F1 来说完全达标。 但他当年能赢过另一位车手波谢尔取得 F1 席位,主要原因还是他能拉来安慕希、以及商汤科技的赞助,据说啊,我是说据说:这两笔赞助的总额超过两亿,直接贡献了索伯当年 20% 的预算。 但就算拉来了这么大的赞助,也不意味着周冠宇在索伯的席位稳了。 因为就在前不久,奥迪官宣将在 2026 年进军 F1 ,收购索伯成为奥迪厂队。奥迪嘛,不差钱,来 F1 为的就是名气。 所以接下来这一年对周冠宇来说,最重要的就是好好跑、出成绩。而咱们中国车迷呢,也让奥迪好好看看,周冠宇在国内的热度。 瞧瞧奥迪目前在国内的销量,嘿嘿,签不签周冠宇,你自己看着办。 至于咱们这些看了 F1 中国站热血沸腾,想要成为车手的普通人们,该知难而退还是得知难而退,毕竟赛车这项运动,只是入门,要花的钱就不是个小数了。 撰文:邋的司机 编辑:脖子右拧 & 面线 封面:焕妍
科大讯飞2023年实现营收196.5亿元,今年Q1加大研发投入致亏损3亿元
集微网消息,4月22日,科大讯飞发布2023年度业绩报告称,公司2023年实现营业收入196.5亿元,较上年增长4.41%;实现归母净利润6.57亿元,较上年增长17.12%;截止2023年12月31日,公司经营性现金流量净额3.50亿元,其中公司第四季度单季度经营性现金流量净额超过15亿元。 公司2023年实现扣除非经常性损益后的净利润1.18亿元,比上年同期下降71.74%,主要原因系科大讯飞在核心技术自主可控和产业链可控的国产化替代方面坚定投入,同时积极抢抓通用人工智能的历史新机遇,在自主可控平台上加大认知大模型研发投入。科大讯飞表示,尽管上述投入一定程度上影响了当期利润,但公司在核心技术自主可控方面所构建的核心能力,以及星火认知大模型取得的领先优势,为公司在大模型的产业竞争中持续保持优势奠定了坚实的基础。 报告期内,科大讯飞在人工智能通用大模型及行业大模型方面坚定投入并取得显著进展。2023年10月,科大讯飞与华为联合发布首个支撑万亿参数大模型训练的万卡国产算力平台“飞星一号”,基于该平台训练完成的“讯飞星火V3.5”于2024年1月30日正式发布。“讯飞星火V3.5”在逻辑推理、语言理解、文本生成、数学答题、代码、多模态各个能力方面均实现大幅提升,进一步逼近GPT-4 Turbo的最新水平;同时星火语音大模型将首次发布,在首批37个主流语种上已整体超越OpenAI公司推出的Whisper V3,保持科大讯飞智能语音技术的国际领先水平;此外,科大讯飞还同时发布了首个深度适配国产算力的讯飞星火开源大模型。 同日,科大讯飞还发布2024年Q1业绩报告称,2024年第一季度,公司实现营业收入36.46亿元,较去年同期增长26.27%,经营活动产生的现金流量净额较去年同期增长17.04%,公司经营基本面保持健康发展态势。 2024年第一季度归母净亏损及扣非净亏损分别为3亿元、4.4亿元,较去年同期分别扩大2.42亿元和1.02亿元,主要原因系公司积极抢抓通用人工智能的历史新机遇,在通用人工智能认知大模型等方面坚定投入。科大讯飞进一步说明如下: 一方面,公司2024年第一季度在大模型研发以及核心技术自主可控和产业链可控,以及大模型产业落地拓展等方面,新增投入约3亿元。其中,研发费用8.42亿元,相对于去年同期增加1.26亿元。尽管上述投入影响了公司短期经营业绩,但对持续巩固科大讯飞人工智能国家队产业地位进一步奠定扎实基础:2024年1月30日,首个基于全国产化算力平台训练的讯飞星火V3.5正式升级发布,语言理解、数学能力、语音交互能力超过GPT-4 Turbo,代码达到GPT-4 Turbo 96%,多模态理解达到GPT-4V 91%。此外还首次发布讯飞星火语音大模型,在多语种语音识别方面,首批37个主流语种效果超过OpenAI Whisper V3。 另一方面,主要影响因素还包括公司持股的三人行、寒武纪等金融资产在2023年第一季度取得投资收益1.34亿元,2024年一季度相对于去年同期投资收益减少1.23亿元。
一条小团团被捕,小鹏回应因MEGA风波配合调查,百度百科App关闭服务,欧盟调查TikTok Lite,这就是今天的其他大新闻
今天是4月23日 农历三月十五 茶百道今天港股上市 首日破发 盘中跌超 30% 加盟制茶饮第一股 感觉大家都不咋看好啊 。。。 下面是今天的其他大新闻 # 一条小团团确认被捕 ( 中国新闻周刊 )4月22日,据科创板日报消息,斗鱼知名主播“ 小团团 ”确认被捕。有知情人士告诉《 科创板日报 》记者,“ 小团团 ”也是因涉嫌大额赌博,且与陈少杰案有关。 1 月 27 日,小团团曾在斗鱼鱼吧发动态宣布停播,截至目前已停播 35 天,而她的微博更新停留在 2023 年 12 月 2 日。 此外,小团团的签约公会渝万传媒目前已成被执行人,执行金额约 44.57 万余元。而渝万传媒曾于 2021 年申请注册“ 一条小团团 ”商标,该商标已处于无效状态。 :想当年,我还用过小团团的导航语音包。 # 小鹏汽车回应“ 员工因理想 MEGA 风波配合调查 ”:支持警方打击网络水军 ( IT之家 )4 月 23 日消息,针对小鹏员工因理想 MEGA 风波配合调查的传闻,小鹏汽车发布声明称,该案件正在侦办阶段,请大家不信谣、不传谣,不影响公安机关侦办案件,小鹏汽车非常支持警方打击网络水军的行动。 此前据财新网报道,理想汽车首款纯电动产品 MEGA 在 3 月初上市时遭到网络水军恶意攻击。在 3 月 11 日,理想汽车 CEO 李想发文称,公司已在使用法律手段应对有组织的违法犯罪行为。 据报道,河北衡水警方正对涉事水军公司和公关公司进行调查。财新多方核实确认上述消息。另据财新了解,在 MEGA 上市期间,涉嫌参与打压的车企有三至四家,衡水警方展开多人次询问,小鹏汽车一名中层员工正在配合调查。这名员工电话无法接通,无法联系他回应消息。 :MEGA 上市之后,是真的被黑惨了。。。 # 百度百科 App 将关闭服务 ( IT 之家 )百度百科 App 近日弹出窗口通知,2024 年 6 月 30 日将关闭百度百科 App 服务,将在百度 App 中的百度百科小程序继续提供服务。 根据苹果 App Store 上的数据显示,百度百科 App 位列“ 参考资料 ”类 App 第 107 名,有 492 个评分,目前评分 3.1 分,百度今天还对百度百科 App 进行了更新。 :一个浏览器能搞定的事儿,倒也没必要再来个 APP。 # 欧盟对 TikTok Lite 展开调查 ( IT 之家 )4 月 23 日消息,欧盟于当地时间 22 日宣布对 TikTok 展开第二次正式调查,因为 TikTok 在法国、西班牙推出的“ 精简版 ”TikTok Lite 存在违反《 数字服务法 》的可能。 据悉,TikTok Lite 是专门为内存不足 2GB、数据连接有限或只支持 2G / 3G 网络连接的用户准备。其内置一个任务和奖励计划,用户可在该平台上完成指定任务来赚取应用内的货币。 欧盟指出,法国和西班牙在“ 没有事先认真评估其带来的风险,特别是与平台的成瘾效应有关的风险,也没有采取有效的风险缓解措施 ”的情况下就推出了上述机制。欧盟尤其对该平台缺乏有效的年龄验证机制表示担忧,目前正在对此进行调查。 :看来欧洲人也感受到了极速版的威力。
加量降价,其实不是新款问界M5的重点
不知道大伙还记不记得,问界 M5 这台车。 在新款问界 M7 每个月怒斩两万多销量的时候,比它更早出道、曾经也冲到过月销过万的问界 M5 ,如今的销量却只有三位数。 而在大家争着降价、抢着改款的大环境里,问界 M5 如果不想落得一个高开低走的结局,现在最需要的,很明显就是一次惊天动地的价格或者是配置调整。 于是乎,新问界 M5 的发布会今天就来了。 然而比较意外的是,一圈看下来,产品层面新 M5 和老款相比提升其实并没有很大,更多还是在售价和配置区别上做了调整。 我带大家快速过一下。 首先就是价格,新问界 M5 目前提供了三个配置版本,分别是低配 24.98 万的增程 MAX 后驱高阶智驾版、中配 26.98 万的纯电 MAX 后驱高阶智驾版,和顶配 27.98 万的增程 MAX RS 四驱高阶智驾版。 相比老款增程和纯电一共有 7 个不同车型,新 M5 不仅配置数量少了,区别也变得更明显了。在意续航和性价比选 24.98 ,就想要纯电的选 26.98 ,在意内饰和运动的选 27.98 。 好处嘛,就是不用在 7 个配置里纠结了,坏处嘛就是车型名字好像比原来复杂了不止一点( 不是 这次新 M5 和老款最大的区别,就是全系标配了带激光雷达的智驾硬件。再加上只要在 6 月以前下单,就能获得一个 2 万的智驾包优惠券,相当于新 M5 全系都配上了华为最新的 ADS 2.0 智驾。 所以也就不用分什么标准版和智驾版了。 如果硬要和之前老款 M5 对比,那价格肯定是都有一定程度的降低。 比如 24.98 万的低配,其实就是原先 27.98 万的增程后驱智驾版;26.98 万的顶配,则是原先 28.98 万的纯电后驱智驾版;27.98 万的顶配,对应的是 29.98 万的增程四驱智驾版。 除了降价以外,新 M5 在一些细节配置上还做了一些升级。 比如外观,老款车型纯电和增程版本之间其实有着一个大嘴的区别,新款则是统一成了原先纯电的小嘴版本, RS 版本还提供了黑化的轮毂、饰条套件,还有帅气的红色轮毂。 车漆也从原先的略显文艺,变成了现在的运动气息拉满。只不过这个红色加上黑轮毂,看着尊嘟很像保时捷 Macan 呐。。。 到了车里,原先只有一个的手机无线充电变成了俩,而且功率飙到了 55 W 。 之前只是简单一个金属罩子的高音扬声器,现在也变成了 M9 同款的星环散射体。 还有座椅材质、水晶挡把也都是一个级的升,再加上个版本的电池容量相比老款也都多了一丢丢,所以一句话总结新问界 M5 的改动,那就是加量不加价。 再加上大嘴一直强调的全铝合金底盘、前四球头后多连杆,看得出来鸿蒙智行真的很想把这个 M5 的品质打出去。 但要说这次改款能不能帮 M5 迸发出 M7 和 M9 的辉煌成绩,我觉得有些难。 因为和改款之前一样,新 M5 想要卖出好成绩最大的阻碍,依旧是自家的兄弟产品 M7 。 从配置上看,在几乎完全一致的售价区间里,问界 M7 ( 24.98-37.98 万元 )在和华为有关的地方,比如车机系统、智能驾驶、屏幕拓展(也就是椅背上的 MagLink 插槽 )上,也保持了高度的一致。 但在车身尺寸上, M7 却是全方位的领先。 虽然单说轴距, M5 甚至还比 M7 长了 6 厘米,但因为溜背设计需要通过前移座椅保持头部空间, M5 的第二排空间也没有圆润的 M7 要来的大。 而花同样的钱,同一个品牌下的类似车型,人们通常会选择看上去更符合车型定位、车型名看着更高级的那个。 就比如脖子哥的一个同事就是去年年底提的新款问界 M7 ,按他的说法,在选车的阶段他几乎完全没有考虑过 M5 ,在价格差不多的情况下,更大的体格对应了更多的用车场景,不仅自己开着有面儿,万一以后结婚生娃了,也能无缝切换。 而这还只是新 M5 面对的内部竞争,来自外面的压力,其实同样不小。 像是混动阵营里,和新 M5 空间尺寸差不太多的领克 08 EM-P ,前一阵才刚刚官宣降价,入门版本的价格已经冲到了 20 万以下。有些经销商的终端优惠,甚至都不到 18 万。 而售价同样是 24.98 万起的理想 L6 也和问界 M7 一样,不仅尺寸比新 M5 大了一圈,还继承了理想绝大部分的家用卖点。 纯电这头就更不用说了,全球最畅销的纯电 SUV 特斯拉 Model Y 两天前才刚刚降价,起售价正好和新 M5 重合;智己 LS6 、小鹏 G6 以及蔚来马上就要发布的乐道,早就已经去 20 万上下厮杀了。 新 M5 如果想的是要和它们直接竞争,那今天公布的这个价格,可能还得再往下探探。 但转念一想,从余承东的角度来看,新 M5 其实大可不必走这些车企的老路,卷价格、卷配置,最后深陷价格战的泥潭无法脱身。 毕竟有时候车子畅销与否,靠的也并不只是性价比。 比如特斯拉 Model Y ,在无数的对比中都是那个要啥没啥的弱势方,但在 3 月份,它在国内卖出了超过 4 万台,直接就是一个断崖式的领先。 再比如保时捷,虽然身为 SUV 的 Macan 无论是空间、舒适性还是燃油经济性都非常拉胯,底子还只是个大众途观,但依旧不妨碍它成为最受欢迎的豪华 SUV 之一。 我不否认它们在产品层面也有不少优点,但其中起到更大作用的无疑是品牌力。 特斯拉是个有划时代意义的新能源企业,他们 CEO 马斯克也搞出了星链,搞出了 Space X ,我身边的很多朋友都顺其自然的觉得,他连火箭都能搞定,造出来的车肯定也很牛逼吧。 保时捷就更不用说了,长时间在赛事和高端跑车市场浸淫,光是选配一个彩色保时捷 LOGO 就得花上大几千,想过去都知道这车开出去会多有面儿。 对它们而言,足够的品牌力其实是超越产品本身的。 这时候再来看鸿蒙智行,其实是很有潜力把高端化溢价,以及领导人魅力打出去的。 毕竟华为的背书,本身就是巨大的品牌力加持。而在问界 M9 获得了巨大成功之后,下一台超豪华的 D 级轿车享界 S9 也在今天的发布会上亮相了。 如果 S9 能够成为下一个 M9 ,国内豪华汽车一哥的位置,应该就能被鸿蒙智行站住。 而今天这场发布会,很明显能看到余承东已经赋予了 M5 另一个身份,那就是抛开之前老 M5 的定位,用拉满的底盘配置和更个性的设计,满足那些喜欢 SUV 和驾驶的用户群体。 再加上华为在品牌力上的潜力,新 M5 瞄准的估计就是 Model Y 的市场。 嗯,如果想要更进一步,再扩大一些影响力的话,没准多在社交平台发声也是个路子。 余总,啥时候开播啊余总! 撰文:致命空枪 编辑:脖子右拧 & 面线 & 结界 封面:子曰
商汤甩出大模型豪华全家桶!秀拳皇暴打GPT-4,首晒“文生视频”,WPS小米现场助阵
作者 | ZeR0 编辑 | 漠影 智东西4月23日报道,今日,商汤科技全新升级“日日新SenseNova 5.0”大模型体系,综合能力全面对标GPT-4 Turbo。 同时,商汤在业界首次推出“云、边、端”全栈大模型产品矩阵,包括商汤端侧大模型、端云协同解决方案,以及面向金融、代码、医疗、政务等领域的边缘产品“商汤企业级大模型一体机”。 “日日新SenseNova 5.0”采用混合专家架构,基于超过10TB tokens训练、覆盖大量合成数据,推理时上下文窗口可支持200K,主要增强了知识、数学、推理、代码能力,在主流客观评测上达到或超越GPT-4 Turbo性能。 现场演示了“日日新5.0”与GPT-4多项功能对比,包括创意写作、逻辑推理、文生图、图像理解、根据图片计算食物热量等。 为了秀端侧大模型的肌肉,商汤科技还“玩”起拳皇。一开始绿衣玩家GPT-4略占上风,但很快就被红衣玩家SenseChat-lite各种连招打得反应不过来,最终红方取胜。 商汤董事长兼CEO徐立说,不是模型能力有多强,是在不同的适用场景下,小模型的决策速度快,当大模型还在计算,小模型已经完成了判断并出拳,不管它的拳是不是最优的,都实实在在地打到了对手的身上。 其端侧大模型实现业内最快推理速度,旗舰平台最高达109.5字/秒,而人眼最快阅读速度仅为20字/秒,现场演示的处理对话、图像处理速度快过云端。商汤还正式发布端侧业务SDK,可适配多款高通骁龙、联发科天玑芯片。 企业级大模型一体机支持千亿模型加速和知识检索硬件加速,相比行业同类产品,千亿大模型推理成本可节约80%。小浣熊·代码大模型一体机轻量版每台售价35万元起,单台支持100人团队使用,每日使用成本低至每人4.5元。 同时,商汤发布了基于昇腾原生的行业大模型,与华为共同打造面向金融、医疗、政务、代码等大模型产业生态。 在自身应用方面,商汤“日日新SenseNova 5.0”在秒画、如影、格物、琼宇、大医、小浣熊家族等产品均有重要更新。 还有One More Thing——文生视频生成平台,徐立带来了三段完全由大模型生成的视频,并着重强调对人物、动作、场景的可控性。 未来,通过输入一段文字描述即可生成一段视频,而且人物的服饰、发型、场景都能根据预先设定,保持视频内容的连贯性和一致性。 金山办公CEO章庆元、海通证券副总经理兼首席信息官毛宇星、小米集团小爱总经理王刚、阅文集团筑梦岛总经理葛文兵均来到现场,分别作为办公、金融、出行、IP角色等行业的代表进行分享。几位客户代表的发言都很有料,或连爆金句,或干货频出,对行业发展很有参考性。 一、文科数理能力均显著提升,全面对标GPT-4 Turbo 商汤董事长兼CEO徐立首先提到Scaling Law尺度定律,即随着模型参数变大、数据量变大、训练时长加长,算法性能会越来越好。 还有两条隐藏假设,一是可预测性,在小尺度上做很多实验,跨越5~7个数量级尺度依然保持性能的准确预测;二是保序性,在小尺度上验证的性能优劣,在大尺度上依然保持着优劣。 这可以指导在有限的研发资源上找到最优模型架构和数据配方,让大模型能最高效地学习。 基于实验结果,小模型在优化数据的情况下,性能可逼近甚至超越跨数据级的大模型。 “商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”徐立说。 为了解决数据集质量的瓶颈,日日新5.0训练用到10T+ tokens的中英文预训练数据,进行了精细设计的清洗处理,形成高质量基础数据。 此外,合成思维链数据,是激活大模型的强理解推理能力的关键。商汤在预训练过程中大规模采用数千亿tokens量级的逻辑型合成数据。 “日日新5.0”在中文理解、知识储备、数理逻辑、代码编程等方面的能力明显提升,在主流客观评测上达到或超越GPT-4 Turbo。 在文科能力方面,“日日新5.0”的创意写作、推理、总结能力均大幅优化,相同的中文知识注入后,可获得更好的理解总结及问答。 基于大量中文语料的构建,在开放式写作,比如让它写2022年基于《红楼梦》给匾额题名来探讨创新的高考作文,可以看到GPT-4写作风格比较生硬:“在学习上……在工作中,……”;“日日新5.0”则写得更加发散,从诗经楚辞到文化革古鼎新,再到互联网新知识的融合。 在理科能力方面,“日日新5.0”的数理、代码及推理能力达到业内领先水平。 商汤展示了一个数学题示例:妈妈给圆圆冲了一杯咖啡,圆圆喝了半杯后,加满水,她又喝了半杯后,再加满水,最后全部喝完,问圆圆总共喝掉多少咖啡和水。如果理解成总共加了两次半杯水即一杯水,那么答案是一杯咖啡一杯水。如果从每次喝掉多少水来算,计算则比较复杂。 “日日新5.0”理解完后,得出跟刚才解读一致的答案。而GPT-4把事情搞复杂了,得出的答案是喝了19/20杯咖啡和1+4/5杯水。 还有一个简单的逻辑情景题,13个小朋友玩老鹰抓小鸡,抓了5只小鸡,问还剩几只。GPT-4不理解老鹰抓小鸡游戏中有1人要当老鹰,给出的答案是8只。“日日新5.0”则给出正确答案。 在多模态能力方面,其在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单中取得领先成绩。 商汤将“日日新5.0”的文生图能力与几个业界最好的模型做直观对比。 徐立说,文生图的一个难点是如何将真正的理解与合成放在一起。其他主流文生图模型对于文字嵌入到图像中都有一定缺失,日日新5.0则能表现得非常好,有比较完整的指令跟随生成效果。 在应用产品层面,“日日新5.0”支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示。 长图上会有很多信息点,但推到多模态窗口中,往往图像分辨率过高,上传不了。对此,商汤给出了非常大的分辨率接口,支持用户对长图等级性提问,包括描述图片细节、总结标题内容等。 再比如打车应用界面截图,它可以识别捕捉到其中的时间、车辆距离、文字提示、车辆信息、功能按钮、推广活动等核心信息。 它也可以化身卡路里助手,拍一张早餐照,让它算算一共多少热量。 相比GPT-4,日日新5.0在理解中式餐饮内容中表现更好。 小浣熊家族是基于商汤大语言模型打造的AI原生生产力系列工具,覆盖软件开发、数据分析、编程教育等多个场景,旨在提升工作效率,已推出代码小浣熊、办公小浣熊等成员。输入商汤小浣熊网页截图,“日日新5.0”可以进行详细描述。 再让它根据前两个小浣熊,来生成一张新的小浣熊形象,它会先解释自己的设计思路,然后生成对应形象。而对GPT-4进行完全相同的输入,GPT-4生出的形象毫不相关,并没有将前两个小浣熊形象融入到它的设计理念中。 通过用户的自然语言输入,办公小浣熊可自动将数据转化为有意义的分析和可视化结果。比如导入数据库文件,数据库里只有英文名,而用户输入查找的是中文名,第一波输入后没查到,接着告诉办公小浣熊“肯定有的 你再找找”,它就会进行思考,再度检查和筛选,找出模糊匹配的信息。 它还可以检查数据库中多个表格的交叉信息来汇总计算,并生成直观的可视化图表乃至雷达图。 二、端侧模型跨级领先,端云协同方案大降推理成本 天下武功,唯快不破。 商汤推出SenseChat-Lite版本端侧⼤模型,可落地手机、平板、VR眼镜、智能汽车等端侧。 商汤日日新·端侧大语言模型的推理速度更快,首次加载低于0.4秒,解码⼤于30tokens/秒,号称“同等尺度性能最优,跨级尺度全面领先”。 人眼最快阅读速度为20字/秒,而该模型在中端平台实现18.3字/秒的平均生成速度,旗舰平台更是达到78.3字/秒,最高能达到109.5字/秒。 商汤通过SDK形式为终端用户提供量化部署工具链,数据处理均在终端设备上完成,有效保障⽤户隐私安全。 商汤还推出端云协同解决方案,进行高性能计算,处理复杂的任务。 该方案支持在不同的设备和平台上运行,使得模型可以在各种终端上进行部署和应用,同时实现在离线状态下仍能保障服务和应用。 其端云协同⽅案性能指标上,在综合考试、语言、知识考试、推理等17个测试集下,平均性能接近云侧,但80%的推理将在端侧处理,因此节省了大量云侧推理成本,模型能够及时适应变化的环境和需求,保持高性能和准确性。 现场演示了端侧离线运行商量平台,比如写请假申请、将长篇大论总结成一句话。基本上眼睛还没看清,模型已经生成出答案。 其端侧扩散模型同样实现了业内最快推理速度。 1B模型支持在高通、联发科高端平台上端侧离线运行,端侧LDM-AI扩图技术在主流平台上推理速度不到1.5秒,比友商云端app快了10倍,可在数秒内生成1200万像素及以上的高清大图,并支持在端侧快速进行等比例扩图、非等比例扩图、旋转填充扩图等多种图像编辑功能。 端侧智能体也很方便,能够自动执行一连串复杂指令,比如打开邮箱-查看邮件-把邮件移动到指定文件夹-打开微信-进入指定微信群聊-在群公告中发布指定内容。 商汤宣布端侧业务SDK正式发布,适配多种主流高通骁龙、联发科天玑芯片,支持XR、PC、车载、安卓/iOS移动全平台。 三、发布企业级大模型一体机,大模型推理成本可节约80% 面向边缘侧,商汤面向金融、医疗、政务、代码四个行业推出商汤企业级大模型一体机。 一体机同时支持千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,相比行业同类产品,千亿大模型推理成本可节约80%;检索大大加速,CPU工作负载减少50%,端到端延迟减少1.5秒。 金融大模型一体机采用国产双路主控CPU及四颗智算加速卡,单机能够满足30人同时使用,支持万量级的金融文档管理和检索,在万级文档知识库规模下检索准确率超过90%,满足金融部门的精准检索要求。 医疗大模型一体机是软硬一体私有化医疗大模型解决方案,针对智能问诊、导诊、病历结构化、影像报告解读等场景,支持智能调整回复内容的语言风格、详略程度、格式要求等,一键自定义专属医疗场景,实现小成本高精度的医疗大模型部署。 政务大模型一体机是面向政务咨询场景的边缘大模型产品,采用国产双路主控CPU及四颗智算加速卡,支持万量级的政策文档管理和检索,面向有政务咨询需求的部门单位, 辅助更高效地处理与法律法规、政策标准相关的咨询和决策任务。 小浣熊·代码大模型一体机轻量版是面向软件开发的边缘大模型产品,是一套安全可靠、开箱即用、高性价比的企业软件研发软硬件一体化解决方案,能够帮助开发人员更高效地编写、理解和维护代码,提高软件开发的效率和质量。 其在HumanEval的测试通过率高达75.6%,超过GPT-4的74.4%,能够支持90多种变成语言和8K上下文,单机可满足100人团队应用需求。小浣熊·代码大模型一体机轻量版每台售价35万元起,每日使用成本低至每人4.5元。 相较于传统的云服务模式,这些一体机的所有数据处理过程均在客户的私有环境内完成,能够有效避免数据在传输过程中的泄露风险,及跨境传输等引发的合规问题。 四、四大客户晒落地成果,金融大模型、拟人大模型发布 金山办公CEO章庆元、海通证券副总经理兼首席信息官毛宇星、小米集团小爱总经理王刚、阅文集团筑梦岛总经理葛文兵均在现场分享了与商汤的合作进展,以及一些最新行业观察与见解。 金山办公CEO章庆元说,金山办公从去年下半年开始一直在跟商汤合作。大约四年前,金山办公就将AI定位为其产品核心战略之一,当时还没有大模型;金山办公一年陆续上线20多个AI功能,包括内容创作、智慧助理、知识洞察等。 两周前,金山办公发布WPS AI企业版,包括AI Hub智能基座、AI Docs智能文档库、Copilot Pro企业智慧助理。他分享说,企业关心的内容与C端应用完全不一样,所以他们做了整合。未来金山办公希望在Copilot方向有所突破。 “我始终认为,如果AI只会吟诗作画,其实AI是不可能改变世界,不可能颠覆世界。”章庆元说,AI要改变世界,真正提高生产力,不一定要多写代码,AI一定能够做一个真正的Copilot,因为它只有调取各种API,才能对企业生产力甚至对世界和社会产生巨大的影响。 金山办公去年开始与商汤合作探索Copilot,4月发布WPS AI企业版Copilot Pro企业智慧助理,就是基于商汤日日新模型。其低代码功能也接入了商汤模型,通过对话形式来生成各种自己的办公自动化应用。他谈到金山办公测试过全球的Copilot,包括GPT-4,之所以选择跟商汤合作,是因为商汤在金山办公的应用场景中准确度还是非常高的。 章庆元认为理科能力比文科能力难,因为涉及思维链推理,“文科说实话,有时候文章写出来,听君一席话,胜似一席话,总是没错的。” 海通证券是中国境内唯一一家至今仍在运营并且未更名、未被政府注资且未被收购重组过的大型证券公司,正在构建AI应用生态。海通证券副总经理兼首席信息官毛宇星分享说,海通证券与商汤科技做的最新是在生成服务上,重点分享了智能问答、智能研发、智能研报三个运营场景。 现场,商汤科技与海通证券联合发布金融行业多模态全栈式大模型,双方在智能客服、合规风控、代码辅助、办公助手等领域助推业务落地,并共研智能投顾、舆情监控等行业前沿场景,打通证券行业大模型落地的全栈式能力。 在个人出行场景,小米汽车SU7的智能车舱中应用了商汤的大模型技术,基于商汤端云大模型解决方案。小米集团小爱总经理王刚说,小米人工智能助手小爱同学已经落地到小米最新发布的汽车、手机、AIoT和机器人中,这是一个软硬件深度结合的产品,要做到全场景体验一致。小爱同学不止有语音助手,还提供小爱建议、小爱视觉、小爱翻译、小爱通话等智能服务。 小爱大模型已在多设备落地,8月份在手机上开启内测,目前有900万大模型用户。王刚说,车上大模型和手机大模型的体验设计差别很大,需要对大模型进行相应的适配调教,才能适用于汽车任务。有大模型后,月活跃用户次日留存提升了10%,中长尾Query满足率也提升至80%。 大模型技术给小爱带来了三个方面的跨越式升级:一是通用对话,二是垂直领域AI,三是NLP任务。具体而言,整个技术架构可以简化成如下图所示,基本分为4类问题,第一类偏工具类,第二类篇偏内容类,这两类相对简单,都是背后的一些执行类操作;第三类偏创作类,之前没有大模型是做不到的;第四类需要更大参数规模的大模型去回答,因为对知识的准确率要求极高。 如何选择大模型? 王刚认为,首先要建设满足业务需求的评测体系,然后选择合适的模型(大小、擅长领域、性能),并针对业务场景将模型进行优化(Prompt优化、微调、预训练)。 在大模型综合能力评测方面,他关注的重要指标是效果指标和性能指标。效果指标会拆解成不同维度,综合对比不同模型产生效果的差异,然后针对不同类别去构造一个混合系统,挑选最好的大模型。“现在我们在非常多的场景上使用了商汤的大模型。”王刚说。 在过去的合作过程中,他感受到商汤大模型有三个典型特点: 第一,模型性能好,速度快。当用户说完话,他们希望1.4秒内完成所有处理步骤,让用户听到相应的回复;但1.4秒对于大模型能力来说太苛刻了,现在要求放宽到了2秒内,王刚称能满足这一响应速度的大模型在行业内其实并不多。 第二,模型效果好,具备检索能力,可以引用高质量信息来源。 第三,模型能力强,支持知识注入、指令追随,包括能对生成内容要有一定约束和引导,支持快速对模型进行微调。在他看来,让大模型输出一个稳定的结果很不容易,大模型在实际产品场景中落地,通用基座能力要比较强大,更重要的是持续针对业务场景要求的大模型适配能力。 最后,他总结了小爱同学的未来规划,一是基于大模型进行技术升级,二是用多模态创造全新产品体验,三是和操作系统深度整合,四是端侧大模型在无网环境下提供较好的体验。 王刚还分享了一个小故事。今年1月,他所在的团队要向小米创始人、董事长、CEO雷军概括小米汽车大模型的效果,当时演示完后就被批了,团队压力很大,为达要求,希望一周完成四五个需求的优化,并达到比较好的效果。结果商汤团队在两三天内就把所有需求做完了。一周后,他们再去给雷军演示,整个效果已经非常不错。 谈到大模型推理成本,王刚说,他们最开始接入大模型时,大模性还非常贵,当时算下来一台手机一个生命周期内使用大模型的成本约20元,这是手机硬件部门接受不了的。 过去他们分析,要覆盖这部分成本,可能有3种途径,一是硬件愿意出钱,二是可商业化、互联网变现,三是用户付费。这三条路他们都尝试走了,也得益于大模型的进步,成本下降非常快,现在终端机和高端机上的硬件可以出一定费用来覆盖模型成本,大约只有原来20元的1/4~1/5。中高端手机和汽车对大模型成本已经不敏感了,手机端有机会通过接下来的内容分发、服务分发、变现去覆盖大模型成本,但如何把大模型部署到智能音箱仍难度较大。 阅文集团筑梦岛总经理葛文兵说,能够真正满足内心需求的产品存在市场空白,筑梦岛拥有广泛的角色阵容和雄厚的IP储备,随着用户对AI角色质量苛刻程度逐级提升,其中网文角色难度最大,因此筑梦岛选择与商汤合作。 商汤拟人大模型支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能,可实现角色、人设及剧情推动能力,能做到人设贴合,可设置不同档位的对话亲密度,驱动各类原创及IP角色上线多个平台。 体验地址:https://character.sensetime.com/ 结语:“大模型+大算力”双轮驱动,运营算力规模达12000P 基于“大模型+大算力”双轮驱动战略布局,商汤科技打造“日日新SenseNova”大模型体系和“SenseCore商汤大装置”,在推动自身大模型研发的同时,也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。 SenseCore商汤大装置是商汤科技前瞻打造的高效率、低成本、规模化的新一代AI基础设施,目前实现了全国联网的统一调度,在上海、深圳、广州、福州、济南、重庆等地均有计算节点。 通过算法设计与算力设施联合优化,目前商汤大装置已实现万卡集群互联,运营算力有12000P;GPU超4万块;峰值算力有12000P,预计到今年年底达到18000P;国产化算力2000P,已完成58款国产芯片的适配与应用。 基于SenseCore商汤大装置,商汤新推出的“模型即服务”商业模式使客户能够轻松地在大装置微调和调用各类生成式AI能力。 日日新大模型体系在自然语言处理、视频生成和深度学习优化等多个方面取得创新,提供自然语言处理、图片生成、自动化数据标注、自定义模型训练等多种大模型及能力。 基于该大模型体系,商汤自研了中文语言大模型应用平台,以及包括AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,并面向政企客户提供多种灵活的API接口和服务。 在探索先进大模型技术的同时,商汤科技也在推动大模型与产业、应用场景更好的结合,帮助更多行业低门槛、高效落地部署AI大模型技术。
三星推出M5/M7/M8显示器:内置AI芯片、可提升分辨率至4K
快科技4月23日消息,三星推出2024款M5/M7/M8三款显示器,均内置AI芯片,极大地提升了用户的使用体验。 在硬件配置上,三款显示器均表现出色。它们的刷新率均为60Hz,可视角度达到了水平/垂直178°,保证了流畅且宽广的视觉效果。 同时,它们都支持HDR10,能够呈现出更加生动逼真的画面。这些显示器还支持WiFi 5无线上网和蓝牙5.2功能,为用户提供了更灵活、更便捷的连接方式。通过无线网络远程连接主机,用户可以在家中或办公室轻松实现显示办公。 在软件功能上,三款显示器各有特色。M8显示器的功能最为全面,它内置的NQM AI芯片可以将低画质的流媒体内容转换成4K分辨率,从而显著提升观看体验。 M8还支持专业版智能控声技术,能够自动区分人声和环境声,并增强人声部分,让用户在观看视频或进行语音通话时能够听得更清楚。 不仅如此,M8显示器还针对Galaxy Buds耳机进行了特别优化。当耳机连接显示器后,用户可以开启360音频模式。这一模式会根据用户的头部位置来调整声音位置,从而提供更加真实、沉浸式的音响效果。 在接口配置上,三款显示器的背部都配备了USB接口和HDMI接口,方便用户连接各种设备。其中,M7和M8还额外配置了一个C口,支持65W PD充电,这为用户提供了更多的便利性和灵活性。 此外,三款显示器都支持与Galaxy Watch进行联动。例如,当用户佩戴Galaxy Watch进行运动时,运动的实时数据可以传输至显示器上,方便用户随时查看自己的运动状态。
24.98 万起!华为发布全新问界 M5,智能驾驶全系标配
在今天问界新 M5 的发布会开始之前,余承东发了一条微博为新车预热,他提到: 我们在智驾技术上进行了大量的研发投入,售价低于 30 万的华为高阶智驾其实都是亏本销售。 发布会结束后,我们见到了问界新 M5 的参数与价格: 问界新 M5 增程 Max 后驱高阶智驾版: CLTC 综合续航 1440km,纯电续航 255km,定价 24.98 万元; 问界新 M5 纯电 Max 后驱高阶智驾版: CLTC 综合续航 602km,定价 26.98 万元; 问界新 M5 增程 Max RS 四驱高阶智驾版: CLTC 综合续航 1275km,纯电续航 230km,定价 27.98 万元。 问界新 M5 将于 5 月 15 日起交付。 是的,这次的三款配置均为「智驾版」,问界新 M5 全系都标配了激光雷达,也都标配了华为高阶智能驾驶系统。 既然三款配置都低于 30 万,你也可以这么理解——买问界新 M5,你赚了,问界赔了。 问界新 M5,看得见与看不见的提升 问界新 M5 的外观变化,用余承东的一句话来总结:「前脸采用封闭式设计,大嘴变成小嘴了」。 相比旧款问界 M5,新 M5 的身形保持一致,前脸采用全新的「鲨鱼鼻车头设计」取代原有的大格栅设计。整体观感更加运动,风阻更低,也更「新势力」了一些。 问界新 M5 整车尺寸为 4785*1930*1625mm,这一尺寸放在同等价位里并不算太大,毕竟如今 20-30 万级别的新势力 SUV 长度已经奔着 5 米去了。 本次问界新 M5 提供五种外观配色,其中包含「大都会红」与「大溪地灰」两个特殊配色。 不过在内饰颜色上,问界新 M5 反倒砍掉了旧款的「极夜黑」内饰,选择由原有的四种变为三种。 在车内,问界新 M5 的设计语言并没有过多的调整,主要的升级聚焦在体验上。 问界新 M5 全系都带来了与问界 M9 同款材质的舒云座椅,坐垫总厚度达到 100 毫米,前排座椅支持通风加热按摩。 前排的 2 个无线充电板由原本的 40W 升级到 50W 无线超级快充,同时车内还有 3 个 66W 有线超级快充。 也就是说,问界新 M5 可以同时满足车内所有乘客的手机充电需求。 对了,尽管余承东表示问界新 M5 天窗采用「航空级微米双层镀银玻璃」,能提供高达 99.9% 的紫外线阻隔率,防晒等级达到 SPF100,但此次问界新 M5 还是标配了手动遮阳帘,甚至还能选配电动遮阳帘,主打一个要啥有啥。 除了看得见的升级,在看不见的领域,问界新 M5 也带来了一些新招数。 问界新 M5 采用全铝底盘,搭配前四球头双叉臂后多连杆独立悬架,同时车身超过 60% 采用大于 210MPa 的高强钢。 余承东也在发布会上表示,问界新 M5 的麋鹿测试成绩达到 79 km/h,这一成绩相比旧款提升了 6km/h。 不过如果说被动安全性是「无脑叠甲」,那主动安全则是「大秀操作」,而这就到了华为智驾的熟悉领域了。 智驾标签的再巩固 华为智驾的主动安全从来不缺话题,从此前有车主倒车踩错油门,再到华为小鹏的 AEB 之争,华为到哪,聚光灯就到哪。 这些事件让华为得以收获各种实际应用场景,而问界新 M5,也获得了华为智驾最为全面的主动安全功能。 问界新 M5 全系均支持前、侧、后防碰撞功能。前向防碰撞功能在人驾与智驾状态下均支持最高 120km/h 的 AEB 刹停,侧向防碰撞生效范围为 40-130km/h,后向防碰撞生效范围达到 1-60km/h。 余承东称,在出现倒车误踩油门的事故之后,智驾团队提升了后向防碰撞的最高时速,从而规避这一风险。 除了主动安全,从泊车到上路,华为高阶智驾也为问界新 M5 带来了额外加成。在原有的泊车功能之上,问界新 M5 新增了遥控泊车,支持超窄车位、机械车位等高难度车位的停泊。 城市领航层面,问界新 M5 依然贯彻华为高阶智驾的「全国都能开,有路就能开」,并且「是现货不是期货」。 余承东还在发布会上表示,根据外派美国的工程师的反馈,华为智驾的体验要优于特斯拉 FSD,而在高速路上「基本实现了 L3 级的驾驶水平」。 大约一年前的 2023 年 4 月 17 日,问界 M5 智驾版首发 ADS2.0 华为高阶智能驾驶,鸿蒙智行开始在智驾领域攻城略地。 时隔一年,华为高阶智能驾驶也在变得更强。 2023 年 4 月,问界 M5 城市领航仅开放 5 个城市的部分道路。 而如今,问界新 M5 支持超过 40000 个城乡镇的城市领航,云端学习训练算力达到 3.3E Flops,城市高架汇入汇出成功率达到 99.2%。 问界新 M5,也可以看作是华为在智驾领域的前沿阵地,它的表现,毫无疑问是华为高阶智能驾驶的风向标。 依然激烈的市场 让我们实事求是,问界新 M5 更接近于常规的改款升级,而非全面的脱胎换骨。除了华为光环带来的品牌效应,问界新 M5 打开市场,靠的是高阶智驾与尚属上乘的车内体验。 但当下的 20-30 万元市场并不缺乏这样的车。 若论车内乘坐体验,那么问界新 M5 对标的是理想 L6,但在「彩电冰箱大沙发」领域,理想已然打出了名堂,打出了印记,而理想 L6 在车长方面相较于问界新 M5 也具备一定优势。 对于问界新 M5 来说,握在手里的王牌,依然是那些对华为高阶智驾感兴趣的人群。 而论智驾,问界新 M5 还要面对另一个对手——小鹏。 余承东在此次发布会上不止一次表示,智驾给问界新 M5 带来了不小的成本提升。 当然了,成本高的言下之意是「这车很值」,但隔壁的小鹏也许有话说:我们准备推出的全新品牌 MONA,可是要把智驾打到 15 万级的。 作为目前智驾声量最靠前的两个品牌,小鹏与华为的竞争重点,除了智驾能力,还有智驾成本,而在这些领域,双方的高下,还未见分晓。 与小鹏相比,背靠华为的问界,多了一笔品牌红利。 但如果论品牌,问界新 M5 还需要盯着同样吃透品牌红利的特斯拉 Model Y。坐拥「全球乘用车销冠」名号,Model Y 几乎是这一价位段避不开的一道坎。 20-30 万的新能源 SUV 市场,几乎是当前竞争最为激烈的市场,问界新 M5 面对的对手都不弱,面对的舆论强度更是拉满,相比之下,问界新 M5 便有点「中庸」的意味。 但这并不算一件坏事,对于一大部分普通消费者来说,在选购需要使用多年的「大件」时,追求的便是「啥都能占一点」,既有品牌,又有智驾,还兼顾舒适的问界新 M5,便是一个典型。 用当下的词汇来形容,问界新 M5 是一个「多边形战士」。 至于这个多边形面积有多大,销量会告诉我们答案。
Sam Altman 投资的这个语音社交应用,怎么成了硅谷的新宠
我们发微博、朋友圈,都有一个空白的输入框,让你用文字记录当下的心情。 如果这个输入框消失了,我们还能愉快地分享生活吗? 最近,初出茅庐的社交产品 Airchat ,打算和主流唱反调,不允许你打字,就让你发语音,底部只保留一个圆滚滚的麦克风标志。 「Don’t type, just talk.」(不要打字,只是说话。) 凭着这句霸道总裁式的口号,Airchat 过去一周在硅谷火起来了。 一时间,大洋彼岸的友人也爱上了「聊微信」。 2 倍速听帖子,成了一种很新的聊天方式 光从视觉上看,Airchat 的设计其实和 X 等社交媒体没什么不同。 帖子按照时间线排列,你可以关注其他用户,滚动信息流,回复、点赞和转发帖子,发私信等等。 ▲ 图片来自:X@elie2222 Airchat 最特别的地方是,用户打不了字,发帖和回复都是语音,然后由 AI 自动转录成文字。 如果你想发帖,只需按住底部的麦克风按钮,讲话,松开,发送,操作和微信差不多,连姿势都无需改变,按照肌肉记忆把手机举到嘴边就好。 浏览别人的帖子,默认是用 2 倍速的语音听,但速度也可以再调整。在追剧三倍速都不够快的时代,这个设置的背后原因令人暖心。 不过,使用 Airchat 需要格外注意公共场合礼仪,因为语音是自动播放的。不想被别人斜目而视的话,Airchat 支持你手动暂停语音,只看文本。 ▲ 其中一个「群聊」 另外,Airchat 也支持「加群」,供用户谈论 e/acc、AI、咖啡等萝卜青菜各有所爱的话题。如果想因地制宜,把语音的作用发挥到最大,那么在线组织下诗歌朗诵大赛也很合适。 Airchat 播放语音时的效果,也让人眼前一亮。头像周围有一圈色彩绚烂的动画,仿佛让所有人注意,该轮到某某发言了。 ▲ 图片来自:X@granawkins 看到这里你会发现,Airchat 的使用方法很简单,打个直观的比方,微信是一对一或者拉群发语音消息,我们还得自己按着语音条手动转文字。 但 Airchat 把这个过程自动化了,并且把语音消息像朋友圈一样排列,让你不断滚动下去。 同时 Airchat 也更加国际化,用 AI 转录的文字几乎跟随语音实时出现,准确率很高,也懂多种语言,印地语、西班牙语甚至希伯来语都能拿下。 ▲ Airchat 的用户个人页面 如果说谢绝打字让人有了三分好奇,Airchat 还有一个讲究人脉的硅谷科技圈子常用的卖点:邀请制。 可想而知,Airchat 的前期用户主要是硅谷从业者、风险投资家、技术爱好者、追踪热点的记者。 Y Combinator 首席执行官 Gary Tan、Spotify 首席执行官 Daniel Ek 也来凑了热闹,无形之中给 Airchat 加了逼格。 4 月 21 日,Airchat 终于决定,对所有美国和欧盟号码开放,无需邀请,然而其他国家的用户仍然需要「邀请函」。 ▲ 图片来自:X@yanatweets 门槛拆了一小半,FOMO(错失恐惧症)依然存在。热衷讨论新产品的 X 用户们,自觉成了引路人,纷纷表示自己有邀请资格,欢迎私信电话号码。 硅谷大名鼎鼎的人物,OpenAI 首席执行官 Sam Altman,也暗暗支持了 Airchat。 Sam Altman 支持了,但不是热烈支持。按照 Airchat 方面的说法,「他盲目地投了一张支票」,对产品本身没什么影响。 Airchat 的创始人觉得,Sam Altman 不是很在意钱,而是和 AI 有关的投资都想参与一笔。 语音是比文本更亲密的对话媒介 Airchat 的主要卖点,就在于语音这个载体。 Airchat 的创始人有两位,一位是创投公司 AngelList 联合创始人 Naval Ravikant,在硅谷非常出名,另一位是 Tinder 前首席产品官 Brian Norgard。 既然在最强调互动的约会应用摸爬滚打过,想必对社交有自己的见解。 两位创始人认为,语音是比文本更亲密的对话媒介。和新朋友对话,聊点有趣的事情,这些在互联网越来越难得的现象,Airchat 想捡回来。 甚至在接受采访时,Ravikant 也贯彻他的价值观,坚持在 Airchat 公开回答问题,谢绝了记者的私信,因为那是「旧世界」的做法。 Airchat 的早期用户们,往往是对技术非常乐观的一波人,他们的价值观,微妙和 Ravikant 达成了一致。 ▲ 图片来自:YouTube@Jerrod 其中一位用户在 X 发帖说,因为 Airchat,他的演讲技巧提高了,更加顺畅地表达想法,人也变得更加自信,甚至开始经营起播客。评论区表示赞同: 抛开乐趣和联系不谈,拿来练口语也挺好的。 上进心强的猛士总能找到自我提升的机会,但 Airchat 眼里的对手,不是想方设法让你打卡的多邻国,主要是一众传统社交媒体。 Ravikant 认为,强调文本的社交媒体滋生键盘侠,但当我们用自己的声音交流时,可能没那么容易愤怒。 我想在我的口袋里举办一场家庭聚会…… 我希望能够随时拿出手机,与有趣、愉快、机智的人交谈。 理想是丰满的,现实是打脸的,尽管创始人强调 peace & love,大家都友好聊天,但没多久,就有 Airchat 用户在上面发表危险和激进的言论了。 当然,不可否认,在情感这条赛道,语音确实是一个重要的交互方式,附着文字和 emoji 无法直接传达的语气和情感。 在 ChatGPT 有声音之前,可能我们不觉得 AI 长了张嘴有什么必要,但发展到现在,已经有很多人着迷它的声线,调教它的性格,和 ChatGPT 谈起赛博恋爱了。 推出高情商语音助手的 AI 初创公司 Hume,也提出了一个很有趣的观点:「AI 界面的未来将基于语音,因为语音比打字快四倍,并且携带的信息量是打字的两倍。」 这里的信息量,不只是言语本身,也关于隐藏的情感。讲话的音调、节奏、语气词,其实都是交流的暗线。 然而,AI 可以被训练成高情商,不可控的人类就不一定了。靠语音社交就实现和平,有些想当然。 语音功能都在用,但语音社交总是很小众 历史不必重复,但会押韵。语音社交如果光靠新鲜感,是存活不了多久的。 报道 Airchat 的文章,常常提起 Clubhouse。 科技行业的热度来去如风,这个 2020 年 4 月上线、2021 年初火爆硅谷的语音产品,经历短短三年,已经快成时代的眼泪了。 把 Airchat 和 Clubhouse 拿出来比较,确实很合适。 Airchat 更像 X 等社交媒体,只不过帖子以语音形式共享,而 Clubhouse 是实时的聊天室。虽然性质不同,但都围绕语音社交,两者的剧本开头也很神似。 Clubhouse 当年也玩邀请制,最早吃螃蟹的同样是硅谷圈,但它的运气比 Airchat 稍好,当时大部分人居家,容易孤独,对新鲜的线上社交模式很有兴趣,让 Clubhouse 起了高楼。 2021 年 2 月,Clubhouse 的估值达到 10 亿,吸引马斯克和扎克伯格也来畅聊,形成「一码难求」的盛况。 然而好景不长,2021 年底,Clubhouse 的下载量明显放缓,到了 2023 年,活跃用户流失大半,公司裁掉超半数员工。 衰落之快,和 Clubhouse 频频出现服务宕机、虚假信息、极端言论等有关,也因为巨头复制 Clubhouse 的门槛并不高。 2020 年底,X 内测了支持实时语音对话的 Twitter Spaces。2021 年 6 月,Facebook 也推出了类似的功能 Live Audio Rooms。 Clubhouse 桩桩件件的雷点,也可能一比一复刻在 Airchat 身上。同时,Airchat 作为一个新生的产品也不够成熟。 4 月 15 日,Airchat 好歹在 App Store 美区的社交媒体榜排 20 多位,一周后就下滑到 80 位了。究其原因,Airchat 的定位有些尴尬。 虽然 Airchat 说自己是语音原教旨主义,但它的消息带有文本,并且按时间线排列,更像传统的社交媒体加个语音旁白,也没有短视频那样有吸引力还能猜你喜欢。 毕竟,我们阅读的速度比听语音更快,无数次看到发来的 1 分钟微信语音条,面无表情地手动转文字,才能勉强消解怒气。 Airchat 只能用语音发帖的设置,又带来了更多的无所适从,因为这不是我们熟悉的、在网上暴露自己的方式。体验过 Airchat 的用户,普遍有几种尴尬的情况: 不喜欢听到自己的声音。 不习惯「即兴」说话,话出口就没法编辑了,只能删除。 不知道怎么说话是合适和得体的,不像 Twitter(文字)、Instagram(图片)、TikTok(短视频),已经用得很习惯了。 某种程度上,这也造成了隐形的筛选,所谓勇敢的人先享受世界,最敢发言的人,往往是那些天不怕地不怕的 e 人。 如果内向的 i 人抱着来都来了的心态,随意地滚动信息流,看看别人都在说些什么,很可能和朱自清共情:热闹是他们的,我什么也没有。 Engadget 记者 Karissa Bell 的体验便是,刷信息流的时候,觉得有些吵,也有些迷茫,感觉自己是突然误入了别人的聊天现场,他们说的话题不是很有趣,声音还有点刺耳。 从 Clubhouse 到 Airchat,硅谷似乎对语音社交有股执念。 Twitter 的文字、Instagram 的图片、TikTok 的短视频,唯有一直强调真实、自然的语音社交屡战屡败,退居二线,服务于小众用户,或者在播客上提供情感价值,再不济作为即时通讯软件的一个功能。 从所谓的新社交产品 Airchat 上,我们也总能看到熟悉的影子,从古早的聊天室开始,核心的人性需求就那么几个,孤独,渴望陪伴,希望真诚交流。 既希望沉浸线上只用网线相牵,又希望虚拟足够模拟现实。然而,日益分裂的世界里,社交产品越多,保持联系的精神压力也变得越大,越明白现实不可替代的道理。 Ravikant 说,Airchat 的目标不是聚集大 V,而是为了让用户找到想要交谈的对象。然而,目前 Airchat 粉丝最多的用户,就是这位创始人自己,但也只有 1 万多名。 更多的时候,Airchat 们只是短暂地吹来一阵新风,作为少数玩家的时尚单品,然后在无人的角落销声匿迹。
是什么,让华为Pura70 Ultra敢卖10000元?
新机开售,很少会遭遇「扫荡」般的抢购。 华为经历了两次:一台去年的 Mate60 Pro,一台上周的 Pura70 Ultra。 爱范儿也在第一时间兵分两路,前往广深两地,赶上了首发体验。 毫无疑问,全新升级、加入「先锋计划」的 Pura,又是一台现象级手机,在线上线下秒速售罄的同时,也引来了铺天盖地的争议: 为什么要用三角形模组? 为什么有那么多个版本? 为什么敢出一台「芭比粉」? 当中最大的争论点集中在: 为什么纸面参数不突出的 Pura70 Ultra,敢卖 10000 元? 华为设计的基本功:CMF 我们编辑部轮番体验 Pura70 Ultra 的这几天里,有不止一位伙伴反映「Pura 是第一部让我想长期当主力机的影像旗舰。」 这种感受并不是空穴来风,究其根本,是源于华为在手机 CMF 设计中的多年积累。 CMF,指「颜色-材料-表面处理」的英文首字母缩写,是产品生产设计当中的核心要素,各个品牌的手机「个性」,也往往都在这体现。 华为 P 系列在颜色的选择上,一直都有自己独到的理解: P20 的极光渐变色 P30 的天空之镜 P40 的冰霜雾水 P50 的初春三时色 P60 的洛可可白 Pura70 Ultra 则在此基础上,进行了更大胆的尝试。 以主打色香颂绿为例,在这款手机的背面,集齐了绿色花纹素皮、绿色玻璃、绿色金属镜头保护环、红色主摄镜头装饰圈,和金色金属「标签」。 虽然集齐了 3 种材质和 5 种色彩,但放在一起,却不显凌乱。 「星芒黑」「星芒白」「摩卡棕」「香颂绿」的素皮背板,分别搭配着颜色略有区别的的金属包边(中框、镜头模组),使得两种材质由于色调的统一而相互融合。 红色主摄镜头装饰圈露出时,有点打破背面的色彩平衡,但升降模组大部分时间都在闭合状态,更何况本就是给别人看的升降镜头,当然要更突出的颜色。 总之,显眼的不突兀,突兀的不显眼。 很长一段时间里,我对素皮材质都是持有保留意见,总认为它偏老气、不耐磨。 但 Pura70 Ultra 上的素皮,却成了它整机设计的亮点核心之一。 Ultra 的镜头模组大、层次多、形状复杂,如果还使用传统的亮面玻璃背板,视觉上的高光会过多,后盖可能看起来较为杂乱,全是亮点相当于没有亮点。 磨砂背板是一个不错的选择,可整机重量就得不到有效控制。如此看来,素皮似乎成了不二之选。 素皮不素,是华为在背板设计中的一大课题。 Ultra 采用的素皮材质,兼具亲肤触感和设计质感,其「星芒纹」的设计语言,来自塞纳河畔夜空的星光倒映在水面、并折射出耀眼星芒的画面定格。 在此,华为掌握了很好的比例和层次,Pura70 Ultra 也成了前几代产品设计的集大成者。 金属边框和素皮背板的质感是 Pura70 Ultra 的静态天赋,是用户初见新机、愿意继续了解新品的敲门砖。 而当你亲手拿起 Pura70 Ultra,会感到华为在营造优秀手感上的经验积累。 即便 Ultra 重 230g 左右,但握持手感完胜另外几部比它轻的影像旗舰。 「足秤」,是拿起 Pura70 Ultra 的最大感受。这并不是指 Ultra 够重,而是整台机器十分紧实,「屏幕-中框-后盖」之间的过渡非常丝滑,手指滑过感受不到断层感。 大弧度 R 角处理,四边等宽的窄边框,以及 3D 玻璃的运用上,P70 Ultra 塑造了华为历史上最好的正面观感,也带来了非常贴合的手感。 一台紧实且跟手的机子,一是能摒除「廉价」的松垮,提升整机的质感;二是能符合大多数人的握持手型,间接地通过顺手来减少重量。 这也是我们得出「完胜其他旗舰」结论的原因所在。 2016 年,荣耀初代 Magic 采用的八曲面屏就已经将「等深、正反八曲」的概念带到了市场,这种「超前」的贴合手感给当时的市场留下了挺深的印象,虽然多年来陆续有厂家尝试,但终究没能做出「那种味儿」,也没让符合握持感的设计,跟上手机的迭代。 小米 14 Pro/Ultra 算是在屏幕「直曲困境」中,率先走出来的一个。雷军曾说为了这块全等深微曲屏,用了 5 万片玻璃,和 18 倍的成本 。 华为 Pura70 Ultra 等深四曲屏幕的基础上,又融入了 Mate60 Pro 的四边等宽的窄边框和中框,在手感上真正将手机的前中后融为了一体。 这几乎也意味着旗舰机曲面屏设计,即将退出历史舞台;等深四曲屏,已经是主流旗舰的未来。 突破点,设计力展现 在旷日持久的 Pura 70 系列曝光过程中,三角形的相机模组区域,是一个「并非悬念的悬念」。 说它并非悬念,是三角形早已出现在各路爆料图里,大家很早就知道华为要这么设计了。 说它是悬念,是因为非方即圆的相机模组区域设计很难再有突破,三角形过于大胆,不平衡的三角形线条挑战了多数人的审美认知,这也是很多人在看到曝光渲染图时,觉得「怪异」的源头。 但答案是,华为通过大弧度圆角处理,赋予三角形「柔和感」,以及三颗镜头的大小和排布,来形成横向的对称感,消解了三角形本身的不平衡感,并打破了目前「非方即圆」的设计逻辑,第一次把「三角形」带上了智能移动终端的核心设计概念。 同时,Pura70 Ultra 又保留了三角形的轮廓,和「锐意向前」的 Pura 系列精神呼应。 当然,它本质上还是个三角形,所以不少人接受不了这个设计是正常的。 但以我的视角来看,华为在突破设计、彰显个性和兼顾大众审美上,做得超乎我的预期。 三角形也一定程度上提升了使用体验。 单手握持时,居中的圆形模组,往往会让食指无处安放,但是华为坚持把模组放在左边,右手握持时,食指有很大的空间活动,手指不会碰到镜头,以至于每次拍照前都要经历「哈气-用衣角擦镜头-再次打开相机」的尴尬流程。 本以为这又是一项「右撇子专利」,再次落下了「左撇子人群」,但事实上左手使用非但不会弄脏镜头,三角形的设计刚好为食指和中指提供了着力点。 打破对称平衡的居中设计,不仅没有「左右为难」,还让所有用户「二手得兼」。 三角形的设计,也再次强化了 Pura 系列的符号语言。 P60 的方圆模组+三摄排列,让其一曝光,就成为了许多网友的创作源泉,甚至还为此衍生出了 P60 专属手机壳。 Pura70 Ultra 仍延续了这种符号,镜头模组形状的更新,还进一步强化了「可爱」的印象,北极熊手机壳的出现,比 P70 系列发售的时间还要早。 虽说与走「高端」的品牌调性有些相悖,但这份独属于 Pura70 系列的符号,加强了人们对这台新机印象与认知,也能走进更多的群体。 对于那些觉得三角形突兀的用户来说,这些奇思妙想的「二创」,或许会成为他们更容易接受接受 Pura 全新设计的契机。 品牌气质时尚化 CMF 做好是基础,设计个性化是加分项,在「形态」的努力之外,我们可以继续寻找华为在 Pura70 Ultra「神态」上的塑造。 华为对 P 系列的品牌定位一直都是「引领科技美学新风向」,意思是时尚为先。 升级后的 Pura 系列,强调突破求变、锐意向前,意思是相较以前,更时尚。 再拿起这台 Pura70 Ultra,并且把目光放在细节里,不难发现 Pura70 Ultra 在「时尚感」上的努力,是有章法成体系,且有成效的。 首先,金色金属 XMAGE 标签,是一举三得的设计点睛之笔。 一是让 Ultra 有了专属设计,与其他三个系列有所区分。 毕竟 1 英寸大底、超聚光伸缩摄像头等硬实力和黑科技,只有 Ultra 有。 二是让 XMAGE 这个华为自有影像品牌更加凸出显现。 自从 Mate50 系列结束了与徕卡的合作,用上了自家的影像,XMAGE 一直都是各界备受关注的对象:失去了徕卡的华为还有影像?自研的 XMAGE 不就是翻版?没有了摄影的华为还有什么? 事实证明,经过三代机型的努力,XMAGE 没有扑街,而是逐渐自立山头、自成一派,特别是 Pura70 Ultra 的 5cm 微距,再次打破了移动摄影的极限。 三是突出一块的「标签」设计,是时尚设计的惯用手法,许多潮流、轻奢品牌,都会在衣服的某处做一些突出的标签,增加辨识度的同时,也突破了平面设计的维度。 Pura70 Ultra 的突出标签,也因此顺理成章地加入了时尚元素。 回到和标签相辅相成的背板,上面的素皮压纹不是华为第一次使用,在 Nova 12 Ultra 的 12 号色上就有成功运用,而 12 号色的 Nova 12 Ultra 就是主打时尚卖点。 同为时尚,nova 的风格更年轻也更潮流,而 Pura70 Ultra 在延续性设计的基础上,通过「高定刺绣压纹」工艺,把时尚描绘地更含蓄也更 Old Money 一些。 比如星芒黑和摩卡棕,在时尚中带点复古,但看不出土,就很「老钱风」。 Pura 70 的整个系列都在贯彻着时尚的元素,包括配件在内。 官方配件中,云朵素皮保护壳和印花磁吸保护壳,很明显就用到了奢侈品包包的设计元素: BV 的云朵包和 BV 绿: 以及 LV/Fendi/Dior 的老花风格: 这种设计风格,不是霸王茶姬对 Dior 或者 Gucci 设计的粗暴挪用,非形似,而是神似,要的是时尚的那种感觉。 这是形似,看得出来是一个东西,但视觉没有冲击,内心有些鄙夷,简言之就是抄袭。 这是神似,即使样子完全不同,但依然能从二者的身上看到似曾相识的庄重、霸气,以及威慑力。 于是,从基本功、突破设计和时尚感三个层面上,Pura 70 系列,尤其是 Ultra 兑现了前几天自己所说的,在时尚感和设计上相对于 P 系列的升级。 2020 年底,Mate 40 Pro 发布,除了 88° 曲率的视觉无变设计,全新星环的镜头模组不仅完善了 Mate 30 上的 Halo 环,还使得「星环」正式走入了 Mate 的家族语言,延续至今。 Mate 60 Pro+ 上的「惊鸿一撇」,更加衬托出了星环的中心地位。 2023 年底,华为首款耳夹耳机 FreeClip 上线,独特的佩戴方式引人瞩目,大胆的颜色采用,也让这款耳机突破了本身的「工具属性」,在适合长时间佩戴的同时,也成为了新时代的一款「赛博耳钉」。 今年二月,被称为「时尚制作」的华为小折叠 Pocket 2 发布,「珍珠双环」的外屏设计,「大溪地灰」全新配色,还有联名艺术定制版。 当然也少不了主打设计、时尚、年轻的配件。 上周,和 P70 系列一同开售的,还有全新的口红耳机 FreeBuds Lipstick 2,其设计灵感来自于「水滴」,耳机大胆的造型设计,和专为女性群体定制的口红充电舱,从里到外,都在彰显着它的与众不同。 华为在一次次大胆和超前的设计中,逐渐成为一家时尚公司。 在友商和竞品都在拼硬件、参数和跑分的时候,华为像是多了一件利器,从无限内卷的性能比拼中撤出半个身位,把时尚和设计,打造成华为产品的新卖点。 因此,在 Pura 系列取得突破的背后,其实是华为近年来在前进路线上的积累与改变。 相比于上一代的 P60 Art,这一次的 Pura70 Ultra 同为系列最高,也实现了迭代涨价。 这其中固然有配置上的增强:比如内存加大,主摄升级等等。但在我看来,华为的品牌力、技术和配置升级,是支撑 Pura70 Ultra 万元起售的一部分因素。 设计,让这款手机在让人信服地获得「溢价」上,居功至伟。 从目前售罄的现状和预期的销售量,华为 Pura70 Ultra 合理地站在了三星 Galaxy S24 Ultra 和 iPhone 15 Pro Max 相同的产品价值线上。在同价位的对比下,它卖到 10000 元,在此也显得更有说服力。 前提是,你对跑分这种事情,没有一丝一毫的兴趣。
华为手机中国市场份额目标曝光:今年约22% 明年30%
【CNMO科技消息】近日,一位数码博主在社交媒体上曝光了华为手机在中国市场的份额目标,引发业界广泛关注。该博主透露,华为手机今年在中国市场目标占据约22%的份额,而明年更是雄将达到约30%。 华为 据悉,为实现这一目标,华为今年的手机出货量目标设定在6000万至6500万台之间,而到了明年,出货量预期将大幅提升至8000万至9000万台。博主强调,这些数字都是经过认真评估的“靠谱数字”。 此前,市场调研机构TechInsights公布的数据显示,华为Mate60系列在中国市场取得了不俗的成绩。该系列手机在2023年8月至12月的短短5个月内,出货量达到了620万部,展现出强大的市场号召力。而华为即将发布的Pura 70系列,由于有着更早的发布窗口和缓解的供应限制,预计将在2024年实现超过1000万部的出货量。 华为Pura 70 TechInsights进一步预测,随着华为新品的不断推出和市场策略的调整,2024年华为在中国的智能手机出货量有望超过5000万部。市场份额也将从2023年的12%大幅提升至2024年的19%(与博主曝光的目标不同,但差距不大),这一增长将帮助华为重新夺回中国市场榜首位置。 业内专家分析认为,华为能够在竞争激烈的市场环境中设定如此高的目标,得益于其强大的研发实力、丰富的产品线以及不断优化的市场策略。同时,随着供应链的恢复和消费者对华为品牌的持续认可,华为有望实现其设定的市场份额目标。
vivo X100 Ultra有望搭载5500mAh大电池 快充为镜头让路
【CNMO科技消息】作为vivo的顶级旗舰,vivo代号“灭霸”的超大杯机型vivo X100 Ultra(暂定名)自从曝光后便一直受到不少消费者的关注。4月23日,有数码博主在微博再放出了一条与该机相关的消息,主要与新机的充电和电池大小有关。 vivo X100系列 该博主称:“那台顶级影像旗舰的高密度电池容量5400/5500±,快充方案不是百瓦级,整个快充系统为镜头堆叠让步。”虽然其没有直接点明新机的身份,但是从描述中不难发现,这款新机很可能就是vivo X100 Ultra。由于镜头模组的关系,新机在充电功率上可能无法做到顶级,但是不少网友表示,80W快充其实也足够用了,并没有比百瓦慢多少。好在新机依旧将配备大电池,这对于大部分人而言比快充可能更加重要。 vivo X100 Ultra爆料 根据该博主此前的消息,vivo的这款顶级旗舰将会在5月份正式发布,作为OPPO、vivo、华为、荣耀、小米等几家中最后登场的旗舰,vivo新机最大的卖点莫过于拍照了。根据此前消息,vivo X100 Ultra将会搭载后置三摄模组,其中包括一枚2亿像素的潜望式超长焦镜头,这枚潜望式长焦有着非常强的影像素质,在堆料方面可以说做到了极致。有传言称,正是因为对这枚全新的潜望镜头在调教方面缺乏经验,才导致了vivo超大杯“姗姗来迟”。

版权所有 (C) 广州智会云科技发展有限公司 粤ICP备20006386号

免责声明:本网站部分内容由用户自行上传,如权利人发现存在误传其作品情形,请及时与本站联系。