×
加载中...
大模型拯救数字人
甲子光年 2024-12-05 07:40

先发展模型能力,还是先发展应用?


在过去很长一段时间,这恐怕都是生成式AI行业里最具代表性的争论之一。


行业内曾在杨植麟和朱啸虎公开发表观点之后,划分成了“技术信仰派”与“产品信仰派”,并且一度争执不下。但仅不到一年,这种争论就逐渐聚焦成一种声音——商业化落地。


清华大学计算机系教授、中国科学院院士张钹曾就这一问题向「甲子光年」表示:“在中国,光搞大模型很难活下去,必须与应用相结合。”


其实,学界的呼吁早已成了业内的共识。


半年前的一场AI论坛中,包括金沙江创投朱啸虎、猎户星空傅盛、智谱张帆等在内的所有嘉宾,都认可商业化是现阶段国内大模型企业的第一要务,也都认可to B是大模型快速实现商业化的最佳路径。


当然,即使是to C的Kimi,也在今年5月20日通过网页版推出了打赏付费功能。这被视为Kimi试水商业化的重要动作。


但究竟如何与应用相结合,是摆在国内绝大多数AI大模型企业面前的一道难题。


而在解题过程中,“数字人”似乎成了全行业统一的标准答案。


11月6日,AI Infra企业零一万物对外发布了大模型to B解决方案,其中就包括了面向电商直播、办公会议等场景的“如意”数字人。


这一动作耐人寻味的原因在于,李开复曾在今年6月的智源大会上公开表示不做to B。然而仅仅半年之后,零一万物就带着数字人解决方案扎进了to B市场。


其实,互联网大厂早就开始了基于AI大模型的数字人布局:例如腾讯打造腾讯智能、百度打造智能云曦灵平台、京东打造言犀、华为打造华为云盘古数字人大模型……


不只是互联网大厂,传统IT厂商也开始探索数字人。


在「甲子光年」近期对世纪互联旗下全资子公司第一线DYXnet的访谈中,世纪互联高级副总裁/第一线总经理陈姵妏透露,第一线目前也在打造“线灵系列”AI服务,而数字人正是其中一个重要板块。


为何AI大模型公司如此钟情数字人?大模型给数字人带来了什么?AI加持下,数字人真是一门好生意吗?




1.两条“死胡同儿”

图片


数字人的爆火,可以追溯到4年前。


早在2020年之前,数字人的前身“虚拟人”就借着元宇宙的东风开始被大众认知。


彼时,Meta还在扎克伯格的带领下all in元宇宙。被带火的3D虚拟人被视为元宇宙的“原住民”,一度成了最热门的创业赛道。当时仅国内与虚拟人沾边的创业公司就多达几十万家。


在众多的虚拟人中,“柳夜熙”一时风头无二。


2021年10月31日,柳夜熙凭借一条“捉妖”题材的短视频爆红全网,一夜涨粉363万。


图片

柳夜熙,来源:柳夜熙微博


从此以后,各大虚拟人如雨后春笋一般,一时间赚足眼球:万科数字员工“崔筱盼”拿下了2021年万科总部最佳新人奖;虚拟人“邓丽君”在江苏卫视2022跨年演唱会亮相;湖南卫视的《你好,星期六》启用数字主持人“小漾”……


根据国内创投数据库IT桔子统计显示,截止2022年10月,国内虚拟人领域融资数量近百起,金额约120亿元。


从技术层面看,当时的虚拟人主要分为两种技术路线:一种是平面2D数字人,渲染要求不高,可以快速规模化复制,并且更像真人,只是肢体动作和面部表情都表现僵硬,实际效果较差。


另一种是3D超写实虚拟人,通过高成本的原理动画制作,生成一个亲和力、表现力更强的虚拟人。初代虚拟偶像洛天依就采用的是这种路线。


对比这两种技术路线不难发现,2D数字人尽管成本低、能够快速批量制作,但受限于当时的技术能力,无法突破形象和动作表现的瓶颈,所以即使价格低廉,却在当时也未获得客户认可。


而效果更好的超写实3D虚拟人在形象外观上更受欢迎。但这种虚拟人的缺点也很明显,那就是“贵”。


关于虚拟人的制作成本,「甲子光年」访谈了国内知名AI数字人创作平台蝉镜。


据蝉镜联合创始人杨洪进表示,制作一个3D虚拟人,大致要经过扫描、建模、计算机绑定、动画展示和渲染等多个环节,时间成本与资金成本投入都不是一个小数目。


3D虚拟人的制作越精良,花费的成本越高。按照传统的CG级制作手法计算,单个超写实3D虚拟人的制作成本大约在100~200万元,时间周期约为2~3个月。


此前,黄仁勋曾在英伟达发布会上出镜了14秒虚拟人视频。根据英伟达官方博客显示,这短短的14秒视频,就共有34位3D美术师和15位软件工程师协同参与,总计投入近千工时。


图片

黄仁勋虚拟人,来源:英伟达


除了居高不下的成本投入,企业还要为虚拟人的商业化进行考虑。毕竟在制作上花了大价钱,谁都想让它最大程度实现商业化变现。


但事实上,当时适合这种高投入的虚拟人的商业化场景极为有限,最常见的形式就是以虚拟偶像的形式进行IP化打造,直接面向to C领域。


日本的初音未来就是这一赛道的鼻祖,也是当时全球第一的虚拟偶像。而国内则有柳夜熙、洛天依等。柳夜熙在一夜爆红之后,甚至曾和小鹏汽车、VIVO、娇韵诗、安踏等知名品牌达成过合作。


可问题在于,虚拟偶像在IP化运营上的投入也是个无底洞。因为虚拟偶像需要持续不断的生产符合自身人设的内容,这就要搭配相应的内容团队专门为其打造。这也是一笔不小的费用。


与此同时,IP生态产业链的上下游联动也必不可少,例如出品玩偶等周边产品、创作相关的影视作品等等,围绕虚拟偶像进行持续性、多元化的运营。


据「甲子光年」此前了解,仅运营一个虚拟偶像的线上内容,一年就要花费超过800万元。“因为你不只是希望它在那里站着,你要的是让它动起来。比如语音、 面部表情、 动作生成等。这些都需要持续投入。”杨洪进表示。


除了成本与商业化的痛点之外,虚拟人还有更加重要的实时互动问题,在当时也难以解决。


简单来说,当时的虚拟人并不能自主实现面部表情和肢体动作的变化,也不能像真人一样回复用户的言语互动。这种痛点在其直播带货时尤其明显。


杨洪进透露,为了解决虚拟人的实时交互问题,当时的虚拟人直播间普遍采用“阿凡达”模式,即前端是虚拟人形象,但动作和语言都由后端的真人进行操作。


高企的制作与运营成本、局促的商业化空间、实时互动瓶颈,都是限制虚拟人普及的巨大门槛,也是拖垮虚拟人运营方的重担。


例如担任全球鞋类巨头斯凯奇潮流主理人的数字人孔襄,2022年4月在抖音出道时就吸引了数十万粉丝,结果当年9月就停止更新,账号一共只发布了8条视频。


一边是“用不起”的3D超写实虚拟人,另一边是“看不起”的2D平面数字人。一时间,这两条技术路线似乎都走进了死胡同儿。




2.“刘润时刻”

图片

转机出现在生成式AI横空出世之后。


在诸多AI数字人里,刘润是一个不得不提的名字。


时间回到2022年10月底。当时,OpenAI的ChatGPT还并未对外发布,商业认知博主刘润就在年度演讲“进化的力量”中展示了自己的数字人。


事实上,刘润第一次展示数字人时并未破圈,人们更多是以猎奇的心态看待刘润的数字人产品。但刘润团队随后加大了在数字人方面的投入,尤其在内容上开始大量使用数字人进行视频输出,数量多到甚至一度被个别读者吐槽“已经看不到真人了”。


直到今年1月1日,刘润才通过公开信的方式复盘了团队在技术上的投入。此时大众才发现刘润的视频内容里已充满数字人。


足够以假乱真、甚至完全无法分辨,是AI大模型加持下的数字人的最大特点,也是AI给数字人带来的最直观的变化。


图片

刘润数字人,来源:刘润视频号


从本质上看,今天的数字人可以看做是一个具象化的AI皮肤,其运行原理也与ChatGPT一致,都是依靠精湛的算法、强悍的算力和优质庞大的数据库。


简单来说,现在我们看到的数字人,其实就是通过视觉形式采集人们说话时的唇动、表情和面部肌肉细节等数据并进行AI训练,进而让AI生成更多更丰富的表情与动作。


由于机器视觉技术已十分成熟,可以精确捕捉人说话时的唇动和面部细节,加上AI大模型在语言能力上的优势,数字人自然能够与真人更贴近,并且也具有加深理解用户意图、生成回答、保持话题连贯等对话的能力。


早在2020年就开始研发AIGC数字人的硅基智能曾向「甲子光年」透露,在ChatGPT发布前,硅基智能就通过了数字人图灵测试的第一阶段:仅通过肉眼,普通人无法分辨真人和数字人。而刘润数字人的亮相,在硅基智能内部被称为“刘润时刻”


这是一个转折点。因为3年前还会有客户说不像真人,现在几乎没有了。”一名硅基智能的销售曾对「甲子光年」表示。


不过,让数字人更普及的核心变化显然来自成本层面。


前文提到,早期的数字人分为2D数字人和3D超写实虚拟人两种技术路线。对比3D虚拟人的投入,2D数字人的成本要低很多。


据蝉镜创始人杨洪进透露,采购一个数字人通常涉及“克隆”和“使用”两笔费用。克隆就是由真人拍照进行AI训练生成数字人。这笔费用在几年前大约会在上万元,近两年价格逐步降低,但也在千元级别。


“去年的市场行情已经到了300元克隆一个数字人。今年我们直接把价格打成了免费。0元就能帮你克隆一个自己的数字人!”杨洪进说。


如此之低的制作价格背后,是AI加持下数字人训练的边际成本大幅降低的原因。


硅基智能创始人司马华鹏曾对「甲子光年」透露,生成2D数字人所需要的数据采集越来越少,成本肉眼可见地下降:从最初需要30分钟的视频数据,到10分钟,5分钟,慢慢缩短为1分钟、甚至是1张照片。“这是一条非常好看的曲线。”


换句话说,在数字人的数据库达到一定量级后,制作方确实可以几乎0成本生成数字人。这也是蝉镜等数字人制作方能够打出免费价格的底气。


克隆成本的降低只是一方面,数字人的实际运营成本也得到了大幅降低。


以如今数字人最常见的直播带货场景为例,第一,商家的直播工作流变得更加简单。


真人直播搭建一个直播间耗时耗力,而通过成熟的数字人产品,5分钟就可以搭建一个数字人直播间,还能通过AIGC生成直播脚本、做剧本和物料的优化等。


第二,大模型加持下,个性化数字人只需几分钟的素材即可生成,可以实现低成本一键开播、24小时不间断直播,极大节省了人力,降低了商家运营成本。


一家代播平台负责人给到了更具体的下降比例:同样一场直播,数字人的花费不到真人主播的10%。


在足够低的成本面前,使用场景的局限便不复存在。


正如我们所见,今天的AI数字人已开始出现在人们常见的诸多场景。除了应用最多的直播带货外,智能客服、短视频娱乐、在线教育、保险销售等场景,也都开始出现数字人的身影。


据杨洪进介绍,由蝉镜平台制作的数字人,已广泛应用在各行各业,甚至包括律师也在使用。“我们数字人单个视频的视频号播放量超过1.2亿。”


对此,陈姵妏也向「甲子光年」透露,第一线聚焦多元化办公场景,打造了线灵系列AI服务。其中AI数字人解决方案是由第一线联手腾讯智影等企业研发,针对电商、培训、旅游、教育等垂直领域,帮助企业客户进行业务讲解、客户服务等工作。


更完美的形象与实时互动能力、足够低的成本、以及更多的应用场景,都是AI大模型带给数字人的巨大突破。而数字人也让AI大模型寻找到了商业化落地的突破口。




3.双向奔赴之后

图片

显然,AI大模型与数字人的结合,是一场恰如其分的双向奔赴。


自从ChatGPT横空出世以来,人们对此类产品的讨论就从未停止。其中最普遍的论调是:它到底能产生什么实际价值?大模型的商业化究竟是什么形态?


而数字人就是大模型给出的第一个答案。


大模型要想解决商业化困境,“产品、场景、成本”是必须回答的3个问题。而数字人恰好就是这3个问题的最大公约数。


也正因如此,我们才看到了包括百度、京东、腾讯在内的互联网大厂,以及零一万物、出门问问等细分头部企业、甚至是第一线这种传统IT厂商,在数字人业务上的不谋而合。


原因在于,AI大模型诸多商业化可能性中,数字人是率先被客户验证的产品。


杨洪进告诉「甲子光年」,目前,企业客户对数字人的最核心需求就是降本增效。而直播带货、智能客服等数字人应用较多的场景,都是更容易测算ROI的场景。


“比如你在数字人上每花1块钱,就能赚2块钱。这种ROI已经普遍是数字人厂商的卖点。”杨洪进透露。


硅基智能曾向「甲子光年」提供过一个案例:2023年春节,杭州一家本地生活公司因为缺少人手,两位运营人员同时运营8个硅基智能数字人直播间,在小长假期间收获了千万流水。


大厂的动作更加高举高打。今年4月16日,京东集团创始人刘强东以“采销东哥AI数字人”的形式现身京东超市、京东家电家居采销直播间。据京东发布的官方战报显示,“采销东哥AI数字人”直播不到1小时,累计成交额超5000万元。


如此之高的投入产出比,客户自然愿意投入真金白银为AI数字人买单。


据杨洪进透露,蝉镜AI数字人创作平台上线以来,目前已积累了20多万家中小企业客户,累计创建的数字人数量也已超过百万个。


尽管数字人看上去像是一个赚钱利器,但也并不意味着它能让客户躺着赚钱。


「甲子光年」曾在《数字人淘金热,一场被AIGC改写的风暴》中指出,数字人只能维持直播的营收模式,通过节省真人主播降低成本,而不能从0到1创造一个有利润的直播间。


真知创投联合创始人Alan也向「甲子光年」表示,数字人本身的价值其实非常有限,即使加入了AI能力,也无法凭空创造价值。


“这就像市面上一些给毛绒玩具加入AI模块的产品一样。尽管它能跟你对话,但它有可能还是会吃灰。”Alan说。


杨洪进则从IP资产的角度给出了另一种思考:“企业购买数字人,也不一定希望它必须带来多少收入。直播带货行业里,主播的角色非常关键,一些头部主播被捧红之后有可能跳槽,业内有非常多这样的例子。而数字人主播显然更稳定,这对企业来说是IP资产安全问题。”


无论是否赚钱,AI数字人都毋庸置疑的在近两年里实现了爆发。根据IDC预计,到2026年中国AI数字人市场规模将达到102.4亿元。


未来,关于AI大模型与数字人的结合,一个更值得思考的想象空间是,数字人将成为AI大模型的服务入口。


今天的数字人,已开始流露出成为人机交互入口的趋势。而对于这些大模型企业来说,数字人也必然会成为自身与客户之间的服务入口。


陈姵妏向「甲子光年」透露,第一线之所以要探索数字人业务,其中一个重要方面就是希望将原有的云网安业务向AI进行升级,通过AI能力进一步服务客户。


“我们有很多传统客户,他们更聚焦于自身的业务。而我们要做的则是用AI帮助他们更好的完成自身业务。这是我们推出AI服务和数字人解决方案的初心。”陈姵妏表示。


像SaaS产品一样,当客户采购数字人产品后,后续的使用与维护的成本都将与背后的AI大模型厂商实现强绑定。但比SaaS更有优势的是,AI大模型产品的使用粘性更高,持续使用还能让AI对客户自身更加了解,替换门槛也自然水涨船高。


AI与数字人的双向奔赴,在给客户产生收益的过程中实现商业化落地,进而反馈大模型训练推动整个闭环乃至大模型飞轮效应的形成。这种闭环的形成不仅提升了数字人的交互体验和智能化水平,也为AI企业提供了持续进步和落地的可能性。


这些,或许才是如此之多AI大模型企业共同瞄准数字人的真正意义所在。


扫码下载app 最新资讯实时掌握