“百模大战这些创业公司,大家用的都是OpenAI的训练方法,因为参数大数据也差不多,结果是同质化严重。市面上根本用不了这么多大模型,到2024年应该就会退热,发现谁在岸上谁在裸泳。”小冰公司 CEO 李笛在2023年年初告诉《AI光年》。
李笛一语成谶。去年年初轰轰烈烈的百模大战,经过一年繁花着锦烈火烹油的高光时刻后,当下也进入了平淡期,创业独角兽的光环纷纷开始褪去,明星创始人被投资人起诉,“六小虎”中的两家,有两家在逐步放弃预训练模型。
当下大模型赛道的游戏当下的竞争已经常态化,大模型创业独角兽也变成了“吞金兽”。《AI光年》曾问过一位投大模型应用的投资人,大模型独角兽估值过200亿后,还能向谁去融资?“BAT战投在早期都纷纷出手了,后期融资其实很不乐观。”
现如今,中国大模型的阵营依然是两大派别,大厂派和创业派。仅仅一年时间,大厂还是大厂,创业公司却多少少了点锐气。投资人中有人已经悲观的下了结论,创业公司打不赢大厂。
“中国一定会有自己的ChatGPT。这跟搜索引擎一样,我们有自己的合规要求。但是中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为。”迅雷创始人、远望资本程浩告诉《AI光年》。
这是《AI光年》策划的《大模型竞争进入深水期》系列观察第一篇,关注的是曾经如火如荼的大模型应用市场,《AI光年》拜访了一级市场的投资人、大模型应用创业者和大厂的大模型从业者。
投资人给《AI光年》2024年的观感是,大模型已经“讲烂了”,资本不再是技术信仰派,只有更好变现能力的明星团队才好拿钱。
大模型投资两极化
OpenAI的发家之路,让外界再次燃起技术改变未来的希望。一个声音总是响起:大模型是走向通用人工智能的第一步,所有行业都值得用大模型重做一遍。
大模型迎来了一场产学研的集体狂欢:大型科技公司声浪不断、科学家抱团创业、大厂高P集体出走……
时间过去两年,现在的局面是,狂欢和混沌的故事线在国内AI圈子中并行。
以百模大战让API价格降无可降为界,牌桌上就已经开始悄悄分出了一些胜负:大厂之间进入从卷技术到卷应用的下半场,在AI Agent这样的应用上大肆下注;大模型独角兽公司们一波三折,但也经历着“放弃基础大模型”的纠结,减员和调整令人不安。
互联网大厂的大模型之战“卷”到所有人,关注点从技术平移到应用,谈钱越来越不可耻,砸钱换一个入场券的游戏已经结束。
OpenAI发布的推理模型o1成为一个节点,行业逐渐形成共识:技术平权正在到来,大模型应用落地已经进入全面开花的前夜。
OpenAI的光芒令科技界艳羡,一旦进入谈钱阶段,一切未必有看上去那样美好——预计OpenAI今年创收35至45亿美元,亏损40至50亿美元。
虽然行业标杆还没看到盈利曙光,但中国人在赚钱这件事上往往更加心急。
没有人比投资圈更愿意因利起早了,ChatGPT拉开大模型投资热的局面后,国内也掀起一阵投资热潮。原因不难解释,是技术抢跑的需要,也是疫情期间被抑制的需求找到了出口。
一个经常被提及的案例是月之暗面,今年2月月之暗面拿下超70亿元的A轮融资,但除了大模型五小虎外,大部分大模型应用厂商融资金额大多没有超过亿元。
总体来看,据钛媒体数据,目前国内披露获得投资的大模型公司只有大约 20 家,除去已经被美团收购的光年之外,融资额超过亿元的不足 5 家。
短暂的火热后,不少投资人今年的观感是,大模型已经“讲烂了”,资本不再是技术信仰派,只有更好变现能力的明星团队才好拿钱。
炒股机器人Arbor Chat创始人郑其森最近在考虑融资,一番接触下来,他发现“创投在AI的投资上还是很积极考虑,但是出手比较谨慎”。
郑其森明显感到,资方对商业可用性和变现能力的重视日益加深,但大模型又是一个明确的方向,因此会产生一些矛盾心理。“大部分资金还是重注在比较明确的大模型方向,但另一方面大家都觉得大模型的投资到了尽头。”
投资人Jack向《深网》解释这种矛盾心理的来源。
“如果投了一个大模型技术团队,迟迟得不到一个milestone的报告,肯定会着急”。在国内“纯技术团队很难融到钱”,一心追求技术突破,不去落地搞应用,“那就不要走投资这条路”。
Jack任职于一家风险投资机构,他原本预期,大型科技公司本该扮演很多大模型项目的“接盘方”,但从目前的趋势来看,他们在投资上的出手次数并不乐观。
近期月之暗面被投资人在香港起诉的消息成为一级市场的热点,“风险投资不风险”和一级市场整体冷清也有关系。数据显示,2023年中国创投市场的交易同比降低了22%。
Jack告诉《深网》:“现在很多机构限制出售量,会上限定一个月只能上会一个项目,”以前对没过会但自己看好的项目,投资人之间会“递小纸条”互相推荐,“今天大部分的VC都没钱情况下,大家都不聊项目了”。
面对大模型这样充满不确定的概念时,Jack发现很多机构的投资逻辑从“人+事”转变为“人的因素多一些”。
“他们现在会投一些人,其实没有想好要做什么大模型产品,或者是项目长什么样,反正先投它,做出来再说,我信你这个人。”Jack说。
决策出发点远离核心价值,暗含一种隐喻:扩张性行业态势最起码不会在大模型早期投资阶段上演。
宏观叙事角度出发,背后的原因可以追溯得更久:上一轮科技创新周期的成果转化尚未结束,大模型所在的人工智能产业还没到大规模释放红利的时候。
大模型很多应用属于高度细分领域,是产业链中的“偏科生”,市占率有限。因此,PE/VC在这类新科技的投资上更为审慎。
网商银行相关人士对《深网》透露,很多技型小企业拿不到资本市场直接融资,是因为这些“科小”普遍轻资产运作,“拿得出手”且能用于抵押贷款的有形资产十分有限。
该人士进一步解释,知识产权为主的无形资产的价值毋庸置疑,但在转化为金融资源的“定价”时存在很高的专业门槛。
无形资产的属性是一方面,高昂的研发和训练成本也导致资方不再单纯追求技术先进性。
“当然技术壁垒还是大家看重的。”天使投资人、人工智能专家郭涛坦诚,“但在AI能自我进步的年代,其实没有人有任何长远的技术壁垒。”
技术平权的一天迟早来到,随着市场对大模型的认知提高,评估标准发生改变也不足为奇。
除了综合考虑项目的商业模式、市场前景和竞争优势等因素,还有一个浅显但管用的标准,即该项目是否是明星大模型团队。
在大模型创业项目如雨后春笋冒出来的2023年,郭涛对《深网》回忆,自己也接触过几个项目,但结果令人失望。
“基本上都不具备投资价值,市场里90%项目都是开源模型,但并没有成熟的生态体系,更不用说缺乏成功案例和品牌效应了。”他感叹。
就目前的趋势来看,越来越多的投资人在考虑非技术性的壁垒,例如垂直行业的进入门槛、品牌及客户基础等。
和所有新技术的命运一样,检验其靠谱与否的唯一衡量标准,最终还是要落到商业化的可行性和规模化上。
郭涛总结到,大模型现在投资的盈利方式还是B端市场。如语言服务、数字分身、数字人等,包括百度的文心大模型、腾讯的混元大模型。C端除了对算力资源要求比较高的一些服务都是免费的,向B端收费是一个大趋势。
变现、变现,还是变现!
奔向飞往深圳的航班路上,赵杰辉还不忘念叨着“Q4还得冲刺一把,多谈几个单子”。
赵杰辉是滴普科技的创始人和CEO,创业之前在华为、阿里工作过多年,属于典型的“商业技术精英”。
形势比人强,赵杰辉现在常挂在嘴边的一句话是“只有持续迭代才能活下去”。也许这也解释了,靠大模型赚到“真金白银”的企业不多,滴普科技却能跻身队列之中的原因。
2022年开始,滴普投入到以大模型为代表人工智能技术,重塑原有的数据平台业务,迭代成为企业AI基础设施和产业生成式AI应用服务商。据他介绍,滴普科技今年的营收约增长90%,其中40%都来自大模型相关业务。
滴普位于北京中关村,上一轮“双创”潮中,这里是“宇宙中的宇宙,苹果中的核心”。2014年以及之后的大约3年,中关村弥漫的都是科技创新的氛围,酿造了一个又一个的“创业传奇”。
十年后的今天再看,气候已经完全变化。
“大模型赛道,甚至是整个人工智能行业,像m以前那样突然出现一个市值翻100倍的公司不太可能。”Jack的语气非常笃定,“以后很难出现BAT和独角兽,涌现出来会是大量的中小公司。”
独角兽企业难再现不是什么新鲜论调,而是近乎行业默契的存在。
在这一轮始于ChatGPT的创新浪潮里,不论信奉的是技术信仰派还是AI平民化,都必须是“务实派”,尽快证明自己的变现能力,这是重中之重。
在和被投企业交流时,Jack发现,即使是对早期企业,拉单子、做项目也成为今年的一个重要课题。
Jack的观察是,“去年大家对技术的崇拜大于赚钱的目标,直到今年因为跟客户坐下来面对面交流,了解客户的需求,才弄清楚在一些场景里,模型到底能不能做,哪一步能做,哪一块能通过工程化的能力解决。”
相对成熟的滴普科技,则在更早阶段看清了这个道理。
2018年和滴普科技同时段起步的几家数据中台公司,已经泯然众人矣。这也让赵杰辉早早明白,在资本、市场都站队“变现能力”的当下,与其去谈技术理想的变革,to B市场更重要的是好好活下去。
赵杰辉和《深网》分享了自己的观点:“大模型为代表的人工智能,在ToB落地一定是以客户的实际价值优先,满足市场的刚性需求。”
大模型率先冲击的就是传统的AI解决方案公司,如果大模型可以满足一家企业百分之五十以上的需求,花钱搞方案的必要性也就大大降低——这也意味着一部分蛋糕会被分走。
有数据显示,行业智能化渗透率将从2021年的7%增长到2026年的30%,更多行业的核心业务系统会被大模型能力渗透。
同时,据艾瑞咨询推算,2023年中国AI基础数据服务市场规模为45亿元,预计到2028年,其市场规模将达170亿元,且未来五年的复合增长率为30.4%。
在滴普面向的to B市场,接住这波大模型红利的,大部分是已经坐上牌桌的企业,靠的是对既有业务进行延续和变革,鲜少见到突然崛起的新势力在蚕食市场。
背后的原因不难理解,一个企业如果真正想把大模型落到深度业务的推理决策,就必须要有一定的数据治理基础。
B端大模型精调和落地,需要团队依靠在产业的多年经验、基于客户私有数据的治理和多种专业机理模型与大语言模型协同,并深入理解用户需求来实践,才能真正能够产生深入的有刚需的价值。
“多个模型形成一个模型的技术栈协同起来,有了整体落地的模型服务平台,才能够让人工智能在一个行业里面真正发挥深度的作用。”赵杰辉补充道。
快递100总经理陈登坤也对《深网》表示,大模型的基础通用人工智能能力针对所有公司都是普惠的,体现大模型应用差异的一是在于公司的私有领域知识库,二是公司的用户应用场景。
一般认为,大模型的发展有三大基础,算力、算法和数据。当前讨论较多的数据更多是各类公开和公共数据,但随着大模型向各个产业、细分领域和场景深入,行业性数据、商业性数据、用户数据等非公开数据就成为核心资源。
同样的逻辑在郑其森的创业路径上得到了验证,ArborChat虽然是个新产品,但过去六年多,郑其森和团队做出的金融AI产品,服务于国内外众多银行和基金。
其中一个业务包括,抽取和分析银行信贷业务客户的财务报表,并通过提取大量的会计数字,放到信贷模型里面做分析,“这让平时会计师七个小时的工作流程压缩到了半小时之内”。
通用大模型的爆发,让他看到了垂类模型在金融领域落地的更多可能性,尤其是在实时投资洞察、投资组合监察和深度金融分析方面。
他举例,如要知道排名前100科技公司在核能有没有投入,基金公司分析师可能需要花一个星期才能做完研究。
但现在分析师能通过ArborChat的Excel插件规模化完成了100家公司的AI搜索,“一星期”缩短到了“一分钟”。
技术不是难点,可贵的地方在于,郑其森看到了市场的空白。参照国外的情况,他的信心更来自“GPT也没能取代一切”。
通用大语言模型不是专门的金融工具,不会特意找金融数据库对接,其通用框架在处理金融数据时,往往会参考很多过时的资讯,这对于二级市场投资者几乎是“0容忍”的存在。
赵杰辉的观点与之类似,“大厂可以跟你卷价格,初创企业卷不起”,因此在大型互联网企业轻易能覆盖的范围里做事,一定是没有价值的。
B端的语料没有被大厂垄断,只要服务够好、够聚焦,就有在垂直领域创造价值的可能性。用赵杰辉的话说,“一定要在大厂的射程之外,找到自己的蓝海,逐步构建自己的不可替代性价值”。
对于更早期的团队,Jack认为还有一个选择,如果业务方向和大厂某个部门的方向一致,则存在被收购的可能。
经验告诉Jack,当大厂发布了一个AI功能,一定要足够聪明去研究和判断会不会冲击或间接影响到自己的项目,快速做出应对,并适当配置位置。
“我们很多项目,投它的时候跟它最后赚钱的时候已经完全不是一个样子。”他说。
面向to B,赚此刻的钱
科创企业要躲开射程的“大厂”, 实际上一直在追逐OpenAI的脚步。
OpenAI今年9月发布的O1模型,通过强化学习的技术路径大幅提高了大模型在逻辑推理方面的能力。
市场纠结的点在于,其最新模型Orion在开发过程中,未能达到预期的性能特别是在编码任务上未能超越前代产品GPT-4。
与之相对的是,中国的互联网大厂更多把注意力放在了应用层上。究其原因,业内的普遍观点是,国内即使是大厂和明星企业,技术优势都不明显,最后拼的还是算力成本和应用生态。
11月12日,李彦宏最近一次公开发言中,两个点值得关注:
一是“过去24个月,AI行业的最大变化是大模型基本消除了幻觉”。
AI幻觉(指大语言模型提供的看似合理但错漏百出的答案)如果真能彻底解决,大模型在许多垂直行业就能进行精准的预测和建议,避免失误带来的损失,使得大模型应用落地更进一步。
二是文心大模型的日均调用量超15亿,相较5月披露的2亿,增长7.5倍,相较一年前首次披露的5000万次,更是增长约30倍。
李彦宏表示“这个增速超出预期”,说明AI是真需求,而这条陡峭的增长曲线,代表着过去两年中国大模型应用的爆发。
应用层作为大模型最接近产业链下游的部分,游戏、办公、金融等垂直行业不同应用场景的多样性需求,也可以反推产业中上游进步。
王仲远此前在接受《深网》专访时曾表示,“C 端用户对于体验非常敏感,对于很轻微的幻觉问题,都会感知强烈,当这些都被解决,杀手级应用自然就出现了。”
大模型作为一个效率工具,已在设计、广告、电商等领域有了明确的应用,比如,文章摘要、会议纪要,主要用于把非结构化的数据结构化。
就C端层面而言,相较于遥遥无期的杀手级应用,大模型为现有产品升级和生态赋能的作用更明显。
比如,在腾讯视频剧集《长相思2》播出期间,腾讯旗下面向C端用户的AI大模型应用腾讯元宝,就因为扮演角色和用户对话、讨论剧情“出圈”,一个月内达到创纪录的3亿互动热度。
不久前,腾讯元宝升级为新一代大模型 " 混元 turbo",在交互体验、AI 搜索,以及多模态理解能力上均迎来进一步的提升。
问及腾讯元宝是否会嵌入商业搜索结果,腾讯首席战略官詹姆斯・米歇尔(James Mitchell)强调:“就目前而言,我们专注于尽可能地增加元宝对用户的吸引力,而非急于进行商业变现。”
面向付费用户意愿较低的C端,大厂之间更乐意比拼的是降低大模型门槛,以增强用户粘性,避免陷入人有我无、落于他人的局面。
360集团副总裁、AI搜索负责人梁志辉给《深网》举了个反例,在AI重塑搜索引擎的过程中,Google这样在传统搜索引擎竞争中取得领先地位的企业,反而落后了,至今都还没有推出原生AI搜索引擎。
“它们的组织弱点在于不愿意去做利润低于链接广告的东西,拉低公司整体低毛利的创新项目难以得到足够的资源支持,这点在Google体现明显。”
梁志辉进一步补充:“大象转身慢、既得利益庞大,自我颠覆的代价巨大。”和to C端大模型商业化前景相比,to B端在现阶段是更具确定性的存在,背后一个重要的推动力量是央国企。
公开数据显示,从2024年1-7月,央国企采购大模型项目数量已超过950个,且均匀布局在智算中心、大模型预训练、Agent和行业应用等多个方向。
公开的招标数据不能完全解释市场需求,很多央国企对大模型的应用和落地,实际上是之前数据管理的延续,而不是覆盖。
央国企大模型落地时,也格外注重行业应用。包括大模型预训练,大模型开发,以及针对个别环节或特定场景构建大模型应用或解决方案。
作为企业数据湖仓平台行业的长期的市场参与者,赵杰辉认为其中一个原因是:“美国和中国ToB市场,最后真正能够在产业端把大模型落地的关键,一定跟基础的数据能力分不开。”
他进一步解释,原有的数据平台市场一定会被以大模型为代表的人工智能技术浪潮重塑,一方面人工智能技术会极大的释放原有数据平台的价值,另一方面快速拥抱人工智能技术的程度会深度重构市场的竞争格局。
而中国在供应链端、制造业上积累的数据和语料,“不比美国弱,甚至比较强”。
路线的分叉,照见的是北美和中国人工智能执棋思路的不同。
Jack认为,一些直观感受更能传递这种信息:在美元VC投资人海岛度假晒朋友圈的周末,穿着中山装的政府工作人员反而在学术会议上,勤勤恳恳学习“大模型到底是什么”。
国内更多“我可以”的声音实际上传导自政策端。Jack的观察是,政策层面对AI的帮助尤大,无论落地效果是否达到预期,从数据到算力,“基础建设”已经在全力配备中。
实际上本轮大模型的发展,包括OpenAI在内,走的都是“力大砖飞”的路线,叠堆更多算力以创造更多奇迹。
对算力资源的投入往往以亿美元为单位计量,同时考虑的全球环境不确定性,政策端的支持很大一部分倾注在算力上。
据中信建设证券数据显示,2024年-2027年全球大模型推理的峰值算力需求量的年复合增长率为113%,远高于训练的78%。
环球同此凉热,当前大模型的发展放缓,部分原因在于算力瓶颈。万卡集群的升级能够提供足够的算力支持,对推动大模型的发展至关重要。
国内的情况是,通信巨头、头部互联网企业及AI企业共同推动超万卡集群技术革新。其中,中国移动等运营商有着强大的机房资源,作为算力基建主力正加速建设智算中心。
但目前来看,从AI Infra (人工智能基础设施,是连接算力和应用的AI中间层基础设施)到Maas(通过API接口调用即可使用的AI商业模式),都没有一个标准且完美的答案。
据字节跳动公开的万卡集群大模型训练架构MegaScale的数据,训练拥有1750亿参数的大模型需要在千卡集群上训练接近20天或者万卡集群上训练近2天,按照GPU使用机时计算,单次训练费用超过200万元,其算力利用率仅约为50%-60%。
科大讯飞副总裁、研究院院长刘聪对《深网》表示,现在许多算力平台等都在建设,但需要警惕的是,要时刻关注技术和市场的变化——例如目前,已经有些公司不再做通用底座大模型的训练迭代。
科大讯飞的算力部分主要和华为联合打造了首个国产万卡算力集群“飞星一号”平台。1024发布会上,讯飞也宣布国产超大规模智算平台“飞星二号”正式启动。对于讯飞来说,算力仍然很重要。
算力平台建设之外,刘聪考虑的事情更远,“如果无法带来商业上的正向循环,那么可能本身就存在问题”。刘聪看到的是商业闭环价值的重要性,作为企业,最终还是要回归“技术进步是否能支持行业场景落地”,因此科大讯飞新模型的迭代,“会在端到端上结合实际场景继续前进”。
赵杰辉的飞机降落深圳后,马不停蹄就安排上了和客户见面。在改革开放的起始站,这座城市见证了产业链供应链崛起的奇迹,无数大中小企业积攒了宝贵的语料宝藏。
如何推动整个社会系统向“智造”更近一步?市场的问题,有时候需要属于自己的“吸引力法则”去解决。
“做ToB的公司肯定是算账,ToB的公司不像ToC那样突然有一个爆款出现,我们挣的一定是现在、当下、此刻的钱。”赵杰辉说。
(应受访者要求,本文Jack人名为化名)