随着百度文心一言率先向公众开放,“百模大战”进入新“赛段”。
8月31日,百度文心一言宣布当日起面向全社会开放服务。这意味着文心一言告别内测阶段,用户无需再排队申请内测资格,可直接通过文心一言官网和文心一言App使用“写文案”“做规划”“生活助手”等AIGC服务。
2023年初刮起的生成式AI风潮方兴未艾,发挥基建作用的大语言模型(下称大模型)也层出不穷。根据中国科学技术信息研究所5月披露的数据,据不完全统计,中国10亿参数规模以上的大模型已发布79个。
而首批获准全面开放的大模型产品屈指可数,媒体报道显示,首批大模型研发机构仅有八家。百度跻身其中,不仅意味着文心一言技术实力获得认可,对锻造一款更加智慧的大模型而言也是一个新起点。
大模型的优化有赖于人类反馈和训练。百度创始人、董事长兼首席执行官李彦宏此前表示,当文心一言向数以亿计的互联网用户大规模开放服务后,能够获取到大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快的速度迭代文心一言。
率先获准全面上线,文心一言靠什么?站在生成式AI打开的新赛道,百度又将打开怎样的商业图谱?
全栈布局AI:文心一言领跑行业
答题、写诗、作画……大模型加持下涌现出的生成式AI应用功能看似大同小异,但鉴于底座模型能力的不同,不同产品在理解、生成、逻辑、记忆等关键能力模块上的表现也有所差异。
综合各项能力来看,文心一言已显露出领跑中文大模型行业之势。在中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力系统性测评结果,百度文心一言表现超过GPT3.5,综合评价指数位居国内第一。中文通用大模型综合性基准SuperClue发布最新中文大语言模型排行榜也显示,文心一言总分超过GPT-3.5-Turbo,领跑国内大模型。
这与文心一言的快速迭代不无关系。据百度方面披露,自3月发布至今,文心一言熟练掌握的创作体裁已超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。与此同时,文心一言的“自我迭代”效率也显著提升,目前其训练速度达原来的3倍,推理速度则是原来的30多倍。
而追本溯源,文心一言的快速成长与百度多年的技术积淀不无关系。回溯来看,百度全面布局人工智能13年有余,在多年研发“长跑”中积累起知识增强、检索增强和对话增强等核心技术优势。此间其累计研发投入超过1400亿元,2022年的研发投入强度达到新高,214.16亿元的核心研发投入占公司核心收入的22.4%,堪称压强式研发。
生成式AI给IT技术栈各个层级——芯片层、框架层、模型层、应用层都带来了变革机遇,作为全球为数不多全栈布局的人工智能公司,除应用层的文心一言和模型层的文心大模型之外,百度也在芯片层、框架层发力。据百度方面披露,其AI业务还涵盖芯片层的昆仑芯片和框架层飞桨深度学习平台,这些层级均有领先业界的关键自研技术,且实现了层与层反馈、端到端优化。
C端“打法”:用大模型重构用户侧产品
部署了立体的产业图谱,百度如何运用大模型重塑AI“生意”?重构旗下所有应用,这是百度当前风格最为鲜明的一大打法。
8月31日,官宣开放文心一言的同时,百度表示公司各类用户侧产品正在利用大模型进行重构。这也兑现了李彦宏早前公开立下的flag:“百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!”
大模型时代所有产品都值得被重构,这个看似极端的说法正在业内落地。从国外科技巨头的动作来看,无论是重金支持Open AI的微软,还是在深耕算法研发已久的谷歌,都在ChatGPT引爆AI圈之后迅速借助大模型升级各自的搜索引擎产品,一方面用具体的应用场景来验证大模型实力,另一方面意在给用户带来更智能化的使用体验,探索用户侧市场的增长边界。
百度也选择积极地在应用层展露大模型实力。据介绍,百度搜索、百家号、百度文库、百度输入法等产品目前正研发并陆续推出相关AI功能,未来还将推出NEWAPP等产品。
重构既有产品能够给C端用户带来哪些价值?这个问题的答案在早前的内测阶段已初步浮现。以百度老牌产品搜索引擎为例,今年5月底百度搜索AI工具“AI伙伴”开始内测。这款百度语义检索技术和大语言模型相结合的工具能与用户进行语音互动、帮助用户标记答案中的重点、提供权威信息来源的同时支持调用各种工具和服务,同时兼具文案以及根据用户意图制作图片或进行文案创作。
此外,在内容创作、内容分发、内容营销、网盘管理等C端场景下,百度也借助大语言模型对百度百家、百度文库、百度网盘等既有产品进行改造,推出AI笔记、AI成片、AI作画、AI BOT、AI写作、AI数字人、“云一朵”智能助理等AI工具。
大模型浪潮下,更多的创投机会集中在IT技术栈中的哪一层?虽然业内尚未对此完全达成共识,但百度坚定地选择应用层。“大模型时代,真正最大的机会既不在基础服务,也不在行业服务,我觉得恰恰是在应用。就好像在移动互联网时代,最大的商业机会可能不是 iOS 或者说安卓这样的操作系统,而是微信、抖音、淘宝这些应用一样。”李彦宏此前在公开场合表示,只有在大模型的基础之上,产生了足够多的AI原生应用,才是一个健康的生态环境。而用大模型重构既有产品之余,百度会否开发更多AI原生C端应用?拭目以待。
B端探索:多模型集成、多行业赋能
大模型浪潮下AIGC应用层出不穷,对于百度等有大模型自研能力的科技大厂而言,较之开发C端应用,B端是一条更易建立起“护城河”的赛道。
企业应用大模型的方式有三:构建基础大模型、建立行业大模型、在基础大模型和行业大模型之上开发AI应用。碍于较高的训练成本和技术壁垒,选择自建大模型的企业寥寥,后两条应用路径是大模型供应商机会所在,百度也正以搭建大模型集成平台的方式抓住“战机”。
2023 年3月,百度智能云推出企业级一站式大模型平台——“千帆大模型平台”。推出5个月后,目前该平台是国内拥有大模型最多的平台,8月升级后全面接入Llama 2 全系列、ChatGLM2-6B等33个大模型,并上线国内103个预置Prompt模板,覆盖对话、游戏、编程、写作十余个场景,便于企业用户获得更精准的服务。
除此,百度也在把大模型能力与实体经济进行深度融合,用大模型技术为能源、制造、金融、交通等领域提供AI服务。譬如,在能源领域,为国家电网提供大模型技术,用AI辅助预测用电的高峰波谷,从而为电网调度提供建议;在汽车制造领域,与吉利汽车合作开发汽车行业大模型,构建了工厂数字化大脑,帮助后者降本增效;在金融服务领域,与中信金控合作开发基于大模型的数字人。
如今百度正基于大模型技术和云平台搭建AI企业服务生态。百度公开的数据显示,截至7月,已有 5 万家企业申请接入文心一言测试,涵盖行业包括传媒文娱、泛科技、金融、汽车、零售、健康医药等。
大模型技术快速迭代,AIGC打开的商业海洋边界何在尚未可知。国内科技大厂们如何逐浪AI、打开新的商业征程,拭目以待。