距离ChatGPT发布整整两年后,中美两地的大模型代表厂商,仍在完善模型产品功能和使用体验上不断发力:11月初,OpenAI在ChatGPT中上线了AI搜索;11月中旬,百度则推出了一系列智能体应用,尝试构建AI应用生态。
行业领头羊的不同思考,得以让外界一窥它们在大模型领域的共识和分歧。
共识在于,无论OpenAI还是百度,都在致力于进一步消除幻觉,并努力提升商业化能力。百度创始人李彦宏甚至发出了“过去24个月,AI行业的最大变化是大模型基本消除了幻觉”的感慨。
但放在当下节点,两家公司对大模型应用的探索,更值得行业审视和思考。 OpenAI的AI搜索功能一经上线,就被众多一线用户发现其搜索结果依然难逃幻觉困境。如何将大模型带出幻觉陷阱? 作为老牌搜索巨头的百度,带来了自己的新答案:借助RAG(Retrieval-augmented Generation)解决了文字幻觉后,百度又盯上了图像幻觉,并为后者量身打造了一项独门秘术——iRAG(检索增强文生图技术,image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,以此来确保生成的图片更加真实,贴近自然。 更重要的是,唯有解决了大模型的幻觉问题,才能让更多人愿意并敢于用大模型技术。智能体,则成了百度撬动更多普通用户触及大模型技术的重磅应用方向。 相比OpenAI希望通过搜索持续增强自身变现能力,加码智能体的百度,不仅自己赚钱,还想让人人都能赚到钱,继续构筑AI应用生态,“我们不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数以百万‘超级有用’的应用。”李彦宏说道。 尽管全球几乎所有大模型玩家都在关注智能体,但正如李彦宏所言,像百度这样把智能体作为最重要战略方向的公司并不多。强如OpenAI,也选择了在今年3月份,关停仅运营两个月的智能体应用商店GPT Store。 在ChatGPT推出两年来,时间曾屡次证明李彦宏的部分非共识,逐一衍化为了行业新共识,如对检索增强的率先重视、卷应用的倡议等。 这一次,高喊智能体会是AI应用最主流形态等非共识论断的李彦宏,还能再次成功吗? 经过两年发展的大模型领域,正在转换出一套新的评判标准:对大模型厂商的综合实力打分,不再仅仅围绕它出了多少论文、刷了多少排行榜,更加开始看重它是否能获得规模化收入,何时能摸到盈利的门槛。 “也许不是最便宜的赢得商战,而是最能落地的赢得利润。”在今年上半年百度等一众大模型厂商纷纷启动大模型“价格战”之际,Lepton AI 创始人兼 CEO贾扬清便给出了自己的见解。在贾扬清看来,“降价是个拍脑袋就可以做的简单策略,但是真正的To B商业成功更难。” 为了加速商业化落地步伐,OpenAI选择了上马AI搜索,扩展新的付费渠道。百度则选择了平台生态策略:提供平台工具,搭建智能体生态,让智能体开发人人可用,人人都能赚到钱。 百度世界2024大会上,李彦宏对外展示了四大智能体应用——公司类智能体、角色类智能体、工具类智能体、行业类智能体。 公司类智能体,就相当于AI时代的公司官网:传统官网具有的公司介绍、产品图片和参数展示、线下门店位置等能力,公司类智能体有;传统网站没有的主动推荐、及时响应和服务能力,公司智能体也有。 角色类智能体,则是一改往日数字人声音、肢体动作、口型机械、呆板的短板,开始变得更加高度拟人化,简单来说就是更像真人了。 工具类智能体方面,李彦宏着重介绍了百度文库与百度网盘联合发布的“自由画布”,在充分运用文库与网盘的融合优势基础上,全面打通过去公域与私域资料的限制,实现输入、编辑、创作、分享自由。 行业类智能体方面,目前已经在法律、医疗健康、金融、体育、旅行等诸多领域落地。作为法律行业的智能体的法行宝,上线半年多以来,已累计免费服务940万人。 为了真正做到让人人都能开发智能体,大会上,李彦宏还带来了One More Thing时刻——对外展示了大模型技术落地的无代码产品秒哒,号称是一个不需要写代码就能够实现任意想法的软件,被李彦宏称之为“迄今为止人类历史上最复杂的多智能体协作工具”。 智能体完成大模型从“言”到“行”能力突破的背后,离不开其基础大模型能力的迭代进步。 具体到百度自身,早在2019年,百度就推出了1亿参数规模的文心大模型1.0版本,随后又在2.0版本升级至10亿参数,ChatGPT发布后不久,百度就抢先推出了3.0版本,并在去年10月迭代到4.0版本。 近日,沙利文发布报告《2024年全球AI生态全景概览》,在全球AI生态全景中,百度与谷歌、OpenAI位于AI-Native Giant同一象限。
在被问及百度为何能以如此快的速度发布大模型时,李彦宏曾回答道,“是因为我们准备得更加充足、工程师非常努力,我们一直在朝着这个方向努力。长期的信念,让我们为这样的颠覆性创新做好了准备。” 能够持续推动技术迭代的另一助力,则来自百度多年来对全球AI人才的招揽,包括吴恩达、Dario Amodei、Jim Fan等一批行业大牛。
作为前百度首席科学家,吴恩达在百度期间带领百度人工智能团队增长至1300多人,帮助百度培养出大量AI人才。
但技术迭代和顶尖人才招募背后都需要真金白银打底,这都迫使身处大模型领域的厂商,必须尽快走向商业化。 那些实力不济的大模型玩家,在这场烧钱游戏中,或者被淘汰出局,或者被大厂收编。波形智能卖身OPPO的案例,成了这一残酷竞争的最新注脚。更早之前,明星创企Inflection、Character.AI、AI Agent独角兽企业Adept,纷纷迎来被大公司变相收购的命运。 商业化手段有限,叠加大模型训练和推理费用高昂,入不敷出的国内部分头部大模型玩家,此前甚至被传出退出预训练的消息。即便不想放弃预训练,一些大模型玩家也开始转变策略,开始放弃在国内烧钱做To C市场的策略,转向全力发展更容易见到回头钱的ToB领域。 竞争激烈的大模型赛道,或主动或被动地演变为一场超头部创企和大厂之间的比拼。尤为不容忽视的是,当其他玩家对预训练有所畏惧之时,手握资源的超头部创企和大厂,反而获得了意料之外的优势。 在近期接受一档播客节目采访时,OpenAI CEO山姆·奥特曼就提道,模型已经成为一项贬值资产是不争的事实,“但说它们不值得花那么多钱来训练,这似乎完全错了。更不用说它们有一个正向复利效应。随着你越来越擅长训练模型,你会变得更高效。至于通过模型获得的收入,我认为这足以证明投资是值得的。” 李彦宏此前也表露过类似的观点。在他看来,模型之间的差距是多维度的,既包括能力方面,也包括成本方面,且“未来大模型之间的差距会越来越大,领先对手6个月就赢了。” 随着大模型逐渐进入巨头游戏阶段,红杉资本在《Generative AI's Act o1: The Agentic Reasoning Era Begins》(生成式AI的o1行动:代理推理时代的开启)报告中指出,生成式人工智能产业的根基正在稳定下来。只有自造血能力充足,且资本雄厚的大玩家才能留在牌桌上。尽管市场竞争还远没结束(按博弈论来讲,甚至将越来越激烈),玩家格局却越来越清晰起来。 基于此,红杉资本预测,应用层正成为风险投资的关注焦点。类比移动互联网转型和云计算转型期间,应用层大约都有20家公司创造了超过10亿美元的收入,“我们预计AI转型期也会出现同样的情况。” 早于红杉资本预言前,当2023年3月16日,百度终于赶在所有国内厂商前面,率先发布文心一言时,李彦宏就对外首度明确,“大模型时代,真正最大的机会既不在基础服务,也不在行业服务,我觉得恰恰是在应用。” 从去年3月16日文心一言正式亮相至今,过去近600天时间内,李彦宏带领百度成为推动AI应用落地的最强有力声音,“卷模型不如卷应用”“卷应用更有价值”等言论被频频提及。 从商业化变现的角度出发,卷应用,也是更能发挥中国创业者优势的领域。这样的实践经验,已经在PC时代和移动互联网时代屡次被证实。 考验和挑战再一次摆到了基础大模型厂商面前——谁能在应用生态建设上更胜一筹,谁就有望成为下一个Android。 在应用生态建设上,没有移动互联网超级应用傍身的OpenAI,在今年1月上线GPT store后,很快便遭遇热度难以为继的困境。 掌握搜索这一生成式AI最重要入口的百度,则在智能体的分发和运营上占据了一定优势。 据字母榜(ID:wujicaijing)了解,百度搜索目前是智能体最大的分发入口,目前每天分发智能体数量超过1000万,并且还在快速增长。 借助百度APP近7亿月活用户所带来的规模效应,百度在帮助普通人开发出智能体之外,还构筑起了一个覆盖“开发+分发+运营+变现”的商业闭环。 为了做好智能体应用的分发,百度还打通了智能体在百度搜索、小度、文小言、地图、车机等多场景、多设备的流转落地,从而在做到人人可开发的基础上,更进一步实现人人能分发、人人可获益的新目标。 值得一提的是,手握智能云云服务的百度,比OpenAI这类单纯的大模型公司,还可以提供更多维度的服务。目前,百度智能云千帆大模型平台帮助客户精调模型数达到3.3万个,并合计开发了77万个企业应用,有六成以上的央国企和大量的民营企业,都在联合百度智能云进行AI创新。 大会期间,百度还展示了大模型在B端的应用。 以保险行业为例,目前百度智能云基于工作流Agent探索、落地车险续保售前数字员工。过去,车险续保的工作指导包含大量流程、子流程、文档等内容,优秀销售人员稀缺,且培养周期往往长达一到两年。 基于工作流Agent开发金牌销售数字员工,则最快可以在1小时内完成、上线,大幅提升了企业车险业务的核心生产力。这样的工作流Agent可以快速集成到百度搜索、微信公众号、企业官网等业务系统中,便利触达用户。 在刚刚结束的金九银十招聘季,智联招聘便联手百度,利用后者的大模型重构了人岗匹配这个核心环节,从而显著提高用人单位的招聘效率和质量。 目前,百度和智联招聘合作,已经成功沉淀出一系列提示词模板,并在数万条实际数据中得到验证,场景平均准确率高达93%。 同样不容忽视的是,AI业务还能间接拉动云厂商的营收。B端客户在使用大模型的同时,会积累大量的业务数据,并产生大量资源需求,这都有利于推动智能云(GPU)相关产品的销售。 多样化的分发场景,和更多用户的使用,除了提升云服务收入之外,更能起到帮助智能体获得数据反馈,反过来进一步推动基础模型自主调优,从而让大模型变得更智能,并使得智能体越用越聪明的效果。 一如通过RAG消除大模型幻觉,刺激更多用户使用一样,只有更聪明的智能体,才能吸引到更多的人真正使用起来。当用的人逐渐变多,李彦宏口中“智能体即将迎来爆发点”的判断,才有望越早到来。