“MaaS最底层的含义是要把模型作为重要的生产元素,围绕模型的生命周期设计产品和技术,从模型的开发入手,包括数据处理、特征工程、模型的训练和调优、模型的服务等,提供各种各样的产品和技术。”
阿里云“通义千问”大模型研发负责人周靖人。
MaaS是“Model as a Service”的缩写,即“模型即服务”,指以模型为核心提供服务。2022年11月,任阿里云“通义千问”大模型研发负责人的周靖人在云栖大会上最早提出这个词。此后,在国内伴随着ChatGPT热潮出现的“百模大战”中,这种商业模式广被提及,亚马逊云科技、字节跳动都选择了这条发展路径。
MaaS即“模型即服务”,指以模型为核心提供服务。
在这一场AI大模型热潮中,阿里云非常明显是以云计算服务商的自我认知参与其中。“阿里云的平台非常欢迎第三方模型。”近日,阿里云CTO周靖人在接受澎湃科技(www.thepaper.cn)采访时表示。
在阿里云发起的AI模型社区魔搭中,集聚了180多万AI开发者和900多个AI模型。模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、粤港澳大湾区数字经济研究院(IDEA研究院)、澜舟科技、清华大学人工智能研究院、深势科技、浙江大学、智谱AI等。
7月25日晚,阿里云又在其微信公众号上发布声明称,阿里云成为国内首家支持Meta公司的Llama 2全系列训练和部署方案的公司。Llama 2是Meta最新开源的类ChatGPT大语言模型,包括70亿、130亿及700亿参数版本。
“有算力、无模型,不够。有模型,无生态,也不够。发展大模型,算力、模型、生态,缺一不可。”周靖人说。
“让模型的使用更简洁”
“大模型浪潮还处在早期阶段,人人都能感受到技术变革的来临,但对于如何降低大模型的研发门槛、如何实现大模型的落地应用,大家都还没有答案。”周靖人认为,动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现。“大模型的研发,是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI和云计算的全栈技术能力。大模型的应用落地更是需要丰厚的生态土壤。”
实际上,多位知情人士对澎湃科技表示,在2021年,任达摩院副院长的周靖人就在内部提及MaaS的概念。
周靖人对澎湃科技解释道,MaaS最底层的含义是要把模型作为重要的生产元素,围绕模型的生命周期设计产品和技术,从模型的开发入手,包括数据处理、特征工程、模型的训练和调优、模型的服务等,提供各种各样的产品和技术。
更简单来说,MaaS最核心的就是让模型的使用更简洁,简单几行代码就可以调用模型。
这就涉及AI模型落地应用的现状,即一个AI模型难以覆盖各行各业的AI应用需求,面对新场景往往需要进行二次开发或优化,否则许多模型难以适配到特定环境应用中。而AI模型定制化门槛较高,同时目前缺乏AI模型开发和使用交流分享的平台。也就是说当开发者遇到相关问题后,无法找到对应的模型服务,也比较难找到人来解答相关问题。
周靖人曾在采访中表示,“最终的目标是,甚至小学生也可以调用模型,能做业务系统的开发。”
“大模型自由市场”
要实现这个目标,就要做一个“大模型自由市场”。
在魔搭(ModelScope)平台上,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。从这个意义上说,魔搭社区是个充分开放的大模型自由市场。
魔搭是阿里达摩院与中国计算机学会(CCF)开源发展委员会在2022年联合推出的国内首个AI模型开源社区,把300多个模型开放给中国的AI研究者与团队,涵盖了自然语言处理,视觉、语音、多模态等模型。阿里巴巴在大型语言模型领域的研究主要由达摩院负责,由周靖人主导。
“一个模型的应用,不仅是接入模型,还会涉及到模型的微调、模型的一系列测试等。”7月,周靖人在2023世界人工智能大会上推出新的模型工具ModelScopeGPT(魔搭GPT),目的是有效帮助使用者在海量模型里面找到最合适的模型,“复杂的系统需要多个模型完成联合的任务,今天可以通过这样的一个流程自动化把各种模型融合在一起。”
魔搭GPT(ModelScopeGPT)是一款大模型调用工具,经常被称为agent(智能代理),它能接收用户以自然语言发出的指令,通过“中枢模型”通义千问调用魔搭社区其他的AI模型,大小模型协同完成人类布置的复杂任务。
比如,用户在魔搭GPT的对话框输入任务:“用20字描述一款新的VR(虚拟现实)眼镜,并用女声朗读,随后转成视频。”魔搭GPT会展示整个任务规划过程,先由中枢模型生成一段描述VR眼镜的文案,接着调用语音生成模型,生成语音并用女声念出,最后调用视频生成模型,输出最终的视频内容。过程中,魔搭GPT先后调用了一大二小3个模型。
目前从全球来看,MaaS的订阅制收费早已经开始。根据海通证券研报总结:OpenAI在2月1日正式官宣ChatGPT Plus试点订阅计划。此外,嵌入其他产品获得引流式收入也是模式之一,例如微软推出高级付费版Microsoft Teams Premium,订阅者可享用“智能回顾”功能,用以提供自动生成的会议记录、推荐任务和个性化标亮。其它收费模式包括不同模型对不同客户需求和客户定价,客户要求越高,模型越好,收费也将越高。
周靖人认为,大模型的研发不应该是一场少数机构的竞赛,而应该通过大小模型的协同进化走向更高级的应用,尤其是适应中国本土需求的应用。(澎湃新闻)