OpenAI可能要造手机了,而且可能是专为ChatGPT设计的AI手机。
最近,据The Information报道,OpenAI CEO Sam Altman一直在与iPhone著名设计师Jony Ive联系,讨论开发一种新的AI硬件设备。
软银CEO孙正义也对此兴趣盎然,并“与两人交谈过这一想法”。
三方合作虽然尚无定论,但以孙正义一向标榜的ChatGPT“重度用户”身份来看,这事儿有戏。
一面是AI公司准备挺进硬件领域;另一面,手机厂商也在加紧拥抱AI大模型。
美东时间10月4日,谷歌发布了搭载谷歌AI基础模型、“以人工智能为中心”的Google Pixel 8系列手机——考虑到谷歌当初发布的安卓系统,曾一举带动功能手机跨跃性进入智能手机时代,谷歌此番入场,可能拉开了AI手机的序幕。
国内手机厂商,也纷至沓来。
10月11日,OPPO宣布,基于其自主训练的安第斯大模型(AndesGPT)打造的新小布助手1.0 Beta 版尝鲜体验正式开启,升级后的小布助手将具备 AI 大模型能力。
这是继小米宣布内置AI大模型的小爱内测之后,又一启动内置AI大模型手机智能助手实测的手机厂商。
步子迈得更大的是华为,从宣布手机系统接入盘古大模型,到开启内置大模型的语音助手小艺的众测、发布内置AI大模型的新机华为Mate60系列,一个多月就一气呵成。
vivo虽然在大模型落地应用上没有实际进展,但其自研的70亿参数大模型vivo_Agent_LM_7B,已在8月份现身C-Eval 等榜单;且官方也在9月的博鳌亚洲论坛国际科技与创新论坛上,预告了自研大模型发布的消息。
荣耀更为火急火燎,7月初早早发布了号称“全球首款原生集成AI大模型的国产手机”Magic V2,赚足噱头;但其自研大模型的进展却没露半点风声,反而表态“在网络大模型方面跟互联网公司进行合作” 。
……
国内外手机巨头大干快干AI大模型的急切心情 ,是显而易见的。这主要是因为,手机市场创新乏力,实在卷不动了;而“把大模型装进手机”,很可能实现手机功能和体验的革命性突破,有望引发新一轮换机潮。
一
AI手机有望治愈市场内卷?
为何国内手机厂商,都对AI大模型趋之若鹜?
最直接的价值,当属手机性能和体验的提升。
当AI大模型融入手机系统,一方面能增强手机处理图像、语音、自然语言处理等任务的能力,显著增强手机性能;另一方面能更灵活响应用户需求,提升用户体验,且随着AI算法的进化,加载在端侧的大模型对用户了解的加深,手机可以预测用户的行为并提前进行优化,变得更聪明智能,从“千人一机”变成“千人千机”。
部署在手机本地的AI大模型,不仅可以实现AI对各类APP的优化赋能,甚至可以作为通用接口,打破壁垒,让APP能力实现自由组合,进而提升用户体验和产品竞争力。
国内外分别率先落地AI大模型的华为 Mate60系列机型及Google Pixel 8系列手机,就是例证。
华为手机很早就将AI能力应用于增强手机图像处理方面,这次AI大模型内置到系统后,体验改善最明显的是其手机语音助手小艺。
与OpenAI的ChatGPT、谷歌Bard这些生成式AI聊天机器人有所不同,华为的小艺在HarmonyOS操作系统底层进行了重构。
即前两者只是加载在手机上的AI应用,小艺则是将大模型作为智慧系统的大脑,借助大模型的高阶能力,对系统能力进行全面增强。
而有盘古大模型做底层支持的小艺,不仅自然语言理解能力实现跨越式迭代,还能利用生成式AI多为用户做很多事情,比如资讯摘要、写文章、回复邮件、撰写备忘录、图片二创等。
不止满足生活需求,甚至还能辅助工作。比如邀约合作伙伴开会,直接跟小艺口述会议的时间、邀请人员以及讨论内容,小艺就能写出一封会议邀请邮件。
更值得一提的是,小艺确实做到了打破APP之间的壁垒,应对更复杂的用户需求场景。
比如针对一张海报图片,询问小艺相关的地址信息并要求导航到目标地点,小艺就可以准确识别海报中的地址信息并打开导航App进行导航。
又如,想找一家牛排餐厅,小艺可以准确理解意图,并直接调用美团服务找到相关餐厅。
而Google Pixel 8系列手机对图像处理能力的增强,也令人惊艳。
通过生成式AI,Google Photos 中的Magic Editor(魔法编辑器) 可以利用已经拍摄的照片,手动从其他照片中选择另一个表情,生成一张新的照片,且可以保证“每个人都睁着眼睛”。
此外,这一功能还能抹去照片中不必要的背景和杂物,让空有高配手机却拍不出合格照片的“手残党”,也能成为出片大师。
AI大模型对手机功能体验的改善是显而易见,并能切中用户需求的,或将刺激大批打算尝鲜的用户换机,打破手机行业创新乏力的同质化内卷困境。
根据市场研究机构Canalys发布的最新报告,截至2023年第二季度,中国智能手机市场出货量约为6430万台,较去年同期下降5%;全球智能手机市场同样动力不足,今年二季度出货量同比下降10%。
而在下滑的大盘中,高端市场则相对走俏。Canalys分析师Amber Liu指出,“消费者越来越愿意为高品质产品买单。自去年以来,中国智能手机市场的平均价格已超过450美元,预计未来几个季度将继续攀升。”
如果AI手机可以大幅提升体验,国内外手机市场再次被激活或成为可能。
华泰证券在其题为《AI会推动新一轮换机潮吗?》的专题研究中指出,随着AI大模型时代到来,AI有望成为驱动下一轮换机潮的重要因素,预计2023 下半年首批“AI 手机”将陆续面世,目前AI 手机主要应用 NLP(自然语言处理)和 CV(计算机视觉)技术,预计 2024-2025 年将有更多创新 AI 应用在手机落地。
在2023年第二季度业绩会上,联发科也表达了类似观点,认为“AI 落地手机将加速换机周期”。
二
“抢滩”大模型,厂商进展不一
其实,手机行业争相抢滩AI大模型,并非仅仅是跟风热点,头部厂商布局AI已有时日,且在步步递进,早期更多是从功能改善层面出发,如今逐渐深入到系统层面。
虽然直到今年8月份发布鸿蒙4系统时,华为才宣布将大模型接入手机系统,但盘古大模型早在2020年9月就已经启动研发,至今已经迭代至3.0版本并已商用。
同样较早布局AI大模型的还有OPPO。
自2020年起,OPPO小布助手团队就开始探索和应用大语言模型。
早在其大模型AndesGPT项目开展以前,OPPO就已经展开了大量的AI投入,对预训练语言模型进行开发和探索,自主研发了曾在中文语言理解测评基准CLUE1.1总榜中排名第五、大规模知识图谱问答KgCLUE1.0,以及排行榜排名第一的大模型OBERT。
vivo发力AI大模型的时间虽尚不可考,但从其2018年成立AI全球研究院,今年8月份在权威测评网站提交了70亿参数大模型vivo_Agent_LM_7B看,投入相关领域研发时间不会短。
小米下场也不晚,早在2016年7月就已经布局AI,到了今年4月,又顺势正式组建了AI实验室大模型团队。
正如小米技术委员会 AI 实验室大模型团队负责人栾剑所说,“手机和 AI 的结合其实很早就有了,比如在拍照中对照片的调整——快速对焦,超分辨率等。现在把大模型加入手机,是一个升级,它提高的是自然语言的交互,包括文字处理的能力、多模态的处理能力等。”
国内手机厂商之所以急着在近三四个月将自身的AI大模型推到台前,甚至整合应用到手机,或是想先发制人,抓住AI手机可能带来的换机潮的窗口期。
根据前述内容,除了自研大模型进展一直没消息的荣耀,国内大部分手机巨头,基本都选择了自研AI大模型,但因为各自条件限制和启动时间有先有后,落地进展不尽相同。
自建一套生态的华为,目前算是第一家将手机AI大模型落地新机的国内手机厂商。
其次要属OPPO和小米。二者虽然未正式发布内置AI大模型的新机型,但已经将旗下内置AI大模型的新手机助手分别启动公测和内测,迈出将AI大模型和手机系统融合的步伐。
OPPO整体考虑更周全,提前做好和上游厂商的磨合。在自主训练AndesGPT大语言模型的同时,OPPO也和联发科合作,希望借用其4位量化技术,实现精度不掉点效果下端侧性能更优,尽快推动AndesGPT在端侧轻量化落地。
vivio虽然自研大模型已上权威排行榜,但至今未见具体落地行为。
网传vivio在今年10月左右会推出内置AI大模型的新OriginOS 4.0系统,如果届时一并推出内置AI大模型新系统的新机,vivo有望成为继华为之后,国内第二个将AI大模型落地新机的手机厂商。
与华为软、硬件自成一体不同,其他手机厂商在自研大模型的同时,未来还是免不了和上游硬件厂商合作,借助其芯片及轻量化技术,更好推进自研AI大模型在手机端的落地,变量更多。
从某种程度而言,谁能更快和硬件厂商磨合好,将自研的大模型加速轻量化落地,谁就能更快抢得先机。
三
自研大模型:终将走向端云一体化?
另一个问题来了:目前市场“百模大战”火热,手机厂商为什么不采取拿来主义,直接调用成熟云端大模型的开源接口,非要亲自下场自研端侧大模型?
原因可用两个关键词概括:带不好、带不动。
一方面,像ChatGPT这类部署在云端的大模型的具体应用,一直以来都伴随着强烈的隐私安全争议。
而本地化部署的手机AI大模型,数据不会离开端侧,在用户数据的隐私和安全性方面更有保障。
因为参数量较为轻量化,手机大模型的加载运行速度也会更快,不受网络环境限制。
此外,布局在手机端的轻量化大模型训练周期短,能根据用户需求进行快速的迭代更新,在响应用户需求方面更灵活。
华泰证券也在前述研报中断言,不同于训练环节的高计算性能要求,推理环节主要根据用户需求,利用训练好的模型进行推理预测,对峰值计算性能要求较低,更注重单位能耗算力、时延、成本等综合指标。
由于云端算力与终端设备间需通过网络信道传输,仅将推理算力分布于云端,受限于网络带宽和传输距离,将无法满足部分场景低时延、高可靠性等要求。
另一方面,对云端大模型来说,随着接入的需求增多及使用频率的增加,云端算力、网络带宽、存储及硬件等资源的消耗负担越重。
手机厂商如果把手机性能革命的驱动力中枢搭载在这些“笨重”的云端大模型上,手机性能体验很容易不稳定,乃至被拖入泥潭。
对于自研端侧大模型的问题,小米技术委员会 AI 实验室大模型团队负责人栾剑在接受腾讯科技采访时的回答,让我们从手机厂商视角看清了它们的考量。
关于自研,栾剑认为,在各种设备终端上,使用的芯片不尽相同,它们在内存大小、算力强弱、平台支持的算子集上都会有差别。这就要求模型必须能根据硬件条件做出动态调整以达到最佳性能。
而一个开源模型,结构上就是固定的,无法再调整,使用起来非常受限。如果希望具备定制模型结构和从头开始训练的能力,就必须自研。
这也解释了,为什么手机厂商一方面要自研大模型,另一方面又得加强和硬件厂商的磨合。
栾剑同时指出,端侧大模型能更好保护用户隐私,同时让用户可以用更低成本去获取更多的功能,但这绝不意味着用手机端就能解决所有问题。
虽然高通、联发科等硬件厂商通过持续提升量化算法,可保证在轻量化落地端侧大模型的同时,带来手机能效和性能的提升;但无法否认,AI大模型再怎么压缩,参数体量摆在那儿,对手机硬件、性能的要求只会越来越高。
前述华泰证券研报也指出,AI 模型大量的计算,将对总线带宽提出更高要求;不断运行的推理任务将使得设备耗电加快,拉动电池容量以及相应的电源管理芯片升级需求。
随着大模型预测越来越准确,这些问题会愈发明显,或将带动上下游产业链的升级。
那么,除了不断优化量化等技术、提升手机配置,手机厂商还有哪些方案,能有效应对端侧大模型进化带来的更高要求?
对此,小米提出的“端云一体化”概念或许是现实选择,即未来AI手机一部分能力或功能,端侧模型可以解决的,就在端侧解决;端侧无法解决的,则调用云端能力。这样既能确保隐私安全性和对用户需求的精准理解和灵活响应,又能保证实现更复杂高阶的操作,优化用户体验。
高通也提出和小米类似的思路。
在技术白皮书《混合AI是AI的未来》中,高通指出,随着生成式AI以前所未有的速度发展以及计算需求的日益增长,AI处理必须分别在云端和终端进行,才能实现AI的规模化扩展并发挥其最大潜能。
而华为目前的解决方案,也是和前两者高度接近的。
据了解,针对消费者在不同设备不同场景下的需求,华为小艺背后的大模型拥有端侧和云侧等形态。在小艺与大模型的结合中,端侧大模型会先对用户请求和上下文信息做一层预处理,再将预处理后的需求发送到云侧,从而最大化地发挥“端侧模型快”和“云侧模型强”的优势。
AI大势已至,作为用户量最广、用户粘性最高的智能终端,手机,或许会成为AI大爆炸大普及的第一载体。