“AI一定是命运对美图的馈赠。”在厦门市美图大厦21层,美图创始人、董事长兼CEO吴欣鸿告诉《AI光年》。
这与业界对当下生成式AI市场的悲观态度截然相反。有数据统计显示,全球AI领域去年从英伟达采购了大概500亿美元规模的GPU,但是同时只产生了大概30亿美元的营收。
而吴欣鸿的乐观,来源于美图在垂直大模型应用上的进展。财报显示,2023年美图总收入27亿元,同比增长29.3%,净利润3.7亿元,同比增长233.2%。官方称,总收入与净利润增长主要得益于AI推动主营业务的收入增长。目前美图用户每天处理数亿份图片和视频,约83%都用到了泛AI功能。
这符合投资人朱啸虎和全球知名AI科学家贾扬清等业内人士的判断,朱啸虎认为大模型的商业机会在垂直应用市场;贾扬清也认为,一个通用的大模型的效果固然非常好,但是在企业实际应用当中,中小型模型加上自己的数据,可能反而能够达到一个更好的性价比。
“诞生Supper App的机会很少,目前我们看到AI应用中,有两大类应用,已经跨越死亡谷,开始有比较持续的流量:一个是提效,另外一个是娱乐。”贾扬清说。
在大模型商业化难的迷惑中,美图业绩的提升,也给了一些行业借鉴。
截至2023年12月31日,美图付费订阅用户数超911万人,创历史新高,同比增长62.3%。同时,该业务全年收入13.3亿元,同比增长52.8%。
“AI这波的时代红利美图无论如何都要抓住。”吴欣鸿说,“我以感恩的心态面对这样巨大的时代红利,但我也担心这样的机会从手上溜走。现在危机感其实比过去加剧了,整个生成式AI发展太快了,过去的一年里,以周为单位,生成式AI有很多新的技术和产品,竞争一直在加剧。当然,对我们冲击最大的还是Sora这样的视频大模型。”
吴欣鸿回忆,美图曾经也有过一次这种来自时代的馈赠,美拍当年已经是中国排名第二的短视频社区,但没抓住后来短视频时代的巨大红利。
对43岁的吴欣鸿来说,抓住AI机会,一定是要全情投入的。3月26日凌晨2:17的美图微信工作群,吴欣鸿还在跟同事分享各种技术文章,《画漫画变零门槛?AI通过文字帮你画一本漫画》,十分钟后他分享了《2024年MidjourneyV6人人必学的命令》,三十分钟后吴欣鸿又分享了《用IPadapter FaceID生成一致性角色》。
“昨天晚上我三点多还没睡,早上八点多又起来了,整个人非常兴奋”,吴欣鸿告诉《AI光年》,“这个工作状态跟我2001年创业的时候有点像,那时候也是经常晚上兴奋的睡不着,研究各种各样的知识,然后早晨回家睡觉。”
那一时期,吴欣鸿在远离互联网中心的泉州古城创业。早晨回家,举目皆是青砖红瓦、飞檐翘角的骑楼古建筑,而晚上在互联网上,吴欣鸿看到的是另外一个技术变革带来的新世界。“我觉得很奇妙,好像在两个世界中穿越一样,会有一种时空交错的感觉”,吴欣鸿说。
2023年6月,蔡文胜辞任美图董事长,吴欣鸿接任董事长,兼任CEO,成为董事会唯一的执行董事。蔡文胜与吴欣鸿,是一起创业的老搭档,蔡文胜懂资本运作;吴欣鸿擅长产品开发。曾经“工具自卑”的美图,在吴欣鸿掌舵后,现在回归到工具本身,以AI重构全线产品。
以下是腾讯新闻《AI光年》与吴欣鸿对话实录整理:
“五虎最好的归宿是抱大厂大腿”
《AI光年》:2024年,美图的关键词是什么?
吴欣鸿:2024年刚过去一个季度,今年我觉得关键词有可能是“速度”,Sora的发布实际上压缩了整个模型层的时间窗口,原本它没出来的时候,大家还是慢悠悠的,现在它出来了,留给大家时间不多了,所有行业都在加速。
《AI光年》:去年ChatGPT出来之后,你说“战战兢兢,如履薄冰”,现在一年过去了,美图的财报也很好看,你的危机感有没有缓解?
吴欣鸿:危机感其实比过去加剧了,整个生成式AI发展太快了,过去的一年里,以周为单位,生成式AI有很多新的技术和产品,竞争一直在加剧。
《AI光年》:竞争来自互联网大厂和大模型创业“五虎”吗?
吴欣鸿:大模型创业五虎,所有的互联网大厂、手机巨头,都有自己的大模型和AI助手,有一些已经亮相,有些还在准备。
大模型的AI新秀们,融资也都比较多,这意味着一级市场和巨头们对大模型的投资差不多到一个阶段了,往后想要大的融资,可能比较难了。
《AI光年》:一级市场有一个观点,认为大模型创业五虎最后好的归宿是抱互联网大厂的大腿,就像OpenAI与微软,你怎么看?
吴欣鸿:的确是。比如最近“月之暗面”公布的最新一轮融资,超10亿美元,阿里出了8亿美元。
《AI光年》:去年一年大家都卷大模型,现在大模型的格局初定,卷应用层你觉得从什么时候开始?
吴欣鸿:总的来说,过去一年国内对通用大模型关注的比较多,但对应用层的关注相对少。但国内应用层的卷,我觉得从去年就开始了,这实际上是有一个先后顺序的,要等到国内大模型厂商提供API或者SDK,应用开发者才能往前推进。
《AI光年》:美图在应用层和大模型领域的战略定位是什么样的?
吴欣鸿:美图过去16年一直在应用层做影像工具,但它也要应用计算机视觉的算法,所以我们自然而然就接触了AI,也无缝衔接了生成式AI这一波。美图为什么要投入大模型?主要是我们用别人的模型有些受限,比如别人已经训练好的图像大模型,我们只能去调用它,但它的效果可能只是六七十分,但我们要求是八十分,怎么办?必须自己下场,才能对效果有所把控。
美图同时在大模型和应用层投入,但我们做的是图像和视频大模型,相对垂直。
美图跟互联网巨头、AI新贵还是有一些差异化,他们都在做LLM模型,图像和视频只是他们未来多模态能力的一环。另外我们现在能看到,大模型公司也在尝试做应用,如果不下场做应用,没有办法构建数据闭环,很难快速提升模型能力。
《AI光年》:你的压力是不是也源于此——图像和视频只是大模型未来多模态能力的一环?
吴欣鸿:不是,美图在纵深上有自己的优势。压力大是因为生成式AI有了确定性趋势,大家都下场,竞争更激烈了。
《AI光年》:你怎么看去年妙鸭的昙花一现?
吴欣鸿:大模型的竞争是一个系统能力的竞争,不是单点的。应用层大部分是靠订阅和单购来变现的,比如说订阅成为美图的VIP会员,我们的产品可以提供几十项能力,但价格是一样的。就单点来说,我们的AI写真效果也很好,但营销做的还不够好。
“Sora给视频大模型明确了技术路线”
《AI光年》:Sora刚出来的时候业界都觉得很惊艳,当时内部有没有一些讨论,有没有一些结论?
吴欣鸿:其实Sora发布,我们的感受是心理冲击很大。原本我们觉得两三年后才能出来的效果,居然被Open AI这么早就实现了,当然它也给很多视频大模型的团队明确了一个技术路线。
《AI光年》:视频大模型的技术路线是什么?
吴欣鸿:Open AI下面有三个模型,一个是以ChatGPT为代表的文本的大模型或者语言大模型,第二是以DALL-E为代表的图像大模型,第三是SORA为代表的视频大模型。
就视频大模型而言,其实有很多团队在做,大家的技术路径差不多,我们也一样,但Sora出来以后,大家发现它的技术路径比较独特,几乎所有做视频大模型的公司,也包括我们,都紧急调整了底层架构,而调整后的视频大模型效果确实挺惊艳的。
《AI光年》:Sora会对我们的冲击比较大?
吴欣鸿:是,图像和视频是我们强相关的,对我们冲击最大的还是Sora这样的视频大模型,视频向下覆盖图像,本质上,视频是由一祯一祯的图像构成,理论上,视频是当前内容的主流形态,在行业应用上也比较广泛,影视、动漫、广告、电商都有广泛的视频需求。
《AI光年》:你觉得中美目前AI发展水平的差距有多大?
吴欣鸿:差距比较大的,其实还是算力。应用层的差距可能很小,中国的工程师红利,有可能帮助中国企业在应用层上获得较强的竞争优势。
《AI光年》:之前王小川之前也讲了“理想上慢一步,应用上快三步”,你怎么看?
吴欣鸿:客观的说,中国在一些新的应用领域的探索并不多,要说快三步也不一定,但中国有工程师红利,跟进的确快。就像前两天那个音乐生成的热点,也是国外的,它火了以后,估计很多国内公司都在快速跟进。
《AI光年》:相对于目前市面上比较热门的几家大模型公司,你觉得美图大模型的优势和劣势是什么?
吴欣鸿:2023年6月,美图推出视觉大模型MiracleVision,是目前通过《生成式人工智能服务管理暂行办法》备案中的唯一的视觉大模型。美图的优势就是说比较垂直,在图像和视频领域去死磕,而且已经有增长飞轮在不断的创造利润,通过利润反哺模型研发,这是一个优势,因为很多大模型创业公司还在烧钱阶段;优势之二是我们有很多用户的丰富案例和正负反馈,从而能构建一个案例库,有解决方案闭环。
至于劣势,我们在语言大模型上的能力建设,这一块没有什么积累,所以我们投资了一家叫weitu AI的公司;还有一个潜在的劣势,就是未来要去卷算力的时候,有可能卷不过巨头。
“AGI到来尚需时日”
《AI光年》:AGI是否已经到来或者即将到来?周鸿祎认为Sora的诞生意味着AGI可能从10年缩短至一两年。你怎么看?
吴欣鸿:我倒不这么看,之所以Sora这种视频大模型会让你感觉到视觉上的震撼,是因为它是以我们最熟悉的内容形态来呈现的,但实际上它里面有AGI吗?或者说它所说的世界模型是真正的了解物理定律吗?好像也不是。只是因为有这种很直观的视频画面,大家就很容易代入。
《AI光年》:如果AGI短期不能到来,你觉得阻碍的因素是什么?为什么?
吴欣鸿:首先这个世界上没有那么多的算力,到通用人工智能,意味着很多人都能享受AGI带来的质的提升,但现在全球算力都比较紧张,英伟达每年的产能也是有限的。首先要达到AGI就需要有巨量算力,比如山姆·奥特曼说要7万亿美元的融资计划,当然这个有点夸张,但也说明实现AGI就要巨大的算力的投入,现在看还早。
ChatGPT也好,Sora也好,都是让你感受一些未来的样子,但距离它真正融入我们的生活和各行各业,为人们带来大幅的质量或效率的提升,其实还有一段时间。
《AI光年》:未来怎么样,美图会不会让很多设计师下岗?
吴欣鸿:不会,今年2月份,我们还收购了设计师社区站酷,它成立于2006年,是一个聚集了大量设计师、摄影师和艺术院校师生的社区,注册用户超1700万。我们收购站酷,很希望帮助设计师变现,也希望设计师能掌握新的技术、新的工具,更专注于创意或者视觉的呈现。
《AI光年》:您觉得AGI会替代那些行业?
吴欣鸿:对于“替代”一说,我持保留态度,因为动不动就替代这个那个的,我觉得人都是在变化中去学习成长的,核心在于能否善用新的工具。
《AI光年》:近期英伟达 CEO 黄仁勋认为,随着人工智能的发展,未来编程不再是一个可行的职业。他认为,下个黄金赛道是生物学。你怎么看?
吴欣鸿:他这个观点的核心是AI应用来解决科技创新上碰到的问题,让很多科技创新加速,除了生物医药,我们觉得还有很多领域,都是用好AI就能大幅提升效率,比如工业、服务业,我们觉得AI都能够提供巨大的助力。
《AI光年》:你如何看待行业或者周期的不确定性带来的压力?
吴欣鸿:2008年创立美图的时候,完全是无心插柳,凭自己对摄影的热爱和修图软件的了解,赶上了移动互联网的萌芽期和爆发期,那时候,做个60分的应用就很受欢迎,过得轻松惬意,但美图上市后,我们犯了一些错误,多元化和冒进等等。经历一些挫折后,我们对自己当下和未来要做的事情是非常清晰的,这种改变,恰恰是竞争带来的,因此,我不太害怕竞争,在竞争中我们可以快速成长。
《AI光年》:跟年岁渐长有关系吗?
吴欣鸿:有,经历了就懂得珍惜,因为真的失败过。
《AI光年》:你比较欣赏谁?从他身上学到的什么?
吴欣鸿:科技领域的话,我比较欣赏乔布斯,乔布斯也是有一点艺术背景,他在年轻的时候学了字体设计,另外他对产品有着近乎偏执的追求,只有这样的特质才能做出跨时代的产品。
(转载自:深网腾讯新闻)