在把 “天才少年” 阶段贡献给搜狗之后,王小川找到了一个让他长期好奇的领域:
“2000 年,我研究生的毕业论文就是做基因测序的拼接算法,当时我就想知道,生命的数学原理是什么?”
在 2023 年成立的百川智能上,王小川统一了他对生命科学的长久关注与追求更强的 AI。
这让一年多前还在讲通用模型和应用的百川看起来 “变了” 也 “慢了”:同行频繁更新模型,而百川近 8 个月没有更新大版本;别人都强调通用和泛化,百川却转向医疗;流量竞争白热化,百川既不参与模型 API 价格战,也没跟进投流大战。
走到焦点之外后,社交媒体上出现不看好百川的声音。也有投资人说:“百川其实是最稳的大模型独角兽之一”——累计融资超 50 亿元,却没怎么烧钱。
1 月 25 日,百川发布新模型 Baichuan-M1-preview,这是百川的第一个全场景推理大模型。
当天下午我们访谈了王小川。一开始,他就分享了 M1 给一位脑梗病危患者提供诊断参考的案例。接下来的两个多小时里,我们也聊了他对生命科学的兴趣源头,他理解的 AGI 和医疗的关系,以及百川已经开始的医疗落地。
多数人认为做医疗是转向垂直领域,王小川的逻辑则是:
“医疗不是垂直场景,因为任何一个 AI 技术在医疗上都有用武之地,它不会被今天的 AI 淹没掉。”
“造医生等价于 AGI,医生是人类职业中最复杂的之一,它可以成为 AGI 的标尺。”
“以前是把物理变数学,现在是把语言变数学,未来是把生命变数学。”
“语言才是智能主轴,视频里没有智能。直接用视频和图像训练世界模型,这是走偏了。”
“生命不全是用物理来算的。物理世界很精确,但走向了熵增,生命看起来不精确,但走向了熵减。”
他预告了百川 25 年的落地计划:
百川的 AI 儿科医生会在北京儿童医院上岗。
2025 年第一季度,每个海淀居民会有一个自己的 “AI 医生助理”。
当更多同行与科技大公司在同一个战壕里厮杀时,百川选择了一条不一样的大模型创业路径。“在大厂射程之外”,王小川看到了什么?以下是他的阶段性回答。
“造医生就等于 AGI,医疗不是垂直场景” 晚点:这两个多月大模型行业特别热闹,大小公司都在狂发模型,百川在忙什么? 王小川:在忙我们的第一个全场景推理模型 Baichuan-M1-preview,今天(1 月 25 日)发布了,明天还会发一个开源的全模态模型 Omini-1.5。 晚点:M1 之前,百川有 8 个月没有更新大的模型版本了,为什么在竞争这么激烈的行业里,你们竟然慢下来? 王小川:我们在专注做医疗模型和产品。而且 25 年你会看到我们并不慢:3、4 月我们预计会再更新一个超级医生模型;第一季度,我们的 AI 医生会在北京儿童医院上岗;我们也在和海淀区合作 AI 医生助手,最快在一季度,每个海淀居民就可以用起来。 晚点:推理模型的主要变化是使用了强化学习。24 年 5 月,OpenAI 发布 o1 4 个月前,你说过百川在强化学习上跑得比较快,为什么百川不是最早一批做出推理模型的中国公司? 王小川:因为快不是我们的目标。我们既做通用,也做医疗增强,是双份的努力。我希望我们往下每一代更新时,都能突出医疗心智。 晚点:做了医疗增强的 M1,现在具体可以做到什么? 王小川:M1 的核心是复杂病症的推理诊断。正好分享个真实案例:前几天,内蒙古市人民医院有个脑梗患者被下了病危通知,家人不甘心,送到北京协和,同时也把病例传给了我们。M1 给出了三个诊断方向,完全命中了后来协和专家会诊提出的 4 个诊断方向。可以说,M1 已经远超市一级医院水准了。 这解锁了新的场景:M1 不只会看头疼脑热等简单病,去年升级后,它也可以做复杂病诊断了。 晚点:大家都在讲通用和泛化,百川却扎进了医疗这个具体场景,为什么这么选?什么时候明确转向的? 王小川:其实从第一天做百川时,我就想造医生。2016 年发生了两件事,一个是 AlphaGo 战胜李世乭,一个是魏则西事件。那时我就在医疗上做了很多思考,有两个结论。 第一是 AlphaGo 还不够,当机器真的掌握语言,强人工智能才到来。这个后来也得到了验证。 另一个是 “得医生者得天下”。医疗资源的核心瓶颈是医生供给不足,而非信息匹配,这不是互联网逻辑能解决的。所以在这时做挂号网、春雨医生、好大夫,只是帮患者找医生,搞不定供给。AI 赋能,才有可能提升医疗供给,尤其是基层医疗供给,让人人都有医生用。 接着到 21 年,把搜狗卖给腾讯后,我觉得自己可以下场了,在搜狗告别信里我就写了:往下 20 年,我想做生命科学、大众健康。22 年我创立了五季医疗,就在这个楼上,以后也会和大家见面。 然后是 23 年 AI 爆发,我创建了百川,因为我认为 AI 对医疗场景有大用处,我们就是带着场景下场的。 晚点:如果第一天就想造医生,为什么百川最开始成立时,你好像没特别强调医疗? 王小川:当时大家想的都是 OpenAI。当你和投资人、团队沟通时,如果太强调医疗,大家可能觉得这是 vertical(垂直领域)。 而且医疗爆发确实是在通用模型解锁之后,所以我们本来也要先做通用模型。而大家会逐渐看到,医疗并不是 vertical。 晚点:什么时候开始明确和团队、投资人说你们要聚焦医疗了?当时是怎么说的? 王小川:2024 年 7 月我们开了一个战略会,核心是讲清楚医疗的前景,它不是 vertical。 首先,最重要的一个认知是,医疗是大模型皇冠上的明珠。任何一个 AI 技术在医疗上都有用武之地:复杂诊断需要推理能力,需要减少幻觉;全病程管理需要长窗口记忆,未来甚至可以记录一个人一生的健康信息;理解医疗影像、听诊等需要多模态;询证、查论文需要 RAG(Retrieval-Augmented Generation,检索增强生成)等;甚至未来手术机器人——我们自己可能不去做——也需要具身智能。 这里有两种态度的差别:一是大家听得更多的 “沿途下蛋”,有一定能力就释放相应应用。但有些场景,可能模型到一定阶段,它就不是一个应用了。 而我们是 “水涨船高”,因为医疗的天花板足够高,它不会被超级模型淹没掉,模型能力越高,这个应用就变得更超级。所以医疗是大模型之上更大的东西,它不是 vertical。 第二句话是,造医生就等于 AGI。一些人觉得 AGI 已经无所不能了,那它就应该比医生厉害,但实际上现在还做不到。 晚点:按照朴素的逻辑,你好像要先成为一个人,再成为医生、律师等专家。而你的表述是,成为了医生,所以成为了人? 王小川:什么是成为人?这太宽泛了。大模型是造人的,而医生是人类职业中最复杂的之一,所以它可以成为一个标尺。 我甚至在内部给大家讲,自然数多还是偶数多?其实一样多,因为它们是双射的,任意一个自然数乘以 2 都是偶数。能造出医生时,就是达到了 AGI。 晚点:7 月和团队说时,大家有什么反馈?能理解到什么程度? 王小川:可能 50% 吧。毕竟有些工程师会想,那我能干嘛?而随着我们的专业医疗团队逐渐加入,大家开始相互配合了,这需要一个转变过程。 晚点:为什么是在那个时间点,那之前不久的 2024 年 5 月,你们刚发布了 “百小应”,它是一个豆包、Kimi 同类的通用聊天机器人应用。 王小川:不得不发了,而且在那个节点发一个东西也无伤大雅。 之后战略会,是我们意识到应该让团队更重视医疗,如果继续强调通用,我们就要同时做通用模型、通用应用和医疗增强。得让团队理解,公司对医疗是认真的。 晚点:更明确要造 AI 医生后,百川的组织和团队实际发生了什么变化? 王小川:现在每个团队都与医疗相关的人。我们也成立了医学产品部,有 30 多位医生,还收购了一家做医工结合的公司,有 40 多人。 晚点:AI 人才和医疗人才,这两种背景的人怎么协作、分工、融合? 王小川:一是做技术的人要会提医学问题;二是,医学背景的人会参与设计模型评测体系,他们要学习对数据的概念。现在已经磨合得比较好了。 晚点:从刚成立时你觉得不应该太强调医疗,到 24 年夏天你敢明确提医疗了,什么发生了变化? 王小川:第一是钱融到了,第二是团队也意识到,除了模型外,要有很好的场景,否则就是红海竞争。 晚点:那么后续融资呢?相比继续做通用模型和应用的公司,要造 AI 医生的百川接下来好融钱吗? 王小川:现在已经到产业落地阶段了,光讲模型也融不到钱了。 晚点:你觉得中国这批大模型创业公司里,谁会先倒下,谁会活得更久? 王小川:既需要持续融资,又没有找到自己应用和场景的公司接下来可能会有挑战,毕竟现在已经有不太需要融资的公司占住了 “只做技术” 的定位。 另外,应用和大厂在一个战壕里的公司也会有挑战。 “从把物理变数学,到把语言变数学,再到把生命变数学” 晚点:你怎么看一批中国公司能快速追赶推理模型?MiniMax 创始人闫俊杰告诉我们,一批中国公司做推理模型很快,原因之一是借助蒸馏;也有人指出,蒸馏无法解释 DeepSeek-R1 和 Kimi-K1.5 技术报告里的实验和训练过程。 王小川:蒸馏是公开的秘密,我倒并不特别排斥这件事。而且部分公司的推理模型并不完整,表象上对标 o1,实际能力还有差距。快,部分也是这个原因。 晚点:你认为怎样算是 “蒸馏” 呢? 王小川:训练模型要构造数据,现在也有很多公司尝试用其它模型生成的数据。 晚点:字节跳动前几天发布推理模型 Doubao-1.5-pro 时,强调 “不走捷径”,不使用任何其他模型的数据。 王小川:每个公司都有自己的属性和策略。字节作为巨头可能对原创性要求更高,但他们也得看论文吧。 晚点:DeepSeek 在全球爆火出圈,这带给你的更多是振奋还是焦虑? 王小川:挺振奋的,说两点。一是中美科技博弈会进入新阶段,DeepSeek 的开源也会改变行业格局,中国离实现 AGI 和应用爆发更近了。 二是 DeepSeek 的出圈让更多人体验到了 AI,教育了行业。年前和 R1 同时发布的百川 M1 虽然没有引起更多关注,但在鉴别诊断上的可用性超过了 R1 。原来我们还想,要怎么让卫健委和医生能理解今天 AI 的医疗推理能力已经很强了,现在这会更容易。往下只需要验证百川医学增强的通用模型能给出更权威性和准确的回答,AI 医生就会更快落地。 晚点:你们 2023 年发布的 Baichuan 和 Baichuan2 是开源的,之后的 Baichuan 3 和 4 是闭源模型,这次 M1 又开源了一个 14B(参数为 140 亿) 的版本。重新走向开源和 DeepSeek 近期的强势开源有关吗? 王小川:这是原定的计划。医疗行业不是单靠百川一家就能做完的,需要和医院深度合作。这次开源的 14B 版本针对医疗做了增强,在医疗评测上的得分反而超过 72B 的版本,而且用 4090 卡(英伟达的一款消费级 GPU)就能部署起来。 开源让医疗科研人员能很容易上手模型、做调优。也能帮我们和医疗行业建立透明和信任的关系。 晚点:你去年说过,中国大模型行业是 “理想慢一步,落地快三步”,指在前沿技术上,中国一段时间内还是会跟随美国的原创性创新,但中国公司有可能把应用落地做得更快、更好。今天的情况好像是 “理想只慢了半步”, 这超出你的预期了吗? 王小川:我觉得 DeepSeek 的做法确实超出了大家的预期,可能只比 OpenAI 慢半步,或者说很接近了。 落地快三步,这是没变的,医疗领域的落地,25 年就会是一个重要节点,医疗会是 AI 较早解锁的主要场景,而不是像一些人想的是更晚的场景。 晚点:你怎么看 DeepSeek 前期主要做开源模型 + 提供 API 的路线?它们 25 年 1 月才上线第一个 to C 应用。 王小川:DeepSeek 不是一个典型的创业公司。它没有融资的责任和风险,所以它既不考虑钱怎么来,也不需要先考虑商业模式,甚至卡都是现成的。这是从零起步的创业不可能复制的。 晚点:那么可复制或者说大家共性的部分是什么呢? 王小川:技术理想。今天,不管是好的创业公司、DeepSeek,还是字节这类大厂,都是在技术理想上往前推进。 晚点:百川的技术理想是什么? 王小川:相信技术突破,以及生命科学和 AI 的连接。 晚点:技术理想就是 AI 行业大家喜欢讲的信仰吗? 王小川:技术理想是信仰的一个子集,信什么都叫信仰。我相信科学方法,相信通过实验验证等方法能发现更多未知。但是之前的科学范式现在已经不够了——我把这叫从科学时代到智能时代。 智能时代的起点就是大语言模型。这之前,是把物理变数学,用数学解构物理世界;现在是把语言变数学,解构对象不再是物理世界本身,而是语言中包含的人对物理世界的投射;再往下,是把生命变数学。所以生命科学不会被今天的 AI 覆盖。 晚点:你对生命科学的长期信念来自什么? 你在搜狗时就投了不少医疗公司,如鹰瞳、春雨医生、博彧维康、小鹿中医等。 王小川:2000 年,我研究生的毕业论文就是做基因测序的拼接算法,当时我就想知道,生命的数学原理是什么。 晚点:听说你会背《黄帝内经》? 王小川:没有。我想的是,当数学物理不能解释生命现象,不是现象不对,而是理论不完善。我想寻求新的理论解释,所以花了一些功夫学中医,中医也是一种哲学。 晚点:你的高中同学,B 站 CEO 陈睿曾告诉我们,上高中时他比较感性,爱写诗;你比较理性,喜欢计算机,但他感觉现在反过来了。 王小川:他是我同桌,交叉换位了。但那也不叫 “感性”,其实是更理性。当科学不够用时,就会做哲学性思考。 我们从父母 DNA 结合的受精卵变成一个人,还长得像爸妈,这听着自然,但在数学上看不可思议。这是怎么算出来的?三体运动问题就已经算不了了,天气预报也很难找到规律。 但一个细胞,一个比天气预报还天气预报的东西,最后竟出现了规律,这不全是物理学来算的。物理世界很精确,但走向了熵增,生命看起来不精确,但走向了熵减。 (注:熵增指,一个封闭系统的熵(总混乱度)会随时间推移增加,直到达到热力学平衡态时的最大值;熵减则是系统的熵在特定条件下减小,即系统从无序转向有序,混乱度降低。) 晚点:生命确实挺神奇,主流观点认为整个宇宙是熵增的,但宇宙中诞生了生命。 王小川:其实我觉得宇宙走向熵增不成立,这是用物理定律推导的,推导前提是,宇宙是一个封闭的、跟外界没有物质能量交换的系统,这如何验证呢?不能用有限推无限。所以我说自己不是 “感性”,物理数学不够的人才会给出这种结果。 晚点:大语言模型,尤其是 2022 年底的 ChatGPT,如何改变了你对做怎么做医疗的想法? 王小川:总结起来三句话,一是强人工智能时代来了。 我对语言很敏感,在搜狗做输入法和搜索都涉及语言。输入法的字词关联,你可以认为它就是 predicting next token(预测下一个 token,大语言模型的训练目标);做搜索引擎时,也想从搜索变问答,我博士时就在思考问答系统。 所以 ChatGPT 一出来,我立刻知道变天了。那时在极客公园组织的讨论中,我是坚定的 AGI “到来派”。 第二句话是我 24 年提的:从科学时代走向智能时代。就是从数学解构物理世界,到数学解构人和生命。这个说完没多久,Hinton、Hassabis 就拿了诺贝尔物理、化学奖。AI 正在颠覆科学范式。 (注:Geoffery Hinton 为图灵奖得主,深度学习奠基人之一;Demis Hassabis 在 DeepMind 带领团队开发了预测蛋白质结构的 AlphaFold。) 第三句话还是 “得医生者得天下”。互联网是得用户者得天下,但我们做医疗后发现不对,没有医生,哪来用户?医生也是器械和药品的流动渠道,他有处方权,是整个行业的枢纽。上个 20 年,整个 VC 投了 1000 亿也没做起来互联网医疗,核心是因为只能围绕医生做周边:帮医生写论文,帮医院做信息化……这些模式都不成立。 所以找医生不如造医生。这也是一个大蓝海,每个人都需要医生朋友。 “中国一年就诊人次 84 亿,这里当然有超级应用” 晚点:你之前一直讲,通往 AGI 要超级模型 + 超级应用双轮驱动,就是同时做超大规模模型和应用。接下来百川在医疗领域想继续做超级模型,会比做通用模型的成本更低还是更高? 王小川:我觉得会更高,因为我们需要更多医疗数据;更远的壁垒还有持续的数据观察,做到 “入院即入组” 甚至 “出生即入组”,就是对病程乃至整个生命过程的每一个医疗干预做完整记录,这会产生海量数据,它们又会成为 AI for Science 的基础,推动生命科学发展。而以前很多临床数据是用完就扔掉了。 晚点:之前李开复告诉我们,只有大厂才烧得起超级大模型。 王小川:医疗大模型(的成本)高有高的价值,它关系生命健康,不能按 token 来算钱。 晚点:除了自己训练模型外,现在的一些开源模型能帮助你们做医疗吗? 王小川:一半一半。比如我们做的一个咳嗽模型——可以通过听咳嗽声音来判断是上呼吸道感染还是下呼吸道感染——市场上根本没有,那我们就得自己做。同时我们也要掌握预训练、后训练、强化学习和 RAG 的全部能力。 晚点:在超级应用方面,你之前对超级应用的定义是 “至少有 3000 万到 1 亿 DAU”,医疗场景也会有这么大的应用吗? 王小川:中国一年就诊人次是 84 亿,百度一天的健康搜索请求是 5000 多万人、4 亿多次。如果我们能做长期的慢病和健康管理,它当然是一个超级应用。 晚点:医疗超级应用可能是什么形态? 王小川:在 C 端,它大概率是一个医生朋友。我们不会畏惧它,而是能平等交流,它也知道你过去的健康史;需要看人类医生时,它也可以给你很多咨询。在 B 端,它现在会是医生的助手,帮助做诊断和全病程管理。 晚点:也有人认为,当模型足够强就会 “吃掉一切”。比如李想最近说:“To C 层面,OpenAI 等掌握最强基座模型的公司不会留下什么应用给大家创业。因为软件的本质是功能,需要场景化、垂直化,而人工智能的本质是能力,能力强就可以吃掉一切,对用户也是最方便的。” 你怎么看这个观点? 王小川:首先医疗行业需要很多特殊数据,通用模型里是没有的。爱因斯坦再聪明,也不能给你看病。 而且医疗和生命科学是下个时代的东西,在我们迈向生命科学的过程中,也会有新的 AI 技术和范式产生。 晚点:百川如何获得足够丰富和优质的医疗数据? 王小川:首先是和医院合作,还有一些医学杂志和数据库也有大量公开优质数据。 晚点:你们已经在合作的一些机构,比如北京儿童医院,他们的数据可以分享给你们吗? 王小川:我们联合建立了北京市重点实验室,数据会分享到实验室。 晚点:医疗模型和医疗应用之间有多大的协同?是否有服务的用户和医院越多、数据越多,然后反哺模型越强的数据飞轮? 王小川:最关键的数据还是来自顶尖医院,质比量更重要。多大程度上有数据飞轮,需要实践更久之后才好回答。 晚点:如果医 AI 医生的前景被大厂认可了,他们也来做怎么办?你之前多次说 “大模新创业要走出大厂射程”,医疗真的在大厂射程之外吗? 王小川:至少目前看,百度、腾讯仍在减少对医疗的投入,这不是大厂的最优先级。 晚点:蚂蚁前不久收购了好大夫在线,他们也说要共同聚焦医疗 AI 服务。 王小川:这个合作我觉得更偏战略驱动,发力点和创新点是支付环节和商业模式设计,而不是 AI 突破,也不是改变医生的供给。 “未来是 Hospital at Home,从造儿科医生开始” 晚点:听说做百川这两年多,你见过的政府领导比之前都多。 王小川:人数更多、级别也更高。 以前做搜索,想接触相关部门领导非常难,现在政府和医院很愿意和我们沟通。比较复杂的是,To B、To G 需要层层沟通。越是领导,对这件事理解越深、支持力度越大;而基层则涉及更多 KPI 考核,我们需要重新设计考核路径,帮助推动落地。并不是所有人第一时间都欢迎改变,但整体趋势是积极的。 晚点:你们去年 8 月宣布了第一个重要的医疗合作伙伴北京儿童医院,这也是因为先认识了他们的领导? 王小川:北京儿童医院的院长很有魄力,有些机构可能对造医生有抵触,而他提出要造 100 万儿科医生。 第二,中国真的很缺儿科医生,原来隔三差五往医院送,会造成医疗挤兑、交叉感染、家长陪护等很多负担,控制不好还可能成为流行病。 而未来会是 Hospital at Home,大量疾病居家处理,甚至能做全生命慢病管理,早预防、早诊断。这也符合国策——把医疗资源输送到基层。 第三,儿童的家长相对年轻,更容易拥抱新技术。因此儿科会成为 AI 医疗里最快产业化的一部分。 晚点:除了医院之外,你们最近还宣布了与北京市海淀卫健委和宁波高新区等地方政府部门的战略合作。这种级别的合作是怎么敲定的? 王小川:政府需求比较大的一是儿科,二是走向基层的全科。 比如深圳是我们的一个重点区域,上次医改中的医联体改革(2013 年起,中国推进的分级诊疗和加强基层医疗资源的改革),深圳就是最早的试点之一。深圳宝安区,从区委书记到区长,再到卫健局领导,我都去见过。 海淀区也会是一个重要试点,我们会和海淀整个医疗系统和病例系统打通。25 年一季度,海淀区每个居民就会得到一个 AI 医生助理。 晚点:你们和医院、政府的这些战略合作,落到具体产品上会是什么? 王小川:可以讲讲已经发生的。我们和北京儿童医院会推出 “一大四小”。一大是指计划今年 3、4 月发布的超级医生模型。四小是居家、社区、市一级人民医院和儿童医院 4 个不同场景。超级医生模型在这些场景里有两个角色:一是家里的医生朋友,二是医院里的医生助手。 晚点:怎么收费?向居民收费还是向政府? 王小川:整体看,付费方式或者说商业模式有 3 个方向:第一是 G 端(政府端),本身有基层公卫费用,会支持家庭医生计划和公立医院改革。第二是 H 端(医院),最终会走到医保里。比如去年底,AI 辅助诊断首次被国家医保局列入了服务项目的立项指南,而且它不是算在医疗器械费用里的,是在医生服务费用里。第三就是 to C,可能从每个人付费走向多层次商业保险。此外未来还有一个很大的机会,是出海。 晚点:我本来也想聊这一点,因为你之前说过在中国做 to B 不是好生意,在欧美是。但医疗出海可能涉及公民数据和隐私问题,这要怎么解决呢? 王小川:我们正在探索,希望今年能有成绩。我们还是要从全球范围来看这次技术突破的价值。 晚点:回到在中国做 to B、to G,一个难点是容易把交付做得很重,甚至做成外包,百川怎么避免这一点? 王小川:以前是因为只能围绕医生做周边,所以容易变成外包;而如果是造医生,那核心价值还是在于超级医生模型。一开始可能要做得要重一些,但头几个客户跑完后,一些非核心模型的部署工作就可以找 ISV(第三方的软件合作商)去做了。 晚点:你们现在实际上去谈客户时,需要走竞标流程吗?会遇到什么样的对手?百川胜率如何? 王小川:这类项目一定会招投标,我们也会遇到其它 AI 公司,当然现在是个公司都说自己是 AI 公司。但一旦我们讲清楚了我们的理念和能力,几乎无一例外,就是(选择了)百川。 晚点:总结而言,2025 年在 AI 医生上,我们会看到什么大的落地进展? 王小川:首先还是儿科,AI 医生会显著减少家长焦虑和医疗资源挤兑,很多问题可以在院外解决。其次,在更多场景和地区,我们会与领先的卫健委合作,推动家庭医生计划,AI 会在基层医疗里扮演重要角色。第三是,在一些重大疑难病症中,AI 诊断甚至可能超越人类。 “就像一艘船,你丢了点东西,也会获得新东西” 晚点:你 2023 年时有一个强判断:语言才是智能的主轴,这次 Baichuan-M1-preview 也有视觉理解等多模态能力。你会怎么定义语言和多模态在提升智能里的不同作用? 王小川:多模态更多是为了增强交互能力,比如医生和病人之间的沟通。这不等于智力。多模态并不是在技术上开辟新赛道。 晚点:在技术上开了推理模型方向的 OpenAI o1,对你的主要启发是什么? 王小川:是从快思考转向了慢思考。慢思考仍是用语言来做推理,这也继续验证了语言在智能提升中的强大威力。 晚点:你认为 “视频里没有智力”,但 Yann LeCun(图灵奖得主,Meta FAIR 负责人) 也提到:人类无时无刻不在通过视觉和其他感官接收大量信息,它们被压缩和处理,形成了对世界的复杂模型。一个 4 岁孩子在 4 年内接收的视觉数据量与当前最大的 LLM 在互联网文本上训练的数据量相当,仅通过文本训练,无法像人或动物那样理解物理世界或进行复杂的推理和规划。你怎么看这个观点? 王小川:我看过他的讲法,但其实人在很长的历史里也没怎么真的理解(物理世界)。 晚点:但人天然就能预测运动轨迹等物理现象,变成了一些生存本能。 王小川:那是生存问题,我们讨论智力问题。 我觉得也许有新模型能从视频里去获取训练数据,但我依然认为语言才是智能主轴。之前和几个美国同行小范围讨论,也有人说语言是 “拐棍”,以后训练 AI 就不需要语言了,可以直接用图像或视频,我觉得这走偏了。 语言至少是脚手架,人的智力和抽象思考受限于语言模式,语言边界就接近人对世界的认知边界。 晚点:当你和一些比较强调多模态的公司,比如 MiniMax、阶跃,或专门做视频生成的公司,如 Pika、Runway 等交流时,你说视频里没有智能,他们是什么反应? 王小川:有两种。 一就是觉得为什么要问这个问题呢?我做视频做得挺好的。 第二种是确实认为多模态对提升智能有用。张鹏(智谱 CEO)有一个说法,是把智力和智能分开,智力是语言,智能是加上多模态。其实智能和智力都是 Intelligence。 晚点:你认为在智能的主轴语言上,下一个技术发展趋势是什么? 王小川:强化学习再往下,有重要的两步:一是 AI 使用工具。比如 Anthropic 的 ComputerUse,还有 OpenAI 刚发的 Operator 都可以算是调用工具。 然后是制造工具,写代码造工具是一种很好的范式。以前是工程师写代码,以后是 AI 写完代码自己运行,AI 自己造工具自己来用。 晚点:这需要什么技术变化才能实现? 王小川:核心还是能力的提升。使用工具需要与外界环境互动。而造工具更具前瞻性,可能成为强化学习后的一个范式迁移。马克思讲人跟动物的区别,一个是语言,一个就是工具。 晚点:能自己使用工具和造工具,对 AI 医生的帮助会是什么? 王小川:会让 AI 医生能更好连接真实世界,比如操作你的电脑或帮助你做数据统计分析,未来甚至会走向手术机器人。 晚点:那从我们现在的状态到真的出现了 AI 医生可能还要多久? 王小川:AI 医生和 AGI 就是一件事。Sam Altman(OpenAI CEO)不是说 27 年 AGI 就会来吗。 晚点:那是他的时间表,你心中的时间表是怎样的? 王小川:AI 医生能帮助诊断疑难杂症、做罕见病分类等复杂医疗场景,这在 25 年就会实现。 能进入物理世界的机器人医生,这块我们还没碰。不过长期看,手术也是阶段性的,以后人都变机器了,也不需要手术了。 晚点:这是指人都义体化了吗?那是《攻壳机动队》了。 王小川:我创业的第一封信就讲了——AGI 帮助延续和繁荣人类文明。 晚点:这是人类文明吗? 王小川:为什么不是呢?不是延续人类肉体,是延续人类文明。文明是对世界的一种认知——“我是谁,我要去哪”。 晚点:当我们失去肉体后,一些感官层面的文明还存在吗?比如机器能被音乐之美和其中的情绪触动吗? 王小川:就像一艘船,你丢了点东西,也会获得新东西。 我觉得 99.99% 的人都低估了这个时代的变化。我刚开始做百川时,不少人说 AI 是 “第四次工业革命”,我特别反对这个类比。 工业革命是社会分工越来越细,而人工智能会收缩分工,可能很多工种就没了。未来人和机器的关系、孩子出生后怎么学习、倡导什么价值,都需要重新定义。 “AGI 会推动生物自由” 晚点:从搜狗时期的内部创业到完全从 0 开始做百川,最大的区别是什么? 王小川:非常不一样。上次是在母体中发展,这次完全独立,自己定义公司长成什么样。 上次是从一个小技术团队起步,招一批清华集训队的做搜索,目标比较简单;这次是迅速扩张到几百人的团队,目标更综合、复杂。 时代和时机也不同了,上次是跟在百度后面做搜索,很累;这次是在浪尖做面向未来的事。 晚点:你自己最大的变化是什么? 王小川:上次更多是相信单靠技术能改变一切;这次视角更全面,我对技术趋势、产业方向和资本都有了更多判断。 晚点:这次创业会更难吗?你曾因为坚持想做浏览器,被调离搜狗 CEO 职位 ,18 个月后又做回了 CEO,你说过那是 “至暗时刻”。 王小川:创业总是难的 。两次难点会不太一样,之前主要是让老板相信,这次是让团队、投资人、外部合作伙伴都能相信。 晚点:你心中,百川做到了什么,会让你有成就感? 王小川:首先是能把医生造出来,让大家都有好医生用,解决医疗资源的不可能三角。再往下,是有机会开辟新的医学科研范式,通过足够多的临床数据推动医学进步。如果能做到这两件事,就有历史性意义。 晚点:你之前卖过一次公司,这会让你更容易接受被收购,还是更觉得这不应该是一种选项。 王小川:最关键的是把事情做成。百川的核心目标是造出 “AI 医生”,而不是为了证明自己。 晚点:以前是更想要证明自己吗?其实你不当搜狗 CEO 那段时间,包括张朝阳的很多人都认为你会离开,但你没走。 王小川:年轻时,会把我很牛、把自己对自己的能力评价看得更重。当时没想离开,我觉得就应该通过浏览器把搜索做起来,验证这是对的。 有一点这次是一样的,就是让该发生的事发生。百川会在造 AI 医生的进程里有自己的位置。 晚点:做百川这两年多,你对打造一个组织有了什么新认知? 王小川:需要更多年轻人。2023 年因为要跑步入场,第一目标是先把团队搭起来。接下来技术团队需要更年轻化,吸收更多博士生和应届博士,医疗人才则需要更多的经验。 晚点:怎么吸引优秀的年轻人加入你们? 王小川:一是要持续有挑战性的任务,要避免团队大了之后,很多事变得按部就班。二是氛围上气味相投,这样更容易吸引目标、风格相似的人。 晚点:最近吸引了什么牛人吗? 王小川:我们 2024 年 7 月之后开始系统进医疗背景的人,进展很快。最近医学总监也到岗了。他在清华和协和联合培养了八年,在协和有六年临床经验,后来又去美国霍普金斯医大学医学院深造,有完整的医学训练,又有工程思维。他现在认为培养 AI 医生比人类医生更有前途。 晚点:之前我见过一些面试了百川,但没有加入的人,一种反馈是觉得百川搜狗的人太多了。 王小川:什么叫多呢?百川里搜狗的人至少不会比一些公司里清华的人多。 晚点:你之前讲过 AI 应用的价值是创造、健康、快乐。如果也用这三个维度去评价你自己的 2024 年,你觉得创造了什么?然后健康、快乐吗? 王小川:经过一年的研发,我们在医疗领域的卡位、产品都有了初步迹象,我们的儿童医生已经要准备上岗了。 公司层面我们也更健康了,团队更注重结果导向。只有技术理想,对产业没想法,这也是不够的。 晚点:创业有提升你自己的健康和快乐程度吗? 王小川:没有。健康程度明显没提升,太忙了。 快乐的话,我还是更看到这件事有意义,这不叫快乐,而是能修补对 “我是谁” 的理解,这在上次(创业)是不够的。 晚点:你对 “我是谁” 有了什么更多理解? 王小川:大概 2023 年时,物理学界有一个乌龙,说发现了室温超导材料。我一整个蒙圈了,因为你难以想象室温超导真出现后世界会怎么变。就像提线木偶一样,你在这个变化中很被动。那时我也理解了多数人看到 AI 来了之后的感受。 所以我觉得非常幸运,AI 变革和我自己息息相关,我能看到这个未来会怎么来,我还能参与其中去做创造。 晚点:如果真的实现了 AI 医生,未来会变成什么样? 王小川:我挺喜欢 Dario(Anthropic 创始人)提的一个词,“生物自由”。 晚点:这是指长生吗? 王小川:是指人不再被疾病所烦恼了。 晚点:你希望长生吗? 王小川:不。首先活太长了,对世界是有害的。对自己而言,完成自己的使命后再继续活很久,肯定就变垃圾时间了。 晚点:AI 医生也能帮我们免受精神、心理疾病的痛苦吗? 王小川:神经问题会容易点,精神问题会难一点。在抑郁上,我们在做一些努力,比如结合一些设备做症状识别。 晚点:在理工科背景创始人中,你对哲学、人文有更多关照和思考。更多想这些问题,会让你变得更悲观吗? 王小川:不会呀。朝闻道,夕死可矣。能想明白、理解了,多开心呀。 晚点:2025 年,你最期待看到什么事发生?可以讲一个和 AI 有关的,一个无关的。 王小川:与 AI 相关的是,想看看多少场景能真的用上 AI 医生,这是我最感兴趣的事。 与 AI 无关的是看特朗普又有什么新动作,每天起来都有巨多乐趣。(转载自晚点对话LateTalk)
![](/images/app_dwonload_qrcode.png)