×
加载中...
地平线余凯:AI时代,99%的人类驾驶行为不值得学习
云见Insight 2025-04-20 10:04

拥有用户的驾驶行为数据,曾经是车企的核心优势。但 AI 时代的新技术正在挑战这一点。


地平线 HSD 智驾系统的发布会上,创始人余凯说:在 AI 时代,99% 的用户行为数据不值得学习。


他的理由是,大部分人类司机的驾驶技术和习惯并不好。比如刹车太急、拐弯不够从容。


“人工智能产品要超越人的水平,不是以人的水平作为目标。”在与《云见 Insight》等媒体的交流会上,余凯进一步解释了这一点。


在 AI 行业,机器学习的训练范式早已从模仿学习人类,转变为自主的强化学习。


谷歌的 AlphaGo 通过模仿人类下棋,打败了世界围棋冠军。而完全自主学习、自博弈产生的 AlphaZero 不仅棋艺更胜一筹,还具备很好的泛化性。


大语言模型 ChatGPT、DeepSeek 做出了同样的尝试。DeepSeek-R1-Zero 完全摒弃了监督微调,表现出了极强的自主推理能力。


自动驾驶行业的最新技术趋势,是将世界模型(World Models)与强化学习深度融合。蔚来、小鹏、理想都在研发世界模型。在不久前的一次分享会上,小鹏表示,其其正在自研 72B 超大参数的基座模型,经过预训练、强化学习, “蒸馏”为一个较小的额模型,再部署到车端。


在新的技术趋势下,余凯认为,人类司机的数据不再是智能驾驶技术的核心壁垒。


特斯拉拥有全世界最多的用户驾驶数据,但同样是用自己组建的车队数据,加上在虚拟世界仿真、强化学习进行模型训练。理想智驾负责人郎咸朋也曾提到,理想从全部用户数据中挑选了 3% 的 “老司机”,只用这部分数据进行训练。


如果真实的用户数据不再是自动驾驶的核心要素,那么车企的数据优势可能也会不复存在。取而代之的,是模型的能力和精度。


最近 2 年,从基于规则的智驾,到端到端、VLA、世界模型,智能驾驶行业的技术快速变化。前人积累的先发优势,在技术创新和范式更改中被抹平。


这场终将收敛到少数玩家的排位赛,现在还看不到尽头。但余凯认为,有一点始终不会变:


“真正的技术护城河,是十年如一日的苦活、脏活、累活,说不清道不明的经验积累,以及体系化的研发文化和流程。”


以下是地平线创始人、CEO 余凯接受《云见 Insight》等媒体采访的内容整理:


顶级玩家不依赖人类司机

图片


提问:你说 99% 的人类数据不值得学习,新的数据解决办法是什么?地平线是怎么考虑的?


余凯:在大模型发展中,学习历史资料文献很重要,但用户行为数据不重要。在智能驾驶领域也是同样道理,99% 的司机驾驶行为,像刹车、拐弯、换道等,体验并不好。据我了解,特斯拉有自己专有的车队,专门训练司机提供训练数据,不是从普通用户获取数据,并且还通过强化学习在仿真平台训练。


我们的看法和特斯拉类似。人工智能产品的目标是超越人类水平,和抖音了解用户喜好、逼近用户水平的逻辑不同。


未来仿真可能最重要,因为在仿真世界模拟各种场景效率比在真实世界高很多,比如一些现实中很少见的场景,在仿真世界可以大量模拟。仿真平台生成的数据更干净、高效,就像 Alpha Zero 在仿真平台左右互搏,棋艺远超人类,下棋方法也是人类历史上没有的。


强化学习很重要。我们在强化学习方面发表了很多论文,并且会把强化学习应用到我们的系统中。


与其花大力气筛选数据,不如只用黄金数据训练。特斯拉用专门车队训练司机获取数据,同时结合虚拟世界仿真。现在智能驾驶领域的顶级玩家已经不依赖司机数据学习了。


提问:有 L4 公司 2021 年甚至更早就在做强化学习范式。这是不是意味着,技术范式转变后,以自动驾驶为终极目标的 L4 公司反而更有优势了?


余凯:那些 L4 公司整个系统成本太高,产品出发点和我们面向乘用车消费者的不一样。


提问:地平线在双系统、世界模型方面是怎么做的?


余凯:我们认为强化学习博弈才是系统 2,而不是把大语言模型加进去,就是系统 2。大语言模型能提升智能驾驶的认知能力,但不是真正的交互式博弈。


我们的长期技术架构是双系统,强化学习的交互式博弈会不断反过来增强系统。司机开车时,老司机很多操作变成习惯,类似系统 1,系统 2 很多功能熟练后也会变成系统 1,但长期来看两个架构都会存在。


我们一直在做世界模型,像 HMI 能生成美轮美奂的界面,把传感器数据生成周边动静态模型,就是基于世界模型实现的。


我们部署了 7 万张卡,在算力方面投入很大。


提问:现在 AI 领域讨论大模型的 scaling law 放缓,随着算力和数据达到一定规模,边际效应会越来越低。自动驾驶随着算力提升,是否会出现这种情况?


余凯:Scaling law 在智能驾驶领域才刚开始,没到头。目前增加算力、扩大网络规模和参数规模,能明显提升效果。比如特斯拉 FSD 不同算力版本,体验差异很大。未来 10 年自动驾驶仍需持续提升算力,但到一定程度会放缓。


我认为 L3 要实现全场景辅助驾驶,做得足够好后,算力提升可能会放缓。之后还会有很多细节工作要做,就像移动通信基带,做好很难,苹果想自己做基带,追了高通近 10 年才快追上。自动驾驶要在各种工况、路况下做到完美很难,从 90 分提升到 100 分非常艰难。


L3 保守派

图片


提问:昨天发布会提到 “以高打低、以快打慢”。现在高阶不能提了,这对智能化战局有什么影响?


余凯:“以高打低、以快打慢” 的策略不变。人类走向 L5 级智能驾驶的趋势不会改变,现在没到 L3 ,就还是辅助驾驶。相关规范对行业是好事,之前行业竞争焦虑导致大家动作变形,回归正常轨道能让行业发展更快。


提问:计算机行业可以根据配置、性能选择产品,但汽车时代用户不知道怎么选,不清楚什么是更好、更值得选的。


余凯:以前是这样,现在情况在改变。以前高速辅助驾驶让用户触达智能驾驶场景的机会很少。去 4S 店体验智能驾驶,店员说要开 40 分钟到高速,很多人就放弃了,所以智能驾驶对老百姓来说只是卖车时的一个配置说明,无法真正体验。但城区辅助驾驶出现后就不一样了,在 4S 店门口或日常通勤就能体验,好不好立马能感受出来。


以前汽车配置像天窗,有或没有对消费者影响不大,现在城区辅助驾驶成为撬动市场的拐点,老百姓会关注它好不好。


提问:现在很多车企和供应商主动推出 L3,地平线有没有规划?


余凯:我们会配合车企。我认为 L3 的基础是有足够好的城区辅助驾驶,但目前城区辅助驾驶还需要努力提升,并且要有足够的部署,通过实际运营统计数据确保安全。所以我对这件事没有特别积极,先看车企的行动,我们先把当下的城区辅助驾驶做好。


关于 L3 我在行业里算保守的,一直被行业推着走,对行业有敬畏之心。之前在百人会发言时,我就呼吁大家冷静,扎扎实实做好辅助驾驶。现在大家都说要实现 L3,我也只能跟着推进。


3年内,10万级别车带城区辅助驾驶

图片

提问:地平线 HSD 有双 J6M、双 J6P 和单 J6P 三个硬件版本,想提问这三个版本的时间节奏以及为何设置三个版本?


余凯:如果只站在我个人角度,我个人肯定希望只卖双 J6P,但每个车厂对产品的理解和定位不同。我认为行业趋势是向高算力发展,城区辅助驾驶会成为标配,我认为行业趋势是向高算力发展,城区辅助驾驶会成为标配,预计三年内会在 10 万级别的车型上普及。


单 J6P 和双 J6P 性能更强,双 J6M 有成本优势。人工智能系统中,参数越多、模型越大效果越好,用户最终会选择大算力产品。就像基带发展,3G 时代只有高端机使用,到 4G 时低端机也普及了。我认为未来 2 - 3 年自动驾驶会迎来 4G Moment,只要城区辅助驾驶足够好。


提问:今年有几家公司推出可插换芯片系统,华为建了 2000 多平米的工厂,大疆也有类似系统。但可插拔芯片面临组装无法满足车规级的提问题。比如地平线如果跟奇瑞合作,是奇瑞建工厂来做吗?


余凯:那肯定的。


提问:要是和吉利等其他公司合作,也需要建可插拔工厂吗?地平线服务多家车企,是否有其他方案?


余凯:是否专门建工厂还不确定,车企现有产线或许可以利用。


提问:这种可插拔芯片模式会成为行业主流吗?


余凯:这是新出现的情况,很难说是否会成为模式。但从用户价值看,很有必要。未来 10 年自动驾驶变化大,每三年换辆车成本高,但换一台车载计算机更可行,对用户有价值,不过未来还需摸索。


提问:地平线和蔚来萤火虫合作是基于 J5,而不是最新的 J6 产品。地平线和蔚来最早什么时候开始接触合作的?


余凯:应该不止一年了,2023 年我们开展合作并对外公布过。当时定点是 J5,因为当时 J6 还没出来。


L5 之前软硬一体

图片


提问:过去大家认为你们是芯片公司,现在提出做智驾公司,是否意味着身份转变?


余凯:地平线的商业本质一直没变,过去几年给主机厂提供的不仅有芯片,还有大量软件工具链和开发工具,这也是地平线在自动驾驶芯片公司中脱颖而出的原因。懂软件的芯片公司很关键,没有软件生态的芯片公司发展艰难。


从商业模式看,我们还是二级供应商。昨天很多一级供应商和我们交流密切,分工很清晰。地平线交付了 200 多万辆车,大多通过合作伙伴完成。我们要把精力放在核心技术和平台级研发上,和一级供应商合作,让它们负责车型适配和交付,地平线专注于提升芯片和 HSD 技术,推动城区辅助驾驶、L3、L4、L5 的发展。


提问:昨天发布会上说,在 L5 级自动驾驶实现前,智驾是软硬结合路线,为什么是 L5?


余凯:L4 虽然可以闭眼不看路况,但还不能在车上睡觉,需求没有完全满足。到 L5 时,在车上能睡觉,基本没有其他需求了。那时不存在软硬分离,软硬结合的成本和效率是最高的,就是单一任务的计算系统。


提问:你还提到,智能驾驶正处于 10 倍速变革时期,地平线如何在技术快速变革中保持战略的灵活性和前瞻性?


余凯:对我们来说,速度至关重要。历史上 10 倍速技术变革期一般是 10 年,前 5 年最为关键,基本能确定行业格局。地平线的战略就是追求速度,以高打低、以快打慢,最快速度推进技术进步。


提问:你很早就提出地平线要做 AI 时代的 Wintel,Wintel 到底指什么?对英伟达来说可能是芯片 + CUDA,对今天的地平线来说是芯片 + 智驾方案,对特斯拉来说是 FSD + 整车。在自动驾驶行业,AI 时代的 Wintel 是什么?


余凯:汽车可能是人类历史上第一个真正的 AI 应用领域,如果存在整车操作系统,应该是以 AI 为主的操作系统,它不仅管自动驾驶,还能管控车内所有设备。车载大脑就是全新的操作系统,肯定不是安卓,安卓在车上只是附属,不是核心。


提问:英伟达凭借大规模算子和丰富工具链,让 CUDA 生态占据垄断地位。地平线怎么帮助主机厂和开发者解决迁移难题?


余凯:在服务器或数据中心的人工智能计算领域,很难赶上 CUDA 生态,目前没有公司能做到。英伟达面向的应用场景太广泛,需求多样,其它公司很难跟上。地平线的战略是在没有竞争的地方竞争,聚焦智能驾驶和机器人领域,这两个领域应用相对聚焦,算子也相对聚焦。我们从窄门切入,就像当年英伟达从图形计算切入,避开英特尔的通用计算,说不定在自动驾驶和机器人领域能开拓出大市场。


很多芯片公司打不开市场,就是因为没有工具链和软件生态。比如做 SOC、平台和手机,很大程度上依赖安卓。在 AI 领域,英伟达的 CUDA 生态是闭源的,其他公司没有,只能自己开发。只有硬件能力没有软件能力的芯片公司很难生存。


提问:现在头部车企都喜欢自研芯片,当像蔚来、小鹏等客户开始自研芯片时,地平线的策略是什么?是部分车型合作还是其他方式?


余凯:一些车企自研芯片会改变市场格局,消费市场可能会发生变化,但这对我们没什么影响,因为我们原本也没占据那部分市场。目前来看,行业趋势正走向软硬结合。


这些车企老大都是我的好朋友,他们要自研芯片,我都会支持。他们有很大梦想才会选择创业,希望成为乔布斯、马斯克那样的人,这值得鼓励。从产业终局看,虽然有 20% 的企业可能成功自研芯片,但 80% 还是会回到产业协同、协作。PC 产业就是例子,早年垂直自研芯片的 PC 厂家大多倒闭了。我相信市场会有地平线的生存空间,我们要做好自己的工作。


提问:地平线和奇瑞、大众、大陆等都有深入合作,在出海方面有什么规划?哪种方式适合地平线?


余凯:我们一直相信合作共赢,出海面临法规、数据等复杂提问题,还是要和合作伙伴一起推进,尊重产业规律。


机器人处于淘金时代

图片


提问:你怎么看地平线短期、长期 5 - 10 年的业务变化?


余凯:我觉得 3 - 5 年内,地平线要把智能驾驶方向做起来,汽车业务市场规模至少做到几十亿美金。机器人业务现在发展还为时尚早,起码还需要 5 年培育期。现在的机器人,比如扫地机太简单,人形机器人离真正实用还比较远。我们希望 5 - 10 年把机器人业务做起来。


5 年后,可能出现拐点,比如让人形机器人在很多应用场景里真正发挥作用。现在自动驾驶已出现拐点,机器人还没有。


提问:地平线在机器人 “大脑” 方面有什么突破规划或布局?


余凯:我们的逻辑是提供机器人时代的基础设施。目前机器人还没有突破性应用,需要长期培育生态。就像当年库克没看到苹果产品爆发式应用,但英伟达提前布局相关生态。我们希望地瓜计算芯片和平台成为所有机器人开发的首选,至于未来哪家企业能在机器人领域爆发很难预测,我们要做的就是做好 “大脑”,也就是操作系统和芯片。


提问:目前在智驾和机器人这两块业务的投入和产出情况如何?


余凯:机器人业务投入大概占 1/20。今年机器人业务收入大概占 1/100,目前主要是招采招工、卖工具,处于机器人行业的 “淘金时代”。(转载自云见Insight)

扫码下载app 最新资讯实时掌握