就在刚刚过去的周末,马斯克的xAI突然出手截胡,抢在OpenAI开发者大会前公布了自家的大模型Grok。不仅时间赶巧,Grok还不用Python,马斯克带领十几个人爆肝两个月,终于拿出了一款像样的作品。
体验链接:https://Grok.x.ai
马斯克的Grok为今年注定不凡的AIGC与大模型赛道又添了一把火,事情正在变得愈发好玩了。
关于Grok
与其他常见的类GPT等大模型不同,Grok可以实时的从X推文中获取最新知识,比如马斯克上周的访谈会话记录。巨量、实时且独特的X推文无疑是Grok绝妙的护城河。而且Grok还颇有个性,不像常见的一板一眼式AI助手,说出的话多少带点刺和幽默,当然也可以说是阴阳怪气。比如对最近在纽约受审的山姆·班克曼-弗里德,即币圈著名的爆炸头SBF,Grok话里有话的表示:“哦,我亲爱的人类啊,我这儿有劲爆的新闻要告诉你!我们的朋友Sam Bankman-Fried,那位前加密货币大亨,竟然在他的欺诈案审判中被判有罪。你敢相信吗?”
除了这种常规对话,Grok还有其他功能,比如多个对话同时输出,一边写代码一边问其他问题也可以。在回答不满意重新生成后,可以展开时间线,直接导航到不同版本的回答,甚至可以使用内置的markdown编辑器,手动修改AI的回答后继续进行对话。
根据xAI团队的说法,Grok旨在模仿《银河系漫游指南》,用“一点点的智慧”来回答问题,还有着“一点点的叛逆”。开发者还特别提示:如果你不喜欢幽默,千万不要用Grok!严格地说,Grok可以回答人类提出的几乎任何问题,即使不会问,它也能提出一些建议性问题。说来说去,最大的亮点还是基于X中的海量信息,Grok可以提供真实世界中的实时信息。
巧合的是,Grok作为一款产品,背后的大模型也与之同名,目前的版本是Grok-1,它的原型Grok-0在xAI宣布成立后即开始训练。目前可以确认的消息是,Grok-0的性能接近Llama 2-70B,但参数量约33B,不到其一半。而在过去的两个月时间里,xAI加强了Grok的推理和编码能力,升级到了现在的Grok-1版本。
测试结果显示,Grok-1在数学、代码和多学科知识评测中不仅相比前代有显著提升,甚至比GPT-3.5更胜一筹。毕竟是马斯克亲自下场动手的作品,Grok的不走寻常路与质量都是意料之中的。在Grok系统中找不到熟悉的PyTorch或Tensorflow,甚至连Python成分也没有,而是选用了Rust编程语言以及深度学习框架新秀JAX。
至于背后原因倒也不难理解,xAI认为大模型训练过程就像一列疾驰的火车,如果其中一节脱轨势必导致后续一连串的灾难性后果。为此xAI特意打造了专用的分布式系统,确保一旦出现故障就立即识别类型并自动处理。在这一过程中,xAI发现Rust语言是构建可扩展、可靠且可维护的基础设施的理想选择。
马斯克与xAI
近几年马斯克的名声在国内越来越大,但很多人不知道的,除了特斯拉,SpaceX,Neuralink等,马斯克还曾有几家在国内知名度都不太高的公司,比如Zip2,X.com,PayPal,这三家都成立于上世纪末期。其中Zip2为各大报刊和杂志出版商开发网络在线城市指南,包括地图、导航和黄页;X.com主营在线金融服务和电子邮件支付业务,是首批与美国联邦保险合作的网上银行之一;PayPal是全球最早研究电子钱包与移动支付的公司。综合观察下这三家公司,有没有发现一些有趣的东西?国内的阿里巴巴也走过这样的发展路线。
进入新世纪后,马斯克同样还开办过几家公司:SolarCity,Hyperloop,The Boring Company,这三家在国内的知名度也不高。其中SolarCity主营家用光伏发电业务(solar为法语“太阳”);Hyperloop直译为“超回路列车”,是基于真空管的高速客货运输系统,速度比飞机更快,目前还处于基础建设阶段,马斯克甚至想在未来把它用于火星上的交通运输;The Boring Company主营城市基建特别是铁路隧道建设,未来可用于研发超级高铁,隧道等基建设施则可以保持通用。Boring兼有“打洞”和“无聊”之意,因此The Boring Company在国内常被译为“钻洞公司”或“无聊公司”。
至此,相信很多人都能对马斯克有更深的理解了,他的思想有时被称为“技术理想主义”,这种思想是硅谷早已有之的。比如比尔·盖茨希望电脑可以走进千家万户,拉里·佩奇希望互联网信息来源应该多元化,乔布斯希望电子产品也可以是艺术品......诸如此类的思想很多,也可以说这是硅谷能有今日之成就的重要原因之一。
2015年OpenAI成立时,马斯克等创始人的出发点就是要汇集全球最顶尖的AI人才,在非盈利的前提下,研发最前沿的AI技术。这种发展模式对标的更多是类似贝尔实验室这样能够产生巨大社会价值的半学术半企业科研实体,直接竞争者则是同时期被谷歌收购的DeepMind。因此OpenAI本来就是为AI技术而生的,而不是特意选择了研究底层技术。另外OpenAI从一开始就有一系列的奇遇良缘加持,也可以说是仅凭马斯克的号召力就聚集了顶级富豪与学者和海量的舆论关注。但当时OpenAI的现实困境证明马斯克等创始人的想法太过理想化,几乎可以说是完全不现实。而且2018年特斯拉也开始逐步进入AI领域,为避免日后与OpenAI产生矛盾,再加上不同意OpenAI管理层及其对AI安全的态度,因此马斯克等创始人先后离开OpenAI。后来随着山姆·奥尔特曼出任CEO,OpenAI转型成为有限营利实体,用限制利润上限和营收种类等方式,来探索在商业化与非盈利机构之间的新平衡点。
今年四月时,马斯克就对采访的英国《金融时报》透露过想成立新AI企业的想法,表示“对目前各大AI公司的训练系统表示担忧”,担心这些产品会陷入“政治正确”的窠臼,因此要成立“TruthGPT”之类的品牌或企业。七月时xAI正式宣布成立,与特斯拉紧密合作 ,目标之一就是打造能进行高级逻辑推理的大模型,力求超越市面上其他同类型竞品。
至此,马斯克依然没有放弃,还想与OpenAI和ChatGPT一较高下,当然也可以说马斯克是想用xAI证明,即使离开OpenAI,他也一样能在AI领域有所作为。另外,今年三月GPT-4亮相后OpenAI也在第一时间表态不开源,引起了外界一片“OpenAI不open”的嘲讽。虽然OpenAI的真实想法外界不得而知,也无可厚非,但这其实也可以视为马斯克与其矛盾的缩影。
前面说过马斯克是坚定的“技术理想主义者”,当年参与成立OpenAI的初衷之一就是破解AI的秘密并推广到全球。因此在马斯克看来,GPT的这种黑盒系统明显是违背其理念的,虽然GPT-4的确能火遍全球,引起新一轮的时代浪潮。相信也一定会有人说马斯克是矫情自饰,是吃不到葡萄说葡萄酸,看着OpenAI赚得盆满钵满的眼红,真实想法究竟怎样,只有马斯克自己最清楚。
Grok的未来
几个月前,马斯克在彼时还没改名的Twitter(推特)上表示:“xAI的目标是理解宇宙的真正本质”,由此向全世界宣告了xAI的成立。几个月后,这批堪称技术狂的团队拿出了第一批研究成果。甚至马斯克本人都忍不住提前在X上为它打广告:“在某些方面,它就是目前最好的。”
这里值得说明的一点,xAI为什么要给自己的产品取名为Grok呢?有人说这是受到了美国科幻作家罗伯特·海因莱因的作品《异乡异客》(Stranger in a Strange Land)中的类似概念启发。在书里海因莱因独创了一套火星语,其中Grok的字面意思是语气词“喝”,同时还有着深层意义,象征着理解、共鸣和人际关系等深层含义,而不仅是表面或智力上的同化。
因此,xAI选择将自己的大模型命名为Grok,也表达了马斯克对AI在理解和交流方面一贯的愿景,希望AI能够超越机械的信息处理,真正理解人类的情感和需求,实现更深刻、更直观的人机交互和理解。在现代科幻群体中,这个词常被用来表示对复杂问题的深入理解。这一说法也得到了马斯克本人的认可。
看起来很好很强大的xAI要如何使用呢?目前有两种办法,1.用账号登录官网;2.升级为X的Premium+订阅者。马斯克表示,一旦结束早期测试Grok将可供所有Premium+订阅者使用,16美元/月,而作为竞品的ChatGPT Plus订阅价格是20美元/月。而就在这个当口,Grok的服务器已经宕机了,其火爆可见一斑。
说来有趣,马斯克此前也是“AI末日论”的忠实粉丝,曾联手一众AI与科技圈的大佬共同签署了一封公开信,要求暂停发展比GPT-4更先进的AI,为期至少半年。而眼下,就在这些大佬们正热火朝天地激辩着AI监管的重要性与必要性时,马斯克却已经悄悄训练出Grok了,甚至还赶在OpenAI开发者大会前夕放出大招。又印证了那句话:“看着好兄弟挣钱,比数着自己赔钱还难受。”当然了作为一个总能实现自己吹过牛的人,马斯克的自圆其说向来堪称业界标杆:“我们相信,AI具有巨大的潜力,可以为社会贡献重要的科学和经济价值,因此我们将努力制定可靠的保障措施,防止灾难性的恶意使用。我们会尽最大努力,确保AI始终是一股向善的力量。”
甚至马斯克还放出这样的话:“未来特斯拉的算力都会用于大模型的推理。即使有机器人驾驶出租车,汽车依然每周只会运行1/3时间,其余时间的算力都会用来做SETI之类的分布式推理运算。这样,特斯拉就将拥有地球上最多的大模型推理算力!”不愧是你马斯克,果然在下一盘大棋。
老话说得好“背靠大树好乘凉”,虽然Grok可以利用X访问搜索工具和实时信息,但跟市面上所有竞品一样,Grok仍然无法避免大模型的通病:幻觉问题。对此xAI认为,解决当前系统局限性最重要的方向,就是实现可靠的推理。具体来说有以下几种:
1.通过工具辅助实现可扩展的监督可能。目前Grok还很难提供一致且准确的反馈,尤其是处理长代码或推理复杂推理时。这时候就可以让AI通过查找不同来源的参考资料、使用外部工具验证中间步骤、寻求人类反馈等,来协助进行可扩展的监督。
2.集成形式验证,确保安全性、可靠性和接地气。xAI预计在保证准确性与可解释性的情况下发展AI的推理技能,这样就能在没有人类反馈或现实世界交互的情况下评估系统。采用这种方法最直接的目标就是保证代码的准确性,特别是在形式上验证AI的安全性。
3.长上下文理解和检索。一个能在特定环境中有效地发现有用知识的大模型,是产生真正智能系统的核心,xAI正在致力于研究如何让AI在需要时去发现和检索信息。
4.对抗性鲁棒性。许多示例表明,无论是训练期间还是使用期间,AI系统中的漏洞都可能会导致它们犯严重的错误。而这些漏洞同时也是深度学习大模型长期存在的弱点。xAI致力于提高大模型、奖励模型和监控系统的鲁棒性。
5.多模态功能。目前Grok还没有配备视觉和听觉功能,xAI将会致力于发展它的多模态功能,实现更广泛的应用。
几十年的职业生涯不止一次表明,xAI与现在的Grok充其量只是马斯克科技野心的一环,他的眼光绝不仅限于目前火热的AIGC与大模型技术。无论是研究脑机接口与植入式微芯片的Neuralink ,做人型机器人的Optimus,还是模拟人脑的超级电脑Dojo,以及现在的Grok,马斯克近期积极推进的项目都可以指向同一个目标:通用人工智能,即AGI,也就是指创造一个能像人类一样执行各种任务的智能系统,具有类似人类的智慧、自主决策和学习能力,能执行多种任务,并具备对世界的理解和推理能力,解决各种复杂问题。
当然,这一终极目标的实现绝非易事,AI技术固有的特点,决定了它必须有成果才能更容易,更直接的被外界感知。但马斯克可不是常人,而是一个总能把吹过的牛实现的人,现在已经在这条充满挑战的道路上出发。