鞭牛士报道,9月13日消息,据外电报道,微软支持的OpenAI 周四表示,正在推出Strawberry系列人工智能模型,旨在花更多时间处理查询答案,以解决难题。
该人工智能公司在一篇博客文章中表示,这些模型能够推理复杂的任务,并能解决比以前的科学、编码和数学模型更具挑战性的问题。
OpenAI 在内部使用代号 Strawberry 来指代该项目,而周四发布的模型则被命名为 o1 和 o1-mini。该公司表示,o1 将从周四开始在 ChatGPT 及其 API 中提供。
OpenAI 的研究员 Noam Brown 专注于提高公司模型的推理能力,他在社交媒体平台 X 的一篇文章中证实,这些模型与 Strawberry 项目相同。
布朗写道:我很高兴与大家分享我们在 OpenAI 的努力成果,创建具有真正通用推理能力的人工智能模型。
OpenAI 在其博客文章中表示,o1 模型在国际数学奥林匹克资格考试中的得分为 83%,而其之前的模型 GPT-4o 的得分仅为 13%。
该公司表示,该模型还提高了竞争性编程问题的性能,并在科学问题基准上超过了人类博士级别的准确度。
布朗表示,这些模型之所以能够获得这样的分数,是因为采用了一种被称为思路链推理的技术,即将复杂问题分解为更小的逻辑步骤。
研究人员指出,当该方法被用作提示技术时,人工智能模型在复杂问题上的表现往往会提高。OpenAI 现在已经实现了此功能的自动化,因此模型可以自行分解问题,而无需用户提示。
OpenAI 表示:我们训练这些模型在做出反应之前花更多时间思考问题,就像人类一样。通过训练,它们学会改进自己的思维过程,尝试不同的策略,并认识到自己的错误。
路透社于 2023 年 11 月首次报道了 OpenAI 在推理项目(当时称为 Q*)上的工作。该报 7 月报道称,该项目后来被称为 Strawberry。
对于 OpenAI 来说,o1 代表着它朝着类人人工智能的更广泛目标迈出了一步。更实际的是,它在编写代码和解决多步骤问题方面比以前的模型做得更好。但它也比GPT-4o更昂贵、使用速度更慢。OpenAI 称 o1 的这个版本为预览版,以强调它还处于起步阶段。
ChatGPT Plus 和 Team 用户从今天开始可以访问 o1-preview 和 o1-mini,而 Enterprise 和 Edu 用户将于下周初获得访问权限。
OpenAI 表示,它计划向 ChatGPT 的所有免费用户提供 o1-mini 访问权限,但尚未确定发布日期。
开发人员访问 o1非常昂贵:在 API 中,o1-preview 每 100 万个输入令牌或模型解析的文本块收费 15 美元,每 100 万个输出令牌收费 60 美元。
相比之下,GPT-4o 每 100 万个输入令牌收费 5 美元,每 100 万个输出令牌收费 15 美元。