OpenAI发布首款具有推理能力AI大模型

鞭牛士 2024-09-13 07:31

鞭牛士报道，9月13日消息，据外电报道，微软支持的OpenAI 周四表示，正在推出Strawberry系列人工智能模型，旨在花更多时间处理查询答案，以解决难题。

该人工智能公司在一篇博客文章中表示，这些模型能够推理复杂的任务，并能解决比以前的科学、编码和数学模型更具挑战性的问题。

OpenAI 在内部使用代号 Strawberry 来指代该项目，而周四发布的模型则被命名为 o1 和 o1-mini。该公司表示，o1 将从周四开始在 ChatGPT 及其 API 中提供。

OpenAI 的研究员 Noam Brown 专注于提高公司模型的推理能力，他在社交媒体平台 X 的一篇文章中证实，这些模型与 Strawberry 项目相同。

布朗写道：我很高兴与大家分享我们在 OpenAI 的努力成果，创建具有真正通用推理能力的人工智能模型。

OpenAI 在其博客文章中表示，o1 模型在国际数学奥林匹克资格考试中的得分为 83%，而其之前的模型 GPT-4o 的得分仅为 13%。

该公司表示，该模型还提高了竞争性编程问题的性能，并在科学问题基准上超过了人类博士级别的准确度。

布朗表示，这些模型之所以能够获得这样的分数，是因为采用了一种被称为思路链推理的技术，即将复杂问题分解为更小的逻辑步骤。

研究人员指出，当该方法被用作提示技术时，人工智能模型在复杂问题上的表现往往会提高。OpenAI 现在已经实现了此功能的自动化，因此模型可以自行分解问题，而无需用户提示。

OpenAI 表示：我们训练这些模型在做出反应之前花更多时间思考问题，就像人类一样。通过训练，它们学会改进自己的思维过程，尝试不同的策略，并认识到自己的错误。

路透社于 2023 年 11 月首次报道了 OpenAI 在推理项目（当时称为 Q*）上的工作。该报 7 月报道称，该项目后来被称为 Strawberry。

对于 OpenAI 来说，o1 代表着它朝着类人人工智能的更广泛目标迈出了一步。更实际的是，它在编写代码和解决多步骤问题方面比以前的模型做得更好。但它也比GPT-4o更昂贵、使用速度更慢。OpenAI 称 o1 的这个版本为预览版，以强调它还处于起步阶段。

ChatGPT Plus 和 Team 用户从今天开始可以访问 o1-preview 和 o1-mini，而 Enterprise 和 Edu 用户将于下周初获得访问权限。

OpenAI 表示，它计划向 ChatGPT 的所有免费用户提供 o1-mini 访问权限，但尚未确定发布日期。

开发人员访问 o1非常昂贵：在 API 中，o1-preview 每 100 万个输入令牌或模型解析的文本块收费 15 美元，每 100 万个输出令牌收费 60 美元。

相比之下，GPT-4o 每 100 万个输入令牌收费 5 美元，每 100 万个输出令牌收费 15 美元。

扫码下载app 最新资讯实时掌握

OpenAI

下一篇英伟达的麻烦还在后头？