DeepSeek立功！OpenAI披露更多o3-mini模型思考过程

鞭牛士 2025-02-07 08:39

鞭牛士报道，2月7日消息，据TC报道，为了应对包括中国人工智能公司 DeepSeek在内的竞争对手的压力，OpenAI 正在改变其最新人工智能模型o3-mini传达其逐步思考过程的方式。

周四，OpenAI宣布，该公司人工智能聊天机器人平台 ChatGPT 的免费和付费用户将看到更新的思路链，其中展示了该模型的更多推理步骤及其如何得出问题的答案。

据 OpenAI 称，使用 o3-mini 的高推理配置的高级 ChatGPT 计划订阅者也将看到此更新的读数。

OpenAI 发言人通过电子邮件告诉 TechCruch：我们为 o3-mini 引入了更新的思维链，旨在让人们更容易理解模型的思维方式。通过此更新，您将能够理解模型的推理，从而对其响应更加清晰和自信。

图片来源： OPENAI

o3-mini 等推理模型在给出结果之前会彻底检查自身事实，这有助于它们避免一些通常会绊倒模型的陷阱。但代价是推理模型需要更长的时间才能得出解决方案——通常要多花几秒到几分钟。

DeepSeek 的 R1 模型是一种类似于 o3-mini 的“推理”模型，它揭示了其完整的思维过程，许多人工智能研究人员认为这是首选方法。除了使模型更易于研究之外，推理步骤在某些情况下还能提供更好的用户体验，帮助指示模型何时可能走在正确的轨道上，何时可能走在错误的轨道上。

OpenAI 选择不展示 o3-mini 及其前身 o1 和 o1-mini 的完整推理步骤，部分原因是出于竞争原因。相反，用户只能看到推理步骤的摘要 — —有时这些摘要是错误的。

> 当我们在 o1-preview 发布之前向人们介绍情况时，看到 CoT 实况通常会让他们“恍然大悟”，明白这将是一件大事。这些并不是原始的 CoT，但这是向前迈出的一大步，我很高兴我们能与世界分享这种体验。
>
> — Noam Brown (@polynoamial) 2025 年 2 月 6 日

OpenAI 仍未展示 o3-mini 的完整推理步骤，但该公司表示它找到了一种平衡：o3-mini 可以自由思考，然后将其想法组织成更详细的摘要。

OpenAI 发言人继续说道：为了提高清晰度和安全性，我们增加了一个额外的后处理步骤，让模型审查原始思路，删除任何不安全的内容，然后简化任何复杂的想法。此外，这个后处理步骤使非英语用户能够以他们的母语接收思路，从而创造更易于理解和友好的体验。

在上周的 Reddit AMA上，OpenAI 首席产品官 Kevin Weil 暗示这一变化即将到来。

「我们正在努力展示比今天更多的东西——[展示模型思维过程]很快就会出现。」他说。「一切都有待确定——展示所有的思维链会导致竞争性的提炼，但我们也知道人们（至少是高级用户）想要它，所以我们会找到正确的方法来平衡它。」

扫码下载app 最新资讯实时掌握

openai

上一篇OpenAI前CTO已聘请OpenAI联合创始人John Schulman

下一篇星际之门开干：OpenAI考虑在16个州设立数据中心园区