OpenAI的最新模型o3-mini推理过程竟是中文，疑似复制Deepseek源代码后仓促上线

Z Finance 2025-02-03 15:55

OpenAI 于上周五推出了新的推理模型 o3-mini，这是该公司o系列推理模型中的最新模型。

然而在OpenAI推出o3-mini模型后不久，许多网友和开发者发现o3-mini的推理过程使用的居然是中文。有网友推测 OpenAl 可能复制了 Deepseek 的开源代码和数据，在没有仔细编辑的情况下着急发布了 03-mini。在DeepSeek席卷全网后，OpenAI急于找回市场的信心。

图片来源：X

ZF编辑部也实际测试了o3-mini的效果，发现模型在推理过程中确实使用了中文，而后在正式回答中又切回了英文。

这也不是OpenAI的推理模型第一次玩语言游戏。根据TechCrunch报道，在 OpenAI 发布其首个推理模型 o1 后不久，人们注意到一种奇怪的现象。该模型有时会在回答问题时“用中文、波斯语或其他语言思考”——即便问题是用英文提出的。

当被要求解决某个问题时，比如“strawberry 这个单词里有几个 R？”o1 会启动其“思考”过程，通过一系列推理步骤得出答案。如果问题是用英文写的，o1 的最终答案也会是英文，但在得出结论之前，它可能会在某些步骤中切换到另一种语言。

AI 专家对此也没有定论，但他们提出了一些理论。

X 上的一些人，包括 Hugging Face 的首席执行官 Clément Delangue，提到了像 o1 这样的推理模型会在包含大量中文字符的数据集上进行训练。谷歌 DeepMind 的研究员 Ted Xiao 声称，包括 OpenAI 在内的公司会使用第三方中文数据标注服务，而 o1 切换到中文正是“中文语言对推理的影响”的一个例子。

“[像] OpenAI 和 Anthropic 这样的实验室会利用[第三方]数据标注服务来处理科学、数学和编程的博士级推理数据，”Xiao 在 X 上发帖写道，“由于专家劳动力的可用性和成本原因，这些数据提供商中有许多位于中国。”

标注（也称为标签或注释）帮助模型在训练过程中理解和解释数据。例如，用于训练图像识别模型的标注可能是围绕对象的标记或指向每个人、地点或物体的标题。

然而，也有一些专家并不认同 o1 的中文数据标注假说。他们指出，o1 在推导解决方案时同样可能切换到印地语、泰语或其他语言，而不仅仅是中文。

这些专家认为，o1 和其他推理模型可能只是选择了它们认为最有效实现目标的语言（或者出现了“幻觉”）。（转载自Z Finance）

扫码下载app 最新资讯实时掌握

DeepSeek OpenAI

上一篇OpenAI新功能「深度研究」登场，人类终极考试的表现超过DeepSeek R1

下一篇百度智能云千帆正式上架DeepSeek-R1/V3模型