×
加载中...
OpenAI的最新模型o3-mini推理过程竟是中文,疑似复制Deepseek源代码后仓促上线
Z Finance 2025-02-03 15:55

OpenAI 于上周五推出了新的推理模型 o3-mini,这是该公司o系列推理模型中的最新模型。

然而在OpenAI推出o3-mini模型后不久,许多网友和开发者发现o3-mini的推理过程使用的居然是中文。有网友推测 OpenAl 可能复制了 Deepseek 的开源代码和数据,在没有仔细编辑的情况下着急发布了 03-mini。DeepSeek席卷全网后,OpenAI急于找回市场的信心。

图片

图片

图片

图片来源:X

ZF编辑部也实际测试了o3-mini的效果,发现模型在推理过程中确实使用了中文,而后在正式回答中又切回了英文。

图片

这也不是OpenAI的推理模型第一次玩语言游戏。根据TechCrunch报道,在 OpenAI 发布其首个推理模型 o1 后不久,人们注意到一种奇怪的现象。该模型有时会在回答问题时“用中文、波斯语或其他语言思考”——即便问题是用英文提出的。

当被要求解决某个问题时,比如“strawberry 这个单词里有几个 R?”o1 会启动其“思考”过程,通过一系列推理步骤得出答案。如果问题是用英文写的,o1 的最终答案也会是英文,但在得出结论之前,它可能会在某些步骤中切换到另一种语言。

图片

AI 专家对此也没有定论,但他们提出了一些理论。

X 上的一些人,包括 Hugging Face 的首席执行官 Clément Delangue,提到了像 o1 这样的推理模型会在包含大量中文字符的数据集上进行训练。谷歌 DeepMind 的研究员 Ted Xiao 声称,包括 OpenAI 在内的公司会使用第三方中文数据标注服务,而 o1 切换到中文正是“中文语言对推理的影响”的一个例子。

“[像] OpenAI 和 Anthropic 这样的实验室会利用[第三方]数据标注服务来处理科学、数学和编程的博士级推理数据,”Xiao 在 X 上发帖写道,“由于专家劳动力的可用性和成本原因,这些数据提供商中有许多位于中国。”

标注(也称为标签或注释)帮助模型在训练过程中理解和解释数据。例如,用于训练图像识别模型的标注可能是围绕对象的标记或指向每个人、地点或物体的标题。

然而,也有一些专家并不认同 o1 的中文数据标注假说。他们指出,o1 在推导解决方案时同样可能切换到印地语、泰语或其他语言,而不仅仅是中文。

这些专家认为,o1 和其他推理模型可能只是选择了它们认为最有效实现目标的语言(或者出现了“幻觉”)。(转载自Z Finance)

扫码下载app 最新资讯实时掌握