鞭牛士报道,1月27日消息,据外电报道,本周,中国人工智能初创公司 DeepSeek 开发的聊天机器人在美国苹果应用商店排行榜上飙升至榜首,取代 OpenAI 的 ChatGPT,成为下载次数最多的免费应用程序。
这款同名的人工智能助手由 DeepSeek 的开源模型提供支持,该公司表示,这些模型的训练成本仅为世界领先模型的一小部分,使用的芯片也比世界领先模型少得多。
这一说法激怒了金融市场,英伟达的股价在盘前交易中下跌了 12% 以上。
1 月 20 日, DeepSeek 发布其新的 R1 推理模型后不久,该应用程序的下载量激增,该模型旨在解决复杂问题,据报道在某些基准上的表现与 OpenAI 的 o1 一样好。R1 是基于 12 月发布的 V3 LLM DeepSeek 构建的,该公司声称该模型与GPT-4o和Anthropic 的 Claude 3.5 Sonnet相当,开发成本不到 600 万美元。
相比之下,OpenAI 首席执行官 Sam Altman 表示,GPT-4 的训练成本超过 1 亿美元。
据《纽约时报》报道,DeepSeek 还声称,训练 V3 只需要大约 2,000 块 Nvidia 专用芯片,而训练领先模型则需要 16,000 块或更多芯片。
这些未经证实的说法导致开发人员和投资者对世界领先 AI 公司青睐的计算密集型方法提出质疑。如果属实,这意味着 DeepSeek 工程师必须在旨在确保美国在 AI 领域主导地位的贸易限制面前发挥创造力。
Nvidia、微软、OpenAI和Meta正在向 AI 数据中心投资数十亿美元——仅星际之门项目就投资了 5000 亿美元,其中 1000 亿美元被认为专门用于 Nvidia。投资者和分析师现在想知道这笔钱是否花得值,因为 Nvidia、微软和其他在维持 AI 现状方面拥有大量股份的公司在盘前交易中都呈下跌趋势。