×
加载中...
消息人士称DeepSeek可能会在5月之前发布R2模型
鞭牛士 2025-02-25 19:32

鞭牛士报道,2月25日消息,据路透社报道,DeepSeek 正在寻求进一步扩大其优势。


上个月,这家中国初创公司凭借其低价的人工智能推理模型引发了全球股市逾 1 万亿美元的抛售,其表现优于许多西方竞争对手。


据三位知情人士透露,目前这家总部位于杭州的公司正在加速推出 1 月份 R1 车型的后续模型版本。


其中两位表示,Deepseek 原本计划在 5 月初发布 R2,但现在希望尽早发布,但没有提供具体细节。


该公司表示,希望新模型能够产生更好的编码,并能够推理除英语以外的语言。R2 的发布时间表的加速细节此前尚未报道过。


DeepSeek 尚未回应对此事发表评论的请求。


竞争对手仍在消化 R1 的影响,它采用性能较弱的 Nvidia 芯片打造,但与美国科技巨头耗资数千亿美元开发的芯片相比仍具有竞争力。


印度科技服务提供商 Zensar 的首席运营官 Vijayasimha Alilughatta 表示:DeepSeek 推出 R2 模型可能成为人工智能行业的一个关键时刻。DeepSeek 在创建具有成本效益的人工智能模型方面取得的成功可能会促使世界各地的公司加快自己的努力……打破该领域少数主导者的束缚。


R2可能会让美国政府感到担忧,因为美国政府已将人工智能的领导力列为国家优先事项。它的发布可能会进一步激励中国当局和企业,其中数十家企业表示已开始将 DeepSeek 模型集成到其产品中。


关于 DeepSeek 的信息很少,其创始人梁文峰通过其量化对冲基金 High-Flyer 成为亿万富翁。梁文峰被前雇主描述为低调内向,自 2024 年 7 月以来就没有接受过任何媒体采访。


路透社采访了十几名前雇员以及熟悉 DeepSeek 及其母公司 High-Flyer 运营的量化基金专业人士。它还查阅了官方媒体文章、这些公司的社交媒体帖子以及可追溯到 2019 年的研究论文。

扫码下载app 最新资讯实时掌握