鞭牛士报道,2月3日消息,据南华早报报道,阿里巴巴集团控股的云计算服务部门周一在其平台上推出了DeepSeek的人工智能(AI) 模型,此前其他大型科技公司也纷纷将这家中国初创公司的开源系统提供给客户。
阿里云在微信上发布的声明中表示:在我们的平台上,用户可以实现从训练到部署再到推理的全过程,无需任何编码。
该公司表示,该平台简化了模型开发流程,为开发者和企业用户带来更快捷、更高效、更便捷的人工智能开发和应用体验。
声明称,阿里云用户可以登录其 PAI 模型库(一组开源大型语言模型 (LLM)),在那里他们可以选择 DeepSeek 的 AI 模型并部署它们来支持他们自己的推理和文本生成应用程序。
该图库包含这家总部位于杭州的初创公司最先进的人工智能模型DeepSeek-V3和DeepSeek-R1,据称其开发成本和计算能力仅为主要人工智能技术公司构建 LLM 所花费成本的一小部分。它还提供这些模型的所谓精简版本,例如 DeepSeek-R1-Distill-Qwen-7B。
LLM 是OpenAI的ChatGPT等生成式 AI 服务背后的技术。开源让公众可以访问软件程序的源代码,从而允许第三方开发人员修改或共享其设计、修复损坏的链接或扩展其功能。
蒸馏是一种训练较小模型以模仿较大、更复杂模型行为的方法,同时显著降低计算成本。这种做法在许多希望缩小模型规模同时为用户提供类似性能的公司中很常见。
阿里云上个月发布了可与 DeepSeek-V3 相媲美的全新 Qwen 2.5-Max 模型,这一最新举措反映出各大科技公司为了自身客户的利益而支持这家初创公司的模型的趋势日益增长。
例如,华为技术有限公司的云计算部门在农历新年假期期间加班加点地与人工智能基础设施初创公司 SiliconFlow 合作,使 DeepSeek 的 V3 和 R1 模型能够在该公司的 Ascend 平台上供用户使用。
华为云周六在一份声明中表示,该平台的性能与DeepSeek 模型在全球高端图形处理单元上的运行情况相匹配。
云计算技术使企业能够通过互联网管理或分发一系列软件和其他数字资源,就像电网中的电力一样,是一种按需服务。这些资源存储在数据中心内。
中国社交媒体和视频游戏巨头腾讯控股也已开始在其云计算平台上支持 DeepSeek 的 R1 推理模型,用户可以在该平台上执行一个简单的三分钟设置过程,该公司周日表示。
顶级 AI 芯片设计师Nvidia自周四起向其 NIM 微服务的用户开放DeepSeek-R1 ,称该模型为需要逻辑推理、推理、数学、编码和语言理解的任务提供了最先进的推理能力、高推理效率以及领先的准确性。
OpenAI 投资者微软上周早些时候在其 Azure 云计算平台和开发者平台 GitHub 上推出了 R1 支持,允许客户构建在Copilot+ 个人电脑上本地运行的 AI 应用程序。电子商务巨头亚马逊已允许开发人员通过亚马逊网络服务使用 R1 创建应用程序。
与此同时,一些专家质疑DeepSeek高性价比AI模型突破的意义是否被夸大了。
复旦大学计算机科学系教授郑小青表示,DeepSeek 技术报告中的 V3 模型的训练费用不包括与架构、算法或数据的前期研究和实验相关的成本。
郑先生在接受中国《每日经济新闻》采访时表示,DeepSeek 的成功源于工程优化,不会对芯片购买或出货产生巨大影响。