×
加载中...
DeepSeek发布多模态AI模型:称性能可超越OpenAI DALL-E 3
鞭牛士 2025-01-28 08:48

鞭牛士报道,1月28日消息,据外电报道,中国AI 公司 DeepSeek 发布了一套新的多模式 AI 模型,声称其性能可以超越 OpenAI 的DALL-E 3。


这些模型可从 AI 开发平台 Hugging Face 下载,是 DeepSeek 称之为 Janus-Pro 的新模型系列的一部分。它们的参数大小从 10 亿到 70 亿不等。参数大致对应于模型的解决问题的能力,参数较多的模型通常比参数较少的模型表现更好。


Janus-Pro 受到 MIT 许可,这意味着它可以不受限制地用于商业用途。


7a3d460f-6980-4b8d-b7de-9f8e4ffff749.png


DEEPSEEK 的 JANUS PRO 模型的图像输出。图片来源: DEEPSEEK


Janus-Pro 被 DeepSeek 描述为新颖的自回归框架,既可以分析图像,也可以创建新图像。据该公司称,在两个 AI 评估基准 GenEval 和 DPG-Bench 上,最大的 Janus-Pro 模型 Janus-Pro-7B 击败了 DALL-E 3 以及 PixArt-alpha、Emu3-Gen 和Stability AI的 Stable Diffusion XL 等模型。


诚然,其中一些型号比较老旧,大多数 Janus-Pro 型号只能分析分辨率高达 384 x 384 的小图像。但考虑到这些型号的紧凑尺寸,Janus-Pro 的性能令人印象深刻。


DeepSeek在 Hugging Face 上的一篇文章中写道: Janus-Pro 超越了之前的统一模型,达到甚至超过了特定任务模型的性能。Janus-Pro 的简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。


91d389d3-34b9-4d3d-99a1-625d718d4c27.png


DEEPSEEK 的新款 JANUS PRO 型号与竞争对手的比较。图片来源: DEEPSEEK


DeepSeek 是一家中国人工智能实验室,主要由量化交易公司 High-Flyer Capital Management 资助。本周,该公司的聊天机器人应用程序登上了 Apple App Store 排行榜榜首,从而引起了主流关注。


DeepSeek 的语言模型采用计算效率高的技术进行训练,这让许多华尔街分析师和技术专家开始质疑美国能否在人工智能竞赛中保持领先地位,以及对人工智能芯片的需求是否能够持续下去。

扫码下载app 最新资讯实时掌握