阶跃星辰联合吉利开源两款阶跃Step系列多模态大模型

鞭牛士 2025-02-18 13:45

鞭牛士 2月18日消息，今日，阶跃星辰与吉利汽车集团联合宣布，开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。

官方介绍称，根据技术报告中的评测结果，阶跃Step-Video-T2V的参数量和模型性能目前在全球开源视频生成领域都处于领先水平；而阶跃Step-Audio则是业内首款产品级的开源语音交互模型。

据介绍，阶跃Step-Video-T2V模型的参数量达到300亿，可以直接生成204帧、540P分辨率的高质量视频。

而阶跃Step-Audio能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达，能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征，同时也能支持不同角色的音色克隆。

扫码下载app 最新资讯实时掌握

阶跃星辰 吉利