阶跃星辰联合吉利开源两款阶跃Step系列多模态大模型
鞭牛士 2月18日消息,今日,阶跃星辰与吉利汽车集团联合宣布,开源两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。
官方介绍称,根据技术报告中的评测结果,阶跃Step-Video-T2V的参数量和模型性能目前在全球开源视频生成领域都处于领先水平;而阶跃Step-Audio则是业内首款产品级的开源语音交互模型。
据介绍,阶跃Step-Video-T2V模型的参数量达到300亿,可以直接生成204帧、540P分辨率的高质量视频。
而阶跃Step-Audio能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,能和用户自然地进行高质量对话。模型生成的语音具有自然流畅、情商高等特征,同时也能支持不同角色的音色克隆。
