3月10日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。
Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。可直接生成204帧、540P分辨率的高质量视频。阶跃星辰在不久前的生态开放日上透露,3月份还将开源图生视频模型。
3月10日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Audio 语音模型两款开源多模态大模型,并基于华为昇腾 CANN 异构计算架构和昇腾服务器,完成了对模型的适配。
Step-Video-T2V 是目前全球参数量最大的开源视频生成模型,达到300亿参数。可直接生成204帧、540P分辨率的高质量视频。阶跃星辰在不久前的生态开放日上透露,3月份还将开源图生视频模型。
评论列表