字节跳动推出视频生成模型OmniHuman-1.5，融合创新架构实现多样视频生成

2025-08-30 660

核心提示：近日，字节跳动重磅推出视频生成模型OmniHuman - 1.5，其创新地融合多模态大语言模型与扩散Transformer架构，模拟独特思维模式，

近日，字节跳动重磅推出视频生成模型OmniHuman - 1.5，其创新地融合多模态大语言模型与扩散Transformer架构，模拟独特思维模式，实现了超一分钟的动态视频生成，展现出流畅镜头运动、复杂多角色互动等精彩表现。

创新架构融合独特思维模式

OmniHuman - 1.5模型架构具有创新性，它将多模态大语言模型与扩散Transformer相结合，从而模拟出两种不同思维模式，即缓慢深思的规划与迅捷直觉的反应。

实现高质量长视频生成

凭借两种思维模式结合产生的强大协同效应，OmniHuman - 1.5能够生成时长超一分钟的动态视频。这些视频呈现出流畅的镜头运动，让画面转换自然；包含复杂的多角色互动，人物关系展现生动；还具备高度动态的动作表现，整体视觉效果出色。

以上文章由 AI 总结生成

点赞 0反对 0举报 0 收藏 0 打赏 0评论 0

更多>同类资讯

推荐图文

推荐资讯

点击排行

机电优选

客户服务热线：15221770352

工作日：09:00-18:00

沪ICP备2025120552号-1

Processed in 0.059 second(s), 13 queries, Memory 1.26 M