分享好友 资讯首页 频道列表

字节跳动推出视频生成模型OmniHuman-1.5,融合创新架构实现多样视频生成

2025-08-30 08:24130

近日,字节跳动重磅推出视频生成模型OmniHuman - 1.5,其创新地融合多模态大语言模型与扩散Transformer架构,模拟独特思维模式,实现了超一分钟的动态视频生成,展现出流畅镜头运动、复杂多角色互动等精彩表现。


创新架构融合独特思维模式

OmniHuman - 1.5模型架构具有创新性,它将多模态大语言模型与扩散Transformer相结合,从而模拟出两种不同思维模式,即缓慢深思的规划与迅捷直觉的反应。


实现高质量长视频生成

凭借两种思维模式结合产生的强大协同效应,OmniHuman - 1.5能够生成时长超一分钟的动态视频。这些视频呈现出流畅的镜头运动,让画面转换自然;包含复杂的多角色互动,人物关系展现生动;还具备高度动态的动作表现,整体视觉效果出色。


以上文章由 AI 总结生成

反对 0
举报 0
收藏 0
打赏 0
评论 0
亿纬锂能成都量产基地揭牌,“龙泉二号”全固态电池下线
2025年9月2日,亿纬锂能固态电池研究院成都量产基地正式揭牌,备受瞩目的“龙泉二号”10Ah全固态电池成功下线。该电池能量密度达

0评论2025-09-043

摩根大通预测iPhone 17系列除Pro版外价格维稳,全新iPhone 17 Air将亮相
苹果秋季新品发布会前夕,华尔街投行摩根大通发布研报,提前“揭晓”iPhone 17系列的核心看点与价格悬念。报告预测,除Pro机型因

0评论2025-09-042

小米发布智能中控屏Max,众筹价1999元,支持微信通话与全屋智能控制
9月1日,小米发布智能中控屏Max,以1999元的众筹价(建议零售价2499元)及丰富功能,为全屋智能家居控制带来新选择。这款中控屏

0评论2025-09-0213

Meta将于9月18日分享AI智能眼镜进展,或发布SDK及代号“Hypernova”的产品
Meta年度开发者大会Connect大会日程公布,诸多信息强烈暗示其首款带有显示功能的消费级智能眼镜发布在即,相关SDK也可能同期亮相

0评论2025-09-0123

具身智能灵巧手多样抓取仿真数据集(DexonomySim)在数博会开源发布
8月28日,具身智能灵巧手多样抓取仿真数据集(DexonomySim)在2025中国国际大数据产业博览会“高质量数据集主题交流活动”上开源

0评论2025-08-3116

乒超联赛:孙颖莎、蒯曼3-1击败申裕斌、韩菲儿,第四局5-10落后逆转
2025年8月30日上午,在乒乓球俱乐部超级联赛第三阶段第二个比赛日中,深圳大学女队与黄石华新女队展开激烈角逐。首盘女双比赛,

0评论2025-08-317

阿里夸克研发“造点”等多款AI产品,AI生态扩张面临挑战
近日,据Tech星球报道,阿里旗下的夸克在AI领域动作频频,正在研发“造点”这款AI产品,同时计划推出“夸克学习”App,加快“夸

0评论2025-08-3016

中国推出5000美元级别机器人,人形机器人产业发展速度超西方认知
摩根士丹利在最新研究报告中指出,8月北京举办的世界机器人大会和首届世界人形机器人运动会,彰显了中国对人形机器人产业的高度

0评论2025-08-2817

国际问题专家高志凯建议:英伟达向中国销售芯片应缴纳15%安全保证金
近期,著名国际问题专家高志凯建议,英伟达若要向中国销售芯片,需缴纳在华销售收入15%的安全保证金,这一建议引发广泛讨论。该

0评论2025-08-2638

美国Figure AI人形机器人实现自主叠毛巾,引发行业关注与思考
近日,美国Figure AI公司展示了人形机器人自主叠毛巾的新技能,在机器人领域引起了广泛关注。该机器人凭借端到端神经网络,在不

0评论2025-08-2525