2025年12月16日,阿里发布新一代万相2.6系列模型,为专业影视制作和图像创作带来革新。该模型不仅是国内首个支持角色扮演功能的视频模型,且具备全球最全功能,同时在画质、音效等方面显著提升,单次视频时长达国内最高的15s。目前已上线阿里云百炼和万相官网,千问APP也即将接入,进一步拓展玩法。万相模型家族的多种视觉创作能力,已在众多领域广泛应用。
万相2.6系列模型的发布与特性
2025年12月16日,阿里发布新一代万相2.6系列模型。此系列模型面向专业影视制作和图像创作场景全面升级,全新的万相2.6是国内首个支持角色扮演功能的视频模型,同时支持音画同步、多镜头生成及声音驱动等功能,堪称全球功能最全的视频生成模型。万相2.6已同步在阿里云百炼、万相官网亮相。
万相2.6相比前代的升级之处
今年9月,阿里率先在国内发布音画同步的视频生成模型万相2.5,极大提升视频创作效率,在权威大模型评测集LMArena上,万相图生视频位居国内第一。此次发布的万相2.6更是进一步提升了画质、音效、指令遵循等能力,单次视频时长实现国内最高的15s。它新增的角色扮演和分镜控制功能亮点十足,不仅能一键完成单人、多人、人与物合拍的视频,还能自动实现多镜头切换等专业任务,充分满足专业影视级场景需求。
角色扮演功能解析
万相2.6是国内首个支持角色扮演功能的模型,能参考输入视频中的角色外观和音色,实现角色扮演,并按照提示词生成单人、多人、人与物合拍的视频。通义万相在模型结构上集成多项创新技术,可对输入参考视频进行多模态联合建模与学习,参考具有时序信息的主体情绪、姿态和多角度全面视觉特征,同时提取音色、语速等声学特征,在生成阶段作为参考条件控制,实现从画面到声音的全感官全维度一致性保持与迁移,目前可支持单人和多人的表演。这一功能让普通用户也能在影视级画面里展现精湛演技。例如,用户上传一段个人视频,并输入科幻悬疑风格提示词,万相2.6能快速完成分镜设计、角色演绎、画面配音等环节工作,几分钟就能生成一段镜头叙事完整、电影级运镜的短片,帮助用户圆电影主角梦。
分镜控制功能优势
在分镜控制方面,通义万相能通过高层语义理解,将原始输入构建为具备完整故事线与叙事张力的专业级多镜头段落。在多镜头丝滑切换过程中,保持核心主体、场景布局和环境氛围统一建模,确保全片在内容、节奏和氛围上的高一致性。万相2.6可将用户简单的提示词转换为多分镜脚本,生成包含多个镜头的连贯叙事视频,并且保持多镜头间的主体、场景等关键信息的一致性。面向广告设计、短剧制作等专业场景,通过输入连续提示词,万相还能生成一段完整叙事的短片。例如,输入一段广告创意提示词,万相2.6能生成一段包含人物角色和商品的广告视频,并且在多镜头切换的情况下保持主体、场景等关键信息的一致性,让人人都能当导演。
万相2.6的应用与后续规划
即日起,所有人可直接在万相官网体验万相2.6,企业用户还能通过阿里云百炼调用模型API。据悉,千问APP也将于近期上线该模型,并提供更丰富的玩法。目前,万相模型家族已支持文生图、图像编辑、文生视频、图生视频、人声生视频、动作生成、角色扮演及通用视频编辑等10多种视觉创作能力,已广泛应用于AI漫剧、广告设计和短视频创作等领域。
以上文章由 AI 总结生成




