Wan 2.6
Wan2.6 提供更高质量的语音生成,支持稳定的多说话人对话,具有更自然、更逼真的音色,并支持生成长达 15 秒的片段。
输入
提示词
提示词扩展
镜头类型
时长
分辨率
宽高比
添加音频(可选)
结果
查看生成记录| 模型与模态 | 积分 / 生成 | 我们的价格 (USD) | 官方价格 (美元) | 折扣 |
|---|---|---|---|---|
Wan 2.6, t2v, i2v, r2v, 720p videoAlibaba | 24 per second | $0.1071 | $0.1 | +7% |
Wan 2.6, t2v, i2v, r2v, 1080p videoAlibaba | 36 per second | $0.1607 | $0.15 | +7% |
Wan 2.6-image imageAlibaba | 7 per image | $0.0313 | $0.03 | +4% |
提示词:
戴着墨镜,正在驾驶飞机并大喊“我们必须立刻降落!”。镜头切换到远景,一架飞机从天空中坠落。
探索 Wan 2.6 在多模态视频创作、电影级叙事以及音画同步方面的强大能力。
将简单的文字提示快速生成画面细节丰富的高质量短视频。
将静态图片转化为动态视频,同时保持风格与细节一致。
自动生成连续场景与多角度镜头,呈现流畅的电影级叙事效果。
让对白、音乐与音效自然贴合画面动作,实现音画同步。
支持 1080p、24fps 视频输出,适合社交媒体与营销场景使用。
结合文字、图片与视频参考,生成更丰富、更具创意的内容。
Wan 2.6 可无缝融入现代内容创作流程,帮助创作者、营销人员和团队更快、更轻松地生成高质量视频。
为 TikTok、Instagram Reels 和 YouTube Shorts 等平台打造吸睛的短视频。支持竖屏和方形比例,让创意无需复杂剪辑或拍摄即可快速呈现。
在几分钟内生成推广视频、产品展示和品牌故事。统一的视觉风格、流畅的镜头切换和电影级叙事,使其非常适合广告素材、落地页和营销活动。
通过多镜头、故事驱动的视频形式,将创意、脚本或概念清晰呈现。无需完整制作团队,也能专业地可视化你的想法。
从视频质量、叙事控制和 API 可用性等方面对比 Wan 2.6 与 Sora,找到最符合你创作或生产需求的方案。
| 功能 | Wan 2.6 | Sora(如 Sora 2) |
|---|---|---|
核心定位 | 注重多镜头叙事与角色一致性的全能型视频生成。 | 更偏向角色驱动的视频模型,常用于社交与应用场景。 |
发布时间 | 2025 年末(12 月) | 2025 年较早阶段(9–10 月更新) |
视频时长 | 单次生成最长 15 秒。 | 普通用户约 15 秒,高级版本可达 25 秒。 |
分辨率 | 最高支持 1080p,24fps。 | 部分版本支持更高分辨率(接近 4K)。 |
多镜头叙事 | 原生支持电影级多镜头生成。 | 更侧重单镜头或角色展示。 |
音频与同步 | 内置音频生成,支持精准口型与音画同步。 | 音画同步表现优秀,偏向角色与互动场景。 |
角色一致性 | 支持跨镜头保持角色外观一致,并支持视频参考。 | 支持角色复用与身份特征,但长序列一致性有限。 |
参考输入 | 支持文字、图片和视频参考输入。 | 角色参考功能有限,视频参考支持较弱。 |
适用人群 | 需要结构化叙事和多场景视频的创作者与营销团队。 | 偏向社交视频创作者和互动型内容。 |