Google Veo 3.1
Google Veo 3.1 升级了 AI 视频模型,可实现更逼真的动作生成、更长的视频片段时长、多图像参考控制以及原生 1080p 音频同步输出。
输入
提示词
时长(s)
宽高比
分辨率
结果
查看生成记录| 模型与模态 | 积分 / 生成 | 我们的价格 (USD) | 官方价格 (美元) | 折扣 |
|---|---|---|---|---|
veo 3.1 Fast, t2v, i2v, r2v, 720p-8s videoGoogle | 30 per video | $0.1339 | $0.8 | - 83% |
veo 3.1 Fast, t2v, i2v, r2v, 1080p-8s videoGoogle | 37.5 per video | $0.1674 | $0.96 | - 83% |
veo 3.1 Fast, t2v, i2v, r2v, 4k-8s videoGoogle | 90 per video | $0.4018 | $2.4 | - 83% |
veo 3.1 Lite, t2v, i2v, r2v, 720p-8s videoGoogle | 15 per video | $0.067 | $0.4 | - 83% |
veo 3.1 Lite, t2v, i2v, r2v, 1080p-8s videoGoogle | 22.5 per video | $0.1004 | $0.64 | - 84% |
veo 3.1 Lite, t2v, i2v, r2v, 4k-8s videoGoogle | 75 per video | $0.3348 | N/A | N/A |
veo 3.1 Quality, t2v, i2v, 720p-8s videoGoogle | 225 per video | $1.0045 | $3.2 | - 69% |
veo 3.1 Quality, t2v, i2v, 1080p-8s videoGoogle | 232.5 per video | $1.0379 | $3.2 | - 68% |
veo 3.1 Quality, t2v, i2v, 4k-8s videoGoogle | 285 per video | $1.2723 | $4.8 | - 73% |
在 Crun 上体验 Google 前沿的 Veo 3.1 模型。支持文生视频、图生视频与原生音频同步,让每一帧都具备电影级品质。
示例提示词:
一只可爱的怪物在水下游泳
我们的 API 提供对前沿 AI 工具的全面访问能力,帮助你轻松构建复杂而强大的应用。
相比 Veo 3,音频真实度提升约 40%。可自动生成同步的对白、音效与环境音,实现更加自然的视听融合。
相比 Veo 3,画面一致性提升约 40–60%。显著减少画面扭曲与闪烁,在 8 秒序列内保持稳定的光照与物体连贯性。
相比 Veo 3,提示词还原度提升约 35%。支持广角、推拉、变焦、跟拍等镜头指令,精准呈现你的创作意图。
支持最多上传 3 张参考图片,在视频生成过程中保持角色外观、艺术风格与视觉元素的高度一致。
支持文生视频与图生视频,通过多段视频无缝拼接,轻松构建最长 148 秒的多镜头叙事内容。
提供 Fast 与 Quality 两种模式,均支持 1080p 输出,在生成速度与视觉质量之间实现灵活平衡。
探索 Veo 3.1 如何通过更精细的控制、更强的一致性以及原生音画融合能力,全面提升 AI 视频生成体验,满足可规模化的生产级工作流需求。
Crun 集成 Veo 3.1 API,支持首帧与尾帧同步控制。通过定义起始与结束画面,AI 可精准插值生成自然流畅的运动路径。同时支持多参考图片输入,帮助创作者同时锁定角色设计、环境与光照,确保整个镜头中的视觉一致性。
模型通过参考图片锁定角色身份特征,有效消除角色“闪烁”问题。为满足长叙事需求,Crun 提供智能扩展能力,可基于上一段视频的运动逻辑自然延展画面,突破 8 秒限制,支持更复杂的故事表达。
Veo 3.1 具备原生音频建模能力,可生成与动作高度同步的对白、环境音与音效。结合强大的物理引擎,精准模拟光线反射、重力与物体碰撞,在视觉与听觉层面同时呈现高度真实感。
针对高频生产场景,Crun 提供 Veo 3 Fast 版本,在速度与成本上进行深度优化。该模型可快速将文本或图像转化为高质量、带音频的视频内容,非常适合社交媒体、广告等需要快速迭代与大规模产出的商业场景。
Google 目前提供多种 Veo 视频生成模型,包括 Veo 3.1、Veo 3 与 Veo 2,覆盖从基础文生视频到具备原生音频与高级电影控制能力的高保真视频生成。下表对比了各版本之间的核心技术差异:
| 模型 | Veo 3.1 | Veo 3 | Veo 2 |
|---|---|---|---|
定位 | 高保真文本 / 图像 / 参考视频生成视频,支持原生音频 | 文本生成视频,基础原生音频 | 基础文本生成视频 |
参考视频 | 支持 | 不支持 | 不支持 |
参考图片 | 多图像参考 | 单图像参考 | 单图像参考 |
画面比例 | 16:9、9:16 | 16:9、9:16 | 16:9、9:16 |
分辨率 | 720p、1080p、4K | 720p、1080p、4K | 自动输出 |
时长 | 4s、6s、8s | 4s、6s、8s | 5s、6s、8s |
原生音频 | 对白 / 环境音 / 音乐 | 基础音频 | 不支持 |
镜头语言与叙事 | 高级场景与镜头控制 | 基础控制 | 基础 |
角色一致性 | 显著提升 | 中等 | 易发生漂移 |
生成速度 | 快 | 标准 | 较慢 |
安全与水印 | 数字水印 | 内置水印 | 基础 |
典型使用场景 | 广告 / 短片 / 竖屏社交内容 | 短视频 / 广告片段 | 概念视频 |