Grok Video
Grok Video是xAI强大的视频生成套件,具有三种模式:文本转视频、图像转视频和视频编辑。所有模式都支持音频生成。

概述
| 属性 | 值 |
|---|---|
| 提供商 | xAI |
| 模型 | T2V、I2V、编辑 |
| 模态 | 视频 |
| 时长 | 1-15秒 (T2V/I2V),最长8秒 (编辑) |
| 分辨率 | 480p、720p |
| 需要提示词 | 是 |
可用模型
Grok Video T2V (文本转视频)
从文本描述生成带音频的视频。
| 属性 | 值 |
|---|---|
| 成本 | 50-750积分 (根据时长变化) |
| 基础成本 | 每秒50积分 |
Grok Video I2V (图像转视频)
将图像动画化为带音频的视频。
| 属性 | 值 |
|---|---|
| 成本 | 52-752积分 (根据时长变化) |
| 基础成本 | 每秒50积分 + 图像2积分 |
Grok Video 编辑
使用文本描述编辑现有视频。
| 属性 | 值 |
|---|---|
| 成本 | 360积分 |
| 最大输入 | 8秒 |
最佳用途
- 快速视频生成 — 处理时间短
- 包含音频 — 原生音频生成
- 图像动画 — 让静态图像栩栩如生
- 视频编辑 — 转换和着色视频
- 灵活时长 — T2V/I2V为1-15秒
输入
提示词(必需)
描述视频场景、动作或编辑。
连接颜色:黄色
输入图像(仅I2V)
要动画化为视频的图像。
连接颜色:蓝色
输入视频(仅编辑)
要编辑和转换的视频。
连接颜色:绿色
配置
时长 (T2V & I2V)
类型:滑块
范围:1-15秒
默认:6
视频时长。成本随时长增加。
宽高比 (T2V & I2V)
类型:选择
默认:16:9 (T2V)、自动 (I2V)
| 选项 | 描述 |
|---|---|
| 16:9 | 横向 |
| 9:16 | 纵向 |
| 1:1 | 正方形 |
| 4:3 | 经典 |
| 3:4 | 经典纵向 |
| 3:2 | 照片横向 |
| 2:3 | 照片纵向 |
| 自动 | 匹配输入图像 (仅I2V) |
分辨率
类型:选择
默认:720p
| 选项 | 描述 |
|---|---|
| 480p | 更快,质量较低 |
| 720p | 标准高清质量 |
| 自动 | 匹配输入 (仅编辑) |
输出
类型:带音频的视频
连接颜色:绿色
使用案例
文本转视频
动漫女学生冲出家门,
樱花飘落,晨光,
速度线表示匆忙,
经典少女漫画美学,鲜艳的色彩。
图像转视频
身穿华丽盔甲的中世纪骑士走过
神秘的森林,生物发光的植物闪烁着光芒,
长满发光藤蔓的古老石头废墟,
黑暗幻想美学。
视频编辑
给这段黑白影片上色,
添加温暖的黄金时段照明,
增强对比度以获得电影般的外观。
获得最佳效果的提示
- 详细描述 — 包括镜头移动和照明
- 使用I2V保持一致性 — 从图像开始以更好地控制角色
- 创意编辑 — 将旧素材转换为新风格
- 优化时长 — 较长的视频成本更高,从短视频开始
- 匹配宽高比 — 使用自动来保持I2V的图像比例
价格详情
| 时长 | T2V成本 | I2V成本 |
|---|---|---|
| 1秒 | 50 | 52 |
| 6秒 | 300 | 302 |
| 10秒 | 500 | 502 |
| 15秒 | 750 | 752 |
视频编辑:最长8秒固定360积分。
比较
| 功能 | Grok Video | Kling 2.6 Pro | Veo 3.1 |
|---|---|---|---|
| 文本转视频 | 是 | 是 | 是 |
| 图像转视频 | 是 | 是 | 是 |
| 视频编辑 | 是 | 否 | 否 |
| 音频 | 是 | 是 | 是 |
| 最大时长 | 15秒 | 10秒 | 8秒 |
| 基础成本 (6秒) | 300 | 1,200 | 4,000 |
相关模型
- Kling 2.6 Pro — 运动控制专家
- Veo 3.1 — Google的高级选项
- Grok 2 Image — xAI的图像生成