Armox
    Armox Academy 📚
    AI模型参考视频模型Grok Video

    Grok Video

    Grok Video是xAI强大的视频生成套件,具有三种模式:文本转视频、图像转视频和视频编辑。所有模式都支持音频生成。

    Grok Video I2V

    概述

    属性
    提供商xAI
    模型T2V、I2V、编辑
    模态视频
    时长1-15秒 (T2V/I2V),最长8秒 (编辑)
    分辨率480p、720p
    需要提示词

    可用模型

    Grok Video T2V (文本转视频)

    从文本描述生成带音频的视频。

    属性
    成本50-750积分 (根据时长变化)
    基础成本每秒50积分

    Grok Video I2V (图像转视频)

    将图像动画化为带音频的视频。

    属性
    成本52-752积分 (根据时长变化)
    基础成本每秒50积分 + 图像2积分

    Grok Video 编辑

    使用文本描述编辑现有视频。

    属性
    成本360积分
    最大输入8秒

    最佳用途

    • 快速视频生成 — 处理时间短
    • 包含音频 — 原生音频生成
    • 图像动画 — 让静态图像栩栩如生
    • 视频编辑 — 转换和着色视频
    • 灵活时长 — T2V/I2V为1-15秒

    输入

    提示词(必需)

    描述视频场景、动作或编辑。

    连接颜色:黄色

    输入图像(仅I2V)

    要动画化为视频的图像。

    连接颜色:蓝色

    输入视频(仅编辑)

    要编辑和转换的视频。

    连接颜色:绿色

    配置

    时长 (T2V & I2V)

    类型:滑块
    范围:1-15秒
    默认:6

    视频时长。成本随时长增加。

    宽高比 (T2V & I2V)

    类型:选择
    默认:16:9 (T2V)、自动 (I2V)

    选项描述
    16:9横向
    9:16纵向
    1:1正方形
    4:3经典
    3:4经典纵向
    3:2照片横向
    2:3照片纵向
    自动匹配输入图像 (仅I2V)

    分辨率

    类型:选择
    默认:720p

    选项描述
    480p更快,质量较低
    720p标准高清质量
    自动匹配输入 (仅编辑)

    输出

    类型:带音频的视频
    连接颜色:绿色

    使用案例

    文本转视频

    动漫女学生冲出家门,
    樱花飘落,晨光,
    速度线表示匆忙,
    经典少女漫画美学,鲜艳的色彩。
    

    图像转视频

    身穿华丽盔甲的中世纪骑士走过
    神秘的森林,生物发光的植物闪烁着光芒,
    长满发光藤蔓的古老石头废墟,
    黑暗幻想美学。
    

    视频编辑

    给这段黑白影片上色,
    添加温暖的黄金时段照明,
    增强对比度以获得电影般的外观。
    

    获得最佳效果的提示

    1. 详细描述 — 包括镜头移动和照明
    2. 使用I2V保持一致性 — 从图像开始以更好地控制角色
    3. 创意编辑 — 将旧素材转换为新风格
    4. 优化时长 — 较长的视频成本更高,从短视频开始
    5. 匹配宽高比 — 使用自动来保持I2V的图像比例

    价格详情

    时长T2V成本I2V成本
    1秒5052
    6秒300302
    10秒500502
    15秒750752

    视频编辑:最长8秒固定360积分。

    比较

    功能Grok VideoKling 2.6 ProVeo 3.1
    文本转视频
    图像转视频
    视频编辑
    音频
    最大时长15秒10秒8秒
    基础成本 (6秒)3001,2004,000

    相关模型