Grok Imagine

Grok Imagine permite generar imágenes y videos a partir de texto o imágenes, con un fuerte enfoque en la creatividad y la coherencia visual.

Modelo:

Entrada

Sube hasta 7 imágenes

Haz clic o arrastra archivos aquí

Se admiten imágenes

Ver límites de carga

Imagen: JPG / PNG / WEBP, ≤10.0MB, máximo 7 imágenes, ancho y alto ≥300px, proporción 1:2.5 ~ 2.5:1

Prompt(Opcional)

499 / 5000

Modo

Divertido
Normal

Duración(s)

6
30

Resolución

480p
720p

Relación de aspecto

  • 16:9
  • 9:16
  • 1:1
  • 3:2
  • 2:3

Resultado

Ver historial
Modelo y Modalidad
Créditos / Gen
Nuestro precio (USD)Precio oficial (USD)
DESCUENTO
grok-imagine, i2i
imageGrok
4
per images
$0.0179$0.022- 19%
grok-imagine, t2i
imageGrok
4
per 6 images
$0.0179$0.02- 11%
grok-imagine, i2v, t2v, 480p
videoGrok
1.6
per second
$0.0071$0.05- 86%
grok-imagine, i2v, t2v, 720p
videoGrok
3
per second
$0.0134$0.07- 81%
Imagen y Video

Creatividad en Video con la API de Grok Imagine

Prueba gratis la generación de video con IA de Grok Imagine en Crun. Compatible con texto a video, imagen a video y el modo Spicy.

Ver documentación
10 s
Duración máxima
720p
Resolución
3
Modos creativos

Prompt:

Ella se inclina hacia la cámara y dice rápidamente “into videos”

Características clave

Tecnología central
Tecnología del motor Aurora

Grok Imagine, entrenado con decenas de miles de millones de ejemplos mediante el motor Aurora, ofrece generación de texto a imagen de alta precisión líder en la industria y compatibilidad con entradas multimodales.

Modelo de imagen autorregresivo

La arquitectura autorregresiva de Aurora predice los tokens de imagen de forma secuencial, permitiendo un control preciso y salidas coherentes condicionadas.

Sistema de continuidad de fotogramas

Garantiza un flujo visual fluido mediante modelado inteligente entre fotogramas, eliminando artefactos para secuencias suaves.

Ensamblaje multimodelo

Combina modelos de IA especializados para optimizar distintos aspectos de la generación de video y lograr una calidad superior.

Soporte de entrada multimodal

Admite entradas de texto e imagen, incluida la edición imagen a imagen para ajustes específicos y transformaciones de estilo.

Tecnología de transferencia de estilo

Aplica estilos artísticos y efectos preservando el contenido original y la integridad del movimiento.

Flujo creativo instantáneo

La generación con desplazamiento infinito permite crear rápidamente variaciones ilimitadas con procesamiento casi instantáneo.

Grok Imagine: generación creativa multimodo con sincronización audiovisual

Grok Imagine ofrece múltiples modos creativos y, junto con el motor Aurora, permite la generación dinámica de video a partir de texto e imágenes, sincronizando automáticamente el audio de fondo para una creación eficiente y profesional.

Generación de video de alta calidad impulsada por texto e imágenes

Con la API de Grok Imagine, convierte rápidamente prompts de texto o imágenes estáticas en videos realistas o estilizados. Admite escenas dinámicas, animaciones fluidas y narración visual, ofreciendo soluciones eficientes para creación, investigación y diseño.

Transformación precisa de imagen a video

La función Grok I2V genera animaciones suaves a partir de una sola imagen, preservando el estilo y los detalles originales. Es ideal para crear videos cortos y mejorar diseños estáticos, ofreciendo una experiencia visual completa con audio sincronizado, sin necesidad de postproducción.

Generación creativa multimodo e integración audiovisual sincronizada

Grok Imagine ofrece los modos Normal, Fun y Spicy para generar efectos visuales cotidianos, exagerados o artísticos según sea necesario. El motor Aurora permite la generación dinámica de video desde texto e imágenes y ajusta automáticamente el audio de fondo, garantizando una creación eficiente y profesional.

Comparación completa de generación de video con IA: Grok Imagine, Veo 3.1 y Sora 2 Pro

Una comparación técnica detallada de tres modelos líderes de generación de video con IA, que cubre posicionamiento creativo, entradas de referencia, resolución, duración del video, sincronización de audio, cinematografía y consistencia de personajes, ayudando a los profesionales a elegir la mejor opción.

ModeloGrok ImagineVeo 3.1Sora 2 Pro
Posicionamiento
Videos cortos creativos y rápidos
Videos narrativos de alto realismo
Videos narrativos de alto realismo
Video de referencia
No compatible
Compatible
Compatible
Resolución
720p
4K
1080p
Duración del video
10 s
8 s
15 s
Audio nativo
Música, sonido ambiental
Diálogo, efectos de sonido, ambiente
Diálogo, sonido ambiental, efectos sincronizados
Cinematografía y narrativa
Transiciones simples, estilo creativo
Tomas precisas, transiciones complejas
Narrativa continua, movimiento físico fluido
Consistencia de personajes
Consistencia básica de estilo
Referencias múltiples aseguran consistencia
Referencias múltiples aseguran consistencia
Velocidad de generación
Muy rápida
Moderada
Moderada y fiable
Casos de uso típicos
Videos cortos para redes sociales, experimentos creativos
Anuncios, promoción corporativa, edición profesional
Videos narrativos, contenido cinematográfico, escenas realistas

Preguntas frecuentes

  • ¿Qué es la API de Grok Imagine?

    La API de Grok Imagine es un modelo multimodal de xAI que genera videos cortos con audio sincronizado a partir de texto o imágenes.
  • ¿Qué tipos de videos puede generar Grok Imagine?

    Puede generar videos de marketing, clips para redes sociales, videos explicativos, visuales conceptuales y contenido cinematográfico corto.
  • ¿Los videos generados por Grok Imagine incluyen audio?

    Sí, todos los videos incluyen música de fondo y efectos de sonido generados automáticamente que coinciden con las imágenes.
  • ¿Cuánto tiempo suele tardar la generación de video?

    La mayoría de los videos se generan en un plazo de 30 segundos a 2 minutos, y hasta 5 minutos durante periodos de alta demanda.
  • ¿Qué relaciones de aspecto admite Grok Imagine?

    Grok Imagine admite cinco proporciones de imagen (1:1, 2:3, 3:2, 9:16, 16:9) y tres proporciones de video (1:1, 2:3, 3:2) para adaptarse a distintas plataformas.
  • ¿Cuál es la diferencia entre los modos Normal, Fun y Spicy?

    Normal es profesional, Fun es más lúdico y Spicy es más atrevido con una expresión creativa más intensa.
Crunlogo

Crun

  • Español
Crun WhatsApp

Escanea en WhatsApp
para soporte de Crun

© 2026 Crun.ai Inc. Todos los derechos reservados.