Google model

Veo 3.1

Clips cinematográficos y directables desde texto o imágenes — con sonido que encaja con la escena.

Hecho para tomas hero de marca, revelaciones de producto pulidas y variantes de campaña repetibles.

Text→VideoImage→Video1080p8s16:9 / 9:16Audio
Ejemplo de video IA de Google Veo 3 Fast: Cinematic 8-second TV commercial in 16:9 with sound. From a tiny FPV-style camera flying indoor...
Audio activado8s
  • PriceUSD 0.52/s
  • Duration8s
  • Format16:9
View render →

Casos de uso

Tomas hero de marcaRevelaciones de productoVariantes de campañaAnuncios sociales y variantes de formatoB‑roll cinematográficoPre‑viz y tests de concepto

Por qué Veo 3.1 es potente

  • Encuadre directable (Composición sólida y lenguaje de cámara para tomas repetibles.)
  • Sonido en la misma pasada (Diálogo, ambiente y SFX cuando lo necesitas (o silencioso para post).)
  • Mejor seguimiento del prompt (Transferencia de intención más clara de las “notas de director” al clip final.)
  • Hecho para flujos de continuidad (Referencias + herramientas de extensión ayudan a mantener un look en varios beats.)

Specs reales — Veo 3.1 en MaxVideoAI (720p/1080p, 4–8 s)

Los límites que definen tus renders.
Precio / segundoAudio activado USD 0.52/s · Audio desactivado USD 0.26/s
Texto→VideoSoportado
Imagen→VideoSoportado
Video→VideoSoportado
Imagen de referencia / estiloSoportado
Video de referenciaSoportado
Resolución máx.1080p
Duración máx.8s
Formatos16:9 / 9:16
Opciones de FPS24 fps
Formato de salidaMP4
Salida de audioSoportado
Audio nativoSoportado
Sincronización labialSoportado
Control de cámara / movimientoAdvanced
Marca de aguaNo (MaxVideoAI)
Fecha de lanzamientoOct 2025
Encuadre directableDetails

Fuerte en notas de dirección, encuadre y lenguaje de cámara para tomas repetibles. Ideal cuando necesitas composición de marca consistente.

  • Usa wide/medium/close y verbos de cámara.
  • Ancla la composición con un sujeto principal.
  • Describe el movimiento antes del estilo.
  • Reutiliza la misma receta de plano para variantes.
Sonido y continuidadDetails

El sonido puede generarse en la misma pasada, y las referencias ayudan a mantener un look entre beats. Mantén estable la receta visual para continuidad.

  • Añade cues ligeros de SFX o ambiente.
  • Bloquea paleta e iluminación entre tomas.
  • Haz cambios pequeños y controlados.
  • Usa frames de referencia cuando sea posible.

Galería de ejemplos: renders Veo 3.1 reales

Mira renders de Veo 3.1 generados con los mismos ajustes que tienes en MaxVideoAI.

Ver todos los ejemplos de Veo 3.1 →

Cómo escribir un gran prompt para Veo 3.1

Google DeepMind

Veo funciona mejor cuando especificas sujeto, acción, contexto, cámara y estilo en lenguaje claro.

Tip: la duración + el formato se definen en la UI — tu prompt controla sujeto, acción, cámara, iluminación, estilo y cues de sonido.

Prompt rápido (iteración)

Usa 1–2 frases cuando quieras variaciones.

Quick = variaciones. Úsalo para iterar rápido.

Template (copy/paste)

[Sujeto] [acción] en [contexto], [encuadre + movimiento de cámara], [iluminación], [estilo], [ambiente/sonido].

Example

Handheld smartphone UGC clip of a woman unboxing a new skincare bottle at a kitchen table. She peels the seal, smiles, and turns the bottle toward camera. Soft window daylight, natural colors, subtle room tone + packaging crinkle.

Demo: un prompt secuenciado (con audio nativo)

Ejemplo de video IA de Google Veo 3.1: Shot 1 (0 - 3 s): macro close-up of one earbud rotating slowly on a wooden desk, shallow depth of...
Audio activado8s

Shot 1 (0–3 s): macro close-up of one earbud rotating slowly on a wooden desk, shallow depth of field, warm desk lamp glow. Shot 2 (3–6 s): medium shot of a young professional putting the earbuds in before stepping onto a busy city street, subtle bokeh lights. Shot 3 (6–8 s): close-up of the charging case clicking shut next to a laptop, soft logo reflection in the lid. Camera: smooth dolly moves between shots, handheld feel but not shaky. Lighting: evening, warm indoors transitioning to cool street light, gentle film grain. Audio: city ambience low in the mix, soft electronic music bed, short VO line: “Block the noise, keep the focus.” No subtitles. Negative: no brand names, no on-screen text, no extreme wide angles.

View render →

Consejos y límites

Veo 3.1 es más fácil de controlar cuando escribes como un brief de plano: encuadre, un solo movimiento de cámara y cues claros de iluminación.

Lo que funciona mejor

  • Ganan las notas de director: tamaño de plano + ángulo + un movimiento de cámara (dolly / pan / handheld) antes de describir el estilo.
  • Mantén un solo sujeto principal por plano; que la acción sea física y fácil de leer.
  • Para continuidad, reutiliza la misma “receta de plano” (paleta, luz, sensación de lente) y cambia solo una variable por toma.
  • El audio funciona mejor con cues mínimos: ambiente + 1 sonido clave, o una línea corta de VO.

Problemas comunes → soluciones rápidas

  • Deriva del prompt / ignora detalles → corta acciones extra, mueve cámara + encuadre a la primera línea y mantén restricciones positivas (“fondo limpio”, “sujeto centrado”).
  • El movimiento se ve desordenado → un solo movimiento de cámara, acción más lenta, fondo más simple.
  • Look fuera de marca → bloquea paleta + iluminación, reutiliza el mismo wording, añade un frame de referencia cuando puedas.
  • Texto/señalética se rompe → mantén el texto legible fuera de plano; añade el copy crítico en post.
  • La VO / lip sync falla → acorta líneas y evita monólogos largos.

Límites a tener en cuenta

  • Hasta 8 segundos por render; alarga encadenando clips (o Extend).
  • Máximo 1080p en este routing.
  • Solo 24 fps.
  • Texto UI pequeño y letras diminutas son poco fiables — añade en post.

Veo 3.1 vs Veo 3.1 Fast

Ver detalles de Veo 3.1 Fast →

Usa Veo 3.1 cuando necesites:

  • Mayor fidelidad y pulido
  • Sonido en la misma pasada cuando lo necesitas
  • Seguimiento de prompts más fiable

Usa Veo 3.1 Fast cuando quieras:

  • Pruebas rápidas de concepto y borradores en volumen
  • Variantes A/B más baratas y loops sociales
  • Iteración rápida antes de pasar a los ganadores

Comparar Veo 3.1 con otros modelos de video IA

¿No estás seguro de si Veo 3.1 es la mejor opción para tu toma? Estas comparativas lado a lado muestran los compromisos — precio por segundo, resolución, audio, velocidad y estilo de movimiento — para elegir el motor adecuado rápidamente.

Cada página incluye renders reales y casos de uso prácticos.

Seguridad y personas / semejanza

  • Nada de contenido sexual ni nada que involucre menores.
  • Nada de contenido de odio, acoso o violencia gráfica.
  • No suplantes personas reales o figuras públicas; usa consentimiento para cualquier semejanza/voz.
  • No incluyas imágenes íntimas sin consentimiento ni datos personales privados (direcciones, teléfonos, documentos).
  • Mantén outputs brand‑safe — algunos prompts o imágenes de referencia pueden bloquearse por filtros del proveedor.

FAQ – Veo 3.1

¿Veo 3.1 está disponible en Europa o Reino Unido?

Sí. MaxVideoAI enruta Veo mediante endpoints licenciados de DeepMind, sin contratos separados.

¿Veo 3.1 puede generar video vertical?

Sí. Veo 3.1 admite 16:9, 9:16 y 1:1. Elige 9:16 para Reels/TikTok/Shorts y mantén la acción centrada.

¿Veo 3.1 admite imagen→video?

Sí. Empieza con un still (Imagen→Video) o usa 1–4 imágenes de referencia para guiar un clip Texto→Video.

¿Puedo pasar de 8 segundos?

Los clips base son de 4/6/8 s. Usa Extend y encadena clips; cada extensión es otro bloque de 4–8 s.

¿Cómo mantengo Veo 3.1 on‑brand?

Usa stills de referencia (Nano Banana o tu biblioteca de marca), mantén descripciones consistentes y especifica paleta/iluminación.