← Volver a los modelos

Veo 3.1 – Texto→video e imagen→video en MaxVideoAI (720p/1080p, 4–8 s)

Veo 3.1 – Video cinemático con audio nativo y control de encuadre (4–8 s, 720p/1080p)

720p/1080p4–8 sEntrada de texto o imagen

Genera videos cortos y cinematográficos con Veo 3.1 (DeepMind) dentro de tu workspace de MaxVideoAI: texto→video, imagen→video, presets de encuadre y audio nativo, con precio transparente por segundo.

Describe la escena, elige 4, 6 u 8 segundos, selecciona 16:9, 9:16 o 1:1, decide si quieres audio nativo, y deja que Veo 3.1 entregue metraje pulido para anuncios, explainers, campañas y trabajo con clientes.

Audio on8s

Veo 3.1 – Texto→video e imagen→video en MaxVideoAI (720p/1080p, 4–8 s)

Cinematic 8-second TV commercial in 16:9 with sound. From a tiny FPV-style camera flying indoors, we explore a bright, modern apartment. At…

View render →

Por qué Veo 3.1 es potente en MaxVideoAI:

  • Texto → Video, Imagen → Video y referencia multi-imagen en un solo lugar
  • Controles cinematográficos para encuadre, tono y movimiento antes de renderizar
  • Audio nativo (diálogo, ambiente, SFX) con toggle de audio on/off
  • Seeds y Extend para mantener encuadre consistente y alargar secuencias
  • Pago por uso: solo pagas los segundos que generas
  • Disponible en Europa, UK y global vía endpoints licenciados de DeepMind
  • Diseñado para convivir con Sora 2, Sora 2 Pro, Pika 2.2, Kling, Wan, MiniMax Hailuo, Nano Banana

Casos de uso

  • Tomas hero de marca y reveals de producto
  • Campañas con encuadre y tono consistentes
  • Anuncios sociales en 9:16, 16:9 o 1:1
  • Explicativos cortos, educación y B-roll cinemático
  • Pre-viz y tests de concepto donde importa el lenguaje de cámara

Qué es realmente Veo 3.1 en MaxVideoAI

Sobre el papel, Veo 3.1 es el modelo de video de formato corto más reciente de DeepMind, con audio más rico y mejor adherencia al prompt.

En MaxVideoAI, Veo 3.1 se expone como un motor controlado y listo para producción:

Flujo MaxVideoAI:

  1. 1. Elige Veo 3.1 como motor.
  2. 2. Selecciona Texto → Video o Imagen → Video.
  3. 3. Ajusta duración (4/6/8 s), relación y resolución (720p o 1080p).
  4. 4. Elige presets de encuadre/tono, luego pega un prompt estructurado.
  5. 5. Ve el precio final por clip antes de generar.
  6. 6. Compara con otros motores en la misma interfaz.

Specs reales – Veo 3.1 en MaxVideoAI (720p/1080p, 4–8 s)

Estas specs describen Veo 3.1 exactamente como lo puedes usar hoy vía MaxVideoAI — no demos teóricas de laboratorio.

Duración y salida

  • Duraciones: 4 s, 6 s, 8 s
  • Resolución: 720p (1280x720) o 1080p (1920x1080)
  • Frame rate: 24 fps (cadencia cinematográfica)

Relaciones

  • 16:9 – horizontal / web video
  • 9:16 – vertical / Reels / Shorts / TikTok
  • 1:1 – cuadrado / ubicaciones de feed

Entradas y archivos

  • Prompts de texto como lista de planos (1–3 frases para un beat; Shot 1/2/3 para secuencias de 8 s)
  • Imágenes de referencia: PNG, JPG, WebP; hasta 4 stills para fijar identidad, vestuario e iluminación
  • Imagen → Video: anima un still (Nano Banana o tus assets) en un plano de 4–8 s
  • Sin entrada de video directa en esta configuración; usa Extend y secuenciación para arcos más largos

Audio

  • Audio nativo activado por defecto (VO, ambiente, SFX)
  • Desactívalo para renders silenciosos más baratos si diseñarás sonido luego
  • Trata el audio de Veo como primera pasada y ajusta timing y volumen en post

Precio

  • Por segundo dentro de MaxVideoAI
  • Ejemplo de config: perSecondCentsAudioOn = 40; perSecondCentsAudioOff = 20
  • Audio on (~$0.40/s): 4 s ≈ $1.60; 6 s ≈ $2.40; 8 s ≈ $3.20
  • Audio off (~$0.20/s): 4 s ≈ $0.80; 6 s ≈ $1.20; 8 s ≈ $1.60
  • Sin suscripción: recarga tu wallet de MaxVideoAI y previsualiza el precio antes de renderizar

Tiempo de render

  • Añade aquí tiempo observado (la cola muestra estimaciones en vivo en la app)

Precios

  • USD 0.52/s en 720p
  • USD 0.52/s en 1080p

Veo 3.1 en MaxVideoAI te da presets de encuadre, control de audio nativo, seeds y Extend—para que se comporte como una cámara dirigible, no como una caja negra.

Galería de ejemplos: salidas reales de Veo 3.1

Mira renders de Veo 3.1 en vivo con los mismos ajustes que tienes en MaxVideoAI.

Ver todos los ejemplos de Veo 3.1 →

MaxVideoAI Google Veo 3.1 example – A wide drone-style tracking shot over a canyon at golden hour. A lone rider on a vintage scrambler motorcycle races along a…

Google Veo 3.1 · 6s

A wide drone-style tracking shot over a canyon at golden hour. A lone rider on a vintage scrambler motorcycle races along a…

Recrear este plano →
MaxVideoAI Google Veo 3.1 example – Shot 1 (0–3 s): macro close-up of one earbud rotating slowly on a wooden desk, shallow depth of field, warm desk lamp…

Google Veo 3.1 · 8s

Shot 1 (0–3 s): macro close-up of one earbud rotating slowly on a wooden desk, shallow depth of field, warm desk lamp…

Recrear este plano →
MaxVideoAI Google Veo 3 Fast example – Cinematic 8-second TV commercial in 16:9 with sound. From a tiny FPV-style camera flying indoors, we explore a bright, modern apartment. At…

Google Veo 3 Fast · 8s

Cinematic 8-second TV commercial in 16:9 with sound. From a tiny FPV-style camera flying indoors, we explore a bright, modern apartment. At…

Recrear este plano →

Texto→Video con Veo 3.1

Escribe prompts como una nota corta de dirección: cine, sujeto, acción, contexto y estilo.

1Cinematografía y encuadre – plano medio, wide en tracking, macro cenital, etc.
2Sujeto – quién o qué vemos.
3Acción – qué sucede en 4–8 s.
4Contexto / entorno – oficina, calle de noche, estudio, aula…
5Estilo y ambiente – cinemático, realista, documental; luz y color.
6Pistas de audio – ambiente, estilo musical, una línea corta de VO; especifica “sin subtítulos” si no quieres texto en pantalla.
7Formato y duración – ej. 8 s, 16:9 (o 9:16 / 1:1).

Plano medio de [sujeto] en [entorno], [acción clara] en 8 s. Cámara [movimiento], 16:9 a 1080p, look ciné con [luz y color]. Audio: [ambiente] + [música/VO], sin subtítulos.

Pégalo en MaxVideoAI, elige Veo 3.1, ajusta duración/orientación y renderiza.

Flujo Imagen→Video con Veo 3.1 (+ Nano Banana)

Combina Veo 3.1 con Nano Banana para fijar estilo e iterar en movimiento.

  1. Genera 1–4 stills de referencia en Nano Banana (o importa stills de tu marca).
  2. Envíalos a Veo 3.1 como imágenes de referencia en Texto→Video, o parte de un still en Imagen→Video.
  3. Enfoca el prompt en movimiento, timing y audio: cómo se mueve la cámara, cómo se mueve el sujeto y cómo debe terminar el beat a 4/6/8 s.
  4. Regenera con las mismas referencias para mantener identidad consistente.
  • Clips hero de producto on-brand
  • Animaciones de logo y títulos con fondos consistentes
  • Visuales de explainers cortos basados en diagramas o stills de UI

Clips multi-shot y secuenciados – beats de 6–8 s dirigidos en Veo 3.1

Veo 3.1 puede comprimir una mini-secuencia en un solo clip de 6 u 8 segundos cuando escribes un prompt estructurado.

Usa seeds y Extend para mantener el encuadre consistente entre beats.

  • Apunta a 2–3 tomas por clip de 8 segundos.
  • Una acción principal y un movimiento de cámara claro por beat.
  • Mantén sujeto, vestuario y entorno consistentes; usa referencias para fijarlos.
  • Trátalo como una escena con varios ángulos, no muchos lugares.
  • Extiende tomas fuertes para construir secuencias de 12–24 s.

Demo: un prompt secuenciado (con audio nativo)

Audio on8s

Demo: un prompt secuenciado (con audio nativo)

Shot 1 (0–3 s): macro close-up of one earbud rotating slowly on a wooden desk, shallow depth of field, warm desk lamp…

View render →

Micro-historia cinemática de producto de 8 s para auriculares inalámbricos (16:9, 1080p)

Shot 1 (0–3 s): macro de un auricular girando lento en un escritorio de madera, poca profundidad, lámpara cálida.

Shot 2 (3–6 s): plano medio de un joven profesional poniéndose los auriculares antes de salir a una calle concurrida, bokeh suave.

Shot 3 (6–8 s): close-up del estuche cerrándose junto a un portátil, reflejo suave del logo en la tapa.

Cámara: dollies suaves entre shots, sensación handheld pero estable.

Luz: tarde, interior cálido pasando a luz fría de calle, grano de película suave.

Audio: ambiente de ciudad bajo en la mezcla, cama electrónica suave, una línea corta de VO: “Bloquea el ruido, mantén el foco.” Sin subtítulos.

Negativo: sin marcas, sin texto en pantalla, sin ultra gran angular.

  • Estructura clara de 3 beats con entorno coherente y cinematografía definida.
  • VO realista que cabe en 8 s; “sin subtítulos” explícito para evitar overlays de texto.

Consejos y límites

  • Buen control de cámara con presets de encuadre y pistas de movimiento
  • Ideal para anuncios, explainers y campañas que necesitan consistencia entre variantes
  • Audio nativo para primera pasada de diseño sonoro y VO
  • Maneja mejor secuencias cortas y enfocadas que prompts caóticos
  • Clips de 4–8 s; usa Extend y edición para ir más largo
  • Máximo 1080p — sin salidas 4K en esta configuración
  • Texto/UI diminuto es hit-or-miss; pon el copy crítico en post
  • Si deriva, ajusta sujeto y cámara y reduce acciones

Si te apoyas en estas restricciones, Veo 3.1 se vuelve una herramienta repetible y dirigible, no una máquina tragamonedas.

Seguridad, personas y semejanza

  • No generes figuras públicas reales, políticos o celebridades.
  • Nada de menores en contextos riesgosos o sugestivos; nada de contenido sexual explícito ni escenas de odio/violencia.
  • Evita usar la semejanza de personas reales sin consentimiento.
  • Algunos prompts e imágenes pueden bloquearse o ajustarse por políticas del proveedor; es normal.
  • Personajes genéricos y escenas ficticias están bien.
  • Aplican políticas del proveedor y marcas de procedencia tipo SynthID; MaxVideoAI añade sus propios filtros.

Estas barreras mantienen Veo 3.1 usable y conforme para trabajo profesional.

Veo 3.1 vs Veo 3.1 Fast – Resumen

  • Veo 3.1 es el nivel premium, de máxima fidelidad, con audio y movimiento más ricos.
  • Veo 3.1 Fast es más barato y rápido para borradores y variantes sociales.
  • Borrador en Veo 3.1 Fast, luego regenera ganadores en Veo 3.1 a 1080p con audio nativo.
Comparar Veo 3.1 vs Veo 3.1 Fast →

FAQ – Veo 3.1 en MaxVideoAI

¿Está disponible Veo 3.1 en Europa o UK?

Sí. MaxVideoAI enruta Veo vía endpoints licenciados de DeepMind; no necesitas contratos separados.

¿Puede generar video vertical?

Sí: 16:9, 9:16 y 1:1. Elige 9:16 para Reels/TikTok/Shorts y centra la acción.

¿Admite imagen→video?

Sí. Empieza con un still (Imagen→Video) o usa 1–4 imágenes de referencia en Texto→Video.

¿Puedo pasar de 8 segundos?

Bases de 4/6/8 s. Usa Extend y encadena clips; cada extensión es otro bloque de 4–8 s.

¿Cómo lo mantengo on-brand?

Usa stills de referencia (Nano Banana o librería de marca), descripciones consistentes y paleta/luz explícitas.

Explora otros modelos

Compara precio, latencia y presets con el resto del catálogo.

google-veo

Google Veo 3.1 Fast

Use Veo 3.1 Fast for affordable, fast AI video generation. Up to 8-second clips with optional native audio—ideal for social formats and iterative testing.

Comparar Veo 3.1 vs Veo 3.1 Fast →

google-veo

Google Veo 3.1 First/Last Frame

Upload starting and ending frames, write a brief, and let Veo 3.1 animate seamless transitions with optional native audio. Swap to Fast mode for cheaper iterations.

Comparar Veo 3.1 vs Veo 3.1 Fast →

openai

OpenAI Sora 2

Create rich AI-generated videos from text or image prompts using Sora 2. Native voice-over, ambient effects, and motion sync via MaxVideoAI.

Comparar Veo 3.1 vs Veo 3.1 Fast →

Veo 3.1 en MaxVideoAI te da acceso directo y pago por uso al motor de video de formato corto más controlable de DeepMind.

Los controles de encuadre y audio hacen que se sienta como una cámara virtual, no solo otro generador caja negra.

Abrir Generate