La Guía Definitiva para Crear Videos con IA: Del Prompt las Mejores Herramientas
- Nexxant
- 30 jun
- 23 Min. de lectura
Introducción
La creación de videos con inteligencia artificial está evolucionando a un ritmo impresionante, pero un factor sigue siendo el verdadero secreto detrás de los mejores resultados: la calidad de tu prompt. Saber cómo estructurar un buen prompt para video puede marcar la diferencia entre generar una escena visualmente impactante… o terminar con algo genérico y sin vida.
En esta guía completa, aprenderás cómo crear prompts profesionales para generación de videos con IA, utilizando herramientas como Sora, Veo, Runway o Leonardo AI Video. Exploraremos los elementos clave que todo prompt eficaz debe incluir: sujeto, acción, contexto, composición de cámara, movimiento de cámara, estilo visual, ambiente, iluminación, audio y formato final.

Además, tendrás acceso a plantillas listas para usar, ejemplos de prompts reales y una tabla de términos técnicos con las expresiones más utilizadas por las principales plataformas de generación de video con IA del mercado.
Ya sea que quieras crear contenido para YouTube, TikTok, Instagram Reels o proyectos comerciales, esta guía te ayudará a transformar tus ideas en resultados visuales de alto impacto.
1. Elementos Esenciales para un Prompt de Video con IA de Alta Calidad
Si alguna vez intentaste generar un video con IA y te frustraste con resultados genéricos, de baja calidad o completamente fuera de lo que imaginabas… lo más probable es que el problema haya estado en tu prompt. Hoy en día, como estas herramientas aún están en desarrollo, conseguir buenos resultados depende mucho de la calidad y el nivel de detalle del prompt.
La realidad es simple: si quieres obtener videos realistas, impactantes y alineados con tu visión, el secreto está en crear un prompt completo, detallado y estratégicamente estructurado.
Pero… ¿Qué debe contener exactamente un buen prompt para video con IA?
Aquí tienes la lista de elementos fundamentales que todo prompt de video debe incluir:
Lista de Elementos Esenciales de un Prompt de Video con IA:
Sujeto Principal (Subject): ¿Quién o qué es el foco de la escena?
Acción (Action): ¿Qué está haciendo el sujeto? ¿Qué movimiento, expresión o interacción ocurre?
Contexto y Ambientación (Setting): ¿Dónde y cuándo sucede la escena? ¿Qué tipo de entorno o escenario?
Composición de Cámara (Camera Composition): ¿Cómo está posicionada la cámara? ¿Primer plano, plano medio o toma panorámica?
Movimiento de Cámara (Camera Motion): ¿La cámara está fija, sigue al sujeto o realiza algún movimiento cinematográfico como paneo o travelling?
Estilo Visual (Visual Style): ¿Quieres algo fotorrealista, estilo dibujo animado, anime, cyberpunk, cinematográfico, etc.?
Ambiente / Estado de Ánimo / Iluminación (Ambiance / Mood / Lighting): ¿Cuál es el clima emocional y visual? ¿Frío, cálido, oscuro, futurista, dramático?
Audio y Sonido (Opcional): ¿Quieres incluir música de fondo, efectos de sonido o diálogos? (Solo si la herramienta lo permite)
Formato de Video y Relación de Aspecto (Aspect Ratio) (Opcional): ¿Prefieres el video en formato 16:9, 9:16, cuadrado o en scope cinematográfico?
Al incluir estos elementos de manera clara y detallada, aumentas drásticamente las probabilidades de que la IA entienda exactamente lo que deseas… y te entregue un resultado visualmente más impresionante.
👉 Importante: No significa que debas especificarlo todo siempre, pero sí es recomendable definir al menos los puntos clave según el objetivo de tu video. Lo que no especifiques, la IA lo generará según su interpretación o las limitaciones de la plataforma.
⚠️ Notas adicionales:
Audio y sonido: No todas las herramientas actualmente permiten manipular esto.
Formato y relación de aspecto: Algunas plataformas tienen tamaños fijos de salida. Por ejemplo, Sora hoy solo permite resoluciones predefinidas. Veo (dentro de Gemini) tampoco tiene selección de formato, aunque en algunos casos puede adaptarse si se indica en el propio prompt.
2. Plantilla Lista para Crear Prompts de Video con IA
Ahora que ya conoces los elementos esenciales de un buen prompt de video, aquí tienes la plantilla definitiva que puedes copiar, pegar y simplemente completar con los detalles específicos de tu proyecto.
🎬 Plantilla Completa para Prompts de Video con Inteligencia Artificial:
Sujeto Principal (¿Quién o qué es el foco de la escena?):[Describe al personaje, objeto o elemento central de la escena. Ejemplo: "Astronauta femenina joven con traje espacial blanco y cabello corto castaño"]
Acción (¿Qué está sucediendo?):[Describe la acción. Ejemplo: "Caminando lentamente sobre la superficie de Marte mientras observa el horizonte"]
Contexto y Ambientación (¿Dónde y cuándo ocurre la escena?):[Detalla el lugar y el momento. Ejemplo: "Paisaje marciano al atardecer, con cielos anaranjados y terreno rocoso"]
Composición de la Cámara (¿Cómo está encuadrada la toma?):[Define el plano de cámara. Ejemplo: "Plano general con el personaje centrado en el encuadre"]
Movimiento de Cámara (¿La cámara está fija o en movimiento?):[Describe el movimiento de cámara. Ejemplo: "Toma de seguimiento lenta siguiendo al personaje desde atrás"]
Estilo Visual (¿Qué look y acabado visual deseas?):[Define el estilo visual. Ejemplo: "Cinemático y fotorrealista, con alto rango dinámico y profundidad de campo suave"]
Ambiente / Estado de Ánimo / Iluminación (Atmosfera, Color, Tono):[Define la iluminación, el tono emocional y el ambiente general. Ejemplo: "Luz cálida de atardecer con sombras dramáticas y atmósfera polvorienta"]
Audio / Diseño de Sonido (Opcional):[Si la herramienta lo permite. Ejemplo: "Sonido ambiental de viento con música orquestal suave de fondo"]
Formato de Video / Relación de Aspecto (Opcional):[Ejemplo: "16:9 para YouTube o 9:16 para TikTok"]
Con esta plantilla, solo necesitas adaptar los detalles según el tipo de video que deseas crear. No te preocupes si al principio tu descripción no queda completamente lineal: usa y adapta las secciones del template hasta sentirte cómodo con la estructura de un buen prompt de video IA.
👉 En las siguientes secciones del artículo te enseñaremos cómo rellenar cada uno de estos puntos en profundidad, con ejemplos prácticos, consejos de cinematografía y hasta trucos de dirección de fotografía para que tus videos generados por IA se vean mucho más realistas e impactantes.
👉 Consejo: Si enseñas esta estructura a ChatGPT, Gemini o cualquier otra IA generativa, puedes convertirla en tu aliada para construir prompts más completos y efectivos, lo que te permitirá centrarte en los detalles creativos y técnicos de tu video.
3. Cómo Rellenar Cada Elemento del Template de Prompt para Video IA: Guía Paso a Paso
Ahora que ya tienes el template base, es momento de entender cómo completar cada sección con la máxima claridad y efectividad, para que la IA entregue exactamente lo que imaginaste.
Recuerda: Cuanto más detallado y preciso sea tu prompt, mayores serán las posibilidades de obtener un resultado visual de alta calidad.
3.1 Sujeto Principal (Subject)
Pregunta clave: ¿Quién o qué será el foco de la escena?
Este es el primer elemento que la IA interpretará al comenzar a generar el video. Por eso es fundamental describirlo claramente:
Qué incluir en la descripción del sujeto:
Tipo de personaje u objeto: Ejemplo: “astronauta femenina”, “hombre anciano”, “robot futurista”
Edad aproximada (si es relevante): Ejemplo: “en sus 30 años”, “persona mayor”
Características físicas básicas: Color de cabello, altura, complexión, etc.
Ropa y accesorios: Ejemplo: “vistiendo un traje azul marino”, “traje espacial con casco”
Expresiones faciales: Sonriendo, serio, asustado, concentrado…
Postura y movimiento corporal: Sentado, caminando, gesticulando, corriendo…
🎯 Ejemplo de prompt:"Un carismático presentador de noticias masculino de unos 30 años, vistiendo un traje azul marino, con cabello corto y oscuro, de pie con expresión segura."
3.2 Acción (Action)
Pregunta clave: ¿Qué está haciendo el sujeto durante el video?
Aquí defines la dinámica de la escena. Describe de manera clara el movimiento, la interacción y el foco narrativo de la acción.
Ejemplos de tipos de acción:
Interacción física: “caminando por una calle concurrida”, “saltando un obstáculo”
Interacción con objetos o entorno: “señalando una pantalla virtual”, “bebiendo café en una cafetería acogedora”
Expresión de emociones: “sonriendo y riendo”, “llorando en silencio”
Actividades específicas: “informando noticias de última hora”, “tocando la guitarra”, “luchando con una espada”
🎯 Ejemplo de prompt:"Informando noticias de última hora, gesticulando con una mano mientras habla directamente a la cámara."
3.3 Contexto y Ambientación (Context and Setting)
Pregunta clave: ¿Dónde y cuándo ocurre la escena? ¿Qué tipo de entorno tiene?
El contexto define el escenario físico, histórico y visual de tu escena. Determina la estética general y el tipo de fondo que la IA generará.
Qué especificar en la ambientación:
Lugar físico: Estudio de televisión, bosque, ciudad futurista, playa, nave espacial, etc.
Período de tiempo: Actual, futuro, años 80, época medieval…
Clima o condiciones ambientales: Noche, día, niebla, lluvia, atardecer…
Inspiración estética o de franquicia (opcional): "Ciudad cyberpunk inspirada en Blade Runner", "Londres victoriana"
🎯 Ejemplos de prompts:
"Dentro de una sala de redacción futurista iluminada con luces LED."
"En una calle urbana distópica por la noche, con letreros de neón y ligera lluvia."
"En la superficie de Marte, con polvo anaranjado y terreno rocoso al atardecer."
3.4 Composición de Cámara (Camera Composition)
Pregunta clave: ¿Cómo está posicionada la cámara en relación al sujeto? ¿Qué distancia, ángulo y encuadre se están usando?
La composición de cámara define qué aparecerá en pantalla y cómo el público percibirá al personaje o al objeto principal. La elección del encuadre afecta la conexión emocional, el foco narrativo y el contexto visual.
Tipos de planos de cámara más comunes:
Tipo | Nombre Técnico | Cuándo Usarlo |
Primer plano | Close-up | Para destacar expresiones faciales y emociones |
Plano medio | Medium shot | Ideal para diálogos y presentaciones |
Plano general | Wide shot / Long shot | Para mostrar al personaje completo y el entorno |
Primerísimo primer plano | Extreme close-up | Enfoque extremo en detalles: ojos, manos, objetos pequeños |
Plano sobre el hombro | Over-the-shoulder shot | Para mostrar la perspectiva de otro personaje |
Plano subjetivo (POV) | Point-of-view shot | Muestra lo que ve el personaje |
Plano de establecimiento | Establishing shot | Para establecer el escenario antes de la acción |
Vista cenital | Bird’s-eye view | Vista general desde arriba |
Vista de gusano | Worm’s-eye view | Para crear sensación de grandeza o vulnerabilidad |
Plano doble | Two-shot | Muestra a dos personajes en la misma escena |
Plano de seguimiento | Tracking shot | La cámara sigue al personaje en movimiento |
🎯 Ejemplos prácticos de prompts de encuadre:
"Plano medio corto, desde el pecho hasta la cabeza, enfocado en el rostro del presentador."
"Plano general mostrando al personaje caminando por una calle futurista por la noche."
"Vista cenital de un automóvil conduciendo por una carretera en el desierto."
3.5 Movimiento de Cámara (Camera Motion): Cómo Dar Vida a tu Escena
Pregunta clave: ¿La cámara está fija o en movimiento? ¿Habrá acercamientos, alejamientos o desplazamientos laterales?
El movimiento de cámara influye directamente en la dinámica visual y la carga emocional de tu video generado por IA. Un buen movimiento puede aumentar la tensión, mejorar la inmersión, suavizar transiciones o destacar elementos clave de la escena.
Tipos Más Comunes de Movimiento de Cámara
Tipo de Movimiento | Término Técnico | Cuándo Usarlo |
Static Shot | Cámara fija | Entrevistas, monólogos o escenas sin movimiento |
Slow Zoom-In | Zoom lento de acercamiento | Para crear tensión o enfocar un elemento |
Slow Zoom-Out | Zoom lento de alejamiento | Para revelar el entorno o transmitir distancia emocional |
Tracking Shot | Plano de seguimiento | Para seguir a un personaje en movimiento |
Dolly In/Out | Movimiento sobre rieles | Para dar profundidad o énfasis dramático |
Pan Left/Right | Paneo horizontal | Para revelar elementos de un lado a otro |
Tilt Up/Down | Paneo vertical | Para mostrar altura o caída |
Crane/Jib Shot | Plano con grúa | Movimientos amplios de arriba hacia abajo o viceversa |
Handheld Shot | Cámara en mano | Para efectos realistas, estilo documental o de tensión |
360-Degree Pan | Giro de 360 grados | Para lograr una inmersión total alrededor del personaje |
POV Motion | Movimiento de punto de vista | Para simular la visión del personaje |
Push-in / Push-out | Acercamiento o alejamiento dramático | Para impactos emocionales rápidos |
Roll | Giro lateral de cámara (Dutch Roll) | Para crear desequilibrio o tensión psicológica |
Whip Pan | Paneo rápido | Para transiciones dinámicas o efectos de acción rápida |
🎯 Ejemplos prácticos de movimiento de cámara para el prompt:
"Slow zoom-in mientras el presentador da la noticia principal."
"Tracking shot siguiendo al personaje desde atrás mientras camina por el mercado."
"Crane shot descendente para revelar el skyline completo de la ciudad."
"Giro de 360 grados alrededor del personaje principal en la azotea al atardecer."
Consejos Extra:
✅ Si no quieres movimiento: Indica claramente "Static camera" en el prompt para evitar que la IA añada movimientos por defecto.
✅ Si quieres más dinamismo: Puedes combinar movimientos, por ejemplo: "Slow tracking shot with a subtle zoom-in".
3.6 Estilo Visual (Visual Style): Definiendo la Personalidad Artística de tu Video
Pregunta clave: ¿Qué aspecto estético y visual quieres que tenga tu video?
El estilo visual determina la textura, la paleta de colores, el nivel de realismo y la personalidad gráfica. Afecta directamente cómo se percibirá emocional y estéticamente tu proyecto.

Estilos Visuales Más Populares para Videos Generados por IA
Estilo | Características Clave | Cuándo Usarlo |
Photorealistic | Máximo realismo, texturas reales de piel y luz | Para videos que simulan filmaciones reales |
Cinematic | Contrastes controlados, colores cinematográficos | Para trailers, comerciales o storytelling emocional |
Cartoon / 2D Animated | Visual de animación tradicional | Contenidos infantiles, retro o de estilo ligero |
Pixar / Disney Style | 3D estilizado, personajes carismáticos y colores vivos | Para apelar a emociones o narrativas épicas |
Anime Style | Trazos de anime, colores planos, ojos grandes | Contenido dinámico, juvenil o inspirado en cultura pop |
Cyberpunk | Neon, niebla, calles mojadas, ciudades distópicas | Para videos futuristas, urbanos o de ciencia ficción |
Noir / Retro | Blanco y negro, sombras duras, estética vintage | Para misterio, tensión o ambientes clásicos |
Watercolor / Oil Painting / Sketch | Textura de pintura o boceto | Videos artísticos, lyric videos o de ambiente emocional |
Sci-Fi Futuristic | Superficies metálicas, iluminación LED | Temáticas tecnológicas, de futuro o de ciencia |
VHS / Analog / 80s | Glitches, ruido, estética de video antiguo | Para proyectos nostálgicos o lo-fi |
🎯 Ejemplos de descripción de estilo visual en el prompt:
"Photorealistic with shallow depth of field"
"Anime style with bold lines and flat colors"
"Cyberpunk aesthetic with neon lighting and rain-soaked streets"
"Cinematic tone with rich color grading and film grain texture"
Consejos:
✅ Para YouTube Shorts o TikTok, funcionan bien estilos como "Cinematic Vertical", "Viral Social Media Style" o "TikTok Trend Look".
✅ Para videos corporativos o educativos, elige estilos como "Minimalist Corporate Style" o "Clean Explainer Style".
3.7 Ambiance / Mood / Lighting: Cómo Crear Impacto Emocional
Pregunta clave: ¿Qué ambiente emocional, visual y de iluminación deseas transmitir?
Este es uno de los elementos que más influye en la emoción que el espectador sentirá al ver tu video. Incluye clima, color, tipo de luz, temperatura y tonalidad emocional. Puedes elegir uno solo o combinar varios para un resultado más cinematográfico.
Principales Categorías Dentro de Ambiance / Mood / Lighting
Categoría | Ejemplos de Uso |
Mood (Emoción / Ambiente) | Dramatic, Mysterious, Joyful, Dark, Tense |
Lighting Type (Tipo de iluminación) | Soft lighting, High contrast, Backlit, Low-key |
Color Temperature | Warm golden tones, Cool blue tones, Neutral daylight |
Color Palette | Vibrant colors, Muted tones, Monochromatic, Neon, Pastel |
Atmospheric Elements | Foggy environment, Rainy night, Golden hour, Dust in air |
Vibe / Setting Tone | Retro vibe, Futuristic, Cozy coffee shop, Post-apocalyptic feel |
🎯 Ejemplos de cómo describir ambiance en el prompt:
"La atmósfera es dramática, con iluminación cálida de golden hour, alto contraste y sombras suaves."
"Iluminación fría y estéril con tonos metálicos azulados, evocando un laboratorio futurista."
"Escena nocturna misteriosa con niebla densa y luz de fondo fría."
"Interior cálido y acogedor con iluminación ámbar suave y bajo contraste."
Consejos Extra:
✅ Siempre que puedas, combina mood + lighting + color tone en un solo bloque de tu prompt para lograr un resultado más cinematográfico.
✅ Si el video es para TikTok, Shorts o Reels, muchas herramientas IA responden muy bien a expresiones como: "Social media aesthetic with high saturation and fast lighting changes".
✅ Por motivos de espacio, no incluimos ejemplos visuales aquí... ¡pero te recomendamos probar por ti mismo y experimentar!
3.8 Audio / Diseño de Sonido (Opcional)
Pregunta clave: ¿Tu video necesita audio? Si es así, ¿qué tipo? ¿Música de fondo? ¿Sonidos ambientales? ¿Narración?
No todas las herramientas de generación de video por inteligencia artificial ofrecen audio integrado todavía. Sin embargo, muchas de las plataformas más recientes ya comienzan a incluir música automática de fondo, efectos de sonido ambientales e incluso narración con voz sintética.
Si deseas incluir audio directamente desde el prompt, es importante especificarlo de manera clara y detallada.
Tipos de Audio más Comunes en Videos Generados por IA
Categoría de Audio | Ejemplos | Cuándo Usarlo |
Música de Fondo | Orquestal épica, Lo-fi beats, Banda sonora tensa, Pop animado | Para crear atmósfera emocional general |
Efectos de Sonido (FX) | Pasos sobre grava, Vidrios rotos, Viento soplando, Ruido de tráfico urbano | Para dar realismo o reforzar acciones específicas |
Sonidos de Ambiente | Lluvia cayendo, Pájaros cantando, Sonido de oficina ocupada | Para ambientar el fondo sonoro de la escena |
Voz en Off / Diálogos | Narrador masculino con voz profunda, Voz femenina entusiasta, Voz robótica de IA | Para videos educativos, comerciales o narrativos |
Silencio / Sin Audio | “No se requiere audio” | Cuando el video será visualmente puro y el audio se añadirá en la edición |
🎯 Ejemplos de Prompts para Audio:
"Incluir música de fondo orquestal épica con crescendos de cuerdas sutiles y percusión profunda."
"Añadir sonido realista de calle urbana con sirenas lejanas y tráfico ligero."
"Narración con voz masculina profunda en español, dando un discurso motivacional."
"No se requiere audio."
3.9 Formato de Video / Relación de Aspecto (Aspect Ratio / Video Format)
Pregunta clave: ¿Dónde se publicará este video? ¿En YouTube? ¿TikTok? ¿Instagram? ¿Sitio web corporativo?
La relación de aspecto determina el formato visual final del video y afecta directamente la experiencia del espectador según la plataforma.
Relaciones de Aspecto Más Populares para Videos Generados por IA
Relación de Aspecto | Nombre Común | Mejor Uso |
16:9 | Horizontal / Paisaje | YouTube, Vimeo, Páginas web, Presentaciones |
9:16 | Vertical / Retrato | TikTok, Instagram Reels, YouTube Shorts |
1:1 | Cuadrado | Feed de Instagram, Facebook |
2.35:1 / 2.39:1 | Cinemascope / Ultra Ancho | Tráilers de películas, videos con estética cinematográfica |
4:3 | Formato Antiguo / Vintage | Contenido retro, efectos VHS, videos nostálgicos |
Personalizado | Formatos Específicos | Para pantallas LED, señalización digital o proyectos únicos |
🎯 Ejemplos de Prompts para Formato de Video:
"Exportar video en formato widescreen 16:9 para YouTube."
"Formato vertical (9:16) optimizado para TikTok e Instagram Reels."
"Relación de aspecto cinematográfica 2.35:1 para un estilo de tráiler de película."
"Formato cuadrado 1:1 adecuado para el feed de Instagram."
Consejos Finales sobre Formato:
✅ Si no especificas el aspecto, la IA generalmente generará el video en el formato estándar de la plataforma (usualmente 16:9).
✅ Si necesitas múltiples formatos, sé específico: “Generar dos versiones: una en 16:9 y otra en formato vertical 9:16.”
✅ Ten en cuenta las posibles limitaciones de la herramienta: Por ejemplo, Sora actualmente tiene formatos predefinidos, y en algunos casos indicar la relación de aspecto en el prompt no tendrá efecto.
4. Ejemplos de Prompts Completos para Generación de Videos con IA
Ahora que ya conoces cómo estructurar un buen prompt, aquí tienes ejemplos completos y reales para inspirarte. Incluimos tanto versiones en formato de plantilla (con cada sección del prompt separada) como versiones lineales (listas para copiar y pegar directamente).
Estos ejemplos cubren diferentes estilos de video: ciencia ficción cinematográfica, noticias deportivas y contenido social media estilo TikTok.
4.1 Escena de Astronauta (Estilo Cinematográfico Sci-Fi)
Prompt en Formato de Plantilla:
Subject: Lone astronaut wearing a futuristic spacesuit, holding a helmet in one hand.
Action: Standing still, looking out over the alien canyon as wind blows dust across the scene.
Context and Setting: On the edge of a massive alien canyon under a stormy purple sky. Dark clouds are slowly moving and swirling across the sky, while intermittent lightning flashes illuminate different parts of the landscape.
Camera Composition: Wide establishing shot.
Camera Motion: Slow pull-back (dolly out) to reveal the full scale of the landscape.
Visual Style: Cinematic and photorealistic with film grain and shallow depth of field. Cool blue and purple color palette.
Ambiance / Mood / Lighting: Dramatic atmosphere with moving volumetric fog, high-contrast shadows, and dynamic light effects from the lightning.
Audio / Sound Design (Optional): Epic orchestral soundtrack with deep strings, low-end atmospheric rumble, and occasional distant thunderclaps.
Aspect Ratio / Format: 16:9 Cinemascope ratio for cinematic trailer feel.
Prompt Lineal:
A wide establishing shot of a lone astronaut wearing a futuristic spacesuit, standing still on the edge of a massive alien canyon under a stormy purple sky, holding his energy weapn in one hand and looking out over the landscape as wind blows dust across the scene. Dark, dense clouds churn and move slowly across the sky, creating a sense of impending danger. Intermittent lightning flashes illuminate different parts of the canyon at irregular intervals, casting brief, dramatic highlights on the rocky terrain. The camera slowly pulls back (dolly out), revealing the vast scale of the environment. The atmosphere is filled with volumetric fog and high-contrast shadows. The visual style is cinematic and photorealistic, with film grain and shallow depth of field, color graded with cool blue and purple tones. Epic orchestral soundtrack with deep strings, low-end atmospheric rumbles, and distant thunder rolls accompany the scene. 16:9 Cinemascope aspect ratio.
4.2 Presentador de Noticias Deportivas (Estilo Broadcast)
Prompt en Formato de Plantilla:
Subject: Charismatic male news anchor in his 30s, wearing a navy-blue suit, short dark hair, confident expression.
Action: Reporting breaking news, gesturing with one hand while speaking directly to the camera. The specific headline he is delivering is in Portuguese: "Palmeiras ganha o seu primeiro mundial no ano de aniversário de 100 anos do campeonato mundial de clubes."
Context and Setting: Inside a futuristic LED-lit newsroom.
Camera Composition: Medium close-up shot (chest to head level).
Camera Motion: Slow zoom-in.
Visual Style: Photorealistic with shallow depth of field.
Ambiance / Mood / Lighting: Dramatic mood with warm golden-hour lighting, strong contrast, and soft shadows.
Audio / Sound Design (Optional): Subtle newsroom ambient noise with dramatic background music.
Aspect Ratio / Format: 16:9 widescreen, optimized for YouTube.
4.3 Fashion Influencer para TikTok (Estilo Social Media)
Prompt Montado no Template:
1. Subject: Young female fashion influencer, 20s, wearing oversized hoodie, sneakers, long blonde hair.
2. Action: Dancing energetically, moving towards the camera, interacting with the audience.
3. Context and Setting: On a New York rooftop during sunset.
4. Camera Composition: Full-body vertical shot.
5. Camera Motion: Fast-paced zoom-in and out synced with music beat.
6. Visual Style: Vibrant, colorful TikTok aesthetic with high saturation.
7. Ambiance / Mood / Lighting: Upbeat mood, warm sunset lighting with strong highlights.
8. Audio / Sound Design (Optional): Upbeat pop track with heavy bass.
9. Aspect Ratio / Format: 9:16 vertical format, optimized for TikTok and Instagram Reels.
Lineal Prompt:
A vertical full-body shot of a young female fashion influencer in her 20s, wearing an oversized hoodie, sneakers, and with long blonde hair, dancing energetically on a New York rooftop during sunset. She moves towards the camera, interacting with the audience with playful gestures. The camera performs fast-paced zoom-in and out movements synced with the music beat. The visual style is vibrant and colorful, following a high-saturation TikTok aesthetic with warm sunset lighting and strong highlights. An upbeat pop track with heavy bass plays in the background. Format is 9:16 vertical, optimized for TikTok and Instagram Reels.
5. Tabla de Términos Técnicos Recomendados para Prompt Engineering de Videos con IA (con Ejemplos)
Estas tablas resumen los conceptos clave vistos anteriormente en esta guía. Te ayudarán a elegir los términos correctos al redactar prompts para generación de video con inteligencia artificial, en plataformas como Sora, Veo, Runway o Leonardo AI Video.
📸 A. Tipos de Encuadre de Cámara (Camera Composition)
Término en Inglés | Significado | Ejemplo de Uso |
Close-up | Plano cerrado al rostro | "Close-up shot of the speaker's face showing emotion." |
Medium Shot | Desde la cintura o el pecho hacia arriba | "Medium shot of a teacher writing on the board." |
Wide Shot | Personaje completo + entorno | "Wide shot of a dancer on stage." |
Extreme Close-up | Detalle extremo (ojos, manos) | "Extreme close-up of a typing hand." |
Over-the-shoulder | Perspectiva sobre el hombro | "Over-the-shoulder shot of a gamer playing." |
Bird’s-eye View | Vista aérea desde arriba | "Bird’s-eye view of a crowded city street." |
Worm’s-eye View | Vista desde el suelo hacia arriba | "Worm’s-eye view of a skyscraper." |
POV Shot | Punto de vista del personaje | "POV of a cyclist riding through traffic." |
🎥 B. Tipos de Movimiento de Cámara (Camera Motion)
Término en Inglés | Significado | Ejemplo de Uso |
Static Shot | Cámara fija, sin movimiento | "Static shot of a person sitting at a desk." |
Slow Zoom-In | Zoom lento de acercamiento | "Slow zoom-in on the singer’s face." |
Tracking Shot | Seguimiento del personaje | "Tracking shot of a runner on the track." |
Dolly In/Out | Movimiento en riel hacia adentro o afuera | "Dolly in towards the speaker during speech." |
Pan Left/Right | Paneo horizontal | "Pan right to reveal the landscape." |
Tilt Up/Down | Paneo vertical | "Tilt up from the ground to the sky." |
Crane Shot | Movimiento amplio vertical | "Crane shot revealing the entire battlefield." |
Handheld | Cámara en mano, efecto temblor | "Handheld shot for documentary feel." |
Whip Pan | Paneo rápido | "Whip pan transition to next scene." |
🎨 C. Estilos Visuales (Visual Style)
Término | Estilo | Ejemplo de Uso |
Photorealistic | Ultra realista | "Photorealistic style with lifelike skin textures." |
Cinematic | Estilo cinematográfico | "Cinematic look with rich contrast and color grading." |
Cartoon / 2D Animation | Animación tradicional | "2D cartoon style with flat colors." |
Pixar Style | 3D estilizado | "Pixar-style character with big eyes and smooth shading." |
Anime | Estilo de anime japonés | "Anime style with bold outlines and vivid colors." |
Cyberpunk | Neon, lluvioso, urbano, futurista | "Cyberpunk style with rain and neon lights." |
Noir | Blanco y negro, alto contraste | "Noir style with dramatic shadows." |
Watercolor | Acuarela o arte digital | "Watercolor look with flowing paint effects." |
💡 D. Iluminación / Ambiente / Emoción (Lighting / Ambiance / Mood)
Categoría | Ejemplos de Términos |
Lighting Type (Tipo de Iluminación) | Soft lighting, Hard light, Backlight, Low-key lighting, High contrast lighting |
Color Temperature (Temperatura de Color) | Warm golden tones, Cool blue tones, Neutral daylight, Sunset glow |
Mood / Emotion (Estado de Ánimo / Emoción) | Dramatic, Mysterious, Joyful, Tense, Uplifting |
Atmospheric Elements (Elementos Ambientales) | Foggy environment, Rainy night, Golden hour, Dust particles, Volumetric light rays |
Vibe (Término Moderno) | Retro vibe, Cozy coffee shop feel, Corporate clean look, TikTok trending aesthetic |
🎶 E. Audio / Diseño de Sonido (Cuando la Plataforma lo Permita)
Categoría | Ejemplos |
Background Music (Música de Fondo) | Epic orchestral, Lo-fi chillhop, Upbeat pop, Dramatic cinematic score |
Ambient Sounds (Sonidos Ambientales) | City traffic noise, Forest birds, Office ambience, Rain sounds |
Sound Effects (FX) | Footsteps, Glass breaking, Car engine starting, Applause |
Voiceover Type (Tipo de Narración) | Deep male narration, Soft female voice, Robotic voice |
No Audio (Sin Audio) | "No audio required." |
6. Consejos Avanzados de Prompt Engineering para Videos IA (Errores Comunes + Hacks Pro)
6.1 Errores Más Comunes al Crear Prompts para Videos IA
Error | Por Qué Afecta el Resultado | Cómo Evitarlo |
❌ Prompt demasiado genérico | Genera escenas vagas y sin enfoque | Siempre incluye: sujeto, acción, contexto, encuadre y estilo |
❌ No especificar el movimiento de cámara | La IA elige movimientos aleatorios | Define claramente: static shot, slow zoom-in, etc. |
❌ Olvidar iluminación y mood | Escena visualmente plana o emocionalmente incoherente | Siempre especifica: tipo de luz, tono de color, mood |
❌ No definir aspect ratio | La IA entrega formato aleatorio (por defecto 16:9) | Siempre especifica: 16:9, 9:16, 1:1, etc. |
❌ Mezclar estilos visuales incompatibles | Resultado visual incoherente | Mantén un solo estilo por prompt |
❌ Lenguaje ambiguo | La IA puede malinterpretar términos como "dark" (¿estado de ánimo o iluminación?) | Sé técnico y específico: “dark mood with low-key lighting” |
6.2 Hacks para Mejorar la Calidad de Tus Videos IA
✅ Usa adjetivos de alta definición:Ejemplo: "Cinematic close-up with shallow depth of field and realistic skin texture."
✅ Menciona referencias visuales conocidas:Ejemplo: "Blade Runner-inspired cityscape with neon lights" o "Pixar-style character with large expressive eyes."
✅ Combina varios movimientos de cámara:Ejemplo: "Slow tracking shot combined with a subtle zoom-in for dramatic effect."
✅ Define atmósfera física + emocional:Ejemplo: "Foggy urban alley with cold blue lighting and tense mood."
✅ Especifica cámara + lente + efecto:Ejemplo: "Wide-angle lens with soft bokeh effect and shallow focus on foreground subject."
✅ Usa modificadores de intensidad:Ejemplo: "Extreme low-angle shot for exaggerated power dynamic" o "High-intensity dramatic lighting with deep shadows."
✅ Solicita foco automático en un elemento:Ejemplo: "Focus pull from background city lights to foreground character."
✅ Detalla acciones específicas del personaje:Ejemplo: "The actor walks towards the camera, stops, looks directly at lens, and smiles confidently."
✅ Combina movimiento + escenario dinámico:Ejemplo: "Crane shot moving downward as the city skyline lights up at sunset."
Ejemplo de Prompt Avanzado Ideal:
"A dramatic slow-motion tracking shot of a young female warrior in battle armor sprinting through a rain-soaked cyberpunk city at night, with neon reflections on the ground, volumetric fog, and intense blue and purple lighting. Cinematic style, shallow depth of field, high contrast, with epic orchestral background music. 16:9 aspect ratio."
7. Las Herramientas de IA para Creación de Video Más Conocidas
En esta sección, priorizamos herramientas accesibles y que puedan ser probadas fácilmente por los usuarios. Aunque Midjourney es ampliamente reconocida como una de las plataformas más potentes para generación de imágenes, requiere una cuenta paga (el plan básico cuesta aproximadamente 8 dólares mensuales). Por eso, aquí nos enfocaremos en las mejores opciones actuales específicamente para generación de video con IA.
7.1 Sora (OpenAI)
Sora, desarrollado por OpenAI (la misma empresa creadora de ChatGPT), es actualmente una de las plataformas más avanzadas del mundo para generar videos realistas y cinematográficos a partir de prompts de texto.
Características Principales:
Generación de Video desde Texto: Describe la escena en detalle y Sora crea el video desde cero basado en esa descripción.
Calidad Cinematográfica: Produce videos en 1080p, con movimientos de cámara complejos, transiciones realistas, efectos avanzados de iluminación y animaciones fluidas de personajes y objetos.Nota: En cuentas gratuitas y básicas, la resolución está limitada a 720p.
Escenas Largas y Complejas: Capacidad de generar videos de hasta 1 minuto de duración, incluyendo múltiples acciones dentro de la misma escena.Nota: Usuarios del plan básico solo pueden generar videos de 5 segundos, pero es posible unir varios clips.
Comprensión Profunda de la Narrativa Visual: Interpreta con precisión las relaciones espaciales, temporales y semánticas entre los elementos de la escena. Aún así, se requiere un prompt bien elaborado para obtener buenos resultados.
Modos Text-to-Video e Image-to-Video: Permite proporcionar una imagen como frame inicial.
Limitaciones:
Sin Edición Posterior: Para realizar ajustes, hay que modificar el prompt y generar un nuevo video.
Restricciones de Contenido: No permite generar videos con violencia extrema, material sensible o que infrinjan las políticas de OpenAI.
Tiempo de Renderizado: El proceso puede tardar varios minutos por video.
7.2 Veo (Integrado a Gemini)
Veo, desarrollado por Google DeepMind, es el principal competidor de Sora y representa la evolución más reciente de Google en la generación de video con IA.
Características Principales:
Generación de Video en Alta Calidad: Produce videos en resolución 4K, superando a Sora en este aspecto. Ofrece estilos como cinematográfico, documental, animado, time-lapse y hasta tomadas aéreas tipo dron.
Soporte para Movimientos de Cámara Avanzados: Reconoce comandos como zoom, travelling, panorámica, tilt y drone shot, brindando mayor control cinematográfico.
Interpretación Detallada de Prompts: Entiende indicaciones de ángulo de cámara, movimiento de escena, estilo fotográfico y tono narrativo.
Modelado Físico del Entorno: Realiza efectos realistas de profundidad de campo, movimiento de partículas, reflejos y iluminación volumétrica.
Audio Contextual (Veo 3): Ahora genera audio integrado al video, incluyendo diálogos en inglés, portugués y español.
Limitaciones:
Acceso Restringido (Beta Cerrada): Veo 3 aún no está disponible al público general, solo por invitación.
Enfoque en Narrativas Cortas: La duración máxima por ahora es de aproximadamente 60 segundos.
Curva de Aprendizaje: Requiere conocimiento técnico en prompts para obtener resultados cinematográficos.
Tiempo de Generación: Especialmente en 4K, el renderizado puede tomar varios minutos.
Limitación para Cuentas Gratuitas: Solo permite videos de 8 a 10 segundos, con un máximo de 4 renders por día.
Enlaces:
7.3 Kling AI (Kuaishou Technology)
Kling AI, desarrollado por Kuaishou Technology, es una de las herramientas de generación de video por IA más avanzadas disponibles, especialmente destacada por su realismo visual, movimientos complejos de cámara y consistencia de personajes.
Características Principales:
Modos de Generación: Soporta Texto a Video e Imagen a Video, permitiendo transformar descripciones textuales o imágenes estáticas en videos animados.
Frames Inicial y Final: Posibilidad de definir tanto el frame inicial como el final del video.
Control de Cámara: Permite comandos detallados como zoom, panorámica y movimientos tipo dron.
Consistencia de Personajes: Mantiene la coherencia visual del personaje a lo largo de toda la secuencia.
Funciones Avanzadas: Incluye sincronización labial con voz IA, extensión de video y edición granular de escenas.
Audio Disponible (versión 2.1 en adelante).
Plan Gratuito: Incluye 200 créditos iniciales para pruebas.
Limitaciones:
Resolución y Duración: Máximo 1080p y 10 segundos de duración.
Complejidad de Prompts: Prompts demasiado complejos pueden requerir varios intentos para ajustes finos.
Planes de Pago: Desde 10 hasta 92 dólares mensuales, según las funcionalidades incluidas.
7.4 Hailuou AI
Hailuou AI es una plataforma emergente que destaca por su velocidad de generación y facilidad de uso, ideal para creadores principiantes y contenido para redes sociales.
Características Principales:
Modos de Generación: Soporta Texto a Video e Imagen a Video.
Calidad de Salida: Videos en HD, con opción de upscaling a 4K.
Interfaz Intuitiva: Proceso de creación rápido y sencillo.
Funciones Extra: Incluye animación de imágenes estáticas, restyling de videos existentes y uso de templates predefinidos.
Plan Gratuito: Incluye 500 créditos para nuevos usuarios.
Limitaciones:
Duración Máxima: Hasta 8 segundos.
Control de Cámara: Limitado.
Estilo Visual: Más orientado a contenidos conceptuales y estilizados, menos realista que Kling AI.
Link: https://hailuoai.video/
7.5 Leonardo AI (Video-to-Video y Text-to-Video)
Leonardo AI, conocido inicialmente por su potente generación de imágenes, ahora también incursiona con fuerza en la generación de video por IA.
Características Principales:
Modos de Generación:
Text-to-Video: Permite crear videos cortos de hasta 6 segundos a partir de texto.
Image-to-Video: Transforma imágenes o clips cortos en animaciones fluidas, manteniendo la coherencia visual.
Estilos Visuales: Compatible con estilos como cinematográfico, realista, anime o pintura digital.
Consistencia Visual: Alta fidelidad de colores, texturas y estilo de render entre la imagen base y el video.
Facilidad de Uso: La interfaz es muy similar a la del generador de imágenes Leonardo, ideal para usuarios ya familiarizados.
Audio: Gracias a la integración del modelo Veo, ahora es posible generar videos con audio.
Limitaciones:
Duración: Máximo 6 segundos por generación.
Control de Movimiento y Personajes: Bastante básico, sin movimientos complejos ni sincronización labial.
Resolución y FPS: Entre 720p y 1080p, con 15 a 24 FPS, según el estilo.
Tiempo de Renderizado: En estilos complejos, puede ser más lento que otras plataformas.
Planes Gratuitos Limitados: Los planes pagos comienzan a partir de 10 dólares al mes.
Comparativa Rápida: Leonardo AI vs Kling AI vs Hailuou AI
Característica | Leonardo AI (Video) | Kling AI | Hailuou AI |
Modos de Generación | Texto a Video, Imagen a Video | Texto a Video, Imagen a Video | Texto a Video, Imagen a Video |
Resolución Máxima | Hasta 1080p | Hasta 1080p | HD con upscaling a 4K |
Duración Máxima | Hasta 6 segundos | Hasta 10 segundos | Hasta 8 segundos |
Control de Cámara | Básico | Avanzado | Limitado |
Estilo Visual | Cinemático, Realista, Anime, etc. | Realista, Cinemático | Estilizado, Conceptual |
Consistencia Visual | Alta | Alta (Personajes coherentes) | Buena para efectos visuales |
Facilidad de Uso | Alta para usuarios de Leonardo | Requiere experiencia en prompts | Muy fácil para principiantes |
Precio | Desde 10 USD/mes | Desde 10 a 92 USD/mes | Gratis con opciones premium |
Conclusión Final
Crear prompts efectivos para generación de video IA no es solo cuestión de creatividad: es una habilidad técnica que implica comprender lenguaje visual, narrativa y los parámetros específicos de cada herramienta.
Dominar elementos como encuadre, movimiento de cámara, estilo visual, ambiente emocional y formato de salida te permitirá alcanzar resultados más profesionales y visualmente impactantes.
Ya sea para videos corporativos, contenidos para redes sociales, trailers cinematográficos o proyectos artísticos, la estructura de prompts que mostramos aquí puede ser la clave para transformar tus ideas en videos de IA que realmente sorprendan.
👉 Consejo final: Antes de renderizar, siempre pregúntate:"Si le mostrara este prompt a un director de fotografía de Hollywood… ¿sabría exactamente cómo filmarlo?"
Si la respuesta es sí... ¡vas por buen camino!
Ahora es tu turno: copia el template, personalízalo, experimenta con diferentes estilos y comienza a crear videos sorprendentes con inteligencia artificial.
Compártelo en tus redes sociales y continúa siguiéndonos para mantenerte al día con lo último en inteligencia artificial, tendencias de diseño y tecnologías emergentes.
¡Gracias por tu tiempo! 😉
Comentarios