Capítulo 9¶
Ingeniería de Prompts para imágenes y video¶
9.0 Objetivo del capítulo¶
Al finalizar este capítulo serás capaz de:
- Diseñar prompts profesionales para generación de imágenes y video.
- Comprender la estructura de un prompt multimedia y cómo modularlo. [web:185][web:189]
- Adaptar un mismo concepto visual a diferentes plataformas (ChatGPT, Gemini, Midjourney, Flux, Ideogram, Stable Diffusion, Veo, Sora, Kling, Runway, Pika). [web:176][web:178]
- Controlar estilo, composición, iluminación, cámara, movimiento y narrativa visual mediante texto. [web:185][web:189]
- Construir una biblioteca reutilizable de prompts multimedia dentro de tu PromptBook Profesional.
- Incorporar metodologías que seguirán siendo útiles aunque cambien los modelos y las UIs.
Nos centraremos en principios y estructuras de diseño visual, apoyándonos en documentación oficial de OpenAI, Black Forest Labs (Flux), Microsoft, Stability y otros proveedores. [web:176][web:178][web:186]
Nota
Un buen prompt multimedia no es una lista de comandos, sino una descripción clara y estructurada de una escena: qué quieres ver, cómo debe verse y para qué la vas a usar.
9.1 La IA como herramienta de creación visual¶
De producir imágenes a diseñar experiencias visuales¶
La aparición de modelos como ChatGPT Images, DALL·E 3, FLUX.2, Midjourney, Stable Diffusion, Runway y otros ha transformado la producción de contenido visual. Hoy puedes generar imágenes y clips de video a partir de descripciones textuales, sin necesidad de dominar una cámara, un set de iluminación o un software complejo de edición. [web:176][web:178][web:187]
Sin embargo, la diferencia entre generar imágenes y diseñarlas es crucial:
- Generar imágenes es pedir “hazme una imagen de X” y aceptar lo que el modelo devuelve.
- Diseñar imágenes implica especificar sujeto, composición, estilo, iluminación y contexto de uso, revisar resultados y iterar hasta lograr una pieza coherente con tu objetivo visual. [web:185][web:190]
graph TD
IDEA[Idea visual] --> PROMPT[Prompt diseñado]
PROMPT --> IA[Modelo de imagen/video]
IA --> BORRADOR[Imagen / clip inicial]
BORRADOR --> REV[Revision humana]
REV --> AJUSTE[Prompt ajustado]
AJUSTE --> IA2[Iteracion]
IA2 --> PIEZA[Resultado final]
Este flujo muestra que la IA es parte del proceso creativo, no su sustitución completa. El criterio humano sigue siendo responsable de decidir cuándo una imagen o un video es adecuado, ético y útil para el proyecto. [web:181][web:188]
[Ilustración: Una secuencia de tres imágenes conceptuales: la primera es un boceto textual, la segunda es un borrador generado por IA, la tercera es la versión final tras ajustes, destacando la evolución desde idea a diseño refinado.]
Curiosidad
Modelos modernos como FLUX.2 permiten incluso usar varias imágenes de referencia para ajustar estilo, composición y colores, mezclando texto y ejemplos como parte del diseño visual. [web:178][web:185]
Conclusión de la sección: la IA ha democratizado la generación visual, pero el diseño sigue dependiendo de tus decisiones. La Ingeniería de Prompts te ofrece el vocabulario y la estructura para convertir ideas en escenas consistentes, más allá de “probar suerte” con descripciones sueltas. [web:176][web:185]
9.2 Anatomía de un prompt visual¶
La mayoría de guías oficiales coinciden en que un buen prompt visual describe varios elementos clave: sujeto, escenario, composición, iluminación, color, estilo, lente/cámara, perspectiva, atmósfera, calidad y formato. [web:176][web:185][web:189]
Componentes de un prompt visual¶
- Sujeto: qué aparece en la imagen (persona, objeto, paisaje, interfaz, escena educativa).
- Escenario: dónde ocurre (aula, laboratorio, ciudad, entorno natural, interfaz digital).
- Composición: distribución de elementos (primer plano, fondo, regla de tercios, simetría, vista cenital, etc.).
- Iluminación: tipo de luz (suave, dura, contraluz, golden hour, luz de estudio, luz ambiental). [web:185]
- Color: paleta dominante (cálida, fría, monocromática, colores corporativos, hex codes). [web:185]
- Estilo artístico: fotográfico, ilustración vectorial, pintura digital, flat design, 3D, comic, etc. [web:176][web:189]
- Lente / cámara: focal (35 mm, 85 mm, gran angular), tipo de encuadre (close-up, plano medio, plano general). [web:185]
- Perspectiva: ángulo de visión (desde arriba, desde abajo, en primera persona, isométrica). [web:185]
- Atmósfera: emociones y ambiente (sereno, dinámico, académico, corporativo, inspirador). [web:190]
- Calidad: nivel de detalle y resolución (alta definición, estilo boceto, resolución para web o impresión). [web:176][web:180]
- Formato: relación de aspecto (16:9, 1:1, 9:16), tipo de salida (JPEG, PNG, WebP, duración de video, etc.). [web:180][web:186]
Relación con OCRFE¶
Puedes mapear estos componentes al framework OCRFE:
- Objetivo: propósito visual (banner educativo, portada de curso, reel informativo, storyboard).
- Contexto: audiencia, plataforma, restricciones de marca o ética. [web:181][web:188]
- Rol: perspectiva creativa (fotógrafo, director de arte, diseñador instruccional, director de fotografía).
- Formato: estructura técnica (resolución, relación de aspecto, duración, estilo de salida). [web:176][web:180]
- Evaluación: criterios de éxito (claridad del mensaje, coherencia con branding, legibilidad de texto, consistencia entre escenas).
graph TD
OCR[OCRFE] --> OBJ[Objetivo]
OCR --> CTX[Contexto]
OCR --> ROL[Rol]
OCR --> FORM[Formato]
OCR --> EVAL[Evaluacion]
OBJ --> SUJ[Sujeto]
CTX --> ESC[Escenario]
CTX --> ATM[Atmosfera]
ROL --> EST[Estilo]
FORM --> CAM[Lente/Camara]
FORM --> FMT[Formato salida]
EVAL --> QUAL[Calidad percibida]
Este diagrama ilustra cómo OCRFE se convierte en la columna vertebral de tu prompt visual: cada sección te obliga a pensar en aspectos clave antes de pedir la imagen o el video. [web:31][web:185]
[Ilustración: Un diagrama de anotaciones sobre una imagen de ejemplo, con flechas que señalan “sujeto”, “composición”, “iluminación”, “color” y “perspectiva”, mostrando cómo cada aspecto se describe en el prompt.]
Dato relevante
Black Forest Labs propone estructuras como[Sujeto] + [Accion] + [Estilo] + [Contexto] + [Iluminacion] + [Tecnico]para FLUX, que encajan muy bien con OCRFE y con la anatomía descrita aquí. [web:185][web:189]
Conclusión de la sección: entender la anatomía de un prompt visual te permite pasar de descripciones vagas a instrucciones precisas que controlan sujeto, composición y estética. Integrar esto con OCRFE asegura que tus prompts multimedia sean coherentes con el propósito educativo o profesional del proyecto. [web:185][web:189]
9.3 Prompts para imágenes¶
Vamos a aplicar estos principios a distintos tipos de imagen: fotografía, ilustración, arte conceptual, personajes, infografías, iconografía, branding, logotipos y materiales educativos.
Fotografía¶
Ejemplo de prompt fotográfico educativo:
Objetivo:
Crear una fotografia para la portada de un curso de Ingenieria de Prompts.
Contexto:
La imagen se usara en una landing web y en redes sociales. Publico: docentes y estudiantes de tecnologia.
Rol:
Actua como fotografo especializado en retratos academicos.
Formato:
Imagen horizontal 16:9, alta resolucion, estilo fotorealista.
Descripcion visual:
Retrato de una persona adulta latinoamericana frente a una pizarra con diagramas abstractos de IA (sin texto legible). Iluminacion suave de estudio, fondo ligeramente desenfocado, colores calidos, atmosfera profesional y cercana.
Ilustración y arte conceptual¶
Objetivo:
Generar una ilustracion vectorial para explicar el concepto de PromptBook.
Contexto:
Se integrara en un capitulo de libro tecnico y en una infografia educativa.
Rol:
Actua como ilustrador de tecnologia educativa.
Formato:
Imagen 4:3, estilo flat design, colores corporativos de la institucion.
Descripcion visual:
Una carpeta digital etiquetada "PromptBook" conectada por lineas a varias ventanas flotantes de prompts y resultados, con iconos de texto, codigo e imagen alrededor. Fondo claro, sin personajes reales.
Personajes y personajes consistentes¶
Objetivo:
Diseñar un personaje consistente para materiales educativos sobre IA.
Contexto:
El personaje aparecerá en presentaciones, videos y guias PDF.
Rol:
Actua como diseñador de personajes.
Formato:
Estilo semi-realista, 3/4 de cuerpo, relacion 1:1.
Descripcion visual:
Personaje docente, de unos 35–45 años, vestimenta casual-profesional, con una tablet en la mano mostrando iconos de IA. Expresion amable y segura. Fondo simple con formas geometricas.
Infografías, iconografía y branding¶
Infografía:
Objetivo:
Generar una infografia visual que resuma el flujo de trabajo de un PromptBook.
Formato:
Imagen vertical 9:16, estilo minimalista, colores azules y verdes.
Descripcion visual:
Cuatro bloques principales (Principios, Patrones, Plantillas, Flujos) conectados mediante flechas. Cada bloque con un icono simple (libro, patron, plantilla, engranaje). Texto minimo, priorizar claridad visual.
Logotipo / branding:
Objetivo:
Diseñar un logotipo simple para "Academia El Profe" centrado en tecnologia y enseñanza.
Formato:
Estilo vectorial, monocromatico + un color acento.
Descripcion visual:
Icono de una pizarra estilizada con un simbolo de IA (nodo conectado) y una silueta sencilla de persona explicando. Tipografia sans serif clara debajo, sin imitar estilos de marcas existentes.
| Tipo de imagen | Enfoque en el prompt |
|----------------------|-----------------------------------------------|
| Fotografia | Sujeto realista, lente, iluminacion, entorno |
| Ilustracion | Estilo grafico, paleta, simplicidad |
| Arte conceptual | Ideas abstractas, atmosfera, textura |
| Personajes | Rasgos, vestimenta, estilo consistente |
| Infografias | Estructura, bloques, iconos, legibilidad |
| Branding / logos | Simplicidad, originalidad, coherencia de marca|
[Ilustración: Una serie de mini-vistas en mosaico que muestran versiones conceptuales de foto, ilustración, personaje e infografía del mismo tema educativo, resaltando cómo cambia el estilo pero permanece el mensaje.]
Error común
Pedir “una imagen bonita sobre IA” sin especificar tipo de contenido (foto, ilustración, infografía) ni propósito. Esto suele producir resultados poco útiles para proyectos profesionales. [web:190]
Conclusión de la sección: diseñar prompts para imágenes requiere elegir primero el tipo de pieza visual y luego describir sujeto, estilo y propósito. Con OCRFE y la anatomía del prompt, puedes producir material coherente para educación, branding y comunicación institucional. [web:176][web:185]
9.4 Prompts para video¶
Los modelos de generación de video (Veo, Sora, Kling, Runway, Pika y otros) están avanzando rápido, pero comparten principios similares para diseño de prompts: describir movimiento, cámara, ritmo e intención narrativa. [web:176][web:187]
Videos educativos y tutoriales¶
Objetivo:
Crear un clip educativo de 30 segundos que explique visualmente el concepto de PromptBook.
Contexto:
Se usara como intro de un curso online.
Rol:
Actua como director de video educativo.
Formato:
Relacion 16:9, estilo animacion ligera (motion graphics), sin voz.
Descripcion visual:
Secuencia de transiciones donde una carpeta digital se abre y muestra distintas secciones (Principios, Patrones, Plantillas, Flujos) con iconos simples. Movimiento suave, ritmo moderado, paleta de colores consistente.
Reels, comerciales y storytelling¶
Reel para redes sociales:
Objetivo:
Crear un reel vertical de 15 segundos que invite a docentes a aprender Ingenieria de Prompts.
Formato:
Relacion 9:16, ritmo dinamico.
Descripcion visual:
Serie rapida de escenas: aula moderna, pantallas con prompts, estudiantes colaborando. Texto superpuesto corto ("Disena conversaciones inteligentes"). Cambios de plano sincronizados con ritmo visual, paleta coherente con la marca.
Comercial / storytelling:
Objetivo:
Generar un video breve con narracion visual sobre el impacto de IA en la educacion.
Rol:
Actua como director de fotografia.
Formato:
Clip de 45 segundos, estilo cinematografico.
Descripcion visual:
Comienza con una escena de aula tradicional (camara fija, iluminacion suave). Transicion a aula tecnologica con estudiantes usando laptops e IA (paneos, planos detalle de pantalla). Termina con plano amplio mostrando colaboracion docente-estudiante. Movimiento de camara fluido, uso de profundidad de campo.
Animación y narrativa¶
Objetivo:
Crear un video animado explicando los 4 componentes clave de un PromptBook.
Formato:
Animacion 2D, estilo educativo, duracion 60 segundos.
Descripcion visual:
Personaje guía recorre un entorno digital donde cada seccion (Principios, Patrones, Plantillas, Flujos) aparece como una puerta. El personaje entra y sale de cada puerta brevemente, con iconos y texto corto en pantalla. Movimiento de camara sencillo, ritmo claro y pausado.
| Tipo de video | Enfoque principal en el prompt |
|----------------------|-----------------------------------------------|
| Educativo | Claridad de conceptos, ritmo didactico |
| Reel | Duracion corta, formato vertical, impacto |
| Comercial | Narrativa de marca, cinematografia |
| Tutorial | Secuencia paso a paso, enfoque en detalles |
| Animacion | Personajes, movimiento, timing |
[Ilustración: Un storyboard simplificado con cuatro viñetas que representan momentos clave de un video educativo, cada viñeta acompañada de notas de cámara, movimiento e iluminación.]
Consejo
Piensa tus prompts de video como micro guiones: describe principio, desarrollo y cierre, además de encuadre y movimiento, en lugar de limitarte a “video sobre X”. Esto ayuda a modelos como Sora, Veo o Runway a generar clips coherentes. [web:187]
Conclusión de la sección: los prompts de video añaden una capa temporal al diseño visual. Debes especificar no solo qué se ve, sino cómo cambia, a qué ritmo y con qué intención narrativa, siguiendo estructuras similares a las de un guion. [web:187]
9.5 Adaptando prompts según la plataforma¶
Cada plataforma de generación visual tiene particularidades: algunas siguen mejor instrucciones detalladas, otras favorecen estilos artísticos específicos, algunas requieren parámetros técnicos explícitos (resolución, steps, guidance). [web:176][web:180][web:185]
En lugar de memorizar diferencias, te conviene adoptar una metodología de adaptación:
- Diseña un prompt base en lenguaje natural bien estructurado (OCRFE + anatomía visual).
- Ajusta ese prompt según las capacidades y convenciones de cada modelo.
Ejemplo de prompt base¶
Prompt base:
"Retrato fotorealista de una docente latinoamericana en un aula moderna, con estudiantes al fondo usando laptops. Iluminacion suave, colores calidos, atmosfera cercana y profesional, relacion 16:9, alta resolucion."
Adaptaciones típicas¶
-
ChatGPT / DALL·E / ChatGPT Images: suele funcionar bien con descripciones en lenguaje natural; puedes añadir instrucciones de estilo (“estilo fotografico profesional”) y dejar que el sistema gestione formato. [web:183][web:188]
-
Flux (FLUX.2): la documentación sugiere usar estructuras explícitas y detallar iluminación, color y aspectos técnicos, sin negative prompts. [web:178][web:185][web:189]
Prompt FLUX:
"Retrato fotografico de una docente latinoamericana, sonriendo, en un aula moderna con estudiantes usando laptops al fondo, ligeramente desenfocados. Estilo fotorealista, iluminacion suave de estudio, paleta de colores calidos (#f4b26b, #fce9d9), relacion 16:9, alta definicion."
-
Midjourney / Stable Diffusion: suelen beneficiarse de prompts más segmentados y pueden requerir parámetros adicionales (por ejemplo,
--ar 16:9, niveles de detalle) según la UI. [web:186] -
Ideogram: está orientado a texto y gráficos; conviene enfatizar tipografía y legibilidad cuando se incluyen palabras.
-
Modelos de video (Veo, Sora, Kling, Runway, Pika): requieren más descripción temporal y narrativa; puedes usar tu prompt base como descripción de escena y añadir secciones para comienzo, desarrollo y final.
Prompt Sora/Veo:
"Clip de 20 segundos: comienza con plano medio de una docente latinoamericana en aula moderna, estudiantes usando laptops al fondo. La camara hace un leve paneo mostrando la interaccion docente-estudiantes. Iluminacion suave, colores calidos, estilo cinematografico educativo."
| Plataforma | Ajuste metodologico |
|---------------------|-----------------------------------------------|
| ChatGPT / DALL·E | Lenguaje natural, detalles, deja formato al modelo |
| Flux (FLUX.2) | Estructura sujeto+accion+estilo+contexto+luz+tecnico |
| Midjourney | Prompt segmentado, parametros de relacion y estilo |
| Stable Diffusion | Prompt detallado + config tecnica (steps, guidance) |
| Ideogram | Enfoque en tipografia y legibilidad |
| Veo / Sora / Kling | Descripcion temporal, planos, movimiento |
| Runway / Pika | Prompts-guion + herramientas de edicion |
[Ilustración: Una misma descripción textual mostrada en tres “versiones” conceptuales etiquetadas como ChatGPT, Flux y Midjourney, con pequeñas notas que indican qué se enfatiza en cada caso.]
Buenas prácticas
Trabaja siempre con un prompt base independiente de la plataforma y luego crea variantes específicas para cada herramienta. Documenta esas variantes enMultimedia/Plataformas.mdpara reutilizarlas. [web:185]
Conclusión de la sección: adaptar prompts a cada plataforma consiste en partir de una idea bien diseñada y traducirla a las convenciones, parámetros y fortalezas del modelo elegido. Esto te protege de cambios futuros en UIs y nomenclaturas. [web:176][web:185]
9.6 Construyendo plantillas reutilizables (OCRFE-Multimedia)¶
Vamos a definir plantillas OCRFE específicas para contenido multimedia, que luego integrarás en Multimedia/OCRFE-Multimedia.md y Multimedia/Plantillas.md.
Plantilla OCRFE para imágenes educativas¶
# Plantilla OCRFE para imagen educativa
Objetivo:
Describe el proposito de la imagen (portada de curso, slide, infografia, icono).
Contexto:
Indica la audiencia, la plataforma de publicacion (web, PDF, redes) y restricciones de marca.
Rol:
Define el rol creativo del modelo (fotografo, ilustrador, diseñador de informacion).
Formato:
Especifica relacion de aspecto, resolucion aproximada y tipo de salida (fotografia, ilustracion vectorial, infografia).
Descripcion visual:
Detalla sujeto, escenario, composicion, iluminacion, paleta de color, estilo y atmosfera.
Evaluacion:
Indica criterios de exito (claridad del mensaje, legibilidad, coherencia con branding).
Plantilla OCRFE para clips de video¶
# Plantilla OCRFE para clip de video
Objetivo:
Describe el proposito del video (intro de curso, reel, tutorial, comercial educativo).
Contexto:
Audiencia, plataforma (YouTube, TikTok, LMS), duracion aproximada.
Rol:
Director de video educativo, animador, director de fotografia.
Formato:
Relacion de aspecto, estilo (motion graphics, cinematografico, animacion 2D/3D), presencia o no de texto superpuesto.
Narrativa visual:
Describe inicio, desarrollo y cierre, tipos de planos, movimiento de camara, ritmo y transiciones.
Evaluacion:
Criterios de exito (comprension del mensaje, engagement esperado, consistencia con el resto del curso).
| Tipo de plantilla | Campos clave |
|----------------------|-----------------------------------------------|
| Imagen educativa | Objetivo, formato, descripcion visual |
| Video educativo | Objetivo, formato, narrativa visual |
| Infografia | Estructura de bloques, iconos, legibilidad |
| Personaje | Rasgos, vestimenta, estilo, consistencia |
[Ilustración: Una hoja tipo ficha técnica donde se ven los campos OCRFE rellenados para un ejemplo de imagen de portada de curso, mostrando cómo la plantilla guía el diseño.]
Consejo
Trata tus plantillas multimedia como “briefs creativos” estandarizados. Cada nuevo proyecto debería empezar rellenando una plantilla, antes de ir al modelo. Esto reduce la improvisación y mejora la coherencia visual global.
Conclusión de la sección: las plantillas OCRFE-Multimedia convierten tus prompts en documentos de diseño estructurado. Son la base para una práctica profesional consistente, repetible y fácil de mejorar con el tiempo. [web:185]
9.7 Construyendo una biblioteca multimedia en el PromptBook¶
Ahora vamos a integrar todo en la carpeta Multimedia/ de tu PromptBook Profesional.
Estructura de la carpeta Multimedia/¶
PromptBook/
Multimedia/
Imagenes/
Fotografia.md
Ilustraciones.md
Infografias.md
Personajes.md
Logos.md
Branding.md
Video/
Cinematografia.md
Storyboard.md
Reels.md
Animacion.md
Comerciales.md
Tutoriales.md
Plataformas.md
Plantillas.md
OCRFE-Multimedia.md
- En
Imagenes/Fotografia.md, documenta prompts para retratos, escenas educativas, ambientes corporativos, etc. - En
Imagenes/Ilustraciones.md, guarda ejemplos de estilos gráficos y paletas. - En
Imagenes/Infografias.md, recopila plantillas de estructura y casos reales usados en cursos. - En
Imagenes/Personajes.md, mantiene fichas de personajes consistentes (descripciones, estilos, variaciones admitidas). -
En
Imagenes/Logos.mdyImagenes/Branding.md, registra lineamientos para identidad visual y uso de colores. -
En
Video/Cinematografia.md, guarda prompts orientados a videos con estética más cinematográfica o institucional. - En
Video/Storyboard.md, documenta estructuras narrativas y secuencias de planos para distintos temas educativos. - En
Video/Reels.md, almacena fórmulas para clips cortos y dinámicos. - En
Video/Animacion.md, recopila prompts para animaciones explicativas. -
En
Video/Comerciales.mdyVideo/Tutoriales.md, guarda guiones modelo para comunicación institucional y enseñanza. -
En
Plataformas.md, describe cómo adaptas prompts base a cada modelo (ChatGPT, Flux, Midjourney, etc.) y guarda ejemplos prácticos. - En
Plantillas.md, centraliza tus mejores plantillas OCRFE-Multimedia. - En
OCRFE-Multimedia.md, especifica las variantes de OCRFE que usas para diseño visual.
graph TD
PB[PromptBook] --> MM[Multimedia/]
MM --> IMG[Imagenes/]
MM --> VID[Video/]
MM --> PLAT[Plataformas.md]
MM --> PLT[Plantillas.md]
MM --> OCR[OCRFE-Multimedia.md]
Este diagrama muestra la arquitectura de tu PromptBook Multimedia: imágenes y video en subcarpetas, y plantillas/metodología en archivos centrales. [web:40]
[Ilustración: Una vista conceptual de un “Panel Multimedia” con pestañas para Fotografía, Ilustraciones, Video y Plantillas, reflejando que el autor tiene una biblioteca organizada para cada tipo de contenido.]
Buenas prácticas
Usa convenciones de nombres claras (por ejemplo,curso-IA-portada-foto-v1,reel-evaluacion-formativa-v2) y añade comentarios sobre resultados y ajustes necesarios. Tu biblioteca crecerá con cada proyecto.
Conclusión de la sección: la biblioteca multimedia de tu PromptBook convierte tu experiencia visual en un sistema organizado. No solo tendrás imágenes y videos, sino conocimiento explícito sobre cómo los diseñaste y cómo los puedes replicar. [web:40]
9.8 Buenas prácticas¶
La generación de imágenes y video con IA plantea retos específicos: derechos de autor, propiedad intelectual, ética, consistencia visual, reutilización e iteración controlada. Los proveedores modernos incorporan políticas y herramientas de moderación que debes respetar. [web:181][web:188]
Derechos de autor y propiedad intelectual¶
- Evita pedir imágenes “en el estilo de” artistas vivos, prácticas que modelos como DALL·E 3 han empezado a bloquear explícitamente. [web:188]
- No intentes recrear logotipos o marcas registradas de forma que pueda confundirse con los originales.
- Considera el contenido generado como parte de tu proyecto, pero respeta las condiciones de uso de cada plataforma (licencias, términos de servicio). [web:181][web:186]
Ética y consistencia visual¶
- Evita representaciones sesgadas, estereotipos o imágenes que puedan reforzar prejuicios; revisa los outputs críticamente. [web:181]
- Asegura que las imágenes educativas representen diversidad y situaciones realistas.
- Mantén consistencia visual en cursos y materiales institucionales: paleta de colores, estilo de personajes, tipo de ilustraciones.
Reutilización, iteración y control de calidad¶
- Usa seeds o versiones para reproducir estilos y resultados cuando la plataforma lo permita (por ejemplo, parámetros de FLUX, Stable Diffusion). [web:180]
- Itera sobre tus prompts base: guarda versiones y notas sobre lo que funcionó y lo que no.
- Evalúa las imágenes y videos generados según criterios claros (legibilidad, coherencia de mensaje, alineación con la marca, ausencia de errores obvios).
| Principio | Practica asociada |
|------------------------|---------------------------------------------|
| Derechos de autor | No imitar artistas vivos ni marcas |
| Propiedad intelectual | Respetar terminos de uso, licencias |
| Ética visual | Evitar sesgos y estereotipos |
| Consistencia de estilo | Definir paletas, personajes, formatos |
| Iteracion controlada | Versionar prompts y evaluar resultados |
[Ilustración: Un tablero con varias impresiones de imágenes generadas, algunas marcadas con etiquetas de “aprobada”, “requiere ajustes”, “rechazada”, mostrando que la revisión humana sigue siendo central.]
Error común
Publicar directamente imágenes o videos generados sin revisar riesgos legales, éticos o de calidad. Las políticas de OpenAI y otros proveedores insisten en que el usuario final es responsable del uso del contenido. [web:181][web:188]
Conclusión de la sección: la Ingeniería de Prompts multimedia debe ir acompañada de prácticas responsables. Diseñar escenas no es solo cuestión de técnica, sino también de respeto por la propiedad intelectual, la ética y la coherencia visual de tu proyecto. [web:181][web:188]
Práctica guiada¶
Para convertir estas ideas en habilidades reales, te proponemos el siguiente conjunto de actividades, todas documentadas en Multimedia/.
1. Diseñar prompts para fotografía¶
- En
Imagenes/Fotografia.md, crea al menos tres prompts OCRFE para fotografías educativas (portada de curso, escena de aula, retrato de docente). - Genera las imágenes en una plataforma que soporte estilo fotográfico (ChatGPT Images, Flux, etc.) y añade notas sobre qué ajustes realizaste.
2. Crear prompts para ilustraciones¶
- En
Imagenes/Ilustraciones.md, diseña prompts para explicar conceptos como “PromptBook”, “Patrones de prompting” y “Flujos de trabajo”. - Genera ilustraciones en una plataforma adecuada y documenta qué estilos te resultan más claros para estudiantes.
3. Elaborar prompts para infografías¶
- En
Imagenes/Infografias.md, construye plantillas para infografías sobre procesos (por ejemplo, flujo de investigación asistida por IA, flujo de desarrollo con múltiples IA). - Genera versiones y evalúa legibilidad, simplicidad y coherencia visual.
4. Diseñar un personaje consistente¶
- En
Imagenes/Personajes.md, define un personaje docente o guía para tus cursos: rasgos, estilo, vestimenta, variaciones permitidas. - Genera varias imágenes del personaje en distintas situaciones y revisa consistencia.
5. Crear prompts para videos educativos¶
- En
Video/Tutoriales.md, diseña al menos dos prompts-guion para clips de 30–60 segundos explicando conceptos del libro. - Utiliza un modelo de video (cuando esté disponible en tu entorno) para generar borradores y documenta los ajustes necesarios.
6. Construir plantillas reutilizables¶
- En
OCRFE-Multimedia.md, refina las plantillas que has usado en los ejercicios y marca las versiones que funcionan mejor. - En
Plantillas.md, centraliza las plantillas aplicables a distintos cursos y proyectos institucionales.
Consejo
Considera este conjunto de ejercicios como la base de tu “manual visual” para la Academia El Profe. Cada nuevo curso o pieza de contenido debería poder apoyarse en las plantillas y ejemplos que construyas aquí.
9.9 Resumen¶
En este capítulo has aprendido a aplicar la Ingeniería de Prompts a imágenes y video, convirtiendo la generación visual por IA en un proceso de diseño estructurado. Comenzamos diferenciando entre generar y diseñar imágenes, y analizamos la anatomía de un prompt visual (sujeto, escenario, composición, iluminación, color, estilo, cámara, perspectiva, atmósfera, calidad y formato) en relación con el framework OCRFE. [web:176][web:185][web:189]
Luego, exploramos cómo crear prompts para distintos tipos de imagen (fotografía, ilustración, personajes, infografías, branding) y para videos educativos, reels, comerciales, tutoriales y animaciones, incorporando movimiento, ritmo y narrativa visual. [web:176][web:187] También vimos una metodología para adaptar prompts base a diversas plataformas (ChatGPT, Flux, Midjourney, Stable Diffusion, Ideogram, Veo, Sora, Kling, Runway, Pika) sin depender de comandos específicos. [web:176][web:178][web:185]
Finalmente, construiste la sección Multimedia/ de tu PromptBook con subcarpetas para imágenes y video, archivos para plantillas, OCRFE-Multimedia y guía de plataformas, y revisaste buenas prácticas sobre derechos de autor, ética y control de calidad. [web:40][web:181][web:188] Las actividades propuestas te invitan a desarrollar una biblioteca visual consistente que podrás reutilizar en cursos, campañas, materiales institucionales y proyectos de comunicación empresarial.
Nota
En los capítulos siguientes, integrarás estas capacidades visuales con flujos de escritura, investigación y coding, consolidando tu PromptBook como sistema integral de diseño de experiencias de aprendizaje y comunicación con IA.
Conclusión general del capítulo: la Ingeniería de Prompts para imágenes y video te permite diseñar experiencias visuales alineadas con tus objetivos educativos y de comunicación, usando modelos de IA como herramientas creativas dentro de un marco profesional, ético y reutilizable. [web:176][web:178][web:185]
Bibliografía¶
- OpenAI. “Image generation – OpenAI API.” Guía oficial para generación y edición de imágenes con modelos GPT Image. https://developers.openai.com/api/docs/guides/image-generation [web:176]
- OpenAI Help Center. “Creating images in ChatGPT.” Documentación sobre generación y edición de imágenes dentro de ChatGPT. https://help.openai.com/en/articles/8932459-dall-e-in-chatgpt [web:183]
- OpenAI. “DALL·E 3.” Descripción de capacidades, mejoras de adherencia al prompt y políticas de estilo. https://openai.com/index/dall-e-3/ [web:188]
- OpenAI. “Introducing ChatGPT Images 2.0.” Artículo sobre el modelo de imagen 2.0 y mejoras en texto, calidad y seguridad. https://openai.com/index/introducing-chatgpt-images-2-0/ [web:187]
- Microsoft Learn. “Azure OpenAI image generation models.” Información sobre modelos de imagen en Azure OpenAI, incluyendo retiro de DALL·E 3 y nuevos modelos. https://learn.microsoft.com/en-us/azure/foundry/openai/how-to/dall-e [web:186]
- Black Forest Labs. “Welcome to BFL Documentation! – FLUX models.” Documentación general sobre FLUX para text-to-image y edición. https://docs.bfl.ml/ [web:178]
- Black Forest Labs. “Image Generation with Text Prompts.” Guía rápida para generación de imágenes con FLUX. https://docs.bfl.ml/quick_start/generating_images [web:177]
- Black Forest Labs. “FLUX.2 Text to Image.” Documentación específica sobre FLUX.2 y text-to-image. https://docs.bfl.ml/flux_2/flux2_text_to_image [web:189]
- Black Forest Labs. “Generate an image with FLUX.1 [dev].” Referencia de API para FLUX.1. https://docs.bfl.ml/api-reference/models/generate-an-image-with-flux1-%5Bdev%5D [web:180]
- Black Forest Labs GitHub. “flux – Official inference repo for FLUX.1 models.” Código de referencia para inferencia con modelos FLUX. https://github.com/black-forest-labs/flux [web:182]
- Black Forest Labs GitHub. “skills – Official skills from Black Forest Labs for FLUX image generation models.” Guía avanzada de prompting y mejores prácticas. https://github.com/black-forest-labs/skills [web:185]
- AI2image. “Complete Guide to Creating AI Images with GPT-4o (2026).” Tutorial sobre uso de ChatGPT Images para creación visual. https://www.ai2image.com/blog/tutorials/chatgpt-image-generator-guide [web:190]
- Dair.ai. “Prompt Engineering Guide.” Recursos generales de Ingeniería de Prompts aplicables a multimedia. https://github.com/dair-ai/Prompt-Engineering-Guide [web:40]