Saltar a contenido

Capítulo 9

Ingeniería de Prompts para imágenes y video

9.0 Objetivo del capítulo

Al finalizar este capítulo serás capaz de:

  • Diseñar prompts profesionales para generación de imágenes y video.
  • Comprender la estructura de un prompt multimedia y cómo modularlo. [web:185][web:189]
  • Adaptar un mismo concepto visual a diferentes plataformas (ChatGPT, Gemini, Midjourney, Flux, Ideogram, Stable Diffusion, Veo, Sora, Kling, Runway, Pika). [web:176][web:178]
  • Controlar estilo, composición, iluminación, cámara, movimiento y narrativa visual mediante texto. [web:185][web:189]
  • Construir una biblioteca reutilizable de prompts multimedia dentro de tu PromptBook Profesional.
  • Incorporar metodologías que seguirán siendo útiles aunque cambien los modelos y las UIs.

Nos centraremos en principios y estructuras de diseño visual, apoyándonos en documentación oficial de OpenAI, Black Forest Labs (Flux), Microsoft, Stability y otros proveedores. [web:176][web:178][web:186]

Nota
Un buen prompt multimedia no es una lista de comandos, sino una descripción clara y estructurada de una escena: qué quieres ver, cómo debe verse y para qué la vas a usar.


9.1 La IA como herramienta de creación visual

De producir imágenes a diseñar experiencias visuales

La aparición de modelos como ChatGPT Images, DALL·E 3, FLUX.2, Midjourney, Stable Diffusion, Runway y otros ha transformado la producción de contenido visual. Hoy puedes generar imágenes y clips de video a partir de descripciones textuales, sin necesidad de dominar una cámara, un set de iluminación o un software complejo de edición. [web:176][web:178][web:187]

Sin embargo, la diferencia entre generar imágenes y diseñarlas es crucial:

  • Generar imágenes es pedir “hazme una imagen de X” y aceptar lo que el modelo devuelve.
  • Diseñar imágenes implica especificar sujeto, composición, estilo, iluminación y contexto de uso, revisar resultados y iterar hasta lograr una pieza coherente con tu objetivo visual. [web:185][web:190]
graph TD
  IDEA[Idea visual] --> PROMPT[Prompt diseñado]
  PROMPT --> IA[Modelo de imagen/video]
  IA --> BORRADOR[Imagen / clip inicial]
  BORRADOR --> REV[Revision humana]
  REV --> AJUSTE[Prompt ajustado]
  AJUSTE --> IA2[Iteracion]
  IA2 --> PIEZA[Resultado final]

Este flujo muestra que la IA es parte del proceso creativo, no su sustitución completa. El criterio humano sigue siendo responsable de decidir cuándo una imagen o un video es adecuado, ético y útil para el proyecto. [web:181][web:188]

[Ilustración: Una secuencia de tres imágenes conceptuales: la primera es un boceto textual, la segunda es un borrador generado por IA, la tercera es la versión final tras ajustes, destacando la evolución desde idea a diseño refinado.]

Curiosidad
Modelos modernos como FLUX.2 permiten incluso usar varias imágenes de referencia para ajustar estilo, composición y colores, mezclando texto y ejemplos como parte del diseño visual. [web:178][web:185]

Conclusión de la sección: la IA ha democratizado la generación visual, pero el diseño sigue dependiendo de tus decisiones. La Ingeniería de Prompts te ofrece el vocabulario y la estructura para convertir ideas en escenas consistentes, más allá de “probar suerte” con descripciones sueltas. [web:176][web:185]


9.2 Anatomía de un prompt visual

La mayoría de guías oficiales coinciden en que un buen prompt visual describe varios elementos clave: sujeto, escenario, composición, iluminación, color, estilo, lente/cámara, perspectiva, atmósfera, calidad y formato. [web:176][web:185][web:189]

Componentes de un prompt visual

  • Sujeto: qué aparece en la imagen (persona, objeto, paisaje, interfaz, escena educativa).
  • Escenario: dónde ocurre (aula, laboratorio, ciudad, entorno natural, interfaz digital).
  • Composición: distribución de elementos (primer plano, fondo, regla de tercios, simetría, vista cenital, etc.).
  • Iluminación: tipo de luz (suave, dura, contraluz, golden hour, luz de estudio, luz ambiental). [web:185]
  • Color: paleta dominante (cálida, fría, monocromática, colores corporativos, hex codes). [web:185]
  • Estilo artístico: fotográfico, ilustración vectorial, pintura digital, flat design, 3D, comic, etc. [web:176][web:189]
  • Lente / cámara: focal (35 mm, 85 mm, gran angular), tipo de encuadre (close-up, plano medio, plano general). [web:185]
  • Perspectiva: ángulo de visión (desde arriba, desde abajo, en primera persona, isométrica). [web:185]
  • Atmósfera: emociones y ambiente (sereno, dinámico, académico, corporativo, inspirador). [web:190]
  • Calidad: nivel de detalle y resolución (alta definición, estilo boceto, resolución para web o impresión). [web:176][web:180]
  • Formato: relación de aspecto (16:9, 1:1, 9:16), tipo de salida (JPEG, PNG, WebP, duración de video, etc.). [web:180][web:186]

Relación con OCRFE

Puedes mapear estos componentes al framework OCRFE:

  • Objetivo: propósito visual (banner educativo, portada de curso, reel informativo, storyboard).
  • Contexto: audiencia, plataforma, restricciones de marca o ética. [web:181][web:188]
  • Rol: perspectiva creativa (fotógrafo, director de arte, diseñador instruccional, director de fotografía).
  • Formato: estructura técnica (resolución, relación de aspecto, duración, estilo de salida). [web:176][web:180]
  • Evaluación: criterios de éxito (claridad del mensaje, coherencia con branding, legibilidad de texto, consistencia entre escenas).
graph TD
  OCR[OCRFE] --> OBJ[Objetivo]
  OCR --> CTX[Contexto]
  OCR --> ROL[Rol]
  OCR --> FORM[Formato]
  OCR --> EVAL[Evaluacion]

  OBJ --> SUJ[Sujeto]
  CTX --> ESC[Escenario]
  CTX --> ATM[Atmosfera]
  ROL --> EST[Estilo]
  FORM --> CAM[Lente/Camara]
  FORM --> FMT[Formato salida]
  EVAL --> QUAL[Calidad percibida]

Este diagrama ilustra cómo OCRFE se convierte en la columna vertebral de tu prompt visual: cada sección te obliga a pensar en aspectos clave antes de pedir la imagen o el video. [web:31][web:185]

[Ilustración: Un diagrama de anotaciones sobre una imagen de ejemplo, con flechas que señalan “sujeto”, “composición”, “iluminación”, “color” y “perspectiva”, mostrando cómo cada aspecto se describe en el prompt.]

Dato relevante
Black Forest Labs propone estructuras como [Sujeto] + [Accion] + [Estilo] + [Contexto] + [Iluminacion] + [Tecnico] para FLUX, que encajan muy bien con OCRFE y con la anatomía descrita aquí. [web:185][web:189]

Conclusión de la sección: entender la anatomía de un prompt visual te permite pasar de descripciones vagas a instrucciones precisas que controlan sujeto, composición y estética. Integrar esto con OCRFE asegura que tus prompts multimedia sean coherentes con el propósito educativo o profesional del proyecto. [web:185][web:189]


9.3 Prompts para imágenes

Vamos a aplicar estos principios a distintos tipos de imagen: fotografía, ilustración, arte conceptual, personajes, infografías, iconografía, branding, logotipos y materiales educativos.

Fotografía

Ejemplo de prompt fotográfico educativo:

Objetivo:
Crear una fotografia para la portada de un curso de Ingenieria de Prompts.

Contexto:
La imagen se usara en una landing web y en redes sociales. Publico: docentes y estudiantes de tecnologia.

Rol:
Actua como fotografo especializado en retratos academicos.

Formato:
Imagen horizontal 16:9, alta resolucion, estilo fotorealista.

Descripcion visual:
Retrato de una persona adulta latinoamericana frente a una pizarra con diagramas abstractos de IA (sin texto legible). Iluminacion suave de estudio, fondo ligeramente desenfocado, colores calidos, atmosfera profesional y cercana.

Ilustración y arte conceptual

Objetivo:
Generar una ilustracion vectorial para explicar el concepto de PromptBook.

Contexto:
Se integrara en un capitulo de libro tecnico y en una infografia educativa.

Rol:
Actua como ilustrador de tecnologia educativa.

Formato:
Imagen 4:3, estilo flat design, colores corporativos de la institucion.

Descripcion visual:
Una carpeta digital etiquetada "PromptBook" conectada por lineas a varias ventanas flotantes de prompts y resultados, con iconos de texto, codigo e imagen alrededor. Fondo claro, sin personajes reales.

Personajes y personajes consistentes

Objetivo:
Diseñar un personaje consistente para materiales educativos sobre IA.

Contexto:
El personaje aparecerá en presentaciones, videos y guias PDF.

Rol:
Actua como diseñador de personajes.

Formato:
Estilo semi-realista, 3/4 de cuerpo, relacion 1:1.

Descripcion visual:
Personaje docente, de unos 35–45 años, vestimenta casual-profesional, con una tablet en la mano mostrando iconos de IA. Expresion amable y segura. Fondo simple con formas geometricas.

Infografías, iconografía y branding

Infografía:

Objetivo:
Generar una infografia visual que resuma el flujo de trabajo de un PromptBook.

Formato:
Imagen vertical 9:16, estilo minimalista, colores azules y verdes.

Descripcion visual:
Cuatro bloques principales (Principios, Patrones, Plantillas, Flujos) conectados mediante flechas. Cada bloque con un icono simple (libro, patron, plantilla, engranaje). Texto minimo, priorizar claridad visual.

Logotipo / branding:

Objetivo:
Diseñar un logotipo simple para "Academia El Profe" centrado en tecnologia y enseñanza.

Formato:
Estilo vectorial, monocromatico + un color acento.

Descripcion visual:
Icono de una pizarra estilizada con un simbolo de IA (nodo conectado) y una silueta sencilla de persona explicando. Tipografia sans serif clara debajo, sin imitar estilos de marcas existentes.
| Tipo de imagen       | Enfoque en el prompt                          |
|----------------------|-----------------------------------------------|
| Fotografia           | Sujeto realista, lente, iluminacion, entorno  |
| Ilustracion          | Estilo grafico, paleta, simplicidad           |
| Arte conceptual      | Ideas abstractas, atmosfera, textura          |
| Personajes           | Rasgos, vestimenta, estilo consistente        |
| Infografias          | Estructura, bloques, iconos, legibilidad      |
| Branding / logos     | Simplicidad, originalidad, coherencia de marca|

[Ilustración: Una serie de mini-vistas en mosaico que muestran versiones conceptuales de foto, ilustración, personaje e infografía del mismo tema educativo, resaltando cómo cambia el estilo pero permanece el mensaje.]

Error común
Pedir “una imagen bonita sobre IA” sin especificar tipo de contenido (foto, ilustración, infografía) ni propósito. Esto suele producir resultados poco útiles para proyectos profesionales. [web:190]

Conclusión de la sección: diseñar prompts para imágenes requiere elegir primero el tipo de pieza visual y luego describir sujeto, estilo y propósito. Con OCRFE y la anatomía del prompt, puedes producir material coherente para educación, branding y comunicación institucional. [web:176][web:185]


9.4 Prompts para video

Los modelos de generación de video (Veo, Sora, Kling, Runway, Pika y otros) están avanzando rápido, pero comparten principios similares para diseño de prompts: describir movimiento, cámara, ritmo e intención narrativa. [web:176][web:187]

Videos educativos y tutoriales

Objetivo:
Crear un clip educativo de 30 segundos que explique visualmente el concepto de PromptBook.

Contexto:
Se usara como intro de un curso online.

Rol:
Actua como director de video educativo.

Formato:
Relacion 16:9, estilo animacion ligera (motion graphics), sin voz.

Descripcion visual:
Secuencia de transiciones donde una carpeta digital se abre y muestra distintas secciones (Principios, Patrones, Plantillas, Flujos) con iconos simples. Movimiento suave, ritmo moderado, paleta de colores consistente.

Reels, comerciales y storytelling

Reel para redes sociales:

Objetivo:
Crear un reel vertical de 15 segundos que invite a docentes a aprender Ingenieria de Prompts.

Formato:
Relacion 9:16, ritmo dinamico.

Descripcion visual:
Serie rapida de escenas: aula moderna, pantallas con prompts, estudiantes colaborando. Texto superpuesto corto ("Disena conversaciones inteligentes"). Cambios de plano sincronizados con ritmo visual, paleta coherente con la marca.

Comercial / storytelling:

Objetivo:
Generar un video breve con narracion visual sobre el impacto de IA en la educacion.

Rol:
Actua como director de fotografia.

Formato:
Clip de 45 segundos, estilo cinematografico.

Descripcion visual:
Comienza con una escena de aula tradicional (camara fija, iluminacion suave). Transicion a aula tecnologica con estudiantes usando laptops e IA (paneos, planos detalle de pantalla). Termina con plano amplio mostrando colaboracion docente-estudiante. Movimiento de camara fluido, uso de profundidad de campo.

Animación y narrativa

Objetivo:
Crear un video animado explicando los 4 componentes clave de un PromptBook.

Formato:
Animacion 2D, estilo educativo, duracion 60 segundos.

Descripcion visual:
Personaje guía recorre un entorno digital donde cada seccion (Principios, Patrones, Plantillas, Flujos) aparece como una puerta. El personaje entra y sale de cada puerta brevemente, con iconos y texto corto en pantalla. Movimiento de camara sencillo, ritmo claro y pausado.
| Tipo de video        | Enfoque principal en el prompt                |
|----------------------|-----------------------------------------------|
| Educativo            | Claridad de conceptos, ritmo didactico        |
| Reel                 | Duracion corta, formato vertical, impacto     |
| Comercial            | Narrativa de marca, cinematografia            |
| Tutorial             | Secuencia paso a paso, enfoque en detalles    |
| Animacion            | Personajes, movimiento, timing                 |

[Ilustración: Un storyboard simplificado con cuatro viñetas que representan momentos clave de un video educativo, cada viñeta acompañada de notas de cámara, movimiento e iluminación.]

Consejo
Piensa tus prompts de video como micro guiones: describe principio, desarrollo y cierre, además de encuadre y movimiento, en lugar de limitarte a “video sobre X”. Esto ayuda a modelos como Sora, Veo o Runway a generar clips coherentes. [web:187]

Conclusión de la sección: los prompts de video añaden una capa temporal al diseño visual. Debes especificar no solo qué se ve, sino cómo cambia, a qué ritmo y con qué intención narrativa, siguiendo estructuras similares a las de un guion. [web:187]


9.5 Adaptando prompts según la plataforma

Cada plataforma de generación visual tiene particularidades: algunas siguen mejor instrucciones detalladas, otras favorecen estilos artísticos específicos, algunas requieren parámetros técnicos explícitos (resolución, steps, guidance). [web:176][web:180][web:185]

En lugar de memorizar diferencias, te conviene adoptar una metodología de adaptación:

  1. Diseña un prompt base en lenguaje natural bien estructurado (OCRFE + anatomía visual).
  2. Ajusta ese prompt según las capacidades y convenciones de cada modelo.

Ejemplo de prompt base

Prompt base:
"Retrato fotorealista de una docente latinoamericana en un aula moderna, con estudiantes al fondo usando laptops. Iluminacion suave, colores calidos, atmosfera cercana y profesional, relacion 16:9, alta resolucion."

Adaptaciones típicas

  • ChatGPT / DALL·E / ChatGPT Images: suele funcionar bien con descripciones en lenguaje natural; puedes añadir instrucciones de estilo (“estilo fotografico profesional”) y dejar que el sistema gestione formato. [web:183][web:188]

  • Flux (FLUX.2): la documentación sugiere usar estructuras explícitas y detallar iluminación, color y aspectos técnicos, sin negative prompts. [web:178][web:185][web:189]

Prompt FLUX:
"Retrato fotografico de una docente latinoamericana, sonriendo, en un aula moderna con estudiantes usando laptops al fondo, ligeramente desenfocados. Estilo fotorealista, iluminacion suave de estudio, paleta de colores calidos (#f4b26b, #fce9d9), relacion 16:9, alta definicion."
  • Midjourney / Stable Diffusion: suelen beneficiarse de prompts más segmentados y pueden requerir parámetros adicionales (por ejemplo, --ar 16:9, niveles de detalle) según la UI. [web:186]

  • Ideogram: está orientado a texto y gráficos; conviene enfatizar tipografía y legibilidad cuando se incluyen palabras.

  • Modelos de video (Veo, Sora, Kling, Runway, Pika): requieren más descripción temporal y narrativa; puedes usar tu prompt base como descripción de escena y añadir secciones para comienzo, desarrollo y final.

Prompt Sora/Veo:
"Clip de 20 segundos: comienza con plano medio de una docente latinoamericana en aula moderna, estudiantes usando laptops al fondo. La camara hace un leve paneo mostrando la interaccion docente-estudiantes. Iluminacion suave, colores calidos, estilo cinematografico educativo."
| Plataforma          | Ajuste metodologico                           |
|---------------------|-----------------------------------------------|
| ChatGPT / DALL·E    | Lenguaje natural, detalles, deja formato al modelo |
| Flux (FLUX.2)       | Estructura sujeto+accion+estilo+contexto+luz+tecnico |
| Midjourney          | Prompt segmentado, parametros de relacion y estilo |
| Stable Diffusion    | Prompt detallado + config tecnica (steps, guidance) |
| Ideogram            | Enfoque en tipografia y legibilidad             |
| Veo / Sora / Kling  | Descripcion temporal, planos, movimiento        |
| Runway / Pika       | Prompts-guion + herramientas de edicion         |

[Ilustración: Una misma descripción textual mostrada en tres “versiones” conceptuales etiquetadas como ChatGPT, Flux y Midjourney, con pequeñas notas que indican qué se enfatiza en cada caso.]

Buenas prácticas
Trabaja siempre con un prompt base independiente de la plataforma y luego crea variantes específicas para cada herramienta. Documenta esas variantes en Multimedia/Plataformas.md para reutilizarlas. [web:185]

Conclusión de la sección: adaptar prompts a cada plataforma consiste en partir de una idea bien diseñada y traducirla a las convenciones, parámetros y fortalezas del modelo elegido. Esto te protege de cambios futuros en UIs y nomenclaturas. [web:176][web:185]


9.6 Construyendo plantillas reutilizables (OCRFE-Multimedia)

Vamos a definir plantillas OCRFE específicas para contenido multimedia, que luego integrarás en Multimedia/OCRFE-Multimedia.md y Multimedia/Plantillas.md.

Plantilla OCRFE para imágenes educativas

# Plantilla OCRFE para imagen educativa

Objetivo:
Describe el proposito de la imagen (portada de curso, slide, infografia, icono).

Contexto:
Indica la audiencia, la plataforma de publicacion (web, PDF, redes) y restricciones de marca.

Rol:
Define el rol creativo del modelo (fotografo, ilustrador, diseñador de informacion).

Formato:
Especifica relacion de aspecto, resolucion aproximada y tipo de salida (fotografia, ilustracion vectorial, infografia).

Descripcion visual:
Detalla sujeto, escenario, composicion, iluminacion, paleta de color, estilo y atmosfera.

Evaluacion:
Indica criterios de exito (claridad del mensaje, legibilidad, coherencia con branding).

Plantilla OCRFE para clips de video

# Plantilla OCRFE para clip de video

Objetivo:
Describe el proposito del video (intro de curso, reel, tutorial, comercial educativo).

Contexto:
Audiencia, plataforma (YouTube, TikTok, LMS), duracion aproximada.

Rol:
Director de video educativo, animador, director de fotografia.

Formato:
Relacion de aspecto, estilo (motion graphics, cinematografico, animacion 2D/3D), presencia o no de texto superpuesto.

Narrativa visual:
Describe inicio, desarrollo y cierre, tipos de planos, movimiento de camara, ritmo y transiciones.

Evaluacion:
Criterios de exito (comprension del mensaje, engagement esperado, consistencia con el resto del curso).
| Tipo de plantilla    | Campos clave                                  |
|----------------------|-----------------------------------------------|
| Imagen educativa     | Objetivo, formato, descripcion visual         |
| Video educativo      | Objetivo, formato, narrativa visual           |
| Infografia           | Estructura de bloques, iconos, legibilidad    |
| Personaje            | Rasgos, vestimenta, estilo, consistencia      |

[Ilustración: Una hoja tipo ficha técnica donde se ven los campos OCRFE rellenados para un ejemplo de imagen de portada de curso, mostrando cómo la plantilla guía el diseño.]

Consejo
Trata tus plantillas multimedia como “briefs creativos” estandarizados. Cada nuevo proyecto debería empezar rellenando una plantilla, antes de ir al modelo. Esto reduce la improvisación y mejora la coherencia visual global.

Conclusión de la sección: las plantillas OCRFE-Multimedia convierten tus prompts en documentos de diseño estructurado. Son la base para una práctica profesional consistente, repetible y fácil de mejorar con el tiempo. [web:185]


9.7 Construyendo una biblioteca multimedia en el PromptBook

Ahora vamos a integrar todo en la carpeta Multimedia/ de tu PromptBook Profesional.

Estructura de la carpeta Multimedia/

PromptBook/
  Multimedia/
    Imagenes/
      Fotografia.md
      Ilustraciones.md
      Infografias.md
      Personajes.md
      Logos.md
      Branding.md

    Video/
      Cinematografia.md
      Storyboard.md
      Reels.md
      Animacion.md
      Comerciales.md
      Tutoriales.md

    Plataformas.md
    Plantillas.md
    OCRFE-Multimedia.md
  • En Imagenes/Fotografia.md, documenta prompts para retratos, escenas educativas, ambientes corporativos, etc.
  • En Imagenes/Ilustraciones.md, guarda ejemplos de estilos gráficos y paletas.
  • En Imagenes/Infografias.md, recopila plantillas de estructura y casos reales usados en cursos.
  • En Imagenes/Personajes.md, mantiene fichas de personajes consistentes (descripciones, estilos, variaciones admitidas).
  • En Imagenes/Logos.md y Imagenes/Branding.md, registra lineamientos para identidad visual y uso de colores.

  • En Video/Cinematografia.md, guarda prompts orientados a videos con estética más cinematográfica o institucional.

  • En Video/Storyboard.md, documenta estructuras narrativas y secuencias de planos para distintos temas educativos.
  • En Video/Reels.md, almacena fórmulas para clips cortos y dinámicos.
  • En Video/Animacion.md, recopila prompts para animaciones explicativas.
  • En Video/Comerciales.md y Video/Tutoriales.md, guarda guiones modelo para comunicación institucional y enseñanza.

  • En Plataformas.md, describe cómo adaptas prompts base a cada modelo (ChatGPT, Flux, Midjourney, etc.) y guarda ejemplos prácticos.

  • En Plantillas.md, centraliza tus mejores plantillas OCRFE-Multimedia.
  • En OCRFE-Multimedia.md, especifica las variantes de OCRFE que usas para diseño visual.
graph TD
  PB[PromptBook] --> MM[Multimedia/]
  MM --> IMG[Imagenes/]
  MM --> VID[Video/]
  MM --> PLAT[Plataformas.md]
  MM --> PLT[Plantillas.md]
  MM --> OCR[OCRFE-Multimedia.md]

Este diagrama muestra la arquitectura de tu PromptBook Multimedia: imágenes y video en subcarpetas, y plantillas/metodología en archivos centrales. [web:40]

[Ilustración: Una vista conceptual de un “Panel Multimedia” con pestañas para Fotografía, Ilustraciones, Video y Plantillas, reflejando que el autor tiene una biblioteca organizada para cada tipo de contenido.]

Buenas prácticas
Usa convenciones de nombres claras (por ejemplo, curso-IA-portada-foto-v1, reel-evaluacion-formativa-v2) y añade comentarios sobre resultados y ajustes necesarios. Tu biblioteca crecerá con cada proyecto.

Conclusión de la sección: la biblioteca multimedia de tu PromptBook convierte tu experiencia visual en un sistema organizado. No solo tendrás imágenes y videos, sino conocimiento explícito sobre cómo los diseñaste y cómo los puedes replicar. [web:40]


9.8 Buenas prácticas

La generación de imágenes y video con IA plantea retos específicos: derechos de autor, propiedad intelectual, ética, consistencia visual, reutilización e iteración controlada. Los proveedores modernos incorporan políticas y herramientas de moderación que debes respetar. [web:181][web:188]

Derechos de autor y propiedad intelectual

  • Evita pedir imágenes “en el estilo de” artistas vivos, prácticas que modelos como DALL·E 3 han empezado a bloquear explícitamente. [web:188]
  • No intentes recrear logotipos o marcas registradas de forma que pueda confundirse con los originales.
  • Considera el contenido generado como parte de tu proyecto, pero respeta las condiciones de uso de cada plataforma (licencias, términos de servicio). [web:181][web:186]

Ética y consistencia visual

  • Evita representaciones sesgadas, estereotipos o imágenes que puedan reforzar prejuicios; revisa los outputs críticamente. [web:181]
  • Asegura que las imágenes educativas representen diversidad y situaciones realistas.
  • Mantén consistencia visual en cursos y materiales institucionales: paleta de colores, estilo de personajes, tipo de ilustraciones.

Reutilización, iteración y control de calidad

  • Usa seeds o versiones para reproducir estilos y resultados cuando la plataforma lo permita (por ejemplo, parámetros de FLUX, Stable Diffusion). [web:180]
  • Itera sobre tus prompts base: guarda versiones y notas sobre lo que funcionó y lo que no.
  • Evalúa las imágenes y videos generados según criterios claros (legibilidad, coherencia de mensaje, alineación con la marca, ausencia de errores obvios).
| Principio              | Practica asociada                           |
|------------------------|---------------------------------------------|
| Derechos de autor      | No imitar artistas vivos ni marcas          |
| Propiedad intelectual  | Respetar terminos de uso, licencias         |
| Ética visual           | Evitar sesgos y estereotipos                |
| Consistencia de estilo | Definir paletas, personajes, formatos       |
| Iteracion controlada   | Versionar prompts y evaluar resultados      |

[Ilustración: Un tablero con varias impresiones de imágenes generadas, algunas marcadas con etiquetas de “aprobada”, “requiere ajustes”, “rechazada”, mostrando que la revisión humana sigue siendo central.]

Error común
Publicar directamente imágenes o videos generados sin revisar riesgos legales, éticos o de calidad. Las políticas de OpenAI y otros proveedores insisten en que el usuario final es responsable del uso del contenido. [web:181][web:188]

Conclusión de la sección: la Ingeniería de Prompts multimedia debe ir acompañada de prácticas responsables. Diseñar escenas no es solo cuestión de técnica, sino también de respeto por la propiedad intelectual, la ética y la coherencia visual de tu proyecto. [web:181][web:188]


Práctica guiada

Para convertir estas ideas en habilidades reales, te proponemos el siguiente conjunto de actividades, todas documentadas en Multimedia/.

1. Diseñar prompts para fotografía

  1. En Imagenes/Fotografia.md, crea al menos tres prompts OCRFE para fotografías educativas (portada de curso, escena de aula, retrato de docente).
  2. Genera las imágenes en una plataforma que soporte estilo fotográfico (ChatGPT Images, Flux, etc.) y añade notas sobre qué ajustes realizaste.

2. Crear prompts para ilustraciones

  1. En Imagenes/Ilustraciones.md, diseña prompts para explicar conceptos como “PromptBook”, “Patrones de prompting” y “Flujos de trabajo”.
  2. Genera ilustraciones en una plataforma adecuada y documenta qué estilos te resultan más claros para estudiantes.

3. Elaborar prompts para infografías

  1. En Imagenes/Infografias.md, construye plantillas para infografías sobre procesos (por ejemplo, flujo de investigación asistida por IA, flujo de desarrollo con múltiples IA).
  2. Genera versiones y evalúa legibilidad, simplicidad y coherencia visual.

4. Diseñar un personaje consistente

  1. En Imagenes/Personajes.md, define un personaje docente o guía para tus cursos: rasgos, estilo, vestimenta, variaciones permitidas.
  2. Genera varias imágenes del personaje en distintas situaciones y revisa consistencia.

5. Crear prompts para videos educativos

  1. En Video/Tutoriales.md, diseña al menos dos prompts-guion para clips de 30–60 segundos explicando conceptos del libro.
  2. Utiliza un modelo de video (cuando esté disponible en tu entorno) para generar borradores y documenta los ajustes necesarios.

6. Construir plantillas reutilizables

  1. En OCRFE-Multimedia.md, refina las plantillas que has usado en los ejercicios y marca las versiones que funcionan mejor.
  2. En Plantillas.md, centraliza las plantillas aplicables a distintos cursos y proyectos institucionales.

Consejo
Considera este conjunto de ejercicios como la base de tu “manual visual” para la Academia El Profe. Cada nuevo curso o pieza de contenido debería poder apoyarse en las plantillas y ejemplos que construyas aquí.


9.9 Resumen

En este capítulo has aprendido a aplicar la Ingeniería de Prompts a imágenes y video, convirtiendo la generación visual por IA en un proceso de diseño estructurado. Comenzamos diferenciando entre generar y diseñar imágenes, y analizamos la anatomía de un prompt visual (sujeto, escenario, composición, iluminación, color, estilo, cámara, perspectiva, atmósfera, calidad y formato) en relación con el framework OCRFE. [web:176][web:185][web:189]

Luego, exploramos cómo crear prompts para distintos tipos de imagen (fotografía, ilustración, personajes, infografías, branding) y para videos educativos, reels, comerciales, tutoriales y animaciones, incorporando movimiento, ritmo y narrativa visual. [web:176][web:187] También vimos una metodología para adaptar prompts base a diversas plataformas (ChatGPT, Flux, Midjourney, Stable Diffusion, Ideogram, Veo, Sora, Kling, Runway, Pika) sin depender de comandos específicos. [web:176][web:178][web:185]

Finalmente, construiste la sección Multimedia/ de tu PromptBook con subcarpetas para imágenes y video, archivos para plantillas, OCRFE-Multimedia y guía de plataformas, y revisaste buenas prácticas sobre derechos de autor, ética y control de calidad. [web:40][web:181][web:188] Las actividades propuestas te invitan a desarrollar una biblioteca visual consistente que podrás reutilizar en cursos, campañas, materiales institucionales y proyectos de comunicación empresarial.

Nota
En los capítulos siguientes, integrarás estas capacidades visuales con flujos de escritura, investigación y coding, consolidando tu PromptBook como sistema integral de diseño de experiencias de aprendizaje y comunicación con IA.

Conclusión general del capítulo: la Ingeniería de Prompts para imágenes y video te permite diseñar experiencias visuales alineadas con tus objetivos educativos y de comunicación, usando modelos de IA como herramientas creativas dentro de un marco profesional, ético y reutilizable. [web:176][web:178][web:185]


Bibliografía

  • OpenAI. “Image generation – OpenAI API.” Guía oficial para generación y edición de imágenes con modelos GPT Image. https://developers.openai.com/api/docs/guides/image-generation [web:176]
  • OpenAI Help Center. “Creating images in ChatGPT.” Documentación sobre generación y edición de imágenes dentro de ChatGPT. https://help.openai.com/en/articles/8932459-dall-e-in-chatgpt [web:183]
  • OpenAI. “DALL·E 3.” Descripción de capacidades, mejoras de adherencia al prompt y políticas de estilo. https://openai.com/index/dall-e-3/ [web:188]
  • OpenAI. “Introducing ChatGPT Images 2.0.” Artículo sobre el modelo de imagen 2.0 y mejoras en texto, calidad y seguridad. https://openai.com/index/introducing-chatgpt-images-2-0/ [web:187]
  • Microsoft Learn. “Azure OpenAI image generation models.” Información sobre modelos de imagen en Azure OpenAI, incluyendo retiro de DALL·E 3 y nuevos modelos. https://learn.microsoft.com/en-us/azure/foundry/openai/how-to/dall-e [web:186]
  • Black Forest Labs. “Welcome to BFL Documentation! – FLUX models.” Documentación general sobre FLUX para text-to-image y edición. https://docs.bfl.ml/ [web:178]
  • Black Forest Labs. “Image Generation with Text Prompts.” Guía rápida para generación de imágenes con FLUX. https://docs.bfl.ml/quick_start/generating_images [web:177]
  • Black Forest Labs. “FLUX.2 Text to Image.” Documentación específica sobre FLUX.2 y text-to-image. https://docs.bfl.ml/flux_2/flux2_text_to_image [web:189]
  • Black Forest Labs. “Generate an image with FLUX.1 [dev].” Referencia de API para FLUX.1. https://docs.bfl.ml/api-reference/models/generate-an-image-with-flux1-%5Bdev%5D [web:180]
  • Black Forest Labs GitHub. “flux – Official inference repo for FLUX.1 models.” Código de referencia para inferencia con modelos FLUX. https://github.com/black-forest-labs/flux [web:182]
  • Black Forest Labs GitHub. “skills – Official skills from Black Forest Labs for FLUX image generation models.” Guía avanzada de prompting y mejores prácticas. https://github.com/black-forest-labs/skills [web:185]
  • AI2image. “Complete Guide to Creating AI Images with GPT-4o (2026).” Tutorial sobre uso de ChatGPT Images para creación visual. https://www.ai2image.com/blog/tutorials/chatgpt-image-generator-guide [web:190]
  • Dair.ai. “Prompt Engineering Guide.” Recursos generales de Ingeniería de Prompts aplicables a multimedia. https://github.com/dair-ai/Prompt-Engineering-Guide [web:40]