Capítulo 11¶

Diagnóstico y optimización de prompts¶

11.0 Objetivo del capítulo¶

Al finalizar este capítulo serás capaz de:

Diagnosticar por qué un prompt produce malos resultados.
Detectar errores comunes antes de ejecutar un prompt.
Analizar respuestas generadas por IA con criterio profesional. [web:205][web:208]
Optimizar prompts mediante un proceso sistemático, apoyado en buenas prácticas actuales. [web:31][web:103]
Construir listas de verificación reutilizables y rúbricas de evaluación.
Documentar mejoras dentro de tu PromptBook Profesional, integrando versionado y auditoría.

No vamos a recopilar una simple lista de errores frecuentes, sino a construir una metodología de diagnóstico y mejora continua basada en investigación y guías oficiales. [web:204][web:209]

Nota
Un prompt que falla es una oportunidad de aprendizaje. La Ingeniería de Prompts profesional trata los errores como señales para mejorar el sistema, no como fracasos individuales.

11.1 ¿Por qué un prompt falla?¶

El modelo no siempre es el culpable¶

Las guías de OpenAI y Microsoft insisten en que malos resultados suelen deberse más a un diseño deficiente del prompt que a incapacidad del modelo, especialmente en modelos modernos de gama alta. [web:31][web:213] Cuando un prompt falla, conviene analizar la relación entre lo que pediste, el contexto que diste, las instrucciones que definiste, el formato requerido y tus expectativas reales.

Podemos descomponer esta relación usando OCRFE:

Objetivo: ¿Está claramente definido qué quieres lograr? [web:31]
Contexto: ¿Has proporcionado suficiente información relevante, sin ruido? [web:103]
Rol: ¿El modelo entiende desde qué perspectiva debe responder (docente, ingeniero, editor)? [web:212]
Formato: ¿Has definido cómo debe ser la salida (estructura, longitud, estilo)? [web:31]
Evaluación: ¿Tienes criterios explícitos para juzgar si la respuesta es buena? [web:205]

Si alguno de estos elementos está débil o ausente, es probable que el resultado sea pobre.

graph TD
  OBJ[Objetivo] --> RES[Resultado]
  CTX[Contexto] --> RES
  ROL[Rol] --> RES
  FORM[Formato] --> RES
  EVAL[Evaluacion] --> RES

  RES --> EXP[Expectativas]

[Ilustración: Un esquema con cinco cajas (Objetivo, Contexto, Rol, Formato, Evaluación) que alimentan una caja central llamada “Resultado”, al lado de otra caja “Expectativas” donde el autor compara lo obtenido con lo esperado.]

Ejemplo real: prompt de educación¶

Prompt inicial:

Explica la Ingenieria de Prompts.

Problemas:

Objetivo vago: no se especifica si la explicación debe ser básica, avanzada, breve o extensa.
Contexto inexistente: no se menciona audiencia ni propósito (clase, informe, resumen).
Formato indefinido: no se indica si se desea un texto estructurado, una lista, una analogía.

Versión mejorada con OCRFE:

Objetivo:
Explicar la Ingenieria de Prompts de forma introductoria.

Contexto:
La audiencia son estudiantes de primer semestre de tecnologia. La explicacion se usara como texto inicial en una clase.

Rol:
Actua como docente universitario.

Formato:
Texto de 3 parrafos, lenguaje claro y cercano, con un ejemplo sencillo.

Evaluacion:
Al finalizar, los estudiantes deben ser capaces de definir Ingenieria de Prompts con sus propias palabras.

Dato relevante
OpenAI y otros proveedores resaltan que prompts bien estructurados reducen la variabilidad y mejoran la fidelidad a las instrucciones, especialmente en modelos razonadores. [web:31][web:213]

Conclusión de la sección: un prompt falla a menudo porque uno o varios componentes de OCRFE están débiles o ausentes. Diagnosticar el fallo implica revisar objetivo, contexto, rol, formato y evaluación en relación con tus expectativas y el comportamiento del modelo. [web:31][web:103]

11.2 Los errores más comunes¶

La literatura técnica sobre prompt engineering identifica varios errores recurrentes que afectan la calidad de las respuestas. [web:103][web:212]

Errores habituales¶

Instrucciones ambiguas: frases como “hazlo bien”, “explica claro” sin criterios concretos.
Exceso de información: prompts que mezclan múltiples objetivos, contextos y preguntas en un solo bloque. [web:31]
Falta de contexto: pedir análisis o recomendaciones sin indicar audiencia, dominio o restricciones. [web:103]
Objetivos poco claros: no distinguir entre explicar, analizar, comparar, diseñar o evaluar.
Restricciones insuficientes: no definir límites de longitud, tono, formato o fuentes aceptables, lo que permite respuestas demasiado genéricas o desbordadas. [web:31]
Formato mal definido: no indicar estructura (secciones, listas, tablas), dificultando el uso de la respuesta en contextos profesionales. [web:212]
Ejemplos contradictorios: en Few-shot prompting, mostrar ejemplos inconsistentes o que no representan el comportamiento deseado. [web:213]

| Error común            | Causa probable                             |
|------------------------|--------------------------------------------|
| Ambiguedad             | Falta de criterios en Objetivo/Evaluacion  |
| Exceso de informacion  | Mezcla de objetivos sin modularidad        |
| Falta de contexto      | Contexto insuficiente o irrelevante        |
| Objetivo difuso        | No se define el tipo de tarea              |
| Restricciones pobres   | Faltan limites y reglas explicitas         |
| Formato ausente        | No se especifica estructura de salida      |
| Ejemplos contradictorios| Plantillas mal seleccionadas para Few-shot |

[Ilustración: Una pantalla donde se ve un prompt largo y confuso con anotaciones en rojo señalando “Ambigüedad”, “Objetivo indefinido”, “Demasiadas instrucciones mezcladas”.]

Error común
Intentar corregir resultados cambiando de modelo o de herramienta, sin revisar primero la calidad del prompt. Las guías modernas recomiendan optimizar el diseño antes de cambiar el stack. [web:31][web:212]

Conclusión de la sección: conocer los errores comunes te permite anticiparlos y detectarlos en tus propios prompts. El objetivo no es memorizarlos, sino integrarlos en tu proceso de diagnóstico para actuar sobre ellos de forma sistemática. [web:103]

11.3 Diagnóstico paso a paso (OCRFE)¶

Vamos a construir una metodología sistemática para revisar un prompt antes y después de ejecutarlo, basada en OCRFE y en prácticas de evaluación recomendadas por OpenAI y Microsoft. [web:31][web:205]

Flujo de diagnóstico¶

graph TD
  O[Objetivo] --> C[Contexto]
  C --> R[Rol]
  R --> F[Formato]
  F --> RE[Restricciones]
  RE --> X[Ejecutar prompt]
  X --> RES[Respuesta]
  RES --> M[Mejora]

Objetivo: ¿Qué tarea específica quieres que la IA realice?
Contexto: ¿Qué información necesita para hacerlo bien, y qué información puede estorbar?
Rol: ¿Es útil definir una perspectiva profesional o bastan las instrucciones generales?
Formato: ¿Cómo debe estructurarse la salida para que puedas usarla directamente?
Restricciones: ¿Qué límites y reglas deben respetarse (longitud, tono, fuentes, ética)?
Ejecutar prompt: Prueba el prompt con el modelo seleccionado.
Respuesta: Recoge la salida y compárala con tus criterios.
Mejora: Ajusta el prompt según las discrepancias observadas.

Checklist de diagnóstico (para `Optimizacion/Diagnostico.md`)¶

# Checklist de diagnostico de prompts

Objetivo
- [ ] Esta claramente definido el tipo de tarea (explicar, analizar, comparar, diseñar, evaluar).
- [ ] No mezcla varios objetivos en una sola instruccion.

Contexto
- [ ] Proporciona informacion relevante sobre audiencia y dominio.
- [ ] Evita detalles innecesarios que puedan confundir al modelo.

Rol
- [ ] Define un rol solo si aporta valor.
- [ ] Evita roles grandilocuentes o irreales.

Formato
- [ ] Especifica estructura (secciones, listas, tablas, diagramas).
- [ ] Incluye indicaciones de longitud y tono.

Restricciones
- [ ] Establece limites claros (por ejemplo, "no hacer X", "no usar Y").
- [ ] Incluye pautas eticas y de verificacion cuando corresponda.

Resultado
- [ ] La respuesta se evalua segun criterios definidos.
- [ ] Las discrepancias se documentan para la mejora.

[Ilustración: Un formulario en pantalla que refleja la checklist de diagnóstico, con casillas marcadas y comentarios indicando áreas de mejora en un prompt.]

Consejo
Antes de ajustar el modelo o los parámetros, pasa tu prompt por esta checklist. En muchos casos, pequeñas mejoras en objetivo, contexto o formato producen grandes cambios en la calidad del resultado. [web:31]

Conclusión de la sección: el diagnóstico paso a paso basado en OCRFE y una checklist explícita te da un proceso replicable para analizar por qué un prompt falla y cómo corregirlo. Es la base de tu metodología de optimización. [web:31][web:205]

11.4 Iteración profesional¶

Optimizar prompts es un proceso iterativo. OpenAI y otras guías recomiendan trabajar con versiones sucesivas, documentar cambios y, en entornos avanzados, usar herramientas como el Prompt Optimizer o Evals para ajustar prompts con datos. [web:210][web:206]

Ciclo de iteración¶

graph TD
  P0[Prompt v0] --> RUN0[Ejecutar]
  RUN0 --> OBS0[Observar respuesta]
  OBS0 --> AJ0[Identificar mejoras]
  AJ0 --> P1[Prompt v1]
  P1 --> RUN1[Re-ejecutar]
  RUN1 --> OBS1[Comparar]
  OBS1 --> AJ1[Refinar]

En tu PromptBook, puedes documentar este ciclo en Optimizacion/Iteraciones.md y Optimizacion/Mejoras.md.

Ejemplo de iteración:

v0: Prompt sin contexto de audiencia.
v1: Añadir audiencia y objetivo de aprendizaje.
v2: Definir formato en secciones y longitud.
v3: Añadir criterios de evaluación y restricciones (por ejemplo, evitar tecnicismos).

Relación con el versionado del PromptBook¶

Cada iteración que mejora un prompt importante debe reflejarse en:

11-Versiones/ (historial de cambios). [web:200]
CHANGELOG.md (resumen de mejoras relevantes).

| Version | Cambio principal                         | Motivo                          |
|--------|-------------------------------------------|---------------------------------|
| v0.1   | Prompt inicial sin OCRFE                  | Borrador de prueba              |
| v0.2   | Añadido contexto y audiencia              | Respuestas muy genericas        |
| v0.3   | Incluida estructura en secciones          | Dificil de usar en informes     |
| v0.4   | Añadidos criterios y restricciones        | Mejora de claridad y enfoque    |

[Ilustración: Una línea de tiempo con hitos de versión de un prompt, cada hito mostrando breves anotaciones sobre qué se mejoró y por qué.]

Buenas prácticas
No intentes “arreglar todo” en una sola iteración. Cambia una o dos cosas por vez (por ejemplo, el objetivo y el formato) y observa su impacto. Esto facilita entender qué ajustes realmente mejoran el comportamiento. [web:210]

Conclusión de la sección: la iteración profesional se basa en versiones, observación sistemática y documentación clara de cambios. Tu PromptBook y Git se convierten en el registro de esa evolución. [web:206][web:210]

11.5 Evaluando respuestas¶

Diagnosticar y optimizar prompts requiere evaluar respuestas con criterios claros. Microsoft y OpenAI describen métricas como precisión, coherencia, utilidad, consistencia y verificabilidad. [web:205][web:207][web:208]

Dimensiones de evaluación¶

Precisión: ¿La respuesta contiene información correcta según fuentes confiables?
Coherencia: ¿Las ideas se presentan de forma lógica y ordenada? [web:208]
Utilidad: ¿La respuesta es accionable y relevante para el objetivo del prompt?
Consistencia: ¿La respuesta respeta el tono, el rol y el contexto definidos? [web:31]
Verificabilidad: ¿Es posible verificar sus afirmaciones mediante fuentes externas? [web:204]
Cumplimiento del objetivo: ¿La respuesta cumple con la tarea planteada en la sección Objetivo?

Rúbrica reutilizable (para `Checklist-Calidad.md`)¶

# Rúbrica de evaluacion de respuestas de IA

1. Cumplimiento del objetivo
- 1: No aborda el objetivo.
- 2: Lo aborda parcialmente, con desviaciones.
- 3: Lo cumple de manera aceptable.
- 4: Lo cumple bien, con ejemplos relevantes.
- 5: Lo cumple de forma excelente y completa.

2. Coherencia
- 1: Ideas desordenadas, sin hilo claro.
- 2: Coherencia limitada, saltos logicos.
- 3: Coherencia aceptable.
- 4: Flujo logico claro y ordenado.
- 5: Estructura impecable, muy facil de seguir.

3. Precisión y verificabilidad
- 1: Datos incorrectos o dudosos frecuentes.
- 2: Mezcla de aciertos y errores sin señalizacion.
- 3: Mayormente correcta, con pocos puntos a verificar.
- 4: Bastante precisa, con indicios de fuentes.
- 5: Precisa y facil de verificar, indica referencias cuando procede.

4. Utilidad
- 1: Poco util para el problema real.
- 2: Algo util, pero requiere mucha reinterpretacion.
- 3: Util y aplicable con ajustes menores.
- 4: Muy util y directamente accionable.
- 5: Altamente util, aporta ideas y estructura aprovechables.

5. Consistencia con tono y rol
- 1: Ignora tono y rol.
- 2: Los sigue parcialmente.
- 3: Mayormente consistente.
- 4: Consistente y alineado.
- 5: Totalmente alineado, refuerza la identidad del proyecto.

| Dimension            | Referencia tecnica                          |
|----------------------|---------------------------------------------|
| Coherencia           | Evaluadores de flujo logico (Microsoft)     |
| Fluidez / claridad   | Evaluadores de fluidez (Microsoft)          |
| Precision            | Fact checking y evals de veracidad (OpenAI) |
| Utilidad             | Evaluaciones de tarea cumplida              |
| Consistencia de rol  | Guía de prompt personas (Anthropic)         |

[Ilustración: Un formulario de evaluación con sliders para cada dimensión (cumplimiento, coherencia, precisión, utilidad, consistencia), llenado por un evaluador humano mientras revisa la respuesta de IA.]

Dato relevante
Microsoft Foundry describe evaluadores de coherencia y fluidez que usan LLM como jueces para cuantificar la calidad de texto, pero recomienda combinar estos métodos con revisión humana. [web:208]

Conclusión de la sección: evaluar respuestas con una rúbrica explícita te permite salir de impresiones subjetivas y tener criterios repetibles. Esto es esencial para comparar versiones de prompts y decidir cuándo una mejora realmente funciona. [web:205][web:208]

11.6 Casos reales de diagnóstico y optimización¶

Vamos a aplicar la metodología a ejemplos concretos en distintos dominios: educación, investigación, programación, marketing, generación de imágenes y productividad.

Caso 1: Educación¶

Prompt inicial:

Genera una clase sobre Ingenieria de Prompts.

Problemas:

Objetivo vago: “una clase” puede ser cualquier cosa.
Contexto pobre: no se define nivel ni modalidad.
Formato indefinido: no se sabe si se requiere plan, guion o materiales.

Versión optimizada:

Objetivo:
Diseñar una clase de 45 minutos sobre Ingenieria de Prompts para estudiantes de tercer semestre de tecnologia.

Contexto:
La clase se imparte en laboratorio con acceso a modelos de lenguaje. Los estudiantes ya conocen conceptos basicos de IA generativa.

Rol:
Actua como diseñador instruccional especializado en educacion tecnologica.

Formato:
Presenta:
- objetivos de aprendizaje;
- actividades principales;
- recursos necesarios;
- criterios de evaluacion.

Evaluacion:
La clase debe permitir que los estudiantes redacten al menos 2 prompts eficaces y reflexionen sobre errores comunes.

Caso 2: Investigación¶

Prompt inicial:

Investiga el impacto de IA en la educacion.

Problemas: igual que antes, demasiado general.

Optimización: aplicar OCRFE, delimitar tipo de investigación (estado del arte, caso regional), audiencia, formato.

Caso 3: Programación¶

Prompt inicial:

Corrige este codigo.

Problemas:

Falta de contexto (lenguaje, entorno, requisitos).
No se indica tipo de corrección (bug, rendimiento, estilo).

Versión optimizada:

Objetivo:
Identificar y corregir errores en la siguiente funcion de Node.js que procesa pagos.

Contexto:
La aplicacion usa una API externa de pagos y se ejecuta en entorno de produccion con alto volumen.

Rol:
Actua como desarrollador senior especializado en integraciones de APIs.

Formato:
Indica:
- posibles puntos de fallo;
- sugerencias de correccion;
- version mejorada del codigo;
- recomendaciones de pruebas.

Evaluacion:
Las mejoras deben preservar la logica de negocio y mejorar manejo de errores.

Codigo:
[pegar funcion]

Caso 4: Marketing¶

Prompt inicial:

Escribe un texto para promocionar un curso de IA.

Optimización: definir audiencia, canal (email, landing, redes), tono, estructura (gancho, beneficios, llamada a la acción), criterios de éxito.

Caso 5: Generación de imágenes¶

Prompt inicial:

Crea una imagen sobre IA en educacion.

Optimización: usar anatomía visual + OCRFE, como en el capítulo 9.

Caso 6: Productividad¶

Prompt inicial:

Ayudame a organizar mi dia.

Problemas: sin contexto (tipo de trabajo, restricciones, prioridades).

Versión optimizada:

Objetivo:
Diseñar un plan de trabajo para hoy centrado en tareas de escritura tecnica.

Contexto:
Dispongo de 6 horas efectivas, trabajo desde casa y tengo 3 entregables: un informe, un capitulo de libro y revision de correos.

Rol:
Actua como coach de productividad.

Formato:
Presenta un horario bloqueado por franjas de 60 minutos, con descansos, prioridades y recomendaciones de foco.

Evaluacion:
El plan debe ser realista y permitir avanzar en los 3 entregables sin sobrecarga.

| Caso       | Problema inicial                 | Mejora aplicada                      |
|-----------|----------------------------------|--------------------------------------|
| Educacion | Objetivo vago, sin contexto      | OCRFE completo, clase estructurada   |
| Investigacion | Pregunta general              | Delimitacion de tipo y audiencia     |
| Programacion | "Corrige este codigo"         | Contexto tecnico, rol y formato      |
| Marketing | "Texto para curso"              | Canal, tono, estructura, CTA         |
| Imagenes  | "Imagen sobre IA"               | Anatomia visual + OCRFE              |
| Productividad | "Organiza mi dia"           | Restricciones, tareas, formato       |

[Ilustración: Dos columnas de prompts, una etiquetada “Antes” (prompts breves y vagos) y otra “Después” (prompts estructurados), con flechas indicando la transformación.]

Buenas prácticas
Usa casos reales de tu propia práctica para alimentar Optimizacion/CasosReales.md. Documenta el antes, el después y las lecciones aprendidas. Esto convierte fallos pasados en guías para el futuro.

Conclusión de la sección: trabajar con casos reales te permite ver la metodología de diagnóstico en acción. El objetivo es que reconozcas patrones de error y sepas cómo corregirlos en distintos dominios. [web:103][web:212]

11.7 Auditoría del PromptBook¶

Una vez que tienes herramientas de diagnóstico y rúbricas, puedes auditar tu PromptBook completo.

Objetivos de la auditoría¶

Detectar plantillas y prompts que han quedado desactualizados.
Identificar incoherencias entre principios, patrones y plantillas reales.
Mejorar prompts críticos usados con frecuencia.
Documentar versiones y cambios relevantes.

En la carpeta Optimizacion/Auditoria.md, puedes definir un proceso como:

# Proceso de auditoria del PromptBook

1. Seleccionar un dominio (Escritura, Investigacion, Coding, Multimedia).
2. Listar los prompts mas usados en ese dominio.
3. Evaluarlos con la checklist de diagnostico y la rúbrica de calidad.
4. Identificar debilidades y registrar observaciones.
5. Diseñar mejoras y nuevas versiones.
6. Actualizar la documentacion y el CHANGELOG.

graph TD
  SEL[Seleccion de prompts] --> EVAL[Evaluacion con rúbrica]
  EVAL --> OBS[Observaciones]
  OBS --> FIX[Diseño de mejoras]
  FIX --> UPD[Actualizacion de PromptBook]
  UPD --> LOG[Registro en CHANGELOG]

[Ilustración: Una vista de hoja de cálculo o tablero Kanban con tarjetas de prompts etiquetadas como “Revisar”, “En mejora”, “Actualizado”, reflejando el proceso de auditoría.]

Consejo
Prioriza la auditoría en prompts de alto impacto (por ejemplo, los que usas para informes, arquitectura de sistemas o materiales educativos clave). No todos los prompts necesitan el mismo nivel de cuidado.

Conclusión de la sección: auditar el PromptBook es la aplicación práctica de tu metodología de diagnóstico a escala. Convierte tu sistema en un proyecto vivo en mejora constante, en lugar de un repositorio estático. [web:200]

11.8 Construyendo una metodología de mejora continua¶

La mejora continua de prompts se parece a prácticas de ingeniería como DevOps o MLOps: ciclos recurrentes de evaluación, ajuste y despliegue. OpenAI Evals y herramientas similares proponen flujos automatizados, pero la lógica subyacente se puede aplicar manualmente a tu PromptBook. [web:204][web:209][web:214]

Ciclo de mejora continua¶

graph TD
  PLAN[Planificar] --> DESIGN[Diseñar prompts]
  DESIGN --> RUN[Ejecutar]
  RUN --> EVAL[Evaluar respuestas]
  EVAL --> LEARN[Aprender y documentar]
  LEARN --> IMPROVE[Mejorar prompts]
  IMPROVE --> PLAN

Planificar: Definir qué procesos o dominios necesitan mejoras (por ejemplo, investigación, coding, multimedia).
Diseñar prompts: Usar OCRFE y plantillas para nuevas versiones.
Ejecutar: Probar los prompts con modelos relevantes.
Evaluar: Aplicar rúbricas de calidad, fact checking y feedback de usuarios. [web:205][web:206]
Aprender y documentar: Registrar observaciones en Optimizacion/Iteraciones.md y Mejoras.md.
Mejorar prompts: Actualizar plantillas, ajustar variables y refinar flujos.

| Fase       | Actividades clave                               |
|-----------|--------------------------------------------------|
| Planificar| Identificar procesos y prompts a mejorar         |
| Diseñar   | Crear o ajustar plantillas OCRFE                 |
| Ejecutar  | Probar en modelos y contextos reales             |
| Evaluar   | Aplicar rubricas y verificaciones                |
| Aprender  | Documentar hallazgos y decisiones                |
| Mejorar   | Actualizar PromptBook y versionado               |

[Ilustración: Un círculo dividido en seis secciones etiquetadas con las fases del ciclo (Planificar, Diseñar, Ejecutar, Evaluar, Aprender, Mejorar), mostrando un proceso continuo.]

Buenas prácticas
Reserva tiempo regular (por ejemplo, una vez al mes) para un “sprint de mejora de prompts”: revisa tu PromptBook, aplica tu metodología y lanza una nueva versión con mejoras documentadas.

Conclusión de la sección: la mejora continua convierte tu PromptBook en un sistema que evoluciona con tu práctica y con los modelos disponibles. No se trata de “arreglar todo de una vez”, sino de mantener un proceso recurrente de diagnóstico y optimización. [web:204][web:210]

Práctica guiada¶

Durante este capítulo te proponemos las siguientes actividades, todas vinculadas a la nueva carpeta Optimizacion/ de tu PromptBook:

1. Diagnosticar varios prompts¶

Elige al menos 5 prompts que utilices habitualmente (en escritura, investigación, coding, multimedia, productividad).
Usa la checklist de diagnóstico para analizar cada uno antes de ejecutarlo.

2. Corregir errores y comparar resultados¶

Ajusta los prompts según los problemas detectados (objetivo, contexto, formato, etc.).
Ejecuta las versiones mejoradas y compara resultados, anotando diferencias en Optimizacion/CasosReales.md.

3. Construir una rúbrica de evaluación¶

Completa y adapta la rúbrica propuesta en Checklist-Calidad.md según tu contexto.
Aplica la rúbrica a varias respuestas y registra puntuaciones.

4. Crear una checklist profesional¶

En Checklist-Calidad.md, añade secciones para distintos dominios (escritura, investigación, coding, multimedia) con criterios específicos.

5. Auditar tu PromptBook completo¶

Define un plan de auditoría en Auditoria.md y comienza por un dominio (por ejemplo, 04-Escritura/).
Documenta hallazgos, mejoras propuestas y cambios realizados, actualizando 11-Versiones/ y CHANGELOG.md.

Consejo
Considera estas actividades como el inicio de tu práctica profesional de “PromptOps”: procesos repetibles para mantener tu sistema de prompts sano, actualizado y alineado con tus objetivos.

11.9 Resumen¶

En este capítulo has desarrollado una metodología profesional para diagnosticar y optimizar prompts. Comenzamos analizando por qué un prompt falla, usando OCRFE para revisar objetivo, contexto, rol, formato y evaluación, y distinguimos errores comunes como ambigüedad, falta de contexto y formatos mal definidos. [web:31][web:103]

Diseñaste un flujo de diagnóstico paso a paso y una checklist que se integra en la nueva carpeta Optimizacion/ de tu PromptBook. Luego, exploramos la iteración profesional y su relación con el versionado en Git y GitHub, y construimos una rúbrica de evaluación basada en dimensiones como precisión, coherencia, utilidad, consistencia y verificabilidad. [web:205][web:208][web:200]

Aplicaste estos conceptos a casos reales en educación, investigación, programación, marketing, generación de imágenes y productividad, y definiste un proceso de auditoría para revisar todo tu PromptBook. Finalmente, estableciste un ciclo de mejora continua inspirado en prácticas de evaluación y optimización de modelos (Evals, Prompt Optimizer) adaptado a tu contexto de Ingeniería de Prompts. [web:204][web:210]

Nota
En el capítulo final, integrarás esta metodología con todos los componentes anteriores (patrones, plantillas, flujos, sistemas) para consolidar tu PromptBook como herramienta integral de trabajo con IA.

Conclusión general del capítulo: dominar el diagnóstico y la optimización de prompts te permite pasar de usar IA de forma reactiva a gestionarla como parte de un sistema controlado. Tu PromptBook se convierte en un laboratorio de mejora continua donde cada experiencia con modelos se traduce en aprendizajes y mejoras documentadas. [web:31][web:204]

Bibliografía¶

OpenAI Developers. “Prompt engineering.” Guía oficial sobre diseño de prompts y buenas prácticas. https://developers.openai.com/api/docs/guides/prompt-engineering [web:31]
OpenAI Developers. “Prompt guidance.” Documento sobre principios de diseño, claridad y estructura en prompts. https://developers.openai.com/api/docs/guides/prompt-guidance [web:45]
OpenAI Developers. “Working with evals.” Documentación sobre el uso de Evals para evaluar y mejorar sistemas basados en LLM. https://developers.openai.com/api/docs/guides/evals [web:209]
OpenAI Developers. “Evaluation best practices.” Guía de buenas prácticas para configurar, ejecutar y analizar evaluaciones. https://developers.openai.com/api/docs/guides/evaluation-best-practices [web:204]
OpenAI Developers. “Prompt optimizer.” Guía sobre el uso del optimizador de prompts basado en datasets y gradadores. https://platform.openai.com/docs/guides/prompt-optimizer [web:210]
OpenAI Developers. “Evals – resources.” Recursos adicionales sobre evaluación de modelos. https://developers.openai.com/learn/evals [web:214]
Microsoft Learn. “Evaluation metrics – generative AI.” Descripción de métricas para evaluar contenido generado por LLM. https://learn.microsoft.com/en-us/ai/playbook/technology-guidance/generative-ai/working-with-llms/evaluation/list-of-eval-metric [web:205]
Microsoft Learn. “Microsoft.Extensions.AI.Evaluation libraries – .NET.” Librerías para evaluar respuestas de modelos en aplicaciones .NET. https://learn.microsoft.com/en-us/dotnet/ai/conceptual/evaluation-libraries [web:207]
Microsoft Foundry. “General Purpose Evaluators for Generative AI.” Evaluadores de coherencia y fluidez para texto generado. https://learn.microsoft.com/en-us/azure/foundry/concepts/evaluation-evaluators/general-purpose-evaluators [web:208]
QASkills. “OpenAI Evals Best Practices: Production Patterns for 2026.” Artículo sobre patrones de evaluación en producción. https://qaskills.sh/blog/openai-evals-best-practices-2026 [web:206]
Starpop / BrightCoding. “OpenAI Prompt Engineering Guide: Best Practices For 2026.” Compilación de buenas prácticas modernas de prompting. https://starpop.ai/blog/articles/openai-prompt-engineering-guide [web:103]
PromptLayer Blog. “Applying Anthropic's Prompt Guide: Practical Insights for Claude.” Artículo sobre precisión y estructura en prompts para Claude. https://blog.promptlayer.com/how-to-apply-anthropic-s-prompt-guide/ [web:212]
Thomas Wiegold. “Prompt Engineering Best Practices 2026.” Análisis sobre cambios en mejores prácticas de prompting. https://thomas-wiegold.com/blog/prompt-engineering-best-practices-2026/ [web:211]
LogicAngel. “Prompt management: How to manage your prompt catalog.” Guía sobre gestión, versionado y auditoría de catálogos de prompts. https://www.logicangel.fr/en/prompt-management-comment-gerer-son-catalogue-de-prompts/ [web:200]

Capítulo 11¶

Diagnóstico y optimización de prompts¶

11.0 Objetivo del capítulo¶

11.1 ¿Por qué un prompt falla?¶

El modelo no siempre es el culpable¶

Ejemplo real: prompt de educación¶

11.2 Los errores más comunes¶

Errores habituales¶

11.3 Diagnóstico paso a paso (OCRFE)¶

Flujo de diagnóstico¶

Checklist de diagnóstico (para Optimizacion/Diagnostico.md)¶

11.4 Iteración profesional¶

Ciclo de iteración¶

Relación con el versionado del PromptBook¶

11.5 Evaluando respuestas¶

Dimensiones de evaluación¶

Rúbrica reutilizable (para Checklist-Calidad.md)¶

11.6 Casos reales de diagnóstico y optimización¶

Caso 1: Educación¶

Caso 2: Investigación¶

Caso 3: Programación¶

Caso 4: Marketing¶

Caso 5: Generación de imágenes¶

Caso 6: Productividad¶

11.7 Auditoría del PromptBook¶

Objetivos de la auditoría¶

11.8 Construyendo una metodología de mejora continua¶

Ciclo de mejora continua¶

Práctica guiada¶

1. Diagnosticar varios prompts¶

2. Corregir errores y comparar resultados¶

3. Construir una rúbrica de evaluación¶

4. Crear una checklist profesional¶

5. Auditar tu PromptBook completo¶

11.9 Resumen¶

Bibliografía¶

Checklist de diagnóstico (para `Optimizacion/Diagnostico.md`)¶

Rúbrica reutilizable (para `Checklist-Calidad.md`)¶