Manzanas, no piñas: triple validación para domar la IA
El modelo insistía en ofrecer piñas cuando la vacante pedía manzanas. Tres puertas de validación resolvieron lo que ningún prompt logró.
### Una historia de manzanas, piñas y el tercer camino
Sobre el papel, lo tenía claro desde el principio: primero la vacante. No un currículum, no un "mira qué brillante soy", sino una respuesta directa a lo que pide el empleador. La vacante pide manzanas — traemos manzanas. Punto.
Solo que el modelo se negaba a vivir en ese mundo. Yo le decía educadamente: "Manzanas, por favor." Y me devolvía una sonrisa: "¿Qué tal unas piñas estupendas?" Reformulé, afiné el prompt, añadí restricciones, quité heurísticas. La vacante seguía pidiendo manzanas y el modelo seguía vendiéndome piñas con entusiasmo. El día de la marmota, con aroma tropical.
Insistí. Supliqué. Escribí ejemplos, contraejemplos y tablas de correspondencia. Y… nada. En el mejor de los casos, accedía a ofrecer una pera. Parecía que dentro del modelo vivía un vendedor profesional de frutas exóticas, convencido de que "la fruta correcta es la que tiene mejor pinta."
Así que hice lo que hace uno cuando la lógica deja de funcionar: le metí diez páginas de teoría sobre cómo responder a ofertas de empleo. Estructura de respuesta, puntos de dolor, responsabilidades críticas, logros que resuenan, factores de riesgo del empleador, contexto del sector. Quería creer que lo "entendería." No lo hizo — no de verdad. Pero algo se movió. Como si hubiera aparecido un imán débil para la palabra "manzana" dentro del modelo, aunque sin fuerza suficiente para girar la aguja de la brújula.
La verdad, estaba agotado. En vez de otro ritual de "un prompt más y funciona", traje un modelo distinto. Opus. Una cabeza fresca de otra escuela. Y en la primera pasada no discutió sobre frutas. Propuso un tercer plan — triple validación. Y de repente el puzle empezó a encajar.
### Planteamiento: "manzanas contra piñas"
Los errores sientan bien cuando son elegantes. El mío lo era. Pensaba que "primero la vacante" significaba compilar la lista correcta. En realidad se trata de una disciplina de deferencia. El modelo no paraba de empujar sus propias prioridades: más alto, más brillante, más impresionante. Yo pedía manzanas; me ofrecía piñas porque las piñas puntúan más en un ranking global de "vistosidad de habilidades." El algoritmo funcionaba — solo que al servicio del objetivo equivocado.
Ni diez páginas de teoría curaron el "reflejo piña." Solo bajaron el volumen: el modelo mencionaba "manzana" un poco más a menudo, pero seguía sacando la "jugosa exótica" al escaparate.
### Giro: el tercer camino
Opus se comportó de otra manera. No discutió sobre qué fruta es "mejor en general" — propuso un procedimiento donde una piña simplemente no tiene por dónde colarse si lo que se pide es una manzana. No una prohibición, sino una secuencia de puertas por las que solo puede pasar el elemento necesario.
La triple validación quedaba así.
1) Validación de vocabulario contra la vacante
Primero, formamos una lista de requisitos a partir del texto de la oferta. No una nube difusa de sinónimos, sino términos semilla estrictos: nombres de responsabilidades, habilidades clave, formas derivadas. En esta fase cualquier "piña" se filtra porque no encaja con el vocabulario de la vacante. Si un término no aparece explícitamente o mediante sinonimia verificada, no es "la fruta de hoy."
2) Validación de evidencia desde el currículum
Después, cada posible "manzana" tiene que presentar un recibo: dónde exactamente en la experiencia está respaldada. No un simple "sé hacer presupuestos", sino "reduje X en Y, gestioné Z por valor de N, implementé el proceso M." Sin evidencia en la experiencia, el elemento se cae, por muy jugoso que parezca. Hasta la piña más aromática es inútil aquí: sin pruebas es solo una etiqueta.
3) Validación de contexto de rol
Por último, comprobamos el encaje por nivel y entorno. Si la vacante es de gestión operativa y la habilidad es una fruta estratégica rara de nivel senior, puede ser "genial", pero está fuera de lugar. Esta fase elimina elementos que pasaron las dos primeras puertas pero no encajan con el tono, el alcance o la responsabilidad que se necesita hoy. Calibra el conjunto final a la realidad de la vacante, no a un "máximo" abstracto.
Después de eso, simplemente no queda espacio en el embudo para exotismos "porque quedan bonitos." Si la vacante pide manzanas, el resultado son manzanas. Quizá con canela. Quizá con un cuchillo y una tabla de cortar. Pero piñas, seguro que no.
### Acción: qué cambió en el sistema
Reestructuré mi pipeline siguiendo este orden:
- en vez de "elige primero las mejores habilidades y que el modelo se apañe", pasó a ser "lista primero los requisitos de la vacante de forma estricta"
- luego añadí una capa de evidencia: para cada requisito, dónde exactamente en la experiencia vive la prueba, con un puntero al dato concreto
- y encima añadí una capa de contexto de rol para que no se cuelen desajustes de nivel o dominio
Lo interesante es que no hicieron falta cambios heroicos en el código. Lo que importaba era el ritmo. Cuando el orden de las puertas es el correcto, los prompts se acortan, el JSON se rompe menos y el modelo alucina menos. Donde antes giraba diales y discutía, ahora simplemente marco "pasa" o "no pasa."
### Clímax: el momento de la verdad
Un test que antes fallaba empezó a devolver una lista con sentido. En los mismos puntos donde el modelo antes metía habilidades "vistosas" que no venían a cuento, ahora admitía con calma: "sin evidencia", "no encaja con el tono del rol", "no lo requiere el vocabulario." Y lo mejor — cuando hacían falta manzanas, por fin llegaban primero. Si no había suficientes manzanas, la lista se quedaba honestamente escueta en vez de colar piñas "para probar."
Ahí apareció una sensación de verdad. No porque hubiera más marcas verdes, sino porque desapareció la excusa de "bueno, esto también mola." Quedó un "sí o no" limpio. Un criterio sencillo que puedes defender.
### Resolución: qué me enseñó la triple validación
- Primero la vacante no es "decir las palabras correctas." Es una arquitectura donde las piñas no tienen dónde vivir.
- La teoría ayuda, pero sola solo empuja la aguja de la brújula. El procedimiento marca el rumbo.
- Los modelos responden mejor no a "un ejemplo más", sino a "una puerta más."
- El orden correcto de comprobaciones cura el 80% de la magia de prompts. El resto es oficio.
Y quizá lo más importante para cualquiera que esté empezando con IA: no intentes convencer a un modelo de que acepte manzanas. Construye un proceso donde las manzanas sean el único resultado posible cuando realmente se piden. A las palabras les sonríe. A los procedimientos les obedece.
A partir de ahí discutí menos y simplifiqué más. Tres puertas, luego el resultado. Si no pasa — esas no son nuestras manzanas. Y esa también es una respuesta honesta.