Validé las pistas interlingüísticas EN↔ES con IA: solo 37 mapeos útiles de 200
Analicé 200 unidades de 4 manuales buscando similitudes EN↔ES para mi bot de español. Solo 37 mapeos gramaticales sobrevivieron al filtro de calidad.
En mi post anterior escribí sobre el modo expat: el escenario en el que alguien de habla rusa vive en España, ya sabe inglés y ahora quiere llevar su español a un nivel funcional. Después de lanzar la versión básica del bot, el siguiente paso era validar una funcionalidad concreta:
### El problema del que partí
Por experiencia propia: cuando estaba aprendiendo español, mi profesora no paraba de conectarlo con el inglés:
- "Esto es casi como el Present Perfect."
- "Esta estructura funciona como en inglés, con esta excepción."
Le quitaba mucha carga a mi cerebro: no tenía que aprender todo "desde cero", podía apoyarme en estructuras que ya conocía.
Cuando trasladé esto al trabajo de producto, la hipótesis era la siguiente:
- Los manuales deberían tener muchos puntos de contacto naturales entre EN y ES.
- Si recojo esos puntos y los empaqueto como pistas, al expat le debería costar menos transferir conocimiento de un idioma al otro.
- Así que en el bot solo necesitaba un botón "Comparar con EN/ES" y una forma de sacar el mapeo relevante.
### Realidad: muchos menos mapeos de lo que parece
Cogí 4 manuales, unas 200 unidades, y me puse a buscar solapamientos reales:
- tiempos verbales similares
- estructuras similares
- trampas típicas para hablantes de ruso
En cuanto formalizas todo esto, se te caen las gafas de color de rosa bastante rápido:
- solo 68 pares entre unidades
- y 37 mapeos gramaticales EN↔ES
Desde la perspectiva de un profesor, "hay muchas similitudes".
Desde la perspectiva de producto, no son tantas — si te importa la UX y la calidad de las pistas.
Algunas de esas "similitudes" resultaron ser:
- o demasiado superficiales
- o directamente confusas (falsos amigos, rangos de uso diferentes, etc.)
### Cómo recogí los datos: Perplexity + Claude como stack de producto
Hacer todo esto a mano habría llevado semanas. Así que me fui directo a un stack de herramientas de IA y monté un pipeline pequeño.
### 1. Perplexity — investigación y columna vertebral académica
Le pedí a Perplexity mapeos gramaticales EN↔ES con un contexto muy específico:
El resultado fueron 37 mapeos gramaticales en JSON, listos para importar. Eso eliminó horas de trabajo rutinario: buscar, estructurar y normalizar datos.
Aquí Perplexity funciona como un "coautor académico": tira de investigación, mantiene el lenguaje preciso y evita la "lingüística pop".
### 2. Claude Sonnet — matcher semántico para unidades
La siguiente capa no es gramática abstracta, sino unidades concretas de los manuales.
Le paso a Sonnet las listas de unidades en inglés y español y le pido que encuentre pares:
Aquí era clave limitar el volumen (25–35 mapeos) y exigir un formato estricto.
Si no, el modelo o te inunda de coincidencias superficiales, o se pone demasiado prudente y te da 5–7 pares.
El resultado: 68 pares de unidades que puedo vincular a pantallas reales en la app.
### 3. Claude Code — pegamento entre datos y producto
Por separado, usé Claude Code como herramienta de desarrollo:
- parsear JSON de Perplexity y Sonnet
- mapearlo sobre las estructuras internas del bot
- montar una capa de API detrás del botón "Comparar con EN/ES"
Esto ya es un pequeño stack de producto con IA, no "un modelo mágico que lo hace todo".
### Cómo se refleja en la UX del bot
En la parte de UX, ahora mismo tengo tres escenarios básicos para mostrar pistas:
- Cuando el alumno está leyendo teoría → botón "Comparar con EN/ES"
- Cuando el alumno responde mal → si hay un mapeo relevante, el bot añade:
- En el resto de casos → no se fuerzan pistas, el usuario mantiene el control
Perplexity es útil aquí no solo como generador de datos, sino también como asesor de UX: cuándo mostrar comparaciones y cuándo callarse para no saturar la pantalla ni la cabeza del alumno.
### Lo que aprendí como persona de producto
Unas cuantas conclusiones que me importan desde el punto de vista de producto, no solo como "alguien a quien le gustan los idiomas":
- "Cuantas más pistas interlingüísticas, mejor" es un objetivo equivocado.
- El combo Perplexity + Claude supera a cualquier herramienta todoterreno.
- El código y los datos son solo la mitad del trabajo.
- En este caso, la IA no es un "botón mágico" sino un acelerador de investigación y prototipado.