Validé las pistas interlingüísticas EN↔ES con IA: solo 37 mapeos útiles de 200

Analicé 200 unidades de 4 manuales buscando similitudes EN↔ES para mi bot de español. Solo 37 mapeos gramaticales sobrevivieron al filtro de calidad.

Análisis de pistas interlingüísticas EN↔ES con IA

En mi post anterior escribí sobre el modo expat: el escenario en el que alguien de habla rusa vive en España, ya sabe inglés y ahora quiere llevar su español a un nivel funcional. Después de lanzar la versión básica del bot, el siguiente paso era validar una funcionalidad concreta:

### El problema del que partí

Por experiencia propia: cuando estaba aprendiendo español, mi profesora no paraba de conectarlo con el inglés:

- "Esto es casi como el Present Perfect."

- "Esta estructura funciona como en inglés, con esta excepción."

Le quitaba mucha carga a mi cerebro: no tenía que aprender todo "desde cero", podía apoyarme en estructuras que ya conocía.

Cuando trasladé esto al trabajo de producto, la hipótesis era la siguiente:

- Los manuales deberían tener muchos puntos de contacto naturales entre EN y ES.

- Si recojo esos puntos y los empaqueto como pistas, al expat le debería costar menos transferir conocimiento de un idioma al otro.

- Así que en el bot solo necesitaba un botón "Comparar con EN/ES" y una forma de sacar el mapeo relevante.

### Realidad: muchos menos mapeos de lo que parece

Cogí 4 manuales, unas 200 unidades, y me puse a buscar solapamientos reales:

- tiempos verbales similares

- estructuras similares

- trampas típicas para hablantes de ruso

En cuanto formalizas todo esto, se te caen las gafas de color de rosa bastante rápido:

- solo 68 pares entre unidades

- y 37 mapeos gramaticales EN↔ES

Desde la perspectiva de un profesor, "hay muchas similitudes".

Desde la perspectiva de producto, no son tantas — si te importa la UX y la calidad de las pistas.

Algunas de esas "similitudes" resultaron ser:

- o demasiado superficiales

- o directamente confusas (falsos amigos, rangos de uso diferentes, etc.)

### Cómo recogí los datos: Perplexity + Claude como stack de producto

Hacer todo esto a mano habría llevado semanas. Así que me fui directo a un stack de herramientas de IA y monté un pipeline pequeño.

### 1. Perplexity — investigación y columna vertebral académica

Le pedí a Perplexity mapeos gramaticales EN↔ES con un contexto muy específico:

El resultado fueron 37 mapeos gramaticales en JSON, listos para importar. Eso eliminó horas de trabajo rutinario: buscar, estructurar y normalizar datos.

Aquí Perplexity funciona como un "coautor académico": tira de investigación, mantiene el lenguaje preciso y evita la "lingüística pop".

### 2. Claude Sonnet — matcher semántico para unidades

La siguiente capa no es gramática abstracta, sino unidades concretas de los manuales.

Le paso a Sonnet las listas de unidades en inglés y español y le pido que encuentre pares:

Aquí era clave limitar el volumen (25–35 mapeos) y exigir un formato estricto.

Si no, el modelo o te inunda de coincidencias superficiales, o se pone demasiado prudente y te da 5–7 pares.

El resultado: 68 pares de unidades que puedo vincular a pantallas reales en la app.

### 3. Claude Code — pegamento entre datos y producto

Por separado, usé Claude Code como herramienta de desarrollo:

- parsear JSON de Perplexity y Sonnet

- mapearlo sobre las estructuras internas del bot

- montar una capa de API detrás del botón "Comparar con EN/ES"

Esto ya es un pequeño stack de producto con IA, no "un modelo mágico que lo hace todo".

### Cómo se refleja en la UX del bot

En la parte de UX, ahora mismo tengo tres escenarios básicos para mostrar pistas:

- Cuando el alumno está leyendo teoría → botón "Comparar con EN/ES"

- Cuando el alumno responde mal → si hay un mapeo relevante, el bot añade:

- En el resto de casos → no se fuerzan pistas, el usuario mantiene el control

Perplexity es útil aquí no solo como generador de datos, sino también como asesor de UX: cuándo mostrar comparaciones y cuándo callarse para no saturar la pantalla ni la cabeza del alumno.

### Lo que aprendí como persona de producto

Unas cuantas conclusiones que me importan desde el punto de vista de producto, no solo como "alguien a quien le gustan los idiomas":

- "Cuantas más pistas interlingüísticas, mejor" es un objetivo equivocado.

- El combo Perplexity + Claude supera a cualquier herramienta todoterreno.

- El código y los datos son solo la mitad del trabajo.

- En este caso, la IA no es un "botón mágico" sino un acelerador de investigación y prototipado.