Porque no deberías de hacer IA Generativa… Aún

Evita IA generativa empresarial si… Esta imagen lo dice todo: muchos están saltando directamente a la IA Generativa (GenAI), dejando atrás los peldaños esenciales sobre el lenguaje; conceptos de Procesamiento de Lenguaje Natural (NLP); Vectores y Embeddings. ¡Y no los culpo! Hacer GenAI es emocionante y accesible, pero… ¿estamos realmente entendiendo lo que estamos haciendo?
La necesidad de la Exploración “Sucia” es insuficiente
Le diremos exploración sucia a explorar sin ningún orden, guía o acompañamiento. Así que, si alguien necesita explorar de forma ‘sucia’ la tecnología, al menos yo no le diría que no. Aún si eso es caro, sale mal, o hay muchos falsos positivos.
Al final, así aprendimos todos con tecnologías previas, a base de fallar. Experimentar con Gen AI sin un conocimiento profundo puede ser costoso y frustrante, pero también puede ser un catalizador para el aprendizaje… Siempre y cuando no lo lleves a producción ni te hagas pasar por un experto. Muchas empresas confiarán en tu criterio, y eso puede salir mal.

Evita IA generativa empresarial si… El caso de un investigador de AstraZeneca
Hace poco, Calvin Lopez, investigador de Inteligencia Artificial en AstraZeneca, compartió su experiencia en un workshop sobre las nuevas integraciones de Gen AI de un gran proveedor de la nube. Los expertos luchaban con tareas que herramientas como SpaCy resolvían con alta precisión y a costos muy bajos desde hace más de 10 años. ¡A veces, las soluciones más sencillas son las mejores!

Usar Gen AI es poderoso, pero no es la mejor solución para todo. Como bien señala “incluso lo quieren meter hasta en la sopa”. Las herramientas tradicionales de NLP (SpaCy, NLTK o CoreNLP) siguen siendo superiores en tareas específicas como procesamiento ligero, identificación estructurada de entidades, tokenización y eliminación de stopwords. Y no podría estár más de acuerdo con él.
La Clave: Conocer las Fortalezas y Debilidades
Los LLMs brillan en comprensión contextual y generación creativa, pero combinarlos con técnicas clásicas puede ser la clave para sistemas robustos. Es importante aprender las fortalezas y debilidades de cada herramienta para discriminar de forma apropiada el uso de cada una en los proyectos.
Si necesitas extraer todas las fechas y organizaciones de un contrato legal, SpaCy lo hará de forma rápida y precisa. Si quieres resumir el contrato o generar cláusulas, GPTo3-mini podría ser más útil. De hecho, muchas veces un buen regex puede hacer el trabajo pesado de un modelo similar a ChatGPT… y teniendo la posibilidad de generar ese regex con ChatGPT, hay gente que prefiere consumir más tokens…

Spoiler: Un regex, no necesita ser ejecutado por tu proveedor de IA, puede ser ejecutado por tu computadora o un servidor a costos mucho más pequeños, eternamente y sin fin (mientras esté encendido ese hardware). Los costos son ínfimos en comparación.
No Descuides los Fundamentos
Si estás entrando en el mundo de la IA gracias a la fácil accesibilidad de herramientas como ChatGPT, no descuides los fundamentos sobre los que se construyó ni las soluciones predecesoras. Entender cómo se resolvían problemas antes te dará ventaja para elegir la mejor herramienta en cada caso y no meter una API de un modelo costoso a la primera oportunidad, (mal)gastando el presupuesto cuando hay una solución que puede costar una fracción (o ser gratuita en ciertos casos) y ofrecer mejores resultados.

Sí aun con todo lo anterior te quedan dudas sobre qué es y que no es hacer IA generativa, te dejo el siguiente blog donde tocamos varios puntos: desde seguridad, hasta problemas causados por dueños de empresas por no entender estos puntos
Conclusión
Explorar Gen AI es genial, pero no te olvides de construir una base sólida de conocimientos en NLP y Core Linguistics. La verdadera maestría reside en saber cuándo usar cada herramienta y cómo combinarlas para obtener los mejores resultados.
Yo hablo más a detalle cómo inicié en este mundo y todo lo que tuve que aprender para poder ser considerado por empresas y profesionales al rededor del mundo para optimizar sus negocios con IA. Te lo comparto en el siguiente blog.
¿Han enfrentado situaciones similares? ¿Has usado SpaCy (o similar) combinado técnicas clásicas con GenAI? ¿Qué consejos darías a alguien que está empezando en el mundo del NLP? Comparte tus experiencias y opiniones en los comentarios.
Written by Chris Galleta
R&D | AI Consultant & Full Stack Data Scientist | You cannot compete with someone who loves what he does. It is in his instict. He does not compete. He lives.
Representante de JhedAI en México
https://www.linkedin.com/in/chrisgalleta/