Con el reciente despido y la rápida recontratación de Sam Altman por parte de OpenAI, los debates sobre el desarrollo y uso de la Inteligencia Artificial vuelven a estar en el centro de atención. Lo que es más inusual es que un tema destacado en los informes de los medios ha sido la capacidad de tener una IA buena en matemáticas.
Aparentemente, parte del drama en OpenAI estuvo relacionado con el desarrollo por parte de la compañía de un nuevo algoritmo de IA denominado Q*. Se ha hablado del sistema como un avance significativo y una de sus características más destacadas era la capacidad de razonar matemáticamente. ¡Más detalles a continuación!
¿Una IA buena en matemáticas?
Ante todo esto, cabe hacerse la pregunta; ¿Pero no son las matemáticas la base de la IA? e incluso, otra como ¿Cómo podría un sistema de IA tener problemas con el razonamiento matemático, dado que las computadoras y calculadoras pueden realizar tareas matemáticas?
Si hay algo muy importante que tener presente es que la IA no es una entidad única. Se trata de un mosaico de estrategias para efectuar cálculos sin instrucción directa de humanos. Como veremos, algunos sistemas de Inteligencia Artificial (IA) son competentes en matemáticas.
Sin embargo, vale la pena señalar que una de las tecnologías actuales más importantes, los grandes modelos de lenguaje (LLM) detrás de los chatbots de IA como ChatGPT, ha tenido dificultades hasta el momento para emular el razonamiento matemático. Esto se debe a que han sido diseñados para concentrarse en el lenguaje.
Si el nuevo algoritmo denominado “Q*” de la empresa tiene la capacidad de poder resolver problemas matemáticos invisibles, entonces podría ser un avance significativo. Cabe acotar que las matemáticas son una forma antigua de razonamiento humano que, hasta ahora, los grandes modelos de lenguaje han luchado por emular. Los LLM son la tecnología que subyace a sistemas como ChatGPT de OpenAI.
Por el momento, los detalles del algoritmo Q* y sus capacidades son limitados pero, sin duda, muy intrigantes. Por lo tanto, hay varias sutilezas a considerar antes de considerar que Q* es un éxito.
Un claro ejemplo es que las matemáticas son una materia con la que todos se involucran en distintos grados, y el nivel de matemáticas en el que “Q*” es competente continúa sin estar claro. Sin embargo, se han publicado trabajos académicos que usan formas alternativas de IA para avanzar en las matemáticas a nivel de investigación.
Estos sistemas de Inteligencia Artificial podrían describirse como competentes en matemáticas. Sin embargo, es probable que Q* no se utilice para ayudar a los académicos en su trabajo, sino que posea otro propósito.
Sin embargo, incluso si el algoritmo de IA (Q*) es incapaz de traspasar los límites de la investigación de vanguardia, es muy probable que se encuentre cierta importancia en la forma en que se ha construido que podría generar tentadoras oportunidades para el desarrollo futuro.
Cada día más cómodos con el uso de IA
Como sociedad, nos sentimos cada día más cómodos con el uso de Inteligencia Artificial especializada para resolver tipos predeterminados de problemas. Por ejemplo, asistentes digitales, así como también reconocimiento facial, entre otros. Lo que continúa siendo difícil de alcanzar es el llamado “Inteligencia General Artificial” (AGI) que posee amplias capacidades de razonamiento comparables a las de un ser humano.
Las matemáticas son una habilidad básica que se aspira enseñar a todos los escolares y seguramente calificarían como un hito fundamental en la búsqueda de AGI. Entonces, ¿de qué otra manera podrían ayudar a la sociedad los sistemas de IA matemáticamente competentes?
No hay que pasar por alto que la mentalidad matemática es relevante para una multitud de aplicaciones, por ejemplo, codificación e ingeniería, por lo que el razonamiento matemático es una habilidad transferible vital tanto para la inteligencia humana como también para la artificial. Una ironía es que la Inteligencia Artificial (IA) se basa, en un nivel fundamental, en las matemáticas.
Por ejemplo, muchas de las técnicas implementadas por los algoritmos de IA se reducen en última instancia a un área matemática conocida como “álgebra matricial”. Una matriz es sencillamente una cuadrícula de números, de la cual una imagen digital es un ejemplo familiar. Cada píxel viene siendo nada más que datos numéricos.
Ahora bien, los modelos de lenguajes grandes también son inherentemente matemáticos. A partir de una enorme muestra de texto, una máquina tiene la posibilidad de aprender las probabilidades de las palabras que son más probables que siga un mensaje (o pregunta) del usuario al chatbot. Si el caso es que quiere que un LLM previamente capacitado se especialice en un tema en particular, entonces tiene la capacidad de poder perfeccionarlo en literatura, matemática o en cualquier otro dominio de aprendizaje. Los grandes modelos de lenguaje (LLM) pueden generar texto que se lea como si entendiera matemáticas.
Desgraciadamente, hacerlo produce un LLM que es bueno para fanfarronear pero, malo para los detalles. La cuestión es que un enunciado matemático es, por definición, aquel al que se le puede asignar un “valor booleano inequívoco” (es decir, verdadero o falso). Por su parte, el razonamiento matemático equivale a la deducción lógica de nuevos enunciados matemáticos a partir de los previamente establecidos.
Es de resaltar que naturalmente, cualquier enfoque del razonamiento matemático que se base en probabilidades lingüísticas se saldrá de su carril. Por tanto, una manera de evitar esto podría ser incorporar algún sistema de verificación formal en la arquitectura (exactamente cómo se construye el LLM) que, verifique continuamente la lógica detrás de los saltos ejecutados por el modelo de lenguaje grande.
Una pista de que esto se ha llevado a cabo podría estar en el nombre “Q”, que podría referirse plausiblemente a un algoritmo desarrollado allá por la década de 1970 para ayudar con el razonamiento deductivo. Alternativamente, Q podría referirse a Q-learning, en el que un modelo tiene la posibilidad de mejorar con el tiempo probando y recompensando las conclusiones que sean correctas.
Desafíos para construir IA matemáticamente capaces
Sin embargo, vale la pena acotar que existen varios desafíos para construir IA matemáticamente capaces. Por ejemplo, algunas de las matemáticas más interesantes consisten en acontecimientos muy improbables. Existen muchas situaciones en las que uno puede pensar que existe un patrón basado en números pequeños pero, repentinamente se rompe cuando se verifican suficientes casos. Esta capacidad es bastante difícil de incorporar a una máquina.
Así mismo, otro desafío puede resultar sorprendente: la investigación matemática puede ser muy creativa. Tiene que serlo, porque los profesionales requieren inventar nuevos conceptos y aun así mantenerse dentro de los límites establecidos. reglas formales de un tema antiguo.
Cualquier metodología de Inteligencia Artificial entrenada exclusivamente para encontrar patrones en matemáticas preexistentes posiblemente nunca podría crear matemáticas genuinamente nuevas. Dada la relación entre matemáticas y tecnología, esto parece impedir la concepción de nuevas revoluciones tecnológicas.
Lo que si es cierto es que los grandes modelos lingüísticos nos han sorprendido antes y, muy seguramente, lo volverán a hacer otra vez.