OpenAI anunció el día de ayer el lanzamiento de GPT-4, su más reciente modelo de inteligencia artificial basado en lenguaje multimodal que entrará a potenciar las aplicaciones de la compañía y que seguro dará mucho de qué hablar por la precisión de sus respuestas, la complejidad de las tareas que puede atender y la manera en como opera para atender las solicitudes de los usuarios.
Announcing GPT-4, a large multimodal model, with our best-ever results on capabilities and alignment: https://t.co/TwLFssyALF pic.twitter.com/lYWwPjZbSg
— OpenAI (@OpenAI) March 14, 2023
Ahora bien, de todo lo nuevo estas 4 cosas son las más impresionantes:
1. La Cantidad de Parámetros
GPT-3 fue construido con 175,000,000,000 parámetros.
GPT-4 tiene 100,000,000,000,000.
Si usted no es muy letrado en temas relacionados con Inteligencia Artificial pueda que no le diga mucho. Pero quienes sí lo son saben que la cantidad de parámetros, que la cantidad de data utilizada para el entrenamiento de los modelos es clave. Y en este caso el cambio de magnitud es inmenso.
2. Los Tipos de Input que Puede Recibir
A diferencia de su antecesor, GPT-4 no sólo puede recibir input vía texto. También puede hacerlo vía imágenes. Es decir, usted le puede mostrar una foto y hacerle una pregunta acerca de la misma, pedirle que haga inferencia de su contenido, que la describa o, como en este caso, que le explique qué tiene de extraña una imagen:
3. Sus Resultados
Con GPT-3 la compañía realizó pruebas de cuál sería su puntaje en algunos de los exámenes de aptitud más reconocidos a nivel mundial, como el SAT que utilizan muchas universidades para evaluar candidatos, o exámenes estandarizados como los Advanced Placement (AP) utilizados por colegios y universidades para acreditar conocimiento de sus estudiantes.
Qué tan “mejor” es GPT-4? Mire los resultados. En todos los casos la mejoría es notoria.
Simulated exams | GPT-4 | GPT-4 (no vision) | GPT-3.5 |
Uniform Bar Exam (MBE+MEE+MPT)1 | 298 / 400 | 298 / 400 | 213 / 400 |
LSAT | 163 | 161 | 149 |
SAT Evidence-Based Reading & Writing | 710 / 800 | 710 / 800 | 670 / 800 |
SAT Math | 700 / 800 | 690 / 800 | 590 / 800 |
Graduate Record Examination (GRE) Quantitative | 163 / 170 | 157 / 170 | 147 / 170 |
Graduate Record Examination (GRE) Verbal | 169 / 170 | 165 / 170 | 154 / 170 |
Graduate Record Examination (GRE) Writing | 4 / 6 | 4 / 6 | 4 / 6 |
USABO Semifinal Exam 2020 | 87 / 150 | 87 / 150 | 43 / 150 |
USNCO Local Section Exam 2022 | 36 / 60 | 38 / 60 | 24 / 60 |
Medical Knowledge Self-Assessment Program | 75 % | 75 % | 53 % |
Codeforces Rating | 392 | 392 | 260 |
AP Art History | 5 | 5 | 5 |
AP Biology | 5 | 5 | 4 |
AP Calculus BC | 4 | 4 | 1 |
AP Chemistry | 4 | 4 | 2 |
AP English Language and Composition | 2 | 2 | 2 |
AP English Literature and Composition | 2 | 2 | 2 |
AP Environmental Science | 5 | 5 | 5 |
AP Macroeconomics | 5 | 5 | 2 |
AP Microeconomics | 5 | 4 | 4 |
AP Physics 2 | 4 | 4 | 3 |
AP Psychology | 5 | 5 | 5 |
AP Statistics | 5 | 5 | 3 |
AP US Government | 5 | 5 | 4 |
AP US History | 5 | 4 | 4 |
AP World History | 4 | 4 | 4 |
AMC 10 | 30 / 150 | 36 / 150 | 36 / 150 |
AMC 12 | 60 / 150 | 48 / 150 | 30 / 150 |
Intro Sommelier (theory knowledge) | 92 % | 92 % | 80 % |
Certified Sommelier (theory knowledge) | 86 % | 86 % | 58 % |
Advanced Sommelier (theory knowledge) | 77 % | 77 % | 46 % |
Leetcode (easy) | 31 / 41 | 31 / 41 | 12 / 41 |
Leetcode (medium) | 21 / 80 | 21 / 80 | 8 / 80 |
Leetcode (hard) | 3 / 45 | 3 / 45 | 0 / 45 |
GPT-4 será el motor de varias aplicaciones, incluyendo ChatGPT y el nuevo Bing, al igual que de aplicaciones de terceros que incorporarán sus funcionalidades avanzadas.