Pathways es una nueva forma de pensar sobre la IA que aborda muchas de las debilidades de los sistemas existentes y sintetiza sus fortalezas. Para mostrarte lo que quiero decir, veamos algunas de las deficiencias actuales de la IA y cómo Pathways puede mejorarlas.
Los modelos de IA actuales suelen estar entrenados para hacer sólo una cosa. Pathways nos permitirá entrenar un solo modelo para hacer miles o millones de cosas.
Los sistemas de IA actuales a menudo se entrenan desde cero para cada nuevo problema: los parámetros del modelo matemático se inician literalmente con números aleatorios. Imagínate que, cada vez que aprendieras una nueva habilidad (saltar la cuerda, por ejemplo), olvidaras todo lo que habías aprendido (cómo mantener el equilibrio, cómo saltar, cómo coordinar el movimiento de tus manos) y comenzaras a aprender cada nueva habilidad desde cero.
Así es más o menos cómo entrenamos la mayoría de los modelos de aprendizaje automático en la actualidad. En lugar de extender los modelos existentes para aprender nuevas tareas, entrenamos cada nuevo modelo desde cero para hacer una cosa y sólo una cosa (o, a veces, especializamos un modelo general para una tarea específica). El resultado es que terminamos desarrollando miles de modelos para miles de tareas individuales. No sólo el aprendizaje de cada nueva tarea toma más tiempo de esta manera, sino que también requiere de muchos más datos para aprender cada nueva tarea, ya que estamos tratando de aprender todo sobre el mundo y los detalles de esa tarea desde cero (completamente diferente a cómo las personas abordan nuevas tareas).
Los modelos actuales se centran principalmente en un sentido. Pathways permitirá múltiples sentidos.
Las personas dependen de múltiples sentidos para percibir el mundo. Eso es muy diferente de cómo los sistemas de IA actuales digieren la información. La mayoría de los modelos actuales procesan sólo una modalidad de información a la vez. Pueden captar texto, imágenes o voz, pero normalmente no los tres a la vez.
Pathways podría permitir modelos multimodales que abarquen la vista, el oído y la comprensión del lenguaje simultáneamente. Entonces, ya sea que el modelo esté procesando la palabra “leopardo”, el sonido de alguien que dice “leopardo” o un video de un leopardo corriendo, la misma respuesta se activa internamente: el concepto de leopardo. El resultado es un modelo más perspicaz y menos propenso a errores y sesgos.
Y, por supuesto, un modelo de IA no tiene por qué limitarse a estos sentidos tan familiares; Pathways podría manejar formas de datos más abstractas, ayudando a encontrar patrones útiles que han eludido a los científicos humanos en sistemas complejos como la dinámica climática.
Los modelos actuales son densos e ineficientes. Pathways los hará mínimos y eficientes.
Un tercer problema es que la mayoría de los modelos actuales son “densos”, lo que significa que toda la red neuronal se activa para realizar una tarea, sin importar si es muy simple o realmente complicada.
La IA puede funcionar de la misma manera. Lo que significa que sólo se activan pequeñas rutas a través de la red según sea necesario. De hecho, el modelo aprende dinámicamente qué partes de la red son buenas en qué tareas; aprende cómo enrutar las tareas a través de las partes más relevantes del modelo. Un gran beneficio de este tipo de arquitectura es que no sólo tiene una mayor capacidad para aprender una variedad de tareas, también es más rápido y mucho más eficiente energéticamente, porque no activamos toda la red para cada tarea.
Para recapitular: los modelos de aprendizaje automático de hoy tienden a especializarse demasiado en tareas individuales cuando podrían sobresalir en muchas. Dependen de una forma de entrada cuando pueden sintetizar varias. Y con demasiada frecuencia recurren a la fuerza bruta cuando bastan la destreza y la especialización de conocimientos.
Pathways, que permitirá que un único sistema de IA se generalice en miles o millones de tareas, comprenda diferentes tipos de datos y lo haga con una eficiencia notable; esto nos permitirá pasar de la era de los modelos de propósito único que simplemente reconocen patrones, a una en la que más sistemas inteligentes reflejan una comprensión más profunda de nuestro mundo y pueden adaptarse a nuevas necesidades.