El MIT investiga la teoría de juegos para mejorar la IA

El MIT investiga la teoría de juegos para mejorar la IA | Tecnología | Emeritus

La teoría de juegos es una rama de las matemáticas que se utiliza en muchas áreas de la vida. Pero, en este caso, nos interesa destacar su utilidad sobre cómo participar en un juego de estrategia. Es decir, vayamos desde el principio, la teoría de juegos indica a los participantes cómo moverse y qué orden deben seguir. En cada punto de decisión, analiza el conocimiento de los jugadores y propone el siguiente movimiento. Investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT aprovecharon los principios de esta teoría para desarrollar el Juego del Consenso. Con ello, proponen un giro para mejorar las capacidades de comprensión y generación de textos de la IA.

 

¿Qué es la teoría de juegos?

Antes de profundizar en el enfoque del Juego de Consenso y lo que significa, primero entendamos la teoría de juegos con un ejemplo. Supongamos que inventas un juego con un amigo, el objetivo es usar un lenguaje críptico para enviarse mensajes ocultos. Es decir, adivinar el significado encubierto de tus oraciones es la tarea de tu amigo. A veces, proporcionas pistas directas, en otras ocasiones, él debe usar preguntas de sí o no para deducir el significado. Ustedes dos tienen la necesidad mutua de confirmar que ambos se entienden y están de acuerdo en el mensaje oculto.

 

Los investigadores del MIT

Basados en las teorías mencionadas, los investigadores del MIT descubrieron que podrían aumentar significativamente la capacidad de la IA. Esto, con el fin de proporcionar respuestas precisas y lógicas a las consultas. Al ver esta interacción como un juego en el que ambos componentes de la IA cooperan bajo pautas predeterminadas para acordar el mensaje adecuado. Es revelador que este novedoso método similar a un juego mejorara el rendimiento general de la IA en una serie de actividades. Esto incluye la comprensión de lectura, la resolución de problemas matemáticos y la conversación.

Los grandes modelos de lenguaje, o LLM, pueden actuar de forma inteligente, al igual que los humanos. Aprenden las tendencias y los vínculos entre palabras y frases mediante el análisis de grandes cantidades de datos con modelos estadísticos. Por lo general, los modelos de lenguaje grandes responden de una de dos maneras. Una de ellas es mediante consultas generativas, que generan respuestas directamente desde el modelo. La segunda forma es la consulta discriminativa, que puntúa un rango de respuestas predefinidas y puede producir resultados inconsistentes y, en ocasiones, contradictorios. Cuando se le preguntó: “¿Quién es el presidente de los Estados Unidos?” El método generativo puede hacer una respuesta simple como “Joe Biden”. A la hora de evaluar la respuesta, “Barack Obama”, una pregunta sesgada podría negar falsamente esta realidad.

Entonces ¿Cómo hacen los investigadores predicciones sensatas cuando sus métodos de puntuación no funcionan bien juntos?

 

¿Qué es importante en el enfoque del juego de consenso?

El sistema de juego de consenso encuentra el equilibrio cuando todos están de acuerdo, asegurando que la respuesta sea fiel a los principios del modelo. Es así como el método cambia la interacción de partes generativas y discriminativas hasta acordar una respuesta acorde y fiel a la realidad. Este método llena con éxito el vacío entre los dos enfoques de consulta.

El uso del método del juego de consenso para la consulta de modelos de lenguaje en la vida real requiere mucho trabajo. Sobre todo, para las tareas que implican dar respuesta a preguntas. Por ejemplo, el modelo usa el método para consultas relacionadas con un conjuntos de datos como MMLU, que tienen preguntas y respuestas de opción múltiple. Después de eso, debe ponerse de acuerdo en todas las preguntas y posibles respuestas entre las partes creativas y discriminativas. De hecho, con los problemas matemáticos ¡tener la respuesta correcta es esencial!

 

Puede interesarte leer: Diseño y Desarrollo de Productos de IA. Una estrella en ascenso

 

Evaluación

El enfoque del juego de consenso ha sido rigurosamente probado en múltiples tareas, incluyendo la comprensión lectora, resolución de problemas matemáticos y el diálogo conversacional. Las pruebas demostraron mejoras significativas en el rendimiento. En particular, cuando se combinó con el modelo LLaMA-7B, el algoritmo ER superó el rendimiento de modelos más grandes, lo que demuestra su eficacia.

La implementación del juego de consenso, particularmente para las tareas de preguntas y respuestas, presenta desafíos computacionales. El principal, radica en la necesidad de un consenso continuo entre los componentes generativos y discriminativos de cada consulta. Este requisito puede conducir a un aumento de la carga computacional y su complejidad.

 

El camino por delante

Este enfoque basado en la teoría de juegos se origina parcialmente en el agente de IA “Cicero”, desarrollado para el juego de mesa estratégico Diplomacy. Este juego tiene que ver con la negociación y la planificación estratégica utilizando el lenguaje natural. De hecho, el enfoque del juego de consenso para las interacciones de la IA refleja estos mismos elementos. De cara al futuro, los investigadores planean integrar esta metodología con modelos fundamentales de IA para lograr resultados más objetivos y coherentes. Esta integración mejora el rendimiento general de la IA, haciendo que sistemas como ChatGPT sean más fiables y precisos.

Además, el diseño del juego de consenso podría cambiar significativamente la forma en que decodificamos los modelos de lenguaje. De hecho, podría abrir nuevos usos y hacer que los sistemas de IA sean más confiables al fomentar una creación de contenidos más precisa. Este progreso hace posible que la IA se conecte con los humanos de formas complejas y confiables en muchas áreas.

 

Emeritus, en alianza con las mejores universidades del mundo entre las que se encuentra el MITxPRO, tiene una amplia gama de especialidades. Entre ellas puedes encontrar programación, ciencia de datos o inteligencia artificial, entre otras. No dudes en contactarnos, tenemos listo tu siguiente nivel profesional.

 

Acerca del Autor

Cursos en la categoría de Tecnología

US +1-606-268-4575
US +1-606-268-4575