1 marzo, 2024

El ser humano vence a la IA en 14 de los 15 juegos de Go engañándola y cometiéndola en un grave error

El mejor jugador del mundo en el juego de mesa Go es un algoritmo de aprendizaje automático que aprendió a jugar por sí solo. De hecho, AlphaGo Zero de Google aprendió por sí solo cómo convertirse en campeón mundial del juego en solo tres días, solo para contagiar a sus competidores humanos profesionales, quienes pasaron años perfeccionando su juego solo para ser derrotados por el robot.

El bot puede incluso vencer a la versión anterior de sí mismo, que podría vencer a los campeones del mundo.

«Derrotó a la versión de AlphaGo que ganó contra el campeón mundial Lee Sedol, y venció a esa versión de AlphaGo por cien juegos a cero», explicó el investigador principal de AlphaGo en un video de 2017.

Bueno, ahora los humanos se han enfrentado a las máquinas. El jugador de One Go, que según el Financial Times se sitúa un nivel por debajo del ranking amateur superior, pudo vencer al jugador de IA KataGo en 14 de 15 juegos.

¿Cómo lograron los humanos este regreso? Bueno, con un poco de ayuda del aprendizaje automático. Un grupo de investigadores, que publicó una preimpresión de su investigación, entrenó a sus propios «adversarios» de IA para buscar debilidades en KataGo.

«En particular, nuestros adversarios no ganan aprendiendo a jugar Go mejor que KataGo; de hecho, nuestros adversarios son derrotados fácilmente por aficionados humanos», escribió el equipo en su artículo. «En cambio, nuestros adversarios ganan engañando a KataGo para que cometa graves errores».

«Este resultado sugiere que incluso agentes muy capaces pueden albergar vulnerabilidades graves», añadieron.

El exploit que encontró el algoritmo fue intentar crear un gran bucle de piedras alrededor de las piedras de la víctima de la IA, pero luego «distraer» a la IA colocando piezas en otras áreas del tablero. La computadora no logra captar la estrategia y pierde entre el 97 y el 99 por ciento de las veces, dependiendo de la versión de KataGo que se utilice.

La estrategia que desarrolló fue utilizada luego por Kellin Pelrine, autor del artículo, para vencer a la computadora de manera consistente. No fue necesaria más ayuda de la IA una vez que Pelrine aprendió la estrategia.

Si bien es fantástico haberle mostrado SkyNet, todavía lo tenemos (incluso si recibimos un poco de ayuda de un terminador) el equipo dice que la investigación tiene implicaciones mayores.

«Nuestros resultados subrayan que las mejoras en las capacidades no siempre se traducen en una solidez adecuada», concluyó el equipo. «Los fallos en los sistemas Go AI son entretenidos, pero fallos similares en sistemas críticos para la seguridad, como el comercio financiero automatizado o los vehículos autónomos, podrían tener consecuencias nefastas».

Se ha publicado una preimpresión del estudio en el sitio web de los investigadores.

[H/T: Financial Times]

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *