Archivo del sitio

IA de AlphaZero vence al programa campeón de ajedrez después de aprender por su cuenta en solo cuatro horas

787-chess-google-ai-alphazero_1024

La compañía de inteligencia artificial hermana de Google, DeepMind, reutiliza la inteligencia artificial para conquistar el ajedrez y el shogi sin la ayuda del conocimiento humano.

AlphaZero, la IA de juego creada por DeepMind, hermano de Google, ha derrotado al mejor programa informático de ajedrez del mundo y ha aprendido por su cuenta cómo jugar en menos de cuatro horas.

La IA reutilizada, que ha derrotado repetidamente a los mejores jugadores de Go del mundo como AlphaGo, se ha generalizado para que ahora pueda aprender otros juegos. Le tomó solo cuatro horas aprender las reglas del ajedrez antes de vencer al programa de ajedrez campeón del mundo, Stockfish 8, en un combate de 100 juegos.

AlphaZero ganó o empató los 100 juegos, de acuerdo con un artículo de investigación no revisado por pares publicado con Cornell University Library’s arXiv.

«Partiendo del juego aleatorio, y sin conocimientos de dominio, excepto las reglas del juego, AlphaZero logró en 24 horas un nivel de juego sobrehumano en los juegos de ajedrez y shogi [un juego de mesa japonés similar], así como en el Go, y derrotó convincentemente al «programa campeon del mundo en cada caso», dijeron los autores del artículo que incluyen al fundador de DeepMind, Demis Hassabis, quien era un niño prodigio del ajedrez que alcanzó el estándar maestro a la edad de 13 años.

«Es un logro notable, incluso si hubiéramos esperado después de AlphaGo», dijo el ex campeón mundial de ajedrez Garry Kasparov a Chess.com. «Siempre hemos supuesto que el ajedrez requería demasiado conocimiento empírico para que una máquina jugara tan bien desde cero, sin ningún conocimiento humano agregado».

Los programas de computadora han podido vencer a los mejores jugadores de ajedrez humanos desde que la supercomputadora Deep Blue de IBM derrotó a Kasparov el 12 de mayo de 1997.

3006

DeepMind dijo que la diferencia entre AlphaZero y sus competidores es que su enfoque de aprendizaje automático no recibe ningún aporte humano además de las reglas básicas del ajedrez. El resto funciona jugando a sí mismo una y otra vez con conocimiento auto-reforzado. El resultado, de acuerdo con DeepMind, es que AlphaZero adoptó un «enfoque más humanamente parecido» a la búsqueda de movimientos, procesando alrededor de 80,000 posiciones por segundo en ajedrez en comparación con los 70m de Stockfish 8.

Después de ganar 25 juegos de ajedrez frente a Stockfish 8 comenzando como blanco, con la ventaja del primer jugador, otros tres comenzando con negro y empatando otros 72 juegos, AlphaZero también aprendió shogi en dos horas antes de vencer al programa principal Elmo en una partida a 100 juegos. AlphaZero ganó 90 juegos, perdió ocho y empató 2.

El nuevo AlphaZero generalizado también fue capaz de vencer a la anterior versión «superhumana» de AlphaGo en el juego chino de Go después de solo ocho horas de auto entrenamiento, ganando 60 juegos y perdiendo 40 juegos.

Aunque los expertos dijeron que los resultados son impresionantes y tienen potencial en una amplia gama de aplicaciones para complementar el conocimiento humano, la profesora Joanna Bryson, investigadora de informática e IA de la Universidad de Bath, advirtió que era «una tarea todavía discreta».