El nuevo traje del emperador
por David Quintero

Hace cosa de dos años una inteligencia artificial consiguió derrotar al campeón mundial de Go, un juego de estrategia del lejano oriente, en la línea del ajedrez, aunque con muchísimas más variantes. Es un problema matemático muy interesante el de estimar el número de posibles partidas diferentes de Go. El número que se suele dar es el de 10700, cifra literalmente inconcebible, alejadísima de cualquier cantidad con la que los humanos estamos acostumbrados a tratar. Incluso las cifras de deuda, presupuestos o de grandes fortunas es raro que lleguen al trillón (1018). Un ejemplo: el número de átomos en el universo observable se estima en 1080.

Aunque las computadoras habían obtenido buenos resultados en el ajedrez (recordemos la victoria de Deep Blue sobre Garry Kasparov), el Go se resistía: abordarlo por fuerza bruta era imposible. Incluso con la mejor tecnología, el mejor hardware, un número como 10700 hace inútil todo intento de asalto basado en el puro cálculo. Había que enseñarle a la máquina a razonar, a pensar de forma estratégica, seleccionando solo los movimientos más interesantes para analizar, descartando los demás, que de hecho es como juegan los grandes maestros de Go y ajedrez. Esto era especialmente difícil en el caso del Go, así que la comunidad de la inteligencia artificial mostró su asombro y admiración cuando una IA diseñada por una empresa filial de Google, DeepMind, derrotó a un jugador humano profesional del máximo nivel, Lee Sedol. El programa, llamado AlphaGo, continuó refinándose y derrotando a humanos por todo el mundo.

Recientemente, la última versión de AlphaGo, AlphaZero, ha conseguido en 24 horas adquirir fuerza de juego sobrehumana en el Go, el ajedrez y el shogi (el ajedrez chino). No solo se ha erigido en mejor que cualquier humano, es que también es mejor que cualquier otro programa específico para estos juegos. A AlphaZero le bastaron 4 horas (¡¡cuatro horas!!) para convertirse en el mejor jugador de ajedrez sobre la Tierra. Vapuleó a Stockfish, considerado el mejor programa de ajedrez hasta entonces, sin perder ni una sola vez. En el shogi y en el Go obtuvo rendimientos no tan espectaculares, pero parecidos, y se coronó también en estas disciplinas.

¿Y cómo consigue todo esto AlphaZero? La clave está en el uso de redes neuronales profundas, un sistema inspirado realmente en el cerebro humano, de ahí el nombre, que le permite aprender a una velocidad asombrosa, captando multitud de detalles y siendo capaz de extraer generalizaciones para casos futuros. Este aprendizaje lo hizo como lo que en el campo de la inteligencia artificial se llama reinforcement learning, aprendizaje con refuerzo. A diferencia de los antiguos programas de ajedrez, en los que se programaba a la máquina con multitud de técnicas de búsqueda, de funciones de evaluación y de optimización para encontrar el mejor movimiento, a AlphaZero simplemente se le han enseñado las reglas del juego, nada más. A partir de ahí, la IA empieza a jugar contra sí misma y va aprendiendo de sus fallos, de sus errores, a una velocidad asombrosa. Espectacular.

En mi trabajo uso de vez en cuando redes neuronales y técnicas procedentes de la inteligencia artificial. Lo curioso es que, a pesar de lo que mucha gente pueda creer, no son algo del otro mundo. Desde el punto de vista matemático, es probabilidad y estadística más álgebra lineal, con algo de cálculo diferencial. Materias de los primeros cursos de las carreras técnicas. Para implementar estas técnicas hace falta saber programación, pero tampoco nada especialmente avanzado. Todo esto hace que me pregunte: ¿en el fondo la inteligencia, incluso la muy sofisticada, es algo sencillo en comparación con los otros conceptos e ideas que hay ahí afuera? ¿O quizá en el futuro se desarrollen técnicas de inteligencia artificial basadas en las más avanzadas ideas físicas y matemáticas de tal modo que cualquier parecido de estas entidades con nosotros sea algo remoto? Recomiendo ver la película Her, que toca estos temas.

Por supuesto, esto no significa que desaparezca el ajedrez, el Go o el shogi, de la misma manera que no han desparecido la hípica o el atletismo porque existan coches, ni las escaleras porque existen ascensores. Sí que sucederá que ya no tendrá sentido enfrentar a un humano contra una máquina, al estilo del duelo Deep Blue vs Kasparov, pero en cambio tendremos un montón de conocimientos nuevos procedentes de las máquinas. Cuando AlphaGo Zero, una versión anterior dedicada solo a Go, empezó a despuntar, jugadores profesionales de Go se dieron cuenta de que estaba haciendo movimientos que los humanos jamás se plantearían, movimientos considerados malos o inexactos en su momento que quizá ahora se vean con otra luz. Sospecho que algo similar puede pasar en el caso del ajedrez.

Y por supuesto, no olvidemos que por mucho que avance la máquina, fue creada por humanos, y la herramienta estrella, las redes neuronales, se basan en una imitación del cerebro humano.

Google y DeepMind querrán seguir avanzando, y ardo en deseos de ver lo que la inteligencia artificial puede crear y resolver en problemas como el plegado de proteínas, el diseño de nuevos fármacos, la gestión de las redes energéticas, los modelos climáticos y meteorológicos, la economía y un largo etcétera.

El artículo de AlphaZero: https://arxiv.org/abs/1712.01815.

© David Quintero
(1.034 palabras) Créditos
Publicado originalmente en Mundos múltiples el 7 de diciembre de 2017