ACTU

DeepMind 10 - Humains 1

par CBL, le 26 January 2019 email @CBL_Factor

Souvenez-vous : il y a plus de deux ans, DeepMind, une division de Google fondée par Demis Hassabis (qui a développé l'IA de Black & White), annonçait un partenariat avec Blizzard. L'idée était de créer une IA à base de réseaux de neurones capable de jouer à Starcraft 2. L'IA en question s'appelle AlphaStar et en décembre, elle a affronté deux pros de Starcraft 2, TLO et MaNa. Ils ont tous les deux pris 5-0 dans la gueule. Lors d'un match en direct cette semaine, MaNa a fini par prendre sa revanche sauvant l'honneur des joueurs avec des vrais neurones. Vous pouvez voir la même partie du point de vue d'AlphaStar.

Alors comment AlphaStar est devenu aussi bonne à Starcraft 2? AlphaStar étant un réseau de neurones, il faut lui fournir des tonnes de données pour qu'elle s'améliore. Au début, AlphaStar s'est contenté de regarder des replays de joueurs humains. Puis elle a joué contre l'IA du jeu jusqu'au point de la battre dans 95% des cas en niveau Elite. Puis DeepMind est passé à la vitesse supérieure en créant de multiples instances d'AlphaStar et en les faisant s'afronter entre elles dans une ligue, chaque instance apprenant des autres instances. Cette entrainement intensif a duré 14 jours pendant lesquels AlphaStar a accumulé l'équivalent de 200 ans d'expérience. Tout cela, DeepMind vous le raconte dans un article super intéressant bourré de graphiques. Vous pouvez même télécharger les replays des parties.

La conclusion est que AlphaStar n'a pas gagné car elle était plus rapide : les chiffres montrent que le temps de réaction de l'IA est inférieur à celui des humains et qu'elle accomplissait moins d'actions par minute que les joueurs pro. AlphaStar a gagné car elle prenait de meilleures décisions, utilisait des meilleures stratégies et était plus efficace en terme de micro-management. Dans un sens c'est logique et c'est exactement ce qu'on attend d'un réseau de neurones : une puissance de calcul délirante analysant des tonnes de données de précédentes parties pour prendre la meilleure décision.

Commentaires