Accueil » Blog » AlphaZero, les échecs, et la science

Le créatif "AlphaZero" ouvre la voie aux ordinateurs d'échecs et, peut-être, à la science


AlphaZero est une formidable opportunité pour les futurs ordinateurs d'échecs et pour les avancées de la science en général, grâce à son IA

Garry Kasparov n'est pas seulement le plus grand joueur d'échecs de tous les temps, mais aussi la victime la plus en vue de l'intelligence artificielle. Sa perte au profit du super ordinateur d'IBM Deep Blue en 1997 a fait la une des journaux du monde entier et l'a rendu amer et, en fait, bleu. Pourtant, il y a une lueur chaleureuse dans ses yeux quand il parle d'AlphaZero, le programme d'échecs qui a changé la donne et qui n'a pris que quatre heures pour s'apprendre à devenir le plus fort joueur d'échecs de l'histoire.

"Pour moi, en tant que joueur très aiguisé et attaquant, c'est un plaisir de regarder jouer AlphaZero", a-t-il dit après avoir participé à un tournoi caritatif pour Chess in Schools avant la London Chess Classic, qui se déroule jusqu'à lundi. "Nous nous attendons tous à ce que les machines jouent des parties très solides et lentes, mais AlphaZero fait exactement le contraire. C'est surprenant de voir une machine jouer aussi agressivement, et cela montre aussi beaucoup de créativité. C'est une véritable percée - et je crois qu'elle pourrait être extrêmement utile pour de nombreuses autres études dans le domaine de l'informatique."


Jouer aux échecs en ligne sur Chess.com

Agressif. Créatif. Utile. Ce sont des mots que vous n'associez pas normalement à l'intelligence artificielle. En effet, ils semblent plutôt humains. Mais pour le créateur d'AlphaZero, Demis Hassabis, le PDG de Deep Mind, ce n'est que le début de ce qu'il pourrait être capable de faire. Comme il le souligne, la prochaine étape consiste à utiliser ses capacités pour résoudre des problèmes du monde réel, comme le repliement des protéines, qui est responsable de maladies comme la maladie d'Alzheimer, la maladie de Parkinson et la mucoviscidose. Mais il s'attend aussi à ce qu'AlphaZero soit capable de développer des matériaux plus résistants et plus légers, de meilleurs médicaments et, à terme, suffisamment flexibles pour s'adapter aux nouvelles situations.

"Deep Blue pouvait bien jouer aux échecs", explique Hassabis. "Mais c'est tout ce qu'il pouvait faire. Il ne pouvait pas jouer à noughts and crosses ou à Connect 4, ni à aucun jeu aussi simple. En d'autres termes, il n'a pas pu démontrer deux éléments qui sont au cœur de ce qui définit l'intelligence humaine - notre intelligence flexible et notre capacité d'apprentissage."

AlphaZero est différent. Dans un article très attendu publié dans la revue Science la semaine dernière, les auteurs expliquent comment il a appris à conquérir les échecs, Go et Shogi en jouant des millions de parties contre lui-même via un processus d'essais et erreurs appelé apprentissage par renforcement. En plus de 1000 parties contre Stockfish, un vainqueur régulier du championnat du monde d'échecs par ordinateur, il a gagné 155 parties avec seulement six défaites, le reste se soldant par des nuls.

Hassabis était un enfant prodige des échecs, qui a appris le jeu à l'âge de quatre ans et a pu battre son père trois semaines plus tard - en effet, quand il a commencé à jouer en compétition, il était si petit qu'il devait apporter un oreiller avec lui pour atteindre le plateau - et est devenu un solide joueur. Pourtant, dans le cas d'AlphaZero, il n'y avait pas d'apport humain, si ce n'est de lui dire les règles de chaque jeu. "En quelques heures, c'était surhumain ", dit fièrement Hassabis.

La prochaine étape logique serait pour AlphaZero d'essayer de maîtriser les jeux avec des informations cachées, comme le poker ou le jeu informatique Starcraft 2. "Ce sont là de grands défis, mais nous aurons quelque chose d'intéressant à dire à ce sujet au cours des 12 prochains mois ", dit-il. "Il serait très intéressant s'il pouvait jouer au poker Texas No Limit à neuf joueurs, avec tout le bluff que cela implique. Aucun ordinateur n'est encore capable de le faire, mais nous pensons qu'AlphaZero le pourrait, si nous décidions de le faire."

Avant de créer DeepMind en 2010, Hassabis a travaillé dans le domaine des jeux vidéo, notamment en tant que programmeur principal de l'intelligence artificielle pour le jeu de dieu emblématique Black & White. A-t-il peur que les machines deviennent nos dieux ? "Les technologies puissantes, et l'IA n'est pas différente, ils sont neutres en soi", dit-il. "Cela dépend donc de la société et de l'humanité. La façon dont nous décidons de partager les gains va aussi déterminer si c'est bon ou mauvais pour le monde."

Cela ne ressemble pas tout à fait à un "non" catégorique. Mais Hassabis croit beaucoup à l'ingéniosité humaine. "Je pense que si nous disposons de suffisamment de temps et d'intelligence humaine, nous pourrons répondre à ces questions ", dit-il. "Nous n'en sommes qu'au tout début de la compréhension de la façon dont AlphaZero prend ses décisions. Nous et de nombreuses autres équipes procédons actuellement à la rétro-ingénierie de ces systèmes et construisons des outils de visualisation et d'analyse. Dans cinq ans, nous aurons des outils qui nous permettront de regarder à l'intérieur de cette boîte noire et de vraiment comprendre ce qu'elle fait."

Kasparov, qui a publié l'année dernière Deep Thinking : Where Machine Intelligence Ends and Human Creativity Begins, un livre bien accueilli sur son match contre Deep Blue et l'avenir de l'IA, nous dit que nous devrions être optimistes.

"Je crois que l'intelligence artificielle nous aidera énormément et il est beaucoup plus probable que nous et les ordinateurs collaborerons ensemble dans l'intérêt de l'humanité."

Hassabis dit qu'il s'inquiéterait davantage de l'état du monde sans la perspective d'une meilleure IA à l'avenir. "Regardez les problèmes auxquels le monde est confronté. Nous avons besoin de remèdes pour des maladies tragiques, comme le cancer et la maladie d'Alzheimer, qui sont également coûteuses à traiter. Je pense que l'IA pourrait aider à ce genre de choses, ainsi qu'à trouver de nouveaux médicaments, de nouveaux matériaux et à mieux analyser les changements climatiques."

Alors comment apaiserait-il les peurs des sceptiques ? "Demandez-vous, si nous n'avions pas quelque chose comme l'IA à l'avenir, comment réglerions-nous ces problèmes, dit-il." Soit nous aurons besoin d'une amélioration exponentielle du comportement humain, de sorte que nous deviendrons plus collaboratifs et moins égoïstes et à court terme, soit nous aurons besoin d'une amélioration exponentielle de la technologie pour résoudre les grands problèmes que nous nous créons. Je ne vois pas beaucoup de preuves pour le premier."



Vidéo : How is This Possible? | AlphaZero Shows Us the Way