Un système autodidacte bat l’Homme à Space Invaders

Autres articles

Un système informatique capable d’apprendre tout seul est parvenu à battre l’Homme à plates coutures à certains jeux vidéos, comme l’iconique Space Invaders, une étape importante dans le développement rapide de l’intelligence artificielle (IA).
Cette performance, réalisée par DeepMind (Google), ouvre la voie à des développements futurs dans la vie courante mais aussi dans des secteurs (climat, santé) impliquant la gestion de masses de données, assure la société qui a publié ses travaux mercredi dans la revue Nature.
“C’est la première fois que l’on conçoit un système d’apprentissage général unique qui soit capable d’apprendre directement à partir de l’expérience pour maîtriser ensuite une vaste gamme de tâches difficiles”, a déclaré Demis Hassabis, co-fondateur de DeepMind, lors d’une conférence de presse à Londres, retransmise sur le site de Nature.
Le nouveau système de la société britannique, rachetée en 2014 par le géant américain de l’Internet, est basé sur un algorithme et conjugue plusieurs techniques d’apprentissage informatique avec des mécanismes inspirés du fonctionnement des réseaux neuronaux.
A partir d’informations minimales, cet “agent d’intelligence artificielle”, baptisé DQN (deep-Q-network), est parvenu à apprendre tout seul plusieurs jeux vidéo, à travers l’expérience et la mémorisation, au point d’égaler voire de surpasser les hommes dans une bonne partie des cas.
Il se révèle meilleur qu’un joueur expérimenté à 29 jeux classiques développés par le Japonais Atari, notamment Space Invaders et Breakout. Mais il fait moins bien pour le moment pour les 20 autres. Le jeu Asterix lui résiste encore mais pour combien de temps?
En 1997, le supercalculateur Deep Blue avait déjà vaincu aux échecs le Russe Garry Kasparov, alors champion du monde. En 2011, le programme informatique Watson avait gagné un jeu télévisé américain.
“La différence avec Deep Blue et Watson, c’est qu’ils sont en partie préprogrammés”, a relevé Demis Hassabis. “Pour Deep Blue, ce sont des informaticiens et des joueurs d’échecs qui ont instillé la connaissance de ce jeu au programme”, a expliqué ce neuroscientifique britannique de 38 ans, concepteur de jeux vidéos.
“Nous, nous avons construit des algorithmes qui apprennent à partir du terrain”. “Les concepteurs et les programmateurs n’ont pas besoin de connaître eux-mêmes la solution”.
DQN a reçu uniquement des informations sur les pixels (image) et sur les scores. “Au départ, il était un peu comme un bébé, ouvrant les yeux et découvrant le monde pour la première fois”, explique Demis Hassabis. “Il a appris en pressant des touches au hasard et en repérant quand cela lui permettait d’avoir de bons scores”, ajoute Vlad Mnih de DeepMind.
A Breakout, jeu de casse-briques de 1976, DQN a même fini par imaginer une technique très efficace (en creusant un tunnel), une stratégie qui a épaté les informaticiens.
DeepMind, fondée en 2011, avait présenté une première ébauche de résultats sur DQN peu avant son rachat par Google pour une somme évaluée à 400 millions de Livres (546 millions d’euros d’aujourd’hui).
Cette fois-ci la gamme de jeux est beaucoup plus étoffée.
DQN a expérimenté des jeux de la fin des années 1970 et des années 1980. Elle va s’attaquer à présent à des jeux des années 1990 en 3D, “nettement plus compliqués”, reconnaît Demis Hassabis. “On y arrivera dans les cinq ans”.
“L’idée, c’est que si l’algorithme permet de simuler la conduite dans un jeu de course automobile, potentiellement avec quelques améliorations, il devrait être capable de conduire une vraie voiture”.
Mais cela va “plus loin que ça”. Cela pourrait permettre de prendre des décisions rapides dans des situations impliquant de nombreuses données, dit-il.
“Cela peut consister à demander à votre téléphone d’organiser un voyage en Europe. Il se chargera de réserver les vols et les hôtels pour vous”.
“Dans le futur, utiliser ce type d’intelligence artificielle devrait nous aider dans des domaines comme l’étude des maladies et les questions climatiques, qui impliquent des données nombreuses et très complexes”, estime-t-il.

Télécharger ici votre Journal Libération en PDF (780)

Régions - 23/04/2024

Guercif: 1.800 élèves bénéficient d'informations et d'orientations post-baccalauréat

Ifrane : Rencontre sur les dernières avancées dans le domaine de l'oncologie gynéco-mammaire

Un système autodidacte bat l’Homme à Space Invaders

Dépression post-partum. Des résultats intéressants pour un dérivé de la kétamine

En Australie, la Grande barrière de corail plus menacée que jamais

A Paris, le vélo a dépassé la voiture comme moyen de transport

Pour faire face au cyberharcèlement, des outils pour les femmes journalistes

Les horlogers suisses se lancent à l'assaut de l'Inde en ordre dispersé

Mardi 23 Avril 2024 - 15:48 Dépression post-partum. Des résultats intéressants pour un dérivé de la kétamine

Mardi 23 Avril 2024 - 15:46 En Australie, la Grande barrière de corail plus menacée que jamais

Economie - 23/04/2024

Maroc-France : Signature d'une feuille de route de partenariat dans les domaines agricole et forestier

Culture - 23/04/2024

Les participants du programme "Ektashif" bientôt au Maroc pour un voyage découverte

Télécharger ici votre Journal Libération en PDF (780)

Régions - 23/04/2024

​Un système autodidacte bat l’Homme à Space Invaders

Mardi 23 Avril 2024 - 15:48 Dépression post-partum. Des résultats intéressants pour un dérivé de la kétamine

Mardi 23 Avril 2024 - 15:46 En Australie, la Grande barrière de corail plus menacée que jamais

Economie - 23/04/2024

Culture - 23/04/2024

Un système autodidacte bat l’Homme à Space Invaders