Augmenter la taille du texte
Diminuer la taille du texte
Partager

​Un système autodidacte bat l’Homme à Space Invaders


Vendredi 6 Mars 2015

​Un système autodidacte bat l’Homme à Space Invaders
Un système informatique capable d’apprendre tout seul est parvenu à battre l’Homme à plates coutures à certains jeux vidéos, comme l’iconique Space Invaders, une étape importante dans le développement rapide de l’intelligence artificielle (IA).
Cette performance, réalisée par DeepMind (Google), ouvre la voie à des développements futurs dans la vie courante mais aussi dans des secteurs (climat, santé) impliquant la gestion de masses de données, assure la société qui a publié ses travaux mercredi dans la revue Nature.
“C’est la première fois que l’on conçoit un système d’apprentissage général unique qui soit capable d’apprendre directement à partir de l’expérience pour maîtriser ensuite une vaste gamme de tâches difficiles”, a déclaré Demis Hassabis, co-fondateur de DeepMind, lors d’une conférence de presse à Londres, retransmise sur le site de Nature.
Le nouveau système de la société britannique, rachetée en 2014 par le géant américain de l’Internet, est basé sur un algorithme et conjugue plusieurs techniques d’apprentissage informatique avec des mécanismes inspirés du fonctionnement des réseaux neuronaux.
A partir d’informations minimales, cet “agent d’intelligence artificielle”, baptisé DQN (deep-Q-network), est parvenu à apprendre tout seul plusieurs jeux vidéo, à travers l’expérience et la mémorisation, au point d’égaler voire de surpasser les hommes dans une bonne partie des cas.
Il se révèle meilleur qu’un joueur expérimenté à 29 jeux classiques développés par le Japonais Atari, notamment Space Invaders et Breakout. Mais il fait moins bien pour le moment pour les 20 autres. Le jeu Asterix lui résiste encore mais pour combien de temps?
En 1997, le supercalculateur Deep Blue avait déjà vaincu aux échecs le Russe Garry Kasparov, alors champion du monde. En 2011, le programme informatique Watson avait gagné un jeu télévisé américain.
“La différence avec Deep Blue et Watson, c’est qu’ils sont en partie préprogrammés”, a relevé Demis Hassabis. “Pour Deep Blue, ce sont des informaticiens et des joueurs d’échecs qui ont instillé la connaissance de ce jeu au programme”, a expliqué ce neuroscientifique britannique de 38 ans, concepteur de jeux vidéos.
“Nous, nous avons construit des algorithmes qui apprennent à partir du terrain”. “Les concepteurs et les programmateurs n’ont pas besoin de connaître eux-mêmes la solution”.
DQN a reçu uniquement des informations sur les pixels (image) et sur les scores. “Au départ, il était un peu comme un bébé, ouvrant les yeux et découvrant le monde pour la première fois”, explique Demis Hassabis. “Il a appris en pressant des touches au hasard et en repérant quand cela lui permettait d’avoir de bons scores”, ajoute Vlad Mnih de DeepMind.
A Breakout, jeu de casse-briques de 1976, DQN a même fini par imaginer une technique très efficace (en creusant un tunnel), une stratégie qui a épaté les informaticiens.
DeepMind, fondée en 2011, avait présenté une première ébauche de résultats sur DQN peu avant son rachat par Google pour une somme évaluée à 400 millions de Livres (546 millions d’euros d’aujourd’hui).
Cette fois-ci la gamme de jeux est beaucoup plus étoffée.
DQN a expérimenté des jeux de la fin des années 1970 et des années 1980. Elle va s’attaquer à présent à des jeux des années 1990 en 3D, “nettement plus compliqués”, reconnaît Demis Hassabis. “On y arrivera dans les cinq ans”.
“L’idée, c’est que si l’algorithme permet de simuler la conduite dans un jeu de course automobile, potentiellement avec quelques améliorations, il devrait être capable de conduire une vraie voiture”.
Mais cela va “plus loin que ça”. Cela pourrait permettre de prendre des décisions rapides dans des situations impliquant de nombreuses données, dit-il.
“Cela peut consister à demander à votre téléphone d’organiser un voyage en Europe. Il se chargera de réserver les vols et les hôtels pour vous”.
“Dans le futur, utiliser ce type d’intelligence artificielle devrait nous aider dans des domaines comme l’étude des maladies et les questions climatiques, qui impliquent des données nombreuses et très complexes”, estime-t-il.


Lu 119 fois

Nouveau commentaire :

Votre avis nous intéresse. Cependant, Libé refusera de diffuser toute forme de message haineux, diffamatoire, calomnieux ou attentatoire à l'honneur et à la vie privée.
Seront immédiatement exclus de notre site, tous propos racistes ou xénophobes, menaces, injures ou autres incitations à la violence.
En toutes circonstances, nous vous recommandons respect et courtoisie. Merci.

Dossiers du weekend | Actualité | Spécial élections | Les cancres de la campagne | Libé + Eté | Spécial Eté | Rétrospective 2010 | Monde | Société | Régions | Horizons | Economie | Culture | Sport | Ecume du jour | Entretien | Archives | Vidéo | Expresso | En toute Libé | USFP | People | Editorial | Post Scriptum | Billet | Rebonds | Vu d'ici | Scalpel | Chronique littéraire | Billet | Portrait | Au jour le jour | Edito | Sur le vif | RETROSPECTIVE 2020 | RETROSPECTIVE ECO 2020 | RETROSPECTIVE USFP 2020 | RETROSPECTIVE SPORT 2020 | RETROSPECTIVE CULTURE 2020 | RETROSPECTIVE SOCIETE 2020 | RETROSPECTIVE MONDE 2020 | Videos USFP | Economie_Zoom | Economie_Automobile | TVLibe







L M M J V S D
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          





Flux RSS
p