L’Intelligence artificielle en 7 questions

Lorsqu’on évoque l’intelligence artificielle, on pense aux robots humanoïdes, aux voitures autonomes, ou encore aux superordinateurs qui gagnent aux échecs (Deep Blue d’IBM qui a battu en 1997 le champions d’échecs Garry Kasparov) ou au jeu de go (AlphaGo, de Google ).

Certaines IA sont très connues comme Watson, développé par IBM, qui est utilisé par près de 500 start-up. Watson est par exemple utilisée pour inventer des recettes de cuisines (Watson Chef), pour analyser les performances des joueurs de tennis du tournoi de Wimbledon, pour assister les avocats dans le grand cabinet américain BakerHostetlers. Il a même assisté le compositeur Alex Da Kid dans l’écriture d’une chanson.

1- Quel est le lien entre algorithmes et intelligence artificielle?

Les algorithmes sont pas moins omniprésents sur internet. Chaque fois que l’on tape une recherche sur Google, ce sont les algorithmes de Google qui sélectionnent et ordonnent les résultats. Lorsque l’on consulte son fil d’actualité Facebook, les publications qui apparaissent sont le fruit d’un savant calcul complexe par ces algorithmes, en fonction de nos préférences et de notre historique. Même chose lorsque Spotify nous recommande un morceau de musique.

Comme je l’expliquais dans l’article Faut il s’inquiéter que le monde soit régit par des algorithmes?, les algorithmes sont fondés sur des hypothèses sous-jacentes qui doivent être identifiées, explicitées et débattues collégialement, sans quoi on peut observer des risques de discrimination (âge), d’exclusion financière (niveau de revenus), d’iniquité de traitement (frais)…

Les programmes dits d’Intelligence artificielle vont un cran plus loin. On parle d’intelligence artificielle lorsqu’on analyse de grandes bases de données (Big data), ou lorsqu’on interagit avec autrui via un agent conversationnel (chatbots).  Pourtant l’immense majorité des chabots ne sont que des scripts préprogrammés qui donnent l’impression d’intelligence artificielle mais n’en sont pas. Seuls les bots des GAFA utilisent des modèles très avancés en traitement du langage.

2- Qu’est-ce que l’apprentissage automatique?

L’apprentissage automatique (machine learning) est un des sous domaines les plus prometteurs au sein de l’ intelligence artificielle. On parle d‘apprentissage automatique pour les systèmes qui ont la capacité d’apprendre, sans être explicitement programmés. Les ordinateurs apprennent par essai et erreur en analysant de grandes quantités de données (Big data) qui ont été préalablement « étiquetées » par des humains. Un programme peut apprendre à reconnaître une voiture si on le « nourrit » de dizaines de milliers d’images de voitures.

On peut comparer le fonctionnement d’un algorithme de machine learning au développement cognitif de l’enfant : celui-ci apprend en observant le monde, en reproduisant les règles sans pour autant qu’on lui expose explicitement. C’est pareil en en matière d’apprentissage automatique (machine learning): les algorithmes sont entraînés à apprendre seuls, sans programmation explicite.

Aujourd’hui, l’apprentissage automatique est par exemple utilisé pour identifier des relations existantes entre des personnes, des événements, pour la recommandation de films ou de livres, la reconnaissance de l’écriture manuscrite…

Dans l’industrie, le machine learning est utilisé pour la maintenance prédictive, la détection d’anomalie, la gestion des stocks et l’optimisation de la consommation d’électricité.

apprentissage automatique supervise profond

3- Quelle est la différence entre apprentissage supervisé et non supervisé?

Au sein du machine learning, on distingue apprentissage supervisé et non supervisé.

  • apprentissage supervisé : On peut prendre l’exemple d’un algorithme qui détecte les visages. Un l’utilisateur devra lui montrer ce qu’est un visage et ce qui ne l’est pas, afin qu’il puisse prédire si les prochaines photos le sont ou non. L’algorithme apprend grâce à des exemples, qui ont été étiquetés par des humains.
  • apprentissage non-supervisé: l’algorithme va comprendre par lui-même comment différencier un visage d’un paysage en cherchant des corrélations. Étant donné qu’un algorithme ne peut pas tout simplement savoir ce qui constitue un visage, la méthode non-supervisée va donc classer les données dans des catégories (cluster en anglais).

4- Qu’est ce que l’apprentissage profond?

L’apprentissage profond (deep learning) regroupe les algorithmes et modèles assez gros et complexes pour pouvoir traiter les données brutes directement. Ils permettent de reconnaître des données complexes, comme des images, l’écriture ou la parole. Ces systèmes reposent souvent sur la technologie dite des « réseaux de neurones ». Les systèmes analysent eux-mêmes les données et en déduisent leurs propres règles. Ils pratiquent généralement l’apprentissage supervisé.

Google Brain utilise le deep learning pour déchiffrer les numéros de rue dans Google Maps, pour la traduction de Google Translate et pour la conduite autonome. Facebook s’en sert pour détecter les images contraires à ses conditions d’utilisation, et pour reconnaître et taguer les utilisateurs présents sur les photos publiées (DeepFace). Des chercheurs l’utilisent pour classifier les galaxies. L’apprentissage profond est aussi utilisé pour la traduction automatique et la reconnaissance vocale.

J’ai découvert avec surprise que ces programmes de deep learning sont mis à disposition du public par les GAFA via des « frameworks » en open source: TensorFlow pour google, Torch chez Facebook, Cortana NTK chez Microsoft, la plateforme Watson chez IBM ou encore DSSTNE chez Amazon. Python est le langage le plus utilisé dans ce domaine.

Tensorflow est actuellement l’outil le plus utilisé.

5- Qu’est ce qu’un réseau de neurones?

La technologie des réseaux de neurones, qui existait avant le deep learning, est inspirée de la structure du cerveau humain -c’est pourquoi on parle de biomimétisme. Elle repose sur des centaines de millions de nœuds, semblables aux neurones. Chaque nœud travaille sur une seule partie d’une équation plus grande. L’ordinateur reconnaît un objet (un chien, une maison) via des nœuds reconnaissant des parties individuelles d’une image, comme la queue d’un chien, un mur ou une porte. Parce qu’un problème est réparti sur des millions de nœuds, la façon dont chaque section prend une décision est opaque.

L’apprentissage des réseaux de neurones est généralement supervisé et automatique. On parle de « boîtes noires » car on n’est pas forcément capable d’expliquer dans le détail le raisonnement logique de l’ordinateur – on constate que le programme arrive à reconnaître des voitures mais sans avoir exactement comment il s’y est pris (ie quels sont les critères qui lui permettent de la reconnaître).

Cela est susceptible de poser problème lorsque de tels programmes sont utilisés en appui d’une politique publique car le raisonnement ne sera pas transparent.

Actuellement, les chercheurs en intelligence artificielle essaient de remonter les différentes activations de nœuds pour voir à quelle partie de l’image le programme d’IA fait attention, afin de mettre en évidence ses critères de décisions. Cela leur donne des informations sur les fonctionnalités que l’ordinateur utilise vraiment pour prendre une décision.

6- Quelles sont les limites de l’intelligence artificielle?

Rapidité de calcul ne fait pas l’intelligence. Si l’apprentissage est puissant, il a des limites intrinsèques : on ne sait automatiser que ce qui répond à des règles logiques et donc pas les changements de paradigmes… Le Big data fait de l’anticipation basée sur la corrélation. Cette anticipation repose sur l’idée que ce qui s’est passé dans le passé doit se reproduire. Cela implique que le système ne sait prévoir que ce qui est régulier, sans être capable de prédire quand cette régularité cessera.

De plus, les intelligences artificielles que nous développons actuellement sont inopérantes sans données. Elles n’ont pas d’esprit d’initiative.

Les techniques d’apprentissage n’ont aujourd’hui pas la capacité d’inventer des concepts neufs ou de construire des appareils conceptuels inédits – c’est pourquoi les chercheurs parlent d’intelligence artificielle faible (par opposition à l’intelligence artificielle générale ou forte qui à l’instar de l’humain aurait une conscience et saurait utiliser l’émotion pour décider).

On est encore loin du rêve de la silicon Valley de télécharger un cerveau dans un ordinateur.

7 – Mais alors quel est le danger de l’intelligence artificielle?

Actuellement, c’est surtout le piratage des intelligences artificielles qu’il faut craindre. Des chercheurs ont démontré que les algorithmes de machine learning peuvent être manipulés en exploitant leur propension à cibler des modèles récurrent (patterns) dans les données. Si on leur envoie de fausses informations, les algorithmes construisent des modèles faux.

On peut par exemple tromper un véhicule autonome avec des panneaux d’affichages, ou des assistants à reconnaissance vocale par des signaux inaudibles pour l’oreille humaine. L’algorithme n’est pas encore suffisamment intelligent pour repérer que l’on cherche à le tromper.

Personnellement, je suis inquiète sur l’impact de l’intelligence artificielle sur l’emploi peu qualifié. En France, un cabinet de conseil, Roland Berger, a établi approximativement que 42 % des emplois étaient menacés. Le Conseil d’orientation pour l’emploi, rattaché au Premier ministre, prévoit, quant à lui que 10 % des emplois seront menacés de disparition, mais que 50% des emplois seront potentiellement automatisés à plus de 50 %. Les emplois les plus exposés sont le plus souvent des métiers manuels et peu qualifiés, notamment de l’industrie, tels que les ouvriers non qualifiés des industries de process, de la manutention, du second oeuvre du bâtiment, les agents d’entretien, les caissiers mais aussi tous les chauffeurs de taxis, camionneurs…

Et voilà, j’espère que maintenant intelligence artificielle, deep learning et big data… n’ont plus de secret pour vous. Pour aller plus loin: je vous conseille :

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *