Avancees Intelligence Artificielle Olivier Ezratty
Avancees Intelligence Artificielle Olivier Ezratty
Avancees Intelligence Artificielle Olivier Ezratty
Mars-Mai 2016
Olivier Ezratty
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 1 / 160
A propos de l’auteur
Photo de couverture : le robot Pepper d’Aldebaran Robotics, prise par l’auteur à Tokyo en octobre 2014.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 2 / 160
Table des matières
Introduction .............................................................................................................. 5
Sémantique et questions clés ................................................................................... 7
Les craintes sur l’intelligence artificielle ............................................................... 7
Grandes questions sur l’intelligence artificielle ..................................................... 9
Qu’est-ce que l’intelligence artificielle ? ............................................................. 10
De l’IA faible à l’IA forte ..................................................................................... 11
L’IA permettrait d’atteindre l’immortalité ........................................................... 13
Définitions et segmentations de l’intelligence artificielle .................................... 14
Histoire et technologies de l’intelligence artificielle .......................................... 18
Des hivers au printemps de l’IA ........................................................................... 18
Force brute et algorithmes traditionnels ............................................................... 23
Moteurs de règles et systèmes experts ................................................................. 24
Méthodes statistiques............................................................................................ 25
Logique floue........................................................................................................ 26
Réseaux de neurones ............................................................................................ 27
Support Vector Machines ..................................................................................... 34
Machine learning et deep learning ....................................................................... 35
Reconnaissance de la parole ................................................................................. 38
Reconnaissance d’images ..................................................................................... 39
Reconnaissance de vidéos .................................................................................... 41
Agents intelligents et réseaux d’agents ................................................................ 41
IBM Watson et le marketing de l’intelligence artificielle ................................. 44
La prouesse technique et marketing d’IBM Watson ............................................ 44
L’approche écosystème de Watson ...................................................................... 48
Les études de cas et projets d’IBM Watson ......................................................... 50
L’IA mis à toutes les sauces dans le marketing des start-ups .............................. 59
Startups US de l’intelligence artificielle............................................................... 61
Cartographies des startups de l’intelligence artificielle ....................................... 61
Deep Learning et Machine Learning .................................................................... 64
Moteurs d’analyses prédictives ............................................................................ 68
IA pour la recherche visuelle................................................................................ 69
Robots conversationnels ....................................................................................... 71
Applications sectorielles du machine learning ..................................................... 73
Applications dans la santé .................................................................................... 75
Startups acquises par les grands du numérique ................................................ 78
Google .................................................................................................................. 78
IBM ....................................................................................................................... 81
Microsoft .............................................................................................................. 82
Apple .................................................................................................................... 84
Facebook ............................................................................................................... 84
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 3 / 160
Autres grands acteurs du numérique .................................................................... 86
Startups françaises de l’intelligence artificielle ................................................. 87
La recherche en IA en France............................................................................... 87
Startups horizontales ............................................................................................ 88
Objets connectés ................................................................................................... 90
Commerce et marketing ....................................................................................... 92
Santé ..................................................................................................................... 94
Applications métiers ............................................................................................. 95
Modélisation et copie du cerveau ......................................................................... 98
Imiter ou s’inspirer du cerveau humain ................................................................ 98
Les initiatives de recherche pour décoder le cerveau ......................................... 100
La copie du cerveau n’est pas pour demain et heureusement ............................ 102
Evolutions de la loi de Moore et applications à l’intelligence artificielle ...... 109
Algorithmes et logiciels...................................................................................... 109
La loi de Moore dans la vraie vie ....................................................................... 111
Puissance de calcul ............................................................................................. 116
Stockage.............................................................................................................. 123
Capteurs sensoriels ............................................................................................. 126
Energie ................................................................................................................ 129
Sécurité ............................................................................................................... 130
La robotisation en marche des métiers .............................................................. 134
Les prévisions sur l’emploi et leurs limites ........................................................ 134
Revue de lectures ................................................................................................ 140
Les incertitudes sur la vitesse de la robotisation ................................................ 150
Comment éviter de se faire robotiser ................................................................. 151
Et les politiques ?................................................................................................ 153
Epilogue................................................................................................................. 156
Glossaire ................................................................................................................ 159
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 4 / 160
Introduction
Cet ebook est une compilation de neuf articles sur les Avancées de l’Intelligence Ar-
tificielle publiés entre mars et mai 2016 sur le blog Opinions Libres.
Ces articles avaient comme ambition de décortiquer l’état de l’art de l’intelligence
artificielle en grattant derrière les effets d’annonces, notamment autour de la victoire
de Deep Mind contre le champion du monde du jeu de Go.
Ils ne prétendent pas remplacer un ouvrage de référence sur l’intelligence artificielle.
Il y en a plein, notamment dans l’édition américaine. Certains de ces ouvrages sont
évoqués dans ce document. Nombreux sont ceux qui racontent à leur manière
l’histoire de l’intelligence artificielle, avec ses hauts et ses bas, depuis sa naissance
pendant les années 1950. Nous sommes actuellement dans une période « haute ».
Mes articles ont évolué après leur publication, comme des sables mouvants. Notam-
ment ceux qui concernent les startups de l’intelligence artificielle que j’ai pu complé-
ter au fil de l’eau et des sollicitations. Au gré de mes lectures, j’ai complété et affiné
le texte.
Voici la synthèse et la structure de ce document :
Sémantique et questions clés : qu’est-ce que l’IA ? Comment est-elle segmen-
tée ? Quelles sont les grandes questions qui se posent à son sujet ?
Histoire et technologies de l’intelligence artificielle : comment l’IA a-t-elle pro-
gressé depuis les années 1950 ? Quelles sont ses principales briques technolo-
giques, surtout algorithmiques ? Les progrès récents viennent-ils du logiciel, du
matériel ou des données ?
IBM Watson et le marketing de l’intelligence artificielle : qu’est-ce qui se
cache derrière IBM Watson ? Comment interpréter sa performance dans sa vic-
toire au Jeopardy en 2011 ? Quelles sont ses autres applications, notamment dans
la santé ? Remplace-t-il les experts ? Quelle est la stratégie d’IBM ? Comment les
startups de l’IA s’y prennent-elles dans leur marketing ?
Les startups US de l’intelligence artificielle : quelles sont les principales star-
tups américaines de l’IA ? Lesquelles sont les mieux financées ? Quelles plate-
formes ont le vent en poupe ?
Les startups acquises par les grands du numérique : comment les grands ac-
teurs américains du numérique investissent-ils dans l’IA et quelles startups ont-ils
acquis ?
Les startups françaises de l’intelligence artificielle : comment fonctionne la re-
cherche française dans l’IA ? Quelles sont les principales startups du secteur ? Où
sont les opportunités ? Quelle stratégie bâtir dans l’IA ?
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 5 / 160
La modélisation et la copie du cerveau : quelle est notre compréhension actuelle
de la structure du cerveau ? Est-ce que les prévisions de la singularité visant à co-
pier le contenu d’un cerveau dans un ordinateur sont réalistes ?
Les évolutions de la loi de Moore : comment évolue la loi de Moore dans la pra-
tique, à la fois dans les supercalculateurs et dans les produits grand public ?
Comment va évoluer le logiciel et le matériel pour faire évoluer les applications à
l’intelligence artificielle ?
La robotisation en marche des métiers : comment l’IA et la robotique vont
transformer les métiers dans le futur ? Est-ce un tsunami qui se prépare ? Que di-
sent les experts sur le sujet ? Quelles sont les limites des prédictions ? Comment
éviter de se faire robotiser ? Qu’en est-il de l’IA dans la politique ?
Epilogue : synthèse d’impressions et que penser de tout cela ?
Bonne lecture !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 6 / 160
Sémantique et questions clés
L’intelligence artificielle fait partie de ces technologies qui peuvent générer toutes
sortes de fantasmes pour les uns et de craintes pour les autres. Peut-être bien plus
qu’avec la majeure partie des technologies, peut-être à l’exception de la génomique,
il nous est difficile d’en comprendre le fonctionnement, l’état de l’art et d’en appré-
cier les enjeux associés.
L’actualité technologique nous ressasse des performances d’IBM Watson, des robots
quadrupèdes ou bipèdes de Boston Dynamics, la future ex-filiale de Google, ou des
dernières expérimentations de voitures à conduite automatique, chez Google ou
ailleurs. Il est facile de mettre tout cela dans le même sac, sous l’appellation
d’intelligence artificielle comme si c’était un tout bien unifié. Il n’en est rien !
L’intelligence artificielle est un pan entier de l’informatique avec sa diversité, ses
briques technologiques, ses assemblages et solutions en tout genre. Qui plus est, elle
est aussi liée à d’autres sciences : les mathématiques, les statistiques, les sciences co-
gnitives, la psychologie et la neuro-biologie.
C’est un véritable écosystème hétéroclite. Qui plus est, la grande majorité des solu-
tions commerciales d’Intelligence Artificielle sont faites de bric et de broc, en fonc-
tion de besoins très spécifiques. On est loin d’avoir sous la main des solutions d’IA
génériques.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 7 / 160
Cette thèse se retrouve décrite dans le menu dans de nombreuses ouvrages, comme
celles de Nick Bostrom dans Superintelligence, paru en 2014 ou dans Our Final In-
vention, Artificial Intelligence and the End of the Human Era de James Barrat,
paru en 2015.
Ces prédictions partent du principe que l’on arrivera un jour à créer une machine su-
perintelligente dont la puissance croitra de manière exponentielle et qui contrôlera
toutes nos destinées du fait de l’hyperconnexion des infrastructures et des objets de la
vie courante.
Le cofondateur de Sun Microsystems, Bill Joy, avait été l’un des premiers à alerter
l’opinion avec Why the future doesn’t need us, un long texte publié en 2000 dans
Wired, tirant la sonnette d’alarme sur les dangers des progrès technologiques dans
l’IA, les nanotechnologies et les biotechnologies. C’était bien avant la fin du premier
séquençage complet du génome humain qui avait coûté une fortune1.
Bill Joy était en fait effrayé des perspectives avancées par Ray Kurzweil qu’il avait
rencontré dans une conférence en 1998 et avoir lu son The age of spiritual machines,
paru six ans avant The singularity is near.
S’en est suivie une grosse décennie de calme côté alertes. Après Stephen Hawking en
2014, Bill Gates et Elon Musk ont repris le flambeau de Bill Joy en 2015 pour de-
1
On y apprend d’ailleurs qu’il avait rencontré Jacques Attali et que ce dernier avait indirectement influé le cours des événements de
Java !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 8 / 160
mander une pause technologique et une réflexion sur les limites à ne pas dépasser
avec l’intelligence artificielle comme avec la robotique.
Il existe même des instituts de recherche qui planchent sur cette question : le Center
for the Study of Existential Risk de Cambridge et le Future of Humanity Insti-
tute d’Oxford.
Dans les optimistes, semble-t-il moins nombreux, on trouve bien évidemment le pape
actuel de la singularité Ray Kurzweil qui anticipe celle-ci autour de 2030-2040 ainsi
que Mark Zuckerberg de Facebook qui pense que l’homme sera raisonnable dans
ses usages de l’IA.
Les optimistes sont aussi souvent les spécialistes de l’IA qui voient de près
l’ingratitude de la discipline et estiment en général que l’on est loin de l’AGI et de
l’ASI. La plupart des auteurs qui prédisent une ASI ne sont en effet pas des spécia-
listes de l’IA !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 9 / 160
Quelles sont les grandes briques technologiques de l’intelligence artificielle ?
C’est un domaine un peu fouillis que je vais essayer de segmenter. Sans forcément
adopter le découpage des ouvrages de référence sur le sujet qui sont assez diffi-
ciles d’abord.
Quels sont les différents usages de l’intelligence artificielle ? Je vais reprendre
les études de cas les plus courantes et les commenter.
Comment les solutions d’intelligence artificielle sont-elles commercialisées, en
prenant l’exemple d’IBM Watson ? En décrivant l’approche qui est actuellement à
dominante service pour les solutions d’entreprises, mais avec un fort développe-
ment d’applications grand public en parallèle. Comment l’IA se retrouve-t-elle
dans le marketing des startups ?
Comment se développe l’écosystème de l’intelligence artificielle, des grands
groupes comme Google, Facebook, Microsoft et IBM jusqu’aux start-ups du sec-
teur ? Quels sont les enjeux industriels dans le secteur ? Et la position de la
France ? Quel est le rôle de l’open source ?
Comment les briques d’intelligence artificielle progressent-elles ? Est-ce lié à
l’invention de nouveaux procédés techniques, aux progrès du matériel ou aux
deux, et dans quelle proportion ? Qu’est-ce qui pourrait accélérer ou ralentir ces
progrès ?
Quel sera l’impact de l’IA sur le futur de l’emploi ? Est-ce réaliste de prévoir
que la moitié des emplois disparaitront dans à peine deux décennies ? Quels sont
les emplois les plus menacés ? Quels sont les moyens d’éviter de se faire « roboti-
ser » ? Quid des politiques et du fonctionnement des états au passage ?
Il s’agit ici du résultat d’une quête personnelle sur un sujet nouveau, s’appuyant en
grande partie sur une recherche bibliographique extensive. Je ne suis pas spécialiste
de ce domaine et j’apprends au fil de l’eau tout en partageant le résultat de cet ap-
prentissage.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 11 / 160
en est encore loin, même si certaines de ces capacités notamment linguistiques et de
raisonnement général sont en train de voir le jour.
L’AGI dépend à la fois des progrès matériels et de notre compréhension toujours en
devenir du fonctionnement du cerveau humain qui fait partie du vaste champ de la
neurophysiologie, coiffant des domaines allant de la neurobiologie (pour les couches
“basses”) à la neuropsychologie (pour les couches “hautes”). Le fonctionnement du
cerveau apparait au gré des découvertes comme étant bien plus complexe et riche
qu’imaginé. Les neurones seraient capables de stocker des informations analogiques
et non pas binaires, ce qui en multiplierait la capacité de stockage de plusieurs ordres
de grandeur par rapport à ce que l’on croyait jusqu’à il y a peu de temps. On sait par
contre que le cerveau est à la fois ultra-massivement parallèle avec ses trillions de
synapses reliant les neurones entre elles mais très lent (“clock” de 100 Hz maximum).
2
On peut aussi se rassurer avec ce très bon papier Ruper Goodwins paru en décembre 2015 dans Ars Technica UK : Demystifying
artificial intelligence: No, the Singularity is not just around the corner.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 12 / 160
Toutes ces conjectures semblent théoriques. Elles partent du principe qu’une ASI
contrôlerait sans restriction toutes les ressources humaines. Elles s’appuient aussi sur
la possibilité que toutes les sécurités informatiques d’origine humaine pourront être
cassées par une ASI.
Dans la pratique, l’IA d’aujourd’hui va déjà bien au-delà des capacités humaines, no-
tamment lorsque la mémoire est en jeu. La capacité des systèmes experts, et notam-
ment d’IBM Watson, à brasser d’énormes volumes d’information fournit des capaci-
tés inaccessibles à n’importe quel humain, même surdoué. L’ASI correspond donc à
un mélange des genres entre les domaines où l’homme est déjà dépassé et ceux où il
ne l’est pas encore et le deviendra.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 13 / 160
On arriverait au stade de l’AGI entre 2030 et 2100 selon les prévisions, et de l’ASI
quelques décennies après. On se demande d’ailleurs ce qui expliquerait le délai entre
les deux au vu du facteur d’accélération lié au matériel.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 14 / 160
L’IA peut notamment servir à automatiser des processus cognitifs et en
s’appuyant sur quatre étapes : l’observation des faits et données, leur interprétation,
leur évaluation et la décision, avec une action ou une proposition d’actions, souvent
basée sur des statistiques.
Voici encore un autre découpage : celui de l’arbre avec trois grandes branches : l’une
pour les tâches d’expertise, la seconde pour les tâches courantes (perception, sens
commun, raisonnement, langage) et la troisième pour les tâches for-
melles (mathématiques, jeux). Mais cela ne décrit pas les briques technologiques as-
sociées pour autant.
Cet autre découpage, plus terre à terre, comprend le machine learning, le traitement
du langage, les systèmes experts, la robotique et la vision. L’architecture est
moyenne : il serait plus logique de regrouper les sens avec la parole et la vision. Sans
compter l’ouïe qui peut aussi servir. Quand à la robotique, elle a vocation à intégrer
tous les autres champs du schéma et à en ajouter d’autres qui lui sont spécifiques
comme ceux des capteurs, des matériaux, de la mécanique, des moteurs électriques et
des batteries.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 15 / 160
Enfin, ce dernier schéma fait un lien formel entre trois groupes :
Les applications (affective computing, reconnaissance d’images et vidéos, traduc-
tion, …).
Les domaines d’applications (computer vision, NLP, …).
Les méthodes (avec trois grandes catégories : le data mining, le machine learning
et les statistiques). Bien bien, mais on peut aussi faire du data mining grâce à du
machine learning et ce dernier peut aussi s’appuyer sur des statistiques. Tout cela
est bien récursif !
Cela rappelle à bon escient que les solutions à base d’IA sont des assemblages de di-
verses briques logicielles selon les besoins. Et ces briques sont des plus nombreuses.
A tel point que leur intégration est un enjeu technique et métier de taille, peut-être le
plus complexe à relever.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 16 / 160
Aymeric Poulain Maybant m’a transmis sa thèse de doctorat sur l’hybridation en
sciences cognitives qui date de 2005 et décrit très bien cet enjeu. L’IA intégrative est
un des principaux facteurs de développement du secteur. On le retrouve dans
l’association de nombreuses techniques dans les solutions d’IA comme le couplage
de réseaux neuronaux et d’approches statistiques, notamment dans la reconnaissance
de la parole.
Si on demandait à un système d’Intelligence Artificielle de s’auto-définir et s’auto-
segmenter en exploitant les données bibliographiques disponibles, il serait bien mal
en point ! Un peu comme il est difficile de caractériser une période contemporaine,
sans le regard de l’historien du futur qui pourra prendre du recul pour analyser le pré-
sent.
Vous êtes déjà paumés ? Moi aussi ! Ce qui n’empêche pas de continuer ce parcours !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 17 / 160
Histoire et technologies
de l’intelligence artificielle
Passons à un côté plus terre à terre en faisant un petit inventaire approximatif des
techniques de l’IA. Il s’agit toujours de vulgarisation et d’une restitution de mon pro-
cessus de découverte du sujet !
Nous évoquerons en partie la question du matériel, notamment pour les réseaux de
neurones. Le reste le sera dans un chapitre dédié aux évolutions de la loi de Moore.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 18 / 160
Cette histoire de l’IA en fait un inventaire intéressant. Herbert Simon (ci-dessus)
et Allen Newell prévoyaient en 1958 qu’en 10 ans, un ordinateur deviendrait cham-
pion du monde d’échecs et qu’un autre serait capable de prouver un nouveau et im-
portant théorème mathématique. 30 ans d’erreur de timing pour la première prévision
et autant pour la seconde sachant qu’elle est toujours largement en devenir pour être
générique !
Cet écueil est le même dans les prévisions actuelles autour de la singularité et du
transhumanisme : l’ordinateur plus intelligent que l’homme en 2030 ou 2040 et
l’immortalité pour les enfants qui viennent de naitre !
Le chercheur d’IBM Herbert Gelernter avait réussi en 1958 à utiliser un logiciel de
démonstration de théorèmes de géométrie fonctionnant en chainage arrière - de la so-
lution jusqu’au problème - sur un IBM 704 et à partir d’une base de 1000 règles. Cela
relevait d’une combinatoire plutôt simple. C’était prometteur.
Il en va autrement du théorème d’incomplétude de Godel qui dit que “dans n’importe
quelle théorie récursivement axiomatisable, cohérente et capable de « formaliser
l’arithmétique, on peut construire un énoncé arithmétique qui ne peut être ni prouvé
ni réfuté dans cette théorie” ou encore du dernier théorème de Fermat (x^n + y^n =
z^n impossible pour un entier n>2) qui n’ont jamais été démontrés via de l’IA.
Le théorème de Fermat a été démontré au milieu des années 1990 et après des années
d’efforts de plusieurs mathématiciens dont Andrew Wiles. Sa démonstration publiée
dans les annales de mathématiques fait 109 pages et fait appel à de nombreux con-
cepts. Un défi a été lancé en 2005 par un certain Jan Bergstra pour démontrer le
théorème de Fermat avec un ordinateur et il reste toujours à relever. A vous de jouer
si cela vous tente !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 19 / 160
Herbert Simon prévoyait aussi – toujours en 1958 – qu’en 1978, les machines se-
raient capables de réaliser toutes les activités intellectuelles humaines. Et la loi de
Moore n’existait pas encore puisqu’elle a été énoncée après cette prévision, en 1965 !
En 1967, Marvin Minsky pensait qu’en une génération, tous les problèmes liés à
l’IA seraient résolus. Deux générations plus tard, on en discute encore. Il prévoyait
aussi qu’au milieu des années 1970, les ordinateurs auraient l’intelligence d’un
homme moyen. Reste à savoir ce qu’est un homme moyen. Moyen vraiment moyen,
ou juste moyen ?
Les retards étaient aussi manifestes dans la traduction automatique et dans la recon-
naissance de la parole. Notons qu’Herbert Simon a été récompensé en 1978 par le
Prix Nobel d’économie, pour ses travaux sur les rationalités de la prise de décision,
après avoir gagné la fameuse médaille de Turing en 1975. Il n’existe pas de prix No-
bel de la prévision ! Il faudrait d’ailleurs plutôt les attribuer à des personnes déjà dé-
cédées pour valider leurs prévisions au long cours !
Après ce premier hiver de l’IA, s’en est suivie une période d’enthousiasme au début
des années 1980 alimentée notamment par la vague des systèmes experts. Le lan-
gage Prolog du français Alain Colmerauer a contribué à cette vague.
Une nouvelle vague de désillusions s’en est suivie autour des années 1990. L’une des
raisons était que le matériel n’arrivait pas à suivre les besoins de l’IA, notamment
pour traiter deux besoins clés : la reconnaissance de la parole et celle des images, très
gourmandes en puissance de calcul.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 20 / 160
(source du schéma ci-dessous)
Lors des années 1980 avaient été lancés divers gosplans d’ordinateurs “de cinquième
génération” dédiés aux applications de l’IA.
Cela a commencé avec celui du MITI Japonais, lancé en 1981 avec des dépenses
d’un milliard de dollars, puis avec le projet anglais Alvey lancé à ₤350 million et en-
fin le Strategic Computing Initiative de la DARPA. Tous ces projets ont capoté et
ont été terminés discrètement.
Le projet du MITI visait à faire avancer l’état de l’art côté matériel et logiciel. Les
japonais cherchaient à traiter le langage naturel, à démontrer des théorèmes et même
à gagner au jeu de Go. Le projet a probablement pâti d’une organisation trop tradi-
tionnelle, linéaire et centralisée.
La fin des années 1980 a aussi connu l’effondrement du marché des ordinateurs dé-
diés au langage LISP.
Pendant les années 1990 et 2000 ont émergé de nombreux projets de HPC (high-
performance computing), assez éloignés de l’IA et focalisés sur la puissance brute et
les calculs en éléments finis. Ils étaient et sont encore utilisés pour de la simulation,
notamment d’armes nucléaires, d’écoulements d’air sur les ailes d’avion ou pour faire
des prévisions météorologiques. Les HPC de Cray Computers avaient été créés pour
cela ! Cette société existe toujours. C’est l’une des rares survivantes des années 1970.
Depuis le début des années 2000, l’IA a été relancée grâce à diverses évolutions :
L’augmentation de la puissance du matériel qui a permis de diversifier la mise en
œuvre de nombreuses méthodes jusqu’alors inaccessibles. Et en particulier,
l’usage de méthodes statistiques pouvant exploiter la puissance des machines au-
tant côté calcul que stockage et puis, plus récemment, les réseaux neuronaux.
L’atteinte de diverses étapes symboliques marquantes comme la victoire d’IBM
Deep Blue contre Kasparov en 1997 puis d’IBM Watson dans Jeopardy en 2011.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 21 / 160
Enfin, début 2016, la victoire de Google DeepMind au jeu de Go contre son
champion du monde.
L’Internet qui a créé de nouveaux besoins comme les moteurs de recherche et
aussi permis le déploiement d’architectures massivement distribuées. L’Internet a
aussi permi l’émergence de méthodes de travail collaboratives dans la recherche et
les développements de logiciels, en particulier dans l’open source.
La disponibilité de très gros volumes de données, via les usages de l’Internet et
des mobiles, des objets connectés ou de la génomique, qui permet d’associer les
méthodes de force brute et les réseaux neuronaux et autres machine learning ou
méthodes statistiques.
Les besoins dans la robotique, dans la conquête spatiale (Curiosity, Philae…),
dans les véhicules à conduite assistée ou autonome, dans la sécurité informatique,
ainsi que dans la lutte contre la fraude et les scams et pour pourvoir à ces besoins
toujours aussi prégnants de s’occuper des personnes âgées au Japon.
Les nombreuses applications commerciales de l’IA croisant le machine learning,
les objets connectés, la mobilité et le big data. Avec des attentes fortes dans le
marketing et le e-commerce.
L’adoption de méthodes scientifiques et pragmatiques – basées sur
l’expérimentation – et transdisciplinaires, par les chercheurs et industriels.
Comme tout domaine scientifique complexe, l’IA n’a jamais été un terrain
d’unanimité et cela risque de perdurer. Diverses écoles de pensée se disputent sur les
approches à adopter. On a vu s’opposer les partisans du connexionnisme – utilisant le
principe des réseaux de neurones et de l’auto-apprentissage – face à ceux du compu-
tationnisme qui préfèrent utiliser des concepts de plus haut niveau sans chercher à les
résoudre via des procédés de biomimétisme.
On retrouve cette dichotomie dans la bataille entre “neats” et “scuffies”, les pre-
miers, notamment John McCarthy (Stanford), considérant que les solutions aux pro-
blèmes devraient être élégantes et carrées, et les seconds, notamment Marvin Minsky
(MIT) que l’intelligence fonctionne de manière plus empirique et pas seulement par
le biais de la logique. Comme si il y avait un écart entre la côté Est et la côte Ouest !
Ces débats ont leur équivalent dans les sciences cognitives, dans l’identification de
l’inné et de l’acquis pour l’apprentissage des langues. Burrhus Frederic Skinner est
à l’origine du comportementalisme linguistique qui décrit le conditionnement opérant
dans l’apprentissage des langues. Noam Chomsky avait remis en cause cette ap-
proche en mettant en avant l’inné, une sorte de pré-conditionnement du cerveau des
enfants avant leur naissance qui leur permet d’apprendre facilement les langues. En
gros, le fonctionnement de l’intelligence humaine est toujours l’objet de désaccords
scientifiques ! On continue d’ailleurs, comme nous le verrons dans le dernier article
de cette série, à en découvrir sur la neurobiologie et le fonctionnement du cerveau.
D’autres débats ont cours entre les langages de programmation déclaratifs et les mo-
teurs d’inférences utilisant des bases de règles. Sont arrivées ensuite les méthodes
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 22 / 160
statistiques s’appuyant notamment sur les réseaux bayésiens, les modèles de Markov
et les techniques d’optimisation. A ce jour, les méthodes les plus couramment utili-
sées sont plutôt des domaines mathématiques et procéduraux, mais les méthodes à
base de réseaux neuronaux et d’auto-apprentissage font leur chemin. L’intelligence
artificielle intégrative qui se développe vise à exploiter conjointement toutes les ap-
proches.
Aujourd’hui, l’IA est aussi l’objet d’un débat de société, philosophique, économique
(sur le futur de l’emploi) et donc politique. Les débats ont tendance à trop sortir de la
sphère scientifique et technique, au point que, parfois, on ne sait plus de quoi l’on
parle ! L’IA est un vaste machin ou tout est mis dans le même sac. On y anthropo-
morphise à outrance l’IA en imaginant qu’elle imite, remplace et dépasse l’homme.
Cela donne parfois envie de remettre quelques pendules à l’heure !
Sur ce, je vais maintenant partir des couches d’abstraction les plus basses (systèmes
experts, réseaux neuronaux, machine learning, méthodes statistiques, …) pour ensuite
monter dans les couches plus hautes qui font généralement appel aux couches basses,
comme dans la reconnaissance de la parole ou des images. Pour chacune de ces tech-
niques, je vais évoquer si besoin est leur ancienneté, les progrès les plus récents, les
applications phares ainsi que quelques acteurs des marchés correspondants.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 23 / 160
(source de l’image)
La force brute s’est aussi généralisée parce que la puissance des ordinateurs le per-
met : ils tournent plus vite, sont distribuables, le stockage coûte de moins en moins
cher, les télécommunications sont abordables et les capteurs de plus en plus nom-
breux, des appareils photo/vidéo des smartphones aux capteurs d’objets connectés
divers.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 24 / 160
Les moteurs de règles sont employés dans les systèmes experts, un domaine et un
marché qui se sont développés depuis les années 1980. Les systèmes experts ont été
notamment théorisés dans le cadre du Stanford Heuristic Programming Project en
1980. Ils répondent à des questions dans des domaines spécifiques dont on a codifié
la connaissance. Cela permit à l’IA de se rendre utile dans des domaines spécifiques,
comme dans la santé.
L’approche se heurtait cependant à la difficulté de capter la connaissance des experts.
Cela explique son déclin dans les années 1990. Dans de nombreux domaines, la force
brute s’est imposée en lieu et place de la logique et de la captation manuelle de con-
naissances.
Cela se retrouve dans le traitement du langage, la traduction automatique, la recon-
naissance des images ou les moteurs de recherche. Même IBM Watson utilise la force
brute pour exploiter de gros volumes de bases de données de connaissances non
structurées.
Un système expert s’appuie sur deux composantes clés : une base de connaissance,
générée souvent manuellement ou éventuellement par exploitation de bases de con-
naissances existantes, puis un moteur d’inférence, plus ou moins générique, qui va
utiliser la base de connaissance pour répondre à des questions précises. Les systèmes
experts peuvent expliquer le rationnel de leur réponse. La traçabilité est possible
jusqu’au savoir codifié dans la base de connaissances.
On compte encore des outils et langages dans ce domaine et notamment l’offre du
français ILOG, acquis en 2009 par IBM et dont les laboratoires de R&D sont tou-
jours à Gentilly près de Paris. Le moteur d’inférence ILOG JRules est devenu IBM
Operational Decision Manager. De son côté, ILOG Solver est une bibliothèque
C++ de programmation par contraintes, devenue IBM ILOG CPLEX CP Optimizer.
Une stratégie de branding moins efficace que celle d’IBM Watson, comme nous le
verrons dans le prochain article de cette série.
Méthodes statistiques
Les méthodes statistiques et notamment bayésiennes permettent de prévoir la proba-
bilité d’événement en fonction de l’analyse d’événements passés.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 25 / 160
Les réseaux bayésiens utilisent des modèles à base de graphes pour décrire des rela-
tions d’interdépendances statistiques et de causalité entre facteurs.
Les applications sont nombreuses comme la détection de potentiel de fraudes dans les
transactions de cartes bancaires ou l’analyse de risques d’incidents pour des assurés.
Elles sont aussi très utilisées dans les moteurs de recherche au détriment de méthodes
plus formelles, comme le rappelle Brian Bannon en 2009 dans Unreasonable Effec-
tiveness of Data.
La plupart des études scientifiques dans le domaine de la biologie et de la santé génè-
rent des corpus sous forme de résultats statistiques comme des gaussiennes
d’efficacité de nouveaux médicaments. L’exploitation de la masse de ces résultats
relève aussi d’approches bayésiennes. Le cerveau met d’ailleurs en œuvre une lo-
gique bayésienne pour ses propres prises de décision, notamment motrices, les
centres associés étant d’ailleurs situés dans le cervelet tandis que dans le cortex céré-
bral gère la mémoire et les actions explicites3.
Logique floue
La logique floue est un concept de logique inventé par l’américain Lofti Zadeh
(“Fuzzy Logic”) en 1965. J’avais eu l’occasion de l’entendre la présenter lors d’une
conférence à l’Ecole Centrale en 1984, lorsque j’étais en option informatique en troi-
sième année. Ca ne nous rajeunit pas !
La logique floue permet de manipuler des informations floues qui ne sont ni vraie ni
fausses, en complément de la logique booléenne, mais à pouvoir faire des opérations
dessus comme l’inversion, le minimum ou le maximum de deux valeurs. On peut
aussi faire des OU et des ET sur des valeurs “floues”.
3
Source : Stanislas Dehaene.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 26 / 160
Quid des applications ? Elles sont relativement rares. On les trouve dans le contrôle
industriel, dans des boites de vitesse chez Volkswagen (pour tenir compte de
l’intention “floue” du conducteur), pour gérer des feux de circulation et maximiser
le débit, dans la reconnaissance de la parole et d’images, le plus souvent, en complé-
ment du bayésien.
Des dizaines de milliers de brevets auraient été déposés pour protéger des procédés
techniques utilisant la théorie de la logique floue.
Réseaux de neurones
Les réseaux de neurones visent à reproduire approximativement par bio mimétisme le
fonctionnement des neurones vivants avec des sous-ensembles matériels et logiciels
capables de faire des calculs à partir de quelques données en entrées et de générer un
résultat en sortie. Combinées en grand nombre, les neurones artificiels permettent de
créer des systèmes capables par exemple de reconnaître des formes. Les réseaux neu-
ronaux les plus intéressants sont ceux qui peuvent faire de l’auto-apprentissage. At-
tention cependant, les réseaux neuronaux visent l’efficacité algorithmique et ne pré-
tendent pas être des reproductions fines du système nerveux biologique à bas niveau.
Le concept de base est né en 1943 des travaux de Warren McCullochs et Walter
Pitts. Donald Hebb ajouta le principe de modulation la connexion entre neurones en
1949, permettant aux neurones de mémoriser de l’expérience. La connaissance est
acquise via les interconnexions entre neurones et via un processus d’apprentissage.
Elle est matérialisée sous la forme de poids de connexions synaptiques entre neurones
qui varient en fonction de l’expérience acquise, par exemple dans la reconnaissance
d’images.
Le premier réseau de neurones matériel fut créé par Marvin Minsky et Dean Ed-
mons en 1950. Le SNARC simulait 40 neurones avec 3000 lampes à tubes !
Frank Rosenblatt, un collègue de Marvin Minsky, créa ensuite le concept
du perceptron en 1957 qui était un neurone assez simple dans son principe. Le pre-
mier perceptron était un réseau de neurones artificiels à une seule couche tournant
sous forme de logiciel dans un IBM 704, le premier ordinateur du constructeur doté
de mémoires à tores magnétiques. C’était un outil de classification linéaire utilisant
un seul extracteur de caractéristique.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 27 / 160
En 1969, Marvin Minsky publia avec Seymour Papert le livre Perceptrons qui cri-
tiquait sévèrement les travaux de Frank Rosenblatt. D’ailleurs, sur un point très spéci-
fique portant sur les portes logiques XOR des perceptrons. Un point valie et qui mit
un coup d’arrêt à ces développements, un peu comme le rapport de Lightfill quelques
années plus tard. Toujours, dans la dynamique de la rivalité des neats vs scuffies.
Ce coup d’arrêt fit perdre un temps considérable à l’ensemble des recherches en IA,
ce d’autant plus que les réseaux neuronaux sont devenus, depuis, un pan fondamental
des progrès dans tous les étages de l’IA. Marvin Minsky reconnu toutefois son erreur
dans les années 1980, après le décès de Frank Rosenblatt.
Depuis une vingtaine d’années, les réseaux neuronaux sont mis à toutes les sauces, la
dernière étant la victoire de DeepMind contre le champion du monde de Go à la mi-
mars 2016. Les réseaux neuronaux ont progressé pas à pas, avec la création
d’innombrables variantes conceptuelles pour améliorer leurs capacités
d‘apprentissage et de mémorisation. L’IA progresse d’ailleurs régulièrement et de
manière plutôt décentralisée, avec des dizaines de chercheurs contribuant à faire
avancer l’état de l’art. Les dernières années ont cependant vu les efforts de recherche
passer des travaux dans la logique de base vers ses applications.
L’un des points clés des réseaux de neurones actuels est la technique de
la rétropropagation du gradient (back propagation) qui corrige les défauts des Per-
ceptrons identifiés par Papert et Minsky. Elle a vu le jour dans les années 1960 puis,
pendant et après le second hiver de l’IA, a repris son essor vers 1986.
Elle permet de modifier le poids des liaisons synaptiques entre neurones en fonction
des erreurs constatées dans les évaluations précédentes, par exemple dans la recon-
naissance d’images.
Comment fonctionne cette boucle d’apprentissage ? C’est un apprentissage soit assis-
té, soit automatique en comparant les résultats avec la bonne réponse, déjà connue.
C’est un des débats clés d’aujourd’hui : est-on réellement capable de créer des ré-
seaux doués de facultés d’auto-apprentissage ? Il semblerait que l’on en soit encore
loin.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 28 / 160
20 ans après la renaissance des réseaux neuronaux, en 2006, le japonais Osamu
Hasegawa créait les réseaux neuronaux auto-organisés incrémentalement (“Self-
Organising Incremental Neural Network” ou SOINN), utilisables dans des réseaux
neuronaux auto-réplicables et capables d’auto-apprentissage.
En 2011, son équipe développait un robot utilisant ces SOINN capable d’auto-
apprentissage (vidéo), illustrant magistralement les applications des réseaux neuro-
naux. Nous sommes 10 ans plus tard, et on constate que les robots autonomes sont
encore loin du compte, même si les sociétés telles que Boston Dynamics, filiale de
Google, nous ébaubissent avec des robots très souples dans leur démarche et résistant
à l’adversité.
Les réseaux neuronaux ont aussi progressé grâce à leur mise en œuvre dans des archi-
tectures matérielles spécialisées permettant de bien paralléliser leurs traitements
comme le fait le cerveau. Le composant électronique idéal pour créer un réseau de
neurones est capable d’intégrer un très grand nombre de pico-unités de traitement
avec entrées, sorties, logique de calcul si possible programmable et mémoire non vo-
latile. Il faut par ailleurs que les connexions entre neurones (synapses) soient les plus
nombreuses possibles. En pratique, les connexions se font avec les neurones adja-
cents dans les circuits.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 29 / 160
Les memristors ont fait son apparition en 2008 chez HP après avoir été conceptuali-
sée en 1971 par le sino-américain Leon Ong Chua. Ce sont des composants électro-
niques capables de mémoriser un état en faisant varier leur résistance électrique par
l’application d’une tension. Un peu comme les cristaux liquides bistables qui servent
dans (feu) les liseuses électroniques. La valeur modifiable de la résistance permet de
stocker de l’information.
Les memristors peuvent aussi être intégrés au côté de composants actifs classiques
dans des unités de traitement. C’est très bien expliqué dans Memristor: From Basics
to Deployment de Saraju Mohanty, publié en 2013, d’où sont extraits les deux
schémas ci-dessous. Le second présente les différents types de memristors actuelle-
ment explorés.
Ces composants sont intégrables dans des puces au silicium utilisant des procédés de
fabrication plus ou moins traditionnels (nanoimprint lithography), en ajoutant une
bonne douzaine d’étapes dans la production, et avec des matériaux rares comme les
oxydes de titane.
Les memristors ont été développés dans le cadre des projets de recherche du pro-
gramme SyNAPSE de la DARPA. HP a été le premier à en prototyper en 2008, avec
de l’oxyde de titane. Il en existe de plusieurs types, pouvant généralement être fabri-
qués dans les lignes de productions de chipsets CMOS traditionnelles, mais avec des
procédés spécifiques de dépôt sous vide de couches minces de matériaux semi-
conducteurs.
HP a même lancé un partenariat avec le fabricant de mémoires Hynix, mais le projet
a été mis en veilleuse en 2012. Le taux de rebus serait trop élevé lors de la fabrication.
C’est un paramètre clé pour pouvoir fabriquer des composants en quantité industrielle
et à un prix de vente abordable. De plus, le nombre de cycles d’écriture semblait limi-
té pour des raisons chimiques, dans le cycle de libération/captation d’oxygène pour
les memristors en oxydes de titane.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 30 / 160
En octobre 2015, HP et SanDisk ont cependant annoncé un partenariat pour fabriquer
des mémoires volatiles et non volatiles à base de memristors, censées être 1000 fois
plus rapides et plus endurantes que les mémoires flash traditionnelles.
D’autres laboratoires de recherche et industriels planchent aussi sur les memristores
et les réseaux de neurones matériels :
IBM planche avec l’ETH de Zurich (le CNRS suisse) sur des ordinateurs à base
de memristors. Ce même ETH développe un memristor capable de stocker trois
états à base de pérovskite (titanate de calcium) de 5 nm d’épaisseur. Cela pourrait
servir à gérer de la logique floue.
Des chercheurs de l’Université Technologique du Michigan ont annoncé début
2016 avoir créé des memristors à base de bisulfite de molybdène qui ont un com-
portement plus linéaire.
Des chercheurs du MIT ont annoncé début 2016 leurs travaux sur le chipset Eye-
riss utilisant des neurones spécialisés réparties dans 168 cœurs dotés de leur
propre mémoire. Mais visiblement sans memristors. L’application visée est la re-
connaissance d’images. Le projet est financé par la DARPA.
Le projet Nanolitz aussi financé par la DARPA dans le cadre des projets Atoms to
Product (A2P) et s’appuie sur des fils microscopiques pour connecter plus effica-
cement des cœurs et neurones dans des circuits spécialisés.
L’ANR française a financé le projet collaboratif MHANN associant l’INRIA,
l’IMS de Bordeaux et Thalès pour créer des memristors ferriques. Le projet devait
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 31 / 160
être terminé en 2013 et avait bénéficié d’une enveloppe de 740 K€. Difficile de
savoir ce qu’il en est advenu en ligne.
Enfin, la start-up californienne Knowm a lancé le premier composant commer-
cial à base de memristors, fabriqué en partenariat avec la Boise State University, à
base d’argent ou de cuivre et au prix de $220. Il est destiné en premier lieu aux la-
boratoires de recherche en réseaux neuronaux.
Le programme SyNAPSE de la DARPA a en tout cas aboutit en 2014 à la création
par IBM de ses processeurs neuronaux TrueNorth capables de simuler un million de
neurones artificiels, 256 millions de synapses reliant ces neurones et exécutant 46
milliards d’opérations synaptiques par secondes et par Watt consommé. Le tout avec
4096 cœurs.
Le chipset a été fabriqué par Samsung en technologie CMOS 28 nm et avec une
couche d’isolation SOI (issue du français SOITEC !) permettant de diminuer la con-
sommation électrique et d’accélérer les traitements. Le chipsets comprend 5,4 mil-
liards de transistors en tout et fait plus de 4 cm2 de surface. Et surtout, il ne con-
somme que 70 mW, ce qui permet d’envisager d’empiler ces processeurs en couches,
quelque chose d’impossible avec les processeurs CMOS habituels qui consomment
beaucoup plus d’énergie. A titre de comparaison, un processeur Intel Core i7 de der-
nière génération (Skymake) réalisé en technologie 14 nm consomme entre 15 W et
130 W selon les modèles, pour 1,7 milliards de transistors.
Le but d’IBM est de construire un ordinateur doté de 10 milliards de neurones et 100
trillions de synapses, consommant 1 KW et tenant dans un volume de deux litres. A
titre de comparaison, un cerveau humain contient environ 85 milliards de neurones et
ne consomme que 20 Watts ! Le biologique reste encore à ce stade une machine très
efficace d’un point de vue énergétique !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 32 / 160
Il existe d’autres projets d’ordinateurs synaptiques à base de réseaux de neurones. On
peut notamment citer le projet de Jeff Hawkins, le fondateur de Palm, celui de Stan-
ford, qui travaille sur le chipset Neurocore intégrant pour l’instant 65536 neurones et
fonctionnant à très basse consommation.
Il y a aussi le projet SpiNNaker de Steve Furber (Université de Manchester, UK), qui
vise à créer un chipset de un milliard de neurones. Il s’appuie cependant sur une ar-
chitecture matérielle classique, avec 18 cœurs 32 bits ARM par chip. On est plus dans
l’architecture massivement parallèle avec des milliers de processeurs de ce type que
dans les processeurs véritablement synaptiques.
Enfin, dans le domaine commercial, le CogniMem CM1K est un chipset ASIC inté-
grant un réseau de 1024 neurones qui sert aux applications de reconnaissance des
formes. Ne coutant que $94, il est notamment utilisé dans la BrainCard, issue d’une
start-up française.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 33 / 160
Plus récemment, Nvidia a présenté au CES 2016 de Las Vegas sa carte PX2 pour
l’automobile qui intègre deux processeurs X1 comprenant 256 GPU. Les GPU Nvidia
sont utilisés pour simuler des réseaux de neurones. C’est bien mais probablement pas
aussi optimal que de véritables réseaux de neurones et de synapses artificiels comme
le TrueNorth d’IBM. Qui plus est, la carte PX2 doit être réfrigérée par eau car elle
consomme plus de 200 W.
Comme l’explique Tim Dettmers, un GPU n’est utilisable pour des réseaux de neu-
rones que si la mémoire est facilement partagée entre les cœurs de GPU. C’est ce que
propose justement Nvidia avec son architecture GPUDirect RDMA.
Il y aussi Movidius qui propose ses chipsets Myriad à base de réseaux neuronaux ex-
ploitant des processeurs vectoriels, dédiés au traitement de l’image. Ils en ont ré-
cemment lancé une version qui tient sur une clé USB, la Fathom Neural Compute
Stick.
On peut donc constater que tout cela bouillonne, plutôt au niveau des laboratoires de
recherche à ce stade, et que l’industrialisation prendra encore un peu de temps, mais
que les réseaux neuronaux matériels ont probablement un bel avenir devant eux.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 34 / 160
classes de problèmes que les réseaux neuronaux. Les SVM “scalent” mieux que ces
derniers dans des architectures distribuées.
Ils peuvent servir par exemple à générer une classification automatique d’échantillons
de données complexes, comme une segmentation client ou la classification de termes
textuels. On les utilise aussi pour prédire la valeur numérique d’une variable.
L’approche concurrence celle des réseaux bayésiens.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 35 / 160
Il y a aussi Deep Learning Methods and Applications publié par Microsoft
Research (197 pages) qui démarre en vulgarisant assez bien le sujet. Et puisArtificial
Intelligence A Modern Approach, de Stuart Russel et Peter Norvig, une somme de
référence sur l’IA qui fait la bagatelle de 1152 pages et qui ne serait que le B-A-BA
pour les étudiants en informatique.
J’ai enfin trouvé cette présentation plutôt synthétique A very brief overview of deep
learning de Maarten Grachten en 22 slides ! Ouf !
Bref, il faut se taper l’équivalent de plusieurs Rapports du CES de Las Vegas !
Le deep learning est une variante avancée du machine learning qui s’appuie sur des
architectures en couches utilisant des “Restricted Boltzmann Machines” qui
s’alimentent les unes les autres. Une machine de deep learning possède plus de
couches dites cachées dans ses réseaux de neurones qu’une architecture de machine
learning classique.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 36 / 160
Le deep learning permet d’élever le niveau d’abstraction du machine learning en ex-
ploitant des concepts de plus haut niveau, comme indiqué dans le schéma ci-dessus 4!
Voir aussi la conférence inaugurale de Yann LeCun au Collège de France en février
2016 où il excelle dans la vulgarisation). Ce fonctionnement imite d’ailleurs celui du
cerveau humain qui utilise plusieurs niveaux d’abstraction. Il permet en théorie de
mettre en place des méthodes d’auto-apprentissage sans base de données
d’entrainement. Pour l’instant, cependant, cela semble surtout concerner les sens arti-
ficiels.
4
Source : l’excellent slideshow de LeCun – Ranzato, qui fait 204 slides, source également de l’historique du deep learning de cette
page.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 37 / 160
Reconnaissance de la parole
C’est une technologie commune et disponible dans les applications grand public. Le
marché est dominé par de grands acteurs américains (OK Google, Microsoft Cortana,
Apple Siri, Amazon Alexa, Viv5) et, en OEM, par l’américain Nuance qui vend sa
solution un peu partout. Apple a fait l’acquisition de la start-up VocaliQ en 2015
et Sensory fait avancer l’état de l’art de manière indépendante depuis plus de 20 ans.
La reconnaissance de la parole s’appuyait au départ sur des techniques statistiques et
notamment bayésiennes. Elle a fait des progrès continus grâce à l’intégration de tech-
niques différentes telles que le deep learning, le big data, les réseaux neuronaux et
des modèles de Markov à base de statistiques.
Elle profite aussi de l’augmentation régulière de la puissance des processeurs et no-
tamment des processeurs mobiles. Nvidia propose depuis peu d’exploiter les fonc-
tions GPU de ses chipsets pour mettre en œuvre des techniques de deep learning, bé-
néficiant du fort parallélisme des nombreux GPU disponibles.
Les solutions de reconnaissance vocale ont souvent besoin d’accéder à des bases de
données de référence, surtout s’il fonctionne sans apprentissage de la voix de
l’utilisateur. Cela nécessite un aller et retour avec les serveurs du service, ce qui se
sent si on utilise un smartphone. D’où l’intérêt de la 4G et de son débit comme de son
faible temps de latence pour les allers et retours avec les serveurs.
Pour en savoir plus, voir cet historique de la recherche en reconnaissance de la pa-
role : Survey of Technical Progress in Speech Recognition by Machine over Few
Years of Research parue en 2015. Ce sujet intègre de nombreuses branches du sa-
voir issu de plusieurs décennies de recherches dans l’IA.
On est encore loin de la solution parfaite, notamment parce que les logiciels man-
quent d’informations sur le contexte des conversations6. Le taux de fiabilité n’est ja-
mais de 100%. Il ne l’est d’ailleurs jamais pour l’homme également ! Par exemple,
Microsoft Cortana atteint un taux d’erreur d’environ 8%, soit le double de celui de
l’homme. Ce taux d’erreurs de l’IA diminuerait de 25% par an. Microsoft prévoit
d’atteindre le taux d’erreur humain d’ici quelques années. Et encore, c’est pour
l’anglais ! Le taux d’erreur est toujours plus élevé dans d’autres langues comme le
chinois. D’où l’intérêt de la récente publication en open source de la solution Deep
Speech 2 de Baidu.
Le taux d’erreur est particulièrement élevé s’il y a du bruit ambiant, comme dans la
rue, dans un endroit où il y a du monde et même dans sa voiture. Des techniques de
captation du son et d’élimination du bruit ambiant existent aussi. Certaines portent
sur l’analyse spectrale et le filtrage de fréquences. D’autres utilisent la captation sté-
réophonique pour séparer le bruit proche (différentié) du bruit lointain (qui l’est
5
Viv, des créateurs de Siri, est un agent conversationnel capable de répondre à des questions complexes, bien au-delà de ce que
peuvent faire Apple Siri et Google. La solution exploite la notion de génération dynamique de programme. Après analyse de la ques-
tion, un programme complexe est généré en moins de une seconde qui va la traiter. Viv a été présenté récemment lors de TechCrunch
Disrupt à New York (vidéo).
6
Voir aussi Why our crazy smart AI still sucks in transcribing speech paru dans Wired en avril 2016.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 38 / 160
moins). J’avais même vu la start-up israélienne VocalZoom au CES 2015 qui utilisait
un laser pour capter les vibrations des lèvres. Il faut juste trouver où placer le laser, ce
qui est plus facile sur des installations fixes que mobiles.
Reconnaissance d’images
Cette fonction est devenue aussi critique que la reconnaissance de la parole et no-
tamment dans les moteurs de recherche et certains réseaux sociaux, pour identifier
des visages, des expressions ainsi que des lieux. Elle est aussi présente depuis des
décennies dans les logiciels d’OCR pour reconnaitre les textes, images et schémas de
documents scannés. Nous avions même un leader en France dans le domaine avec la
société LTU, acquise par le japonais Jastec en 2005.
La reconnaissance d’images est l’une des principales applications des réseaux neuro-
naux, du machine learning et du deep learning comme nous l’avons vu précédemment.
L’un des objectifs de la recherche est d’élever au maximum le niveau sémantique de
la reconnaissance, pour identifier les personnes et objets sur les images. Par exemple,
dans le cas des solutions de Nvidia ou Mobileye pour la conduite assistée, il s’agit de
détecter au pixel près ceux qui correspondent à des piétons, des cyclistes, des véhi-
cules, de la signalisation au sol et des panneaux de signalisation.
Google est évidemment friand de ce genre de technologies qu’ils utilisent dans
Google Image et Google Photo. Google Image est capable (avec le glisser-déplacer)
d’identifier des images similaires à celle que l’on fournit. Cela utilise probablement
une méthode simple de création de hash-code sur les photos et de recherche dans
l’index d’une grande base de données.
Dans leur projet FaceNet, Google annonce avoir atteint un taux de réussite de détec-
tion de visage de 99,63%7. Le tout s’appuie sur un réseau neuronal à 22 couches.
7
Voir FaceNet: A Unified Embedding for Face Recognition and Clustering. publié en juin 2015.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 39 / 160
De son côté, Facebook et son projet DeepFace s’appuie sur la technologie issue
d’une start-up israélienne face.com. Son taux de réussite serait de 97,25% pour véri-
fier qu’une personne sur une photo est la même sur une autre, quel que soit l’angle de
la prise de vue et l’éclairage. C’est juste en-dessous du taux de reconnaissance hu-
main qui serait évalué à 97,5%.
On trouve de la détection de visages dans plein de solutions du marché comme avec
la fonction Faces de Apple iPhoto. Elle provient peut-être de la start-up sué-
doise Polar Rose acquise par Apple en 2010. De manière peu surprenante, Apple a
aussi acquis, début 2016, la start-up Emotient, spécialisée dans la reconnaissance
d’émotions faciales à base de machine learning. Le matching de visages est une chose,
mais détecter les émotions en est une autre et on peut s’attendre à ce qu’Apple utilise
cette fonctionnalité dans les évolutions de ses solutions, notamment dans la visiocon-
férence Facetime.
Les APIs en cloud proposées par Microsoft Research dans le cadre de son projet Ox-
ford apportent des services équivalents aux développeurs d’applications. Google fait
de même avec ses Cloud Vision APIs. Cette abondance des offres rappelle que les
technologies de l’IA, une fois au point, deviennent rapidement des commodités. Les
méthodes sont sur la place publique. Il faut ensuite les mettre en œuvre avec du logi-
ciel et du matériel. La différence se situe dans l’implémentation et aussi dans le mar-
keting.
La reconnaissance des visages est évidemment un sujet chaud pour les services de
sécurité. On en voit dans tous les films et séries TV ! En quelques secondes, les sus-
pects sont identifiés. Est-ce comme cela dans la vraie vie ? Probablement pas. Cela
explique pourquoi le FBI a lancé son projet NGI (Next Generation Identification) en
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 40 / 160
2009 et maintenant opérationnel. Il était pourvu à hauteur de la bagatelle de $1B et
réalisé par Lockheed Martin.
Le marché de la reconnaissance faciale est aussi prolixe en solutions diffusées en
OEM, comme imagga (seulement $300K de levés) et ses API en cloud de tagging
automatique d’images en fonction de leur contenu, Cognitec qui vise surtout les mar-
chés de la sécurité, Cortexica ($6,6m de levés) et son logiciel findSimilar en cloud
qui met en œuvre ces techniques pour le retail et Slyce qui cible aussi le marché du
retail ($37m de levés et IPO en avril 2015).
Citons enfin un domaine connexe, celui de la reconnaissance de l’écriture manus-
crite à partir d’encre digitale, saisie par exemple avec un stylet comme sur les ta-
blettes. Ce marché est moins connu que pour la reconnaissance vocale ou d’images.
Et nous y avons un champion français avec la société MyScript, anciennement Vi-
sion Objects, qui est basée à Nantes et qui a notamment vendu son logiciel à Sam-
sung.
Reconnaissance de vidéos
La reconnaissance de vidéos est une évolution naturelle de la reconnaissance
d’images, à ceci près que les vidéos fournissent plus d’information. Elle elle est utile
dans tout un tas de contexte, notamment pour les voitures à conduite automatique, un
domaine où l’ordinateur peut maintenant dépasser l’homme.
De son côté, Facebook sait reconnaitre un sport dans une vidéo en s’appuyant sur des
réseaux neuronaux. Quant à Google Brain, il est capable d’identifier des chats dans
des vidéos mais avec un taux d’erreurs encore très élevé, de l’ordre de 25%. La re-
connaissance des visages est précise à 81,7% près (source). Il faut un début à tout !
On trouve des solutions de reconnaissance de visage dans les vidéos chez Kairos qui
savent aussi analyser les émotions et quantifier les foules, chez KeyLemon ($1,5m
de levés) qui propose une solution en cloud, chez Clarifai ($10m de levés) qui per-
met notamment de faire de la curation de contenus photo et vidéo, ou chez le japo-
nais NEC. Il faut aussi citer OpenCV, une solution open source de détection de vi-
sages. Voir cette liste de solutions pour développeurs de détection de visages dans les
vidéos.
Vu de haut, les réseaux d’agents ressemblent aux réseaux de neurones mais leur
mode de fonctionnement est différent. Un agent peut très bien être lui-même indivi-
duellement construit avec un réseau de neurones pour réaliser une tâche spécifique
comme la reconnaissance de la parole ou d’images.
Un autre agent va utiliser le texte généré par la reconnaissance puis appliquer un pro-
cessus de reconnaissance sémantique, puis un autre va traiter la question, fouiller
dans une base de données ou de connaissance, récupérer des résultats, un autre va
formuler une réponse et la renvoyer à l’utilisateur. Idem pour un système de traduc-
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 42 / 160
tion automatique qui va d’abord analyser la parole avec un premier agent, puis réali-
ser la traduction avec un second, puis utiliser un troisième agent de “text to speech”
pour transformer le résultat de manière audible.
Le robot Nao d'Aldebaran a une belle capacité de mouvement grâce à une mécanique de bon niveau. Il interagit en
parlant avec l'utilisateur, mais de manière encore limitée. Son grand frère Pepper, est doté d'une capacité à capter les
émotions des humains qu'il a en face de lui mais sa capacité de dialogue est encore approximative.
Un robot autonome est aussi un condensé de nombreux agents qui gèrent différents
niveaux d’abstraction avec de nombreux capteurs, de la mécanique, des systèmes
permettant au robot de savoir où il est, avec quoi il interagit, etc.
Un robot est particulièrement complexe à mettre au point car il cumule des défis au
niveau des capteurs, de l’intégration de ses sens, de la mécanique pour se mouvoir, de
la batterie pour son autonomie, et dans l’intelligence artificielle pour piloter
l’ensemble et éventuellement interagir à la fois mécaniquement, visuellement et ora-
lement avec son environnement, notamment s’il s’agit de personnes.
Le niveau d’abstraction des réseaux d’agents est plus élevé que celui des réseaux de
neurones. D’où le fait que j’en termine par là sur cette partie !
Les agents sont notamment utilisés dans les systèmes de call centers. Une start-up
française s’était lancée - parmi d’autres - sur ce créneau : Virtuoz. Elle a été acquise
en 2013 par l’américain Nuance. Il existe même un concours du meilleur agent de
service client en ligne, lancé en 2016 en France avec une trentaine de candidats !
Quid des outils de développement associés ? Il y en a plein, et notamment en open
source.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 43 / 160
IBM Watson
et le marketing de l’intelligence artificielle
Je vais m’attaquer ici au marketing des offres de l’intelligence artificielle. Nous al-
lons commencer par étudier le cas d’IBM avec Watson puis élargir la réflexion au
marché en général, et notamment des startups qui surfent sur la vague de l’IA.
8
Source : Humans Need not Apply – 2015, de Jerry Kaplan.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 44 / 160
tures, dans la lignée de leur ligne historique de mainframes. D’où l’importance pour
eux du HPC (High Performance Computing) et de l’intelligence artificielle.
La première incartade d’IBM dans l’IA s’est manifestée au grand jour avec la bataille
des jeux d’échecs. Durant plusieurs années, elle culmina avec la victoire de
l’ordinateur IBM Deeper Blue (ci-dessus9) contre Gary Kasparov en 1997. Cela a
contribué à relancer les recherches d’IBM sur l’IA dans les années 2000.
La seconde grande étape a été la victoire d’IBM Watson au jeu Jeopardy en 2011.
Jeopardy est une sorte de “Questions pour un Champion” américain, sans Julien Le-
pers. Trois parties avaient été organisées : un échauffement le 13 février, et deux les
14 et 15 février. J’ai regardé l’épisode du 14 février sur YouTube. Il mettait face à
face un avatar représentant Watson sur écran et deux champions du jeu : Brad Rutter
et Ken Jennings. Dans les trois parties, Jeopardy gagne, fine. On se rend compte que
Watson ne répond pas bien à toutes les questions, tout du moins au début. C’est un
diésel ! Il est lent au démarrage mais carbure bien ensuite.
J’ai aussi trouvé une autre partie intéressante et moins médiatisée organisée avec
comme joueurs Miles O’Brien et David Gondek, l’un des créateurs de Watson. Au
départ, Watson ne sait pas indiquer pendant quelle décennie Klaus Barbie a été con-
9
Deep Blue ou Deeper Blue ? Deep Blue a en fait connu plusieurs versions et celle qui a gagné était dénommé Deeper Blue.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 45 / 160
damné. OK, ce n’est probablement pas un problème de compréhension mais plutôt de
bases de connaissances utilisées ! Il ne sait pas indiquer sur quelle place de Dallas
(Dealey Plaza) JFK a été assassiné. La littérature sur le sujet est pourtant abondante
aux USA. Il ne sait pas non plus ce qu’est la vermiphobia (la phobie des vers) ni la
ailuraphobia (phobie des chats) dont la signification est disponible sur Wikipedia.
Mais la reconnaissance vocale est peut-être défaillante sur ces termes peu usités.
Il ne sait pas non plus identifier des recettes de cuisine en fonction de leurs compo-
santes. C’est plutôt décevant. Un peu comme les systèmes de reconnaissance de la
parole qui marchotent en situation difficile. Watson a du mal à répondre à des ques-
tions formulées avec peu de mots et comprenant des ambiguïtés ou des doubles sens.
Watson ne devait pas non plus accéder à des sources d’information suffisamment
larges, et en particulier étrangères. Pourtant, il s’agissait tout de même de 200 mil-
lions de pages de données structurées et non structurées représentant un total de 4 To.
Mais j’ai lu quelque part que dans Jeopardy, les questions n’étaient pas interprétées
par Watson par reconnaissance de la parole mais pas saisie humaine. Ce qui induisait
potentiellement une source d’erreur externe à Watson.
Pendant la première moitié de la partie, Watson est en retard par rapport à ses deux
concurrents. Il commence à battre ses concurrents à partir d’une série de questions
visant à déterminer quelle capitale est la plus au nord parmi deux villes. Comme les
candidats américains ont l’air d’être nuls en géographie (moi, m’sieu, je savais…), ils
ne répondent à aucune de ces questions alors que Watson a une belle base de donnée
en mémoire avec les villes et leurs coordonnées géographiques. Dans les questions
qui suivent, Jeopardy prend le dessus. On se demande si l’impact psychologique de la
remontée de Jeopardy avec les questions sur la géographie joue un rôle. Cette partie
méconnue dure moins de 15 minutes en tout. L’un des deux joueurs a empoché
$28000 et Watson, $31999. Ils sont au coude à coude.
Il a fallu du temps pour aboutir à ces performances de Watson ! Plusieurs parties
d’essais avaient été perdues par Watson avant l’épisode historique de 2011. IBM in-
dique que Watson s’est amélioré au gré des parties, mais il est difficile de faire la part
des choses entre les évolutions logicielles, un éventuel auto-apprentissage et la four-
niture de nouvelles sources de données.
En tout cas, le champion de Jeopardy Ken Jennings témoignait en février 2013 dans
TEDxSeattle de cette douloureuse impression de devenir obsolète. A vrai dire, il ne
l’est toujours pas.
Cinq ans après, le jeu Jeopardy est toujours diffusé sur la TV US et depuis 1964, un
record ! De quoi relativiser les prévisions alarmistes sur l’obsolescence des métiers !
Même si joueur de Jeopardy n’est pas à proprement parler un métier.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 46 / 160
Cette histoire de Jeopardy est un peu enjolivée et construite par la communication
d’IBM qui au passage, a été pilotée à l’échelle mondiale par l’agence Ogilvy. La per-
formance n’est pas si impressionnante que cela. J’aurais été bluffé si Watson avait
essayé de répondre à toutes les questions et écrasé ses concurrents à plates-coutures.
Cela montre la difficulté d’accéder à des informations faiblement structurées, même
si tout est disponible sur Internet. Watson chargeait toute sa base de données interne
en RAM et ne tapait pas en temps réel dans Internet ou dans un moteur de recherche
pour des raisons de rapidité, d’où ses limites. Qui plus est, il semble que les questions
étaient saisies au clavier par des opérateurs, et non pas traitées par reconnaissance
vocale.
A priori cependant, les limitations rencontrées pendant la partie de 2011 ont pu être
levées depuis. Ce n’est qu’une question de moyens. Il faudrait probablement organi-
ser une partie “retour” où Watson répondrait (juste) à 100% des questions ! Et trouver
des figurants pour le contrer ! Watson fait ce que Google Search devrait peut-être
faire un jour, en allant plus loin que ses habituelles méthodes statistiques. Seulement
voilà, Watson n’est pas aussi scalable que l’architecture de Google Search ! Pour
l’instant. Sinon, Google mettrait probablement en œuvre des méthodes voisines de
celles de Watson dans son moteur de recherche. Il en maîtrise très bien les compo-
santes technologiques.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 47 / 160
Watson était au départ un projet de recherche baptisé BlueJay (2007) focalisé sur
l’exploitation de gros volumes de données non structurées. Il s’intégrait dans la vo-
lonté d’IBM Research de s’attaquer à un grand défi, comme passer le fameux test de
Turing, ou en dialoguant avec une machine, on ne sait pas distinguer l’homme de la
machine. Watson était d’abord présenté comme un ordinateur. Il s’appuie sur une ar-
chitecture massivement parallèle à base 750 serveurs utilisant des processeurs Po-
wer7 octo-cœurs tournant à 3,5 GHz totalisant 16 To de RAM. Cette fameuse RAM
chargeant tout le corpus de contenus utilisé pour Jeopardy.
Watson est devenu une plate-forme logicielle, respectant en cela les canons de la ré-
ussite dans le numérique. Elle est proposée aux développeurs sous forme d’APIs en
cloud. L’histoire est bien racontée ici. Dans la pratique, Watson s’appuie principa-
lement sur la solution DeepQA d’IBM et le framework Apache UIMA (Unstructured
Information Management Architecture) qui permet d’exploiter des données non struc-
turées.
Notons que la communication d’IBM est en tout cas très focalisée sur le cognitive
computing et que Watson est le produit d’appel phare. C’était le seul sujet de
l’intervention en keynote de Ginni Rometty au CES de Las Vegas de janvier 2016.
IBM organise aussi chaque année une grande conférence “World of Watson” dont la
dernière édition avait lieu à New York du 23 au 24 mai 201610.
10
Les vidéos des keynotes de l’édition de mai 2015 sont disponibles pour la première et la seconde journée.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 48 / 160
IBM a annoncé investir plus de $1B sur le Cognitive Computing, un peu comme il
avait annoncé au début des années 2000 investir la même somme sur le développe-
ment de Linux. C’est donc un beau pari marketing et business qu’IBM fait ici. Et
c’est plutôt bien vu car une bonne part du futur des solutions numériques va utiliser
les techniques de l’IA. Il faut toujours se positionner sur un futur pas trop lointain
pour éviter de rater les trains de la technologie qui passent !
Fredrik Stenbeck a bien décrypté début mars 2016 ce que contient IBM Watson. Il
est proposé aux développeurs de solutions sous la forme d’APIs REST11 qui permet-
tent d’accéder à la panoplie de services suivants :
Document Conversion, un service qui permet de convertir tout document textuel
(PDF, Word, HTML) pour les faire ingérer par les services de Watson. C’est
l’alimentation de la base de connaissances.
Le Natural Language Classifier qui permet de classifier automatiquement des
données textuelles, issues en général de questions posées par des clients en lan-
gage naturel.
Dialog, un outil qui permet de gérer des conversations scriptées pour des agents
conversationnels, avec des arbres de décision. Ce genre d’outil est mis en œuvre
depuis des années dans les systèmes de chat des sites de commerce en ligne. Les
dialogues générés sont limités car préprogrammés. Voici un exemple de code et le
résultat associé :
Retrieve and Rank, un service qui s’appuie sur le logiciel open source Apache
Solr et qui permet de traiter les requêtes et questions en s’appuyant sur un mix de
moteur de recherche et de machine learning.
Créer une application Watson revient donc à créer du code, du contenu et à réaliser
un travail d’intégration pour créer un agent conversationnel intelligent. Dans des ap-
11
Avec requêtes http comprenant des GET et des POST et renvoyant le résultat.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 49 / 160
proches verticales, il faut définir des scénarios de dialogues assez précis et avoir sous
la main beaucoup de données exploitables, aussi bien structurées que non structurées.
D’où l’importance pour IBM d’avoir un écosystème de partenaires solutions à même
de couvrir les besoins de divers marchés verticaux. Pour ce faire, IBM a lancé un
programme partenaire assez classique qui comprend l’accès aux APIs, à une commu-
nauté, un programme d’accélération de trois mois et un catalogue de solutions pour
promouvoir les partenaires. A ce jour, l’écosystème d’IBM Watson comprend envi-
ron 400 sociétés. Le programme d’accélération porte surtout sur l’accompagnement
technique mais donne aussi l’opportunité de pitcher son offre pour récupérer un part
du fonds d’investissement de $100m créé pour l’occasion.
En plus de son écosystème, IBM développe l’activité de services pour prendre en
main de bout en bout les projets de ses grands clients. Alors que l’équipe d’origine de
Watson ne faisait que quelques personnes, elle comprend maintenant 2000 personnes
ans le monde, principalement des consultants, avant-vente et développeurs. Y com-
pris, un centre d’avant-vente et de support situé à Montpellier.
L’ensemble est intégré dans les “IBM Cognitive Business Solutions” avec un focus
sur quelques marchés clés : l’assurance, le retail et la santé. Ces 2000 personnes sont
un bon début mais encore peu au regard des 270 000 collaborateurs d’IBM Services
(c’est une estimation au doigt mouillé). La migration d’IBM vers un business “cogni-
tif” suffisamment différentié des autres sociétés de services globales dans le monde
est une course contre la montre. Et ces dernières ne se laisseront probablement pas
faire, même si elles auront probablement quelque temps de retard à l’allumage.
Quid du prix de Watson ? Il serait fourni à coup de licence logicielle d’un prix supé-
rieur au million de dollars, mais avec un tarif plus proche de ceux du cloud pour les
partenaires. IBM prévoit de générer $10B de CA grâce à Watson d’ici une dizaine
d’années. Ce qui ferait plus de 12% de son CA actuel.
Reste à savoir comment se positionne IBM par rapport à l’éventail de solutions du
marché. L’impression est donnée d’un spectre fonctionnel assez limité et focalisé sur
la création d’agents conversationnels. Les offres ne sont pas applicables au traitement
de l’image ni à la robotique. C’est accentué par le fait qu’IBM ne communique pas
dans le détail l’architecture des briques technologiques logicielles que contient Wat-
son. Ou alors, on y trouve des briques logicielles intégrées dans l’offre de manière un
peu rapide comme les Watson Analytics qui permettent par exemple de segmenter
automatiquement une audience client en fonction de ses comportements et
d’identifier ceux des segments susceptibles de générer du “churn” (perte de clients).
Avec leur approche service et intégration, IBM pourra cependant toujours affirmer
qu’il sait intégrer les autres briques du marché. Bref, Watson est, en l’état, un objet
difficile à benchmarker avec sa concurrence !
Quand on observe le marketing et les études de cas avancées par IBM, les mêmes ont
tendance à revenir systématiquement, notamment le système expert d’aide au dia-
gnostic et de prescription pour le traitement de cancers. Leur montée en puissance
commerciale est difficile à évaluer.
Les projets doivent être longs à closer et à mener avec les grandes entreprises surtout
si elles doivent mettre de l’ordre dans leurs données, comme ce fut le cas avec les
projets de systèmes experts dans les années 1980. Ils ont probablement également des
clients dans les secteurs militaires et du renseignement US qui ne donnent pas lieu à
de la communication marketing. Finalement, les références sont maintenant bien plus
nombreuses avec les partenaires éditeurs de logiciels qu’avec IBM en direct.
Voyons donc ce qu’IBM a dans sa besace de références clients et partenaires, par
segment de marché.
Santé
La solution Watson for Oncology a été créé initialement en partenariat avec
l’assureur santé Anthem (anciennement WellPoint) et le Memorial Sloan Kettering
Cancer Center (MSK) de New York, qui associe un hôpital et un centre de recherche.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 51 / 160
Elle a ensuite été déployée dans plus d’une quinzaine d’établissements aux USA et
ailleurs dans le monde comme en Inde. Elle est fournie sous forme de service en
cloud, avec un abonnement dont le prix n’a pas été rendu public par IBM.
La solution analyse les dossiers de patients atteints de tumeurs cancéreuses, y com-
pris le séquençage d’ADN des tumeurs12, aide au diagnostic, détermine des traite-
ments possibles et évalue leur efficacité relative. Il aide notamment à optimiser
l’usage de la chirurgie, de la radiothérapie et de la chimiothérapie. Les cancers sont
des pathologies idéales pour Watson car elles sont plurifactorielles. Mais ce n’est pas
(encore) de la médecine préventive.
Les études scientifiques publiées sont très nombreuses et toujours fournies avec des
résultats statistiques sur des cohortes de patients. Il faut les croiser avec des logiques
statistiques bayésiennes et cognitives complexes pour en tirer des conclusions. On
connait par exemple le lien entre les mutations des gênes BCRA1 et BCRA2 et les
cancers du sein.
Des données statistiques peuvent exister qui font le lien entre type de thérapies et
types de mutation de ces gênes. On est ici dans le domaine du big data non structuré
contrairement au big data dans le marketing qui est basé sur des données bien plus
structurées en général (logs Internet, données d’achats ou de consommation, bases de
données relationnelles, etc). Il semble que cette partie de la solution ait été dévelop-
pée en partenariat avec Cleveland Clinic.
12
Semble-t-il, et non pas un simple génotypage, mais on peut aussi séquencer l’ARN qui évalue l’expression des gênes dans les
tumeurs.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 52 / 160
Watson utilise des sources d’informations variées pour faire son diagnostic, et il
pioche notamment dans les 44 000 nouvelles publications scientifiques annuelles sur
le cancer. Les articles ne sont pas toujours faciles à exploiter : autant le texte relati-
vement facile à analyser, autant les illustrations qui ne sont pas fournies sous format
structurées comme dans l’exemple ci-dessous, ne doivent pas être facilement exploi-
tables. Or elles fournissent des données critiques, exploitables statistiquement, à sup-
poser que Watson puisse comprendre leur signification.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 53 / 160
L’exploitation de la littérature scientifique ne doit donc pas être bien évidente à ce
niveau. Par contre, elle est peut-être plus aisée pour les études liées aux AMM (auto-
risations de mise sur le marché) et autres études épidémiologiques.
Watson fournit au praticien un choix de traitements qui sont fournis avec un indice de
confiance, comme la probabilité de survie. Après avoir démarré avec les cancers du
poumon, les cancers couverts intègrent maintenant les leucémies, les mélanomes,
ceux du pancréas, des ovaires, du cerveau, du sein et du colon.
Dans cette application, Watson bat l’homme dans la force brute : il compulse notam-
ment des bases de données de recherche en oncologie pour aider les cancérologues.
Mais d’où viennent ces données ? Fait-il progresser la recherche ? Indirectement oui
car il va alimenter ces bases de données qu’il utilise avec des résultats de traitement
saisis par les praticiens.
Par contre, il ne fait pas directement progresser la recherche sur les cancers. Il ne faut
pas oublier que chacun des articles scientifiques exploité a nécessité de 3 à 7 années
de recherche par plusieurs chercheurs ! C’est un travail considérable. Watson utilise
les résultats de la recherche existante, recherche qui s’appuie sur des expériences (in-
vitro et in-vivo, que l’on ne sait pas encore simuler numériquement) et les résultats
statistiques associés. Bref, on a encore besoin de chercheurs ! Pour automatiser ce
processus, il faudra passer par plusieurs stades d’évolution de l’IA : ajouter la dimen-
sion créative et conceptuelle, automatiser des tests in-vitro et in-vivo avec des robots
et en dernier lieu, bien plus tard, réaliser ces tests in-silico quand les algorithmes et la
puissance de calcul le permettront.
Dans les applications santé de Watson, on peut aussi citer l’application
de GenieMD qui permet aux patients, aux USA, de faire un premier niveau
d’autodiagnostic de problèmes de santé courants et d’être ensuite mis en relation avec
des praticiens. Il permet aussi de suivre l’observance de la prise de médicaments. La
solution exploite les informations fournies par les patients en langage naturel. C’est
une application générique qui pourrait être mise en oeuvre dans les stations de télé-
médecine pour les déserts médicaux.
En 2014, le Baylor College of Medicine a créé son application KnIT (Knowledge
Integration Toolkit) à base de Watson pour identifier des therapies contre le cancer.
Précisément, elle analysait la littérature scientifique pour suggérer six protéines ki-
nases capables de contrôler le fonctionnement de la protéine p53 qui jouerait un rôle
dans le développement d’environ la moitié des cancers. En 30 ans, selon IBM, moins
d’une trentaine de nouvelles protéines auraient été découvertes. Ce qui mériterait
d’être vérifié!
Enfin, au CES 2016, IBM présentait avec l’équipementier médical Medtronic une
autre solution utilisant Watson pour prédire la survenue d’hypoglycémies des diabé-
tiques de type 1. Les données exploitées étaient visiblement moins massives que
celles de l’application sur les cancers. L’hypoglycémie est générée par une boucle de
rétro-action plus simple qui associe l’activité physique, la prise d’insuline et
l’alimentation.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 54 / 160
Il faut donc mesurer les trois ce qui n’est pas trop compliqué pour les deux première
mais moins évidente pour la dernière, même avec les capteurs de type Scio. Cepen-
dant, l’application est probablement pertinente pour ceux des diabétiques qui prati-
quent un sport intensif et pour lesquels les risques d’hypoglycémie sont importants et
répétés.
Distribution
Dans le retail, IBM propose une solution d’analyse des données clients et de sources
diverses pour anticiper les besoins du marché et adapter les inventaires et les straté-
gies de tarification.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 55 / 160
IBM propose aussi un Personal Shopper été réalisé en partenariat Fluid. Le premier
client est la chaîne de distribution de vêtements sportifs North Face. Il s’agit là en-
core d’un agent conversationnel utilisable via le service en ligne du site marchand. Le
corpus de données utilisé exploite tout le catalogue du site ainsi que les différents cri-
tères de choix des vêtements. Le dialogue proposé est très “scripté”. Son arbores-
cence semble limitée. Le système a été présenté au Big Show 2016 de la National Re-
tail Foundation à New York13.
L’éditeur de logiciel américain Red Ant a aussi développé une solution de formation
des commerciaux, SellSmart, qui accède au CRM de l’enseigne utilisatrice (vidéo).
Juridique
Le secteur juridique exploite de très gros volumes de données qualitatives : les lois et
réglementations dans chaque pays, la jurisprudence des tribunaux et la littérature qui
les commente. C’est un secteur qui fait appel comme la médecine à des praticiens qui
doivent mémoriser de grandes quantités de textes. Watson arrive à point nommé pour
les aider à piocher dans l’immensité du savoir de leur profession. Toujours pour les
assister plus que pour les remplacer, sauf peut-être pour les tâches les plus élémen-
taires.
De nombreuses solutions juridiques sont déjà bâties sur Watson, surtout aux USA.
Nous avions eu l’occasion d’en décrire certaines dans Les disruptions numériques
dans les professions libérales en février 2016.
On compte notamment LegalZoom, un service d’avocat en ligne couvrant à la fois le
droit des affaires et le droit civil14 et l’avocat virtuel de la start-up Ross Intelligence,
un agent conversationnel capable de répondre à un éventail varié de questions juri-
diques, adopté en mai 2016 par le cabinet d’avocats américain Baker Hostetler.
Le débat reste évidemment ouvert dans les professions juridiques pour évaluer la por-
tée des solutions construites sur Watson et l’impact qu’il aura sur les métiers. Comme
d’habitude, c’est la partie de ces métiers qui est la plus commoditisée et répétable qui
sera automatisée en premier. Pour la partie qui relève plus de la dimension humaine,
comme dans pénale, on aura encore besoin d’avocats pendant pas mal de temps. Et
heureusement, si l’on parle d’automatiser une partie du travail des avocats, on ne
l’évoque pas encore pour ce qui est des juges ! Un scénario avocat-IA contre juge-IA
serait en tout cas intéressant à tester !
Divers
Watson a aussi fait son apparition sporadique dans divers marchés :
Dans les assurances, avec Insurance Assistant de l’USAA (United Services Auto-
mobile Association), un agent conversationnel qui permet aux clients de cette assu-
rance dédiée au personnel militaire US de s’y retrouver dans ses offres et services.
13
Pour en savoir plus voir ce compte-rendu détaillé sur le JDN : Comment The North Face a appliqué Watson à l’expérience
d’achat.
14
Voir ce numéro de The American Lawyer qui en parle bien.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 56 / 160
Dans les objets connectés, avec l’ouverture d’un centre de recherche dédié à l’IOT
et Watson à Munich.
Dans les voyages avec la solution Cognintive Travel de la start-up WayBlazer qui
est une sorte de concierge numérique commercialisé aux professionnels du tourisme.
Une solution équivalente est proposée parGoMoment.
Thomson Reuters qui automatise la production d’études de marché. Peut-être sau-
ront-ils générer d’autres courbes que les droits dans leurs prédictions et adopter les
exponentielles et les gaussiennes !
Le spécialiste de l’équipement des centres d’appels Genesys va utiliser Watson pour
améliorer ses services en analysant le flot de data généré par les appels clients.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 57 / 160
met en tout cas de détecter l’humeur de l’auteur, comme sa tristesse. On voit bien
Facebook, voir Périscope, utiliser ce genre de solution pour prévenir des suicides !
Gouvernements
Des études de cas de Watson dans la sécurité doivent bien exister sans être documen-
tées, même si l’offre d’IBM n’est pas forcément ce que l’on peut trouver de mieux
pour ces besoins particuliers.
On peut noter la campagne Watson for president qui vise, un peu à la manière de
Coluche en 1980, de faire élire Watson comme nouveau président américain en 2016.
En indiquant que cela permettrait à la Maison Blanche de prendre des décisions ra-
tionnelles. C’est confondre un peu rapidement l’outil de la prise de décision (POTUS)
et l’outil d’aide à la prise de décision (Watson et/ou le staff du Président et son admi-
nistration). Un président fait déjà appel à de nombreux experts pour prendre ses déci-
sions, en particulier dans la diplomatie, les négociations internationales et le pilotage
du bras armé des USA. Il a aussi besoin de pas mal d’aide et de tacticiens pour faire
voter des lois par le congrès qui est souvent récalcitrant, même lorsqu’il est du même
bord que lui. On l’a vu pour l’Affordable Care Act (Obamacare) lors du premier
mandat de Barack Obama.
Il faut aussi tenir compte de la connaissance de l’Histoire qui influe sur les décisions
des politiques. Le cerveau fonctionne très souvent par analogies. L’IA et Watson
n’utilisent pas encore massivement le raisonnement par analogies. Il répond surtout
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 58 / 160
en fouillant dans de vastes dépôts de connaissances et pour croiser quelques informa-
tions structurées.
Pourrait-il répondre : si tu envahis tel pays dans telle et telle circonstance, voici ce
qui a le plus de chances de se produire en suivant les leçons de l’histoire connue ?
Voici ce qui permettrait d’éviter le pire ? On apprend souvent du passé pour
(mieux ?) décider du futur. Mais de nouveaux éléments complexifient la donne. Par
exemple, doit-on faire une analogie entre la montée du FN et des populismes dans le
monde et la situation des années 1930 et d’avant seconde guerre mondiale ? Qu’est-
ce qui est similaire et qu’est-ce qui est différent ? Comment anticiper la dimension
émotionnelle qui fait bouger un peuple ? Quand est-ce que le peuple est au bord
d’une révolte ? Comment l’anticiper ?
Autre difficulté à surmonter pour l’IA, mais pas insurmontable : comment tenir
compte d’un adversaire qui agit de manière non rationnelle ? La plupart des algo-
rithmes d’IA sont conçus de manière rationnelle ! Exemple : comment réagir quand
l’une des parties agit de manière irrationnelle, tel un Saddam Hussein en 1990/1991,
voir quand les deux parties sont irrationnelles avec ce même Saddam Hussein et
Georges W. Bush en 2003 ?
Je m’étais aussi demandé en 2013, pour les 50 ans de l’assassinat de JFK, si un sys-
tème de type Watson ne pourrait pas analyser toute la littérature sur le sujet et pondre
une synthèse voire résoudre l’énigme qui est bien plus complexe qu’une
simple théorie du complot style 9/11. L’analyse des faits et mystères de l’histoire
pourrait probablement gagner de ce genre de système. Mais l’intérêt économique de
la chose est plutôt marginal !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 59 / 160
En fait, Savvy est un plugin pour Excel qui traduit en texte compréhensible les don-
nées d’un graphe. Avec la vidéo de démo, on n’est pas plus avancé pour identifier les
morceaux de fruits du yaourt d’IA du logiciel ! Il y a probablement un bon savoir
faire derrière ce logiciel mais son label “IA” est des plus vague ! Cela donne un petit
côté magique et mystérieux au logiciel ce qui lui donne probablement une certaines
valeur, le sortant de la vase du logiciel de commodité.
J’ai pu obtenir une explication de la société sur le fonctionnement de son logiciel.
Seulement voilà, il est difficile à traduire en langage naturel (moteur d’inférence
d’ordre 2, …) ! Ca se complique sémantiquement quand des “algorithmes génétiques”
sont utilisés. Ca y est, on exploite l’ADN de l’utilisateur ? Que nenni ! Il s’agit
d’algorithmes de réseaux neuronaux qui combinent l’état de deux neurones pour con-
ditionner celui de la suivante dans la chaîne de traitement, comme dans la combinai-
son des chromosomes dans la reproduction sexuée du vivant !
Chez CrowdFlower, on enrichit vos données grâce au machine learning ! Soit. Idem
chez Sift Science qui lutte contre la fraude grâce encore au machine learning. On se
retrouve à observer un marketing utilisant des mots magiques et où machine learning
vient compléter l’arsenal du cloud et autre big data.
Chez Groupe361, on propose la solution Tanukis qui comprend “le premier disposi-
tif e-learning doté d’intelligence artificielle” qui ressemble à un agent conversation-
nel, ajustant le parcours pédagogique en fonction du comportement de l’élève.
Il faudra un jour inventer des niveaux d’IA ou de machine learning. Histoire de pou-
voir évaluer la taille des morceaux de fruits d’IA dans les yaourts à base d’IA ! Car le
client et commentateur moyen a bien du mal à caractériser les morceaux de fruits et
leur assemblage ainsi que les épaississants ! On peut aussi se demander si et quand
les médias spécialisés seront en mesure de benchmarker les logiciels intégrant de l’IA
dans leurs labos de tests.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 60 / 160
Startups US de l’intelligence artificielle
Je vais essayer ici de segmenter ce marché, d’en identifier les tendances et lignes de
force, de voir comment il se structure (verticalement, horizontalement) et comment il
s’organise entre produits, données et services. Je vais aussi essayer d’identifier ce qui
est rare dans ce marché.
Certains spécialistes de l’IA m’ont à juste titre fait remarquer que l’IA en était encore
au stade artisanal et principalement de l’ordre du bricolage. Cela ne se voit évidem-
ment pas directement quand on fait le tour d’horizon des startups du secteur. Surtout
dans le mesure où la plupart d’entre elles sont “b-to-b” et diffusent leurs solution en
marque blanche. Vous les retrouverez éventuellement dans les agents conversation-
nels des sites web de marques, dans le ciblage marketing qui vous touche avec une
offre pertinente (ou pas du tout…), dans des robots capables de dialoguer plus ou
moins avec vous, ou dans les aides à la conduite dans votre voiture haut de gamme
semi-automatique.
L’un des moyens de se rendre compte indirectement de cet aspect artisanal consiste à
d’évaluer la part produit et la part service des entreprises du secteur. Plus la part du
produit est faible, plus on est dans le domaine de l’artisanal. Cela n’apparait pas dans
les données publiques mais peut au moins d’obtenir quand on a l’occasion d’observer
à la loupe ces entreprises : dans le cadre d’une relation grand compte/startup, d’un
investissement ou même d’un recrutement. On peut l’observer également dans les
profils LinkedIn des salariés de l’entreprise s’ils sont disponibles. Bref en utilisant ce
que l’on appelle des sources d’information “ouvertes”.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 61 / 160
On constate une évolution à la hausse du financement des startups de ces secteurs. De
2009 à 2015, c’est une évolution constante, avec une courbe en cloche atteignant vi-
siblement son pic en 2015.
Mais cette évolution a marqué de très nombreux secteurs d’activité comme les Fin-
techs, le retail, ou le e-commerce. L’IA n’est pas encore une priorité nette des VCs
qui mettent encore le paquet sur des secteurs traditionnels. Nous avons ici $1,2B
d’investissements dans l’IA pour $59B en 2015, en tout rien qu’aux USA !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 62 / 160
L’ancienneté des startups de ce secteur est plutôt grande avec un bel étalement sur la
date de création. Il y a certes un pic entre 2010 et 2012 mais un gros volume de star-
tups créées entre 2006 et 2010. Elles sont encore là car elles doivent probablement
cibler des marchés d’entreprises. Les investisseurs ont tendance à financer des star-
tups plutôt matures dans ce secteur. Les startups les plus anciennes de l’IA sont celles
de la reconnaissance de la parole et de la vidéo, qui ont respectivement 8 et 6,5 ans
d’ancienneté.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 63 / 160
Les solutions sont très souvent proposées sous la forme d’APIs en cloud mais les
approches plateformes sont encore en devenir et balbusentienttiantes car elles ne
bénéficient pas d’un effet push/pull courant dans le grand public (la demande pour
des smartphones Android entrainant celles d’applications tournant dessus).
Les levées de fonds sont encore relativement modestes dans l’ensemble. On dé-
passe dans de rares cas les $100m. Ce n’est pas beaucoup par rapport à plus de
$1B réalisées par des licornes telles que Pinterest, où l’intensité technologique est
plus faible. Les licornes sont presque toutes des startups grand public.
Le secteur donne lieu à de nombreuses acquisitions mais Google n’a pas acquis
tout ce qui était intéressant ! Autant on sait que Google a bien ratissé le secteur par
de nombreuses acquisitions telles que celle de DeepMind (UK) en 2014, autant on
peut constater que nombreuses aussi sont les startups créées par d’anciens de
Google et notamment des Google Labs.
On retrouve aussi beaucoup d’anciens de l’université de Stanford et du MIT dans
les startups de l’IA, généralement bardés d’un ou de plusieurs PhD en IA.
Dans ce qui va suivre, je vais indiquer la date de création des startups ainsi que les
montants levés entre parenthèses lorsqu’ils sont disponibles. Même si les montants
levés ne sont pas une indication suffisante de succès, elles montrent que la société a
au moins attiré le regard et l’argent d’investisseurs. Les financements qui dépassent
les $20m indiquent une “traction” qui peut avoir un impact mondial assez rapidement.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 64 / 160
Hawkins pense que le cerveau est principalement une machine prédictive qui n’est
pas forcément dotée d’une capacité de calcul parallèle intensive mais plutôt d’une
mémoire associative rapidement accessible. Il insiste sur l’importance du temps dans
les mécanismes de rétropropagation mise en œuvre dans les réseaux neuronaux uni-
quement dans les phases d’apprentissage. Alors que le cerveau bénéficie d’une mise à
jour sensorielle permanente.
Les thèses de Hawkins sont intéressantes et constituaient un pot-pourri des connais-
sances en neurosciences il y a plus de 10 ans maintenant. Elles sont évidemment con-
sidérées comme un peu simplistes (voir ces critiques chez Jeff Kramer, Ben Goert-
zel et sur Quora).
J’ajouterai à ces critiques que Hawkins oublie négligemment le rôle du cervelet et du
cerveau limbique dans les apprentissages et le prédictif. Le cervelet contient plus de
neurones que le cortex et il gère une bonne part des automatismes et mécanismes
prédictifs, notamment moteurs.
Numenta propose aussi NuPIC (Numenta Platform for Intelligent Computing) sous la
forme d’un projet open source. Cette société est très intéressante dans le lot car elle
utilise une approche technique plutôt originale qui dépasse les classiques réseaux
neuronaux.
Sentient Technologies (2007, $135m, dernier tour de financement en 2014) déve-
loppe pour sa part une solution d’IA massivement distribuable sur des millions de
CPUs, visant les marchés de la santé, de la détection de fraudes et du du e-commerce.
La société dit employer des méthodes d’IA avancées pour détecter des tendances
dans les données. C’est du “big data” revisité. Le système imite les processus biolo-
giques pour faire de l’auto-apprentissage. On trouve des morceaux de deep learning
et des agents intelligents dedans. Ces agents sont évalués avec des jeux de tests et les
meilleurs conservés tandis que les plus mauvais sont éliminés. Bref, c’est une sorte de
Skynet. L’un des fondateurs de la société est français, Antoine Blondeau, et basé à
Hong Kong.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 65 / 160
Digital Reasoning (2000, $52m, dernière levée en 2016) a été créée par des anciens
d’Oracle et de la CIA (entre autres provenances) et est financée par In-Q-Tel, le fonds
d’investissement de cette dernière. Sa solution d’analyse de données est utilisée par le
renseignement et la défense US ainsi que dans la finance. Comme celle de Skymind,
sa solution Synthesys est en Java et ouverte. Elle permet d’analyser des données
structurées et non structurées, y compris des conversations téléphoniques. Elle sert à
détecter des comportements anormaux dans les communications électroniques. C’est
donc un outil utilisé par la NSA dans la gestion de ses interceptions (PRISM & co).
Metamind (2014, $14m) fait de la classification automatique d’images et de textes,
un peu comme ce que propose IBM Watson pour la partie texte. Elle a été créé par
une équipe d’anciens de Stanford.
Scaled Inference (2014, $13,6m) propose une plateforme de machine learning en
cloud via des APIs. Elle comprend de la reconnaissance de formes, des détectons
d’anomalies, des algorithmes de prédiction. Startup créé par un ancien de Google.
Solution pas encore disponible.
Skymind (2014, NC) a été créée par des anciens de Vicarious. Elle propose une solu-
tion open source en Java – Deeplearning4j.org – capable d’analyser des flux de don-
nées. Elle est notamment utilisée dans la détection de fraude, le commerce et le CRM.
BigMl (2011, $1,63m) a l’air d’être un outil d’analyse assez générique qui analyse les
comportements clients, permet du diagnostic de matériel, dans la santé, dans les
risques pour des prêts. L’ensemble s’utilise via des APIs attaquant un service en
cloud. Au moins, leur site fournit des exemples de traitement de jeux de données
comme ce modèle prédictif de succès de campagne de financement participatif sur
Kickstarter en fonction de leurs différentes caractéristiques. Intéressant !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 66 / 160
Cycorp (1994, NC) est une sorte de laboratoire de recherche privé en IA financé par
des contrats du gouvernement US, dont la DARPA, et d’entreprises privées. Le projet
de recherche Cyc dont il est issu a plus de 30 ans au compteur ! Il vise à modéliser les
connaissances et à permettre d’automatiser la recherche scientifique. Il propose une
suite d’outils en open source et licence commerciale permettant d’exploiter des dic-
tionnaires, ontologies et bases de connaissances pour répondre à des questions
d’analystes.
Ayadsi (2008, $98m) interprète aussi de gros volumes de données pour y identifier
des signaux faibles pertinents. Le projet a démarré à Stanford et avec des finance-
ments de la DARPA et de la NSF, l’équivalent américain de l’Agence Nationale de la
Recherche française.
Narrative Science (2010, $29,4m) propose Quill, une plateforme qui analyse les
données structurées et non structurées issues de sources diverses pour en extraire ce
qui est important et en produire des résumés automatiquement. La solution permet
notamment d’exploiter les données issues de Google Analytics ou d’historique de
transactions financières (ci-dessous). Startup créée par un ancien de Google et de
Carnegie Mellon.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 67 / 160
Synapsify (2012, $1,45m) a créé CORE, un outil d’analyse et de traitement en lan-
gage naturel qui fait de la recommandation de contenus.
Idibon (2012, $6,9m) analyse les textes structurés, notamment issus des réseaux so-
ciaux, pour les classifier automatiquement et réaliser des analyses statistiques dessus.
Workfusion (2010, $36,3m) propose une solution en cloud d’orchestration et de con-
solidation de données pour les entreprises. Elle s’appuie sur de l’apprentissage super-
visé d’outils traitant de gros volumes de données par des travailleurs crowdsourcés,
dans divers métiers comme les services financiers, la comptabilité et le e-commerce.
Le projet est issu de travaux de recherche du MIT.
Nutonian (2011, $4m) propose une solution d’extraction de données intelligente, ca-
pable d’identifier des tendances cachées dans les données.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 68 / 160
méthode relève de la force brute au lieu d’exploiter la chimère du web sémantique qui
n’a pas vraiment vu le jour. Comme le web sémantique demandait un encodage spé-
cifique et structuré des données, peu de sites l’ont adopté et l’extraction de données
reste empirique. Le traitement même de ces données pour les interroger n’a pas l’air
de faire partie de leur arsenal.
Skytree (2012, $20,5m) propose une autre solution de moteur de prédiction, Skyree
Infinity qui peut par exemple prédire le comportement des consommateurs et identi-
fier des segments d’acheteurs potentiels de produits précis. La startup propose
SkyTree Express en téléchargement gratuit pour analyser jusqu’à 100 millions
d’éléments. Ils sont financés par la CIA via son fonds d’investissement In-Q-Tel en
plus de Samsung.
Sentenai (2015, $1,8m) propose aussi une plateforme d’analyse prédictive, en cloud,
qui est notamment positionnée dans l’analyse de données issues d’objets connectés.
La startup, basée à Boston, a été créée par un ancien de TechStars Boston, Rohit
Gupta. La startup donne l’impression de ne pas avoir grand chose d’autre dans sa be-
sace que ses fondateurs et la capacité à recruter des développeurs sur la côte Est. Elle
est très early stage et n’a pas grand chose à raconter à ce stade.
Cette catégorie comprend de nombreux autres acteurs tels que Alteryx (2010,
$163m), Predixion Software(2009, $37m), RapidMiner (2007, $36m), Alpine Data
Labs (2011, $23m) et Lavastorm (1999, $10m).
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 69 / 160
Vicarious (2010, $72m) est spécialisé dans la reconnaissance et la classification
d’images. Ils se sont fait remarquer en étant capable d’interpréter des Captcha de
toutes sortes avec une efficacité de 90%.
Clarifai (2013, $72m) propose une API en cloud permettant d’accéder à leurs fonc-
tions de reconnaissance d’images.
Cortica (2007, $38m) extrait les attributs clés d’images fixes ou animées pour les
associer à des descriptifs textuels avec sa solution Image2Text. Elle est par exemple
capable de reconnaitre une marque et modèle de voiture dans une vidéo ou un animal
dans une photo (ci-dessous). Le tout est protégé par une centaine de brevets ! La so-
ciété est originaire d’Israël.
Superfish (2006, $19,3m) développe des moteurs de recherche d’images pour les
applications grand public.
Camio (2013) fournit une solution en cloud d’exploitation de vidéos de caméras de
surveillance.
Deepomatic (2014, $950K) utilise le deep learning pour interpréter le contenu, la
forme et la couleur d’images dans les médias et les associer à des publicités contex-
tuelles. C’est une startup française !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 70 / 160
Descartes Labs (2014, $8,28m) exploite via deep learning les données d’image satel-
lite pour y découvrir comment évolue la production agricole, le cadastre des villes ou
autres données géographiques.
En complément de ces startups, on trouve aussi des startups spécialisées dans le trai-
tement du langage. Là encore, tout n’est pas chez les GAFA ou chez Nuance. On peut
notamment citer DefinedCrowd (vidéo avec son ukulélé de circons-
tance), Weotta (2011) et MindMeld (2014).
Robots conversationnels
Les robots conversationnels ou “chat bots” sont très en vogue en ce moment. On les
retrouve dans de nombreuses startups ainsi que dans diverses offres de grandes entre-
prises du numérique (Facebook, Google, …).
Toutes visent à automatiser le service client en ligne dans les sites de e-commerce ou
autres, visant la réussite du fameux test de Turing qui définit une intelligence artifi-
cielle comme une intelligence indistinctible de celle de l’homme dans de telles dis-
cussions par le biais d’échanges textuels.
Dans les startups, on peut notamment citer…
Existor (1988) est une startup anglaise créatrice d’agents conversationnels comme
Cleverbot qui exploite la webcam des laptops pour interpréter les visages des utilisa-
teurs. Cleverbot utilise la puissance des GPU des ordinateurs et des mobiles. La so-
ciété propose aussi un avatar visuel pour mener ces conversations. J’ai fait quelques
tests et ce n’est pas très probant (ci-dessous). Et pour cause, les agents conversation-
nels sont souvent mise en oeuvre dans des univers très précis, comme l’offre d’une
société particulière.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 71 / 160
Msg.ai (2014, $2,7m) est une startup qui propose des chatbots pour les sites de vente
en ligne. Elle est notamment déployée chez Sony.
Niki.ai (NC) est une startup indienne qui, comme la précédente, propose des chatbots
pour les sites de vente en ligne, notamment dans les services (transports, voyage aé-
rien, santé).
ReplyYes (2015, $3,5m) est une autre startup américaine, de Seattle, qui propose
une solution de chatbots pour les sites de vente en ligne associant machine learning et
opérateurs humains. Ils ont deux spinoffs, l’une qui vend des disques vinyles (The
Edit) et l’autres, des BD (Origin Bound). The Edit aurait vendu $1m de vinyles en
huit mois.
Semantic Machines (2015, $12,38) est une startup de Boston et Berkeley qui pro-
pose des chatbots pouvant être intégré dans toutes sortes d’usages, b2b et b2c.
L’équipe fondatrice comprend des anciens de Siri et Google Now. La solution intègre
la reconnaissance et la synthèse de la parole.
Talla ($4m) propose une solution de chatbots pour les besoins des entreprises,
comme dans le recrutement, le marketing et la gestion de rendez-vous. Elle s’intègre
dans les systèmes de messagerie tels que Slack. Elle fait penser au français Julie Desk.
Chatfuel (2016, $120K) est une jeune startup américaine qui permet de créer ses
propres chatbots. Sa solution serait déployée chez Forbes, Techcrunch et dans la mes-
sagerie instantanée Telegram qui compte plus de 100 millions d’utilisateurs.
Pandorabots (2008), une startup d’Oakland (Californie) qui propose une plateforme
de chatbot en ligne, open source et multi-lingue. 385 000 chatbots ont été générés
avec (mai 2016). Ils sont intégrables dans divers environnements de messagerie ins-
tantanés tels que Slack et Whatsapp.
TARA (NC) est une startup de San Francisco qui propose un robot conversationnel
de gestion du recrutement de freelances.
Ces solutions de chatbots ne sont pas évidentes à départager. Elles reposent proba-
blement sur des techniques voisines et se distinguent parfois plus par les marchés vi-
sés que par leur performance absolue.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 72 / 160
Il existe même des prix récompensant les chatbots s’approchant le mieux du test de
Turing ou le passant entièrement : les Leobner Prizes, créés en 1990. S’il a bien été
attribué chaque année depuis dans sa première mouture, et notamment au créateur de
Cleverbot en 2005 et 2006, il ne l’a pas encore été dans la seconde, celle du passage
complet du test du Turing devant deux juges.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 73 / 160
Dans les services juridiques avec divers systèmes d’interrogation de bases de con-
naissances (Casetext, $8,8m, Judicata, $7,8m, et Ross Intelligence, qui s’appuie sur
IBM Watson). Il y a aussi Kira et Legal Robot.
Dans les universités pour les aider à recruter les meilleurs étudiants (Plexuss) ou, au
contraire, pour aider ces derniers à trouver la meilleure université (Admitster).
Dans la recherche scientifique : pour gérer une communauté mondiale de data scien-
tists (Kaggle, $12,75m), pour découvrir des étoiles selon leurs caractéristiques ().
Dans la sécurité informatique pour détecter les tentatives de phishing (GreatHorn,
$2,6m) ou avec Lookout (2007, $282m) qui sécurise les mobiles avec un modèle
prédictif.
Dans l’agriculture pour robotiser la culture et personnaliser le soin de chaque plan
(Blue River Technology, $30,35m). La société propose un système robotisé de cul-
ture de laitues contenant une bardée de capteurs, dont certains sont 3D, pour optimi-
ser l’entretien de laitues ou de plants de mais (ci-dessous).
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 74 / 160
Dans les contenus avec le canadien Landr ($10,4m) et son service en cloud pour
automatiser le mixage audio et créer des morceaux de musique agréables à l’écoute.
Il y a aussi Narrative Science (2010, $29,4m) qui est capable de rédiger tout seul des
textes à partir de données structurées et non structurées, utilisé notamment dans les
médias et le marketing.
15
Voir The human splicing code reveals new insights into the genetic determinants of disease qui explique les fondements scien-
tifiques de leur procédé.
16
Cf la vidéo de son CEO, Jeremy Howard à TEDx Bruxelles en décembre 2014. Il y aborde un point clé : il n’y a pas assez de
médecins dans le monde. L’automatisation des diagnostics est donc un impératif incontournable.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 75 / 160
Ginger.io (2011, $28,2m) a créé un outil de diagnostic et de prescription de traite-
ment pour diverses pathologies neuropsychologiques. Il exploite des applications
mobiles pour le diagnostic et du machine learning. La solution permet un auto-
traitement de certaines pathologies par les patients.
Lumiata (2013, $10m) est dans la même lignée un système d’analyse de situation de
patient permettant d’accélérer les diagnostics, notamment en milieu hospitalier.
MedWhat (2010, $560K) propose une solution générique d’aide au diagnostic qui
s’appuie sur la panoplie totale de l’IA (deep learning, machine learning, NLP). Elle
se matérialise sous la forme d’une application mobile faisant tourner un agent con-
versationnel à qui ont indique ses symptômes, qui pose des questions de qualification
et oriente ensuite le patient (vidéo de démo). Elle stocke aussi le dossier médical du
patient. La startup a été créée par des anciens de Stanford, mais cela ne semble pas
suffisant pour décoller !
Behold.ai (2015, $20K) a développé une solution d’analyse d’imagerie médicale
pour aide les radiologues à faire leur diagnostic. Cela s’appuie sur du machine lear-
ning. Le système compare les images de radiologie avec et sans pathologies pour dé-
tecter les zones à problèmes, comme les nodules et autres formes de lésions.
Cognitive Scale (2013) a créé la solution Cognitive Clouds. Elle est notamment pro-
posée aux adolescents atteints de diabète type 1 pour les aider à se réguler, en inté-
grant les aspects médicaux (prise d’insuline, suivi de glycémie), d’activité physique
et d’alimentation. Il y a des dizaines de startups qui visent le même marché et avec
plus ou moins de bonheur. Très souvent, elles méconnaissent le fonctionnement des
diabétiques dans la régulation de leur vie et leur segmentation.
atomwise (2012, $6,35m) utilise le machine learning pour découvrir de nouveaux
médicaments et vérifier leur non toxicité. Le principe consiste à simuler l’interaction
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 76 / 160
entre des milliers de médicaments connus et une pathologie telle qu’un virus, et
d’identifier celles qui pourraient avoir un effet par simulation des interactions molé-
culaires. Un premier résultat aurait été obtenu en 2015 sur un virus d’Ebola. La simu-
lation in-silico permet de choisir quelques médicaments qui sont ensuite testés in-
vitro avec des cellules humaines.
MedAware (2012, $1m) fournit une solution qui permet d’éviter les erreurs de pres-
cription médicamenteuse en temps réel pour les médecins. Avec des morceaux de big
data et de machine learning dedans qui exploite notamment des bases de données
médicales d’historiques de patients.
Hindsait (2013) propose une solution en cloud servant à identifier les déviations dans
les dépenses de santé. Cela sert donc surtout aux financeurs des systèmes de santé
que sont les assurances publiques, privées et les mutuelles. Ca fait moins rêver le pa-
tient !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 77 / 160
Startups acquises
par les grands du numérique
Google
L’actualité abonde depuis 2014 d’acquisitions médiatisées de startups de l’IA par ces
grands acteurs du numérique. Cela alimente quelques fantasmes sur leurs avancées
qui sont quelque peu enjolivées. Elles sont notamment focalisées sur Google qui au-
rait, selon les commentateurs, acquis tout ce qui existait de bien autour de l’IA.
C’est évidemment une vue de l’esprit. Oui, Google a fait bien plus d’acquisitions
dans le domaine de l’IA que les autres grands du numérique, mais rappelons-nous le
côté très artisanal de ce secteur. Ce n’est pas parce que vous achetez quelques verre-
ries de luxe que vous êtes le seul à savoir fabriquer des verres de luxe ! L’artisanat est
très souvent un marché très fragmenté. On peut le constater au regard des effectifs
des startups acquises. Ils sont en général très limités, comme ils l’étaient d’ailleurs
pour les acquisitions par Facebook de startups telles qu’Instagram, Whatsapp ou Ocu-
lus Rift, qui n’avaient par ailleurs aucun rapport avec l’IA.
L’acquisition la plus médiatisée de Google dans l’IA fut celle de
l’anglais DeepMind en 2014 pour un montant record dans ce secteur de $625m. Et
surtout, pour à peine une cinquantaine de personnes dont une douzaine de chercheurs
en machine learning. Ce qui fait le chercheur à $50m, un record comparativement aux
développeurs qui sont estimés à environ $1m à $2m pour des acquisitions de jeunes
startups. Ce qui est rare et cher. En 2014, une estimation portait à une cinquantaine
le nombre de chercheurs en machine learning dans le monde. A vrai dire, il y en avait
certainement beaucoup plus. On ne compte pas les PhD qui font ou ont fait de la re-
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 78 / 160
cherche en machine learning. Mais les “bons” sont probablement peu nombreux
comme dans toutes les disciplines de la recherche.
Google n’en était pas à son premier coup. Ils avaient auparavant mis la main sur la
société de reconnaissance vocale SayNow en 2011, qui se retrouve probablement
dans la commande OK Google sur mobiles Android. Puis sur Viewdle et
de PittPatt en 2012, qui faisaient tous les deux de la reconnaissance faciale et de
mouvements. Ensuite, en 2013, sur le spécialiste des réseaux neuro-
naux Dnnresearch, avec le canadien Geoff Hinton au passage, père du renouveau
des réseaux neuronaux, évoqué dans le second article de cette série.
Ont suivi Dark Blue Labs et Vision Factory, deux sociétés d’Oxford qui n’ont pas
levé de fonds. S’y ajoutèrent la solution de recommandation d’images JetPack, le
spécialiste de la traduction automatique Quest Visual, et celui de la reconnaissance
de mouvements Flutter qui a probablement enrichi l’offre logicielle de Dropcam,
une startup de caméras de surveillance qui est dans le giron de Nest, une filiale
d’Alphabet.
L’année 2014 a vu Google/Alphabet acquérir une palanquée de startups dans la robo-
tique avec Schaft (robot humanoïde et bras articulé, japonais), Industrial Percep-
tion (robots industriels, spécialisé dans la vision 3D), Redwood Robotics (bras robo-
tisés, issue du SRI et acquise un an après sa création), Meka Robotics (aussi dans les
bras robotisés, qui avait contribué à la création de Redwood Robo-
tics), Holomni (roues robotisées), Bot & Dolly (bras articulés à mouvements très
souples servant aux tournages de cinéma), Autofuss (encore des bras articulés) et sur-
tout Boston Dynamics, connu pour ses robots médiatisés doués de capacité de
marche à quatre puis deux pattes mais que Google est en train de céder.
Que deviennent toutes ces acquisitions ? Tout ce qui relève du traitement des images
et du langage s’est retrouvé dans les services de Google, notamment mobiles. La ro-
botique ? Elle a débouché sur peu d’applications commerciales pour l’instant car ces
technologies sont toujours en phase de gestation ou destinées à des marchés de niche.
Et Google ne cherche pas à concurrencer les leaders de robots industriels (ABB,
Fanuc, etc).
Google fait des progrès réguliers dans le traitement des images, comme
avec PlaNet qui identifie à quel endroit ont été prises des photos d’extérieur ou pour
compter les calories dans des photos de plats. Google utilise aussi beaucoup d’IA
sensorielle pour faire évoluer les fonctions de conduite automatique de ses Google
Car.
L’IA googlelienne a connu un sursaut de médiatisation avec la victoire de la solution
AlphaGo construite par une équipe d’une vingtaine de personnes de sa filiale Deep-
Mind au jeu de Go contre le champion du monde Sud-Coréen (vidéo de la première
partie). AlphaGo avait déjà battu le champion européen, Fan Jui, en octobre 2015.
Ces victoires ont été présentées comme des étapes importantes des progrès de l’IA,
faisant écho à la victoire de Deeper Blue aux échecs contre Gary Kasparov en 1997.
La différence ? Le jeu de Go est plus difficile à simuler car la combinatoire de jeu est
bien plus grande qu’aux échecs. AlphaGo ne peut pas compter que sur la force brute.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 79 / 160
Il doit combiner plusieurs méthodes pour être efficace : éliminer des options de jeu
inutiles via le “Monte Carlo Tree Search” (représenté graphiquement ci-dessus) ou
MCTS et exploiter une base de jeux permettant d’identifier des tactiques gagnantes.
A ce jeu-là, cependant, AlphaGo ne gagne pas systématiquement. Mais c’est une
bonne pub pour DeepMind dont les solutions de machine learning ont d’autres appli-
cations comme la curation de médias ou la santé. La performance a été documentée
dans un article publié dans la revue Nature en janvier 2016. Un peu vexés, les co-
réens ont d’emblée lancé un plan de financement public de 765m€ dans l’IA sur cinq
ans avec les géants comme Samsung, LG, Hyundai et SK Telecom.
En 2016, DeepMind était toujours un laboratoire de recherche. Ils planchent sur DQN,
un réseau neuronal profond doté de capacités d’auto-apprentissage et DeepMind
Health, qui donne lieu à une collaboration avec la NHS britannique et dans
l’application Streams de détection de blessures aux reins dans les urgences.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 80 / 160
Le français Yann LeCun, maintenant chez Facebook, a trouvé de son côté que le
progrès accompli par AlphaGo n’est pas révolutionnaire pour autant, surtout en
termes d’intelligence, un mot valise dont la définition est à géométrie variable. Il met
en évidence le rôle de l’architecture matérielle qui est mise en œuvre (280 GPUs et
1920 CPUs, même si ce n’est pas forcément celle qui l’était dans les matchs histo-
riques).
Contrairement aux nombreuses startups évoquées dans la partie précédente, Google
utilise l’IA pour enrichir ses propres offres grand public, que ce soit autour de son
moteur de recherche multifonctions ou de business plus périphériques d’Alphabet
(santé, IoT, automobile). Il s’approvisionne en technologies et compétences de ma-
nière assez classique, pas du tout dans un modèle d’innovation ouverte. L’enjeu est
de transformer ces avancées en plateformes, comme il commence déjà à le faire en
publiant des APIs d’IA dans le cloud pour les développeurs, dont fait partie Tensor-
Flow, une bibliothèque open source de machine learning.
Comme ce fut le cas dans le Web 2.0, la position des acteurs est à la fois technolo-
gique mais aussi liée à la capacité à satisfaire des besoins importants d’utilisateurs, à
créer des écosystèmes applicatifs et à trouver un bon modèle économique. Google n’y
est pas toujours arrivé, comme avec Google Reader (abandonné), Picasa (abandonné
au profit de Google Photos), Google Wave (transformé), Google+ (mal en point)
ou Google Compare (récemment abandonné).
L’IA est en tout cas un domaine suffisamment ouvert pour que l’on ne se contente
pas de ne prêter qu’aux riches !
D’ailleurs, petite question : quels travaux de recherche en IA a pu créer et publier
Ray Kurweil depuis qu’il est chez Google, à savoir 2012 ? Il planche en théorie sur le
traitement du langage naturel et sur la création d’une AGI (intelligence artificielle
généraliste). On n’en sait pas plus ! Avant d’être chez Google, Kurzweil était à la fois
un serial-inventeur et un serial-entrepreneur en plus d’être auteur de nombreux livres,
donc plutôt prolifique. Depuis, c’est un grand silence. Les exponentielles de progrès
ne sont pas universelles !
IBM
IBM est le second acteur auquel les médias font le plus souvent référence concernant
l’IA, notamment depuis qu’il communique fort bien sur les performances et applica-
tions diverses de Watson.
IBM est aussi coutumier des acquisitions, qui servent surtout à enrichir son offre de
logiciels d’entreprises, source de profits de même niveau que ses activités de services
pourtant trois fois plus importantes en chiffre d’affaire. L’offre logicielle d’IBM s’est
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 81 / 160
agrandie depuis les années 1990 par le fait de nombreuses acquisitions avec Lotus,
Rational, Tivoli pour ne nommer que les plus connues. Et cela a continué depuis.
IBM a investi au moins $7B en acquisitions dans l’IA, bien plus que Google ne l’a
fait. Il a notamment absorbé en 2014 la startup Cognea, créatrice d’un agent conver-
sationnel, AlchemyAPI (2005), une startup de deep learning d’analyse de textes et
d’images, de reconnaissance de visages, de tagging automatique d’images acquise en
2015,IRIS Analytics, une startup allemande d’analyse temps-réel dédiée à la détec-
tion de fraudes aux moyens de paiement, s’appuyant sur du machine lear-
ning, Explorys et la solution de gestion de données patients Phytel, intégrés dans les
solutions santé de Watson, acquises en 2016.
Au-delà de l’acquisition de technologies et d’équipes, IBM s’intéresse aux données
permettant d’alimenter Watson de manière générique. Cela s’est manifesté avec
l’acquisition des activités données de The Weather Channel en 2015 permettant de
créer une base météorologique conséquente utile dans différents marchés (tourisme,
agriculture, énergie, transports) ainsi que de Truven Health Analytics pour $2,6B,
qui gérait les données – probablement anonymisées – sur le cout et les traitements de
200 millions de patients.
Cette démarche est originale. On ne l’observe pas chez Google ou les autres acteurs
évoqués ici. Les données de certains domaines sont en effet plus rares que les algo-
rithmes de machine et deep learning et de réseaux neuronaux qui sont plutôt monnaie
courante. Le couplage données + big data + machine learning auto-apprenant permet
de créer des bases uniques. D’où leur valeur économique pour IBM. CQFD.
Microsoft
Microsoft a ceci de commun avec IBM qu’il entretient depuis des décennies de
grandes équipes de recherche fondamentale et particulièrement investies dans les dif-
férents champs de l’intelligence artificielle. Créé en 1991, Microsoft Research occupe
plus de 1000 chercheurs répartis dans le monde, et y compris en France, dans un la-
boratoire commun monté à Orsay avec l’INRIA. La principale équipe européenne est
située à Cambridge au Royaume-Uni. Les équipes de Microsoft Research sont à
l’origine d’avancées comme le système de dialogue en langage naturel Cortana.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 82 / 160
Les activités de Microsoft Research dans le machine learning sont imposantes
avec plusieurs dizaines d’équipes projets impliquées. Dans les projets, on trouve
les grands classiques qui portent sur l’amélioration de la reconnaissance de la parole
et des images et notamment le tagging automatique de vidéos. Et puis, en vrac, un
agent conversationnel détectant des troubles psychiatriques (DiPsy), un outil de re-
connaissance de chiens originaire de Chine qui fonctionne à l’échelle individuelle,
pas à celui de la race (Dog Recognition) et un outil de tri de pièces de monnaie pour
les réfractaires aux Blockchains (Numiscan).
Microsoft qui est maintenant résolument tourné vers le cloud fait tout de même
quelques acquisitions de startups pour accélérer son “time to market” dans l’IA ou
dans la périphérie de l’IA. Les équipes de recherche fondamentale travaillent en effet
sur des domaines où le risque est plus scientifique et technique que marché tandis que
les startups sont censées œuvrer une un risque marché. Le risque est même parfois
émotionnel et dans l’image, comme l’a montré le robot conversationnel Tay qui s’est
mis à tenir des propos nazis et a été débranché. Tay était sorti de Microsoft
Research !
Les acquisitions dans les startups de l’IA sont cependant peu nombreuses chez Mi-
crosoft. On peut surtout citer Revolution Analytics, qui faisait de l’analyse prédic-
tive s’appuyant sur le langage open source R, acquise récemment en 2016. Un moyen
de s’attirer un écosystème de développeurs ! Et puis, début 2016, Swiftkey, un logi-
ciel de clavier virtuel mobile qui s’appuierait lui aussi sur du machine learning. En
2015, Microsoft avait aussi mis la main sur Prismatic, un agrégateur de news
s’appuyant sur du machine learning, ainsi que Double Labs, une application Android
de notification elle aussi basée sur du machine learning.
Il n’empêche que l’éditeur a bien compris les enjeux de l’IA et cherche à se position-
ner comme fournisseur de plateforme d’IA pour les développeurs, le “Conversation
As a Platform” et le “Microsoft Bot Framework”, qui rappellent dans leur structure
l’offre des APIs d’IBM Watson. Il a été annoncé lors de la conférence Build qui
s’est tenue à San Francisco entre le 28 mars et le 1ier avril 2016 (voir les vidéos de
keynotes du premier jour et du second jour). C’est tout frais ! Cf ce bon résumé de
Build 2016 dans l’Usine Digitale.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 83 / 160
C’est dans ce cadre que Microsoft propose 22 APIs dans ses Cognitive Services (an-
ciennement Projet Oxford) associés à l’agent Cortana Intelligence Suite. Ce sont des
APIs sensorielles qui font de la reconnaissance d’images, audio, du traitement du
langage naturel (NLP). L’agent intègre les services en cloud Azure Machine Learning,
lancés en 2015. Microsoft a notamment démontré son CRIS (Custom recognition in-
telligence service), un outil de “speech to text” capable d’interpréter les paroles ap-
proximatives d’enfant en bas âge. Microsoft propose aussi en open source son son
framework de “deep learning” CNTK (Computational Network Toolkit) depuis fin
2015.
Apple
Apple est bien plus orienté produits et marchés que ne le sont IBM et Microsoft. Non
seulement la société n’a pas formellement de laboratoire de recherche fondamentale
mais elle ne publie aucun papier dans le domaine de l’IA. C’est tout le contraire de
l’innovation ouverte !
Les acquisitions d’Apple sont peu nombreuses en règle général. Dans l’IA, on peut
compter Emotient pour la reconnaissance des visages et des émotions, VocalIQ, qui
devait enrichir les fonctionnalités de reconnaissance de la parole de SIRI en ajoutant
de l’auto-apprentissage, ainsi que Perceptio, dans la reconnaissance d’images
s’appuyant sur du deep learning. SIRI est de son côté le résultat de l’acquisition en
2010 de la startup SIRI, elle-même issue d’un projet de SRI International financé
par la DARPA, et de l’usage des technologies issues de l’américain Nuance Com-
munications, la société leader du secteur de la reconnaissance de la parole qui fait
plus de $2B de chiffre d’affaire ! Ce dernier utilise en partie des technologies issues
de Scansoft, provenant du belge Lernout & Hauspie qui avait acquis la technologie de
reconnaissance de la parole de Ray Kurzweil !
Apple comble les trous dans l’IA via son partenariat avec IBM qui porte notamment
sur Watson. Il est cependant probable qu’Apple devra faire quelques acquisitions
dans le cadre de son projet de voiture automatique.
Facebook
Facebook a fait parler de lui côté IA en lançant le FAIR (Facebook Artifical Intelli-
gence Research) qui est dirigé par le chercheur français Yann LeCun et qui est ins-
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 84 / 160
tallé à Paris depuis 2015. Yann LeCun est l’un des pères du machine learning. Il est
aussi depuis peu professeur au Collège de France sur le deep learning17.
Facebook a aussi fait l’acquisition de Wit.ai, une petite startup de Palo Alto, pour
ajouter des fonctionnalités de reconnaissance de la parole dans ses services et no-
tamment de Messenger. Mais Wit.ai est aussi une plateforme utilisée par des milliers
de développeurs !
Le géant des réseaux sociaux rêve aussi probablement de créer des solutions de mar-
keting ultra-intelligentes, capables de devenir les aspirations et intentions des utilisa-
teurs. Par exemple, une solution qui saura que je change de ville tous les ans pour
mes vacances et évitera de m’exposer à des publicités liées à des villes déjà visitées !
Facebook lançait à sa dernière conférence développeurs en avril 2016 sa solution
d’APIs pour le développement de chatbots, son Bot Framework.
Enfin, on ne peut pas négliger les applications potentielles de l’IA dans la réalité
augmentée. C’est un enjeu pour Facebook (Oculus Rift), pour Google (qui finance
Magic Leap dans ce domaine) et Apple (qui aurait un projet dans le domaine).
17
Voir sa leçon inaugurale qui fait un très bon panorama technique du machine learning.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 85 / 160
Autres grands acteurs du numérique
Dans les acquisitions de startups de l’IA par d’autres grands acteurs du numérique, on
peut citer quelques mouvements récents, même si on est loin du tsunami. Pourquoi
donc ? Est-ce lié aux domaines d’activités de ces entreprises ?
La startup Connectifier, spécialisée dans l’identification de profils pour le recru-
tement, acquise par LinkedIn début 2016. LinkedIn a aussi acquis Bright en 2014,
un spécialiste du recrutement basé sur de la recommandation et s’appuyant sur du
machine learning pour l’analyse sémantique des CVs.
Le moteur de recherche visuel mobile SnapTell a été acquis par Amazon en 2009,
l’une des rares acquisitions de ce dernier semblant intégrer des solutions ou tech-
nologies d’IA avec le spécialiste de la reconnaissance d’images Orbeus, acquis en
avril 2016. Ce qui peut vouloir dire que la solution en cloud Amazon Machine
Learning, lancée en 2015, est d’origine interne. Elle permet de réaliser des re-
commandations d’achats, comme dans le service d’Amazon. Il pourrait en être de
même d’Alexa, le moteur de reconnaissance vocale d’Amazon qui est notammet
intégré à Amazon Echo et est aussi exploitable via ses APIs par des développeurs
tiers.
Le spécialiste du machine learning PredictionIO acquis par SalesForce également
début 2016, ainsi que Metamind début avril 2016. Je les avais couverts rapide-
ment dans l’article précédent alors qu’ils étaient encore indépendants !
L’application de recommandation mobile Livestar acquise par Pinterest en 2013.
La startup de machine learning et d’analytics Whetlab acquise par Twitter en
2015.
Le spécialiste de data analytics BigMachines acquis par Oracle en 2013 pour
$300m.
A chaque fois, il s’agit visiblement d’applications métiers et pas forcément de star-
tups qui ont réellement fait avancer l’état de l’art de l’IA.
Il sera intéressant d’observer les acquisitions de startups d’ici fin 2016 pour identifier
une éventuelle croissance des catégories IA et machine learning. Une liste à jour est
disponible sur CBInsights.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 86 / 160
Startups françaises
de l’intelligence artificielle
Après avoir fait le tour des stratégies d’IA de quelques grands acteurs du numérique
dont Google, IBM, Microsoft et Facebook et à leurs acquisitions, revenons aux star-
tups du secteur en nous intéressant aux françaises.
Il est clair que l’IA est l’une des technologies clés du numérique, aujourd’hui et de-
main. Donc, au lieu de chercher à créer un Google, un Facebook ou un système
d’exploitation français, il serait bon de s’intéresser à ce domaine prometteur, surtout
dans la mesure où les plateformes correspondantes sont encore en devenir.
La recherche en IA en France
La recherche en IA est disséminée dans plusieurs laboratoires et dans des projets col-
laboratifs associant laboratoires publics et universités. Les deux premiers organismes
se focalisant sur l’IA sont l’INRIA et le CNRS.
Que fait l’INRIA ? Un grand nombre des projets de recherche fondamentale en IA
référencés sur leur site font appel aux techniques de l’IA, même s’ils ne sont pas for-
cément labellisés IA / machine learning / réseaux neuronaux. C’est ainsi le cas du
projet Orpailleur mené à Nancy et dédié à la représentation des connaissances et au
raisonnement. L’équipe planche sur l’extraction de données dans les bases de con-
naissances non structurées, et notamment dans le domaine de la santé, le même que
celui qui est investi par IBM Watson et plein de startups. Ils collaborent notamment
avec le centre de lutte contre le cancer de Nancy. L’équipe Magnet travaille quand à
elle directement sur le machine learning et l’auto-apprentissage.
Les chercheurs français se plaignent en tout cas d’être délaissés en France dans la
discipline. Ils ne sont certainement pas les seuls, au sens où de nombreuses disci-
plines se sentent délaissées dans la recherche publique.
Une association créée en 1993 fait la promotion de la recherche en IA, l’AFIA. Elle
organisait en octobre 2014 une conférence de promotion de l’IA dans la recherche.
On y identifie par exemple Andreas Herzig (IRIT, CNRS, Toulouse) qui travaille
sur la modélisation de la logique et du raisonnement, Hélène Fargier (IRIT, CNRS,
Toulouse) qui travaille notamment sur la programmation par contraintes, Jérôme
Euzenat (LIG, Inria) qui planche sur la représentation et l’échange de connaissances
et Leila Amgoud (IRIT, CNRS) qui est spécialisée dans la modélisation de
l’argumentation.
Le défi pour ces chercheurs et leurs autorités de tutelle est de trouver des applications
marchés de leurs travaux. En consultant la liste des participations d’IT-
Translation qui est l’un principaux financeurs de projets issus de l’INRIA, on cons-
tate que l’IA est souvent en filigrane de ces projets, mais pas forcément au niveau
“plateforme” ou “couches de base”.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 87 / 160
Dans Economic Report or The President, le rapport annuel 2016 sur l’économie de
la Maison Blanche, j’ai découvert deux données intéressantes : aux USA, en 2013, les
startups ont créé 2 millions d’emploi et les entreprises traditionnelles 8 millions.
Donc 20% ! Une proportion énorme sachant que dans le même temps, l’économie
française a plutôt détruit des emplois et les startups n’en ont probablement créé que
quelques milliers. Et surtout : la moitié de la R&D fédérale est dédiée à la défense !
Et au milieu des années Reagan, elle en représentait les deux tiers ! Cela explique
pourquoi tant de projets autour de l’IA sont financés par la DARPA. Y compris trois
défis lancés en 2004, 2005 et 2007 sur la conduite automatique, qui ont dynamisé les
équipes de recherche de nombreuses universités sur le sujet. Nombre de ces équipes
ont été ensuite recrutées par Google pour ses différents projets de voitures automa-
tiques.
En France, la recherche dans l’IA semble mieux financée côté civil, même s’il est
difficile de le vérifier par les chiffres. On ne s’en plaindra pas. A ceci près que la
R&D militaire US a une qualité : elle est orientée vers des objectifs pratiques selon
des cahiers des charges. De son côté, la recherche civile française fonctionne plutôt
de manière très décentralisée et sans objectifs pratiques clairs, sauf lorsqu’elle est fi-
nancée par des entreprises privées, surtout depuis la loi Pécresse de 2007. A méditer !
Startups horizontales
Voici les startups que j’ai pu repérer dans les solutions techniques d’IA plus ou moins
génériques. Le champ de la reconnaissance audio est faiblement couvert par les star-
tups françaises. Dans celle des images, on eu quelques cas anciens comme LTU qui a
été racheté par le japonais JASTEC en 2005.
Il subsiste quelques acteurs spécialisés dans la recherche et qui ont intégré petit à pe-
tit des techniques d’IA dans leurs offres. Antidot et Sinequa sont anciens dans le pay-
sage mais, à l’instar de nombreux éditeurs b2b, ils peinent à croître pour atteindre la
taille critique, même s’ils commencent à se développer à l’international comme Sine-
qua qui y réalise maintenant 50% de son chiffre d’affaire.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 88 / 160
J’indique comme dans la partie précédente entre parenthèse l’année de création et les
montants levés lorsqu’ils sont disponibles. On aimerait bien ajouter un troisième in-
dicateur : le chiffre d’affaire, mais il n’est généralement pas disponible !
Antidot (1999, $3,5m) est connu pour son moteur de recherche pour entreprises. Il
propose une fonction de classification automatique de contenus ainsi que
d’amélioration de la pertinence des résultats de recherche s’appuyant sur du machine
learning.
Sinequa (2002, $5,33m) est un fournisseur de solutions de big data et d’analyse de
données pour les grandes entreprises. Il fournit un moteur de recherche sémantique
capable d’exploiter les données issues de nombreux progiciels (ERP, CRM, gestion-
naires de contenus, etc). La société a annoncé en 2015 investir dans le machine lear-
ning pour améliorer la performance de ses solutions.
Dataiku (2013, $3,5m) fait évoluer les concepts de business intelligence et de data
mining avec son Data Science Studio, un ensemble d’outils d’analyse de données qui
exploitent du machine learning pour la création de modèles de données et de simula-
tions.
Heuritech (2013) propose sa solution logicielle Hakken d’analyse sémantique, de
tagging et classement automatiques de textes, images et vidéos sous forme d’APIs. Ils
proposent aussi HeuritechDIP qui permet d’améliorer sa connaissance des clients et
d’anticiper leurs besoins, évidemment, surtout dans les applications de commerce en
ligne. Le tout s’appuie sur force marchine et deep learning. La startup s’appuie sur les
travaux de recherche de deux laboratoires publics le CNRS LIP6 and l’ISIR de
l’UPMC (Paris VI).
Les solutions de reconnaissance de visage qui évaluent l'âge sont généralement à côté de la plaque. L'habit (du visage)
ne fait pas le moine ! Ici, sur le stand de Smart Me Up au CES 2016 de Las Vegas.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 89 / 160
de données textuels, comme dans les commentaires d’utilisateurs dans les réseaux
sociaux ou sites de e-commerce. Le tout s’appuie sur des techniques de machine lear-
ning et de deep learning. L’outil permet notamment d’explorer les données analy-
sées de manière visuelle pour identifier des patterns et signaux faibles.
Smart Me Up (2012, 3m€), vu aux CES 2015 et 2016 propose une solution logicielle
d’analyse des visages. Elle détecte l’âge, le comportement et les émotions des utilisa-
teurs. La solution est bien entendu plutôt commercialisée sous forme de brique logi-
cielle en marque blanche utilisable dans des applications métier.
Regaind (2014, 400K€) propose une solution de tri automatique de photos en cloud
s’appuyant sur du machine learning et de deep learning. Elle permet de trier les pho-
tos sous un angle à la fois narratif et descriptif et de les tagger automatiquement.
Moodstocks (2008) propose une solution mobile de reconnaissance d’images, four-
nie sous la forme d’APIs et d’un SDK multi-plateforme.
Zelros (2015, 80K€ de love money) propose une plateforme en cloud B2B qui per-
met aux applications métiers d’accéder aux données structurées ou non ainsi qu’aux
modèles prédictifs et en langage naturel via un bot conversationnel exploitable via
Slack, par SMS, Skype Entreprise ou équivalents. La startup est basée à Paris.
Do You Dream Up (2009) propose également un agent conversationnel multilingues
pour les sites web. Il est notamment utilisé par Voyages-SNCF depuis 2011 et a ré-
cemment évolué pour être intégré dans une “HelpBox”, sorte d’aide en ligne contex-
tuelle interactive.
DreamQuark (2014) développe des solutions d’intelligence artificielle à base de ré-
seaux de neurones et de deep-learning avec des mécanismes d’auto-apprentissage ca-
pables d’explorer tous seuls tous types de données de les traiter. La startup propose
des outils d’analyse via sa plateforme Brain qui permet d’explorer, optimiser et valo-
riser les données structurées (bases de données) et non-structurées (images, sons,
voix) dans les secteurs de l’assurance et la santé.
Objets connectés
C’est un domaine où les entrepreneurs français sont assez prolixes en général. Il n’est
donc pas étonnant d’y trouver quelques startups intégrant des briques d’IA dans leurs
solutions. Le scénario le plus répandu est lié à la consommation d’énergie et à la mai-
son connectée, avec des solutions faisant de l’auto-apprentissage du comportement de
ses habitants pour piloter des actions d’économies d’énergie et d’automatisation di-
verses.
Craft.ai (2015, $1,1m) est une très jeune startup spécialisée dans l’Internet des objets.
Elle permet de créer des solutions logicielles d’orchestration d’objets connectées qui
apprennent toutes seules des comportements des utilisateurs et des données environ-
nementales captées par les objets connectés. La solution est commercialisée sous la
forme d’APIs destinées aux développeurs d’applications. L’approche est intéressante
dans son principe. Reste à trouver un modèle économique solide.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 90 / 160
Angus.AI (2014) est un peu l’équivalent de Craft.ai, mais pour les robots et divers
objets connectés qui doivent percevoir ce qui se passe dans leur environnement. La
startup créée par des anciens ingénieurs d’Aldebaran qui ont développé la partie logi-
cielle des robots Nao et Pepper, propose une solution logicielle embarquée dans les
robots leur apportant les fonctions de base de reconnaissance vocale et faciale et de
détection d’obstacles. Elles sont fournies sous la forme d’un kit de développement et
d’APIs (interfaces de programmation). Ils s’appuient beaucoup sur des solutions open
source du marché. Ils travaillent déjà avec la SNCF, mais pas sur des robots.
Ubiant (2011), basé à Lyon, était également présent au CES de Las Vegas en 2015 et
2016. Il propose une solution matérielle et logicielle de gestion de la maison intelli-
gente, de l’éclairage et de l’énergie qui s’appuie sur du machine learning et sur le
Luminion (ci-dessous) un objet connecté interagissant avec l’utilisateur via des LED
de couleur indiquant si la consommation du foyer est supérieur à celle du voisinage.
C’est une offre b2c.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 91 / 160
mobile et par commande vocale. Le projet lancé sur Kickstarter n’a pas porté ses
fruits.
Iqspot (300K€) est une startup bordelaise qui analyse la consommation énergétique
des bâtiments et sensibilise ses occupants pour la diminuer. Le tout avec du machine
learning. C’est une participation d’IT-Translation.
Xbrain (2012) est une startup française établie dans la Silicon Valley ainsi qu’à Paris
et Lille qui se spécialise dans les applications de l’IA à l’automobile et la robotique.
Sa plateforme xBrain Personal Assistant permet de créer des agents conversationnels.
Elle s’appuie sur la reconnaissance vocale, sur la gestion de contexte, sur la détection
des intentions et la gestion de règles. Son créateur, Gregory Renard, planche sur l’IA
depuis près de 20 ans.
Scortex (2016) développe des solutions matérielles et logicielles apportant
l’autonomie aux robots et objets connectés qui intègre notamment la reconnaissance
d’images et de la parole. Ils ont même développé un chipset à base de réseaux neuro-
naux.
Commerce et marketing
L’écosystème français a toujours été prolixe en startups b2b et b2c dans le secteur du
ecommerce et du marketing. Il est donc normal d’y retrouver quelques startups inté-
grant de l’IA.
AntVoice (2011, $3,5m) propose une solution de recommandation prédictive pour les
sites de ecommerce qui s’appuie sur de l’intelligence artificielle. C’est un spécialiste
du big data marketing. La solution analyse la pondération de la relation entre Inter-
nautes et produits et s’appuie sur la théorie des graphes.
Datapred (2014) propose également une solution d’analyse prédictive basée sur du
machine learning. La société cible divers marchés professionnels dont celui de la dis-
tribution, en plus de la finance, de la logistique et de la santé. Elle permet par
exemple de simuler des hypothèses marketing et leur impact sur une chaîne logistique
de distribution en tenant compte d’un grand nombre de paramètres. Comme c’est
souvent le cas, le lancement d’un projet requiert une bonne part de service et de per-
sonnalisation avant sa mise en oeuvre opérationnelle.
DataPublica / C-Radar (2011) est une société qui propose une solution en cloud de
marketing prédictif B2B permettant de cibler les bons prospects. Elle s’appuie sur
l’exploitation des données administratives et financières des entreprises issues de
sources publiques, des sites web associés, des réseaux sociaux et des mentions dans
les médias. Ces données permettent alors de segmenter automatiquement les clients,
de prioritisation de ces segments, le tout s’appuyant sur un apprentissage supervisé.
L’approche permet par exemple de segmenter les startups d’un secteur d’activité
donné (Medtech, Fintech). La société est une autre participation d’IT Translation.
D’autres startups françaises se positionne sur ce créneau comme Compellia (2015),
qui analyse des sources données ouvertes et identifie des événements clés de la vie
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 92 / 160
des entreprises pour créer des listes de prospects qualifiés, sachant que le processus
est spécifique à chaque marché.
Il y a aussi TinyClues (2010, $7,37), une startup plus établie qui utilise des solutions
de machine learning pour identifier les produits que les clients de sites de vente en
ligne sont le splus succeptibles d’acheter, histoire d’optimiser les campagnes marke-
ting ciblées au niveau du ciblage comme des messages et des offres.
Search’XPR (2013, $3,2m) est une startup créée à Clermont-Ferrand qui a créé le
concept de “sérendipité psycho-cognitive” issu d’une thèse soutenue en 2010
par Jean-Luc Marini, l’un des cofondateurs de la société. Le concept est mis en œuvre
dans la solution Oorace, destinée au commerce en ligne et même traditionnel.
Elle permet d’analyser l’état d’esprit du consommateur et d’évaluer sa réceptivité à
des propositions commerciales inattendues, affichables notamment dans des
offres ciblées s’apparentant à du “retargeting publicitaire” un peu moins bourrin que
celui de Criteo. Le tout s’appuie sur de l’analyse syntaxique des sites visités et du
parcours du visiteur, associant algorithmes et sciences cognitives analysant les “émo-
tions” des utilisateurs, avec à la clé une augmentation des taux d’achat et du niveau
des paniers moyens. Le service est fourni sous la forme d’APIs en cloud. Reste à sa-
voir si les algorithmes relèvent réellement de l’IA et comment ils fonctionnent. C’est
la “secret sauce” de la société, vaguement documentée ici. Pas forcément de l’IA au
sens classique du terme, mais plutôt une algorithmie bien sentie, probablement astu-
cieuse dans sa forme, qui permet d’éviter la force brute de nombreux solutions de
machine learning.
Dictanova (2011, 1,2m€) est une société nantaise à l’origine d’une solution d’analyse
textuelle des feedbacks clients dans les réseaux sociaux ou sites de vente en ligne, en
liaison avec les outils de CRM pour optimiser la relation client. Les techniques utili-
sées comprennent l’analyse sémantique de textes et la classification automatique. La
solution est fournie en cloud. C’est une autre participation d’IT-Translation.
Modizy (2012, $275K) propose un assistant d’achats dans la mode basé sur un algo-
rithme d’intelligence artificielle. Modizy propose aussi une place de marché reliant
consommateurs et marques.
Do You Dream Up (2009) propose une solution de chat automatique pour les sites
en ligne. La société est basée à Paris, Bordeaux et Londres. Et elle a déjà une bonne
douzaine de clients grands comptes ayant déployé sa solution.
Tastehit (2014) utilise du machine learning et du big data pour personnaliser les sites
de e-commerce en temps réel. Donc, une offre b2b.
CompareAgences (2012) intermédie la relation entre agents immobiliers et particu-
lier dans le cadre de la vente de biens. La startup emploie 12 personnes et génère 200
000 visiteurs uniques par mois. 1000 agences immobilières sont intégrées en France.
Le tout est à base de machine learning, sans plus de précisions.
Cypheme (2015) est une startup proposant une application mobile de détection de
produits contrefaits, s’appuyant sur un algorithme de machine learning appliqué à la
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 93 / 160
qualification d’images. La startup est accélérée chez Microsoft Ventures à Paris.
C’est une sorte de Shazam de la contrefaçon.
Santé
C’est un domaine très porteur pour les applications de l’IA. Seulement, voilà, nous
sommes un peu à la traine dans l’une de ses grandes applications : la génomique.
Mais la santé va au-delà de la génomique, heureusement.
CardioLogs Technologies (2014) a créé une solution d’interprétation automatique
des électrocardiogrammes (ECG) en temps réel s’appuyant sur du machine learning.
Uberisation en puissance des cardiologues ? Pas si vite ! Cela permet surtout de
rendre un suivi plus régulier des patients à risques ou atteints de maladies chroniques.
DreamUp Vision (2015) est une startup issue de Dreamquark, une startup spécialisée
dans l’analyse de données pour la santé et les assurances. Elle propose une solution
d’analyse des images de la rétine obtenues par un fond de l’œil traditionnel. Elle
permet de détecter les rétinopathies diabétiques émergentes aussi bien que les oph-
talmos. Elle se situe dans un mouvement comprenant quelques autres acteurs dans le
monde qui traitent automatiquement les résultats d’imagerie médicale. C’est ainsi le
cas d’une autre startup francilienne, Qynapse qui analyse de manière itérative les ré-
sultats d’IRM cérébrales pour suivre l’évolution de traitements, notamment dans la
lutte contre les cancers du cerveau.
Dexstr.io (2014) est une startup toulousaine fournissant la solution Inquiro qui ex-
ploite les données médicales non structurées pour faciliter la recherche
d’informations pour les sociétés de pharmacie. En gros, c’est de la recherche docu-
mentaire, un peu comme le font Sinequa et Antidot, mais avec un tuning adapté à la
documentation scientifique dans la santé. Leur concurrent serait plutôt l’application
d’IBM Watson à l’oncologie. C’est encore une participation d’IT-Translation.
Khresterion (2014) propose un logiciel d’aide au diagnostic et à la prescription pour
le et les cancers. La solution fonctionne sur un principe voisin de celui d’IBM Wat-
son, compulsant la littérature scientifique et les données des patients pour proposer
divers traitements avec leurs avantages et inconvénients comme les effets secondaires.
La société aurait comme prescripteur des organismes de remboursement comme Hu-
manis, Axa et la Maaf. Sa solution commence aussi à être utilisée dans la finance, là
où les cycles de vente sont probablement plus courts.
Industrie
Il existe probablement de nombreux acteurs dans ce vaste domaine où le machine
learning peut avoir plein d'usages.
Citons par exemple le cas de DCbrain, issu de Telecom Paristech, et spécialisé dans
la modélisation de flux physiques (eau, gaz, électricité, ...) pour les utilities, qui s'ap-
puie sur des solutions de big data et de machine learning pour identifier des tendances
et signaux faibles. Cela permet de piloter automatiquement les réseaux, de faire de la
maintenance prédictive et de modéliser le fonctionnement des réseaux.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 94 / 160
Applications métiers
C’est là que la créativité est la plus développée, comme nous l’avions vu dans
l’article précédent de la série au sujet des startups américaines.
Snips.ai (2013, $6,3m) est une startup connue du secteur de l’IA créée par Rand Hin-
di (prix du MIT30 en 2015), Mael Primet et Michael Fester. Leur dernière levée de
fonds de 5,7m€ en juin 2015 présente la particularité d’associer Bpifrance avec des
investisseurs américains, en plus de business angels tels que Brent Hoberman et Xa-
vier Niel. L’équipe comprend 35 personnes : des data-scientists, des développeurs,
designers et quelques marketeurs. Leur positionnement est large et un peu vague :
rendre la technologie invisible et les usages intuitifs via de l’IA. A ce titre, la startup
a développé des applications expérimentales telles que :snips (un ensemble
d’applications de recherche pour iOS dont un clavier virtuel intelligent pour la re-
cherche d’adresses), Tranquilien (qui prédit les places disponibles dans les trains de
banlieue), Parkr (la même chose pour prédire les places de parking), Flux (qui identi-
fie le trafic mobile en s’appuyant sur les données des smartphones), RiskContext et
SafeSignal (identification de risques d’accidents sur la route).
La startup planche aussi sur des applications verticales : pour les véhicules connectés,
dans l’hôtellerie, la maison connectée et les loisirs numériques. Le tout s’appuie sur
force machine et deep learning, modèles probabilistiques, traitement du langage, ges-
tion de graphes et aussi encryption des données pour garantir la vie privée. Derrière la
vision, l’implémentation et l’expérimentation, on leur souhaite de réussir la busi-
nessmodelation.
Jam (1m€) a créé un agent conversationnel SMS pour étudiants. Ils ont ISAI Ven-
tures dans leur capital. La solution utilise une combinaison d’IA et de vrais interve-
nants humains pour assurer une bonne qualité des réponses. Leurs outils d’IA sont en
open source.
Julie Desk (2014, $993K), basé à Paris, propose un service d’assistante virtuelle
fonctionnant sous la forme d’un agent conversationnel opérant en français et en an-
glais. Il gère surtout votre agenda et réponds à vos mails à votre place pour prendre
des rendez-vous avec vos interlocuteurs. Comme pour Jam, l’agent fonctionne en
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 95 / 160
mode supervisé par des opérateurs ce qui permet d’assurer une bonne qualité de ser-
vice. Les tarifs vont de 50€ à 80€ par mois. Il est notamment utilisé par des entrepre-
neurs de startups. Mais l’agent ne répond pas encore au téléphone.
Riminder (2015) est une startup spécialisée dans les RH qui s’appuie sur du deep
learning pour proposer des outils d’aide à la décision. Il aider les chercheurs d’emploi
à construire leur parcours professionnel et les actifs à développer leur carrière, en ex-
ploitant une base de connaissance de plusieurs millions de parcours de cadres.
White (2015) est une startup hébergée à l’accélérateur de Microsoft Ventures à Paris
qui permet la saisie automatique de pièces comptables pour l’expertise comptable et
l’audit. L’outil est capable de comprendre la structure du document et de le traiter
convenablement dans son environnement. Il va au-delà des solutions traditionnelles
d’OCR (optical characters recognition).
niland (2013) est une autre participation de IT-Translation, la structure de valorisa-
tion des projets de recherche issus notamment de l’INRIA. Mais la startup a été créée
par des anciens de l’IRCAM et s’appuie sur 10 années de travaux de recherche. Elle
utilise le deep learning analysant le contenu de la musique pour rendre
son exploration dans les plateformes de diffusion plus intelligente. Elle identifie les
similarités entre morceaux pour les classifier automatiquement. La solution sera ex-
ploitée par CueSongs (UK, une société fondée par le chanteur Peter Gabriel) et mo-
tionelements (Singapour) qui sont dédiés aux professionnels de la musique. La solu-
tion est aussi illustrée par le service en ligne www.scarlett.fm et s’appuie sur Sound-
cloud pour vous permettre de créer une web radio personnalisée en fonction de vos
goûts.
Yseop (2008) propose son agent conversationnel Savvy. Nous l’avions déjà évoqué
dans le troisième article de cette série. La société propose également une solution de
Business Intelligence qui est capable d’extraire intelligemment des données de bases
structurées (ERP, CRM, etc) pour les convertir en synthèse en langage naturel,
après moulinage dans un moteur de déductions, et qui plus est, dans plusieurs langues.
Dhatim (2008) automatise la gestion des factures et le contrôle des déclarations so-
ciales avec comme premiers clients les opérateurs mobiles (pour les factures) et
d’autres (pour les déclarations sociales). Dans ce dernier cas, la solution permet
d’éviter de générer des incohérences dans les déclarations sociales et les pénalités qui
vont avec les contrôles qui sont eux inévitables. La solution s’appuie sur une combi-
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 96 / 160
naison de centaines de règles métiers et de machine learning qui déclenche des ac-
tions automatisées.
Séline (2013), édité par la société Evi, propose une panoplie d’applications bureau-
tiques intégrant un agent conversationnel permettant de dialoguer et poser des ques-
tions en langage naturel. On y trouve notamment un traitement de texte, un tableur,
un gestionnaire d’agenda, un carnet d’adresses, un gestionnaire de tâches, une média-
thèque, un logiciel de gestion de finances et un gestionnaire de messagerie instanta-
née. Dilemme classique : faut-il recréer tout un existant complexe pour y intégrer une
nouvelle fonction ou ajouter cette fonction aux produits existants du marché (Micro-
soft Office, Open Office). Question d’ouverture, de simplicité de mise en oeuvre et
de modèle économique!
Dans un compte-rendu sur l’écosystème entrepreneurial de La Réunion, j’avais aussi
identifié quelques startups qui utilisent le machine learning : logiCells (ERP séman-
tique) et Teeo (analyse de consommation d’énergie pour les entreprises). A contrario,
certaines startups font appel à des briques d’IA comme le machine learning mais pré-
fèrent ne pas l’évoquer dans leur communication.
Ce tour est probablement incomplet et les oubliés du secteur se feront immanquable-
ment connaitre pour intégrer cette liste que je mettrai à jour au fil de l’eau. A vrai dire,
d’ici peu de temps, l’usage de machine learning sera aussi courant dans les startups
que l’appel à des bases de données NoSQL : une banalité !
Le top du top de la startup d’IA ? Utiliser l’IA dans une solution d’agent conversa-
tionnel en cloud qui fait du big data sur des données issues de l’IOT en sécurisant les
transactions via des Blockchains. Le Bingo de la startup d’IA est lancé !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 97 / 160
Modélisation et copie du cerveau
Doit-on absolument chercher à copier ou imiter le cerveau humain pour créer des so-
lutions numériques ? Dans quel cas l’imitation est-elle utile et dans quels cas
l’inspiration seulement nécessaire ? Doit-on chercher à créer des machines plus intel-
ligentes que l’homme dans toutes ses dimensions ?
L’exemple de l’aviation peut servir de bonne base de réflexion. L’avion s’inspire de
l’oiseau mais ne l’imite pas pour autant. Les points communs sont d’avoir des ailes et
d’utiliser la vitesse et la portance des ailes pour voler.
Le concept diverge alors rapidement : les avions n’ont pas d’ailes mobiles faites de
plumes ! En lieu et place, leurs ailes sont généralement fixes et les moteurs sont à hé-
lice ou sont des réacteurs. L’avion dépasse largement l’oiseau dans la vitesse (super-
sonique pour les avions militaires), la taille (B747, A380, Galaxy C5, Antonov 124),
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 98 / 160
la capacité d’emport (qui se mesure en dizaines de tonnes), l’altitude (10 km pour un
avion de ligne) et la résistance du froid (il y fait environ -50°C, ce qu’un organisme
biologique développé peu difficilement supporter longtemps, même avec un bon
plumage). Les avions sont par contre très inférieurs aux oiseaux côté efficacité éner-
gétique et flexibilité, même si la densité énergétique de la graisse animale est voisine
de celle du kérosène (37 vs 43 Méga Joules/Kg).
Le bio-mimétisme a été utile au début pour conceptualiser l’avion, que ce soit dans
les schémas de Léonard de Vinci ou de l’avion de Clément Ader qui étaient très
proches de l’oiseau. Si la motorisation d’un avion est très différente de celle des oi-
seaux qui battent de l’aile, les plumes se déployant au moment de l’atterrissage et du
décollage sont cependant réapparues sous la forme des volets hypersustentateurs, in-
ventés par Boeing pour ses 707 lancés à la fin des les années 1950 (description) et
dont la forme la plus élaborée a été intégrée aux Boeing 747 (ci-dessous), dont les
premiers vols ont eu lieu en 1969.
L’aigle est l’un des oiseaux les plus rapides au monde, atteignant 120 Km/h. Un
avion de ligne classique atteint 1000 Km/h et il touche le sol, volets hypersustenta-
teurs déployés, à environ 200 Km/h. Un A380 décolle en 2700 m et atterri sur 1500
m. Un aigle se pose en quelques secondes et presque n’importe où ! C’est la puis-
sance contre la flexibilité. Il faut se pencher du côté des drones de poche pour retrou-
ver une part de la flexibilité des oiseaux mais leur autonomie est généralement bien
plus limitée que celles des oiseaux, surtout les oiseaux migrateurs qui peuvent voler
plusieurs heures d’affilée avant de se reposer au sol.
L’IA suit un chemin voisin dans le biomimétisme : certaines caractéristiques du cer-
veau des mammifères sont imitées dans les réseaux de neurones, le machine et le
deep learning. Mais des différences fondamentales font diverger intelligence humaine
et de la machine : à la fois ses entrées et sorties tout comme la structure de sa mé-
moire et du raisonnement. La machine se distingue pour l’instant par la capacité de
stockage et d’analyse d’immenses volumes d’information et par sa puissance de cal-
cul brute.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 99 / 160
L’homme dispose de capteurs sensoriels en quantité astronomique qu’aucun objet
connecté n’égale à ce stade, ce qui, associés au cortex, lui procure une mémoire sen-
sorielle qui accumule les souvenirs pendant toute son existence, provenant des en-
trées/sorties que sont les nerfs optiques, auditifs et olfactifs, ainsi que ceux qui gèrent
le toucher, faits de millions de neurones irrigant en parallèle notre mémoire senso-
rielle. C’est une force et une faiblesse. Nos émotions liées à cette mémoire sensorielle
génèrent la peur de certains risques et des prises de décisions pouvant être irration-
nelles. Ensuite, le niveau de complexité du cerveau dépasse l’entendement.
Il n’empêche que, par la force brute, l’IA dépasse déjà l’homme dans tout un tas de
domaines, notamment lorsqu’il faut “cruncher” de gros volumes de données qui nous
échappent complètement. Quand elle a accès à de gros volumes de données comme
dans l’oncologie ou en exploitant les données issues d’objets connectés, l’IA peut
faire des merveilles.
Elle est d’ailleurs plutôt inopérante sans données. Elle ne sait pas encore quoi cher-
cher ni prendre d’initiatives. Et les algorithmes sont encore très limités car les don-
nées de notre vie ne sont, heureusement, pas encore consolidées. Cela explique les
limites de ces algorithmes de recommandation qui ne savent pas ce que j’ai déjà vu
ou fait et ne sont pas prêts de le savoir. Ils ne peuvent donc pas faire de recommanda-
tion totalement pertinente. Le jour où toute notre vie sera suivie par des objets con-
nectés depuis la naissance, il en sera peut-être autrement.
Qu’en est-il du raisonnement humain ? Celui-ci ne semble pas hors de portée des ma-
chines. On arrive petit à petit à le modéliser pour des tâches très spécialisées. Mais
l’IA manque encore de souplesse et de capacité d’adaptation à une grande variété de
situations. Bref, de jugeote ! Mais il n’est pas inconcevable d’arriver à fournir une
intelligence générique à une machine. On y arrivera pas tâtonnements, par intégration
de briques algorithmiques et logicielles disparates, et pas seulement via la force brute
de la machine.
Dans la pratique, c’est plutôt un projet de big data qui s’éloigne du cerveau. En effet,
les modèles de simulation ne s’appuient plus du tout sur la connaissance biologique
actualisée que l’on du fonctionnement des neurones dans le cerveau.
Les USA ne sont pas en reste avec la BRAIN Initiative annoncée par Barack Obama
en 2013. Elle vise à mieux comprendre le fonctionnement du cerveau. L’objectif an-
noncé semble plus opérationnel que celui des européens : mieux comprendre les ma-
ladies d’Alzheimer et de Parkinson ainsi que divers troubles neuronaux. Le budget
annuel est de l’ordre de $100m, donc, in fine, du même ordre de grandeur que le Hu-
man Brain Projet. Parmi les projets, on trouve des initiatives en nano-technologies
pour mesurer l’activité individuelle de cellules nerveuses, à commencer par celles des
mouches drosophiles.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 101 / 160
On peut aussi citer le Human Connectome Project, lancé en 2009, un autre projet
américain, financé par le NIH comme la BRAIN Initiative, et qui vise à cartographier
avec précision les différentes régions du cerveau (exemple ci-dessus avec les princi-
pales liaisons nerveuses internes au cerveau).
De son côté, le projet Allen Brain Atlas planche sur la cartographie du cerveau de
différentes espèces dont l’homme et la souris, au niveau de l’expression des gènes de
ses différentes cellules nerveuses. La plateforme et les données associées sont ou-
vertes. Des chercheurs de l’Université de Berkeley ont même réussi à créer une car-
tographie précise de la sémantique du cortex.
Reste aussi, côté neurobiologie, à comprendre le processus d’’apprentissage des en-
fants en bas âge et jusqu’à 20 ans. Comment le cerveau se câble-t-il pendant les
phases d’apprentissage ? Comment séparer l’inné de l’acquis dans les processus
d’apprentissage ? On dissèque les souris, mais bien évidemment pas les enfants en
bas âge. Donc, on ne sait pas trop. Et l’IRM est insuffisante. Les chinois et les japo-
nais planchent sur une voie intermédiaire en cartographiant le cerveau de singes qui
sont plus proches de l’homme que les rongeurs.
Pour résumer, un bon nombre de recherches portent sur le fonctionnement du cerveau,
avec une intersection avec les recherches en intelligence artificielle.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 102 / 160
tion ultime du solutionnisme technologique qui cherche à trouver une solution tech-
nologique à tous les problèmes ou fantasmes humains.
Le dump du contenu d’un cerveau dans un ordinateur fait cependant face à quelques
obstacles technologiques de taille. Heureusement d’ailleurs !
Quels sont-ils ? Tout d’abord, on ne sait pas encore précisément décrire le mode de
stockage de l’information dans le cerveau. Se situe-t-il dans les neurones ou dans les
synapses qui relient les neurones aux axones d’autres neurones ? Dans Memories
may not live in neurons synapses paru dans Scientific American en 2015, il est fait
état que l’information serait stockée dans les neurones et pas au niveau des synapses18.
Ce stockage est-il du même ordre dans le cortex et dans le cervelet ? Qu’en est-il du
cerveau limbique qui gère les émotions, le bonheur et la peur, en interagissant à la
fois avec le cortex et avec les organes producteurs d’hormones ? On cherche encore !
La science progresse aussi pour cartographier le cerveau politique des électeurs. Ici, sur le clivage républicains et démo-
crates aux USA qui est toujours d’actualité. Ce n’est évidemment pas sérieux, mais un jour, cela le sera peut-être et on
pourra cartographier le cerveau des électeurs ! Source.
Quoi qu’il en soit, l’information est stockée sous forme de gradients chimiques et io-
niques. Probablement pas sous forme binaire (“on” ou “off”) mais avec des niveaux
intermédiaires. En langage informatique, on dirait que les neurones stockent peut-être
des nombres entiers voire flottants au lieu de bits individuels. Il n’est pas exclu non
plus que les neurones puissent stocker plusieurs informations à différents endroits
(dendrites, synapses, axones). Et il n’y a que quelques nanomètres entre les dendrites
et les terminaisons des axones !
La communication entre les deux est chimique, via un potentiel d’ions calcium, so-
dium et potassium, et régulée par des hormones de régulation de la transmission ner-
veuse telles que l’acétylcholine, la dopamine, l’adrénaline ou des acides aminés
comme le glutamate ou le GABA (acide γ-aminobutyrique) qui bloquent ou favori-
sent la transmission d’influx nerveux. A cette complexité, il faut ajouter l’état des
cellules gliales qui régulent l’ensemble et conditionnent notamment la performance
18
Découverte confirmée par des chercheurs du MIT début 2016. Cf http://www.extremetech.com/extreme/123485-mit-discovers-the-
location-of-memories-individual-neurons.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 103 / 160
des axones via la myéline qui l’entoure. La quantité de myéline autour des axones est
variable d’un endroit à l’autre du cerveau et module à la fois l’intensité et la rapidité
des transmissions nerveuses. Cela fait une complexité de plus dans le fonctionnement
du cerveau !
Et si la mémoire n’était constituée que de règles et méthodes de rapprochement ? Et
si le savoir était en fait encodé à la fois dans les neurones et dans les liaisons entre les
neurones ? En tout cas, le cerveau est un gigantesque puzzle chimique qui se reconfi-
gure en permanence. Les neurones ne se reproduisent pas mais leurs connexions et la
soupe biologique dans laquelle elles baignent évoluent sans cesse.
Comment détecter ces potentiels chimiques qui se trouvent à des trillions d’endroits
dans le cerveau, soit au sein des neurones, soit dans les liaisons interneuronales ?
Comment le faire avec un système d’analyse non destructif et non invasif ?
Il n’y a pas 36 solutions : il faut passer par des ondes électromagnétiques, et avec une
précision de l’échelle du nanomètre. Aujourd’hui les scanners utilisent généralement
trois technologiques : la tomodensitographie qui mesure la densité de la matière par
rayons X, les PET scanners qui détectent des traceurs biologiques radioactifs par
émission de photons et l’IRM qui détecte les corps mous par résonnance magnétique
nucléaire, qui n’irradie pas le cerveau mais doit le plonger dans un bain magnétique
intense. Ces scanners ont une résolution qui ne dépasse pas l’ordre du millimètre et
elle ne progresse pas du tout en suivant une loi exponentielle de Moore ! Il serait
d’ailleurs intéressant d’évaluer la quantité d’énergie qu’il faudrait envoyer dans le
cerveau (rayons X, magnétisme, etc) pour réaliser ce genre de détection 100 à 1000
trillions de fois, soit le nombre de synapses dans le cerveau, et avec une résolution de
l’ordre du nanomètre. Si cela se trouve, cette énergie électromagnétique serait suffi-
sante pour faire cuire le cerveau comme dans un four à micro-ondes, ce qui ne serait
pas du tout un effet désiré ! Sauf peut-être pour traiter de manière un peu radicale cer-
tains abrutis.
C’est une loi connue dans la physique : plus on explore l’infiniment petit, plus c’est
couteux en énergie. Le LHC du CERN près de Genève a permis de détecter les bo-
sons de Higgs. Il consomme la bagatelle de 200 mégawatts avec des pointes de 1,3
gigawatts, soit plus que la puissance générée par une tranche de centrale nucléaire !
Le LHC a couté $9B et le prix de ce genre d’instrument scientifique ne suit pas du
tout la loi de Moore comme le séquençage de l’ADN !
Des capteurs d’électro-encéphalogrammes existent bien (EEG). Ils sont placés à la
périphérie du cortex sur la tête et captent l’activité de grandes zones de contrôle psy-
chomotrices du cerveau avec un faible niveau de précision. C’est très “macro”. La
mémoire et le raisonnement fonctionnent au niveau du “pico”. Qui plus est, si on sait
cartographier approximativement les zones fonctionnelles du cerveau, on est bien in-
capable de capter le rôle de chaque neurone prise individuellement. Pourra-t-on con-
naitre avec précision la position de toutes les synapses dans l’ensemble du cerveau et
à quels neurones elles appartiennent ? Pas évident ! Autre solution : cartographier le
cortex pour identifier les patterns de pensée. Si on pense à un objet d’un tel type, cela
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 104 / 160
rend peut-être actif des macro-zones distinctes du cerveau que l’on pourrait recon-
naitre.
Dans The Brain vs Deep Learning Part I: Computational Complexity — Or
Why the Singularity Is Nowhere Near, Tim Dettmers avance que la machine ne
pourra pas dépasser le cerveau pendant le siècle en cours. Il démonte les prédictions
de Ray Kurzweil19.
19
J’avais moi-même émis des doutes sur les exponentielles qui sont la primitive des raisonnements de Kurzweil en avril 2015
dans trois articles sur les dérives des exponentielles.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 105 / 160
(source de l’illustration ci-dessus)
Le cerveau d’un fœtus comprendrait plus de mille milliards de neurones, qui meurent
rapidement. On perd en fait des neurones dès sa naissance, comme si une matrice
s’évidait pour prendre forme progressivement au gré des apprentissages. Le cerveau
d’un enfant comprendrait plus de 100 milliards de neurones, et plus de 15 trillions de
synapses et 150 milliards de dendrites.
Un cerveau adulte comprend environ 85 milliards de neurones dont 30 dans le cortex,
10 trillions de synapses (liaisons neurones / neurones via les terminaisons multiples
des axones qui sortent de neurones et se connectent aux dendrites proches du noyau
d’autres neurones), et 300 milliards de dendrites (les structures des neurones sur les-
quelles ne trouvent les synapses). Il consomme environ 20 Watts fournis sous forme
d’hydrates de carbone (glucoses) via la circulation sanguine, ce qui en fait une “ma-
chine” très efficace côté consommation énergétique. Dans son développement à partir
de la naissance, le cerveau perd des neurones mais gagne des liaisons entre elles, et ce,
toute la vie, même si le processus se ralentit avec l’âge, même sans maladies neuro-
dégénératives.
Un neurotransmetteur arrivant via une synapse peut déclencher une cascade de réac-
tions en chaines dans le neurone cible qui va réguler l’expression de gênes et produire
des protéines de régulation qui vont modifier le comportement des dendrites dans la
réception des signaux issus des axones. Qui plus est les dendrites – les récepteurs
dans les neurones – ont des formes et des comportements variables. Bref, nous avons
un système de régulation des plus complexes qui n’a pas du tout été intégré dans les
modèles Kurzweiliens !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 106 / 160
Plus de la moitié des neurones du cerveau sont situées dans le cervelet. Il gère les
automatismes appris comme la marche, la préhension, les sports, la conduite, le vélo,
la danse ou la maitrise des instruments de musique. Un neurone du cervelet contient
environ 25 000 synapses le reliant aux terminaisons d’axones d’autres neurones.
Ceux du cortex qui gèrent les sens et l’intelligence comprennent chacun de 5000 et
15 000 synapses.
Le cerveau est aussi rempli de cellules gliales qui alimentent les neurones et en con-
trôlent le fonctionnement via la myéline qui entoure les axones et divers autres méca-
nismes de régulation. Il y en a au moins autant que de neurones dans le cerveau, ce
qui ajoute un niveau de complexité de plus. Il faut ajouter le rôle de buffer de mé-
moire de l’hippocampe, le vidage de ce buffer pendant le sommeil ce qui rappelle que
une bonne qualité et durée de sommeil permet d’entretenir sa mémoire. Enfin, via le
système nerveux sympathique et parasympathique, le cerveau est relié au reste des
organes, dont le système digestif ainsi qu’à tous les sens et notamment le toucher.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 108 / 160
Evolutions de la loi de Moore
et applications à l’intelligence artificielle
L’IA a connu des vagues diverses d’hivers et de renaissances. Pour certains, il s’agit
plutôt de vaguelettes. Les récentes “victoires” de l’IA comme dans Jeopardy (2011)
et AlphaGo (2016) donnent l’impression que des sauts quantiques ont été franchis.
C’est en partie une vue de l’esprit car ces progrès sont sommes toutes modestes et
réalisés dans des domaines très spécialisés, surtout pour le jeu de Go.
Peut-on décortiquer par quels biais les progrès dans l’IA vont s’accélérer ? Nous
avons vu dans les parties précédentes qu’il était difficile de faire la part des choses
entre avancées liées à l’immatériel et celles qui dépendent du matériel. Je vais com-
mencer par les algorithmes et logiciels puis aborder la partie matérielle. Avec en in-
terlude, un passage sur l’application de la loi de Moore dans la vraie vie qui est bien
différente des belles exponentielles présentées à tout va !
Algorithmes et logiciels
Nous verrons plus loin que le matériel continuera de progresser, même si c’est un
chemin semé d’embuches du côté des processeurs.
S’il y a bien une loi de Moore difficile à évaluer, c’est celle des algorithmes et logi-
ciels ! Personne ne la mesure et pourtant, une bonne part des progrès numériques
vient de là et pas seulement de l’augmentation de la puissance du matériel.
Les réseaux neuronaux à boucle de feedback et le deep learning auto-apprenants sont
maintenant anciens et leur progression est lente dans le principe. Leur mise en œuvre
s’améliore beaucoup grâce aux possibilités matérielles qui permettent de créer des
réseaux neuronaux multicouches allant jusqu’à 14 couches.
A chaque fois qu’un record est battu comme avec AlphaGo, il résulte de la combinai-
son de la force du matériel, du stockage et du logiciel. Qui plus est, ces records de
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 109 / 160
l’IA portent sur des domaines très spécialisées. La variété et les subtilités des raison-
nements humains sont encore loin. Mais elles ne sont pas hors de portée. Notre cer-
veau est une machine hyper-complexe, mais ce n’est qu’une machine donc potentiel-
lement imitable.
La recherche progresse en parallèle dans les techniques de reconnaissance d’images
(à base de réseaux de neurones et de machine learning), de la parole (itou) et de
l’analyse de données (idem). Les algorithmes génétiques sont de leur côté utilisés
pour trouver des chemins optimums vers des solutions à des problèmes complexes
intégrant de nombreux paramètres, comme pour trouver le chemin optimum du voya-
geur du commerce.
C’est dans le domaine de l’intelligence artificielle intégrative que des progrès signi-
ficatifs peuvent être réalisés. Elle consiste à associer différentes méthodes et tech-
niques pour résoudre des problèmes complexes voire même résoudre des problèmes
génériques. On la retrouve mise en œuvre dans les agents conversationnels tels que
ceux que permet de créer IBM Watson ou ses concurrents.
Dans le jargon de l’innovation, on appelle cela de l’innovation par l’intégration. C’est
d’ailleurs la forme la plus courante d’innovation et l’IA ne devrait pas y échapper.
Cette innovation par l’intégration est d’autant plus pertinente que les solutions d’IA
relèvent encore souvent de l’artisanat et nécessitent beaucoup d’expérimentation et
d’ajustements.
Cette intégration est un savoir nouveau à forte valeur ajoutée, au-delà de l’intégration
traditionnelle de logiciels via des APIs classiques. Cette intelligence artificielle inté-
grative est à l’œuvre dans un grand nombre de startups du secteur et en particulier
dans celles de la robotique.
Le mélange des genres n’est pas évident à décrypter pour le profane : machine lear-
ning, deep learning, support vector machines, modèles de Markov, réseaux bayésiens,
réseaux neuronaux, méthodes d’apprentissage supervisées ou non supervisées, etc.
D’où un discipline qui est difficile à benchmarker d’un point de vue strictement tech-
nique et d’égal à égal. Ce d’autant plus que le marché étant très fragmenté, il y a peu
de points de comparaison possibles entre solutions. Soit il s’agit de produits finis du
grand public comme la reconnaissance d’images ou vocale, et d’agents conversation-
nels très à la mode en ce moment, soit il s’agit de solutions d’entreprises exploitant
des jeux de données non publics. Un nouveau savoir est à créer : le benchmark de
solutions d’IA ! Voilà un métier du futur !
La vie artificielle est un autre pan de recherche important connexe aux recherches sur
l’IA. Il s’agit de créer des modèles permettant de simuler la vie avec un niveau
d’abstraction plus ou moins élevé. On peut ainsi simuler des comportements com-
plexes intégrant des systèmes qui s’auto-organisent, s’auto-réparent, s’auto-répliquent
et évoluent d’eux-mêmes en fonction de contraintes environnementales.
Jusqu’à présent, les solutions d’IA fonctionnaient à un niveau de raisonnement relati-
vement bas. Il reste à créer des machines capables de gérer le sens commun, une
forme d’intelligence génétique capable à la fois de brasser le vaste univers des con-
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 110 / 160
naissances – au-delà de nos capacités – et d’y appliquer un raisonnement permettant
d’identifier non pas des solutions mais des problèmes à résoudre. Il reste à apprendre
aux solutions d’IA d’avoir envie de faire quelque chose. On ne sait pas non plus aider
une solution d’IA à prendre du recul, à changer de mode de raisonnement dynami-
quement, à mettre plusieurs informations en contexte, à trouver des patterns de res-
semblance entre corpus d’idées d’univers différents permettant de résoudre des pro-
blèmes par analogie. Il reste aussi à développer des solutions d’IA capables de créer
des théories et de les vérifier ensuite par l’expérimentation.
Pour ce qui est de l’ajout de ce qui fait de nous des êtres humains, comme la sensa-
tion de faim, de peur ou d’envie, d’empathie, de besoin de relations sociales, on en
est encore loin. Qui plus est, ce n’est pas forcément nécessaire pour résoudre des pro-
blèmes courants de l’univers des entreprises. Comme l’indique si bien Yuval Noah
Harari, l’auteur du best-seller ”Sapiens”20, “L’économie a besoin d’intelligence, pas
de conscience” ! Laissons donc une partie de notre intelligence voire une intelligence
plus développée aux machines et conservons la conscience, les émotions et la créati-
vité !
20
Intervenant en juin 2016 dans la conférence USI organisée par Octo Technology à Paris.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 111 / 160
Dans la plupart des cas, ces technologies “de luxe” sont intégrées dans des produits
grand public après quelques années. Ainsi, la puissance des super-calculateurs des
années 1990 s’est retrouvée dans les consoles de jeu des années 2000. Au lieu de
faire des calculs en éléments finis pour des prévisions météo, les consoles de jeux
calculent des millions de polygones pour simuler des images en 3D temps réel. Mais
cette puissance n’est pas homothétique dans toutes les dimensions. Si la puissance de
calcul est similaire, les capacités de stockage ne sont pas les mêmes.
Examinons donc de près comment cette fameuse loi s’applique pour des objets numé-
riques grand public. Prenons trois cas d’usages courants : un laptop plutôt haut de
gamme en 2006 et en 2016, l’évolution de l’iPhone entre sa première édition lancée
en juin 2007 et l’iPhone 6S lancé en septembre 2015 et puis l’évolution du haut dé-
bit fixe sur 10 ans.
En appliquant une belle loi de Moore uniforme, les caractéristiques techniques de ces
trois larrons devraient doubler tous les deux ans au minimum. Sur une période de 10
ans, cela donnerait 2 puissance 5 soient x32 et sur 8 ans, x16. Si le doublement inter-
venait tous les 18 mois, ces facteurs seraient respectivement de x101 et x40.
Commençons par un laptop haut de gamme à prix équivalent entre 2006 et 2016. J’ai
comparé deux modèles plutôt haut de gamme de la même marque : un Asus W7J de
2006 et un Asus Zenbook UX303UA de 2016, certes sorti en 2015. Mais entre fin
2015 et mi 2016, il n’y a pas eu de changements d’architecture des laptops, qui col-
lent à la roadmap d’Intel.
Aucun paramètre technique n’a évolué d’un facteur x32 et à fortiori d’un facteur
x100. Ceux qui ont le mieux progressé et qui ont un impact sur la performance perçue
par l’utilisateur sont la vitesse du moteur graphique (x12) et celle du Wi-Fi (x24).
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 112 / 160
Pour le reste, les gains sont très modestes. Le processeur est “seulement” 3,7 fois plus
rapide. La résolution des écrans a augmenté mais la résolution limitée de l’œil rend
caduque cette progression dès lors qu’un écran atteint la résolution 4K, qui com-
mence à apparaitre sur certains laptops.
Le plus grand retardataire est la batterie qui n’évolue quasiment pas. L’autonomie des
laptops a progressé non pas grâce aux batteries mais à la baisse de consommation des
processeurs et autres composants électroniques ainsi qu’à l’intelligence intégrée dans
les systèmes d’exploitation, aussi bien Windows que MacOS.
Les derniers processeurs Intel savent éteindre certaines de leurs parties lorsqu’elles ne
sont pas utilisées. Par contre, la densité des batteries s’est un peu améliorée et leur
cure d’amaigrissement a permis de créer des laptops plus fins.
Du côté de l’iPhone, la situation est plus contrastée et bien meilleure que pour les
laptops.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 113 / 160
Deux dimensions techniques ont bien progressé : le processeur qui est x18 fois plus
rapide et la communication data Internet mobile qui est x781 fois plus rapide, tout du
moins en théorie, car d’un point de vue pratique, le ratio réel est plus raisonnable. Et
encore, c’est lié au choix peu hardi du Edge au moment de la sortie du premier
iPhone alors que la 3G aurait très bien pu être supportée, réduisant ainsi l’écart de
performance entre l’iPhone 1 et le 6S.
Contrairement aux laptops, au lieu de voir les prix baisser, ils augmentent, position-
nement haut de gamme d’Apple oblige. Le poids augmente aussi car l’iPhone 6S a un
écran plus grand que celui du premier iPhone. Et comme pour les laptops, la capacité
de la batterie a très peu augmenté. J’ai indiqué les résolutions d’écrans et de capteurs
vidéo sachant qu’il n’y a pas de raison objective de vouloir poursuivre ad-vitam la loi
de Moore pour ce qui les concerne.
La situation est assez différente du côté du haut débit fixe. Vous pouvez stagner
pendant une décennie à la même vitesse d’accès à Internet et bénéficier tout d’un
coup d’un progrès soudain appliquant 10 ans de loi de Moore. Si vous passez par
exemple d’un ADSL à 12 Mbits/s en download et 1 Mbits/s en upload à de la fibre
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 114 / 160
chez Free à 1 Gbits/s en download et 200 Mbits/s en upload, le facteur multiplicateur
est respectivement de x83 et x200.
Si vous partiez d’un débit encore plus faible du fait d’un plus grand éloignement des
centraux télécoms, le facteur multiplicateur serait encore plus élevé. Mais plus votre
débit ADSL d’origine est faible, plus faibles sont les chances de voir la fibre arriver
chez vous du fait des travaux d’infrastructure à réaliser pour passer les fourreaux
transportant la fibre du central télécom jusqu’à chez vous !
Chez les autres opérateurs que Free, le facteur multiplicateur dépend de la technolo-
gie utilisée. Chez Numericable, c’est du FTTB à la performance à géométrie variable
selon l’âge du capitaine et surtout un débit montant assez limité. Chez Orange, vous
avez des taquets de débits à 100, 200 et 500 Mbits/s en download et de 50 Mbits/s à
200 MBits/s en upload selon l’offre commerciale. Et si vous attendez toujours la fibre,
la loi de Moore vous concernant est un encéphalogramme tout plat !
En ne conservant que les paramètres techniques où la loi de Moore est pertinente,
voici donc ce que cela donne sous une autre forme, à savoir la progression moyenne
tous les deux ans. On voit qu’à part la data WAN, on est loin du doublement tous les
deux ans de la performance !
La loi de Moore s’applique bien mieux aux liaisons réseaux haut débit fixe et mobiles
qu’à la capacité de calcul et de stockage, surtout sur ordinateurs personnels. Cela ex-
plique indirectement la montée en puissance des architectures en cloud. On peut plus
facilement répartir une grosse charge de calcul sur des serveurs que sur des postes de
travail ou des mobiles. On retrouve cette architecture dans Siri qui traite une bonne
part de la reconnaissance vocale côté serveurs. Au passage, la loi de Moore de la
vraie vie valide aussi le scénario de fiction de “Skynet” des films Terminator où c’est
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 115 / 160
une intelligence logicielle distribuée sur des millions de machines dans le réseau qui
provoque une guerre nucléaire !
Alors, la loi de Moore est foutue ? Pas si vite ! Elle avance par hoquets. Il reste en-
core beaucoup de mou sous la pédale pour faire avancer la puissance du matériel et
sur lequel l’IA pourrait surfer. Mais son redémarrage pourrait prendre du temps.
Puissance de calcul
La fameuse loi de Moore est mise en avant par les singularistes pour prédire le dépas-
sement de l’homme par l’IA à une échéance de quelques décennies. Seulement voilà,
la validation dans la durée de cette loi empirique de Moore n’est pas triviale comme
nous venons de le voir.
La question est revenue au-devant de la scène alors que cette loi fêtait ses 50 ans
d’existence. Un anniversaire commenté pour annoncer la fin de ses effets, tout du
moins dans le silicium et les technologies CMOS. Cette technologie est sur le point
d’atteindre un taquet aux alentours de 5 nm d’intégration sachant que l’on est déjà à
10 nm à ce jour, notamment chez Intel, et à 14 nm en version commerciale (Core M
et Core i de génération Skylake 2015). Les architectures multi-cœurs atteignent de
leur côté leurs limites car les systèmes d’exploitation et les applications sont difficiles
à ventiler automatiquement sur un nombre élevé de cœurs, au-delà de 4.
Le schéma ci-dessus et qui vient de Ray Kurzweil n’a pas été mis à jour depuis 2006.
Il est difficile d’obtenir un schéma sur l’application de la loi de Moore au-delà de
2010 pour les processeurs. Est-ce parce que l’évolution de la puissance de calcul s’est
calmée depuis ?
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 116 / 160
Dans le même temps, les découvertes en neuro-biologies évoquées précédemment
augmentent de plusieurs ordres de grandeur la complexité de la modélisation du fonc-
tionnement d’un cerveau humain. Bref, cela retarde quelque peu l’échéance de la sin-
gularité.
L’excellent dossier After Moore’s Law, paru dans The Economist en mars 2016,
détaille bien la question en expliquant pourquoi la loi de Moore des transistors
CMOS pourrait s’arrêter d’ici une douzaine d’année lorsque l’on descendra au niveau
des 5 nm d’intégration. Et encore, la messe n’est pas encore dite. A chaque nouvelle
génération d’intégration, les fondeurs se demandent s’ils vont pouvoir faire descendre
réellement le cout de fabrication des transistors. En-dessous de 14 nm, ce n’est pas du
tout évident. Mais l’ingénuité humaine a des ressources insoupçonnables comme elle
l’a démontré dans les générations précédentes de processeurs CMOS !
Il faudra tout de même trouver autre chose, et en suivant divers chemins de traverse
différents des processeurs en technologie CMOS.
Voici les principales pistes connues à ce jour et qui relèvent toutes plutôt du long
terme :
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 117 / 160
Le multi-patterning, que j’explique ici, permet d’en contourner les limitations. Mais il
coute tout aussi cher car il ajoute de nombreuses étapes à la fabrication des chipsets et
peut augmenter le taux de rebus. La loi de Moore s’exprime en densité de transistors
et aussi en prix par transistors. Si la densité augmente mais que le prix par transistor
augmente aussi, cela ne colle pas pour les applications les plus courantes.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 118 / 160
Il est possible d’imiter cette architecture 3D avec des couches métalliques multiples
dans les circuits intégrés mais elles coutent pour l’instant assez cher à produire et plus
on les empile, plus cela devient compliqué. Les processeurs les plus modernes com-
prennent une petite dizaine de couches de métallisation, comme indiqué dans ce
schéma d’origine Intel.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 119 / 160
Passer de l’électron au photon
C’est la photonique qui exploite des composants à base des matériaux dits “III-V”21.
Aujourd’hui, la photonique est surtout utilisée dans le multiplexage de données sur
les liaisons ultra-haut-débit des opérateurs télécoms, dans des applications très spéci-
fiques, ainsi que sur des bus de données optiques de supercalculateurs.
La startup française Lighton.io planche sur la création d’un coprocesseur optique ca-
pable de réaliser très rapidement des calculs sur de gros volumes de données et de
combinatoires. Le système s’appuie sur la génération de jeux de données aléatoires
permettant de tester simultanément plusieurs hypothèses de calcul, à des fins
d’optimisation. Les applications visées sont en premier lieu la génomique et l’Internet
des objets.
L’un des enjeux se situe dans l’intégration de composants hybrides, ajoutant des
briques en photonique au-dessus de composants CMOS plus lents. Intel et quelques
autres sont sur le pont.
Une fois que l’on aura des processeurs optiques généralistes, il faudra relancer le pro-
cessus d’intégration. Il est actuellement situé aux alentours de 200 nm pour la photo-
nique et la course se déclenchera alors pour descendre vers 10 à 5 nm comme pour le
CMOS actuel.
21
Un sujet que j’avais exploré dans Comment Alcatel-Lucent augmente les débits d’Internet en 2013.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 120 / 160
tiques pourraient servir à créer des agents intelligents dotés de facultés d’auto-
apprentissage rapide. Cela serait un chemin vers le développement de systèmes d’IA
créatifs.
En 2014, des chinois de l’Université de Sciences et Technologies de Hefei ont été
parmi les premiers à expérimenter des ordinateurs quantiques pour mettre en jeu des
réseaux de neurones artificiels, pour la reconnaissance d’écriture manuscrite. Leur
ordinateur quantique utilise un composé organique liquide associant carbone et fluor.
On n’en sait pas beaucoup plus !
Les équipes de la NASA ont créé de leur côté le QuAIL, le Quantum Artificial In-
telligence Laboratory, en partenariat avec Google Research. Il utilise un D-Wave
Two comme outil d’expérimentation, à ce jour le seul ordinateur quantique commer-
cial, diffusé à quelques unités seulement. Leurs publications scientifiques sont
abondantes mais pas faciles d’abord comme les autres ! Ce centre de la NASA est
situé au Ames Research Center, là-même où se trouve la Singularity University et à
quelques kilomètres du siège de Google à Mountain View.
Google annonçait fin 2015 avoir réussi à réaliser des calculs quantiques 100 millions
de fois plus rapidement qu’avec des ordinateurs classiques sur ce DWave-Two. Ces
tests sont mal documentés au niveau des entrées, des sorties et des algorithmes testés.
Il se pourrait même que ces algorithmes soient codés “en dur” dans les qubits des D-
Wave ! Qui plus est, la comparaison faite par Google avec les calculs sur ordinateurs
traditionnels s’appliquait à algorithme identique alors que les algorithmes utilisés
dans l’ordinateur quantique n’étaient pas optimisés pour ordinateurs traditionnels.
Bref, le sujet est polémique, comme le rapportent La Tribune ou Science et Avenir.
Est-ce une querelle entre anciens et modernes ? Pas vraiment car ceux qui doutent des
performances du D-Wave travaillent aussi sur les ordinateurs quantiques.
Début mai 2016, IBM annonçait mettre à disposition son ordinateur quantique expé-
rimental cryogénique de 5 Qubits en ligne dans son offre de cloud. On ne sait pas trop
quel type de recherche pourra être menée avec ce genre d’ordinateur ni quelles APIs
sont utilisées.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 121 / 160
Quid des recherches en France ? Le CEA de Saclay planche depuis longtemps sur la
création de circuits quantiques. Ils ont développé en 2009 un dispositif de lecture
d’état quantique non destructif de qubits après avoir créé l’un des premiers qubits en
2002. Et le CEA-LETI de Grenoble a de son côté récemment réalisé des qubits sur
composants CMOS grâce à la technologie SOI d’isolation des transistors sur le subs-
trat silicium des composants. Ces composants ont toutefois besoin d’être refroidis
près du zéro absolu (-273°C) pour fonctionner. Enfin, le groupe français ATOS, déjà
positionné dans le marché des supercalculateurs depuis son rachat de Bull, travaille
avec le CEA pour créer un ordinateur quantique à l’horizon 2030.
Dans son étude Quantum Computing Market Forecast 2017-2022, le cabinet Mar-
ket Research Media prévoit que le marché des ordinateurs quantiques fera $5B d’ici
2020, en intégrant toute la chaine de valeur matérielle et logicielle. Le premier mar-
ché serait celui de la cryptographie. Avant de parler de marché, il faudrait que cela
marche ! Et nous n’y sommes pas encore.
Chaque chose en son temps : la recherche, l’expérimentation puis l’industrialisation.
Nous n’en sommes qu’aux deux premières étapes pour l’instant.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 122 / 160
La notion d’IA intégrative pourrait aussi voir le jour dans les architectures matérielles.
Comme le cerveau qui comprend diverses parties spécialisées, un ordinateur doué
d’IA évoluée intégrera peut-être des architectures hybrides avec processeurs au gra-
phène, optiques et quantiques en compléments d’une logique de base en bon et vieux
CMOS !
Ceci est d’autant plus plausible que certaines techniques sont insuffisantes pour créer
un ordinateur générique, notamment les ordinateurs quantiques qui ne sauraient gérer
qu’une certaine classe de problèmes, mais pas comprimer ou décomprimer une vidéo
par exemple, ou faire tourner une base de données NoSQL.
Stockage
Si la loi de Moore a tendance à se calmer du côté des processeurs CMOS, elle conti-
nue de s’appliquer au stockage. Elle s’est appliquée de manière plutôt stable aux
disques durs jusqu’à présent. Le premier disque de 1 To (Hitachi en 3,5 pouces) est
apparu en 2009 et on en est maintenant à 8 To. Donc, 2 puissance 4 et Moore est sauf.
L’évolution s’est ensuite déplacée vers les disques SSD à mémoires NAND dont la
capacité, démarrée plus bas que celle des disques durs, augmente régulièrement tout
comme sa vitesse d’accès et le tout avec une baisse régulière des prix. Les perspec-
tives de croissance sont ici plus optimistes qu’avec les processeurs CMOS.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 123 / 160
Comme nous l’avions survolé dans le dernier Rapport du CES 2016, les mémoires
NAND 3D font des progrès énormes, notamment avec la technologie 3D XPoint
d’Intel et Micron qui combine le stockage longue durée et une vitesse d’accès équiva-
lente à celle la mémoire RAM associée aux processeurs. Elle est encore à l’état de
prototype mais sa fabrication ne semble pas hors de portée.
La technologie de mémoire 3D est aussi maîtrisée par des sociétés telles
que Samsung (ci-dessous, avec sa technologique V-NAND) et Toshiba (ci-dessus
avec sa technologie BiCS). Elle consiste à créer des puces avec plusieurs couches
empilées de transistors, ou de transistors montés en colonnes. L’e niveau
d’intégration le plus bas des transistors est ici équivalent à celui des CPU les plus
denses : il descend jusqu’à 10 nm.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 124 / 160
Des disques SSD de 16 To devraient arriver d’ici peu ! Pourquoi cette intégration
verticale est-elle possible pour la mémoire et pas pour les processeurs (GPU, CPU) ?
C’est lié à la résistance à la montée en température. Dans un processeur, une bonne
part des transistors fonctionne en même temps alors que l’accès à la mémoire est sé-
quentiel et donc n’active pas simultanément les transistors. Un processeur chauffe
donc plus qu’une mémoire. Si on empilait plusieurs couches de transistors dans un
processeur, il se mettrait à chauffer bien trop et s’endommagerait. Par contre, on sait
assembler des circuits les uns sur les autres pour répondre aux besoins d’applications
spécifiques.
Pour les supercalculateurs, une tâche ardue est à accomplir : accélérer la vitesse de
transfert des données du stockage vers les processeurs au gré de l’augmentation de la
performance de ces derniers. Cela va aller jusqu’à intégrer de la connectique à 100
Gbits/s dans les processeurs. Mais la mémoire ne suit pas forcément. Aujourd’hui, un
SSD connecté en PCI et avec un connecteur M.2 est capable de lire les données à la
vitesse vertigineuse de 1,6 Go/s, soit un dixième de ce qui est recherché dans les cal-
culateurs à haute performance (HPC). Mais cette vitesse semble supérieure à celle de
lecture d’un SSD ! Le bus de communication est devenu plus rapide que le stockage !
Avec 3D XPoint, l’accès aux données serait 1000 fois plus rapide qu’avec les SSD
actuels, modulo l’interface utilisée. Après un retard à l‘allumage, cette technologie
pourrait voir le jour commercialement en 2017. Elle aura un impact important pour
les systèmes d’IA temps réel comme IBM Watson. Rappelons-nous que pour Jeopar-
dy, l’ensemble de la base de connaissance était chargée en mémoire RAM pour per-
mettre un traitement rapide des questions !
Cette augmentation de la rapidité d’accès à la mémoire, qu’elle soit vive ou de longue
durée, est indispensable pour suivre les évolutions à venir de la puissance des proces-
seurs avec l’un des techniques que nous avons examinées juste avant.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 125 / 160
Des chercheurs d’université et même chez Microsoft Research cherchent à stocker
l’information dans de l’ADN. Les premières expériences menées depuis quelques
années sont prometteuses22. La densité d’un tel stockage serait énorme. Son avantage
est sa durabilité, estimée à des dizaines de milliers d’années, voire plus selon les
techniques de préservation. Reste à trouver le moyen d’écrire et de lire dans de
l’ADN à une vitesse raisonnable.
Aujourd’hui, on sait imprimer des bases d’ADN à une vitesse incommensurablement
lente par rapport aux besoins des ordinateurs. Cela se chiffre en centaines de bases
par heure au grand maximum. Cette vitesse s’accélèrera sans doute dans les années à
venir. Mais, comme c’est de la chimie, elle sera probablement plus lente que les
changements de phase ou de magnétisme qui ont court dans les systèmes de stockage
numérique actuels. La loi de Moore patientera donc quelques décennies de ce côté là,
tout du moins pour ses applications dans le cadre de l’IA.
Capteurs sensoriels
L’un des moyens de se rapprocher et même de dépasser l’homme est de multiplier les
capteurs sensoriels. La principale différence entre l’homme et la machine réside dans
la portée de ces capteurs. Pour l’homme, la portée est immédiate et ne concerne que
ses alentours. Pour les machines, elle peut-être distante et globale. On voit autour de
soi, on sent la température, on peut toucher, etc. Les machines peuvent capter des
données environnementales à très grande échelle. C’est l’avantage des réseaux
d’objets connectés à grande échelle, comme dans les “smart cities”. Et les volumes de
données générés par les objets connectés sont de plus en plus importants, créant à la
fois un défi technologique et une opportunité pour leur exploitation.
Le cerveau a une caractéristique méconnue : il ne comprend pas de cellules senso-
rielles. Cela explique pourquoi on peut faire de la chirurgie à cerveau ouvert sur
quelqu’un d’éveillé. La douleur n’est perceptible qu’à la périphérie du cerveau.
D’ailleurs, lorsque l’on a une migraine, c’est en général lié à une douleur périphé-
rique au cerveau, qui ne provient pas de l’intérieur. L’ordinateur est dans le même
cas : il n’a pas de capteurs sensoriels en propre. Il ne ressent rien s’il n’est pas con-
necté à l’extérieur.
Cette différence peut se faire sentir même à une échelle limitée comme dans le cas
des véhicules à conduite assistée ou automatique qui reposent sur une myriade de
capteurs : ultrasons, infrarouges, vidéo et laser / LIDAR, le tout fonctionnant à 360°.
Ces capteurs fournissent aux ordinateurs de bord une information exploitable qui va
au-delà de ce que le conducteur peut percevoir. C’est l’une des raisons pour les-
quelles les véhicules automatiques sont à terme très prometteurs et plus sécurisés. Ces
techniques sont déjà meilleures que les sens humains, surtout en termes de temps de
22
Sachant néanmoins qu’elles ont démarré en 1994 avec les travaux de Leonard M. Adleman aux USA, documentés dans Computing
with DNA paru dans Scientific American en 1998. A cette époque, Adleman voulait créer un ordinateur à base d’ADN. Mais sa
conclusion était que l’ADN était surtout un moyen intéressant de stockage de gros volumes d’information. J’ai remarqué au passage
dans l’article que le cout de la génération de molécules d’ADN était déjà relativement bas à cette époque : $1,25 la paire de bases
d’ADN. Il démarre en 2016 à $0,2, soit seulement 6 fois moins. En plus de 20 ans ! Encore un exemple où la loi de Moore ne s’est
pas du tout appliquée. Pour l’instant !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 126 / 160
réponse, de vision à 360° et de capacité d’anticipation des mouvements sur la chaus-
sée (piétons, vélos, autres véhicules).
Les capteurs de proximité intégrables à des machines comme les robots progressent
même dans leur bio mimétisme. Des prototypes de peau artificielle sensible existent
déjà en laboratoire, comme en Corée du Sud (ci-dessus, source dans Nature). L’une
des mécaniques humaines les plus difficiles à reproduire sont les muscles. Ils restent
une mécanique extraordinaire, économe en énergie, fluide dans le fonctionnement,
que les moteurs des robots ont bien du mal à imiter.
Les capteurs fonctionnent aussi dans l’autre sens : de l’homme vers la machine. Les
progrès les plus impressionnants concernent les capteurs cérébraux permettant à
l’homme de contrôler des machines, comme pour contrôler un membre artificiel ro-
botisé, une application pouvant restaurer des fonctions mécaniques de personnes han-
dicapées, voire de démultiplier la force de personnes valides, dans les applications
militaires ou de BTP. L’homme peut ainsi piloter la machine car la périphérie du cor-
tex cérébral contient les zones où nous commandons nos actions musculaires.
Des expériences de télépathie sont également possibles, en captant par EEG la pen-
sée d’un mot d’une personne et en la transmettant à distance à une autre personne en
lui présentant ce mot sous forme de flash visuel par le procédé TMS, de stimulation
magnétique transcraniale.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 127 / 160
Si on peut déjà alimenter le cerveau au niveau de ses sens, comme de la vue, en inter-
ceptant le nerf optique et en simulant le fonctionnement de la rétine ou par la TMS,
on ne sait pas l’alimenter en idées et informations abstraites car on ne sait pas en-
core vraiment comment et surtout où elles sont stockées.
Dans Mashable, une certaine Marine Benoit affirmait un peu rapidement en mars
2016 qu’une équipe avait mis au point “un stimulateur capable d’alimenter directe-
ment le cerveau humain en informations”. A ceci près que l’étude en question, Fron-
tiers in Human Neuroscience ne faisait état que d’un système qui modulait la capa-
cité d’acquisition par stimulation ! Pour l’instant, on doit se contenter de lire dans le
cerveau dans la dimension mécanique mais pas “écrire” dedans directement. On ne
peut passer que par les “entrées/sorties”, à savoir les nerfs qui véhiculent les sens,
mais pas écrire directement dans la mémoire. Mais ce n’est peut-être qu’un début !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 128 / 160
Energie
L’homme ne consomme en moyenne que 100 Watts dont 20 Watts pour le cerveau.
C’est un excellent rendement. Tout du moins, pour ceux qui font travailler leur cer-
veau. Ce n’est pas facile à égaler avec une machine et pour réaliser les tâches de base
que réalise un humain. Les supercalculateurs consomment au mieux quelques KW et
certains dépassent les MW.
Des progrès sont cependant notables dans les processeurs mobiles. Consommant
moins de 5 W, ils agrègent une puissance de calcul de plus en plus impressionnante
grâce à des architectures multi-cœurs, à un fonctionnement en basse tension, aux
technologies CMOS les plus récentes comme le FinFET (transistors verticaux) ou
FD-SOI (couche d’isolant en dioxyde de silicium réduisant les fuites de courant dans
les transistors et améliorant leur rendement énergétique) et à une fréquence d’horloge
raisonnable (entre 1 et 1,5 GHz). La technologie FD-SOI issue de STMicroelectro-
nics et Soitec gagne petit à petit du terrain, notamment chez Samsung, Global Foun-
dries et NXP.
La mécanique et l’énergie sont les talons d’Achille non pas de l’IA qui est distri-
buable là où on le souhaite mais des robots. Un homme a une autonomie d’au moins
une journée en état de marche convenable sans s’alimenter. Un robot en est encore
loin. D’où l’intérêt des travaux pour améliorer les batteries et notamment leur densité
énergétique. Un besoin qui se fait sentir partout, des smartphones et laptops aux véhi-
cules électriques en passant par les robots. Les progrès dans ce domaine ne sont pas
du tout exponentiels. Cela a même plutôt tendance à stagner. Dans les batteries, c’est
la loi de l’escargot qui s’appliquerait avec un quadruplement de la densité tous les 20
ans (source).
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 129 / 160
rie d’atteindre une densité énergétique 20 fois supérieure à celle des batteries ac-
tuelles, utilisées dans les véhicules électriques23.
Mais en elles sortent rarement, faute de pouvoir être industrialisées à un coût raison-
nable ou de bien fonctionner dans la durée. Parfois, on arrive à une densité énergé-
tique énorme, mais cela ne fonctionne que pour quelques cycles de charge/décharge.
Trop injuste !
Résultat, pour le moment, la principale voie connue est celle de l’efficacité indus-
trielle, choisie par Elon Musk dans la création de sa Gigafactory dans le Nevada, une
usine à $5B qui exploitera la technologie de batteries standards de Panasonic, qui a
aussi mis $1B au pot pour le financement de l’usine. Une usine qui est aussi proche
d’une mine de Lithium, à Clayton Valley, l’un des composés clés des batteries et
qui démarrera sa production en 2020.
On peut cependant citer l’étonnante performance d’un laboratoire de l’université de
Columbia qui a réussi à alimenter un composant CMOS avec de l’énergie provenant
de l’ATP (adénosine triphosphate), la source d’énergie principale des cellules vi-
vantes qui est générée par les nombreuses mitochondries qu’elles contiennent. Cela
ouvre des portes vers la création de solutions hybrides biologiques et informatiques
insoupçonnées jusqu’à présent.
Sécurité
C’est un sujet évoqué de manière indirecte, au sujet du jour où l’IA dépassera
l’intelligence de l’homme et s’auto-multipliera au point de mettre en danger l’espèce
humaine. Cela part du principe qu’une intelligence peut se développer à l’infini in-
silico. Pourquoi pas, dans certains domaines. Mais c’est faire abstraction d’un point
clé : l’intelligence est le fruit, certes, du fonctionnement du cerveau, mais également
de l’interaction avec l’environnement et avec les expériences sensorielles.
23
Cf http://blog.erios.org/index.php?post/2013/12/07/Stockage-de-l-%C3%A9lectricit%C3%A9%3A-les-batteries-du-futur-face-au-
tout-p%C3%A9trole.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 130 / 160
L’intelligence cumule la capacité à créer des théories expliquant le monde et à des
expériences permettant de le vérifier. Parfois, la vérification s’étale sur un demi-
siècle à un siècle, comme pour les ondes gravitationnelles ou le Boson de Higgs.
Cette capacité de théorisation et d’expérimentation de long terme n’est pour l’instant
pas accessible à une machine, quelle qu’elle soit.
L’IA présente des risques bien plus prosaïques, comme toutes les technologies numé-
riques : dans sa sécurité. Celle d’un système d’IA peut être compromise à plusieurs
niveaux : dans les réseaux et le cloud, dans les capteurs, dans l’alimentation en éner-
gie. Les bases de connaissances peuvent aussi être induites en erreur par l’injection
d’informations erronées ou visant à altérer le comportement de l’IA, par exemple
dans le cadre d’un diagnostic médical complexe. On peut imaginer l’apparition dans
le futur d’anti-virus spécialisés pour les logiciels de machine learning.
Les dangers de l’IA, s’il en existe, sont particulièrement prégnants dans l’interaction
entre les machines et le monde extérieur. Un robot n’est pas dangereux s’il tourne en
mode virtuel dans une machine. Il peut le devenir s’il tient une arme dans le monde
extérieur et qu’il est programmé par des forces maléfiques. Le “kill switch” de l’IA
qui permettrait de la déconnecter si elle devenait dangereuse devrait surtout porter sur
sa relation avec le monde physique. Les films de science fiction comme Transcen-
dance montrent que rien n’est sûr de ce côté là et que la tendance à tout automatiser
peut donner un trop grand contrôle du monde réel aux machines.
L’homme est déjà dépassé par la machine depuis longtemps, d’abord sur la force
physique, puis de calcul, puis de mémoire et enfin de traitement. Mais la machine a
toujours été pilotée par l’homme. L’IA semble générer des systèmes pérennes dans le
temps ad vitam aeternam du fait de processus d’apprentissage qui s’agrègent avec le
temps et de la mémoire presque infinie des machines. L’IA serait immortelle. Bon,
tant que son stockage ne plante pas ! Un disque dur peut planter à tout bout de champ
au bout de cinq ans et un disque SSD actuel ne supporte au mieux que 3000 cycles
d’écriture !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 131 / 160
Les dangers perceptibles de l’IA sont à l’origine de la création d’OpenAI, une initia-
tive visant non pas à créer une IA open source (cela existe déjà dans le machine lear-
ning) mais de surveiller ses évolutions. Il s’agit d’une ONG créée par Elon Musk qui
vise à s’assurer que l’IA fasse le bien et pas le mal à l’humanité. Elle est dotée de
$1B et doit faire de la recherche. Un peu comme si une organisation était lancée pour
rendre le capitalisme responsable24.
Autre méthode, se rassurer avec Demystifying Machine Intelligence de Piero Sca-
ruffi qui cherche à démontrer que la singularité n’est pas pour demain. Il s’appuie
pour cela sur une vision historique critique des évolutions de l’intelligence artificielle.
Il pense que les progrès de l’IA proviennent surtout de l’augmentation de la puissance
des machines, et bien peu des algorithmes, l’effet donc de la force brute.
Selon lui, l’homme a toujours cherché une source d’intelligence supérieure, qu’il
s’agisse de dieux, de saints ou d’extra-terrestres. La singularité et les fantasmes au-
tour de l’IA seraient une nouvelle forme de croyance voire même de religion, une
thèse aussi partagée par Jaron Lanier, un auteur anticonformiste qui publiait Singula-
rity is a religion just for digital geeks en 2010.
Piero Scaruffi prend aussi la singularité à l’envers en avançant que l’ordinateur pour-
ra dépasser l’homme côté intelligence parce que les technologies rendent l’homme
plus bête, en le déchargeant de plus en plus de fonctions intellectuelles, la mémoire
en premier et le raisonnement en second ! Selon lui, le fait que les médias numériques
entrainent les jeunes à lire de moins en moins de textes longs réduirait leur capacité à
raisonner. On peut d’ailleurs le constater dans les débats politiques qui évitent la pen-
sée complexe et privilégient les simplismes à outrance. J’aime bien cet adage selon
lequel l’intelligence artificielle se définit comme étant le contraire de la bêtise natu-
relle. Cette dernière est souvent confondante et rend le défi de la création d’une intel-
ligence artificielle pas si insurmontable que cela.
Pour Piero Scaruffi, en tout cas, l’intelligence artificielle est d’ailleurs une mauvaise
expression. Il préfère évoquer la notion d’intelligence non humaine. Il pense aussi
qu’une autre forme d’intelligence artificielle pourrait émerger : celle d’hommes dont
on aura modifié l’ADN pour rendre leur cerveau plus efficace. C’est un projet du
monde réel, poursuivi par les chinois qui séquencent des milliers d’ADN humains
pour identifier les gènes de l’intelligence ! Histoire de réaliser une (toute petite) partie
des fantasmes délirants du film Lucy de Luc Besson !
24
Cf OpenAI dans Wikipedia et Why you should fear artificial intelligence paru dans TechCrunch en mars 2016.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 132 / 160
Pour Daniel C. Dennett, le véritable danger n’est pas dans les machines plus intelli-
gentes que l’homme mais plutôt dans le laisser-aller de ce dernier qui abandonne son
libre arbitre et confie trop de compétences et d’autorité à des machines qui ne lui sont
pas supérieures.
Et si le plus grand risque était de ne rien faire ? Pour toutes ces technologies et re-
cherches citées dans cet article, est-ce que l’Europe et la France jouent un rôle mo-
teur ? Une bonne part de cette R&D côté hardware est concentrée au CEA. Pour
l’industrie, ce n’est pas évident, à part peut-être la R&D en photonique chez Alcatel-
Lucent qui même si elle dépend maintenant de Nokia, n’en reste pas moins toujours
en France.
Il reste aussi STMicroelectronics qui reste très actif dans les capteurs d’objets con-
nectés. De son côté, la R&D côté logicielle est dense, que ce soit à l’INRIA ou au
CNRS.
Reste à savoir quelle “technologie de rupture” sortira de tout cela, et avec une trans-
formation en succès industriel à grande échelle qui passe par de l’investissement, de
l’entrepreneuriat et de la prise de risque car de nombreux paris doivent être lancés en
parallèle pour n’en réussir que quelques-uns.
Faut-il pour autant lancer une « stratégie industrielle » coordonnée dans l’intelligence
artificielle. L’histoire récente a montré que l’Etat devait créer les conditions de
l’émergence d’innovation plutôt que chercher à les micro-manager. Donc, il s’agit
une fois encore de poursuivre le développement d’une politique qui favoriser
l’innovation et les startups. Et aussi une politique qui investit de manière avisée dans
les sujets porteurs au niveau de la recherche.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 133 / 160
La robotisation en marche des métiers
Prenons maintenant un peu de recul sur la robotisation en marche des métiers liée aux
avancées de l’intelligence artificielle vues jusqu’à présent.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 134 / 160
Ensuite, on se trompe souvent sur le terme et même la nature des chamboulements.
Surestimés à court terme, sous-estimés à long terme, mais surtout mal appréhendés
dans leur réalité technique.
Ainsi, dans Les robots veulent déjà nous piquer notre job d’Emmanuel Ghes-
quier qui commente une étude d’un certain Moshe Vardi de l’Université Rice du
Texas, il est indiqué que “On a pu voir avec les robots Pepper que certains robots
pouvaient donner des conseils de gastronomie ou d’œnologie dans les supermarchés
Carrefour ou qu’une boutique de téléphonie allait fonctionner à 100% avec des em-
ployés robotisés au Japon”. L’auteur qui relaie cela n’a pas du voir Pepper à l’œuvre
car, au stade actuel de son développement, il est encore plus que brouillon ! J’avais
même pu le constayer en 2014 dans une boutique Softbank dans le quartier Omote-
sando (photos) où ils commençaient à être déployés.
Les robots Pepper et Romeo d'Aldebaran Robotics (groupe Softbank) en apparente discussion, pendant l'événement des
10 ans de Cap Digital à Paris fin mars 2016. En fait, ils ne discutent pas vraiment. Et un shutdown avait bloqué le pre-
mier pendant de longues minutes. Work still in progress !
En y regardant de près, l’étude en question est un article publié dans The Conversa-
tion, Are robots taking our jobs. Il a bien du mal à faire le tri dans les évolutions de
l’emploi aux USA entre ce qui provient de l’automatisation, de la globalisation et de
la concurrence asiatique dans l’industrie manufacturière et même indienne, dans les
emplois concernant les services informatiques. L’emploi a surtout migré géographi-
quement. Les emplois de perdus dans l’industrie aux USA et en Europe se sont re-
trouvés en Asie. C’est le “monde plat” de Thomas Friedman.
Autre exemple légèrement exagéré : celui du fonds d’investissement Deep
Knowledge Venture de Hong Kong qui aurait nommé en 2014 un logiciel
d’intelligence artificielle à son board dénommé VITAL ! Il sert à identifier les projets
les plus prometteurs dans la santé, la spécialité de ce fonds de capital risque. Evi-
demment, le relai de cette annonce a donné lieu à quelques exagérations : le logiciel
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 135 / 160
est ainsi facilement passé de membre du board à CEO de l’entreprise. On n’est plus à
une exagération près pour forcer le trait. Mais c’est comme si on disait que Excel est
à la tête des entreprises, ce qui n’est d’ailleurs pas si faux que cela dans pas mal de
cas ! Au passage, on ne peut que nommer des personnes physiques dans ces rôles-là,
même à Hong Kong 25!
Une analyse sur l’impact de la robotisation sur les emplois devrait porter sur leur
structure. Les métiers sont très divers et fragmentés. Rien que dans la santé, on trouve
des dizaines de types d’emplois et spécialités différentes. Il en va de même dans les
services. Les startups s’attaquent en général en priorité à des cibles à la fois faciles et
volumineuses, là où l’on peut générer une croissance exponentielle et de belles éco-
nomies d’échelle au niveau mondial. Les kinésithérapeutes seront-ils remplacés par
des robots bipèdes ? Probablement moins rapidement que les conducteurs de camions
car ils sont moins nombreux, donc ne présentant pas les mêmes économies d’échelle
potentielles ! Et l’automatisation du travail d’un kiné est plus complexe que celle
d’un conducteur de camion. L’innovation a ceci de particulier qu’elle permet aussi la
création de métiers nouveaux, qu’elle recompose le paysage économique entier et
celui des métiers.
25
Cf https://en.wikipedia.org/wiki/Deep_Knowledge_Ventures.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 136 / 160
L’une des études les plus sérieuses sur cette question est anglaise : The Future of
Employment: How susceptible are jobs to computerisation? Publiée en 2013, elle
segmente avec plus de précisions que la moyenne les métiers et leurs risques d’être
remplacés par des machines. Le calcul du risque s’appuie sur trois formes
d’intelligence clés des métiers : l’intelligence motrice (perception et manipulations),
l’intelligence créative et l’intelligence sociale.
On y constate que la situation est très polarisée : il y a d’un côté des métiers à très
faible risque d’automatisation (<20%) comme les fonctions de management, dans la
finance, dans le numérique, l’éducation et même la santé, et de l’autre, des métiers à
très fort rique d’automatisation (>60%) et surtout dans les services, la vente et
l’administratif (schéma ci-dessus).
En tout cas, il ne sera pas nécessaire d’atteindre un quelconque point de singularité où
l’intelligence de la machine dépasserait l’homme pour que les tsunamis de l’emploi
se produisent. Ils peuvent intervenir bien avant ! Et pour cause : bien des métiers
d’exécution relèvent de tâches très répétitives qui sont sujettes à l’augmentation de
l’automatisation dans un premier temps, sans passer par la case de l’AGI,
l’intelligence artificielle générale, celle qui remplacerait totalement l’intelligence
humaine, puis la dépasserait rapidement par la force démultiplicatrice des machines.
Les études de cas mises en avant dans les ouvrages sur le futur de l’emploi collent
souvent à l’actualité marketing du secteur de l’IA. Les livres parus après 2011 com-
mencent presque tous par évoquer la victoire d’IBM Watson dans Jeopardy. A partir
de 2013, ils passent aux prescriptions en cancérologie, l’une des applications com-
merciales de Watson. Depuis environ 2011, nous avons droit aux Google Car et
autres avancées dans la conduite automatique. Récemment, les agents conversation-
nels (chatbots) sont revenus au gout du jour, du fait de divers lancements comme
chez Facebook.
En quelques années, les études de cas brandies en trophées peuvent perdre de leur
substance. Il a été fait beaucoup de cas de la décision du Taïwanais Foxconn en 2011
de déployer un million de robots pour remplacer leurs travailleurs de ses usines en
Chine qui demandaient des augmentations de salaire ou se suicidaient. Quatre ans
plus tard, seulement 50000 robots avaient été déployés, ce qui ne présage rien de
leur capacité à réaliser l’objectif annoncé mais illustre la difficulté à robotiser certains
métiers, même répétitifs.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 137 / 160
Dans cette abondante littérature sur le futur de l’emploi, les fondements scientifiques
et technologiques des prédictions sont rarement analysés. S’y mêlent allègrement la
science-fiction, la science et la fiction. Nous avons vu dans la partie précédente que la
pérennité ou tout du moins la stabilité de la loi de Moore étaient loin d’être évidentes.
Les prévisions sont souvent vaguement plausibles mais très vagues côté timing !
Dans le top de l’exagération technique, nous avons par exemple Tomorrowland de
Steven Kotler (2015), qui prédit monts et merveilles singularistes allant de
l’intelligence artificielle générale (AGI) autoréplicable jusqu’au téléchargement des
cerveaux dans un ordinateur : “Yet it is worth noting that Moore’s Law states that
computers double in power every twelve months […]. Biotechnology, meanwhile, the
field where mind uploading most squarely sits, is currently progressing at five times
the speed of Moore’s Law. […] people alive today will live long enough to see their
selves stored in silicon and thus, by extension, see themselves live forever.”. Nous
avons donc une loi de Moore deux fois plus rapide dans les processeurs que dans la
vraie vie (12 vs 24 mois) et des “biotechnologies” qui évoluent cinq fois plus rapide-
ment que la loi de Moore, alors que cette vitesse ne concerne que le cas particulier de
l’évolution du coût du séquençage de l’ADN, observée sur la période courte 2007-
2011. Evolution qui s’est bien calmée les 5 années suivantes !
Ces livres oublient un autre phénomène induit par le numérique : le transfert du tra-
vail non pas seulement vers les machines mais aussi vers les clients, que l’on observe
avec les distributeurs automatiques et caisses automatiques, le e-commerce, la SDA
(sélection directe à l’arrivée) des centres d’appels, les banques en ligne et les assu-
rances. Comme la valeur économique du temps des gens à faible revenu est faible,
elle est absorbée en échange de services en théorie plus rapides. C’est un principe
également courant dans l’économie collaborative, qu’elle concerne les professionnels
(cas de Uber, version VTC) ou les particuliers (Blablacar, Aibnb).
Du côté de la vision macro-économique, la majorité de ces ouvrages ont une fâcheuse
tendance à se focaliser sur la situation aux USA et à ne pas adopter une approche
mondiale du problème. Ils n’évoquent pas non plus des fonctionnaires qui sont sou-
vent les derniers a être robotisés car protégés par la lenteur de l’innovation dans les
administrations et le manque de courage politique.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 138 / 160
Ces livres font aussi peu de cas de prédictions sur le devenir du système financier. Ils
indiquent qu’il est à l’origine de la concentration de la richesse sur les plus fortunés,
qu’il détourne la valeur ajoutée des salaires vers le capital, et qu’il pousse à
l’automatisation, faisant courir l’économie à sa perte. Et pourtant, le système finan-
cier est basé sur un point clé, bien mis en avant par Yuval Harari dans l’excellent
“Sapiens” qui relate de manière très synthétique les dynamiques de l’histoire de
l’humanité : le système financier, surtout celui des prêts, repose sur la confiance dans
le futur. Cette confiance est la clé de voûte du capitalisme et du système financier. Or
cette confiance est en train de s’effondrer pour tout un tas de raisons (emploi, dette,
environnement, …). Cela se retrouve dans les faibles taux d’intérêts actuellement pra-
tiqués. Si la robotisation met à genoux le système financier et l’économie derrière,
des freins naturels se mettront peut-être en place. Ou pas, car le pire est toujours pro-
bable !
Autre manque de prédiction : l’impact des progrès issus de l’IA sur la démographie !
Si la durée de vie s’allonge et le confort s’améliore, la démographie pourrait voir sa
croissance ralentir, comme c’est le cas au Japon isolationniste depuis quelques dé-
cennies. Dans la réalité, elle restera inégale. Les technologies issues de l’IA ne se dé-
ploient pas à la même vitesse selon les continents et rien ne dit qu’elles éradiqueront
les inégalités sur l’ensemble de la planète, surtout si le moteur de leur déploiement est
hautement capitalistique.
La Ludditisation des métiers n’est généralement pas évoquée par les prévisionnistes,
du nom des Luddites qui résistèrent au début du 19 ième siècle contre le développement
des machines à tisser au Royaume-Uni. Tandis que la Reine Elisabeth I avait refusé
l’octroi d’un brevet à William Lee en 1589, après son invention de la machine à tisser
les bas, craignant de générer du chômage chez les ouvriers textiles, le gouvernement
de sa Majesté avait décidé d’envoyer la troupe contre les ouvriers récalcitrants au
progrès, entre 1806 et 1811. Un gouvernement élu par un parlement dominé par des
entrepreneurs ! Quelles forces pourraient résister à l’automatisation des métiers ?
Certains métiers ont-ils une meilleure capacité de résistance que d’autres, notamment
par la voie de la règlementation ? Nous avons peu d’exemples résilients dans le
temps !
Les ouvrages n’intègrent pas non plus dans leurs scénarios l’épineuse question de la
production d’énergie qui est incontournable pour tout développement économique, y
compris dans le numérique. L’énergie ? Elle est là, c’est le soleil ! Le seul véritable
problème est d’apprendre à la dompter et à la stocker.
Les matières premières ? On en trouvera en fonction des besoins. Ces derniers font
évoluer les techniques de recherche et on trouve de tout, y compris dans le domaine
des terres rares.
Et la question environnementale qui nous rattrape à grandes enjambées ? Le passage
au solaire réglera naturellement une bonne partie du problème sur le long terme !
Les optimistes de l’innovation estiment que, grâce à l’IA, l’Homme sera capable de
résoudre tous ces problèmes, presque d’un coup de baguette magique. En exagérant
un peu, l’IA est devenue en quelque sorte la solution de sous-traitance ultime des so-
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 139 / 160
ciétés procrastinatrices et des fainéants : ne nous attaquons pas aux problèmes qui
fâchent et attendons que l’IA et la robotique fassent le boulot à notre place ! C’en est
presque un éloge du laisser-aller.
Deux ouvrages intéressants traitent assez bien de ces questions : The beginning of
infinity de David Deutsch, qui défend un point de vue selon lequel l’infini et
l’innovation sont intimement liés et qu’il ne faut pas de mettre des barrières à notre
capacité d’innovation. Et puis The infinite resource de Ramez Naam qui fait un bi-
lan circonstancié des défis qui se présentent pour gérer les ressources en apparence
limitées de la planète côté énergie, agriculture et matières première. Il équilibre bien
ces difficultés et les progrès techniques à venir qui permettront de les contourner.
Revue de lectures
Aller, c’est parti pour une petite revue éditoriale sur la robotisation des métiers et le
futur des emplois !
Rise of the robots and the threat of a jobless future (2016) de Martin Ford est
l’ouvrage le mieux documenté de cette série. Il évoque un bon nombre des méca-
nismes macro-économiques des précédentes révolutions et crises industrielles, et de
ce qui pourrait advenir dans le futur.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 140 / 160
Sa thèse principale est que les révolutions numériques passées et à venir contribuent à
réduire l’emploi dans les classes moyennes et à favoriser d’un côté l’émergence
d’emplois de bas niveaux mal payés et de l’autre d’emplois de haut niveau bien payés.
C’était déjà anticipé dans le rapport Triple Revolution produit en 1964 pour
l’administration de Lyndon B. Johnson, le successeur de JFK. Ses auteurs
s’alarmaient déjà sur risques les risques de l’automatisation, mettant en avant la diffi-
culté de remplacer les emplois supprimés par la modernisation à un rythme suffi-
samment rapide. Il était très en avance sur son temps, alors que l’informatique n’en
était encore qu’à ses balbutiements. Juste avant la sortie du mythique mainframe IBM
360, en 1965, c’est dire !
Aux USA, les 5% des foyers les plus aisées représentaient 27% de la consommation
en 1992 et 38% en 2012. Les 80% les moins aisés sont passés de 47% à 39% dans le
même temps. Après la crise de 2008, le top 5% avait augmenté ses dépenses de 17%
et le reste n’avait fait que rester au niveau de 2008. D’ou l’émergence de business
comme Tesla qui cible, pour l’instant, surtout les 5% les plus riches. Les nouvelles
entreprises issues du numérique sont automatisées dès le départ et ont moins de sala-
riés. Elles profitent à plein de la productivité issue du numérique. Les exemples un
peu éculés et trop généralisant de Whatsapp et Instagram sont mis en avant pour illus-
trer le point. On nous bassine un peu trop avec les $16B de “valeur” de Whatsapp
générés par 55 employés, alors que lorsqu’elle a été acquise par Facebook, cette so-
ciété n’avait quasiment pas de revenus.
En France, le régime général des retraites a vu son poids dans le PIB évoluer de
11,2% en 1990 à 13,8% en 2008, soient 2,6% de progression. Coïncidence ? Ne se-
rait-ce pas finalement une solution différente au même problème ? A sa-
voir, augmenter les charges sociales et taxes pour financer une retraite par répartition
en lieu et place d’une augmentation du profit des grandes entreprises qui rémunèrent
un système de retraite par capitalisation ? C’est probablement à moitié vrai et à moi-
tié faux car les profits des grandes entreprises françaises ont aussi augmenté dans la
même période. Mais comme les actions du CAC40 sont détenues par des investis-
seurs étrangers, il se trouve qu’ils alimentent aussi les systèmes de retraite de pays
étrangers, notamment anglo-saxons qui en sont friands !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 142 / 160
Le paradoxe est que la pénurie de compétences qualifiées ralentit ce phénomène de
concentration de la valeur sur les plus riches ! Si on y pourvoyait plus rapidement,
cela détruirait encore plus de jobs mal payés, et bien plus que de jobs bien payés de
créés. La limitation des visas de travail type H1B1 pour les cadres qualifiés étrangers
imposée par le congrès US créerait une inertie souhaitable pour protéger les emplois
non qualifiés. En même temps, elle favorise l’offshore de métiers qualifiés en plus
des métiers faiblement qualifiés qui sont déjà externalisés à l’étranger.
Autre point intéressant, l’auteur fait état des écueils des MOOCs, présentés comme la
solution miracle pour l’enseignement. Deux études menées par l’Université de Penn-
sylvanie en 2013 et qu’il ne faudrait pas forcément généraliser montrent que les résul-
tats d’étudiants ayant suivi des MOOCs étaient moins bons que ceux d’étudiants pas-
sant par des méthodes traditionnels. Il ne faut certainement pas jeter le bébé du
MOOC avec l’eau du bain de ces études. Les méthodes mixant MOOCs et enseigne-
ment IRL (in real life) sont probablement à favoriser.
Le livre fait aussi état d’opinions divergentes sur l’avenir de l’IA. L’expert en
sciences cognitives Gary Marcus trouve que les performances récentes de l’IA sont
survendues. Pour Noam Chomsky, qui s’est penché sur les sciences cognitives pen-
dant 60 ans, on est encore à des millénaires de la création de machines intelligentes
comme l’homme et que la singularité reste du domaine de la science fiction. Même
opinion pour le psychologue cognitiviste Steven Pinker, le biologiste P. Z. Myers et
même pour Gordon Moore. Il évoque aussi l’histoire de la National Nanotechnology
Initiative lancée en 2000, qui survendait l’idée de créer des nano-machines au niveau
des atomes et s’est ensuite rabattue sur des objectifs plus raisonnables.
Martin Ford évoque l’intérêt du revenu minimum qui est souvent présenté comme la
solution pour traiter le problème de la disparition trop rapide d’emplois liés à la robo-
tisation. C’est une sorte d’Etat providence générique poussé à l’extrême quand il
n’est plus en mesure de créer les conditions d’une activité pour tous. Ces débats
émergent avant même que la richesse permettant de le financer ne soit créée et que de
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 143 / 160
nouveaux métiers soient automatisés. La Finlande est parfois mise en avant comme
validant le principe alors que le revenu minimum n’y a été ni voté, ni encore appliqué
à fortiori !
Les questions clés sont nombreuses. Quel est le niveau de ce revenu minimum ? Est-
il là juste pour simplifier les systèmes existants de redistribution ? Comment est-il
financé s’il est plus élevé ? Comment est-il différentié en fonction de la situation des
foyers ? Comment évite-t-il de décourager les gens de travailler là où cela reste né-
cessaire ? Quel serait son impact si mis en place dans des pays et pas dans d’autres ?
Quel impact sur les flux migratoires qui créent déjà une pression certaine ? Il existera
toujours des inégalités marquées entre pays, en plus de celles qui existent entre mi-
lieux sociaux. Ce débat a démarré il y a plus de 11 millénaires avec les débuts de
l’agriculture. Il s’est poursuivi avec toutes les autres révolutions technologiques et
industrielles suivantes et n’est pas prêt de se terminer.
Dans Race against the machine (2012) et The Second Machines Age” (2014), Erik
Brynjolfsson et Andrew Mcafee font les mêmes constats que le livre précédent sur la
concentration de la richesse sur les 5% les plus aisés.
Ils rappellent qui, si l’on considère aujourd’hui encore que les anciennes révolutions
industrielles ont créé tant d’emplois, c’est parce que l’on a enlevé de l’équation les
chevaux et autres bêtes de somme qui ont perdu leur utilité et ont disparu au passage,
ou bien, ont été transformés en chair à steaks. Ils étaient ce que sont aujourd’hui les
travailleurs à bas salaire dont l’activité est en voie d’être automatisée, modulo les
steaks. Le bilan écologique est aussi bien connu : c’est la terre qui a payé le prix de la
croissance humaine !
Ils décrivent le scénario de l’offshore qui pourrait menacer l’emploi dans les pays à
faible cout de main d’œuvre : les métiers délocalisés étaient les plus codifiables et
donc, automatisables en priorité lorsque la technologie le permettra. Cela protège
pour une part les pays occidentaux. A ceci près que les métiers codifiables non délo-
calisables pour des raisons physiques sont aussi automatisables. A contrario, le déve-
loppement des robots réduit l’intérêt des délocalisations dans l’industrie. Il permet en
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 144 / 160
théorie une relocalisation des usines, et la création d’emplois locaux de production,
d’installation et de maintenance de robots ainsi que dans la supply chain.
Le scénario des auteurs met en avant les mêmes gagnants et perdants : les personnes à
haut niveau de qualification vs les personnes faiblement qualifiées, les entreprises
superstars à croissance exponentielle et les autres, et enfin le capital contre le travail.
Il s’appuie sur le fait que, ces dernières décennies, les salaires ont déjà augmenté pour
les personnes les plus qualifiées et baissé pour les moins qualifiées.
On pourrait ajouter à cette analyse la possibilité d’un ajustement de la population
mondiale en fonction des glissements de valeur provoqués par la robotisation. Quelle
serait l’influence de la robotisation sur la natalité ? Et surtout de la prolongation de la
durée de la vie, sans même parler de vie éternelle. Plus la longévité augmente,
comme au Japon, plus la natalité baisse. A court et moyen terme, cela résout le pro-
blème de l’emploi par le vide. Mais une société vieillissante peut enclencher son dé-
clin inexorable. L’impact d’un éventuel revenu de base ne serait pas neutre. Avec lui,
la démographie n’irait plus naturellement à la baisse.
Les deux auteurs, qui sont de la MIT Sloan School of Management, proposent un
plan d’action en quatre points qui s’inspire en partie des propositions du rapport
Triple Revolution de 1964 :
Investir dans l’éducation, en payant mieux les enseignants, en les rendant respon-
sables, et attirer aux USA les immigrants qualifiés. Côté cursus, ils recommandent
d’investir dans la créativité, dans l’identification de tendances et dans la commu-
nication complexe. Ils font remarquer que l’homme plus la machine sont plus
puissants qu’une machine seule. Donc, associer la créativité et la maitrise de
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 145 / 160
l’usage des technologies reste une belle protection. Ils considèrent que tous les
métiers qui requièrent à la fois de la créativité et une forte sensibilité motrice ne
sont pas prêts d’être automatisés (cuisiniers, jardiniers, réparateurs, dentistes). Les
auteurs font aussi preuve de bon sens en rappelant que notre imagination est limi-
tée pour prédire les emplois du futur. On n’anticipe pas assez la nature des pro-
blèmes existants et à venir qui vont générer leurs propres métiers.
Développer l’entrepreneuriat : l’enseigner comme une compétence dans
l’ensemble de l’enseignement et pas seulement dans les meilleures business
schools, réduire les règlementations qui ralentissent la création d’entreprise, et
créer un visa pour les entrepreneurs. Ce visa s’est retrouvé dans l’initiative “Star-
tup Visa Act” lancée en 2011 par l’administration Obama mais qui n’est toujours
pas validée par le Congrès US. Ils recommandent aussi d’encourager les innova-
tions d’organisation et du travail collaboratif pour exploiter ce qu’il reste
d’utilisable du temps et des compétences des gens inoccupés.
Développer l’investissement dans l’innovation, la recherche et les infrastructures,
notamment dans les télécommunications. Un grand classique des pays modernes
comme des pays émergents.
Côté lois et fiscalité, ne pas alourdir la législation du travail. Rendre les em-
bauches plus attractives que la robotisation des métiers au niveau des charges so-
ciales et taxes, ce qui rappelle une bonne partie de la politique de l’emploi en
France, qui ne nous réussit pas si bien. Ne pas réguler les nouvelles activités. Ré-
duire les subventions aux emprunts immobiliers et les réallouer à l’éducation et à
la recherche. La propriété immobilière a tendance à réduire la mobilité géogra-
phique. Réduire les subventions directes et indirectes aux services financiers. Ré-
former le système des brevets et réduire la durée d’application du copyright. Enfin,
ils ne recommandent pas de créer une allocation universelle mais plutôt un crédit
d’impôt pour les bas revenus (negative income tax) dans la lignée d’une proposi-
tion de Thomas Paine qui date de 1797 au Royaume-Uni. Pourquoi valoriser le
travail ? Parce que, quelle que soit sa nature, en plus de pourvoir à nos besoins, le
travail traite deux nuisances : l’ennui et le vice (Voltaire), sans compter les
couches hautes de la pyramide des motivations de Maslow.
C’en est presque un plan “à la Macron” : favorisons l’entrepreneuriat et tous les pro-
blèmes sociétaux se régleront d’eux-mêmes. Un peu trop classique !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 146 / 160
The Second Intelligent Species: How Humans Will Become as Irrelevant as
Cockroaches (2015), de Marshall Brain, grossit le trait en annonçant que les scienti-
fiques sont en train de créer une seconde espèce intelligente, les robots et l’IA, qui va
nous dépasser et supprimer la majorité des emplois. Les premiers touchés seront les
millions de camionneurs, les vendeurs dans la distribution de détail, dans les fast
foods et le BTP. C’est un darwinisme technologique provoqué par l’Homme, qui se
fait dépasser par ses propres créations.
Le reste est de la non-science-fiction, tablant sur une intelligence artificielle qui régu-
lerait les comportements humains néfastes, comme ceux qui affectent
l’environnement. Les emplois non qualifiés disparaitraient à la fin des années 2030,
ce qui semble un peu rapide au vu de la progression de la robotique.
Au passage, l’auteur fournit une explication du fameux paradoxe de Fermi selon le-
quel il est bizarre qu’aucune civilisation extraterrestre ne nous ait approchés à ce jour.
“Officiellement”, diraient les conspirationnistes. L’IA développée par ces civilisa-
tions serait comme la nôtre : une fois qu’elle serait satisfaite par ses réalisations et par
l’équilibre ainsi généré, elle n’aurait pas besoin d’explorer le reste de l’univers. Faut
voir…
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 147 / 160
Jobocalypse (2013) de Ben Way, que je n’ai pas lu (désolé…), part du principe que
nous sommes déjà envahis par les robots et que la disparition d’emplois liée à
l’automatisation est une histoire ancienne. Il anticipe que même les métiers les plus
qualifiés seront remplacés par des robots car ils s’autoalimenteront. Les scénarios en-
visagés vont de révolutions provoquées par les sans-emplois à des initiatives gouver-
nementales de formation massive les concernant. On dira que l’on préférera le second
scénario au premier même si c’est un peu court !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 148 / 160
L’étude AI, Robotics and the future of jobs du Pew Research Center, parue en 2014,
recense de son côté l’avis de divers spécialistes dont certains estiment que la moitié
des emplois sont menacés à l’horizon 2025. Ces experts sont très divisés sur la ques-
tion !
Le pessimisme provient du risque d’impact rapide de l’automatisation sur les cols
blancs avec un risque de déclassification pour un grand nombre, qui seront orientés
vers des métiers moins bien payés. Enfin, le système d’éducation ne serait pas en me-
sure de s’adapter aux nouveaux enjeux.
Certains experts sont optimistes car les métiers qui disparaissent sont naturellement
remplacés par d’autres, au gré de l’évolution de la demande. La relation avec le tra-
vail sera aussi redéfinie de manière plus positive.
C’est aussi l’avis de Darrell M. West de la Brookings Institution dans What happens
if robots take the jobs qui prévoit des créations de jobs dans plein de secteurs et des
disparitions dans peu de secteurs. On retrouve cette thèse dans Toil and Technology
– Innovative technology is displacing workers to new jobs rather than replacing
them entirely (2015) de James Bessen, d’où sont extraits les schémas ci-dessous qui
montreraient que les ordinateurs ne sont pas à l’origine de la suppression d’emplois.
Enfin, Humans Are Underrated: What high achievers know that brilliant ma-
chines never will (2015) de Geoff Colvin met en avant de son côté l’opportunité de
remettre au gout du jour les qualités humaines dans les métiers : l’empathie,
l’intuition, la créativité, l’humour, la sensibilité et les relations sociales.
Une manière de différentier clairement les machines et l’homme. Elle était reprise par
Dov Seidman dans Harvard Business Review en 2014 (ci-dessous). C’est une belle
conclusion, même si frisant quelque peu l’utopie.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 149 / 160
Les incertitudes sur la vitesse de la robotisation
Il y aura bien de l’automatisation et des pertes d’emploi, mais probablement moins
que ne l’annoncent les prévisions les plus alarmistes. Les cycles d’innovation sont
lents. Les prévisions oublient souvent d’intégrer la dimension économique et sociale.
Pour qu’un métier soit automatisé, même partiellement, il vaut mieux que cela soit
intéressant économiquement, et pas seulement pour la performance technologique.
Dans certains cas, l’automatisation de métiers pourrait élargir leur marché en les ren-
dant accessibles au plus grand nombre, comme pour les avocats ou de nombreux pans
de la santé. Dans d’autres comme pour les traders, l’impact sur l’emploi sera minime
et on ne regrettera pas forcément ceux qui occupaient ces métier
L’automatisation à venir est incertaine dans son ampleur, dans sa rapidité, dans les
métiers qui seront affectés et dans ses effets induits. Elle produit généralement des
transferts de valeur. La France a perdu en un demi-siècle le tiers de ses emplois !
Entre 1946 et la fin du 20eme siècle, l’emploi agricole est passé de 36% à moins de
3% de la population ! Une part de cette transformation a eu lieu pendant les Trente
Glorieuses (1945-1975), générant de la croissance dans de nombreux secteurs :
l’automobile, le BTP, les biens de consommation courante, le commerce, les loisirs,
les médias et la publicité.
Les automatisations à venir ne pourront pas être amorties de la même manière. La
“destruction créative” de valeur pourrait avoir du retard à l’allumage. Mais elle libè-
rera probablement de la créativité dans d’autres domaines, notamment dans les loisirs.
L’automatisation pourrait être plus lente que prévue, notamment dans les métiers les
plus difficiles à automatiser. L’ouvrier de chantier n’est pas facile à robotiser de ma-
nière générique. Surtout pour les petits chantiers. Mais certains le seront, par exemple
via l’impression de béton en 3D qui permet dans certaines conditions de faire
l’économie des coffrages.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 150 / 160
(source du schéma ci-dessus qui montre une évolution à la hausse des métiers cognitifs et non routiniers,
donc plus difficiles à automatiser)
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 151 / 160
et technologies n’attirent pas tant que cela les jeunes et notamment en France, comme
une enquête mondiale récemment réalisée par Randstad le montre.
Dans The Future of Jobs Employment, Skills and Workforce Strategy for the
Fourth Industrial Revolution publié en janvier 2016 par le World Economic Forum,
les auteurs prévoient que les deux tiers des enfants en école primaire d’aujourd’hui
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 152 / 160
exerceront un métier qui n’existe pas encore. Ils y vont un peu fort car l’échéance
n’est pas si lointaine. Ils prévoient que 7,1 millions d’emplois administratifs disparai-
tront d’ici 2020, et que seulement 2 millions d’emplois seront créés dans les techno-
logies (aux USA). Par contre, des emplois devraient être créés pour combler une par-
tie du trou dans l’énergie, les nano-biologies et le divertissement, et ceux des com-
merciaux subsisteront. Et oui, les emplois de l’avenir seraient surtout ceux dont le
contenu émotionnel sera le plus dense, comme expliqué dans Les 10 compétences
clés du monde de demain.
D’un point de vue stratégique, on peut intuitivement privilégier l’enseignement supé-
rieur, la recherche et l’entrepreneuriat dans les domaines scientifiques et technolo-
giques qui génèrent ces automatisations. Il vaut mieux créer ou adopter les outils de
l’automatisation que de n’en subir que les effets, comme décrit dans How To Avoid
Being Replaced By A Robot paru dans Fast Company en avril 2016.
On pourra aussi favoriser les enseignements pas trop spécialisés et assez diversifiés.
Et enfin, ne pas oublier d’exceller dans ce qui fait de nous des Hommes, de belles
machines biologiques douées d’émotions.
Et les politiques ?
Un sujet est rarement évoqué dans les ouvrages sur le futur des métiers en relation
avec l’IA : quid des organisations politiques et des Etats ? Peuvent-ils se faire eux-
mêmes disrupter par de l’IA ? Evitons l’expression “uberiser” qui est à la fois trop
précise et trop vague. Il y a bien l’initiative Watson for President mais elle est un
peu légère car construite comme une opération de communication d’IBM.
On ne peut qu’aller en conjectures. La première question à se poser sur l’usage de
l’IA concerne les élections dans les démocraties. Les dernières grandes élections, no-
tamment américaines, ont montré la force à la fois des réseaux sociaux et de la pro-
pagation d’idées véhiculant ou bien du rêve (Obama, Sanders) ou des angoisses
(Trump), voir les deux à la fois (H. Clinton). Derrière les deux victoires de Barack
Obama se cachent beaucoup de big data et de marketing opérationnel ciblés sur les
bonnes audiences.
Que ferait l’IA pour améliorer un tel processus ? Elle collecterait des volumes gigan-
tesques d’informations ouvertes sur ce qui se dit et s’écrit, sur ce que font les élec-
teurs, sur leurs réactions à des discours antérieurs, sur les analyses biométriques (de
la captation de pouls avec une montre, des mouvements oculaires avec des capteurs
de Tobii, de l’EEG pour la mesure de l’activité cérébrale, etc), sur l’économie ou sur
les médias.
Elle les analyserait alors au point de permettre la création de programme politiques
appliquant soit la démagogie ultime (celle qui fait gagner les élections mais qui est
inapplicable ou qui, si appliquée, mène à une catastrophe) soit la démagogie
utile (celle qui fait à la fois gagner les élections et aller dans un chemin non catastro-
phique et responsable). Le tout en étant conforme à une idéologie de base d’un parti
politique donné, avec son système de valeur (partage, social, économie, croissance,
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 153 / 160
environnement, fiscalité, justice, école, selon les cas). Voilà de beaux défis
d’optimisation sous contraintes !
Des tentatives de ce genre ont déjà été vaguement lancées. Valentin Kassarnig, cher-
cheur à l’Université Amherst du Massachusetts, a présenté début 2016 un pre-
mier générateur de discours politique basé sur de l’IA, et qui dépasse les généra-
teurs de pipeau déjà bien connus. Mais cela reste assez rustique et focalisé sur le lan-
gage, pas sur la construction d’un programme politique qui se tienne. La solution est
même diffusée en open source ! Malheureusement, en politique plus qu’ailleurs,
l’adage selon lequel le contraire de l’IA est la bêtise naturelle s’applique parfaitement.
Cette dernière est même plutôt efficace électoralement !
Après les élections se pose la question de la gestion. Est-ce que l’IA permettrait de
préparer des choix censés mis ensuite dans les mains d’électeurs dans le cadre de dé-
mocraties plus participatives ? Est-ce que l’IA permettrait de bâtir des politiques éco-
nomiques dignes de ce nom ? Est-ce l’IA permet d’intégrer les complexes relations
sociales dans la société ? D’anticiper les réactions des citoyens aux nouvelles lois et
réglementations, notamment fiscales ? Est-ce qu’elle permettra de gérer les conflits ?
Est-ce qu’elle pourrait permettre d’accélérer la justice ? D’éviter les erreurs judi-
ciaires ? De réformer les systèmes de santé au fil de l’eau des progrès technolo-
giques ? Je n’en sais rien. Il n’y a pas beaucoup de chercheurs qui planchent sur ces
questions ! Certains indiquent toutefois qu’une IA impliquée dans le processus ap-
porterait un peu de rationalité et serait capable de prendre des décisions non basées
sur le côté obscur des émotions.
Les systèmes d’aide à la décision politique pourraient-ils faire appel à de l’IA inten-
sive ? Y compris lorsqu’il s’agit d’évaluer la position et l’attitude des autres parties
prenantes, des agents économiques ou des chefs d’Etat ? Est-ce qu’une IA permettrait
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 154 / 160
à un POTUS de gérer de manière optimale la relation conflictuelle avec Vladimir
Poutine, les bras de fer avec les Chinois, ou de résoudre pacifiquement les divers con-
flits du Moyen-Orient ? Ou à un successeur de François Hollande de se dépatouiller
de la situation en France ?
On a bien vu des films de Science Fiction mettant en scène des personnages liés à
l’IA comme dans “Her” et “Ex Machina”, mais pas encore dans de la politique fiction.
Ca ne serait tarder vue l’imagination débridée des scénaristes !
On en est encore loin. Ce qui démontre par l’absurde que l’AGI (Artificial General
Intelligence) n’est pas pour tout de suite. Mais gare à vos fesses les politiques ! La
démocratie participative pourrait prendre un visage inattendu !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 155 / 160
Epilogue
Nous voici au terme de ce petit voyage dans l’IA. Nous n’avons pas fini d’en en-
tendre parler !
Pour commencer, un grand merci à ceux qui ont commenté les articles à l’origine de
cet ebook et m’ont fourni des pistes de réflexion et de lectures. J’avais posé quelques
questions clés dans la première partie et les suivants ont permis d’y répondre en
grande partie grâce à ces contributions. De nombreuses startups se sont faite con-
naitre et ont rejoint au fil de l’eau la partie de la série sur les startups françaises.
Les effets de manche sont nombreux derrière les annonces tant dans l’IA que dans la
robotique. Une généralisation et des extrapolations abusives sont souvent construites
autour de performances médiatisées comme la victoire d’AlphaGo au jeu de Go ou
celle de Watson à Jeopardy. Le phénomène enfle, maintenant que l’IA et le machine
learning sont devenus des arguments marketing pour les startups comme pour les
grands groupes du numérique. Et les prédictions vont bon train, de la fin des métiers à
la fin de l’Homme lui-même.
L’impression subsiste aussi que les prouesses récentes sont bien plus liées aux pro-
grès dans le matériel que dans les logiciels et les algorithmes. Qui plus est, la puis-
sance brute des machines a tendance à rendre les développeurs moins astucieux dans
leur manière d’aborder les problèmes. Mais cette impression vient probablement de la
difficulté à bien appréhender la nature même des progrès réalisés dans les algo-
rithmes et procédés techniques de l’IA. Leur vulgarisation est très difficile.
Malgré ces nombreux écueils et la bulle médiatique qui l’accompagne, l’IA fait ce-
pendant des progrès réguliers et la vague semble aussi importante que les vagues
technologiques précédentes qu’ont été le cloud, le big data ou les objets connectés ou
même que les BlockChains, un peu trop présentés en ce moment comme la poudre de
perlimpinpin universelle de l’économie. Elle est d’ailleurs reliée à ces vagues car elle
en fournit des outils permettant d’en améliorer la performance et la valeur d’usage.
Nous avons aussi vu que la loi de Moore était à la fois un peu enjolivée dans les dis-
cours et qu’elle pouvait avoir tendance à ralentir, notamment dans la puissante brute
des processeurs. Cela n’empêche pas les chercheurs et entreprises du secteur à redou-
bler d’efforts pour continuer l’aventure. Ce n’est pas parce que c’est plus difficile
qu’avant d’avancer que cela ralentit les innovateurs. Au contraire même ! Les pers-
pectives d’atteindre des “moonshots” les motivent. L’Homme est est insatiable dans
sa quête de savoirs et d’innovations.
Nous avons pu découvrir de nombreuses startups françaises dans le domaine de l’IA,
aussi bien au niveau des techniques horizontales que des applications métiers. Nous
avons aussi des talents français également établis aux USA ou dans des entreprises
américaines, comme Yann LeCun qui a créé le laboratoire d’intelligence artificielle
de Facebook à Paris. Reste à transformer cela en avantage stratégique et en emplois !
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 156 / 160
Les questions qui se posent sont les mêmes que d’habitude : comment faire en sorte
que ces startups grandissent vite, soient bien financées et se développent à
l’international.
Une opportunité existe pour bien positionner la French Tech sur ce créneau porteur
qui structurera vraisemblablement les plateformes numériques des années à venir.
Comme d’habitude, il s’agit d’être les premiers à créer des plateformes mondiales de
grande ampleur, pas juste de créer des myriades d’applications métiers disparates.
L’excellence en R&D ne se traduit pas nécessairement en innovations et réussites
économiques sinon, la France serait championne du monde des industries numériques
depuis des décennies !
Enfin, même avec une IA un peu faiblarde et lourdingue, la marche vers
l’automatisation totale ou partielle de nombreux métiers est déjà en route. Il faut s’y
préparer dès maintenant, ne pas y résister futilement, s’y adapter en se modernisant,
en faisant évoluer notre système d’enseignement et en produisant des outils compéti-
tifs. Les civilisations qui ont évité les progrès techniques et les outils de communica-
tion dans l’histoire ont systématiquement périclité ou, au mieux, décliné. Les deux
exemples les plus connus sont l’empire Ottoman qui a mis trois siècles à adopter
l’imprimerie ou la Chine qui a brutalement bloqué ses échanges maritimes aux débuts
du 15ième siècle.
Qui plus est, les prévisions des prévisionnistes n’engagent que ceux qui y croient.
Elles sont souvent à côté de la plaque. Le futur n’est pas écrit à l’avance, il s’écrit au
fur et à mesure.
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 157 / 160
Nouveautés à intégrer
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 158 / 160
Glossaire
Les avancées de l’intelligence artificielle – Olivier Ezratty – Mars-Mai 2016 - Page 160 / 160