Mathématiques: Informatique
Mathématiques: Informatique
Mathématiques: Informatique
& informatique
Une nouvelle
Bibliothèque
Tang L'aventure .,,,athé.,,,atique
e
Tangente Hors-série n° 52
Mathématiques
et informatique
Une nouvelle ère numérique
EDITIONS.
POLE
Mathématiques
et informatique
La Société informatique de France
Le Prix Bernard-Novelli
Les perspectives de l'informatique au XXIe siècle
Informatique, popularisation et médiation
Intelligence artificielle et philosophie
La préhistoire de l'informatique
Babbage et le premier ordinateur potentiel
Le programme de Lady Ada King
Les messages qui se corrigent tout seuls
Alonzo Church, Alan Turing et la calculabilité
Algèbre de Boole
Langages et récursivité
Langages rationnels et automates finis
Complexité de Kolmogorov
et profondeur logique de Bennett
Comment éliminer les spams
En bref
Notes de lecture
Mathématiques expérimentales
Les automates cellulaires et le jeu de la vie
Démonstration, l'ordinateur à la rescousse
Espaces de Banach et informatique théorique
Le problème fondamental de l'informatique théorique :
P est-il égal à NP ?
La simulation numérique
Le calcul haute performance
Quelques problèmes de calculs
En bref
Problèmes
Solutions
l'infonnatique,
Le Teorem de Thales
ouvert. Le petit écran d'hier à aujourd'hui
supplémentaire informe
l' utilisateur du niveau L'informatique a totalement envahi le monde
de sécurité de la moderne, qui ne peut plus s'en passer, pas plus
communication. que de l'eau courante ou de l'électricité. Plus
encore que ces éléments indispensables de notre
environnement, l'histoire témoigne d'une accélé-
ration exponentielle du temps qui permet à chaque
instant de progresser autant que pendant les dix ins-
tants précédents.
De l'algorithme d'Euclide à la machine à calcu-
ler de Pascal, du premier ordinateur potentiel de
Babbage à la machine de Turing, des ordinateurs
géants aux PC, des disquettes au Web généralisé,
tout va tellement vite que personne ne sait ce que
réserve l'avenir. Voilà pourquoi, tant du côté de la
recherche que dans la médiation scientifique vers
Ce télé pho ne est réservé aux go uve rn a nts et le public, des efforts sont indispensables pour ne
hauts responsables de l' armée . Son usage est pas laisser une partie de la population sur le bas-
plus lourd que celui des téléphones usuels, c'est côté de la route.
pourquoi longtemps les mini stres ont préféré uti-
li ser le urs télé phones usuels, inconscients qu ' il s
étaie nt del ' importance de la sécurité. li a fallu
les révélations d ' Edward Snowden pour qu ' il s
comprennent que le urs conversations à trave rs
un téléphone po11able ordinaire étaient écoutées
par la NSA ... et d ' autres services d ' intelligence
sans auc un doute. Il est difficile d 'en dire plu s
car, bien entendu , les algorithmes de chiffre ment Supercalculateur
utili sés sont classés « secre t défense» ! Cray XI.
Informatique
Karl Steinbuch, l'un des pionniers de De IJil à 11,re en passant par l'octet
l'informatique en Allemagne, for-
gea en 1957 le mot lnformatik où À la fin des années 1940, John Tukey appelle bit
l'on reconnaît bien sûr l'influence l'unité élémentaire de stockage dans la mémoire
du mot français informer qui signi- d'un ordinateur. Il s'agit de la contraction de binary
fiait, à l'origine, façonner l'esprit digit, c'est-à-dire chiffre binaire. Sans doute faut-il y
Le suffixe -ique (-ik en a lie ma nd) voir un clin d'œil au terme anglais bit qui désigne un
qui l'agrémente provient du latin morceau. L'utilisation du terme bit a été popularisée
-icus : relatif à. Certains estiment par Claude Shannon, l'un des fondateur de la théorie
cependant que l'on est en présence de l'information.
d'un mot-valise, c'est-à-dire le début Cependant, la plus petite unité adressable se com-
d'un terme et la fin d'un autre, abré- pose de plusieurs bits, en général 8. C'est pourquoi,
viation de l'expression information on utilise souvent le mot octet, introduit vers 1920
automatique. Professeur d'informa- en chimie pour désigner une couche composée de 8
tique à Harvard puis directeur du électrons. Le mot byte, introduit en 1956 par Werner
Centre national de calcul électronique Buchholz, ingénieur américain d'origine allemande
de la société Bull, Philippe Dreyfus travaillant pour IBM, lui est (presque) synonyme : il
reprend en français en 1962 et popu- désigne la plus petite unité adressable (qui autrefois
larise le mot sous sa forme francisée pouvait varier en fonction du matériel].
informatique.
Colin de la Higuera,
président de la Slf: « L'enseignement de
l'informiltique en Frnnce est insuffisilnt »
Dans l'e nsembl e des pays se pose la quest ion
de l'enseigne ment de l' in fo rmatique . Certains,
co mme la France , fo nt le pari de fo rmer au
Société Informatique de France
numérique, c'est-à-dire, essenti e lle ment aux
SI f : la plus jeune usages. D'autres, comme le Royaume-U ni , les
États-U ni s et la majo rité des pays as iatiques.
des societés sauantes jugent indi spe nsa bl e de fo rme r à l' in fo rma-
En France, les sc iences ont toutes une soc iété savante. tiqu e, c'es t-à- dire à la prog ra mm ati o n , a u
Po ur les plu s in sta ll ées d 'entre e ll es, ces soc iétés codage et à l'ense mbl e de ce qui pe rmet de
savantes sont des institutions centena ires qui jouent un détenir les cl és du mo nde numérique.
impo rtant rô le d 'organi sati o n et d 'anim ati on . Ell es Si l'on part du princ ipe qu ' un enseig nement
permettent à la sc ience qu 'e ll es re présente nt d 'être de l' info rmatique est correct quand la d isc i-
vi sible, aux médi as de loca li ser des interl ocuteurs, aux pline est enseignée de faço n stabl e et pérenne
pouvoirs publi cs de di sc uter d 'évoluti ons dans les cur- par des spéc iali stes fo rmés pour cela , le constat
sus. Une soc iété savante pe ut contribuer à la va lori - est qu 'en 201 4 la sc ie nce in fo rmatique n 'est
sation des travaux conduits dan s la di scipline , et à sa rée lle ment enseig née en France que dans cer-
vul garisation. Elle a éga le ment une responsabilité vis- tains cursus de l'enseigne ment supérie ur.
à-v is des je unes: le ur mo ntrer tout l' intérêt d 'orie n- Po urtant , que l que so it le ur ni vea u de fo rma-
ter leurs études dans sa bra nche scientifique. ti on, tec hni c ie ns et ingéni e urs passés par ces
La Soc iété informatique de France (SIF) a été créée cursus info rmatiques sont rég uliè re ment pl é-
pour cela le 3 1 ma i 201 2. Ses adhérents en partage nt bi sc ités par les e ntre pri ses: les sa laires d ' em-
les o bjectifs: prom ouvo ir l' informatique , une in fo r- bauche sont presque systématiquement toujours
matique ouve rte, qui se retrou ve pl e ine ment au se in les plus hauts, et les embauches ont souvent lieu
des sc ie nces de l' info rm ati o n et du numé rique. li ava nt la fin des études.
s'ag it éga le me nt de contribue r à la diffu sion d ' une Ma is le contingent d ' informatic iens fo rmés est
culture sc ientifique , et de ré pandre l' idée que ! 'en- lo in d ' être suffisant pour ré pondre aux beso ins
se igne ment de l' inform atique, en tant que di sc ipline ac tue ls du marc hé de l'e mpl o i et to utes les
sc ientifique et pas seul eme nt en tant qu 'o uti 1, est une études pros pecti ves à di spositi on montrent que
nécess ité aujourd ' hui . cette te nd ance n 'est pas prête de s' in ve rser.
Comme le montre brill amment Mil ad Do ue ihi dans Malgré ces constats, aucun di spos iti f permet-
son li vre Qu 'est-ce que le numérique? (Hermès, 201 3), tant de générali ser l'enseigne ment de l' in for-
l' in fo rm atique est née sc ie nce, s'est déve loppée en matiqu e n 'est mi s e n pl ace e t les obstacles
industrie et a donné lie u à une culture qui a changé de s'accumulent notamment avec des pro blèmes
no m et est devenue numérique. Ma is ce la ne signifie de mi se en œ uvre de programmes à la hauteur
pas, bien au cont ra ire, que l' informatique ait di sparu ! des enje ux sc ie ntifiques , c ulture ls et soc ié-
Elle est l'essence mê me de cette culture. Avec l' aide taux actuels au lycée, en BTS , et dans les classes
de son Conseil scientifique, de ses adhérents, des asso- pré parato ires. Malgré le très fo rt in ves ti sse-
ciatio ns d ' inform aticiens, des grandes in stitution s, la me nt de ceux qui so nt impliqués, le manque
SIF ente nd contribuer au déve loppement et au rayo n- d 'ense ignants aya nt reçu une fo rmati on spéc i-
ne ment de cette sc ience. fique en in fo rmatique empêche la mise en place
Site de la SIF : d ' une politique de formation ambitieuse, comme
www.societe-informatique-de-france.fr ce la pe ut être le cas dans d 'autres pays.
Le PriK Bernard-nouelli
lormalique et de ieu
De pui s l' avè ne ment de ! 'e nse ig ne me nt de spéc ia lité ISN ( infor-
matiq ue et sc iences du numé rique), le magazine Tangente o rga-
ni se un co ncours de proje ts info rmatiques auto ur du je u, intitulé
Prix Be rnard -Nove lli e n souve nir de son co ll aborateur di sparu
e n 20 1 1. La Société in fo rmatique de France. !'assoc iatio n Pro-
;
.". ""
•-·.
.'
~
log in , Mag ma Mobil e. Cas io, INRI A et plu sie urs uni ve rs ités et •
éco les d' ingé ni eurs e n sont pa rte na ires. Conç u e n prio rité po ur xr
~
les é lèves e n spéc ia lité IS N, le co ncours est cepe nd ant o uve rt à
tout lycée n accro d ' in fo rmatique e t de jeu. L' idée est de conc i-
lie r la pass io n q ue peuve nt avoir les lycée ns po ur le je u o u po ur
'
l' info rmatique e n jo ignant l' util e (la pré parati o n du proje t ISN)
à l'agréable (le fa it de se vo ir reconn aît re dans l' uni ve rs du je u
numériq ue).
- ,:
~.,..~· ~
.. - . ~
Les lauréats re mpo rtent un tro phée d 'art mathé matique, mais sur-
tout la poss ibilité de vo ir d urant l'année sui va nte le ur je u déve-
loppé de maniè re profess io nne lle e t pro posé sur les smartphones. it'i É. Tho mas lf':l É. Thomas
Nouveau : de ux acte urs du do ma ine de l'éducatio n, du je u et de l' info rmatique, les ca lc ul atri ces
Casio et la société M ag ma M obile (vo ir e n page 3 1), parraine nt le concours, qui pre nd une
importance médiatique partic uliè re.
Re nseigne me nt et inscriptio n : http://www .tro phe tange nte .corn/
T
outes les acti vnes humaines , plus ou moins importante, aux pro-
éco nomiques , sc ie ntifiques grès sc ientifiques et technologiques
ou indu stri ell es prése nte nt des champs info rmatiques et mathé-
aujourd ' hui des enjeux liés, de manière matiques des sciences. Bien entendu,
• Les défis de la modé li sati on multi - sécurité. qui sont les principaux sujets
éche lle et des incertitudes associées. actue ls de recherche au cœur de lïn-
Il s concernent les très grand s systèmes for matique.
numériques, e mbarqués ou e nfoui s,
les systè mes de systèmes, la program - • Les défis liés à la tran sformation du
mation des très g rand s log ici e ls . .. déluge de données en bibli othèq ues
Il s do ivent pre ndre en co mpte les de conn aissa nces di gnes de confi-
impératifs de fiabilité , de sûreté et de ance. Les enjeux sont de taille : la
cyber-communication générali sée dans
laque lle on s' immerge doit être sûre
l'INS21 :le PIUS ieune instiWt du CNRS et respectueuse de la vie pri vée : l ' in-
Avec ses dix instituts thématiques, le Centre national de teraction e ntre les mondes rée ls et
la recherche scientifique (CNRS) couvre l'ensemble du numériques débouche par exem ple sur
des probl ématiqu es d'a pprenti ssage
champ scientifique. Créé ea 2009, l'Institut des sciences
qui renvo ient à des thématiques plu-
de l'information et de leurs interactions (INS21) est
ridi sc iplin a ires. L'é laboratio n même
le plus jeune d'entre eux. Il soutient et coordonne la de la connai ssance en devient un axe
communauté autour d'un réseau d'une soixantaine de majeur.
laboratoires associés aux centres universitaires et répar-
tis sur l'ensemble du territoire. Les professionnels des • Les défis liés à la modéli sation du
métiers de la recherche présents dans ces laboratoires viva nt et à ses applications : santé.
sont au nombre de 11000. Une moitié est constituée bien-être, re lations entre l' humai n et
ses environnements. Le paradi gme dif-
de doctorants et de post-doctorants, et l'autre moitié de
fè re selon qu ' il s'agisse de développe-
permanents, exerçant des métiers variés : ingénieurs,
ments théoriques ou d 'expériences de
techniciens, enseignants-chercheurs de . L'université et
laborato ire qui sont les fo rmes tradi-
chercheurs du CNRS. Ces derniers, au nombre d'environ tion nel les de la sc ience et de 1'ingén-
600, sont des chercheurs à plein temps. ierie. L" approche est ici de gagner en
compréhension, principalement grâce
Les recherches de l 'INS21 se répartissent en six domaines à l'anal yse de modèles mathématiques
principaux : l'informatique fondamentale ; le traitement mi s en œ uvre à trave rs des simulati ons
et la sécurité des données ; les réseaux ; le traitement numériques . De plu s. des algorithmes
représentent les mécani smes naturels
des signaux et des images; l'automatique; l'intelligence
étudiés et permettent de les représenter.
artificielle et la robotique.
de les préd ire, et d 'ajuster leurs vari -
Les trois premiers domaines relèvent de l'informatique, ables pour les contrôler.
les trois derniers vont au-delà, l'ensemble constituant les
« sciences de l'information». Des concepts nouueaux
Mettant à profit la pluridisciplinarité du CNRS, l'INS21 jeunes de moins d'un siècle
tisse des relations fortes avec les mathématiques, la
biologie, l'ingénierie ou encore les sciences humaines De grands rés ultats sc ientifiques sont
offerts par cette sc ience.
et sociales.
Ainsi , dès qu ' une mac hine (é lec tro-
Vous trouverez davantage d'informations sur le site
nique, abstraite, etc.) qui ca lc ul e peut
www.cnrs.fr/ins2i. exéc ute r les in g rédi e nt s de base des
Michel Bidoit, directeur de l'Institut a lgo rithmes, a lo rs e ll e peut exéc uter
tous les log ic ie ls du mo nde : c'est que lque sorte). Nous voil à donc devant
un e mac hin e univ e rse ll e, comm e une vision nouve lle de cette noti on
d éfinie par la th èse de Churc h- d 'aléa.
Turin g (vo ir a rti c le e n page 40 ).
Ce rés ultat implique pa r e xe mpl e Au fur et à mesure que cette sc ience se
que toutes les « inte lli ge nces méca- po pul ari sera , la pensée info rmatique
niques» (ordin ate ur, robo t, etc.) so nt enrichi ra les connaissances humaines
qu a i itativ e me nt équiv a le ntes : e ll es et é larg ira notre vision sur ces sujets.
se ront ju ste plu s o u mo in s ra pides o u
pe rformantes. La relation auec les mathématiques
Un autre rés ultat mo ntre le li en entre
la sc ience informatique et de grand s La modé li sation et la réso lution de
concepts. C'est la théori e algorith - no mbre ux pro bl è mes re ncontrés en
mique de ! ' inform ati on. La co mplex i- info rmatique offrent des dé fi s nou-
té d ' un message e n te rme d ' info rma- veaux pour les mathématiques pour
tio n (au sens où " bl ablabl a .. . " mê me les deux di sciplines info rmatiques et
répété une infinité de fo is contie nt mathématiques.
mo in s d ' info rm atio n qu ' une page de Il est en effet rare que les techniques
longueur fini e) se défi nit par « la lon- mathématiques usuelles pui ssent être
gueur du plus petit programme écrit utili sées « clés en main ». Les objets
a vec une machine uni verselle qui manipulés tout comme les types de
génère le message en question ». Bref, réponses attendues (par exemple en
la long ue ur du plu s petit programme termes d 'effecti vité) appara issent sou-
indique la complex ité du message. Il vent comme non class iques aux mathé-
n'est pas du tout év ide nt, ma is c'est le matic iens.
cas , que cette dé finition est pertine nte,
bien fond ée, ne dé pend de la mac hine L' info rmatique théorique intervient,
cho isie qu 'à une co nstante près, et entre autres, dans les domaines sui -
offre une form ali satio n profonde de va nts : calcul fo rme l, arithmétique des
cette idée de « compl exité ». ordin ateurs, géométrie pour l' image,
algorithmique (du tex te, sur les arbres ,
De même la notion de suite aléato ire graphes), automates, systèmes dy na-
prend un visage nouvea u : ce n'est plu s miques, ana lyse d ' algorithmes, com-
une suite « générée par le hasard » (au plex ité du ca lcul , info rmatique quan-
sens préc is de la théorie des probabili - tiqu e, log ique, bases de données,
tés), mais une suite qui ne peut être ... preuves de programmes, vérifi cation
générée par un programme de taill e log icie ll e et matéri elle, codes correc-
fini e (une suite « imprédictible » en teurs, cry ptographie .. .
Tout un programme !
Informatique, popularisation et
I • •
e 1a ion
La « fracture informatique » ne concerne pas seulement les
générations ou l'accès au matériel. Au sein d'une m êm e
catégorie d'utilisateurs d'équipements informatiques, des
inégalités parfois rédhibitoires sont constatées en fonction de
la culture scientifique et technique liée au numérique. La
médiation scientifique est là pour tenter de répondre à ce défi
de société.
e 11u111enque façonne aujourd'hui l ' impli cati o n dans la c réat io n de ces
ISN :un partenariat réussi Ces tro is vo lets se cro isent en pratique.
une interve ntion en cl asse (vo let éduca-
pour taire entrer les sciences ti f) par exemple donnant li eu à des di s-
du numérique à l'école cussions fa miliales Je soir (volet citoyen).
C
omment construire une mac hine ne présente que pe u d ' intérêt pour un
Turing à intelligente ? Cette question in- spéc iali ste e n inte ll ige nce arti fic ie ll e
Bletchley Park. téresse to ut autant les spéc ia- (vo ir Le test de Turing en encad ré).
li stes en inte lligence artific ie lle que les Pourtant , même si à pre mière vue les
chercheurs en philosophie de l'esprit. de ux d isciplines ne s' intéressent pas aux
Pour les premiers, il s'agit de créer une mê mes probl èmes sc ie ntifiq ues, des
mac hine capable de résoudre des pro- liens profo nds ex istent entre philoso-
blèmes techn iques habitue llement trai- phie et in fo rm atique.
tés par l' homme. L 'objectif est, pour les
l' importance des perceptions dans la co- un robot qui appre nd à marc her, le mou-
gnition e t rompt ain si avec le modè le ve me nt des d iffé re ntes parties du corps
cartés ie n affirmant que le corps et l'es- produit des c ha ngeme nts dans la pe r-
prit sont deux substances indépe ndantes . ception de l 'e nvironne me nt. Certains de
Appliqué à la robotique , cette pos itio n ces c ha nge me nts ne sont pas préd ic-
philosophique invite à conce voir des tibles , te ls que bo uger to utes les pattes
mac hines qui ne sont pas programmées e n mê me te mps po ur une arai gnée mé-
pour une tâc he ou un problè me spéc i- canique. D' autres mouve me nts, plus or-
fique, mais qui appre nne nt de manière ga ni sés , pe rmettent cependant au robot
autono me à pe rcevoir et à résoudre le de découvrir son e nvironne me nt de ma-
problè me sans décompos iti o n log ique nière effi cace . En tâtonnant , il peut donc
préalabl e de la part du concepte ur. Po ur tro uve r de lui -mê me les mo uve me nts
La révolution
POPPV. premier robot humanoïde crvntoaraphiaue
imprimé en 30
Le robot Poppy a été présenté en 2014 à François Hollande
à l'Élysée, dans le cadre d'un évènement Frenchîech pour
soutenir le développement de l'économie du numérique (des
vidéos sont disponible en ligne sur les sites de DailyMotion
et de Vimeo). Poppy est le premier robot humanoïde com-
plet au monde à être la fois open-source et imprimé en 30.
Il est destiné principalement au monde de l'éducation, des Colossus, premier ordinateur
Fablabs (associatifs ou dans les entreprises). des geeks et à Blctchley Park pendant
des artistes. la Seconde Guerre mondiale.
Dès 2014, les premiers lycées, écoles d'ingénieur et Fablab
commenceront à l'utiliser dans leurs formations. Il est prévu L ' in formatique est née en partie du
que cet usage se multiplie rapidement afin de contribuer à besoin de décry pter les messages
l'appropriation du monde numérique et de l'impression 30 allemands de la Seconde Guerre
par le plus grand nombre. mondiale. Des méthodes pour casser
Tout le monde peut télécharger librement les plans de Poppy fac il ement le code de la mac hine
et le logiciel associer, le construire, le << hacker », et inventer Eni gma, comme celle de l 'indice de
de nouvelles version ! coïncidence, ex istaient mais n'ont pu
Référence : être utili sées du fa it de l'absence de
http ://www.poppy-project.org moyens de calcul s suffisants. Cest
pourquoi Al an T uring et son éq uipe
optèrent pour une méth ode moin s
systématique, la recherche de mots
probables, qu ' heureusement l 'armée
allemande fo urni ssait en abondance.
dans les bulletin s météo par exempl e.
L e premier ordin ateur (Colossus) fut
construit par les Britanniques à la
même époque pour décrypter le code
d' une autre machine de chi ffrement.
L orenz. réservée aux hauts dirigeants
allemands alors qu 'Eni gma servait sur
le champ de bataill e, en parti culier
dan s les sous- marins. Le code de
L orenz et le relati f fa ible nombre de
messages le permettaient.
Après la guerre, ces progrès menèrent à l'introducti on de nouvelles méthodes.
comme les clefs asymétriques où, contrairement aux clefs sy métriques, savoir coder
ne suffit pas pour savo ir décoder. L a plus cé lèbre et la plus utili sée d 'entre elles. en
parti culier dans les cartes bancaires et sur Internet, est la méth ode RSA. du nom des
tro is inventeurs : Ri vest. Shamir et Adl eman. Elle repose sur la difficul té pratique de
fac tori ser les nombres quand il s sont grands.
La préhistoire
de l'informatique
De la procédure algorithmique aux premières machines à cal-
culer, les origines de l'informatique sont bien plus anciennes
que ce qu'on pourrait imaginer, même si ce sont les progrès
de la physique qui ont permis le pas sage à l'acte. Histoire de
précurseurs.
es & informatique
POUR L'INFORMATIQUE
Dans le livre VII des Éléments, il John Na pier, l' inve nte ur des loga-
explique , dans ses deux pre miè res pro- rithmes e n 1614, mit au po int un
positions, la méthode effective po ur systè me de baguettes couli ssantes sur
obtenir le PGC D de deux nombres : lesque lles étaie nt notées les tables de
c'est ce qu'on appe lle de nos jours multipli cation des e ntiers de 1 à 9
l'algorithme d 'Euclide. qui pe rme ttaie nt ainsi d 'effectuer des
Dans l ' Antiquité, o n pe ut cite r aussi multiplications. Pe u après, Wilhe lm
le cribl e imag iné pa r Ératosthè ne Schickhard s ' e n inspira pour imaginer
pour obte nir la li ste des no mbres pre- une horloge calculante ; d ' après le
miers. Les deux ho mmes o nt vécu à courrie r qu'il envoya à son ami Ke pler,
Alexandrie au troi siè me siècle ava nt le haut était constitué de baguettes cou-
J. -C. , le pre mie r au dé but, le second li ssantes alors que des roues dentées e n
au milie u. bas pe rmettaient d 'e nreg istrer les rete-
nues . Malheure useme nt sa mac hine
Mais d'où vie nt le mot mê me d 'a l- no n e ncore ac hevée fut détruite l'an -
gorithme, c uri e use a nagra mme du née sui va nte da ns un incendie .
mot logarithme ? Il provie nt de la
déformation du no m du mathé mati- Bla ise Pasca l, âgé de 19 ans, se
cien arabe du début du dixième siècle dé tac he du principe de l' ho rlo ge.
Mohammed al-Khwari zmi. Celui-ci ne perme ttait pas d 'effectue r
Dans son cé lè bre o uvrage Kitab al-ja- des rete nues en cascade pour des rai -
br (on y reconnaît une autre origine, sons mécaniques (trop forte pou ssée
celle du mot algèbre), il a donné une qui bloqu ait la mac hine) . Il conçoit
méthode mécanique de la réso lution des des rouages mini aturi sés, dits à lan-
équations du second degré ; po ur lui , il ternes, qui rés iste nt à des secousses
y en avait six types une fois ôtées toutes très fortes alors que des systè mes de
les express ions négatives. L'attribution sautoirs pe rmette nt les retenues. Cette
de son nom po ur désig ne r ce type de mac hine fonctionnait sans inte rve ntion
raisonnement n' est donc pas usurpée. humaine interméd iaire. C'est pourquoi
o n considè re Blaise Pascal comme le
Les premières machines à calculer pre mie r invente ur d ' une machine à
ca lculer.
Les premiers instrume nts mécaniques
pour permettre le calcul sont les bou-
liers, o u abaques, conç us dans diffé-
re ntes civili satio ns dès l ' Antiquité ; on
ne peut cepe ndant pas les considé rer
comme des mac hines.
Gerbert d ' Aurillac, é rudit éclairé,
rapporta de ses voyages chez les
Maures d 'étranges machines et en
conç ut lui-mê me avec tant d'habile té
qu ' o n le soupçonna d 'avo ir vendu son
âme au diable, ce qui ne l' e mpêcha pas
d ' être é lu pape e n 999 sous le nom de
Sylvestre Il .
Babbage
et le premier ordinateur potentiel
Au XIXe siècle, Charles Babbage conçut la première calculatrice
scientifique ainsi que le premier instrument que l'on puisse
qualifier d'ordinateur. Malheureusement, au-
cun des deux ne fonctionna à l'époque.
C
harles Babba- no mbre d ' e rre urs, ce q ui cond ui sa it
ge se consa- parfo is à des catastro phes, e n partic u-
cra très je une Iier des na ufrages pui squ ' e ll es étaie nt
aux mathé matiq ues. uti lisées dans la nav igatio n. Le but ini-
Après des études au ti a l de Babbage fut do nc de créer des
Trinity Co llege de tables de fo nctio ns sans e rreur de cal-
Cambridge, il dev int c ul. Po ur cela, il conç ut une machine
me mbre de la Royal capa ble de ca lc ule r les vale urs d ' un
Soc iety e n 18 16 e t fut po lynô me à pa rt ir de ses di ffére nces
parmi les fond ate urs de fi ni es (vo ir l'encadré). E n utili sant
la Roya l Astrono mical So- l' approximati o n des fo nctio ns par des
c iety en 1820, ce qui pe ut ex- po lynô mes, ce la permet de dresser les
plique r son inté rêt po ur les tables tables des fo nctio ns usue lles, comme
Charles de fo ncti o ns numé riques, indi spe n- les fon ctio ns trigono métriques o u log-
Babbage (1791-1871). sab les aux calcu ls astro no miques, e n arithmiques.
Portrait par partic ulie r. La méthode utili sée ex plique le no m
Virginia Kolence . Les tables de l' é poque, confec tio n- do nné à ce calcu lateur : la machine à
nées à la ma in , conte naie nt un g rand différences.
Différences rmies de
rappliquées aux
premiers entiers (lire
verticalement l'image
n élément de la machine à différences, de 0, 1, 2, •.• )
construit en 1832, on remarque qu 'elle
calcule sur des nombres décimaux.
La machine à différence, construite selon les plans de Babbage en 1991. Sur la droite, on remarque la
manivelle qui actionne la machine, sur la gauche, l'imprimante et sa manivelle.
le calcul analogique
Pour donner un exemple simple, voire simpliste, de calcul analogique, une autre façon
d'effectuer les additions est d'utiliser les propriétés des longueurs : deux mètres plus trois
mètres font cinq mètres. Ainsi, avec deux règles graduées, on peut facilement opérer une ad-
dition. La fonction logarithme transformant une multiplication en addition donne alors une
méthode analogique pour calculer un produit. Il suffit de transformer l'échelle linéaire en
échelle logarithmique. On obtient un instrument de calcul, autrefois symbole de l'ingénieur.
De façon plus générale, l'idée du calcul analogique est de représenter les nombres par des
grandeurs géométriques Oongueurs, aires, volumes,
angles) ou physiques (mécaniques, électriques, hy-
drauliques, chimiques), et d'exploiter des phéno- Une règle à calcul est composée de
mènes géométriques ou physiques dont la modéli- trois réglettes dont une cou~ entre
sation mathématique est fondée sur les équations les deux autr . En faisant coïncider la
que l'on veut résoudre. graduation 1 de l'une et la graduation
En particulier, des systèmes électriques per- 2 de l'autre, pu· en alignant le curseur
mettent de résoudre automatiquement certaines sur la graduation 5 de la première, on lit
équations : celles qui les régissent. le résultat de la multiplication 2 x 5 sur la
Les calculateurs analogiques ont été en usage seconde.
jusqu'à ce que les ordinateurs, ou calcula-
teurs
dire jusqu'au dessup: ;la~n;t;e;n;t,; c~'e;s~t-~à;-;;:::i::=3j~~g~Ë~
débutles
numériques, ~-~~~
années 1970. Dans le
domaine du calcul scien-
tifique, numérique est
ainsi devenu l'opposé
d'analogique.
HISTOl1
R E$ par Jean-Jacques Dupas
sur n calculant les nombres de Be rnoulli Les résultats des A; sont conservés dans
B; de proc he e n proche. les variables V 11 , V 12 et V 13 alors que les
Pour n = 1, 0 = A0 + B I résultats des nombres de Be rnoulli uti-
donc 8 1 = - A0. li sent les variabl e V 21' V 22 ,Y 23,V 24 ...
Pourn= 2,0 =A 0 +B 1A 1 +8 2 Ce p rog ra mm e est incroy a bl e me nt
donc 8 2 = - A0 - B IA 1. moderne et abstrait (utilisation de variables .
Pour n = 3, 0 = A0 + B IA 1 + B2A 2 + 8 3 bouc les, branchements). Ada avait bie n
donc 8 3 = - A0 - B 1A 1 - B 2A 2. co mpri s l' idée de ce que no us ap pelo ns
V3 est initialisée avec n. Une autre boucle le branchement conditionnel (la poss i-
de sommation est nécessa ire pour ajo u- bilité qu' a un programme de sélection-
ter à A 0 les A;B;. Le compte ur de cette ner des instructions sui vant une condition).
boucle est la variable V 10. Ell e s'est inté ressée à la no ti o n de cal-
Encore faut-il évaluer les A ; ! Pour ce faire, c ul abilité, fa isa nt la di stinction e nt re ce
e lle comme nce par ca lculer qui est théoriquement possible de calculer
1 211- l . 211 de ce qui l'est en pratique. Enfin , elle avait
A 0 = - - - - pui s A 1
2 2n + 1' 2 parfa ite me nt pe rçu l' inté rêt de la méca-
Son évalu ation du coeffic ie nt A 1 n 'est ni satio n du ca lc ul. Hé las, elle décédera
pas optimale, ma is e ll e se sert de la à la fl e ur de l'âge d ' un cancer et ses tra-
valeur 2n déjà stockée dans une variable va ux seront o ubliés pendant plu s d ' un
lors de l'éva luatio n du coefficie nt A0. s ièc le . Ell e sera redécouve rte lo rs de
Pour évalue r les A,, sui vants (o ù n > 2), l'avène me nt des premiers ordinate urs;
elle réécrit l'expression de A,, comme suit : un langage informat ique portera mê me
A 211 2n - 1 211 - 2 2 son nom .
" = 2-3--4-···211
J.-J. D.
211- 1 211 - 2 2
=A----
' 3 4 211 Références
• Lady Ada et le premier ordinateur. Eugene Eric
Elle construit donc une nouve lle boucle, Kim et Betty A lexa ndra Too le, Pour La Science
maté ri ali sée da ns son programme par 26 1. juillet 1999.
une accolade . Le numérate ur est initia- • Lady Augusta Ada King comtesse de Lovelace.
li sé avec 2n - 1 et le dé nominate ur avec Biblioth èque Tan gente 37. Les algorithmes.
3; à chaque itération , on divise le numé- 20 13.
rateur, diminué de 1, pa r le dénomina- •Informatique: la préhistoire est anglaise . Tan -
te ur, a ugme nté de 1, et on le multiplie gente 137, 20 10 .
avec le rés ulta t. Ce mo rcea u de pro-
gramme est le sui vant s i la va ria ble V I
conti e nt 1, V 7 conti e nt 2, V6 conti e nt
2n e t V 11 contie nt A 1 :
V6- V1-+V6
(Y 6 contient désorm ais 211 - 1),
V1+V 7 -+V7
( Y 7 contient désormais 2 + 1 = 3),
V6/ V7 -+Vs
(Y 8 contient désorm ais la nouvelle fraction ),
Vg X VI I -+ VII
(Y 11 contient le nouvea u prod uit) .
les messages
oui se corrigent tout seuls
De nos jours, tout message, que ce soit un texte, une image ou une
vidéo, est une longue suite de bits, c'est-à-dire de O et de 1. Il peut
être envoyé par des canaux de communication divers : câbles, fibres
,:i·.
i~
\
optiques, ondes radio, etc. Quelle que soit la ligne de transmission util-
isée, elle ne saurait être à l'abri d ' erreurs. Pour remédier à ce défaut,
l' idéal est que les messages erronés se corrigent d 'eux-mêmes. La tâche
semble impossible .. . et pourtant l'idée est simple : enrichir le message
d ' informations redondantes.
Rkh;ml. "'"''"•·
La première solution qui vient à l'esprit est la répétition, par exemple 191:i~t98.
trois foi s. Ainsi, 0 est codé en 000, et 1, en 111 . À la réception, le mes-
sage est découpé en blocs de trois bits. Les groupes 000 et 111 sont
corrects et ne posent aucun problème. Pour les autres, on remplace le bit minoritaire par le bit opposé.
Ainsi 100, 010 et 001 sont remplacés par 000, 011, 101 et 110, par 111. Inconvénient : la correction
s' avère exacte si une seule erreur a été commise. Autrement dit, le code proposé ne peut corriger qu ' une
erreur tous les trois bits. De plus, il est assez lourd puisqu'il triple la longueur des messages.
Avant d ' aller plus loin, notons qu ' une notion importante se dégage, celle de distance linguistique entre
deux messages, c'est-à-dire le nombre de bits à modifier pour passer de l'un à l' autre.
Les mathématiciens ont inventé de nombreux codes correcteurs d ' erreurs utilisant des notions d'al-
gèbre. Par exemple, un codage dû à Richard Harnrning consiste à transformer chaque groupe de quatre
bits (x 1, x 2, x 3 , x 4) en un mot de huit bits qui s'écrit:
(x1, x2, x3, x4 , x1 + x2, x3 + x4, x1 + x3, x2 + x4) .
+ 0 1
Dans cette transformation, 0 0 1
l'addition se fait suivant la table suivante : 1 1 0
R ÉFÉ R ENCES
L'U11i1•ers des codes secrels de l 'A 111iq11i1é à /11/erne/, Hervé Lehning. Ixe lles
De nombreux a11ic les (vo ire mê me numéros entiers) de Tangenle, de ses hors-séries et de Tange/lie
Sup ont été consacrés à la cryptographie et aux codes correcteurs d' e rreurs. Vo ir par exemple :
• Ta11ge111e 14 7. pages 42 à 50, 20 12.
• ù 1 cryplographie. Bibli othèque Tangente 26, réédité en 201 3.
• Tra 11.1fe r1 el échange. Ta11ge111e SU P 70- 71 . 201 3.
Hlgèbre de Boole
Fruit d'une longue et lente algébrisation de la logique, l'algèbre
de Boole est utilisée pour la première fois hors du champ
mathématique par Shannon, père fondateur de la théorie de
l'information. Elle a depuis de nombreuses applications en
électronique et informatique.
Des péripatéticiens à Boole
L
es phil osophes g recs fure nt les
p'.emiers à étudie r la log iqu~, qui
rege nte, so u ve nt in co nsc ie m - En q uête d' un la ngage uni ve rse l com-
me nt , nos process us me nta ux. Dès le mun à la log iq ue e t à l' algè bre, Le ibni z
s iècl e de Pé ri c lès , la struc ture idéa le reche rc he, sa ns succès, un « alphabet
d ' un texte mathé matique est é tablie e t des pe nsées hum aines » q ui pe rmette
la notion de démonstration chez Eucl ide, de tra nscrire sy mbo liq ue me nt tout ra i-
Archimède ou Apollo nius est totale ment sonne me nt déductif e n algorith me. Ge r-
mode rne. De ux log iques co mpl é me n- gonne tente bien d ' uti liser la combinatoire
taires se dévelo ppe nt avec l'école pé ri- pour retrouver la syllogistique des anciens
pa té ti c ie nn e d ' Ari sto te e t l 'éco le du m a is, fo nda me nta le me nt , la logi qu e
po rtique de Chrys ippe. S i la log ique reste to ujours une bra nche de la philo-
aristotélicie nne, ou scolastique, fut long- so phi e n 'a ppa rte na nt pas a u co rpu s
te mps la référe nce des logic ie ns, celle mathé matique.
des stoïc ie ns, qui to mba pe u à pe u da ns C'est à Geo rge Boo le (18 15- 1864), un
l'oubli , peut être considé rée comme une mathé matic ie n autod idacte, q ue rev ie nt
pre mière versio n du calcul moderne des le mé rite d 'affirme r que la log iq ue doit
propos itio ns. être rattac hée aux mathé matiq ues et no n
à la phil oso phi e . Il ré unit les log iques
E C lasses (a , [3 , y, ... ) Propositions (p , q , r ... . ) a ri s to té li c ie nn e e t stoï c ie nn e e n un
1 Un ivers ( 1) Ta uto logie (V) uni q ue systè me a lgé bri q ue , mais qu i
0 Vide ÇO) Cont rad icti o n (F) im pose de c ho is ir e ntre une interp réta-
+ Uni o n ( U) Disjoncti on (y ) ti o n e nse mb li ste o u propos itio nn e l le
X Intersectio n ( n ) Conjonction(/\) (voir tabl eau). Malgré ses défa uts, cette
Conp lément (- ) Négati o n (~) mathémati sati o n de la log iq ue est une
c Inclus ion de c lasse (C ) Imp licatio n matérie lle (:l ) révo luti o n , p lu s q u ' un e évo lu tio n , et
Iden tité en tre classe(=) Equiva lence matérielle( = ) a ura des réperc uss io ns sur les fo nde-
Interprétations de l'algèbre de Boole me nts mê me des ma thé matiq ues.
Û s,,co~~ lité,
• contraires, pour des propositions universelles (V) oppo-
sées en qualité,
• subcontraires, pour des propositions particulières (3) opposées en qualité,
• subalternes, pour opposition en quantité.
Les syllogismes sont composés de deux propositions, appelées prémisses, ayant en commun un moyen terme,
et d'une proposition conclusive sans le moyen terme. Pour des prémisses données et supposées vraies, le
=
syllogisme valide la véracité de la conclusion. Il y a 43 64 propositions pour un syllogisme, 2 X 2 4 posi- =
=
tions pour le moyen terme, donc en tout 4 X 64 256 structures potentielles de syllogismes. Mais seuls
vingt-quatre sont valides. Le célèbre syllogisme :
Tous les hommes sont mortels
Or Socrate est un homme
Donc Socrate est mortel
est constitué de trois propositions de type A, avec« homme» pour moyen terme. Un tel syllogisme est appelé
« barbara », car les voyelles correspondent aux types des propositions. De même, le syllogisme :
Tous les lecteurs de Tangente sont sympathiques
Certains mathématiciens ne sont pas sympathiques
Donc certains mathématiciens ne lisent pas Tangente
est de type « baroco ».
sc ience n' ex istant que par l' in fo rmatique, cherche Aux sources de la parole. AUX SOURCES
au to-orga II isat ion DE LA PAROLE
à modéli ser les re présentatio ns cogniti ves du ~nhia.unoN
-
cette c itation de Boileau :
Autre mythe parmi d ' autres, dans un domaine Mythes et légen des d es TIC
« Ce qui se conçoit bien
très diffé rent : le système des adresses IP (Inter-
s'énonce clairement. »
net protoco[), qui permettrait d ' identifie r les uti-
H.L.
lisateurs . .. mais qui est lo in de le fa ire si ceux-ci
Langages et
récursiuité
La notion d'autoréférence fascine les amateurs de paradoxes
et de jeux mathématiques. En informatique, c'est la récursivité
qui joue ce rôle. Elle consiste à appeler au sein d'un
programme qui calcule la fonctionf. .. la fonctionf elle-même !
Il n 'y a pourtant rien de plus sûr qu'une telle démarche.
es premi ers langages de pro-
Récurrence et induction
A La récursivité en mémoire
B La procédure ci-dessous décrit en détail comment la fonc-
tion Factorielle fonctionne pour n = 3 :
• Comme 3 n'est pas égal à o, l'appel de Factorielle (3) pro-
voque l'affectation de 3 x Factorielle (2), qui demande le
1
I p calcul de Factorielle (2), et on recommence.
• Comme 2 n'est pas égal à o, l'appel de Factorielle (2) pro-
voque l'affectation de 2 x Factorielle (1), qui demande le
calcul de Factorielle (1), et on recommence.
• Comme 1 n'est pas égal à o, l'appel de Factorielle (1) pro-
Un polygone convexe à n sommets voque l'affectation de 1 x Factorielle (o), qui demande le
est obtenu d ' un polygone convexe P calcul de Factorielle (o), et on recommence.
à n - 1 sommets en ajoutant un point A • Comme o est égal à o, l'appel de Factorielle (o) provoque
entre deux sommets B et C (côtés en l'affectation de 1. Les calculs envisagés et laissés de côté
rouge) . Les diagonales sont alors peuvent alors être effectués. On obtient successivement :
de trois types : celles de P, BC et celles Factorielle (1) = 1 x Factorielle (o) = 1 x 1 = 1,
passant par A (en bleu). Factorielle (2) = 2 x Factorielle (1) = 2 x 1 = 2,
Factorielle (3) = 3 x Factorielle (2) = 3 x 2 = 6.
Voyons un exemple où ce principe est Chaque procédure récursive peut se détailler ainsi. Elle
à l'œuvre: combien de diagonales un poly- occupe une place en mémoire importante car tous les appels
gone convexe à n côtés possède-t-il ? récursifs doivent être stockés dans un sens, avant d'être exé-
Tout d'abord, nous lui donnons un nom : cutés dans l'autre. On comprend que cette description est
v11 • Nom mer est pre ndre un pouvoir sur inutile dans la pratique, car l'un des intérêts primordiaux
ce que l' o n no mme. Le raisonne ment des fonctions récursives est d'être facile à prouver par
s' opère en li ant le cas d' un po lygone à récurrence.
n côtés à celui d ' un polygo ne à n - 1
côtés. On considère donc un po lygone
P à n - 1 côtés et on y ajo ute un po int donnant v11 • On trouve: v11 = n(n - 3)/2.
A entre deux sommets B et C. Comme nt la tro uver ? Le déta il ne sera
Le s diago na les se sc in de nt e n tro is pas do nné ici, mais il fa ut savo ir q ue
groupes. Le pre mier est formé des d ia- les méthodes sont diverses. L' une d'entre
gonales du po lygone P, au nombre de e lles, q ui n'est pas la plu s nég li geable,
v11 _ 1 par hypothèse, le seco nd d u côté est l' induction .
BC de Pet le troisième des dro ites joi-
gnant A aux points de P autres que B et On é met une hypothèse par intu ition ,
C, au nombre den - 3. on la vérifie expérimenta le ment pour
Ai nsi : v11 = v,,_ 1 + 1 + (n - 3) les premières valeurs, et, si aucun contre-
exe m ple ne vient la dé me nti r, o n la
Une telle re lation est dite de récurrence dé montre .
car elle lie v11 à v11_ 1 • Si on connaît v11_ 1, La démons tration par récurrence (ce
on en déd uit v11 • La conn aissance d' un n'est pas par hasard qu 'elle est appelée
terme permet de calculer, les sui vants. induction par les Anglo-Saxons) est la
Comme un triangle n'a aucune diagonale, preuve de cette form ule a posteriori. Sa
v3 = 0 ce qui donne les suivants de proche. dé marche:
On peut même en déd uire une formu le • Elle est vérifiée pour n = 3 .
• Adme tton s qu ' e lle le so it po ur n - 1 de la fo nction décrit comment elle est défi-
(hypoth èse de récurrence) : ni e. Cette définiti o n pe ut se mbler éton-
v,,_1 = (n - l )(n - 4) / 2. nante, car la factorielle y est définie à paitir
• Al o rs, d 'a près la re lat io n de réc ur- d 'ell e-mê me. On la compre nd mieux en
re nce: pe nsant à une délégatio n de tâc he. Vo u-
v,, = v,,_ 1 + n - 2 lo ir sui vre son exécutio n est fast id ie ux
= (n - 1)(n - 4) / 2 + n - 2 e t, de plus, ne sert à rie n (l'encadré c i-
=(n 2 - Sn + 4 + 2n - 4) / 2 co ntre s imul e ce pe nda nt l'exéc uti o n
= (n 2 - 311 )/2 = n(n -3)/2 compl è te de la procéd ure). L' intérêt est
La fo rmule est do nc vra ie po ur n. de po uvo ir pro uver que la fo ncti o n Fac-
• De proc he e n proc he (on dit e ncore to ri e ll e re mp lit bie n son rô le. Ce la se
par récurrence), o n e n déduit q u 'ell e fa it par réc urre nce sur son arg ume nt 11.
est vraie po ur to ut n ~ 3 . O n re ma rque que l'écriture de la fo nc-
li s 'ag it de !'archétype du raisonne me nt ti o n est e ll e- mê me la pre uve q u 'e ll e
pa r récurre nce. Co mme o n va le vo ir, il do nne bi e n le bo n résul tat. En effet, si
s'applique à l' ide ntique po ur pro uve r n = 0 , le résultat est bi e n 1. Ad me tto ns
que les fo nctions récursives rempli ssent que le résultat soit bi e n (n - 1) 1 pour
bi e n le ur office. n - 1, la re latio n Facto rie ll e: = 11 x Fac-
li est do nc à la base de la récursivité. to rie lle (n - 1) do nne 11 (n - 1) ! = 11 !
po ur n , ce qui est le bo n résultat. O n a
Description d'une fonction récursiue ainsi mo ntré par récurre nce que la fo nc-
ti o n Facto ri e lle re nvo ie do nc to ujours
La démarche précéde nte permet de créer le bo n résultat.
des algo rithmes ava nt de les prouve r.
L' impo rta nt est de res te r a u cœ ur du le tri par récursiuité
princ ipe: s i o n sa it passer de l'éta pe 11
à l'éta pe n + 1 e t que l'on sa it démar- Les fo nc ti o ns réc urs ives sont parti cu-
rer , o n pe ut tra ite r to utes les é tapes. liè re me nt intéressantes s i ell es s'appli -
Qua nd o n l' applique e n info rmatique, que nt à des structures récursives comme
o n ne parl e plu s de réc urre nce mais de les li stes o u les arbres . Vo ici la défi ni -
récursivité. tio n , a priori surréali ste, de la structure
On pe ut ainsi définir des fo nctions récur- de li ste :
sives da ns pra tique me nt to us les lan-
gages mode rnes. Une liste cl ' obj ets est soit fa liste vide.
L'exe mpl e le plu s so uve nt do nné est soit un obj et (la tête) plus une liste (fa
celui de la fo nctio n fac to rielle do nt voici queue). Une li ste de no mb res e nti e rs
la desc ripti o n du ca lc ul : pe ut do nc être: { 10. 5 , 8, 2}. Dans ce
cas, sa tête est le nombre 10 et sa que ue,
Fonction Factorielle, argument n : nombre la li ste {5, 8, 2}. Po ur ce qui suit , o n
Si n = 0 alors Factorielle := 1 no tera t : : q la I iste de tê te t e t de queue
sinon Factorielle := n x Factorielle (11 - 1) q. Un exemple de fo nctio n récursive sur
les li stes va dé bo uche r sur un tri . Com-
Co mme da ns un grand nombre de lan- me nt trier une li ste par ordre croissant ?
gages, on a fait précéde r la descripti o n Comme o n va le vo ir, il suffit de savoir
de cette fon ction par une partie déclarant in sérer un no mbre dans une li ste déjà
son no m (Fac to rie lle) et son (o u ses) triée . La fo nctio n sui va nte, notée Insère ,
argument : n qui est un no mbre . Le corps sera utili sée po ur ce fa ire :
langages rationnels
et automates finis
La théorie des langages formels est une modélisation du
langage naturel. Fondamentale pour décrire et analyser les
langages de programmation et la calculabilité, elle a de
nombreuses applications en linguistique correction
orthographique, reconnaissance vocale, traduction.
anni les langages formels se trouve
Des automates dans tous leurs états la ngage est reconna issab le si , e t seu le-
ment si , il est rationnel. C'est le théorème
Un mo t étant do nné, o n pe ut se de ma n- de Kleene , dont il ex iste une pléthore
de r s' il fa it pa rtie o u no n d ' un la ngage . de démonstrations.
Po ur ce la, il ex iste une mac hine a bs- En particulier, pour c haq ue express io n
traite (appelée automate fini), composée ratio nne lle o n peut construire un auto-
d ' un no mbre fini d 'états re liés par des ma te qui reco nn aît le la ngage dé noté
fl èches é tique tées pa r des le ttres. Les par cette ex press io n . Une intuiti o n pour
a uto ma tes déterm inistes n 'o nt qu ' un compre nd re po urquo i
seul état initia l et une unique fl èche é ti - {a"b" , avec n un e nti er q ue lco nqu e}
quetée par une le ttre pour c haque état. n 'est pas rat io nne l est de remarquer que
Pour tester un mot , il fa ut partir de !'état les é tats d ' un a utomate pe uve nt renfer-
initi al e t sui vre les fl èches corres po n- mer une info rmatio n bornée. Or, pour
dant aux lettres du mot les unes après les acce pter un mot de ce la ngage , lors-
a utres. Si l'automate est déte rmini ste, qu 'o n a lu un no mbre arb itra ireme nt
il ne possède qu ' un état initial et il ex iste, grand de a, o n a beso in de vé rifier qu'il
à c haque é tape, au plus une fl èche é ti - y a auta nt d'occurrences de b.
que tée par chaque lettre. Le che min (on Pour compte r les occurre nces du mot
dit a uss i calcul) ainsi construit à partir chaton da ns un texte, o n peut construire
d ' un mot sur un automate dé te rmini ste un auto m ate qui reco nnaît le langage
est donc unique . Après avo ir é puisé les rationnel A *chaton (les mots qui finis-
lettres du mot , s i on se trouve sur un sent par chaton) sur l'a lph abet nat ure l,
état fin al, le mot est accepté, sinon il est qui pe ut lire le tex te à trave rs l' auto-
rejeté par l'automate. Le langage reconnu m a te e t in c ré m e nte r un co mpte ur à
par cet automate est l'ensemble des mots c haque fois que l'on visite un état final
acceptés par cet automate. Dans le même (qui correspo ndra à une occurre nce de
ordre d'id ées, un lan gage es t recon- chaton dans le tex te).
naissable s' il existe un automate qui le
reconnaît. De maniè re remarqua ble, un On pe ut auto ri ser un automate à possé-
de r plu sie urs c he min s étiquetés par un
b mot. On obtient ce qu 'o n a ppe ll e un
automate non déterministe e t un mot est
accepté si au moins un des chemins qu'il
étique tte est acceptant, rejeté si no n .
Bonn e no uv e ll e, il es t poss ibl e de
construire pour c haque a uto mate no n
dé te rmini ste un automate détermini ste
qui reconn aît le mê me la ngage ! Mau-
Un automate qui reconnaît le langage b(ab + b)*. vaise nouve lle, l'automate ainsi constrn it
Par exemple, pour tester bba, on part de l'état initial O pe ut avo ir ex po ne nti e ll e m e nt plus
(indiqué par la flèche entrante). La flèche étiquetée par b d 'états . .. Ces de ux classes d 'auto mates
nous mène en 1, la flèche suivante nous laisse en 1 et on finit ont do nc é to nna mme nt le même pou-
enfin en 2, qui n'est pas un état final : le mot est donc rejeté. voir ex press if : il s sont éq ui va lents en
Le mot a est directement rejeté. Le mot bbab , en revanche , ce qu ' il s sont capables de ca lcule r, mais
fait arriver en 1, qui est final (indiqué par la flèche sortante), ils diffèrent dans la manière dont il le cal-
donc le mot est accepté. Et en effet, le langage dénoté c ul e nt. Il fa ut tro uve r un co mp rom is
par b(ab + b)* contient bbab mais pas bba. e ntre le fa ible no mbre d 'états des auto-
,____,,___o_ ~
R
~--•~--•
f- --· s
s
ministe à 11 + 1 états au pire qui le recon-
naît. Un tel automate est appelé awomate u ( }----
X
·
aux termes dérivés.
~ . __
~ 111J---
..___
s-
s
.
·
Complexité de Kolmogorou
et profondeur logique de Bennett
Pour mesurer la complexité d 'un objet numérique, s elon que
l'on considère son contenu en informations, ou son contenu
en structures, deux notions très différentes sont obtenues. À
l'origine de ces outils se trouvent les travaux du mathématicien
Andreï Kolmogorov.
proposée par A ndreï Ko lmogorov e n
1965. C harles Bennett a depuis donné un
sens mathématique à une distinction tout
auss i nature lle e t impo rtante , ma is q ui
j usqu 'à présent écha ppa it à la forma li-
sati o n , la di stin ctio n e ntre ce q ui est
« complexe car a léato ire » (co mme un
gaz o u un tas de caillo ux) et ce qu i est
« co mpl exe ca r t rès o rga nisé o u très
structuré » (comme une puce info rma-
tique ou un être vivant). Ces deux concepts
- comp lex ité de Ko lm ogorov et pro-
fo nde ur logi que de Be nnett - concer-
ne nt to utes les scie nces.
L d es n o ti o n s n a ture ll es de
« s impl e » e t de « co mpl exe »
n 'ont abo uti à des résultats inté ressants
à décrire e nti è re me nt dans le déta i1, car
il faut indiquer l'emplacement et la fo1m e
de chaque caillo u. Pourtant e lle est fac ile
que de puis que lques années, g râce à la à décrire po ur ce qui est de sa struc ture
théorie a lgo rithmique de l' informati o n gé néra le , pui sque seule sa for me géo-
mé triqu e ( lo ng ue ur, la rg ue ur .. . ) es t
importante a lo rs.
Il y a bie n de ux concepts de complex ité
à ne pas co nfo ndre : la « co mplex ité Raymond Solomonoff
a léato ire » et la « complex ité o rga ni sée (1926-2009).
(ou structure lle) » . Po ur l' illu stre r plus
préc iséme nt, cons idérons le pro bl è me
de la description au millimètre près d ' une
ma ison dont les murs sont couve rts de
c ré pi . Le pl a n de la ma ison correspo nd
à la complex ité o rga ni sée de la ma ison . La dé finiti o n de la profo nde ur log ique
Ce plan ne préc ise pas les dess ins du de Be nne tt s'appuie sur la théorie de la
c rép i sur les murs. La descripti o n com- calc ul a bilité e t es t assez tec hnique à
plète de la ma ison , qui contie nt to us les é no ncer ; e ll e fa it e n partic ulie r inte r-
détails du crépi , compo rte bien plus d' in- ve nir les no tio ns de machine de Turing
forma tio ns que celle du pl an . La ma ison uni ve rsell e e t de fo nc ti o ns récurs ives .
possède une complexité organisée de Mais cela n'empêche pas de comprendre
ta ill e moyenne (un pl an n 'est pas très assez bie n intuiti vement de quo i il s'agit.
compliqué comparée pa r exemple à un Po ur tro uver le« bo n » concept mathé-
être viva nt ) et une complexité aléatoire matique assoc ié à la complex ité struc-
assez gra nde. ture lle, C harles Bennett a mené un trava il
d 'ana lyse. Po ur lui , un o bje t fo rte me nt
Programmes courts et temps de calcul orga nisé contie nt nécessaire me nt e n lui
la trace d ' un lo ng process us d 'élabora-
Le concept mathé matique de complex ité ti o n , de ré fl ex io n o u d 'évo luti o n qui
a léato ire a été ide ntifié da ns les a nnées correspo nd à une fo rme de calcul . Dé fi -
1960, g râce a ux travaux pré limina ires nir la co mplex ité o rga ni sée d ' un o bje t
de Ray S o lo mo no ff , e t à ce ux d ' A n- se ramè ne do nc au problè me de la dé fi -
d reï Ko lmogorov, de Gregory C ha it in niti o n d ' une no tio n de contenu en cal-
et de Leonid Lev in . Cette complex ité cul. E n in fo rm a tiqu e th éor iqu e, les
se no mme complexité de Kolmogorov. trava ux s ur les a lgo rithmes pre nne nt
Elle est dé fini e co mme la ta ille du plus bi e n e n co mpte les te mp s de ca lcul
peti t progra mme po ur un o rdinate ur de (classes P, NP, EXP ... ), ma is ces é tudes
référe nce - a ppe lé machine univer- s ' attac he nt surto ut a ux compo rte me nts
selle - capable de produire l'objet numé- asy mpto tiques des a lgo rithmes, a lo rs
rique auque l o n s' inté resse e t que l'on qu ' ic i o n n 'a à fa ire qu 'à des o bj e ts
a s upposé éc rit so us la fo rme d ' une numé riques fini s, o u que l 'on ra mè ne à
sui te de O et de 1 (image numérique, son des o bje ts fini s e n fi xa nt un ni vea u de
numé rique ... ). Une suite d ' un milli a rd préc is io n cons idé ré comme s u ff isant
de O a une fa ibl e co mpl ex ité de Ko l- po ur la numé ri sati o n . Po ur dé finir le
mogorov, de mê me qu ' un milli a rd de conte nu e n ca lc ul d ' un o bje t numé rique
c hi ffres bin a ires d e n (ca r d es p ro- (c'est-à-dire sa complex ité o rga ni sée),
gra mmes courts pe rme tte nt de les ca l- Be nnett propose de considé re r le te mps
culer). Une suite a léato ire d ' un milli ard de calcul que pre nd le programme mini-
de O e t de 1, à l ' in ve rse, possède une ma l (celui do nt la ta ille définit la com-
co mpl ex ité de Ko lmogorov d 'enviro n plex ité de Ko lmogorov) po ur produire
un milli ard . l'objet a uque l on s' inté resse . C'est une
Sur un exemple
Un programme de compression de données permet d'évaluer à la fois la complexité de Kolmo-
gorov et la profondeur logique de Bennett. L'idée est que la version compressée d'un fichier doit
être vue comme un court programme engendrant le fichier. La taille de ce fichier indique donc
une valeur approchée de la complexité de Kolmogorov. De plus, le temps nécessaire à la décom-
pression du fichier est assimilable au temps de calcul de ce court programme pour produire le
fichier initial, donc peut être vu comme une évaluation de sa profondeur logique de Bennett.
Voici concrètement ce que l'on obtient avec des images. Les expériences ont été réalisées par Hec-
tor Zenil, Cédric Gaucherel et l'auteur. On a pris sept images de même format que l'on a com-
pressées par utilisation d'un algorithme de compression sans perte O'image que l'on retrouve après
décompression est exactement celle avant compression).
La première série indique le classement des images par ordre croissant de taille du fichier com-
pressé. Le classement est donc celui par complexité de Kolmogorov K(s ) croissante. Sans sur-
prise, l'image toute noire (image 1, en haut à gauche) a le contenu en information le plus petit,
et l'image composée de pixels tirés aléatoirement (image 7) est celle qui exige la plus grande
quantité de mémoire (K(s) est maximal). Les autres images sont classées à peu près comme on
s'y attend : le texte écrit à la main (image 2) demande assez peu de mémoire car il y a beaucoup
de blanc ; un réseau périodique (image 3) ; une courbe de Peano (image 4) ; une image irrégu-
lière mais avec deux axes de symétrie (image 5) ; un microprocesseur (image 6).
La seconde série d'images (ligne du bas) reprend les sept mêmes images, mais cette fois par
ordre croissant de temps de décompression, ce qui donne des valeurs approchées de la profon-
deur logique de Bennett, P(s), et donc un classement par complexité structurelle croissante.
L'image 7 du premier classement (qui est parfaitement aléatoire) est maintenant parmi les pre-
mières, conformément à l'idée qu'un hasard parfait est sans structure. Le microprocesseur est
bien identifié comme le plus complexe structuralement. La courbe de Peano est sans surprise tou-
jours considérée comme contenant des structures un peu plus riches que le motif périodique. Le
texte écrit et le motif symétrique changent de position, donnant au total un classement compa-
tible avec ce qui, intuitivement, correspond à une complexité structurelle croissante.
ou « c'est un objet de petite complex ité Un autre problème est de savoir si les lois
aléatoire mais profond ». Pour tra ncher, du monde physique sont telles que, néces-
il fa ut avo ir ide ntifié en quo i la co m- sa irement , se produit un accroissement
plexité est orga nisée. Ce qui est pro- de la complex ité organi sée. Ce n 'est pas
fond peut avoir l'apparence de l'aléatoire. parce qu ' une sorte de ca lcul se déroule
li n'es t pas absurde de considé rer q ue da ns le monde physique qu ' un autre cal-
le trava il de la rec herc he sc ientifiqu e cul plus rapide n 'est pas poss ible ou que
est l'identification de la complex ité orga- les résultats de ce ca lcul ne pe uve nt pas
nisée , là où ap pare mme nt ne se tro uve être détruits (auque l cas bien sûr aucune
que de la compl ex ité aléato ire. croissance de profonde ur log ique ne se
Aujou rd' hui , les algorithmes de co m- prod uit). Le fa it que notre monde phy-
press ion de données (sans pertes) sont sique autorise de longs calculs ne prouve
les mei ll e urs o ut il s po ur me ne r des do nc pas qu ' il es t le lie u d ' une aug-
mes ures de complex ité : me nta ti o n in év ita bl e de profo nd e ur
• La taill e du fic hi er compressé est une log ique . Les bons concepts mathéma-
ap prox im ati o n de la co mpl ex ité de tiques semblent identifiés. La question
Kolmogorov. « pourquo i ass iste-t-on à un accroisse-
• Le temps de calcul pri s pour décom- ment de la complex ité organi sée? » pos-
presser un fic hie r compressé do nne sè d e m a int e na nt un se ns pure me nt
une évaluation de sa profondeur logique mathé matique, et pe ut do nc recevo ir
de Bennett (elle n'est vraiment sati s- une réponse mathématique. Si on y arrive,
fa isante q ue si l'algorithme de com- peut-être sauro ns-no us a lors pourquo i
pression a bien su re pérer les structures la vie deva it apparaître sur Terre !
du fic hier qu 'on lui a confié).
Les rés ul tats de Bennett montrent auss i J.-P. D.
que l'apparition lente de la complex ité
organi sée ne contredit aucune me nt la Références
seconde lo i de la thermodynamique, qui • Mesurer la complexité des objets numériques. Jea n- Paul Delahaye , Bulle-
concerne l'accro isse me nt de la co m- tin de la Société informatique de Fran ce ( 1), 20 13 , disponi ble en li gne.
plex ité aléato ire . Le fa it que la co m- • Image Characterization and Classiflcation by Physica l Complexiry. Hec-
plex ité orga ni sée s'accroisse au cours tor Zenil , Jean-Paul De lahaye et Cédric Gauchere l, Complexiry 17 (3),
du tem ps (com me o n le cons tate sur 2012.
Terre) est simple ment le signe que dans • Camplexiré aléatoire et complexité organ isée. Jean- Pau l Delahaye, Qure ,
le monde physique se déroulent des pro- 2009 .
cess us ass imil a bl es à du calcul (avec • Logica/ Depth and Physica/ Complexity . Charles Ben nett, in The Univer-
mé morisation). Ce n'est pas choquant : sal Turing Machine: A Half-Centu ry Su rvey, Oxford Unive rsi ty Press ,
les mo uve ments mécaniques, les inte r- 1988 .
actio ns c h imiqu es, les process us d e • How 10 dejin e complexity in physics, and Why. Charles Ben nett , in Com-
sélection, les mouvements culturels sont plexiry, Enrropy and the Physics of Information , SFI Studies in the Sciences
des sortes de ca lcul s. S i o n ado pte le of Comp lexi ty (V III ), Add ison-Wes ley, 1990 .
point de vue de Bennett , l'aug me nta- • Information , Randomness and lncompleteness: Papers on Algorithmic
tion de la complex ité organisée sur Terre Information Th eory. Gregory Chai tin , Worl d Scient ific. 1987.
de pui s qu atre milli ards d 'a nn ées es t • Information, comp lex ité et hasard . Jean-Paul Delahaye , Hermès , 1999.
co mpatibl e avec la the rmody namique, • Three Approaches for Defining the Concept of Information Quamity. Andreï
et cela sans avoir recours à des pirouettes Kolmogorov, Information Transmission ( 1), 1965.
comme quand on confo ndait complex ité
aléato ire et complex ité organi sée.
Comment éliminer
les spams?
Comment rejeter les courriers électroniques non sollicités
sans perdre de messages ? La solution la plus efficace à
l'heure actuelle repose sur l'utilisation d'un théorème de
mathématiques : le théorème de Bayes.
le même registre. Cependant, cette idée sage, tou s ses mots sont lu s ; il est ainsi
montre rapidement ses limites pour plu - transformé en un e nsembl e de probabi-
sieurs raisons. lités. Ces probabilités sont combinées
Tout d'abord , un co urri er normal peut pour donner un indi ce indiquant la pro-
très bien uti Iiser ces mots et vous ri s- babilité que le message so it du spam ou
quez de les é liminer automatiquement. non. Comme ce calcul de probabilités fait
Ensuite , ce rtain s po urri e ls ne les uti- appel au théorè me de Bayes, ces filtres
Iisent pas. D ' a utre part , il s uffit de sont appel és filtres bayésiens.
changer « v ia gra » e n « Via g r a » ,
« VI4GR4 » o u « YIAGRA » pour Pour calculer la probabilité qu ' un mot
conto urne r la difficulté. apparai sse dans un pourriel , rien de très
Des filtres plus développés ont été mi s difficile : pre nez un gra nd nombre de
au point pour tenir compte de ces pro- pourriel s, utili sez un log iciel pour trier
blèmes. Cependant , les tec hniqu es les mot s s ' y trouvant e t co mptez le
em ployées par les aute urs de pourriels nombre d 'occurrences de chacun. Faites
évo lue nt sa ns cesse, ce qui nécess ite la mê me chose avec un ensemble de
une mise à jour permanente des règles message n' étant pas du spam (vos mes-
emp lo yées. Et bien qu e ces règ les sages personnel s par exemple) et vous
so ie nt très efficaces pour se d é bar- obtenez, pour chaque mot , la probabi-
rasse r d ' une bonne parti e du spam , le lité qu ' il apparai sse dans un pourriel et
filtrage des messages restants es t sou- la probabilité qu'il apparaisse dans un
ve nt très difficile. message norma l. Après l'analyse d ' un
message , vous pouvez , en multipliant
Est-il si diffic ile de distinguer les pour- les probabilités que chaque mot apparaisse
riels des vrais messages ? Po ur un être dans un pourriel , en déduire la probabilité
hum a in e n aya nt déjà reçu quelques- que l' e nsemble des mots du message
un s, un coup d' œ il suffit. Ce n'est pas apparaissent dans un pourriel . Mais atten-
la présence d ' un mot particulier qui les tion , la probabilité que l'ensemble des
rend fac ile à identifi er, mai s plutôt l'ac- mots d ' un message apparaissent dans
c umul ati o n de mot s dan s un mê me un pourriel n 'est pas égal à la probabi-
registre. Dans le cas des pourriel s , il lité que cet ensemble de mots forme un
s'agi t souve nt du reg istre pornogra- pourriel !
phique. La différence entre un texte nor- Appelons P(S) la probabilité qu ' un mes-
mal même très vulgaire sur le sujet et un sage soit du spam. Pour chaque mot M ,
pourriel est l' accumulation . Mê me de il est facile de calculer la probabilité
mauvaise qualité , un texte normal res- conditionnelle P(M I S) que le mot M
pecte certaines contraintes littéraires . apparaisse dans un message de spam. Il
À ! ' heure ac tuelle , les log iciel s les plus est donc facile d 'en déduire la probabilité
performants se fondent sur ce constat. qu ' un ensemble de mots M; formant un
Il faut anal y er les mots dans leur contexte courrier électronique C apparaissent
pour savoir si un message est du spam dans du spam :
ou non. La lecture de tous les mots du
message permet en effet d 'avoir une vue
=IJ
P(C I S) P(M; 1S)
plus globale de son contenu et donc de Par contre, pour connaître P(S I C),
sa nature . Pour cela, chaque mot reçoit c'est-à-dire la probabilité que ce mes-
une probabilité: celle qu'il fi gure dans sage soit effectivement du spam, il est
un spam . Lors de l'arrivée d'un mes- indiqué d ' utiliser le théorème de Bayes .
mathématiques
expérimentales
Les mathématiques science expérimentale ? Cette affirmation,
qui ferait bondir plus d'un mathématicien pur et dur, trouve
de plus en plus d'échos grâce à l'outil informatique.
P
lt1\ll'llP,
l'ordinateur producteur
de faits mathématiques
Simon Plouffe.
Un sec ond type d 'e xpé rim e nt a ti o ns
mathématiques est celui où l'on de mande cette mé th ode est ce ll e que fit Simo n
à l'o rdinate ur de produire un g ra nd Pl o uffe e n 1995 de l' éga lité:
nombre de «faits mathé matiques» qu 'on
analyse e nsuite jusqu 'à y découvrir des :rr = h,' 16'1 ( 8k4+ 1 2
8k + 4
1
8k + 5
1 )
Sk + 6 .
régul arités, qu ' il sera pe ut-être poss ibl e Cette no uve lle fo rmul e de séri e po ur rr
de dé montre r. C 'es t a in s i qu ' un a mi pe rmet d'en ca lcule r les chiffres binaires
ma thé m a ti c ie n a redéc ou ve rt , il y a indé pe nda mme nt les un s des autres, ce
que lques années par l'ex périme ntati o n qui étonna tout le monde . Elle permet par
informatiqu e la stratég ie ass urant de exe mpl e de ca lcul e r le milli a rdi è me
gagne r au Jeu de M ari e nbad (o u je u de c hi ffre binaire de rc sans calculer les pré-
Nim) basée sur la Nim-additi o n . céde nts.
Noto ns bi e n que la no uve ll e fo rmule a
Le re pé rage inform atique de régul ari - é té pro uvée ri go ure use me nt pa r un e
tés dans des faits mathématiques énumérés démo nstration au sens traditionnel. Fa ire
pa r la m achine adme t un cas pa rtic u- trava ille r l'o rdinate ur et généra li ser sans
lie r : la reche rc he de no uve ll es fo rmules prendre la pe ine de dé mo ntrer se révé-
par examen des chiffres décimaux qu 'elle lera it catas tro phiqu e . La nécess ité de
produit. La technique co ns iste à ca lcu - fa ire des dé mo nstrati o ns trad iti onnelles
le r avec un e préci s io n de plu s ie urs n 'est contestée pa r pe rsonne.
di za ines de c hiffres di verses fo rmul es L'o rdin a te ur produit des fa its math é-
e t à co mp a re r les rés ult a ts o bte nu s. matiques e n gra nde qu a ntité do nt o n
Lorsque les rés ultats de de ux formul es pe ut lui de mande r que ll es lo is les o rga-
coïncide nt , on essaie de dé mo ntre r l'éga- ni sent. Les régul arités re pé rées dev ien-
lité re pé rée. En pratique, po ur me ne r d ro nt alo rs des théo rè mes s i o n ré uss it
très ra pide me nt de no mbre uses compa- à les dé mo ntre r, ou sero nt des co nj ec-
ra isons, des a lgorithmes spéciaux sont tures s i o n n ' y pa rvie nt pas.
utili sés. C'est ain s i qu ' e n ca lc ul ant avec l' aide
La plu s fa meuse découve11e obte nue par de progran1mes, les décimales des nombres
o btenir de s ph è res dan s l'es pace est contrôl é mécaniquement. Bien sûr le
ce lui utili sé pour fa ire les piles de bou- trava il de mi se au point de la version
lets de canon ou les tas d 'oranges). formal isée se fait en s'aidant d 'ordina-
Un bon ass istant ne sert pas seule ment teurs, et une fois que ce travail sera effec-
à exéc ute r doc il e me nt des co r vées tué , ce sera encore l'ordinateur qui sera
si mples qu 'on pourrait faire soi-mê me chargé du contrôle final de la justesse de
à la main si o n éta it près à y consacré chaque pas de la preuve formalisée. Un
des années ou des s ièc les . li sera d 'au- tel travail d 'éc riture formelle d ' une
tant plu s préc ie ux qu 'o n pourra lui preuve associée à sa vérification a été mené
demander des tâc hes subtil es. Grâce pour le théorè me des quatre couleurs
aux log ic ie ls de calcul formel e t de par Georges Gonthier.
démonstration automatique, il n'est pas Cet usage des ordinateurs pour valider
ra re qu ' une parti e dé li cate de dé mon s- des démonstrations complexes est une
tration o u un morceau difficile de ca l- forme nouvelle d 'expérimentation mathé-
cul so it confi é à l'ordin ate ur. matique. Elle s'ajoute aux nombreuses
Aujourd ' hui , on voit donc fréquemment autres form es d 'ex pé rimentation s e n
des recherches où l'ordinateur interv ient train d 'e nvahir l'ense ig ne me nt et la
en fournissant son aide au moment de la recherche mathé matique.
découverte des nouveaux énoncés, étape J.-P. D.
sui vie par une aide à la mise au po int des
démonstrations et éventuellement à leur Bibliographie
contrô le (sans parler de l'a ide qu 'ap- • J. Borwein, D . Bai ley, R. Gi rgensohn. Experimetati on in Mathematics:
porte ('ordinateur pour éditer les textes Computati onal Paths to Discovery. Natick, MA, A. K. Peters, 2004 .
mathématiques, les imprimer et les faire • D. Bailey, J. Borwei n , K . Devi in. The Experimental Mathe matician:
circuler entre chercheurs). a Computationa l Guide to the Mathematica l Unknown. Natick , MA , A.
K . Peters, 2002 .
L'ordinateur pour confirmer • D. Bailey, J . Borwe in , N. Gi rgenshn , Ex perimental Mathematics in
et contrôler Action, A. K. Peter, 2006.
• K . Cha urasya Experimenta l Mathematics, Campus Books International,
Signalons encore qu'un usage impor- 20 12.
tant de l' ordinateur se mbl e e n vue à • G. Gonthi er, Formai Proof, The Four-Color Theore m . Notices of the
cause justement de la complex ité des AMS 55 ( 11 ), 1382- 1393, 2008.
preuves que l' interaction e ntre ordina- • K. Hare. New Techniques for Bou nds on the tota l number of primes fac-
teurs et mathématic iens engendre. La tors of an odd Perfects number, Mathematics of Computation, 76:260,
démonstration que Thomas Hales a mise 224 1- 2248,2007.
au point de la conjecture de Kepler et dont • P. Oc hem, M , Rao,. Odd Perfect Numbers are Greater than 10 1500 ,
certaines parties fo nt interve nir des cal- Mathemati cs of Computation, 8 1, 1869- 1877, 20 12.
cul s informatiques a été publiée avec
une mi se en garde du comité d 'experts
chargé d'en fournir la garantie: le comité
a indiqué qu ' il ne pou vait pas assurer
q u'auc une erreur n'éta it restée. Pour
lever cette incertitude, Thomas Ha les a
entrepri s de produire une vers ion for-
malisée de sa dé monstration , c'est-à-
dire une version dont chaque pas est
so igneusement ex pli c ité et pe ut être
L
es a uto mates cellulaires o nt fait propage-t-ell e au mo nde e ntier?
le ur ap pa riti o n dans les a nnées
1940, s uite à des trava ux des naissance, uie et mort
mathé matic iens Stanislaw Ulam et John
von Neumann qui recherchaient des sys- Une automate cellul a ire peut se définir
tè mes abstraits capables de se ré pliquer co mme un e nse mbl e de ce llul es po u-
e ux- mê mes. vant pre ndre des é tats s uccessifs (le
Ils sont régulièrement utilisés pour modé- no mbre d'états poss ibles étant fini) en
li ser les processus d 'ex pa ns ion des é pi - fo ncti o n des états des cellules vo is ines
dé mi es o u des é pi zooti es. Ils sont auss i à c haq ue étape, le te mps étant discrétisé
pertinents que le ur définiti on est simple : e n in sta nts 1, t + 1, t + 2, . .. Les ce l-
Hu commencement,
les matrices...
Matlab est un logiciel de calcul numérique interactif développé
par la soc iété américaine MathWorks. Utilisé aujourd ' hui par
plu sieurs millions d' ingénieurs et de chercheurs , il est issu,
au milieu des années 1970 , du projet pédagog ique d ' un pro-
fesse ur de mathématiques, Cleve Moler, soucieux d 'aider ses
matlab
élèves à fai re du calcul matriciel sans connai ssance préalable
de Fortran (Matlab est la contraction de Matrix Laboratory) .
poor l'enseignement
Matlab est donc , nati vement , optimisé pour le traitement des Les dernières versions de Matlab
matrices , qui en sont d'ai lleurs les variables par défaut. Son permettent aux utilisateurs de créer
langage , destiné initi alement à des étudiants, est simple , intui- des applications prêtes à l'emploi et
ti f et plus concis que les langages hi storiques Basic , C , For- de les empaqueter automatiquement
tra n ou Pasca l. afin de les partager facilement via
la plateforme communautaire de
MathWorks (www.mathworlcs.fr/rnat-
labcentral). Autre signe d'une volonté
d'interopérabilité accrue , les possi-
bilités d' interfaçages avec d ' autres
_,_,._.
. . :=.;_
__
_
langages comme le C++ ou Java .
Au-delà de l'usage dans la recherche
---
---·
--·· et l'industrie, cet environnement
constitue également un outil nova-
teur pour l'enseignement. En sciences
du vivant par exemple, le recours à
Si Matl ab est d 'abord un langage, c' est aussi un environne- Matlab peut permettre d'aborder la
ment de développement doté d'une interface graphique pui s- problématique de la bio-informa-
sante pour l' affichage des courbes et des données , ainsi que tique et des systèmes biologiques à
de nombreuses boîtes à outils (fonctions dédiées à des appl i- travers l' analyse de séquences géno-
cations spéc ifiques, comme le tra ite ment du signal , !'analyse miques, d ' arbres phylogénétiques ,
stati stique , l' optimi sation . . . ). Outre une utili sation standard de structures protéiniques , etc.
en algèbre linéa ire , le log ic iel permet ain si )'analyse et la
visuali sation de données , la modéli sati on et la simulation de Matlab se veut aussi le partenaire
systèmes dynamiques , l' optimisation numérique , la mi se en privilégié du baccalauréat « Sciences
œuvre et le test d ' algorithmes, et trouve des applications aussi et technologies de l' industrie et du
bien en traitement du signal qu 'en statistique ou encore en trai- développement durable » (STI2D).
tement des im ages. Certaines ressources pédagogiques
Les trois fo ndateurs de Math Works (C leve Mo Ier et les ingé- exploitent ainsi les capacités de simu-
ni eurs Jack Little et Steve Bangert) pouvaient-il s imag ine r, lation et de modélisation du logiciel
lors de la commercia li sation , en 1984 , de la toute première pour proposer aux élèves l'étude de
vers ion de Mat lab, que leur logic iel dev iendrait non seule- systèmes réels, comme la lampe
ment un outil incontourn able pour la recherche, mai s sera it solaire Mona, développée par la jeune
de plus en plus utili sé et pri sé par le monde de l' industrie et entreprise Solar 21 .
de la finance?
Démonstration
L'ordinateur à la rescousse
Une intelligence artificielle comparable à celle de l'être
humain reste encore à ce jour hors de notre portée. Pour
autant, l'ordinateur peut nous aider à mener bien des
raisonnements, parfois même très complexes.
Puzzle Artifact illustrant le théorème
des quatre couleurs
(design : Tara Flannery).
'
L
ordinateur est e ncore lo in des
pe r fo rm a nces hum a in es e n
te rmes d ' inte ll igence , mais il
a des ato uts que l' être humain ne pos-
sède pas : une capac ité de ca lc ul incom-
parable , une docilité totale et une fiabilité
sans fa ille dès lors que la mi ss io n q ui lui
a é té confiée l'a é té avec ri g ue ur.
li se mb le a lo rs no rm al que le mathé-
m ati c ie n c he rc he à s ' a ppu ye r dess us
po ur l'a ide r da ns ses dé mo nstra ti o ns ,
surto ut ce lles do nt il a du mal à se tire r
to ut seul. Dans ce but , il a do nc im a-
g iné plu sie urs o uti ls in fo rmatiques.
L'assistant de preuue
Il n 'est pas possible d 'écrire
un programme qui prend en entrée L' un des o uti ls les pl us notables de la
dé mo nstrati o n ass istée pa r o rdinate ur
un énoncé mathématique est l'ass istant de pre uve. Un ass ista nt
et qui détermine, en un temps fini, de pre uve est un log icie l qui vé rifie les
si cet énoncé est vrai oufaux. é ta pes d' un ra iso nne me nt log ique. Il
la démonstration automatique
a + b • 5 • ( k 1 + k2)
Espaces de Banach
et informatique théorique
Un problème d'analyse difficile peut être reformulé en théorie
des graphes et se trouver lié à certains concepts de
l'informatique théorique. Ce phénomène fréquent est une
manifestation forte de l'unité des mathématiques !
L
Les termes suiv is ' é me rge nce d e l ' o rdin a te ur , les di sta nces e ntre X et B , o n introduit
d'un astérisque sont dans la seconde mo itié du XX 0 la dis lo rs io n d e f , un no m bre da ns
défin is en encadré.
clans le glossaire. s iècl e, a induit le déve lo ppe- l l ; 001dé fini par:
me nt d ' une no uvelle branche des mathé- . . 11/(x)- f(_r)II II d(x. r)
th.\ï ( f } == max x max · .
· '" ' d(x .y) •· • llf<x)- /(.r)II,.
matiques , l' in fo rm atique théorique, e t
do nc auss i ! 'appariti o n d' une no uvelle La d isto rs io n de f est un in variant très
es pèce de sc ie ntifiques , les « in fo rm a- robu ste: il est in va ri ant par exemple par
tic ie ns théori c ie ns », qui o nt la parti c u- les homothéties de B. Po ur avo ir un in va-
larité d ' ê tre a uss i à l ' a ise d eva nt un ri ant ne dépe ndant que de X, on prend
c lav ie r qu ' a u ta bl eau no ir. li y a d es la bo rne in fé rie ure sur to utes les appli -
as pects de l' in fo rmatique théorique que catio ns injecti ves te lles quef, et on défi-
l'on im ag ine bi e n: théorie des g raphes, nit la dis10rsion de X à va le urs da ns B :
algorithmique, théorie de la complexité ... c,,( X) = in f dist (f).
J x---n
Pest-il égal à nP ?
Le problème découvert par Godel paraissait facile ; pourtant,
il résiste depuis cinquante ans, et on a surtout compris qu'il
ne fallait pas s 'attendre à en trouver rapidement la solution.
De quel problème fondamental s 'agit-il ?
L
es problèmes combinato ires clas- de la même faço n po ur chaque compo-
siques(« savoir si un mot contient sante. Si l' o n re ncontre une im poss ibi-
un sous- mot donné »,« savo ir lité, c'est qu 'aucun coloriage bicolore n ·est
s i un c he min do nn é est le p lus court poss ib le, ca r to us les co lori ages fa it s
chemin re li ant A et B dans un gra phe », après le pre mier sont inév itables . Si on
« savo ir si l'entie r N est un carré par- aboutit , c'est que la ré ponse est oui.
fa it » .. . ) se tra itent parfo is rapide ment , Aucun retour en arrière n' est nécessai re
ou à l' in ve rse de mandent bea ucoup de da ns l' utili sa ti o n de la mé th ode (les
ca lculs. Les cl asses de comp lex ité défi - nœuds une fo is co~rés ne changent plus
•
ni es en in fo rmatique théorique serve nt de dti ule ur) et doncia méthode de colo-
à les ranger en catégories. C'est étra nge, riage prend un « temps» (c 'est-à-di re un
ma is on ignore si les de ux princ ipa les nombre d ' étapes) proportionnel en gros
c lasses, P et NP, sont éga les ! au nombre de nœuds, n. On dit que le pro-
bl ème de la 2-co lori abilité est polyno-
La classe P m ia l (o u ap p a rli e nl à la c lass e
polynomiale) .
Savo ir si les nœ uds d ' un gra phe donné Certains problèmes de décision Oa réponse
aya nt n nœ uds sont co lori ables à l' a ide do it être « oui » ou « non ») ne peuve nt
de de ux couleurs (par exemple bl e u et être réso lus qu 'en un nomb re d ' étapes
ro uge) sans que deux nœ uds liés l'un à majoré par ,l (o u par toute autre pui s-
l' autre portent la même couleur est fac ile. sance de n , n mes urant la taille des don-
On obtient la ré ponse rapidement par la nées). On con sidère encore que ce sont
méthode sui va nte. On cho isit un nœ ud , des problèmes « efficacement traitables »
que l'o n co lorie e n rou ge , on co lorie et il s constituent la classe P des pro-
to us les nœ uds qui lui sont liés en ble u , blèmes que l'on pe ut résoudre en temps
on colorie tous les nœuds liés à un nœud polynomial.
bl e u e n rouge, et on poursuit ainsi de Bien év idemment , un problème deman-
proche en proche en alternant les cou- dant un nombre d 'étapes de l'ordre de
4
leurs ; quand il ex iste plusie urs compo- 11 est plus diffic ile (en un sens) qu ' un
Problème·~ planaire
Un graphe G, de taille n, étant donné, ainsi qu'un entier k,
ex po ne ntie l de poss ibilités , ce qui est
le problème même de la recherche sc ien-
tifique. Dit en termes simples , la ques-
peut-on trouver knœuds du grapbeGtels qu'en ne retenant tion « P = NP ? » signifie « est-ce que
que ces k nœuds et les arcs qui les relient on obtienne un ce que nous po uvo ns tro uve r ra pide-
graphe planaire (représentable sur un plan sans que deux ment , lorsque nous avo ns de la chance ,
arcs se coupent) ? pe ut être trouvé ra pidement par un ca l-
cul intelligent ?». Sous forme très brève :
Problème da emenabla ~ l' inte lli ge nce pe ut-e ll e re mpl acer la
Une famille finie d'ensembles finis F, de taille n, étant don- chance?
née, ainsi qu'un nombre 1c, peut-on trouver k ensembles Une autre fo rmulation encore de ce pro-
dans la famille F qui soient disjoints deux à deux ? blème est : tout ce que l 'on peut vérifi er
Exemple : F = {{a, b, c}, {a. e, c,f, g}, {d. e,f}. {a. c, e, i}, fac ilement peut-il être découvert fac i-
{c,f, i}, {g. h, i}, {b,f, ï}, {j, 1c, l, m}, {b, g, h, i}} avec k = 4. lement ? Vérifier qu ' un chemin dans un
Réponse : oui, en considérant {a, b, c}, {d, e,j}, {g, h, i}, gra ph e passe pa r to us les nœ ud s du
{j, 1c, l, m}. graphe sans jamais passer deux fo is par
le mê me nœ ud (che min hamiltonien)
est fac ile, do nc, si P = NP, savo ir s' il
la grande question ex iste des che mins hamilto ni ens sera
fac ile (on ne connaît pour l' instant aucun
La ques tio n la plu s fo nd ame nta le de algorithme e ffi cace qui le permet) .
l' inform atique théorique est ce ll e de
savoir si P =NP. Autre ment dit , ce que Tout probl ème de la classe P est égale-
l'on pe ut fa ire en te mps po lyno mi a l ment da ns la cl asse NP. Apparteni r à la
non déterministe quand on a une chance classe NP n'est donc pas un gage de di f-
p ar fa ite (cl asse d es probl è mes NP) fi culté ! Un te l gage ne s'obtient qu ' en
pe ut-il toujours être fait en temps po ly- considérant la classe des problèmes NP-
no mi a l par un a lgorithme n ' utili sa nt compl ets.
Latex Cabri
La compos iti o n des fo rmul es mathématiques
est un cauchemar pour beaucoup d ' utili sateurs
pour uérifier une conjecture
de maths, de l' étudiant au chercheu r, mais plus Les log icie ls de géo mé trie inte rac ti ve sont une des
e ncore pour les éd ite urs. e n recherche perma- manifestations importantes de l'appo rt de l' infor-
nente de sy nthé ti se urs de form ules. En 1977 le matique aux mathé matiques.
mathématic ie n e t in formatic ien Donald Knuth Si Je plus connu d 'entre e ux, Cabri , s'adresse natu-
crée le langage Tex (pro noncez « Tek ») qui , rellement au monde de l'éducation (la société Cabri-
ap rès compi lation. affiche la plupart des fo r- log vient de plu s de sortir Cabri Fac tory pour le
mules dont on peut avo ir besoin. Quelques collège), des chercheurs, amateurs ou profess ion -
a nn ées pl us tard , e n 1983, Les] ie Lam port nels, se le sont rapidement approprié pour e n faire
intègre ce langage dans un log ic ie l de co m- un outil de conjecture et de recherche dans le domaine
pos iti o n de pages qui prend le no m de LaTeX . de la géométrie é lé me ntaire.
Aujo urd' hui , LaTeX est utili sé dans le mo nde
e nti er, dans to utes les lan g ues, sous to us les C'est ainsi quel' ingé nieur et mathé maticien amé-
systèmes d'exploitation, et possède de nombreuses ricain Sta nley Rabinowitz, connu pour son inépui-
extensions se mbl ab les aux bibliothèqu es de sable base de problè mes (il a créé dans les années
Maple o u Math ematica, qui regro upe nt des 1990 une société d 'édition spécialisée dans le pro-
co mmandes pré prog rammées. blem solving et un site internet intitulé « 20 000 pro-
blems under the sea »),a choisi un logo illu strant
une propriété toute simple à énoncer qu ' il a décou-
B(x) = E(x) + J. f(x , y)dy 1 verte en 1990 grâce au logiciel Cabri -géomètre .
Soit P un point quelconque intérieur à un triangle
ABC. On trace les segments [PA], [PB] et [PC] qui
l(a)o(( o)o ,.,., ,( a.1)t,
Fo!otSIH IOO.OO!"C...... -
la simulation numérique
Entre la théorie et l'expérience s 'est glissée, depuis
l'avènement de l'informatique, la simulation numérique. Elle
est devenue un outil indispensable pour compenser les
limites de l'expérimentation et tenter de représenter
l'irreprésentable.
ù sui~-je ? Que l' interrogatio n inventé par les Grecs , re mplit cette fo nc-
Un modèle à suiure
l'informatique de la simulation
La précision des simulations numériques croît avec
la finesse de discrétisation des objets étudiés. Pour gagner
un facteur dix sur la résolution, il faut multiplier le
nombre de mailles par mille ! Cette croissance expo-
nentielle lie intimement le progrès des simulations
numériques à celui des équipements informatiques.
On est passé de quelques dizaines de mailles dans les
années soixante à la dizaine de milliards de mailles
aujourd'hui. À mailles égales, cette augmentation de
performance a permis de passer des modèles sphé-
riques à une dimension a des modèles à trois dimen-
sions, plus proches de la réalité. La s imul a ti o n num ériq ue s' int rod uit
clo ne dans le d iptyque d ialectique théo-
Les processeurs vectoriels, qui exécutent des opéra- rie-ex pé rie nce , au cœ ur de la sc ie nce
tions sur des vecteurs, sont particulièrement bien cl ass ique, po ur structurer la recherc he
adaptés à la simulation numérique. Les performances mode rn e se lo n un t riptyque t héo rie,
d'un processeur actuel sont liées à sa fréquence de modé li satio n- s imul atio n et ex périme n-
fonctionnement et à son parallélisme interne (sa tati o n . Elle permet bie n sûr de limiter le
capacité à effectuer des opérations simultanées). Le coût e t le danger par rappo rt aux ex pé-
degré suivant est le parallélisme entre processeurs, rime ntati o ns phys iques , mais auss i de
dont la gestion est à la charge du programmeur. Le se do nne r les moyens de mi e ux co m-
calcul doit alors être décomposé en tâches indépen- pre ndre, do nc de mi e ux concevo ir o u
dantes, en veillant à maintenir la communication agir. Elle devient un guide conceptuel pour
entre processeurs pour partager des résultats inter- intuite r d e no u ve ll es direc ti o ns d e
médiaires, et à l'équilibre des charges de travail de reche rc he.
chaque processeur pour gagner en efficacité.
Les résultats de s imul atio n numérique
Plusieurs types d'architecture existent pour les super- fo nt ma inte nant partie de notre quoti-
calculateurs, dont les puissances se chiffrent aujour- die n : prév is io ns mé téoro log iques, pré-
d'hui en téraflops (voir en pages suivantes). Les vis io ns dé mographiques, évolutio n du
supercalculateurs vectoriels possèdent des proces- climat o u cours de la bo urse.
seurs haut de gamme, mais leur architecture rigide
est peu évolutive. Les « grappes de PC » sont peu Des mailles à répartir
coûteuses, mais mal adaptées à une forte puissance
de travail. Enfin, un excellent rapport performance / prix La pre miè re é tape d ' une expérime nta-
est offert par une structure intermédiaire : les « grappes ti o n num é riqu e cons iste à ré unir les
de mini-ordinateurs à mémoire partagée ». Des caractéristiques phys iques du systè me à
briques de base - les nœuds - sont constituées de plu- étudier cl ans un modèle établi avec des
sieurs microprocesseurs partageant une mémoire mé thodes mathé matiques e t in fo rma-
commune et sont reliées entre elles par un réseau tiques. Les grandeurs phys iques recher-
d'interconnexion haute performance. Cette struc- c hées (pos iti o n , vitesse, te mpérature,
ture, la plus répandue parmi les supercalculateurs, pression . . . ) et le urs variatio ns sont liées
est appelée ordinateur massivement parallèle. par des équati o ns , souve nt aux dérivées
pa11ie lles, qui modé li sent le comporte-
me nt de l' o bje t. Ho rs d u c ha mp analy-
le calcul
haute performance
Le besoin croissant de simulation numérique ne pourrait être
assouvi sans les performances en continuelle évolution des
technologies numériques. Le calcul intensif, ou haute perfor-
mance, participe à ce développement de l'innovation et est
devenu un enjeu majeur dans la course à la compétitivité.
epui s que l' homme s'est mi s à
D
ling), ou calc ul intensif, renvo ie , à ce
calculer, il n'a eu de cesse de jour, aux machines pétafl opiques , c 'est-
chercher à produire plus de cal- à-dire de machines capables d'effectuer
cu ls. Utilisant tout d 'abord de pet its un million de milliard s d'opérations à la
ca illoux , les calculi , puis l'écriture, il seconde (vo ir encad ré).
comprit bi en plu s tard qu e certaines
opérations pouvaient être mécani sées . Un enjeu stratégique
Une des premi ère s mac hin es méca-
niques est due à Pascal en 1645 . Bab- De nombreux domaines académiq ues ,
bage a failli nou s faire basc ul er dans mais auss i industriels, ont beso in de ces
un monde d ' inform atique méca nique pui ssa nces de ca lcul s : cos mo log ie,
dès le XIXe siècle. Ce fut ensuite l'avè- météoro logie, médec ine , chimi e, phy-
nement de l' informatique moderne. Pen- sique nucl éa ire ... Le ca lcul intensif est
dant ce temps, les beso in s en calcul s devenu un instrument de compétiti vité
ont augmenté de façon exponentielle, au pour nos entreprises. Il leur permet d'in-
sens propre du terme ! [l faudrait des cen- nover plus vite et de réduire le temps
taines, voire des milliers d'années à nos entre la concepti on et la mise sur le mar-
machines de bureau pour exéc uter les ché des produits. Pour toutes ces ra i-
applications imaginées par nos sc ien- sons, le pays devait se doter de moyens
tifiques. Le « calcul haute performance » de ca lcul efficaces.
dev ient une nécess ité. Il y a encore quelques années, la France
Le terme de calcul haute performance (ou accusait un retard certain dans ce domaine.
HPC , pour high performance compu - La stru cture publiqu e Genci (G rand
Équipement national de ca lcul intensif)
Le savoir-/aire français dans le domaine fut alors créée en 1987. Cette structure
a financé et commandé un certain nombre
du calcul intensifprovient de la volonté
de machines , dont Curi e , d'une pui s-
de garantir la fiabilité des armes sance de plus de 2 pétaflops, est la figure
nucléaires par la simulation. de proue, avec un accès ouvert à tous
rr
• pour arriver à un nombre qui n 'existe pas dans la nature:
Ordinateur de bureau
ga • ((10· = 10···0"
Le calculateur Le TGCC (Très Grand Centre de calcul impensable de multiplier par mille la
Curie. du CEA), nouvell e infrastructure verte , consommation é lectrique des futures
héberge , outre la première machine péta- machines. D'autant que, de l' autre côté,
flopique Curie , la nouve lle génération une grande partie de cette é lec tri ci té
du CCRT. Cette structure a pour but consommée est tran sformée par effet
d ' accue illir des systèmes informatiques Joule e n chaleur, et il faut alors refroi-
dédi és au calcul haute pe rformance , dir les mac hines . Les tec hniqu es de
offrir des espaces de communication refroidissement progressent , et on fai t cir-
pour de gra nd s évènem e nt s sc ie nti- culer de l' eau directement au plu s près
fiques, et proposer un bâtiment modu- des processeurs , ce qui permet d ' éva-
laire et flexible dimensionné pour recevoir cuer plus de calories. Mieux refro idis.
les futures évolution s des machines. les processeurs peuve nt donc être rap-
Les structures qui ont permi s le déve- prochés , ce qui diminue le te mps de
loppement de ces mac hines ne sont pas co mmunication entre eux. Il est touit
toujours simples à appréhe7ider. li ex iste fois certa in qu'il faudra concevo ir de
bien sûr les structures européennes Prace no uveaux microprocesseurs touj ours
(partnership for advanced computing plu s pui ssants e t moin s énerg ivores.
in Europe) et ETP4HCP (European tech- Enfin , il faudra augmenter la fiabilité
nologie platform fo r HCP ), mai s il est des systèmes. On estime qu ' une mac hine
important de comprendre que la France, exaflopique contiend ra des millions de
en s' appuyant sur l' expérience du CEA , cœurs de calcul s, ce qui impliquera une
reste au premier plan dans la course de panne par heure avec les fiabilités actuelles.
ces technologies. Cepe ndant , l' avenir L'exploitation de te lles mac hines pour-
sera au moin s exaflopique (avec des rait alors s' avérer difficile, sinon impos-
machines capables d 'effectuer 10 18 d'opé- sible. D'ores et déjà, les machines actuelles
rations à la seconde). contiennent des redondances qui per-
mettent de ne pas stopper les calcul s à
les défis du futur chaque panne.
Références De nombreux obstacles restent à fran-
• Les supercalculateurs Pour arriver à de tel s résultats, les cher- chir, et la dé mocrati sation du calcul
relève nt le d éfi. La cheurs doivent relever plusieurs défis. Le haute performance, attendue avec impa-
Recherche 469 , 20 12 premier est la maîtri se de la consom- tience par les sc ientifiques et les indus-
(di sponibl e en li gne). mation énergétique. En effet. la consom- triels , sera longue , mais est en cours.
• www-hpc .cea .fr mation électrique peut représenter jusqu' à
• www.genci.fr 30 % du coût de fonctionnement, et il est J.-J. D. & F. L.
maple mathematica :
Capture d'écran les maths de la fortune
de Maple montrant
· ~ t l l · rs-..-o ril a un calcul d ' intégrale. Le logiciel de calcul form e l Mathematica est
> ln:t"" C
a• li , • ) :J édité par Wolfram Researc h depuis 1988 .
[ 2- .1 .. 111(.1• 1)
!>I Maple est un logic iel de cal- Arrivé sur le marché peu de temps après son
.:J
cul symbo lique dont le nom , conc urrent Maple, il a immédiateme nt fait la
qui s ig nifi e « éra bl e » e n fortune de son créateur, Stephen Wolfram
anglais, vient sans aucun doute de son origine cana- (voir Tangente 134). Malgré une syntaxe pour
d ienne. Son a mbiti o n est de permettre des ca lcul s le moin s déroutante au premier abord ,
comme les mathé mati c ie ns les fo nt. Mathematica a su s' imposer dans de nom-
A in s i, il est poss ibl e de ca lcul er des intég ral es breux milieux grâce à la qualité graphique des
xi courbes et surfaces qu ' il permet de générer et
comme : J - - dx.
x +I à sa souplesse d ' utilisation.
Maple trou ve un résultat exact :
x 2 / 2 - x + ln (x + 1)
mais ne préc ise pas les inte rva lles de va lidité car
ce la est e n de ho rs de ses compéte nces .
De plus, Maple calcule sur un espace de fon ction s
hors de portée de I' uti Iisate ur moyen . Par e xe mple,
il fo urnit des résultats comme :
"' d.'r = lna - ln (- a )
f
0
7
~ - - a 2 2a
qui ne pourra qu ' éto nne r l' utili sate ur. Un.pe u de
c urios ité pe rmet de compre ndre d ' où vie nt un te l
rés ultat : le log ic ie l calcule l' intégral e définie : Un exemple de graphique sous Mathematica.
dx = 1n(x -a ) -1n(x +a )
fx 2
- a 2
2a
Les autres atouts de Mathematica sont le cal-
cul d ' intégrales, la simplification de formules
pui s re mpl ace x pa r les bo rnes de l' intég ral e, algébriques alambiquées , la manipulation de
sans vé rific ati o n de sens. C ette vé rifi cation doit systèmes de logique formelle et la résolution
ê tre fa ite par l' utili sate ur, ce qui est norm al mai s exacte (en calcul symbolique) d ' équations ,
ne do it pas ê tre o ubli é. M a pl e pe rmet éga le me nt grâce à une banque de données riche de nom-
de visuali ser des courbes e t des surfa ces , les in s- breuses fonctions spéciales . En outre, les der-
truc ti o ns po ur ce faire sont é lé me nta ires (voir la nières versions du logiciel permettent de poser
fi gure). Po ur finir ce bref tour d ' hori zo n , M a ple des questions ou de donner des instructions
est programmabl e vi a un la ngage s impl e , ce qui mathématiques en langue naturelle (l ' anglais),
pe rmet e n particu lier d ' utili ser des fonction s plu s directement dans l'invite de commande , sans
sophi stiquées. passer par la syntaxe formelle !
> plot(• - •.ln(a) , r-0 . Pi) :
Ce qui n'est pas toujours correctement inter-
Tracé de la courbe prété, on s'en doute : rien ne sait encore rem-
d'équation: y= x- sin x placer une bonne syntaxe pour interagir avec
entre O et p. [>
un logiciel. ..
Certes , dans la plupart des applications, Les nombres 22k s'écrivent de manière
ce ni vea u de préc is ion es t s uffi sant. exac te e n base 2. Qu 'e n es t-il de la
Ma is ce n'est pas le cas dans une suite fraction 9 / 10? Un calcu l simple montre
de calcul s dans lesquels une erreur même que 0 ,9 s'écrit 0, 111 00110011001 1... ,
extrêmement petite sur la va leur de l' un présentant bien une forme pé riodique
des x de la s uit e es t a mplifi ée illimitée. Que se passe-t-il lorsque l' on
systématiquement. Que ll e est don c la travaille en double précision ? On connaît
nature bi e n pa rti c uli è re du nombre bie n l'a pproximation qui est souve nt
10 23, 1 qui conduit à ces rés ult a ts
aberra nts? On obtient en fa it ce type de
suites de va leurs absurdes pour tout a
de la forme 4 k - 0 ,9 ou encore 22k - 0 ,9,
k éta nt un nombre e nti e r nature l. Le
lecte ur c uri e ux pe ut a in s i tes te r 3, 1,
15 , 1 ou63 ,I pourconstaterque, lorsque
11
k croît, la divergence devient plus rapide .
La suite (x,,),, proposée est construite 1(
de telle so1te que toute différence initiale, 1
faite et qui dit que i 0 = HPavec une erreur ca lcul s effect ifs utili sant la machine.
de l' ordre de 2 %. Pour o bte nir une Po ur ce la , introdui so ns la procéd ure
préc ision de l'ordre de quinze ou se ize chaotique connue sous l'appe ll ation de
déc im a les (ce qui sé m a ntiqu e me nt dynamique de Verhulst, selon le nom du
implique la base 10), il fa ut , en base 2, célèbre mathé matic ien be lge . Le but de
aller jusqu 'à une cinquantai ne de chiffres ce scientifique était de décrire l'évolution
« après la virgule». Les puissances de d' une popul ati o n sous contrai ntes, de
1/2 donnent en fa it les erreurs absolues mani è re à éc happer à l'a bsurdi té d u
maximales en base 2. Elles sont calculées, modèle exponentiel manquant de réal isme
respecti vement aux l 6e et 17e décimales , (vo ir Ma thém at iq u es et Biologi e ,
d ans le tabl eau c i-contre, qui do nne Bibliothèque Tangente 42, 20 11 ). Voyons
également les erreurs absolues pour la ce qu ' il en est en temps discret. So it une
valeur 0 ,9 . On constate que ces erreurs populatio n y mesurée à l' instant enti er
sont maximales étant, pour une précision t (on note y, cette popul ation). L' instant
de 10-k, approximati ve me nt éga les à s ui va nt , cette po pul ati o n va croître
( 1/2) x 10...;; (et même un peu supérieures) proportionne llement à ell e-même mais
pour les valeurs k = 16 et k = 17 . De là e n subi ssa nt éga le me nt un facte ur
les résultats étonnant obtenus pour toute d 'atté nuation expliqué par la limitati on
succession de calculs de nature divergente ! des ressources et la saturation de sa niche
écolog ique. Yerhul st étudi e alo rs une
puissances de 1/2 Valeur décimale erreur en base 2
procédure évo luti ve se lo n l' équ ati on
50 8.88E-016 5.55E-016
suivante:
51 4.44E-016 0.000000000000000 11102
52 2.22E-016 Yr +I = Y, + a X Y, X ( 1- ~) .
53 1.11E-016
54 0.00000000000000005551 5.55E-017
55 0.00000000000000002776 0.00000000000000002776 Cette équation ex pri me une croissance
p ro po rti o nn e ll e à e ll e- mê me m a is
Des problèmes vont donc également se atténuée par un fac teur proportionne l à
poser lors de la mi se en pl ace de tout la taill e de la po pul ati on . La constante
calcul générateur de chaos mathématique. K es t s upp osée re ndre co mpte de s
Un deuxiè me exemple va nous montrer conditions nature lles propres à l' espèce
ex pli c ite me nt qu e les propri é tés de concernée . Cec i n 'est pas notre sujet.
distributi vité ou d ' assoc iati vité ne sont Concentro ns-nous sur l'aspect for me l
pas vérifiées lors de la mi se en place de de l 'équ a ti o n , qui pe ut s'éc rire , e n
posant K = 1 :
2
Y1+1 =Y, + ay, + ay ,
Images numériques,
du pbcel à la topologie
Les images numériques sont partout ; mais sans les mathé-
matiques, nos ordinateurs seraient bien démunis pour les
exploiter. Au fait, qu'entend-on précisément par l'expression
« image numérique » ?
.l=..I
la mi se en œuvre d ' un processus de
1À \ ~
.
--········- ~
.
construction (concepti on assistée par
ordin ateur ou CAO , architecture ... ).
Dans ces processus constru ctifs, on
~ --· ···· -- ·-~
... .. utili se des objets mathé matiques plu s
. .. o u mo in s structurés pour représenter
im
•
i • ··· ·····--· ~
les objets contenu s dans les scènes
( « soupe » de tri angles, autrement
dit un e nsemble de triangles sans
0
La diffic ulté rés ide même si sa géométrie est déformée, ses
alors dans la définition, . couleurs mod ifi ées ... Réc iproquement,
.
le calcul et l' utilisation . il est poss ible de di stinguer certai ns
objets en observant leur topol og ie.
de tels invariants sur les
Ainsi, sans les goûter, il est poss ible de
modèles mathématiques particu-
distinguer un donul d'un bretzel rien
liers uti lisés dans les images numériques. Il s'agit là d ' un
qu'en comptant le nombre de trous de
domai ne de recherche très actif. chacun des deux objets
_. Références (en France) concernant le
calcul de l' homologie sur des images: Lors de l'étude de séquences d'images
travaux de Sylvie Alayrangues, Dobrina de battement de cœur, être en mesure
Bo ltcheva, Guill aume Damiand , Laurent Fuchs, de détecter les changements de topol-
Jacques-O li vier Lachaud , Pascal Lienhardt, ogie provoqués par l' ouverture et la
fermeture de la va lve aortique peut
Samue l Pe ltier.
permettre de déceler des anomali es.
lamé de de monte-Carlo
Hpplication à un inuestissement financier
Lorsque l'ensemble des paramètres d'un problème (par
ex emple la rentabilité d'un investissement financier) est
trop important ou ne peut être entièrement décrit, des
méthodes numer1ques statistiques deviennent les seuls
moyens de modéliser la situation. La méthode de Monte-
Carlo en fait partie.
à certaines idées Une application « théorique »
reçues, les mathé matiques ne au calcul d'intégrdles
constituent pas une science défi -
nitive, au sein de laquelle tous les résul - Parmi les méthodes numériques initiées
tats sont établ is une foi s pour toutes. de pui s que lques décennies et rendues
Bien au contraire, les maths sont en per- prag matiques g râce à l' in fo rmatique ,
manence e n construction. De nouveaux o n re trouv e la fa me use mé th od e de
résultats sont découverts chaque jour et Monte-Carlo mise au point vers 1947 par
complè te nt prog ress iveme nt le grand le phys ic ien gréco-améri ca in Nicho las
livre de nos connaissances . Constantine Metropo lis ( 19 15- 1999),
Tous les prob lè mes théoriques ne sont l' un des co llaborate urs de Jo hn vo n
donc pas résolus . Et il en est de même Ne um a nn ( 1903- 1957 ). C'es t a uss i
pour de nombreux problèmes pratiques Ni cho las Metro po li s qui fut l' un des
en manque de support mathé matique inve nteurs d ' un des tout pre miers ordi -
uti Iisable concrète ment. nateurs opérationnels qu ' il baptisa du nom
La grande complexité de certains cas de de MAN IAC (Mathe mati cal Analyzer,
fi g ure e n éco nomi e, en bi o log ie, e n Nume rical Jntegrator And Co mputer)
physique, en finance, fa it que nos mathé- pour coupe r court à la mode des acro-
matiques, toutes sati sfai santes qu 'elles nymes étranges qui désignaient ce genre
pui sse nt se mbl e r, s'a vè re nt souv e nt de mac hines . MANI AC I fut totalement
insuffi santes. C'est pour ce type de pro- opératio nne l dès 1952.
bl è mes que l' inform atique se révè le
d ' un secours inc roya ble ment utile. La méthode de Monte-Carlo s 'est révé-
lée particuli ère ment uti le pour le calcul
de certa ines intégra les portant s ur de
Quand des méthodes numériques suppléent très larges domaines, donn ant en pra-
à l 'absence de solution mathématique ... tique des rés ultats numériques nette-
f(x ) 1.5
ALEA(\
2 > • 1 a g 10
95 % . f o o ~ e 2 o dx= ~ fo,e-Tdz .
En dimension 2 et en coordonnées polaires, on représente un
Densité de fréquence de la distribution des rendements
point (x, y) du plan en joignant ce point à l' origine, et en
mesurant d' une part l'angle entre ce segment et l'horizontale
(0) et d'autre part la distance entre le point et l' origine (r ).
On a: x = rcosO ety = rsinO (voir graphe en bas ci-contre).
r appartient à R+ et O parcourt l' intervalle [0, 2n].
Le changement de variables dans l' intégrale double impose
la multiplication par le Jacobien , déterminant de la matrice
des dérivées partielles des deux variables de départ relative-
0,02 0,0-4 0.06 0,06 0,1 0,12 0,14 0,16
ment aux deux nouvelles variables. Ici, il vaut :
iJx iJy
La méthode Monte-Carlo no us li vre ic i J - det iJr iJr = det I cosO sinO I=rcos2 0 + rsin2 0 =r.
un résultat in access ibl e a u moye n de iJx iJy -rsinO rcosO
- -
méthodes traditio nnelles mais que seule iJO iJO
une étroite co ll aborati o n e ntre les de ux L'intégrale double (sur un certain domaine D) de deux variables
domaines mathé matiques e t in fo rm a- normales réduites indépendantes x et y se sépare naturelle-
tique a re ndu possible. ment en deux intégrales simples : ,
D.J. 1 _.!_(x' +,') 1 -~
- ff'e 2 dxdy = -JdO'Jre 2 dr.
2nJJ 2H
La première quantifie une distribution uniforme de la variable
O sur l' intervalle [O, 2n] , ce qui est facile à simuler. Pour la
deuxième, il suffit de poser r2!2 =tee qui donne rdr=dt pour
arriver à une fonction intégrable dont l'image sur l'ensemble
des réels positifs est l' intervalle [O, 1], nous permettant à nou-
veau de recourir aux distributions uniformes :
r,înO
,,
,'
=
On pose donc O 2n x ALEA et e 2 = ALEA, soit
X r = .J-21n(ALEA). La simulation de variables normales
Représentation graphique d' un point réduites se fait alors au moyen de
en coordonnées polaires . z = sin(2nALEA) x .J-2ln(ALEA).
V
pas et , é ve ntu e ll e me nt , lui té lé ph o-
des messages du type : « Bon- ne rez . . . po ur vo us ape rcevo ir qu 'e ll e
jour es t c hez e ll e, bi e n lo in des so uc is .
J'espère que tu vas bien . J 'ai besoin de Ce rta in s s'y fo nt pre ndre et se fo nt
ton aide, j e suis en déplacement et je dé trou sse r, parfo is de qu elques mil -
me trou ve dans une situation très com- liers d ' e uro s ! Le bon se ns suffit pour
pliquée que j e voudrais t'expliquer. Je év ite r ce pi ège . No us no us inté res-
reste cependant connectée en attendant so ns ic i aux procédures s ui vies par
ta réponse, puisque j e ne suis joignable les escrocs pour s' approprier le compte
que par mail. » de messageri e d 'a utrui , et co mme nt
Ce message est signé d ' une amie et pro- l 'e mpêc he r. Po ur le co mpre ndre, il
vi e nt de son adresse é lec troniqu e . Si fa ut savoir comme nt les comptes so nt
vous êtes prude nt , vou s n ' y répondrez protégés .
co lli s ion s a lo rs H ! 'est a uss i ! On peut retrouver le mot de passe par recherche
réa li ser une te lle fonction de hac hage au ex ha ust ive (o n dit aussi « par force
m oye n d'un c hiffre m e nt par blocs, brute »). S ' il s ' ag it de SHA-1, il est
comme le code AES (Advanced Encryp- mieux protégé . Une faço n toute s impl e
tion Standard), pui squ ' il combine une de casser un mot de passe est d'essayer
clef secrète de 128 bits à un bloc de 128 tous les mo ts de passe c lassiq ues. li
bits pour obtenir un bloc de 128 bits. 11 ex iste ainsi des dictionnaires de mots de
suffit d'introduire la clef secrète comme passe usue ls : mots courants de la langue
vale ur initi ale de l' itération . La fonction nata le de l' utili sateur (comme « mai-
de hac hage obtenue est a uss i rés istante son » o u « objet »), prénoms, suites de
que le chiffre ment utilisé. L'ennui est que c hi ffres « log iques » comme 123456,
I' AES o u les fonctions de c hiffre me nt mots spéciali sés et ra res du domaine de
e n général sont longues à calculer. C'est ! ' utili sate ur com me « aca ta lectique » ,
pourquo i on a introduit des fo nctio ns etc. Les hackers utilisent a insi un grand
de hachage plus rapides , tels MD5 (Mes- no mbre de dictionnaires que l'on peut
sage Di ges t) s ur 128 bits o u SHA-1 trou ve r sur Internet.
(Sec ure Has h Algorithm) sur 160 bits, Pour év ite r le cassage par dictionnaire ,
qui utilisent des chiffrements simplifiés. il est nécessa ire d ' utili ser des mots de
Ma lhe ure useme nt les clefs des c hiffre- passe qui ne peuvent y figurer. Il est
me nts sont trop courtes , ce qui autori se prudent a uss i d ' en avo ir un différent
une attaq ue exhaustive. Le nombre de cas pour c haq ue compte et site utili sé. Une
à analyser pour MD5 est de 2 16 , ce qui idée simpl e pour ce faire est de partir
est devenu beaucoup trop faible à l'heure d'un mot et d'un no mbre , et de les mixer
actuelle. Pour SHA-1, il est de 26() , ce qui différemment pour chacun de vos comptes,
pe ut être atteignable e n me tta nt un très mai s de faço n log ique pour vo us. Par
gra nd no mbre d'ordinateurs e n réseau. exe mpl e , si vo us utili sez Tangente et
Il est possible d 'amé liore r ces attaques. votre date de naissance 25 12 / 993, vous
Cependant, SHA-1 est encore considéré po uvez les marier se lo n plu sieurs lo is,
comme re lative me nt sûr. que vo u s pouvez même noter. Par
exemple, 1-2-3-4-3-2- 1 donne :
Recherche du mot de passe T25angl219ent93e. Cec i n 'est qu'un
exemple , e t il est év idemment possible
Le hacke r di s pose do nc du hac hé de de compliquer à lo is ir la méthode !
votre mot de passe a ins i que de la fo nc-
tion de hac hage utili sée . Si MD5 est au H. L.
cœur de cette fo nction , il est possible de
l'article &de la lol lntomauaue et llllenés On se donn e un e nse mbl e de règ les
R = {ri' r 2 , r 3 ... } , un ense mble d'as-
« Un traitement ne peut porter que sur des données à carac- sertion s data 11 = {as I' as 2 , as 3 .. . asq} te l
tère personnel qui satisfont aux conditions suivantes : que tou s les rk sont vra is , un ensemble
de variables booléennes
1) Les données sont collectées et traitées de manière loyale B = {/Jpp 2 . . . Pq} te l que
et licite; p 111 =vrai<=> as,,, est transmi s, et enfin la
2) Elles sont collectées pour des finalités déterminées, expli- formule boo lée nne de ! ' e nse mbl e de
cites et légitimes et ne sont pas traitées ultérieurement règles R, notée~ = 11k(v;(11i k;)) où , quels
de manière incompatible avec ces finalités. Toutefois, que soient les indices k , i et), bk.i j E B.
un traitement ultérieur de données à des fins statistiques On dit que data,, est n- exposable par
ou à des fins de recherche scientifique ou historique est rapport à R si, et seulement si, il ex iste
considéré comme compatfüle avec les finalités initiales une affectation de valeurs boo léennes
de la collecte des données, s'il est réalisé dans le respect aux variables de B te lle que ~ est vraie ,
des principes et des procédures prévus au présent cha- et le nombre de p 1, p 2 .. • p q prenant la
pitre, au chapitre IV et à la section 1 du chapitre V _llinsi valeur vraie est inférie ur n.
qu'aux chapitres IX et X et s'il n 'est pas utilisé pour
prendre des décisions à l'égard des personnes concernées ; Pour les données présentées dans l' en-
3) Elles sont adéquates, pertinentes et non excessives au regard cadré précédent , on peut fac ilement véri-
des finalités pour lesquelles elles sont collectées et de fi er que la soluti on
leurs traitements ultérieurs ; T a= {P 1 = V,P2 = Y, p 3 = F,p4 = F,
4) Elles sont exactes, complètes et, si nécessaire, mises à jour ; Ps = V, p 6 = V,p7 = Y, ps = F,p9 = F,
les mesures appropriées doivent être prises pour que les p 10 = F} valide bie n ER, et donc que R
données inexactes ou incomplètes au regard des finali- est 5-exposable. Pour montrer que 5 est
tés pour lesquelles elles sont collectées ou traitées soient bien la plu s petite valeur acceptable,
effacées ou rectifiées ; une manière est de tester toutes les affec-
5) Elles sont conservées sous une forme permettant l'iden- tations ayant quatre valeurs vraies (il en
tification des personnes concernées pendant une durée ex iste Cio so it 2 10) , et montrer qu ' au-
qui n 'excède pas la durée nécessaire aux finalités pour cune ne convient.
lesquelles elles sont collectées et traitées.
li est poss ible de montrer que ce pro-
bl ème, dans sa généralité , est NP-com-
S ' il n'y a qu ' une seule règle de collecte, pl et , en se fondant sur une réducti on à
le problème est simple: il suffit de trans- un problème assez connu en log ique : le
mettre la conjonction impliquant le moins problème de satis.fiabilité minimale avec
d 'attributs. Le problème devient plu s pondération (ou Min Weighted Sat). On
difficile lorsque le client souhaite béné- défi nit le problème d 'optimisation asso-
ficier de plusieurs avantages ck si mul - c ié, qui cherche à trou ve r le plu s petit
tané ment. nombre d 'é léments de B (on notera m
Afin de définir formellement le pro- cette vale ur) qu ' i I fa ut fi xer à vrai pour
blè me mathé matique de la minimi sa- que ER so it vraie. Le problème d ' opti -
tion des données co!Jectées (dit également mi sation est NP-difficil e, ce qui signi -
problème den-exposition) , posons fie qu ' il peut être très coûteux de trouver
ER= llk (rk) = 11k (v;(llik.;)), appe lée for- le rés ultat exact à cette questio n pour
mule booléenne del' ensemble de règles . de grandes valeurs de m. Pour ca lculer
Le problème s'énonce formellement de la solution exacte du problè me , on pe ut
la manière suivante : utili ser une méthode de force brute,
• • • e lIJ•
~o=lallO m.r.m,~
Formulaire vierge IÏTil (.: .M
et règles de collecte IIDIIJ >J!lr
~ ~~ssusde~
Processus de lfl///1} dec1S1on
L1o:1~~?~~ 1
décision
0 ~ormulaire Formul<l: @
complet minimal
~ ~Mi - .-n-i nu
- .s-a-ti-o -n
® ~ ~J
Offre de service 6 du contenu
Offre de mv;ce
Références
• Exposition minimum de données pour des applications à base de classifieurs. Nicolas Anci aux, Benjam in Nguyen et Mi chali s
Yazirgianni s. Ingénierie des Systèmes d 'inf ormation 18(4) , 20 13.
• Le dé fi : https://project.inri a. fr/minex p/, rubrique Challenge (en anglais).
Un exemple de programme en AMPL Une au tre ma nière de fa ire est d' uti li -
ser un o util de réso luti o n exact de pro-
var b1 binary; var b2 binary; ... var b10 binary; bl è mes d'o ptim isati o n . Le prob lème
minimize EX: do it alors être écrit da ns un langage par-
b1 + b2 + b3 + b4 + bs + b6 + b7 + b8 + b9 + b10; tic u Iie r : le la ngage A MPL ( la ngage de
subject to modé li sati o n po ur la progra mm ati o n
n : b1*b2 + b3*b4 >= 1; mathé matique), qui perme t d · exp ri me r
r2 : b5*b6*b7 + b4*b8*b9 >= 1; une fo nc ti o n à minimi ser pa r rapport à
r3: b1*b6*b7 + b2*b4*b10 >= 1; un ensemble de variables (ic i les prédicats
r4: b2*b5*b6*b7 + b1*b4*b8*b9 >= 1; booléens) et de contra intes (ic i les règles).
U n exe m p le d ' un te l progra m me est
donné en encadré. Les contraintes contien-
L'algorithme approché RAND* ne nt des multipli catio ns, ce qu i re nd le
p ro bl è m e no n- lin éa ire. Ta nt qu e le
Entrées : ensemble de K règles r k contenant q prédicats no mbre de variables n'est pas trop impor-
distincts P; tant (di sons une centa ine), ce programme
nombre de passes N peut être résolu par des logic ie ls comme
Sortie : meilleur ensemble de valeurs de vérité P; trouvé Coue nne (po ur Co nvex over and under
Variables: p_optimal, un tableau de q booléens e nve lo pes fo r no n- linea r es tim atio n .
x, une variable de type entier di spo nibl e e n li g ne e t open -source).
l. Mettre à VRAI toutes les valeurs de p_optimal;
2. Pour compteur allant de 1 à N faire Une de rniè re approc he est de pro poser
3. Mettre toutes les valeurs de P; à FAUX des a lgo rithmes de compl ex ité po lyno-
4. Pour k allant de 1 à K faire miale, et donc fac iles et rapides à calculer,
5. x - une valeur aléatoire comprise entre l pe rmettant de trouve r un résultat appro-
et le nombre de disjonctions dans r k c hé de la so luti o n . L'encadré qui suit
6. Pour j allant de 1 au nombre de prédicats dans la do nne l'exemple d ' un a lgo rithme a léa-
J!111• disjonction de r k faire to ire, no mmé RAND *, très s impl e, qui
7. mettre à VRAI la valeur du prédicat P; pe rme t de ca lcule r une soluti o n accep-
correspondant à b k.xj table au problè me, e n gé néra nt a léato i-
8. FinPour re me nt N solutio ns acceptabl es, pui s en
9 . FinPour c ho is issa nt la me ill e ure . To utefo is, la
10. Si le nombre de prédicats P; mis à VRAI est plus petit que minima lité de la so luti o n n'est auc une-
le nombre de prédicats p_optimal; mis à VRAI, alors me nt garantie !
11 . Pour i allant de 1 à q faire
12. p_optimal; - P; Le lecte ur est in vité à c he rche r d 'autres
13. FinPour a lgorithmes po ur résoudre le problè me
14. FinSi de mani ère approchée, et à comparer, à
15 . FinPour te mps de calcul égal, le ur qua lité avec
16. Retourner la liste des p_optimal; l' algorithme naïf RAND*. A insi, on voit
que le problè me de limite r la collecte
de do nnées est compliqué, pui sque la
c'est-à-dire teste r to utes les so luti o ns simple identification d' une donnée poten-
poss ibles : il y e n a très exacte me nt 2<i ti e ll e me nt util e est un pro bl è me in fo r-
o ù q re présente le no mbre de prédicats matique di ffic il e et coûte ux e n te mps !
booléens du problè me. Le coût de cette
mé thode est do nc haute me nt pro hibiti f. N.A.&B. N.
Une structure de CRISPR dans une Elle utili se un o util comm un des lin-
bactérie 2200 Kbp
g ui stes et des in fo rmati c iens pour
Chromosome circulaire de générer avec un
2000Kbp
Elle pourra par exemple générer la séquence augccguaa en utilisant successivement les
règles 1, 2 et 3 (aug) , puis 4, 6 et 7 (ccg) , et enfin 11, 12 et 13 (uaa). Observez que la struc-
ture des règles est très régulière : elles sont toutes de la forme « un non terminal se récrit
en un symbole terminal suivi éventuellement d'un non terminal » . On nomme réguliers
les langages générés avec cette forme de règles. Ces langages ont une foule de bonnes
propriétés qui en font un outil précieux en informatique (système Unix, traitements de
texte ... ). Ainsi, savoir si une phrase appartient à un langage régulier demande un nombre
d'opérations proportionnel à la taille de la phrase. De plus ils forment une classe stable au
sens où l'intersection, l'union, le complémentaire, la différence ou l'application d'un ho-
momorphisme sur un langage régulier continuent à donner un langage régulier.
Les langages peuvent aussi être décrits, de façon équivalente, à l'aide de machines : c'est
un modèle plus proche de ce qui se passe en biologie où de nombreuses machines sont en
œuvre ainsi qu'en informatique où on définit plusieurs types de machines abstraites en
fonction du type de langages, la plus générale, la machine de Turing , étant le fondement
de nos ordinateurs.
Pour reconnaître un langage régulier, on utilise ainsi ce qu'on appelle des automates
d'états finis. La machine part d'un état initial et lit les symboles de la phrase de gauche
à droite. En utilisant une fonction de transition fixée qui associe à chaque état et chaque
symbole lu un nouvel état, la machine progresse tant que c'est possible d'états en états.
La phrase est reconnue si la machine termine dans un état final. On représente graphi-
quement les états par des cercles, un état final par un double cercle et une transition en
lisant un symbole par une flèche depuis l'état de départ jusqu'à l'état d'arrivée surmontée
du symbole. Nous effleurons juste en passant la notion de probabilité qu'on peut intro-
duire dans les langages et leurs représentations: rien n'empêche de considérer un langage
comme une distribution de probabilités sur l'ensemble des enchaînements possibles. D'un
point de vue grammaire ou machine, ceci suppose d'associer des probabilités aux règles
ou aux transitions. Nous nous contentons ici de considérer que toutes les phrases ont la
probabilité o ou 1. En pratique, il peut exister en biologie différentes alternatives d'analyse
(on parle d'ambiguïté) avec des probabilités différentes pour de mêmes phrases, comme
par exemple dans le cas des télomérases qui oscillent entre deux états stables.
l\ insi, une grammaire ho rs contexte {S-+ aSu , S-+ cSg, S-+ gSc, S-+ uSa}
)Our la reconnaissance de ti ges-bo ucles U { S-+ aX, X-+ a l a E {a,c,g, t} }.
fa ns I'ARN peut être décrit par deux
!nsembles de règles (l' un pour la tige, De même, il fa ut amé liorer la machine
le deuxième pour la boucle) : précédente en ajoutant une mé mo ire
On a effectué un zoom
sur certains éléments du
treillis. Pour les autres, on ,, c,1
a simplement indiqué les 0,3,
états fusionnés. La double 1,3 1,2
ellipse est le plus grand langage compatible
avec l'ensemble de phrases impossibles {a,
0 • 1,2
aag, agg, aca, acg}. Il est constitué des mots
formant une suite éventuellement vicie de
,©
ag terminée par ac (par exemple agagac fait
partie du langage). 2,3 0,2,3
....,,
a.. •
... ... .. ,
.......
tte,410,
utili sés pour définir la fo ncti o n de .......... . 11
' )1111··
Ill,..~~
"'
-· ,_.....,.,..
...... ..-. ~......~ - . . a e a a t
tra nsitio n. La ri chesse de descriptio n a ""'
..,., lt,&,U ,
"''"'
........... 1c11uu .... 1111111>,,
....... IN~"':UC$1t ~ l
Grolopin
et les plans projectifs finis
Un petit problème de combinatoire peut cacher de grandes
théories. Arithmétique des congruences, corps finis , espaces
projectifs (en passant par une conjecture non résolue) , voilà
des notions qu'il vaut mieux connaître pour trouver
l'algorithme qui construise la solution optimale.
ro log in (voir page 25) est une • Les pin 's sont tous composés d' un
Les coupl es (N ; M) po ur lesquels il fal - L' intuitio n qui se cache derriè re la solu-
la it réso udre l' é ni g me é taie nt (3 ; 7) , ti o n est de voir les pin 's co mme des
(4 : 13), (6 ; 3 1) , (9 ; 73) pui s fin a le- droites du pl an e t les trous co mme les
me nt (28; 757) (notez qu 'on a to uj o urs po ints par lesque ls e ll es passent : de ux
M = N 2 - N + 1). droites que lco nqu es sont séca ntes o u
Po ur (N; M) = (3; 7) , le nombre max i- parallè les. Ain si, ajo ute r un po int « à
mal de pin 's constructibles est 7, dont voici l' infini » po ur chaque cl asse de droites
un je u admi ss ibl e : parallè les pe rme t de garantir un po int
o•o•o•• d ' inte rsec ti o n po ur c haqu e pa ire de
•o•oo•• d ro ites , do nc un unique trou e n com-
o••o•o• mun po ur c haque paire de pin 's. C ' est
•oo••o• la base de ce qu ' o n appe ll e la géométri e
oo••••o projecti ve.
••oo••o Po ur construire un je u de pin 's max i-
••••ooo
L'avantage de ce problè me est que c ha-
mal, o n di sting ue ra de ux cas :
• N = p + 1 o ù p est un no mbre pre mie r,
c un , pe u impo rte so n bagage mathé- • N = / + 1 po ur p pre mie r e t k > 1.
matique, po uva it soume ttre des pin 's
e t co ntribue r à dévo il e r des pi xe ls de la résolution pour n=3
la carte.
Comme nçons par le cas de l' e xe mpl e ,
mest un majorant du nombre de pin's so itN= 3.
Cons idé rons to utes les droites à coeffi -
Le problè me consiste donc à réali ser un
tableau de M = N2 - N + 1 colo nnes e t
le plus de lignes possible , tel que chaque
Code Pvthon résolvant le cas
ligne comporte N trous et que deux lignes N=o+ 1où onremier
quelconques aie nt exacte me nt un trou
N; 3
à la mê me positio n . p ; N -1
On peut comme ncer par remarque r qu ' il Np ; range(p)
est impossible d 'obtenir plus de M pin 's. points; [(x, y) fo r x in Np for y in Np] \
En effet, si o n di sposa it d ' un te l jeu , o n + [('infini', k) fo r k in Np) \
+ [('infi ni', 'infi ni'))
aura it stri cte me nt plu s de MN trou s à
for a in Np :
ré partir parmi les M co lo nnes . D 'après
for b in Np:
le « principe des ti ro irs » , il ex isterait une pins ; "" # droi te y ; ax + b
colonne comportant au moins N + 1 trous. for x, y in points:
Considérons alo rs les N + 1 pin 's aya nt pins+ ; 'o' if (x ;; 'infini' and y ; ; a) \
or (x J; 'infini' and y;; (a * x + b) % p) else ' '
un tro u da ns cette co lo nne, il reste pour
print(pins)
chac un d 'entre e ux N - 1 tro us à ré par-
fo r a in Np:
tir parmi les M - 1 = N2 - N co lo nnes pins ; "" # verticale x ; c
res ta ntes , so it en to ut for x, y in points :
( N + l )( N - 1) = N 2 - 1 trou s parmi pins+; 'o' if ((x, y);; ('infini ', 'infini') or x ;; a) else ''
N 2 - N co lo nnes . Une co lo nne co m - print(pins)
pins ; "" # infini
po rtera au moin s de ux trous : les de ux
for x, y in points :
pin 's ainsi mi s e n év ide nce auro nt de ux pins+; 'o' if x ;; 'infini' else ''
trous aux mêmes positions, ce qui consti- print(pins)
tue une cont radi ctio n.
Figure 1. \ =() B
• •
corps de cardinal q non primaire (pui s- x=l 0 0 0
sance de nombre premier) qu ' il n 'existe
pas de plan projectif d 'ordre q, c'est-à-
OO
• • • 0 0 0
le traitement
du signal
Aux frontières des mathématiques et de l'informatique, le
traitement du signal, à l'intitulé médicalisé, est injustement
méconnu. Avec l'arrivée des ordinateurs, il a basculé dans
l'informatique moderne et envahi l'intégralité de nos outils de
communication.
, 1, n 11 llL' tous des Monsie ur complexe de détection dont) ' unité cen-
de mesures , que nous appellerons géné- • différentiel (ou dérivée) : D[/ ] (x) = f'(x) .
riquement images. Notons x l ' obj et, y
l ' image obtenue par la mes ure et H la L' in tégration , opérateur in ver se de D, permet de
transformati on représe ntati ve du sys- construire de nombreux autres opérateurs, et en par-
tème de détecti on. H est souvent appe- ticulier l'importante famille des opérateurs à noyaux,
lée un opérateur (vo ir en encadré). Ces de la forme H[/ ] (x) = f K(x,y)f(y}dy.
tro is grandeurs sont liées par la relation
y= H(x), pour une ex périmentati on non Deux exemples courants sont :
bruitée, donc utopique. On ne considè- • la convolution : Hg[! ](x) = f f(u)g(x -u}du.
, .
rera que le cas très courant d ' une trans-
• l'operateur tomograph1que : A[ J ] (x) = 2 r- ~
uf(u)du
-
fo1111ation H linéaire: le ni veau de l' image J, 11 2 - x2
est proporti onnel à ce lui de l ' objet et
l ' im age d ' un e so mm e d 'o bj et es t la
so mmes des images de chaq ue objet. ra lité du problème en supposant objet
On note alors Y = H .X , où X et Y sont et im age éc hantill onnés de la même
les matrices co lonnes de l 'objet et de façon , de sorte que les matrices X et Y
l 'image avec un e dim ension éga le à contiennent le même nombre de va leurs
! 'échantill onn age (le nombre de po ints et donc que la matrice H associée à l'opé-
de mesures) . On n'enlève rien à la géné- rateur H so it carrée.
Le problème se trou ve ainsi mathéma- ses coordonnées dans une base, que nous
tisé, et son étude est ramenée à celle des supposerons orthogonale. Un espace de
matrices d'opérateur, dont le cadre mathé- Hilbe rt pe ut alo rs être vu co mme un
matique est ce lui des es paces de Hil - ensemble de suites infinies , mais de car-
be rt . C es es pa ces d e fo ncti o n s, rés so mm ables, pui sque les fo ncti ons
générali sati ons des espaces euclidiens, qu 'elles représentent sont d 'énergie fi nie
so nt muni s d ' un produit sca la ire. On (vo ir encadré). A insi, l'approx imation
peut alors parler d 'orthogonalité de fo nc- d' une courbe par un po lynôme de deg ré
ti o ns e t définir des projecti o ns. Cec i n est un pro blè me d 'optimi satio n qui
explique que l'intuition géométrique est consiste à rechercher la projecti on d' un
un mote ur pui ssant de la créati vité en objet de dimension infinie dans un espace
tra ite ment du signal, les théorèmes y de dimension n + 1.
étant analogues à ceux de la géométrie
cl assique. Un é lé ment d ' un espace de Dans la plupart des cas conc rets , les
Hilbert, une fonction ( 1D) ou une image opérateurs linéa ires d ' un espace de Hil -
(2D), est défini de mani ère unique par bert sont des transformations qui peuvent
être décomposées en so mme d ' homo-
D'Euclide à Hilbert théties de ra pports (valeur pro pres) et
de directio ns (vecteurs propres) di ffé-
La notion d'espace de Hilbert, ou hilbertien, généralise re nts. L'ensembl e des va leurs et vec-
celle d 'espace euclidien, lente mathématisation de notre teurs propres résume toutes les propriétés
environnement. David Hilbert a prolongé les méthodes de l'opérateur et est appelé son spectre.
mathématiques des espaces euclidiens de dimensions infé- La théorie spectrale est au cœur du trai-
rieures ou égales à trois à des espaces de dimension quel- tement du signal.
conque, voire infinie (mais dénombrable). Un changement de base dans un espace
En 1926, John von Neumann développe cette idée en consi- vecto ri e l pe ut simplifi er les coo rdon-
dérant qu'un système quantique constitué de N particules, nées d ' un vec te ur. li en est de même
chacune déterminée par six paramètres (trois de position po ur la stru cture d ' un e matrice ! Par
et trois de vitesse), est un point d 'un espace de Hilbert de un c hange me nt de base de vec te urs
dimension 6N. Il axiomatise la mécanique quantique, asso- pro pres o rth ogo naux, la plupart des
cie aux grandeurs physiques traditionnelles des opéra- matrices peuve nt s'écri re sous la fo rme
teurs linéaires et leurs applique les techniques de l'analyse À.1 Ü Ü
mathématique. O Ài O
di ago na le H,,,, =
Les espaces hilbertiens apparaissent fréquemment en phy- 0
sique, et sont incontournables en traitement du signal. 0 0 0 À,,
Puisque les phénomènes physiques étudiés sont d'énergie où les (À.;)i=l l ...11 sont les valeurs propres.
finie, et que l'énergie est proportionnelle au carré d'une To ute la pro bl é matique d u tra iteme nt
grandeur Oa vitesse pour un mouvement, Ec = mv 2 / 2 ; la du signa l est rés umée dans cette repré-
position pour l'énergie potentielle d'un ressort, EP = kx2 / 2 ; sentati o n .
le champ électrique E ou magnétique B pour les phéno- On di stin g ue les prob lèmes d irects,
mènes électromagnétiques, Eem = E0 E2 / 2 + B2 / 2µ 0 ; l'in- lorsque l'objet x et l'opérateur H sont
tensité I ou la tension U en électricité, E = RI2 = U2 / R, connu s, et les problèmes inverses, pour
etc.), la plupart des grandeurs physiques sont de carrés lesquels seul l'objet x est inconnu .
intégrables. Ceci explique que les exemples les plus courants Les mesures de te mpérature, press ion,
d'espace de Hilbert en physique sont les espaces de fonc- hygro métrie et plu vio métrie recueillies
tions de carré intégrable ! par une station météorolog ique sont por-
teuses d ' info rmations qui vont permettre ,
en utilisant les résultats d'expériences pas- Une mesure du degré avec lequ e l un
sées, de prédire l' évo lutio n future de problème est bien posé est le critère de
phénomènes atmosphériques. C'est un
exemple de pro bl ème direct qui prédit
..
cond 1twnnement JE
----=-
À.min
~ 1,
les espaces vectoriels, l 'a lgèbre linéaire, cher une solution x, possédant les carac-
les distributions , l 'analyse fonctionnelle, téri stiques attendues de l 'obj et, qui mini-
les probabilités , les stati stiques, l 'opti - mi se la qu antité Q(x) = JJ y- H(x) JJ 2 . La
mi sation , l ' analyse numérique ... D ' un so luti on , identique à l ' in verse généra-
point de vue méthodologique, deux direc- I isée , est x = (1 HH r1 ' Hy, où 'H est la
tions de rec herche sont utili sées pour m atri ce transposée de H . Bi en sûr ,
l 'é tude des probl èmes inverses . U ne x = W 1y si la matri ce H est carrée et
voie, très en vogue, utilise les méthodes in versibl e.
probabili stes qu i incorporent des infor- Dans le cas d ' un système linéai re de
mations a priori sur la so lution (c'est matri ce mal conditi onnée, la régul ari -
toujours plus fac ile quand on connaît la sati on de Tikhonov incorpore de plus
solution !). dans le critère de minimi sation des condi-
L'autre vo ie date des années 1960 avec ti ons sur la soluti on. Son principe est
les travaux de Tikhono v ( 1906- 1993) de minimiser une quantité qui dépend de
en physique mathématique, qui traite, deux termes et d'un para mètre :
en dimension infini e, des probl èmes =
Q(x) D(y - H(x)) + aS(x).
d 'existence , d ' unicité et de stabilité. L a Comme pour la méthode des mo indres
réso luti on numériqu e s'e ffectue alors carrés, le premier tenne est fidèle aux don-
par proj ection sur des espaces de dimen- nées et s'annule si H(x) = y. Le second
sion fini e. terme tient compte de conditions a priori
sur la so luti on et se doit d 'être « petit »
quand elles sont rempli es.
Le po ids des données (a= 0) ou de l' a
priori (a=+ oo) sur la so luti on dépend
de la va leur du paramètre a. Pour une
va leur du paramètre fixée, on cherche la
so luti on x qui minimi se Q (x). Class i-
2 2
quement, Q(x) = Il Y - HX 11 + a JJ CX 11
et la so luti on généra li sée est
X= ('HH + a 'cet
' Hy . On retrouve
bien sûr la so lution des moindres carrés
pour a= O. Tout dépend donc du choix
de l 'opérateur de rég ul ari sati on. Pour
l ' identité C = 1, les soluti ons de norm es
fa ibl es sont favo ri sées, et on év itera les
Andreï Nikolaïevitch Tikhonov. grandes flu ctu ati ons dues à des va leurs
propres faibles. De fa it , les va leurs
Résoudre un probl ème inverse rev ient propres À ont été tran slatées et changées
à détermin er un obj et x dont l ' im age en À + a, ce qui régul ari se la solution en
H (x) par le système de détecti on est « la atténu ant l 'a mplifi cati on À- 1 due aux
plu s proche poss ibl e» de la mesure y. fa ibl es va leurs propres. Le conditi on-
Cette notion de di stance entre éléments nement est amélioré car
de Hilbert a un sens grâce à la nonne asso- À"'"" + a < À,,.., pour a> O.
ciée au produit sca laire, analogue de la À rnin +a À min
Protégez-uous
des hackers !
Les menaces sur Internet portent des noms poétiques comme
spams, phishing , chevaux de Troie, zombies, botnets, dénis
de service et bien d'autres encore tant l'imagination des
criminels est fertile. Heureusement, une bonne hygiène suffit
pour éviter l'essentiel car l'élément faible d'un système
informatique reste l'être humain.
Un exemple de phishing.
Cher(e) EDF Client(e) : Si vous cliquez sur le lien en
bleu , vous vous retrouvez
sur un site où on vous fait
Votre paiement a été refusé par vot re étab lissement bancaire en raiso n payer au moyen de services
d'un problème technique sur le système de prélèvement automatiq ue. du type Paypal , ce qu'au-
• Dépassement du plafond j ournali er, cune administration ne fait.
• Erreur de sa isie des données bancaires,
• Erreur de la sa isie du nom du titulaire de la ca rte de crédit.
Pour éviter les péna lités de reta rd, nous vo us donnons la possi bilité de
payer en lign e. Afin de régler vot re facture N° F03674.92 78.5417.3681 ,
cliquer sur le lien ci-desso us :
ED F SA au capi 1al de 924 433 331 €. RCS Paris n• 552 081 3 17.
siège ~ocial 22·30 av de Wagram 75382 Paris cedex 08 . Copy ri ght © EDF 20 14
Le piratage d ' un service offic ie l peut se rien. En général, les hackers ne rendent
fai re e n obte nant le mot de passe d'un rie n. L' ironie de! ' hi stoi re est qu ' il s uti -
adm ini strateur du système, ce qui per- li sent un dispositif destiné à sécuri ser
met d 'en prendre la maîtri se. Une fois Internet pour vous rançonner. En effet,
le système sous contrôle , il est poss ible le log iciel mal veill ant qu ' il s vo us amè-
de réc upére r les données co nte nues ne nt à exéc ute r s ur vo tre ordinateur
dans ses mémoires et donc d 'envoyer chiffre vos fichiers avec un système de
des courriers é lectro niques aux c li ents chi ffre ment asy métrique. Une clef tenue
e n se fa isa nt passer pour le sys tè me secrète est nécessa ire pour les déchif-
lui -même. frer. Bien entendu , les ransomwares (ou
« rançongiciels ») peuvent s'attaquer
Une attaq ue bien plus série use consiste aux entrepri ses comme aux particuliers.
à prendre les données contenu es s ur Les plus vulnérables sont les PME car
votre ordi nateur en otage et vous deman- e lles sont des objectifs plus tentants que
der une rançon pour vous les rendre. Ne les particuliers mais so uve nt presque
payez surto ut pas, ce la ne serv irait à auss i inconsc ients qu 'eux des dangers.
le classement des
par les moteurs de recherche
pages
Les pages du Web sont innombrables. Pourtant, les moteurs
de recherche comme Google les classent en une fraction de
seconde. Ils sont capables de repérer les pages les plus
populaires, aussi bien que celles qui se cache nt ...
Au centre du calcul effectué dans notre exemple se trouve la matrice le mode de calcul
( 0 1/ 2 0 0\
l 01
M - l O li 3 correspon d ant a' 1a distn'b ution
. des scores d e Pour préc iser les ca lcul s, imag inons la
0 0 1/ 3 0 parti e du We b tra itant du sujet cherché
0 1/ 2 1/ 3 1
limitée à quatre pages.
chaque page. C'est pourquoi la somme des termes de chaque
(:
~ :J\,
Pour simplifier, les pages sont dés ignées
par des lettres . Les fl èches dés ignent les
colonne est égale à 1. Partant de la distribution initiale X -
rgo-robors est le titre de l' ins- bots. C'est là qu ' intervient , au cours de
expe rts, ces log ic ie ls capables de ma- la faço n dont il traite l'information.
nipule r des règles introduites par les Pour les systèmes complexes, comme
progra mme urs et ex pl o itées à l'a ide de ceux de la physique statistique, on uti-
mote urs d ' in fé re nce, re produi sant le lise des équations différentielles cou-
ra isonne ment hum ain. plées, en particulier pour créer des
boucles de rétroaction, qui permettent
Tangente : Où en est aujourd ' hui au système de s'autoorganiser de la
l'intelligence artificielle ? bonne manière. Tous ces outils sont ex-
« Dans u11 premier temps limitée par ploités pour modéliser l'apprentissage
la complexité des algorithmes, com- des robots. Et dans notre proj et, la cu-
parée aux capacités des microproces- riosité est simulée à l 'a ide de modèles
seurs, l'IA bénéficie aujourd'hui des encore au stade de la recherche. C 'est
progrès des capacités de mémoire des ce qui nous a rapprochés de Misha
ordinateurs et des recherches mathé- Gromov [NDLR : le mathé matic ie n
matiques. Elle est à la base de techno- Mikhaïl G ro mov est e n poste à l' In s-
logies modernes telles que les moteurs titut des hautes études sc ie ntifiques]. Il
de recherche de type Google, mais a lu un de nos articles sur la curiosité
un obstacle subsistait : l 'approche de artificielle, consacré à la modélisation
la cogn ition est symbo liq ue ; or la du plaisir engendré par la croissance
connexion à la réalité est une difficulté des connaissances : la problématique
importante que l'on retrouve quand il des modèles informatiques fa isant la
s 'agit de programmer des robots réels. différence entre les motivations intrin -
Des tâches élémentaires pour les hu- sèques et extrinsèques était également
mains devien nent d'énormes gageures. au cœur de ses travaux sur les ergosys-
On s' est alors retournés vers une vieille tèmes ! »
idée, déjà évoquée par Turing : fa ire
apprendre comme un enfa nt. La notion De la « curiosité artificielle » ? Voi-
d'a uto-apprentissage, à laquelle on là qui éveille la nôtre ! Pierre-Yves
revient dep uis une di~aine d'années, Oudeyer explique qu'elle est consti-
allait donner une seconde vie à l '/A. » tuée de trois modules.
• Le pre mie r module réa li se un ap-
Et les mathématiques dans tout pre ntissage stati stique class ique, qui
cela? cons iste po ur le robot à construire un
« Elles sont fo ndamentales. Certains modè le prédic tif du résultat de ses
outils ne sont pas très exotiques : actes, e t à pou voir compare r, po ur
l'apprentissage automatique est un chaque ac tio n, sa prédictio n avec la
doma ine de recherche à l 'intersec- réa lité.
tion de l 'IA, de l'inférence statistique • Le de uxiè me module, au-dess us, est
et de l'optimisation. Les algorithmes, un systè me de méta- prédictio n. Les
briques élémentaires de I'a rchitec- prédictio ns de premie r ni veau sont
ture, proviennent de diverses sources : soumi ses à une évaluation qui va ser-
pour comprendre le vivant, Turing vir à mesure r l' inté rêt de c haque situa-
avait déjà imaginé les automates cellu- tio n ex plorée par le robot. Plus cette
laires ; pour simuler le f onctionnement mesure sera é levée, plus la curi os ité
du cerveau, les réseaux de neurones du robot sera é ve illée et l'inc itera à
per111e1ten t une approche reconstituant po ursui vre son apprenti ssage. Si la
Le de,ign
des têks des
rohoh a rté
conçu par
Da\ id 1 ~ nrh.
LESTR
tan
DÉPOSEZ VOS CANDIDATURES
CHAQUEANNÉEAVANTLE31AOUT
0 014)
ACTIONS par Hervé Lehning
la cryptographie,
à l'origine de l'informatique
La réalisation des premiers ordinateurs a mobilisé des
moyens énormes. La dépense était à l'époque justifiée par
l'urgence de décrypter les messages chiffrés allemands, un
travail qui demande de colossaux moyens de calcul.
a toujours demandé de
l'astuce et des calcu ls. Pour le
montrer, prenons le code le plus
simpl e qui ex iste, ce lui de Jules César,
qui consiste en un décalage de lettres. La
clef du chiffre ment est donc ic i le déca-
!age, c'est-à-d ire un nombre entre I et
25. Prenon s un exem pl e simple, dont
on ignore la c lef : L'auteur explique à Cédric Villani
WYMNM SGJUX YXYWI XYL , comment utiliser une C-36 sous
où les le ttres o nt été regroupées par le regard du général Desvignes,
cinq comme c'es t l'usage . L'idée la président de 1'Association des
plus simple pour le décrypter est d'écrire, réservistes du chiffre et de la sécurité
so us chaque lettre, l 'a lph abet d a ns de l' information (A RCSI).
l 'ordre:
Une des vingt-cinq li gnes que l'on peut
w y M N M s G J u X y X y w X y L
écrire a in si correspond au message en
X z N 0 N T H K V y z y z X K y z M
c la ir (vo ir le tableau). Une idée plus
y A 0 p 0 u L w z A z A y K z A N
subtil e pour décrypter ce message est
z B p Q p V J M X A B A B z L A B 0
d'utiliser la fréquence des lettres en
A c Q s QW K N y B c B c A M B c p
français. Dans le message chi ffré, le Y
B 0 R s R X L 0 z c 0 c 0 B N c 0 Q
est la lettre la plus fréquente. Ell e cor-
c E s T s y M p A D E D E c 0 D E R
respond probab lement au E, la lettre la
plus fréquente en français. Pour trans-
Décryptement d ' un message chiffré par le code former Y en E, il faut le décaler de 6 dans
de Jules César. On peut par exemple utiliser des bandes l'ordre alphabét ique: Y, Z,A , B , C , D,
de pa pier portant chacune l' alphabet dans l' ordre. E. En décala nt de même chaque lettre
Avec une règle, on examine chaque alignement du message chi ffré, o n obt ient bien le
et on s'arrête dès que le texte a un sens . même décryptement.
Po ur déte rm iner la longueur d ' une cle f En fra nça is, l' indi ce de coïnc ide nce
de Vigenère, Wi ll iam Friedman ( 189 1- moyen est donc égal à la somme
1969) eut l' idée d ' introd uire un indice 0 ,084 2 +0 ,0 11 2 + . .. + 0 ,00 12,
invariable par pe rmutation des lettres. soit 0 ,0746. Dans le cas d ' un message
Ain si, sa valeur n 'est pas affectée par où les lettres seraient choisies au hasard ,
une substituti on alphabétique simple, on trou ve une fréque nce moyenne de
te lle celles engendrées par le code de 1 /26. L' ind ice est donc égal à 26 fo is
César. Pour obtenir un te l ind ice, !' idée ( 1/ 26)2 , c'est-à-dire à 1/ 26, soit 0,038.
la plus simple est d 'additionner les car- Il s'agit de l' indice de coïncidence moyen
rés des fréquences des lettres . Plus pré- d' un tex te aléato ire .
ci séme nt , dans un tex te T do nné , o n Prenons un message chiffré par la méthode
co mpte le nombre d 'occ urre nces de de Vi genère , par exemple :
Colossus, le premier ordinateur log iques, fo rcé ment prév isibles , per-
mirent à Alan Turing d 'utiliser la méthode
d u mot probable avec succès.
Colossus, premier
ordinateur à Bletchley Autreme nt d it , une mac hine peut être
Park pendant la Seconde idéa le et potenti e ll ement imposs ibl e à
Guerre mondiale. décrypter, mais le mai llon fai ble reste tou-
jours l'être humain. C'est pourquoi, il est
important que les opérateurs so ient bien
formés et les notices d ' uti lisation cl aires.
Le premier ordinateur (Colossus) fut construit par les Ain si, cell e de la C-36 , mac hine à chi f-
Britanniques pendant la Seconde Guerre mondiale pour frer de l'armée fran ça ise au cours de la
décrypter le code d'une machine de chiffrement, Lorenz, Seconde Gue rre mo ndi a le , préc ise de
réservée aux hauts dirigeants allemands, alors qu'Enigma limite r les messages à qu atre-v in gts
servait sur le champ de bataille, en particulier dans les sous- caractères et de change r la cle f après
marins. Le code de Lorenz et le relatif faible nombre de chac un d ' eux ...
messages le permettaient.
Après la guerre, ces progrès menèrent à l'introduction Références
de nouvelles méthodes, comme les clefs asymétriques où, • Cryptographie et codes secrets. Tangente Biblio-
contrairement aux clefs symétriques, savoir coder ne suf- thèque 26 .20 13.
fit pas pour savoir décoder. La plus célèbre et la plus uti- • L"un ivers des codes secrets. de / 'Antiquité à
lisée d'entre elles, en particulier dans les cartes bancaires Internet. Hervé Lehnin g , Ixe lles , 20 12.
et sur Internet, est la méthode RSA, du nom des trois • Doss ier « Codes secrets » . Tangente 14 7. 20 12.
inventeurs : Rivest, Shamir et Adleman. Elle repose sur
la difficulté pratique de factoriser les nombres quand ils H.L.
sont grands.
... Tangente le magazine des mathématiques ••• •• • Les hors-séries «kiosque » •••
Pour mieux comprendre le monde : Tangente 4 fois par an , un hors-série " kiosque .. d'au moins
Le seul magazine au monde 56 pages, explorent l'actualité des grands dossiers
du savoir ou de la culture mathématique.
s ur les mathématiques.
Tous les deux mois depuis 25 ans. . ~Ë!~l r'-~~c.... Le calcul intégral, Ma thématiques
et informatique, Les angles
••• Les hors-séries Disponibles
Bibliothèque Tangente •• • ft - chez votre marchand de journaux
- avec l'abonnement PLUS
Ce sont de magnifiques ouvrages d'en .,.._.,.
- avec l' abonnement Math+.
moyenne 160 pages (prix unitaire
19,80 € ), richement illustrés, approfon- ••• Spécial Logique •••
dissant le sujet du dernier numéro Nouveau ! Dans la collection
des HS .. kiosque .. de Tangente. Tangente Jeux et Stratégie, un
Disponibles trimestriel contenant près de
· chez votre libraire 200 jeux: tests de logique, grilles à
· avec l'abonnement SUPERPLUS remplir, énigmes mathématiques ...
- avec l'abonnement Mat h++ Accès numérique gratuit pour les
à un prix exceptionnel (33% de réduction). abonnés à la version papier.
• Tous les titres avec les HS « kiosque ». •• Tous les titres avec les HS Bibliothèque. ••• Tous les titres avec les deux HS.
J e j oins mon paiement par (étab lissements scolaires, joindre bon de commande administratif):
Ta.ngente
Publié par les Éditions POLE
sns au capital de 42 ooo euros
Siège social
80 bd Saint-miche! - 75006 Paris
Commission paritaire : 1016 Il 80883
Dépôt légal à parution
Directeur de Publication et de la Rédaction
Gilles COHEn
Rédacteur en chef adjoint
Herué LEHnmG
Secrétaire de rédaction
Édouard rnomns
Ont collaboré à ce numéro
Sylute HLHYRHnGUES, mcolas nnc1nux, maidme HUDOUm,
Catherine BELLEnnnÉE, miche( BIDOIT, Philippe BOULHnGER,
martlne BRILLLEHUD, Élisabeth BUSSER, Hrthur CHHRGUÉRHUD,
Jean-François COLonnn, François COSTE, miche! CRITOn,
Franck DHnmos, Jean-Paul DELHHHYE, Colin DE LH HIGUERH,
Dauid DELHUnHY, mcolas DELERUE, Hdrien DUFOUR,
Jean-Jacques DU PHS, Hrnaud DURHRD,
Jean-Christophe flLLIHTRE, Christine fROIDEUHUX,
Gabriel GOUUlnE, Bertrand HHUCHECORnE, Daniel JUSTEnS,
Robin LHmHRCHE-PERRm, François LHUHLLOU,
Herué LEHRlnG, Christine LElnlnGER, Jean-miche! mULLER,
Benjamen nGUYEn, Jacques ntCOLHS,
Hlexandre THLOR, Hlain UHLETTE, Brigitte UHLLÉE,
JIII-Jênn UIE, Thierry UIÉUILLE, Hlain ZHLmHRSlll
maquette
Guillaume GHIDOT, Ratacha LHUGIER,
Claude LUCCHlnl
EDITIONS.
Prix: 19,80 € POLE