Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% ont trouvé ce document utile (0 vote)
10 vues76 pages

Structure Et Fonction de l'ARN

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1/ 76

Structure et fonction de l’ARN

Fonctions cellulaires de l’ARN

● ARN messagers
● ARN de transfert Fonctions génétiques
● génomes viraux à ARN
● ARN régulateurs: micro ARN

● autoépissage d'ARN viraux Fonctions enzymatiques


● maturation ARNt par la = ribozymes
ribonucléase P (Altman, Cech, 1983)
● épissosome (snRNA)
● le ribosome

Hypothèse du «monde ARN»


?
Ribonuclease P:tRNA Self-splicing group II intron
Reiter et al, Nature 2010 Toor et al, Science 2008
Le ribosome est un «ribozyme»

Nature (2000) 407:327 50% de la masse bactérienne...


Ramakrishnan Steitz Yonath

Prix Nobel de
Chimie, 2009
“Interférence” par l'ARN
MicroARN: petits ARN régulateurs
chez les eucaryotes

Mello

Fire

Prix Nobel de
Médecine, 2006 Coupure/inactivation de l'ARNm
Poly “Biologie moléculaire, pg 217
L’ARN peut adopter une structure 3D complexe

Cette structure 3D lui permet d’accomplir des


fonctions catalytiques ou biologiques complexes

Des molécules peuvent cibler ces structures d’ARN :


antibactériennes, antivirales, antimitotiques
Antiobiotiques ciblant l’ARN (le ribosome)
Antiobiotiques ciblant l’ARN
La richesse des structures de l’ARN lui permet de
reconnaître des ligands variés de manière spécifique

Un ARN obtenu par évolution dirigée ou “Selex”


Structure de l’ARN
Nature chimique de l’ARN

O O

O- NH O- NH

O P O O P O
N O N O
O- O O- O
NH2 NH2

O N O OH N

O P O O P O
N O N O
O- O O- O

O O

O N O OH N
NH NH
O P O O P O
N N N NH2
N NH2 O- O
O- O
NH2 NH2

O N O OH N
N
N
O P O O P O
N N N
N O- O
O- O

OH OH OH

ADN ARN
Les ARN contiennent aussi des bases non-standards

Pseudouridine Dihydrouridine

Inosine 7-methyl guanosine

… et beaucoup d'autres
Différences ARN-ADN

● Présence d’un groupement 2’-OH sur le sucre


(au lieu du 2’-H): plus polaire

● Remplacement de la thymine par l’uracile


= suppression du groupement 5-CH3

Petites modifications  grands effets


Modification de la géométrie locale
notion de “plissement” du ribose

C2' endo C3' endo


Impact sur la géométrie globale

Forme A

préférée
2’ OH par l'ARN

Forme B
préférée
par l'ADN
La modification de géométrie
affecte la taille des sillons

Le petit sillon est


peu marqué

Le grand sillon est


très profond et pincé
Interactions ARN:protéines  ADN:protéines
ADN: insertion élément de structure secondaire
(hélice, boucle) dans le grand sillon

ADN
Interaction ARN:protéine

La reconnaissance spécifique d’un


ARN s’effectue souvent via les
zones de structure moins régulière

UC
U G
C–G La protéine se lie dans
A–U
C–G
G–C
une irrégularité de
C–G l’hélice
G G
U
G A
G–C
U–A
C–G
U•G
G–C
G–C
La présence du 2’ hydroxyle rend
la molécule d’ARN chimiquement labile
L’ARN s’autolyse en conditions alcalines

N
O NH
O
N N
NH N NH2
O
O
N N NH2
O
O O
P
3’-phosphate cyclique
O O H -O H O O-
H P OH
O-
O H O O CH2 B
O
CH2
5’-hydroxyle
O OH
Le groupement 2’­OH permet la catalyse de réactions
chimiques

Auto-coupure

A U
A C
YGA
C
PAG
U A U
G

Ribozyme en tête de marteau


Avocado Sunblotch Virus

Martick, Scott Cell '06


Nature chimique de l’ARN
O O

O- NH O- NH

O P O O P O
N O N O
O- O O- O
NH2 NH2

O N O OH N

O P O O P O
N O N O
O- O O- O

O O

O N O OH N
NH NH
O P O O P O
N N N NH2
N NH2 O- O
O- O
NH2 NH2

O N O OH N
N
N
O P O O P O
N N N
N O- O
O- O

OH OH OH

ADN ARN
L’ARN est produit par transcription à partir de l’ADN

● ARN = molécule linéaire courte


ADN long  ARN court

● la plupart des ARN sont monobrins


ADN double brin  ARN simple brin

● «turnover» plus ou moins rapide


ADN pérenne  ARN labile

ARNm procaryotes: ½ vie moyenne de 3'


ARNm eucaryotes: ½ vie plus longue et variable;
Goldman et al protéines régulatrices quelques minutes; globines 10h!
Nature '13
Appariements de bases

En plus des 2
appariements
canoniques,
l’ARN tolère
fréquemment des
appariements G-U, dits
«bancals» (wobble)

A-U et G-C sont


«isostères», tandis que
l’appariement G-U
provoque une légère
distortion du squelette
ribose phosphate
Appariements de bases

En plus des 2
appariements
canoniques,
l’ARN tolère
fréquemment des
appariements G-U, dits
«bancals» (wobble)

A-U et G-C sont


«isostères», tandis que
l’appariement G-U
provoque une légère
distortion du squelette
ribose phosphate
Appariements de bases

En plus des 2
appariements
canoniques,
l’ARN tolère
fréquemment des
appariements G-U, dits
«bancals» (wobble)

A-U et G-C sont


«isostères», tandis que
l’appariement G-U
provoque une légère
distortion du squelette
ribose phosphate
Structure secondaire et tertiaire
● Structure primaire : séquence des nucléotides
● Structure secondaire : identification des régions appariées

● Structure tertiaire : repliement en 3D et contacts correspondants

En 1ère approximation, le repliement de l'ARN est “hiérarchique”:


formation puis assemblage des éléments de structure secondaire
Structures secondaires-type

boucle terminale

boucle
interne
boucle boucle
multiple terminale
“enflement”
ou “bulge” –––AGGACUU–––––AAGUCCU–––

5' 3'

Séquences répétées inversées


Structures secondaires­type

Séquences répétées inversées

boucle terminale

boucle
interne
boucle boucle Dans les prédictions de
multiple terminale
structure secondaire, les
“enflement”
ou “bulge” interactions boucle-boucle
seront négligées
Pseudo­nœuds

pseudonoeud «vrai» noeud

Lorsqu’une boucle forme un appariement avec une région située à l'extérieur de


la tige, on dit que la structure forme un pseudo-nœud

La longueur de la région appariée dans la boucle ne peut dépasser


10 à 11 nucléotides.
Sinon, formation d’un nœud topologique
Pseudo­nœuds

On trouve localement quelques pseudo-nœuds dans de nombreux ARN naturels


ex : Turnip Yellow Mosaic Virus

En général, les deux hélices sont empilées et coaxiales


Stabilité des structures

● Liaisons hydrogène (électrostatique)

● Empilement des plateaux de bases : van der Waals

● Empilement des plateaux de bases : «effet hydrophobe»


(masquage des bases hydrophobes vis à vis du solvant)

● Solvatation des phosphates (électrostatique)


Fonction d'énergie: mécanique moléculaire

U = liaisons kb (b­b0)2 + angles ka (a­a0)2 + torsions kt [1 + cos(nt­)]

+ ij [ Aij/rij12 ­ Bij/rij6 + qiqj/rij ]

.35 H H H

N-.30
.3
H
CH2
-.55
.3 -.6
CH2 H N O

CH2 C .55
-.55
CH2 O CH2 O CH3
-.35
N CH C N CH C N CH
.55
.25
H H H
Evaluation expérimentale de la stabilité

L'absorption UV des bases à 260 nM est plus importante lorsque l’ARN est
sous-forme de simple-brin dénaturé (« hypochromicité » de la double-hélice)

 On peut suivre la fusion d'un duplex par spectrophotométrie


Evaluation des paramètres de stabilité thermodynamique

[Duplex]
5’
AGAUAUCU3’ 2 [Brin] [Duplex] K=
3’UCUAUAGA5’
[Brin]2

Enthalpie libre standard


de formation du duplex Go = – RT logK = Ho – T So

A la température de fusion,
2 [Duplex] = [Brin] +R Tfus log(2 [Brin]) = Ho – Tfus So
la moitié de l’ARN est sous
forme de duplex

Conservation de la
2 [Duplex] + [Brin] = ARNtotal
quantité d’ARN totale

Mesures pour  2 Tfus =


Ho On néglige la variation
valeurs de ARNtotal So + R log(ARNtotal ) de H° et S° avec T

?
Modèle des premiers voisins
L’énergie pour former une paire de bases ne dépend que des interactions
entre celle-ci et les deux paires adjacentes (empilement + liaisons H)

Pas d’effets à longue portée

Ghélice ≈  Gempilements individuels

Gn Gn+1
5' A 5' AG
3' U 3' UC

G( AG
UC
) = Gn+1 ­ Gn
Modèle des premiers voisins
L’énergie pour former une paire de bases ne dépend que des interactions
entre celle-ci et les deux paires adjacentes (empilement + liaisons H)

Pas d’effets à longue portée séquence-dépendants

Ghélice ≈  Gempilements individuels

Gn Gn+1
5' A 5' AG
3' U 3' UC

G( AG
UC
) = Gn+1 ­ Gn + constante
Modèle des premiers voisins

L’énergie pour former une paire de bases ne dépend que des interactions
entre celle-ci et les deux paires adjacentes (empilement + liaisons H)

Pas d’effets à longue portée séquence-dépendants

Ghélice ≈  Gempilements individuels

Gn Gn+1
5' X X' 5' X A X'
3' Y Y' 3' Y B Y'

Gn+1 ­ Gn = G( XA ) + G(AX') ­ G ( XX') + constante


YB BY' YY'
Tables de Freier-Turner
G ( XX')
YY' paire de base en 5' (XY)
(kcal/mol) GU UG AU UA CG GC
GU -0.5 -0.6 -0.5 -0.7 -1.5 -1.3
UG -0.5 -0.5 -0.7 -0.5 -1.5 -1.9
paire de AU -0.5 -0.7 -0.9 -1.1 -1.8 -2.3
base en 3' UA -0.7 -0.5 -0.9 -0.9 -1.7 -2.1
(X'Y')
CG -1.9 -1.3 -2.1 -2.3 -2.9 -3.4
GC -1.5 -1.5 -1.7 -1.8 -2.0 -2.9

Freier et al (1986) Proc Nat Acad Sci (USA) 83:9373 ;


Turner et al (1987) Cold Spring Harb Symp Quant Biol, 52:123
Turner (2000) in Nucleic Acids, U. Science Books
Les règles d’empilement sont asymétriques

5’-CG-3’ 5’-GC-3’
3’-GC-5’ 3’-CG-5’
Les règles d’empilement sont asymétriques

C G

G C

5’-CG-3’ 5’-GC-3’
3’-GC-5’ 3’-CG-5’

G = -2.0 kcal/mol G = -3.4 kcal/mol


Tables de Freier-Turner
paire de base en 5'
GU UG AU UA CG GC
GU -0.5 -0.6 -0.5 -0.7 -1.5 -1.3
UG -0.5 -0.5 -0.7 -0.5 -1.5 -1.9
paire de AU -0.5 -0.7 -0.9 -1.1 -1.8 -2.3
base en 3' kcal/mol
UA -0.7 -0.5 -0.9 -0.9 -1.7 -2.1
CG -1.9 -1.3 -2.1 -2.3 -2.9 -3.4
GC -1.5 -1.5 -1.7 -1.8 -2.0 -2.9

Taille de boucle 1 2 3 4 5 6 7 8 9 10 20

Enflements 3 5 6 7 7 8 9 10 10 11 14
Boucles terminales - - 7 6 4 4 4 4 4 4 7
Boucles internes - 1 1 2 2 2 3 3 3 4 7

Freier et al (1986) Proc Nat Acad Sci (USA) 83:9373 ;


Turner et al (1987) Cold Spring Harb Symp Quant Biol, 52:123
Turner (2000) in Nucleic Acids, U. Science Books
Tétraboucles hyperstables

GNRA
Tétraboucles hyperstables

Les ARNs de structures


connues contiennent un
nombre anormalement
élevé de boucles de 4
nucléotides (tetraboucles)

Ces boucles appartiennent


pour la majorité à 2 classes:
GNRA
UNCG
Recherche de structure secondaire optimale
Recherche de structure secondaire optimale

● Méthode exhaustive de type force brute impraticable

● Méthodes par programmation dynamique


● Nussinov, R. and Jacobson, A.B. (1980) Fast algorithm for predicting the secondary
structure of single- stranded RNA. Proc Natl Acad Sci U S A, 77, 6903-6913.
● Zuker, M. and Stiegler, P. (1981) Optimal computer folding of large RNA sequences
using thermodynamics and auxiliary information. Nucleic Acids Res, 9, 133-148.
Algorithme de Nussinov

On adopte une fonction d'énergie E qui ne prend


en compte que les appariements, pas l'empilement.

Principe :
Pour chaque paire i,j de nucléotides, on tabule l’énergie E(i,j) de la
structure la plus stable, S(i,j), pour la sous-séquence allant de i à j
Algorithme de Nussinov

Principe :
Pour chaque paire i,j de nucléotides, on tabule l’énergie E(i,j) de la
structure la plus stable, S(i,j), pour la sous-séquence allant de i à j

4 façons d'obtenir S(i,j):

1) ajouter i,j, appariés, à S(i+1,j-1)


i+1 j-1
i j
2) ajouter i, non-apparié, à S(i+1,j)

3) ajouter j, non-apparié, à S(i,j-1)

4) réunir deux sous-structures optimales, S(i,k) et S(k+1,j)


Algorithme de Nussinov
On adopte une fonction d'énergie E qui ne prend
en compte que les appariements, pas l'empilement

1 2 3 4

i+1 j-1
i j i+1 j i j-1 i j
i j k k+1

i,j appariés i seul j seul union de


sous­structures
Algorithme de Nussinov

i+1 j-1
i j i+1 j i j-1 i j
i j k k+1

L'énergie E ne prend en compte que les appariements, pas l'empilement

Relation de récursion:

E(i+1,j-1) + e(i,j)
E(i+1,j)
E(i,j) = Min
E(i,j-1)
Min (E(i,k) + E(k+1,j))
i<k< j-1
Algorithme de Nussinov E(1,N)
j
i 0
0

Je epl
Je

re ie l
0

pl
r

ie e s s
le éq
0

s s ue
éq n c
Relation de récursion: 0

ue es
nc de
es
0

de long
E(i,j) =

lo ue
0

ng u r
ue 2
E(i+1,j-1) + e(i,j)

ur
0

3
E(i+1,j)
Min E(i,j-1)
Min (E(i,k) + E(k+1,j))
i<k< j-1
Algorithme de Nussinov
j k
i 0
x 0
x 0 3,7 3,11

x 0
x 0 +
Relation de récursion:
x 0
E(i,j) =
x 0
E(i+1,j-1) + e(i,j) x 0 8,11 k+1
E(i+1,j) x
Min E(i,j-1)
Min (E(i,k) + E(k+1,j))
i<k< j-1
Algorithme de Zuker
L'énergie E prend en compte les appariements et l'empilement.

E(i+1,j)
E(i,j-1) E(i,j) : energie de la meilleure
E(i,j) = Min V(i,j) structure sur le segment [i,j]
Min(E(i,k)+E(k+1,j))
i<k<j-1

Boucle terminale(i,j) V(i,j) : energie de la meilleure


V(i+i,j-1) + e(i,j) structure sur le segment [i,j] où
V(i,j) = Min
Boucle interne(i,j) l’appariement (i,j) est formé
Boucle multiple(i,j)

Programmation dynamique avec deux tableaux


Zuker (1981, 2003) Nucleic Acids Research
Algorithme de Zuker
http://mfold.rna.albany.edu
Zuker, Nucl Acids Res, 2003
Programmation dynamique sans pseudonoeuds O(N 3) Nussinov, Zuker

Programmation dynamique avec pseudonoeuds O(N 6) Rivas, Eddy (1999) J Mol Biol

Programmation dynamique avec pseudonoeuds O(N 5) Condon et al (2004) Theor Comp Sci

Les méthodes récentes fournissent toutes les structures (secondaires) ayant


une énergie dans un intervalle donné au dessus du minimum global:
structures “sous-optimales”

J. Mol. Biol. (2006) 359:526


Current Opin. Struct. Biology 2007, 17:157
Validation des prédictions

● Etudes phylogénétiques: mutations “compensatoires”

● Sondage chimique et enzymatique de l’ARN


Mutations compensatoires

Hypothèse : la structure 2D d'ARN homologues est conservée

Corollaire : la présence d’un appariement est conservée mais pas


nécessairement la nature des bases impliquées

C-G G-C

Espèce 1 Espèce 2
Mutations compensatoires

Thermus thermophilus Escherichia coli

ARN ribosomal 5S
(120 nt, grande sous-unité)
Etudes phylogénétiques

1) Alignement des séquences (difficile...)

2) Etude des covariations de nucléotides

fb,b'
Information mutuelle: M(i,j) = b,b' fb,b' log f f
b b'

i j
x x C x x x x G x x
fb (resp. fb') = fréquence de
x x A x x x x U x x
b (b') dans la colonne i (j)
x x G x x x x C x x
b b'
M(i,j) = fCG log fCG/fCfG + fAU log fAU/fAfU + fGC log fGC/fGfC
+ 13 x zéro
= log 3
Sondes enzymatiques

L’activité de certaines ribonucléases


dépend de la structure de l’ARN substrat

Ribonucléase S1
Clive préférentiellement les régions simple-brin

Ribonucléase V1
Clive préférentiellement entre les bases appariées et empilées

Ribonucléase T1
Clive après les guanosines
Sondes enzymatiques

Ribonucléase S1
Sondes chimiques

sonde chimique

Les modifications sont révélées par transcription inverse


à partir d’une amorce marquée

La polymérisation est bloquée par la base modifiée


Sondes chimiques

O O
S
CH3 O O CH3

diméthyl sulfate

O NH 2
N N
NH N

N N NH2 N N

Alkyle la position N7 des G et N1 des A


Structure 3D:
tout ce que nous avons négligé...
Interactions non­canoniques

En plus des interactions Watson-Crick et G-U wobble, il est possible


de former des appariements «non-canoniques» entre bases

Watson-Crick Hoogsteen Reverse-


(brins //) Hoogsteen
(brins anti-//)
Interactions non­canoniques

X .

. X X X
Il existe une grande variété d’interactions non-canoniques

Plusieurs dizaines d’appariements non-


canoniques ont été observés dans les
structures 3D d’ARN.

Ceux-ci peuvent être classés en fonction


des faces d’interaction sur les bases, de
l’orientation de la base par rapport au
sucre (syn/anti) et du sens du squelette
ribose- phosphate

Leontis, Stombaugh & Westhof (2002)


Nucleic Acids Res. 30: 3497-3531
Il existe une grande variété d’interactions non-canoniques

Plusieurs dizaines d’appariements non-


canoniques ont été observés dans les
structures 3D d’ARN.

Ceux-ci peuvent être classés en fonctions des


faces d’interaction sur les bases, de
l’orientation de la base par rapport au sucre
(syn/anti) et du sens du squelette ribose-
phosphate

Leontis, Stombaugh & Westhof (2002)


Nucleic Acids Res. 30: 3497-3531

Paire
bancale;
exemple
du rôle
de l'eau
Un concentré d’interactions non­canoniques:
la boucle E de l’ARN ribosomal 5S

| |
C-G
C-G
A•G
A•A
AA parallèle A•U•G
G•A
G-C
G•U GA en cisaille
| |
Triplet de bases
Escherichia coli
Haloarcula marismortui

La «boucle» E de l’ARN 5S est complètement résistante aux nucléases


Elle est fortement structurée par des interactions non-canoniques
Structure de la boucle E

| |
C-G
C-G
A•G
A•A
A•U•G
G•A
G-C
G•U
| | A•G A•A triple G•A
Triplets de bases

U•A•U U•A•U
C•G•G
Hoogsteen Reverse Hoogsteen

Les purines peuvent s’apparier simultanément avec 2 autres bases


Triplets de bases

On peut former un triplex continu le long d’une séquence homopurine


Interactions «à longue portée»

Intéraction Pseudonoeuds
tétraboucle-récepteur

Triples hélices
Interaction tétraboucle­récepteur

C-G
C-G
U U A
A A
A A AG
G U

Costa & Michel (1997) Rules for RNA recognition of GNRA tetraloops deduced by
in vitro selection: comparison with in vivo evolution. EMBO J. 16, 3289-3302
Prédiction de structure 3D

● Prédiction de structure 2D (Zuker, Eddy, ...)


● Validation
­phylogénie
­sondes chimiques et enzymatiques
● Recherche d’interactions 3D
­covariations de séquence
­pontages chimiques ou UV
● Construction d’un modèle compatible
● Affinement par des simulations de
dynamique moléculaire
Simulation du repliement in silico
Voir le chapitre sur les protéines...

Repliement

RNA (2008) 14:1164

Vous aimerez peut-être aussi