Chapitre 4 - 2008 1 PDF
Chapitre 4 - 2008 1 PDF
Chapitre 4 - 2008 1 PDF
1) caractérisation de la Résistance :
w L
B
L’expression de la résistance d’un pavé de semi-conducteur est donnée est donnée par :
RAB = ZRsh où Z = L/W et RSh la Résistance d’un pavé carré de matériau
RAB = ρL/A soit => R = ρL /(tW) pour un pavé carré, l’expression devient :
Avec L = W => RAB = ρ/t = Rsh ohm / carré et ρ = 1/σ = 1/q μ Ν οù µ est la mobilité et N est
la concentration des porteurs par unité de volume
La table ci-dessous donne la résistance d’un carré pour quelques matériaux :
L=2λ
W = 8λ
Polysilicium
W L
=2λ = 2λ
N - diffusion
R = Z Rs
R = 1sq x Rs = Rs = 104 Ω R = (L/W) * Rs
R = (1/4) 104 Ω
Dispositif Minimum
2) Caractérisation de la capacité
Dans un circuit, les couches conductrices sont séparées l’une de l’autre par du SiO2. Ceci
pourrait constituer une capacité à plaques parallèles, Cox = є0єox A / tox (farads)
tox = épaisseur oxide(100-200Å=1-2 10-2µm), A= Area, et єoєox =3,9x8,85 10-14 F/cm
=35 10-18 pF/µm ;
Capacité par unité surface Cox = 35-17 10-4 pF/µm2. C’est l’unité standard pour le noeud
technologique correspondant à la capacité grille-canal du transistor de taille minimum (2λ x
2λ), donnée par □Cg
La figure ci-dessous montre les capacités générées par l’intervalle d’oxyde entre les diverses
couches de métal :
Couche métal 3
C23
C22 C22
Couche métal 2
C21
Couche métal 1
b
a Diffusion Diffusion
source a
drain Cjp
Xc
Cja
3) Effets RC distribués :
Les fils excessivement longs se présentent comme des lignes de retard formées par des
cellules RC comme le montre la figure ci-dessous :
C C C
C1
C
GD
G GDS Substrat
I
D
C
GS C
2
Figure 8
Ce modèle comprend les capacités grille-source CGS et grille-drain CGD non linéaires, les
capacités de diffusion des régions source C2 et drain C1, la conductance non linéaire GDS
observée en régime de saturation, et le courant ID (VD,VG). L'analyse d'un circuit grand
signal est souvent simplifiée, aux dépens de la précision, en moyennant les éléments non
linéaires dans la gamme de fonctionnement. Le circuit linéaire correspondant pourra être plus
facilement analysé.
Pour les applications "petit signal", les paramètres du circuit équivalent deviennent
linéaires. Un circuit équivalent du premier ordre en régime saturé est donné par la figure 9 ci-
dessous:
D
Cgd
gds
G Cc C1
Substrat
gmvgs
C
gc 2
Cgs
S S
Figure 9
+V Cgs2 + VDD
Cgs1 DD
S B S B
G G
Cgd1 D C21 D
Cgd2 C22
Cgd1 Cgd2
C21 C22
v G D G vo
i D
S B
Ci S B
Cgs1
Cgs2
Figure 10
La figure ci-dessous montre les capacités parasites d'une paire d'inverseurs en cascade:
Wp Transistor P
Cgsp
source
Cgdp Cgdp
L
Cgdn Cgdn
Cgsp drain Ldp
Cgdp Cdbp
1 fo Sortie Substrat
Cdbn
Cgdn
Cdiff Cint Cgsn Entrée Ldn
drain
L
source
Cgsn Transistor N
Wn
Figure 11
Les capacités grille-substrat ont été négligées ainsi que les capacités source-substrat car
source et substrat sont connectés soit à la masse soit à l'alimentation.
" Avec l'évolution des procédés vers des dimensions plus faibles (nanométrique), l'importance
des effets périphériques tend à croître; ils sont donc de moins en moins négligeables. Ces
effets sont si complexes qu'il faut recourir à un extracteur approprié (Mc Cormick, S.P. Excl:
A circuit extractor for IC Designs, IEEE Proc. 21st Design Automation Conference
Albuquerque 1984 pp. 616-623) pour arriver à les évaluer avec précision lors de la conception
d'un circuit VLSI". Les formes des connexions peuvent prendre une importance cruciale
comme l'expliquent Glasser et Dobberpuhl dans leur ouvrage "The Design and Analysis of
VLSI circuits, Addison-Wesley Reading (Mass.) 1985"
Exemple d'application :
La société ES2 a communiqué pour la technolgie CMOS 1µm :
cox = 170 nF/cm2 et cj = 30 nF/cm2
Admettons que le "Lay out" nous donne : L = 1 µm; Wn = Ldn = Ldp = 3µm et que Wp =
10µm
alors pour un inverseur tout seul :
Cin = (3µm + 10µm)*1µm*170nF*10-8µ-2 ≈ 2200 nF 10-8
Cout = 0.5 Cin + (3µm + 10µm)*3µm*30nF*10-8µ-2 ≈ 2200 nF 10-8
Pour une paire d'inverseurs :
CL = Cout (commande) + Cin (charge) + Cint (inconnue) = 4400 nF 10-8 + Cint
0v
Figure 12
V Sortie
dd
Vc
0
Entrée Τ↓ Τ↑
Figure 13
V Vdd
dd
I=0 I DS Ω n
I DS sat n
CL C
L
0v t(ns)
Vout(V)
NMOS bloqué < NMOS entre en mode de saturation et PMOS en blocage
Vdd
PMOS linéaire < NMOS entre en mode linéaire
Vdd/2
0v t(ns)
t hli
Figure 15
2
avec Idn(sat) = 0.5 kn (Vdd - Vtn) et
2
Idn(lin) = kn [(Vdd - Vtn)Vout - 0.5 V out] où
I I
d sat p d Ω p
C
I=0 L C
L
0v t(ns)
Vout(V)
Vdd
Vdd/2
PMOS bloqué < PMOS entre en mode linéaire
0v t(ns)
NMOS linéaire
t lhi
PMOS entre en mode de saturation et NMOS en blocage
Figure 17
dt = CL (dVout / Idp(Vout) )
Le transistor PMOS passe du mode de fonctionnement saturé au mode linéaire à -Vtp alors
que Vin = 0 V
−Vtp Vdd / 2
dVout dVout
tlhi = CL ∫
0
I DP ( SAT )
+ CL ∫
−Vtp
I DP ( LIN )
Req Req
2,5Req 2,5Req
= 7Req Ceq = 7τ
ω0 =gds/Cg = µ(Vgs-Vt)/L2
Dans le cas de l'interconnexion entre blocs logiques, via le bus, ou lorsqu'il s'agit de
connecter la sortie d'un boîtier, via un amplificateur de sortie, à l'entrée d'autres boîtiers,
l'augmentation de la capacité d'interconnexion Ci devient préoccupante et le retard devient
sérieux d'autant plus que la sortance f0 est importante. Comment faire pour réduire ce temps
de retard pour qu'il devienne du même ordre de grandeur que celui d'un seul inverseur? la
solution consiste à utiliser des inverseurs d'adaptation, dont la dimension augmente en
progression géométrique de pas fo , jusqu'à ce que le dernier soit capable de piloter en un
délai court la grosse charge capacitive. En effet plus le débit est fort, plus une capacité se vide
ou se remplit rapidement.
Si on utilise n étages et que chaque étage a une taille fo supérieure à celle de l'étage
précédent, à chaque fois le retard sera donné par Tpdi+1 = Tpdi + Tpd et la capacité
correspondante sera CLi+1 = fo CLi. La dernière capacité sera égale à CLn = fon CL0. Le
temps de retard n'aura progressé qu'arithmétiquement avec un pas de Tpd et le retard total ne
sera que de n Tpd.
fn = y = CL/Cg
2
1 f f
Cg
CL
Retard = td
Retard d’un étage = f td
Retard total = n x f td = ln(y) ( f / ln f) td
[Vds/Id(Vout=Vdd)+Vds/Id(Vout=Vdd/2)]/2
VDD
3/3 12/3
Vin Vout
VSS
Cg (W/L)
R□ (L/W)
W/L et L/W sont respectivement le nombre de carrés pour la capacité et pour la résistance
Avec un niveau haut à l’entrée, le retard du buffer est :
T T
Energie: E =
∫ P(t )dt = ∫ i
0 0
dd (t )Vdd dt
T
Puissance moyenne: Pmoy = 1 idd (t )Vdd dt
T ∫
0
Vdd
p
Ip
Entrée Sortie
n In
CL
0v
La puissance dynamique est requise pour charger et décharger les capacités de charge
quand les transistors commutent.
T
1
Pdynamic = ∫ iDD (t )VDD dt
T 0
T
V
= DD ∫ iDD (t )dt
T 0
VDD
= [Tf swCVDD ]
T
= CVDD 2 f sw
Facteur d’activité
Portes dynamiques:
Portes statiques :
Un SoC de technologie 100 nm (2 λ) alimenté sous 1.2 V possède 200 Mtransistors dont
20M transistors logiques de largeur moyenne : 12 λ et 180M transistors mémoires de largeur
moyenne : 4 λ avec une capacité de grille Cg = 2 fF/μm
- Consommation dynamique
Sachant que les portes logiques CMOS Statique possèdent un facteur d’activité de 0.1 et
que les nombreuses banques Mémoire ont un facteur d’activité de 0.05, estimer la
consommation de puissance dynamique par MHz. Négliger la capacité filaire et le
courant de court- circuit.
Clogique= (20 106 )(12x0,05µm)(2fF) = 24 nF
Cmem= (180 106 )(4x0,05µm)(2fF) = 72 nF
Pdynamique = (0,1 Clogique+ 0,05Cmem) (1,2)2 f = 8,6 mW/MHz
- consommation statique
Pstatique= IstatiqueVDD = 38 mW
S’il n’y avait pas de transistors low leakage, on aurait eu Pstatique = 749 mW
VTN = Cte
Vdd 2
1/Vdd
Nous avons également vu que les temps de montée et de descente varient en fonction
inverse de (Vdd -VT)2
Pour gagner sur la puissance, on fait diminuer Vdd mais cela fait augmenter le retard don fait
équilibrer en faisant diminuer la tension de seuil comme le montre les courbes suivantes :
Malheureusement la diminution de la tension seuil fait augmenter la consommation
statique. En effet, d’après le modèle BSIM3 le courant de drain s’écrit:
Le pipeline est comme la ligne d’assemblage d’un SoC. Plus il y a d’étages plus ce dernier est
rapide impliquant une consommation plus importante. Alors que le Pentium II et III avaient
des pipelines de taille similaire, le Pentium IV a débuté avec 20 étages et a terminé sur les
dernières versions avec 35 étages (consommation de 5 W). L’exemmple ci-dessous montre le
traitement simultané de 10 instructions :
Compromis vitesse-surface (2) Approche parallèle
Pparallèle= NCtotal Vdd2 fclk/N + CregVdd2 fclk
D’où les architectures parallèles à 2 cœurs à 14 étages et celle d’Atom (Techno 45nm, grille
en dioxide de hafnium, 2 milliards de transistors) à 16 étages comme le montre la figure ci-
dessous.
Réduction des capacités physiques
Minimiser le nombre des transistors par porte et utiliser des portes dynamiques ou
pseudo CMOS.
O1 O2 F
P1 (Chaîne) 1/4 1/8 1/16
P0=1-P1 (Chaîne) 3/4 7/8 15/16
P0→1 3/16 7/64 15/256
P1 (arbre) 1/4 1/4 1/16
P0=1-P1 (arbre) 3/4 3/4 15/16
P0→1 3/16 3/16 15/256
(1-0,5x0,2).(0,5x0,2)=0,09 (1-0,2x0,1).(0,2x0,1)=0,0196
Pour minimiser l’activité du circuit retarder au maximum les signaux qui ont une grande
probabilité d’être à 1
Augmentation de l’activité α
7-1) Introduction
C'est en 1972 que Mead présenta pour la première fois la théorie du maigrissement du
transistor MOS et donc celle des circuits correspondants. Cette théorie se résume ainsi : Si les
dimensions du dispositif physique et les potentiels appliqués sont réduits par un facteur 1/κ,
(κ >1) et que l'impureté est augmentée par κ, la forme du modèle du champ électrique au sein
du dispositif maigri ne change pas. Ceci reste vrai pour une longueur de canal allant jusqu'à 1
μm et ce ne l'est plus en dessous. Il faudrait reprendre la théorie.
7-2) Théorie généralisée
div Jn = 0
avec
Jn = - q μnn grad φ + qDn grad n
En dessous de la tension de seuil, la contribution des électrons à la charge d'espace est
négligeable ainsi les deux équations ci-dessus peuvent être découplées.
Posons :
φ' = φ/κ
(x',y',z') = (x, y, z)/λ
2
(n', p', N'D, N'A) = (n, p, ND, NA) λ /κ
La table ci-dessous donne les facteurs d'échelle associés avec les quantités physiques
les plus importantes pour les circuits CMOS:
Le facteur ks dans l'expression du courant pour la vitesse de dérive de saturation varie très peu
avec VDS/L Ec où Ec est le champ critique en saturation de vitesse; donc ks varie peu avec
λ / κ , elle est considérée comme constante dans la table.
Deux nouveaux paramètres de mise à l'échelle doivent être tout d'abord définis, la
chute de Vbe à l'entrée et à la sortie. Comme la sortie de la porte BiCMOS est à Vbe de Vdd
et de la masse, le swing de la sortie d'une porte BiCMOS sera réduit plus fortement que celui
d'une porte CMOS. Le facteur de mise à l'échelle γ est défini comme étant le rapport entre la
mise à l'échelle de la tension d'alimentation et elle du swing de tension du BiCMOS :
γ = [(Vdd-2Vbe).(Vdd/κ)]/[(Vdd/κ-2Vbe)(Vdd)]
De façon similaire, le facteur de mise à l'échelle α est défini, de façon à prendre en compte la
chute de Vbe à l'entrée. Le courant dans les transistors MOS d'une porte BiCMOS se réduit
plus que celui d'une porte CMOS. Les transistors MOS fonctionnent plutôt dans la région
linéaire, α est le rapport entre les transconductances réduites idéale et réelle. Pour le
fonctionnement saturé de la vitesse, les transistors MOS fonctionnent dans la région saturée,
α est le rapport entre les courants réduits idéal et réel. , α est donné par l'équation suivante où
f=1 pour la transition "pull up" et f=0 pour la transition "pull down" :
α = [(Vdd/κ-Vth)(Vdd-Vth-f.Vbe)]/[(Vdd-Vth)(Vdd/κ-Vth-f.Vbe)]
Les facteurs α et γ sont toujours supérieur à 1. En appliquant les règles de Baccarani du
CMOS aux équations analytiques du temps de retard et en admettant que la performance de la
porte BiCMOS est au moins égale à celle de la CMOS, les règles de mise à l'échelle du
transistor bipolaire sont données par la table suivante (facteur d'échelle κ pour la tension et
λ pour les dimensions latérales, κ, γ, λ, α >1; colonne de gauche pour la saturation et celle de
droite pour l'ohmique) :
Paramètre physique Expression Facteur d'échelle
Dimensions latérales Le, We 1/λ
Surface émetteur Ae 1 / λ2
Gain en courant β α/γ
Temps transit de base τfo γ /2α κ/λ2α
Quand différentes règles d'échelle sont requises par les divers paramètres du dispositif, la
règle la plus stricte est adoptée. Le profil de la base est déterminé par le temps de transit. Ici la
loi quadratique est adoptée pour la relation entre τfo et Wb. Pour les trés faibles largeur de
base, on devra tenir compte de la charge dans la zone de dépletion, le simulateur de Tang
donne τfo ~ Wb1/2. Le profil dans le collecteur est essentiellement déterminé par la
résistance du collecteur et les paramètres de forte injection.
6-5) Discussion des règles :
On constate que les règles du BiCMOS sont concordantes avec celles de l'ECL;
toutefois lors d'une mise à l'échelle en tension (I-V quadratique), la concentration du dopage
du collecteur pour le BiCMOS en λ3 dégraderait les performances des circuits ECL utilisant
ces transistors. Même pour le cas plus réaliste de la saturation, où les règles de mise à l'échelle
sont similaires, il y a une différence significative concernant la valeur optimale de la
concentration du dopage du collecteur. La simulation donne les résultats suivants :
Le retard d'une porte ECL décroît lorsque le courant de polarisation croît, jusqu'à ce
qu'apparaisse les effets de la forte injection, après quoi le retard augmente rapidement. Pour
des dopages plus faibles, le retard minimum a lieu pour des courants plus faibles. De plus ce
minimum est plus faible pour les dopages plus faibles. Pour réduire la puissance dissipée, on
réduit le courant donc le dopage collecteur (< 2 e16cm3). Par contre pour les drivers BiCMOS
les concentrations fortes de dopage du collecteur (>5e 16cm3) améliorent les performances
de la porte surtout pour les charges capacitives importantes. Toutefois l'augmentation de la
concentration est nécessairement limitée par les effets de claquage.
EXERCICES DU CHAPITRE 4
1) Soit un interrupteur à transistor MOSN de tension de seuil 0,75v et dont la grille est
à 5v pour l'état fermé. On applique sur l'une des extrémités un signal carré TTL de fréquence
250 Mhz .Donner la forme du signal à la sortie.
+5v
+5v
0v IN OUT
2) Reprendre l'exercice avec un MOSP avec la même tension de seuil et dont la grille
est maintenue à 0v.
0v
+5v
0v IN OUT
3) Un bon interrupteur conservant bien le niveau 1 et le niveau 0 est constitué des deux
MOS précédents en parallèle comme le montre la figure ci-dessous:
CK
+4v
1v IN OUT
CK
On applique sur les grilles deux signaux carrés TTL complémentaires de période 6ns. A
l'entrée IN, on applique un signal carré variant entre 1v et 4v et de période égale à 3,5 ns.
Vpen
Idp Ic
Vout(t=0) = 0v
Vdd Idn
+ C
Vin L
0 -
Vnen +Vdd
a) Préciser la source et le drain de chacun des transistors, justifier.
b) Remplir à l'aide de croix le tableau ci-dessous en identifiant les 4 phases de la
charge de CL et justifier les gammes de tension Vout correspondantes,la phase 1 correspond à
Vout(t=0).
Etat du TMOS Idn1 Idp1 Idn2 Idp2 Idn3 Idp3 Idn4 Idp4
Bloqué
Saturé
Linéaire
2) Décharge de la capacité
Vpen
Idp Ic
Vout(t=0) = Vdd
Vdd Idn
C
Vin L
0
Vnen +Vdd
a) Préciser la source et le drain de chacun des transistors, justifier.
b) Remplir à l'aide de croix le tableau ci-dessous en identifiant les 4 phases de la
décharge de CL et justifier les gammes de tension Vout correspondantes,la phase 1
correspond à Vout(t=0).
Etat du TMOS Idn1 Idp1 Idn2 Idp2 Idn3 Idp3 Idn4 Idp4
Bloqué
Saturé
Linéaire
3) Lay out
4) Multiplexeur 2:1
6) Bascule D
EXERCICE 3 :
2) Les transistors NMOS en série dans la section logique de la porte CPL ci- dessus se
trouvent clairement sur le chemin critique. Ce chemin critique a été extrait dans la figure
montrée ci- dessous. On désire déterminer la taille de ces transistors de sorte que le retard soit
minimum. On suppose qu'un transistor NMOS de taille minimale possède une résistance de
conduction égale à R. En plus, les seules capacités parasites qu'on devra considérer sont Cgs =
Cgd = C (toujours pour un transistor de taille minimale). Finalement, on suppose que les trois
transistors ont la même taille.
Donner l'expression du temps de retard de propagation de ce chemin critique en fonction de
R, C, la charge CL et la surface du transistor S. Déterminer qualitativement comment on
devrait tailler les transistors pour minimiser le retard de propagation.
3) Trouver l'expression de l'énergie consommée par ce chemin critique durant une transition
(l'entrée passe de haut en bas) en fonction de R, C, S, CL, Vdd, et Vt. Déterminer
qualitativement comment tailler les transistors pour minimiser l'énergie consommée durant
une transition?
4) Déterminer la taille S minimisant le produit Energie- retard EDP (Energy Delay Product)
5) Donner le schéma d'un multiplexeur à 4 entrées (table de vérité ci- dessous) en logique à
base de transistors de transmission complémentaires avec le minimum de transistors.
5) Donner le schéma d'un multiplexeur à 16 entrées (table de vérité ci- dessous) en logique à
base du MUX 4/1 de la question précédente. Identifier le chemin critique
1) Inverseur Pseudo-nMOS
L’inverseur ci-dessous est constitué d’un driver nMOS et d’une charge pMOS polarisée par la
masse (longueur de canal et tension de seuil identiques). On suppose que Vinv =Vout= 0,5 Vdd, Vtn =
|VTP| = 0,2Vdd, Vdd = 5V
Vdd
Charge
Vout
Vin Driver
Donner la valeur du rapport du paramètre de transconductance KR = (WN)driver/(WP )charge
2) Mémoire ROM
Couche métal 3
C23
C22 C22
Couche métal 2
C21
Couche métal 1
Le lay out d'une cellule mémoire à base de transistor NMOS configuré en Nand est donné par
la figure suivante ; donner le schéma électrique de la mémoire ROM correspondante
2) Modèle de la ROM
L’inverseur ci-dessus est constitué d’un driver nMOS et d’une charge pMOS polarisée par la
masse (longueur de canal et tension de seuil identiques). On suppose que Vinv =Vout= 0,5 Vdd, Vtn =
|VTP| = 0,2Vdd, Vdd = 5V
b) Evaluer pour λ = 0,6 µ, les valeurs des résistances parasites (10 Ω /carré) et des capacités
parasites linéique et de grille dans une cellule mémoire pour une ligne mot puis pour une ligne
bit, sachant que nous disposons des mêmes données que pour l’exercice précédent.
EXERCICE 6 :
Le fil de bus long de polysilicium dans un process simple métal (ligne mot dans une mémoire)
se présente comme une ligne de retard formée par des cellules RC comme le montre la figure
ci-dessous :
C C C
Ce fil est formé par 2 segments de 1 mm séparés par un buffer de retard tbuf avec r= 20Ω/µm
et c= 4 10-4pF/µm
Le registre d’un chemin de donnée a une hauteur de 25 µm (dans le sens de la répétition). Une
ligne d’horloge métal2 connecte verticalement tous les registres pour en faire un registre à n
bits. Le registre a 30µm de métal1 de 1 µm, 20 µm de poly de 1 µm (au dessus du champ), et
16 µm d’une capacité grille de 1 µm.
2) Quel serait le retard RC pour le registre à partir d’un buffer d’horloge utilisant 5 mm d’un
métal2 de 1µm (0,05Ω/□)?
3) Quelle serait la largeur de la ligne d’horloge afin de garder le temps de skew en dessous de
0,5 ns si le fichier de registre est formé de 32 registres de 16 bits était alimenté avec le même
fil métal2 de 5 mm ?