Arquitetura de Computadores:: Uma Abordagem Quantitativa
Arquitetura de Computadores:: Uma Abordagem Quantitativa
Arquitetura de Computadores:: Uma Abordagem Quantitativa
C0065.indd i
11/10/13 1:28 PM
C0065.indd ii
11/10/13 1:28 PM
Arquitetura de Computadores:
Uma Abordagem Quantitativa
Quinta Edio
John L. Hennessy
Universidade de Stanford
David A. Patterson
Universidade da Califrnia, Berkeley
Com contribuies de
Krste Asanovic
Universidade da Califrnia, Berkeley
Jason D. Bakos
Universidade da Carolina do Sul
Robert P. Colwell
R&E Colwell & Assoc. Inc.
Norman P. Jouppi
HP Labs
Sheng Li
HP Labs
Naveen Muralimanohar
HP Labs
Gregory D. Peterson
Universidade do Tennessee
Thomas M. Conte
Universidade do Estado da Carolina do Norte
Timothy M. Pinkston
Universidade do Sul da Califrnia
Jos Duato
Universidade Politcnica de Valncia e Simula
Parthasarathy Ranganathan
HP Labs
Diana Franklin
Universidade da Califrnia, Santa Brbara
David A. Wood
Universidade do WisconsinMadison
David Goldberg
Instituto de Pesquisa Scripps
Amr Zaky
Universidade de Santa Clara
C0065.indd iii
11/10/13 1:28 PM
C0070.indd iv
CDD: 004.22
CDU: 004.2
11/10/13 1:35 PM
Sobre os Autores
C0065.indd v
11/10/13 1:28 PM
vi
Sobre os Autores
confiveis para muitas empresas. Ele tambm se envolveu no projeto Rede de Workstations (Network of Workstations NOW), que levou tecnologia de clusters usada
pelas empresas de Internet e, mais tarde, computao em nuvem. Esses projetos valeram
trs prmios de dissertao da ACM. Seus projetos de pesquisa atuais so o Laboratrio
Algoritmo-Mquina-Pessoas e o Laboratrio de Computao Paralela, onde ele o diretor.
O objetivo do Laboratrio AMP desenvolver algoritmos de aprendizado de mquina escalveis, modelos de programao amigveis para computadores em escala de depsito e
ferramentas de crowd-sourcing para obter rapidamente insights valiosos de muitos dados
na nuvem. O objetivo do laboratrio Par desenvolver tecnologias para entregar softwares
escalveis, portveis, eficientes e produtivos para dispositivos pessoais mveis paralelos.
C0065.indd vi
11/10/13 1:28 PM
C0075.indd vii
11/10/13 10:38 AM
C0075.indd viii
11/10/13 10:38 AM
C0060.indd ix
11/10/13 12:34 PM
entre SIMD de vetor, SIMD em nvel de instruo e GPU ultrapassam o jargo associado a
cada arquitetura e expem as similaridades e diferenas entre elas.
Kunle Olukotun, Universidade de Stanford
A 5a edio de Arquitetura de Computadores: Uma Abordagem Quantitativa explora
os diversos conceitos paralelos e seus respectivos trade-offs. Assim como as edies
anteriores, esta nova edio cobre as mais recentes tendncias tecnolgicas. Um destaque
o grande crescimento dos dispositivos pessoais mveis (Personal Mobile Devices PMD) e
da computao em escala de depsito (Warehouse-Scale Computing WSC), cujo foco
mudou para um equilbrio mais sofisticado entre desempenho e eficincia energtica em
comparao com o desempenho bruto. Essas tendncias esto alimentando nossa demanda
por mais capacidade de processamento, que, por sua vez, est nos levando mais longe no
caminho paralelo.
Andrew N. Sloss, Engenheiro consultor, ARM
Autor de ARM System Developer's Guide
C0060.indd x
11/10/13 12:34 PM
Agradecimentos
Embora este livro ainda esteja na quinta edio, criamos dez verses diferentes do
contedo: trs verses da primeira edio (alfa, beta e final) e duas verses da segunda,
da terceira e da quarta edies (beta e final). Nesse percurso, recebemos a ajuda de
centenas de revisores e usurios. Cada um deles ajudou a tornar este livro melhor. Por
isso, decidimos fazer uma lista de todas as pessoas que colaboraram em alguma verso
deste livro.
Revisores
Jason D. Bakos, University of South Carolina; Diana Franklin, The University of California,
Santa Barbara; Norman P. Jouppi, HP Labs; Gregory Peterson, University of Tennessee;
Parthasarathy Ranganathan, HP Labs; Mark Smotherman, Clemson University; Gurindar
Sohi, University of WisconsinMadison; Mateo Valero, Universidad Politcnica de Catalua; Sotirios G. Ziavras, New Jersey Institute of Technology.
Membros do Laboratrio Par e Laboratrio RAD da University of CaliforniaBerkeley, que
fizeram frequentes revises dos Captulos 1, 4 e 6, moldando a explicao sobre GPUs
e WSCs: Krste Asanovic, Michael Armbrust, Scott Beamer, Sarah Bird, Bryan Catanzaro,
Jike Chong, Henry Cook, Derrick Coetzee, Randy Katz, Yun-sup Lee, Leo Meyervich, Mark
Murphy, Zhangxi Tan, Vasily Volkov e Andrew Waterman.
Painel consultivo
Luiz Andr Barroso, Google Inc.; Robert P. Colwell, R&E Colwell & Assoc. Inc.; Krisztian
Flautner, VP de R&D na ARM Ltd.; Mary Jane Irwin, Penn State; David Kirk, NVIDIA; Grant
Martin, cientista-chefe, Tensilica; Gurindar Sohi, University of WisconsinMadison; Mateo
Valero, Universidad Politcnica de Catalua.
Apndices
Krste Asanovic, University of CaliforniaBerkeley (Apndice G); Thomas M. Conte, North
Carolina State University (Apndice E); Jos Duato, Universitat Politcnica de Valncia and
Simula (Apndice F); David Goldberg, Xerox PARC (Apndice J); Timothy M. Pinkston,
University of Southern California (Apndice F).
Jos Flich, da Universidad Politcnica de Valencia, deu contribuies significativas para a
atualizao do Apndice F.
xi
C0095.indd xi
11/10/13 11:39 AM
xii
Agradecimentos
Material adicional
John Nickolls, Steve Keckler e Michael Toksvig da NVIDIA (Captulo 4, NVIDIA GPUs);
Victor Lee, Intel (Captulo 4, comparao do Core i7 e GPU); John Shalf, LBNL (Captulo 4,
arquiteturas recentes de vetor); Sam Williams, LBNL (modelo roofline para computadores
no Captulo 4); Steve Blackburn, da Australian National University, e Kathryn McKinley,
da University of Texas, em Austin (Desempenho e medies de energia da Intel, no
Captulo 5); Luiz Barroso, Urs Hlzle, Jimmy Clidaris, Bob Felderman e Chris Johnson
do Google (Google WSC, no Captulo 6); James Hamilton, da Amazon Web Services (Distribuio de energia e modelo de custos, no Captulo 6).
Jason D. Bakos. da University of South Carolina, desenvolveu os novos slides de aula para
esta edio.
Mais uma vez, nosso agradecimento especial a Mark Smotherman, da Clemson University,
que fez a leitura tcnica final do nosso manuscrito. Mark encontrou diversos erros e
ambiguidades, e, em consequncia disso, o livro ficou muito mais limpo.
Este livro no poderia ter sido publicado sem uma editora, claro. Queremos agradecer
a toda a equipe da Morgan Kaufmann/Elsevier por seus esforos e suporte. Pelo trabalho
nesta edio, particularmente, queremos agradecer aos nossos editores Nate McFadden e
Todd Green, que coordenaram o painel consultivo, o desenvolvimento dos estudos de caso
e exerccios, os grupos de foco, as revises dos manuscritos e a atualizao dos apndices.
Tambm temos de agradecer nossa equipe na universidade, Margaret Rowland e Roxana
Infante, pelas inmeras correspondncias enviadas e pela guarda do forte em Stanford
e Berkeley enquanto trabalhvamos no livro.
Nosso agradecimento final vai para nossas esposas, pelo sofrimento causado pelas leituras,
trocas de ideias e escrita realizadas cada vez mais cedo todos os dias.
C0095.indd xii
11/10/13 11:39 AM
Agradecimentos
xiii
Cruz; Carl Feynman; David Filo; Josh Fisher, Hewlett-Packard Laboratories; Rob Fowler, DIKU;
Mark Franklin, Washington University (St. Louis); Kourosh Gharachorloo; Nikolas Gloy,
Harvard University; David Goldberg, Xerox Palo Alto Research Center; Antonio Gonzlez,
Intel and Universitat Politcnica de Catalunya; James Goodman, University of Wisconsin
Madison; Sudhanva Gurumurthi, University of Virginia; David Harris, Harvey Mudd College;
John Heinlein; Mark Heinrich, Stanford; Daniel Helman, University of California, Santa
Cruz; Mark D. Hill, University of WisconsinMadison; Martin Hopkins, IBM; Jerry Huck,
Hewlett-Packard Laboratories; Wen-mei Hwu, University of Illinois at UrbanaChampaign;
Mary Jane Irwin, Pennsylvania State University; Truman Joe; Norm Jouppi; David Kaeli,
Northeastern University; Roger Kieckhafer, University of Nebraska; Lev G. Kirischian, Ryerson
University; Earl Killian; Allan Knies, Purdue University; Don Knuth; Jeff Kuskin, Stanford;
James R. Larus, Microsoft Research; Corinna Lee, University of Toronto; Hank Levy; Kai Li,
Princeton University; Lori Liebrock, University of Alaska, Fairbanks; Mikko Lipasti, University
of WisconsinMadison; Gyula A. Mago, University of North Carolina, Chapel Hill; Bryan
Martin; Norman Matloff; David Meyer; William Michalson, Worcester Polytechnic Institute;
James Mooney; Trevor Mudge, University of Michigan; Ramadass Nagarajan, University
of Texas at Austin; David Nagle, Carnegie Mellon University; Todd Narter; Victor Nelson;
Vojin Oklobdzija, University of California, Berkeley; Kunle Olukotun, Stanford University;
Bob Owens, Pennsylvania State University; Greg Papadapoulous, Sun Microsystems; Joseph
Pfeiffer; Keshav Pingali, Cornell University; Timothy M. Pinkston, University of Southern
California; Bruno Preiss, University of Waterloo; Steven Przybylski; Jim Quinlan; Andras
Radics; Kishore Ramachandran, Georgia Institute of Technology; Joseph Rameh, University
of Texas, Austin; Anthony Reeves, Cornell University; Richard Reid, Michigan State University;
Steve Reinhardt, University of Michigan; David Rennels, University of California, Los Angeles;
Arnold L. Rosenberg, University of Massachusetts, Amherst; Kaushik Roy, Purdue University;
Emilio Salgueiro, Unysis; Karthikeyan Sankaralingam, University of Texas at Austin; Peter
Schnorf; Margo Seltzer; Behrooz Shirazi, Southern Methodist University; Daniel Siewiorek,
Carnegie Mellon University; J. P. Singh, Princeton; Ashok Singhal; Jim Smith, University
of WisconsinMadison; Mike Smith, Harvard University; Mark Smotherman, Clemson
University; Gurindar Sohi, University of WisconsinMadison; Arun Somani, University of
Washington; Gene Tagliarin, Clemson University; Shyamkumar Thoziyoor, University of
Notre Dame; Evan Tick, University of Oregon; Akhilesh Tyagi, University of North Carolina,
Chapel Hill; Dan Upton, University of Virginia; Mateo Valero, Universidad Politcnica de
Catalua, Barcelona; Anujan Varma, University of California, Santa Cruz; Thorsten von
Eicken, Cornell University; Hank Walker, Texas A&M; Roy Want, Xerox Palo Alto Research
Center; David Weaver, Sun Microsystems; Shlomo Weiss, Tel Aviv University; David Wells;
Mike Westall, Clemson University; Maurice Wilkes; Eric Williams; Thomas Willis, Purdue
University; Malcolm Wing; Larry Wittie, SUNY Stony Brook; Ellen Witte Zegura, Georgia
Institute of Technology; Sotirios G. Ziavras, New Jersey Institute of Technology.
Apndices
O apndice sobre vetores foi revisado por Krste Asanovic, do Massachusetts Institute
of Technology. O apndice sobre ponto flutuante foi escrito originalmente por David
Goldberg, da Xerox PARC.
Exerccios
George Adams, Purdue University; Todd M. Bezenek, University of WisconsinMadison
(em memria de sua av, Ethel Eshom); Susan Eggers; Anoop Gupta; David Hayes; Mark
Hill; Allan Knies; Ethan L. Miller, University of California, Santa Cruz; Parthasarathy
Ranganathan, Compaq Western Research Laboratory; Brandon Schwartz, University of
C0095.indd xiii
11/10/13 11:39 AM
xiv
Agradecimentos
WisconsinMadison; Michael Scott; Dan Siewiorek; Mike Smith; Mark Smotherman; Evan
Tick; Thomas Willis
Agradecimentos especiais
Duane Adams, Defense Advanced Research Projects Agency; Tom Adams; Sarita Adve,
University of Illinois, UrbanaChampaign; Anant Agarwal; Dave Albonesi, University
of Rochester; Mitch Alsup; Howard Alt; Dave Anderson; Peter Ashenden; David Bailey; Bill Bandy, Defense Advanced Research Projects Agency; Luiz Barroso, Compaq's
Western Research Lab; Andy Bechtolsheim; C. Gordon Bell; Fred Berkowitz; John Best, IBM;
Dileep Bhandarkar; Jeff Bier, BDTI; Mark Birman; David Black; David Boggs; Jim Brady;
Forrest Brewer; Aaron Brown, University of California, Berkeley; E. Bugnion, Compaq's
Western Research Lab; Alper Buyuktosunoglu, University of Rochester; Mark Callaghan;
Jason F. Cantin; Paul Carrick; Chen-Chung Chang; Lei Chen, University of Rochester; Pete
Chen; Nhan Chu; Doug Clark, Princeton University; Bob Cmelik; John Crawford; Zarka
Cvetanovic; Mike Dahlin, University of Texas, Austin; Merrick Darley; the staff of the
DEC Western Research Laboratory; John DeRosa; Lloyd Dickman; J. Ding; Susan Eggers,
University of Washington; Wael El-Essawy, University of Rochester; Patty Enriquez, Mills;
Milos Ercegovac; Robert Garner; K. Gharachorloo, Compaq's Western Research Lab; Garth
Gibson; Ronald Greenberg; Ben Hao; John Henning, Compaq; Mark Hill, University of
WisconsinMadison; Danny Hillis; David Hodges; Urs Hlzle, Google; David Hough; Ed
Hudson; Chris Hughes, University of Illinois em UrbanaChampaign; Mark Johnson;
Lewis Jordan; Norm Jouppi; William Kahan; Randy Katz; Ed Kelly; Richard Kessler; Les
Kohn; John Kowaleski, Compaq Computer Corp; Dan Lambright; Gary Lauterbach,
Sun Microsystems; Corinna Lee; Ruby Lee; Don Lewine; Chao-Huang Lin; Paul Losleben, Defense Advanced Research Projects Agency; Yung-Hsiang Lu; Bob Lucas, Defense
Advanced Research Projects Agency; Ken Lutz; Alan Mainwaring, Intel Berkeley Research
Labs; Al Marston; Rich Martin, Rutgers; John Mashey; Luke McDowell; Sebastian Mirolo,
Trimedia Corporation; Ravi Murthy; Biswadeep Nag; Lisa Noordergraaf, Sun Microsystems;
Bob Parker, Defense Advanced Research Projects Agency; Vern Paxson, Center for Internet
Research; Lawrence Prince; Steven Przybylski; Mark Pullen, Defense Advanced Research
Projects Agency; Chris Rowen; Margaret Rowland; Greg Semeraro, University of Rochester;
Bill Shannon; Behrooz Shirazi; Robert Shomler; Jim Slager; Mark Smotherman, Clemson
University; o SMT research group, University of Washington; Steve Squires, Defense
Advanced Research Projects Agency; Ajay Sreekanth; Darren Staples; Charles Stapper; Jorge
Stolfi; Peter Stoll; os estudantes de Stanford e de Berkeley, que deram suporte s nossas
primeiras tentativas de escrever este livro; Bob Supnik; Steve Swanson; Paul Taysom;
Shreekant Thakkar; Alexander Thomasian, New Jersey Institute of Technology; John Toole,
Defense Advanced Research Projects Agency; Kees A. Vissers, Trimedia Corporation; Willa
Walker; David Weaver; Ric Wheeler, EMC; Maurice Wilkes; Richard Zimmerman.
C0095.indd xiv
11/10/13 11:39 AM
Introduo
C0085.indd xv
xv
11/10/13 11:18 AM
xvi
Introduo
esse campo emergente. Os leitores vo apreciar o modo como essa rea evoluiu na ltima
dcada, comparando a arquitetura do cluster Google descrita na terceira edio com a
encanao mais moderna apresentada no Captulo 6 desta verso.
Aqueles que esto retomando este livro vo poder apreciar novamente o trabalho de dois
destacados cientistas da computao que, ao longo de suas carreiras, aperfeioaram a
arte de combinar o tratamento das ideias com princpios acadmicos com uma profunda
compreenso dos produtos e tecnologias de ponta dessa indstria. O sucesso dos autores
nas interaes com a indstria no ser uma surpresa para aqueles que testemunharam
como Dave conduz seus retiros bianuais de projeto, foruns meticulosamente elaborados
para extrair o mximo das colaboraes acadmico-industriais. Aqueles que se lembram
do sucesso do empreendimento de John com o MIPS ou esbarraram com ele em um
corredor no Google (o que s vezes acontece comigo) tambm no vo se surpreender.
E talvez o mais importante: leitores novos e antigos vo obter aquilo por que pagaram.
O que fez deste livro um clssico duradouro foi o fato de que cada edio no uma
atualizao, mas uma extensa reviso que apresenta as informaes mais atuais e insights
incomparveis sobre esse campo fascinante e rapidamente mutvel. Para mim, depois
de vinte anos nessa profisso, ele tambm outra oportunidade de experimentar aquela
admirao de estudante por dois professores notveis.
C0085.indd xvi
11/10/13 11:18 AM
Prefcio
Esta edio
Declaramos que a quarta edio de Arquitetura de Computadores: Uma Abordagem Quantitativa
podia ser a mais significativa desde a primeira edio, devido mudana para chips
multicore. O feedback que recebemos dessa vez foi de que o livro havia perdido o foco
agudo da primeira edio, cobrindo tudo igualmente, mas sem nfase nem contexto.
Estamos bastante certos de que no se dir isso da quinta edio.
Ns acreditamos que a maior parte da agitao est nos extremos do tamanho da computao, com os dispositivos pessoais mveis (Personal Mobile Devices PMDs), como
telefones celulares e tablets, como clientes e computadores em escala de depsito oferecendo computao na nuvem como servidores. (Bons observadores devem ter notado
a dica sobre computao em nuvem na capa do livro.) Estamos impressionados com o
tema comum desses dois extremos em custo, desempenho e eficincia energtica, apesar
de sua diferena em tamanho. Como resultado, o contexto contnuo em cada captulo
xvii
C0090.indd xvii
11/10/13 8:42 PM
xviii
Prefcio
C0090.indd xviii
11/10/13 8:42 PM
Prefcio
xix
C0090.indd xix
11/10/13 8:42 PM
xx
Prefcio
detalhes sobre projeto, custo e desempenho dos WSCs que poucos arquitetos conhecem.
Ele comea com o popular modelo de programao MapReduce antes de descrever a
arquitetura e implementao fsica dos WSCs, incluindo o custo. Os custos nos permitem
explicar a emergncia da computao em nuvem, porque pode ser mais barato usar WSCs
na nuvem do que em seu datacenter local. O exemplo PIAT uma descrio de um WSC
Google que inclui informaes publicadas pela primeira vez neste livro.
Isso nos leva aos Apndices A a L. O Apndice A aborda os princpios de ISAs, incluindo
MIPS64, e o Apndice K descreve as verses de 64 bits do Alpha, MIPS, PowerPC e SPARC,
alm de suas extenses de multimdia. Ele inclui tambm algumas arquiteturas clssicas
(80x86, VAX e IBM 360/370) e conjuntos de instrues embutidas populares (ARM,
Thumb, SuperH, MIPS16 e Mitsubishi M32R). O Apndice H est relacionado a esses
contedos, pois aborda arquiteturas e compiladores para ISAs VLIW.
Como j dissemos, os Apndices B e C so tutoriais sobre conceitos bsicos de pipelining
e caching. Os leitores relativamente iniciantes em caching devero ler o Apndice B antes
do Captulo 2, e os novos em pipelining devero ler o Apndice C antes do Captulo 3.
O Apndice D, Sistemas de Armazenamento, traz uma discusso maior sobre confiabilidade e disponibilidade, um tutorial sobre RAID com uma descrio dos esquemas RAID
6, e estatsticas de falha de sistemas reais raramente encontradas. Ele continua a fornecer
uma introduo teoria das filas e benchmarks de desempenho de E/S. Ns avaliamos o
custo, o desempenho e a confiabilidade de um cluster real: o Internet Archive. O exemplo
Juntando tudo o arquivador NetApp FAS6000.
O Apndice E, elaborado por Thomas M. Conte, consolida o material embutido em um s lugar.
O Apndice F, sobre redes de interconexo, foi revisado por Timothy M. Pinkston e Jos Duato. O
Apndice G, escrito originalmente por Krste Asanovic, inclui uma descrio dos processadores
vetoriais. Esses dois apndices so parte do melhor material que conhecemos sobre cada tpico.
O Apndice H descreve VLIW e EPIC, a arquitetura do Itanium.
O Apndice I descreve as aplicaes de processamento paralelo e protocolos de coerncia
para o multiprocessamento de memria compartilhada em grande escala. O Apndice J,
de David Goldberg, descreve a aritmtica de computador.
O Apndice L agrupa as Perspectivas histricas e referncias de cada captulo em um
nico apndice. Ele tenta dar o crdito apropriado s ideias presentes em cada captulo
e o contexto histrico de cada inveno. Gostamos de pensar nisso como a apresentao
do drama humano do projeto de computador. Ele tambm d referncias que o aluno
de arquitetura pode querer pesquisar. Se voc tiver tempo, recomendamos a leitura de
alguns dos trabalhos clssicos dessa rea, que so mencionados nessas sees. agradvel
e educativo ouvir as ideias diretamente de seus criadores. Perspectivas histricas foi uma
das sees mais populares das edies anteriores.
C0090.indd xx
11/10/13 8:42 PM
Prefcio
xxi
O Apndice E pode ser lido a qualquer momento, mas pode ser mais bem aproveitado se for
lido aps as sequncias de ISA e cache. O Apndice J pode ser lido sempre que a aritmtica
atra-lo. Voc deve ler a parte correspondente ao Apndice L depois de finalizar cada captulo.
Material complementar
Uma variedade de recursos est disponvel online em www.elsevier.com.br/hennessy,
incluindo:
C0090.indd xxi
11/10/13 8:42 PM
xxii
Prefcio
Novos materiais e links para outros recursos disponveis na Web sero adicionados
regularmente.
Comentrios finais
Mais uma vez, este livro resultado de uma verdadeira coautoria: cada um de ns escreveu
metade dos captulos e uma parte igual dos apndices. No podemos imaginar quanto
tempo teria sido gasto sem algum fazendo metade do trabalho, servindo de inspirao
quando a tarefa parecia sem soluo, proporcionando um insight-chave para explicar um
conceito difcil, fazendo crticas aos captulos nos fins de semana e se compadecendo
quando o peso de nossas outras obrigaes tornava difcil continuar escrevendo (essas
obrigaes aumentaram exponencialmente com o nmero de edies, como mostra o
minicurriculum de cada um). Assim, mais uma vez, compartilhamos igualmente a responsabilidade pelo que voc est para ler.
John Hennessy & David Patterson
C0090.indd xxii
11/10/13 8:42 PM
Sumrio
AGRADECIMENTOS ................................................................................................. xi
INTRODUO ..........................................................................................................xv
PREFCIO ...............................................................................................................xvii
Captulo 1
Captulo 2
Introduo ...............................................................................................1
Classes de computadores ......................................................................4
Definio da arquitetura do computador ..............................................9
Tendncias na tecnologia ....................................................................14
Tendncias na alimentao dos circuitos integrados........................19
Tendncias no custo .............................................................................24
Dependncia .........................................................................................30
Medio, relatrio e resumo do desempenho ....................................32
Princpios quantitativos do projeto de computadores .......................39
Juntando tudo: desempenho e preo-desempenho ..........................46
Falcias e armadilhas ...........................................................................48
Comentrios finais ................................................................................52
Perspectivas histricas e referncias ..................................................54
Estudos de caso e exerccios por Diana Franklin ..............................54
Captulo 3
C0080.indd xxiii
11/10/13 8:34 PM
xxiv
Sumrio
Captulo 4
Introduo ...........................................................................................227
Arquitetura vetorial ............................................................................229
Extenses de conjunto de instrues SIMD para multimdia .........246
Unidades de processamento grfico .................................................251
Detectando e melhorando o paralelismo em nvel de loop .............274
Questes cruzadas .............................................................................282
Juntando tudo: GPUs mveis versus GPUs servidor
Tesla versus Core i7............................................................................284
4.8 Falcias e armadilhas .........................................................................290
4.9 Consideraes finais...........................................................................291
4.10 Perspectivas histricas e referncias ................................................293
Estudo de caso e exerccios por Jason D. Bakos .............................293
Captulo 5
Captulo 6
C0080.indd xxiv
11/10/13 8:34 PM
Sumrio
xxv
Apndice B
Introduo...........................................................................................C-1
O principal obstculo do pipelining hazards do pipeline.........C-10
Como o pipelining implementado? ..............................................C-26
O que torna o pipelining difcil de implementar?..........................C-38
Estendendo o pipeline MIPS para lidar com operaes multiciclos...C-46
Juntando tudo: o pipeline MIPS R4000 ..........................................C-55
Questes cruzadas ...........................................................................C-62
Falcias e armadilhas ......................................................................C-71
Comentrios finais ...........................................................................C-72
Perspectivas histricas e referncias .............................................C-72
Exerccios atualizados por Diana Franklin.....................................C-73
C0080.indd xxv
11/10/13 8:34 PM
C0080.indd xxvi
11/10/13 8:34 PM