Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Optica-Moderna

Ó pt ica M ode r na Funda m e n ntt os e a plica ç õe s S é r gio C. Zilio Pref ácio Este é um texto destinado à introdução dos conceitos básicos da óptica moderna, elaborado para estudantes de física ou engenharia elétrica. Seu enfoque principal está voltado para a óptica física, onde fenômenos ondulatórios, tais como difração e interferência , são abordados. Entretanto, no Cap. 2 são introduzidos alguns tópicos de óptica geométrica, onde o caráter ondulatório da luz é ignorado. A apresentação destes conceitos é importante, pela analogia que historicamente foi realizada entre a equação de Schrödinger e a equação das ondas eletromagnéticas, via óptica geométrica. Na exposição do material admite-se que o aluno já tenha conhecimentos de eletromagnetismo e que possua algumas noções de física matemática. No final do Cap. 2, quando se faz a analogia entre a óptica geométrica e a mecânica clássica, são necessários conhecimentos relativos ao formalismo de Hamilton-Jacobi. Cada capítulo apresenta inicialmente os conceitos básicos, seguidos por uma lista de problemas propostos. No capítulo final são sugeridas demonstrações a serem realizadas pelo professor para a melhor fixação das idéias apresentadas. Tais demonstrações podem ser realizadas com um instrumental relativamente barato, acessível a qualquer instituição ministrando cursos ao nível de graduação. O texto começa fazendo uma introdução do desenvolvimento das idéias na área de óptica. Isto é interessante para se localizar os tópicos que veremos nos capítulos subseqüentes dentro de certo contexto histórico. Nos capítulo seguinte tratamos da propagação dos raios (óptica de raios), mas depois o texto detém-se no assunto central, a óptica ondulatória. Inicialmente discute-se no Cap. 3 a equação que descreve as ondas eletromagnéticas, suas soluções e propriedades. O Cap. 4 trata da fase do campo eletromagnético e alguns efeitos lidados a ela, porém sem exaurir o assunto. O conceito de fase será utilizado freqüentemente nos capítulos subseqüentes. No Cap. 5 daremos atenção à natureza vetorial do campo elétrico e introduziremos o conceito de polarização. Ênfase é dada à dedução das equações de Fresnel pela sua utilidade e importância histórica. Em seguida são apresentados vários dispositivos e técnicas que permitem alterar a polarização da luz e muitas vezes controlar sua intensidade. Estes efeitos são de grande importância em aplicações que envolvem o chaveamento da luz, como por exemplo, em comunicações ópticas. O fenômeno de interferência é abordado no Cap. 6. Nele são discutidos o princípio da superposição, e as interferências de dois feixes e múltiplos feixes. Interferômetros de grande aplicação prática, tais como o de Michelson, Mach-Zehnder e Fabry-Perot são discutidos em detalhes. Um outro assunto tratado, a teoria de películas, é de grande interesse prático, pois permite o cálculo do efeito de um conjunto de filmes finos dielétricos sobre o espectro de transmissão, ou reflexão, de espelhos multicamadas, filtros interferenciais e revestimentos anti-refletores. Para a observação de padrões de interferência, faz-se em geral necessário que haja coerência na luz utilizada. Este tópico é tratado no Cap. 7. O Cap. 8 refere-se ao fenômeno de difração. Inicialmente introduzimos a formulação matemática que resulta na fórmula de FresnelKirchhoff. Os casos de difração de Fraunhofer e Fresnel são discutidos e a aplicação em redes de difração é apresentada. Neste capítulo também procuramos tratar tópicos de interesse prático tais como, microscopia por contraste de fase e óptica difrativa (óptica de Fourier). Estes oito capítulos compõem o núcleo central de um curso de óptica básico, que deve ser conhecido por profissionais que trabalham nesta área. Nos capítulos finais procuramos complementar alguns conceitos já introduzidos e abordar tópicos mais específicos. Apresentamos no Cap. 9 um modelo clássico para a interação da radiação com a matéria, para em seguida discutir os princípios de funcionamento do laser. É apresentado o modelo semi-clássico da interação da radiação com a matéria (Cap. 10), discutimos cavidades ópticas (Cap. 11), ação laser (Cap. 12) e regimes de operação de um laser (Cap. 13). Finalmente, introduzimos alguns conceitos de óptica não linear (Cap. 14), óptica de cristais (Cap. 15) e guiamento de luz (Cap. 16). i Í ndice 1. Uma visão histórica 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Considerações preliminares....................................................................................1 Desenvolvimentos iniciais......................................................................................2 Óptica ondulatória versus corpuscular....................................................................4 Ressurgimento da teoria ondulatória.................................................................... ...6 Ondas eletromagnéticas e luz..................................................................................8 A relatividade restrita............................................................................ . ........... .....12 A óptica quântica................................................................................................. ..13 Bibliografia........................................................... ............................................... .14 2. Óptica de raios 2.1 Introdução..............................................................................................................15 2.2 Propagação de luz em meios homogêneos.............................................................16 2.3 Propagação de luz em meios não homogêneos......................................................17 2.4 A lei de Snell generalizada.....................................................................................19 2.5 O princípio de Fermat.......................................................................................... ...22 2.6 A equação dos raios...............................................................................................26 2.7 A função eikonal....................................................................................................29 2.8 Analogia entre a mecânica clássica e a óptica geométrica.....................................32 2.9 Obtenção da equação de Schrödinger....................................................................35 2.10 O potencial óptico................................................................................................38 Bibliografia....................................................................................................... ...41 Problemas............................................................................................................41 3. Ondas eletromagnéticas 3.1 Introdução ao conceito de ondas............................................................................43 3.2 Ondas eletromagnéticas..........................................................................................45 3.3 Ondas harmônicas unidimensionais.......................................................................47 3.4 Ondas planas e esféricas.........................................................................................50 ii 3.5 Ondas gaussianas................................................................................... .................54 3.6 Propagação do feixe gaussiano...............................................................................59 3.7 Formulação matricial da óptica geométrica...........................................................60 3.7 Vetor de Poynting. Intensidade..............................................................................62 Bibliografia........................................................................................... .................64 Problemas..............................................................................................................64 4. A fase da onda eletromagnética 4.1 Velocidades de fase e de grupo. Dispersão............................................................67 4.2 Efeito Doppler. Aplicações astronômicas..............................................................72 4.3 Alargamento de linhas espectrais...........................................................................74 4.4 Óptica relativística.................................................................................................75 4.5 Modulação eletro-óptica de freqüência..................................................................79 4.6 Auto-modulação de fase.........................................................................................82 Bibliografia...........................................................................................................84 Problemas..............................................................................................................84 5. Polarização das ondas eletromagnéticas 5.1 Polarização linear...................................................................................................87 5.2 Polarização elíptica................................................................................................88 5.3 Polarização circular................................................................................................91 5.4 Lâminas de quarto de onda e meia onda................................................................91 5.5 Obtenção de luz linearmente polarizada................................................................92 5.6 Equações de Fresnel...............................................................................................94 5.7 Polarização por reflexão total interna...................................................................103 5.8 Matrizes de Jones.................................................................................................105 5.9 Atividade óptica...................................................................................................109 5.10 Efeito Faraday....................................................................................................112 5.11 Isoladores ópticos...............................................................................................113 5.12 Efeito Pockels.....................................................................................................115 5.13 Efeitos Kerr e Cotton-Mouton............................................................. ..............116 5.14 Chaveamento eletro-óptico................................................................................117 Bibliografia.........................................................................................................118 Problemas............................................................................................................119 iii 6. Interferência 6.1 Princípio da superposição....................................................................................121 6.2 Interferência por divisão da frente de onda..........................................................124 6.3 Interferência por divisão de amplitudes...............................................................134 6.4 Interferômetro de Fabry -Pérot..............................................................................136 6.5 Analisador de espectro óptico..............................................................................139 6.6 Teoria de películas...............................................................................................140 Bibliografia.........................................................................................................144 Problemas...........................................................................................................145 7. Coerência 7.1 Introdução............................................................................................................147 7.2 Coerência temporal..............................................................................................149 7.3 Resolução espectral de um trem de ondas finito..................................................152 7.4 Coerência espacial................................................................................................155 7.5 Medidas de diâmetros de estrelas.........................................................................158 Bibliografia.........................................................................................................159 Problemas............................................................................................................160 8. Difração 8.1 Princípio de Huygens...........................................................................................161 8.2 Fórmula de Fresnel- Kirchhoff.............................................................................163 8.3 Princípio de Babinet.............................................................................................168 8.4 Difração de Fraunhofer .......................................................................................169 8.5 Difração por uma abertura circular......................................................................173 8.6 Rede de difração...................................................................................................175 8.7 Padrões de difração de Fresnel.............................................................................177 8.8 Óptica de Fourier .................................................................................................183 8.9 Microscopia por contraste de fase........................................................................187 8.10 Holografia .........................................................................................................189 Bibliografia.........................................................................................................191 Problemas............................................................................................................191 iv 9. Interação luz-matéria: tratamento clássico 9.1 Modelo do oscilador harmônico...........................................................................195 9.2 Dispersão cromática do índice de refração..........................................................197 9.3 Absorção............................................................................................................. 201 9.4 Espalhamento.......................................................................................................202 9.5 Forças radiativas sobre átomos neutros...............................................................204 Bibliografia.........................................................................................................207 Problemas............................................................................................................208 10. Interação luz-matéria: tratamento semi-clássico 10.1 Introdução..........................................................................................................209 10.2 Emissões espontânea e estimulada....................................................................211 10.3 A susceptibilidade atômica................................................................................215 10.4 Os coeficientes A e B de Einstein......................................................................218 10.5 O coeficiente de ganho.......................................................................................220 10.6 Alargamentos homogêneo e não homogêneo....................................................221 10.7 Saturação de ganho em meios com alargamentos homogêneo e não homogêneo ...........................................................................................................................222 10.8 Espectroscopia de saturação...............................................................................226 Bibliografia.........................................................................................................228 Problemas........................................................................................................... 228 11. Cavidades ópticas 11.1 Introdução..........................................................................................................231 11.2 Álgebra de cavidades ópticas.............................................................................232 11.3 Freqüências de ressonância........ ........................................................................237 11.4 Perdas em cavidades ópticas..............................................................................239 Bibliografia.........................................................................................................240 Problemas........................................................................................................... 241 12. Ação laser 12.1 Condição de limiar.............................................................................................243 12.2 Freqüências de oscilação....................................................................................244 12.3 Potência de saída do laser..................................................................................246 v 12.4 Considerações finais...........................................................................................250 Bibliografia.........................................................................................................252 Problemas........................................................................................................... 252 13. Regimes de operação de um laser 13.1 Introdução...... ....................................................................................................255 13.2 Regimes multimodos e monomodo....................................................................257 13.3 Regime de modos travados…............................................................................258 13.4 Obtenção do regime de modos travados…........................................................260 13.5 Q-switching.......................................................................................................263 Bibliografia.........................................................................................................268 Problemas........................................................................................................... 268 14. Óptica de cristais 14.1 Propagação de luz em meios anisotrópicos........................................................269 14.2 Elipsóide de índices............................................................................................270 14.3 Propagação de uma onda plana num meio anisotrópico....................................272 14.4 Superfície normal...............................................................................................275 Bibliografia.........................................................................................................280 Problemas............................................................................................................280 15. Guiamento da luz 15.1 Guias de ondas metálicos...................................................................................281 15.2 Guias de ondas dielétricos..................................................................................289 Bibliografia.........................................................................................................294 Problemas............................................................................................................294 16. Óptica não linear 16.1 Introdução..........................................................................................................295 16.2 Modelo do oscilador não harmônico..................................................................296 16.3 Aproximação da variação lenta da amplitude....................................................298 16.4 Geração de soma de freqüências........................................................................301 Bibliografia.........................................................................................................306 Problemas............................................................................................................306 vi 16. Demonstrações 16.1 Óptica geométrica..............................................................................................297 16.2 Ondas eletromagnéticas.....................................................................................302 16.3 Polarização das ondas eletromagnéticas............................................................306 16.4 Interferência.......................................................................................................313 Bibliografia.........................................................................................................323 1 Uma visão histórica Uma visão histórica 1 1.1 Considerações preliminares A área de óptica é um campo de estudos fascinante. De maneira simplificada, podemos dizer que ela é o ramo da Física que estuda a propagação da luz e sua interação com a matéria. Em muitas áreas da ciência e tecnologia, o entendimento de determinados conceitos pode ser difícil porque seus efeitos não são facilmente visualizados. Na óptica, entretanto, o simples uso de um laser permite a visualização de um dado efeito como função de vários parâmetros, facilitando o aprendizado. Isto se deve principalmente à coerência, monocromaticidade e colimação da luz proveniente deste instrumento, que permitem a observação de fenômenos tais como interferência e difração, nos quais a natureza ondulatória da luz se manifesta claramente. Entretanto, para se chegar ao desenvolvimento deste dispositivo, e de vários outros que são importantes no nosso cotidiano, um longo caminho foi percorrido e este percurso gerou um histórico bastante rico. Alguns aspectos que merecem destaque estão ligados às idéias sobre a natureza da luz e aos caminhos paralelos que a óptica e o eletromagnetismo trilharam durante séculos. Para se entender um pouco estes fatos, faremos, no transcorrer desta seção, uma breve revisão histórica do desenvolvimento dos conceitos principais ligados à óptica. Um outro fato importante para o qual deve-se chamar a atenção refere-se à analogia existente entre a óptica física e a mecânica quântica. No estado estacionário, ambas são descritas pela mesma equação de ondas e assim, vários fenômenos que se observa num laboratório de óptica podem ser usados para um melhor entendimento da mecânica quântica. Apenas como exemplo, o princípio da incerteza de Heisenberg pode ser S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 2 Uma visão histórica verificado num experimento de difração de luz por uma fenda, como veremos no Cap. 8. Similarmente, outros fenômenos nos quais a matéria comporta-se de forma ondulatória encontra seu análogo na óptica física. Desta forma, o aprendizado da mecânica quântica torna-se mais simples com o auxílio da óptica. 1.2 Desenvolvimentos iniciais Antes do século XVII existia pouco embasamento teórico para os fenômenos ópticos observados. Eram conhecidos alguns elementos tais como lentes e espelhos, mas a teoria descrevendo seu princípio de funcionamento não estava sedimentada. A primeira grande evolução da óptica ocorreu durante o século XVII, quando houve um desenvolvimento significativo da sua formulação matemática, possibilitando a explicação dos fenômenos observados até então. Nas duas primeiras décadas foram introduzidos os sistemas ópticos que combinam duas lentes. O primeiro deles, o telescópio refrativo, foi patenteado em 1608 por Hans Lippershey (1587-1619), um holandês fabricante de óculos. Seu dispositivo utilizava uma ocular côncava, conforme esquematizado na Fig. 1.1. Ouvindo falar desta invenção, Galileo Galilei (1564-1642) construiu seu próprio telescópio e em 1610 descobriu as luas de Júpiter, os anéis de Saturno e a rotação do Sol. Estas descobertas popularizaram este instrumento óptico e a configuração que utiliza a ocular côncava leva hoje o nome de telescópio Galileano. O telescópio com ocular convexa, também mostrado na Fig. 1.1, foi introduzido por Johannes Kepler (1571-1630), que o utilizou para fazer importantes observações astronômicas, que se tornaram conhecidas como as leis de Kepler. O telescópio Kepleriano tornou-se mais difundido por possibilitar maior tolerância na acomodação visual. telescópio Galileano (ocular côncava) telescópio Kepleriano (ocular convexa) Fig. 1.1 - Tipos de telescópios refrativos. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Uma visão histórica 3 O segundo tipo de sistema óptico que combina duas lentes é o microscópio. Ele foi inventado provavelmente pelo holandês Zacharias Janssen (1588-1632) por volta de 1609, na versão possuindo ocular côncava. É interessante notar que a invenção deste instrumento ocorreu praticamente ao mesmo tempo que a do telescópio. O microscópio com ocular convexa foi introduzido logo a seguir por Francisco Fontana (1580-1656). Além do desenvolvimento tecnológico destes instrumentos refrativos de duas lentes, começou-se neste período a elaboração da formulação matemática que permite o cálculo da propagação dos raios. Em seu livro Dioptrice, de 1611, Kepler apresenta a lei de refração para pequenos ângulos, estabelecendo que os ângulos de incidência e refração são proporcionais. Esta aproximação, chamada de paraxial, possibilitou o tratamento matemático de sistemas ópticos simples, compostos de lentes finas. Neste mesmo trabalho, ele introduz de forma pioneira o conceito de reflexão total interna. Apesar deste sucesso inicial, podemos dizer que a maior contribuição para o desenvolvimento da óptica nesta primeira metade do século XVII deveu-se a Willebrord Snell (1591-1626), que em 1621 introduziu a lei da refração (lei dos senos). O conhecimento desta lei deu origem à óptica aplicada moderna, permitindo o cálculo de sistemas ópticos mais complexos, não tratáveis pela aproximação paraxial introduzida por Kepler. A lei de Snell foi deduzida pela primeira vez em 1637, por René Descartes (1596-1650), que lançou mão de uma formulação matemática baseada em ondas de pressão num meio elástico. Aparentemente, esta foi a primeira vez em que a luz foi tratada como onda. Uma outra dedução interessante da lei de Snell foi realizada por Pierre de Fermat (1601-1665) em 1657, utilizando o princípio do tempo mínimo. Anteriormente a Fermat, Heron, de Alexandria, havia introduzido o princípio da menor distância, que previa que os raios andariam sempre em linha reta, que é a menor distância entre dois pontos. Com o princípio de Fermat, existe a possibilidade do raio executar uma trajetória curva se o meio não for homogêneo. Abordaremos este ponto com maiores detalhes no próximo capítulo, apresentando inclusive outras formulações matemáticas além daquela baseada no princípio de Fermat. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 4 Uma visão histórica 1.3 Óptica ondulatória versus corpuscular Na segunda metade do século XVII, descobertas interessantes foram realizadas e novos conceitos foram introduzidos. O fenômeno de difração foi descoberto por Francesco Maria Grimaldi (1618-1663), através da observação de bandas de luz na sombra de um bastão iluminado por uma pequena fonte. Em seguida, Robert Hooke (1635-1703) refez os experimentos de Grimaldi sobre difração e observou padrões coloridos de interferência em filmes finos. Ele concluiu, corretamente, que o fenômeno observado devia-se à interação entre a luz refletida nas duas superfícies do filme e propôs que a luz originava-se de um movimento ondulatório rápido no meio, propagando-se a uma velocidade muito grande. Surgiam assim as primeiras idéias da teoria ondulatória, ligadas às observações de difração e interferência que eram conhecidas no caso das ondas sobre uma superfície de águas calmas. Contribuições relevantes para a óptica foram feitas por Isaac Newton (1642-1727). Em 1665 ele realizou experimentos de dispersão num prisma, que o levou à conclusão da composição espectral da luz branca. Também introduziu a teoria corpuscular que afirmava que “a luz é composta de corpos muito pequenos, emitidos por substâncias brilhantes”. Esta sua afirmação foi provavelmente baseada no fato de que raios de luz se propagam em linhas retas num meio homogêneo e daí a analogia com o movimento retilíneo que uma partícula descreve quando não existe força agindo sobre ela. A teoria corpuscular explicava, por exemplo, a formação de sombras, de imagens geradas por uma lente, etc.. Nesta época Newton aceitava as duas teorias, tanto a corpuscular como a ondulatória. A dispersão de luz por um prisma era explicada por ele com sendo devida à excitação de ondas no meio, por corpúsculos de luz; cada cor correspondia a um modo normal de vibração, sendo que a sensação de vermelho correspondia às vibrações mais longas, enquanto que o violeta, às mais curtas. Com o passar do tempo, Newton inclinou-se para a teoria corpuscular, provavelmente devido à dificuldade de se explicar a propagação retilínea da luz através de ondas que se estendiam em todas as direções. Newton também introduziu o telescópio por reflexão em 1668, para contornar os problemas de aberração cromática existentes nos telescópios por refração. Ele acreditava que estas aberrações presentes nas lentes jamais poderiam ser evitadas, o que se provou não ser verdade com a introdução do dubleto acromático no século XVIII. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 5 Uma visão histórica Christiaan Huygens (1629-1695), contemporâneo de Newton, inclinava-se para a interpretação ondulatória da natureza da luz. Esta concepção explicava certos fenômenos, como por exemplo, a interferência e a difração dos raios de luz. Ele estendeu a teoria ondulatória com a introdução do conceito das ondas secundárias (princípio de Huygens), com as quais deduziu as leis da reflexão e refração. Fez ainda várias outras contribuições importantes, como por exemplo, estabelecendo que a velocidade de propagação da luz variava inversamente com uma propriedade do material, denominada índice de refração (v ∝ 1/n). A dupla refração da calcita também foi descoberta por ele. Independente da natureza corpuscular ou ondulatória da luz, um dado importante a ser obtido era sua velocidade de propagação. Muitos acreditavam que ela se propagava instantaneamente, com velocidade infinita. Porém, em 1676, Dane Ole Christensen Römer (1644-1710) sugeriu a medida da velocidade da luz pela verificação do intervalo entre eclipses da lua Io, de Júpiter, que se move praticamente no mesmo plano que este planeta se move em torno do Sol. A realização destas medidas, baseadas no princípio mostrado na Fig. 1.2, demonstrou que embora muito grande, a velocidade da luz é finita. Observando-se o diâmetro aparente de Júpiter, era possível saber como a distância deste à Terra, r(t), mudava com o tempo. Como o intervalo entre duas eclipses consecutivas variava com o tempo, associou-se esta variação à velocidade de propagação finita da luz, de acordo com Δτ = Δr/c, de onde se obteve c ≈ 2.3x108 m/s. Io r (t) Órbita de Júpiter Órbita da Terra Fig. 1.2 - Medida da velocidade da luz realizada por Römer. As linhas pontilhadas definem o ângulo de visão de Júpiter por um observador na Terra. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 6 Uma visão histórica Ao final do século XVII, ambas as teorias (corpuscular e ondulatória) eram aceitas. Durante o século XVIII acabou prevalecendo a teoria corpuscular, principalmente devido ao grande peso científico de Newton, que havia se inclinado na direção desta. Não houve grandes avanços da óptica naquele século, exceto pela construção do dubleto acromático em 1758, por John Dollond (1706-1761). 1.4 Ressurgimento da teoria ondulatória O início do século XIX presenciou o ressurgimento da teoria ondulatória. Entre 1801 e 1803, Thomas Young (1773-1829) propôs o princípio da superposição e com ele explicou o fenômeno de interferência em filmes finos. Devido ao peso científico de Newton e suas idéias sobre a teoria corpuscular, Young foi bastante criticado pela comunidade científica inglesa devido a estes trabalhos. Desconhecendo os avanços realizados por Young, já que a difusão de conhecimentos era lenta naquela época, Augustin Jean Fresnel (1788-1827) propôs, 13 anos mais tarde, uma formulação matemática dos princípios de Huygens e da interferência. Na sua concepção, a propagação de uma onda primária era vista como uma sucessão de ondas esféricas secundárias que interferiam para refazer a onda primária num instante subsequente. Esta proposição, chamada de princípio de Huygens-Fresnel, também recebeu muitas críticas da comunidade científica francesa, principalmente por parte de Laplace e Biot. Entretanto, do ponto de vista matemático, a teoria de Fresnel explicava uma série de fenômenos, tais como os padrões de difração produzidos por vários tipos de obstáculos e a propagação retilínea em meios isotrópicos, que era a principal objeção que Newton fazia à teoria ondulatória na época. Pouco tempo depois, Gustav Robert Kirchhoff (1824-1887) mostrou que o princípio de Huygens-Fresnel era conseqüência direta da equação de ondas e estabeleceu uma formulação rigorosa para o fenômeno de difração, como veremos no Cap. 8. Ao saber que a idéia original do princípio da superposição devia-se a Young, Fresnel ficou decepcionado, porém os dois acabaram tornando-se amigos e eventuais colaboradores. Fresnel também colaborou com Dominique François Jean Arago (1786-1853), principalmente em assuntos ligados à polarização da luz. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Uma visão histórica 7 Nos primórdios da teoria ondulatória, pensava-se que a luz era uma onda longitudinal, similar à uma onda sonora propagando-se num meio tênue, porém com alta constante elástica, chamado éter. Tal meio precisava ser suficientemente tênue para não perturbar o movimento dos corpos e a constante de mola deveria ser elevada para sustentar as oscilações de alta frequência da luz. Por outro lado, a dupla refração da calcita já havia sido observada por Huygens, que notou que a luz tem “dois lados opostos”, atribuídos à presença do meio cristalino. Posteriormente, Étienne Louis Malus (1775-1812) observou que os “dois lados opostos” também se manifestavam na reflexão e que não eram inerentes a um meio cristalino, mas sim, uma propriedade intrínseca da luz. Fresnel e Arago realizaram uma série de experimentos visando observar seu efeito no processo de interferência, mas os resultados não podiam ser explicados com o conceito de onda longitudinal aceito até então. Por vários anos, Fresnel, Arago e Young tentaram explicar os resultados observados, até que finalmente Young propôs que a luz era na verdade composta por ondas transversais (duas polarizações), como as que existem numa corda. A partir daí, Fresnel utilizou um modelo mecanicista de propagação de ondas transversais para deduzir suas famosas equações de reflexão e transmissão numa interface dielétrica, para as duas polarizações. Esta dedução está apresentada no Cap. 5. Em 1825, a teoria ondulatória já era bastante aceita enquanto que a teoria corpuscular tinha poucos defensores. Até meados do século, foram realizadas várias medidas terrestres da velocidade da luz. Em 1849, Armand Hippolyte Louis Fizeau (1819-1896) utilizou uma roda dentada rotatória (chopper) para gerar pulsos de luz e um espelho distante que refletia os raios de volta para a roda. Variando a velocidade angular desta, variava-se o período entre duas aberturas consecutivas e era possível fazer com que os pulsos passassem ou fossem bloqueados pela roda. A partir das equações do movimento retilíneo uniforme, Fizeau determinou a velocidade da luz como sendo 315.300 km/s. Outro conjunto de medidas visando a determinação da velocidade da luz foi realizado por Jean Bernard Léon Foucault (1819-1868), com a utilização de um espelho rotatório desenvolvido em 1834 por Charles Wheastone (da ponte de Wheastone) para a medida da duração de uma descarga elétrica. Arago havia proposto o uso deste dispositivo para a determinação da velocidade da luz em meios densos, mas não conseguiu realizar o experimento. Entretanto, Foucault logrou êxito nesta tarefa e em 1850 verificou que a S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 8 Uma visão histórica velocidade de propagação da luz na água era menor que no ar. Isto era contrário ao previsto pela teoria corpuscular de Newton e reforçou ainda mais a teoria ondulatória. 1.5 Ondas eletromagnéticas e luz Enquanto isso, a eletricidade e o magnetismo desenvolviam-se paralelamente à óptica. Em 1845 foi feita a primeira ligação entre o magnetismo e a luz por Michael Faraday (1791-1867). O efeito Faraday, que veremos com detalhes no Cap. 5, consiste na rotação da polarização da luz quando esta passa por certos tipos de materiais submetidos a campos magnéticos intensos. Entretanto, o relacionamento completo entre a óptica e o eletromagnetismo só foi estabelecido por James Clerk Maxwell (1831-1879). Inicialmente ele introduziu a corrente de deslocamento e re-escreveu, numa forma diferencial, as equações empíricas existentes na época. As expressões resultantes, hoje conhecidas como equações de Maxwell, foram combinadas e geraram uma equação de ondas para o campo eletromagnético, cuja velocidade de propagação dependia das grandezas μ0 e ε0 (c = 1 / ε 0 μ 0 ), que podiam ser determinadas com medidas de capacitância e indutância. Surpreendentemente, o valor obtido era numericamente igual à velocidade da luz, já bem determinada experimentalmente. Com isto concluiu-se que a luz era uma onda transversal, de natureza eletromagnética. Esta descoberta foi ratificada pelo trabalho de Heinrich Rudolf Hertz (18571894), que em 1888 produziu e detectou ondas longas através de uma antena. Nós hoje sabemos que a luz visível é uma forma de onda eletromagnética, mas com comprimento de onda restrito ao intervalo que vai de 4 x 10-5 cm a 7.2 x 10-5 cm, como mostra a Fig. 1.3. A intuição na época é que para uma onda se propagar era necessária a existência de algum meio que a suportasse, no caso, o éter. Assim, grande parte dos esforços subsequentes foram na direção de se determinar a natureza física e as propriedades do éter. Uma das questões relevantes na época era se o éter estava ou não em repouso. A origem desta questão estava ligada à observação da aberração estelar, realizada em 1725 por James Bradley (1693-1762). Neste fenômeno, ocorre um desvio da luz das estrelas devido ao movimento de translação da Terra em torno do Sol. Ele podia ser explicado facilmente pela teoria corpuscular; S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 9 Uma visão histórica neste caso, seria equivalente à inclinação da trajetória de gotas de chuva que um observador localizado num trem em movimento observa, mesmo que elas estejam caindo na vertical para um observador em repouso. Podia também ser explicado pela teoria ondulatória, desde que se considerasse o éter em repouso e a Terra passando sem perturbações por ele. Com esta motivação, iniciou-se uma série de estudos para a determinação do estado de movimento do éter. λ (Å) 107 Microondas e ondas de rádio 106 105 104 103 Infravermelho Visível Ultravioleta 2 10 101 Raios X 100 Raios γ 10-1 Fig.1.3 - O espectro eletromagnético (1 Å = 10-8 cm). Arago realizou experimentos mostrando que fontes de luz terrestres e extra-terrestres tinham o mesmo comportamento, como se a Terra estivesse em repouso com relação ao éter. Para explicar estes resultados, Fresnel sugeriu que a luz era parcialmente arrastada pelo éter, conforme a Terra passasse por ele. Esta hipótese de arrastamento de Fresnel era aparentemente confirmada por experimentos feitos por Fizeau, com a passagem de luz por colunas cheias de água em movimento e por George Biddell Airy (1801-1892), que em 1871 usou um telescópio cheio de água para observar a aberração estelar. Supondo que o éter estava em repouso absoluto, Hendrik Antoon Lorentz (1853-1928) desenvolveu uma teoria englobando as idéias de Fresnel, e que resultou nas conhecidas fórmulas de Lorentz. Maxwell sugeriu em 1879, ano de sua morte, um esquema para se determinar a velocidade com que o sistema solar se movia com relação ao S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 10 Uma visão histórica éter. O físico americano Albert Abraham Michelson (1852-1931), na época com 26 anos, decidiu realizar o experimento proposto por Maxwell e esquematizado na Fig. 1.4. A montagem experimental faz uso de um interferômetro de dois feixes, hoje conhecido como interferômetro de Michelson, que será discutido no Cap. 6. A luz proveniente de uma fonte é dividida por um espelho semi-transparente (divisor de feixes), é refletida por dois espelhos e retorna ao divisor de feixes. Parte da luz chega ao observador e parte retorna à fonte (Fig. 1.4 (a)). Se a Terra estiver andando para a direita com velocidade v e o éter estacionário, os feixes horizontal e vertical levarão tempos diferentes para chegar ao observador. De acordo com a Fig. 1.4 (b), estes tempos são: t = h d + d = 2cd c − v c + v c2− v2 (1.1) onde c é a velocidade da luz e d é a distância do divisor de feixes ao espelho. O primeiro termo representa o tempo que a luz demora a ir do divisor de feixes até o espelho da direita e o segundo é o tempo de volta. Para o feixe vertical temos: tv = v 2 t 2v 2 d2 + c 4 (1.2) de onde se obtém t = 2d / c 2 − v 2 , de forma que a diferença de tempos v entre os dois caminhos é dada por: ⎛ ⎜ c 1 Δ t = t h − t v = 2d ⎜ − ⎜ c 2 −v 2 c 2 −v 2 ⎝ ⎞ ⎟ dv 2 ⎟≈ 3 ⎟ c ⎠ (1.3) que corresponde a uma diferença de fase: Δφ = ωΔ t = 2πc 2πd ⎛ v ⎞ 2 Δt ≈ ⎜ ⎟ λ ⎝c⎠ λ (1.4) onde λ é o comprimento de onda da luz. Como as velocidades da luz e da Terra eram conhecidas, esperava-se medir uma variação de pelos menos 1/3 de franja de interferência quando o interferômetro fosse rodado 900 com relação à geometria da Fig. 1.4. Entretanto não foi observada S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 11 Uma visão histórica nenhuma variação e em 1881 Michelson publicou os resultados provando que a Terra estava em repouso com relação ao éter. Estes experimentos foram refeitos com maior precisão em 1887, com a participação de Edward Williams Morley (1838-1923), e novamente obteve-se um resultado nulo. Fitzgerald e Lorentz tentaram explicar o resultado nulo do experimento de Michelson e Morley admitindo que um corpo se contrai na direção de seu movimento através do éter, na razão 1− v 2 /c 2 . Este encurtamento, conhecido como contração de Fitzgerald–Lorentz, igualaria os dois caminhos ópticos de tal maneira que não haveria qualquer deslocamento de franja. Entretanto, esta explicação ad hoc não era muito satisfatória, pois esta contração não era passível de medição, já que qualquer aparelho se contrairia junto com o objeto a ser medido. espelho espelho fonte (a) observador espelho espelho fonte (b) observador v Fig. 1.4 - Diagrama simplificado do experimento de Michelson-Morley: (a) interferômetro e (b) caminhos ópticos. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 12 Uma visão histórica 1.6 A relatividade restrita A observação da aberração estelar não poderia ser explicada pela postulação de um éter em repouso com relação à Terra. Os resultados obtidos por Michelson e Morley eram contrários a esta possibilidade e a explicação de Fitzgerald–Lorentz não era convincente. Poder-se-ia admitir o caráter corpuscular da luz e o efeito da aberração estaria explicado. Entretanto, a teoria ondulatória já estava bem estabelecida e praticamente não foi questionada. Como explicar então o fenômeno da aberração estelar? Já em 1900, Jules Henri Poincaré (1854-1912), baseado no experimento de Michelson e Morley questionava a necessidade da existência do éter. Porém, apenas em 1905, quando Albert Einstein (18791955) introduziu a teoria da relatividade restrita, foi possível a explicação da aberração estelar sem a necessidade de se postular a existência do éter. Como veremos no Cap. 6, com dois postulados simples, as transformações de Lorentz, e o uso do produto escalar de quadrivetores, é fácil obter-se os efeitos Doppler longitudinal e transversal, bem como explicar os fenômeno de aberração estelar e da velocidade de arraste de Fizeau. Com isto chega-se à conclusão que a onda eletromagnética existe por si só, sem a necessidade de um meio para se propagar. Em 1905, Einstein também realizou seu famoso trabalho sobre o efeito fotoelétrico, que lhe rendeu o prêmio Nobel de 1921. O desenvolvimento da relatividade restrita havia dispensado a necessidade do éter e favorecia o conceito ondulatório da luz. Paradoxalmente, no efeito fotoelétrico admitia-se a natureza corpuscular da luz, a mesma defendida por Newton. Atualmente, entende-se que a luz tem uma natureza dual porque, devido aos trabalhos de quantização do campo de radiação eletromagnética, mencionados na próxima seção, concluiu-se que as ondas eletromagnéticas são constituídas por partículas relativísticas, chamadas de fótons. Portanto, certos fenômenos, como interferência, podem ser descritos considerando-se o caráter ondulatório e outros fenômenos, como o efeito fotoelétrico, considerando-se o caráter de partícula. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Uma visão histórica 13 1.7 A óptica quântica Em 1900, Max Karl Ernst Ludwig Planck (1858-1947) introduz o conceito de quanta para a explicação do espectro da radiação emitida por corpos aquecidos a uma dada temperatura T, como por exemplo, fornos de fundição. Surgiu então a idéia de que a radiação era absorvida pelos átomos da cavidade de forma discreta, o que deu origem à mecânica quântica. Foi introduzida a constante de Planck e a energia absorvida por átomos com frequência de ressonância ν como Eν = hν. Embora Planck tivesse quantizado os átomos da cavidade, foi Einstein, que com a explicação do efeito fotoelétrico, quantizou a onda eletromagnética associando a ela uma partícula, que posteriormente foi denominada fóton. Com as idéias introduzidas por Niels Bohr e pelos cientistas da escola de Copenhagen, a mecânica quântica foi desenvolvida na sua quase totalidade até 1927. O trabalho de Schrödinger, que introduziu a função de onda na descrição de um sistema quântico, está fortemente baseada na analogia que existe entre a óptica geométrica e a mecânica clássica, que será revisada no próximo capítulo. Portanto, como já mencionamos, o entendimento dos fenômenos que ocorrem na óptica ondulatória auxilia bastante o aprendizado da mecânica quântica. De acordo com o que foi explanado acima, podemos dividir o estudo da óptica em três partes: a) óptica geométrica - trata-se a luz como raios que se propagam em linha reta nos meios homogêneos, de acordo com a descrição de Newton. Este tópico não será tratado neste texto, mas o leitor poderá encontrar material a este respeito na Ref. 1.3. b) óptica física - leva em conta a natureza ondulatória das ondas eletromagnéticas e como conseqüência, temos a aparição de fenômenos tais como interferência e difração. Esta parte da óptica está relacionada com o entendimento que Huygens tinha a respeito da natureza da luz, e será apresentada nos capítulos de 3 a 8. c) óptica quântica - nesta parte quantiza-se o campo eletromagnético, aparecendo assim o fóton. Com esta teoria podemos tratar da interação entre fótons e átomos e explicar detalhadamente o funcionamento do laser. Neste curso estaremos interessados principalmente em óptica física, embora façamos uma breve revisão de óptica geométrica. Veremos, no Cap. 3, a origem da equação de ondas e sua solução para em seguida S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 14 Uma visão histórica abordarmos problemas ligados à polarização das ondas eletromagnéticas, tais como a geração de uma dada polarização e seu uso. Descrevemos vários dispositivos que geram ou alteram uma dada polarização. No capítulo subseqüente, analisaremos o fenômeno de interferência, discutindo vários tipos de interferômetros e suas aplicações. No Cap. 7, veremos um tópico importante para a obtenção de interferência, que é a coerência da fonte de luz utilizada. Também estudaremos a difração de luz e suas aplicações práticas, dentre as quais se destaca a rede de difração. Este curso certamente será mais bem aproveitado se for acompanhado com demonstrações dos vários tópicos abordados. Levando este fato em conta, incluímos no capítulo final, práticas demonstrativas que ilustram e complementam os assuntos apresentados. Bibliografia 1.1 E. Hecht, Optics, Addison-Wesley Publishing Company, 2a edição, 1987. 1.2 G. R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, Inc, 1968. 1.3 S. C. Zilio, Desenho e Fabricação Óptica, veja e-book no site: http://www.fotonica.if.sc.usp.br/ebook/e-book2.php S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 15 Óptica de raios 2 2.1 Introdução Ao tratarmos o tópico óptica de raios, também conhecido como óptica geométrica, não levamos em consideração o caráter ondulatório da luz, nem sua polarização. Nestas condições, efeitos tais como difração e interferência não se evidenciam. Como veremos adiante, isto corresponde ao caso em que o comprimento de onda tende a zero (λ→0), que é análogo ao limite clássico que se obtém da mecânica quântica ao tomarmos h→0 . Este raciocínio foi utilizado por Schrödinger na obtenção da sua famosa equação, como mostraremos no final do capítulo. Entende-se como meio homogêneo aquele no qual o índice de refração não depende da posição, sendo, portanto constante. Note que o meio pode ser simultaneamente homogêneo e anisotrópico, caso comum em cristais, para os quais o índice de refração tem valores diferenciados para distintas direções de propagação da luz. Já no meio não homogêneo, o índice de refração é dependente da posição, em geral devido às flutuações de densidade, temperatura ou composição química do material. Este capítulo inicia-se com uma breve exposição das propriedades de propagação de raios em meios homogêneos, com ênfase na sua refração ao atingir uma interface dielétrica plana. Este é um tópico que será revisto no Cap. 5, depois que abordarmos os conceitos de polarização da luz e condições de contorno do campo eletromagnético, necessárias à dedução das equações de Fresnel. Em seguida, trataremos de uma situação bem mais interessante, a propagação de luz em meios não homogêneos. Mostraremos que os raios de luz podem descrever uma trajetória curva, diferentemente dos meios homogêneos, nos quais a propagação é retilínea. Serão apresentados quatro tratamentos teóricos para este tipo de problema. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 16 Em particular, faremos, no final do capítulo, uma analogia entre a mecânica clássica e a óptica geométrica. Esta analogia será importante para a obtenção da equação de Schrödinger. 2.2 Propagação de luz em meios homogêneos Os trabalhos realizados até a primeira metade do século XVII estabeleceram que um raio de luz que se propaga obedece aos seguintes princípios: a) nos meios homogêneos a propagação é retilínea e b) quando um raio (raio 1) atinge a interface que separa dois meios distintos temos uma fração refletida (raio 2) e outra refratada (raio 3), conforme mostra a Fig. 2.1. n 2 φφ’’ φ n’ 3 φ” normal 1 Fig. 2.1 - Reflexão e refração de um raio luminoso numa interface dielétrica. Como discutido por Huygens, cada meio é caracterizado por um parâmetro chamado índice de refração, n, que determina a velocidade com que o raio se propaga naquele meio. A direção seguida pelos raios 2 e 3 não é arbitrária. Demonstraremos na seção 5.6, usando as condições de contorno para o campo eletromagnético, que eles obedecem as seguintes regras: (i) os raios 1, 2 e 3 estão todos num mesmo plano, chamado de plano de incidência, (ii) φ = φ’ e (iii) n sen φ = n’sen φ” (lei de Snell). Estas leis são muito importantes para o traçado dos raios ópticos na presença de interfaces dielétricas. Note que pela expressão (iii), quando um raio penetra num meio de índice de refração maior ele se aproxima da normal. Pela interpretação corpuscular de Newton isto só seria possível se a componente de velocidade do raio paralela à normal aumentasse. Mas isto é contrário à descoberta experimental de Foucault, que constatou que S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 17 um raio de luz diminui sua velocidade ao adentrar um meio de maior índice de refração, como apresentamos na seção 1.4. Em seguida trataremos o caso da propagação de luz em meios não homogêneos, para o qual obviamente um meio homogêneo é um caso particular. Através do princípio do tempo mínimo, ou princípio de Fermat, vamos deduzir a lei dos senos. Apresentaremos ainda quatro abordagens teóricas diferentes, que serão aplicadas a algumas situações específicas, em particular ao caso em que o índice de refração depende de apenas uma coordenada. 2.3 Propagação de luz em meios não homogêneos A motivação para o estudo da propagação de raios em meios não homogêneos encontra-se nas diversas aplicações práticas e situações que ocorrem no nosso cotidiano. Dentre os vários exemplos que podem ser citados, destacamos os seguintes: (i) turbulências atmosféricas – ao olharmos para as estrelas numa noite de céu claro, notamos que elas tremem ou piscam. Isto se deve às turbulências atmosféricas, tais como flutuações de pressão e densidade, que levam à formação de correntes de vento e variações do índice de refração do ar. Como conseqüência, o caminho percorrido pelo raio de luz não é estável, levando a dificuldades para as observações astronômicas de corpos celestes distantes, que obrigam o uso de satélites, como por exemplo, o Hubble, ou o emprego de óptica adaptativa. Na óptica adaptativa emprega-se um laser de corante para excitar átomos de sódio existentes na camada superior da atmosfera. Isto gera uma mancha circular brilhante devido à luminescência do sódio, que devido às flutuações atmosféricas é vista de uma forma distorcida pelo telescópio. Um sistema servo-mecânico corrige então a curvatura de um dos espelhos do telescópio, de maneira a eliminar estas distorções. O tempo de resposta deste sistema de correção é da ordem de 0.1 s. (ii) efeito miragem – o aquecimento do ar próximo à superfície da Terra modifica seu índice de refração e isto faz com que a luz execute uma trajetória não retilínea. Este efeito é claramente observado nas transmissões de corridas de carros pela TV. O ar, aquecido pelo contato S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 18 Óptica de raios com o asfalto, realiza um movimento convectivo ascendente fazendo tremer as imagens dos carros, como se houvesse uma tênue fumaça diante deles. O efeito do desvio da luz é ainda mais evidente para os raios rasantes, como quando viajamos de carro e observamos a imagem do céu e nuvens refletidas no asfalto, dando a impressão de poças d’água. Nesta situação, os raios rasantes são desviados pelo ar aquecido localizado próximo ao asfalto e atingem o olho do observador. Este efeito, conhecido como miragem, é comum em desertos, mas também pode ocorrer no mar, só que neste caso, a água resfria o ar e a imagem é invertida. (iii) comunicações ópticas – na transmissão de informações com luz, o meio no qual o raio se propaga desempenha um papel importante. Na transmissão de microondas por visada direta, onde o sinal gerado por uma antena parabólica é captado por outra, flutuações na atmosfera produzem ruído no sinal transmitido, devido à instabilidade na trajetória dos raios, que por vezes não atingem perfeitamente a antena receptora. Nas comunicações por fibra óptica, a luz gerada por um laser semicondutor fica confinada principalmente no núcleo, que possui índice de refração maior que a casca. Assim, a variação do índice de refração novamente modifica a propagação dos raios. A própria focalização de luz em fibras ópticas é muitas vezes realizada por uma lente do tipo GRIN (gradient index), cujo índice de refração diminui radialmente, de forma contínua. A propagação de luz nestes meios do tipo lente será discutida após introduzirmos as ferramentas matemáticas necessárias. (iv) efeitos auto-induzidos – ocorrem quando um feixe de luz laser percorre um meio do tipo Kerr, cujo índice de refração depende da intensidade de acordo com: n(I) = n0 + n2I, onde n0 é o índice de refração para baixas intensidades e n2 é chamado de índice de refração não linear. O feixe de luz laser possui em geral um perfil transversal de intensidade do tipo gaussiano, que modifica o índice de refração na direção radial, produzindo o efeito de uma lente. A origem de n2 pode ter natureza térmica ou eletrônica, e sua determinação constitui um assunto de pesquisa atual. Em comunicações por fibras ópticas, a presença deste tipo de efeito pode compensar a dispersão da velocidade de grupo e dar origem a sólitons. Trataremos deste assunto brevemente no Cap. 4. Além dos exemplos citados acima, o estudo da propagação de luz em meios não homogêneos é importante do ponto de vista histórico, pois permite entender como a mecânica ondulatória foi introduzida por Schrödinger. Mesmo assim, o material relativo a este tópico está disperso S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 19 em vários livros e artigos, e sua compilação justifica a existência do presente texto. Do ponto de vista teórico, a propagação de luz em meios não homogêneos pode ser tratada de quatro maneiras distintas, que cronologicamente seguem a seguinte ordem: a) lei de Snell generalizada, b) princípio de Fermat, c) equação do eikonal e d) limite clássico da equação de Schrödinger. No restante do capítulo, desenvolveremos estas análises teóricas, com a aplicação a alguns casos particulares. 2.4 A lei de Snell generalizada Como se tornará evidente mais adiante, este tipo de abordagem se aplica ao caso unidimensional, ou seja, quando o índice de refração varia em apenas uma direção. Como exemplo desta situação, tomemos uma mistura não homogênea de água (n=1.333) e álcool (n=1.361), que apresenta uma variação de índice de refração como indicada na Fig. 2.2. Vamos ainda supor que o raio de luz penetra nesta mistura a uma altura y0, localizada na região de transição água-álcool, propagando-se ao longo do eixo z. Esta situação está esquematizada na Fig. 2.3. Como a variação de n é pequena e ocorre numa região relativamente grande (da ordem de um centímetro), admitiremos que o desvio sofrido pelo feixe é pequeno. Assim, o raio deslocar-se-á pouco da altura y0 e o índice de refração pode ser expandido em série de Taylor, de acordo com: n ( y) = n 0 + n(y) dn dy água (y − y0 ) (2.1) y0 álcool nal n0 nag y0 y Fig. 2.2 - Variação do índice de refração numa mistura não homogênea de água e álcool (nág=1.333 e nal=1.361). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 20 y índice maior θi i+1 θi-1 y0 índice menor i i-1 z Fig. 2.3 - Desvio de um raio de luz que incide na mistura água-álcool a uma altura y0. A magnitude do desvio foi exagerada para melhor visualização. onde n0 e dn/dy]y0 são respectivamente o índice de refração e seu gradiente na altura y0. A seguir, vamos utilizar a lei de Snell, que já era conhecida experimentalmente em 1621. Para isto, vamos imaginar a região de transição água-álcool dividida num grande número de lâminas planas e paralelas, de espessuras tão finas quanto se queira, de forma que em cada uma delas o índice de refração pode ser considerado constante. As lâminas são paralelas ao eixo z e, portanto perpendiculares à direção em que n varia. O paralelismo entre as faces de cada lâmina é motivado pelo fato de n variar apenas ao longo de y. Podemos aplicar a lei de Snell na interface que separa duas lâminas consecutivas i e i-1: ni-1 sen θi-1= ni senθi, onde θi é o ângulo que o raio faz com o eixo y. Como o índice de refração é constante em cada uma das lâminas, o raio se propaga em linha reta até a próxima interface, onde chega com o ângulo de incidência θi. Novamente aplicamos a lei de Snell: ni senθi = ni+1 sen θi+1. Desta forma, o produto nsenθ mantém-se constante conforme o raio se propaga pelas diferentes lâminas. Tomando o limite em que as espessuras das lâminas tendem a zero, obtemos a lei de Snell generalizada: n ( y) sen θ( y) = constante (2.2) que estabelece que o ângulo θ varia continuamente com y, conforme n varia. Podemos ainda trabalhar com o ângulo β(y) que o raio faz com as S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 21 faces das lâminas. Levando em conta que β é o ângulo complementar de θ e que o raio inicialmente propaga-se ao longo do eixo z (β(y0) = 0), a lei de Snell generalizada fica: (2.3) n ( y) cos β( y) = n 0 O raio descreve uma trajetória curva dada por y = y(z), cuja inclinação é: 1 − cos 2 β dy sen β = tgβ = = dz cos β cos β (2.4) Usando as expressões de cosβ e n(y) dadas pelas equações (2.3) e (2.1), temos: dy = dz n2 −1 = n 02 2 dn n 0 dy (y − y 0 ) (2.5) y0 onde o termo quadrático em dn/dy foi desprezado. A eq. (2.5) pode ser facilmente integrada resultando em: y = y0 + 1 dn 2n 0 dy z2 (2.6) y0 que representa a trajetória parabólica do raio dentro do meio. É possível se fazer uma demonstração na qual se mede o desvio de um raio de luz laser ao percorrer certa distância dentro do meio. Isto possibilita a medida do gradiente do índice de refração como função da altura y. Devido ao fato deste gradiente não ser constante, observamos a focalização (ou desfocalização) da luz do laser, como descrito a seguir. Consideremos um feixe de luz laser com diâmetro Δy, de tal forma que a parte inferior do raio penetra no meio a uma altura y0 e a parte superior em y0 +Δy. Vamos ainda considerar Δy suficientemente pequeno tal que o índice de refração seja aproximadamente o mesmo (n0) ao longo de todo o perfil transversal do feixe. A uma distância z no interior do meio, a parte inferior do feixe satisfará a eq. (2.6), enquanto que a parte superior executará uma trajetória descrita por: y' = (y 0 + Δy ) + S. C. Zilio 1 dn 2n 0 dy y 0 + Δy z2 (2.7) Óptica Moderna – Fundamentos e Aplicações Óptica de raios 22 e assim, o diâmetro do feixe, Φ = y’-y, como função da distância de propagação, fica: 2 ⎧ ⎫ ⎧ ⎫ Φ = Δy + 1 ⎨ dn − dn ⎬ z 2 = Δy ⎨1 + 1 d n2 z 2 ⎬ 2n 0 ⎩ dy y0 +Δy dy y0 ⎭ ⎩ 2n 0 dy y0 ⎭ (2.8) Desta forma, o desvio sofrido pelo feixe está ligado ao gradiente de n, enquanto que seu diâmetro fornece a derivada segunda de n. De acordo com a Fig. 2.2, próximo da água o feixe será desfocalizado e na região mais próxima do álcool haverá focalização. 2.5 O princípio de Fermat Introduzido em 1657, o princípio de Fermat estabelece que a luz se propaga entre dois pontos no menor tempo possível, no caso em que ela não sofre reflexões. Consideremos um raio se propagando por meios com diferentes índices de refração, conforme mostra a Fig. 2.4. O tempo total para ele realizar o percurso indicado é dado pela somatória dos tempos gastos em cada meio: t= ∑ N i =1 ti = ∑ N i =1 di 1 = vi c ∑n d N i =1 (2.9) i i onde di é a distância percorrida em cada meio, com velocidade vi = c/ni. c é a velocidade da luz no vácuo e ni é o índice de refração do i-ésimo meio. A somatória [Δ] = Σnidi é denominada de caminho óptico. Como c é constante, o tempo mínimo implica no menor caminho óptico possível. n1 d1 n2 n3 d2 d3 n4 d4 n5 d5 n6 d6 Fig. 2.4 - Propagação de um raio por uma série de meios homogêneos com índices de refração diferentes. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 23 Uma aplicação simples do princípio de Fermat é a dedução da lei de Snell, que apresentamos a seguir. Consideremos um raio que se propaga entre dois pontos fixos, P1 e P2, localizados em meios com índices de refração distintos, n1 e n2, conforme mostra a Fig. 2.5. As distâncias x1 e x2 são fixas, mas y1 e y2 podem variar para a minimização do tempo. Entretanto, como os pontos P1 e P2 são fixos, y1+y2 = Y é constante. O caminho óptico será dado por: n1 n2 θ1 normal θ2 d2 P2 y2 y1 d1 P1 x1 x2 Fig. 2.5 - Geometria utilizada na dedução da lei de Snell pelo princípio de Fermat. [Δ ] = ∑ n i d i = n 1d 1 + n 2 d 2 N (2.10) i =1 que de acordo com a geometria da Fig. 2.5, [Δ] pode ser expresso como: [Δ ] = n 1 x 12 +y 12 + n 2 x 22 +y 22 = n 1 x 12 +y 12 + n 2 x 22 + ( Y−y 1 ) 2 (2.11) A eq. (2.11) fornece a variação de [Δ] com y1. Para encontrarmos seu valor mínimo igualamos sua derivada a zero: d[Δ ] = dy 1 n 1 y1 x 12 + y 12 − n 2 (Y − y 1 ) x 22 + ( Y − y 1 ) 2 =0 (2.12) De acordo com a geometria da Fig. 2.5, as frações da eq. (2.12) correspondem aos senos de θ1 e θ2, de forma que assim obtemos a lei de Snell: n 1 sen θ1 − n 2 sen θ 2 = 0 S. C. Zilio (2.13) Óptica Moderna – Fundamentos e Aplicações Óptica de raios 24 Até agora nossa apresentação do princípio de Fermat restringiu-se ao caso em que a luz se propaga através de vários meios homogêneos, porém com diferentes índices de refração. Queremos agora analisar o caso em que a propagação ocorre num meio em que o índice de refração varia continuamente ao longo do percurso do raio. Neste caso, a somatória da eq. (2.9) deve naturalmente ser substituída por uma integral: [Δ ] = ∫P n (s) ds P2 (2.14) 1 onde s é distância percorrida pelo feixe entre os pontos P1 e P2 e n(s)ds é o caminho óptico elementar. O princípio de Fermat estabelece a existência de um caminho muito bem definido para o raio ir de P1 e P2. Trata-se de um princípio variacional que pode ser colocado da seguinte maneira: δ ∫ n (s) ds = 0 P2 P1 (2.15) Quando um raio se propaga no espaço, ds é expresso em coordenadas cartesianas como: ds = dx 2 + dy 2 + dz 2 = dz 1 + x& 2 + y& 2 (2.16) onde x& =dx/dz e y& =dy/dz. Note que dz foi arbitrariamente colocado em evidência, mas também poderíamos ter escolhido dx ou dy. Assim, o princípio de Fermat fica: δ ∫ n ( x , y, z) 1 + x& 2 + y& 2 dz = 0 ⇒ δ ∫ f ( x , y, x& , y& , z) dz = 0 P2 P2 P1 P1 com: f ( x , y, x& , y& , z ) = n ( x , y, z ) 1 + x& 2 + y& 2 (2.17) (2.18) onde supusemos que n pode variar nas três direções. A solução da eq. (2.17) já foi estabelecida no contexto da mecânica clássica, explicitamente ao se tratar o princípio da mínima ação: δ ∫ L ( x , y, z, x& , y& , z& , t ) dt = 0 P2 P1 S. C. Zilio (2.19) Óptica Moderna – Fundamentos e Aplicações Óptica de raios 25 onde L(x,y,z, x& , y& , z& ,t) é a Lagrangeana do sistema mecânico, x, y, e z são as coordenadas cartesianas e t é o tempo. Comparando as equações (2.17) e (2.19), notamos que f(x,y, x& , y& ,z) faz o papel da Lagrangeana e z, o de tempo. Como já estudado na mecânica clássica, a solução da eq. (2.17) leva a um conjunto de equações do tipo Euler-Lagrange: d ⎛ ∂f ⎞ ∂f =0 ⎜ ⎟− dz ⎝ ∂x& ⎠ ∂x (2.20a) d ⎛ ∂f ⎞ ∂f ⎜ ⎟− =0 dz ⎜⎝ ∂y& ⎟⎠ ∂y (2.20b) Queremos agora aplicar estas equações na análise da trajetória do raio se propagando na mistura de água e álcool. De acordo com a simetria do problema, a trajetória do raio está confinada ao plano yz e a função f independe de x e x& . Em geral, a análise de problemas onde o índice de refração depende apenas de uma coordenada torna-se matematicamente mais simples se a coordenada “tempo” for tomada na direção em que n varia. Assim, tomaremos ds = 1 + z& 2 dy , onde agora dy foi colocado em evidência. Neste caso, a equação de Euler -Lagrange torna-se: d ⎛ ∂f ⎞ ∂f =0 ⎜ ⎟− dy ⎝ ∂z& ⎠ ∂z (2.21) n ( y)z& ∂f = = n0 ∂z& 1 + z& 2 (2.22) onde f (z& , y) = n ( y) 1 + z& 2 independe de z e portanto ∂f / ∂z = 0 . Isto simplifica a solução da eq. (2.21) pois ∂f / ∂z& será constante. Desta forma, temos: onde a condição inicial β(y0) = 0 foi usada. Note que tg β(y0) = dy/dz = 0 para z = 0 (y=y0). Portanto, z& = cotgβ = ∞ neste ponto e os z& do numerador e denominador da eq. (2.22) se cancelam. Elevando esta equação ao quadrado obtemos: ( n 2 ( y) z& 2 = n 02 1 + z& 2 S. C. Zilio ) (2.23) Óptica Moderna – Fundamentos e Aplicações Óptica de raios 26 Substituindo a expressão aproximada para o índice de refração n(y) ≅ n0 + (dn/dy)(y-y0) e considerando que z& = dz/dy =1/(dy/dz) =1/ y& , obtemos: y& = dy = dz 2 dn n 0 dy (y − y0 ) (2.24) y0 onde o termo quadrático em dn/dy foi desprezado. Esta equação é idêntica à eq. (2.5) e sua integração leva à trajetória parabólica da eq. (2.6) obtida na seção precedente. Com esta análise chegamos ao mesmo resultado obtido com a lei de Snell generalizada. Entretanto convém salientarmos que as equações de Euler-Lagrange são mais gerais pois permitem tratar problemas onde o índice de refração varia nas três direções. 2.6 A equação dos raios Através da manipulação matemática das equações de Euler– Lagrange, obtidas com o princípio de Fermat, é possível a obtenção de uma equação vetorial elegante, que descreve a propagação de um raio num meio óptico não homogêneo. Para deduzirmos esta equação dos raios, começaremos com a eq. (2.20a): d ⎛ ∂f ⎞ ∂f ∂n = 1 + x& 2 + y& 2 ⎜ ⎟= dz ⎝ ∂x& ⎠ ∂x ∂x (2.25) onde a expressão para f, dada pela eq. (2.18), foi utilizada na derivada relativa a x. Efetuando também a derivada com relação a x& obtemos: d ⎛⎜ nx& ⎜ dz 1 + x& 2 + y& 2 ⎝ ⎞ ⎟ = 1 + x& 2 + y& 2 ∂n ⎟ ∂x ⎠ (2.26) Da eq. (2.16) temos: (ds / dz ) = 1 + x& 2 + y& 2 . Portanto, usando a regra da cadeia no termo x& =dx/dz do lado esquerdo da equação temos: d ⎛ dx ⎞ 2 2 ∂n ⎜ n ⎟ = 1 + x& + y& dz ⎝ ds ⎠ ∂x S. C. Zilio (2.27) Óptica Moderna – Fundamentos e Aplicações Óptica de raios 27 Aplicando novamente a regra da cadeia na derivada relativa a z chegamos a: d ⎛ dx ⎞ ∂n (2.28) ⎜n ⎟ = ds ⎝ ds ⎠ ∂x Partindo da outra equação de Euler-Lagrange, eq. (2.20b), obtemos de forma análoga a expressão envolvendo a coordenada y: d ⎛ dy ⎞ ∂n ⎜n ⎟ = ds ⎝ ds ⎠ ∂y (2.29) Combinando as equações (2.28) e (2.29) é possível encontrar uma expressão análoga para a coordenada z: d ⎛ dz ⎞ ∂n ⎜n ⎟ = ds ⎝ ds ⎠ ∂z (2.30) Multiplicando as equações (2.28), (2.29) e (2.30) respectivamente pelos versores î, ˆj e kˆ , e somando as três, obtemos a equação vetorial que fornece a propagação do raio dentro do meio não homogêneo: r d ⎛ dr ⎞ r (2.31) n ⎟ = ∇n ⎜ ds ⎝ ds ⎠ r r A Fig. 2.6 mostra a geometria de s, ds, r e d r . É interessante notar que r d r = ds . A direção de propagação do raio de luz é caracterizada por um r r versor û = dr / ds . O vetor r é definido a partir da escolha de uma origem arbitrária, s é o deslocamento ao longo do raio e ds é um incremento infinitesimal deste deslocamento. y ds r s dr r r z Fig. 2.6 - Geometria das grandezas utilizadas na equação dos raios. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 28 Para finalizarmos esta seção, vamos aplicar a equação dos raios à análise da propagação de luz pela mistura de água e álcool. O uso da eq. (2.31) é em geral simples na aproximação paraxial, onde o desvio do raio é pequeno. Neste caso, ds está praticamente na direção z e assim podemos substituir d/ds por d/dz. Como a trajetória do raio se dá no plano yz, r r escrevemos r = yˆj + zk̂ , de onde tiramos d r /dz = dy/dz ĵ + k̂ . O gradiente r de n pode ser calculado a partir da eq. (2.1) e resulta em ∇n = dn / dy y ĵ . 0 Substituindo estas grandezas na equação dos raios obtemos: d ⎡ ⎛ dy ⎞⎤ dn n ( y)⎜ ĵ + k̂ ⎟⎥ = ⎢ dz ⎣ ⎝ dz ⎠⎦ dy ĵ (2.32) y0 Como n(y) não depende de z, ele pode ser tirado para fora da derivada. k̂ é um vetor constante e sua derivada relativa a z é nula. Portanto, da equação vetorial (2.32) sobra apenas a componente na direção ˆj , dada por: ⎡ dn ⎢n 0 + dy ⎢⎣ ⎤ d 2 y dn ( y − y 0 )⎥ 2 = dy ⎥⎦ dz y0 (2.33) y0 onde n(y), dado pela eq. (2.1) já foi substituido. Na aproximação paraxial, o raio se desvia pouco do eixo z (y ≈ y0) e além disto dn/dy é pequeno. Logo podemos desprezar o segundo termo entre colchetes do lado esquerdo da equação e assim obtemos uma expressão onde a derivada segunda de y é constante (equação da parábola). A solução desta equação é simples e leva aos resultados já obtidos anteriormente: d 2 y 1 dn = dz 2 n 0 dy y0 dy 1 dn = dz n 0 dy y0 (2.34) que implica em: z (2.35) de forma que: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 29 y = y0 + 1 dn ⎤ 2 z 2n 0 dy ⎥⎦ y 0 (2.36) onde as condições iniciais y& (z=0) = 0 e y(z=0) = y0 foram utilizadas. Portanto, recuperamos os resultados já encontrados pela lei de Snell generalizada e pelas equações de Euler-Lagrange. 2.7 A função eikonal Neste ponto, deixaremos de lado a óptica geométrica para introduzirmos o conceito de eikonal. Esta função, obtida a partir da óptica ondulatória, é importante pois representa o papel da função característica de Hamilton na mecânica clássica e é de grande valia quando se faz a analogia desta com a óptica geométrica. Como veremos no Cap. 3, a equação das ondas eletromagnéticas na sua forma reduzida (sem dependência temporal) é dada por: r r ∇2E + k 2E = 0 (2.37) r r onde k( r ) = 2πn( r )/λ é o é vetor de propagação, que depende da posição, r uma vez que n( r ) depende da posição num meio não homogêneo. A solução da equação de ondas é uma grandeza complexa, que contém um termo de amplitude e outro de fase, e pode ser escrita como: r r r r r r r r (2.38) E ( r ) = E 0 ( r ) e iφ ( r ) = E 0 ( r ) e ik 0S( r ) r r r sendo E0( r ) a amplitude (envelope), φ( r ) a fase da onda e S( r ) a função eikonal, que dá a direção de propagação da onda em termo de seus cosenos diretores. k0 é o vetor de onda no vácuo, dado por k0 = 2πn/λ, onde r λ é o comprimento de onda da luz no vácuo (n=1). As superfícies S( r ) = constante formam as equifases da onda, e esta se propaga perpendicularmente a estas superfícies. Para visualizarmos este fato, consideremos uma onda plana, cuja fase é dada por: rr r φ( r ) = k.r = k x x + k y y + k z z (2.39) como veremos posteriormente. Assim, a função eikonal fica sendo: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 30 S( x , y, z) = ky kx k x+ y+ z z k0 k0 k0 (2.40) A direção perpendicular a esta superfície pode ser encontrada pelo cálculo de seu gradiente: r r k (2.41) ∇S( x, y, z) = = nû k0 r onde û é um versor paralelo a k e que portanto define a direção de r r propagação da onda. Realizando o produto escalar ∇S.∇S obtemos: r 2 ⎛ ∂S ⎞ 2 ⎛ ∂S ⎞ 2 ⎛ ∂S ⎞ 2 ∇S = ⎜ ⎟ + ⎜⎜ ⎟⎟ + ⎜ ⎟ = n 2 ⎝ ∂x ⎠ ⎝ ∂y ⎠ ⎝ ∂z ⎠ (2.42) que é conhecida como a equação do eikonal. Esta equação também pode ser obtida diretamente pela substituição da eq. (2.38) em (2.37), mas isto será deixado como exercício. O conceito de função eikonal pode ser utilizado na dedução da equação dos raios que obtivemos na seção 2.6. Fazendo uso da Fig. 2.6, de r r r r onde temos d r = ds e û = dr / ds , podemos escrever ∇S = nû = nd r / ds , sendo que este último termo já é o que entra na equação dos raios. Tendo em mente a eq. (2.31) escrevemos: r d ⎛ dr ⎞ d r n ⎜ ⎟ = ∇S ds ⎝ ds ⎠ ds (2.43) O lado direito da equação pode ser trabalhado com o uso da regra da cadeia: r 3 dx i ∂ d dr r =∑ = .∇ ds i =1 ds ∂x i ds ( ) e pelo cálculo do gradiente da eq. (2.42) (equação do eikonal): r r 2 r r r r ∇ ∇S = 2∇S.∇ ∇S = 2n∇n S. C. Zilio (2.44) (2.45) Óptica Moderna – Fundamentos e Aplicações Óptica de raios 31 r r Usando ∇S = ndr /ds no segundo termo desta equação obtemos: ( ) r r dr r r d r .∇ ∇S = ∇S = ∇n ds ds (2.46) onde a eq. (2.44) foi utilizada no primeiro termo da esquerda. Substituindo a igualdade da direita na eq. (2.43) recuperamos a equação dos raios. Com a função eikonal é possível obter-se as condições de contorno para os raios de luz. Lembrando que o rotacional do gradiente é nulo, temos: r r r r r (2.47) ∇ x ∇S .da = ∇S.d l = 0 ∫ [ ( )] ∫ A r r onde o teorema de Stokes foi usado. Como ∇S = nd r / ds , temos: r dr r (2.48) n .d l = nds = 0 ds Nesta última passagem supusemos que o caminho de integração coincide r com o caminho dos raios de luz, isto é, û é paralelo a d l . De acordo com a Fig. 2.7 podemos definir os caminhos C1 e C2, e a eq. (2.48) pode ser expressa como: (2.49) nds1 = nds 2 ∫ ∫ ∫ ∫ C1 C2 de onde concluimos que dois raios de luz que deixam um ponto P1 e chegam até um ponto P2 por caminhos geométricos diferentes, o fazem com o mesmo valor de caminho óptico. Exemplificando, todos os raios que saem de um dado ponto de um objeto colocado na frente de uma lente e chegam ao mesmo ponto da imagem, o fazem de tal forma que as integrais de linha de nds por diferentes caminhos geométricos fornecem o mesmo valor. P 2 C1 P1 C2 Fig. 2.7 - Possíveis caminhos seguidos pelos raios de luz. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 32 Podemos também usar a eq. (2.48) para deduzir a lei de Snell. Neste caso, o caminho de integração dado pela curva C não corresponde à direção de propagação dos raios de luz. Considere a Fig. 2.8, que mostra raios incidentes sobre uma interface que separa dois meios. Neste caso temos: r r ⎛ dr ⎞ ⎛ dr ⎞ n 1 ⎜ ⎟ . ê = n 2 ⎜ ⎟ . ê ⇒ n 1û 1 . ê = n 2 û 2 . ê ⎝ ds ⎠ 2 ⎝ ds ⎠1 (2.50) que nos leva diretamente à lei de Snell, já que û.ê = senθ. A seguir, vamos usar a idéia de função eikonal para estabelecer um paralelo entre a óptica geométrica e a mecânica clássica. û2 θ2 θ1 û1 ê C n2 n1 Fig 2.8 - Raios de luz que incidem numa interface dielétrica. 2.8 Analogia entre a mecânica clássica e a óptica geométrica Em 1828, Hamilton formulou a analogia entre a óptica geométrica e a mecânica Newtoniana de uma partícula. Esta formulação está discutida em detalhes na referência 2.3 e aqui fazemos apenas um breve resumo das idéias envolvidas. Já vimos um pouco desta analogia quando estudamos o princípio de Fermat, que é equivalente ao princípio da mínima ação, ou ação estacionária. Vamos ver agora outros aspectos desta equivalência. Para a obtenção da equação de Hamilton-Jacobi, lembremo-nos que a ação é dada por: A(q, p, t ) = ∫ L (q, p, t )dt + C (2.51) C S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 33 onde L é a Lagrangeana, q e p são respectivamente a coordenada e velocidade generalizadas, t é o tempo e C é uma constante. Denominando de H o Hamiltoniano do sistema mecânico e fazendo uma transformação canônica tal que o novo Hamiltoniano, K, seja nulo, obtemos a equação de Hamilton-Jacobi: K ( q , p, t ) = H ( q , ∂A ∂A , t) + =0 ∂q ∂t (2.52) No caso em que a energia se conserva, H não depende do tempo e a eq. (2.52) pode ser integrada, resultando em: A(q, p, t ) = W (q, p) − Et (2.53) onde H = E é a energia da partícula, A é a função principal de Hamilton e W é conhecida como função característica de Hamilton. Na eq. (2.52), o momentum é representado por ∂A / ∂q , e como nos sistemas conservativos apenas W depende de q, como visto na eq. (2.53), temos p = ∂W /∂q . Este resultado pode ser estendido para três dimensões fornecendo: r r (2.54) p = ∇W Isto significa que a partícula caminha perpendicularmente à superfície definida pela função W. Neste ponto já é possível notar-se alguma semelhança com a óptica geométrica, pois de acordo com a eq. (2.41), um raio de luz propaga-se perpendicularmente à superfície S(x,y,z), com o índice de refração fazendo o papel de momentum. Para analisarmos o movimento de uma partícula, consideremos a superfície A = constante = a, como uma frente de onda propagando-se no espaço das configurações. De acordo com a Fig. 2.9, a variação da função W num intervalo de tempo dt é dada por: dW = W’ - W = E dt (2.55) Usando o conceito de derivada direcional temos: r r r dW = ∇W.ds = ∇W ds (2.56) r onde d s é um vetor perpendicular à superfície A = constante. Igualando as equações (2.55) e (2.56) obtemos a velocidade de fase para a propagação da frente de onda como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 34 vf = ds E E = r = = dt ∇W p E (2.57) 2mT onde T = p2/2m é a energia cinética da partícula. Deste modo, vemos que a velocidade de fase aumenta quando a velocidade da partícula diminui. Entretanto, como veremos posteriormente, é a velocidade de grupo (velocidade de um pacote de onda) que é igual à velocidade da partícula, e não a velocidade de fase. r ds W = a W’ = a + Edt A (0) = a A (dt) = a Fig. 2.9 - Propagação da superfície A(t)=a no espaço das configurações. Para realizarmos uma comparação formal entre a óptica geométrica e a mecânica clássica, vamos inicialmente mostrar que a equação do eikonal tem sua origem na óptica ondulatória no limite em que λ → 0. Para isto não podemos usar a equação de ondas na forma reduzida, dada pela eq. (2.37), mas sim sua forma completa, que envolve a derivada temporal. Esta equação, que será deduzida no Cap. 3, é dada por: r n 2( r ) ∂ 2 E 2 (2.58) ∇ E− 2 =0 c ∂t 2 onde o aspecto vetorial do campo elétrico foi ignorado para simplificar as contas. A solução desta equação é obtida generalizando-se a eq. (2.38) de acordo com: r r r E ( r , t ) = e B( r ) e ik 0 [S( r )−ct ] (2.59) r r onde a amplitude do campo elétrico foi escrita como E 0 ( r ) = exp{B( r )} por conveniência. A substituição de (2.59) em (2.58), que será deixada como exercício, nos leva a: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios {ik [2∇B.∇S + ∇ S]+ [∇ B + (∇B) r r 2 2 0 r 2 ( ) r 2 − k 02 ∇S + n 2 k 02 ]} E = 0 35 (2.60) Como as grandezas B e S são reais, cada termo entre colchetes deve se anular separadamente. Assim temos: r r 2∇B.∇S + ∇ 2S = 0 r 2 r 2 ∇ 2 B + ∇B − k 02 ∇S + n 2 k 02 = 0 (2.61b) r r φ( r , t ) =k 0 [S( r ) − ct ] (2.62) ( ) ( ) (2.61a) No limite em que λ → 0 (k0 → ∞), apenas os dois últimos termos de (2.61b) são relevantes, o que nos leva à equação do eikonal já discutida anteriormente. Em resumo, a solução da equação de ondas eletromagnéticas possui uma fase que é dada por: e no limite em que λ → 0 obtemos que o raio de luz se propaga com uma r direção definida por ∇S = nû . Já na mecânica clássica, a direção de propagação de uma partícula é dada pela eq. (2.54). Assim, a função característica W(q,p) faz o papel de eikonal e p = 2mT = 2m(E − V) (onde V representa a energia potencial), faz o papel de índice de refração. A análise da equação de Hamilton-Jacobi indica que a mecânica clássica é análoga ao limite da óptica geométrica da equação de ondas. Raios de luz ortogonais às frentes de onda (equifases) correspondem à trajetórias de partículas, ortogonais as superfícies de ação constante. Na seção seguinte, vamos ver como Schrödinger estendeu a analogia de Hamilton para obter uma equação básica na mecânica quântica, que hoje leva seu nome. 2.9 Obtenção da equação de Schrödinger Embora Hamilton tivesse desenvolvido a analogia exposta na seção precedente ainda em 1828, ele não tinha motivos para atribuir qualquer caráter ondulatório a uma dada partícula. Desta forma, por falta de evidências experimentais não foi possível a ele encontrar uma equação de ondas para descrever o comportamento da partícula. Foi Erwin S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 36 Schrödinger que, em 1925, estendeu a analogia de Hamilton e encontrou uma equação de ondas para descrever o movimento de um ponto material. A idéia seguida por Schrödinger está esquematizada na Fig. 2.10. Sabia-se que a óptica geométrica era um caso limite da óptica ondulatória e que era análoga à mecânica Newtoniana de uma partícula. Seria possível obter alguma equação, no mesmo pé de igualdade da equação de ondas eletromagnéticas, que levaria à mecânica clássica no limite em que alguma grandeza, α, inerente à esta teoria tendesse a zero? Mecânica Newtoniana r r ∇W = p Analogia de Hamilton (1828) α→0 Óptica geométrica r ∇S = nû λ→0 ?????? Óptica ondulatória φ =k 0 [S − ct ] A = W - Et Fig. 2.10 - Conjectura de Schrödinger. Da analogia de Hamilton, W corresponde ao eikonal S. Levandose em conta a parte temporal, a ação A = W - Et deve corresponder à fase da onda eletromagnética, dada por: r ⎡ S( r ) ⎤ r r (2.63) φ( r , t ) =k 0 [S( r ) − ct ] = 2π ⎢ − νt ⎥ λ ⎣ 0 ⎦ onde as substituições k0 = 2π/λ0 e λ0 = c/ν foram introduzidas. Comparando os termos com dependência temporal na fase da onda e na ação, Schrödinger concluiu que a energia da partícula deveria ser proporcional à frequência de alguma onda associada a ela, cuja propagação está mostrada na Fig. 2.9. Assim, E = hν (2.64) onde h é uma constante de proporcionalidade, que mais tarde foi identificada como sendo a constante de Planck. Associando um comprimento de onda à propagação da superfície A(t) no espaço das S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 37 configurações e levando em conta que esta se propaga com uma velocidade de fase dada por vf = E/p, temos: λ= v f (E / p ) h = = ν (E / h ) p (2.65) Desta forma, Schrödinger conseguiu associar um comprimento de onda à partícula de momentum p. Este comprimento de onda foi posteriormente deduzido por de Broglie de uma outra maneira e por isso leva o nome de comprimento de onda de de Broglie. A eq. (2.65) permite encontrar o vetor de propagação como: 2m ( E − V ) k = 2π = 2π p = λ h h (2.66) onde h = h/2π, e as relações p2 = 2mT e E = T+V foram utilizadas. Substituindo o valor de k dado em (2.66) na equação de ondas reduzida, eq. (2.37), chegamos à equação de Schrödinger: − h2 2 ∇ ψ + Vψ = Eψ 2m (2.67) onde o vetor campo elétrico foi substituido por uma nova função, ψ, cuja interpretação será deixada para os textos de mecânica quântica. Em resumo, para se obter a equação de Schrödinger, é necessário associar um comprimento de onda à partícula de momentum p (comprimento de onda de de Broglie) e isto pode ser feito estendendo-se a analogia de Hamilton. A partir disto, usa-se a conservação de energia e a equação de ondas na sua forma reduzida para a obtenção da equação de Schrödinger. Para finalizarmos esta seção, vamos mostrar que a velocidade de grupo associada à propagação da superfície de ação constante corresponde à velocidade da partícula. Como veremos no Cap. 4, a velocidade de grupo, ou de pacote de onda, é dada por: vg = S. C. Zilio dω dν = dk d (1/λ ) (2.68) Óptica Moderna – Fundamentos e Aplicações Óptica de raios 38 com ω = 2πν. Usando a eq. (2.65), e considerando que p = 2m(E − V) e E = hν, temos: 1 = 2m( E − V ) λ h (2.69) cuja derivada com respeito a ν nos fornece vg-1: 1 d (1/λ ) = = vg dν m 2m(hν − V) (2.70) Substituindo hν por E e p = 2m(E − V) , obtemos vg = p/m = v. 2.10 O potencial óptico Como vimos na seção anterior, as equações de ondas eletromagnéticas e de Schrödinger são formalmente equivalentes desde que se associe o comprimento de onda de de Broglie à partícula. No limite clássico da equação de Schrödinger, que corresponde ao caso h → 0 (λ → 0), recuperamos as equações da mecânica clássica. Para sistemas conservativos temos: r r F = −∇V (2.71) e este tipo de equação também deve existir na óptica geométrica devido à equivalência entre as duas equações de ondas. Usando (2.66), podemos definir um potencial óptico como: r r h 2k 2(r) V( r ) = E − 2m (2.72) Na presente analogia, a óptica geométrica está ligada ao limite clássico da equação de Schrödinger, no qual a 2a lei de Newton é válida. Desta forma, r r r r r h 2 k( r ) r F = ma = −∇V( r ) = ∇k m (2.73) Como k( r ) = k0 n( r ) e k 0 = ω/c, temos: r S. C. Zilio r Óptica Moderna – Fundamentos e Aplicações Óptica de raios ( ) 39 2 r r r a = hω n ( r )∇n mc (2.74) Assim, obtemos a aceleração que atua sobre uma partícula de luz quando esta atravessa um meio com índice de refração variável. Entretanto, a eq. (2.74) mistura o caráter de uma partícula de massa m com o de onda (ω,c). Para eliminarmos a massa desta equação, faremos uso da relação de de Broglie: mv = hk ⇒ v hω = n mc (2.75) onde k0 = ω/v = nω/c. Substituindo (2.75) em (2.74) obtemos uma expressão para a aceleração de um raio de luz que se propaga com velocidade v = c/n num meio cujo índice de refração depende da posição: r v2 r a= ∇n n (2.76) Entretanto, a solução desta equação é complicada, uma vez que v também pode depender da posição. Para simplificá-la, vamos tomar a aproximação paraxial que estabelece que o movimento do raio está confinado em torno do eixo de propagação, que denominaremos de z. Neste caso, v ≅ dz/dt e a aceleração pode ser expressa como: r r r dv dv dz = a= dt dz dt (2.77) onde a regra da cadeia foi utilizada. Substituindo (2.77) em (2.76) e cancelando v obtemos: r dv v r = ∇n dz n (2.78) r d 2 r dz v r = ∇n dz 2 dt n (2.79) Usando v = d r /dt e aplicando novamente a regra da cadeia chegamos a: r S. C. Zilio r Óptica Moderna – Fundamentos e Aplicações Óptica de raios 40 que nos leva à equação de propagação de raios: r d2r r n 2 = ∇n dz (2.80) Podemos comparar este resultado com a equação dos raios obtida anteriormente. Usando a aproximação paraxial (d/ds→d/dz) na eq. (2.31) e realizando a primeira derivada com respeito a z, temos: r r d2r r dn d r + n 2 = ∇n dz dz dz (2.81) Vemos então que o primeiro termo desta equação não aparece em (2.80). Para efeitos práticos isto não tem muita importância, pois a duas equações são válidas apenas na aproximação paraxial, que só tem sentido quando a variação de n é muito pequena. Na solução da eq. (2.81), despreza-se em geral o primeiro termo e aproxima-se n por n0 no segundo termo. Podemos entender a ausência do termo proporcional a dn/dz em (2.80) re-escrevendo o potencial óptico como: r h 2 ω 2 n 02 ⎤ ⎡ h 2 ω 2 (n 02 − n 2 ( r ) )⎤ r ⎡ (2.82) V( r ) = ⎢E − + ⎥ ⎢ ⎥ 2mc 2 ⎦ ⎣ 2mc 2 ⎣ ⎦ que corresponde a um termo constante e outro muito pequeno. Para passarmos do caso quântico para o clássico devemos ter h → 0. Isto significa que os níveis de energia do sistema são quase contínuos e para isto o potencial deve variar lentamente no espaço. Assim, o primeiro termo de (2.81) pode ser considerado como de segunda ordem e portanto desprezado. Em conclusão, introduzimos um potencial óptico com o qual obtivemos uma equação que descreve a propagação dos raios na aproximação paraxial. Este conceito é interessante porque através dele podemos entender porque os raios de luz procuram sempre as regiões de maior índice de refração (menor potencial). Como exemplo, numa fibra óptica o núcleo possui índice de refração levemente superior ao da casca, o que garante que os raios de luz fiquem confinados próximos ao seu centro. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 41 Bibliografia 2.1 D. Marcuse, Light Transmission Optics, 2nd ed., van Nostrand Reinholt Company, NY (1982). 2.2 M. Born and E. Wolf, Principles of Optics, 3rd ed., Pergamon, Oxford (1970). 2.3. H. Goldstein, Classical Mechanics, Addison-Wesley Publishing Co., 6th ed. (1969), pg. 307. 2.4. G. R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, NY (1968). 2.5. R. Köberle, Rev. Bras. Fís. 9, 243 (1979). 2.6. D. A. Krueger, Am. J. Phys. 48, 183 (1980). Problemas 2.1. Um raio de luz incide sobre uma placa de espessura d de tal maneira a formar 100 com a normal, conforme mostra a Fig. 2.11. O índice de refração é dado por n = 1+ z/d. Use a lei de Snell generalizada para encontrar o ângulo com que o raio deixa a placa. 2.2. Ainda com relação ao exercício 1, use as equações de Euler-Lagrange para encontrar: a) a equação da trajetória do raio dentro do meio e b) a que distância y do eixo z ele sai fora do meio. θ y z 100 d Fig. 2.11 - Relativa aos exercícios 2.1 e 2.2. 2.3. Repita o problema 2.2 usando a equação dos raios. 2.4. Uma lente do tipo GRIN (índice gradual) consiste de uma placa plana e paralela cujo índice de refração varia quadraticamente com a S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica de raios 42 distância ao eixo óptico z de acordo com n(x,y) = n0 - α(x2+y2)/2. Considere um raio entrando com um ângulo θ0 (pequeno) neste material, como mostra a Fig. 2.12 A espessura da lente é d e α << n0. Use a equação dos raios para encontrar: a) a equação da trajetória do raio dentro do meio e b) o ângulo de saída (no ar) do raio. z θ0 Fig. 2.12 - Lente do tipo GRIN. θ0 é o ângulo já dentro do material. d 2.5. Obter a eq. (2.42) pela substituição de (2.38) em (2.37). 2.6. Obter a eq. (2.60) pela substituição de (2.59) em (2.58). 2.7. Um raio de luz incide normalmente sobre um meio semi-infinito com índice de refração n = n 0 (1 − α 2 y 2 ) a uma pequena altura y0. Tome α y0 << 1. a) Use a lei de Snell generalizada para encontrar a equação da trajetória do raio dentro do meio. b) Repita o problema usando as equações de Euler-Lagrange. c) Repita o problema usando a equação dos raios. 2.8. Um feixe de luz colimada incide normalmente sobre uma placa de espessura ℓ, com índice de refração n = n 0 (1 − α 2 y 2 ) , conforme mostra a Fig. 2.13. Este elemento funciona como uma lente tipo GRIN unidimensional. Encontre a posição focal, F. Considere que α ymax << 1 e ℓ é suficientemente pequeno para não haver oscilações do raio dentro da placa. y z F ℓ Fig. 2.13 - Relativa ao exercício 2.8. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 43 Ondas eletromagnéticas 3 3.1 Introdução ao conceito de onda Para entendermos a propagação, bem outros aspectos físicos relacionados à luz, vamos inicialmente rever algumas idéias ligadas ao conceito de onda. Começaremos analisando uma onda mecânica, que é uma perturbação que caminha num meio material. Um exemplo bastante conhecido é o de uma corda estirada no chão sobre a qual se exerce um rápido puxão para cima. Sabemos que se forma um pulso nesta corda e que ele caminha (ou propaga-se) ao longo dela. Esta situação corresponde ao caso de propagação em uma dimensão (direção), ilustrado na Fig. 3.1. Outro exemplo de onda mecânica é o caso de uma pedra que cai na superfície absolutamente calma de um lago. Ao tocar na água, a pedra provoca um movimento do líquido, na forma de um círculo que aumenta radialmente. Neste caso, temos uma onda que se propaga em duas dimensões, sobre o plano definido pela superfície do lago. Estes são exemplos de perturbações que podem ser caracterizados como movimentos ondulatórios chamados pulsos. corda parada v corda com pulso Fig. 3.1 - Ilustração de um pulso propagando-se numa corda. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 44 Uma pergunta pertinente seria: podemos descrever este efeito matematicamente? A resposta é obviamente sim e a equação que descreve a propagação da onda, bem como sua solução, já eram conhecidas desde o século XVIII. Se estivermos tratando com ondas unidimensionais, que caminham apenas na direção z, por exemplo, a equação que descreve sua propagação é dada por: ∂ 2u = 1 ∂ 2u ∂ z2 v2 ∂ t 2 (3.1) que envolve derivadas parciais de segunda ordem com relação às variáveis espaço e tempo. A função u representa a perturbação provocada pela onda no meio, como por exemplo, a altura do pulso na corda. Por sua vez, v é a velocidade com que a onda caminha. Esta equação diferencial tem como soluções possíveis quaisquer funções que possuam o argumento descrevendo um movimento retilíneo uniforme, dado por: z = z0 ± vt, ou alternativamente, z ± vt = constante. Nesta última expressão, o sinal negativo corresponde a um movimento na direção do eixo z, enquanto que o sinal positivo descreve um movimento na direção negativa do eixo z. Estas soluções referem-se às ondas que se propagam sem dispersão, isto é, o pulso caminha com velocidade constante, sem que haja distorção no seu formato. No Cap. 4 trataremos do caso mais geral em que existe dispersão, a qual provoca mudanças no formato do pulso ao se propagar. Uma onda pode ser descrita de maneira geral como: u1 = f(z-vt) e u2 = g(z+vt), onde f e g são funções quaisquer. Se houver no meio ondas se propagando simultaneamente nas duas direções, a solução geral é dada pela combinação linear: u = a 1u 1 + a 2 u 2 = a 1f(z − vt) + a 2 g(z + vt) (3.2) onde u1 e u2 representam respectivamente, pulsos caminhando nas direções +z e -z. A combinação linear das ondas presentes no meio, expressa pela eq. (3.2), é conhecida como princípio da superposição e será abordada no problema 3.1. A forma de cada pulso é estabelecida pelas funções f e g, e depende das condições iniciais do problema, isto é, de como se gera o pulso no meio. Ao contrário das ondas mecânicas, as ondas eletromagnéticas, que discutimos a seguir, não precisam de um meio material para se propagarem. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 45 3.2 Ondas eletromagnéticas Por volta de 1870, James Clerk Maxwell introduziu um conjunto de equações envolvendo os campos elétrico e magnético, colocando de forma clara as equações empíricas existentes na época. Também introduziu o conceito de corrente de deslocamento, tornando a lei de Ampère mais geral. Estas equações, conhecidas atualmente como equações de Maxwell, estão discutidas em detalhes nos textos básicos de eletromagnetismo (ver referência 3.1). Temos: r r ∇. D = ρ (3.3a) r r ∇. B = 0 (3.3b) r r r ∇x E = −∂B / ∂t (3.3c) r r v r ∂D ∇x H = J + (3.3d) ∂t onde o sistema internacional (MKSA) foi adotado. O último termo da eq. (3.3d) representa a corrente de deslocamento introduzida por Maxwell. Cada uma destas equações corresponde a uma lei física descoberta empiricamente. De acordo com a ordem usada acima temos: lei de Gauss, inexistência de monopolo magnético, lei da indução de Faraday e lei de Ampère-Maxwell. O significado das grandezas que aparecem neste r r conjunto de equações é o usual: E é o campo elétrico, B é a indução r magnética, ρ é a densidade de portadores livres, J é a densidade de r r r corrente devida aos portadores livres, D = ε 0 E + P é o deslocamento r r r elétrico e H = B / μ0 − M é o campo magnético. Introduzimos assim, a r r polarização elétrica P e a magnetização M , que correspondem à resposta do meio devido à presença dos campos elétrico e magnético, respectivamente. As constantes ε0 = 8.854x10-12 F/m e μ0 = 4πx10-7 H/m, determinadas empiricamente, são denominadas respectivamente de permissividade e permeabilidade do vácuo. As equações de Maxwell podem ser combinadas de forma a gerar uma nova equação que descreve a onda eletromagnética. Antes, porém, vamos fazer hipóteses simplificadoras para as relações constitutivas que nos dão a resposta do meio à presença dos campos. Vamos supor relações S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 46 Ondas eletromagnéticas r r r tr r t r lineares do tipo P = ε 0 χE , M = χ m H e J = σE (conhecida como lei de t t Ohm), onde χ e χ m são respectivamente as susceptibilidades elétrica e magnética e σ é a condutividade elétrica. Em geral χ é um tensor, de forma que as polarizações e os campos podem não ser paralelos. Entretanto, neste capítulo vamos considerar apenas meios isotrópicos, nos t t quais χ e χ m são escalares, isto é, χij = χδij. Voltaremos a abordar o caráter tensorial destas grandezas quando tratarmos da propagação da luz em meios anisotrópicos dentre os quais se enquadram diversos tipos de r r r r r r r cristais. Desta forma, D = ε 0 E + P = ε 0 (1 + χ)E = εE , onde D e E são r r paralelos. Analogamente, B = μ H , onde μ = μ0 (1+ χm). Definiremos a constante dielétrica como ke = ε/ ε 0 = (1+χ) e a constante magnética como t km = μ/μ0 = (1+ χm). Estamos interessados em estudar a propagação de ondas r eletromagnéticas num meio livre e homogêneo, isto é, ρ = J = 0, μ e ε não dependem da posição. Tomando-se o rotacional da eq. (3.3c) temos: r r r r r ⎛ ∂B ⎞ ∂ r r ∂ r r (3.4) ∇x (∇xE) = −∇x ⎜⎜ ⎟⎟ = − (∇xB) = −μ (∇xH) ∂t ∂t ⎝ ∂t ⎠ r r r r r r r Usando a eq. (3.3d) com J = 0, a identidade vetorial ∇x (∇xE ) = ∇ (∇.E ) r r r − ∇ 2 E e o fato que num meio livre e homogêneo, ∇.E = 0 , obtemos a equação de ondas: r r ∂ 2E ∂2 r 2 (3.5) ∇ E = μ 2 D = με 2 ∂t ∂t Analogamente, tomando o rotacional da lei de Ampère-Maxwell e usando as eq. (3.3b) e (3.3c), obtemos uma equação similar para o campo magnético: r r ∂ 2H 2 (3.6) ∇ H = με 2 ∂t Se considerarmos a propagação em apenas uma dimensão (apenas na direção z, por exemplo), o Laplaceano se transforma numa derivada segunda com relação a z, e assim as eq. (3.5) e (3.6) tem a forma da S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 47 equação de ondas dada por (3.1). Este tipo de equação já era conhecido na época, de forma que Maxwell pode concluir que se tratava de uma onda com velocidade de propagação v = 1 / με . É interessante enfatizar que quando estas equações foram obtidas pouco se conhecia sobre a natureza da luz. Apenas quando Maxwell substituiu os valores de ε e μ, conhecidos empiricamente através de medidas de capacitância e indutância, obteve-se que a onda eletromagnética tinha uma velocidade de propagação igual à da luz, e assim pode ser feito o relacionamento entre a óptica e o eletromagnetismo. No caso tridimensional, as equações (3.5) e (3.6) são cada uma um conjunto de três equações para as componentes, isto é: ∇ 2 E x = με ∇ E y = με 2 ∇ 2 E z = με ∂ 2E x ∂t 2 (3.7a) ∂t 2 (3.7b) ∂ 2E y ∂ 2E z ∂t 2 (3.7c) Existe ainda um conjunto de equações similares para o campo magnético. Todas são equações diferenciais lineares, de segunda ordem, que podem ter uma infinidade de soluções, dependendo das condições de contorno impostas pela geometria de cada situação particular. Nas seções seguintes vamos discutir os tipos de soluções mais comuns. 3.3 Ondas harmônicas unidimensionais A equação para a onda eletromagnética unidimensional tem a forma da equação para u e, portanto, sua solução se constitui de pulsos do tipo: E = E(z±vt) (3.8a) H = H(z±vt) (3.8b) caminhando com velocidade v = 1 / με = 1 / k e ε 0 k m μ 0 = c / k e k m , onde c é a velocidade da luz no vácuo (ke = km =1). Para meios dielétricos e não S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 48 magnéticos (km=1), temos v = c / k e = c / n, onde n = k e é o índice de refração do meio. Um caso particular muito interessante das soluções expressas pelas eq. (3.8a) e (3.8b) é o das ondas harmônicas, que são perturbações periódicas da forma: E = E o cos[k(z ± vt)] = E o cos[(kz ± ωt) ] H = H o cos[k(z ± vt)] = H o cos[(kz ± ωt)] (3.9a) (3.9b) ω = kv (3.10) E = E o exp { i [k(z ± vt)] } = E o exp { i (kz ± ωt) } (3.11) onde definimos: sendo ω a freqüência angular da onda e k a constante de propagação ou módulo do vetor de propagação. Posteriormente, veremos com mais detalhes o significado físico destas grandezas. Assim como a expressão co-senoidal apresentada acima, soluções do tipo seno também satisfazem a equação de ondas e também são chamadas de ondas harmônicas. Como exemplo, no caso das ondas mecânicas funções do tipo seno ou co-seno podem ser obtidas conectando um diapasão numa das extremidades de uma corda esticada. Existe ainda uma terceira maneira de se expressar a onda harmônica, mais conveniente para a realização da operação de multiplicação dos campos, que é a forma exponencial: que também satisfaz a equação de ondas. De acordo com a fórmula de Euler (exp{iθ} = cosθ + i senθ) esta expressão contém um termo real e outro imaginário. Como o campo elétrico (assim como o magnético) deve ser uma variável real, é costume tomar-se apenas a parte real (ou imaginária) da eq. (3.11). Vamos enfatizar aqui que uma onda tem três partes importantes: a) a amplitude (Eo), b) a orientação espacial dos campos (polarização) e c) a fase (kz±ωt). A amplitude está ligada à intensidade, que determina a potência que está sendo transportada pela onda. A polarização dos campos está vinculada à orientação do vetor campo elétrico no espaço. Esta orientação define o que chamamos de polarização de uma onda e será tema de muitas discussões ao longo do texto, como por exemplo, quando estudarmos os fenômenos de reflexão e refração. Veremos ainda que a S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 49 fase, que é o argumento da função que descreve a onda, é um elemento fundamental no entendimento de vários fenômenos, como por exemplo, o da interferência de ondas. O argumento das funções dadas nas eq. (3.8a) e (3.8b) possui um termo descrevendo a variação espacial da onda, e outro, a temporal. De fato, não é algo simples a visualização conjunta das variações no espaço e no tempo, e a maneira mais funcional para analisar a fase é fazê-la separadamente. Para simplificar ainda mais a discussão, faremos uso das ondas harmônicas definidas nas eq. (3.9a) e (3.9b). Vamos somar 2π ao argumento da função, o que não altera o valor da amplitude do campo da onda, pois cos φ = cos (φ + 2π). Ao fazermos este incremento de fase, sua origem pode ser oriunda tanto da parte espacial quanto temporal, isto é, a variação pode ser no valor de z ou no de t. Tomemos inicialmente a variação de fase como sendo de origem temporal. Consideremos um dado instante de tempo t e que decorrido um intervalo de tempo T, a fase total se altera de 2π. Desta forma, temos: E = E o cos[kz ± ω(t +T)] = E o cos[kz ± ω t + ωT] = E o cos[kz ± ω t +2π ] . Neste caso, ωT = 2π, que nos leva a: ω= 2π = 2π f T (3.12) O intervalo de tempo T para o qual a onda harmônica se repete é chamado de período temporal da onda. A eq. (3.12) define a relação que deve existir entre período, freqüência angular ω e freqüência f. Tomemos a seguir a variação de 2π na fase como sendo oriunda da parte espacial. Desta forma, consideramos a onda em um dado ponto z e, no mesmo instante, o ponto (z+λ), tal que este deslocamento espacial gere a variação de fase citada. Temos então que E = E o cos [k(z + λ) ± ωt] = E o cos [kz ± ωt + kλ] = E o cos [kz ± ωt +2π] . Disto vem que kλ = 2π e, consequentemente: k= 2π λ (3.13) Portanto, chegamos à conclusão que existe um período espacial dado por λ, à semelhança do período temporal já discutido. A eq. (3.13) define a relação entre o módulo do vetor de propagação e este período espacial, S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 50 chamado de comprimento de onda. Isto evidencia que as partes espacial e temporal de uma onda participam em pé de igualdade, ou seja, tanto é possível haver alteração de uma onda através da passagem do tempo quanto da mudança de posição no espaço. A Fig. 3.2 ilustra o comportamento de uma onda harmônica como função da variável espacial para diversos tempos, isto é, como se a onda fosse fotografada periodicamente. v λ z Fig. 3.2 – Evolução temporal-espacial de uma onda harmônica. Conforme o tempo passa, a onda caminha para a direita com velocidade v constante. A mudança de uma onda no tempo é algo muito comum em eletrônica, enquanto que a mudança de fase no espaço é algo próprio da óptica. Assim sendo, em eletrônica se faz a modulação de sinal no tempo, enquanto em óptica se pode modular não apenas no tempo, mas também no espaço. 3.4 Ondas planas e esféricas O caso discutido na seção anterior é o das ondas harmônicas unidimensionais, para as quais a propagação ocorre apenas ao longo do eixo z. No caso de uma onda que se propaga numa direção qualquer do espaço, além de z, as coordenadas x e y também aparecem na solução da equação de ondas se utilizarmos o Laplaceano em coordenadas cartesianas. Assim, generalizando a eq. (3.11) temos: rr (3.14) E = E o exp { i (k x x + k y y + k z z ± ωt )} = E o exp i k.r ± ωt {( )} r onde o vetor k = k x î + k y ĵ + k z k̂ define a direção de propagação da onda e é chamado de vetor de propagação, cujo módulo, como já vimos é 2π/λ . r r = x î + yˆj + zk̂ é chamado de vetor posição. Os versores î , ˆj e k̂ indicam a direção e sentido dos eixos x, y e z, do sistema de coordenadas cartesianas. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 51 A solução dada por (3.14) é de extrema importância uma vez que qualquer rr pulso f( k.r − ω0 t ) pode ser gerado fazendo uma superposição de campos { } elétricos E(ω), isto é, calculando a transformada de Fourier de E0(ω): rr rr (3.15) f (k.r − ω0 t ) = ∫ E(ω)dω =∫ E 0 (ω) exp i(k.r − ωt ) dω sendo que ω0 entra nos limites de integração. Desta forma, podemos ver que a solução harmônica é uma espécie de onda básica e as soluções mais complicadas são derivadas a partir dela. Voltaremos a este assunto no Cap. 7, quando estudarmos a resolução espectral de um trem de ondas finito. Entretanto, devemos afirmar que embora esta solução seja importante do ponto de vista matemático, ela não tem significado físico, já que as condições de contorno demandariam fontes de dimensões infinitas (planos), como veremos a seguir. rr De acordo com a eq. (3.14), a fase da onda é φ(r,t) = k.r -ωt. Vamos encontrar para quais pontos no espaço esta fase tem o mesmo valor, isto é, queremos determinar as superfícies equifases. Assim, para um dado instante de tempo φ deve ser constante e isto só é possível se rr r k.r = kû.r = constante. Aqui, û é um versor que especifica a direção e r o sentido do vetor de propagação k . A realização do produto escalar nos leva a: kxx + kyy + kzz = constante, que é a equação do plano visto na Fig. 3.3, cuja normal é o próprio vetor de propagação. Desta forma concluímos que a onda plana possui como superfícies equifases, planos que se r propagam na direção de k , com velocidade v. r k = kû z r r O y x Fig. 3.3 - Superfície equifase de uma onda plana. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 52 r Para entendermos melhor o significado de k vamos fazer uso da Fig. 3.4, que representa duas superfícies equifases tais que os argumentos das funções seno diferem exatamente de 2π, significando que a onda se repete. Logo, a separação entre os dois planos é λ, como discutido rr rr anteriormente. Assim, para um dado tempo t, k.r1 - ωt = constante e k.r2 - ωt = const.+2π. Subtraindo estas duas igualdades temos: k.( r2 − r1 ) = 2π. r r r r r2 − r1 r r1 r r2 r frente de onda r k λ r Fig. 3.4 - Significado de k . Levando em conta que o produto escalar seleciona apenas a r r r componente de ( r2 − r1 ) paralela a k (portanto perpendicular aos planos equifases), e que esta corresponde à separação entre os dois planos consecutivos, concluímos que kλ = 2π e consequentemente k = 2π/λ, como no caso da onda unidimensional. Como para a translação com velocidade constante, o espaço é igual à velocidade vezes o tempo, temos λ = Tv = v/f. Assim obtemos v = λf = ω / k , que é a velocidade de fase da onda, que será abordada com maiores detalhes no próximo capítulo. Um outro tipo de solução para a equação de ondas é a onda esférica, que está ligada à condição de contorno correspondente à radiação emitida por uma fonte pontual. Quando tal fonte emite radiação eletromagnética, a onda gerada se espalha em todas as direções, como mostrado na Fig. 3.5, diferentemente da onda plana que caminha apenas r na direção do vetor de propagação k . Neste caso, o campo elétrico é dado por: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 53 E= E0 cos(kr − ωt ) r (3.16) Nesta expressão vemos que a amplitude decresce com r e a razão para isto está ligada ao princípio da conservação de energia. A potência (energia por unidade de tempo) é o produto da intensidade pela área atravessada pela onda, que no caso da esfera é A = 4πr2. Logo, devido à conservação de energia (ou potência), 4πr2I deve ser constante conforme a onda esférica se propaga. Como veremos no final do capítulo, I ∝ E2 (ver eq. (3.41)) de onde concluimos que E depende de 1/r. Conforme mostra a Fig. 3.5, o produto kr dá origem a uma superfície equifase esférica, dependente de r. Note que r nor argumento da exponencial aparecem apenas os módulos dos vetores k e r , e não o seu produto escalar. superfície equifase r k F Fig. 3.5 - Onda esférica. Existem outros tipos de soluções para a equação de ondas e um dos mais comuns é a solução do tipo gaussiana, que abordaremos na seção 3.5. r r Uma identidade importante é a que relaciona H e E . Para derivála devemos notar que de acordo com a expressão da onda plana, r r r r ∇x E = ikx E (3.17a) r r ∂E = −i ωE (3.17b) ∂t r r ∂H = −iωH (3.17c) ∂t S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 54 r r r r r r r Como ∇x E = −∂B / ∂ t = − μ∂H / ∂ t , temos ikxE = iμωH , isto é, r r H e E são perpendiculares entre si. Por outro lado, r r rr ∇.E = ik.E = 0 (3.18a) r r significando que k e E são perpendiculares. Também, r r r r ∇.H = ik.H = 0 (3.18b) r r r r r e assim, k e H são perpendiculares. Logo, concluímos que k , H e E são mutuamente perpendiculares, como mostra a Fig. 3.6. É claro que isto r r só é válido em meios isotrópicos, onde ∇.E = 0 . Nos meios r r r r anisotrópicos, a condição a ser utilizada é ∇.D = 0 , e neste caso, k , H e r D são mutuamente perpendiculares. r E r H r k r r r Fig. 3.6 - Geometria dos vetores k , H e E 3.5 Ondas gaussianas Uma solução importante da equação de ondas é aquela obtida ao se utilizar o Laplaceano em coordenadas cilíndricas: ∇ 2 = ∇ T2 + ∂2 ∂2 1 ∂ ∂2 = + + ∂z 2 ∂r 2 r ∂r ∂z 2 (3.19) onde ∇ T2 é a parte associada à coordenada radial. Fisicamente, o uso destas coordenadas implica que o meio possui condições de contorno com simetria azimutal, isto é, podem existir obstáculos circulares, meios do tipo lente como discutido no Cap. 2, etc. A solução que vamos obter a seguir é de observação bastante comum em laboratórios de óptica, pois S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 55 corresponde ao tipo de luz emitida pela maioria dos lasers. Como o sistema de coordenadas particulares escolhido para o Laplaceano não tem influência na parte temporal do campo elétrico, é de se esperar que, como nos dois casos discutidos na seção anterior, ele seja dado por uma expressão do tipo: r r r r E( r , t ) = E( r ) exp{− iωt} (3.20) Substituindo esta solução tentativa na eq. (3.5), obtemos a equação de ondas na forma reduzida, que envolve apenas as coordenadas espaciais: r r ∇ 2 E + k 2 (r )E = 0 (3.21) 2 2 onde k = μεω pode depender da coordenada radial se tivermos um meio do tipo lente. Entretanto, com o objetivo de simplificar os cálculos seguintes, vamos supor que o meio seja homogêneo, isto é, k é constante. r Tomando apenas uma componente vetorial de E e supondo que a onda tem sua propagação confinada em torno do eixo z, fazemos a mudança de variáveis: E(r, z) = ψ(r, z) exp{− ikz} (3.22) que quando substituida na eq. (3.21) resulta em: ∇ T2 ψ − 2ikψ' = 0 ∂ψ onde ψ' = ∂z e o termo proporcional a ψ' ' foi desprezado. Esta é ainda (3.23) uma equação difícil de ser resolvida e sem nenhuma justificativa ad hoc, vamos tentar uma solução do tipo: ⎧⎪ ⎡ Q( z ) r 2 ⎤ ⎫ ⎪ ψ(r, z) = ψ 0 exp⎨− i ⎢P(z) + ⎥⎬ 2 ⎥⎦ ⎪⎭ ⎪⎩ ⎢⎣ (3.24) Substituindo na eq. (3.23) obtemos: Q 2 r 2 + 2iQ + kr 2 Q'+2kP' = 0 (3.25) onde as derivadas de P e Q são relativas a z. Como esta igualdade é válida para qualquer r, devemos analisar as partes que possuem a mesma potência em r. Assim, Q 2 + kQ' = 0 S. C. Zilio (3.26a) Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 56 iQ + kP' = 0 (3.26b) Desta forma, obtemos equações diferenciais, que embora não lineares, são de primeira ordem, e consequentemente fáceis de serem resolvidas. A solução da eq. (3.26a) resulta em: Q( z ) = k z + q0 (3.27) onde q0 é uma constante de integração, que será analisada posteriormente. Utilizando este resultado na eq. (3.26b) é fácil mostrar que: ⎛ z ⎞ P(z) = −i ln⎜⎜1 + ⎟⎟ ⎝ q0 ⎠ (3.28) Podemos agora substituir os valores de P(z) e Q(z) na eq. (3.24) para encontrarmos a função ψ(r,z). Antes porém, vamos re-escrever a constante de integração como q0 = iz0, com z0 real. A razão de se considerar q0 imaginário é que esta é a única maneira de se obter uma solução que está confinada em torno do eixo z; caso contrário, o campo elétrico se estenderia exponencialmente até o infinito e esta é uma solução que não nos interessa. Desta forma temos: exp{ − iP( z)} = exp{− ln[1 − i( z / z 0 )]} = e { } 1 1 exp i tg −1 (z / z 0 ) = 2 1 − i(z / z 0 ) 1 + (z / z 0 ) ⎧⎪ k ⎛ r 2 ⎞⎫⎪ ⎧ Q( z ) r 2 ⎫ ⎟⎬ = exp exp⎨− i ⎨− i ⎜⎜ ⎬ 2 ⎭ ⎪⎩ 2 ⎝ z + iz 0 ⎟⎠⎪⎭ ⎩ ⎧⎪ kr 2 ⎛ z − iz 0 ⎞⎫⎪ ⎧ r2 ikr 2 ⎫ ⎜ 2 ⎟⎬ = exp⎨− 2 = exp⎨− i − ⎬ 2 2 ⎜⎝ z + z 0 ⎟⎠⎪⎭ ⎪⎩ ⎩ w ( z) 2R ( z ) ⎭ { } { onde as grandezas w(z) e R(z) foram introduzidas como: w 2 (z) = S. C. Zilio 2z 0 1 + (z/z 0 ) 2 = w 02 1 + (z/z 0 ) 2 k } (3.29) (3.30) (3.31a) Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 57 { } onde w02 = 2z0/k é o valor de w(z) na origem (z = 0) e R(z) = z 1 + (z 0 /z) 2 (3.31b) Com estas definições o campo elétrico fica: E(r, z) = E 0 ⎧ ⎡ ⎧ w0 r2 ⎫ kr 2 ⎤ ⎫ exp⎨− 2 ⎬ xexp⎨− i ⎢kz − η(z) + ⎥⎬ w(z) 2R(z) ⎦ ⎭ ⎩ w (z) ⎭ ⎩ ⎣ (3.32) onde η(z) = tg-1(z/z0) é conhecida como fase de Gouy. Podemos agora fazer uma interpretação do significado desta expressão. A primeira parte da eq. (3.32) está ligada à amplitude do campo. Vemos que ao se modificar a coordenada radial o campo decai exponencialmente, de forma a seguir uma função gaussiana. O comportamento de E contra r está mostrado na Fig. 3.7. Para uma distância r = w(z), o valor de E decai para 1/e do valor em r = 0. Esta distância é chamada de raio do feixe. Na origem, o raio mínimo é w0, de acordo com a eq. (3.31a). Nesta posição temos a “cintura do feixe”. Ainda de acordo com esta equação, vemos que z0 = kw02/2 = πnw02/λ. Este parâmetro é chamado de comprimento de Rayleigh. Para z = z0, o raio do feixe aumenta de um fator 2 quando comparado com o valor em r = 0. Ainda com relação à amplitude do campo, para r = 0, o feixe vai se abrindo conforme z aumenta e a amplitude decai com z, de acordo com w0/w(z) = 1 / 1 + (z/z 0 )2 . É interessante notar que existe um tamanho mínimo para o diâmetro do feixe e isto está ligado ao fenômeno de difração, que veremos no Cap. 8. Para z muito maior que z0, a eq. (3.31a) prediz que w(z) ≈ w0z/z0. Usando a relação entre w0 e z0, e considerando que o raio do feixe satisfaz: r = w(z), temos: E(z,r) e- r 2w(z) 2 /w 2 r Fig. 3.7 - Variação da amplitude do campo com a coordenada radial. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 58 r= λ z πnw 0 (3.33) que é a equação de uma reta, que nos dá o ângulo de divergência do feixe como tgθ ≈ θ = λ/πnw0. Iremos obter uma expressão similar a esta quando tratarmos da difração de luz por uma fenda circular de raio w0. A segunda metade da eq. (3.32) está ligada à fase da onda. O termo mais interessante é o que possui R(z), que corresponde ao raio de curvatura da frente de onda. Quando a onda se propaga, a curvatura do feixe vai mudando conforme mostra a Fig. 3.8. Para r = 0 e r = ∞ o raio de curvatura é infinito. O valor mínimo de R(z) ocorre para z = ±z0 e vale Rmin = 2z0. Para z > 0, o raio de curvatura é positivo e se a luz caminha para a direita temos a divergência do feixe. Por outro lado para z < 0, o raio de curvatura é negativo e o feixe estará convergindo. r 2w0 R(z ) z 2w Fig. 3.8 - Propagação de um feixe gaussiano (a) e variação da amplitude do campo com coordenada radial. O feixe definido pela eq. (3.32) é chamado feixe gaussiano de ordem zero (TEM00), podendo existir feixes de ordem superior, cujas distribuições de intensidade na direção radial são mostrados na Fig. 3.9. Embora não demonstremos aqui, a amplitude do campo elétrico é modulada por um polinômio de Hermite. Alguns pontos a serem enfatizados com relação à eq. (3.32) são: (i) o raio da curvatura R(z) e o diâmetro do feixe mudam conforme ele se propaga na direção z, implicando numa divergência (ou convergência) do mesmo, (ii) em w(z) o campo é 1/e do valor em r = 0, (iii) o intervalo de Rayleigh z 0 = πw 02 n / λ é a distância z em que o raio w(z) do feixe aumenta por um fator 2 , (iv) w0 é o raio mínimo do feixe, obtido no ponto focal e (v) a propagação do feixe não segue as leis da óptica geométrica devido à difração da luz no S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 59 ponto focal, mas pode ser descrita através de matrizes (lei ABCD), como discutido na referência 3.3 e na seção seguinte. TEM00 TEM01 TEM10 TEM11 TEM20 TEM30 TEM21 TEM31 TEM40 TEM22 Fig. 3.9 - Distribuições transversais de intensidade para feixes gaussianos de várias ordens. 3.6 Propagação do feixe gaussiano Como mencionamos na seção anterior, a propagação de um feixe gaussiano não segue as leis da óptica geométrica, mas sim da óptica ondulatória, onde o fenômeno de difração é importante. O que devemos fazer para caracterizar o feixe gaussiano é determinar como w(z) e R(z) variam conforme a onda se propaga. Isto é feito através da lei ABCD que discutiremos a seguir. Vamos definir um parâmetro q(z) = k/Q(z), tal que para a propagação num meio homogêneo obtemos q(z) = q0 + z, como indica a eq. (3.27). Por outro lado, vemos da eq. (3.30) que: 1 Q( z ) 1 iλ = = − q (z) k R (z) πnw 2 (z) (3.34) Desta forma, sabendo como q(z) varia com z, a parte real de 1/q(z) dará R(z), enquanto que a parte imaginária está ligada a w(z). Se conhecermos w0, podemos encontrar z0, e q0 = iz0. Substituindo em q(z) = q0 + z obtemos a eq. (3.31). Entretanto, um dado sistema óptico pode conter componentes tais como lentes e outros elementos. Neste caso, a variação do parâmetro q é dado pela lei ABCD: q2 = S. C. Zilio Aq1 + B Cq1 + D (3.35) Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 60 onde q1 e q2 se referem a dois planos quaisquer perpendiculares ao eixo óptico (z), enquanto que A, B, C, e D são os elementos da matriz que caracteriza a propagação geométrica de um raio de luz entre os planos 1 e 2, como veremos na próxima seção. No caso da propagação no ar, usamos a matriz de translação com A = 1, B = z, C = 0 e D = 1, e obtemos q2 = q1 + z, como anteriormente. O cálculo da propagação do feixe gaussiano em alguns sistemas particulares será deixado como exercício. 3.7 Formulação matricial da óptica geométrica O tratamento matemático na forma matricial é um formalismo de muita importância para a descrição da propagação de feixes gaussianos e cálculos de cavidades ressonantes para lasers. É também adequado para descrever sistemas que incluem muitos elementos ópticos, já que o efeito do conjunto pode ser encontrado através de multiplicação de matrizes. Vamos levar em conta apenas os raios paraxiais confinados ao redor do eixo óptico (θ muito pequeno). Considere a situação mostrada na Fig. 3.10. Podemos supor que, na aproximação paraxial, existe uma relação linear entre as características geométricas dos feixes de entrada e saída do sistema óptico. Desta forma, tomando Yi como a altura e θi como o ângulo do raio incidente no sistema óptico, e Ye e θe como os parâmetros do feixe emergente, podemos escrever um conjunto de equações envolvendo estas grandezas: Ye = S11 Yi + S12 θ i θ e = S 21 Yi + S 22 θ i (3.36) que pode ser colocada na forma matricial: ⎛ Y ⎞ ⎛ S S ⎞⎛ Y ⎞ ⎜⎜ e ⎟⎟ = ⎜⎜ 11 12 ⎟⎟⎜⎜ i ⎟⎟ ⎝ θ e ⎠ ⎝ S 21 S 22 ⎠⎝ θ i ⎠ (3.37) ou esquematicamente, na notação de Dirac utilizada na mecânica quântica,⏐ R e = S⏐ R i . Para um sistema óptico composto de vários elementos, fazemos a multiplicação de suas matrizes respeitando a ordem com que os raios incidem nos elementos. Logo,⏐ R n =SnSn-1...S2S1⏐ R 1 . S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 61 θe θi Yi Ye z eixo óptico sistema óptico Fig. 3.10 - Raios incidentes e emergentes de um sistema óptico. Na aproximação paraxial, dy/dz = tgθ ≈ θ. Como exemplo, vamos encontrar a matriz S para uma lente positiva (convergente) de distância focal f. A Fig. 3.11 mostra os raios principais para uma lente convergente. Note que quando o raio estiver descendo dy/dz<0 e portanto θ é negativo. s’ s O (1) d d’ O’ f (2) Fig. 3.11 - Traçado de raios para uma lente convergente de distância focal f. O corresponde ao objeto (tamanho d) e O’ à imagem (tamanho d’). Vamos usar a aproximação paraxial, na qual d e d’ são muito menores que a distância focal f. Da Fig. 3.11 vemos que o raio (1) incidente sobre a lente é descrito pela altura Yi(1) = d’ e pelo ângulo θi(1) = arctg d’/f ≅ d’/f, enquanto que o raio emergente é caracterizado por Ye(1) = d’ e θe(1) = 0. Logo, poderemos montar a seguinte equação matricial: ⎛ d ′ ⎞ ⎛ S11 S12 ⎞⎛ d ′ ⎞ ⎟⎟⎜⎜ d ′ ⎟⎟ ⎜⎜ ⎟⎟ = ⎜⎜ S S 0 ⎝ ⎠ ⎝ 21 22 ⎠⎝ f ⎠ (3.38) que nos leva ao sistema de equações: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 62 d ′ = S11d ′ + S12 df ′ (3.39 a) 0 = S 21d ′ + S 22 df ′ (3.39b) Para o raio (2), temos Yi(2) = -d, θi(2) = 0, Ye(2) = -d e θe(2) = arctg d/f ≅ d/f. Portanto, ⎛ − d ⎞ ⎛ S11 S12 ⎞ ⎛ − d ⎞ ⎜ d ⎟ = ⎜⎜ ⎜ ⎟ S S ⎟⎟ ⎜⎜ 0 ⎟⎟ ⎝ f ⎠ ⎝ 21 22 ⎠ ⎝ ⎠ de onde se obtém: - d = -S11d ⇒ S11 = 1 d f = −S 21d ⇒ S 21 = − 1 (3.40) (3.41a) (3.42b) f Substituindo estes valores na eq. (3.39) encontramos S12 = 0 e S22 = 1, de forma que a matriz da lente positiva fica: ⎛1 S = ⎜⎜ -1 ⎝f 0⎞ ⎟ 1⎟⎠ (3.43) Para uma lente negativa (divergente) basta que se troque o sinal de f, como será demonstrado no problema 3.6. A determinação das matrizes de vários sistemas ópticos e suas combinações será deixada para a seção de exercícios. O procedimento a ser adotado na solução destes problemas é análogo ao que usamos para a lente positiva. Um fato que merece destaque é que as matrizes que representam os elementos ópticos, a exemplo da matriz da lente convergente, são unitárias. Logo, quando temos um sistema óptico composto de vários elementos, sua matriz também é unitária, pois é a resultante de um produto de matrizes unitárias. 3.8 Vetor de Poynting. Irradiância r A potência por unidade de área que se propaga na direção k é dada pelo vetor de Poynting, que é definido como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 63 r r r S = E xH (3.44) r r Usando a relação entre H e E dada logo após as eq. (3.17) temos: r r r r r r r (k x E) r rr 1 − E (k.E) + k (E.E ) = = S = Ex μω μω (3.45) 2 2 r rr r E0 E 2 = k= cos k.r − ωt k μω μω [ [ ] ] Os detetores existentes não possuem velocidade suficiente para acompanhar a variação rápida do campo elétrico e fazem uma média temporal do sinal. Portanto, devemos calcular a média temporal do vetor de Poynting, isto é: t +T t +T rr r r E 02 0 1 0 rr 2 cos ( k . r t ) dt k < S > = ∫ S( r , t )dt = − ω T t0 μωT t∫0 Usando a identidade cos 2 y = 12 [1 + cos 2 y] obtemos: r S = { [ (3.46) ] rr E o2 1 ( T sen 2 k . r − ωt 0 − ω T ) ω + 2 2μω2T rr − 1 sen 2 (k.r − ωt 0 ) 2 [ ]} (3.47) Integrando em um período, que é dado por T = 2π/ ω , obtemos: { r r r E2 r 1 < S > = 0 k = Re E * x H 2μω 2 } (3.48) Definimos densidade de fluxo radiante ou irradiância como: r E 2k E 2 1 I = < S > = 0 = 0 = cnε 0 E 02 2μω 2μv 2 (3.49) que possui unidades de W/m2. Esta é uma expressão bastante útil na prática, pois permite relacionar a intensidade da luz com o campo elétrico. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 64 Bibliografia 3.1. J. R. Reitz, F. J. Milford and R. W. Christy, Fundamentos da Teoria Eletromagnética, Editora Campus, RJ (1982) 3.2. G. R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, NY (1968). 3.3. A. Yariv, Quantum Electronics, 2nd edition, John Wiley and Sons, NY, (1975) Cap. 6. 3.1. As soluções da equação de ondas ∂ 2ψ ∂x 2 − c12 Problemas ∂ 2ψ ∂t 2 = 0 podem se dividir em dois tipos: ondas progressivas e estacionárias. a) Para obter soluções tipo ondas progressivas faça as seguintes mudanças de variáveis: v- = x - ct e v+ = x + ct e mostre que a solução mais geral é dada por ψ = f ( x - ct) + g (x +ct), onde f e g são funções arbitrárias (método de D’Alembert). b) Para obter soluções estacionárias faça ψ(x,t) = X(x)T(t) e mostre que as soluções possíveis são do tipo: ψ1 = (A cospx + B senpx) (C cospct + D senpct) e ψ2 = (A’ epx + B’ e-px) (C’epct + D’e-pct) (método da separação das variáveis). 3.2. Obter a equação de ondas para a propagação de luz em meio não homogêneo, onde ε = ε (x,y,z) e μ = μ (x,y,z). 3.3. Complete as passagens que levam à eq. (3.23). 3.4. Complete as passagens que levam as eqs. (3.25) e (3.26). 3.5. Considere um raio propagando-se num meio isotrópico de maneira a formar um ângulo θ (pequeno) como o eixo óptico. Mostre que a matriz que descreve a propagação do raio entre dois planos perpendiculares ao eixo óptico e separados por uma distância d, é dada, na aproximação paraxial, por: ⎛ 1 M = ⎜⎜ ⎝ 0 d 1 ⎞ ⎟⎟ ⎠ 3.6. Derive a matriz de uma lente divergente. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ondas eletromagnéticas 65 3.7. Considere uma interface esférica de raio R separando dois meios dielétricos de índices de refração n1 e n2 e a luz indo do meio 1 para o meio 2. Mostre que a matriz que descreve a propagação do raio através da interface é dada, na aproximação paraxial, por: ⎛ 1 0⎞ M = ⎜⎜ (1-n ) 1 ⎟⎟ ⎝ nR n ⎠ onde n = n2/n1 é o índice de refração relativo. R é positivo se o centro de curvatura estiver à direita da interface e negativo se estiver à esquerda. 3.8. Considere um feixe gaussiano incidente sobre uma lente fina de distância focal f, tal que sua cintura coincida com a lente. Usando a lei ABCD encontre a localização da nova cintura do feixe e o diâmetro da mancha focal. 3.9. Suponha que um feixe gaussiano incida sobre a face de um bloco sólido muito longo de índice de refração n, tal que sua cintura esteja dentro do bloco. Usando a lei ABCD encontre a localização da cintura do feixe e o diâmetro da mancha focal, em comparação com o caso que não existe prisma. 3.10. Considere um feixe gaussiano de cintura 2w0 que incide sobre uma lente fina de distância focal f. A que distância d do foco deve ser colocada a lente para que a divergência do feixe emergente seja mínima? Deduza a equação de formação de imagem para o caso de feixes Gaussianos. 3.11. Um material possui índice de refração complexo ñ = n + iα, onde n e α são reais. Explique os efeitos produzidos por n e α. Calcule o vetor de Poynting para uma onda plana se propagando neste meio. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 66 S. C. Zilio Ondas eletromagnéticas Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 67 A fase da onda eletromagnética 4 4.1 Velocidades de fase e de grupo. Dispersão Como vimos no capítulo anterior, a onda eletromagnética é caracterizada por uma fase que possui dependência nas coordenadas r espaciais e temporal, φ = φ( r ,t). Esta grandeza é a característica mais importante da onda eletromagnética já que define a direção de propagação, através do gradiente da função eikonal (vide Cap. 2), a frequência e também sua velocidade de propagação. No presente capítulo, vamos concentrar nossa atenção aos aspectos ligados à frequência e velocidade da onda, e como proceder para transmitir informações através dela. De acordo com o exposto no Cap. 3, as coordenadas espaciais e temporal das fases das ondas analisadas estão separadas em dois termos, rr da forma k.r -ωt. Entretanto, pode acontecer o caso em que estas coordenadas estão misturadas, e um exemplo disto é quando o índice de refração depende do tempo. Como k é proporcional a n, a fase passa a ser r r φ(r,t)= k ( t ).r −ωt, que é conhecida como fase generalizada. A frequência da onda estará então associada à variação temporal da fase generalizada, tópico que veremos com mais detalhes quando tratarmos da modulação eletro-óptica e varredura de frequência. Por enquanto, vamos concentrar nossa atenção na velocidade de propagação da onda. Começaremos por dizer que quando se deseja transmitir sinais, é impossível fazê-lo através de uma onda de frequência única (monocromática), porque os detetores existentes medem a intensidade do sinal e não a fase. Para tal fim, devemos modular a onda, como explicado a seguir. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 68 Vamos considerar duas ondas planas monocromáticas, de frequências ω + Δω e ω − Δω, propagando-se ao longo da direção z, com os correspondentes vetores de onda k + Δk e k − Δk. Aplicando o princípio da superposição introduzido por Young, temos: E = E 0 exp{ i (k + Δk ) z − i (ω + Δω) t} + E 0 exp{ i (k − Δk ) z − i (ω − Δω) t} (4.1) Através de uma manipulação matemática simples desta equação chegamos a: E = E 0 exp{ i (kz − ωt )}[exp{ i (Δkz − Δωt )} + exp{− i (Δkz − Δωt )}] ⇒ E = 2E 0 exp{ i (kz − ωt )}cos(Δkz − Δωt ) (4.2) Como usualmente feito nos livros de eletromagnetismo, tomamos apenas a parte real desta expressão, o que nos leva a: E = 2 E 0 cos (kz − ωt ) cos (Δkz − Δωt ) (4.3) Isto nos dá uma onda de frequência ω modulada por outra, de frequência Δω, como mostra a Fig. 4.1. A B Fig. 4.1 - Modulação da amplitude da onda. De acordo com a equação anterior, vemos que a onda portadora, de frequência maior, tem a forma cos(kz-ωt) e a modulação é dada por cos(Δkz − Δωt). Vamos concentrar nossa atenção nos pontos A e B, que são respectivamente máximos da modulação e da onda portadora, e determinar as velocidades com que estes pontos se propagam. Estes máximos satisfazem as condições: Ponto A: S. C. Zilio Δkz - Δωt = 2πm (4.4a) Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 69 kz - ωt = 2πn Ponto B: (4.4b) onde m e n são inteiros. Diferenciando z com relação a t nas expressões acima obtemos: Δω ⎛ dz ⎞ ⎜ ⎟ = vg = Δk ⎝ dt ⎠ g Ponto A: (4.5a) ω ⎛ dz ⎞ ⎜ ⎟ = vf = k ⎝ dt ⎠ f Ponto B: (4.5b) que são respectivamente as velocidades da modulação e da onda portadora. A velocidade da onda portadora leva o nome de velocidade de fase e a da modulação o de velocidade de grupo. Neste caso em que temos duas ondas monocromáticas, o espectro de frequências é composto por duas “funções delta”. Para o caso de um “pacote” ou grupo de ondas cujo espectro de frequências é uma função caixa, como mostra a Fig. 4.2, teremos que somar (integrar) todas as componentes de frequências para encontrar a expressão do campo elétrico como fizemos para as duas ondas monocromáticas na eq. (4.1). Assim, E ( z, t ) = ω0 + Δω 2 ω0 − Δω 2 ∫E 0 exp{i (kz − ωt )} dω (4.6) E(ω) E0 Δω ω0 ω Fig. 4.2 - Espectro de freqüências tipo caixa. Para efetuar esta integração devemos levar em conta que pode haver dispersão do pacote, isto é, k pode ser uma função de ordem S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 70 superior a ω, como veremos quando tratarmos a interação entre a luz e a matéria no Cap. 9. Vamos expandir k em torno de ω0, de acordo com: k (ω) = k 0 + [ dk (ω − ω 0 ) + ϕ (ω − ω 0 ) 2 dω 0 ] (4.7) O termo quadrático pode ocorrer no caso em que houver dispersão no índice de refração, isto é, quando n = n(ω). Desprezando termos de ordens superiores à linear em ω (caso sem dispersão) temos: Δω 2 ⎤ ⎪⎫ ⎞ dk ⎪⎧ ⎡⎛ E 0 exp⎨ i ⎢⎜⎜ k 0 + (ω − ω 0 ) ⎟⎟ z− iωt ⎥ ⎬ dω dω 0 ⎪⎩ ⎣⎝ ⎠ ⎦ ⎪⎭ (4.8) ⎧ ⎡ dk ⎤⎫ E(z, t) = E 0 exp{i (k 0 z − ω 0 t )}. ∫ exp⎨ iΩ ⎢ z − t ⎥ ⎬ dΩ Δω ⎦⎭ ⎩ ⎣ dω 0 − (4.9) ω0 + E ( z, t ) = ∫ Δω ω0 − 2 Fazendo a substituição Ω = ω − ω0 obtemos: + Δω 2 2 O primeiro termo desta expressão representa a onda portadora e o segundo é a função forma ou modulação que passaremos a chamar g(z,t). Assim, g ( z, t ) = E 0 + x − Δω 2 ∫ Δω 2 ⎧ ⎡ dk ⎤⎫ sen φ ⎛ Δω ⎞ z − t ⎥ ⎬ dΩ = 2E 0 exp⎨ iΩ ⎢ ⎟ ⎜ φ ⎝ 2 ⎠ ⎦⎭ ⎩ ⎣ dω 0 (4.10) onde φ = ⎛⎜ Δω ⎞⎟ ⎡⎢ dk z − t ⎤⎥ . A Fig. 4.3 mostra o pacote de ondas obtido ⎝ 2 ⎠ ⎣ dω 0 ⎦ através das equações (4.9) e (4.10). Seu valor máximo ocorre quando φ = 0, ou seja, quando dk z = t. A velocidade com que o pacote se propaga, dω 0 que é a já conhecida velocidade de grupo, é: vg = S. C. Zilio dz dω = dt dk 0 (4.11) Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 71 Fig. 4.3 - Pacote de ondas correspondente ao espectro de frequências tipo caixa. Se houvéssemos tomado o termo de ordem quadrática na expansão de k, obteríamos a dispersão do pacote, isto é, ele mudaria de forma ao se propagar. Isto ocorre porque a velocidade de grupo passaria a ter um termo dependente da freqüência e assim, diferentes componentes espectrais se propagariam com velocidades diferentes. Desta forma, haveria uma separação cromática ao longo do pacote, efeito este que leva o nome de varredura em freqüência. O conhecimento de como um pacote se dispersa é de muita importância nas telecomunicações, em particular, quando se pretende transmitir uma seqüência de pulsos curtos numa fibra óptica. Se a taxa de repetição for alta, os pulsos estarão muito próximos e poderão se superpor, produzindo confusão na informação que está sendo transmitida. Deixaremos a análise da dispersão de um pulso como exercício, mas vamos mencionar aqui que esta dispersão da velocidade de grupo pode ser cancelada por um efeito não linear de terceira ordem chamado de auto-modulação de fase. Isto dá origem ao sóliton temporal que veremos na seção 4.6. Além da dispersão devida à variação do índice de refração com a frequência, que acabamos de ver, existe um outro tipo de dispersão nas fibras ópticas, chamada de dispersão modal. Cada um dos modos transversais mostrados na Fig. 3.9 possui uma velocidade de propagação diferente. Se o pulso de luz constituir-se de uma soma destes modos, cada um deles caminhará com velocidade diferente, acarretando no alargamento do pulso. Para evitar esta complicação, costuma-se usar para as comunicações ópticas fibras mono-modos que permitem a propagação apenas do modo TEM00. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 72 4.2 Efeito Doppler. Aplicações astronômicas Na seção anterior aprendemos a calcular a velocidade da onda eletromagnética. Vamos agora dedicar o restante do capítulo à analise de fatores que determinam sua frequência, começando pelo famoso efeito Doppler. Consideremos uma fonte S emitindo radiação eletromagnética de frequência f, num meio com índice de refração unitário, e um observador O. Temos quatro casos a tratar: a) O observador se aproxima da fonte com velocidade v0. Neste caso, o número de ondas que ele encontra num tempo τ é: f ' τ = fτ + v0τ v ⇒ f '= f + 0 λ λ (4.12) onde v0τ é a distância que ele percorre num tempo τ. Como c = λf, temos f’ = f (1+v0/c). Desta forma, o observador nota que a frequência da luz aumenta por um fator (1+v0/c) devido ao fato dele estar se aproximando da fonte. b) O observador se afasta da fonte com velocidade v 0. Este caso é similar ao anterior, apenas deve-se inverter o sinal de v 0: f’ = f (1- v0/c) (4.13) c) A fonte se aproxima do observador com velocidade vs. Olhando para a Fig. 4.4 vemos que durante um certo tempo τ, a frente de onda percorre uma distância O′A = cτ, enquanto que a fonte anda O' S = vsτ. A distância S A é dada por S A = cτ - vsτ = (c-vs)τ. Assim, o comprimento de onda na região S A é dado por: λ = S A /número de ondas = S A /fτ e portanto, λ = (c-vs)/f (4.14) A freqüência f’ observada por O será então dada por: f '= S. C. Zilio ⎛ c c = f ⎜⎜ λ ⎝ c − vs ⎞ ⎟⎟ ⎠ (4.15) Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 73 O’ S O A Fig. 4.4 - Demonstração ração do efeito Doppler no caso em que a fonte se aproxima do observador. d) A fonte se afasta do observador com velocidade vs, de forma que basta inverter o sinal no denominador: f '= ⎛ c c = f ⎜⎜ λ ⎝ c + vs ⎞ ⎟⎟ ⎠ (4.16) Estes quatro casos podem ser resumidos em apenas uma expressão matemática: ⎛ c + v0 ⎞ ⎟⎟ = f f' = f ⎜⎜ ⎝ c + vs ⎠ ⎛ 1 + v 0 /c ⎞ ⎟⎟ ⎜⎜ ⎝ 1 + v s /c ⎠ (4.17) onde o sinal das velocidades será positivo se elas estiverem no sentido do observador para a fonte. No caso de estarmos tratando com luz visível, o efeito chama-se Doppler-Fizeau. Exemplo disto são as aplicações astronômicas: (i) Estrelas duplas: são duas estrelas bastante próximas girando em torno do centro de massa do sistema, não separáveis através de telescópio. Porém, ao analisar-se o espectro de luz emitida, o efeito Doppler permite distinguir que são estrelas duplas. Esta situação está esboçada na Fig. 4.5. (ii) Expansão do universo: as estrelas têm uma velocidade de fuga de 10-30 km/s e os quasares de aproximadamente 0.8 c. Isto faz com que os espectros de luz emitidos por elementos químicos conhecidos tenham um deslocamento na direção do vermelho. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 74 1 2 f1 f2 1 f1=f2 2 2 1 f2 f1 Fig. 4.5 - Efeito Doppler-Fizeau no caso das estrelas duplas. 4.3 Alargamento de linhas espectrais O funcionamento de lâmpadas de descarga e lasers a gás baseia-se no fato de que os átomos são excitados pela descarga elétrica e ao voltarem para o estado fundamental emitem luz de frequência ν0 = E/h, onde E é a diferença de energia entre os estados fundamental e excitado, e h é a constante de Planck. Note que aqui estamos denominando a frequência de ν, enquanto que na seção anterior a mesma era f. Devido ao fato das moléculas do gás possuírem movimento browniano, a linha ν0 adquire uma largura Δν que queremos calcular. Vamos considerar um gás com N moléculas/cm3, mantido à temperatura T num tubo de Geisler. Após a descarga elétrica observa-se a luz emitida na direção do eixo x com um espectrômetro, dando-se particular atenção à raia de frequência em torno de ν0. O número de moléculas/cm3 com componente x de velocidade compreendida entre vx e vx + dvx é dada por: dN = N ( ) m exp − mv 2x / 2kT dv x 2πkT (4.18) Admitamos que a intensidade total Idν emitida com frequência compreendida no intervalo ν e ν + dν é proporcional a dN. Assim temos: Idν = AdN = AN S. C. Zilio ( ) m exp − mv 2x /2kT dv x 2πkT (4.19) Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 75 Entretanto, vx e dvx podem ser tiradas da fórmula do efeito Doppler na qual a fonte está em movimento e o observador em repouso, eq. (4.15). Expandindo o denominador para vx/c << 1 chegamos a: ν= ν0 c ≅ ν 0 (1 + v x /c ) ⇒ v x = (ν − ν 0 ) ν0 1 − v x /c (4.20) Logo, dvx = (c/ ν0)dν. Desta forma, cancelando dν na expressão para I e usando a eq. (4.20) obtemos : ⎡ mc 2 ⎛ ν − ν 0 ⎞ 2 ⎤ AcN m I= exp ⎢− ⎜ ⎟ ⎥ ν0 2πkT ⎢⎣ 2kT ⎝ ν 0 ⎠ ⎥⎦ (4.21) que é a expressão da gaussiana mostrada na Fig. 4.6. I(ν) ΔνD ν0 ν Fig. 4.6 - Alargamento espectral devido ao efeito Doppler. Se as moléculas do gás estivessem em repouso, o espectro de frequências observado seria a função δ(ν- ν0). Entretanto, como elas se movem, o efeito Doppler faz com que haja um alargamento desta linha. É fácil mostrar que a largura da linha, ΔνD, é dada por: Δν D = 2 ν0 c 2l n 2 kT m (4.22) 4.4 Óptica relativística O efeito Doppler e a aberração da luz das estrelas, descoberta por Bradley em 1725, podem ser explicados em termos da relatividade restrita, introduzida em 1905 por Albert Einstein. Vamos inicialmente rever alguns de seus conceitos básicos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 76 (i) Postulados: a) As leis físicas são invariantes em forma para diferentes referenciais inerciais (referenciais não acelerados). b) A velocidade da luz é a mesma para todos os observadores inerciais. (ii) Transformações de Lorentz: Considere dois sistemas de coordenadas cartesianas O e O’, sendo r que O’ se move com velocidade v = vˆi , como mostra a Fig. 4.7. No instante t = 0 as duas origens coincidem. As transformações de Lorentz relacionam (x,y,z,t) do referencial O com (x’,y’,z’,t’) do referencial O’, de acordo com: x’ = γ(x-vt) x = γ(x’+vt’) y = y’ y’ = y z = z’ z’ = z t = γ(t’+vx’/c2) (4.23) t’ = γ(t-vx/c2) onde γ = 1 / 1 − v 2 / c 2 . r v = vî y’ y x x’ O z O’ z’ Fig. 4.7 - Referenciais com movimento relativo. (iii) Quadrivetores: Como vimos em (ii), as coordenadas espaciais e temporal estão intimamente ligadas, por isso é conveniente se trabalhar com vetores de quatro componentes (quadrivetor). Exemplos de quadrivetores são os de posição, vetor de onda e momentum, mostrados respectivamente a seguir: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética ⎛x⎞ ⎜ ⎟ ⎜y⎟ ⎜ z ⎟, ⎜ ⎟ ⎜ ict ⎟ ⎝ ⎠ 77 ⎛ kx ⎞ ⎟ ⎜ ⎜ ky ⎟ ⎜ k ⎟, ⎜ z ⎟ ⎜ iω/c ⎟ ⎠ ⎝ ⎛ px ⎞ ⎟ ⎜ ⎜ py ⎟ ⎜ p ⎟ ⎜ z ⎟ ⎜ iE /c ⎟ ⎝ 0 ⎠ O produto escalar de dois quadrivetores é feito como normalmente se multiplicam matrizes. Como exemplo, tomemos o produto dos dois primeiros quadrivetores mostrados acima: φ = kxx + kyy + kzz - ωt = k.r − ωt rv (4.24) que é a fase da onda plana. Como o produto escalar de quadrivetores é invariante quando se muda de um referencial inercial para outro, a fase da onda plana é a mesma quando vista por observadores em O e O’. (iv) Efeito Doppler longitudinal: Considere uma onda plana propagando-se na direção do eixo x r ( k = k î ). A fase vista pelo observador em O será φ = kx - ωt e em O’ r v será φ’ = k'.r '− ω' t ' = kx’x’+ ky’y’+ kz’z’- ω’t’, isto é, estamos supondo que em O’ a onda se propaga numa direção arbitrária. Como φ = φ’ temos: kx - ωt = kx’x’+ ky’y’+ kz’z’- ω’t’ (4.25) Usando as transformações dadas pela eq. (4.23), obtemos: ⎛ vx' ⎞ kγ ( x '+ vt ' ) − ωγ⎜ t '+ 2 ⎟ = k ' x x '+ k ' y y'+ k ' z z'−ω' t ' c ⎠ ⎝ (4.26) Igualando os coeficientes de cada coordenada temos as seguintes relações: (4.27a) k y’ = k z’ = 0 k x’ = γ (k- ωv ) c2 (4.27b) ω’ = γ (ω-kv) Mas como k = ω/c então, ω' = ω S. C. Zilio 1 − v/c 1 − v 2 /c 2 (4.27c) e consequentemente, Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 78 ν' = ν 1 − v/c 1 + v/c (4.28) que é a fórmula do efeito Doppler longitudinal obtida pela relatividade restrita. Para recuperarmos a fórmula clássica devemos expandir este resultado para v<<c. (v) Efeito Doppler transversal: Considere agora a onda plana se propagando na direção do eixo y r r ˆ ( k = kj ), sendo portanto perpendicular a v As fases vistas em O e O’ são respectivamente: φ = ky - ωt e φ’ = k '.r '− ω' t = kx’x’+ ky’y’+ kz’z’- ω’t’. Igualando estes dois escalares chegamos a: r v φ = φ' ⇒ ky − ωt = k ' x x '+ k ' y y'+ k ' z z'−ω' t ' (4.29) Novamente, usando as transformações dadas pela eq. (4.23), obtemos: ⎛ vx' ⎞ ky'−ωγ ⎜ t '+ 2 ⎟ = k ' x x '+ k ' y y'+ k ' z z'−ω' t ' c ⎠ ⎝ (4.30) de onde tiramos as seguintes relações: k z’ = 0 (4.31a) k x’ = - (4.31b) ωγv c2 k y’ = k = ω/c ω' = ωγ = ω 1 − v 2 /c 2 (4.31c) (4.31d) sendo que esta última expressão nos dá a fórmula do efeito Doppler transversal, que não possui análogo clássico. (vi) Aberração da luz das estrelas: De acordo com as eq. (4.31), vemos que a direção de propagação da onda plana no referencial O’ não é na direção de y’, mas forma com este um ângulo dado por: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética tgα = 79 k ′x v/c γv ωγv = = = 2 k ′y ωc /c c 1 − v 2 /c 2 (4.32) Este fenômeno de mudança de direção é conhecido como aberração da luz das estrelas. Devido ao fato de que um observador na Terra tem uma velocidade finita ele verá a posição da estrela diferente da posição real que ela ocupa, devido ao problema de aberração citado acima. A Fig. 4.8 ilustra este efeito. posição real posição aparente r k y’ z’ α O’ r k' velocidade da Terra x’ Fig. 4.8 - Aberração da luz proveniente das estrelas. 4.5 Modulação eletro-óptica de frequência Na análise que fizemos até agora dos fenômenos envolvendo a fase, as partes espacial e temporal eram independentes, isto é, φ(z,t) = kz ωt. Assim, a identificação da frequência da onda, associada à evolução temporal da fase, era imediata. Entretanto, podem ocorrer situações onde o índice de refração, e consequentemente o vetor de propagação, depende do tempo. Desta forma, a fase da onda torna-se φ(z,t) = k(t)z - ωt, e as partes espacial e temporal ficam misturadas pelo primeiro termo. Como a frequência encontra-se associada à evolução temporal da fase da onda eletromagnética, podemos definir: ω=− ∂φ ∂t (4.33) como sendo a frequência generalizada da onda. Com este conceito podemos analisar alguns efeitos responsáveis pelo surgimento de novas S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 80 componentes de frequência. Começaremos com o efeito eletro-óptico que pode modificar a frequência da onda, ou introduzir novas componentes de frequência, como veremos a seguir. Existem cristais anisotrópicos não lineares (KDP, LiNbO3, LiTaO3, etc.) cujos índices de refração se modificam com a aplicação de um campo elétrico externo. Estes cristais são denominados eletro-ópticos. Consideremos uma onda propagando-se pelo cristal ao longo do eixo óptico z, com polarização na direção do eixo x, conforme mostra a Fig. 4.9. Um campo elétrico variável no tempo é aplicado, também na direção do eixo x. O índice de refração é dado por: n(t) = n0 + αV(t), onde V(t) é a voltagem aplicada, α é a resposta do cristal ao campo externo e n0 é o índice de refração na ausência de campo. Esta variação do índice de refração produz uma alteração na fase da onda, que passa a ser: φ(t) = k0n0L - ω0t + k0αLV(t) r E (4.34) x r k V(t) z y L Fig. 4.9 - Propagação de uma onda eletromagnética ao longo de um cristal eletro-óptico. onde L é o comprimento do cristal, ω0 é a frequência da luz incidente e k0 é o vetor de onda no vácuo. Vamos em seguida considerar dois tipos de voltagens aplicadas sobre o cristal, que são os casos de maior interesse prático. a) Voltagem do tipo rampa - Nesta situação, V(t) = βt, e a fase de onda fica: φ(t) = k0n0L - ω0t + k0αLβt (4.35) de forma que obtemos a frequência generalizada como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 81 ω=− ∂φ = ω 0 − k 0 αβ L ∂t (4.36) isto é, o cristal eletro-óptico faz variar um pouco a frequência da luz, como mostrado na Fig. 4.10. k0αβL ω ω0 ω Fig. 4.10 - Alteração da frequência da luz ao passar por um cristal eletro-óptico com voltagem do tipo rampa. b) Voltagem senoidal - Neste caso, vamos tomar V(t) = -AsenΩt, onde Ω é uma frequência gerada por uma fonte de rádio-frequência (em geral da ordem de 100 MHz), de forma que: φ(t) = k0n0L - ω0t - k0αLAsenΩt (4.37) que dá origem à uma frequência: ω=− ∂φ = ω 0 + k 0 αLAΩcosΩt ∂t (4.38) que é modulada pelo termo cosΩt. Para entendermos como esta modulação altera o espectro de frequência da luz, vamos analisar o que acontece com a onda plana neste caso. E = E0 exp{i (k0n0L - ω0t - k0αLAsenΩt)} (4.39) O termo exp{-i MsenΩt}, com M = k0αLA, pode ser expandido numa série de funções de Bessel de acordo com: exp{-i MsenΩt} = ∑J +∞ n = −∞ n (M)exp{ − inΩt} (4.40) de forma que o campo elétrico é dado por: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 82 A fase da onda eletromagnética E = E 0 exp{ik 0 n 0 L}[J 0 (M ) exp{− iω0 t} + J 1 (M ) exp{− i(ω 0 + Ω) t} + J −1 (M ) exp{− i(ω0 − Ω) t}+ ....] (4.41) ω0. Lembrando-se que J-n (M) = (-1)n Jn(M), temos um novo espectro de de onde vemos a criação de vários picos laterais à frequência fundamental frequência da luz, que é mostrado na Fig. 4.11. Este tipo de modulação tem suas principais aplicações na geração de novas frequências para espectroscopia com laser e no “mode-locking” de lasers. J0(M) J1(M) J-2(M) ω0−2Ω ω0−Ω J2(M) ω0 ω0+Ω ω0+2Ω ω J-1(M) Fig. 4.11 - Geração de picos laterais (sidebands) através de modulação eletroóptica. 4.6 Auto-modulação de fase O efeito eletro-óptico é conseqüência de um processo não linear de segunda ordem que pode ocorrer em cristais que não possuem simetria de inversão. A geração de segundo harmônico é um efeito que também tem origem na não linearidade de segunda ordem. Entretanto, em cristais que possuem simetria de inversão estes efeitos não se manifestam e a não linearidade de ordem mais baixa que pode ocorrer é a de terceira ordem. Meios do tipo Kerr se enquadram nesta classe de materiais; neles o índice de refração depende do quadrado do campo elétrico da luz (de sua intensidade), ao contrário do efeito eletro-óptico, que varia linearmente com o campo elétrico externo aplicado. A não linearidade Kerr pode ser expressa como: n(I) = n0 +n2I (4.42) onde n0 é o índice de refração na ausência de luz e n2 é denominado de índice de refração não linear. No caso em que a luz se constitui de pulsos S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 83 curtos, o índice de refração dependerá do tempo devido à variação de I com t na eq. (4.42). Isto fará com que a frequência da luz se modifique de acordo com: ω = ω0 – k0n2LdI/dt (4.43) Se o pulso for do tipo gaussiano, sua derivada terá uma forma dispersiva e as frequências geradas variarão no tempo, como mostra a Fig. 4.12. Por outro lado, um pulso curto tem associado a si um espectro de frequências com certa largura, como veremos posteriormente. Na região de dispersão anômala do índice de refração do meio (dn/dλ>0), as freqüências correspondentes ao azul caminharão mais rapidamente e tentarão ficar na parte frontal do pulso (t < 0 na Fig. 4.12). 15 Δω = ω − ω0 10 5 0 -5 -10 -15 -150 -100 -50 0 50 100 150 tempo Fig. 4.12 – Variação da frequência devido ao efeito Kerr ao longo de um pulso de luz. O tempo t = 0 corresponde ao centro do pulso. Entretanto, devido à auto-modulação de fase, componentes vermelhas são geradas na frente do pulso, que nada mais é que uma redistribuição de energia. Como conseqüência, a dispersão quer jogar as frequências maiores (azul) para a parte frontal do pulso, enquanto que o efeito Kerr que jogar as frequências menores (vermelho). Na parte final do pulso ocorre o inverso: a dispersão joga as frequências menores (vermelho) para a parte final do pulso, enquanto que o efeito Kerr joga as frequências maiores. Para uma intensidade convenientemente escolhida, um efeito cancela o outro e o pulso acaba se propagando sem dispersão. Este pulso que se propaga sem modificações recebe o nome de sóliton. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 84 Bibliografia 4.1. J. R. Reitz, F. J. Milford and R. W. Christy, Fundamentos da Teoria Eletromagnética, Editora Campus, RJ (1982) 4.2. G. R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, NY (1968). 4.3. Efeito Doppler - veja vol. II da coleção Sears - Zemansky. 4.1. Demonstre a relação: 1 = 1 − λ 0 dn vg vf Problemas c dλ 0 4.2. Mostre que a velocidade de grupo pode ser escrita como: vg = c n + ω dn dω 4.3. A velocidade de grupo da luz numa certa substância varia inversamente proporcional ao comprimento de onda. Como varia o índice de refração com o comprimento de onda? 4.4. O poder de dispersão do vidro é definido pela razão nD/(nF-nC), onde C, D e F referem-se aos comprimentos de onda Fraunhoffer: λC = 6563 Å, λD = 5890 Å e λF = 4861 Å. Encontre a velocidade de grupo no vidro, cujo poder de dispersão é 30 e nD = 1,5. 4.5. A constante dielétrica de um gás varia com a frequência angular de acordo com: ε =1+A(ω02-ω2), onde A e ω0 são constantes. Compute as velocidades de fase e de grupo para a propagação de luz no gás, supondo que o segundo termo de ε é << 1. 4.6. A curva de dispersão de um vidro pode ser representada aproximadamente pela equação empírica de Cauchy: n = A + B/λ2. Encontre as velocidades de fase e de grupo para λ = 5.000 Å num vidro onde A = 1.4 e B = 2.5 x 106 (Å)2. 4.7. Mostre que um pacote de ondas se dispersa se considerarmos termos de ordem quadrática em (ω-ω0) na expansão do vetor de onda k(ω). Sugestão: Considere uma distribuição de frequência do tipo gaussiana de E0 (ω). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A fase da onda eletromagnética 85 4.8. Prove a correção Doppler relativística geral ν' = ν ⎢1 − (v/c ) cos θ ⎥ , onde 2 2 ⎡ ⎢⎣ 1 − v /c θ é o ângulo que o vetor de onda k faz com o eixo x. ⎤ ⎥⎦ 4.9. No problema anterior encontre θ’, o ângulo que o vetor de onda k’ faz com o eixo x’ (fórmula geral para a aberração). 4.10. Prove que a velocidade da luz num meio em movimento é aproximadamente c + v m (1 − n −2 ) , onde vm é a velocidade do meio n com relação ao observador e n é o índice de refração do meio. O resultado mostra que a luz parece ser arrastada pelo meio. A quantidade (1 − n −2 ) é chamada coeficiente de arrastamento de Fresnel. Sugestão: use dx = dt dx '/dt '+ v 1 + ( v 2 /c 2 )dx '/dt ' 4.11. a) A fase de uma onda é φ = k [0.5 x + 0.5 y + β z] - ωt. Encontre o ângulo que ela faz com o eixo z. b) A fase da componente espectral ω de uma onda é φ = (ω/c) n(ω) z - ωt. Encontre a velocidade de grupo em torno da freqüência ω0. c) A fase de uma onda é φ = kz ωt – βt2/2. Encontre a freqüência instantânea da onda. 4.12. Considere duas ondas planas monocromáticas de mesma amplitude E0, com freqüências ω0 + δω e ω0 − δω , (δω << ω0) propagando-se ao longo da direção z. Suponha que exista dispersão do índice de refração, isto é, n = n(ω), tal que termos de ordem quadrática em (ω-ω0) devem ser considerados na expansão do vetor de onda k(ω). Encontre as velocidades de fase e de grupo desta onda. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 86 S. C. Zilio A fase da onda eletromagnética Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 87 A polarização da onda eletromagnética 5 5.1 Polarização linear No Cap. 2 analisamos a onda eletromagnética rno que se refere à sua direção de propagação, dada pelo vetor de onda k , e como esta se altera quando o raio percorre um meio com índice de refração variável. Este tópico está ligado à óptica geométrica, que é o limite clássico da óptica ondulatória. No Cap. 3 analisamos a equação de ondas e suas possíveis soluções, que como vimos, são dependentes das condições de contorno do problema sendo tratado. Já no Cap. 4 estivemos estudando a fase da onda eletromagnética, que é talvez sua característica mais importante. Vimos como calcular a velocidade de propagação e as mudanças em freqüência que ocorrem devido ao movimento relativo entre o observador e fonte, ou à variação temporal do índice de refração. Agora r r vamos analisar os fatores pré-exponenciais E 0 e H 0 cuja mudança de direção no espaço e tempo determina os estados de polarização da luz. Considere uma onda eletromagnética plana, como discutido na seção 3.4, dada por: { { } } rr r r E = E 0 exp ± i(k.r − ωt ) rr r r H = H 0 exp ± i(k.r − ωt ) (5.1a) (5.1b) r r Se as amplitudes E 0 e H 0 são vetores reais e constantes, a polarização da onda é chamada linear. É tradicional em óptica especificarse a polarização da onda como sendo a direção do campo elétrico e plano de polarização aquele que o contém. Se a onda vier se propagando na S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 88 direção do observador, este verá o campo elétrico variando sobre um plano fixo conforme mostra a Fig. 5.1. r H r E plano de polarização r k Fig. 5.1 - Propagação de uma onda plana linearmente polarizada. 5.2 Polarização elíptica r No caso da polarização linear, a projeção do vetor E sobre o r plano xy descreve um segmento de reta. No entanto, quando E 0 (e r conseqüentemente H 0 ) for um número complexo, a projeção será uma elipse (ou circunferência, como veremos na próxima seção). Considere a r r soma de dois campos E 1 e E 2 , respectivamente nas direções x e y, propagando-se na direção z, conforme mostra a Fig. 5.2. Ambos possuem a mesma freqüência e vetor de onda, e são soluções possíveis da equação de ondas, que diferem por estarem rodados entre si de π/2. Além disto, eles podem também possuir uma diferença de fase relativa que chamaremos de δ. As duas soluções são linearmente independentes e, como tal, combinações lineares delas fornecem outras soluções possíveis da equação de onda. Vejamos quais novos tipos de soluções podem advir destas combinações lineares. O campo resultante é dado por: r r r E = E1 + E 2 = (E10 e iδ î + E 20 ĵ) exp{i(kz − ωt)} (5.2) ou alternativamente, tomando a parte real: r E(r, t) = E10 cos(kz − ωt + δ)î + E 20 cos(kz − ωt)ĵ S. C. Zilio (5.3) Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 89 y y r H1 r E1 r E2 r H2 x x r k r k z z Fig. 5.2 - Representação gráfica da orientação de duas soluções possíveis para a equação de onda. r r A variação de E( r , t) no espaço e tempo está mostrada na Fig. 5.3 e sua projeção no plano xy, mostrada na Fig. 5.4, descreve uma elipse. r H r E z Fig. 5.3 - Onda plana com polarização elíptica . y ψ a b E10 x E20 Fig. 5.4 - Projeção do campo elétrico no plano xy. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 90 Esta elipse é descrita pelas equações: ⎛ E1 ⎜⎜ ⎝ E 10 ⎞ ⎛ E2 ⎟⎟ + ⎜⎜ ⎠ ⎝ E 20 2 ⎞ EE ⎟⎟ − 2 1 2 cosδ = sen 2 δ E 10 E 20 ⎠ 2 tg 2ψ = 2 (5.4a) E 10 E 20 cos δ 2 E 10 − E 220 (5.4b) 2 a 2 + b 2 = E 10 + E 220 (5.4c) ab = E10 E 20 sen δ (5.4d) cuja demonstração deixaremos como exercício. A elipse é caracterizada por a, b, e ψ, que são conhecidos como parâmetros de Stokes. Alguns casos particulares desta situação que estamos estudando ocorrem quando: a) b) δ = 0 ⇒ E1 = E 10 E2 E 20 E δ = π ⇒ E 1 = − 10 E 2 E 20 (Fig.5.5a) (Fig. 5.5b) ⎛E ⎞ ⎛E ⎞ π (Fig. 5.5c) δ = ⇒ ⎜⎜ 1 ⎟⎟ + ⎜⎜ 2 ⎟⎟ = 1 2 E E ⎝ 10 ⎠ ⎝ 20 ⎠ r Neste caso, a projeção de E no plano xy nos dá uma elipse que roda no sentido horário, tal que: E 1 = E 10 sen ωt e E 2 = E 20 cos ωt . 2 2 c) Quando δ = −π/2 teremos ainda uma elipse com os eixos principais, coincidindo com x e y, mas com polarização no sentido antihorário, como mostrado na Fig. 5.5d. De um modo geral, pode-se mostrar que para 0 < δ < π temos polarização no sentido horário e para π < δ < 2π no sentido anti-horário. y y x a) δ = 0 y x b) δ = π y x x c) δ = π/2 d) δ = -π/2 Fig. 5.5 - Alguns casos particulares de polarizações elípticas. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 91 5.3 Polarização circular Trata-se novamente de um caso particular de luz elipticamente polarizada. Quando δ = ±π/2 e E 10 = E 20 = E 0 , teremos: E12 + E 22 = E 02 (5.6a) E1 = E 0 cos ωt (5.6b) E 2 = ±E 0 sen ωt (5.6c) (+ para δ = π/2 e - para δ = π/2) e assim a elipse se transforma numa circunferência. 5.4 Lâminas de quarto de onda e meia onda Queremos agora partir de luz linearmente polarizada e rodar seu plano de polarização ou gerar luz circularmente polarizada. Isto pode ser conseguido com um cristal anisotrópico cujo índice de refração depende da direção (birrefringência), como por exemplo, mica, quartzo, etc. Voltaremos a este tópico no capítulo que aborda a óptica de cristais. Considere a Fig. 5.6, onde luz linearmente polarizada incide sobre uma lâmina de espessura d com eixos rápido e lento respectivamente nas direções x e y. E y (nl) x (nr) z d Fig. 5.6 - Incidência de luz sobre uma lâmina birrefringente. O campo elétrico incidente forma um ângulo de 45° com o eixo x de maneira que suas componentes são: Ex = E0 exp{i(k r z- ωt)} e Ey = E0 S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 92 exp{i(k lz- ωt)}. A onda atinge a placa em z = 0, onde Ex = E0 exp{-i ωt} e Ey = E0 exp{-i ωt}, e sai em z = d com: Ex(d) = E0 exp{i(k r d- ωt)} e Ey(d) = E0 exp{i(k ld- ωt)}. A diferença de fase entre as componentes emergentes é: ⎛ 2π 2π ⎞ ⎛n n ⎞ 2πd (n l − n r ) δ = (k l − k r )d = ⎜⎜ − ⎟⎟ d = 2π ⎜⎜ l − r ⎟⎟ d = λ0 ⎝ λl λr ⎠ ⎝ λ0 λ0 ⎠ (5.7) Para termos luz circularmente polarizada, devemos fazer δ = π/2 e assim, π 2πd (n l − n r ) ⇒ (n l − n r )d = λ 0 = λ0 2 4 (5.8) ou seja, a diferença de caminhos ópticos deve ser igual a um quarto de onda. Por outro lado, quando δ = π, o plano de polarização da onda será rodado de 90°. Neste caso, a diferença de caminhos ópticos deve ser meia onda: π= 2πd (n l − n r ) ⇒ (n l − n r )d = λ 0 λ0 2 (5.9) Se a luz incidente sobre a lâmina de meia onda não estiver com polarização a 45°, o campo será rodado por um ângulo 2θ, como veremos na seção 5.7. 5.5 Obtenção de luz linearmente polarizada Existe uma variedade de maneiras de se obter luz linearmente polarizada. Vamos sumarizar algumas delas. a) Por reflexão - quando estudarmos as equações de Fresnel mais adiante, veremos que ao se incidir luz não polarizada sobre uma superfície separando dois meios de índices de refração n1 e n2, a luz refletida sai r polarizada, com E paralelo à superfície, quando o ângulo de incidência for igual ao ângulo de Brewster, como indicado na Fig. 5.7. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética NP θB 93 . P n1 n2 Fig. 5.7 - Polarização por reflexão. b) Dicroismo - certos materiais possuem moléculas orientadas numa direção preferencial e absorvem radiação com polarização paralela ao seu eixo. Conseqüentemente tal material deixará passar apenas a luz que tiver polarização perpendicular ao eixo da molécula como mostra a Fig. 5.8. Um exemplo disto é o polaróide. P NP vibração Fig. 5.8 - Polarização por dicroismo. c) Processo de difusão de luz - a luz espalhada por moléculas de um meio, geralmente está parcialmente polarizada. O maior grau de polarização ocorre quando as direções luz-molécula e moléculaobservador formarem um ângulo de 900, conforme representado na Fig. 5.9. dipolo oscilante NP z P Fig. 5.9 - Polarização por espalhamento. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 94 d) Grade metálica - geralmente usada para infravermelho e micro-ondas. A componente de luz que tiver polarização paralela aos fios da grade produzirá uma corrente elétrica, sendo assim parte dissipada pelo efeito Joule e parte refletida. Por outro lado, a componente perpendicular passa e teremos assim luz linearmente polarizada na direção perpendicular à grade (ver Fig. 5.10). NP P Fig. 5.10 - Polarização por grade metálica. e) Dupla refração - aparece em materiais birrefringentes tais como mica, quartzo, calcita, KDP, etc. O conhecido prisma de Nicol usa este princípio para polarizar a luz. Considere radiação não polarizada incidente sobre o prisma birrefringente mostrado na Fig. 5.11. A componente de campo elétrico que incidir no meio, com polarização paralela ao eixo rápido, não será praticamente defletida pois nr é pequeno (raio ordinário) ao passo que a outra componente será pois nl é bem maior (raio extraordinário). ordinário NP P2 P1 extraordinário Fig. 5.11 - Polarização por dupla refração. 5.6 Equações de Fresnel Estamos interessados em detalhar um pouco mais o que acontece com a radiação eletromagnética quando incide num meio com índice de refração diferente daquela na qual ela se propaga. Em particular queremos S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 95 analisar os ângulos de reflexão e refração e as amplitudes dos campos elétricos transmitido e refletido. a) Leis da reflexão e refração Considere dois meios homogêneos isotrópicos, lineares e não condutores (σ = J = 0) com índices de refração n1 e n2, separados por uma interface localizada sobre o plano xz. Um raio de amplitude E, propagando-se no meio 1 incide sobre a interface, formando um ângulo θ com o eixo y. O raio refletido tem amplitude E’ e sua direção de propagação n̂ ′ é especificada pelos ângulos θ’ e φ’ Analogamente, o raio refratado é especificado por E”, θ” e φ”, como mostra a Fig. 5.12. Note o fato de estarmos supondo que os três raios não estão num mesmo plano. Das equações de Maxwell podemos deduzir condições de r r contorno que estabelecem a continuidade das componentes de E e H ao r r r se passar de um meio para outro. Os campos E , E ' e E" são dados por: { { { } rr r r E = E 0 exp i(k.r − ωt ) r r r r E' = E '0 exp i(k '.r − ω' t ) r r r r E" = E "0 exp i(k".r − ω" t ) } } (5.10a) (5.10b) (5.10c) enquanto que os campos magnéticos se relacionam com os campos elétricos através de: r k y θ θ’ r k' n1 x n2 θ’’ r k" Fig. 5.12 - Geometria da reflexão e refração de um raio de luz. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 96 r r r kxE H= μω r r r k ' xE' H' = μω′ r r r k" xE" H" = μω′′ (5.11a) (5.11b) (5.11c) Tomando um pequeno elemento de volume S dh contendo parte da interface (Fig. 5.13), podemos aplicar a forma integral da lei de Gauss: ∫ ∇.D dϑ = ∫ D.da = ∫ r r r r υ s υ Como a carga superficial é dada por lim ∫ s ∫ dh →0 ρdϑ = ∫ ρdhda ∫ υ ρdh = σ, ficamos com: r r D.da = ∫ σda h (5.12) (5.13) s r r D1.n̂1da + ∫ D 2 .n̂ 2da = ∫ σda Assim, de acordo com a Fig. 5.13, temos: s1 s2 s (5.14) S1 n̂ 1 dh interface S2 n̂ 2 Fig. 5.13 - Elemento de volume usado na obtenção das condições de contorno. Note que S1 = S2 = S pois dh ≅ 0 e nos leva a: S. C. Zilio n̂ 1 = − n̂ 2 = n̂. Logo, a eq. (5.14) Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética ( 97 ) r r n̂. D1 − D 2 = σ (5.15) que estabelece que a variação da componente normal do deslocamento elétrico é igual à carga superficial. No nosso caso específico σ = 0, logo, a r componente normal de D é contínua: ( ) r r n̂. D1 − D 2 = 0 ( ( ( (5.16) ) ) ) Procedendo de maneira análoga com as outras equações de Maxwell, obtemos: r r n̂ x E1 − E 2 = 0 r r n̂. B1 − B2 = 0 r r r n̂ x H1 − H 2 = J = 0 {( {( )} (5.17) (5.18) (5.19) {( )} {( )} A eq. (5.17) estabelece que para y = 0 a componente tangencial do campo elétrico é contínua. Logo, rr r r E 0 x exp i k.r − ωt + E ′0 x exp i k '.r − ω′t r r = E ′0′x exp i k".r − ω′′t para a componente x e {( {( )} )} rr r r E 0 z exp i k.r − ωt + E ′0 z exp i k '.r − ω′t r r = E ′0′z exp i k".r − ω′′t )} (5.20a) (5.20b) para a componente z. Como estas igualdades são válidas para qualquer t e qualquer ponto r da interface, devemos ter: ω = ω′ = ω′′ rr r r r r k.r = k '.r = k".r (5.21a) (5.21b) r r r onde r = x î + zk̂ . Esta última igualdade estabelece que os vetores k , k ' r e k" são coplanares, isto é, φ’ = φ” = 0 e, portanto: k sen θ = k ′ sen θ′ = k ′′ sen θ′′ S. C. Zilio (5.22) Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 98 Por outro lado, k = k’ pois k = ω/v1 e k’ = ω’/v1 = ω/v1. Logo, θ = θ’, ou seja, o ângulo de incidência θ é igual ao ângulo de reflexão θ’. O ângulo de refração θ” pode ser encontrado usando-se k = n1k0 e k”= n2k0 na eq. (5.22). Assim, n1sen θ = n2sen θ′′ , que é chamada de lei de Snell. Em resumo temos as seguintes regras: (i) os raios incidente, refletido e refratado são coplanares, (ii) o ângulo de incidência θ é igual ao ângulo de reflexão θ’, e (iii) os ângulos de incidência e refração se relacionam através da lei de Snell n 1 sen θ = n 2 sen θ′′ b) Amplitudes das ondas refletida e refratada r Vamos analisar dois casos: a) aquele em que E é paralelo à interface (e, portanto, perpendicular ao plano xy) como mostrado na Fig. 5.14(a), que leva o nome de onda TE (transversa elétrica) ou polarização r σ (ou s) e b) quando H for paralelo à interface, que corresponde à onda TM (transversa magnética) também chamada polarização π (ou p), r r mostrada na Fig. 5.14(b). No caso (a) E = E ẑ e para (b) H = H ẑ , o mesmo se dando com as ondas refletida e refratada. Logo, usando as eq. (5.17) e (5.19) podemos fazer a seguinte análise: caso a) TE E + E’= E” H cos θ − H′ cos θ = H′′ cos θ′′ (5.23a) (5.23b) Usando a eq. (5.11) para eliminar H em função de E, obtemos: kE cos θ − kE ′ cos θ = k ′′E ′′ cos θ′′ (5.24) de onde saem os coeficientes de transmissão e reflexão definidos por: τσ = 2n 1 cos θ E ′′ = E n 1 cos θ + n 2 cos θ′′ ρσ = S. C. Zilio E′ n 1 cos θ − n 2 cos θ′′ = E n 1 cos θ + n 2 cos θ′′ (5.25a) (5.25b) Óptica Moderna – Fundamentos e Aplicações n1 n2 A polarização da onda eletromagnética r E r H y r k θ r E r k r H r H' y θ r H' r E' x θ” r E" r k" r H" θ’ r k' n1 n2 θ” (a) r k' r E' θ’ 99 (b) r H" r E" r k" Fig. 5.14 - Reflexão e refração de uma onda (a) TE (polarização s) e (b) TM (polarização p). O círculo aberto significa que o campo está saindo do plano e a cruz que ele está entrando no plano. Caso b) TM H - H’= H” E cos θ + E ′ cos θ = E ′′ cos θ′′ (5.26a) (5.26b) Novamente, usando a eq. (5.11) para eliminar H em função de E, obtemos: k (E - E ′) = k ′′E ′′ , de onde sai: τπ = ρπ = 2n 1 cos θ E ′′ = E n 2 cos θ + n 1 cos θ′′ E ′ − n 2 cos θ + n 1 cos θ′′ = E n 2 cos θ + n 1 cos θ′′ (5.27a) (5.27b) 2 1 − (n 1 n 2 ) sen 2 θ , e o índice de As equações acima podem ser modificadas usando-se a lei de Snell para cos θ" = 1 − sen 2 θ" = refração relativo (n = n2/n1): ρσ = S. C. Zilio cos θ − n 2 − sen 2 θ cos θ + n 2 − sen 2 θ (5.28a) Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 100 ρπ = − n 2 cos θ + n 2 − sen 2 θ n 2 cos θ + n 2 − sen 2 θ (5.28b) A Fig. 5.15 mostra a variação do coeficiente de reflexão em função do ângulo de incidência quando n2 > n1 (reflexão externa). O sinal negativo de ρ significa que o campo elétrico muda a fase em 180° após a reflexão. Note que ρπ = 0 quando: n 2 cos θ B − n 2 − sen 2 θ B = 0 ⇒ tg θ B = n = 1,0 0,0 (5.29) ρπ θB 0,5 n2 n1 ρσ -0,5 -1,0 0 15 30 45 60 75 90 Ângulo (graus) Fig. 5.15 - Coeficiente de reflexão externa. Como n2 > n1 temos tgθB > 1 e, consequentemente, θB > 45°. θB é conhecido com ângulo de Brewster. A Fig. 5.16 mostra o caso da reflexão interna (n1 > n2) com o ângulo de Brewster, sendo agora menor que 45°. Por outro lado, quando n = senθ temos um ângulo crítico θC acima do qual ρσ = ρπ = 1. Para n < senθ temos: B ρσ = cos θ − i sen 2 θ − n 2 cos θ + i sen 2 θ − n 2 ⇒ ρσ = 1 B (5.30) Um conceito erroneamente empregado é que se a refletividade é unitária, nenhuma luz penetra no meio menos denso. Isto não é verdade, como veremos a seguir. Supondo que a onda incidente na interface é plana e tomando o campo elétrico na forma exponencial, podemos escrever: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 101 ρσ 1,0 0,5 θC θB 0,0 -0,5 ρπ 0 15 30 45 60 75 90 ângulo (graus) {( )} rr E = E o exp i k.r − ω t = E o exp{i ( k x x + k y y − ω t )} Fig. 5.16 - Coeficiente de reflexão interna. (5.31) onde na última passagem usamos o fato que ao onda se propaga no plano r xy ( r = x î + yˆj ). Note que kx = k senθ e ky = k cosθ são as projeções de r k no plano xy. O módulo de k é (ω/c) n1. No meio com índice n2, o {( )} r r E " = E "0 exp i k " .r − ω t = E "0 exp {i ( k "x x + k "y y − ω t )} (5.32) r sendo as projeções de k ” dadas por kx” = k” senθ” e ky” = k” cosθ”, e seu campo elétrico pode ser escrito de maneira similar: módulo por k”= (ω/c)n2. Lembrando que n = n2/n1, pela lei de Snell temos senθ = n senθ” e consequentemente: ncosθ" = n 1 − sen 2 θ" = n 2 − sen 2 θ = i sen 2 θ − n 2 ( Desta forma, a parte espacial da fase da onda fica: k "x x + k "y y = k senθ x + i sen 2 θ − n 2 y ) E " = E "0 exp(−αy) exp{ i (k senθ x − ω t )} (5.33) (5.34) Como i2 = -1, o campo é dado por: (5.35) onde α = k sen 2 θ − n 2 . Note que a luz se propaga paralelamente à interface, na direção do eixo x. Por outro lado, ela penetra no meio menos S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 102 denso, porém decaindo de forma exponencial. Em geral, a profundidade de penetração é da ordem do comprimento de onda da luz. Pictoricamente, é como se houvesse uma rampa na qual uma partícula (fóton) sobe um pouco, mas depois volta. Este processo na óptica leva o nome de penetração em barreira ou tunelamento fotônico. Isto fica mais claro se colocarmos dois prismas próximos, separados por uma distância da ordem do comprimento de onda da luz, como representado na Fig. 5.17. Desprezando as reflexões de Fresnel nas faces de entrada e saída, vemos que a intensidade da luz transmitida decai exponencialmente com a separação entre os prismas, de acordo com IT = I0 exp (-αd). No interior de cada prima o campo elétrico oscila harmonicamente, mas entre eles decai exponencialmente como mostrado na Fig. 5.17. IR d Io IT Fig. 5.17 – Tunelamento fotônico. Este é um fato muito importante, principalmente no que se refere à propagação de luz em fibras óptica. Nelas, o núcleo (com cerca de 5 μm de diâmetro) possui o índice de refração levemente superior à da casca (diâmetro da ordem de 120 μm) e a tendência da luz é a de propagar confinada no meio com maior índice de refração. Porém, como acabamos de ver, uma parte não desprezível da radiação propaga pela casca, devido ao tunelamento fotônico e qualquer imperfeição (trincas, bolhas, etc.) acarreta em perdas de intensidade. Com relação à energia transmitida ou refletida, podemos escrever: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética { 103 } r n r 2 1 r 2r 1 r r < S > = E*x H = E 0 k̂ E0 k = 2μ 0 c 2μ 0 ω 2 (5.36) Chamando de n̂ a normal à interface, a energia se propagando r n r 2 nesta direção é J = < S > . n̂ = E 0 cos θ , a energia refletida é: r J' = < S' > .n̂ = n r" E0 2μ 0 c 2 n 2μ 0 c r E '0 2μ 0 c 2 cos θ e a transmitida é dada por: J" = < S" > . n̂ = r cos θ" . Define-se refletividade R e transmissividade T como: r 2 ′0 E J′ 2 R= = r 2 = ρ J E0 r 2 J" n 2 E"0 cos θ′′ n 2 = T= r 2 cos θ = n τ J n1 E 1 0 (5.37a) 2 cos θ′′ cos θ (5.37b) onde necessariamente T + R = 1. 5.7 Polarização por reflexão total interna No caso da reflexão total interna, os coeficientes de reflexão para as polarizações s e p, podem ser escritos como ρσ = exp{ iθσ } e ρ π = exp{ iθ π } , onde as mudanças de fase θσ e θ π , que ocorrem durante a reflexão, são dadas por: ( θ σ = −2tg −1 sen 2 θ − n 2 / cos θ ( ) θ π = −2tg −1 sen 2 θ − n 2 / n 2 cos θ ) (5.38a) (5.38b) Se a onda incidente possuir as duas polarizações (s e p) haverá uma diferença de fase induzida pela reflexão total interna: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 104 { ( sen θ − n / cos θ) − tg ( sen θ − n / n cos θ) } δ = θ σ − θ π = −2 tg −1 −1 2 2 2 2 (5.39) 2 A Fig. 5.18 mostra a diferença de fase δ como função do ângulo de incidência θ para a reflexão total interna no vidro (n1 ≈ 1.5, n2 = 1) cujo ângulo crítico é θC = 41.9°. Vemos que próximo ao ângulo de 50°, a diferença de fase é 45° e assim podemos pensar em obter luz circularmente polarizada, fazendo duas reflexões internas no vidro. Isto pode ser conseguido com o rombo de Fresnel, mostrado na Fig. 5.19 (a), tomando-se o cuidado de fazer as amplitudes dos campos com polarizações s e p iguais. Por outro lado, se provocarmos quatro reflexões internas, a diferença de fase induzida será de 180° e como resultado teremos uma rotação no plano de polarização da luz linearmente polarizada incidente (Fig. 5.19 (b)). Neste caso, não é necessário fazer as polarizações s e p de mesma amplitude. A vantagem deste método de obtenção de luz circularmente polarizada e rotação do campo elétrico é a acromaticidade, isto é, a independência do comprimento de onda, ao contrário das lâminas de λ/4 e λ/2. 60 δ (graus) 45 30 15 0 30 45 θ (graus) 60 75 90 Fig. 5.18 - Diferença de fase como função do ângulo de incidência para a reflexão total interna no vidro. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 105 E E E Ep Es (a) (b) Fig. 5.19 - (a) obtenção de luz circularmente polarizada (rombo de Fresnel) e (b) rotação do plano de polarização da luz. Para finalizarmos esta seção, convém chamar a atenção para o fato de que o dispositivo da Fig. 5.19 (b) roda continuamente o plano de polarização da luz incidente, como é mostrado na Fig. 5.20. Este mesmo efeito ocorre para a lâmina de meia onda que estudamos na seção 5.4. Ao rodarmos o dispositivo (ou lâmina λ/2), ou então mudando o plano de polarização da luz incidente de um ângulo θ, a luz emergente sai com o plano de polarização rodado de 2θ. θ1 θ1 θ2 θ2 entrada saída Fig. 5.20 - Rotação do plano de polarização da luz pela ação do dispositivo da Fig. 5.19(b). 5.8 Matrizes de Jones Considere um campo elétrico onde as componentes x e y estão defasadas de um ângulo δ: ( ) r E = E 0 x ˆi + E 0 ye −iδ ĵ exp{ i(kz − ωt )} S. C. Zilio (5.40) Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 106 Jones escreveu este campo da forma matricial: r ⎛ E0x ⎞ E = ⎜⎜ −iδ ⎟ ⎟ ⎝ E 0 ye ⎠ (5.41) Usando este formalismo podemos escrever o campo elétrico para as várias polarizações já vistas: (a) LP (δ = 0) (b) CPH (δ = π/2) (c) CPAH (δ = - π/2) ⎛ E0x ⎞ ⎟⎟ E = ⎜⎜ ⎝ E0y ⎠ r ⎛ E0 ⎞ ⎛1⎞ ⎟ ⎜⎜ ⎟⎟ E = E = ⎜⎜ 0 − iπ / 2 ⎟ ⎝− i⎠ ⎠ ⎝ E 0e r ⎛ E0 ⎞ ⎛ 1⎞ ⎟ ⎜⎜ ⎟⎟ E = E = ⎜⎜ 0 iπ / 2 ⎟ ⎝i⎠ ⎝ E 0e ⎠ (5.42a) (5.42b) (5.42c) e ainda definir operações tais como: (i) Soma: ⎛1 ⎞ r r ⎛1⎞ ⎛1⎞ E + E' = E 0 ⎜⎜ ⎟⎟ + E 0 ⎜⎜ ⎟⎟ = 2E 0 ⎜ ⎟ ⎜ 0⎟ ⎝− i⎠ ⎝i⎠ ⎝ ⎠ r r ⎛a⎞ ⎛c⎞ (ii) Produto escalar: tomando E = ⎜⎜ ⎟⎟ e E ' = ⎜⎜ ⎟⎟ temos: ⎝ b⎠ ⎝d⎠ r r ⎛c ⎞ E E ' = (a * b * ) ⎜⎜ ⎟⎟ = a * c + b * d . Dois vetores são ortogonais quando ⎝d⎠ r r e , e E E ' = 0 . Como exemplo, temos: Dentro desta abordagem podemos associar, a cada sistema óptico, uma matriz que modifica o campo incidente, dando origem ao campo emergente desejado, de maneira análoga ao que foi feito na óptica geométrica. Vamos escrever as matrizes para os elementos já vistos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 107 r r a) lâmina de quarto de onda (λ/4): devemos ter E' = M λ / 4 E , onde ⎛1⎞ ⎛1⎞ r r ⎜ ⎟ ⎜ ⎟ E = E 0 ⎜ ⎟ , E' = E 0 ⎜ ⎟ ⎜i ⎟ ⎜1⎟ ⎝ ⎠ ⎝ ⎠ ⎛1⎞ matricial temos: E ⎜ ⎟ = 0⎜ ⎟ ⎜i ⎟ ⎝ ⎠ ⎛M M ⎞ e M λ / 4 = ⎜ 11 12 ⎟ . Realizando o produto ⎜M ⎟ ⎝ 21 M 22 ⎠ ⎛ M 11 ⎜⎜ ⎝ M 21 M 12 ⎞ ⎛1⎞ ⎟ E ⎜ ⎟ . Logo, M 11 + M 12 = 1 e M 22 ⎟⎠ 0 ⎜1⎟ ⎝ ⎠ M 21 + M 22 = i . Existem várias matrizes que satisfazem estas condições. Devemos lembrar que se o campo tem polarização ao longo de um dos eixos principais, esta polarização não é alterada. Assim, temos: ⎛1 ⎞ ⎛1 ⎞ M M M =1 E 0 ⎜ ⎟ = ⎛⎜⎜ 11 12 ⎞⎟⎟ E 0 ⎜ ⎟ ⇒ 11 ⎜⎜ ⎟⎟ ⎜ 0 ⎟ ⎝ M 21 M 22 ⎠ M 21 = 0 ⎝ ⎠ 0 ⎝ ⎠ (5.43) e desta forma a matriz que descreve a lâmina de quarto de onda é: ⎛1 0 ⎞ ⎟⎟ M λ / 4 = ⎜⎜ ⎝0 i ⎠ (5.44) b) lâmina de meia onda (λ/2): procedendo de maneira análoga podemos encontrar a matriz para a lâmina de λ/2: ⎛1 ⎞ ⎛ 1⎞ ⎛1 0⎞ r r ⎜ ⎟ ⎜ ⎟ ⎟⎟ E = E 0 ⎜ ⎟ , E' = E 0 ⎜ ⎟ ⇒ M λ / 2 = ⎜⎜ ⎜ − 1⎟ ⎜ 1⎟ ⎝ 0 - 1⎠ ⎝ ⎠ ⎝ ⎠ (5.45) c) polarizador com eixo de transmissão horizontal: considere um campo r elétrico E linearmente polarizado, formando um ângulo θ com o eixo x e propagando-se na direção z. A Fig. 5.21 mostra este campo incidindo num polarizador com eixo de transmissão na direção x. Neste caso temos: ⎛ cos θ ⎞ r ⎜ ⎟ E = E0 ⎜ , ⎜ sen θ ⎟⎟ ⎝ ⎠ ⎛ cos θ ⎞ r ⎜ ⎟ ⇒ M = ⎛⎜ 1 0 ⎞⎟ E' = E 0 ⎜ ⎜ 0 0⎟ ⎜ 0 ⎟⎟ ⎝ ⎠ ⎝ ⎠ (5.46) A intensidade de luz emergente é proporcional a: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 108 ⎛ cos θ ⎞ r r ⎜ ⎟ E 2 cos 2 θ ⇒ I = I cos 2 θ 2 = 0 E' E' = E 0 (cos θ 0 ) ⎜ 0 ⎜ 0 ⎟⎟ ⎝ ⎠ (5.47) Esta é a lei de Malus, que não vale para um polaróide porque ele não extingue completamente a componente y, mas vale para o prisma de Nicol. r E y θ eixo de transmissão x z Fig. 5.21 - Polarizador com eixo de transmissão horizontal. c) polarizador com eixo de transmissão a 45° : o campo incidente é o mesmo que o do caso anterior, mas o eixo de transmissão do polarizador faz 45° com o eixo x, conforme mostra a Fig. 5.22. r E y eixo de θ transmissão x z 450 Fig. 5.22 - Polarizador com eixo de transmissão a 45°. E 0 (cos θ + sen θ) que é também o campo emergente. Decompondo-o Na direção do eixo de transmissão, o campo incidente é 2 2 r E ⎛ cos θ + senθ ⎞ em duas componentes, E ′x e E ′y , obtém-se: E ' = 0 ⎜⎜ ⎟ 2 ⎝ cosθ + senθ ⎟⎠ S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética para 109 ⎛ cos θ ⎞ r ⎜ ⎟ , de onde se tira a matriz para este sistema: E = E0 ⎜ ⎜ sen θ ⎟⎟ ⎝ ⎠ 1 ⎛1 M = ⎜⎜ 2 ⎝1 1⎞ ⎟ 1⎟⎠ (5.48) 5.9 Atividade óptica Atividade óptica é a propriedade que certos materiais possuem de rodar o plano de polarização de um feixe de luz linearmente polarizada, da maneira indicada na Fig. 5.23. O ângulo de rotação θ do plano de polarização depende da distância l percorrida pela luz dentro do meio e de uma característica intrínseca do material, chamada de poder rotatório. Costuma-se definir o poder rotatório específico como sendo o ângulo rodado por unidade de comprimento. θ z l Fig. 5.23 - Rotação do plano de polarização da luz devido à atividade óptica do meio. Olhando para a direção z > 0, se a luz rodar para a direita o material é chamado de destro-rotatório e se rodar para a esquerda, levorotatório. Alguns exemplos de meios opticamente ativos são: quartzo cristalino (com a luz se propagando na direção do eixo óptico), clorato de sódio, molécula de DNA e alguns tipos de açúcares. Na Fig. 5.24 vê-se o poder rotatório do quartzo como função do comprimento de onda. Notamos que esta grandeza varia com λ e esta variação, chamada de dispersão rotatória, pode ser usada na determinação do comprimento de onda de luz monocromática, ou como monocromador por atividade óptica, colocando-se um polarizador na entrada do meio e um analisador na saída S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 110 deste. Variando-se o ângulo do analisador podemos alterar o comprimento de onda que sai do monocromador. graus/mm 60 40 20 0 400 500 λ (nm) 600 700 Fig. 5.24 - Poder rotatório específico do quartzo cristalino como função do comprimento de onda. A atividade óptica pode ser explicada levando-se em conta a simetria das moléculas que compõem o meio, que neste caso é chamada de simetria chiral. Para facilitar o entendimento, vamos pensar nestas moléculas como tendo a forma de molas helicoidais. Quando a luz linearmente polarizada incide sobre o material, as componentes x e y estarão sujeitas a mesma simetria (o diâmetro das molas é o mesmos nas direções x e y) e portanto possuem a mesma velocidade de propagação (mesmo índice de refração). Já no caso de luz circularmente polarizada, as componentes polarizadas à direita (σ+) e à esquerda (σ-) “encontram” o passo da mola de formas diferentes (positivo ou negativo) e, portanto, “vêem” simetrias diferentes. Isto faz com que os índices de refração n+ e n- para estas duas polarizações sejam diferentes e como conseqüência, estas polarizações adquirem fases diferentes durante sua propagação pela amostra. Este fato pode ser melhor apreciado se usarmos o formalismo matricial de Jones. Consideremos um feixe de luz linearmente polarizada na direção x, propagando-se ao longo do eixo z. Podemos decompor esta luz em duas componentes circularmente polarizadas, ortogonais. No formalismo de Jones, este fato se expressa como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 111 r ⎛1 ⎞ 1 ⎛ 1 ⎞ 1 ⎛1 ⎞ E = ⎜⎜ ⎟⎟ = ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ⎝0⎠ 2 ⎝ − i ⎠ 2 ⎝i ⎠ (5.49) Após percorrer uma distância l dentro do meio, as componentes σ+ e σ- adquirem fases diferentes e o campo elétrico na saída da amostra pode ser escrito da forma: r ⎤ ⎡1 ⎛ 1 ⎞ 1 ⎛1 ⎞ 1 ⎛ 1⎞ 1 ⎛ 1⎞ E' = ⎜⎜ ⎟⎟ e ik +l + ⎜⎜ ⎟⎟ e ik −l = e iο ⎢ ⎜⎜ ⎟⎟ e iθ + ⎜⎜ ⎟⎟ e −iθ ⎥ 2 ⎝− i⎠ 2 ⎝i ⎠ 2 ⎝i ⎠ ⎦ ⎣2 ⎝− i⎠ onde foram introduzidas as quantidades θ = (k + − k − )l / 2 . Somando as matrizes obtemos: (5.50) ψ = (k + + k − )l / 2 r ⎡(e iθ + e − iθ )/2 ⎤ iο ⎛ cosθ ⎞ ⎟⎟ E' = e iο ⎢ iθ ⎥ = e ⎜⎜ −iθ ⎝ senθ ⎠ ⎣⎢(e − e )/2i ⎦⎥ e (5.51) que representa uma onda linearmente polarizada, cuja direção do plano de polarização encontra-se rodado de um ângulo θ com relação a direção inicial (antes da luz penetrar no meio). De acordo com a definição de θ temos: θ= π (n + − n − ) l λ (5.52) de forma que o poder rotatório específico é dado por: δ= θ π = (n + − n − ) l λ (5.53) que explica a forma da Fig. 5.24. Note, porém, que Δn = n+ - n- pode ter dispersão com o comprimento de onda e assim, a forma funcional de δ é mais complicada do que uma hipérbole. Um fator importante de se notar é que se tivermos a mola orientada ao longo do eixo z, por exemplo, a polarização do campo rodará de +θ se ele estiver se propagando no sentido +z e -θ se ele estiver no sentido –z. desta forma, se a luz atravessa o meio, reflete num espelho e atravessa novamente o meio no sentido oposto, o efeito de uma rotação cancela o da outra e a luz volta a ter a polarização original. Isto impede que a atividade óptica seja usada em isoladores ópticos. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 112 5.10 Efeito Faraday Certos meios isotrópicos podem provocar a rotação da luz pela r aplicação de um campo magnético uniforme B na direção de propagação da luz. Esta propriedade, conhecida como efeito Faraday, é comumente aplicada na construção de isoladores ópticos ou diodos ópticos. Na ausência de campo magnético, o material comporta-se da mesma forma para as polarizações circulares σ+ e σ-. Entretanto, a presença do campo r B quebra a simetria para rotações à direita e à esquerda, da maneira apresentada na Fig. 5.25 e o material passa a ter atividade óptica. Quando a luz linearmente polarizada incide sobre o material, as componentes de polarização x e y estarão sujeitas à mesma simetria e portanto possuem a mesma velocidade de propagação (mesmo índice de refração). Já no caso de luz circularmente polarizada, as componentes polarizadas à direita (σ+) e à esquerda (σ-) “encontram” os triângulos de formas diferentes e, portanto, “vêem” simetrias diferentes. Isto faz com que os índices de refração n+ e n- para estas duas polarizações sejam diferentes e como conseqüência, estas polarizações adquirem fases diferentes durante sua propagação pela amostra. Este efeito pode ser calculado pelo formalismo matricial de Jones, da mesma forma que na seção anterior.. y σ− Ey Ex σ+ x Fig. 5.25 - Explicação do efeito Faraday baseado na simetria do meio. No efeito Faraday, o ângulo que o plano de polarização roda está ligado à resposta do material ao campo magnético, através da constante de Verdet, de acordo com: θ = BV l S. C. Zilio (5.49) Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 113 onde B é módulo do campo magnético, V é a constante de Verdet e l é o comprimento do meio. Os materiais mais comumente utilizados para este tipo de aplicação e que obviamente possuem um valor elevado da constante de Verdet são alguns tipos de vidros densos (flint), alguns semicondutores e o TGG (Terbium Galium Garnet). Na Fig. 5.26 podemos observar o comportamento de V contra λ para o TGG. Um fator importante para a construção dos isoladores ópticos está ligado aos sentidos relativos do campo magnético e do vetor de r r propagação k . Digamos que a luz se propaga na direção do campo ( k e r B paralelos) e que roda um ângulo θ no sentido horário. Se ela se r r propagar no sentido inverso ( k e B anti-paralelos), ela novamente rodará um ângulo θ, só que agora no sentido anti-horário, pois verá os triângulos da Fig. 5.25 orientados no sentido inverso. Como conseqüência, se a luz atravessar o meio e depois voltar, o efeito total será o de rodar o plano de polarização da onda de 2θ, diferentemente do que acontece na atividade óptica. Veremos a seguir como este fato pode ser usado para a construção de diodos ópticos. segundos/(Gauss*mm) 20 15 10 5 0 0,6 0,7 0,8 λ (μm) 0,9 1,0 1,1 1,2 Fig. 5.26 - Variação da constante de Verdet com o comprimento de onda para o TGG. 5.11 Isoladores ópticos Os lasers, principalmente os dos tipos diodo e corante, têm sua estabilização em freqüência bastante perturbada pela realimentação de luz devido à reflexões parasitas nas superfícies dos elementos ópticos que compõem uma determinada montagem experimental. Para se evitar este S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 114 tipo de problema é necessário um diodo óptico, ou isolador óptico, que permite a passagem de luz do laser para o experimento, mas impede a passagem no sentido inverso. Este isolador é baseado no efeito Faraday, que descrevemos na seção anterior. Considere, como mostra a Fig. 5.27, um meio que quando sujeito r a um campo B roda o plano de polarização da luz de 45°. Na entrada do sistema existe um polarizador P1, com eixo de transmissão paralelo ao eixo y e na saída um polarizador P2, com eixo de transmissão na direção 1 2 ( î + ĵ) . A luz proveniente do laser passa pelo polarizador P1, roda 45° no sentido horário e passa por P2. A luz refletida pelos componentes ópticos (retornando ao laser) passa por P2, roda 45° no sentido antir horário (pois vê o sentido de B invertido) e é bloqueada pelo polarizador P1, sendo assim impedida de retornar ao laser. y y l θ E B E k z P2 P1 x x Fig. 5.27 - Esquema de um isolador óptico baseado no efeito Faraday. Devido ao fato da constante de Verdet variar com o comprimento de onda, a isolação óptica apresentada acima funciona apenas para luz monocromática. Para um dado λ, seleciona-se o valor de B que produz a rotação de 45°; para outro λ devemos tomar um valor diferente de B para compensar a dependência da constante de Verdet com o comprimento de onda ou trabalhar com o polarizador P2 numa outra orientação. Neste último caso teremos perda de intensidade da luz na direção reversa. Para finalizar esta seção devemos mencionar que é possível se construir um isolador óptico com uma lâmina de quarto de onda ou rombo de Fresnel. Imagine que a luz passe por um polarizador P e por uma lâmina λ/4, de maneira a se tornar circularmente polarizada. Quando ela retorna, após reflexão nos componentes ópticos do sistema experimental, passa novamente pela lâmina λ/4. Esta dupla passagem pela placa S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 115 retardadora faz com que seu efeito seja o de uma lâmina de meia onda, rodando o plano de polarização da luz de 90°, que é finalmente barrada pelo polarizador P. A desvantagem deste método é que durante as reflexões nos componentes ópticos, a polarização circular pode ser afetada, tornando-se elíptica e o efeito total da dupla passagem pela placa retardadora não é exatamente o de uma lâmina de λ/2. Já no caso do diodo óptico com efeito Faraday, o efeito das reflexões sobre a polarização não é relevante pois o polarizador P2 re-polariza a luz que volta ao diodo. A isolação é usualmente medida em dB, de acordo com a expressão: ⎛I ⎞ I = 10 log10 ⎜ V ⎟ (5.55) ⎜I ⎟ ⎝ i ⎠ onde IV e Ii são respectivamente as intensidades de luz que passa e que incide sobre o diodo no sentido em que ele bloqueia . Assim, uma isolação de -40 dB significa que se incidirmos luz na direção reversa do diodo, apenas 0,01% desta luz passará por ele. 5.12 Efeito Pockels Como mencionamos na seção 4.5, existem cristais cujos índices de refração se modificam face à aplicação de um campo elétrico. Quando esta variação for diretamente proporcional ao campo elétrico, teremos o conhecido efeito Pockels, que é utilizado na modulação eletro-óptica da luz, tanto em frequência (seção 4.5), como em intensidade. Este efeito aparece em cristais anisotrópicos, que são caracterizados por um elipsóide de índices de refração escrito como: x 2 y2 z2 + + =1 n 2x n 2y n 2z (5.56) No caso em que nx = ny ≠ nz temos um cristal uniaxial, cujo eixo de simetria (z) é chamado de eixo óptico (e.g. KDP, quartzo, etc.). O índice de refração para a luz polarizada nesta direção é denominado de extraordinário (ne), enquanto que para a luz com polarização nas direções x e y tem-se o índice de refração ordinário (n0). Esta anisotropia dá origem aos fenômenos de birrefringência discutidos na seção 5.4. Além desta S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 116 anisotropia natural, certos cristais uniaxiais podem ter uma anisotropia extra, induzida pela aplicação do campo elétrico externo, sendo que este pode ser aplicado na direção de propagação da luz (efeito Pockels longitudinal) ou perpendicular a ela (efeito Pockels transversal). Consideremos o caso em que a luz se propaga ao longo do eixo óptico (z), de forma que as componentes x e y da onda eletromagnética estão ambas sujeitas ao mesmo índice de refração (n0). Vamos supor que um campo elétrico estático, V/l, é aplicado longitudinalmente ao cristal, onde V é a voltagem e l é o comprimento da amostra. Nestes casos, as componentes x e y da onda estarão sujeitas a índices de refrações rápido (nr) e lento (nl) dados por: nr = n0 − nl = n0 + n 30 rV 2 (5.57a) n 30 rV 2 (5.57b) onde r é uma componente de um tensor eletro-óptico, que dá a resposta do meio em resposta à aplicação do campo elétrico. Vemos então a aparição de uma birrefringência induzida pelo campo elétrico, efeito este que pode ser usado para chaveamento eletro-óptico da luz, como veremos na seção 5.14. 5.13 Efeitos Kerr e Cotton-Mouton Em meios ópticos isotrópicos tais como líquidos e cristais de simetria cúbica, o efeito Pockels não existe. Entretanto, para campos elétricos intensos pode existir uma birrefringência induzida pelo alinhamento das moléculas do meio. A substância neste caso comporta-se opticamente como se fosse um cristal uniaxial no qual o campo elétrico define o eixo óptico. Este efeito foi descoberto em 1875 por J. Kerr e é chamado de efeito Kerr. A magnitude da birrefringência induzida é proporcional ao quadrado do campo elétrico, de acordo com: n // − n ⊥ = KE 2 λ S. C. Zilio (5.53) Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 117 onde K é a constante de Kerr, λ é o comprimento de onda da luz no vácuo, r n// é o índice de refração na direção do campo elétrico estático E aplicado sobre a amostra e n⊥ é o índice perpendicular a ele. O efeito Kerr é utilizado em moduladores de luz ultra-rápidos, conhecidos como células Kerr. Este dispositivo, mostrado na Fig. 5.28, consiste de dois condutores paralelos imersos num líquido com constante de Kerr elevada (nitrobenzeno, por exemplo). A cela contendo o líquido é colocada entre dois polarizadores cruzados, que fazem ângulos de ±45° r com a direção do campo elétrico aplicado. Na presença do campo E , a birrefringência induzida no líquido permite a passagem de luz pelo polarizador de saída. Para uma certa voltagem, Vλ/2, a cela se comporta como uma lâmina de meia onda e o conjunto se torna transparente à luz incidente sobre ele (exceto pelas reflexões nos polarizadores e nas janelas da cela). y +V y E E z P2 P1 x x Fig. 5.28 - Esboço de uma cela de Kerr usada como modulador eletro-óptico de luz. O efeito Cotton-Mouton é o análogo magnético do efeito Kerr e é atribuído ao alinhamento das moléculas de um líquido devido à presença de um campo magnético. A grandeza deste efeito é proporcional ao quadrado do campo magnético aplicado, similarmente ao que ocorre no efeito Kerr. 5.14 Chaveamento eletro-óptico Como visto na seção anterior, a cela de Kerr pode ser usada como modulador ou chave eletro-óptica rápida, ou seja, aplicando-se pulsos elétricos nos eletrodos, a transmissão óptica do sistema também será pulsada. Assim, este dispositivo pode ser usado, por exemplo, como um chopper rápido (f ~ MHz) para vários tipos de experimentos. A chave S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 118 eletro-óptica mais comumente utilizada, no entanto, é aquela baseada no efeito Pockels. A cela de Pockels é bastante similar àquela mostrada na Fig. 5.28, porém, com o meio eletro-óptico sendo um cristal anisotrópico e o campo elétrico sendo, em geral, aplicado na direção longitudinal. Esta cela permite uma aplicação muito importante na construção de alguns tipos de laser de alta potência, através do uso da técnica de Q-switching (chaveamento do fator de qualidade da cavidade do laser). Voltaremos a abordar este assunto quando discutirmos o princípio de operação dos lasers. Finalmente, uma outra aplicação que se pode dar à cela de Pockels é na eliminação das flutuações de potência da luz que sai de um laser. Este dispositivo, chamado de eliminador de ruidos (noise eater), está mostrado esquematicamente na Fig. 5.29. Um divisor de feixes DF coleta uma pequena fração da luz e a envia para um detector. O sinal deste é comparado com uma referência fixa e a diferença Δv realimenta a cela de Pockels, junto com um nível D.C. de voltagem (V), de tal forma que a intensidade de luz indo para o experimento é sempre constante. DF LASER CELA DE POCKELS V+Δυ Exp. detector Δυ V Fig. 5.29 - Diagrama esquemático de um eliminador de ruídos. Bibliografia 5.1. W. Schurcliff, Polarized Light, Production and Use, Harward University Press, Cambridge, MA, (1962). 5.2. G. R. Fowles, Introduction to Modern Optics, Holt, Rinehard and Winston, NY (1968). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 119 5.3. M. Born and E. Wolf, Principles of Optics, terceira edição, Pergamon, Oxford (1970). 5.4. E. Hecht and A. Zajac, Optics, segunda edição Addison-Wesley Publishing Company, Reading, MA (1987). 5.5. J. C. Castro, Optical barrier penetration – a simple experimental arrangement, Am. J. Phys. 43, 107 (1975). 5.6. R. C. Jones, J. Opt. Soc. Am. 31, 488 (1941). Problemas 5.1. Um feixe de luz viajando no vácuo atinge a superfície de uma placa de vidro. Quando o ângulo de incidência é 56°, o feixe refletido está completamente polarizado. Qual é o índice de refração do vidro? 5.2. Faça um esboço do plano x-y seguintes ondas: (a) Ex = Acos(ωt-kz) (b) Ex = Acos(ωt-kz+π/4) (c) Ex = Acos(ωt-kz-π/4) mostrando o estado de polarização das Ey = 2Acos(ωt-kz) Ey = Acos (ωt-kz) Ey = 0,5Acos (ωt-kz) 5.3. Escreva as matrizes de Jones para os campos acima. 5.4. O ângulo crítico para reflexão total interna numa peça de vidro é 45°. Qual é o ângulo de Brewster para (a) reflexão interna e (b) reflexão externa? 5.5. Qual a espessura que deve ter uma peça de quartzo para se fazer uma lâmina de λ/4 para λvácuo = 6.000 Å? Dados: n1 = 1,5422 e n2 = 1,5533. 5.6. Prove que T+R=1 para a polarização σ. Idem para polarização π. 5.7. Descreva o princípio de funcionamento de um isolador óptico feito com um polarizador e uma lâmina de quarto de onda. 5.8. Demonstre a eq. (5.4a). 5.9. Encontre a matriz de Jones que descreve um meio exibindo atividade óptica descrita pelo poder rotatório θ. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações A polarização da onda eletromagnética 120 ⎡3⎤ 5.10. Luz elipticamente polarizada descrita pelo vetor de Jones: ⎢ ⎥ é ⎣i ⎦ enviada através de um meio com atividade óptica descrita pelo poder rotatório θ = π/2 e de um polarizador linear com eixo de transmissão vertical. Que fração da intensidade de luz é transmitida pelo sistema? 5.11. Um feixe de luz circularmente polarizada incide numa superfície plana de vidro (n = 1.5) de maneira a formar 450 com a normal. Descreva o estado de polarização da luz refletida. ⎡A ⎤ 5.12. Mostre que a onda representada pelo vetor de Jones ⎢ iδ ⎥ é, em ⎣ Be ⎦ geral, elipticamente polarizada e que o semi-eixo maior da elipse 1 2 AB faz um ângulo tg −1 2 cos δ com o eixo x. Discuta os casos 2 A − B2 especiais: (a) A = 0, (b) B = 0, (c) δ = 0, (d) δ = π/2 e (e) A = B. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interferência 121 Interferência 6 6.1 Princípio da superposição Interferência é o fenômeno que tem como origem a adição vetorial dos campos eletromagnéticos (princípio da superposição). Ao se calcular a intensidade do campo resultante, através da eq. (3.49), veremos que esta pode ser maior ou menor que a soma das intensidades dos campos que se superpuseram. Em geral, estes são oriundos da mesma fonte e percorrem caminhos ópticos distintos, de forma que haverá uma diferença de fase entre eles. A Fig. 6.1 mostra um exemplo de como o processo de interferência pode ser obtido. Para efeitos práticos, é como se os raios 1 e 2 fossem provenientes de duas fontes virtuais, F1 e F2. Vários outros casos serão descritos posteriormente. Veremos no Cap. 7 que se a fonte for coerente teremos interferência estacionária, ao passo que se a fonte for incoerente teremos interferência não estacionária. F1 1 P F 2 F2 Fig. 6.1 - Diagrama esquemático mostrando a obtenção de interferência. Para entender melhor o princípio da superposição, vamos considerar duas fontes pontuais F1 e F2 emitindo ondas esféricas, monocromáticas e coerentes num meio não polarizável (vácuo) conforme está mostrado na Fig. 6.2. No ponto P temos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 122 Interferência r r E 01 r r E 1 = r r exp{ i[ k r − r1 − ωt − φ1 ] } r − r1 r r E 02 r r E 2 = r r exp{ i[ k r − r2 − ωt − φ 2 ] } r − r2 (6.1a) (6.1b) que são os campos produzidos pelas fontes F1 e F2, respectivamente. r r r − r1 F1 r r1 r r r − r2 r r r r2 O P F2 Fig. 6.2 - Arranjo para a observação de interferência de duas fontes pontuais monocromáticas. r r r ( ) O campo resultante E vem da superposição de E1 e E 2 , isto é, da r r r r r adição vetorial E = E 1 + E 2 . A intensidade é proporcional a E * . E , logo: r r r 2 r 2 r r r r Ι α E * . E = E 1 + E 2 + E 1* . E 2 + E 1 . E *2 (6.2) Os dois últimos termos são aqueles responsáveis pela interferência, como veremos a seguir. Podemos escrever estes termos como: r r r r r r 2E 01 . E 02 r r r r * * E 1 . E 2 + E 1 . E 2 = r r r r cos ( k r − r1 − k r − r2 + φ1 − φ 2 ) (6.3) r − r1 r − r2 r r Supondo que E 01 e E 02 são paralelos e definindo: r r r r A 1 = E 01 / r − r1 r r r r A 2 = E 02 / r − r2 S. C. Zilio (6.4a) (6.4b) Óptica Moderna – Fundamentos e Aplicações Interferência 123 r r r r δ = k ( r − r1 − r − r2 ) + φ1 − φ 2 temos: (6.4c) r r r r E * . E = A12 + A 22 + 2A1 . A 2 cos δ (6.5) ou alternativamente, Ι = Ι1 + Ι 2 + 2 Ι1Ι 2 cos δ (6.6) r r onde o último termo, oriundo da mistura de E 1 e E 2 varia com a diferença de fase entre os campos e dá origem ao fenômeno chamado r r interferência. Para a obtenção da eq. (6.6) tomamos E 01 e E 02 paralelos. Se isto não ocorrer, o termo de interferência deverá ser multiplicado por cosΦ, onde Φ é o ângulo entre E 01 e E 02 . Voltando à análise da eq. (6.6), podemos ver que a intensidade máxima é: r r Ι max = Ι 1 + Ι 2 + 2 Ι 1 . Ι 2 = ( Ι1 + Ι 2 ) 2 (6.7a) que é maior que a soma (Ι 1 + Ι 2 ) . Isto acontece quando o co-seno vale 1, ou seja, quando δ = 2mπ (interferência construtiva). Por outro lado, a intensidade mínima é dada por: Ι min = Ι 1 + Ι 2 − 2 Ι 1 . Ι 2 = ( Ι1 − Ι 2 ) 2 (6.7b) que é menor que (Ι 1 + Ι 2 ) . Isto acontece para cos δ = −1, ou seja, quando δ = (2m+1)π (interferência destrutiva). A Fig. 6.3 mostra como a intensidade varia com δ. I(δ) Imax Imin 0 S. C. Zilio π 3π 5π 7π δ Óptica Moderna – Fundamentos e Aplicações 124 Interferência Fig. 6.3 - Intensidade dos campos superpostos com função da diferença da fase. No caso em que I1 = I2 = I0 temos Imax = 4I0 e Imin = 0. Costuma-se definir a visibilidade das franjas (visibilidade de Michelson) como: η= Ι max − Ι min 2 Ι 1 . Ι 2 = Ι1 + Ι 2 Ι max + Ι min (6.8) No caso particular em que φ1 = φ2 temos δ = k{ r − r2 − r − r1 }, de r r r r r r δ 2mπ = = { r − r2 − r − r1 } = constante k k r r forma que se considerarmos os máximos, veremos que eles satisfazem: (6.9) que é um hiperbolóide de revolução. δ pode ser colocado em termos da diferença de caminhos óticos, que neste caso é dada por: r r r r Δ = n{ r − r2 − r − r1 } Logo: δ= 2π Δ + (φ 2 − φ1 ) λ0 (6.10) (6.11) Geralmente φ1 = φ1(t) e φ2 = φ2(t), isto é, as fases mudam com o tempo. Chamando τ0 de tempo de coerência, que é um tempo característico ligado à mudança de fase, e T de tempo de observação, quando τ0 << T temos interferência não estacionária. Voltaremos a este tópico no Cap. 7. 6.2 Interferência por divisão da frente de onda Na discussão do princípio da superposição feita na seção anterior, foram utilizados apenas dois feixes para simplificar a análise, mas o princípio é válido para um número arbitrário deles, conforme abordaremos nas seções posteriores. Em dispositivos interferométricos que utilizam dois feixes costuma-se dividir a frente de onda e isto pode ser feito de várias maneiras, como veremos a seguir. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interferência 125 a) Experiência de Young (fenda dupla) Um experimento clássico que demonstra a interferência da luz foi feito por Thomas Young, em 1802. Considere o arranjo experimental mostrado na Fig. 6.4. Luz proveniente de uma fonte F passa por um pequeno orifício S e incide sobre duas fendas paralelas estreitas, S1 e S2, separadas por uma distância h. Um anteparo colocado após as fendas mostrará listas claras e escuras, definindo assim o padrão de interferência que estamos interessados em encontrar. Note que o orifício S é de fundamental importância, pois é ele que fornece a coerência espacial necessária entre a radiação vinda das duas fendas. P S S1 y h F S2 D Fig. 6.4 - Experimento de Young para a observação de interferência. Como vimos anteriormente na eq. (6.11), δ = 2π Δ + (φ 2 − φ1 ) , λ0 onde Δ = n (S 2 P − S 1 P ) é a diferença de caminhos ópticos. Usando o teorema de Pitágoras temos: ( h 2 ⎧ h⎞ ⎪ 1 y+ 2 ⎛ 2 S 2 P = ⎜ y + ⎟ + D ≈ D ⎨1 + 2 2⎠ ⎝ ⎪⎩ 2 D S. C. Zilio ) 2 ⎫ ⎪ ⎬ ⎪⎭ (6.12.a) Óptica Moderna – Fundamentos e Aplicações ( 126 h 2 ⎧ h⎞ ⎪ 1 y− 2 ⎛ 2 S1 P = ⎜ y − ⎟ + D ≈ D ⎨1 + 2 2⎠ ⎝ ⎪⎩ 2 D ) Interferência 2 ⎫ ⎪ ⎬ ⎪⎭ (6.12.b) que são expressões válidas apenas quando h << D. Desta forma, ⎡ 1 y 2 + h 2 /4 + yh ⎤ Δ = nD ⎢1 + ⎥ D2 ⎣ 2 ⎦ ⎡ 1 y 2 + h 2 /4 − yh ⎤ nyh − nD ⎢1 + ⎥= D D2 ⎣ 2 ⎦ (6.13) Vamos agora supor que n = 1 (vácuo) e φ1 = φ2 (feixes coerentes). Disto resulta que: δ= 2π yh λ0 D (6.14) Para se obter intensidade máxima devemos ter: δ = 2mπ = 2π yh D ⇒ y max = mλ 0 λ0 D h (6.15a) e intensidade mínima quando: 1⎞ 1⎞ 2π yh D⎛ ⎛ δ = 2⎜ m + ⎟ π = ⇒ y min = ⎜ m + ⎟ λ 0 2⎠ 2⎠ λ0 D h⎝ ⎝ (6.15b) A Fig. 6.5 mostra o padrão de interferência que se observa no anteparo. A distância entre duas franjas consecutivas (dois máximos consecutivos), chamada interfranja é dada por: y m +1 − y m = S. C. Zilio λ0D h (6.16) Óptica Moderna – Fundamentos e Aplicações Interferência 127 Fig. 6.5 - Padrão de interferência obtido com a fenda dupla. Maneiras alternativas de se demonstrar interferência por divisão da frente de ondas são vistas na Fig. 6.6. Dentre elas se incluem também os interferômetros de Michelson e de Mach-Zehnder, que devido a sua importância serão tratados separadamente. y 1 S. 2 h (a) x S’ D S. 1 S’ . h y 2 (b) x S’’ D d1 y S’ h 1 (c) S 2 x S’’ D Fig. 6.6 - Alguns dispositivos que produzem interferência por divisão de frente de onda: (a) espelho simples de Lloyd, (b) espelho duplo de Fresnel e (c) biprisma de Fresnel. b) Interferômetro de Michelson O interferômetro de dois feixes mais conhecido foi desenvolvido por Michelson em 1880. O desenho básico está mostrado na Fig. 6.7. A S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 128 Interferência radiação proveniente de uma fonte F é colimada e dividida por um divisor de feixes DF. Os feixes divididos são refletidos pelos espelhos E1 e E2 e voltam para o divisor de feixes. O padrão de interferência é observado em P, ao se variar a posição de um dos espelhos. E2 DF E1 F L1 L2 x1/2 P Fig. 6.7 - Interferômetro de Michelson. Supondo ser a fonte monocromática e o interferômetro estar no vácuo (n = 1), a diferença de caminhos ópticos é dada por Δ = x1 – x2 e, portanto, a diferença de fase é: δ= 2π (x 1 − x 2 ) λ0 (6.17) onde x1 e x2 são respectivamente as distâncias percorridas pelos feixes 1 e 2. Note que ao se mover o espelho E1 de uma distância x1/2, o feixe anda x1 (vai e volta). A intensidade observada em P é: ⎛ 2π ⎞ Ι (Δ ) = Ι 1 + Ι 2 + 2 Ι 1Ι 2 cos ⎜⎜ Δ ⎟⎟ ⎝ λ0 ⎠ (6.18) Como os feixes 1 e 2 são refletidos e transmitidos de maneira igual pelo divisor D, temos I1 = I2 = I0. Desta forma, ⎡ ⎛ 2π ⎞⎤ Ι (Δ ) = 2Ι 0 ⎢1 + cos ⎜⎜ Δ ⎟⎟⎥ ⎝ λ 0 ⎠⎦ ⎣ (6.19) Observando que I(0) = 4I0, podemos re-escrever a eq. (6.19) como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interferência 129 ⎡ ⎛ 2π ⎞⎤ 1 Ι (Δ ) = Ι(0) ⎢1 + cos ⎜⎜ Δ ⎟⎟⎥ 2 ⎝ λ 0 ⎠⎦ ⎣ (6.20) ou, alternativamente: ⎛ 2π ⎞ 1 1 P (Δ ) = Ι (Δ ) − Ι (0) = Ι (0) cos ⎜⎜ Δ ⎟⎟ 2 2 ⎝ λ0 ⎠ (6.21) É interessante notar que P(Δ) é a transformada de Fourier do espectro da fonte, isto é, de uma função δ( λ − λ 0 ) . Este instrumento é bastante utilizado para a realização de medidas espectroscópicas na região do infravermelho, como veremos na próxima seção. c) Espectroscopia por transformada de Fourier (ETF) Medidas espectroscópicas na região do infravermelho médio (de 2.5 a 25 μm) e longínquo (de 25 a 1000 μm) são importantes para o estudo de propriedades vibracionais de moléculas na fase gasosa e de defeitos em sólidos. Entretanto, neste intervalo espectral ocorrem sérias dificuldades experimentais criadas pela falta de fontes de banda larga intensas e de detectores suficientemente sensíveis à esta radiação de baixa energia. A necessidade de se operar sob condições tão adversas fez com que os espectrômetros interferométricos se tornassem preferidos aos espectrômetros dispersivos (ED) convencionais, que utilizam prismas ou redes de dispersão, devido ao fato de possuírem uma razão sinal/ruído (S/R) melhor, possibilitando a obtenção de espectros de boa qualidade em intervalos de tempo relativamente curtos. Entretanto, antes de entrarmos nos detalhes da técnica de ETF, convém salientarmos que na região do infravermelho é tradicional usar-se como unidades o número de onda, σ, dado em cm-1, que é o inverso do comprimento de onda. Assim, a região do infravermelho médio se estende de 400 a 4000 cm-1, enquanto que a do infravermelho longínquo cobre de 10 a 400 cm-1. As duas maiores vantagens da ETF sobre a ED são conhecidas como vantagens de Fellgett e Jacquinot. A vantagem de Fellgett (ou da multiplexação) baseia-se no fato de que o método interferométrico cada elemento espectral de uma banda larga Δσ é observado durante todo o tempo τ da medida, de forma que o sinal integrado de uma pequena banda δσ é proporcional a τ. Se o ruído da medida for predominante devido ao S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 130 Interferência interferômetro será proporcional a τ . Já no método dispersivo, cada elemento espectral é observado isoladamente durante o tempo τ /M, onde M = Δσ/δσ é o número de elementos espectrais. Isto nos dá uma razão S/R proporcional a τ / M , que será menor quanto maior for o número de elementos espectrais a serem estudados. Entretanto, a vantagem de multiplexação deixa de existir se o ruído for devido a flutuações de intensidade da fonte, como ocorre em lâmpadas onde existe descarga elétrica. A vantagem de Jacquinot (ou da throughput) afirma que é possível transmitir mais energia através do ETF do que pelo ED. O fluxo de energia, Φ, transmitido por um sistema óptico é proporcional à throughput que é dada pelo produto AΩ, onde A é a área do colimador de entrada e Ω é o ângulo sólido subtendido pela fonte. O interferômetro pode ter uma fonte extensa, com grande ângulo sólido. Já no caso do ED, a resolução depende linearmente da largura da fenda do instrumento e a energia transmitida do quadrado de sua área. É possível mostrar que na condição em que os dois aparelhos operam com a mesma resolução, a energia transmitida pelo ETF chega a ser até 200 vezes maior que a do ED. Esta é realmente uma vantagem muito importante, pois como foi dito anteriormente, as fontes na região do infravermelho são muito fracas. A principal desvantagem do método interferométrico é que o espectro se interesse não é imediatamente visível, sendo necessário um computador para calculá-lo a partir do padrão de interferência. No caso de uma fonte de banda larga, para se obter a intensidade total atingindo o detector é necessário somar todas as freqüências presentes. Usando σ =1/λ e I = ½ cnε0 E 2 na eq. (6.19) temos: detector, isto é, aleatório e independente do nível de sinal, a razão S/R do ∞ ⎫ ⎧∞ 2 2 I(Δ) = cnε 0 ⎨∫ Ε(σ ) dσ + ∫ Ε(σ ) cos(2πσΔ ) dσ⎬ ⎭ ⎩0 0 ou ainda, S. C. Zilio 2 I(Δ ) = 1 I(0) + cnε 0 ∫ (σ ) cos(2 πσΔ ) dσ 2 0 (6.22) ∞ (6.23) Óptica Moderna – Fundamentos e Aplicações Interferência 131 O interferograma I(Δ) nada mais é do que a função de autocorrelação do campo elétrico, como veremos no Cap. 7. O primeiro termo da eq. (6.23) é a soma das intensidades individuais de cada feixe e o segundo é a modulação provocada pela sua interferência. Para se obter o espectro a partir do interferograma basta apenas calcular a transformada de Fourier inversa de I(Δ) – ½ I(0): B(σ ) = cnε 0 1 2 ⎤ ⎡ Ε(σ ) = (const )∫ ⎢Ι(Δ ) − Ι(0 )⎥ cos(2πσΔ ) dΔ 2 2 ⎦ 0 ⎣ ∞ (6.24) A maneira experimental de se determinar o espectro B(σ) com o interferômetro é a seguinte: 1. Mede-se I(Δ), que é a intensidade de luz incidente no detector como função do deslocamento do espelho; 2. Experimentalmente determina-se I(0) ou I(∞) = ½ I(0); 3. Substitui-se I(Δ) – I(∞) na eq. (6.24) e calcula-se a integral num computador para um σ particular; 4. Repete-se a operação 3 para outros σ´s obtendo-se então B(σ) a menos de uma constante multiplicativa. Para a obtenção do espectro de transmissão de uma amostra são necessárias duas medidas sob as mesmas condições operacionais, uma com a amostra no feixe e a outra fora dele. Dividindo-se estes dois espectros obtém-se a transmissão da amostra, além de se eliminar a constante multiplicativa. Na prática, o espelho móvel do interferômetro percorre uma distância finita, L, que limita o conhecimento de I(Δ) a apenas um intervalo finito de valores de Δ. Esta truncagem do interferograma afeta a resolução do instrumento, como veremos a seguir. Consideremos uma fonte de luz monocromática de freqüência σ0 e intensidade conhecida. O interferograma para este caso é dado por: I(Δ) = ½ I (0) + (const) cos (2πσ0Δ) (6.25) Usando-se a eq. (6.24) para calcular B(σ), teremos uma distribuição δ(σ -σ0) se o espelho andar uma distância infinita, mas para distâncias finitas (-L< Δ < L) obteremos uma função sinc: B(σ) α S. C. Zilio sen [2π(σ − σ0 )L] = sinc z 2π(σ − σ0 )L (6.26) Óptica Moderna – Fundamentos e Aplicações 132 Interferência onde z = 2π(σ −σ 0)L. A função sinc z, chamada de forma de linha instrumental, é a aproximação que se consegue para o feixe monocromático. Esta função tem meia largura de 1.21/L e porções que se estendem 0.22 abaixo de zero como se pode ver na Fig. 6.8. Podemos tolerar a meia largura do pico central como um decréscimo da resolução, mas os picos laterais podem dar a aparência de falsas fontes de energia. Para reduzir este problema introduz-se um tratamento matemático do interferograma, chamado apodização, cujo objetivo é diminuir os picos laterais. A apodização consiste em multiplicar o interferograma por uma função por cujo valor em Δ = 0 é 1 e em Δ = L é zero. Tomemos como exemplo a função triangular: A(Δ) = 1 - Δ /L (6.27) Multiplicando-se I (Δ) por esta função e usando-se novamente a eq. (6.24) com intervalo de integração finito, obtém-se a função sinc2 (z/2) para B (σ), que também é mostrada na Fig. 6.8. a) b) −2 π −π π 2π z Fig. 6.8 - a) sinc z, b) sinc2 (z/2). O efeito da apodização, além de eliminar praticamente os picos laterais, é o de aumentar a meia-largura da linha para 1.79/L, piorando assim a resolução. Para definir formalmente a resolução do interferômetro (com truncagem e apodização) podemos usar o critério de Rayleigh, que afirma que duas linhas freqüências σ1 e σ 2 estarão resolvidas quando o pico da primeira cair no primeiro zero da segunda, conforme mostra a Fig. 6.9. O critério de Rayleigh estará satisfeito quando (z1 – z2) = 2π e assim podemos definir a resolução do interferômetro como: δσ ≡ (σ1-σ2) = 1/L S. C. Zilio (6.28) Óptica Moderna – Fundamentos e Aplicações Interferência 133 Com esta análise vemos que a resolução de um espectrômetro por transformada de Fourier depende apenas de quanto o espelho móvel se desloca. Já no caso da espectroscopia dispersiva, a resolução depende inversamente da largura da fenda. Assim, para se obter boa resolução na ED, a fenda deve ser bastante estreita, o que diminui a throughput, enquanto que na ETF, basta apenas aumentar o deslocamento do espelho c móvel. a b z1 z2 z 2 Fig. 6.9 - Critério de Rayleigh para definir resolução. a) sinc (z-z1) / 2, b) sinc2 (z-z2) /2 e c) soma. d) Interferômetro de Mach-Zehnder Um outro interferômetro de dois feixes importante é o interferômetro de Mach-Zehnder. O desenho básico está mostrado na Fig. 6.10 e o princípio de funcionamento é similar ao de Michelson. A radiação proveniente de uma fonte F é colimada e dividida por um divisor de feixes DF1. Os feixes divididos são refletidos pelos espelhos E1 e E2 e vão para um outro divisor de feixes DF2. O padrão de interferência é observado na saida 1 ou na saida 2, ao se variar a posição de um dos espelhos. A característica principal deste instrumento é que se variando a diferença de caminhos ópticos é possível fazer com que a luz comute entre uma e outra saída. Isto tem importância em comunicações ópticas porque possibilita alterar a direção de tráfego do sinal. Já no caso do interferômetro de Michelson, a luz ou vai para o observador, ou retorna para a fonte. saida 2 DF2 E1 saida 1 L1 F Óptica Moderna – EFundamentos e Aplicações 2 S. C. Zilio B DF1 B x1 B B 134 Interferência Fig. 6.10 - Interferômetro de Mach-Zehnder. 6.3 Interferência por divisão de amplitudes No nosso estudo de interferência nos concentramos até agora no problema de interferência entre apenas dois feixes. Queremos agora tratar o problema de interferência entre múltiplos feixes. Uma maneira de se produzir um grande número de feixes mutuamente coerentes é por reflexão múltipla entre duas superfícies planas e paralelas, parcialmente refletoras, como por exemplo, a placa de vidro mostrada na Fig. 6.11. P F θ (1) C A Placa de vidro n1 C´ (2) θ” B n2 d D n1 Fig. 6.11 - Interferência por múltiplas reflexões. Vamos inicialmente considerar apenas os raios (1) e (2) atingindo o ponto P. Posteriormente tomaremos um número maior de raios. Tomando a origem da propagação no ponto A, a situação do campo elétrico será: em A: Incidente: Refletido: Transmitido: Incidente: em B: Refletido: Transmitido: S. C. Zilio E0 exp{-iωt} ρE0 exp{-iωt} τE0 exp{-iωt} {( )} ρ′τE exp{i(k AB − ωt )} ττ′E exp{i (k AB − ωt )} τE0 exp i k 2 AB − ωt (6.29a) (6.29b) (6.29c) (6.30a) 0 2 (6.30b) 0 2 (6.30c) Óptica Moderna – Fundamentos e Aplicações Interferência {( )} Refletido: (ρ ′ ) τE exp {i (k AB + k BC − ωt )} Transmitido: ρ′ττ′E exp{i(k AB + k BC − ωt )} Incidente: ρ′τE 0 exp i k 2 AB + k 2 BC − ωt 2 em C: 0 2 0 2 2 2 135 (6.31a) (6.31b) (6.31c) A frente de onda é constituída pelos campos em C e C’, dados {[ ( ) ]} = ρ′ττ′E exp{i (2k AB − ωt )} E = ρE exp{i (k AC ′ − ωt ) } por: E C = ρ′ττ′E 0 exp i k 2 AB + BC − ωt 0 C′ (6.32a) 2 0 1 (6.32b) AB = BC . Por outro lado, vemos que AB = d / cos θ' ' AC′ = AC sen θ , implicando que AC′ = 2d tgθ ′′senθ. Definimos: onde φ1 = k 1 AC′ = 2dk 1 tgθ' ' sen θ φ 2 = 2k 2 AB = 2dk 2 /cos θ' ' e (6.33a) (6.33b) Podemos ainda obter através das equações de Fresnel que ρ = −ρ′ e ττ ′ = 1 − ρ 2 . Desta forma o campo elétrico total na frente de onda será: E total = E 1 + E 2 = E 0 [ρe iφ1 + ρ′ττ′e iφ 2 ] exp{− iωt } = ρE 0 exp[i (φ1 −ωt )][1 − (1− ρ 2 ) exp{i(φ 2 −φ1 )}] E total = E *total .E total = ρ 2 E 02 {1 + (1 − ρ 2 )[(1 − ρ 2 ) − 2 cos (φ 2 − φ1 )]} (6.34) de forma que a intensidade será proporcional a: 2 (6.35) Se tivermos trabalhando com vidros teremos ρ ~ 0,2 ⇒ ρ2 = 0,04 ⇒ (1 − ρ 2 ) = 0,96 ~ 1. Então: E total 2 = 2ρ 2 E 02 [1 − cos (φ 2 − φ1 )] (6.36) A diferença de fases é: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 136 Interferência δ = φ 2 − φ1 = 2k 2 d − 2k 1d sen θ tgθ′′ cos θ′′ 2d { k 2 − k 1 sen θ sen θ′′} = cos θ′′ (6.37) Usando a lei de Snell, k1 sen θ = k 2 sen θ′′ , temos: δ = 2dk 2 cos θ′′ = 4π n 2 d cos θ′′ λ0 (6.38) As condições de máximo e mínimo de interferência são dadas respectivamente por: 4πn 2 d cos θ′′ = (2m + 1) π λ0 4πn 2 d cos θ′′ = 2mπ λ0 (6.39a) (6.39b) 6.4 Interferômetro de Fabry-Pérot Voltamos agora à discussão da interferência de múltiplos feixes considerando todos os feixes emergindo da placa como indicado na Fig. 6.12. Usando o princípio da superposição encontramos o campo elétrico transmitido como: E0 E1’ E2’ E1 E2 E3’ E4’ E3 E4 Fig. 6.12 - Interferência de múltiplos feixes. E = ∑ E i = E 0 ττ′ + E 0 ττ′ρ′ 2 e iδ + E 0 ττ′ρ′ 4 e i 2δ + ... ∞ i =1 S. C. Zilio (6.40) Óptica Moderna – Fundamentos e Aplicações Interferência 137 onde E 0 ( t ) = E 0 exp{− iωt} , a origem das fases foi tomada no ponto B da Fig. 6.11 e δ é a diferença de fase obtida na seção anterior ( δ = 4λπ n 2 d cos θ′′ ). Colocando E 0 ττ′ em evidência obtemos: 0 ( ) E = E 0 ττ ′ 1 + ρ ′ 2 e iδ + ρ ′ 4 e i2δ + ... = E 0 ττ ′ 1 − ρ ′ 2 e iδ (6.41) Nesta última passagem foi usado o fato de que o termo entre parênteses é uma série geométrica. Além disso, ττ ′ = 1 − ρ 2 = 1 − R e ρ ′ 2 = ρ 2 = R , portanto o campo elétrico será dado por: E= E 0 (1 − R ) 1 − Re iδ (6.42) E 02 (1 − R ) E 02 (1 − R ) = Iα E = (1 − Re iδ )(1 − Re −iδ ) 1 + R 2 − 2R cos δ de onde se calcula a intensidade como: 2 2 2 (6.43) ou seja, Ι(δ ) = Ι 0 (1 − R ) = 2 1 + R − 2R (cos 2 δ/2 − sen 2 δ /2 ) 1 + 2 Ι0 sen 2 δ /2 4R (1− R )2 (6.44) Quando δ = 2nπ temos sen 2 δ/2 = 0 e Imax = I0, mas quando Ι 0 . A função I(δ), chamada de função de Airy, sen 2 δ/2 = 1 e Ι min = 1 + (1−4RR )2 está mostrada na Fig. 6.13. Costuma-se escrever: Ι(δ ) = I0 1 + Fsen 2 δ/2 (6.45) onde F = 4R/(1-R)2 indica o contraste das franjas de interferência. A função de Airy pode ser também graficada como função da frequência ν. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 138 Interferência Chamando de Δv a distância entre dois picos consecutivos desta função (free spectral range) e de δν a largura de cada pico, podemos definir a finesse do interferômetro como: F = Δν π = F δν 2 (6.46) Ι(δ) I0 R=0.2 2π 0 4π 6π R=0.9 δ Fig. 6.13 - Função de Airy. O dispositivo inventado por C. Fabry e A Pérot é usado geralmente para medidas de comprimentos de onda com alta precisão e para o estudo da estrutura fina de linhas espectrais. Um interferômetro deste tipo consiste essencialmente de dois espelhos parcialmente refletores de vidro ou quartzo, podendo ser planos ou esféricos, mas estando alinhados para se obter o contraste de franjas máximo. Se a distância entre as placas puder ser variada mecanicamente, o dispositivo é chamado interferômetro, mas se as placas forem fixas o termo usado é étalon. As Figs. 6.14 (a) e (b) mostram as duas situações. fonte extensa plano focal lente colimadora (a) lente focalizadora fonte pontual (b) S. C. Zilio Óptica Moderna –fotodetetor Fundamentos e Aplicações Interferência 139 Fig. 6.14 - (a) étalon Fabry-Perot e (b) interferômetro de Fabry-Pérot. O interferômetro é usualmente montado entre lentes colimadora e focalizadora. Se uma fonte extensa de luz é usada, franjas circulares concêntricas aparecem no plano focal da lente focalizadora. Uma outra maneira de se usar o interferômetro é no método de varredura, utilizando uma fonte pontual que é colocada de tal forma que apenas um ponto aparece no plano focal de saída. A varredura pode ser obtida mecanicamente, variando a distância entre os espelhos, ou, opticamente, variando a pressão do gás (índice de refração) no interferômetro. A intensidade de saída é medida foto-eletronicamente e consiste numa soma de funções de Airy, uma para cada componente espectral. 6.5 Analisador de espectro óptico Em todo o mundo, os lasers são amplamente empregados em diversas áreas do conhecimento humano. Durante sua utilização, principalmente no desenvolvimento de ciência e tecnologia, vários fatores influenciam a eficácia e precisão de uma determinada técnica. O comprimento de onda da luz do laser está sempre sujeito a pequenas variações devido às flutuações térmicas do ambiente, da tensão de alimentação, ruídos acústicos, etc. Para que se possa corrigir, ou pelo menos monitorar, as variações de comprimento de onda de lasers, é necessária a utilização de instrumentos ópticos com alto poder de resolução, capazes de distinguir freqüências bem próximas. Este tipo de instrumento é o analisador de espectro óptico, que consiste de um interferômetro de Fabry-Pérot confocal, cujo tamanho da cavidade é alterado por meio de um transdutor piezoelétrico, como mostra a Fig. 6.15. O principio de funcionamento do interferômetro de Fabry-Pérot foi discutido na seção anterior, onde encontramos que sua transmissão é dada pela função de Ary: Ι (ν ) = 1+ ( Ιo 2F π )2 sen 2 δ/2 (6.47) PZT S. C. Zilio Óptica Moderna – Fundamentos e Aplicações detetor lente espelhos 140 ( Interferência Fig. 6.15 - Vista esquemática do analisador de espectro óptico. ) onde I0 é a intensidade da luz incidente, F é a finesse da cavidade óptica F = π R / (1 − R ) e δ = 4πνd/c é a fase ganha pela onda ao efetuar uma volta completa na cavidade. A expressão acima é válida para uma onda plana incidindo normalmente num interferômetro de espelhos planos, separados por uma distância d. Num caso real, o feixe é gaussiano e os espelhos são esféricos, porém, o formato da curva é essencialmente o mesmo, exceto pela fase δ, que no caso do interferômetro confocal passa a ser a metade. A finesse caracteriza a qualidade da cavidade; quanto maior ela for, menor a largura dos picos de intensidade e maior o poder de resolução do interferômetro. Vemos da expressão para F que a finesse depende da refletividade dos espelhos, de maneira que quanto maior a refletividade, maior a finesse. Na prática, outros fatores são importantes na determinação de F, apesar da refletividade continuar sendo o termo principal. Estes outros fatores são: irregularidade nas superfícies, desalinhamento dos espelhos, perdas por absorção e por difração. Se a distância entre os espelhos for variada continuamente por meio de um transdutor piezoelétrico, a intensidade medida pelo detetor apresentará um perfil como o mostrado pela linha cheia da Fig. 6.16. Se o laser apresentar outro modo, de frequência ν', a ele corresponderá outra função de Airy, mostrada pela linha tracejada da Fig. 6.16. A distância entre picos consecutivos ( Δv = c / 4d no caso da cavidade confocal) é chamado de intervalo espectral livre (free spectral range) que em geral é da ordem de GHz. O espectro repete-se periodicamente em cada intervalo ν espectral livre. ν’ S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interferência 141 Fig. 6.16 - Funções de Airy para as frequências ν e ν '. 6.6 Teoria das películas Uma das aplicações da interferência de múltiplos feixes é na confecção de componentes ópticos que transmitem ou refletem seletivamente a radiação eletromagnética. Tais componentes são feitos depositando-se filmes finos de materiais dielétricos sobre um substrato de vidro ou quartzo opticamente polido. Os materiais mais utilizados para este fim são: MgF2 (n = 1,38), SiO2 (n = 1,45), ZnS(n = 2,38), criolita (n = 1,34), TiO2 (n = 2.4), ZrO2 (n = 2.2), etc.. No tratamento deste problema não usaremos a soma de campos transmitidos ou refletidos como foi feito o interferômetro de Fabry-Pérot. r r Ao invés, faremos uso das condições de contorno para E e H nas interfaces entre os filmes. Considere três meios com índices de refração n0, n1 e n2 conforme mostra a Fig. 6.17. r E0 r k0 r E2 r k2 r E1 r k1 r E1' r k1' r E '0 r k 0' n0 n1 n2 x l Fig. 6.17 - Geometria dos campos elétricos para a determinação das condições de contorno. 0 r O campo E 0 incide do meio n0 sobre o meio n1. O campo total r r refletido é E '0 . O campo total caminhando para a direita no meio n1 é E1 e r r para a esquerda E1' e no meio n2 o campo total transmitido é E 2 , caminhando para a direita. Como as polarizações não se alteram na passagem de um meio para o outro, podemos escrever as condições de r r contorno para os módulos de E e H como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 142 Interferência ⎧E 0 + E ′0 = E 1 + E 1′ ⎨ ⎩H 0 − H ′0 = H 1 − H 1′ em x = 0: em x = l : ⎧E 1exp{ ik 1l} + E 1′ exp{− ik 1l} = E 2 exp{ ik 2 l} ⎨ ⎩H 1exp{ ik 1l} − H 1′ exp{− ik 1l} = H 2 exp{ ik 2 l} (6.48a) (6.48b) Como H = nE/μc , as duas equações envolvendo o campo magnético se transformam em: n 0 (E 0 − E ′0 ) = n 1 (E1 − E1′ ) n 1 (E 1 exp{ ik 1l} − E 1′ exp{− ik 1l}) = n 2 E 2 exp{ ik 2 l} (6.49a) (6.49b) Das equações anteriores para o campo elétrico e destas duas últimas sai que: ⎛ E′ n 0 ⎜⎜1 − 0 ⎝ E0 1+ ⎞ E ⎟⎟ = [− in 1 sen k 1l + n 2 cos k 1l] 2 exp{ ik 2 l} E0 ⎠ ⎤E E ′0 ⎡ n = ⎢cos k 1l − i 2 sen k 1l ⎥ 2 exp{ ik 2 l} n1 E0 ⎣ ⎦ E0 Lembrando-se que τ = E 2 / E 0 (6.50a) (6.50b) e ρ = E′0 / E 0 , e que o fator exp { ik 2 l} não é importante, pois sempre estamos interessados em calcular ρ τ 2 2 e , podemos escrever as equações acima na forma matricial: ⎛ ⎜ cos k 1l ⎛1 ⎞ ⎛ 1 ⎞ ⎟⎟ ρ = ⎜ ⎜⎜ ⎟⎟ + ⎜⎜ ⎝n0 ⎠ ⎝− n0 ⎠ ⎜ − in senk l 1 1 ⎝ -( i ⎞ ) senk 1l ⎟ ⎛1 ⎞ ⎛1 ⎞ n1 ⎟ ⎜⎜ ⎟⎟τ = M⎜⎜ ⎟⎟τ (6.51) n ⎝n2 ⎠ cos k 1l ⎟⎠ ⎝ 2 ⎠ onde M é chamada de matriz de transferência de um filme com índice de refração n1. Podemos generalizar este raciocínio para N filmes, escrevendo: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interferência 143 ⎛1 ⎞ ⎛ 1 ⎞ ⎛1 ⎞ ⎜⎜ ⎟⎟ + ⎜⎜ ⎟⎟ ρ = M 1 M 2 M 3 ...M N ⎜⎜ ⎟⎟ τ ⎝n0 ⎠ ⎝− n0 ⎠ ⎝ n N +1 ⎠ (6.52) ⎛ A B⎞ ⎟⎟ é a matriz de transferência para N filmes. Da onde M1M2...MN = ⎜⎜ ⎝C D⎠ igualdade matricial acima obtém-se: ρ= τ= An 0 + Bn N +1n 0 − C − Dn N +1 An 0 + Bn N +1n 0 + C + Dn N +1 (6.53a) 2n 0 An 0 + Bn N +1n 0 + C + Dn N +1 (6.53b) A seguir vamos ver duas aplicações simples do que foi exposto acima. a) Película anti-refletora Tomemos inicialmente apenas uma película depositada sobre um substrato. Através da eq. (6.51) vemos que a matriz de transferência deste filme possui os elementos A = cos k1l, B = −i sen k1l/ n1, C = −i n1 sen k1l e D = cos k1l, que quando substituídos na eq. (6.53a), com n0 = 1 (ar), resulta em: ρ= n 1 (1 + n 2 Se k1l = π/2 temos ρ ( )cos k l − i(n ) ) senk l n 1 (1 − n 2 )cos k 1l + i n 1 − n 2 senk1l 2 2 + n2 (6.54) ρ = (n 2 − n 12 ) / (n 2 + n 12 ) e, portanto, R = 1 1 1 2 = [(n 2 − n 12 ) / (n 2 + n 12 )] . Se quisermos uma película anti-refletora (ρ = 0 ) as seguintes condições devem ser satisfeitas: 2 k 1l = λ 2πn 1l π = ⇒l= 0 λ0 2 4n 1 n1 = n 2 (6.55a) (6.55b) b) Espelho de alta refletividade S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 144 Interferência Considere agora 2N películas onde as ímpares têm espessura λi/4 e índice de refração ni, enquanto que as pares possuem espessura λp/4 e índice de refração np conforme mostra a Fig. 6.18. A matriz de transferência para uma camada dupla ímpar/par é: λi/4 n0 ni λp/4 np ni np 1 2 3 4 ni np n2N+1 2N Fig. 6.18 - Configuração para um espelho de alta refletividade. 0 ⎞ ⎛ − n p /n i ⎟⇒ MiMp = ⎜ ⎜ 0 − n i /n p ⎟⎠ ⎝ ⎞ ⎛ (− n p /n i )N 0 N ⎟ M = (M i M p ) = ⎜ N ⎟ ⎜ 0 (− n i /n p ) ⎠ ⎝ (6.56) Portanto, A = (− n p /n i )N , B = C = 0 e D = (− n i /n p )N e assim, tomando n0 = 1 temos: (− n ρ= (− n p p ⇒R= ρ S. C. Zilio /n i ) − (− n i /n p ) . n 2 N +1 /n i ) + (− n i /n p ) . n 2 N +1 2 N N N N ⎡ (n p /n i )2 N − n 2 N +1 ⎤ =⎢ ⎥ 2N ⎢⎣ (n p /n i ) + n 2 N +1 ⎥⎦ (6.57) 2 (6.58) Óptica Moderna – Fundamentos e Aplicações Interferência Quando np < ni e N é muito grande, (n p /n i ) 2 N ~ 0 e portanto R ~ 1. 145 Bibliografia 6.1. G. R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, NY (1968). Problemas 6.1. Calcule e grafique o padrão de interferência que seria obtido se 3 fendas igualmente espaçadas fossem usadas na experiência de Young. 6.2. Um espelho duplo de Fresnel possui um ângulo Φ (muito pequeno) entre os dois espelhos. Calcule o valor da interfranja como função deste ângulo. 6.3. Um interferômetro de Michelson é usado para medir o índice de refração de um gás. O gás flui para dentro de uma célula evacuada de comprimento L colocada num dos braços do interferômetro. O comprimento de onda é λ. (a) Se N franjas são contadas conforme a célula vai do vácuo para a pressão atmosférica, qual o índice de refração em termos de N, λ e L? (a) Quantas franjas serão contadas se o gás for CO2 (n = 1,00045) para uma célula de 10 cm usando luz de sódio (λ = 5890 Å)? 6.4. Numa experiência usando o espelho simples de Lloyd, o ângulo de incidência é 890. Qual é o espaçamento entre as franjas quando se usa luz de 6000 Å? 6.5. Considere duas ondas planas monocromáticas de mesma amplitude e freqüência que se interceptam de maneira que seus vetores de propagação formam um ângulo θ entre si. Supondo que os campos são linearmente polarizados na mesma direção, qual o período do padrão espacial formado? 6.6. Luz colimada com λ = 0.5 μm incide perpendicularmente sobre um biprisma de Fresnel, de índice de refração n = 1.5. Numa parede após S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 146 Interferência o biprisma, observam-se franjas separadas de 0.5 mm. Qual é o ângulo do biprisma? 6.7. Um biprisma de Fresnel, de índice de refração n = 1.5, está a 1 m de uma fonte pontual monocromática, com λ = 0.5 μm. Numa parede distante 1 m do biprisma, observam-se franjas separadas de 0.5 mm. Qual é o ângulo do biprisma? 6.8. Um feixe de luz colimado, de comprimento de onda λ incide normalmente numa placa de vidro de índice de refração n e espessura d. Dê uma expressão para a fração da intensidade incidente que é transmitida. 6.9. Um feixe de luz colimado incide sobre uma película plano-paralela de espessura d e índice de refração n, localizada no ar. Encontre a transmissão do filme como função do comprimento de onda incidente. Para que comprimento de onda a transmissão é mínima e qual o seu valor? 6.10. Desenvolva uma expressão para a refletância no ar (n0 = 1) de uma camada dupla de filmes finos depositados sobre uma placa de vidro de índice de refração n. Chame de n1 e n2, e l1 e l2 os índices de refração e espessuras das camadas. 6.11. Qual seria a menor variação de índice de refração possível de ser detectada com um interferômetro de Fabry-Pérot onde os espelhos distam 1 mm e λ0 = 6000 Å? S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Coerência 147 Coerência 7 7.1 Introdução No capítulo anterior deduzimos fórmulas para a interferência de ondas eletromagnéticas supondo serem elas monocromáticas, coerentes e de amplitudes constantes. Em casos reais, a amplitude e a fase variam com o tempo de maneira aleatória, produzindo assim, intensidades de luz que r r flutuam rapidamente. No caso da superposição dos campos E1 e E 2 , a intensidade será, a menos de constante multiplicativa, dada por: r r r r r I α (E 1 + E 2 ) *. (E 1 + E 2 ) = E 1 2 r + E2 2 r r + 2 Re E 1 . E *2 (7.1) r 2 r 2 significa média temporal, I 1 α E 1 e I 2 α E 2 . No que r r segue, vamos supor que E1 e E 2 são paralelos. A Fig. 7.1 mostra um caso típico de interferência. Supondo que os feixes 1 e 2 deixam fonte S em t = 0, eles chegarão ao ponto de observação P após decorridos os tempos t e t +τ, respectivamente, posto que caminham distâncias diferentes. Logo, E1 = E1(t) e E2 = E2(t +τ). onde A P 1 2 S B Fig. 7.1 - Interferência de dois campos E1 e E2. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 148 Coerência Na expressão para a intensidade temos um termo “cruzado” em E e E 2 . Vamos definir uma função de correlação ou coerência mútua como: * 1 Γ12 ( τ) = E 1 ( t ) E *2 ( t + τ) e a função de correlação normalizada: γ 12 (τ) = Γ12 (τ) Γ11 (0)Γ22 (0) = < E 1 ( t )E *2 ( t + τ) > Γ11 (0)Γ22 (0) (7.2) (7.3) onde Γ 11 (0) = E 1 (t) E 1* (t) α I 1 e Γ22 (0) = E 2 (t) E *2 (t) α I 2 . Assim, com base nas equações (7.1) e (7.3) podemos escrever: I = I1 + I 2 + 2 I1 I 2 Re γ 12 (τ) (7.4) A função γ 12 ( τ) é geralmente uma função periódica de τ. Portanto, teremos um padrão de interferência se γ 12 (τ ) , chamado de grau de coerência, tiver um valor diferente de 0. Em termos de γ 12 (τ ) temos os seguintes tipos de coerência: γ 12 = 1 Coerência completa 0 < γ 12 < 1 Coerência parcial γ 12 = 0 Incoerência completa No capítulo anterior definimos visibilidade das franjas como: η= I max − I min I max + I min (7.5) Como a função γ 12 ( τ) pode ser positiva ou negativa, temos: I max = I1 + I 2 + 2 I1 I 2 γ 12 (τ) I min = I1 + I 2 − 2 I1 I 2 γ 12 ( τ) S. C. Zilio (7.6) (7.7) Óptica Moderna – Fundamentos e Aplicações Coerência 149 Logo, em termos de γ 12 (τ ) a visibilidade é dada por: 2 I1 I 2 γ 12 (τ) η= I1 + I 2 (7.8) e no caso particular em que I1 = I2, η assume uma expressão simples: η = γ 12 (τ ) (7.9) Desta forma, para intensidades de mesmo valor, a visibilidade das franjas nos indica o grau de coerência da luz. 7.2 Coerência temporal Para mostrar como o grau de coerência está relacionado com as características da fonte, vamos considerar luz quase monocromática com a seguinte propriedade: o campo varia senoidalmente por um tempo τ0, chamado de tempo de coerência, e então muda de fase abruptamente. Esta seqüência se repete indefinidamente e a mudança de fase que ocorre a cada τ0 está aleatoriamente distribuída entre 0 e 2π, como mostra a Fig. 7.2. φ(t) 2π Δ1 π 0 0 Δ2 τ0 2τ0 Δ3 3τ0 Δ4 4τ0 Δ5 t Fig. 7.2 - Variação aleatória da fase a cada intervalo de tempo τ0. E( t ) = E 0 exp{ i [− ωt + φ ( t )] } O campo elétrico pode ser expresso como: (7.10) r r Supondo novamente que E1 e E 2 são paralelos e que possuem a mesma amplitude, temos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 150 Coerência γ 12 (τ ) = < E 0 exp {i [−ωt + φ(t )]}E 0 exp{− i [−ω(t + τ ) + φ(t + τ )]} > < E 1 E 1* > < E 2 E *2 > γ 12 (τ ) = exp{ iωτ}E 02 exp{ i [φ(t ) − φ(t + τ )] } / E 02 (7.11) e portanto, 1 T exp{ i [φ(t ) − φ(t + τ)] }dt T →∞ T ∫ 0 γ 12 (τ ) = exp{ iωτ} lim (7.12) Escrevendo a média temporal de forma explícita obtemos: (7.13) Para resolver esta integral devemos considerar dois casos: τ0 > τ e τ0 < τ, que serão analisados a seguir. Caso a) τ 0 > τ A Fig. 7.3 mostra como Δφ(t) = φ(t) - φ(t +τ) varia com o tempo. Para n τ 0 < t < (n+1) τ 0 - τ temos Δ φ = 0 e para (n + 1) τ 0 - τ < t < (n+1) τ 0 , temos Δ φ = Δ n+1. Logo, realizando explicitamente a integral temos: Δφ(t) nτ0 t 2π π 0 ∫ Δ1 τ0-τ 0 {∫ τ0 (n+1)τ0 Δ3 Δ2 τ0 t+τ 2τ0 2τ0-τ 3τ0 t 3τ0-τ Fig. 7.3 - Variação de Δφ com o tempo. T exp[ i Δφ(t )] dt = ∑ ∞ n =0 ( n +1)τ 0 − τ nτ 0 e xp(i0 ) dt + ∫ ( n +1)τ 0 ( n +1)τ 0 − τ exp( i Δ n +1 ) dt = ∑ [(n + 1) τ 0 − τ − nτ 0 ] + ∑ exp[iΔ n +1 ] [(n + 1) τ 0 − (n + 1) τ 0 + τ] 0 ∞ n =0 S. C. Zilio ∞ } n =0 = ∑ (τ 0 − τ) + τ∑ exp( i Δ n +1 ) = n (τ 0 − τ ) ∞ ∞ n =0 n =0 (7.14) Óptica Moderna – Fundamentos e Aplicações Coerência 151 A segunda somatória é nula pois as variações de fase são aleatórias e quando somamos exp{i Δ n+1}, os vários termos se cancelam. Assim sendo, substituímos a eq. (7.14) em (7.13) e obtemos: ⎡ 1 ⎤ ⎛ τ γ 12 (τ ) = exp{ iωτ}lim ⎢ n (τ 0 − τ)⎥ = exp{ iωτ}⎜⎜1 − n →∞ nτ ⎣ 0 ⎦ ⎝ τ0 Caso b) τ > τ 0 ⎞ ⎟⎟ ⎠ (7.15) Agora, Δφ será sempre diferente de zero, pois em t e t +τ0 as fases ∑ exp[iΔ ] = 0 ∞ são diferentes. Assim, temos um termo n =0 n +1 o termo não nulo em que Δφ = 0. Logo, para τ > τ 0 γ 12 (τ) = 0 . e não teremos teremos sempre Para utilizarmos a eq. (7.4), devemos tomar a parte real de γ12(τ), dada por: ⎧ ⎛ τ ⎞ para τ < τ 0 ⎪cos ωτ ⎜⎜1 − ⎟⎟ (7.16) Re γ 12 (τ ) = ⎨ τ0 ⎠ ⎝ ⎪ 0 para τ > τ 0 ⎩ Com este resultado, podemos fazer o gráfico de I(τ), mostrado na Fig. 7.4. Se I1 = I2 = I0, temos I(τ) = 2I 0 [1 + cos(ωτ)(1 − τ /τ 0 )] para τ < τ0 e 2I0 para τ > τ0. ( ( I1 + I 2 I1 + I 2 I1 − I 2 ) I(τ) 2 ) τ0 2 τ Fig. 7.4 - Interferência entre dois feixes parcialmente coerentes. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 152 Coerência 7.3 Resolução espectral de um pulso de luz Um outro ponto interessante a ser tratado neste capítulo é como o fato de um trem de ondas não ser temporalmente infinito altera sua composição espectral. Considere o campo elétrico E(t) num certo ponto do espaço. Esta função está relacionada com a transformada de Fourier da função g(ω), que dá a composição espectral do campo através da transformação: E(t ) = ∫ g(ω) exp(− iωt ) dω ⇔ g(ω) = +∞ −∞ 1 +∞ E(t ) exp( iωt ) dt (7.17) 2π ∫ − ∞ Tomemos um trem de ondas temporalmente finito, como o mostrado na Fig. 7.5. Ele pode ser expresso como: E(t) −τ0/2 τ0/2 t Fig. 7.5 - Trem de ondas finito ⎧ ⎪exp(− iω 0 t ) E(t ) = ⎨ ⎪ 0 ⎩ τ0 τ ≤t≤ 0 2 2 τ0 para t ≥ 2 para - [ (7.18) ] Desta forma, podemos encontrar g(ω) dado pela eq. (7.17) como: g(ω) = sen τ20 (ω − ω 0 ) 1 τ0 / 2 { } ω − ω = exp i ( ) t dt 0 π(ω − ω0 ) 2π ∫ − τ0 / 2 (7.19) que podemos re-escrever como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Coerência 153 g (ω) = τ0 ⎤ ⎡τ sinc ⎢ 0 (ω − ω0 )⎥ 2π ⎦ ⎣2 A intensidade do feixe é I α E 2 = 1 2π ∫ +∞ −∞ 2 E( t ) dt. Entretanto, através do teorema de Parceval podemos relacionar E ( t ) Vamos chamar g (ω) (7.20) 2 e g (ω) 2 2 ∞ 1 ∞ E ( t ) dt g ( ) dω = ω ∫ −∞ 2π ∫ − ∞ 2 2 como: (7.21) ou seja, a energia do trem compreendida entre ω e ω +d ω . As duas funções g(ω) e G(ω) estão esboçadas na Fig. 7.6. G( ω ) é dado por: τ2 τ G (ω) = 0 sinc 2 φ , onde φ = 0 (ω − ω0 ) . 2 4π 2 de G(ω), que é a função de distribuição espectral, g(ω) ~ sincφ G(ω) ~ sinc2φ -2π π π 2π φ Fig. 7.6 - Composição espectral do campo elétrico, g(ω) e função de distribuição espectral, G(ω). τ 02 , podemos encontrar as freqüências que dão a 4π 2 meia largura do pico central através de: Notando que G(ω0 ) = ⎡τ ⎤ sen 2 ⎢ 0 (ω ± − ω 0 )⎥ 1 ⎣2 ⎦ G (ω ± ) = G (ω0 ) = G (ω0 ) 2 2 ⎡ τ0 ⎤ ⎢ 2 (ω ± − ω 0 )⎥ ⎣ ⎦ S. C. Zilio (7.22) Óptica Moderna – Fundamentos e Aplicações 154 ω− Coerência Esta igualdade pode ser resolvida para nos dar os valores de ω+ e com os quais se calcula a meia largura da distribuição espectral: ω ± ≅ ω0 ± π / τ 0 ⇒ Δω = ω + − ω − = 2πΔν = 2π τ0 (7.23) Logo, a largura da linha espectral está relacionada com o tempo de coerência através de: 1 (7.24) Δν = τ0 Podemos ainda chamar l = cτ como diferença de caminhos ópticos (supondo que n = 1) e l c = cτ 0 como comprimento de coerência. Se quisermos ter interferência estacionária a desigualdade l < l c deve ser satisfeita. A seguir, vamos ver alguns exemplos numéricos para diferentes tipos de luz e para isto vamos usar a expressão τ0 = 1/Δν, onde Δν é a largura de linha, que será demonstrada na seção seguinte. Consideremos as seguintes fontes emissoras de luz: i) Lâmpada espectral: temos tipicamente λ = 5000 Å e Δλ ~ 1Å. O comprimento de coerência é l c = cτ 0 = c/Δν. Mas Δν/ν = Δλ/λ, ou (5X10 −5 ) λ2 cλ Δν = ν Δλ/λ, ο que nos leva a l c = = = 10 −8 νΔλ Δλ 2 = 2.5 mm. ii) Luz branca: agora temos λ = 5500 Å e Δλ ~ 1500 Å, que resulta em lc = λ2 = 0.002 mm = 2 μm. Δλ lc = 3 x1010 c = = 3 x 106 cm = 30 Km. 4 10 Δν iii) Radiação coerente (laser): um valor típico para Δν é de 104 Hz . Logo, 7.4 Coerência espacial Na seção anterior tratamos o problema da coerência de dois campos chegando ao mesmo ponto do espaço através de caminhos diferentes. Queremos agora, discutir o problema mais geral de coerência S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Coerência 155 entre dois campos em diferentes pontos do espaço. Isto é importante ao se estudar coerência de campos de radiação produzidos por fontes extensas. Considere a fonte pontual quase-monocromática da Fig. 7.7 e os pontos de observação P1, P2 e P3 com campos E1, E2 e E3 respectivamente. Os pontos P1 e P3 estão localizados na mesma direção da fonte, por isso entre eles dizemos que existe uma coerência espacial longitudinal, ao passo que entre P1 e P2, localizados à mesma distância da fonte, a coerência espacial é transversal. É evidente que a coerência longitudinal dependerá apenas de r13 = r3 – r1, ou equivalentemente, de t13 = r13/c. Para qualquer valor de E1(t), E3(t) variará da mesma maneira, mas a um tempo t13 mais tarde. Se t13 << τ0 haverá uma alta coerência entre P1 e P3 enquanto que se t13 >> τ0 a coerência será pequena ou mesmo nula. P2 r2 S r1 P1 r3 P3 Fig. 7.7 - Fonte pontual quase-monocromática. Já que uma fonte extensa pode ser considerada como composta por uma infinidade de fontes pontuais independentes, é conveniente estudar o caso de duas fontes pontuais isoladas. SA e SB são fontes completamente incoerentes mostradas na Fig. 7.8. Os campos elétrico nos pontos P1 e P2 são dados por: B E 1 ( t ) = E 1a ( t − t 1a ) + E 1b ( t − t 1b ) E 2 ( t ) = E 2a ( t − t 2a ) + E 2 b ( t − t 2 b ) (7.25.a) (7.25.b) e a função de correlação normalizada entre os campos E1 e E2 é: γ 12 = S. C. Zilio < E 1 E *2 > < E 1 E 1* >< E 2 E *2 > (7.26) Óptica Moderna – Fundamentos e Aplicações 156 Coerência r2a P2 SA r2b d l r1a SB P1 r1b r Fig. 7.8 - Fontes pontuais completamente incoerentes. Vamos chamar t ′ = t − t 1a , t ′′ = t − t 1b , t 1a − t 2a = τ a e t 1b − t 2b = τ b onde τ a e τ b são os tempos de coerência transversal de SA e SB. Logo, E1E *2 = E1a ( t ′) E *2 a ( t′ + τa ) + E1b ( t ′′) E *2 b ( t′′ + τ b ) B (7.27) Note que na expressão acima não comparecem os termos E 1a E 2b e E 2a E 2b , pois as fontes são completamente incoerentes. Apenas os termos diretos não são nulos, isto é, E1E1* = E 2 E*2 = E1a ( t − t1a ) E 2 a ( t − t1a ) 2 2 + + E1b ( t − t1b ) E 2 b ( t − t 1b ) 2 (7.28.a) 2 (7.28.b) 1 < E 1a ( t ′)E *2a (t ′ + τ a ) > 1 < E 1b ( t ′′)E *2 b ( t ′′ + τ b ) > + 2 2 2 2 < E 1b > < E 1a > Como as fontes são equivalentes podemos escrever: γ 12 = 1 1 1⎛ τ ⎞ 1⎛ τ γ (τ a ) + γ (τ b ) = ⎜⎜1 − a ⎟⎟ exp(iωτ a ) + ⎜⎜1 − b 2 2 2 ⎝ τ0 ⎠ 2 ⎝ τ0 (7.29) Logo, = ⎛ τa * γ ⎜ γ 12 = γ 12 12 = ⎜1 − ⎝ τ0 S. C. Zilio ⎞ ⎟⎟ exp(iωτ b ) ⎠ ⎞ 1 + cos [ω(τ a − τ b )] ⎟⎟ 2 ⎠ (7.30) Óptica Moderna – Fundamentos e Aplicações Coerência onde: τa − τb = 157 r1a − r2 a r1b − r2 b r1a − r1b r2 a − r2 b dl ≅ − = − c c c c rc (7.31) Se fizermos um esboço de γ 12 como função da distância entre os pontos P1 e P2 teremos o gráfico da Fig. 7.9, onde os primeiros mínimos saem da expressão: ωdl 0 ⎛ ωdl 0 ⎞ 1 + cos ⎜ = ±π ⎟=0⇒ rc ⎝ rc ⎠ πrc rc rλ ⇒ l0 = ± ⇒ l0 = = 2νd 2d ωd 1 (7.32) lγ12l l0 - l0 l Fig. 7.9 - Correlação entre os campos 1 e 2. Podemos chamar lω = 2l0 = rλ/d de comprimento de coerência transversal. Uma outra expressão interessante pode ser derivada definindo θd = d/r como na Fig. 7.10. Assim, lω = λ/ θd. Esta expressão é muito importante para a medida de diâmetros estelares através do experimento de dupla fenda. SA θ d SB r S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 158 Coerência Fig. 7.10 - Definição do ângulo de coerência. 7.5 Medidas de diâmetros de estrelas Na seção precedente introduzimos o conceito de comprimento de coerência transversal entre duas fontes pontuais completamente incoerentes. Este conceito pode ser utilizado na medida de diâmetros angulares de estrelas distantes. Se ao invés de duas fontes pontuais tivermos uma fonte circular, é possível mostrar que o comprimento de coerência transversal é dado por: l ω = 1.22 λ θd (7.33) onde o fator 1.22 corresponde ao primeiro zero da função de Bessel de primeira ordem dividido por π. Esta expressão também aparece na difração por uma fenda circular que veremos no próximo capítulo. Inicialmente selecionamos o comprimento de onda de alguma raia espectral emitida pela estrela por meio de um filtro óptico de banda estreita. A seguir, realizamos o experimento de interferência de Young, numa configuração em que é possível variar a distância (e portanto o grau de coerência) entre as duas fendas. Na situação em que a distância h entre as fendas é l0, γ 12 se torna nulo e as franjas de interferência desaparecem. Desta forma podemos encontrar lω = 2l0 e determinar o diâmetro angular θd da estrela. Como as estrelas se encontram muito distantes da Terra, θd é muito pequeno (da ordem de centésimos de segundo de arco) e assim lω é da ordem de metros. Uma maneira alternativa de se medir diâmetros estrelares com uma precisão melhor foi proposta por Hanbury-Brown e Twiss. Este método, conhecido como interferometria de intensidades, mede a função de coerência de segunda ordem dos campos, isto é, I1 (t ) I 2 (t ′) , onde I1 e I2 são as intensidades nos detetores 1 e 2, mostrados na Fig. 7.11. É possível mostrar que a coerência de segunda ordem exibe um efeito de interferência similar ao mostrado na Fig. 7.9. Ao invés de se variar a distância entre os detetores, como se faz com as duas fendas da experiência de Young, é introduzida uma linha de atraso eletrônica depois de um dos detetores (para variar o tempo t’) e desta forma os detetores S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Coerência 159 podem ficar estacionários, separados por uma distância de vários quilômetros, o que permite a medida de diâmetros angulares muito pequenos, da ordem de milionésimos de segundo de arco. atraso I1 ( t ) I 2 ( t ′) correlator Fig. 7.11 - Interferometria de intensidade para medir diâmetros de estrelas. Bibliografia 7.1. M.V. Klein, Optics, John Wiley and Sons, NY (1970). 7.2. G.R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, NY (1968). 7.3. M. Françon, Modern Applications of Physical Optics, Intersience, NY (1963). 7.4. R. Hanbury-Brown and R. Q. Twiss, Proc. Roy. Soc. A243, 291 (1957). Problemas 7.1. Um orifício de 1 mm de diâmetro é usado como fonte para a experiência da fenda dupla usando uma lâmpada de sódio (λ = 5890 Å). Se a distância entre o orifício e as fendas é de 2 m, qual é a máxima distância entre as fendas tal que as franjas de interferência ainda são observáveis? 7.2. Calcule o espectro de potência, G(ω), de um trem de ondas amortecido: ⎧A exp{− (at + iω0 t ) } E(t ) = ⎨ 0 ⎩ S. C. Zilio t ≥0 t<0 Óptica Moderna – Fundamentos e Aplicações 160 Coerência 7.3. Mostre que para um trem gaussiano E(t) = A exp{− (at 2 + iω0 t )} , G(ω) também é uma função gaussiana centrada em ω 0 . 7.4. Mostre que a função de correlação normalizada (grau de coerência) de um campo é dado pela transformada de Fourier normalizada do espectro de potência, isto é, γ12 (τ) = { ∫ ∞ −∞ G(ω) exp(iωτ) dω ∫ ∞ −∞ G(ω) dω } 7.5. Certa lâmpada tem uma função de distribuição espectral gaussiana, 2 i.e, B(v) = A exp − α 2 (ν − ν 0 ) . Encontre o tempo médio de coerência para os trens de onda oriundos desta fonte. 7.6. Usa-se a fonte do exercício anterior num interferômetro de Michelson. Como será o interferograma? Faça um gráfico de I x x. 7.7. Uma fonte de luz colimada, com espectro de potência G(ω) = cos [π(ω−ω0)/Δω] na região (ω0 − Δω/2) < ω < (ω0 + Δω/2) e zero fora desta região, é usada como fonte num interferômetro de Michelson. Encontre o interferograma produzido por esta fonte. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 161 Difração 8 8.1 Princípio de Huygens Neste capítulo vamos considerar o fenômeno da difração da radiação eletromagnética, que é conseqüência da natureza ondulatória da luz. Ela se constitui na distorção causada na frente de uma onda eletromagnética que incide sobre um obstáculo de dimensões comparáveis ao seu comprimento de onda. Estes obstáculos podem ser aberturas num anteparo, objetos opacos tais como esferas, discos e outros. Em todos esses casos, o caminho seguido pelo raio não obedece às leis da óptica geométrica, sendo desviado sem haver mudanças no índice de refração do meio. Assim, temos a presença de radiação em locais nos quais ela não seria esperada, como nas regiões de sombra indicadas Fig. 8.1. Raio de luz Região de sombra Região de sombra Fig. 8.1 - Ilustração de um experimento de difração em uma abertura. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 162 É como se a interação da radiação com as bordas do anteparo, ou do obstáculo, causasse uma perturbação na radiação em propagação e a espalhasse por regiões onde ela não deveria normalmente ser detectada. Como vimos no Cap. 2, este efeito é equivalente ao princípio da incerteza de Heisenberg, já que as equações do campo eletromagnético e a de Schrödinger são formalmente iguais. Os aspectos essenciais da difração podem ser explicados qualitativamente pelo princípio de Huygens. Segundo ele, cada ponto na frente de onda age como uma fonte produzindo ondas secundárias que espalham em todas as direções. A função envelope das frentes de onda das ondas secundárias forma a nova frente de onda total. A Fig. 8.2 ilustra este conceito. Com este princípio podemos perceber que cada nova frente de onda é formada pela interferência de infinitas fontes, as quais estão irradiando a partir da frente de onda num instante anterior. Isto pode ser traduzido em forma matemática dizendo-se que em cada ponto da nova frente de onda teremos um campo óptico que é igual à soma dos campos irradiados por todas as fontes secundárias. Note que o fenômeno de difração está fortemente baseado no de interferência. Como o número de fontes é infinito, a soma dos campos referentes a cada fonte secundária se transformará numa integral. frente de onda frente de onda secundária fonte secundária direção de propagação nova frente de onda Fig. 8.2 – Ilustração do princípio de Huygens para a construção geométrica de uma frente de onda, a partir de uma frente de onda anterior. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 163 O princípio de Huygens, posteriormente utilizado por Fresnel, pode ser enunciado matematicamente pela soma (integral) das várias ondas secundárias geradas numa área iluminada, como por exemplo, uma fenda. A geometria para esta situação está esquematizada na Fig. 8.3. A equação resultante de várias ondas secundárias no ponto P é: U(P ) = ∫∫ U A A exp { i (kr2 − ωt )} dA r2 (8.1) S’ θ1 θ2 ) n r r1 A r r2 P F Fig. 8.3 - Difração por uma fenda de área A. onde UA é a amplitude da onda primária que se origina na fonte F e ilumina a fenda. A partir dela, cada elemento dA da abertura gera uma onda esférica secundária que interfere no ponto P com outras ondas esféricas geradas em diferentes elementos da abertura. Vamos em seguida ver com mais detalhes matemáticos a obtenção da eq. (8.1). 8.2 Fórmula de Fresnel-Kirchhoff Após a abordagem inicial realizada por Huygens e Fresnel, um tratamento matemático mais preciso do princípio de Huygens foi proposto por Kirchhoff, da forma como segue. Vamos partir da segunda identidade de Green, que é expressa como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 164 ( ) ( ) r r I = ∫∫∫ V∇ 2 U − U∇ 2 V dυ = ∫∫ V∇U - U∇V . n̂ dS V A Difração (8.2) onde U e V são funções contínuas e integráveis que obedecem a equação de ondas: 1 ∂2U v2 ∂ t 2 ∇2U = ∇2V = 1 ∂ 2V v2 ∂ t 2 (8.3a) (8.3b) Estamos supondo que o meio é homogêneo, de forma que v não depende de r. As soluções da equação de ondas são da forma: U (r, t ) = U (r ) exp { ± iωt} V (r, t ) = V (r ) exp { ± iωt} (8.4a) (8.4b) que quando substituídas nas equações (8.3) resultam em: ∇2U = − ∇2V = − ω2 U(r ) v2 ω2 V(r ) v2 (8.5a) (8.5b) Com isto notamos que o integrando do lado esquerdo da eq. (8.2) é nulo, isto é, V∇ 2 U − U∇ 2 V = − ∫∫ (V∇U - U∇V ) . n̂ dS = 0. r Assim, ω2 (VU − UV ) = 0 v2 A r (8.6) A superfície fechada A envolve o volume de interesse, que podemos tomar como sendo aquele da Fig. 8.4. Neste caso, podemos dividir a integral em duas regiões, S1 e S2, tal que: . = + ∫∫ ∫∫ ∫∫ A S1 S. C. Zilio S2 Óptica Moderna – Fundamentos e Aplicações Difração 165 ) n1 S1 Volume de interesse P ρ S2 ) n2 Fig. 8.4 - Geometria utilizada para o cálculo da integral de superfície. Queremos encontrar o valor da função U no ponto de observação P e para isto tomaremos V(r,t) como sendo uma onda esférica da forma V(r, t ) = V0 exp{ i (kr − ωt )}/r. O gradiente em coordenadas esféricas é dado por: r ∂ 1 ∂ 1 ∂ ∇= φ̂ θ̂ + r̂ + ∂r rsenθ ∂ φ r∂θ J = ∫∫ (V∇U - U∇V ).n̂ dS de forma que a integral de superfície em S2 fica: r r (8.7) = r r ⎛ exp{ i (kr - ωt )} ⎞⎤ ⎡ V0 { ( ) } exp i kr ωt U UV − ∇ ∇ ⎜ ⎟⎥ . n̂ 2 dS 2 0 ⎢ ∫∫S2 ⎣ r r ⎝ ⎠⎦ S2 2 2 (8.8) 2 onde dS2 = ρ dΩ e n̂ 2 = −r̂ , que substituidos na eq. (8.8) resulta em: ⎡ e ikr r ⎛ 1 ik ⎞ ⎤ J = V0 e −iωt ∫∫ ⎢ ∇U - Ue ikr ⎜ − 2 + ⎟ r̂ ⎥ . (− r̂ )ρ 2 dΩ S2 r ⎠ ⎦ r =ρ ⎝ r ⎣ r S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 166 = V0e −iωt 1 ik ⎞⎤ 2 ⎡ eikρ r ikρ ⎛ ∫∫S2 ⎢⎣ ρ (− ∇U. r̂ )r=ρ + Ue ⎜⎝ − ρ2 + ρ ⎟⎠⎥⎦ ρ dΩ ∫ (8.9) Tomando o limite ρ → 0 obtemos J = −V0 exp{− iωt}U(P ) dΩ = − 4πV0 exp{− iωt}U(P ) . Logo, como ∫∫ = ∫∫ + ∫∫ ( ) = 0 temos: r r 4πV0 exp{− iωt}U (P ) = ∫∫ V∇U - U∇V . n̂ 1dS1 = A S1 S2 ⎡ exp{ i (kr − ωt )} r ⎛ 1 ik ⎞ ⎤ = ∫∫ ⎢V0 ∇U − UV0 exp{ i (kr − ωt )}⎜ − 2 + ⎟ r̂ ⎥ . n̂ 1 dS1 S1 r r ⎠ ⎦ S1 ⎝ r ⎣ (8.10) que nos leva à equação básica da teoria da difração: S1 ⎡ e ikr r ⎤ ⎛ 1 ik ⎞ 4πU (P ) = ∫∫ ⎢ ∇U − U ⎜ − 2 + ⎟ r̂ e ikr ⎥ .n̂ 1dS1 S1 r ⎠ ⎝ r ⎣ r ⎦ S1 (8.11) Esta expressão é chamada de teorema integral de Kirchhoff. Ela relaciona o valor da função no ponto de observação P com valores desta função e sua derivada sobre a superfície S1 que envolve o ponto P. Como tomamos ρ → 0, a Fig. 8.4 se modifica da maneira mostrada na Fig. 8.5. Particularizando a eq. (8.11) para o caso em que U é também uma onda esférica da forma: U(r1 , t ) = U0 exp{ i (kr1 − ωt )} r1 (8.12) o teorema integral de Kirchhoff pode ser escrito de forma mais explícita como: 4πU(P ) = ikU 0 e −iωt ∫∫ exp{ik (r1 + r2 )} [cos θ1 − cos θ 2 ]dS1 S1 r1 r2 ⎤ ⎡ e ikr2 e ikr1 − U 0 e −iωt ∫∫ ⎢ 2 cos θ1 − 2 cos θ 2 ⎥ dS1 S1 r r r1 r2 ⎦ ⎣ 21 S. C. Zilio (8.13) Óptica Moderna – Fundamentos e Aplicações Difração 167 r r1 F ) n1 S1 (fonte) r r2 P Fig. 8.5 - Geometria usada no cálculo da integral Kirchhoff. onde θ1 é o ângulo entre n̂ 1 e r̂1 , e θ2 é o ângulo entre n̂ 1 e r̂2 . O termo ( cos θ 1 − cos θ 2 ) é chamado de fator de obliqüidade. Nos fenômenos de difração r1 e r2 são geralmente grandes, de forma que podemos desprezar o segundo termo. Assim obtemos: ikU 0 e −iωt U(P ) ≈ 4π ∫∫ S1 exp{ik (r1 + r2 )} [cos θ1 − cos θ 2 ]dS1 r1 r2 (8.14) Esta é a conhecida fórmula de Fresnel-Kirchhoff. Vamos particularizá-la para o caso de difração por uma fenda de área A, na geometria da Fig. 8.3, com S1 = S’+ A. Pode-se mostrar que a integral sobre S’ é desprezível e assim, U(P ) ≈ ikU 0 e − iωt 4π ∫∫ exp{ik (r1 + r2 )} (cos θ1 − cos θ 2 ) dA A r1 r2 (8.15) A fórmula de Fresnel-Kirchhoff nada mais é do que a afirmação matemática do princípio de Huygens. Para examinar melhor este ponto vamos tomar uma abertura circular com a fonte F localizada no eixo de simetria da abertura conforme mostra a Fig. 8.6. A superfície de integração A é um pedaço de casca esférica de raio r1 e centro em F, de forma que θ1 = π. Logo: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 168 U(P ) = − exp{ i (kr2 − ωt )} ik (1 + cos θ 2 ) dA U A r2 4π ∫∫ A (8.16) A ) n r r1 r r2 P onde U A = U 0 exp { ikr1 }/ r1 é a amplitude da onda primária incidente. A partir dela, cada elemento dA da abertura gera uma onda esférica Fig. 8.6 - Difração em uma fenda circular. secundária U A [exp ⎧⎨⎩ i ⎛⎜⎝ kr2 − ωt ⎞⎟⎠ ⎫⎬⎭ / r2 ] dA . No princípio de Huygens não existe o fator de obliqüidade nem a fase -π/2 introduzida no campo pela difração. Note que a difração na direção da fonte é zero pois θ2 ≈ π e o fator de obliqüidade é nulo. 8.3 Princípio de Babinet Considere uma abertura A que produz um campo difratado U(P) no ponto de observação P. Suponha agora que a abertura é dividida em duas porções A1 e A2 tal que A = A1 + A2. As duas novas aberturas são ditas complementares. Um exemplo está mostrado na Fig. 8.7. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 169 Fig. 8.7 - Exemplo de geometria ilustrativa do princípio de Babinet. Da fórmula de Fresnel-Kirchhoff é fácil ver que U(P) = U1(P) + U2(P). Esta equação, conhecida como princípio de Babinet, é uma conseqüência direta da possibilidade de divisão da região de integração em diversas partes. 8.4 Difração de Fraunhofer No tratamento detalhado da difração é usual distinguir-se dois casos gerais conhecidos como difração de Fraunhofer e Fresnel. Qualitativamente falando, a difração de Fraunhofer ocorre quando as ondas incidente e difratada são planas. Este é o caso quando as distâncias r1 e r2 são tão grandes que a curvatura da frente de onda pode ser desprezada, como mostra a Fig. 8.8(a). Por outro lado, se a fonte e o ponto de observação estão suficientemente próximos da abertura temos então difração de Fresnel (Fig. 8.8(b)), onde a curvatura da frente de onda na abertura não pode ser desprezada. F ∞ F P (a) Fraunhofer ∞ P (b) Fresnel Fig. 8.8 - Tipos de difração. O arranjo experimental para se observar difração de Fraunhofer está mostrado na Fig. 8.10. Em particular, vamos analisar o caso da difração pela fenda estreita mostrada na Fig. 8.10. O campo elétrico no ponto P será dado por: U(P ) = S. C. Zilio ikU 0 −iωt exp{ ik (r1 + r2 )} [cos θ1 − cos θ 2 ]dA e ∫∫ A 4π r1 r2 (8.17) Óptica Moderna – Fundamentos e Aplicações Difração 170 onde r1 e r2 são respectivamente as distâncias de F e P ao elemento de área dA. Levando-se em conta que os pontos F e P estão infinitamente afastados, de forma que r1 e r2 não variam muito ao fazer-se a integração sobre A, podemos escrever: U(P ) ≈ ike − iωt U 0 ⎡ cos θ1 − cos θ 2 ⎤ ⎥ ∫∫ A exp{ik (r1 + r2 )}dA ⎢ 4π r1 r2 ⎣ 14444 4244444 3⎦ (8.18) C Plano focal P F Lente focalizadora Lente colimadora Fig. 8.9 - Arranjo para observar difração de Fraunhofer. y y x b θ r2 z r r r1 L r r0 P F Fig. 8.10 - Fenda estreita (L >> b). U (P ) ≈ CL ∫ b/2 −b / 2 exp{ ik (r1 + r2 )}dy (8.19) pois dA = Ldy. Uma segunda aproximação a ser feita é considerar r1 constante sobre A. Além disto, r2 = r0 + y senθ, logo: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 171 U (P ) ≈ CL exp{ ikr1 }∫ b/2 −b / 2 exp{ ik (r0 + ysenθ)}dy = CL exp{ik (r1 + r0 )}∫ exp{ikysenθ}dy 144 42444 3 −b / 2 b/2 C′ exp{ iky sen θ} ik sen θ sen ( kb2 sen θ) kb 2 sen θ (8.20) Esta última integral é fácil de ser calculada e nos leva a: U ( P) = C′ Fazendo β = kb senθ , temos: 2 U(P ) = C′b b/2 −b / 2 = C′b sen β sen 2 β ⇒ I(P ) = I 0 β2 β (8.21) (8.22) O padrão de difração I(P) está mostrado na Fig. 8.11. O máximo central ocorre para β = 0 (θ = 0) enquanto que os mínimos localizam-se em β = ± n π, onde n é um inteiro. I(P) terá máximos relativos para β = ± l,43 π, ± 2,46π, etc. que são raízes de β = tgβ. I(β) I0 -2π −-π π 2π β Fig. 8.11 - Padrão de difração para uma fenda estreita. Consideremos apenas a franja central para deduzir uma expressão para o ângulo no qual a luz se espalha. Para este fim vamos considerar a Fig. 8.12. Como os primeiros mínimos ocorrem para β = ±π e θ = φ/2, temos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 172 π= kb φ 2π φ sen = b sen 2 2 2λ 2 (8.23a) φ Fig. 8.12 - Ângulo de abertura da franja central. Fazendo a aproximação de pequenos ângulos (φ << π), na qual sen φ/2 ≈ φ/2, obtemos: π= bπ φ 2λ ⇒φ= λ 2 b (8.23b) Esta expressão é bastante adequada para se observar a analogia entre a óptica ondulatória e a mecânica quântica. Nesta, um dos princípios fundamentais é o da incerteza (de Heisenberg) que estabelece para uma dimensão: Δy Δpy ~ h (8.24) Para o problema de difração que estamos tratando, Δy pode ser identificado com a largura da fenda, b, enquanto que Δpy é a incerteza no momentum do fóton, cujo valor é p = h/λ, como demonstrado por de Broglie. Olhando para a Fig. 8.13, vemos que a incerteza no momentum do fóton é Δpy = p senφ/2 = h/λ senφ/2 ≈ h/λ φ/2. Assim, y S. C. Zilio Δy φ p Δpy Óptica Moderna – Fundamentos e Aplicações Difração 173 Fig. 8.13 - Ângulo de abertura da franja central. b 2λ hφ ~h⇒φ= 2λ b (8.25) que reproduz a eq. (8.23b), demonstrando a analogia entre a óptica ondulatória e a mecânica quântica. No caso de uma fenda retangular, com os lados a e b da mesma ordem de grandeza, teremos: I(P ) = I 0 sen 2 α sen 2 β β2 α2 (8.26) onde α = ka sen γ . Deixaremos a demonstração desta expressão como 2 exercício. 8.5 Difração por uma abertura circular No caso de uma abertura circular, vamos usar a variável y para integração, similarmente ao que foi feito para a fenda estreita. Chamando de R o raio da abertura, o elemento de área será tomado como sendo uma faixa de comprimento 2 R 2 − y 2 e largura dy, como mostra a Fig. 8.14. y x R y r0 P θ z Fig. 8.14 - Ilustração da geometria envolvida na difração por uma abertura circular. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 174 Consideremos, dentro da aproximação de Fraunhofer, que a onda incidente na abertura circular seja plana. A amplitude da onda no ponto P é dada, de acordo com a eq. (8.17), por: U (P ) ≈ C exp{ikr0 }∫ exp {ikysenθ} 2 R 2 − y 2 dy R −R (8.27) onde foi utilizado r2 = r0 + y senθ e dA= 2 R − y dy . Introduzindo as 2 2 grandezas u = y/R e ρ = kRsenθ, a integral acima se torna: U (P ) ≈ 2CR 2 exp{ ikr0 }∫ exp { iρu} 1 − u 2 du +1 −1 (8.28) Esta é uma integral padrão (tabelada), cujo valor é π J1(ρ)/ρ , onde J1(ρ) é uma função especial chamada de função de Bessel de primeira ordem. Desta forma, a intensidade do feixe difratado se torna: 2J 1 (ρ) 2J (ρ) I(P ) = (CπR ) = I0 1 ρ ρ 2 2 2 2 (8.29) uma vez que J1(ρ)/ρ → 1/2 quando ρ → 0. A dependência de Io em R4 indica uma rápida redução (ou aumento) na intensidade de luz com a diminuição (ou aumento) do raio da abertura circular. Outro ponto importante a ser considerado é quanto aos zeros da função J1(ρ). Eles determinam os pontos de intensidade nula, os quais estão localizados em círculos concêntricos em torno do ponto θ = 0 . As raízes da função J1(ρ) ocorrem para os valores de ρ iguais a 3.83, 7.02, 10.17, etc., como mostra a Fig. 8.15. Com eles são obtidos os ângulos θ que correspondem à intensidade nula. Tais ângulos serão: θ1 = 3,83/kR = 0,61λ/R, θ2 = 7,02/kR = 1,12λ/R, θ3 = 10,17/kR = 1.62λ/R. I(P) ρ S. C. Zilio -10 -5 Óptica0 Moderna 5 – Fundamentos 10 e Aplicações Difração 175 Fig. 8.15 - Padrão de difração para uma abertura circular. 8.6 Rede de difração Vamos utilizar uma análise similar à anteriormente realizada para a fenda estreita na aproximação de Fraunhofer para entendermos o funcionamento da rede de difração mostrada na Fig. 8.16. Começaremos com a expressão dada pela eq. (8.20) e somaremos para as várias fendas paralelas. Assim temos: P b h θ x Fig. 8.16 - Rede de difração. U ≈ C ∫ exp{ikysenθ} dy = C ∫ exp{ikysenθ} dy + b + C∫ h +b h exp{ikysenθ} dy + C∫ exp{ikysenθ} dy + L 0 2h+b 2h (8.30) onde o número de integrais do lado direito é igual ao número de fendas paralelas, que tomaremos como N+1 ≈ N, para N >> 1. Esta expressão pode ser escrita da forma: U = C ∑∫ N jh + b j=0 jh exp{ikysenθ}dy (8.31) para N+1 fendas. Assim, realizando a integração temos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 176 U=C∑ N j= 0 =C exp{ ik ( jh + b)senθ} − exp{ ik ( jh )senθ} iksenθ exp{ikbsenθ}− 1 N exp{i k j h senθ} ∑ iksenθ j= 0 (8.32) Desta expressão é possível mostrar, embora não o façamos aqui, que ⎛ senί ⎞⎛ senNγ ⎞ ⎟⎟⎜⎜ ⎟⎟ U = 2bCNexp{ i[ί + (N − 1)γ}⎜⎜ ⎝ ί ⎠⎝ Nsenγ ⎠ kb sen θ kh sen θ onde β = e γ= . Logo, 2 2 ⎛ sen β ⎞ 2 ⎟⎟ Iα U (P) ⇒ I = I 0 ⎜⎜ ⎝ β ⎠ ⎛ sen β ⎞ FD 2 ⎛ sen Nγ ⎞ ⎟⎟ ⎜⎜ ⎝ N sen γ ⎠ FI (8.33) 2 (8.34) ⎛ sen Nγ ⎞ com FD = ⎜⎜ ⎟⎟ o fator ⎟⎟ sendo o fator de difração e FI = ⎜⎜ ⎝ N sen γ ⎠ ⎝ β ⎠ de interferência. A Fig. 8.17 mostra o padrão de difração e interferência para a rede considerada. Vemos que FD = 0 para β = ± nπ (n = inteiro diferente de zero) e FD é máximo para β = 0, ± 1,43π, etc. Por outro lado, FI = 0 quando sen Nγ = 0, ou seja, quando γ = mπ/N, e máximo para sen γ = 0, o que implica em γ = mπ e consequentemente, sen θ = mλ/h. 2 2 I(θ) I0 1,0 0,8 FD 0,6 0,4 θ 0,2 0,0 S. C. Zilio 0,0 Linha de 0,5 ordem zero 1,5 2,5 3,0 Linha de 2,0 ordem um Óptica Moderna – Fundamentos e Aplicações 1,0 Difração 177 Fig. 8.17 - I(θ) para uma rede de difração. O poder de resolução da rede de difração é definido como PR = λ/Δλ, onde Δλ é a separação entre duas linhas espectrais, que pode ser obtida usando-se o critério de Rayleigh, mostrado na Fig. 8.18. Este critério estabelece que duas linhas estarão resolvidas quando o máximo de uma coincide com o zero da outra. A dispersão angular de uma rede é dada por DA = dθ/dλ, mas como senθ = mλ/h (condição de máximo de FI), temos que cosθ dθ = m dλ/h e, portanto, DA = dθ/dλ = m/(h cosθ). Por outro lado, γ = (kh / 2)sen θ e assim Δγ = (πh / λ ) cos θ dθ . Do critério de Rayleigh temos que Δγ = π / N ⇒ Δθ = λ / (Nh cos θ) . Como DA = Δθ /Δλ = m/h cosθ, obtemos Δλ = (Δθ h / m ) cos θ = λ/mN e portanto o poder de resolução da rede é: PR = λ = mN Δλ (8.35) 1+2 1 2 λ λ+Δλ Fig. 8.18 - Critério de Rayleigh. 8.7 Padrões de difração de Fresnel Vamos agora analisar o caso de difração de Fresnel e para isto vamos considerar a Fig. 8.19, na qual as coordenadas da fonte e do observador são dadas respectivamente por: F:(0,0,-h1) e P:(0,0,h2). Note S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 178 que estamos tratando do caso em que tanto a fonte como o observador encontram-se sobre o eixo óptico. Partindo da eq. (8.14) temos: ikU 0 e − iωt U(P ) = 4π exp{ ik (r1 + r2 )} [cos θ1 − cos θ 2 ] dA ∫∫ S1 r1 r2 (8.36) y dA r r1 F x r R r r2 n̂ h1 h2 z P Fig. 8.19 - Geometria para a difração de Fresnel. Antes de tratarmos a solução desta integral, vamos fazer uma análise qualitativa do que devemos esperar da difração de Fresnel. Vamos considerar inicialmente uma área com simetria azimutal, como por exemplo, uma abertura circular, e dividi-la em regiões delimitadas por círculos de raios constantes tal que r1 + r2 difiram de λ/2 entre dois círculos consecutivos. Estas regiões são denominadas de zonas de Fresnel e possuem a propriedade que a fase ik(r1 + r2) muda de sinal ao se passar de uma zona para outra. Fazendo as aproximações r1 = ⎡ ≈ h 1 ⎢1 + ⎣ R2 r1 + r2 ≈ h 1 + h 2 + 2 h1 1 + R2 h 12 S. C. Zilio h 12 + R 2 = 1 R2 1 R2 1 R2 ⎤ h + r ≈ h + = e temos 1 2 2 ⎥ 2 h1 2 h2 2 h 12 ⎦ ⎡1 1 ⎡1 1 ⎤ 1⎤ R2 , onde =⎢ + ⎥. ⎢ + ⎥ = h1 + h 2 + 2L L ⎣ h1 h 2 ⎦ ⎣ h1 h 2 ⎦ Óptica Moderna – Fundamentos e Aplicações Difração 179 = λL , R2 = 2λL ,....., Rn = nλL. Assim, se a n-ésima zona for definida pelo raio interno Rn e pelo raio externo Rn+1, sua área será πR n2 +1 − πR 2n = πR 12 , sendo portanto independente de n. Desta forma, as áreas das zonas de Fresnel são todas iguais. Como a fase muda de sinal ao se passar de uma zona para a próxima, pois: Desta expressão vemos que os raios das zonas de Fresnel são dados por R1 k (r1 + r2 ) n +1 − k (r1 + r2 ) n = k Podemos escrever: λ =π 2 U(P) = U1 − U 2 + U 3 − U 4 + .... (8.37) (8.38) onde Un é a contribuição da n-ésima zona ao campo difratado. Como as áreas das zonas de Fresnel são iguais, os módulos das contribuições de cada uma será aproximadamente igual. Desta forma, se abertura circular contiver um número inteiro de zonas e se este número for par, o campo difratado será aproximadamente nulo e haverá uma mancha escura no centro do padrão de difração. Por outro lado, se o número de zonas de Fresnel for ímpar, o campo difratado terá apenas a contribuição de U1 . Na prática, o valor de Un decresce lentamente com n devido ao fator de obliqüidade e à dependência radial dada pelo produto r1 r2 que aparece no denominador. Isto faz com que o campo difratado no ponto P seja metade da contribuição da primeira zona sozinha no caso de uma abertura circular infinitamente grande (n → ∞). Para verificarmos este fato podemos reescrever a eq. (8.38) como: U ( P ) = ½ U 1 + (½ U 1 − U 2 + ½ U 3 ) + (½ U 3 − U 4 + ½ U 5 ) + .... (8.39) Os termos entre parênteses são aproximadamente nulos uma vez que o valor de U n é igual á média aritmética dos dois U’s adjacentes. Desta forma, o campo difratado no ponto P é aproximadamente igual a ½ U 1 quando não existir abertura (n → ∞). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 180 Se ao invés de uma abertura circular tivéssemos considerado um disco centrado no eixo óptico, a construção das zonas de Fresnel começariam na borda do disco. De acordo com a eq. (8.39), o feixe difratado em P será a metade da contribuição da primeira zona não obstruída e assim veríamos uma mancha brilhante (spot de Poisson) sobre o eixo óptico, como se o disco não existisse. Esta é uma situação que vai contra as conclusões que intuitivamente se tira da óptica geométrica. Pela análise qualitativa feita até agora, podemos ver da eq. (8.38) que as zonas de Fresnel ímpares dão uma contribuição positiva para a difração, enquanto que as zonas pares contribuem negativamente. Assim, poderíamos pensar em construir uma abertura, como a mostrada na Fig. 8.20, que eliminaria as contribuições das zonas pares, resultando em: U(P) = U1 + U 3 + U 5 + .... (8.40) Este tipo de abertura produz uma intensidade do feixe difratado em P muito maior do que se não existisse a abertura e sob este aspecto funciona como se fosse uma lente (lente de Fresnel), com distância focal efetiva dada por L = R12 /λ. Este tipo de lente é usado em retro-projetores e possui o inconveniente de ser fortemente cromática devido à dependência de L com o inverso de λ. Fig. 8.20 – Placa com zonas de Fresnel. Após esta discussão qualitativa sobre a difração de Fresnel por aberturas e obstáculos com simetria azimutal, voltemos à eq. (8.36) para S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 181 aplicá-la ao caso de aberturas retangulares. Tomando r1r2 ≈ h1 h2 e supondo que o fator de obliqüidade varia pouco, podemos escrever: U (P ) = 2⎫ ⎧ ikU 0 e − iωt [cos θ1 − cos θ 2 ] e ik ( h1 + h 2 ) ∫∫ S exp⎪⎨ i kR ⎪⎬ dA 1 4π h 1 h 2 ⎪⎩ 2L ⎪⎭ ( ) ⎧ k x 2 + y2 ⎫ ≈ C ∫∫ exp⎨ i ⎬ dxdy S1 2L ⎩ ⎭ (8.41) onde a constante defronte à integral foi denominada C. Fazendo as substituições u = x k/πL , obtemos finalmente: U (P ) = v = y k/πL ⎧ πu 2 ⎫ C πL u 2 exp ⎬ du ⎨i k ∫ u1 ⎩ 2 ⎭ ∫ v2 v1 e dxdy = πL/k dudv ⎧ πv 2 ⎫ exp ⎨ i ⎬ dv ⎩ 2 ⎭ (8.42) Façamos agora um breve parêntese para discutir as integrais acima, chamadas de integrais de Fresnel: ∫ ω 0 ⎧ iπω′ 2 ⎫ exp⎨ ⎬ dω′ = C(ω) + i S(ω) ⎩ 2 ⎭ (8.43) onde C( ω ) e S( ω ) são dadas graficamente pela espiral de Cornu mostrada na Fig. 8.21. Alguns casos limites desta integral são: C(∞) = S(∞) = ½, C(-∞) = S(-∞) = -½ e C(0) = S(0) = 0. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 182 S(ω) 0.5 ω -0.5 C(ω) 0.50.5 -0.5 Fig. 8.21 - Espiral de Cornu. Logo, ∫ ω2 ω1 =∫ +∫ 0 ω1 ω2 0 =∫ ω2 0 − ∫ = C(ω 2 ) − C(ω1 ) + iS(ω 2 ) − iS(ω1 ) ω1 0 (8.44) No caso da eq. (8.42) que estamos estudando, U( P ) = CπL {[C(u 2 ) − C(u1 )] + i[S(u 2 ) − S(u1 )]} k x{[C(v 2 ) − C(v1 )] + i[S(v 2 ) − S(v1 )]} (8.45) Para uma abertura infinita, isto é, sem nenhum obstáculo para difração, u1 = v1 = -∞ e u2 = v2 = ∞ e, portanto, U0 = (CπL/k)(1 + i)2. Assim, a expressão para a difração por uma abertura retangular pode ser re-escrita como: {[C(u 2 ) − C(u 1 )] + i[S(u 2 ) − S(u 1 )]} (1 + i )2 x{[C(v 2 ) − C(v 1 )] + i[S(v 2 ) − S(v 1 )]} U(P ) = S. C. Zilio U0 (8.46) Óptica Moderna – Fundamentos e Aplicações Difração 183 Esta expressão pode ser usada para o cálculo da difração por uma fenda estreita, considerada como um caso limite da abertura retangular, onde u1 = -∞ e u2 = ∞. Desta forma temos: U(P ) = U0 { [C(v 2 ) − C(v1 )] + i[S(v 2 ) − S(v1 )]} (1 + i ) (8.47) e finalmente, a difração por uma borda reta (como uma lâmina de barbear) constitui-se no caso limite da eq. (8.47) quando v1 = -∞, tal que: U( P ) = U0 ⎧ 1 ⎫ ⎨[C( v 2 ) + iS( v 2 )] + (1 + i )⎬ 2 (1 + i ) ⎩ ⎭ (8.48) ficando apenas como função da variável v2, que dá a posição da borda refratora. Se a borda estiver sobre o eixo z (v2 = 0), a eq. (8.48) nos fornece U(P) = ½ U0, isto é, a amplitude do campo difratado é a metade da do caso em que não existe abertura nenhuma e, consequentemente, a intensidade é ¼ da que se observa no espaço livre. A Fig. 8.22 mostra a intensidade da luz difratada no ponto P como função da posição da borda. As oscilações vistas no gráfico correspondem às rotações em torno do ponto ½ da espiral de Cornu. I/I0 1 região de sombra 0,5 v2 Fig. 8.22 – Intensidade do sinal difratado por uma borda reta como função de sua posição. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 184 8.8 Óptica de Fourier Vamos considerar novamente o caso da difração de Fraunhofer, porém supondo que a abertura, além de possuir uma forma arbitrária, também pode alterar a fase da onda incidente. Vamos supor que a abertura esteja colocada num plano xy, defronte a uma lente de distância focal f, como mostra a Fig. 8.23. Queremos analisar o padrão de difração que ocorre no plano focal, que denominaremos de XY. De acordo com o que vimos no Cap. 3, podemos usar o cálculo matricial para ver que na aproximação paraxial, todos os raios que saem da abertura com o mesmo ângulo, portanto paralelos entre si, serão focalizados no mesmo ponto P do plano XY, com coordenadas dadas por X ≈ f cosα e Y ≈ f cosβ, sendo α e β os ângulos que o raio faz com os eixos x e y, respectivamente. Tomando o plano meridional contendo o eixo óptico z e um raio particular partindo de Q, vemos que a diferença de caminho entre este raio e outro r paralelo saindo da origem O é dada por δr = R .n̂ , como mostrado na Fig. 8.24, onde R = xî + yĵ é o vetor posição do ponto Q da abertura e r n̂ = cos α î + cos β ĵ + cos γ k̂ é um versor na direção de propagação do raio. Assim temos: r X Y δr = R.n̂ = x cos α + y cos β = x + y f f (8.49) y Q x r R Y X P O abertura S. C. Zilio lente plano focal Óptica Moderna – Fundamentos e Aplicações Difração 185 Fig. 8.23 – Geometria para o cálculo do padrão de difração no plano focal. Q r R n̂ δr O Fig. 8.24 – Geometria para o cálculo do padrão de difração no plano focal. De acordo com a fórmula de Fresnel-Kirchhoff, simplificada para grandes distâncias, o campo difratado no plano XY é dado por: U (X, Y ) = C ∫∫ g ( x , y) e ikδr dA = C ∫∫ g ( x , y) e ik ( xX + yY ) / f dA (8.50) A A onde g(x,y) é a amplitude do campo na abertura. Esta função pode ser complexa se houver variações de fase para diferentes pontos da abertura. A eq. (8.50) pode ser simplificada pela introdução das “freqüências espaciais” μ = kX/f e ν = kY/f, resultando em: U(μ, ν ) = C ∫∫ g ( x , y) e i (μx + νy ) dA A (8.51) Vemos então que o padrão de difração no plano focal é a transformada de Fourier da função abertura g(x,y) e formalmente, a análise que se faz é a mesma que a empregada na seção 6.2c). Tomemos como exemplo uma fenda estreita de largura b paralela ao eixo x. O padrão de difração observado no plano focal será: U(ν ) = C ∫ b/2 −b / 2 e iνy dy = Cb sen (νb/2) νb/2 (8.52) que é a mesma função apresentada na Fig. 6.8. Vemos que ela possui picos laterais que podem ser minimizados pelo processo de apodização, que neste caso teria que ser feito pela inserção de alguns tipos de objeto, como um slide, no plano de abertura. Isto é diferente do que é feito na espectroscopia por transformada de Fourier, onde se realiza a S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 186 transformada de Fourier matematicamente, sendo a função de apodização multiplicada pelo interferograma. Um exemplo bastante interessante para se entender o conceito de freqüência espacial é o da rede de difração formada por fendas de largura b separadas por uma distância h. A função g(y) mostrada na Fig. 8.25(a) pode ser representada por uma série de Fourier do tipo: g(y) = g0 + g1 cos(ν0y) + g2 cos(2ν0y) + g3 cos(3ν0y) + .... (8.53) onde ν0 = 2π/h é a freqüência espacial fundamental. A transformada de Fourier desta função produz uma série de distribuições δ(ν - nν0) cuja amplitude é proporcional ao coeficiente gn, como mostra na Fig. 8.25(b). Na origem temos o termo constante go, os primeiros picos laterais em ± ν0 correspondem a g1 e assim por diante. Picos mais afastados da origem correspondem às componentes de Fourier de ordens mais altas. Isto permite a realização do processo de filtragem espacial da maneira que explicamos a seguir. (a) -2h g(y) -h 0 -2ν0 (c) h y 2h U(ν) (b) -3ν0 b -ν0 ν0 0 ν 2ν0 3ν0 g´(y´) y´ S. C. Zilio Óptica Moderna – Fundamentos e Aplicações (d) g´(y´) y´ Difração 187 Fig. 8.25 – (a) Função abertura de uma rede periódica, (b) sua transformada de Fourier, (c) filtragem espacial das freqüências altas e (d) filtragem espacial das freqüências baixas. Na Fig. 8.23, se o feixe continuar se propagando, haverá a formação de uma imagem da abertura no plano da imagem, que chamaremos de plano x’y’. Matematicamente, isto corresponde à realização da transformada de Fourier inversa da função U(μ,ν). Se todas as freqüências espaciais no intervalo -∞ ≤ μ ≤ +∞ e -∞ ≤ ν ≤ +∞ forem igualmente transmitidas pelo sistema óptico, a imagem será fiel ao objeto, a menos de um fator de magnificação e algumas aberrações. Entretanto, se no plano focal μν (plano de Fourier) algumas freqüências espaciais forem removidas através de algum tipo de abertura, de forma a modificar a função U(μ,ν), a imagem formada será alterada de acordo com: g´(x´, y´) = C ∫∫ T(μ, ν )U(μ, ν ) e −i ( μx´+ νy´)dμdν A (8.54) onde T(μ,ν) é chamada de função transferência, que será unitária no caso em que nenhum objeto é colocado no plano de Fourier. O processo de filtragem espacial consiste em se colocar obstáculos ou aberturas no plano de Fourier de forma a se modificar a função de transferência e alterar deliberadamente a imagem. Isto é equivalente a se alterar um sinal elétrico por meio de filtros passivos. Para se ter uma idéia do resultado da filtragem espacial, voltemos ao exemplo da rede de difração cuja função g(y) está mostrada na Fig. 8.25(a). Se no espectro de Fourier da Fig. 8.25(b) eliminarmos componentes de Fourier com n > 3, ficamos com a função g’(y’) mostrada na Fig. 8.25(c), que corresponde a uma onda quadrada suavizada. Se por outro lado eliminarmos as freqüências mais baixas, com n < 3, a nova imagem formada terá as bordas realçadas, como mostra a Fig. 8.25(d). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 188 8.9 Microscopia por contraste de fase Esta técnica, introduzida pelo físico holandês Zernicke, é utilizada para a observação de objetos microscópicos transparentes cujo índice de refração difere levemente daquele do meio transparente circundante. O tratamento deste problema é similar aquele feito na filtragem espacial, exceto que o objeto e o filtro espacial colocado no plano de Fourier modificam apenas a fase e não a intensidade do campo elétrico. Para se obter alguma intuição no tratamento do contraste de fase, vamos considerar uma grade de fase constituída de faixas transparentes alternadas de materiais com índices de refração alto e baixo. Neste caso, a função representando o objeto é g(y) = exp{iφ(y)}, onde o fator de fase φ(y) está mostrado na Fig. 8.26(a). A altura dos degraus é Δφ = kzΔn, sendo z a espessura de cada faixa e Δn a diferença de índices de refração dos dois materiais. Como Δφ é usualmente muito pequeno, podemos escrever g(y) ≈ 1 + iφ(y) e assim o padrão de difração no plano focal é dado por: U(ν ) = ∫ [1 + iφ( y)] e iνy dy = ∫ +∞ +∞ −∞ −∞ = U1 (ν) + iU 2 (ν) e iνy dy + i ∫ φ( y) e iνy dy +∞ −∞ (8.55) U1(ν) contém apenas contribuição de freqüências baixas (U1(ν) = δ(ν)) enquanto que U2(ν) é a transformada de Fourier de uma rede periódica e portanto possui componentes de freqüência maiores, como mostra a Fig. 8.26(b). Se o campo da eq. (8.55) se propagar até o plano da imagem, passando por uma ocular para produzir o aumento desejado, recobraremos g(y), que não é possível de ser visualizado porque o objeto é transparente. φ(y) (a) Δφ -2h -h S. C. Zilio 0 h U2(ν) Óptica Moderna – Fundamentos e Aplicações (b) B B U1(ν) B -3ν0 B B y 2h -2ν0 B B -ν0 B B 0 ν B ν0 B B 2ν0 B B 3ν0 B B Difração 189 Fig. 8.26 – (a) Função de fase de uma grade periódica e (b) transformada de Fourier. Devido ao fator i na eq. (8.55), as componentes U1(ν) e U2(ν) estão 90° fora de fase, o que leva a um g(y) onde apenas a fase é modulada. Para fazer com que a amplitude da imagem seja modulada, é necessário remover a diferença de fase entre as duas componentes. Isto pode ser feito colocando-se no plano de Fourier uma placa de fase que se constitui numa lâmina de vidro com uma pequena seção central com espessura λ/4 maior que o restante. Assim, a componente central U1(ν) ganha uma fase extra de π/2 de maneira a ficar em fase com U2(ν). Como resultado, a imagem será dada por: g´(y´) = ∫ U (ν ) e +∞ −∞ 1 −iνy´ dy´+ ∫ U 2 (ν )e −iνy´ dy´= g 1 ( y´) + g 2 ( y´) +∞ −∞ (8.56) O primeiro termo corresponde a um fundo de iluminação constante enquanto que o segundo corresponde a uma rede regular com faixas alternadas transparentes e opacas. Isto faz com que a rede de fase se transforme numa rede de amplitude visível. Embora esta análise tenha sido realizada para o caso de uma rede periódica, ela também é válida para qualquer objeto transparente de forma arbitrária. 8.10 Holografia A técnica de holografia, proposta por Gabor em 1947, permite a visão tridimensional da fotografia de um objeto devido à reconstrução da frente de onda baseada no processo de difração. É um método que, embora introduzido em 1947, tornou-se prático apenas após a invenção do laser, que é uma fonte de luz coerente. Durante o processo de gravação, S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 190 mostrado na Fig. 8.27(a), um feixe de luz monocromática colimado é dividido em dois, sendo que um deles ilumina o objeto, enquanto que o outro é utilizado como referência para a fase a ser gravada. A luz espalhada pelo objeto interfere com a de referência sobre uma chapa fotográfica localizada no plano xy. Como estamos considerando luz colimada (onda plana), onde o feixe de referência sobre a chapa será dado por: U 0 ( x, y) = a 0 e i (μx +νy ) (8.57) onde ao é a amplitude da onda plana, e μ = k senα e ν = k senβ são as freqüências espaciais. Os ângulos α e β especificam a direção do feixe de referência ao atingir o plano xy. Da mesma forma, o feixe espalhado pelo objeto e atingindo o filme é: U( x, y) = a ( x, y) e iφ( x , y ) (8.58) onde a(x,y) é um número real. O padrão de interferência gravado na chapa fotográfica pode ser escrito como: I(x, y) α U + U 0 = a 2 + a 02 + aa 0ei[ φ (x,y)−μx−νy] + 2 aa 0e −i[ φ (x,y)−μx−νy] = a 2 + a 02 + 2aa 0cos[φ(x, y) − μx − νy] feixe de laser (8.59) espelho objeto observador holograma Óptica Moderna – Fundamentos e Aplicações S. C. Zilio feixe de laser imagem virtual feixe direto imagem real Difração 191 Fig. 8.27 – (a) Geometria usada para a produção de um holograma e (b) uso do holograma para a visualização das imagens real e virtual. Para a visualização do holograma, devemos iluminá-lo com um feixe colimado de luz laser, similar ao empregado no processo de gravação. A luz transmitida será proporcional ao campo incidente vezes a transmitância que foi gravada no ponto (x,y), que é proporcional a I(x,y), de acordo com: U T ( x , y) = U 0 I = a 0 (a 2 + a 02 ) e i[ μx +νy ] + a 02 a e iφ + + a 02 a e −i[ φ− 2μx −2νy ] = (a 2 + a 02 ) U 0 + a 02 U + U −1 U 0− 2 a 2 (8.60) O holograma funciona como uma rede de difração, produzindo um feixe direto e outros dois difratados em primeira ordem, em cada lado do holograma, conforme mostra a Fig. 8.26(b). O primeiro termo corresponde ao feixe direto. O segundo termo é um dos feixes difratados, e como é uma constante vezes U, representa luz refletida do objeto, formando, portanto, uma imagem virtual. O último termo corresponde a uma imagem real. Bibliografia S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 192 8.1. G.R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, Inc., NY (1968). Problemas 8.1. Resolva o problema da difração de Fraunhofer para as seguintes configurações: a) fenda retangular de lados a e b; b) abertura circular de raio r e c) abertura em cruz com L >> b, conforme a Fig. 8.27. b L/2 Fig. 8.27 - Abertura em forma de cruz. 8.2. Calcular a intensidade no ponto P como função de y, h2 e λ (h1 = ∞) para a Fig. 8.28. (Theorie de Champ, Laudau e Lifschitz - pg. 203) y x z P(0,0,h2) Fig. 8.28 – Borda iluminada por luz colimada. 8.3. Usando a transformada de Fourier, calcule U(P) para o retângulo de lados a e b, isto é: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Difração 193 ⎧0 x ∉[ − a2 , a2 ] f ( x) = ⎨ a a ⎩ 1 x ∈[ - 2 , 2 ] ⎧0 y ∉[ − b2 , b2 ] b b ⎩ 1 y ∈[ - 2 , 2 ] e h( y ) = ⎨ 8.4. Repetir o cálculo acima para a abertura circular. 8.5. a) Considere o padrão de difração na aproximação de Fraunhofer devido as duas fendas desiguais, onde a e b são duas larguras e c a distância entre seus centros. Derive uma expressão para a intensidade da difração como função do ângulo θ, considerando que a luz incidente tem comprimento de onda λ. b) Use a fórmula de a) para obter expressões nos casos especiais (i) a = b e (ii) a = 0. Faça esboços destes padrões. 8.6. Uma rede de difração é usada para resolver as linhas D do sódio (5890 Å e 5896 Å), na linha de ordem l. Quantas fendas são necessárias para tal? 8.7. Considere uma abertura circular de raio R. Na difração de Fresnel, o campo elétrico sobre o eixo é dado por: ⎧⎪ kρ 2 ⎫⎪ 1 ⎡1 1 ⎤ U(P ) = C ∫∫ exp⎨ i ⎬ dA , onde = ⎢ + ⎥ , e h1 e h2 são S1 L ⎣ h1 h 2 ⎦ ⎪⎩ 2L ⎪⎭ as posições da fonte e do observador, respectivamente. Encontre uma expressão para o campo elétrico difratado e os valores de L para os quais ele é nulo. 8.8. Uma fonte pontual monocromática, com λ = 0.5 μm, encontra-se a uma distância h = 40 cm de uma abertura circular de raio R = 1 mm. A que distância h’ se deve posicionar um observador para ver 10 zonas de Fresnel contidas na abertura? 8.9. Uma fenda estreita, de largura b, é colocada a uma dada distância de uma lente de foco f. Tratando o problema como unidimensional, encontre a distribuição de freqüência espacial, U(ν), no foco da lente quando luz monocromática ilumina a fenda. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 194 S. C. Zilio Difração Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico Interação luz-matéria: tratamento clássico 195 9 9.1 Modelo do oscilador harmônico Neste ponto queremos aprofundar nosso conhecimento sobre o índice de refração e para isto vamos lançar mão de um modelo bastante tradicional em óptica, que utiliza um oscilador harmônico para representar o átomo. Este é um modelo puramente clássico uma vez que tanto a posição do elétron assim como o campo eletromagnético são tratados como variáveis clássicas. Já no modelo semi-clássico, o átomo é considerado como um sistema quântico, apresentando níveis discretos de energia, mas o campo elétrico continua sendo tratado como uma variável clássica. No modelo completamente quântico, quantiza-se o campo elétrico, que assim como o átomo, é tratado como variável quântica. Consideremos um meio dielétrico isotrópico, onde é sabido que os elétrons estão permanentemente ligados aos núcleos. Supomos que cada elétron, de carga -e desloca-se uma distância x da posição de equilíbrio. Neste caso, haverá um dipolo elétrico induzido no átomo, que é dado por p = -ex. Se houver N átomos por unidade de volume e todos tiverem o mesmo deslocamento na direção x, a polarização do meio será a soma da contribuição de todos os dipolos, de acordo com: P = -Nex (9.1) Para encontrarmos o deslocamento x, vamos considerar o modelo em que o elétron de massa m está ligado harmonicamente ao núcleo de massa M através de uma mola de constante elástica K, como mostra a Fig. 9.1. Neste desenho, o átomo já possui um momento de dipolo estático permanente, mas isto não influi na análise que realizaremos para o cálculo S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 196 do dipolo induzido pela onda eletromagnética. Para eliminarmos o dipolo permanente bastaria tomarmos o elétron distribuído sobre uma casca esférica concêntrica com o núcleo (shell model). Quando este oscilador é submetido a um campo eletromagnético, o campo elétrico age apenas sobre o elétron, resultando num movimento oscilatório forçado. Como M >> m, o deslocamento do núcleo devido a este campo que oscila rapidamente é pequeno e será desprezado. De outra forma, a massa reduzida poderia ser usada, levando basicamente ao mesmo resultado. x E k m K B M Fig. 9.1 - Oscilador harmônico amortecido sujeito a um campo elétrico linearmente polarizado na direção x . Vamos supor ainda que este oscilador harmônico seja viscosamente amortecido e vamos chamar a constante de amortecimento de mb. Iremos na seção 9.4 calcular este fator de amortecimento, fazendo sua ligação com a aceleração da carga, que emite radiação como se fosse uma antena (dipolo oscilante). Como estamos interessados na interação da luz com a matéria, vamos supor que o átomo está na presença de uma onda eletromagnética na qual o campo elétrico propaga-se na direção z e é linearmente polarizado na direção x, como mostra a Fig. 9.1. Isto dará origem a um deslocamento em torno da posição de equilíbrio, que é descrito pela segunda lei de Newton como: m dx d2x + mb + Kx = −eE 2 dt dt (9.2) onde E é amplitude do campo elétrico sentido pelo elétron. A solução desta equação diferencial é bem conhecida dos textos básicos de mecânica clássica. No estado estacionário, supomos que x(t) tem um comportamento harmônico, com frequência ω igual à do termo forçante (campo elétrico). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 197 Para facilitar as contas, vamos tomar o campo elétrico e o deslocamento na forma exponencial como: (9.3a) E(t) = E 0 exp (− iωt ) x(t) = x 0 exp (− iωt ) (9.3b) x0 é amplitude do deslocamento do elétron no regime estacionário, que pode ser um número complexo para levar em conta qualquer atraso da resposta face à excitação aplicada pelo campo elétrico. Pela substituição das equações (9.3) na eq. (9.2) obtemos o valor de x0 através da igualdade: (9.4) (-mω2 - iωmb + K) x0 = -eE0 onde as exponenciais em ωt foram canceladas. Desta expressão obtemos o deslocamento x(t), o que nos permite escrever a polarização como: P= Ne 2 (9.5) E0 -mω 2 − iωmb + K Dos livros textos de eletromagnetismo (ver referência 9.1) temos que o campo elétrico sentido pelo átomo (E0) está relacionado ao campo elétrico dentro do meio através de: E0 = E + P 3ε 0 (9.6) que quando substituído na eq. (9.5) nos leva à expressão final para a polarização elétrica induzida no meio: P= Ne 2 / m E ω02 − ω 2 − iωb (9.7) onde ω0 = K/m − Ne 2 /3mε 0 é a frequência de ressonância do átomo. Este é o resultado central que origina do modelo do oscilador harmônico. Vamos em seguida utilizá-lo para obter informações sobre o índice de refração do meio. 9.2 Dispersão cromática do índice de refração Vimos na seção 3.2 que a polarização está ligada à susceptibilidade elétrica do meio por: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 198 P = ε0 ~ χ E = ( ~ε - ε0)E (9.8) Por comparação com a eq. (9.7) temos: ~= χ Ne 2 /mε 0 ω 02 − ω 2 − iωb ( 9.9) de onde vemos que ~ χ é um número complexo. Para realçar este fato estaremos usando um ~ sobre uma variável sempre que ela for complexa. n 2 = 1+ ~ Por outro lado, da eq. (9.8) temos que ~ ε /ε0 = ke = ~ χ . Com isto conseguimos estabelecer a dependência do índice de refração com a susceptibilidade do meio, que por sua vez especifica como este responde ao campo elétrico da onda. Notamos que o índice de refração também passa a ter uma natureza de número complexo. Supondo que ~ χ é muito menor que 1, podemos expandir o índice de refração em série de Taylor e assim obtemos: ~ n= (1 + χ~ ) ≈ 1 + 1 χ~ + ..... = n + i κ 2 (9.10) sendo n e κ as partes real e imaginária do índice de refração complexo, respectivamente. Como veremos na próxima seção, o primeiro está ligado à velocidade de fase da onda eletromagnética e o segundo à sua atenuação quando da propagação pelo meio. Vamos inicialmente concentrar nossa atenção na parte real de ~ n, dada por: (ω02 − ω2 ) ⎛ Ne 2 ⎞ n =1+ ⎜ ⎟ 2 2 2 ⎝ 2mε 0 ⎠ (ω0 − ω2 ) + (ωb ) (9.11) O primeiro fato que nos chama a atenção é a dependência de n com a frequência da luz. Esta dependência, que leva o nome de dispersão cromática, está mostrada na Fig. 9.2. Em geral, as transições atômicas mais intensas dos materiais transparentes ocorrem na região do ultravioleta e assim, nas regiões do visível (0.4 a 0.7 μm) e infravermelho próximo (0.7 a 2.5 μm) o índice de refração aumenta com a frequência (diminui com λ). Isto significa que quanto mais deslocado para o infravermelho for o comprimento de onda da luz, menor será n e S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 199 consequentemente, maior será sua velocidade de propagação uma vez que v = c/n. Logo, se tivermos um pulso curto de luz com uma distribuição espectral contendo várias freqüências, as freqüências menores caminharão mais rapidamente que as freqüências maiores e o pulso alarga ao se propagar. Este fato é danoso na área das comunicações ópticas, pois o alargamento dos pulsos impõe um limite à taxa de repetição máxima possível de se transmitir por uma fibra óptica. Nos meios compostos por moléculas, ω0 corresponde à frequência de vibração molecular que em geral se encontra no infravermelho médio (2.5 a 25 μm). Mesmo assim, o tratamento apresentado acima continua válido pois estaremos na região de dispersão normal localizada à direita de ω0, onde o índice de refração também aumenta com a frequência. A única região com comportamento diferente é a região de dispersão anômala, na qual o índice de refração diminui com a frequência. Porém, do ponto de vista das comunicações ópticas, esta região não tem interesse já que nela existe grande absorção de luz, como veremos a seguir. n(ω) dispersão normal dispersão anômala 1 infravermelho dispersão normal visível ω0 ω Fig. 9.2 - Dependência do índice de refração com a frequência da luz. Do ponto de vista prático, costuma-se utilizar uma relação empírica entre o índice de refração n e o comprimento de onda para um dado meio transparente, conhecida como equação de Sellmeier. A forma usual desta equação para os vidros é: n 2 (λ ) = 1 + S. C. Zilio B3 λ2 B1λ2 B 2 λ2 Bi λ2 + + = + + .... 1 ∑i λ2 − C λ2 − C1 λ2 − C 2 λ2 − C 3 i (9.12) Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 200 onde Bi e Ci são os coeficientes de Sellmeier, determinados experimentalmente, e λ é o comprimento de onda da luz no vácuo, medido em micrômetros. Cada termo da soma representa uma absorção óptica com força de oscilador Bi, no comprimento de onda Ci . Esta equação foi deduzida em 1871 por W. Sellmeier como uma extensão da fórmula de Cauchy, resultante do trabalho de Augustin Cauchy para modelar a dispersão. Como exemplo, os coeficientes para um vidro crown comum de borosilicato, conhecido como BK7, são mostrados na Tabela 9.1. Eles correspondem a duas ressonâncias, uma no ultravioleta e outra no infravermelho. Perto de cada pico de absorção, a equação dá valores não físicos para n e nestas regiões um modelo mais preciso para a dispersão, conhecido como modelo de Helmholtz, deve ser usado. Os coeficientes de Sellmeier para muitos vidros óticos podem ser encontrados no catálogo de vidros da Schott. B Tabela 9.1 - Coeficientes de Sellmeier para o BK7. Coeficiente Valor B1 1.03961212 B2 2.31792344x10-1 B3 1.01046945 C1 6.00069867x10-3 μm2 C2 2.00179144x10-2 μm2 C3 1.03560653x102 μm2 B B B Longe dos picos de absorção, o valor de n tende a n ≈ 1 + ∑ Bi ≈ k e , onde ke é a constante dielétrica do meio. A equação de Sellmeier também pode ser escrita como: n 2 (λ ) = A + S. C. Zilio B1λ2 B 2 λ2 + λ2 − C1 λ2 − C 2 (9.13) Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 201 onde o coeficiente A representa a contribuição da absorção que ocorre no ultravioleta para o índice de refração no infravermelho. 9.3 Absorção Vimos na seção 4.1 que a velocidade de fase da onda é dada por v ~ n ω/c = (n + iκ)ω/c, onde = λf = ω/k, ou alternativamente, k = ω/v = ~ agora explicitamos a natureza complexa do vetor de propagação. Uma onda plana descrita por um vetor de propagação complexo pode ser escrita como: ~ (9.14) E = E 0 exp i [kz − ω t] = E 0 exp − 1 αz exp{ i [kz − ω t ] } { } { } onde k = n ω/c é a parte real do vetor de propagação, ligada à propagação da onda com velocidade c/n. Por outro lado, vemos que a intensidade da onda (I α E*E) é atenuada exponencialmente, com um decaimento dado n pelo coeficiente de absorção α, ligado com a parte imaginária de ~ através de α = 2κω/c. De acordo com as equações (9.9) e (9.10) podemos escrever: 2 ω2 b ⎛ Ne 2 ⎞ α(ω) = ⎜ ⎟ 2 2 2 ⎝ mcε 0 ⎠ (ω0 − ω2 ) + (ωb ) (9.15) que é chamada forma de linha Lorentziana. Esta curva, mostrada na Fig. 9.3, é mais pronunciada quanto menor for o fator de amortecimento b. Para um material com várias transições, a determinação das posições das freqüências de ressonância é chamada de espectroscopia. α(ω) b ω ω0 Fig. 9.3 – Dependência do coeficiente de absorção com a frequência da luz. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 202 9.4 Espalhamento O modelo do oscilador harmônico amortecido é bastante útil para descrever o espalhamento da radiação por átomos ou moléculas. Neste modelo é fundamental que o centro espalhador seja bem menor que o comprimento de onda da luz, tal que o campo elétrico possa ser considerado uniforme para efeito de simplificação dos cálculos. A seção de choque para o centro espalhador é definida como σ(ω) = α(ω)/N, onde α(ω) é o coeficiente de absorção dado pela eq. (9.15). Com isso obtemos: ⎛ 2 ⎞ ω2 b (9.16) σ(ω) = ⎜ e ⎟ 2 ⎝ mcε 0 ⎠ (ω 2 − ω 2 ) + (ωb )2 0 Temos três limites a considerar, dependendo de como ω se compara a ω0: ⎛ 2 σ(ω) ≅ ⎜ e ⎝ mcε 0 ω << ω0 ⎞ bω 2 ⎟ 4 ⎠ ω0 ⎛ 2 σ(ω) ≅ ⎜ e ⎝ mcε 0 ω ≈ ω0 ⎛ 2 σ(ω) ≅ ⎜ e ⎝ mcε 0 ω >> ω0 ⎞1 ⎟ ⎠b ⎞⎛ b ⎞ ⎟⎜ 2 ⎟ ⎠⎝ ω ⎠ (9.17) (9.18) (9.19) Para continuarmos a análise precisamos agora determinar o valor de b. Consideramos na eq. (9.2) a existência de uma força de atrito viscoso do tipo Fat = -mbv, que é responsável por uma dissipação de energia a uma taxa P = Fat v = -mbv2, onde P é a potência dissipada. Por outro lado, é sabido dos textos mais avançados de eletromagnetismo que a potência emitida por uma carga acelerada é dada por: P= 1 2e 2 a 2 = 1 e 2 ω 2 v 2 4πε 0 3c 3 2πε 0 3c 3 (9.20) onde na última passagem tomamos a solução dada na eq. (9.3b) por x(t) = x0 exp(-iωt), que nos leva à v(t) = dx/dt = -iω x(t) e a(t) = dv/dt = -iω v(t) = -ω2 x(t). Comparando a eq. (9.20) com a potência dissipada pelo atrito viscoso chegamos à seguinte expressão para b: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico b= 203 e 2 ω2 1 2πε0 3mc3 (9.21) Substituindo este valor nos casos limites mencionados acima obtemos: Caso 1 - ω << ω0 - Espalhamento Rayleigh 2 ⎞ ⎛ ⎞ ⎛ σ(ω) = 1 2 ⎛⎜ e 2 ⎞⎟ ⎜ ω ⎟ = 5 x10 − 25 ⎜ ω ⎟ ω ω 6πε 0 ⎝ mc ⎠ ⎝ 0 ⎠ ⎝ 0⎠ 2 4 4 (9.22) onde o fator numérico possui unidades de cm-2. Este caso é importante para a propagação de luz em fibras ópticas, onde as absorções atômicas mais intensas ocorrem no ultravioleta. Assim, existe uma perda muito maior para a luz visível do que para a infravermelha. Esta expressão também explica também a cor azul do céu e o avermelhado do pôr do sol. A luz que vem do Sol é chamada de luz branca porque corresponde à combinação de um número muito grande de cores. Quando esta luz atravessa a parte superior da atmosfera ocorre um espalhamento pela ação de moléculas ali existentes. As cores mais próximas do azul, anil e violeta sofrem um efeito de espalhamento maior do que as cores laranja e vermelha. Considere os raios de luz branca que saem do Sol, mas que não vem diretamente na nossa direção. No entanto, as componentes de cores azuladas sofrerão um desvio pelas moléculas da atmosfera e acabarão chegando até nós. Desta forma, a cor azul que vemos corresponde à luz que saiu do Sol, não está vindo inicialmente na nossa direção, mas foi desviada pela parte superior da atmosfera, chegando assim aos nossos olhos. A cor avermelhada do por do Sol pode ser explicada com base neste mesmo efeito. Quando o Sol se põe, os raios de luz branca estão vindo na nossa direção. Porém, as componentes de cores azuladas são espalhadas para o lado e acabam não chegando até nós, sobrando assim apenas as cores mais avermelhadas. Caso 2 - ω ≈ ω0 - Espalhamento ressonante σ(ω) = 3 λ20 2π S. C. Zilio (9.23) Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 204 Vemos então que na ressonância a seção de choque é proporcional ao quadrado do comprimento de onda da radiação incidente, Caso 3 - ω >> ω0 - Espalhamento Thompson σ(ω) = 1 ⎛ e 2 ⎞ = 5 x10 − 25 ⎜ ⎟ 6πε 02 ⎝ mc 2 ⎠ 2 (9.24) Neste caso, a seção de choque é praticamente constante e este regime é chamado de espalhamento Thompson, caracterizado por espalhar igualmente todas as freqüências. 9.5 Forças radiativas sobre átomos neutros O desenvolvimento de técnicas para aprisionar e resfriar íons revolucionou a área da física atômica há duas décadas. A possibilidade de se isolar um único íon e reduzir seu movimento térmico a uma temperatura de poucos mK permite a supressão dos deslocamentos Doppler de primeira e segunda ordens, possibilitando medidas espectroscópicas e padrões de tempo de precisão sem precedentes. O advento de vários experimentos bem sucedidos demonstrando o resfriamento de íons aprisionados sugeriu a possibilidade de se fazer o mesmo com átomos neutros. A neutralidade elétrica da espécie aprisionada abre uma nova porta no estudo de efeitos onde altas densidades, não conseguidas com íons, são úteis ou necessárias, tal como em colisões atômicas frias e efeitos quânticos coletivos. Além do mais, o aprisionamento e resfriamento de átomos neutros fazem as medidas espectroscópicas mais simples devido à supressão do efeito Doppler e o aumento do tempo de trânsito do átomo num feixe de laser de prova. Melhorias substanciais na precisão de relógios atômicos e medidas de constantes fundamentais podem ser realizadas. A possibilidade de se estudar colisões com átomos lentos dá ao investigador um melhor entendimento das forças atômicas e ligações químicas entre os átomos. Em altas densidades, os pacotes de onda representando os átomos começam a se superpor de tal forma que os efeitos quânticos se manifestam. Para um sistema de bósons, a transição de fase conhecida S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 205 como condensação de Bose-Einstein pode ser observada, demonstrando uma previsão muito importante da estatística quântica. Armadilhas óticas eficientes para o aprisionamento de átomos neutros são agora construídas rotineiramente e resultados bastante interessantes são obtidos com esta técnica. Para entender como os átomos neutros podem ser freados e aprisionados com um feixe de laser, é importante saber a força a exercida sobre o átomo pelo campo de radiação laser. Embora existam um tratamento completamente quântico, assim como um tratamento semi-clássico para descrever a interação entre o átomo e a onda eletromagnética, uma abordagem clássica é importante como uma alternativa mais simples de introduzir este assunto ao nível de graduação. Para isto, utilizaremos novamente o modelo do oscilador harmônico amortecido introduzido na seção 9.1. Este modelo, entretanto, prevê que a força elétrica média exercida sobre elétron é nula uma vez que o campo elétrico varia harmonicamente no tempo. Assim, para explicar a existência da força, teremos que lançar mão do campo magnético. Uma vez que o elétron adquire uma velocidade finita devido à força elétrica, o campo magnético exerce uma força ao longo da direção do vetor de propagação do campo eletromagnético. Esta força é chamada de força espontânea. Existe também uma força induzida, também conhecida como força de dipolo ou de gradiente, cuja origem é que se segue: uma vez que o campo elétrico desloca o elétron da sua posição de equilíbrio, o átomo adquire um momento de dipolo induzido que pode interagir com o gradiente do campo elétrico e levar a uma força na direção do gradiente. A força induzida é usada para aprisionar e resfriar transversalmente átomos neutros enquanto que a força espontânea é usada principalmente para resfriamento. Vamos agora calcular estas forças e discutir suas propriedades. A. Força espontânea Considerando a geometria da Fig. 9.1, vemos que a força magnética agindo sobre elétron é: r (9.25) Fs = −(e / c) x& Bẑ onde, de acordo com as equações de Maxwell B = E/c. A solução para o caso estacionário da eq. (9.2) pode ser utilizado para encontrar x& da eq. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 206 (9.25). Fazendo uma média temporal sobre um período de oscilação, encontramos que a força magnética agindo sobre o elétron é dada por: r ⎛ e2E2 ⎞ ω2 b ⎟⎟ ẑ Fs = ⎜⎜ 2 2 ⎝ 2mc ⎠ ω02 − ω2 + (ωb ) ( ) (9.26) com b dado pela eq. (9.21). Para obter esta expressão, consideramos que o núcleo é muito pesado para seguir a oscilação rápida do campo elétrico. Por outro lado, como a eq. (9.26) tem um valor médio finito e o elétron está fortemente ligado ao núcleo, o átomo adquire uma velocidade v(t) ao longo da direção de propagação da onda eletromagnética. Esta velocidade induz um efeito Doppler e a freqüência de transição no referencial do laboratório se transforma de acordo com: ω0 → ω0’ = ω0 (1+v/c) e a equação que descreve a força espontânea agindo sobre átomo é: r ⎛ e2E 2 ⎞ ω2 b ⎟⎟ Fs = ⎜⎜ ⎝ 2mc ⎠ ω − ω'0 ω + ω'0 [( )( )] + (ωb) 2 2 ẑ (9.27) Estamos interessados no caso em que a freqüência da luz está próxima da freqüência de ressonância (ω ≈ ω0); portanto, supondo v/c << 1, podemos escrever ω + ω0’ ≈ 2ω e eq. (9.27) se torna: r r ⎛ e2E2 ⎞ b ⎟⎟ ẑ Fs = M at v& = ⎜⎜ 2 2 ⎝ 2mc ⎠ 4[Δ − ω0 (v / c )] + b (9.28) onde Mat = M + m é a massa do átomo e Δ = ω – ω0 é a dessintonia entre as freqüências do laser e de ressonância. Esta é a força espontânea, que nesta descrição clássica vêm do campo magnético agindo sobre elétron cuja componente x de velocidade é produzida pelo campo elétrico. B. Força de dipolo Quando o campo elétrico desloca o elétron da sua posição de equilíbrio, existe um dipolo elétrico induzido que pode interagir com o campo elétrico. A energia de interação é dada por: r r (9.29) U = −p ⋅ E = exE onde x é a já conhecida solução da eq. (9.2). Portanto, a força induzida é: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento clássico 207 r r ⎛ e 2 ⎞ cos (ωt + φ) cos ωt r 2 Fi = −∇U = ⎜⎜ ⎟⎟ ∇E ⎝ m ⎠ ω02 − ω 2 2 + (ωb )2 (9.30) r r 2 ⎛ e2 ⎞ ω02 − ω2 ⎟⎟ Fi = ⎜⎜ ∇ E 2 2 ⎝ 2m ⎠ ω02 − ω2 + (ωb ) (9.31) ( ) com φ = tg−1[ωb/(ω02−ω2)] sendo o atraso de fase entre x e E. Realizando uma média temporal sobre um período de oscilação da mesma maneira que foi feito para a força espontânea, encontramos a força induzida como: ( ) Usando a transformação de referencial dado por: ω0 → ω0’ = ω0 (1+v/c) e a aproximação de ressonância próxima (v/c << 1), encontramos: r r 2 ⎛ e2 ⎞ Δ − ω0 (v / c ) ⎟⎟ E Fi = ⎜⎜ ∇ 2 2 ⎝ 4mω ⎠ [Δ − ω0 (v / c )] + b (9.32) A força induzida é muito importante para o aprisionamento de átomos neutros. Para um feixe Gaussiano focalizado, sintonizado abaixo da freqüência de ressonância (Δ < 0), a força estará dirigida na direção do valor máximo da intensidade do laser (I α E2). Portanto, um átomo próximo ao foco sofrerá uma força restauradora dirigida para ele uma vez que a intensidade diminui a partir do foco em todas as direções. Bibliografia 9.1. J. R. Reitz, F. J. Milford and R. W. Christy, Fundamentos da Teoria Eletromagnética, Editora Campus, RJ (1982) 9.2. G. R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, NY (1968). 9.3. S. C. Zilio and V. S. Bagnato, Radiative forces on neutral atoms – a classical treatment, Am. J. Phys. 57 (5) 471 (1989). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 208 Interação luz-matéria: tratamento clássico Problemas 9.1. Calcule o tempo de vida clássico, tclass = energia/(potência irradiada), de um elétron oscilando de acordo com: x = x0 cosωt. 9.2. Faça um esboço da seção de choque de espalhamento de um átomo em função de ω quando ω0 = 6.28 x1015 rad/s. 9.3. Considere um átomo de sódio (Mat = 3.84x10-26 kg e λ0 = 589 nm) em ressonância com um laser cuja irradiância é 200 mW/cm2. Qual será a aceleração sentida pelo átomo? 9.4. Explique o que é força de oscilador. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 209 Interação luz-matéria: tratamento semi-clássico Interação luz-matéria: tratamento semi-clássico 10 10.1 Introdução O laser é uma fonte especial de luz, coerente e colimada, que permite um grande número de aplicações práticas. Dentre estas, destacamse aquelas que envolvem a interação da radiação com a matéria, como por exemplo, a caracterização, processamento e ablação de materiais, além de outras aplicações importantes nas áreas de comunicações e medicina. Quase toda a luz que vemos no dia-a-dia, seja ela de lâmpadas incandescentes e fluorescentes, ou até mesmo dos nossos aparelhos de televisão, é gerada espontaneamente quando átomos ou moléculas se livram de excesso de energia neles depositados emitindo luz. Este tipo de luz ordinária é liberado por mudanças de energia dos níveis atômicos ou moleculares, que ocorrem sem qualquer intervenção externa. Entretanto, existe um segundo tipo de luz que ocorre quando um átomo ou molécula retém o excesso de energia até ser estimulado a emiti-lo na forma de luz. Os lasers são capazes de produzir e amplificar esta forma de luz estimulada, de forma a produzir feixes intensos e focalizados. A palavra laser foi cunhada como um anagrama de Light Amplification by Stimulated Emission of Radiation (amplificação da luz pela emissão estimulada de energia). A natureza especial deste tipo de radiação eletromagnética tornou a tecnologia laser uma ferramenta vital em quase todos os aspectos da vida diária, incluindo comunicações, diversão, fabricação, e medicina. Albert Einstein foi quem deu o passo inicial no desenvolvimento do laser ao estabelecer a existência destes dois tipos de emissão num artigo publicado em 1917. Por muitos anos, os físicos pensaram que a S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 210 Interação luz-matéria: tratamento semi-clássico emissão espontânea de luz fosse o processo mais provável e dominante, e que qualquer emissão estimulada seria sempre muito mais fraca. Só depois do final da segunda guerra mundial é que se começou a busca por condições que possibilitassem a predominância da emissão estimulada e fizesse a emissão de um átomo ou molécula estimular muitos outros para produzir o efeito de amplificação da luz. Um cientista da Universidade de Columbia, Charles H. Townes, foi o primeiro a ter sucesso na amplificação de radiação estimulada no começo dos anos 50. Seu trabalho foi centrado na região de microondas, que possui um comprimento de onda muito mais longo do que o da luz visível, e o dispositivo inventado por ele foi denominado de maser, onde o m do início do anagrama indica microwave ao invés de light. Outros cientistas também foram bem-sucedidos na construção de masers, e a partir daí, um esforço bastante significativo foi desenvolvido na tentativa de se produzir emissão estimulada em comprimentos de onda mais curtos. Muitos dos conceitos principais para se produzir a radiação laser foram desenvolvidos no final dos anos 50, por Townes e Arthur Schawlow, dos laboratórios Bell, por Gordon Gould da Universidade de Columbia e por dois cientistas soviéticos, Nikolai Basov e Aleksander Prokhorov. Gould solicitou uma patente ao invés de publicar suas idéias, e embora tivesse obtido o crédito de cunhar a palavra laser nos seus cadernos de laboratório, quase 30 anos se passaram antes que ele tivesse a patente concedida. Existe ainda alguma discórdia sobre quem merece o crédito pelo conceito do laser. Basov e Prokhorov dividiram o prêmio Nobel de Física de 1964 com Townes pelo trabalho pioneiro sobre os princípios envolvendo os masers e lasers. Schawlow também recebeu uma parte do prêmio Nobel de Física de 1971 por suas pesquisas com lasers. A publicação do trabalho de Townes e Schawlow estimulou um grande esforço para se construir um sistema laser. Em maio de 1960, Theodore Maiman, trabalhando no Hughes Research Laboratories, construiu um dispositivo usando um bastão de rubi sintético com o qual demonstrou pela primeira vez a ação laser. O laser de rubi de Maiman emitia pulsos intensos de luz vermelha coerente em 694 nm, num feixe estreito e altamente concentrado, bastante típico das características mostradas pela maioria dos lasers atuais. O bastão de rubi possuía as extremidades com superfícies espelhadas para refletir a luz e era envolvido por uma lâmpada flash helicoidal, sendo suficientemente S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 211 pequeno para que coubesse na mão. Curiosamente, o fotógrafo designado pelo laboratório Hughes para divulgar a descoberta achou que o laser real era muito pequeno e fez Maiman posar com um laser maior, mas que não funcionava. As fotografias mostrando Maiman com este laser circulam ainda hoje e são usadas em muitas publicações. Embora os lasers que emitem luz visível sejam os mais comuns, seus princípios básicos de funcionamento se aplicam na maior parte do espectro eletromagnético. A primeira emissão estimulada foi conseguida na região de microondas, mas agora os lasers operam desde o infravermelho até o ultravioleta e pesquisas estão sendo realizadas para se produzir um laser operando na região dos raios X. Os lasers atualmente em uso possuem potências de que vão de menos de 1 mW até muitos kW de luz contínua, e alguns produzem trilhões de watts em pulsos extremamente curtos. As áreas militar e de energia tem desenvolvido lasers que ocupam edifícios inteiros, enquanto que o laser mais comum usa um dispositivo semicondutor que possui um tamanho típico de um grão de areia. 10.2 Emissões espontânea e estimulada O entendimento de alguns princípios fundamentais é essencial para a explicação de como a emissão estimulada é produzida e amplificada. O primeiro desses princípios relaciona-se com o fato de que o laser é um dispositivo inerentemente quântico e que a quantização da energia deve ser invocada para explicar sua operação. A Física Clássica parte do pressuposto que energia pode variar contínua e suavemente e que os átomos e moléculas podem possuir qualquer quantidade de energia. O trabalho de Niels Bohr, que se tornou a chave para o desenvolvimento da mecânica quântica, estabelece que os átomos e moléculas só podem ter quantidades discretas de energia, chamadas de quantas de energia. Alguns conceitos ligados ao fóton, átomo e quantização da energia, necessários para se entender a operação de um laser, são: • Na descrição quântica, um átomo possui níveis discretos de energia. • A emissão de luz espontânea e estimulada só ocorre se houver transições entre níveis de energia. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 212 • É necessária uma inversão de população entre níveis de energia para que haja a amplificação da emissão estimulada de energia. Se um átomo ou molécula estiver num estado com energia maior que a do estado fundamental (estado de mais baixa energia do átomo), ele pode decair espontaneamente para um nível de energia mais baixo sem qualquer estímulo externo. Como resultado, temos a liberação de um excesso de energia, igual à diferença de energia dos dois níveis, como um fóton de luz. A freqüência do fóton emitido é dada pela relação de Einstein: ΔE = hν, onde h é a constante de Planck. Os átomos e moléculas excitados têm um tempo característico para emitir espontaneamente, que é o tempo médio que eles permanecem no estado excitado antes de decaírem para um nível de energia mais baixo. O tempo de vida do estado excitado é um fator importante para que ocorra a emissão estimulada. Se um átomo no estado excitado é iluminado por um fóton que tem a mesma energia da transição que ocorreria espontaneamente, o átomo pode ser estimulado a voltar ao estado de mais baixa energia e simultaneamente emitir um fóton com a mesma energia da transição e mesma direção do fóton incidente. Assim, um único fóton que interage com um átomo excitado pode resultar então em dois fótons. Se usarmos a descrição ondulatória da luz, a emissão estimulada terá a freqüência da luz incidente e estará em fase (coerente), resultando em amplificação da intensidade da onda de luz original. A Fig. 10.1 ilustra a absorção (a), emissão espontânea (b) e estimulada (c) com as duas ondas coerentes resultantes. depois antes (a) antes depois (b) depois antes (c) Fig. 10.1 – Absorção (a ), emissão espontânea (b) e estimulada (c). O problema principal para se conseguir a emissão estimulada é que, sob condições normais de equilíbrio termodinâmico, a população S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 213 (número de átomos ou moléculas em cada nível de energia) não é favorável para a sua ocorrência. Devido à tendência dos átomos e moléculas decaírem espontaneamente para os níveis de mais baixas energias, a população em cada nível diminui com o aumento de energia. Em condições normais, para uma energia de transição correspondente a um comprimento de onda óptico (da ordem de 1eV), a razão entre o número de átomos ou moléculas na energia mais alta ao número no estado fundamental é de cerca de 10-17. Em outras palavras, virtualmente todos os átomos ou moléculas estarão no estado fundamental para uma transição com energia correspondente ao comprimento de onda da luz visível. Assim, embora a luz emitida espontaneamente pudesse facilmente estimular a emissão de outro átomo excitado, tão poucos estão disponíveis que o fóton emitido encontrará primeiro um átomo no estado fundamental e será absorvido (Fig. 1(a)). Em resumo, como o número de átomos no estado excitado é muito pequeno com relação ao do estado fundamental, o fóton emitido tem uma probabilidade muito maior de ser re-absorvido, fazendo a emissão estimulada insignificante quando comparada com a emissão espontânea (no equilíbrio termodinâmico). O mecanismo pelo qual a emissão estimulada pode se tornar dominante é ter mais átomos no estado excitado que no estado fundamental, de forma que os fótons emitidos têm maior probabilidade de estimular a emissão do que serem absorvidos. Como esta condição é o inverso do que ocorre na situação de equilíbrio normal, ela é denominada de inversão de população. Havendo mais átomos num estado excitado que no fundamental, a emissão estimulada pode dominar, resultando numa cascata de fótons. O primeiro fóton emitido estimulará a emissão de mais fótons, que estimularão a emissão de ainda mais fótons, e assim por diante. A cascata resultante de fótons cresce, produzindo a amplificação da luz emitida. Se a inversão de população termina (a população do estado fundamental domina), a emissão espontânea se tornará novamente o processo favorecido. Quando Einstein introduziu o conceito de emissão estimulada, a maioria dos físicos acreditava que qualquer condição diferente da do equilíbrio termodinâmico seria instável e não poderia ser sustentada. Só muito mais tarde é que desenvolveram métodos para produzir as inversões de população necessárias para sustentar a emissão estimulada. Átomos e moléculas podem ocupar muitos níveis de energia, e embora algumas S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 214 Interação luz-matéria: tratamento semi-clássico transições sejam mais prováveis que outras (devido às regras de seleção da mecânica quântica), uma transição pode acontecer entre dois níveis de energia quaisquer. A condição necessária para ocorrer a emissão estimulada e amplificação, ou ação laser, é que pelo menos um nível de energia mais alto tenha uma população maior que um nível mais baixo. A abordagem mais comum para se produzir uma inversão de população num meio laser é fornecer energia ao sistema para excitar átomos ou moléculas para os níveis de energia mais altos. No equilíbrio termodinâmico, a energia térmica não é suficiente para produzir uma inversão de população porque o calor só aumenta a energia média da população, mas não aumenta o número de espécies no estado excitado com relação ao estado fundamental. A razão entre os números de átomos num sistema com dois níveis de energia (1 e 2) em equilíbrio termodinâmico é determinada pela distribuição de Boltzmann: N2 (10.1) = exp{− ( E 2 − E1 ) / KT} N1 onde N1 e N2 são respectivamente os números de átomos nos níveis 1 e 2, E1 e E2 as energias dos dois níveis, K é a constante de Boltzmann, e T é a temperatura em Kelvins. De acordo com esta equação, no equilíbrio termodinâmico N2 só poderá ser maior que N1 se a temperatura for um número negativo. Antes da publicação das pesquisas descrevendo a ação maser, vários físicos achavam que a inversão de população seria impossível de ser conseguida porque necessitaria de tal temperatura negativa. Para produzir a inversão de população exigida para a ação laser, átomos ou moléculas devem ser excitados a níveis de energia específicos. Luz e corrente elétrica são os mecanismos de excitação usuais para a maioria dos lasers, mas também existem outras abordagens, que embora bastante complexas, produzem freqüentemente lasers com bom desempenho. Em geral se excita um átomo ou molécula a um nível de energia superior àquele que participa da emissão estimulada, após o que ele decai para o nível excitado de interesse. Excitação indireta através das colisões entre dois tipos de gases de uma mistura também pode ser empregada para produzir a inversão de população. Em outras palavras, excita-se um tipo de gás através da passagem de corrente elétrica e este S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 215 transfere, via colisões, a energia aos átomos ou moléculas responsáveis por produzir a ação de laser. Como já mencionado, o tempo que um átomo ou molécula permanece no estado excitado é crítico para estabelecer se a emissão será estimulada ou espontânea. Em geral, o estado excitado possui um tempo de vida típico da ordem de alguns nanossegundos antes da ocorrência da emissão espontânea e este período não é suficientemente longo para sofrer a provável excitação por outro fóton. Assim, uma exigência crítica para a ação laser é que o estado excitado tenha um tempo de vida longo. Estes estados existem em certos materiais e são chamados de estados metaestáveis. O tempo de vida de um estado metaestável varia tipicamente de microssegundos a milissegundos, que é um tempo realmente longo na escala atômica. Com vidas tão longas, átomos e moléculas excitados podem produzir quantidades significantes de emissão estimulada. A ação laser só é possível se a população do nível excitado se mantiver superior à do nível fundamental. Quanto mais longo for o tempo de decaimento da emissão espontânea, mais adequado uma molécula ou átomo será para a ação laser. A ação maser demonstrada por Charles Townes foi importante porque utilizou pela primeira vez a inversão de população para funcionar, e assim, provou para muitos físicos descrentes que tal inversão era possível de ser produzida. O maser desenvolvido por ele baseava-se na molécula de amônia, tendo apenas dois níveis que participam da ação laser. Townes empregou uma aproximação moderna para produzir a inversão de população - uma técnica de feixe molecular que separava magneticamente as moléculas excitadas das moléculas no estado fundamental. Estas eram descartadas e as moléculas excitadas restantes possuíam a inversão de população desejada. Outras técnicas mais eficientes de inversão de população para masers e lasers práticos foram desenvolvidas, requerendo a utilização de três, quatro, ou mais níveis de energia. 10.3 A susceptibilidade atômica Vimos no Cap. 9 que a suscetibilidade elétrica de um átomo clássico é dada pela expressão: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 216 ~ χ= Ne 2 /mε 0 Ne 2 /mε 0 ≈ ω02 − ω2 − iωb 2ω0 (ω0 − ω) − iω0 b (10.2) onde na última passagem consideramos o caso em que a freqüência da luz incidente está próxima da ressonância atômica (ω ≈ ω0). Introduzindo o tempo de relaxação T = 2/b relacionado à potência emitida pelo elétron acelerado, podemos escrever explicitamente as partes real e imaginária da susceptibilidade como: (ω0 − ω)T ⎛ Ne 2 T ⎞ χ′ = ⎜ ⎟ 2 2 ⎝ 2mω0 ε 0 ⎠ 1 + (ω − ω0 ) T (10.3a) 1 ⎛ Ne 2 T ⎞ χ′′ = ⎜ ⎟ 2 2 ⎝ 2mω0 ε 0 ⎠ 1 + (ω − ω0 ) T (10.3b) que estão ligadas respectivamente ao índice de refração e ao coeficiente de absorção através das expressões aproximadas n = 1 + ½ χ´ e α = ½ (ω/c) χ”. O átomo clássico pode ter qualquer energia, bastando para isto o simples aumento da amplitude de oscilação do elétron. Entretanto, a ação laser só pode ser descrita considerando-se um átomo quântico, cuja energia assume valores discretos. O cálculo da suscetibilidade deste átomo é feita utilizando-se técnicas da mecânica quântica, em particular o formalismo da matriz de densidade. Este tipo de cálculo foge aos objetivos deste capítulo e assim, o que vamos fazer a seguir é apresentar a equação que descreve a suscetibilidade e discutir fisicamente a origem dos seus termos. No formalismo semi-clássico, onde o átomo é tratado como uma entidade quântica e o campo eletromagnético como uma variável clássica, as partes real e imaginária da susceptibilidade atômica são dadas por: (ω0 − ω)T2 μ 2 (ω0 − ω) T2 ⎛ μ 2 ΔN 0 T2 ⎞ χ′ = −⎜ =− ΔN g(ν) ⎟ 2 2 2 2hε 0 ⎝ hε 0 ⎠ 1 + (ω − ω0 ) T2 + 4Ω T2 τ 10.4a) ⎛ μ 2 ΔN 0 T2 ⎞ μ2 1 χ′′ = −⎜ = − ΔN g(ν) ⎟ 2 2 2 2hε 0 ⎝ hε 0 ⎠ 1 + (ω − ω0 ) T2 + 4Ω T2 τ (10.4b) S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 217 Interação luz-matéria: tratamento semi-clássico onde ΔN0 = (N2 – N1)0 , que substitui o N da eq. (10.3), é a diferença de população entre os níveis excitado (2) e fundamental (1) na ausência de luz. μ é o momento de dipolo da transição conectando os estados 1 e 2, sendo dado, no caso em que a luz estiver polarizada na direção x, por: r r μ = −e ∫ ψ 1 ( r ) x ψ 2 ( r ) dV , onde as funções de onda ψi referem-se aos estados excitado (2) e fundamental (1). g(ν) é a forma de linha normalizada, dada pela Lorentziana: g (ν ) = 1 + 4π (ν − ν 0 ) T2 2T2 2 2 2 = (Δν / 2π) (ν − ν 0 ) 2 + (Δν / 2) 2 que possui uma largura Δν = (πT2)-1 e é tal que lado, (10.5) ∫ g(ν) dν = 1 . Por outro 2 2 ⎛ ⎞ 1 + (ω − ω0 ) T2 ⎟⎟ ΔN = ΔN 0 ⎜⎜ 2 2 2 ⎝ 1 + (ω − ω0 ) T2 + 4Ω T2 τ ⎠ (10.6) é a diferença de população entre os níveis excitado (2) e fundamental (1) na presença de luz. As diferenças mais significativas entre as equações (10.3) e (10.4) devem-se ao termo de saturação 4Ω2T2τ existente no denominador e à interpretação dos termos de relaxação τ e T2. A grandeza Ω = μE/2ħ é conhecida como freqüência de Rabi e seu quadrado é proporcional à intensidade. Uma conseqüência da presença deste termo nas equações (10.4) e (10.6) é que tanto a suscetibilidade quanto a diferença de população diminuem conforme se aumenta a intensidade de luz. Este fenômeno, conhecido como saturação, se torna bastante aparente quando 4Ω 2 T2 > 1 + (ω − ω0 ) 2 T2 2 . Outra conseqüência da saturação é o alargamento da linha Lorentziana de um valor Δν = (πT2)-1 para Δν sat = Δν 1 + 4Ω 2 T2 τ . Voltaremos a este ponto quando discutirmos a saturação do ganho. Um outro aspecto importante que distingue as equações (10.3) e (10.4) é aquele relacionado com os tempos de relaxação. No caso clássico, T é o tempo característico do amortecimento da vibração do elétron devido à emissão de radiação. Já no caso semi-clássico, foram introduzidos dois tempos de relaxação: τ, conhecido como tempo de relaxação longitudinal, é o tempo de decaimento da diferença de S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 218 população devido à emissão espontânea ou à processos não radiativos, enquanto que T2, conhecido como tempo de relaxação transversal, é responsável pela perda de coerência relativa entre os dipolos induzidos nos átomos pela luz incidente, devido principalmente às colisões interatômicas. 10.4 Os coeficientes A e B de Einstein Em 1917 Einstein publicou um artigo onde analisou a interação de um conjunto de átomos idênticos com um campo de radiação com energia variando suavemente nas vizinhanças da freqüência de transição. Ele supôs a existência de dois processos estimulados, dependentes da densidade de energia de acordo com: W21 = B 21ρ(ν ) (10.7a) W12 = B12 ρ(ν ) (10.7b) onde Wij é a taxa de transição (número de transições por com unidade de tempo) e Bij são constantes a serem determinadas. De acordo com a Fig. 10.2, o átomo estará em equilíbrio com o campo de radiação (estado estacionário) quando o número de transições de 1→ 2 foi igual à de 2→1. Assim, 2 W12 W21 A 1 Fig. 10.2 – Átomo de dois níveis. N 1 B12 ρ(ν ) = N 2 [B 21ρ(ν ) + A ] (10.8) sendo A a taxa de transições espontâneas e Ni a população do nível i. Para determinarmos os coeficientes A e Bij vamos supor que o campo de radiação tem como origem a emissão de corpo negro, cuja densidade de energia é dada pela fórmula de Planck: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 219 Interação luz-matéria: tratamento semi-clássico hν ⎞ ⎛ 8πn 3 ν 2 ⎞⎛ KT ⎜ e − 1⎟⎟ hν ρ( ν ) = ⎜ ⎟ 3 ⎜ ⎠⎝ ⎝ c ⎠ −1 (10.9) onde a primeira fração representa a densidade de modos para a radiação isotrópica de freqüência ν, a segunda fração o número de ocupação destes modos e o termo hν é a energia por modo (fóton). A consideração deste tipo de radiação específica não implica em quebra de generalidade uma vez que é de se esperar que os coeficientes A e Bij dependam apenas do átomo e não da radiação a que está exposto. Substituindo (10. 9) em (10. 8) obtemos: hν 8πn 3 hν 3 ⎛ KT ⎞ ⎜⎜ e − 1⎟⎟ = N 2 N1B12 3 c ⎝ ⎠ −1 −1 hν ⎡ ⎤ 8πn 3 hν 3 ⎛ KT ⎞ ⎜⎜ e − 1⎟⎟ + A ⎥ (10.10) ⎢B 21 3 c ⎝ ⎠ ⎢⎣ ⎥⎦ Como os átomos estão em equilíbrio térmico, a razão entre as populações dos níveis 1 e 2 é dada pelo fator de Boltzmann: hν N 2 g 2 − KT e = N1 g1 (10.11) onde gi é a degenerescência do i-ésimo nível. Substituindo esta razão na eq. (10.10) e re-arranjando os termos obtemos: g1 8πn 3 hν 3 ⎞ − KT ⎛ 8πn 3 hν 3 B A B A − = − ⎟e ⎜ 21 12 3 g2 c3 ⎠ ⎝ c hν (10.12) que será válida para qualquer temperatura somente se: A 8πn 3 hν 3 = B 21 c3 (10.13a) B12 g 2 = B 21 g 1 (10.13b) Como num sistema atômico de dois níveis isolado a taxa de decaimento A é o inverso do tempo de vida espontâneo, A = 1/τesp, usando ν = c/λ obtemos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 220 B 21 = g1 c λ2 B12 = ⎛⎜ ⎞⎟ g2 ⎝ n ⎠ 8πn 2 hντ esp (10.14) 10.5 O coeficiente de ganho Considere a passagem de uma onda monocromática de freqüência ν e irradiância Iν através de um conjunto de átomos com densidades (átomos/m3) N1 e N2 nos níveis 1 e 2, respectivamente. Desprezando a emissão espontânea, se tivermos um número de transições 2→1 maior que 1→2 haverá um acréscimo na potência da luz dado por: Potência = [N 2 W21 − N1 W12 ] hν Volume (10.15) Tomando Iν g(ν) = (c/n) ρ(ν), onde Iν g(ν) é a irradiância efetivamente percebida pelo átomo, e usando as equações (10.7) e (10.14) obtemos: g Potência ⎡ ⎤ λ2 g (ν) = ⎢ N 2 − 2 N1 ⎥ Iν 2 Volume ⎣ g1 ⎦ 8πn τ esp (10.16) Esta potência é acrescida à da onda incidente, que aumenta de acordo com: dI ν (z) Potência = = γ (ν ) I ν ( z ) dz Volume (10.17) Comparando as equações (10.17) e (10.16) vemos que o coeficiente de ganho é dado por: γ (ν) = ΔN λ2 g (ν ) 8πn 2 τ esp (10.18) onde ΔN foi generalizado como ΔN = ⎡ N 2 − g 2 N1 ⎤ . O ganho nada mais ⎥ ⎢ g1 ⎦ ⎣ é do que um coeficiente de absorção negativo. Generalizando o tratamento da seção 9.2 para incluir o caso em que os átomos que sofrem a transição estão dispersos numa matriz hospedeira, podemos escrever: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico r r r r r r D = ε 0 E + P + Ptrans = εE + ε 0 χE 221 (10.19) onde as contribuições não ressonante da matriz e ressonante devida à r transição atômica foram separadas. Colocando E em evidência encontramos a permissividade elétrica do material como ε′ = ε(1 + ε 0 χ / ε ) e a constante de propagação como k′ = ω με′ ≅ k(1 + ε 0 χ / 2ε ) no caso em que χ <<1. Como analisado na seção 9.3, isto nos leva a um coeficiente de absorção α = kχ”(ν)/n2 = -γ(ν), onde n = ε / ε 0 é o índice de refração não ressonante da matriz. Usando as equações (10.4b) e (10.18) obtemos : τ esp = h ε 0 λ3 8π 2 μ 2 (10.20) Desta equação vemos que quanto menor λ e maior o momento de dipolo da transição, menor será o tempo de vida do estado excitado. 10.6 Alargamentos homogêneo e não homogêneo O termo alargamento é utilizado para denotar a largura de linha da resposta em freqüência de um conjunto de átomos sujeito a um campo de radiação eletromagnética. Existem dois casos a serem considerados. No primeiro, conhecido como alargamento homogêneo, os átomos são indistinguíveis, tendo, portanto, a mesma freqüência de transição ω0 = (E2E1)/ħ. Neste caso, a forma de linha é dada pela eq. (10.5) e sua largura, Δν = (πT2)-1, tem como origem um dos seguintes processos: (i) colisões inelásticas com outros átomos (ou moléculas) ou com fônons se o átomo estiver localizado numa matriz sólida; (ii) transições radiativas ou não radiativas para a outros níveis; (iii) colisões elásticas que destroem a fase do dipolo elétrico induzido no átomo e (iv) alargamento por potência devido ao processo de saturação que ocorre na interação do átomo com o campo de radiação, cuja forma funcional, como já vimos é dada por: Δν sat = Δν 1 + 4Ω 2 T2 τ . Como a largura de linha é inversamente proporcional à T2, que é a constante de tempo caracterizando a perda de coerência (fase) atômica, no caso em que temos uma combinação dos processos mencionados acima, podemos escrever: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 222 1 1 =∑ T2 T2i (10.21) onde a soma leva em conta todos os mecanismos (colisões, transições, etc.) que interrompem a interação coerente luz-matéria. No alargamento não homogêneo, existem classes de átomos que diferem entre si por possuírem freqüências de ressonância distintas. Duas situações que levam a este tipo de alargamento são o efeito Doppler, no caso de um gás de átomos (ou moléculas) e as flutuações de campo cristalino que os diversos átomos sentem quando estão alojados numa matriz hospedeira. Estas flutuações têm como origem deformações, ou outros tipos de imperfeições cristalinas, que fazem com que os átomos vejam diferentes vizinhanças (e campos cristalinos) dependendo do lugar onde eles se encontram posicionados, levando a diferentes freqüências de transição, devido ao efeito Stark flutuante. No caso de átomos colocados em vidros, o alargamento não homogêneo é bem mais significativo porque a configuração de átomos se modifica bastante conforme se muda a posição no interior do material. Uma classe importante de lasers é aquela em que o meio ativo é um gas. Dentre os vários lasers deste tipo destacam-se o de CO2, argônio, kriptônio, He-Ne, excimer, etc. Já vimos na seção 4.3 que a forma de linha neste caso é dada por uma Gaussiana da forma: g (ν ) = onde: 2 ⎡ ⎛ ν − ν0 ⎞ ⎤ exp⎢− 4ln 2⎜ ⎟ ⎥ π Δν D ⎝ Δν D ⎠ ⎦⎥ ⎣⎢ 2 ln 2 (10.22) Δν D = 2ν 0 2ln 2 kT (10.23) mc 2 Vamos em seguida analisar como o ganho de um meio ativo satura quando temos estes tipos de alargamento de linha. 10.7 Saturação do ganho em meios com alargamentos homogêneo e não homogêneo A distinção mais importante entre sistemas atômicos com alargamentos homogêneo e não homogêneo é a maneira com que o ganho S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 223 satura. Isto é muito importante para descrever a ação laser, como veremos adiante. Num sistema com alargamento homogêneo os átomos são indistinguíveis, de forma que o ganho total é dado pela eq. (10.18), deduzida na seção 10.5. Substituindo nesta equação g(ν) e ΔN dados respectivamente pelas equações (10.5) e (10.6), usando Iν = ½ cnε0E02 e Ω = (μE 0 / 2h ) , obtemos o ganho no sistema com alargamento homogêneo como: ΔN 0 λ2 g(ν) γ 0 (ν ) 1 (10.24) γ (ν ) = = 2 8πn τ esp 1 + I ν / I s (ν) 1 + I ν / I s (ν) onde γ0(ν) é o ganho não saturado que ocorre para intensidades muito pequenas (E0 ≈ 0) e Is(ν) é a intensidade de saturação, dada por cnε 0 h 2 4πn 2 hν = μ 2 τg(ν) (τ /τ esp ) λ2 g(ν) I s (ν ) = (10.25) onde na última passagem usamos a eq. (10.20) para a eliminação de μ2. Desta equação vemos que a intensidade de saturação é menor próximo ao centro da linha de absorção, o que torna maior o denominador da eq. (10.24). Assim, o ganho segue aproximadamente a forma de linha Lorentziana longe da freqüência de ressonância (Is(ν) é pequeno), mas nas vizinhanças do centro da linha ele diminui significativamente devido ao decréscimo de Is(ν). Já no caso de um sistema atômico com alargamento não homogêneo, os átomos são distinguíveis, cada um tendo uma determinada freqüência de transição. Um exemplo típico é o caso do efeito Doppler, que faz com que classes de átomos com velocidades diferentes tenham freqüências diferentes. Vamos definir uma função p(νξ) que representa a probabilidade da freqüência central de um átomo se localizar entre νξ e νξ + dνξ. Para o caso de um gás, esta função será a distribuição de Maxwell-Boltzmann, que por definição é normalizada de acordo com: ∫ +∞ −∞ p(ν ξ )dν ξ = 1 . Cada átomo com freqüência νξ é considerado como ∫ possuindo alargamento homogêneo, tendo uma função forma de linha gξ(ν) normalizada tal que: +∞ −∞ g ξ (ν) dν = 1 . Podemos definir uma forma de linha g(ν) para a transição, supondo que g(ν)dν representa a probabilidade S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 224 que uma emissão espontânea gere um fóton com freqüência ν e ν +dν. Com isso podemos escrever: g ( ν ) dν = [∫ +∞ −∞ ] p ( ν ξ ) g ξ ( ν ) dν ξ dν (10.26) que nada mais é do que a média ponderada das contribuições de todas as classes de átomos cujas formas de linha possuam um valor não nulo na freqüência ν. Note que embora utilizemos a mesma denominação g(ν) para a forma de linha, aqui não se trata de uma Lorentziana, mas sim de uma soma delas, com freqüências variadas. No caso particular em que a linha homogênea é muito mais estreita que a linha não homogênea caracterizada pela distribuição p(νξ), gξ(ν) pode ser aproximada pela função δ(ν-νξ) e assim g(ν) da eq. (10.26) se torna p(ν). Se a inversão total não saturada é ΔN0 (átomos/m3), a inversão devida aos átomos no intervalo dνξ é ΔN0p(νξ)dνξ e a contribuição daquela classe sozinha ao ganho na freqüência ν é dada como: p(ν ξ ) dν ξ ΔN 0 λ2 ⎡ ⎤ (10.27) γ ξ (ν ) = ⎢ ξ 2 2 2 8πn τ esp ⎣ [1 / g (ν)] + [λ φ I ν /4πn hν]⎥⎦ onde a eq. (10.24) foi usada com φ = (τ/τesp). Como as contribuições das várias classes são aditivas, segue-se que: p(ν ξ ) dν ξ ΔN 0 λ2 +∞ (10.28) γ (ν ) = ξ 2 ∫ − ∞ [1 / g (ν)] + [λ2 φ I ν / 4πn 2 hν] 8πn τ esp Este é o nosso resultado básico. Para verificar a validade da eq. (10.28), vamos considerar o caso em que Iν é muito pequeno e assim os efeitos de saturação podem ser desprezados. Usando as equações (10.28) e (10.26) temos: ΔN 0 λ2 γ (ν ) = 8πn 2 τ esp ΔN 0 λ2 ∫−∞ p(ν ξ )g (ν) dν ξ = 8πn 2 τ esp g(ν) +∞ ξ (10.29) que é igual à eq. (10.24) no caso em que Iν = 0, exceto que g(ν) não é uma função Lorentziana, mas uma média ponderada delas. Isto mostra que na ausência de saturação as expressões para o ganho de sistemas com alargamentos homogêneo e não homogêneo são idênticos. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 225 Nosso interesse principal nesta seção é derivar o ganho saturado para uma transição atômica alargada não homogeneamente. Supondo que os átomos de cada classe ξ são idênticos (e com alargamento homogêneo), podemos usar a eq. (10.5) para a função forma de linha para esta classe: g ξ (ν) = (Δν / 2π) (ν − νξ )2 + (Δν / 2)2 (10.30) onde Δν é chamada de largura homogênea da linha não homogênea. Átomos com freqüência de transição νξ agrupadas dentro de uma faixa Δν são considerados indistinguíveis e chamados de pacotes homogêneos. Usando as equações (10.28) e (10.30) temos: γ (ν ) = ΔN 0 λ2 Δν 16π 2 n 2 τ esp p(ν ξ ) dν ξ ∫ (ν − ν ) +∞ −∞ ξ 2 + (Δν / 2) + [λ2 φ I ν Δν / 8π 2 n 2 hν] 2 (10.31) No caso em que o alargamento não homogêneo é muito maior que o homogêneo, p(νξ) varia suavemente na região onde o integrando têm seu máximo e pode ser retirado para fora da integral, sobrando apenas uma integral definida do tipo: ∫ +∞ −∞ 1 π dx = x2 + a2 a (10.31) Com isso obtemos: γ (ν ) = γ 0 (ν ) ΔN 0 λ2 p(ν) 1 = 2 2 2 2 8πn τ esp 1 + [λ φ I ν / 2π n hνΔν] 1 + I ν /I s (10.32) onde Is = 2π2n2hνΔν/φλ2 é a intensidade de saturação da linha não homogênea. Uma comparação das equações (10.24) e (10.32) revela duas diferenças essenciais entre o comportamento da saturação em sistemas com alargamento homogêneo e não homogêneo. Primeiro, o sistema não homogêneo satura mais lentamente devido à raiz quadrada presente no denominador da eq. (10.32). Isso pode ser explicado pelo fato que mais classes começam a interagir com campo de radiação conforme sua intensidade aumenta, de acordo com Δν sat = Δν 1 + 4Ω 2 T2 τ , de forma a compensar parcialmente o decréscimo da inversão na classe ξ. Se S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 226 Interação luz-matéria: tratamento semi-clássico multiplicarmos a eq. (10.24) por Δνsat, o resultado é um ganho cuja dependência é do tipo dada pela eq. (10.32). Segundo, a intensidade de saturação no caso não homogêneo não depende da forma de linha, mas apenas de Δν. Isto é, Is não depende de g(ν) conforme ocorre na intensidade de saturação para o caso homogêneo. 10.8 Espectroscopia de saturação Para apreciarmos melhor a diferença entre o comportamento da saturação em meios como alargamentos homogêneo e não homogêneo, vamos considerar o caso em que um campo forte, de freqüência ν, é aplicado a um meio que pode absorver a luz. Simultaneamente, um feixe de sonda bem fraco, de freqüência ν′ , é usado para medir o ganho γ( ν′ ). Nosso objetivo é determinar a forma da curva de ganho para as duas situações. Vamos considerar inicialmente o caso homogêneo. O ganho em ν′ é dado pela eq. (10.18), que transcrevemos abaixo: γ (ν ′) = ΔN λ2 g(ν ′) 8πn 2 τ esp (10.34) onde ΔN é a inversão de população na presença do campo forte em ν, dada pela eq. (10.6), que quando usada com a equação do ganho leva a: ⎞ ⎛ ⎟ ⎜ 2 2 2 ( ) 1 4 T + π ν − ν 0 2 ⎟ γ (ν ′) = γ 0 (ν ′) ⎜ 2 2 ⎟ ⎜ E μ 2 2 2 ⎜ 1 + 4π (ν − ν 0 ) T2 + 2 0 g 1T2 τ ⎟ ⎠ ⎝ h (10.35) onde E0 é a amplitude do campo forte em ν e γ0( ν′ ) é a função ganho não saturado: λ2 (10.36) γ 0 (ν ′) = ΔN 0 g (ν ′) 8πn 2 τ esp e g( ν′ ) é, neste caso, a função Lorentziana. Assim, vemos que o ganho tem a mesma dependência em freqüência que o ganho não saturado, mas sua magnitude é reduzida pelo fator dentro do parêntesis da eq. (10.35). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 227 Interação luz-matéria: tratamento semi-clássico No caso de um sistema alargado não homogeneamente, a situação é mais complicada. Quando ν′ está nas vizinhanças de ν (ν´-ν < Δν), o feixe sonda interage com moléculas que possuem a diferença de população saturada pelo feixe de bombeio. Para esta freqüência podemos utilizar a eq. (10.30) para re-escrever a eq. (10.28) como: γ (ν ) = ΔN 0 λ2 8πn 2 τ esp ∫ +∞ −∞ (ν − ν ξ ) 2 + (Δν / 2) (ν − ν ξ ) 2 + (Δν / 2) + [λ2 φ ΔνI ν / 8π 2 n 2 hν ] 2 2 p(ν ξ ) g ξ (ν)dν ξ (10.37) O integrando é proporcional à contribuição do ganho em ν devido ao pacote atômico centrado em νξ , e a fração representa o fator pelo qual esta contribuição é reduzida devido ao campo saturante em ν. O ganho sentido pelo feixe de prova fraco em ν′ é, portanto o ganho não saturado multiplicado por esse fator de redução local, isto é: γ ( ν′ ) = γ 0 ( ν′ ) 2 (ν − ν′) 2 + (Δν / 2) 2 (ν − ν′) 2 + (Δν / 2) + [λ2 φ ΔνI ν / 8π 2 n 2 hν] (10.38) Para as freqüências ν′ afastadas de ν, a diferença de população não está saturada pelo feixe forte e assim, o ganho sentido pelo feixe sonda será dado pela eq. (10.29). Em suma, γ( ν′ ) é essencialmente idêntico ao ganho não saturado, exceto para freqüências ν´ nas vizinhanças da freqüência de saturação ν, onde é diminuído num intervalo de freqüências da ordem de: -1 Δν dip = Δν 1 + I ν / I s e o ganho em ν′ é reduzido por um fator (1+Iν/Is) . Is é a intensidade de saturação definida por Is = 8π2n2hν/Δνφλ2. Essa região de ganho mais baixo é usualmente chamada de Lamb dip e o fenômeno é utilizado para se obter a largura homogênea contida num perfil não homogêneo. A curva de ganho do sinal de prova está esquematizada na Fig. 10.3 para as duas situações. Nela vemos que para o caso de alargamento homogêneo a curva de ganho diminui em toda a sua largura espectral, porém, no caso não homogêneo o decréscimo (saturação) do ganho ocorre apenas para algumas classes de velocidades. Isto faz com que a curva passe a apresentar buracos no seu perfil toda vez que houver luz presente naquela freqüência. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 228 (a) (b) Fig. 10.3 – Ganho de um feixe de prova fraco de freqüência ν´ na presença de um campo saturante forte na freqüência ν para os casos de alargamentos (a) homogêneo e (b) não homogêneo Bibliografia 10.1. A. Yariv, Quantum Electronics, 3ª edição, John Wiley and Sons, NY (1989). Problemas 10.1. Mostre que χ’ e χ” satisfazem a relação de Kramers-Kronig: χ′(ω) = + ∞ χ ′′(ω) 1 P.V.∫ dω′ − ∞ (ω′ − ω) π χ ′′(ω) = − + ∞ χ ′(ω) 1 P.V.∫ dω′ − ∞ (ω′ − ω) π (10.39a) (10.39b) no limite de saturação desprezível (Ω = 0). P.V. significa o valor principal de Cauchy. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 229 10.2 Determine o valor do coeficiente de absorção devido a uma transição em ν0 = 3x1014 Hz, onde N2 = 0 e N1 = 1018 cm-3, a largura de linha não homogênea Gaussiana é 400 cm-1 e τesp = 10-4 s. Definindo a densidade óptica como DO = -log10(I/I0), qual será seu valor em ν0 para uma mostra com 1 cm de comprimento? A que temperatura a taxa de transições induzidas pela radiação de corpo negro se iguala à taxa de emissão espontânea? 10.3. Mostre que quando os feixes de bombeio e de prova de mesma freqüência propagam em direções opostas num experimento de espectroscopia de saturação num gás sujeito ao efeito Doppler, eles interagem simultaneamente apenas com os átomos (ou moléculas) que possuem velocidades nulas na direção dos feixes. 10.4. Mostre que a intensidade de saturação para um átomo de dois níveis é dada por Is(ν) = hν/(2σ(ν)τ), onde σ(ν) é a seção de choque de absorção na freqüência ν. 10.5. Considere o efeito da dispersão na velocidade de grupo de um pulso óptico, com freqüência central igual à da ressonância atômica (ω0), propagando num meio atômico: a) para um meio amplificador e b) para um meio absorvente. Expresse a velocidade de grupo como função do ganho de pico para uma linha Lorentziana. Ignore hole-burning e suponha que o espectro do pulso é estreito comparado com Δν. Lembre que: 2 (ν 0 − ν ) χ ' (ν ) = χ" (ν ) , γ (ν) = − k χ" (ν) , vg = dω/dk’, com Δν χ' (ν) ⎤ , onde k(ν) = ωn/c = 2πνn/c. k ' (ν) = k ⎡⎢1 + 2n 2 ⎥⎦ ⎣ n2 10.6. a) Explique (fisicamente) o significado dos termos de relaxação τ e T2. b) Discuta o significado de χ com base na expressão ⎡ ε χ(ν) ⎤ , onde k e ε referem-se à matriz onde são k ' = k ⎢1 + 0 2ε ⎥⎦ ⎣ colocados os átomos de susceptibilidade χ. c) Deduza os números de modos por unidade de freqüência que podem ser emitidos espontaneamente em torno da freqüência ν. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Interação luz-matéria: tratamento semi-clássico 230 d) Deduza uma expressão relacionando o número de fótons do r modo k (freqüência ν) com a intensidade Iν naquela freqüência. e) Deduza uma expressão relacionando a intensidade Iν com a densidade de energia ρ(ν) naquela freqüência. 10.7. A primeira linha da série principal do sódio é linha D em 5890 Å, que corresponde a uma transição do primeiro estado excitado (3p) para o estado fundamental (3s). a) Qual a energia em eV do primeiro estado excitado? b) Que a fração de átomos está no primeiro estado excitado em uma lâmpada de vapor de sódio a uma temperatura de 250 0C? c) Qual é a razão entre a emissão estimulada, B21 ρ(ν), e a emissão espontânea, A, a uma temperatura de 250 0C para a linha D do sódio? 10.8. a) Calcule a constante de ganho aproximada de um laser de rubi com N0 = 1019 íons de Cr3+/cm3 em Al2O3. O comprimento de onda do laser é 6934 Å, o tempo de vida do estado excitado é de 3 ms e a largura de linha é de 1 Å. Suponha g1 = g2, e que 50% dos íons Cr3+ estão no primeiro estado excitado e 40% estão no estado fundamental. b) Calcule a densidade de inversão N2-N1(g2/g1) para um laser de He-Ne operando em 6328 Å. A constante de ganho é 0.04 cm-1 no centro da linha, e a largura Doppler é de 1 GHz. O tempo de vida do estado excitado é de 10-7 s. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 231 11 Cavidades ópticas 11.1 Introdução Como exposto no capítulo anterior, é necessária a presença de luz para que ocorra a emissão estimulada e conseqüentemente, a ação laser. Do ponto de vista prático, isto é obtido por meio de uma cavidade ressonante, que nada mais é que o interferômetro de Fabry-Pérot, já estudado no Cap. 6. Além de possibilitar o crescimento da intensidade da radiação eletromagnética, a cavidade também seleciona certas freqüências para as quais a ação laser ocorre. Para se realizar o cálculo de uma cavidade óptica é necessário o uso dos conhecimentos sobre feixes Gaussianos, que já vimos no Cap. 3. Apenas para recordar, o campo elétrico é dado por: E(r, z) = E 0 ⎧ ⎡ ⎧ w0 r2 ⎫ kr 2 ⎤ ⎫ exp⎨− 2 ⎬ xexp⎨− i ⎢kz − η(z) + ⎥⎬ w(z) 2R(z) ⎦ ⎭ ⎩ w (z) ⎭ ⎩ ⎣ (11.1) onde w02 = 2z0/k nos dá o valor da cintura do feixe (semi-diâmetro em z = 0, η(z) = tg-1(z/z0) e, w 2 (z) = { } { 2z 0 1 + (z/z 0 ) 2 = w 02 1 + (z/z 0 ) 2 k { R(z) = z 1 + (z 0 /z) 2 } } (11.2a) (11.2b) Além disso, a propagação do feixe gaussiano é descrita pela lei ABCD, que nos permite encontrar como w(z) e R(z) variam conforme a S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 232 onda se propaga. Definimos anteriormente o parâmetro q(z) de acordo com: 1 1 iλ (11.3) = − q(z) R (z) πnw 2 (z) de forma que, sabendo como q(z) varia com z, a parte real de 1/q(z) dará 1/R(z), enquanto que a parte imaginária está ligada a w(z). Neste caso, o parâmetro q se transforma de acordo com a lei ABCD: q2 = Aq1 + B Cq1 + D (11.4) onde q1 e q2 se referem a dois planos quaisquer perpendiculares ao eixo óptico (z), enquanto que A, B, C, e D são os elementos da matriz que caracteriza a propagação geométrica de um raio de luz entre os planos 1 e 2, como vimos na seção 3.7. 11.2 Álgebra de cavidades ópticas Neste capítulo vamos nos concentrar apenas em cavidades com espelhos esféricos, como as mostradas na Fig. 11.1. Devemos notar que um espelho plano é um caso particular de superfície esférica onde o raio é infinito. Dada uma cavidade simples consistindo de dois espelhos esféricos, queremos encontrar o feixe Gaussiano que satisfaça as condições de contorno impostas pelos raios de curvatura dos espelhos. Começaremos por tratar o problema de forma inversa, ou seja, dando um feixe Gaussiano e determinando onde se deve colocar os espelhos tal que seus raios de curvatura coincidam com os da frente de onda. Nesta situação, o feixe volta sobre si mesmo e refaz o caminho anterior sem sofrer modificações em seu perfil transversal, resultando numa cavidade dita estável. Supondo que a superfície R1 está à esquerda e R2 à direita, e usando a eq. (11.2b) temos: R 1 = z1 + R 2 = z2 + S. C. Zilio z 02 z1 (11.5a) z 02 z2 (11.5b) Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 233 de onde se obtém : z1 = R1 1 (11.6a) ± R 12 − 4z 02 2 2 R 1 (11.6b) R 22 − 4z 02 z2 = 2 ± 2 2 que são as posições em que os espelhos devem ser localizados. No caso prático, sabemos os raios de curvatura dos espelhos e a distância entre eles, definida como l = z2-z1. Com estes dados, podemos encontrar o valor de z 02 com o uso das equações (11.6): z 02 = l(l + R 1 )(l − R 2 )(R 2 − R 1 − l ) ( R 2 − R 1 − 2l ) 2 (11.7) o que nos permite caracterizar completamente o feixe Gaussiano. M1 M1 M2 M2 C2 C1 plano-paralelo M1 M1 M2 C1 C2 C2 C1 M1 M1 M2 Confocal M1 Concêntrico M1 M2 C1 C2 M2 C1,2 C2 C1 M2 C2 M2 C1 Fig. 11.1 – Cavidades ópticas formadas por dois espelhos esféricos. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 234 Uma vez determinado z0, e consequentemente w0 = (λz0/πn)1/2, o próximo passo consiste em encontrar o semi-diâmetro do feixe nas posições dos espelhos utilizando a eq. (11.2a). Para uma cavidade simétrica, onde R2 = -R1 = R, isto pode ser feito com facilidade. Notamos da eq. (11.7) que: z 02 = e portanto: (2R − l )l (11.8) 4 λz 0 l ⎞4 λ ⎛ l ⎞4 ⎛ w0 = = ⎜ ⎟ ⎜R − ⎟ 2⎠ πn ⎝ 2 ⎠ ⎝ πn 1 1 (11.9) que quando substituído na eq. (11.2a) com z = ± l/2 (cavidade simétrica) resulta em: λl ⎛ 2 R 2 ⎞ 4 ⎜ ⎟ 2πn ⎝ l(R − l/2) ⎠ 1 w 1, 2 = No caso em que R >> l (z0 >> l), w 1, 2 ≈ w 0 ≈ λ πn (11.10) ⎛ lR ⎞ 4 e o feixe está ⎜ ⎟ ⎝ 2 ⎠ 1 praticamente colimado dentro da cavidade. Por outro lado, w1,2 será mínimo para R = l e nesta situação temos uma cavidade simétrica confocal, uma vez que f = R/2 = l/2, onde a cintura do feixe e os semidiâmetros nos espelho são dados por: λl (11.11) ( w 0 )conf = 2πn (w 1, 2 )conf = λl = 2 ( w 0 )conf πn (11.12) que quando substituído na eq. (11.10) resulta em: (w 1, 2 )conf w 1, 2 1 ⎞4 ⎛ =⎜ ⎟ ⎝ (l/R )(2 − l/R ) ⎠ 1 (11.13) Este resultado está graficado na Fig. 11.2 como função de l/R. Notamos que quando a distância entre os espelhos se aproxima de 2R, ou S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 235 quando R→ ∞, o semi-diâmetro no espelho diverge. Nesta situação temos uma cavidade que é dita instável uma vez que a energia confinada dentro dela começa a transbordar pela lateral do espelho. ω1,2/(ω1,2)conf 2,0 1,5 1,0 0 1 2 l/R Fig. 11.2 – Semi-diâmetro nos espelhos de uma cavidade esférica simétrica. O problema da estabilidade da cavidade pode ser tratado de uma forma mais geral usando o método auto-consistente. Ao dar uma volta completa na cavidade, é de se esperar que tanto o raio de curvatura como o semi-diâmetro do feixe se reproduza. Nestas condições, a lei ABCD pode ser descrita como: q= Aq + B Cq + D (11.14) onde A, B, C e D são as matrizes dos elementos que formam a cavidade óptica. Resolvendo a eq. (11.14) obtemos: 1 (D − A) ± (D − A) 2 + 4BC = q 2B (11.15) Como as matrizes que descrevem o sistema óptico são unitárias, AD-BC = 1, e a eq. (11.15) pode ser re-escrita como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 236 D+A⎞ 1 − ⎛⎜ ⎟ 1 (D − A) 2 ⎠ = 1 −i λ ⎝ = ±i B R πw 2 n q 2B 2 (11.16) onde na última passagem usamos a eq. (11.3). Assim, dependendo do sinal de B, apenas + ou – deve ser considerado na raiz, de forma a obtermos: 2B (11.17a) R= λ w = ⎛⎜ ⎞⎟ ⎝ πn ⎠ 1/ 2 (D − A) B 1/ 2 ⎡ ⎛D+A⎞ ⎤ ⎢1 − ⎜ 2 ⎟ ⎥ ⎠ ⎦ ⎣ ⎝ (11.17b) 2 1/ 4 A análise desta equação mostra que só teremos solução real quando: D+A (11.18) ≤1 2 Esta é a condição de confinamento (estabilidade) para uma cavidade genérica. No caso particular em que temos uma cavidade com dois espelhos de raios R1 e R2, e usando que fi = Ri/2, encontramos a matriz do sistema como: 4l 2 ⎛ ⎜ 1 − 2l(2 / R 1 + 1 / R 2 ) + R 1R 2 M=⎜ ⎜ 2l ⎞ ⎛ ⎟ ⎜ − 2⎜1 / R 1 + 1 / R 2 + R 1R 2 ⎠ ⎝ ⎝ ⎞ 2l(1 − l / R 2 ) ⎟ ⎟ ⎟ (1 − 2l / R 2 ) ⎟ ⎠ (11.19) de onde tiramos que: 2l 2 D+A = 1 − 2l(1 / R 1 + 1 / R 2 ) + ≤1 R 1R 2 2 (11.20) Com um pouco de manipulação algébrica chegamos à condição de confinamento para a cavidade esférica simétrica: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações ( Cavidades ópticas 0 ≤ 1− l / R 1 )(1 − l / R 2 ) ≤ 1 237 (11.21) Esta desigualdade pode ser colocada na forma gráfica indicada na Fig. 11.3. Dela vemos que as cavidades plano-paralelas e concêntrica são instáveis, enquanto que a confocal é estável. 1-l/R2 simétrico confocal estável plano-paralelo estável 1-l/R1 concêntrico Fig. 11.3 – Diagrama de confinamento de cavidades ópticas esféricas. 11.3 Freqüências de ressonância Como vimos na seção anterior, para que haja confinamento, e consequentemente estabilidade, é necessário que o feixe se reproduza geometricamente (raio de curvatura e semi-diâmetro) ao dar uma volta completa na cavidade. Por outro lado, para que a cavidade seja ressonante, a fase do campo eletromagnético deve ganhar uma diferença de fase múltipla de 2π de forma a haver interferência construtiva conforme o feixe dá a volta completa na cavidade. Para calcularmos as freqüências de S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 238 ressonância que são decorrentes deste acréscimo de fase, vamos considerar o feixe Gaussiano numa ordem qualquer, isto é, não apenas o feixe TEM00 que vimos no início do capítulo. Sem fazer nenhuma demonstração detalhada, vamos usar resultados já conhecidos da literatura e escrever o campo eletromagnético como: E m ,n (x,y,z) = E 0 w0 y ⎞ x ⎞ ⎛ ⎧ x 2 + y2 ⎫ ⎛ Hm ⎜ 2 ⎟ exp⎨− ⎟H n ⎜ 2 ⎬x 2 w(z) ⎠ w(z) ⎠ ⎝ w(z) ⎝ ⎩ w (z) ⎭ k (x 2 + y 2 )⎤ ⎫ ⎧ ⎡ exp⎨− i ⎢kz − (m + n + 1)η(z) + ⎬ 2R(z) ⎥⎦ ⎭ ⎩ ⎣ (11.22) onde Hj são os polinômios de Hermite de ordem j. Se o feixe ganha uma diferença de fase múltipla de 2π ao dar a volta completa na cavidade, a diferença de fase será múltipla de π se ele realiza apenas meia volta, ou seja, θm,n(z2) – θm,n(z1) = qπ, onde q é um inteiro qualquer e θm,n(z) = kz(m+n+1) tg-1(z/z0). Como estamos apenas pegando o resultado da volta completa e dividindo por 2, os raios de curvatura não aparecem. Chamando l = z2-z1 obtemos: kql- (m+n+1) [tg-1(z2/z0) -tg-1(z1/z0)] = qπ (11.23) Logo, a separação entre dois modos adjacentes é dada por kq+1- kq = π/l, ou usando k = 2πνn0/c, onde n0 é o índice de refração, Δν = νq+1- νq = c/2n0l. Esta diferença de freqüências corresponde ao inverso do tempo de trânsito do feixe na cavidade e o modo q é chamado de longitudinal. Os modos transversais também são separados em freqüência e isto pode ser visto tomando-se dois conjuntos de valores para m e n de forma que: k1l - (m+n+1)1 [tg-1(z2/z0) -tg-1(z1/z0)] = qπ k2l - (m+n+1)2 [tg-1(z2/z0) -tg-1(z1/z0)] = qπ (11.24a) (11.24b) e por subtração: (k1-k2)l = [(m+n+1)1 - (m+n+1)2] [tg-1(z2/z0) -tg-1(z1/z0)] (11.25) Usando que (k1-k2) = (ω1- ω2)n0/c = 2πΔνn0/c temos: Δνt = S. C. Zilio c Δ(m+n) [tg-1(z /z ) -tg-1(z /z )] 2 0 1 0 2πn 0 l (11.26) Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 239 11.4 Perdas em cavidades ópticas Uma cavidade óptica é um dispositivo que permite o confinamento e aumento da radiação eletromagnética para que seja possível a emissão estimulada. Entretanto, existe uma série de fatores que impedem que a energia armazenada aumente indefinidamente. Os mecanismos de perda mais comum em cavidades óticas são basicamente três: 1. Reflexões imperfeitas. A transmissão finita dos espelhos é necessária para que se retire da cavidade a energia produzida pela ação laser. Além disso, nenhum espelho é ideal e mesmo quando eles são feitos para dar a maior refletividade possível, alguma absorção residual e espalhamento reduzem a refletividade para um valor pouco menor que 100%. 2. Absorção e espalhamento no meio ativo. As transições de algum dos níveis atômicos populados durante o processo de bombeamento para níveis excitados mais altos constituem um mecanismo de perda que ocorre no meio ativo. O espalhamento por impurezas e imperfeições é bastante grave em meios ativos do tipo estado sólido. 3. Perdas por difração. Para modos que se afastam consideravelmente do eixo óptico, a dimensão finita dos refletores faz com que alguma energia não seja interceptada por eles sendo, portanto, perdida. Para um dado conjunto de espelhos, esta perda será maior para os modos transversais de ordens mais altas porque neste caso a energia está mais concentrada fora do eixo óptico. Esse fato é utilizado para evitar a oscilação de modos de ordens altas. Introduzindo-se uma abertura dentro da cavidade óptica, cujo diâmetro é suficiente para permitir a passagem da maior parte do modo fundamental, aumenta as perdas dos modos de ordens mais altas. Historicamente, existem várias formas de se quantificar a perda da cavidade ótica. Uma das maneiras é através do tempo de vida, tc, do decaimento da energia de um modo da cavidade, definido através da equação: ε dε (11.27) =− dt tc S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 240 onde ε é a energia armazenada no modo. Uma outra maneira é através da perda por passagem, L, definida de acordo com: dε cL =− ε dt nl (11.28) onde l é o comprimento da cavidade e cL/nl é a fração de perda por unidade de tempo. Por comparação temos: nl (11.29) tc = cL No caso de uma cavidade com espelhos de refletividades R1 e R2, e um coeficiente de absorção médio α, a perda média por passagem é L = αl − ln R 1 R 2 , tal que: tc = nl c(αl − ln R 1 R 2 ) ≈ nl c[αl + (1 − R 1 R 2 )] (11.30) onde na última passagem usamos a hipótese que R1 e R2 são próximos de 1. O fator de qualidade, Q, de uma cavidade ressonante é definido como: Q= ωε ωε =− P dε / dt (11.31) onde ε é a energia armazenada e P = -dε/dt é a potência dissipada. Pela comparação das equações (11.27) e (11.31), obtemos Q = ωtc. O fator de qualidade é quem determina a largura da curva de resposta Lorentziana da cavidade como Δν1/2 = ν/Q = 1/2πtc, de forma que, de acordo com a eq. (11.30), Δν1/ 2 = c(αl − ln R 1R 2 ) 2πnl (11.32) Bibliografia 11.1. A. Yariv, Quantum Electronics, terceira edição John Wiley and Sons, NY (1989) S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Cavidades ópticas 241 Problemas 11.1. a) Faça o diagrama 0 ≤ (1-l/R1) (1-l/R2) ≤ 1, indicando as regiões de estabilidade; b) localize neste diagrama as cavidades mostradas abaixo e c) liste as que são estáveis. C2 C2 A B C1 C2 C2 C1 D C simétrico C1 C2 C1 E C2 F C1 C2 G C1 C2 H 11.2 Deseja-se construir um laser de centro F (λ ≅ 3.14 μm) tal que a divergência do feixe seja 2 mrad e o diâmetro no espelho de saída seja 2 mm. Suponha que este espelho não altere as características do feixe gaussiano (R e w) na transmissão. a) Especifique uma dada geometria, dando os valores de R1, R2 e l, para uma cavidade com dois espelhos que produza as características desejadas. b) Localize esta cavidade no diagrama de estabilidade. c) Determine os valores de z0, w0 e a posição do foco. 11.3. Deseja-se construir um laser de CO2 (λ = 10 μm) com R1 = ∞, R2 = 6 m e l = 1.5 m. a) Determine z0, w0 e w2 (no espelho R2). b) Para se retirar a radiação da cavidade é feito um pequeno furo (φ = 1 mm) no espelho plano. Supondo que o furo não perturba o modo Gaussiano fundamental, calcule a transmissão. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 242 Cavidades ópticas 11.4. O tamanho do spot nos espelhos de um laser de He-Ne é w = 0.5 mm, a cavidade é do tipo confocal e o comprimento de onda é 6328 Å. a) Qual é o comprimento da cavidade do laser? b} Qual o tamanho da mancha focal para a transição de 3.39 μm na mesma cavidade? c) Qual é a separação em freqüência entre os modos do laser? d) Se o tempo da cavidade é de 1 ns, qual será a largura de linha da emissão? S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 243 Ação laser 12 12.1 Condição de limiar Como vimos no Cap. 10, é possível amplificar a radiação eletromagnética quando ela se propaga através de um meio onde os níveis excitados possuem uma população maior do que a do nível fundamental. Esta inversão de população pode ser conseguida ao se fornecer energia para o meio ativo através de algum agente externo (bombeamento), de tal forma que ele passa a apresentar ganho. Entretanto, este é um processo que exibe o fenômeno de saturação, ou seja, ao ser amplificado o campo eletromagnético aumenta de intensidade e, consequentemente, devido à emissão estimulada, ele produz a despopulação do nível excitado, acarretando no decréscimo da inversão de população. Isto faz com que o sistema atinja o estado estacionário onde a amplificação sofrida pelo feixe é suficiente apenas para compensar as perdas que ele sofre, que vimos no final do capítulo anterior. Desta forma, ao dar uma volta completa na cavidade óptica, será necessário que o feixe além de se reproduzir geometricamente (estabilidade da cavidade), também se reproduza com relação à amplitude e fase. Matematicamente, isto equivale a dizer que após uma volta completa: E final = r1r2 e i 2 k 'l = r1r2 e i 2 n '( ν ) kl e[ γ ( ν )−α ]l = 1 E inicial (12.1) onde r1 e r2 são os coeficientes de reflexão dos espelhos, γ(ν) representa o ganho do meio ativo de comprimento l e α leva em conta todas as outras perdas da cavidade, incluindo a absorção e espalhamento do meio ativo. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 244 Analisando apenas a amplitude do campo elétrico, dada pela eq. (12.1), temos r1 r2 e[ γ ( ν ) −α ]l = 1 , ou alternativamente, 1 γ (ν ) = α − ln(r1 r2 ) l (12.2) que equivale a dizer que o ganho apenas compensa as perdas. Levando em conta a eq. (10.18) e supondo que a freqüência do campo eletromagnético está no centro da linha, obtemos a inversão de população que satisfaz esta equação como: 2 2 g 1 ⎞ 8π n ν τesp ⎛ ⎛ ⎞ ΔN t = ⎜ N 2 − 2 N1 ⎟ = 2 ⎜ α − ln(r1r2 ) ⎟ g1 l c g (ν 0 ) ⎝ ⎠ ⎠t ⎝ (12.3) = 8π n 2 ν 2 τesp Δν ⎛ 1 ⎞ ⎜ α − ln(r1r2 ) ⎟ 2 l c ⎠ ⎝ onde tomamos g(ν0) ≅ 1/Δν. Esta é a inversão de população de limiar (threshold). É importante salientar que ΔN estará sempre travado neste valor, de acordo com o seguinte argumento: se ele for menor, o ganho gerado pela emissão estimulada não será suficiente para compensar as perdas e o campo dentro da cavidade diminui até se extinguir. Por outro lado, se ele for maior, o campo eletromagnético tenderá a aumentar, e como conseqüência da emissão estimulada, ele reduzirá a população do estado excitado, acarretando no decréscimo da inversão de população. Em termos do tempo da cavidade, dado pela eq. (11.30), temos a inversão de população de limiar dada por: ΔN t = 8π n 3ν 2 τesp Δν t c c3 (12.4) 12.2 Freqüências de oscilação Assim como fizemos na seção 11.3, vamos considerar a fase de um feixe Gaussiano que dá meia volta na cavidade para calcular as freqüências de oscilação. Considerando apenas o modo TEM00 e supondo que as reflexões nos espelhos introduzem fases θm1 e θm2, podemos reescrever a eq. (11.23) como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 245 kql- [tg-1(z2/z0) -tg-1(z1/z0)] +( θm1+θm2)/2 = qπ (12.5) onde o fator ½ vem da consideração de meia volta, como já fizemos na seção 11.3. Entretanto, diferentemente daquela análise, a cavidade agora está preenchida com o meio ativo e neste caso o índice de refração, e consequentemente o vetor de propagação k, será alterado pela ressonância. Neste caso temos: ωq nl ⎛ χ′(ν) ⎞ -1 -1 ⎟ − [tg (z 2 /z 0 ) -tg (z1 /z 0 )] + ( θ m1 + θ m 2 )/2 = qπ ⎜1 + c ⎝ 2n 2 ⎠ (12.6) Se considerarmos uma cavidade vazia (χ´ = 0) obtemos: νq = ( θ + θm2 ) ⎤ qc c ⎡ -1 tg (z 2 /z 0 ) -tg -1(z1 /z 0 ) − m1 + ⎢ ⎥⎦ 2nl 2πnl ⎣ 2 (12.7) que quando substituído na eq. (12.6) resulta em: χ ′(ν ) ⎞ ν ⎛⎜1 + ⎟ = νq 2n 2 ⎠ ⎝ (12.8) de onde vemos que a freqüência é modificada pela presença da ressonância atômica. Esta é uma equação transcendental e para simplificar sua solução vamos utilizar as equações (10.4) para escrever: χ′(ν) = 2(ν 0 − ν ) 2 n 2 (ν 0 − ν ) χ′′(ν) = γ (ν ) Δν kΔν (12.9) onde na última passagem utilizamos γ(ν) = kχ”(ν)/n2. Substituindo na eq. (12.8) e considerando que o ganho se estabiliza no valor de limiar, teremos: ⎛ ( ν − ν ) γ t (ν ) ⎞ (12.10) ν ⎜1 + 0 ⎟ = νq kΔν ⎝ ⎠ e considerando que ν será muito próximo de νq, ν ≈ ν q − (ν q − ν 0 ) S. C. Zilio c ⎛ 1 ⎞ ⎜ α − ln(r1 r2 ) ⎟ 2πnΔν ⎝ l ⎠ (12.11) Óptica Moderna – Fundamentos e Aplicações Ação laser 246 onde a eq. (12.2) para γt(ν) foi utilizada. Alternativamente, podemos usar a definição de largura de linha da resposta da cavidade, eq. (11.32), e escrever: ν ≈ ν q − (ν q − ν 0 ) Δν 1 / 2 Δν (12.12) Se a freqüência atômica ν0 não coincidir com alguma freqüência de ressonância da cavidade passiva, a freqüência com que a ação laser ocorrerá será afastada de νq na direção deν0. A este efeito se dá o nome de puxamento de freqüência. Entretanto para Δν1/2 << Δν, o laser oscilará próximo de νq. 12.3 Potência de saída do laser Agora que já sabemos qual a mínima inversão de população para que ocorra a emissão laser podemos calcular a potência de saída que se obtém para um determinado bombeamento externo. Inicialmente devemos dizer que a transição atômica deve possuir mais do que dois níveis, uma vez que neste caso é inviável se obter a inversão de população em regime contínuo. Desta forma vamos considerar o modelo mais utilizado que consiste num sistema de quatro níveis, como mostra a Fig. 12.1a. Entretanto como a relaxação do nível 3 para o nível 2 é muito rápida, podemos considerar o modelo simplificado mostrado na Fig. 12.1b. 2 3 2 1 B2 B2 B1 1 B1 0 0 estado fundamental estado fundamental (a) (b) Fig. 12.1 – Sistemas de (a) 4 e (b) 3 níveis. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 247 A transição laser ocorre entre os níveis 2 e 1, sendo as taxas de bombeamento externo para eles dadas por B1 e B2. O tempo de vida do nível 2, t2, é determinado pela emissão espontânea, τesp, por transições não radiativas entre 2 e 1, e transições não radiativas para outros níveis que produzem sua de-população, enquanto que a população do nível 1 decai principalmente por transições não radiativas. A densidade de átomos nos níveis 1 e 2 são respectivamente N1 e N2, e sua degenerescência dada por g1 e g2. Considerando que as transições induzidas pelo campo eletromagnético no caso de alargamento homogêneo são dadas por: W21 ≡ Wi (ν) = W12 = λ2 g (ν) Iν 8πn 2 hντ esp g2 W (ν ) g1 i (12.13a) (12.13b) podemos escrever a equação de taxas que descreve as populações dos níveis 1 e 2 como: dN 2 N g = B2 − 2 − ⎛⎜ N 2 − 2 N1 ⎞⎟ Wi (ν) dt t2 ⎝ g1 ⎠ N g N dN1 = B1 − 1 + ⎛⎜ N 2 − 2 N1 ⎞⎟Wi (ν) + 2 t 21 g1 t1 ⎝ dt ⎠ (12.14a) (12.14b) No equilíbrio (regime estacionário) podemos tomar as populações como sendo constantes (dN/dt = 0), de forma que as equações (12.14) levam a: N 2 = t 2 (B2 − ΔNWi (ν)) g2 g t t N1 = 2 t1 ⎧⎨B1 + ΔNWi (ν) ⎡⎢1 − 2 ⎤⎥ + B2 2 ⎫⎬ g1 g1 ⎩ t 21 ⎭ ⎣ t 21 ⎦ (12.15a) (12.15b) onde ΔN = ⎛⎜ N 2 − g 2 N1 ⎞⎟ . Subtraindo as equações (12.15a) e (12.15b) g1 ⎠ ⎝ encontramos a diferença entre as populações dos níveis 1 e 2 como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 248 ΔN = B2 t 2 − (B1 + δB2 ) t1 (g 2 /g1 ) 1 + [t 2 + (1 − δ )t1g 2 / g1 ]Wi (ν) (12.16) onde δ = t2/t21. Na ausência de campo (Wi = 0) a inversão de população não saturada é dada por: (ΔN )0 = ⎛⎜ N 2 − ⎝ g g2 ⎞ N1 ⎟ = B2 t 2 − (B1 + δB2 ) t1 2 g1 g1 ⎠0 (12.17) que depende de parâmetros externos ao sistema atômico. A inversão de população pode ser escrita como: ΔN 0 (12.18) 1 + φt 21 Wi (ν) onde φ = δ [1 + (1 − δ )( t 1g 2 / t 2 g 1 )] depende apenas de parâmetros do sistema atômico. Na prática, os lasers conhecidos apresentam t1g2 << t2g1, de forma que φ ≈ δ = t2/t21. Com isso obtemos: ΔN = ΔN = ΔN 0 1 + t 2 Wi (ν) (12.19) De acordo com a eq. (10.18), o ganho é proporcional a ΔN e assim podemos escrever: γ 0 (ν ) (12.20) γ (ν ) = 1 + t 2 Wi (ν) onde o ganho não saturado de uma linha homogênea é: γ0 = ΔN 0λ2 g (ν ) 8π n 2 τesp (12.21) Como o ganho do meio ativo fica travado no ganho de limiar, podemos calcular a taxa de transições induzidas necessária para que isto ocorra. Das equações (12.2) e (12.20) temos γ0 1 γ = γ t = α − ln( r1 r2 ) = l 1 + t 2 Wi (ν ) (12.22) com a qual podemos calcular a taxa de transições induzidas como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 249 Wi (ν ) = 1 t2 γ 0l ⎞ ⎛ − 1⎟ ⎜ ⎝ αl − ln(r1 r2 ) ⎠ (12.23) Conhecendo a taxa de transições induzidas, podemos usar a mesma análise da seção 10.5 para encontrar a potência gerada dentro da cavidade óptica. Partindo da eq. (10.15) escrevemos: Pcav = ΔΝ Wi (ν) hν Vm , onde Vm é o volume do modo predominante na cavidade. Substituindo os valores de Wi(ν) e ΔN dados respectivamente pelas equações (12.23) e (12.3) encontramos: Pcav 8π n 2 hc(τesp / t 2 ) ⎛ Vm ⎞ γ 0l ⎛ ⎞ − 1⎟ = ⎟(αl − ln(r1r2 ))⎜ ⎜ 3 λ g (ν 0 ) ⎝ l ⎠ ⎝ αl − ln(r1r2 ) ⎠ (12.24) onde supusemos novamente que a freqüência do campo eletromagnético está no centro da linha homogênea. Definindo o fator de perda interna por passagem como Li = αl, o ganho não saturado por passagem como g0 = γ0l, a área média do modo como sendo A =Vm/l, e supondo que os espelhos tem refletividades próximas de 1, tal que -ln(r1r2) ≈ 1- R 1R 2 = 1 – R = T, chegamos ao resultado final: Pcav = 8π n 2 hc ⎞ ⎛ g0 − 1⎟ A(L i + T )⎜ 3 λ g(ν 0 )(t 2 /τ esp ) ⎝ (L i + T ) ⎠ (12.25) Esta é a potência que está sendo gerada dentro da cavidade. Entretanto, o que nos interessa é a potência útil que se pode tirar do laser. Levando em conta que parte da potência gerada é perdida devido à absorção por passagem e que a outra parte sai pelo espelho, temos que a potência útil é dada pela fração Pútil = Pcav [T/(T+Li)], obtemos a expressão: Pútil = 8π n 2 hc ⎞ ⎛ g0 − 1⎟ T A⎜ 3 λ g(ν 0 )(t 2 /τ esp ) ⎝ (L i + T ) ⎠ (12.26) Um fator que se pode variar na construção de um laser é a transmissão do espelho de saída, também conhecido como acoplador de saída (output coupler). Isto possibilita que modifique a quantidade de energia que é extraída do laser, como mostrado na Fig. 12.2. Pela existência de um máximo nesta figura podemos concluir que existe uma S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 250 transmissão ótima que permite a maior retirada de energia de dentro do laser. Para encontrar este valor tomamos a derivada de Pútil e igualamos a zero, o que nos leva a: (12.27) Tot = −L i + g 0 L i que substituída na eq. (12.26) resulta em: Pot = 8π n 2 hc A λ3 g(ν 0 )(t 2 /τ esp ) ( g 0 − Li ) 2 = 2I s A ( g 0 − Li ) 2 (12.28) onde Is é a intensidade de saturação da linha homogênea dada pela eq. (10.25). Potência útil (un. arbtrárias) 4 3 2 1 0 0 5 10 Transmissão (%) Fig. 12.2 – Potência útil em função da transmissão para diferentes ganhos não saturados. 12.4 Considerações finais Após o desenvolvimento da teoria de funcionamento do laser que realizamos até agora, podemos nos deter para analisar quais são os parâmetros importantes para a sua construção. Inicialmente devemos caracterizar o meio ativo com relação à sua curva de absorção e de S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 251 fluorescência. A medida das seções de choque de absorção e fluorescência, bem como dos tempos de decaimento, permitem estabelecer se o meio apresentará inversão de população de limiar. Em seguida, devemos escolher uma geometria adequada para a cavidade. Além da estabilidade, outros fatores devem ser levados em conta, tais como: a) Potência de saída - como vimos, a potência de saída é proporcional ao volume do modo. Assim, modos de maior volume produzem maior potência de saída desde que o meio seja suficientemente grande para conter tal modo. Para se ter o maior volume possível usa-se uma configuração que permite modos de ordens mais altas. b) Tamanho do meio – certos cristais usados como meio ativo só podem ser crescidos em tamanhos reduzidos. Neste caso, a cintura do feixe deve ser pequena para caber dentro do meio ativo. c) Ganho do meio – existem meios cujo ganho (γ0) é muito baixo. Para se atingir a condição de limiar deve-se aumentar o comprimento para que a condição de limiar g0 > Li +T seja satisfeita. d) Meios de alto limiar - a inversão de população é proporcional à taxa de bombeamento. Em meios com alto limiar deve-se focalizar o feixe de bombeamento para se obter uma inversão de população adequada. e) Divergência do feixe de saída – muitas vezes queremos ter um feixe com baixa divergência e isto definirá qual é a cintura do feixe que se pode ter. f) Estabilidade da cavidade - uma vez definida as características da cavidade com relação ao tipo de meio ativo e ao ângulo de divergência, seleciona-se os espelhos adequados e para isso vemos se satisfazem as condições de estabilidade. g) Potência ótima – finalmente, para se ter a maior potência de saída é necessário escolher o espelho com a transmissão adequada. Isto em geral é feito de uma forma experimental, construindo-se vários espelhos de refletividades diferentes e levantando uma curva como a da Fig. 12.2. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 252 Bibliografia 12.1. A. Yariv, Quantum Electronics, 3ª edição, John Wiley and Sons, NY (1989) Problemas 12.1. Considere um laser de Ar+ oscilando em 514.5 nm numa cavidade óptica que possui comprimento ℓ = 100 cm e é totalmente preenchida pelo meio ativo. A perda por passagem (L = αℓln R 1 R 2 ) é 10%. A seção de choque da emissão estimulada é σe = 2.5 10-13 cm2 (γ = ΔN σe) e o tempo de vida do estado excitado é t2 = 5 ns. Supondo que o tempo de vida do estado inferior da transição laser é muito curto (t1 << t2), calcule: (a) a inversão de limiar, ΔNt. (b) a taxa de bombeamento de limiar, B2. (c) a taxa de transições induzidas, Wi, quando a taxa de bombeamento é o dobro da de limiar. (d) o ganho não saturado por passagem (g0 = γ0ℓ). (e) Sabendo que Vm ≈ 20 cm3, encontre a potência na cavidade. 12.2. Considere um laser de rubi operando em 693.4 nm com largura de linha de 1 Å. O tempo da emissão espontânea é τesp = 3 ms e n = 1.5. A cavidade óptica possui comprimento ℓ = 50 cm e espelhos com refletividades R1 = 1 e R2 = 0.98. Desprezando a absorção (α = 0), calcule: (a) a inversão de limiar, ΔNt. (b) o puxamento de freqüência no caso em que νq – ν0 = 1 GHz. (c) supondo que t2 = τesp, γ0 = 5 m-1 e A = 5 cm2, calcule a potência útil. 12.3. Um laser de He-Ne opera em 632.8 nm com largura de linha de 1 GHz. A cavidade óptica possui comprimento ℓ = 30 cm e espelhos com refletividades de 0.99. Desprezando a absorção (α = 0), encontre o puxamento de freqüência no caso em que νq – ν0 = 100 MHz. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Ação laser 253 12.4. Um laser de Nd+3:YAG operando em 1064 nm, com largura de linha de 6 cm-1, é constituído por uma cavidade óptica de comprimento ℓ = 50 cm e um meio ativo com 10 cm de comprimento, possuindo um coeficiente de absorção de 0.4 cm-1. Os espelhos possuem refletividades R1 = 1 e R2 = 0.98. O tempo da emissão espontânea é τesp = 5.5 10-4 s e n = 1.5. Calcule: (a) o coeficiente de perda por passagem, (b) a inversão de limiar, ΔNt. γc ⎞ . ⎟ 2πΔν ⎠ 12.5. Mostre que o efeito do puxamento de freqüência é reduzir a separação dos modos da cavidade de c/2ℓ para c ⎛⎜1 − 2l ⎝ Calcule a redução para o caso Δν = 1 GHz, g = 4 cm-1 e ℓ = 1 m. 12.6. Num laser de He-Ne com potência de saída de 1 mW e Δν1/2 = 10 MHz (largura do modo da cavidade) ocorre o fenômeno de puxamento de freqüência. Calcule o valor da relação Δν/ν onde ν é a freqüência de oscilação e Δν a largura do espectro de saída. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 254 S. C. Zilio Ação laser Óptica Moderna – Fundamentos e Aplicações 255 Modos de operação de um laser x Regimes de operação de um laser 13 13.1 Introdução Vimos no Cap. 11 que uma cavidade óptica passiva, portanto sem o meio ativo, possui freqüências de ressonância dadas pela eq. (11.23) ou (12.7). Também vimos, no Cap. 10, que um meio ativo possui um coeficiente de ganho cuja distribuição espectral depende do tipo de alargamento, homogêneo ou não homogêneo. No primeiro caso, teremos uma linha com perfil Lorentziano, enquanto que no segundo, a linha possuirá um perfil Gaussiano. Finalmente, os dois conceitos foram unificados no Cap. 12, onde encontramos as freqüências de ressonância e a potência de saída de um oscilador laser. Agora, queremos entender um pouco melhor a distribuição espectral da luz emitida pelo laser e como ela influencia seu regime temporal. Para uma visualização do que acontece com a freqüência de saída do laser, vamos nos basear na Fig. 13.1, onde uma linha com alargamento não homogêneo é considerada. Em (a) são vistos os modos da cavidade passiva, que são separados por Δν = c/2L, no caso de considerarmos modos longitudinais de uma cavidade com dois espelhos planos. Em (b) temos o perfil espectral da curva de ganho (linha cheia) e também a curva de perda (linha pontilhada), que consideraremos independente da freqüência. A ação laser ocorre apenas nas freqüências de ressonância da cavidade, uma vez que só assim teremos radiação eletromagnética suficientemente intensa para produzir a emissão estimulada. Além disso, o ganho não saturado deve ser maior do que a perda, mas quando a emissão estimulada começa a ocorrer, o ganho satura e iguala a perda, como mostra a Fig. 13.1(c). Note que estamos considerando uma linha com alargamento não homogêneo. Como resultado, vemos que as freqüências S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 256 Modos de operação de um laser presentes no espectro de saída do laser são aquelas mostradas na Fig. 13.1(d), onde a amplitude de cada uma corresponde à diferença entre o ganho não saturado e a perda. Esta figura indica claramente a presença de um conjunto de freqüências igualmente espaçadas de Δν = c/2L no espectro de saída do laser. Se estivermos considerando também os modos transversais, teremos ainda várias outras freqüências presentes neste espectro, mas esta situação não será considerada nesta seção. (a) (b) (c) (d) Fig. 13.1 – (a) Modos de uma cavidade passiva, (b) curva de ganho não saturado (linha cheia) e curva de perda (linha tracejada), (c) curva de ganho saturado e (d) espectro de saída do laser. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 257 Modos de operação de um laser 13.2 Regimes multimodos e monomodo O regime de operação mais comum é o multimodos, que se vê na Fig. 13.1(d). Este regime ocorre principalmente para lasers operando no regime cw. Neste caso, o campo elétrico para uma das componentes de freqüência da radiação que sai do laser é dado por: E n ( t ) = E (ν n ) e i[ 2 πνn t +φ ( t )] (13.1) onde νn = ν0 + nΔν, com n inteiro, são as freqüências da cavidade. Devido ao fato de existirem várias componentes de freqüência, podemos usar o princípio da superposição para encontrar o campo elétrico total: E( t ) = ∑ E n (t ) = ei 2πν0t +∞ n =−∞ ∑ E (ν +∞ n =−∞ n ) ei[ 2 πnΔνt +φn ( t )] (13.2) Como as fases φn(t) são em geral independentes entre si, não teremos interferência entre diferentes componentes de freqüência quando calculamos a intensidade da luz que sai do laser. Desta forma, a intensidade será dada simplesmente por: I α E( t ) = 2 ∑ E (ν +∞ n =−∞ ) α 2 n ∑ I( ν +∞ n =−∞ n ) (13.3) Em outras palavras, a intensidade total será a soma das intensidades de cada modo do laser. Este resultado é válido para um grande número de lasers que operam no regime contínuo, como por exemplo, os lasers de He-Ne, argônio, criptônio e outros. Assim, o laser multimodos possui várias componentes espectrais, podendo ter baixa pureza espectral se o número de modos for grande. Isto pode não ser conveniente para várias aplicações onde se deseja uma freqüência bem definida. Para contornar este problema devemos eliminar todos os modos longitudinais, exceto um. Isto pode ser feito adicionando-se à cavidade óptica elementos que produzem perdas dependentes da freqüência. O elemento óptico específico a ser adicionado à cavidade depende da largura espectral da curva de ganho e do número de modos longitudinais existentes. Se o espectro da luz emitida contiver poucos modos, tipicamente um número menor que 100, basta apenas a adição de um étalon Fabry-Pérot espesso. Como os S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 258 Modos de operação de um laser intervalos espectrais livres da cavidade e do étalon são diferentes, podemos fazer que apenas um dos modos coincida, como mostra a Fig. 13.2. A transmitância total será o produto das transmitâncias da cavidade e do étalon. Os pequenos picos que aparecem não serão amplificados; apenas o maior será, pois sua perda por transmissão é nula. Por outro lado, se existirem muitos modos, torna-se necessária a introdução de outros elementos intracavidade, como por exemplo, um étalon fino e um filtro birrefringente de placas inclinadas. (a) (b) (c) Fig. 13.2 – (a) Modos de uma cavidade passiva, (b) curva de transmissão do étalon grosso e (c) curva de transmissão total. 13.3 Regime de modos travados Um regime muito importante para a operação de um laser é o regime de modos travados (mode-locking), também conhecido como regime de fases travadas. Este tipo de operação, que permite a obtenção de pulsos extremamente curtos, ocorre ao se inserir um elemento intracavidade que produz uma correlação entre as fases dos diversos modos longitudinais. Isto faz com que as fases presentes na eq. (13.1) sejam as mesmas para todos os modos, ou seja, φn(t) = φ0 = constante. Desta forma, a eq. (13.2) se transforma em: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 259 Modos de operação de um laser E( t ) = ∑ E n (t ) = ei[ 2πν0t+φ0 ] ∑ E(ν n ) ei 2πnΔνt +∞ +∞ n =−∞ n =−∞ (13.4) com Δν = c/2L, como antes. Uma propriedade importante desta expressão está ligada à teoria da informação: como temos modos discretos, a função E(t) se repete no tempo com um período dado por T = 1/Δν, como facilmente demonstrado por: E( t + T) = ei[ 2 πν0t +φ0 ] ∑ E(ν n ) ei[ 2 πnΔνt +2 πn ] = E( t ) +∞ n =−∞ (13.5) Se os modos possuírem um espaçamento bem menor do que a largura de banda do ganho, podemos aproximar a somatória por uma integral e neste caso o campo elétrico se torna uma transformada de Fourier das componentes espectrais: E ( t ) = e iφ0 ∫ +∞ −∞ E (ν )e i 2 πνt dν = e iφ0 ℑ{E (ν )} (13.6) No caso em que o meio ativo possui alargamento não homogêneo, o que ocorre na maioria dos lasers, E(ν) será uma função Gaussiana e consequentemente E(t) também será Gaussiana. Neste caso, a intensidade será dada por: ⎫⎪ ⎧⎪ ⎛ 2t ⎞ 2 2 (13.7) I( t ) α E( t ) α exp⎨− ⎜⎜ ⎟⎟ ln 2⎬ ⎪⎭ ⎪⎩ ⎝ τ p ⎠ onde o tempo de duração do pulso, τp, depende da largura não homogênea ΔνNH, de acordo com: τ p = 4ln 2 / πΔν NH . Este é o caso conhecido como transformado por Fourier (Fourier transformed). Se houver varredura em freqüência (chirp), esta expressão não será mais válida. Usando a eq. (13.7) e lembrando que o campo elétrico se repete no tempo devido ao fato de termos modos longitudinais discretos, concluimos que a luz sai do laser numa seqüência de pulsos de largura τp e taxa de repetição Δν = c/2L, que é o inverso do tempo de trânsito da luz pela cavidade. Em outras palavras, a interferência entre as diversas componentes espectrais produz a seqüência de pulsos mostrada na Fig. 13.3. No caso do laser operar no S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Modos de operação de um laser 260 regime multimodos sem travamento de fases, este termo de interferência será nulo pelo fato das fases serem aleatórias. τp T Fig. 13.3 – Seqüência de pulsos produzida pelo laser mode-locked. Para um laser cuja cavidade possui um comprimento L = 1.5 m, a taxa de repetição é da ordem de 100 MHz. Por outro lado, o tempo de duração do pulso depende da largura espectral da linha não homogênea do meio ativo. Na Tabela 13.1 vemos as largura de linhas não homogêneas e as durações dos pulsos obtidos em alguns sistemas lasers. Tabela. 13.1 – Pulsos curtos observados em sistemas laser mode-locked. Laser He-Ne @ 632.8 nm Nd:YAG @ 1.064 μm Rodamina 6G @ 600 nm Ti: Al2O3 @ 800 nm ΔνNH (Hz) 1.5 x 109 1.2 x 1010 5 x 1012 5 x 1013 (ΔνNH)-1 (s) 6.7 x 10-10 8.3 x 10-11 2 x 10-13 2 x 10-14 Observado (s) 6 x 10-10 7.6 x 10-11 4 x 10-13 1.5 x 10-14 13.4 Obtenção do regime de modos travados Existem diversas maneiras de se correlacionar as fases dos modos longitudinais do laser de forma a se obter o regime de modos travados. No mode-locking ativo, a aplicação de uma voltagem externa de freqüência Ω sobre um modulador acusto-óptico ou eletro-óptico produz uma modulação temporal das perdas da cavidade, como mostrado esquematicamente na Fig. 13.4. Isto faz com que o campo elétrico circulante também fique modulado, de acordo com: meio ativo modulador Fig. 13.4 – Vista esquemática de um laser com mode-locking ativo. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 261 Modos de operação de um laser E n ( t ) = E n cos ( 2πν n t + φ n ) [1 − α (1 − cos [Ωt + φ])] (13.7) O segundo termo entre colchetes representa as perdas na transmissão. Usando ωn = 2πνn, podemos desenvolver esta expressão como: E n ( t ) = E n (1 − α ) cos (ωn t + φ n ) + E n α cos [(ωn − Ω )t + φ n − φ] 2 α − E n cos [(ωn + Ω )t + φ n + φ] 2 (13.8) O primeiro termo mostra que o campo de freqüência angular ωn tem sua amplitude reduzida pelo fator α (α << 1), enquanto que os outros dois termos indicam o surgimento de novos modos com freqüências angulares ωn - Ω e ωn + Ω. Esta situação pode ser vista na Fig. 13.5. Escolhendo a freqüência de modulação tal que Ω = 2πΔν = πc/L, os picos laterais coincidem com os modos da cavidade, de forma que cada modo sentirá a influência de modos adjacentes, levando a uma competição que produz a correlação de fases entre eles. E0 E-1 Ω 2πΔ E1 Fig. 13.5 – Modos da cavidade (linhas cheias) e picos laterais gerados (linhas tracejadas). O mode-locking passivo pode ser de dois tipos. O primeiro baseiase na modulação da transmissão pelo controle da perda, através de um absorvedor saturável. Uma visão esquemática da cavidade do laser está mostrada na Fig. 13.6(a). Além do meio ativo, existe um absorvedor saturável cuja curva de transmissão é vista na Fig. 13.6(b). Em geral, este absorvedor produz uma perda muito grande e o campo elétrico não adquire a amplitude necessária para promover a emissão estimulada. Porém, estatisticamente, é possível que flutuações do campo elétrico gerem uma amplitude suficientemente alta para ser transmitida pelo S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Modos de operação de um laser 262 absorvedor saturável. Este campo transmitido será amplificado pelo meio ativo e ganhará a amplitude necessária para continuar passando pelo absorvedor saturável. No estado estacionário, teremos apenas um pulso circulando pela cavidade óptica. Toda vez que ele passa pelo absorvedor saturável, sua parte inicial é bloqueada e sua subida se torna cada vez mais rápida, deformando o pulso, da forma indicada pela linha tracejada da Fig. 13.6(c). O meio ativo possui, em geral, uma saturação do ganho, da forma mostrada Fig. 13.6(d), e assim, quando o pulso passa por ele, a parte final será bem menos amplificada que a subida inicial. Como conseqüência, após várias passagens pela cavidade, o pulso terá uma duração temporal bastante reduzida, como também é visto na Fig. 13.6(c). Transmissão 1 meio ativo AS (b) (a) T0 0 Is I Ganho G0 (c) (d) 1 Tempo IS I Fig. 13.6 – (a) Vista esquemática de um laser com mode-locking passivo por absorvedor saturável (AS), (b) curva de transmissão do absorvedor saturável, (c) absorção da parte inicial do pulso e seu formato final após várias voltas pela cavidade, e (d) saturação do ganho do meio ativo. É possível mostrar, resolvendo-se a equação diferencial não linear que descreve este sistema óptico, que o pulso produzido é um sóliton, que possui uma dependência temporal do tipo sech. Este tipo de mode-locking S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 263 Modos de operação de um laser é em geral utilizado em lasers de corante, onde o meio ativo é a rodamina 6G e o absorvedor saturável é o DODCI. O segundo tipo de mode-locking passivo utiliza o efeito Kerr óptico (KLM – Kerr lens mode-locking) e é aplicado principalmente quando o meio ativo é o cristal de Ti:Al2O3. No efeito Kerr óptico, o índice de refração do meio ativo depende da irradiância, de acordo com n(t) = n0+n2I(t). Como o perfil transversal do feixe é Gaussiano, haverá a formação de uma lente induzida pela presença da luz, que altera a álgebra da cavidade, levando-a de uma configuração instável para uma outra estável. Como no mode-locking passivo descrito previamente, flutuações estatísticas produzem um pulso que é amplificado pelo meio ativo. Este pulso encontrará a cavidade estável e será amplificado continuamente a cada volta. Devido ao fato do meio ativo ter um dado tempo de recuperação e ser depletado após a passagem do pulso, apenas ele será amplificado, levando a uma situação estacionária. Outros prováveis pulsos que poderiam ser gerados não serão amplificados e como conseqüência, não induzirão uma lente suficientemente forte para tornar a cavidade estável para sua propagação, e serão atenuados. 13.5 Q-switching O primeiro laser demonstrado, o de Rubi, opera no regime de Qswitching e gera pulsos de uma forma completamente diferente que no regime de mode-locking. Posteriormente, outros tipos de lasers também foram desenvolvidos para operar no regime de Q-switching, pois este permite a geração de pulsos gigantes de altíssimas intensidades. O termo Q-switching refere-se ao chaveamento do fator de qualidade da cavidade óptica, denominado de Q. Uma visão esquemática de um laser operando no regime Q-switched está mostrada na Fig. 13.7. ℓ meio ativo L MEO P Fig. 13.7 – Vista esquemática de um laser operando no regime Q-switching. MEO significa modulador eletro-óptico e P, polarizador. L e ℓ são respectivamente os comprimentos do meio e da cavidade. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 264 Modos de operação de um laser No interior da cavidade existe uma célula de Pockels composta por um modulador eletro-óptico e um polarizador (ou lâminas em ângulo de Brewster). Esta célula funciona como uma chave óptica que permite, ou não, que a cavidade transmita. No estado normal, o cristal eletroóptico, em geral KDP, funciona como uma lâmina de quarto de onda. Como a luz passa duas vezes pelo cristal (ida e volta) seu efeito será o de uma lâmina de meia onda que rodará a polarização do campo elétrico de 900, fazendo com que ele seja bloqueado pelo polarizador. Ao se aplicar uma tensão no cristal, ele operará como uma lâmina de meia onda, fazendo com que o campo elétrico tenha sua polarização rodada de 1800 após a dupla passagem pelo cristal e assim ele não será bloqueado pelo polarizador. Como dissemos, no estado normal, a cavidade não transmite e sua perda é muito grande. Nesta situação, bombeia-se o meio ativo geralmente através de uma lâmpada flash ou um laser de diodo. A população vai se acumulando no estado metastável e a emissão espontânea começa a ocorrer. Porém, como a cavidade está obstruída, não existe emissão estimulada. Isso permite uma inversão de população muito grande, que não ocorreria se houvesse emissão estimulada. Após um tempo ótimo, escolhido experimentalmente, aplica-se uma tensão elétrica no modulador eletro-óptico, permitindo-se a assim a passagem de luz pela célula de Pockels. A emissão estimulada começa a ocorrer numa situação onde a inversão de população e, portanto o ganho, γ, é muito grande. Isto faz com que o sistema produza pulsos gigantes, cuja intensidade dentro do meio ativo evolui no tempo de acordo com: dI dI dz c = = γI dt dz dt n0 (13.9) onde a lei de Beer foi empregada, sendo n0 o índice de refração do meio ativo. Logo, no início de processo de amplificação, a intensidade aumenta exponencialmente no tempo com uma taxa γc/n0. Como o meio ativo e a cavidade possuem comprimentos L e ℓ, respectivamente, apenas uma fração L/ℓ dos fótons está dentro do meio ativo num dado instante de tempo e é amplificada. O número de fótons, Φ, é proporcional à intensidade, e assim podemos escrever uma equação de taxas da forma: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 265 Modos de operação de um laser dΦ ⎛ γcL 1 ⎞ = Φ⎜ − ⎟ dt ⎝ n 0l t c ⎠ (13.10) onde o primeiro termo entre parênteses leva em conta a fração de fótons que está sendo amplificada e o segundo representa as perdas da cavidade óptica devido à absorção do meio e à refletividade dos espelhos. O tempo tc já foi introduzido na seção 11.4 e é dado pela eq. (11.30). Definindo um tempo normalizado τ = t/tc, podemos re-escrever a eq. (13.10) como: dΦ γ ⎛ ⎛γ ⎞ ⎞ = Φ⎜ − 1⎟ = Φ⎜ − 1⎟ dτ ⎝ (n 0l / cLtc ) ⎠ ⎝ γt ⎠ (13.11) O termo γt = n0ℓ/cLtc é o mínimo valor de ganho (threshold) que permite a existência de amplificação. Lembrando que o ganho é proporcional à diferença de população, ΔN, podemos introduzir o parâmetro n = ΔNV e seu valor de limiar, nt, o que nos leva à equação: dΦ ⎛n ⎞ = Φ⎜ − 1⎟ dτ ⎝ nt ⎠ (13.12) onde o termo Φ(n/nt) dá o número de fótons gerados pela emissão estimulada por unidade de tempo normalizado. Como cada fóton gerado tem como origem uma única transição atômica, ele corresponde a um decréscimo de Δn = -2 na inversão total. Usando este argumento, podemos escrever: dn n = −2Φ dτ nt (13.13) que juntamente com a eq. (13.12) formam um par de equações diferenciais acopladas, que podem ser resolvidas numericamente. Não vamos aqui encontrar a evolução temporal de Φ e n, mas sim analisar como o número de fótons emitidos varia com a diferença de população total. Para isto escrevemos: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Modos de operação de um laser 266 1 n dΦ dΦ dτ ⎛n ⎞ n = = −Φ⎜ − 1⎟ t = ⎛⎜ t − 1⎞⎟ dn dτ dn ⎠ ⎝ n t ⎠ 2Φn 2 ⎝ n (13.14) passando dn para o lado direito, temos: 1 dn dΦ = ⎛⎜ n t − dn ⎞⎟ 2⎝ n ⎠ (13.15) que pode ser integrada facilmente resultando em: 1 Φ = [n t ln (n / n i ) − (n − n i )] 2 (13.16) onde o número inicial de fótons na cavidade foi desprezado. Para encontrarmos a população remanescente após a emissão do pulso Qswitched, tomamos o limite em que t » tc para qual o número de fótons restantes na cavidade é nulo. Fazendo Φ = 0 na eq. (13.16) temos: nf ⎧ n − ni ⎫ = exp⎨ f ⎬ ni ⎩ nt ⎭ (13.17) Esta é uma equação do tipo (x/a) = exp{x-a}, onde x = nf/nt e a = ni/nt. Ela pode ser resolvida graficamente, ou numericamente, para ni/nt em função de nf/ni, uma vez que da eq. (13.17) é possível ver que: n i ln (n f / n i ) = n t nf / ni −1 (13.18) O resultado está mostrado na Fig. 13.8, porém com os eixos x e y invertidos para melhor visualização. A primeira conclusão que tiramos deste gráfico é que quanto maior a inversão de população inicial, menor será o número de átomos remanescentes no estado excitado após a emissão do pulso. Por outro lado, a fração de energia originalmente armazenada na inversão de população que é convertida em oscilação laser é (ni – nf)/ni, que tende a 1 conforme a inversão de população inicial aumenta. A potência de saída instantânea do laser é dada por P = Φhν/tc, que pelo uso da eq. (13.16) pode ser expressa da forma: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 267 Modos de operação de um laser P= hν [n t ln (n / n i ) − (n − n i )] 2t c (13.19) É de interesse se calcular a potência de pico do pulso de saída. Fazendo ∂P/∂n = 0, encontramos que a potência máxima ocorre quando n = nt. Fazendo esta substituição na eq. (13.19) temos: Pmax = hν [n t ln (n t / n i ) − (n t − n i )] 2t c (13.20) Se a inversão inicial é bem acima do valor de limiar obtemos finalmente que: n i hν 2t c (13.21) 0,0 0,8 0,2 0,6 0,4 0,4 0,6 0,2 0,8 nf/ni 1,0 0,0 1,0 1,5 2,0 2,5 3,0 3,5 4,0 (ni-nf)/ni Pmax = 1,0 4,5 ni/nt Fig. 13.8 – Inversão remanescente (eixo à esquerda) e fator de utilização de energia (direita) após a emissão do pulso gigante. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações 268 Modos de operação de um laser Bibliografia 13.1. A. Yariv, Quantum Electronics, 3ª edição, John Wiley and Sons, NY (1989) Problemas 13.1. Considere um laser oscilando com 2n modos longitudinais de mesma amplitude E0, separados de Δν = c/2ℓ. Calcule razão entre a potência de pico no regime de modos travados e a potência média quando as fases dos modos são aleatórias (multimodos contínuo). 13.2. A largura de banda de um laser He-Ne de modos travados é 1 GHz, o espaçamento entre os modos é 150 MHz e a curva espectral pode ser descrita por uma função Gaussiana. Calcule a duração dos pulsos de saída e a taxa de repetição. 13.3. Qual a potência máxima de saída e a energia do pulso quando o laser de rubi do problema 12.2 opera no regime Q-switched com ni = 1.64 ΔNt? S. C. Zilio Óptica Moderna – Fundamentos e Aplicações ! " "# $ # ) * %&' &( + " && * , $ & - & -& #* #, # &- & -- - %&' ( - . ) /) ) + + 0 # ! * 1 * ) * " * && #* #, , -- # %&' -( 2$ ) + " & 3 3$ %&' '( 1 ) 4 5 / * 6 3 + + ) " 0 %&' 7( 0 $ * 1 5 & 9 ) & # 8 " # 0 $ #0 0 8 %&' ( ) + 8 9 $ " # "# %&' 2( * ) " 0 / * " #* , $ %&' 2( %&' ( %&' :( 0 %&' ( 9 9 # #0 0 0 " #, # %&' ( 2& $ ; 8* 8, * , 8 %&' &$( +/ ) 8< = 9 ) $ %&' &$( " * , * & %&' &&( , # > / &' & + * * ? # / 8 ) 9 1 . 1 / + * , , , * = * ! # / + 5 + * " ) * A , * @ * , ! 2 5 1 * ! ) 1 * . + ) ) / * D *, + ) C * B * ) + * " ) B ) * *, , ) * ) *D ,D B % ( * % ) ( + 6 + * ) # * * * * ) * 4 * 8 + E F * * * F * ) ! > ) + ? ? * 1 # * / # * ) &' ) E = ! ) ) * ? 6 @ $ + ) ) $ " + 2- G 6 G 6 , , G 6 E * G * 6 E H * H * ) I" # ! $ # #$ K K$ ) % $ J %&' & ( J " #$ # * ˆ # , 0̂ # Ĵ K$ K * ˆ K , 0̂ K Ĵ %&' &-( " ˆ J / + J $ˆ + ) 8 %&' &'( ? M *N ? " # H %&' &7 ( 2' 8 K 9 * %&' &7 ( ? %&' & ( %&' &7( " J # K J K A %&' & ( "# K ) J %&' & ( " J J # "# + %&' &'( $ %&' &2( %&' 7( 0 " ˆ ˆ # 9 ) "# H 6 " ˆ ˆ # ˆ # ˆ %&' &:( + + * H $ %&' &:( 6 ˆ ˆ # 6 H ˆ # ˆ # ˆ # ˆ # " " %&' & ( "# $ " 0 #0 # 0 0 ) %&' :( ) #0 $ %&' $( 0 * " 0 0 0 #0 $ %&' &( 0 # G ( $ > # %&' & =) ) ) 0 27 ˆ . 1 + 5 5 ? + ) 0 " ** & * * , , * ,, , * 8 + * & $ , %&' & , 0 G ) ) + 5 ) ( / ) / + G * + %&' :( 9 ) " ' H 6 * * , , $ %&' -( " H & * & , 6 O ) , %&' ' ( & * * %&' -( * , %&' ' ( %&' ' ( , ) /) + = %&' &( 9 %&' &'( + * ) %&' & ( ) %&' &2( " J, J ,J * J J* J J*J, , J* J J, J J*J #* J ,J J* #, # J, $ %&' 7( 2 1 ) " J, J * J*J, J ,J * J J* J *J J* J J, J , J ,J J* $ J, %&' ( +/ &P 1 +/ ? * * * * ? %&' ( * ? # +/ ) + ! J*J, " ? ) +/ ) + J A$ %&' J, J, * 0 ( , + J* /) + J *J , $ %&' 2( + > ) " J* J, %&' :( + 5 > ) /) ) J* # * ) +/ E & ) < %&' 2( " 22 J, J* , J, J* * & %&' ( * , # * %&' %&' :( %&' ( ( ! > &' - + J, < * , J* < < = $ + ' !$ '! , + ' . %&' O (+ + , 0 / & () *! + % + / $ , 0 J, A $ + " J* , Q %&' :( %&' , J J * J* J *J $ %&' -$( ? ( " J* J , %&' -&( 2: J* J & %&' - ( * ? + 5 + J *J , %&' -&( * 1 ! > &' ' %&' - ( . J , < * < J* < = $ !$ '! & ( )- 1 ! ) 2 J* A $ %&' * (+ J, + J " J , > J, J ,J $ %&' --( " J, J %&' -'( * J, J , & %&' -7( 2 ? + 5 < %&' -7( ! %&' -'( %&' -7( * * > &' 7 + J, < * < J , =3 + % ,' = $ ) & / %&' &'( %&' ) J, J %&' -'( , ? ? ) > ( & () J J* / !$ + * 9 < ) /) &' + /) / F +/ + ) ? :$ J*J, = J*J $ !$ '! + + ! &' & Q &' ' &' & ! + 4 $ , % O U S ! NR J & : ) V) , + % @ 1 S @ 1 S % ' + ' $ 1 % + R ) R 1 * ! N R J & :' &' - # # S 1 J,J ; 1 ,TG ,TG Q & %& ( ! " # ! $ % & ' $ $ & ( $ "! "! ( ") * "! # & "! "! + "! # ( , * & $ + # $ . $ # ! / $ + " # * , - "! + # $ ! # ( . 0 ) " $ 12 3 $ % & ' ( ' # ! . # % ) * $ ! # * $ 0 ) & # 4 $ + $ ! 5 + * , -4 $ ' , , ! , $ , $ - 6 # ! # 2 % ) ! + 7 ") 6 0 / $ 7 8 89 . / 1 2 # "! & 2 2 2 <; $ $ ;: % 6 ; : 2 ! & <; <; ; : ;: < - : "! <; $ & $ & + ! $ ") # "! $=7 $ 89 8 > $ < - : 1 ! ? 6 @ 8 < < $ 6 2 < 2 , ; : <; : < - : "! 6 ; . 8 $ A 4 < - 4: ) 7 6 / : < ; :) , ! , ! # $ < # "! # "! "! 7 , ' "! > $ -? # , < - : < ; 8 "! : ( $ < - 4: "! $ $ & "! ! 7 " ") "! ; ; & $ < - 4: ; "! 6 < - ?: ; ( $ < - ?: + $=7 6 "! < : 2 "! 8 ; - ( 0 ! / 1 / ' < - -: 2 ' ( 6 ; < - B: , ; C $ C $ 8 D; $ + ") $ # $ # $ 0 & 8 C E $ $ $ & 2 B ! # $ 2 F . ' & $ <? $ > : "! $ 6 < - G: ; "! & E; ! $ E $ < - -: $ 6 < - : < - H: 2 # I $ "! $ "! "! $ < - : "! # $ . + $ ! 7 & 2 # 7 $ < - -: > 0 & & 0 "! D : $ + L8 K& $ $ # :8 0 $ . J < <L D + $ D ( "! $ ! G I $ $ 8 $ + L8 $ D 8 $ & $ $ $ <L ! 8 : # > : $ # $ $ < D + & A > "! <L : * $ # $ "! ! #& . & $ $ & "! ! D ( & , $ < - H: $ $ "! D M # $ # # & "! ! 7 # # . 0 N ( + & $ < - -: "! 6 " M & ! 8 #! "! 6 " D $=7 $ < - "! : D $ 03+ $=7 < - & # 8 # $=7 1 "! M < : * & # < - 9: : ( ! ! ! A 1 4 > J N & $ < - H: 6 M M $ < - : 6 M $ 5 +& $ $ 4 J < - 4: $ < - 4: $ 0 + $ $ N ! & $ A $ " ! 2 $ ! & N & # . 1 8 $ DM ( , D; -- $ " ( "! $ "! 89 & 2 ! $ 8 * # & & $ ") $ & "! "! # "! $ $ +& H % 5 ' " ' ( ' ' 647' / % # < : % ! ( # "! & $ & "! "! ! ! #& # ( 2 ! & # "! % "! * #& "! "! , 2 -B 7 J "! ! "! 2 $ " "! 7 $ "! < : < : $ J & J - H9 & & 8 .J < D : 0 * / & N !/ ! ! ) 8 # # & # "! ! "! L ! ! 7 $ "! 7 ! & * $ # ") 1 , -G . < 0 : $ & "! + J < : "! 5 7 "! A & I + $ // + & 1 5 $ J 7 5 & 38 J O P $ J , <55: -G H 5 +& & 9 5 ! 5/ $ 9 $ ! 5 * ' "! $ " A 2 & $ 6 $ ! # 8 "! ' ' 12 ; ; ; , " $ < - -: ; ' ' 1L ;9 2 & 6 1L < - ?: ! 0 12 ; < - B: ") 6 ' ; ; < - G: H ' $ ' ; ; $ < - : 6 ' $ ; $ < - H: $= 12 1L > $ ") <$ < P < 8 89 4 - : 12 $ $ < - ?: : <$ <1L: : ? : < - $ $ ") "! 12 1L 2 ! 6 <12: < - 9: $ <$ <$ 1L <$ : ") < - $ <$ : : : < - 4: $ : 8 <$ : $ :8 <$ : N + $ $ 2 ( $ ") $ Q < - : < - 4: ! $ ! #& * 7 : $ "! $ N 0 $ < - 0 # 7 ! "! & 0 0 ! J H4 (1 / $ ") ") 12 1L A 90 2 :9 : *(Q <$ : 12 <$ : 1L RL*(Q <$ : $ "! & $ ! $ 6 ( ! $ 2 $ < : <$ : : * - :; $ $ < - ?: $ < <$ : & ") < < $ # $ "! "! ") & <$ : $ ( $ :; $ $ < - 4: $ "! & $ 0 , 89 ") "! + 8 #& ! "! < ! * : $ $ ! 0 : ( # "! $ < 0 H? ! ! ! ! 0 0 / / 8 89 . - , N 2 Q ! 2 ' ; 6<= 2 ! M . I! * ' ; 6>= ) 99 Óptica não linear 295 Óptica não Linear 16 16.1 Introdução A óptica não linear trata do estudo da interação da luz com a matéria no regime em que suas propriedades ópticas são modificadas pela presença da luz. Muito embora as propriedades não lineares da constante dielétrica e da susceptibilidade magnética fossem conhecidas há muito tempo, os processos ópticos não lineares só começaram a ser observados experimentalmente no início da década de 60. Isto decorreu do fato de que tais processos necessitam de altas intensidades de campo eletromagnético para se manifestarem, o que só é possível com o uso de fontes de radiação laser. Temos, portanto, quase cinco décadas do surgimento da óptica não linear. Desde então, ocorreram enormes avanços, não só no entendimento dos aspectos fundamentais que regem a interação da radiação com a matéria, como também no desenvolvimento de uma grande variedade de aplicações tecnológicas. Para frisar este último ponto, citamos o nascimento da indústria opto-eletrônica, e também a corrida para se alcançar o desenvolvimento de dispositivos inteiramente fotônicos, ou seja, aqueles que funcionam apenas através da luz e de sua interação com matéria, dispensando assim a atual tecnologia eletrônica, que é mais lenta e consome mais energia. Usando a óptica não linear, podemos pensar que no futuro próximo teremos chaves rápidas puramente óticas, o que em muito beneficiará o campo das comunicações ópticas, e também memórias e computadores ópticos. Atualmente tem-se conhecimento de um vasto número de processos ópticos não lineares, como por exemplo, a geração de novas freqüências através de processos de geração de harmônicos, soma e S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica não linear 296 diferença de freqüências, assim como auto-modulação de fase, mistura de ondas, conjugação de fase, e outros. 16.2 Modelo do oscilador não harmônico Vimos no Cap. 9 que é possível calcular as propriedades de refração e a absorção de um meio utilizando o modelo do oscilador harmônico amortecido, que basicamente descreve o movimento de um elétron ligado ao núcleo atômico. Com aquele modelo pudemos calcular o deslocamento do elétron face à aplicação de um campo eletromagnético, que depois foi utilizado para o cálculo da polarização induzida no meio e posteriormente da susceptibilidade, que é a responsável pelas propriedades lineares de refração e absorção. O resultado obtido com o modelo do oscilador harmônico amortecido mostra que a susceptibilidade não ~ E, a depende da intensidade da luz. Matematicamente, como P = ε0 χ polarização varia linearmente com o campo aplicado. Porém, devemos ter em mente que fenômenos ópticos não lineares só ocorrem quando a resposta do meio material depender da intensidade do campo elétrico aplicado, ou seja, quando P = ε0 ~χ (E) E. Assim, é necessário estender este modelo com a inclusão de termos não harmônicos para deduzir a expressão clássica para a suscetibilidade não linear. Para isso adicionamos um termo quadrático à força restauradora da mola, de forma que a eq. (9.2) se torna: m d2x dx + mb + Kx + max 2 = −eE 2 dt dt (16.1) onde a é o termo que caracteriza a não linearidade de segunda ordem da resposta eletrônica, sendo muito menor que K. Para considerarmos o caso mais geral, vamos supor que o átomo está sujeito a duas ondas de freqüências diferentes, da forma: E(t) = E1 exp (− iω1 t ) + E 2 exp (− iω 2 t ) (16.2) A eq. (16.1) é difícil de ser resolvida pelo fato de ser uma equação diferencial não linear. Para facilitar sua solução, vamos supor que o termo não harmônico é suficientemente pequeno para que seja tratado como uma S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica não linear 297 perturbação. Desta forma, as soluções para a equação de movimento podem ser escritas como uma soma de soluções particulares, sucessivamente aproximadas: x = x (1) + x ( 2) + x (3) .... (16.3) onde x(1) é a já conhecida solução linear (a=0), x(2) é a solução correspondente ao efeito não linear de segunda ordem e assim por diante. A solução de primeira ordem é obtida desprezando-se o termo não harmônico: x (1) = x (1) (ω1 ) + x (1) (ω 2 ) (16.4) Substituindo a eq. (16.4) na eq. (16.1) com a = 0 obtemos: x (1) (ωi ) = Ne/m Ei ω − ω i2 − iω i b 2 0 (16.5) com i = 1 ou 2. Para as soluções de segunda ordem aproxima-se ax2 por 2 a (x (1) ) na equação de movimento. Este termo passa então a ser um termo forçante, que devido ao fato de estar elevado ao quadrado, apresenta contribuições com diferentes freqüências, da forma: x ( 2) = x ( 2) (ω1 + ω2 ) + x ( 2) (ω1 − ω2 ) + x ( 2) (2ω1 ) + x ( 2) (2ω2 ) + x ( 2) (0) (16.6) onde o termo em ω1 + ω2 é o responsável pela geração da soma de freqüências, ω1 - ω2 pela diferença de freqüências, 2ω1 e 2ω2 pela geração de harmônicos e 0 pela retificação óptica. Pela substituição na equação diferencial podemos encontrar cada um destes termos como: x ( 2 ) (ω1 ± ω2 ) = × x ( 2) (2ωi ) = S. C. Zilio [ω (ω − 2a (e/m ) 2 EE (ω − ω − iω1b )(ω02 − ω 22 m iω 21b ) 1 2 2 0 2 1 − (ω1 ± ω2 ) − i(ω1 ± ω2 )b 1 2 0 2 0 2 − a (e/m) 2 ] exp{− i(ω1 ± ω2 )t} − ω − iω i b ) (ω − 4ω − 2iω i b ) 2 i 2 2 0 2 i E i2 exp{− 2iω i t} (16.7) (16.8) Óptica Moderna – Fundamentos e Aplicações Óptica não linear 298 x ( 2) (0) = −2a (e/m) 2 ⎤ 1 ⎡ 1 1 + ω 02 ⎢⎣ (ω 02 − ω12 − iω1 b ) (ω 02 − ω 22 − iω 2 b )⎥⎦ (16.9) Através de sucessivas interações é possível obtermos não linearidades de ordens superiores. Usando a expressão P = -Nex = ε0 ~ χ E, podemos encontrar as susceptibilidades não lineares. 16.3 Aproximação da variação lenta da amplitude Nesta seção vamos deduzir uma equação de ondas simplificada, supondo que a amplitude do campo eletromagnético varia lentamente numa distância da ordem do comprimento de onda da luz. No Cap. 3 vimos que a equação de ondas num meio dielétrico, não magnético e sem cargas livres é descrita como: r r r ∂2 r ∂ 2 (ε 0 E + P ) ∇ E = μ0 2 D = μ0 ∂t ∂t 2 2 (16.10) que pode ser o re-escrita como: r r r ∂ 2E ∂ 2P ∇ E − μ0ε0 2 = μ0 2 ∂t ∂t 2 (16.11) O lado esquerdo corresponde à equação de ondas para a propagação da luz no vácuo, enquanto que o termo no lado direito leva em conta a interação do campo eletromagnético com o meio. A polarização pode ser r t r r relacionada com o campo elétrico de acordo com: P = ε 0 χ E : E , onde deixamos explícito o caráter tensorial da susceptibilidade de um meio anisotrópico e o fato que a resposta do meio, dada pela susceptibilidade, pode não ser constante, dependendo do campo aplicado como vimos na seção anterior para o modelo do oscilador não harmônico. Entretanto, esta dependência é muito fraca em meios transparentes e mesmo para altas intensidades de campo elétrico a polarização pode ser expandida em série de potências: ( ) r r rr rrr t t t P = ε 0χ (1) : E + ε 0χ ( 2 ) : EE + ε 0χ (3) : EEE + ... S. C. Zilio (16.12) Óptica Moderna – Fundamentos e Aplicações Óptica não linear 299 onde novamente foi usada a notação de produto tensorial. Uma maneira mais explícita de escrevermos estes termos é: Pi(1) = ε 0 ∑ χ ij(1) E j , ( 2) Pi( 2 ) = ε 0 ∑ χ ijk E jE k , (16.13a) j ( 3) Pi( 3) = ε 0 ∑ χ ijkl E jE k E l (16.13b) j,k (16.13c) j,k ,l e assim por diante. Desta forma, vemos que a suscetibilidade linear χ(1) é uma matriz 3x3, possuindo portanto 9 termos. Já as suscetibilidades de segunda e terceira ordens possuem respectivamente 27 e 81 termos. Entretanto, devido à simetria dos meios cristalinos utilizados, vários destes termos são nulos ou estão ligados entre si por uma relação de proporcionalidade. Em particular, χ(2) = 0 para meios com simetria de inversão. É conveniente escrevermos a polarização dada na eq. (16.11) de maneira a separarmos explicitamente as contribuições linear e não linear: r r r r r r P ( r , t ) = P (1) ( r , t ) + P NL ( r , t ) . Desta forma, a equação de ondas se torna: r r r t (1) ∂ 2 E ∂ 2 P NL ∇ E − μ 0ε 0 (1 + χ ) : 2 = μ 0 ∂t ∂t 2 2 (16.14) Nos processos não lineares podem existir em geral várias ondas de mesma freqüência (degeneradas) ou de freqüências diferentes (não degeneradas) se propagando no meio. Podemos usar o princípio da superposição para escrever o campo elétrico de acordo com: r r r r r r r r E ( r , t ) = ∑ E l ( k l , ωl ) = ∑ εl ( r , t ) exp{ i(k l .r − ωt )} l (16.15) l Da mesma forma, também podemos escrever as polarizações linear e não linear em termos de suas componente de Fourier como: r r r r r r t P (1) ( r , t ) = ∑ Pl(1) (k l , ωl ) = ε 0 ∑ χ (1) (ωl ) : E l ( k l , ωl ) l S. C. Zilio (16.16a) l Óptica Moderna – Fundamentos e Aplicações Óptica não linear 300 r r r r r r P NL ( r , t ) = ∑ P ( n ) ( r , t ) = ∑ P NL ( k m , ωm ) n ≥2 (16.16b) m Para um processo não linear onde existem n ondas não degeneradas, teremos n equações diferenciais acopladas, cada uma correspondendo a uma dada freqüência. Considerando ondas harmônicas teremos: r ω2 t r r r r ∇ 2E + ε : E(k , ω) = −μ 0ω2 P NL (k m , ωm = ω) (16.17) c2 t t (1) onde ε = (1 + χ ) é um tensor que leva em contra a anisotropia do meio e que dá origem a propriedades lineares tais como índice de refração, birrefringência, absorção e dicroísmo. Para a solução desta equação é importante sabermos como tomar o termo de polarização não linear na freqüência correta. Como exemplo, vamos considerar o efeito não linear de segunda ordem chamado soma de freqüências, onde ω = ω1 + ω2. Temos, portanto, dois campos, E1 (k1 , ω1 ) e E 2 (k 2 , ω2 ) , incidentes no r r r r material e um terceiro campo, E(k, ω = ω1 + ω2 ) , gerado. As equações não lineares acopladas ficam: r r r ⎛ 2 ω12 t ⎞ r r ⎜⎜ ∇ + 2 ε1 :⎟⎟E1 (k1 , ω1 ) = −μ 0ω12 P NL (ω1 ) c ⎠ ⎝ r r r r 2 t ( 2) = −μ 0ε 0ω1 χ (ω1 = ω − ω2 )E ∗2 (k 2 , ω2 )E(k, ω) r ⎛ 2 ω22 t ⎞ r r ⎜⎜ ∇ + 2 ε2 :⎟⎟E 2 (k 2 , ω2 ) = −μ 0ω22 P NL (ω2 ) c ⎠ ⎝ r r r r 2 t ( 2) = −μ 0ε 0ω2 χ (ω2 = ω − ω1 )E1∗ (k1 , ω1 )E(k , ω) r ⎛ 2 ω22 t ⎞ r r ⎜⎜ ∇ + 2 ε :⎟⎟E(k , ω) = −μ 0ω2 P NL (ω) c ⎠ ⎝ r r r r 2 t ( 2) = −μ 0ε 0ω χ (ω = ω1 + ω2 )E1 (k1 , ω1 )E 2 (k 2 , ω2 ) S. C. Zilio (16.18a) (16.18b) (16.18c) Óptica Moderna – Fundamentos e Aplicações Óptica não linear 301 Este conjunto de equações diferenciais de segunda ordem pode ser simplificado usando uma aproximação que supõe que a amplitude varia lentamente numa distância correspondente a um comprimento de onda. A variação rápida com a distância está contida no termo de fase, que será colocado em evidência como: r r r E ( ω , z ) = ∈ ( ω , z ) exp {i ( kz − ω t )} , onde ∈ (ω, z) é a amplitude da onda. Como a variação desta amplitude é muito pequena para 2 ∂ ∈ . Substituindo distâncias da ordem de λ, podemos tomar: ∂ ∈ << k 2 ∂z r r ∂z r E(ω, z) na eq. (16.18c) e usando a aproximação de variação lenta de amplitude chegamos a uma equação diferencial linear do tipo: r ∂∈ ∂z = iμ 0ω2 r NL P (ω, z) exp{ − i(kz − ωt )} 2k (16.19) Por se tratar de uma equação diferencial linear, sua solução é bastante simples no caso em que não existe deplecção, isto é, quando as amplitudes dos campos incidentes são constantes. Para ilustrar este fato, vamos tratar o caso em que a interação não linear gera a soma das freqüências incidentes. 16.4 Geração de soma de freqüências Vamos considerar duas ondas planas de freqüências ω1 e ω2 interagindo num meio não linear. Os campos propagam paralelamente ao eixo óptico, que tomaremos como sendo z, e suas amplitudes são aproximadamente constantes no caso em que a não linearidade é pequena. Caso contrário, será necessária a solução de três equações não lineares acopladas, tarefa que em geral é bastante difícil. Vamos tomar um meio semi-infinito cuja interface localiza-se em z = 0; no caso de haver uma segunda interface, paralela à primeira, efeitos de interferência com os campos refletidos devem ser considerados, similarmente ao que foi feito para o interferômetro de Fabry-Pérot. Como estamos interessados num campo cuja freqüência ω3 corresponde à soma dos campos incidentes, ω3 = ω1 + ω2, podemos re-escrever a eq. (16.19) como: S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica não linear 302 r ∂∈ ∂z = iμ 0 ω32 r NL P (ω3 = ω1 + ω2 , z) exp{ − i(k 3 z − ω3 t )} 2k 3 (16.20) onde a componente i da polarização não linear é dada por: ⎤ ⎡ ( 2) PiNL (ω3 , z) = ε 0 ⎢∑ χ ijk (ω3 = ω1 + ω2 )E1 jE 2 k ⎥ e{ i ( k1z−ω1t )}e{ i ( k 2z−ω2t )} ⎦ ⎣ j,k (16.21) Para simplificar, podemos escrever o termo da somatória entre colchetes como P3i (ω3 = ω1 + ω2), de forma que a eq. (16.20) assume a forma: ∂ ∈3 iμ 0 ω32 = ε 0 P3 (ω3 ) exp{ iΔkz} ∂z 2k 3 (16.22) onde a polarização P3(ω3) e o campo gerado ∈3(ω3 ) tem a mesma direção, de forma que apenas suas amplitudes foram consideradas. O termo Δk = k1+k2-k3 é conhecido como desajuste de fases ou descasamento de fases. Como as amplitudes E1 e E2 são constantes, P3(ω3) também o será e a eq. (16.22) é facilmente integrada, resultado em: ∈3 (z) = μ 0 ω32 ε 0 P3 (ω3 ) [exp{ iΔkz} − 1] 2k 3 Δk (16.23) onde a condição inicial ∈3( z = 0) foi usada. A intensidade do campo gerado em ω3 é dada por: 2 2 sen ( Δkz/2 ) ⎤ I 3 (z) = 1 cnε 0 ∈3 ≈ P3 (ω3 ) ⎡ z2 ⎢⎣ Δkz/2 ⎥⎦ 2 2 (16.24) que, de acordo com a eq. (16.21), é proporciona a I1 e I2. O gráfico desta intensidade como função de Δkz/2 está mostrado na Fig. 16.1. O primeiro zero ocorre em π e para um determinado Δk, o comprimento que a luz deve percorrer para atingir esta condição é o chamado comprimento de coerência, dado por ℓc = 2π/Δk. Por exemplo, se ℓc = 1 cm, Δk = 2π cm-1 e para a luz visível, Δk/k ≈ 10-4. A condição de máxima eficiência é atingida S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica não linear 303 quando Δk = k3 – k1 – k2 = 0, que é chamada de condição de casamento de fase, ou conservação de momentum. Como ki = ωi n(ωi)/c, para atingir esta condição devemos ter: ω1 [n(ω3) - n(ω1)] + ω2 [n(ω3) - n(ω2)] = 0. Em cristais cúbicos com dispersão normal, n aumenta com ω, de forma que n(ω3) > n(ω1), n(ω2). Para se contornar este problema é necessário o uso de cristais anisotrópicos. Num cristal uniaxial negativo, por exemplo, o índice de retração extraordinário é menor que o ordinário e assim, escolhe-se uma direção de propagação e as polarizações dos feixes de tal maneira que a condição de casamento de fases seja satisfeita, como veremos adiante. I3 −2π −π 0 π 2π Δkz/2 Fig. 16.1 – Intensidade do campo gerado na soma de freqüências. Para completar esta seção, vamos tomar o caso particular em que ω1 = ω2 = ω e ω3 = 2ω, conhecido como geração de segundo harmônico. Como vimos, o comprimento de coerência satisfaz a condição Δkℓc = [k(2ω) – 2k(ω)] = 2π. Como k(ωi) = ωi n(ωi)/c temos: [2ω n(2ω)/c – 2ω n(ω)/c]ℓc = 2k0 [n(2ω) – n(ω)]ℓc = 2π (16.25) Como k0 = ω/c = 2π/λ0, obtemos o comprimento de coerência como: lc = S. C. Zilio λ 2[n (2ω) − n (ω)] (16.26) Óptica Moderna – Fundamentos e Aplicações Óptica não linear 304 Assim, se a diferença de índices for 0,05, por exemplo, o comprimento de coerência será de apenas 10 λ0. Podemos entender o significado do comprimento de coerência analisando a propagação dos campos fundamental e de segundo harmônico. Digamos que numa dada posição é gerado um campo de segundo harmônico, que se propaga com velocidade diferente da do fundamental. Ao percorrer uma distancia ℓc, o campo em 2ω estará 180° fora de fase com o campo em ω e o segundo harmônico gerado nesta posição produzirá interferência destrutiva com o campo gerado anteriormente, levando ao primeiro mínimo (em π) da Fig. 16.1. Como visto, o casamento de fases ocorre quando n(2ω) = n(ω). Vamos tomar um cristal uniaxial com o eixo óptico na direção z e com o feixe fundamental polarizado na direção x (eixo ordinário), como mostra a Fig. 16.2(a). Queremos calcular em que direção deve ocorrer a propagação para que haja o casamento de fases. De acordo com a Fig.16.2 (b), o índice de refração efetivo para o campo em 2ω é dado pela expressão: 1 cos 2 θ + sen 2θ = [n e2 ω (θ)]2 [n o2 ω ]2 [n e2ω ]2 (16.27) que corresponde à elipse maior da figura. Para haver casamento de fases devemos impor que no(ω) = n(2ω), ou seja, escolher um ângulo θm tal que: cos 2 θm sen 2θm 1 = + 2 ω 2 = 1ω 2 2ω 2 2ω 2 [n e (θm )] [n o ] [n e ] [n o ] (16.28) Com isso obtemos o ângulo de casamento de fases como: [n ωo ]−2 − [n o2ω ]2 sen θm = 2 ω −2 [n e ] − [n o2 ω ]−2 2 (16.29) ω Para o caso de um cristal de KDP (KH2PO4) temos n e = 1.466, n e2 ω = 1.487, n ωo = 1.506 e n o2 ω = 1.534, para λ = 6943 Å, que é o comprimento de onda de operação de um laser de rubi. Com estes valores obtemos θm = 50.40. S. C. Zilio Óptica Moderna – Fundamentos e Aplicações Óptica não linear 305 O casamento de fases onde n(2ω) = no(ω) é chamado do tipo I. Existe ainda o tipo II, onde dois feixes fundamentais tem polarizações ortogonais tal que n(2ω) =1/2 [no(ω) + ne(ω)]. r km z (ne) r Eω r k n o2 ω (θ) r E 2ω n ωo (θ) n e2ω (θ) y (no) n ωe (θ) x (no) (a) (b) Fig. 16.2 – (a) Geometria de propagação na geração de segundo harmônico e (b) índices de refração em função de θ para os feixes fundamental e de segundo harmônico. A discussão realizada nesta seção considerou não haver depleção do feixe fundamental. Entretanto, se o efeito não linear for grande, a amplitude do campo em ω diminuirá e assim, duas equações acopladas do tipo da equação (16.22) devem ser resolvidas, uma para o feixe fundamental e outra para o segundo harmônico. Não demonstraremos aqui, mas a solução para estas equações é: I3 (z) = I1 (0) tanh 2 (Κ ∈1(0)z) onde: S. C. Zilio 3 μ Κ = χ ijk 2⎛⎜ 0 ⎞⎟ 2 ω ⎝ ε 0 ⎠ n (ω)n (2ω) (16.30) (16.31) Óptica Moderna – Fundamentos e Aplicações Óptica não linear 306 O gráfico desta função está mostrado na Fig. 16.3. I3(L)/I1(0) 1 0 I1(0) Fig. 16.3 – Geração de segundo harmônico com depleção do feixe fundamental. Bibliografia 16.1. J. R. Reitz, F. J. Milford and R. W. Christy, Fundamentos da Teoria Eletromagnética, Editora Campus, RJ (1982) 16.2. G. R. Fowles, Introduction to Modern Optics, Holt, Rinehart and Winston, NY (1968). 16.3. A. Yariv, Quantum Electronics, 3ª edição, John Wiley and Sons, NY (1989). Problemas 16.1. Usando o modelo do oscilador não harmônico, obtenha o deslocamento do elétron na freqüência ω1+ω2, dado pela eq. (16.7). 16.2. Complete os passos que levam à eq. (16.19). S. C. Zilio Óptica Moderna – Fundamentos e Aplicações