3.2 Valores Vectores Propios
3.2 Valores Vectores Propios
3.2 Valores Vectores Propios
AUTOVECTORES Y DIAGONALIZACIÓN
En lo que resta de este tema, nos centraremos en un tipo especial de aplicaciones lineales:
los endomorfismos.
Definición: Endomorfismo.
Se llama endomorfismo a una aplicación lineal f: V ⎯⎯
→ V, en que el espacio inicial y final
son el mismo.
ENDOMORFISMOS BIYECTIVOS
Ejemplos de endomorfismos biyectivos (es decir, que cumplen todo lo anterior) son las
aplicaciones ya vistas: giros, simetrías y homotecias.
Los endomorfismos biyectivos son inversibles, es decir, existe un endomorfismo f–1 que
“deshace” lo hecho por f. Si la matriz de f es A, la matriz de f–1 es su inversa, A–1.
• Si A es la matriz de una homotecia de razón 2, que duplica todos los vectores, A–1 será
la matriz de una homotecia de razón ½, que los reduce a la mitad.
• Veamos qué sucede si A es la matriz de una proyección, que lleva todos los vectores del
espacio ! 3 a un cierto plano, sobre el que proyectamos (como si fuese un objeto
produciendo sombra). Por ejemplo la proyección “en planta” sobre el plano XY:
!3 ⎯⎯→ !3
(x,y,z) " (x,y,0)
⎛ 1 0 0 ⎞
Su matriz es ⎜ ⎟ que no tiene inversa. En efecto, la proyección es un endomorfismo
⎜ 0 1 0 ⎟
⎜⎝ 0 0 0 ⎟⎠
no inversible. Esto se debe a que distintos vectores se proyectan sobre el mismo: tanto
(1,2,3) como (1,2,5) o (1,2,9) se proyectan sobre (1,2,0). Por esto la transformación no se
puede deshacer, porque una vez que hemos proyectado un vector, no sabemos cuál era el
original. Esto se traduce en que la matriz tiene determinante cero y por tanto no es
inversible.
SEMEJANZA DE MATRICES
En este tema se tratará de ver, dada una matriz, si existe otra matriz semejante a ella
que sea diagonal: P–1 A P = D, y en ese caso calcular la diagonal D y la matriz de paso P.
En otras palabras: dado un endomorfismo, trataremos de encontrar una base en la cual la
matriz del endomorfismo sea sencilla (diagonal si es posible).
Para ello se utilizarán los valores y vectores propios.
En un endomorfismo, dado que el espacio inicial y el final son el mismo, podemos comparar
un vector v con su imagen f(v), y ver si es múltiplo suyo.
Definición.
Si un vector v (no nulo) cumple que su imagen es múltiplo suyo, es decir, si
f (v) = λv
con λ escalar, se dice que v es un vector propio (o autovector) de f, y que λ es su valor
propio (o autovalor) asociado.
f(v)=2v
Además, si λ es un valor propio, todos sus
vectores propios asociados forman un subespacio. v
Se llama subespacio propio (o autoespacio)
asociado a λ , y se denota por Vλ.
u
f(u)
Geométricamente: un autovector es aquel que, al En la figura, v es autovector, ya que se
aplicarle el endomorfismo, permanece sobre la transforma en un múltiplo suyo (no
misma recta. Es decir, no cambia de dirección cambia de dirección al aplicar f)
(aunque sí puede cambiar de sentido y/o de Pero u no es autovector, ya que cambia
módulo). de dirección al aplicarle f.
Como ejemplo, los autovectores de autovalor 1 son los que no varían por el endomorfismo:
v se transforma en el mismo vector, 1 v = v . Por otra parte, los autovectores de autovalor –
1 son los que cambian de sentido pero no de módulo: v se transforma en (–1) v = –v
La noción de autovalores y autovectores fue introducida por el matemático alemán David Hilbert a
principios del siglo XX. Siguiendo la denominación original, en inglés se llaman eigenvalues y
eigenvectors.
!3 ⎯⎯→ !3
2) Consideremos una simetría respecto al plano XZ,
(x,y,z) " (x, - y,z)
- Observar que todos los vectores de la forma (α,0,β) quedan transformados en sí mismos
(es decir, multiplicados por 1). Por tanto 1 es valor propio, con vectores propios los de la
forma (α,0,β)
- Observar que los vectores de la forma (0,γ,0) quedan transformados en (0,–γ,0), es decir,
multiplicados por –1. Por tanto –1 también es valor propio, con vectores propios los de la
forma (0,γ,0).
Es decir, el plano XZ que actúa como “espejo” de la simetría queda fijo. Por eso está
formado por autovectores de valor propio 1. Por el contrario, el eje Y, que es perpendicular
al “espejo”, queda invertido y por eso está formado por autovectores de autovalor –1.
!2 ⎯⎯→ !2
3) En un giro de 45º, no hay valores ni vectores
(x,y) " ( 22 x- 2
2
y, 2
2
x+ 2
2
y)
propios, ya que ningún vector (no nulo) queda transformado en un múltiplo de sí mismo:
todos cambian de dirección con el giro.
Propiedades.
1. Si los valores propios de A son λ1,. . . ,λn entonces los de αA son αλ1,. . . , αλn. Los
vectores propios de αA son los mismos que los de A.
Esto se debe a que αA consiste en efectuar el endomorfismo y además multiplicar todo
por α. Por tanto cada autovector se multiplica por su autovalor λ y también por α, es decir,
se multiplica por α λ.
2. Si los valores propios de A son λ1,. . . ,λn entonces los de Ak son λ1k,. . . ,λnk . Los
vectores propios de Ak son los mismos que los de A.
Esto se debe a que Ak consiste en efectuar el endomorfismo k veces. Por tanto cada
autovector se multiplica k veces por su autovalor λ, es decir, se multiplica por λk
Esto se debe a que A–1 deshace lo hecho por A. Por tanto, si A multiplica cada autovector
por su autovalor λ , el endomorfismo inverso multiplica dicho autovector por 1/λ.
(Obviamente se requiere que todos los autovalores sean distintos de 0, pero ocurre que
si 0 es autovalor la matriz no tiene inversa).
Sea !2 ⎯f⎯
→ !2 ⎛ 3 2 ⎞
cuya matriz es A= ⎜ ⎟
(x,y) " (3x+2y, y ) ⎝ 0 1 ⎠
⎛ 3 2 ⎞ ⎛ x ⎞ ⎛ λ 0 ⎞ ⎛ x ⎞
Esto también podemos escribirlo como ⎜ ⎟ ⎜ ⎟ =⎜ ⎟ ⎜ ⎟
⎝ 0 1 ⎠ ⎝ y ⎠ ⎝ 0 λ ⎠ ⎝ y ⎠
y finalmente
⎛ 3− λ 2 ⎞ ⎛ x ⎞ ⎛ 0 ⎞
⎜ ⎟ ⎜ y ⎟ = ⎜ ⎟ que es una ecuación equivalente a la primera, f(v)= λv, es
⎝ 0 1− λ ⎠ ⎝ ⎠ ⎝ 0 ⎠
decir, los vectores v=(x,y) no nulos que la verifiquen, serán vectores propios, y los λ serán
los valores propios.
Para la mayoría de los valores de λ, este sistema será compatible determinado (rango 2), y
por tanto no tendrá más soluciones que x=0, y=0. Estos valores de λ no son valores propios.
Sin embargo, para algunos valores de λ, el sistema será compatible indeterminado y por
tanto existirán soluciones no nulas del sistema: es decir, vectores no nulos tales que
f(v)= λv.
¿Cuándo el sistema será compatible indeterminado? Esto ocurrirá cuando la matriz del
sistema tenga determinante nulo, ya que entonces su rango no será completo. Planteamos
entonces
⎛ 3− λ 2 ⎞
det ⎜ ⎟ = 0.
⎝ 0 1− λ ⎠
es decir (3–λ)(1–λ) = 0
lo que se cumple sólo para los valores λ=1, λ=3. Estos son los valores propios.
Ahora calculamos los vectores propios resolviendo el sistema
A v = λv
para los autovalores λ que ya hemos calculado.
Este sistema, según los cálculos anteriores, se traduce en
⎛ 3− λ 2 ⎞ ⎛ x ⎞ ⎛ 0 ⎞
⎜ ⎟ ⎜ ⎟ = ⎜ ⎟
⎝ 0 1− λ ⎠ ⎝ y ⎠ ⎝ 0 ⎠
λ=1 :
El sistema a resolver es A v = 1 v, que se traduce en
⎛ 3− λ 2 ⎞ ⎛ x ⎞ ⎛ 0 ⎞
⎜ ⎟ ⎜ y ⎟ = ⎜ ⎟ haciendo λ=1
⎝ 0 1− λ ⎠ ⎝ ⎠ ⎝ 0 ⎠
Es decir
⎛ 2 2 ⎞ ⎛ x ⎞ ⎛ 0 ⎞
⎜ ⎟ ⎜ ⎟ =⎜ ⎟ cuya solución son los vectores (α,–α).
⎝ 0 0 ⎠ ⎝ y ⎠ ⎝ 0 ⎠
Por tanto, estos son los vectores propios de valor propio 1. El subespacio que forman es V1.
Una base de V1 es (1,–1).
λ=3 :
El sistema a resolver es A v = 3 v, que se traduce en
⎛ 3− λ 2 ⎞ ⎛ x ⎞ ⎛ 0 ⎞
⎜ ⎟ ⎜ ⎟ = ⎜ ⎟ haciendo λ=3
⎝ 0 1− λ ⎠ ⎝ y ⎠ ⎝ 0 ⎠
Por tanto, estos son los vectores propios de valor propio 3. El subespacio que forman es V3.
Una base de V3 es (1,0).
2. Hallar las raíces de dicho polinomio. Estos serán los valores propios. Se puede
mencionar su multiplicidad (es decir, si son simples, dobles, triples…)
Nota. La “multiplicidad” de una raíz a en un polinomio es el exponente con que aparece el factor
3
(x-a). Por ejemplo, en (x–4) (x+5), la raíz 4 tiene multiplicidad 3, o es triple, y la raíz –5 tiene
multiplicidad 1, o es simple).
! !
3. Para cada valor propio λ, resolver el sistema (A– λ Ι) x = 0 (que será compatible
indeterminado), la solución será el subespacio propio asociado a λ.
Observación.
Vista la forma de calcular los valores propios, de ello se deducen algunas propiedades más:
1. Los valores propios de una matriz diagonal o triangular, son sus elementos diagonales.
Al calcular el polinomio característico, nos daremos cuenta de que directamente sale
factorizado con factores de la forma (a–λ), donde a es un elemento de la diagonal.
En efecto, hemos visto que los vectores propios conservan su dirección cuando se les
aplica el endomorfismo. Por ello, podemos considerar que los vectores propios marcan las
direcciones principales a lo largo de las cuales actúa el endomorfismo, conservando fijas
dichas direcciones. Por eso la matriz en una base de vectores propios es más sencilla.
Hemos encontrado los vectores propios u=(1,–1) y v=(1,0), correspondientes a los dos
valores propios. Con estos dos vectores, como son linealmente independientes, se forma
una base de ! 2 , B={ (1,–1) , (1,0) }.
Hallemos la matriz de f en esta base y comprobaremos que efectivamente es diagonal.
Ahora bien, sabemos que los vectores de la base, u y v, son vectores propios: por tanto
conocemos su imagen, que es un múltiplo suyo.
Ahora hay que expresar estas imágenes en coordenadas respecto de la misma base B, es
decir, expresarlas como combinación lineal de u y v. Es fácil:
⎛ 0 ⎞
f(v) = 3·v se expresa como 0·u + 3·v → coordenadas (0,3) → 2ª columna ⎜ ⎟
⎝ 3 ⎠
⎛ 1 0 ⎞
Así ya podemos formar la matriz D = ⎜ ⎟ , que efectivamente es diagonal.
⎝ 0 3 ⎠
Los elementos de la diagonal son precisamente los valores propios, 1 y 3 en este caso.
D
base B base B
donde:
⎛ 3 2 ⎞
- A es la matriz de f en base canónica, que ya conocíamos: A= ⎜ ⎟
⎝ 0 1 ⎠
⎛ 1 0 ⎞
- D= ⎜ ⎟ es la diagonal de los valores propios.
⎝ 0 3 ⎠
- P es la matriz de cambio de la base B a la canónica; por tanto tendrá en sus columnas
los vectores de B expresados en base canónica:
⎛ 1 1 ⎞
P= ⎜ ⎟ (es decir, P tiene en sus columnas los vectores propios u, v).
⎝ −1 0 ⎠
Planteándolo en general,
Diagonalizar una matriz cuadrada A es encontrar una diagonal D semejante a A.
Para ver si A es diagonalizable, habrá que ver si se puede formar la base de vectores
propios. Es decir, habrá que ver si, uniendo las bases de los distintos subespacios propios,
“hay suficientes vectores” como para formar con ellos una base del espacio total V.
Para que ocurra esto, cada autovalor deberá proporcionar tantos autovectores
independientes como indica su multiplicidad. Es decir, si un autovalor es doble deberá
proporcionar dos autovectores independientes; si es triple tres, etc. De lo contrario no habrá
“suficientes” para formar una base.
dim( Vλ ) = n – rg( A– λI )
A) Ver si es diagonalizable.
1) Calcular el polinomio característico y hallar los valores propios.
1) Hallar los vectores propios, resolviendo el sistema correspondiente para cada valor propio.
2) Hallar una base de cada subespacio propio, y unirlas todas para formar una base de
vectores propios del espacio total ! n .
Para que D sea nxn se necesitarán n valores propios, así que en la diagonal habrá que repetir cada
valor propio λ tantas veces como indique dim(Vλ). Además ha de respetarse un mismo orden al
colocar los valores propios en D y los vectores propios en las columnas de P.
Ejemplos.
⎛ 2 0 2 ⎞
1) Veamos si es diagonalizable la matriz A= ⎜⎜ −1 3 1 ⎟⎟
⎜⎝ 0 0 3 ⎟⎠
⎛ 2−λ 0 2 ⎞
⎜
El polinomio característico es det ⎜ −1 3− λ ⎟ = λ3 – 8 λ2 + 21 λ – 18 que factoriza
1 ⎟
⎜⎝ 0 0 3− λ ⎟⎠
como (λ–2) (λ–3)2 . Por tanto, sus raíces son λ=2 (simple), λ=3 (doble).
Estos son los valores propios.
⎛ 1 −4 0 ⎞
Ello se refiere a diagonalizar la matriz de f en base canónica, A= ⎜⎜ 0 −1 0 ⎟⎟
⎜⎝ 0 2 1 ⎟⎠
λ=1:
⎛ 0 −4 0 ⎞ ⎛ x ⎞ ⎛ 0 ⎞
! !
El sistema es (A – Ι) x = 0 , es decir, ⎜⎜ 0 −2 0 ⎟⎟ ⎜⎜ y ⎟ = ⎜
⎟ ⎜ 0 ⎟
⎟ → solución (α, 0, β)
⎜⎝ 0 −2 0 ⎟⎠ ⎜⎝ z ⎟⎠ ⎜⎝ 0 ⎟⎠
Así pues, la base de vectores propios se forma uniendo las bases de V1 y V–1 :
B= { (1,0,0) , (0,0,1), (2,1,1) }
⎛ 1 0 2 ⎞
Poniendo esta base en columnas se obtiene la P = ⎜⎜ 0 0 1 ⎟⎟
⎜⎝ 0 1 1 ⎟⎠
⎛ 1 0 0 ⎞
Y la diagonal se forma con los valores propios 1 doble y –1 simple: D = ⎜⎜ 0 1 0 ⎟⎟
⎜⎝ 0 0 −1 ⎟⎠
(Notar que ha de respetarse un mismo orden al colocar los valores y los vectores propios).
Por tanto si la matriz es real simétrica, no hace falta comprobar que es diagonalizable.
(Además, una vez estudiado el tema del Espacio Euclídeo, se podrá ver que en una matriz
simétrica los subrespacios propios son todos ortogonales entre sí).
Supongamos que queremos calcular la potencia An de una matriz. Esto puede llevar una
gran cantidad de operaciones.
Pero si la matriz A es diagonalizable, el cálculo se facilita notablemente.
En ese caso, diagonalizando la matriz tendremos P–1AP = D, por tanto A = PDP–1 .
Entonces,
n n
A = A····A = P DP–1 PDP–1···· PDP–1 = PD····D P–1 = PD P–1
es decir,
n n
A = PD P–1
n
lo cual es muy fácil de calcular teniendo en cuenta que para hallar la potencia D basta
elevar a la potencia n cada elemento diagonal.
Ejemplo
⎛ 3 2 ⎞
Hemos obtenido anteriormente la diagonalización de la matriz A= ⎜ ⎟:
⎝ 0 1 ⎠
⎛ 1 0 ⎞ ⎛ 1 1 ⎞
P–1AP = D, por tanto A= PDP–1, donde D= ⎜ ⎟ y P= ⎜ ⎟
⎝ 0 3 ⎠ ⎝ −1 0 ⎠
Calculemos entonces A9.
⎛ 9 0 ⎞ P–1 =
A9= P D9 P–1 = P ⎜ 1 ⎟
⎝ 0 39 ⎠
−1
⎛ 1 1 ⎞⎛ 1 0 ⎞ ⎛ 1 1 ⎞ ⎛ 19683 19682 ⎞
= ⎜ ⎟⎜ ⎟ ⎜ ⎟ = ⎜ ⎟
⎝ −1 0 ⎠ ⎝ 0 19683 ⎠ ⎝ −1 0 ⎠ ⎝ 0 1 ⎠
1. Círculos de Gershgorin.
Este resultado permite localizar una zona del plano complejo (o de la recta real) en la que
se encuentran los valores propios, y así acotarlos entre ciertos límites:
Dada una matriz A de tamaño nxn, se pueden dibujar en el plano complejo n círculos, uno
por cada fila de la matriz, de la siguiente manera:
- Centro: el elemento diagonal de la fila
- Radio: la suma de los valores absolutos de los demás elementos de la fila
Entonces, todo valor propio de A se encuentra contenido en alguno de los círculos,
incluido el borde.
Se trata de un método iterativo para calcular el valor propio dominante (es decir, de mayor
valor absoluto) de una matriz, así como su vector propio asociado.
1) Que haya un único valor propio de mayor valor absoluto (p. ej. no se podría aplicar a
una matriz cuyos valores propios fueran –5,1,5). Este valor propio será el que
calcularemos.
2) Que dicho valor tenga asociado un subespacio propio de dimensión 1, por tanto
generado por un solo vector propio. Este vector propio será el que calcularemos.
Ejemplo
⎛ −4 12 ⎞
Calculemos el valor propio dominante y su vector propio asociado, para A= ⎜ ⎟
⎝ −6 14 ⎠
Partimos del vector v0 = (1,0). Hemos trabajado con 4 cifras significativas.
Nº ui σi ui
vi =
iteración σi
0 (1,0) 1 (1,0)
1 (–4,–6) –6 (0.6667, 1)
2 (9.333, 10) 10 (0.9333, 1)
3 (8.2667,8.4) 8.4 (0.9841,1)
... ... ... ...
8 ... 8 (1,1)
9 (8,8) 8 (1,1)