2 Valores y Vectores Propios Estadisticos 2024 2
2 Valores y Vectores Propios Estadisticos 2024 2
2 Valores y Vectores Propios Estadisticos 2024 2
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
Ejemplo 1
3 1 3−𝑡 1
Sea la matriz 𝐴 = [ ] . El polinomio característico es 𝑃𝐴 (𝑡) = | |, esto es:
6 2 6 2−𝑡
𝑃𝐴 (𝑡) = (3 − 𝑡)(2 − 𝑡) − 6 = 6 − 5𝑡 + 𝑡 2 − 6 = 𝑡 2 − 5𝑡 = 0. Las raíces 𝑡 = 5, 𝑡 = 0
son los valores propios de la matriz A.
Los vectores propios correspondientes a estos valores propios, se obtienen resolviendo:
3 1 𝑥 𝑥 3 1 𝑥 0
(1)[ ][ ] = 5[ ] y (2) [ ][ ] = [ ] respectivamente.
6 2 𝑦 𝑦 6 2 𝑦 0
22
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
3𝑥 + 𝑦 = 5𝑥 𝑦 = 2𝑥 𝑦 = 2𝑥
De (1) se pasa a: { →{ →{ luego la recta 𝐸1 : 𝑦 = 2𝑥 es el
6𝑥 + 2𝑦 = 5𝑦 2𝑥 = 𝑦 0=0
conjunto solución de (1).
Similarmente la solución de (2) es la recta 𝐸2 : 𝑦 = −3𝑥. En ambos casos hay infinitas
soluciones y son las rectas 𝐸1 : 𝑦 = 2𝑥 y 𝐸2 : 𝑦 = −3𝑥 . Estas rectas se denominan
Espacios propios o Auto espacios correspondientes a los valores propios 𝑡 = 5, 𝑡 = 0
respectivamente.
Un miembro de 𝐸1 es por ejemplo 𝑢 = (1,2) y satisface 𝐴𝑢 = 5𝑢. De la misma forma 𝑣 =
(1, −3) es miembro de 𝐸2 y satisface 𝐴𝑢 = 0𝑢.
1 2 3 4
1 4 9 16
Ejemplo 2 Sea la matriz 𝐴 = [ ]
1 8 27 64
1 32 81 256
El polinomio característico de esta matriz es de cuarto grado y sería sumamente
complicado calcular manualmente sus raíces, pero con la ayuda del MATLAB se
puede seguir paso a paso el procedimiento.
Primero se ingresa a Matlab la matriz 𝐴:
A =[1 2 3 4;
1 4 9 16;
1 8 27 64;
1 32 81 256]
a) Primer camino
Se calculan los coeficientes del polinomio característico con el comando poly(A).
format bank;
pc=poly(A)
pc =
1.00 -288.00 2554.00 -4980.00 1440.00
esto indica que el polinomio es: 𝑡 4 − 288𝑡 3 + 2554𝑡 2 − 4980𝑡 + 1440
Se calculan las raíces del polinomio con el comando roots
roots(pc)
ans =
278.9068
6.4531
2.2908
0.3493
23
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
b) Segundo camino
Cálculo simultáneo de valores propios y vectores propios de una matriz con el
comando eig de MATLAB
A = [1 2 3 4;
1 4 9 16;
1 8 27 64;
1 32 81 256];
[U,E]=eig(A)
U=
-0.0170 -0.3654 -0.9529 -0.6829
-0.0644 -0.6145 0.2736 -0.7202
-0.2477 -0.6374 0.1126 0.1072
-0.9665 0.2872 -0.0662 0.0593
E=
278.9068 0 0 0
0 6.4531 0 0
0 0 0.3493 0
0 0 0 2.2908
Las columnas de la matriz U son los vectores propios de A y los correspondientes valores
propios están en la diagonal de la matriz E. Así por ejemplo la última columna de U es:
u=U(:,4)
u=
-0.6829
-0.7202
0.1072
0.0593
corresponde al valor propio t=E(4,4)=2.2908, que es el último término de la matriz
diagonal E. Esto quiere decir que se satisface la ecuación: A*u=t*u
24
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
Esto quiere decir que 𝑝𝐴 (𝑡) = 𝑡 4 − 117𝑡 3 + 4452𝑡 2 − 65370𝑡 + 307716, cuyas raíces
son
roots(pc)
ans =
58.36
30.67
18.85
9.12
todas son positivas. Entonces como A es simétrica y tiene todos sus valores propios
positivos, luego es definida positiva.
Desde el punto de vista matemático, las matrices definidas positivas, presentan propiedades
que son extraordinariamente bellas y sorprendentes. Entre ellas están, las distintas formas
de caracterización. En el siguiente teorema mencionamos solo dos de ellas por ser de
utilidad en el curso.
5.3 Relaciones entre los valores propios y los menores principales dominantes
Teorema 1
Dada una matriz simétrica 𝐴, las siguientes afirmaciones son equivalentes:
a) 𝐴 es definida positiva (todos sus valores propios son positivos).
b) Todos los menores principales dominantes de 𝐴 son positivos.
Ejemplo 4
2 −1 0
a) La matriz 𝐵 = [−1 2 − 1]cumple con estas condiciones porque es simétrica y sus
0−1 2
menores principales dominantes son positivos:
2 −1 0
2 −1
𝐻1 = 2 ; 𝐻2 = | | = 3; 𝐻3 = |−1 2 − 1| = 4
−1 2
0 −1 2
De otro lado sus valores propios de B son todos positivos: r =3.4142; 2.0000; 0.5858
25
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
Ejercicios
1. Siguiendo los pasos del ejemplo 1, halle el polinomio característico, los valores y
3 1
vectores propios de la matriz: 𝐴 = [ ]
6 2
6 −1 1
2. Para la siguiente matriz 𝐴 = [−1 5 − 3] y empleando Matlab
1 −3 9
9−2−1−2
−2 9 − 2 − 1
3. Se tiene la siguiente matriz 𝐴 = [ ] desarrolle lo siguiente:
−1 − 2 9 − 2
−2 − 1 − 2 9
5. Con la ayuda del siguiente programa genere una matriz A de 5x5 donde las
componente A(i,j) son funciones de los enteros (i,j)
n=5;
for i=1:n
for j=1:n
A(i,j)=2/(2+cos(i-j));
end
end
disp(A)
luego desarrolle lo que sigue:
a) Halle los valores y vectores propios de la matriz A.
b) Halle los menores principales dominantes ¿se cumple el Teorema 1 de la sección 5.3?
26
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
Proposición 1
Sean 𝑥 e 𝑦 dos vectores no nulos del plano, con
origen en el origen de coordenadas, donde 𝜃 es el
ángulo entre 𝑥 e 𝑦. Entonces la relación entre el
producto interno y el ángulo 𝜃 es:
𝑥 𝑦
(1) cos(𝜃)=< < ||𝑥|| , ||𝑦|| > donde 0 ≤ θ ≤ π
Demostración
a) Supuesto que los vectores 𝑥 e 𝑦 son unitarios, esto es: ‖𝑦‖ = ‖𝑥 ‖ = 1
En los triángulos de la Fig.1 se tiene las siguientes relaciones:
c= cos(α+θ); d= sen(α+θ); a=cos(α); b=sen(α), reemplazando en el producto
< x , y >= 𝑎𝑐 + 𝑏𝑑= cos(α) cos(α+θ) + sen(α) sen(α+θ)
= cos(α+θ) cos(α) + sen(α+θ) sen(α)
como cos(A - B)=cos(A)cos(B) + sen(A)sen(B), entonces
< 𝑥 , 𝑦 >= cos(α+θ - α)= cos(θ); finalmente se tiene
cos(θ)= < 𝑥 , 𝑦 >
Las dos funciones son biunívocas y en esta medida queda perfectamente definido el valor
de θ, como un punto del intervalo [0, π], medido en radianes y se obtiene haciendo uso de
la inversa del coseno, esto es:
<𝑥 , 𝑦>
(2) 𝜃 = 𝑎𝑐𝑜𝑠( ||𝑥||||𝑦||) donde 0 ≤ θ ≤ π
27
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
Fig. 2 Fig. 3
Ejemplo1
Sean los vectores
x=[3,4] y=[2,-3].
Entonces el ángulo que forman estos vectores, según (2) y con la ayuda de Matlab es:
ang=acos(dot(x,y)/(norm(x)*norm(y)))
ang = 1.9101 radianes, de aquí en grados sexagesimales
ang*180/pi
ans= 109.44°
La relación (1) se extiende para vectores de ℜ𝑛 y es de gran ayuda para entender las
nociones de perpendicularidad, paralelismo y correlación de vectores en los espacios
vectoriales de mayor dimensión.
Ejemplo2
x=[-1, 2, 3, 4] ; y=[2,1,-4,3] ;
28
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
b) Definición
Dos vectores 𝑥, 𝑦 no nulos, son paralelos si existe un número 𝛼, tal que 𝒚 = 𝜶𝒙
b1) También en este caso, la definición viene de la idea gráfica. En efecto dos vectores
son paralelos si el ángulo entre ellos es 0 o π. De la fórmula (1) y tomando en cuenta que
𝑥 = (𝑥1 , 𝑥2 ) , 𝑦 = (𝑦1 , 𝑦2 ) son no nulos se desprende que: 𝑥1 𝑦2 = 𝑦1 𝑥2 de aquí se
deduce que si 𝑥1 = 0 necesariamente tiene que ser 𝑦1 = 0, consecuentemente 𝑥2 ≠ 0 y
𝑦 𝑦
𝑦2 ≠ 0, entonces 𝑥 = (0, 𝑥2 ) , 𝑦 = (0, 𝑦2 ), como 𝑦2 = 𝑥2 𝑥2 tomando 𝛼 = 𝑥2 se satisface
2 2
la definición de paralelismo 𝑦 = 𝛼𝑥.
Si 𝛼 es positivo se tiene 𝑐𝑜𝑠( 𝜃) = 1, luego por (2) 𝜃 = 0 y de aquí los vectores son
paralelos y tienen la misma dirección.
Si 𝛼 es negativo sale 𝑐𝑜𝑠( 𝜃) = −1, luego 𝜃 = 𝜋, entonces los vectores son paralelos y
con direcciones opuestas.
Ejemplo3
x=[-1, 2, 3, 4] ; y=[-2,4,6, 8] ;
son paralelos porque y=2x y de otro lado empleando (1) el coseno del ángulo entre ellos
es:
co=dot(x,y)/(norm(x)*norm(y)) % co=cos(𝜃)
co =1.000
de aquí tomando el arco coseno de co=1, se tiene
ang =acos(co) % ang=𝜃
ang =0
29
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
b) 𝑀(𝑥) = (𝑚𝑥, . . . , 𝑚𝑥) (es un vector constante, que lo denotamos brevemente con
𝑀(𝑥) = 𝑀𝑥 y lo denominamos media vectorial).
En Matlab se obtiene haciendo:
Mx=mean(x)*ones(1,n) % matriz fila
Mx=mean(x)*ones(n, 1) % matriz columna
d) El mínimo y máximo de un vector x. En Matlab x debe ser una matriz fila y en este
caso el comando es minmax(x). Si x es una columna, el resultado es erroneo.
(||𝑥−𝑀𝑥||)(||𝑦−𝑀𝑦||)
El menor valor de 𝑐𝑜𝑣( 𝑥, 𝑦) será − y se da cuando 𝜃 = 𝜋, esto es
(𝑛−1)
cuando los vectores (𝑥 − 𝑀𝑥) y (𝑦 − 𝑀𝑦) son paralelos y con direcciones opuestas.
30
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
La covarianza 𝑐𝑜𝑣( 𝑥, 𝑦) =0, ocurre cuando los vectores (𝑥 − 𝑀𝑥) y (𝑦 − 𝑀𝑦) son
ortogonales, esto es cuando 𝜃 = 𝜋/2 .
Conclusiones similares se tienen para 𝑐𝑜𝑣( 𝑥, 𝑦, 1).
Observaciones
De (7.5) se desprende que:
𝐷(𝑥) = (𝑛 − 1) ∗ 𝑣𝑎𝑟(𝑥)
𝐷(𝑥) = 𝑛 ∗ 𝑣𝑎𝑟(𝑥, 1)
Observaciones importantes
a) En la definición de R se tomó 𝑐𝑜𝑣( 𝑥, 𝑦), pero también se podría haber tomado la
fórmula (2) de 7.3, que tiene otro ponderado; pero cualquiera que sea el ponderado, este
se simplifica.
b) De la sección (6.1) se deduce que 𝑅 = 𝑐𝑜𝑠( 𝜃), donde 0 ≤ 𝜃 ≤ 𝜋, es el ángulo que
(𝑥−𝑀𝑥) (𝑦−𝑀𝑦)
forman los vectores unitarios de las traslaciones de 𝑥, 𝑦 esto es: ‖𝑥−𝑀𝑥‖ y ‖𝑦−𝑀𝑦‖.
De aquí −1 ≤ 𝑅 ≤ 1
31
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
c3) Si 𝑅 = 0, también por 6.2 se concluye que los vectores unitarios de las traslaciones
de x, y, que definen 𝑅 son ortogonales.
a) min(X) es una matriz fila de m componentes, con los mínimos de cada columna.
b) max(X) es una matriz fila de m componentes, con los máximos de cada columna.
c) mean(X) es una matriz fila de m componentes, con los promedios de cada columna.
d) mode(X) es una matriz fila de m componentes, con las modas de cada columna.
e) std(X) es una matriz fila de m componentes, con las desviaciones estándar de cada
columna.
f) var(X) es una matriz fila de m componentes, con las varianzas de cada columna
g) cov(X) es una matriz de mxm con las covarianzas de todas las m columnas tomadas de
dos en dos. Es decir, la primera componente de la primera fila de la matriz cov(X) estará
formada por la covarianza de 𝑋1 consigo mismo, es decir la varianza de 𝑋1 . La segunda
componente será la covarianza de 𝑋1 con 𝑋2 , la tercera será la covarianza de 𝑋1 con 𝑋3 ,
así sucesivamente. La última será la covarianza de 𝑋1 con 𝑋𝑚 . La segunda fila de cov(X)
tiene una estructura similar. La diagonal de la matriz cov(X) esta formada por las
varianzas de cada columna de X.
h) corrcoef(X) es una matriz de mxm con los coeficientes de correlación de todas las m
columnas tomadas de dos en dos. La primera componente de la primera fila de
corrcoef(X) es la correlación de la columna 𝑋1 consigo misma, que es 1. La segunda
componente es la correlación de 𝑋1 con 𝑋2 , la tercera será la correlación de 𝑋1 con 𝑋3 ,
así sucesivamente. La última será la correlación de 𝑋1 con 𝑋𝑚 . La segunda fila de
corrcoef(X) se desarrolla en forma similar a la primera.
32
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
La diagonal de la matriz corrcoef(X) está formada por unos por que son las correlaciones
de cada columna consigo misma.
Ejemplo 1
Consideremos la matriz:
E =[64 28 56 22;
55 23 40 13;
50 30 16 2;
63 23 44 13;
62 29 43 13;
49 30 14 2;
44 29 14 2;
69 32 57 23;
69 31 49 15;
61 29 47 14;
60 29 45 15;
63 28 51 15;
55 42 14 2;
48 34 16 2];
Copiando y pegando en la ventana de comandos de Matlab y luego calculando los
estadísticos, se tiene:
% mínimo de cada columna
min(E)
ans = 44 23 14 2
% máximo de cada columna
max(E)
ans = 69 42 57 23
% media de cada columna
mean(E)
ans = 58.0000 29.7857 36.1429 10.9286
% moda de cada columna
mode(E)
ans = 55 29 14 2
% desviación estándar de cada columna
std(E)
ans = 7.9227 4.5940 17.1368 7.5393
33
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
var(E)
ans = 62.7692 21.1044 293.6703 56.8407
R es la matriz de las correlaciones entre las columnas de E. Por ejemplo, en la primera fila
están las correlaciones de la primera columna consigo misma (por eso sale 1) y con todas
las columnas restantes. La segunda fila son las correlaciones de la 2da columna con todas
las columnas y así sucesivamente.
Observaciones
a) El valor más alto de R es 𝑅(3,4)= 0.9795, que es la correlación entre las columnas x=3ra
y z=4ta, de la matriz E. De (7.6) el valor del ángulo entre los vectores unitarios de las
(𝑥−𝑀𝑥) (𝑧−𝑀𝑧)
traslaciones (vut), o sea entre: ‖𝑥−𝑀𝑥‖ 𝑦 ‖𝑧−𝑀𝑧‖
, viene a ser acos(0.9795)*180/pi= 11.62°.
¿Cuál es el ángulo entre las columnas originales 3 y 4 de E?, según la fórmula (2) de la
sección 6.1, el valor del ángulo es 10.6399°. Este resultado es parecido al de los vut.
b) El valor más bajo de R (en valor absoluto) es R(1,2)= -0.1564, que es el ángulo entre
los vut de la 1era y 2da columnas, cuyo valor es: acos(-0.1564)*180/pi= 98.99°
Se observa que para los valores de R cercanos a 1, el ángulo entre los vut es cercano a 0°
y para valores de R cercanos a 0, el valor del ángulo es cercano a 90°.
34
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
Ejercicios
1. Se tiene las siguientes operaciones con Matlab.
a=2:0.5:4.3
a = 2.00 2.50 3.00 3.50 4.00
b=[3, 4, 5, 6, 7.5]
b=3 4 5 6 7.5
a+b
ans = 5.00 6.50 8.00 9.50 11.50
a+b'
ans =
5.00 5.50 6.00 6.50 7.00
6.00 6.50 7.00 7.50 8.00
7.00 7.50 8.00 8.50 9.00
8.00 8.50 9.00 9.50 10.00
9.50 10.00 10.50 11.00 11.50
2. Sea la matriz:
1 0 0 0
2 3 0 0
𝐴=[ ]
1 5 2 0
6 2 7 4
Qué relación existe entre los polinomios característicos de 𝐴 y 𝐴𝑡
6. Para las columnas de la matriz E del ejercicio 5, calcule, el mínimo, máximo, la media,
la moda, la desviación estándar, la covarianza, la varianza y la correlación de Pearson
empleando los comandos de Matlab.
Con los estadísticos obtenidos elabore una tabla.
35
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.
7. Obtener los mismos estadísticos del ejercicio 6, pero empleando las definiciones
descritas en las secciones que van del 7.1 al 7.7.
9. En la siguiente matriz:
P=[0.6667 0.7873 1.2627 1.9802 1.4855 0.8758 0.6756 0.7262 1.0785 1.8368;
0.7873 0.6667 0.7873 1.2627 1.9802 1.4855 0.8758 0.6756 0.7262 1.0785;
1.4540 1.4540 2.0500 3.2429 3.4657 2.3613 1.5514 1.4018 1.8047 2.9153;
3.5747 3.6953 5.3627 8.4660 8.4169 5.5984 3.7784 3.5298 4.6879 7.6674;
-0.1206 0.1206 0.4754 0.7175 -0.4947 -0.6097 -0.2002 0.0506 0.3523 0.7583];
las filas representan las variables y las columnas los registros de una base de datos.
a) Calcule el mínimo, máximo, la media, la moda, la desviación estándar, la covarianza,
la varianza y la correlación para las 5 filas de la matriz P. Halle en grados sexagesimales
el ángulo que forman los vectores semi normalizados de las filas con la más alta y la más
baja correlación.
b) Con los estadísticos obtenidos en la parte (a) elabore una tabla.
BIBLIOGRAFIA
1. G. Strang. (1986) Álgebra lineal y sus aplicaciones. Edit. Addison–Wesley
Iberoamericana.
2. J.B. Fraleigh, R.A. Beauregard (1989). Algebra Lineal. Addison–Wesley
Iberoamericana.
3. MatLab (1995). Edición estudiante, Versión 4, guía de usuario. Ed. Prentice Hall.
4. Spiegel M. R.; Schiller J. Y Srinivasan E. A. (2013). Probabilidad y Estadística. Edit.
Mc Graw Hill.
5. Barry R. James. (2004). Probabilidad, un curso de nivel intermedio. Ed. IMCA.
6. Trevor Hastie, Robert Tibshirani, Jerome Friedman. (2008). The Elements of
Statistical Learning. Data Mining, Inference, and Prediction. Springer Series in
Statistics.
7. Christopher M. Bishop (2006). Pattern Recognition and Machine Learning. Springer
Science+Business Media, LLC.
36