Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

2 Valores y Vectores Propios Estadisticos 2024 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas

Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

CONTINUACIÓN DEL CAPÍTULO 1


CONTENIDO
5. VALORES Y VECTORES PROPIOS DE UNA MATRIZ
5.1 Definiciones
5.2 Matriz definida positiva
5.3 Relaciones entre los valores propios y los menores principales dominantes

6. ASPECTOS GEOMÉTRICOS DE LOS VECTORES


6.1 Ángulo entre dos vectores
6.2 Vectores ortogonales y paralelos

7. ALGUNOS ESTADÍSTICOS CON MATLAB


7.1 Media, media vectorial, moda, mínimo y máximo de un vector
7.2 Desviación estándar o típica
7.3 Covarianza de dos vectores
7.4 Varianza de un vector
7.5 Dispersión de un vector
7.6 Coeficiente de correlación de Pearson de dos vectores
7.7 Estadísticos de las columnas de una matriz aplicando Matlab

5. VALORES Y VECTORES PROPIOS DE UNA MATRIZ


5.1 Definiciones
Un vector 𝑢 ≠ 0 es vector propio (o auto vector) de una matriz 𝐴de orden nxn si existe un
escalar 𝑡 tal que se cumple la ecuación 𝐴𝑢 = 𝑡𝑢. Al escalar 𝑡 se le denomina valor propio
(o auto valor) correspondiente al vector propio 𝑢.
La existencia de vectores propios de 𝐴 es equivalente a la singularidad de la matriz 𝐴 − 𝑡𝐼
, esto es 𝑑𝑒𝑡( 𝐴 − 𝑡𝐼) = 0. Este determinante se llama Polinomio característico de la
matriz 𝐴 y se denota 𝑃𝐴 (𝑡) = 𝑑𝑒𝑡( 𝐴 − 𝑡𝐼).

Ejemplo 1
3 1 3−𝑡 1
Sea la matriz 𝐴 = [ ] . El polinomio característico es 𝑃𝐴 (𝑡) = | |, esto es:
6 2 6 2−𝑡
𝑃𝐴 (𝑡) = (3 − 𝑡)(2 − 𝑡) − 6 = 6 − 5𝑡 + 𝑡 2 − 6 = 𝑡 2 − 5𝑡 = 0. Las raíces 𝑡 = 5, 𝑡 = 0
son los valores propios de la matriz A.
Los vectores propios correspondientes a estos valores propios, se obtienen resolviendo:
3 1 𝑥 𝑥 3 1 𝑥 0
(1)[ ][ ] = 5[ ] y (2) [ ][ ] = [ ] respectivamente.
6 2 𝑦 𝑦 6 2 𝑦 0

22
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

3𝑥 + 𝑦 = 5𝑥 𝑦 = 2𝑥 𝑦 = 2𝑥
De (1) se pasa a: { →{ →{ luego la recta 𝐸1 : 𝑦 = 2𝑥 es el
6𝑥 + 2𝑦 = 5𝑦 2𝑥 = 𝑦 0=0
conjunto solución de (1).
Similarmente la solución de (2) es la recta 𝐸2 : 𝑦 = −3𝑥. En ambos casos hay infinitas
soluciones y son las rectas 𝐸1 : 𝑦 = 2𝑥 y 𝐸2 : 𝑦 = −3𝑥 . Estas rectas se denominan
Espacios propios o Auto espacios correspondientes a los valores propios 𝑡 = 5, 𝑡 = 0
respectivamente.
Un miembro de 𝐸1 es por ejemplo 𝑢 = (1,2) y satisface 𝐴𝑢 = 5𝑢. De la misma forma 𝑣 =
(1, −3) es miembro de 𝐸2 y satisface 𝐴𝑢 = 0𝑢.
1 2 3 4
1 4 9 16
Ejemplo 2 Sea la matriz 𝐴 = [ ]
1 8 27 64
1 32 81 256
El polinomio característico de esta matriz es de cuarto grado y sería sumamente
complicado calcular manualmente sus raíces, pero con la ayuda del MATLAB se
puede seguir paso a paso el procedimiento.
Primero se ingresa a Matlab la matriz 𝐴:
A =[1 2 3 4;
1 4 9 16;
1 8 27 64;
1 32 81 256]
a) Primer camino
Se calculan los coeficientes del polinomio característico con el comando poly(A).
format bank;
pc=poly(A)
pc =
1.00 -288.00 2554.00 -4980.00 1440.00
esto indica que el polinomio es: 𝑡 4 − 288𝑡 3 + 2554𝑡 2 − 4980𝑡 + 1440
Se calculan las raíces del polinomio con el comando roots
roots(pc)
ans =
278.9068
6.4531
2.2908
0.3493

23
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

b) Segundo camino
Cálculo simultáneo de valores propios y vectores propios de una matriz con el
comando eig de MATLAB
A = [1 2 3 4;
1 4 9 16;
1 8 27 64;
1 32 81 256];

[U,E]=eig(A)

U=
-0.0170 -0.3654 -0.9529 -0.6829
-0.0644 -0.6145 0.2736 -0.7202
-0.2477 -0.6374 0.1126 0.1072
-0.9665 0.2872 -0.0662 0.0593
E=

278.9068 0 0 0
0 6.4531 0 0
0 0 0.3493 0
0 0 0 2.2908
Las columnas de la matriz U son los vectores propios de A y los correspondientes valores
propios están en la diagonal de la matriz E. Así por ejemplo la última columna de U es:
u=U(:,4)
u=
-0.6829
-0.7202
0.1072
0.0593
corresponde al valor propio t=E(4,4)=2.2908, que es el último término de la matriz
diagonal E. Esto quiere decir que se satisface la ecuación: A*u=t*u

5.2 Matriz definida positiva


Definición
Una matriz simétrica 𝐴 es definida positiva si todos sus valores propios son positivos.
Ejemplo 3
A =[20 2 3 4;
2 14 9 6;
3 9 27 4;
4 6 4 56]

Calculando con la ayuda de MATLAB se tiene su polinomio característico


format bank
pc=poly(A)

24
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

pc = 1 -117 4452 -65370 307716

Esto quiere decir que 𝑝𝐴 (𝑡) = 𝑡 4 − 117𝑡 3 + 4452𝑡 2 − 65370𝑡 + 307716, cuyas raíces
son
roots(pc)
ans =
58.36
30.67
18.85
9.12
todas son positivas. Entonces como A es simétrica y tiene todos sus valores propios
positivos, luego es definida positiva.
Desde el punto de vista matemático, las matrices definidas positivas, presentan propiedades
que son extraordinariamente bellas y sorprendentes. Entre ellas están, las distintas formas
de caracterización. En el siguiente teorema mencionamos solo dos de ellas por ser de
utilidad en el curso.

5.3 Relaciones entre los valores propios y los menores principales dominantes
Teorema 1
Dada una matriz simétrica 𝐴, las siguientes afirmaciones son equivalentes:
a) 𝐴 es definida positiva (todos sus valores propios son positivos).
b) Todos los menores principales dominantes de 𝐴 son positivos.
Ejemplo 4
2 −1 0
a) La matriz 𝐵 = [−1 2 − 1]cumple con estas condiciones porque es simétrica y sus
0−1 2
menores principales dominantes son positivos:
2 −1 0
2 −1
𝐻1 = 2 ; 𝐻2 = | | = 3; 𝐻3 = |−1 2 − 1| = 4
−1 2
0 −1 2
De otro lado sus valores propios de B son todos positivos: r =3.4142; 2.0000; 0.5858

b) Consideremos la matriz del ejemplo 3


A =[20 2 3 4;
2 14 9 6;
3 9 27 4;
4 6 4 56];
Los menores principales dominantes de A, son los determinantes de las sub matrices:
A1=20; A2=A(1:2,1:2); A3=A(1:3,1:3); A4=A;
H1=A1; H2=det(A2); H3=det(A3);H4=det(A4);
Tb=[H1, H2, H3, H4]
Tb =

25
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

20.00 276.00 5814.00 307716.00


En consecuencia para esta matriz se cumple el Teorema 1 del parágrafo 5.3

Ejercicios
1. Siguiendo los pasos del ejemplo 1, halle el polinomio característico, los valores y
3 1
vectores propios de la matriz: 𝐴 = [ ]
6 2

6 −1 1
2. Para la siguiente matriz 𝐴 = [−1 5 − 3] y empleando Matlab
1 −3 9

a) Escriba el polinomio característico de A.


b) Halle los valores y vectores propios de la matriz 𝐴.
c) Verificar que los vectores propios son ortogonales y unitarios.
d) Examine si la matriz 𝐴 es definida positiva, calculando sus menores principales
dominantes. Emplear el teorema 1 para justificar lo mismo.

9−2−1−2
−2 9 − 2 − 1
3. Se tiene la siguiente matriz 𝐴 = [ ] desarrolle lo siguiente:
−1 − 2 9 − 2
−2 − 1 − 2 9

a) Escriba el polinomio característico de A.


b) Halle los valores propios de la matriz 𝐴.
c) Verificar que los vectores propios son ortogonales
c) Examine si la matriz 𝐴 es definida positiva, calculando sus menores principales
dominantes.
2 0 0
4. En la matriz 𝐵 = [0 𝑎 3] cuáles son los valores de “a” para que la matriz sea definida
0 𝑎 𝑎
positiva.

5. Con la ayuda del siguiente programa genere una matriz A de 5x5 donde las
componente A(i,j) son funciones de los enteros (i,j)
n=5;
for i=1:n
for j=1:n
A(i,j)=2/(2+cos(i-j));
end
end
disp(A)
luego desarrolle lo que sigue:
a) Halle los valores y vectores propios de la matriz A.
b) Halle los menores principales dominantes ¿se cumple el Teorema 1 de la sección 5.3?

26
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

c) Examine si la matriz 𝐵 = 𝐴 ∗ 𝐴𝑡 es definida positiva, calculando los valores propios y


por otro lado sus menores principales dominantes.

6. Para la matriz B de ejercicio 5, ¿se cumple el Teorema 1 de la sección 5.3?

6. ASPECTOS GEOMÉTRICOS DE LOS VECTORES


6.1 Ángulo entre dos vectores
La representación gráfica de dos vectores no nulos en el plano, permite deducir la
relación que existe entre el producto interno y el ángulo que forman estos.

Proposición 1
Sean 𝑥 e 𝑦 dos vectores no nulos del plano, con
origen en el origen de coordenadas, donde 𝜃 es el
ángulo entre 𝑥 e 𝑦. Entonces la relación entre el
producto interno y el ángulo 𝜃 es:
𝑥 𝑦
(1) cos(𝜃)=< < ||𝑥|| , ||𝑦|| > donde 0 ≤ θ ≤ π

Demostración
a) Supuesto que los vectores 𝑥 e 𝑦 son unitarios, esto es: ‖𝑦‖ = ‖𝑥 ‖ = 1
En los triángulos de la Fig.1 se tiene las siguientes relaciones:
c= cos(α+θ); d= sen(α+θ); a=cos(α); b=sen(α), reemplazando en el producto
< x , y >= 𝑎𝑐 + 𝑏𝑑= cos(α) cos(α+θ) + sen(α) sen(α+θ)
= cos(α+θ) cos(α) + sen(α+θ) sen(α)
como cos(A - B)=cos(A)cos(B) + sen(A)sen(B), entonces
< 𝑥 , 𝑦 >= cos(α+θ - α)= cos(θ); finalmente se tiene
cos(θ)= < 𝑥 , 𝑦 >

b) Cuando 𝑥 e 𝑦 no son unitarios, se aplica la parte (a) a los vectores unitarios


𝑥 𝑦
, y el resultado es (1).
||𝑥|| ||𝑦||

c) El valor del ángulo θ en radianes y en grados sexagesimales


El coseno restringido al intervalo [0, π] es una función estrictamente decreciente y aplica
biunívocamente este intervalo sobre el intervalo [-1 , 1] (Fig. 2). Su inversa: arco
coseno, escrito como acos (Fig. 3), también aplica biunívocamente el intervalo [-1, 1]
sobre [0, π]. Estas afirmaciones se ilustran en los diagramas que siguen.
cos: [0, π] →[-1, 1] y acos: [-1, 1] →[0, π]

Las dos funciones son biunívocas y en esta medida queda perfectamente definido el valor
de θ, como un punto del intervalo [0, π], medido en radianes y se obtiene haciendo uso de
la inversa del coseno, esto es:
<𝑥 , 𝑦>
(2) 𝜃 = 𝑎𝑐𝑜𝑠( ||𝑥||||𝑦||) donde 0 ≤ θ ≤ π

27
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

Fig. 2 Fig. 3

d) La relación entre radianes y grados sexagesimales


Esta relación es como sigue: θ radianes es igual a (θ*180/π)° grados sexagesimales

Ejemplo1
Sean los vectores
x=[3,4] y=[2,-3].
Entonces el ángulo que forman estos vectores, según (2) y con la ayuda de Matlab es:
ang=acos(dot(x,y)/(norm(x)*norm(y)))
ang = 1.9101 radianes, de aquí en grados sexagesimales
ang*180/pi
ans= 109.44°

La relación (1) se extiende para vectores de ℜ𝑛 y es de gran ayuda para entender las
nociones de perpendicularidad, paralelismo y correlación de vectores en los espacios
vectoriales de mayor dimensión.

6.2 Vectores ortogonales y paralelos


Las definiciones formales de ortogonalidad y paralelismo de vectores, son independientes
de la noción de ángulo entre ellos; pero cuando se asocian a las ideas gráficas toman un
sentido más completo desde el punto de vista conceptual.
a) Definición
Dos vectores 𝑥, 𝑦 son ortogonales o perpendiculares si su producto interno es
< 𝒙 , 𝒚 >= 𝟎.
Esta definición viene de la noción geométrica de ortogonalidad de dos vectores no nulos
y es cuando estos forman un ángulo de 90° grados sexagesimales o π/2 radianes. En
<𝑥 , 𝑦>
efecto tomando en cuenta la fórmula (1) se tiene: ||𝑥||||𝑦|| = cos(π/2) = 0 y como los
vectores son no nulos se concluye que < 𝑥 , 𝑦 >= 0

Ejemplo2
x=[-1, 2, 3, 4] ; y=[2,1,-4,3] ;

28
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

son ortogonales, pues el producto interno es nulo; en efecto < 𝑥 , 𝑦 >=-2+2-12+12=0 y


el ángulo que forman debe ser π/2 radianes. En efecto
ang=acos(dot(x,y)/(norm(x)*norm(y)));
ang*180/pi
ans= 90°

b) Definición
Dos vectores 𝑥, 𝑦 no nulos, son paralelos si existe un número 𝛼, tal que 𝒚 = 𝜶𝒙

b1) También en este caso, la definición viene de la idea gráfica. En efecto dos vectores
son paralelos si el ángulo entre ellos es 0 o π. De la fórmula (1) y tomando en cuenta que
𝑥 = (𝑥1 , 𝑥2 ) , 𝑦 = (𝑦1 , 𝑦2 ) son no nulos se desprende que: 𝑥1 𝑦2 = 𝑦1 𝑥2 de aquí se
deduce que si 𝑥1 = 0 necesariamente tiene que ser 𝑦1 = 0, consecuentemente 𝑥2 ≠ 0 y
𝑦 𝑦
𝑦2 ≠ 0, entonces 𝑥 = (0, 𝑥2 ) , 𝑦 = (0, 𝑦2 ), como 𝑦2 = 𝑥2 𝑥2 tomando 𝛼 = 𝑥2 se satisface
2 2
la definición de paralelismo 𝑦 = 𝛼𝑥.

b2) Recíprocamente si los vectores satisfacen la definición de paralelismos, entonces el


ángulo que forman es 0 o 𝜋, (0° o 90° sexagesimales). En efecto reemplazando 𝑦 = 𝛼𝑥
en (1)
Se tiene:
−1 𝑠𝑖 𝛼 < 0
𝛼 𝑥 𝑥 𝛼
𝑐𝑜𝑠( 𝜃) = |𝛼| < ||𝑥|| , ||𝑥|| >= |𝛼| = 𝑠𝑖𝑔(𝛼) = { 0 𝑠𝑖 𝛼 = 0 .
1 𝑠𝑖 𝛼 > 0

Si 𝛼 es positivo se tiene 𝑐𝑜𝑠( 𝜃) = 1, luego por (2) 𝜃 = 0 y de aquí los vectores son
paralelos y tienen la misma dirección.
Si 𝛼 es negativo sale 𝑐𝑜𝑠( 𝜃) = −1, luego 𝜃 = 𝜋, entonces los vectores son paralelos y
con direcciones opuestas.

Ejemplo3
x=[-1, 2, 3, 4] ; y=[-2,4,6, 8] ;
son paralelos porque y=2x y de otro lado empleando (1) el coseno del ángulo entre ellos
es:
co=dot(x,y)/(norm(x)*norm(y)) % co=cos(𝜃)
co =1.000
de aquí tomando el arco coseno de co=1, se tiene
ang =acos(co) % ang=𝜃
ang =0

7. ALGUNOS ESTADÍSTICOS CON MATLAB


7.1 Media, media vectorial, moda, mínimo y máximo de un vector
Sea 𝑥 = (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) un vector. Entonces
1
a) 𝑚𝑥 = 𝑛 ∑𝑛𝑖=1 𝑥𝑖 , es la media de x. En Matlab la media se obtiene con el comando
mean(x).

29
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

b) 𝑀(𝑥) = (𝑚𝑥, . . . , 𝑚𝑥) (es un vector constante, que lo denotamos brevemente con
𝑀(𝑥) = 𝑀𝑥 y lo denominamos media vectorial).
En Matlab se obtiene haciendo:
Mx=mean(x)*ones(1,n) % matriz fila
Mx=mean(x)*ones(n, 1) % matriz columna

c) La moda de x es el término de mayor frecuencia. En Matlab x puede ser fila o


columna. La moda se obtiene con el comando mode(x).

d) El mínimo y máximo de un vector x. En Matlab x debe ser una matriz fila y en este
caso el comando es minmax(x). Si x es una columna, el resultado es erroneo.

7.2 Desviación estándar o típica


Sea 𝑥 = (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) un vector.
Existen dos tipos de desviación estándar, que difieren solo por el divisor (ponderado)
1
1 2 2 1
(1) 𝑠𝑡𝑑(𝑥, 0) = (𝑛−1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑚𝑥) ) = ‖𝑥 − 𝑀𝑥 ‖ ,
√𝑛−1
1
1 2 1
(2) 𝑠𝑡𝑑(𝑥, 1) = (𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑚𝑥)2 ) = ‖𝑥 − 𝑀𝑥 ‖
√𝑛

Matlab usa la fórmula (1) y su comando es std(x,0)=std(x), independientemente de que x


sea una matriz fila o columna.
La desviación estándar de un vector es pues, la distancia ponderada, del vector a su media
vectorial.

7.3 Covarianza de dos vectores


a) Definiciones
Sean 𝑥 = (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) y 𝑦 = (𝑦1 , 𝑦2 , . . . , 𝑦𝑛 ) dos vectores. Existen dos definiciones
de covarianza, que difieren solo por el ponderado.
1 1
(1) 𝑐𝑜𝑣( 𝑥, 𝑦) = ∑𝑛𝑘=1(𝑥𝑘 − 𝑚𝑥)(𝑦𝑘 − 𝑚𝑦) = < 𝑥 − 𝑀𝑥, 𝑦 − 𝑀𝑦 >
(𝑛−1) (𝑛−1)
La segunda definición solo cambia de ponderado
1
(2) cov(x, y,1) = 𝑛 < 𝑥 − 𝑀𝑥 , 𝑦 − 𝑀𝑦 >
Matlab usa la fórmula (1): cov(x, y), independientemente de que x, y sean matrices fila o
columna.

b) Covarianza: paralelismo y ortogonalidad de vectores


De (1) se tiene: <𝑥 − 𝑀𝑥 , 𝑦 − 𝑀𝑦 >= (||𝑥 − 𝑀𝑥||)(||𝑦 − 𝑀𝑦||) 𝑐𝑜𝑠( 𝜃), donde 𝜃 es el
ángulo entre los vectores (𝑥 − 𝑀𝑥) y (𝑦 − 𝑀𝑦). Entonces tomando en cuenta que el
máximo valor de cos(𝜃) es 1 y el mínimo (-1), se concluye que:
(||𝑥−𝑀𝑥||)(||𝑦−𝑀𝑦||)
El máximo valor de 𝑐𝑜𝑣( 𝑥, 𝑦) es y se da cuando 𝜃 = 0, es decir
(𝑛−1)
cuando los vectores (𝑥 − 𝑀𝑥) y (𝑦 − 𝑀𝑦) son paralelos y tienen la misma dirección.

(||𝑥−𝑀𝑥||)(||𝑦−𝑀𝑦||)
El menor valor de 𝑐𝑜𝑣( 𝑥, 𝑦) será − y se da cuando 𝜃 = 𝜋, esto es
(𝑛−1)
cuando los vectores (𝑥 − 𝑀𝑥) y (𝑦 − 𝑀𝑦) son paralelos y con direcciones opuestas.

30
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

La covarianza 𝑐𝑜𝑣( 𝑥, 𝑦) =0, ocurre cuando los vectores (𝑥 − 𝑀𝑥) y (𝑦 − 𝑀𝑦) son
ortogonales, esto es cuando 𝜃 = 𝜋/2 .
Conclusiones similares se tienen para 𝑐𝑜𝑣( 𝑥, 𝑦, 1).

7.4 Varianza de un vector


La varianza de un vector 𝑥 es la covarianza de 𝑥 consigo mismo. Es decir, la varianza de
𝑥 es:
1 ‖𝑥−𝑀𝑥‖2
(1) 𝑣𝑎𝑟( 𝑥, 0) = 𝑐𝑜𝑣( 𝑥, 𝑥, 0) = (𝑛−1) < 𝑥 − 𝑀𝑥 , 𝑥 − 𝑀𝑥 >= (𝑛−1)
De (1) se observa que la varianza de un vector es igual a su desviación estándar al
cuadrado, esto es 𝑣𝑎𝑟( 𝑥, 0) = [𝑠𝑡𝑑(𝑥, 0)]2
Similarmente para 𝑣𝑎𝑟( 𝑥, 1) = 𝑐𝑜𝑣( 𝑥, 𝑥, 1).
Matlab usa la fórmula (1) y el comando es var(x,0)=var(x), donde x puede ser una matriz
fila o columna.

7.5 Dispersión de un vector


Definición
Sea 𝑥 = (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) un vector y 𝑀𝑥 su media vectorial. Entonces:
La suma de cuadrados o dispersión de 𝑥 es la función 𝐷(𝑥) = ‖𝑥 − 𝑀𝑥 ‖2 .

Observaciones
De (7.5) se desprende que:
𝐷(𝑥) = (𝑛 − 1) ∗ 𝑣𝑎𝑟(𝑥)
𝐷(𝑥) = 𝑛 ∗ 𝑣𝑎𝑟(𝑥, 1)

7.6 Coeficiente de correlación de Pearson de dos vectores


Sean 𝑥 = (𝑥1 , 𝑥2 , . . . , 𝑥𝑚 ) y 𝑦 = (𝑦1 , 𝑦2 , . . . , 𝑦𝑚 ) dos vectores. Entonces el Coeficiente
de correlación entre los vectores 𝑥, 𝑦 se define como
𝑐𝑜𝑣(𝑥,𝑦)
(1) 𝑅 = 𝑐𝑜𝑣(𝑦,𝑦)
√𝑐𝑜𝑣(𝑥,𝑥)
Tomando en cuenta las fórmulas (1) de (7.3), reemplazando y simplificando en R se
tiene:
<𝑥−𝑀𝑥 ,𝑦−𝑀𝑦> (𝑥−𝑀𝑥) (𝑦−𝑀𝑦)
(2) 𝑅 = ‖𝑥−𝑀𝑥‖‖𝑦−𝑀𝑦‖ =< ‖𝑥−𝑀𝑥‖ , ‖𝑦−𝑀𝑦‖ >

En Matlab la correlación entre dos vectores 𝑥, 𝑦 lo da la función: corrcoef(x, y),


independientemente de que x, y sean matrices fila o columna.

Observaciones importantes
a) En la definición de R se tomó 𝑐𝑜𝑣( 𝑥, 𝑦), pero también se podría haber tomado la
fórmula (2) de 7.3, que tiene otro ponderado; pero cualquiera que sea el ponderado, este
se simplifica.
b) De la sección (6.1) se deduce que 𝑅 = 𝑐𝑜𝑠( 𝜃), donde 0 ≤ 𝜃 ≤ 𝜋, es el ángulo que
(𝑥−𝑀𝑥) (𝑦−𝑀𝑦)
forman los vectores unitarios de las traslaciones de 𝑥, 𝑦 esto es: ‖𝑥−𝑀𝑥‖ y ‖𝑦−𝑀𝑦‖.
De aquí −1 ≤ 𝑅 ≤ 1

31
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

c) Correlación de Pearson su relación con el paralelismo y la ortogonalidad de


vectores
c1) Cuando los vectores 𝑥, 𝑦 son paralelos (no nulos), entonces 𝑅 = ±1
En efecto si 𝑥, 𝑦 son paralelos entonces existe un 𝛼 ≠ 0, tal que 𝑦 = 𝛼𝑥.
Reemplazando 𝑦 = 𝛼𝑥 en (2) se tiene
(𝑥−𝑀𝑥) (𝛼𝑥−𝑀𝛼𝑥) 𝛼 1 𝑠𝑖 𝛼 > 0
𝑅 =< ‖𝑥−𝑀𝑥‖ , ‖𝛼𝑥−𝑀𝛼𝑥‖ >= |𝛼| = {
−1 𝑠𝑖 𝛼 < 0

Cuando 𝑥, 𝑦 tienen la misma dirección, esto es 𝛼 > 0 , entonces 𝑅 = 1.


Cuando tienen direcciones contrarias, o sea 𝛼 < 0 , entonces 𝑅 = −1.

c2) Recíprocamente si 𝑅 = ±1 se puede afirmar, en base a las observaciones de la


sección 6.2, que los vectores unitarios de las traslaciones de x, y, que definen 𝑅 son
paralelos.

c3) Si 𝑅 = 0, también por 6.2 se concluye que los vectores unitarios de las traslaciones
de x, y, que definen 𝑅 son ortogonales.

7.7 Estadísticos de las columnas de una matriz aplicando Matlab


Sean 𝑋 = [𝑋1 , 𝑋2 , . . . , 𝑋𝑚 ], una matriz con m columnas 𝑋𝑘 , donde las columnas son
vectores de ℜ𝑛 Entonces:

a) min(X) es una matriz fila de m componentes, con los mínimos de cada columna.
b) max(X) es una matriz fila de m componentes, con los máximos de cada columna.
c) mean(X) es una matriz fila de m componentes, con los promedios de cada columna.
d) mode(X) es una matriz fila de m componentes, con las modas de cada columna.
e) std(X) es una matriz fila de m componentes, con las desviaciones estándar de cada
columna.
f) var(X) es una matriz fila de m componentes, con las varianzas de cada columna
g) cov(X) es una matriz de mxm con las covarianzas de todas las m columnas tomadas de
dos en dos. Es decir, la primera componente de la primera fila de la matriz cov(X) estará
formada por la covarianza de 𝑋1 consigo mismo, es decir la varianza de 𝑋1 . La segunda
componente será la covarianza de 𝑋1 con 𝑋2 , la tercera será la covarianza de 𝑋1 con 𝑋3 ,
así sucesivamente. La última será la covarianza de 𝑋1 con 𝑋𝑚 . La segunda fila de cov(X)
tiene una estructura similar. La diagonal de la matriz cov(X) esta formada por las
varianzas de cada columna de X.
h) corrcoef(X) es una matriz de mxm con los coeficientes de correlación de todas las m
columnas tomadas de dos en dos. La primera componente de la primera fila de
corrcoef(X) es la correlación de la columna 𝑋1 consigo misma, que es 1. La segunda
componente es la correlación de 𝑋1 con 𝑋2 , la tercera será la correlación de 𝑋1 con 𝑋3 ,
así sucesivamente. La última será la correlación de 𝑋1 con 𝑋𝑚 . La segunda fila de
corrcoef(X) se desarrolla en forma similar a la primera.

32
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

La diagonal de la matriz corrcoef(X) está formada por unos por que son las correlaciones
de cada columna consigo misma.

Ejemplo 1
Consideremos la matriz:
E =[64 28 56 22;
55 23 40 13;
50 30 16 2;
63 23 44 13;
62 29 43 13;
49 30 14 2;
44 29 14 2;
69 32 57 23;
69 31 49 15;
61 29 47 14;
60 29 45 15;
63 28 51 15;
55 42 14 2;
48 34 16 2];
Copiando y pegando en la ventana de comandos de Matlab y luego calculando los
estadísticos, se tiene:
% mínimo de cada columna
min(E)
ans = 44 23 14 2
% máximo de cada columna
max(E)
ans = 69 42 57 23
% media de cada columna
mean(E)
ans = 58.0000 29.7857 36.1429 10.9286
% moda de cada columna
mode(E)
ans = 55 29 14 2
% desviación estándar de cada columna
std(E)
ans = 7.9227 4.5940 17.1368 7.5393

%covarianzas entre las columnas de X, es una matriz de 4x4


cov(E)
ans =
62.7692 -5.6923 123.6923 52.8462
-5.6923 21.1044 -34.4286 -13.4011
123.6923 -34.4286 293.6703 126.5495
52.8462 -13.4011 126.5495 56.8407

% varianzas de cada columna de X, es igual a la diagonal de cov(E)

33
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

var(E)
ans = 62.7692 21.1044 293.6703 56.8407

% Según (7.5), la Dispersión de cada columna de X=(n-1)*var(E)


Dip= 816.0 274.4 3817.7 738.9

R = corrcoef(E) % matriz de 4x4 con las correlaciones entre las columnas de X


R=
1.0000 -0.1564 0.9110 0.8847
-0.1564 1.0000 -0.4373 -0.3869
0.9110 -0.4373 1.0000 0.9795
0.8847 -0.3869 0.9795 1.0000

R es la matriz de las correlaciones entre las columnas de E. Por ejemplo, en la primera fila
están las correlaciones de la primera columna consigo misma (por eso sale 1) y con todas
las columnas restantes. La segunda fila son las correlaciones de la 2da columna con todas
las columnas y así sucesivamente.
Observaciones
a) El valor más alto de R es 𝑅(3,4)= 0.9795, que es la correlación entre las columnas x=3ra
y z=4ta, de la matriz E. De (7.6) el valor del ángulo entre los vectores unitarios de las
(𝑥−𝑀𝑥) (𝑧−𝑀𝑧)
traslaciones (vut), o sea entre: ‖𝑥−𝑀𝑥‖ 𝑦 ‖𝑧−𝑀𝑧‖
, viene a ser acos(0.9795)*180/pi= 11.62°.
¿Cuál es el ángulo entre las columnas originales 3 y 4 de E?, según la fórmula (2) de la
sección 6.1, el valor del ángulo es 10.6399°. Este resultado es parecido al de los vut.

b) El valor más bajo de R (en valor absoluto) es R(1,2)= -0.1564, que es el ángulo entre
los vut de la 1era y 2da columnas, cuyo valor es: acos(-0.1564)*180/pi= 98.99°
Se observa que para los valores de R cercanos a 1, el ángulo entre los vut es cercano a 0°
y para valores de R cercanos a 0, el valor del ángulo es cercano a 90°.

c) ¿Cuál es el ángulo entre las columnas originales 3 y 4 de E?


Según la fórmula (2) de la sección 6.1, el valor del ángulo es 10.6399°; este resultado es
parecido al que se obtiene en (a).

d) De otro lado el ángulo entre las columnas originales 1 y 2 de E es 12.1294°. muy


diferente a lo que se obtiene en (b), que es de 98.99°. Esta situación de debe a que las
componentes de los vut de las columnas 1 y 2 tienen signos negativos y otros negativos,
a diferencia de los originales, donde todos son positivos.
En la tabla que sigue se resumen los resultados de los ángulos y cosenos.
Tabla
Columnas: 3, 4 Columnas: 1, 2
Originales Pearson Originales Pearson
Coseno= 0.9828 0.9795 0.9777 -0.1564
Ángulo= 10.6399° 11.6238° 12.1294° 98.9978°

34
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

Ejercicios
1. Se tiene las siguientes operaciones con Matlab.
a=2:0.5:4.3
a = 2.00 2.50 3.00 3.50 4.00

b=[3, 4, 5, 6, 7.5]
b=3 4 5 6 7.5

a+b
ans = 5.00 6.50 8.00 9.50 11.50

a+b'
ans =
5.00 5.50 6.00 6.50 7.00
6.00 6.50 7.00 7.50 8.00
7.00 7.50 8.00 8.50 9.00
8.00 8.50 9.00 9.50 10.00
9.50 10.00 10.50 11.00 11.50

a) Describa literalmente el significado de: a, b, b', a+b, a+b'


b) Cuáles de las operaciones a responden a definiciones matemáticas?
c) Que operaciones no son matemáticas y solo responden a la sintaxis de Matlab?

2. Sea la matriz:
1 0 0 0
2 3 0 0
𝐴=[ ]
1 5 2 0
6 2 7 4
Qué relación existe entre los polinomios característicos de 𝐴 y 𝐴𝑡

3. Si 𝐵 = 𝐴 + 𝐴𝑡 , verificar que (𝐴𝐵)𝑡 = 𝐵𝑡 𝐴𝑡

4. Examine si A y B son matrices invertibles. En caso lo sean verificar que si se cumple:


(𝐴𝐵)−1 = 𝐵−1 𝐴−1 y (𝐴−1 )𝑡 = (𝐴𝑡 )−1

5. Descargue la siguiente base de datos de Matlab, copiando y pegando en la ventana de


comandos: load fisheriris;
Se generan dos matrices: meas (medidas) y species (especies). Guardar la matriz de las
medidas en D. A la matriz de las especies hacerle corresponder una matriz columna F,
asignado el valor 1 a la especie Setosa, 2 a Versicolor y 3 a Virginica. Esto se puede lograr
copiando y pegando el siguiente código: U=ones(50,1); F=[U;2*U;3*U]. Luego tome la
matriz E=[D, F].

6. Para las columnas de la matriz E del ejercicio 5, calcule, el mínimo, máximo, la media,
la moda, la desviación estándar, la covarianza, la varianza y la correlación de Pearson
empleando los comandos de Matlab.
Con los estadísticos obtenidos elabore una tabla.

35
Universidad Nacional de Ingeniería - Facultad de Ingeniería Industria y de Sistemas
Sección de Post Grado. Doctorado de la FIIS. Curso: Aplicaciones Cuantitativas para la Investigación.
Pedro C. Espinoza H.

7. Obtener los mismos estadísticos del ejercicio 6, pero empleando las definiciones
descritas en las secciones que van del 7.1 al 7.7.

8. La correlación de Pearson de las 5 columnas de E se obtienen cuasi normalizándolas.


Escriba estas columnas y con ellas calcule el ángulo que forman las que tienen la mayor
correlación y también para las que tienen la correlación más baja (escribir en grados
sexagesimales).

9. En la siguiente matriz:
P=[0.6667 0.7873 1.2627 1.9802 1.4855 0.8758 0.6756 0.7262 1.0785 1.8368;
0.7873 0.6667 0.7873 1.2627 1.9802 1.4855 0.8758 0.6756 0.7262 1.0785;
1.4540 1.4540 2.0500 3.2429 3.4657 2.3613 1.5514 1.4018 1.8047 2.9153;
3.5747 3.6953 5.3627 8.4660 8.4169 5.5984 3.7784 3.5298 4.6879 7.6674;
-0.1206 0.1206 0.4754 0.7175 -0.4947 -0.6097 -0.2002 0.0506 0.3523 0.7583];

las filas representan las variables y las columnas los registros de una base de datos.
a) Calcule el mínimo, máximo, la media, la moda, la desviación estándar, la covarianza,
la varianza y la correlación para las 5 filas de la matriz P. Halle en grados sexagesimales
el ángulo que forman los vectores semi normalizados de las filas con la más alta y la más
baja correlación.
b) Con los estadísticos obtenidos en la parte (a) elabore una tabla.

BIBLIOGRAFIA
1. G. Strang. (1986) Álgebra lineal y sus aplicaciones. Edit. Addison–Wesley
Iberoamericana.
2. J.B. Fraleigh, R.A. Beauregard (1989). Algebra Lineal. Addison–Wesley
Iberoamericana.
3. MatLab (1995). Edición estudiante, Versión 4, guía de usuario. Ed. Prentice Hall.
4. Spiegel M. R.; Schiller J. Y Srinivasan E. A. (2013). Probabilidad y Estadística. Edit.
Mc Graw Hill.
5. Barry R. James. (2004). Probabilidad, un curso de nivel intermedio. Ed. IMCA.
6. Trevor Hastie, Robert Tibshirani, Jerome Friedman. (2008). The Elements of
Statistical Learning. Data Mining, Inference, and Prediction. Springer Series in
Statistics.
7. Christopher M. Bishop (2006). Pattern Recognition and Machine Learning. Springer
Science+Business Media, LLC.

36

También podría gustarte