Regresion Lineal
Regresion Lineal
Regresion Lineal
Y =ax+ b (1.1)
Figura 1.1. Representación de dos series de datos. ¿Cuál aproxima mejor una
relación lineal entre las variables x e y?
1.2. Función Potencial
y=a xb (1.2)
Transformación de variable
x ¿= xb y¿= y
x ¿= x y ¿ = y 1/ b
y también habríamos obtenido una relación lineal entre las nuevas variables
representadas ( x ¿ , y ¿ )=(x , y 1 /b )(x*, y*).
Hemos visto cómo elegir las nuevas variables con el fin de llevar la
representación gráfica a una representación lineal. Lo que hemos propuesto es
la transformación de las variables y la representación de las nuevas. Una
manera alternativa de análisis es recurrir a gráficos en los que sus ejes tengan
escalas logarítmicas.
Y = A +bX (1.5)
Observando la figura 1.3 podemos darnos cuenta que las escalas logarítmicas
son "más democráticas" que las lineales, puesto que dejan ocupar el mismo
espacio en el gráfico a los intervalos entre décadas entre valores "pequeños"
que el espacio ocupado por los intervalos entre décadas entre valores
"grandes". Podemos ver, por ejemplo, que el lugar reservado para los valores
entre 10-5 y 10-4 es idéntico al reservado para el intervalo 10 8 y 109. Si las
variables x e y se representan ambas en escalas logarítmicas, la función
potencial de la ecuación (1.2) quedará representada por una recta cuya
pendiente es b y cuya ordenada al origen ord=log (a), por lo que a=10ord .
M =M ´ ± ΔM
y ´=a+bx ´ (1.12)
( xy )´ =a x +b x ´2 (1.14)
( xy)´−x ´− y ´
b=
x´ 2 −( x´ )2 (1.15)
a= y´−bx (1.16)
donde:
∑ xi ∑ yi ∑ xi yi ∑ x i2
b= y´= ( xy )´= x 2 ´=
n , n , n , n
EJEMPLO:
Supongamos la siguiente información cinemática
No. X y Xy x2
1 10 105 1050 100
2 20 195 3900 400
3 30 301 9030 900
4 40 390 15600 1600
5 50 510 25500 2500
6 60 602 36120 3600
Total 210 2103 91200 9100
a=
∑ y i −∑ x i
n (1.18)
Usando los métodos vistos de teoría de errores se puede determinar la
incertidumbre en la determinación de la pendiente y punto de corte calculando
la desviación estándar de la distribución de valores de ε i alrededor de la mejor
línea, que llamaremos Σ y, Esta última está dada por:
∑ εi u
∑ y= √
n−2 [ y ] (1.19)
¿] Representa unidades de y. Acá la desviación estándar se calcula usando
n−2 en el denominador en vez de n−1 como consecuencia de aplicar la
definición de desviación estándar a la posición de una línea en un plano.
Una ventaja muy importante del método de mínimos cuadrados es que nos
proporciona valores estadísticamente significativos de las incertidumbres en la
pendiente y el punto de corte, que se derivan objetivamente de la dispersión
real en los mismos puntos experimentales, sin perjuicio de cualquier afirmación
optimista que queramos hacer sobre las incertidumbres de los valores medidos.
Una vez se haya determinado los valores de b , a , Δb y Δa, se puede escribir la
ecuación correspondiente. Por ejemplo, para el caso de una dependencia
lineal, la ecuación final se escribiría de la forma:
n ∑ x i y i− ∑ x i ∑ y i
r=
2 2 2 2
√ [ n ∑ x −( ∑ x ) ][n ∑ y −( ∑ y ) ]
i i i i (1.23)
Fig. 1.6. Coeficiente de correlación para los ajustes lineales a datos cada vez
más ruidosos
B≡ b (1.30)
A ≡ log(a) (1.31)
Esto quiere decir que una vez se encuentre el valor del punto de corte a, se
debe calcular el anti-logaritmo de este valor para escribir la ecuación final.
∑ y 2i ∑ ( x 2i y i )−∑ ( x i y i ) 2
i=1 i=1 i=1 (1.33)
n n n n
Los coeficientes pueden ser hallados por ajuste de mínimos cuadrados usando
las siguientes expresiones:
n n n
n ∑ ( y i ln xi )−∑ y i ∑ ln x i
i=1 i=1 i=1 y .X−y . X
b= n n
=
x 2−( X ) 2
∑ ( ln x i )2−(∑ ln x i ) 2
i=1 i=1 (1.38)
n n
∑ y i −b ∑ y i ( ln x i )
a= i=1 i=1
= y−b X
n (1.39)
Correlación
Los requerimientos de las ciencias van más allá del comportamiento de una
variable y en muchos de sus problemas necesita investigar la relación entre
variables. Así por ejemplo, ¿existe alguna relación entre la altura de los
árboles y el diámetro de sus troncos a cierto nivel del suelo? ¿Existe alguna
relación entre el grado de oscuridad nocturna, la temperatura del ambiente y
el apetito de los ratones? ¿Hay alguna relación entre las calificaciones
obtenidas por los estudiantes en sus exámenes de admisión a la
universidad y su rendimiento académico en ella? ¿Existe alguna relación
entre la alimentación de las personas y las afecciones cardiacas? Si existen
relaciones de asociación entre las variables entonces, ¿será posible hacer
estimaciones del valor de una de ellas conociendo el valor de la otra
variable? Precisamente este es el tema central de la correlación.
Si existe una relación entre los valores de las variables x e y, ella se puede
graficar. Las relaciones de equivalencia de primer grado, su grafica es una
línea recta, si la relación no es de primer grado, su grafica es una línea curva.
Sea, por ejemplo, la relación
Y =2 x +3
X -2 -1 0 1 2
y -1 1 3 5 7
Encontramos que ellos están situados sobre una línea recta, figura 2.1.
Figura 2.1
La ecuación y=bx+ c tiene por grafica una línea recta y para trazar basta
tabular dos puntos ( x , y ).
Las rectas y=x e y=−x. Estas rectas son casos particulares de y=bx+ c en
ellas el coeficiente de posición c=0 indica que pasan por el punto x=0, y=0, o
sea el origen (0,0) . La recta y=x corresponde a la función idéntica en ella b=1
y c=0; su grafica se muestra en la figura 2.4 y es la recta bisectriz del ángulo
que conforman los ejes X e Y (primer cuadrante). La recta y=−x tiene por
grafica la figura 2.5; esta recta es bisectriz del ángulo de los ejes X e Y en el
segundo cuadrante.
B. CORRELACION
r=0
Figura 2.6
r=-1 r=-0.8
Figura 2.9 Figura 2.10
Σxy
r= x=X − X́
2 2
√( Σ x )( Σ y )
y=Y −Ý
Ejemplo de aplicación
Sean los pares (XY): (1; 1.5), (2; 2.2), (2.5; 2), (3; 2.5), (4; 4.5), (4.5; 4), (5; 5),
(6; 5).
Primero se procede a dibujar el diagrama de dispersión (figura 2.11).
Figura 2.11
Este diagrama muestra que la correlación es cercana a +1.
Para el cálculo de r se procede así:
X Y X − X́ =x Y −Ý = y X2 XY Y2
1.0 1.5 -2.5 -1.8 6.2 4.5 3.2
2.0 2.2 -1.5 -1.1 2.2 1.6 1.2
2.5 2.0 -1.0 -1.3 1.0 1.3 1.7
3.0 2.5 -0.5 -0.8 0.2 0.4 0.6
4.0 4.5 0.5 1.2 0.2 0.6 1.4
4.5 4.0 1.0 0.7 1.0 0.7 0.5
5.0 5.0 1.5 1.7 2.2 2.6 2.9
6.0 5.0 2.5 1.7 6.2 4.2 2.9
Σ 28 26.7 19.2 15.9 14.4
N=8
ΣX =28
28
X́ = =3.5
8
ΣY =26.7
26.7
Ý = =3.3
8
Σ x 2=19.2
Σ y 2=14.4
Σxy=15.9
Σxy 15.9
r= =
2 2
√ ( Σ x ) ( Σ y ) √ ( 19.2 ) (14.4)
Respuesta: r =0.96
6 Σ D2
r s=1− 2
n( n −1)
Para cálculos der s es necesario obtener la diferencia D entre los rangos, y si
una de las escalas no es ordinal, entonces se asigna rango a las puntuaciones.
D -1 -1 2 -1 -2 2 1 0
D2 1 1 4 1 4 4 1 0 ΣD2 =16
6 Σ D2 6 (16) 96
r s=1− 2
=1− =1− =0.81
n(n −1) 8(64−1) 504
Respuesta: rs=0.81
REGRESIÓN
En todos los casos de regresión existe una dependencia funcional entre las
variables. En el caso de dos variables, siendo una de ellas ( X ), variable
independiente y la otra (Y ), la dependiente, se habla de regresión de Y sobre X
; por ejemplo, los ingenieros forestales utilizan la regresión de la altura de los
arboles sobre su diámetro, lo cual significa que midiendo el diámetro (variable
independiente) y reemplazando su valor en una relación definida según la clase
de árbol se obtiene la altura, y aun sin necesidad de cálculos aprecian la altura
utilizando graficas de la función de dependencia, altura = función del diámetro.
Estas graficas son líneas que pueden ser rectas o curvas. Aquí solo
estudiaremos los ajustes que originan líneas rectas.
B. regresión lineal
Para guiar nuestro análisis sobre dos variables, pongamos como ejemplo el
caso de una industria metal-mecánica que paga los operarios por cada unidad
de elemento torneado. Tenemos una relación entre las variables piezas
producidas y jornales. Utilizando el eje X como eje de unidades producidas y el
eje Y, como eje de jornales, ubiquemos los puntos que corresponden a la
producción de 10 operarios de diferentes categorías (figura 2.12)
Unidad Jornales
15 150
20 200
25 250
28 280
30 300
35 350
38 380
40 400
42 420
45 450
Figura 2.12
En este ejemplo, las dos variables tienen una correlación perfecta, su grafica es
una línea recta cuya ecuación es Y =10 X que es la recta de regresión de los
jornales sobre las unidades producidas (regresión de Y sobre X ). Si se cambia
a $ b la remuneración por unidad torneada, la recta de regresión será Y =bX y
pasa por (0 , 0) .
En ambos casos las líneas de regresión permiten lecturas fuera de los valores
experimentados. Si se efectúan lecturas entre dos valores experimentados, se
dice que se ha interpolado entre esos valores; la operación de leer valores
sobre la línea, más allá de los limites experimentados, se llama extrapolación.
En particular, la operación de extrapolación suele conducir a resultados
absurdos o irreales, como por ejemplo obtener por extrapolación unidades
torneadas negativas; por esta razón, al extrapolar se debe ser cuidadoso y
conocer con claridad lo que se desea.
500
Unidade Jornales 450
s 400
10 220 350
20 290 300
250
25 325 200
28 346 150
30 360 100
35 395 50
38 416 0
5 10 15 20 25 30 35 40 45 50
40 430
42 444
45 465 Figura 2.13
Por lo general sucede en las aplicaciones prácticas que las correlaciones entre
x e y no son perfectas. En consecuencia, al ubicar en un sistema cartesiano los
datos que son pares ( X , Y ), se obtienen situaciones como las que muestra en
la figura 2.14. En esta figura cada par de puntos define una recta y
Figura 2.14
No existe recta alguna que pase por todos los puntos, pero intuitivamente
comprendemos que existe una recta de mayor adecuación y trataríamos de
trazarla lo más cerca posible de los puntos de modo que sus desviaciones con
respecto a ellos sean lo menor posible. Tal línea existe y se llama línea de
mejor ajuste y queda definida como la línea que hace mínima la suma de los
cuadrados de las desviaciones respecto a ellas de todos los puntos que
corresponden a la información recogida. Si estudiamos la regresión Y sobre X ,
las desviaciones d se miden en la dirección del eje vertical (figura 2.15), cuya
magnitud es la desviación del valor observado con relación a la lectura del valor
sobre la línea de regresión. En caso de que se desee la regresión de X sobre Y
, las desviaciones dse miden en la dirección del eje horizontal (figura 2.16), de
donde resulta que las dos rectas no son coincidentes, se acercan tanto más
entre sí cuanto más alta es la correlación entre X e Y . En el caso de que la
correlación sea perfecta, r =1, las dos rectas de regresión lineal Y sobre X y X
sobre Y coinciden.
Y =c+ bX
∑ xy
b y=
∑ x2
c=Ý −b y X́
∑ xy
Se puede expresar b y en otra forma recordando que r = y que
√ ∑ x2 ∑ y2
2 ∑ x2 2 ∑ y2
sx= ; s y=
N N
∑ xy sx
b y= 2
; c= X́ −b X Ý ; (b x =r )
∑x sy
∑(Y −Y ' )2
Para la regresión Y sobre X s2xy =
N
∑( X−X ' )2
Para la regresión X sobre Y s2xy =
N
∑ (Y −Y ' )2
Para Y sobre X s yx =
N
∑( X−X ' )2
Para X sobre Y s xy =
N
Ejemplo de aplicación
Los datos de un problema son los pares
( X , Y ):(2,2) ,( 4,3),(5,3) ,(6,4),(7,6) ,(8,5),(9,7) ,(10 , 6).
Figura 2.17
(b) Construir por apreciación visual a mano alzada una recta de regresión de Y
sobre X .
Respuesta: La recta PQ. Figura 2.17, trazada buscando compensar las
desviaciones; esta recta pasa por los puntos P( 4,3) y Q(10 ; 6,7), y es la
recta que para nuestra apreciación aproxima mejor los datos.
X 2 4 5 6 7 8 9 10
Y 2 3 3 4 6 5 7 6
Y´ 1.8 3.0 3.6 4.2 4.9 5.5 6.1 6.7
X X − X́ =x Y Y −Ý = y xy x2 y2
2 -4.38 2 -2.5 10.95 19.18 6.25
4 -2.38 3 -1.5 3.75 5.66 2.25
5 -1.38 3 -1.5 2.07 2.50 2.25
6 -0.38 4 -0.5 0.19 0.14 0.26
7 0.62 6 1.5 0.93 0.38 2.25
8 1.62 5 0.5 0.81 2.62 0.25
9 2.62 7 2.5 6.55 6.86 6.25
10 3.62 6 1.5 5.43 13.10 2.25
51 36 30.50 50.44 22.00
N=8
∑ Xi 51
X́ = = =6.38
N 8
∑ Yi 36
Ý = = =4.5
N 8
∑ xy 30.50
b y= = =0.605
∑ x2 50.44
c=Ý −b y X́ =4.5−6.38 ( 0.605 )=0.640
Y ' =0.640+ 0.605 X
Valores de Y predichos (Y ´ )
X 2 4 5 6 7 8 9 10
Y 2 3 3 4 6 5 7 6
Y´ 1.9 3.1 3.7 4.3 4.9 5.5 6.1 6.7
Introducción
Para seleccionar una celda solamente tiene que hacer un clic sobre la misma
para que ésta se active.
Introducción de fórmulas:
Edición de celdas:
-General 43.666
-Moneda $43.67
-Porcentaje 4367.00%
-Científico 4.37 e + 1
Alinear contenido:
General
Izquierda
Central
Derecha
Impresión de un rango:
2.-Elija Imprimir del menú file. Ahí aparece una pantalla para seleccionar que
se desea solo un rango, el número de copias y a colores y/o escala de grises o
blanco y negro.
3.-Haga clic en Ok
Creación de fórmulas:
Utilizar una fórmula nos puede facilitar la manipulación de los datos de una hoja
de cálculo. Con una fórmula pueden realizar operaciones, tales como suma,
multiplicación, comparación, etc.
Una fórmula combina los valores de algunas celdas con operadores, tales
como suma, resta, multiplicación, división y funciones predefinidas para
producir un nuevo valor. Las fórmulas se escriben en la barra de entrada y
siempre inician con un signo igual (=). La siguiente ilustración muestra
ejemplos de fórmulas que contienen algunos de los elementos que se pueden
incluir:
- : Resta o negación
+: Suma o confirmación
%: Porciento
* y /: Multiplicación y división.
&: Unión de texto.
= < > <= >= <>: Comparación
Figura 3.6
3.-En este momento aparece el menú de los tipos de gráficas y siga los pasos
que propone el facilitador de gráficos.
Figura 3.9
Figura 3.11
Figura 3.13
Figura 3.14
EL INFORME DE LABORATORIO
La buena redacción científica es un parte muy importante en el proceso de investigar e informar los
resultados obtenidos en nuestros experimentos. El mejor experimento jamás montado sobre un fenómeno
dado puede tener poco o ningún valor si no se comunica a otras personas, y se les comunica bien, con
buena redacción clara y atractiva. Aunque la comunicación puede ser oral, como es normalmente en
congresos y conferencias científicas, en la abrumadora mayoría de los casos la gente se entera de
nuestro trabajo a través de páginas impresas. Nuestra obligación de optimizar la habilidad de redacción
no es, por tanto, un asunto trivial, y debería considerarse como una parte esencial e integral de nuestras
actividades experimentales. Nuestra redacción debe ser lo suficientemente buena para atraer y retener la
atención y el interés de nuestros lectores.
En este proceso es importe destacar que no existen recetas que nos digan cómo escribir bien un informe
o artículo científico. Cada uno de nosotros tiene una forma diferente de expresar sus pensamientos, y
cada uno debe permitir que su estilo se desarrolle a su modo particular. Esto requiere una práctica amplia
y debemos considerar la redacción de informes en un primer curso de laboratorio de Física como una
excelente oportunidad para ganar experiencia en ello.
En la redacción y escritura de un informe científico hay que tener presente siempre algo muy importante y
es que hay una persona cuyos intereses deben captar nuestra atención en primer lugar: la persona que
se ocupa de leer nuestro informe o articulo y debemos concentrar nuestra atención en ella. El escrito debe
estar redactado de tal forma que esa persona a quien va dirigido entienda perfectamente todo aquello que
queremos comunicarle.
En cuanto respecta al lenguaje normalmente usado en las publicaciones científicas, es una práctica
común usar un estilo despreocupado, caracterizado por el uso de la voz pasiva y las construcciones
impersonales.
Como se mencionó arriba, no existen recetas de estilos, sin embargo en lo que sigue a continuación se
dan algunas pautas para presentar los informes de una forma clara y ordenada. Al final se da los
diferentes puntos que debe tener el informe que se debe presentar sobre los resultados obtenidos en las
prácticas de laboratorio que ustedes realizarán en este curso de física.
A continuación se presentan los puntos que debe contener el informe científico que se debe
presentar para dar a conocer los resultados del experimento realizado.
RESUMEN/ ABSTRACT
(En español e inglés, respectivamente). Permite al lector tener una rápida idea del contenido del
informe. No olvide que un resumen está constituido: qué se hizo, cómo lo hizo, (sin confundirlo
con el desarrollo del experimento) y conclusiones importantes. Debe ser breve, no pasar de 10
renglones. Es por eso que debe ser lo último que se hace.
ABSTRACT
1. Introducción
Realice una breve descripción de lo que está investigando y justificando el principio físico, los
métodos y técnicas de medición. Describir el dispositivo experimental con un esquema
completo, claro y detallado (no el montaje que aparece en la guía), descripción del desarrollo
de la experiencia.
3. Resultados
Aquí se presentan los resultados obtenidos, en la forma de tablas, gráficos, etc., (con
leyendas, unidades físicas, cálculo de errores, entre otros). Cada grafico, tabla, figura, debe
estar anunciado en el texto, debidamente numerado y con una leyenda que lo identifique. Es
imprescindible el correcto manejo de los errores e incertidumbres. Presentar los cálculos
correspondientes, necesarios para alcanzar los resultados esperados, sin necesidad de
incurrir en las repeticiones para cada dato, para esto son las tablas.
4. Discusión y análisis
(Es la parte principal del informe). Extraer la información útil de los resultados obtenidos.
Evaluar la validez, los valores de los resultados en relación con los modelos teóricos u otros
resultados. Comparación con otras fuentes, con estimación anteriores. Interpretar los
resultados con su error respectivo, en relación a modelos existentes o nuevos (propuestos
en el trabajo). Discusión de su significado y su relación con diversas aplicaciones del tema.
Discusión de los resultados en relación con otros métodos. Crítica del trabajo propio. Este
punto puede ser más desarrollado en un informe de laboratorio que en un artículo publicado.
Aquí se trata no sólo de anunciar un resultado, sino también, permitir su repetición en las
mejores condiciones y de proponer mejorías.
5. Conclusiones
Resumen crítico de la experiencia. Debe contestar a la introducción, guarda relación con los
objetivos propuestos y es consecuente con los resultados sobresalientes y la discusión e
interpretación de los resultados obtenidos y anuncia futuros desarrollos, aplicaciones, etc.
Deben ser breves, concisas y numeradas; mejor escriba pocas con mucho sentido que
muchas sin sentido alguno. Evite escribir lo publicado por otros autores, esta debe ser
consecuencia de su trabajo y de lo reportado a lo largo de su informe. Haga referencias
alusivas al texto de donde se obtiene(n) esa(s) conclusión(es).
6. Referencias
Se puede distinguir:
Referencias Externas. Son referencias a otros trabajos (artículos, libros,…). Aparecen entre
¨ [¨ y ¨] ¨ y se listan al final del informe, en la parte de bibliografías o de referencias.
Las referencias externas son importantes por razones de ética y de derechos de autor.
Permiten aliviar el trabajo evitando reproducir un desarrollo matemático por ejemplo.