Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Evaluación Genómica

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 9

DE LA LINEA RECTA A LA EVALUACIÓN GENÓMICA

(Número 01)

Julio 2020

Al preparar este material se partió de la idea general de tratar de


explicar, sin recurrir a los conceptos teóricos y en una especie de
recetario de cocina, los principios básicos operativos que van
desde la regresión lineal simple hasta la evaluación genómica,
detallando los cambios que han ocurrido para llegar al análisis de
datos por el Modelo Animal y obtener estimadores mas precisos
de valor genético.

Esperamos que quienes tengan la oportunidad de revisarlo


señalen las posibles carencias, errores o inconsistencias y que,
con la colaboración de todos, podamos disponer de una pequeña
ayuda para avanzar en estos campos del saber.

01.- La línea recta y su relación con la línea de regresión

Un primer ejemplo

Supóngase que se tienen los siguientes cinco (05) pares de datos:

x y
0 0
1 1
2 2
3 3
4 4

Se observa que hay una relación perfecta, de forma tal que la variable
y se incrementa en una unidad a medida que la variables x también
se incrementa en una unidad.

En este ejemplo, sin necesidad de recurrir a cálculos matemáticos, la


expresión y = x se ajusta perfectamente.

1
Si se hace un gráfico con estos datos y se unen los puntos
adyacentes, se tendrá una línea recta que parte desde el punto (0,0)
hasta el punto (4,4).

En el gráfico, la línea recta cruza el eje Y en el punto donde el valor de


x es igual a 0 y se tiene un incremento de una unidad en y por un
aumento de una unidad en x. Es decir, la línea recta tiene una
ecuación Y = 0 + 1X, donde 0 es el denominado intercepto y 1 es la
pendiente, por lo que se simplifica en y = x.

En Estadística, la pendiente también es denominada la regresión, por


lo que ya se tiene la ecuación de regresión sin mayor problema.

Si los valores fueran:


x y
0 2
1 3
2 4
3 5
4 6

2
El valor de y para x = 0 es de 2, por lo que el intercepto es 2 pero
la pendiente o regresión sigue siendo 1. Entonces, la ecuación
será y = 2 + x

Si los valores fueran:


x y
2 0
3 1
4 2
5 3
6 4

3
El valor de y cuando x es igual a 0 no está graficado, pero si se
observa que la pendiente o regresión sigue siendo 1, se puede deducir
con facilidad que si x toma el valor 0 y debe tomar el valor de – 2, por
lo que la ecuación de la recta o de la regresión es:

y=-2+x

No siempre se tienen valores de x y de y que permiten obtener


con facilidad los valores del intercepto y de pendiente. Al
contrario, son situaciones muy infrecuentes en la vida real.

02.- Un recetario de cocina

Se puede recurrir a un recetario de cocina para obtener la


ecuación de regresión lineal. Por ejemplo, si se toma el caso de:

x=2 3 4 5 6
y=0 1 2 3 4

y se realizan los cálculos de Σx, Σy, Σx2, Σy2, Σxy, con n = 5 pares
de datos u observaciones, se obtiene que

Σx = 20, Σy = 10, Σx2 = 90, Σy2 = 30, Σxy = 50

SCx = Σx2 – [(Σ


Σx)2 / n] denominada Suma de cuadrados de x

90 – (202 / 5)

(90 – 80) = 10.0

SCy = Σy2 – [(Σ


Σy)2 / n] denominada Suma de cuadrados de y

30 – (102 / 5)

(30 – 20) = 10.0

4
Σx * Σy) / n]
SPxy = Σxy – [(Σ denominada Suma de productos xy
donde * se refiere a multiplicación

50 - [(20 * 10) / 5]
50 - 40 = 10

Y el coeficiente de regresión b se obtiene mediante SPxy / SCx

b = 10 / 10 = 1.0

y el intercepto (representado por la letra a)


a = promedio de las y – b * promedio de las x

=y–b* x = (10 /5) - 1.0 (20 / 5) = 2–4= -2

y la ecuación de regresión será y = a + b* x = -2+x

03.- Uso de programas computarizados

No se requiere aprenderse de memoria las fórmulas presentadas


para el cálculo de la ecuación de regresión. Se pueden introducir
los datos en una hoja Excel y pedirle el gráfico, la ecuación de
regresión, la prueba estadística y muchas cosas mas. También se
puede utilizar algún programa estadístico. El Statistix es fácil de
operar y si se crea una hoja con los datos, se podrá solicitar el
gráfico, la ecuación de regresión, la prueba estadística y muchas
cosas mas.

04.- Lo mas importante

Lo mas importante es entender lo que se logra obtener con este


análisis. Se logra cuantificar el efecto lineal de una variable
continua sobre otra variable continua y mediante una prueba
estadística, donde se tiene una hipótesis nula que plantea que la
variable independiente x no afecta significativamente a la variable
dependiente y, contra la hipótesis alternativa de que si la afecta
significativamente. se podrá concluir si se acepta o no esa
hipótesis nula.

5
Adicionalmente, el análisis de regresión lineal simple servirá de
base para, posteriormente, entender como analizar datos con
modelos de regresión mas complejos. Por ejemplo, regresiones
cuadráticas o de mayor grado, regresiones no lineales,
regresiones múltiples con mas de una variable x, regresiones con
evaluación de la interacción entre variables x, etc.

05.- X como variable discreta o categórica

Pero también se debe señalar que el análisis de regresión simple


es la base para realizar estudios del efecto de una o mas
variables discretas o categóricas sobre una variable respuesta.

Un ejemplo sencillo: dos sexos y 4 mediciones en cada uno.

Valores de Y Promedio
Sexo A 1, 2, 2, 3 2.0
Sexo B 4, 5, 5, 6 5.0

Una prueba de t para comparar estos dos promedios o su


equivalente prueba de F nos proporciona una probabilidad de
rechazo de la hipótesis nula de p = 0.002, indicando que existen
diferencias significativas entre sexos. El promedio global es 3.5,
la diferencia entre sexos es de 3.0 unidades, el sexo A tiene un
promedio que es – 1.5 unidades menor que el promedio global y
el sexo B tiene un promedio que es 1.5 unidades mayor que el
promedio global. Es decir, respecto al promedio global, la suma
de los efectos de sexo es cero.

Si se asigna al sexo A el código 0 y al sexo B el código 1 e


hiciéramos un análisis de regresión lineal, se debiera obtener un
intercepto de 2 ya que si x toma el valor 0 (sexo A) su valor y
promedio es 2 y la pendiente o regresión debe ser 3 pues al
pasar x de 0 a 1 el valor promedio de y pasa de 2 a 5, es decir, se
incrementa en 3 unidades.

Y, efectivamente, eso es lo que se obtiene al realizar el análisis de


regresión. Se obtiene la ecuación y = 2 + 3 * x, con una prueba

6
estadística que señala una p de 0.002 para aceptar la hipótesis
nula.

Pero si se utiliza la codificación 1 para sexo A y 2 para sexo B, la


ecuación que se obtiene es y = - 1 + 3 * x. La pendiente o
regresión sigue siendo 3 pero el intercepto es diferente, es - 1,
por ser este el valor de y cuando x es igual a cero. Si deseamos
conocer el promedio del sexo A, substituimos x por 1 en la
ecuación y se obtiene y = 2. Así mismo, si x es igual a 2, entonces
y es igual a 5, los promedios de los sexos.

Una codificación muy interesante es la de 1 para el sexo A y – 1


para el sexo B. El análisis de regresión continúa produciendo los
mismos resultados de probabilidad p = 0.002 para aceptar la
hipótesis nula pero la ecuación de regresión es y = 3.5 - 1.5 * x

El promedio global de la variable y es 3.5 y - 1.5 es la inferioridad


del promedio del sexo A respecto al promedio global, por lo que
el sexo A tendrá promedio 3.5 – 1.5 = 2. Si se asume que la suma
de los efectos de sexo es cero, entonces + 1.5 es el efecto del
sexo B, por lo que el promedio del sexo B es 3.5 + 1.5, es decir, 5,
los mismos valores previamente obtenidos en los párrafos
anteriores.

Esta codificación permite recordar el programa del Dr. Walter


Harvey para análisis por la metodología de los cuadrados
mínimos. Señalaba el Dr. W. Harvey que el modelo estadístico era
y = α + β*(x – x ), donde α es el valor de y para x = 0, β es la
superioridad o inferioridad del primer nivel de sexo (sexo A)
sobre el promedio global y, en este ejemplo con solo dos niveles,
- β es la superioridad o inferioridad del último nivel de sexo (sexo
B) sobre el promedio global.

7
06.- Un breve resumen

El análisis de regresión simple permite evaluar el efecto de una


variable x sobre una variable respuesta y, proporciona la
ecuación de predicción asociada, la posibilidad de aceptar o no si
el efecto es estadísticamente significativo y ofrece un camino
para evaluar los efectos de variables categóricas.

Los programas computarizados realizan los cálculos. Lo mas


importante, entonces, es conocer la utilidad de las metodologías
y modelos estadísticos para ir aproximándonos cada vez mas a
las herramientas que permiten obtener predictores de valor
genético mediante lo conocido como Modelo Animal.

07.- Apéndice

El ejemplo sencillo con dos sexos y 4 mediciones en cada uno.

Valores de Y Promedio
Sexo A 1, 2, 2, 3 2.0
Sexo B 4, 5, 5, 6 5.0

evaluado por tres metodologías estadísticas pero con resultados


iguales en valores de t o de F.

Prueba de t para la comparación de promedios


Two-Sample T Tests for y by sexo

sexo Mean N SD SE
1 2.0000 4 0.8165 0.4082
2 5.0000 4 0.8165 0.4082
Difference -3.0000

Null Hypothesis: difference = 0


Alternative Hyp: difference <> 0
95% CI for Difference
Assumption T DF P Lower Upper
Equal Variances -5.20 6 0.0020 -4.4127 -1.5873
Unequal Variances -5.20 6.0 0.0020 -4.4127 -1.5873

Test for Equality F DF P


of Variances 1.00 3,3 0.5000

8
Prueba de F para la comparación de promedios
One-Way AOV for y by sexo

Source DF SS MS F P
sexo 1 18.0000 18.0000 27.0 0.0020
Error 6 4.0000 0.6667
Total 7 22.0000

Grand Mean 3.5000 CV 23.33


Chi-Sq DF P
Bartlett's Test of Equal Variances 0.00 1 1.0000
Cochran's Q 0.5000
Largest Var / Smallest Var 1.0000

Component of variance for between groups 4.33333


Effective cell size 4.0

sexo Mean
1 2.0000
2 5.0000
Observations per Mean 4
Standard Error of a Mean 0.4082
Std Error (Diff of 2 Means) 0.5774

Por análisis de regresión, códigos 1 y – 1


Unweighted Least Squares Linear Regression of y

Predictor
Variables Coefficient Std Error T P
Constant 3.50000 0.28868 12.12 0.0000
sexo -1.50000 0.28868 -5.20 0.0020

R-Squared 0.8182 Resid. Mean Square (MSE) 0.66667


Adjusted R-Squared 0.7879 Standard Deviation 0.81650

Source DF SS MS F P
Regression 1 18.0000 18.0000 27.00 0.0020
Residual 6 4.0000 0.6667
Total 7 22.0000

OMAR VERDE

También podría gustarte