Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Unidad IV - ESTIMACION-00

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

Unidad IV. Estimación.

4.1 Inferencia Estadística

Inferir, es en general, establecer un nuevo conocimientos a partir de una ya dado, sacar consecuencia o
deducir una cosa de otra.
La estadística, es la ciencia o rama de las Matemáticas que se ocupa de recoger datos, analizarlos y
organizarlos, y de realizar las predicciones que sobre esos datos puedan deducirse, tiene dos vertientes
básicas:

a) Estadística Descriptiva Básicamente se ocupa de la primera parte, es decir, a partir de ciertos datos,
analizarlos y organizarlos. Es aquí donde tiene sentido calcular la media,
mediana, moda, desviación media, desviación típica, etc.
b) Estadística inferencial Se ocupa de predecir, sacar conclusiones, para una población tomando como
base una muestra (es decir, una parte) de dicha población. Como todas las
predicciones, siempre deben de hacerse bajo un cierto grado de fiabilidad o
confianza

Sera esta ultima vertiente de la estadística la que estudiemos en esta unidad.

La inferencia estadística puede dividirse en dos apartados de acuerdo con el conocimiento sobre la
distribución en la población

1. Inferencia Paramétrica: Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc .... )
pero se desconocen sus parámetros. Se realizan inferencias sobre los
parámetros desconocidos de la distribución conocida.
2. Inferencia no Paramétrica: Forma y parámetros desconocidos. Se realizan inferencias sobre
características que no tienen por qué ser parámetros de una distribución
conocida (Mediana, Estadísticos de orden).

De acuerdo con la forma en que se estudian los parámetros o características desconocidas, la inferencia
puede dividirse en:

a) Estimación: Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas
sobre posibles valores de los mismos. La estimación puede ser:
 Puntual: Un único valor para cada parámetro
 Por intervalos: Intervalo de valores probables para el parámetro, en el que está
contenida con cierto grado de probabilidad

b). Contraste de Hipótesis: Se realizan hipótesis sobre los parámetros desconocidos y se desarrolla un
procedimiento para comprobar la verosimilitud de la hipótesis planteada

Ya que uno de los propósitos de la estadística es estimar cantidades desconocidas de la población (tales
como la media poblacional, la varianza, etc.) llamadas parámetros poblacionales, o más brevemente
parámetros, a partir del conocimiento de las correspondientes cantidades muestrales (tales como la media
muestral, la varianza muestral, etc.) llamadas estadísticos muestrales, o más brevemente estadísticos. Es
fundamental entender la diferencia entre parámetros y estadísticos. Los parámetros se refieren a la
distribución de la población y los estadísticos a los datos muestrales.

Así pues estadístico es cualquier función de los valores muestrales que depende exclusivamente de estos.
Una aplicación muy importante de los estadísticos son los estimadores, un estimador (esto es, una función de
la muestra) es usado para estimar un parámetro desconocido de la población. Por ejemplo, si se desea
conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de
dicho artículo en diversos establecimientos (la muestra) y la media aritmética de las observaciones puede
utilizarse como estimador del precio medio.

Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que
posea mejores propiedades que los restantes, como insesgo, eficiencia, convergencia y robustez
(consistencia).

El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del
parámetro en estudio. En general, se suele preferir realizar una estimación mediante un intervalo, esto es,
obtener un intervalo [a,b] dentro del cual se espera esté el valor real del parámetro con un cierto nivel de
confianza. Utilizar un intervalo resulta más informativo, al proporcionar información sobre el posible error de
estimación, asociado con la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori
el verdadero valor del parámetro quede contenido en el intervalo.

Cuando se analizan problemas de inferencia, es conveniente tener un símbolo que represente el parámetro
de interés. Se usara la letra griega minúscula (theta) para representar el parámetro.

4.2 Propiedades de los estimadores

Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el
verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir,
que su sesgo sea nulo por ser su esperanza igual al parámetro que se desea estimar.
Un estimador es insesgado cuando para cualquier tamaño muestral se cumple que su valor esperado es igual
al parámetro que se desea estimar.

parámetro a estimar
estimador de

es insesgado si para todo n se cumple

Por ejemplo, si se desea estimar la media de una población, la media aritmética de la muestra es un
estimador insesgado de la misma, ya que su esperanza (valor esperado) es igual a la media de la población.

En efecto, si una muestra aleatoria procede de una población de media μ, quiere decir
que:

para cualquier

La media aritmética o media muestral,

con lo que, al aplicar las propiedades de linealidad de la esperanza matemática se tiene que:
Eficiencia

Diremos que un estimador es más eficiente o más preciso que otro estimador, si la varianza del primero es

menor que la del segundo. Por ejemplo, si y son ambos estimadores de

Diremos que es más eficiente que . Un estimador es más eficiente (más preciso), cuanto menor es su
varianza. La eficiencia de los estimadores está limitada por las características de la distribución de
probabilidad de la muestra de la que proceden.

Eficiencia relativa

Se denomina eficiencia relativa ER a un estimador insesgado respecto de otro estimador insesgado al


cociente entre sus varianzas

Error cuadrático medio

Se define el error cuadrático medio (ECM) como:

Consistencia

Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para un estimador es
que a medida que el tamaño de la muestra crece, el valor del estimador tienda a ser el valor del parámetro,
propiedad que se denomina consistencia. Existen diversas definiciones de consistencia, más o menos
restrictivas, pero la más utilizada es la denominada consistencia en media cuadrática que exige que:

1. cuando

2. cuando
Robustez
El estimador será un estimador robusto del parámetro si la violación de los supuestos de partida en los
que se basa la estimación (normalmente, atribuir a la población un determinado tipo de función de distribución
que, en realidad, no es la correcta), no altera de manera significativa los resultados que éste proporciona.

Suficiencia
Se dice que un estimador es suficiente cuando resume toda la información relevante contenida en la muestra,
de forma que ningún otro estimador pueda proporcionar información adicional sobre el parámetro
desconocido de la población.
4.3 Estimación por punto de un parámetro.

El objetivo de una estimación puntual es seleccionar, con base a los datos muestrales, un solo numero que
sea el valor más recomendable de . Se usara el valor numérico de un estadístico muestral, como la
estimación puntual.

En general, si es una variable aleatoria con una distribución de probabilidad , caracterizada por el
parámetro desconocido , y si es una muestra aleatoria de tamaño n de , entonces el

estadístico se le llama el estimador puntual de . Obsérvese que es una


variable aleatoria, ya que es una función de variables aleatorias. Después de seleccionar la muestra, toma
un valor numérico particular llamado la estimación puntual de .

Definición: Una estimación puntual de un parámetro poblacional es el valor numérico particular de de un


estadístico .

En la ingeniería son comunes los problemas de estimación. Con frecuencia es necesario estimar:

 La media de una sola población


 La varianza o la desviación estándar de una sola población
 La proporción de elementos de una población que pertenecen a una clase de interés
 La diferencia entre las medias de dos poblaciones
 La diferencia entre las proporciones de dos poblaciones

La proporción de un dato estadístico es el número de veces que se presenta ese dato respecto al total
de datos. Se conoce también como frecuencia relativa y es uno de los parámetros de cálculo más
sencillo. Tiene la ventaja de que puede calcularse para variables cualitativas.
Por ejemplo, si se estudia el color de ojos de un grupo de 20 personas, donde 7 de ellas los tienen

azules, la proporción de individuos con ojos azules es del 35% , es decir


El dato con mayor proporción se conoce como moda.
En inferencia estadística existen intervalos de confianza para la estimación de este parámetro.

Si en una población conocemos la proporción p de los individuos que tienen cierta característica,
podemos elegir aleatoriamente muestras de tamaño n y obtener la proporción en cada muestra

Como sabes, el numero de éxitos de una muestra de tamaño n se distribuye de forma binomial

, luego a partir de aquí vamos a determinar la distribución de la variable .


Estimaciones razonables de estos parámetros son los siguientes:

 Para , la estimación es , la media muestral


 Para la estimación es , la varianza muestral
 Para , la estimación es , la proporción muestral, donde x (numero es éxitos) es el número
de elementos de una muestra aleatoria de tamaño n que pertenece a la clase de interés .
 Para , la estimación es , la diferencia entre las medias muestrales de dos
muestras aleatorias independientes.
 Para , la estimación es , la diferencia entre dos proporciones muestrales calculadas a
partir de dos muestras aleatorias independientes.

Puede haber varias opciones diferentes para el estimador puntual de un parámetro. No confundir el estimador
es el estadístico utilizado para generar una estimación y es una variable aleatoria. Y la estimación es el valor
que toma el estimador. Ejemplo de estimadores.

Parámetro Estimador Estimación


Media
Varianza
Desviación estándar
Proporción

Ejemplo. En una muestra aleatoria de 15 docentes de educación de la UJAT, se les pregunto: ¿El
investigador educativo debe ser bien remunerado? 1. Sí. y 2. No. De la siguiente tabla consideremos las
variables edad en años cumplidos (X ) y el docente considera que el investigador educativo debe ser bien
remunerado (Y ), para distinguir entre estimador y estimación:

Docente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 34 38 49 42 35 44 30 36 43 47 39 46 48 36 44
Remuneración 1 1 1 1 2 1 2 1 1 1 2 1 1 2 1

Variable Parametro Estimador Estimacion

4.4 Intervalos de confianza


Los Intervalos de confianza son intervalos aleatorios que se obtienen para estimar los parámetros
desconocidos de la población a partir de los estadísticos de las muestras. Estudiaremos dos casos:

 Intervalo de Confianza para estimar la proporción desconocida de una población, a partir de la

proporción de una muestra de tamaño n.

Muestra Población
, (desconocida)

La información se obtiene a partir de la muestra, y con esa información estimaremos el valor


desconocido

 Intervalo de confianza para estimar la media de una población normal cuando la desviación
estándar es conocida, o cuando la desviación estándar es desconocida en muestras de
tamaño . A partir de la media de una muestra de tamaño

Muestra Población

,
conocida

La información se obtiene a partir de la muestra y con esa información estimaremos el valor


desconocido del parámetro .

Es importante resaltar que estos problemas son de inferencia o estimación.


Los parámetros son desconocidos y la información se obtiene a partir de las muestras.

Intervalo de confianza para una proporción.

La distribución de la proporción muestral corresponde a


Ahora se consiste a estimar la proporción real a partir de la proporción .

El estimador se calcula a partir del numero de “éxitos” de una muestra de tamaño , ,

normalizando a tenemos
Si fijamos la probabilidad se puede construir un intervalo simétrico con los valores de en la curva
normal estándar, de forma que el área entre esos dos valores sea igual a

Sustituyendo a tenemos:

Y despejando a se obtiene el intervalo de confianza para

Esta fórmula no debe usarse si , o si o .

El valor se llama nivel de confianza y al valor se le llama nivel de significación

1
 

z
2 2
z z
2 1
2
Ejemplo . Si el porcentaje de los alumnos de la UJAT deportistas en la muestra de tamaño 36 es igual al
30%, se desea estimar la proporción de estudiantes deportistas de una población con un nivel de
confianza de .

Solución :

Buscamos en la tabla normal


estándar (tabla A)
0.95
0.025 0.025
-1.96
(
1.96
)
z
x
0.15 0.45
Para encontrar el intervalo

Luego el intervalo de confianza es


Estudio del Error

Cuando calculamos el intervalo de confianza para una proporción con un nivel de confianza de con
la formula

el error que cometemos es la semi-amplitud del intervalo, que vale

Se observa que el error será más pequeño cuanto más grande sea el tamaño de la muestra .
Si deseamos un error y fijamos un nivel de confianza de , despejando se obtiene que

Pero como entonces y

Intervalo de confianza de la media

Como la distribución de la media muestral corresponde a , nuestro problema

consiste en estimar la media real a partir de la media muestral , si normalizamos la ecuación anterior
tenemos la ecuación antes vista:

Si fijamos una probabilidad se tiene


Sustituyendo a y despejando a , se obtiene:

Al valor se le llama nivel de confianza y al valor de se le llama nivel de significación. Cuando el


parámetro de la población es desconocida la distribución de la para muestras pequeñas no se ajusta a la

ecuación .
Pero para el caso demuestras grandes con la aproximación es buena, sustituyendo por la cuasi-
desviación típica o estándar

1
 

z
2 2
z z 
2 1
2
 El intervalo de confianza para con desconocida y

Equivale a

Si utilizamos la desviación estándar de la muestra en lugar de la cuasidesviación estándar .

 Estudio de error

Cuando calculamos el intervalo de confianza para la media con un nivel de confianza con la
formula anterior,

El error que cometemos es la semi-amplitud del intervalo, que vale


Si observa la expresión del error, éste será más pequeño cuanto más grande sea el tamaño de la
muestra n, entonces

Ejemplo. Se ha tomado una muestra aleatoria de 16 alumnos de la UJAT a los que se ha medido el nivel
de glucosa en la sangre, obteniéndose una media muestral de 110 mg/cc. Se sabe que la desviación
típica de la población es de20 mg/cc. Obtener el intervalo de confianza, al 95%, para el nivel medio de
glucosa en la sangre en la población.

Solución. Datos:

Buscamos el valor en la tabla A 0.95


0.025 0.025
z
En intervalo viene dado por
-1.96 1.96
( ) x
100.2 119.8

Si en el ejemplo anterior al tamaño de la muestra fuese 64. ¿Cuánto valdría el error o semi-amplitud del
intervalo?

Si en el ejemplo anterior quisiéramos un error de 1mg/cc. ¿Cuál sería el tamaño de la muestra


adecuado?.

Despejamos en la expresión del error el valor del tamaño n de la muestra, sustituyendo

:
EJEMPLOS DE LA UNIDAD

1. En una unidad académica de la UJAT hay matriculados 800 alumnos. A una muestra seleccionada
aleatoriamente de un 15% de ellos, se les pregunto si utilizaban la cafetería del instituto. Contestaron
negativamente un total de 24 alumnos.
a) Estimar el porcentaje de alumnos que utilizan la cafetería del instituto
b) Determinar, con una confianza del 99%, el error máximo cometido con dicha estimación.

Solución. El tamaño de la muestra es de y usan la cafetería luego


a) El estimador del porcentaje de alumnos que utilizan la cafetería del instituto es

es decir el 20%

b) El nivel de confianza y
Además y , luego el error es:

un error máximo de 9.04%

2. Para estimar la proporción de familias da la ciudad de Villahermosa que poseen aire acondicionado,
se requiere utilizar una muestra aleatoria de tamaño n. Calcular el valor mínimo de n para garantizar
que, a un nivel de confianza de 95%, el error en la estimación sea menor que 0.05. (como se
desconoce la proporción se ha de tomar el caso más desfavorable, que será de 0.5)

Solución. El nivel de confianza y


Además y , luego despejamos a n de la formula del error :

Por lo tanto

Luego .
3. Se desea estimar la proporción p de estudiantes de la UJAT regulares de una población a través del
porcentaje observado de la muestra aleatoria de estudiantes de tamaño n.

a) Si el porcentaje de individuos regulares en la muestra es igual al 30%, calcular el valor de n para


que, con un nivel de confianza del 0.95, el error cometido en la estimación sea inferior al 3.1%
b) Si el tamaño de la muestra es de 64 individuos y el porcentaje de estudiantes regulares en la
muestra es del 35%, determinar, usando un nivel de significación del 1%, el correspondiente
intervalo de confianza para la proporción de estudiantes regulares de la población.
Solución.

a) si y , entonces

Luego como el error es del 3.1%, es decir: y sustituyendo este dato en

Entonces el número de la muestra aleatoria de estudiantes regulares es de

b) ahora y , entonces
luego el intervalo de confianza para es:

Entonces

El intervalo de confianza es

4. Se sabe que el contenido de fructuosa de cierto alimento sigue una distribución normal, cuya
varianza es conocida, teniendo un valor de 0.25. Se desea estimar el valor de la media poblacional
mediante el valor de la media de una muestra, admitiéndose un error máximo de 0.2, con una
confianza del 95%. ¿Cuál ha de ser el tamaño de la muestra?

Solución: Tenemos
varianza
confianza
error

y
Entonces

Luego

5. La altura de los jóvenes norteños se distribuye según una ley normal de media desconocida y
varianza 25 cm2. Se ha seleccionado una muestra aleatoria y con una confianza del 95% se ha
construido un intervalo para la media poblacional cuya amplitud es de 2.45 cm. Determine el límite
superior y el inferior del intervalo de confianza si la muestra tomada dio una altura de 170 cm.
a) Cual ha sido el tamaño de la muestra seleccionada?
b) Determinar el intervalo de confianza si la muestra tomada dio una altura media de 170 cm
Solución:
a) el tamaño de la muestra seleccionada

la amplitud con entonces

b) el intervalo de confianza si la muestra tomada dio una altura media de 170 cm

También podría gustarte