Unidad IV - ESTIMACION-00
Unidad IV - ESTIMACION-00
Unidad IV - ESTIMACION-00
Inferir, es en general, establecer un nuevo conocimientos a partir de una ya dado, sacar consecuencia o
deducir una cosa de otra.
La estadística, es la ciencia o rama de las Matemáticas que se ocupa de recoger datos, analizarlos y
organizarlos, y de realizar las predicciones que sobre esos datos puedan deducirse, tiene dos vertientes
básicas:
a) Estadística Descriptiva Básicamente se ocupa de la primera parte, es decir, a partir de ciertos datos,
analizarlos y organizarlos. Es aquí donde tiene sentido calcular la media,
mediana, moda, desviación media, desviación típica, etc.
b) Estadística inferencial Se ocupa de predecir, sacar conclusiones, para una población tomando como
base una muestra (es decir, una parte) de dicha población. Como todas las
predicciones, siempre deben de hacerse bajo un cierto grado de fiabilidad o
confianza
La inferencia estadística puede dividirse en dos apartados de acuerdo con el conocimiento sobre la
distribución en la población
1. Inferencia Paramétrica: Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc .... )
pero se desconocen sus parámetros. Se realizan inferencias sobre los
parámetros desconocidos de la distribución conocida.
2. Inferencia no Paramétrica: Forma y parámetros desconocidos. Se realizan inferencias sobre
características que no tienen por qué ser parámetros de una distribución
conocida (Mediana, Estadísticos de orden).
De acuerdo con la forma en que se estudian los parámetros o características desconocidas, la inferencia
puede dividirse en:
a) Estimación: Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas
sobre posibles valores de los mismos. La estimación puede ser:
Puntual: Un único valor para cada parámetro
Por intervalos: Intervalo de valores probables para el parámetro, en el que está
contenida con cierto grado de probabilidad
b). Contraste de Hipótesis: Se realizan hipótesis sobre los parámetros desconocidos y se desarrolla un
procedimiento para comprobar la verosimilitud de la hipótesis planteada
Ya que uno de los propósitos de la estadística es estimar cantidades desconocidas de la población (tales
como la media poblacional, la varianza, etc.) llamadas parámetros poblacionales, o más brevemente
parámetros, a partir del conocimiento de las correspondientes cantidades muestrales (tales como la media
muestral, la varianza muestral, etc.) llamadas estadísticos muestrales, o más brevemente estadísticos. Es
fundamental entender la diferencia entre parámetros y estadísticos. Los parámetros se refieren a la
distribución de la población y los estadísticos a los datos muestrales.
Así pues estadístico es cualquier función de los valores muestrales que depende exclusivamente de estos.
Una aplicación muy importante de los estadísticos son los estimadores, un estimador (esto es, una función de
la muestra) es usado para estimar un parámetro desconocido de la población. Por ejemplo, si se desea
conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de
dicho artículo en diversos establecimientos (la muestra) y la media aritmética de las observaciones puede
utilizarse como estimador del precio medio.
Para cada parámetro pueden existir varios estimadores diferentes. En general, escogeremos el estimador que
posea mejores propiedades que los restantes, como insesgo, eficiencia, convergencia y robustez
(consistencia).
El valor de un estimador proporciona lo que se denomina en estadística una estimación puntual del valor del
parámetro en estudio. En general, se suele preferir realizar una estimación mediante un intervalo, esto es,
obtener un intervalo [a,b] dentro del cual se espera esté el valor real del parámetro con un cierto nivel de
confianza. Utilizar un intervalo resulta más informativo, al proporcionar información sobre el posible error de
estimación, asociado con la amplitud de dicho intervalo. El nivel de confianza es la probabilidad de que a priori
el verdadero valor del parámetro quede contenido en el intervalo.
Cuando se analizan problemas de inferencia, es conveniente tener un símbolo que represente el parámetro
de interés. Se usara la letra griega minúscula (theta) para representar el parámetro.
Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el
verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir,
que su sesgo sea nulo por ser su esperanza igual al parámetro que se desea estimar.
Un estimador es insesgado cuando para cualquier tamaño muestral se cumple que su valor esperado es igual
al parámetro que se desea estimar.
parámetro a estimar
estimador de
Por ejemplo, si se desea estimar la media de una población, la media aritmética de la muestra es un
estimador insesgado de la misma, ya que su esperanza (valor esperado) es igual a la media de la población.
En efecto, si una muestra aleatoria procede de una población de media μ, quiere decir
que:
para cualquier
con lo que, al aplicar las propiedades de linealidad de la esperanza matemática se tiene que:
Eficiencia
Diremos que un estimador es más eficiente o más preciso que otro estimador, si la varianza del primero es
Diremos que es más eficiente que . Un estimador es más eficiente (más preciso), cuanto menor es su
varianza. La eficiencia de los estimadores está limitada por las características de la distribución de
probabilidad de la muestra de la que proceden.
Eficiencia relativa
Consistencia
Si no es posible emplear estimadores de mínima varianza, el requisito mínimo deseable para un estimador es
que a medida que el tamaño de la muestra crece, el valor del estimador tienda a ser el valor del parámetro,
propiedad que se denomina consistencia. Existen diversas definiciones de consistencia, más o menos
restrictivas, pero la más utilizada es la denominada consistencia en media cuadrática que exige que:
1. cuando
2. cuando
Robustez
El estimador será un estimador robusto del parámetro si la violación de los supuestos de partida en los
que se basa la estimación (normalmente, atribuir a la población un determinado tipo de función de distribución
que, en realidad, no es la correcta), no altera de manera significativa los resultados que éste proporciona.
Suficiencia
Se dice que un estimador es suficiente cuando resume toda la información relevante contenida en la muestra,
de forma que ningún otro estimador pueda proporcionar información adicional sobre el parámetro
desconocido de la población.
4.3 Estimación por punto de un parámetro.
El objetivo de una estimación puntual es seleccionar, con base a los datos muestrales, un solo numero que
sea el valor más recomendable de . Se usara el valor numérico de un estadístico muestral, como la
estimación puntual.
En general, si es una variable aleatoria con una distribución de probabilidad , caracterizada por el
parámetro desconocido , y si es una muestra aleatoria de tamaño n de , entonces el
En la ingeniería son comunes los problemas de estimación. Con frecuencia es necesario estimar:
La proporción de un dato estadístico es el número de veces que se presenta ese dato respecto al total
de datos. Se conoce también como frecuencia relativa y es uno de los parámetros de cálculo más
sencillo. Tiene la ventaja de que puede calcularse para variables cualitativas.
Por ejemplo, si se estudia el color de ojos de un grupo de 20 personas, donde 7 de ellas los tienen
Si en una población conocemos la proporción p de los individuos que tienen cierta característica,
podemos elegir aleatoriamente muestras de tamaño n y obtener la proporción en cada muestra
Como sabes, el numero de éxitos de una muestra de tamaño n se distribuye de forma binomial
Puede haber varias opciones diferentes para el estimador puntual de un parámetro. No confundir el estimador
es el estadístico utilizado para generar una estimación y es una variable aleatoria. Y la estimación es el valor
que toma el estimador. Ejemplo de estimadores.
Ejemplo. En una muestra aleatoria de 15 docentes de educación de la UJAT, se les pregunto: ¿El
investigador educativo debe ser bien remunerado? 1. Sí. y 2. No. De la siguiente tabla consideremos las
variables edad en años cumplidos (X ) y el docente considera que el investigador educativo debe ser bien
remunerado (Y ), para distinguir entre estimador y estimación:
Docente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 34 38 49 42 35 44 30 36 43 47 39 46 48 36 44
Remuneración 1 1 1 1 2 1 2 1 1 1 2 1 1 2 1
Muestra Población
, (desconocida)
Intervalo de confianza para estimar la media de una población normal cuando la desviación
estándar es conocida, o cuando la desviación estándar es desconocida en muestras de
tamaño . A partir de la media de una muestra de tamaño
Muestra Población
,
conocida
normalizando a tenemos
Si fijamos la probabilidad se puede construir un intervalo simétrico con los valores de en la curva
normal estándar, de forma que el área entre esos dos valores sea igual a
Sustituyendo a tenemos:
1
z
2 2
z z
2 1
2
Ejemplo . Si el porcentaje de los alumnos de la UJAT deportistas en la muestra de tamaño 36 es igual al
30%, se desea estimar la proporción de estudiantes deportistas de una población con un nivel de
confianza de .
Solución :
Cuando calculamos el intervalo de confianza para una proporción con un nivel de confianza de con
la formula
Se observa que el error será más pequeño cuanto más grande sea el tamaño de la muestra .
Si deseamos un error y fijamos un nivel de confianza de , despejando se obtiene que
consiste en estimar la media real a partir de la media muestral , si normalizamos la ecuación anterior
tenemos la ecuación antes vista:
ecuación .
Pero para el caso demuestras grandes con la aproximación es buena, sustituyendo por la cuasi-
desviación típica o estándar
1
z
2 2
z z
2 1
2
El intervalo de confianza para con desconocida y
Equivale a
Estudio de error
Cuando calculamos el intervalo de confianza para la media con un nivel de confianza con la
formula anterior,
Ejemplo. Se ha tomado una muestra aleatoria de 16 alumnos de la UJAT a los que se ha medido el nivel
de glucosa en la sangre, obteniéndose una media muestral de 110 mg/cc. Se sabe que la desviación
típica de la población es de20 mg/cc. Obtener el intervalo de confianza, al 95%, para el nivel medio de
glucosa en la sangre en la población.
Solución. Datos:
Si en el ejemplo anterior al tamaño de la muestra fuese 64. ¿Cuánto valdría el error o semi-amplitud del
intervalo?
:
EJEMPLOS DE LA UNIDAD
1. En una unidad académica de la UJAT hay matriculados 800 alumnos. A una muestra seleccionada
aleatoriamente de un 15% de ellos, se les pregunto si utilizaban la cafetería del instituto. Contestaron
negativamente un total de 24 alumnos.
a) Estimar el porcentaje de alumnos que utilizan la cafetería del instituto
b) Determinar, con una confianza del 99%, el error máximo cometido con dicha estimación.
es decir el 20%
b) El nivel de confianza y
Además y , luego el error es:
2. Para estimar la proporción de familias da la ciudad de Villahermosa que poseen aire acondicionado,
se requiere utilizar una muestra aleatoria de tamaño n. Calcular el valor mínimo de n para garantizar
que, a un nivel de confianza de 95%, el error en la estimación sea menor que 0.05. (como se
desconoce la proporción se ha de tomar el caso más desfavorable, que será de 0.5)
Por lo tanto
Luego .
3. Se desea estimar la proporción p de estudiantes de la UJAT regulares de una población a través del
porcentaje observado de la muestra aleatoria de estudiantes de tamaño n.
a) si y , entonces
b) ahora y , entonces
luego el intervalo de confianza para es:
Entonces
El intervalo de confianza es
4. Se sabe que el contenido de fructuosa de cierto alimento sigue una distribución normal, cuya
varianza es conocida, teniendo un valor de 0.25. Se desea estimar el valor de la media poblacional
mediante el valor de la media de una muestra, admitiéndose un error máximo de 0.2, con una
confianza del 95%. ¿Cuál ha de ser el tamaño de la muestra?
Solución: Tenemos
varianza
confianza
error
y
Entonces
Luego
5. La altura de los jóvenes norteños se distribuye según una ley normal de media desconocida y
varianza 25 cm2. Se ha seleccionado una muestra aleatoria y con una confianza del 95% se ha
construido un intervalo para la media poblacional cuya amplitud es de 2.45 cm. Determine el límite
superior y el inferior del intervalo de confianza si la muestra tomada dio una altura de 170 cm.
a) Cual ha sido el tamaño de la muestra seleccionada?
b) Determinar el intervalo de confianza si la muestra tomada dio una altura media de 170 cm
Solución:
a) el tamaño de la muestra seleccionada