Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

ESTIMACIÓN

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

Tecnológico Nacional De México

Campus Ciudad Juárez

Estadística Inferencial

Estimación
Ingeniería en Logística
Grupo BX: 8:00-9:00 HRS

Alumno:
Salazar Barcenas Fabian
20111689

Ciudad Juárez, Chihuahua 23 de marzo de 2022

Semestre Febrero-Junio 2022


2.1 Introducción
Importancia de la estimación: En el ámbito de la ingeniería se aplica para control
de calidad, mejoras en procesos, pronósticos, control del personal, seguridad
industrial, entre otros muchos usos. A pesar de ser una ciencia exacta, también se
pueden cometer errores (Outliers) por lo que es importante saber aplicar las técnicas
y herramientas.

Clasificación de variables aleatorias:

- Variable cualitativa: Es aquella variable aleatoria que toma valores de tipo


nominal o valores que denotan una cualidad. Veamos el siguiente ejemplo para
fortalecer la idea. Supongamos que en una urna tenemos 20 bolas de color rojo, 15
de color azul y 18 de color blanco. Sacamos una bola al azar, esto es sin mirar la
urna. Supongamos que definimos la variable X por "el color de la bola sacada de la
urna". Entonces X tomara valores en el espacio de estado { rojo, azul, blanco}. De
otra forma

X que toma valores en {rojo, azul, blanco}

es una variable cualitativa.

- Variable cualitativa ordinal: Es aquellas variables que, aun denotando resultados


aleatorios de tipo cualitativo, es posible conforme al experimento aleatorios
asociado a estos resultados, dotarlas de una relación de orden. Pensemos en el
siguiente ejemplo, la variable D representará el nivel de dolor a causa de un
tratamiento médico de tipo invasivo, y cuyos valores son "inexistente", "poco
intenso", "moderado", y "muy fuerte". Es claro que entre estos niveles existe una
relación de orden aun cuando no sean valores numéricos. De otra forma, D toma
valores en el conjunto {inexistente, poco intenso, moderado, muy fuerte}.

Los datos cuantitativos que no admitan una jerarquía de orden se llaman


simplemente variable cualitativa nominal, Por ejemplo, la variable que está midiendo
en un determinado conglomerado de personas la profesión de cada una de ellas,
{ingeniero, profesor, obrero, ..., etcétera}
- Variable cuantitativa: Es la que asume valores o cantidades numéricas, de modo
que podemos realizar operaciones aritméticas entre estos resultados. Dentro de
este tipo de variables podemos distinguir dos grupos: discreta y continua.

Se dice que una variable aleatoria es discreta cuando el espacio de estado, es


decir el espacio de todos los posibles resultados, constituye un conjunto discreto.
Ahora bien, un conjunto es discreto cuando es contable o que se puede numerar.
Piense usted en el conjunto de los números naturales, o en el conjunto {0, 1, ..., n}.
Para el primer caso tenemos el siguiente ejemplo: el número de accidentes de
tránsito en la ciudad de Antofagasta durante el año 2003; para el segundo caso, el
número de "caras" obtenidas al lanzar n veces una moneda.

Una variable aleatoria es continua si los posibles resultados o el espacio de


estado no "se puede numerar". Pensemos por ejemplo en la medición de la estatura
de los 1200 alumnos del colegio. Se puede proponer como espacio de estado el
conjunto [0, 3]. Puede parecer una exageración los extremos de este intervalo (0
metros y 3 metros), pero lo interesante es que no podemos descartar ningún
resultado, es decir entre los resultados posibles de 1.734 metros y 1.735 metros, no
podemos descartar el resultado de 1.7345 metros, y entre los resultados 1.734
metros y 1.7345 no podemos descartar el resultado de 71.73444 metros.

Variables aleatorias discretas: Una variable aleatoria se llama discreta si se puede


contar su conjunto de resultados aleatorias posibles. Las variables aleatorias
discretas son variables aleatorias cuyo intervalo de valores es finito o contablemente
infinito.
2.2 Características de un estimador
Tipo de Estimación Características
Una estimación es puntual cuando se usa un
solo valor extraído de la muestra para estimar el
parámetro desconocido de la población. Al valor
usado se le llama estimador.
Estimación Puntual

Una estimación por intervalo de un parámetro θ


es algún par de funciones de la muestra que
satisfacen L(x) ≤ U(x) para todo x ∈ X . El
Estimación por Intervalo
intervalo aleatorio [L(X), U(X)] es llamado un
estimador por intervalo.

El enfoque bayesiano se basa en la


interpretación subjetiva de la probabilidad, el
cual considera a ésta como un grado de creencia
con respecto a la incertidumbre.

Un parámetro es visto como una variable


aleatoria a la que, antes de la evidencia
muestral, se le asigna una distribución a priori de
Estimación Bayesiana
probabilidad, con base en un cierto grado de
creencia con respecto al comportamiento
aleatorio. Cuando se obtiene la evidencia
muestral, la distribución a priori es modificada y
entonces surge una distribución a posteriori de
probabilidad.
Estimador Características
Un estimador es una función de las Para ser calificado de buen estimador
variables muestrales que se utiliza para son características importantes la
hacernos una idea sobre el valor del insesgadez o ausencia de sesgo, la
parámetro objeto de estudio. Es eficiencia o reducida variabilidad y la
completamente lógico que sea una consistencia o comportamiento
función de las variables muestrales probabilístico del estimador a medida
porque actúa como “representante” del que aumenta el tamaño de la muestra.
conjunto de estas. Al resultado que se
obtiene del estimador cuando se le un estimador es asintóticamente
introduce la información muestral se le insesgado si, teniendo sesgo, este
denomina estimación del parámetro θ. tiende a anularse a medida que
aumenta el tamaño de la muestra.

2.3 Teoría de la estimación puntual


El objetivo de la estimación puntual es aproximar el valor del parámetro
desconocido (tiempo medio de ejecución de un algoritmo, altura media de las
mujeres de una población, diferencia del resultado medio entre dos tratamientos
médicos, proporción de gente que mejora con un tratamiento médico…)

Para ello se utiliza la información de la muestra (x1,x2,…,xn)(x1,x2,…,xn), a través


de un estimador.
Algunos estimadores frecuentes son:
que corresponde a la varianza de la muestra, pero dividiendo por n−1n−1, en lugar
de dividir por nn. En el capítulo de estadística descriptiva, ya comentamos que el
R, por defecto, al calcular la desviación típica de una muestra, mediante el
comando sd, calcula directamente la cuasi-varianza y luego obtiene la raiz
cuadrada.
La evaluación del estimador sobre la muestra fija da lugar a una estimación
puntual.

2.4 Estimación por intervalos


La estimación por intervalos consiste en establecer el intervalo de valores donde es
más probable se encuentre el parámetro. La obtención del intervalo se basa en las
siguientes consideraciones:

a) Si conocemos la distribución muestral del estimador podemos obtener las


probabilidades de ocurrencia de los estadísticos muestrales.

b) Si conociéramos el valor del parámetro poblacional, podríamos establecer la


probabilidad de que el estimador se halle dentro de los intervalos de la distribución
muestral.

c) El problema es que el parámetro poblacional es desconocido, y por ello el


intervalo se establece alrededor del estimador. Si repetimos el muestreo un gran
número de veces y definimos un intervalo alrededor de cada valor del estadístico
muestral, el parámetro se sitúa dentro de cada intervalo en un porcentaje conocido
de ocasiones. Este intervalo es denominado "intervalo de confianza".
2.4.1 Intervalo de confianza para la media
Es conocido de nosotros durante este curso, que en base a la distribución muestral
de medias que se generó en el tema anterior, la fórmula para el cálculo de
probabilidad es la siguiente:

la media de la muestra, sólo se despejará m de la formula anterior, quedando lo


siguiente:

De esta fórmula se puede observar que tanto el tamaño de la muestra como el valor
de z se conocerán. Z se puede obtener de la tabla de la distribución normal a partir
del nivel de confianza establecido. Pero en ocasiones se desconoce s por lo que en
esos casos lo correcto es utilizar otra distribución llamada “t” de student si la
población de donde provienen los datos es normal.
Para el caso de tamaños de muestra grande se puede utilizar una estimación
puntual de la desviación estándar, es decir igualar la desviación estándar de la
muestra a la de la población (s= σ).

2.4.2 Intervalo de confianza para la diferencia de medias


Si se tienen dos poblaciones con medias μ1 y μ2 y varianzas σ 2 y σ 2, 1 2
respectivamente, un estimador puntual de la diferencia entre μ1 y μ2 está dado por
la estadística x´1−x´2. Por tanto. Para obtener una estimación puntual de μ1−μ2, se
seleccionan dos muestras aleatorias independientes, una de cada población, de
tamaño n1 y n2, se calcula la diferencia x´1−x´2 , de las medias muestrales.
Recordando a la distribución muestral de diferencia de medias:

Al despejar de esta ecuación μ1−μ2 se tiene:

En el caso en que se desconozcan las varianzas de la población y los tamaños de


muestra sean mayores a 30 se podrá utilizar la varianza de la muestra como una
estimación puntual.

2.4.3 Intervalo de confianza para la proporción

Un estimador puntual de la proporción P en un experimento binomial está dado por


la estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por
tanto, la proporción de la Si no se espera que la proporción P desconocida esté
demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P
al considerar la distribución muestral de proporciones.

Al despejar P de esta ecuación nos queda:


En este despeje podemos observar que se necesita el valor del parámetro P y es
precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción
de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.

Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a


1, el procedimiento del intervalo de confianza que se establece aquí no es confiable,
por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea
mayor o igual a 5. El error de estimación será la diferencia absoluta entre p y P, y

podemos tener el nivel de confianza de que esta diferencia no excederá

2.4.4 Intervalo de confianza para la diferencia de pr oporciones


Los límites para el intervalo de una diferencia de proporciones correspondientes a
dos muestras independientes son:

O bien

Este intervalo puede utilizarse de manera alternativa al contraste de hipótesis para


decidir (con nivel de significación α %) si hay igualdad de los dos grupos. Se
decidirá
por la igualdad de los grupos si el valor 0 queda incluido en cualquier posición en
elintervalo. Aunque se haga el contraste Delaware dos proporciones, es cebador
lugar, es aconsejable obtener el intervalo de confianza de la diferenciade medios,
si este ha resultado significativo, puesto que ayudara a interpretar si existe
significación aplicada además de la estadística. Si se dispone de alguna
información previa y sólo quiere calcularse alguno de los dos intervalos
unilaterales, bastara sustituir z α/2 por zα y de cicatrizar el límite superior o inferior
del intervalo según el caso. Por ejemplo, el intervalo derecho unilateral

corresponde a:
2.4.5 Intervalo de confianza para la varianza

Dada una variable aleatoria con distribución Normal N (μ; σ), el objetivo es la
construcción de un intervalo de confianza para el parámetro σ, basado en una
muestra de tamaño n de la variable.

A partir del estadístico

La fórmula para el intervalo de confianza, con nivel de confianza 1 − α es la siguiente

Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1 grados de libertad


que deja a su derecha una probabilidad de α/2.

2.4.6 Intervalo de confianza para la razón de varianzas

Supondremos la existencia de dos poblaciones sobre las que una determinada


variable sigue una distribución Normal. Sobre la población 1 la variable sigue una
distribución N (µ1, σ1) y sobre la población 2 sigue una distribución N (µ 2, σ2).
Igualmente supondremos que disponemos de dos muestras aleatorias
independientes, una para cada población, de tamaños
muestrales n1 y n2 respectivamente.

El objetivo es construir un intervalo de confianza, con nivel de confianza (1 − α) ·


100 %, para el cociente de varianzas
El estadístico pivote utilizado es:

Que sigue una distribución F de Fisher con n1 − 1 y n2 − 1 grados de libertad.

El intervalo de confianza que resulta es

Donde Fα/2 es el valor de una distribución F de Fisher-Snedecor


con n1 − 1 y n2 − 1 grados de libertad que deja a su derecha una probabilidad de α/2

2.5 Determinación del tamaño de muestra


Todo estudio epidemiológico lleva implícito en la fase de diseño la determinación
del tamaño muestral necesario para la ejecución del mismo. El no realizar dicho
proceso, puede llevarnos a dos situaciones diferentes: primera que realicemos el
estudio sin el número adecuado de pacientes, con lo cual no podremos ser precisos
al estimar los parámetros y además no encontraremos diferencias significativas
cuando en la realidad sí existen. La segunda situación es que podríamos estudiar
un número innecesario de pacientes, lo cual lleva implícito no solo la pérdida de
tiempo e incremento de recursos innecesarios, sino que además la calidad del
estudio, dado dicho incremento, puede verse afectada en sentido negativo.

Para determinar el tamaño muestral de un estudio, debemos considerar diferentes


situaciones:

A. Estudios para determinar parámetros. Es decir, pretendemos hacer inferencias a


valores poblacionales (proporciones, medias) a partir de una muestra.

B. Estudios para contraste de hipótesis. Es decir, pretendemos comparar si las


medias o las proporciones de las muestras son diferentes.
Elementos de la Inferencia Estadística

A. Estudios para determinar parámetros

Con estos estudios pretendemos hacer inferencias a valores poblacionales


(proporciones, medias) a partir de una muestra.

A.1. Estimar una proporción:

Si deseamos estimar una proporción, debemos saber:

a) El nivel de confianza o seguridad (1-α). El nivel de confianza prefijado da lugar a


un coeficiente (Zα). Para una seguridad del 95% = 1.96, para una seguridad del
99% = 2.58.

b) La precisión que deseamos para nuestro estudio.

c) Una idea del valor aproximado del parámetro que queremos medir (en este caso
una proporción). Esta idea se puede obtener revisando la literatura, por estudio
pilotos previos. En caso de no tener dicha información utilizaremos el valor p = 0.5
(50%).

2.5.1 Basado en la media de la población


El determinar el tamaño de una muestra representa una parte esencial del metodo
cientifico para poder llevar acabo una investigacion. Al muestreo lo podemos definir
como el conjunto de observaciones necesarias para estudiar la distribucion de
determinadas caracteristicas en la totalidad de una poblacion,apartir de la
observacion de una parte o subconjunto de una poblacion denominada muestra.

2.5.2 Basado en la proporción de la población


En poblaciones dicotómicas con una proporción π éxitos el estimador puntual del
parámetro π es la proporción muestral de éxitos, p, que coincide con la media de la
muestra cuando se codifica como 1 la característica que se considera como éxito y
0 la que se considera no éxito.

A partir de un tamaño muestral moderadamente grande el estadístico p tiene una


distribución aproximadamente normal. El intervalo de confianza Para la proporción
poblacional

está centrado en la proporción muestral; siendo sus límites superiores e

inferior donde z /2 es el valor crítico correspondiente al grado

de confianza 1- de la distribución normal tipificada y es el error típico de


la proporción.

Para obtener el intervalo de confianza y contrastar hipótesis sobre la proporción una

alternativa consiste en tratar a la proporción como la media poblacional de una

variable dicotómica codificada como se ha descrito anteriormente (éxito=1, no


éxito=0)

y la secuencia es:

Para el intervalo de confianza:


Analizar
Estadísticos Descriptivos
Explorar

Para contrastar la hipótesis nula


Analizar
Comparar medias
Prueba T para una muestra

Utilizando este criterio los resultados numéricos no coinciden exactamente con los
que se obtendrían aplicando la expresión del error típico de la proporción; no
obstante, la discrepancia es despreciable si el número de observaciones es
suficientemente grande.
2.5.3 Basado en la diferencia entre las medias de la población

En ocasiones interesa definir un intervalo de valores tal que permita establecer


cuáles son los valores mínimo y máximo aceptables para la diferencia entre las
medias de dos poblaciones. Pueden darse dos situaciones según las muestras
sean o no independientes; siendo en ambos casos condición necesaria que las
poblaciones de origen sean normales o aproximadamente normales:

• MUESTRAS INDEPENDIENTES

Si puede suponerse que las varianzas de ambas poblaciones son iguales, el


intervalo de confianza para la diferencia de medias poblacionales está centrado en
la diferencia de las medias muestrales, siendo sus límites superior e inferior:

t /2 es el valor crítico correspondiente al grado de confianza 1- de la distribución

t de Student con n1+ n2-2 grados de libertad y es


una estimación de la desviación típica común a ambas poblaciones obtenida a
partir de las varianzas de las dos muestras. En la práctica si n1 y n2 son
moderadamente grandes, el valor crítico

t /2 se aproxima, como ya se ha visto anteriormente, a los valores de la


distribución normal.

Si las varianzas poblacionales no pueden suponerse iguales los límites del


intervalo de confianza son:

El valor crítico t /2 corresponde a una distribución t cuyos grados de libertad se


calculan en base a ambos tamaños muéstrales y a las desviaciones típicas de
cada grupo según la corrección propuesta por Dixon y Massey:
Bibliografía
Alor, J. A. G. (2021, 11 octubre). Unidad II Estimación. Scribd.

https://es.scribd.com/document/535266204/Unidad-II-Estimacion

Estadística Básica Edulcorada. (2019). En Estadística Básica Edulcorada (p. 7.2).

https://bookdown.org/aquintela/EBE/

Estimador. (2018). Wolters Kluwer.

https://guiasjuridicas.wolterskluwer.es/Content/Documento.aspx?params=H4sIAAA

AAAAEAMtMSbF1jTAAASNjM1NLtbLUouLM_DxbIwMDS0NDA1OQQGZapUtckhl

QaptWmJOcSoAs8AlejUAAAA=WKE#:%7E:text=Para%20ser%20calificado%20de

%20buen%20estimador%20son%20caracter%C3%ADsticas%20importantes%20la

,el%20tama%C3%B1o%20de%20la%20muestra.

Hernández, G. O. (2018, 3 julio). Aplicaciones de la estadística en la Ingeniería.

gestiopolis. https://www.gestiopolis.com/aplicaciones-de-la-estadistica-en-la-

ingenieria/#:%7E:text=En%20el%20%C3%A1mbito%20de%20la,aplicar%20las%2

0t%C3%A9cnicas%20y%20herramientas.

Hernández, M. C. (2020). unidad 2 estadistica inferencial.docx. Scribd.

https://es.scribd.com/document/490147151/unidad-2-estadistica-inferencial-docx

Rios, A. (2017, 16 diciembre). ESTADISTICA INFERENCIAL 2 UNIDAD. Academia.

https://www.academia.edu/35447243/ESTADISTICA_INFERENCIAL_2_UNIDAD

Teorema de Bayes. (2018). Clasificación de variables.

https://intranetua.uantof.cl/facultades/csbasicas/Matematicas/academicos/emartine

z/Estadistica/clasifica/clasifica.html

Tipos de estimaciÃ3n y caracterÃsticas. (2015, 11 noviembre). SoyStaff. http://soy-

staff.blogspot.com/2015/11/tipos-de-estimacion-y-caracteristicas.html

También podría gustarte