Resumen Estadística
Resumen Estadística
Resumen Estadística
espacio muestral.
Una variable aleatoria de tipo discreto es aquella que toma un número finito de valores, e incluso puede
tomar un número infinito, pero siempre que este número infinito sea numerable.
¿Qué relación existe entre la f(x,y) y la F(x,y)?---La f(x, y) coincide con la derivada parcial segunda,
respecto a x e y, de la función de distribución F(x, y).
Distribuciones marginales
Distribuciones discretas. El alumno entenderá que tendrá todo el sentido hablar de: las
funciones de cuantía condicionadas y las funciones de distribución condicionadas.
Medidas de forma.
El coeficiente de correlación de Pearson es un índice estadístico que mide la fuerza de la relación lineal
que existe entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, el coeficiente de
correlación de Pearson es independiente de la escala de medida de las variables aleatorias. Se define
como:
Distribución de Bernoulli. Este modelo se utiliza principalmente en
situaciones en las que sólo pueden ocurrir dos
resultados posibles mutuamente excluyentes:
uno de ellos de probabilidad p y la otra 1-p
Distribución binomial. Cuando repetimos de forma independiente
un ensayo Bernoulli
Teorena Central del Límite: No existe un único Teorema Central del Límite, sino un conjunto de
teoremas, todos ellos dando condiciones para que una sucesión de variables aleatorias tienda a
distribuirse según una distribución normal. Muchas variables aleatorias que se encuentran en la práctica
son sumas o promedios de un número grande de variables aleatorias independientes.
- La validez del teorema central del límite no está limitado a variables aleatorias
continuas y simétricas, se extiende también a variables aleatorias discretas y
asimétricas. Así tenemos el Teorema de Moivre
En una estimación puntual se utiliza un solo número o valor para determinar una
estimación del parámetro poblacional desconocido. En la estimación puntual se asume que
el estadístico es un buen estimador del parámetro desconocido. Obviamente cualquier
estadístico no sirve, es necesario que satisfaga ciertas propiedades:
Contrastación de hipótesis.
Una hipótesis estadística es una conjetura relativa a alguna característica de la población,
que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la
información extraída de las muestras, y tanto si se aceptan como si se rechazan se puede
cometer un error.
La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa
por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1).
En este caso los pasos a seguir son los siguientes, plantear las hipótesis, escoger un
estadístico concreto, conocer la distribución de este estadístico y decidir, con los datos de
la muestra, si estamos caracterizando a la población.
2. Estimador eficiente.
Se tiene dos estimadores insesgados , que siguen las mismas distribuciones , para
un mismo tamaño muestral n , se sidece que uno es más eficiente que el otro
cuando su varianza es menor.
3.Estimador consistente.
4.Estimador suficiente.
Estimador invariante: Un estimador es invariante si se verifica que el estimador de una función del
parámetro es igual a la función del estimador del parámetro.
- Son suficientes.
Introduciendo un nuevo método de estimación, que llamaremos «estimación por intervalos». En este
método se trata de hallar dos estadísticos t1 (X1, X2,..., Xn) y t2 (X1, X2,..., Xn) que serán, por tanto,
variables aleatorias como ya sabemos, y tales que para el parámetro poblacional desconocido θ, se
cumpla:
Siendo conocida Siendo desconocida
Intervalo de confianza para la media.
n>=30
n<30
n es grande
Contrastes de hipótesis.
Hipótesis estadística: Es cualquier afirmación que hagamos, verdadera o falsa, sobre alguna
característica desconocida de la población.
- Si una hipótesis, nula o alternativa, designa un único valor, llamado parámetro poblacional en
este caso, se dice que la hipótesis es simple.
- La hipótesis, nula o alternativa, también puede designar un rango de valores para el
parámetro desconocido. Una hipótesis de este tipo se denomina compuesta y será cierta para más
de un valor del parámetro poblacional.
El Error de Tipo II, ocurre cuando no se rechaza la hipótesis nula y es falsa. Supongamos
que para una determinada regla de decisión particular, la probabilidad de cometer este
error se denota por . Entonces, la probabilidad de rechazar una hipótesis nula falsa es
nula H 0
6. Interpretación: Si el valor calculado para el estadístico cae dentro de la región crítica, entonces la
hipótesis nula H 0 se rechaza y si cae dentro de la región de aceptación entonces no se rechaza
H 0
Valor Probabilístico o P-valor.
Contraste no significativo: p- valor > α (no se rechaza H 0 )
Contrastes no paramétricos.
Pruebas paramétricas
Ventajas: Desventajas:
1.- Por lo general, son fáciles de usar y
entender.
1.-Pueden, ignorar,
2.- Eliminan la necesidad
desperdiciar o incluso
de suposiciones restrictivas
prescindir de información.
de las pruebas
paramétricas. 3.- Se pueden 2.- No son tan eficientes
pequeñas. paramétricas.
Concepto de racha: Sea una sucesión en la que intervienen dos tipos de símbolos entonces definimos
una racha como una sucesión de uno o más símbolos idénticos, que están precedidos o seguidos
por un símbolo diferente o por ninguno, siendo la longitud de una racha el número de símbolos
iguales que incluye.