Estadistica Comercial
Estadistica Comercial
Estadistica Comercial
SERIES SIMPLES
Se considerarán para el caso que nos ocupa, series finitas. (están acotadas). Es decir, que tienen una
cantidad de números limitada (pocos) y que sea posible realizar operaciones no engorrosas utilizando
calculadoras.
Están dadas entonces, por una cantidad finita de datos estén estos ordenados o no.
DATOS NO AGRUPADOS
Datos no agrupados es el conjunto de observaciones que se presentan en su forma original tal y como
fueron recolectados, para obtener información directamente de ellos. Los datos no agrupados es un
conjunto de información si ningún orden que no nos establece relación clara con lo que se pretende
desarrollar a lo largo de un problema, esto se soluciona mediante una tabulación que nos conduce a una
tabla de frecuencias.
Muchas veces el proceso de análisis de datos se cuenta con un gran volumen de información en bruto
(datos no agrupados)
DATOS AGRUPADOS
RANGO
El rango de clase, conocido también como amplitud de clase o recorrido de clase, es el límite dentro de
los cuales están comprendidos los valores de la serie de datos, en otras palabras, es el número de
diferentes valores que toma la variable en un estudio de investigación dada. Es la diferencia entre el
valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango
de una distribución de frecuencia se designa con la letra R.
Cada intervalo quedará entonces definido por sus límites superior e inferior...a la diferencia entre ambos
extremos se le denomina "amplitud del intervalo"
FRECUENCIA ABSOLUTA:
el número de veces que aparece un valor, se representa con donde el subíndice representa cada uno de
los valores. La suma de las frecuencias absolutas es igual al número total de datos, representado por f1.
FRECUENCIA ACUMULADA: la suma de frecuencias absolutas de todos los valores iguales o inferiores al
valor considerado, se representa por N1 .
Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre el número total de
datos, se representa por .
(nótese que cuando se trata de acumuladas las letras que las representan están en mayúscula)
LIMITES EXACTOS.
Los limites nominales de una clase indican los valores mínimos y máximos aceptables en esa clase, sin
embargo, existe una zona entre el limite superior de una clase y el limite inferior de la clase siguiente
que no esta incluida en los limites nominales.
Aquí es donde intervienen los conceptos de limites exactos, los cuales marcan con precisión el valor
inicial y el final de cada clase.
PUNTO MEDIO (estadísticas)
El punto medio es el valor medio de un conjunto de datos. Para un conjunto de datos con un número
impar de miembros, es el miembro del conjunto de datos con apenas tantos valores menos que su valor
como mayor que él. Para un conjunto de datos con un número par de miembros, es el promedio de los
dos valores medios del conjunto de datos. El punto medio se utiliza en estadísticas para analizar un
conjunto de datos.
PORCENTAJE:
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en
términos de tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia
relativa por 100. La denotaremos por pi.
PROPORCIÓN
Matemáticamente, una proporción es la igualdad de dos razones cuyo objetivo es establecer la relación
entre una parte con respecto al todo. En las proporciones no se multilica el cociente resultan e por 100,
ya que la relación se establece respecto de la unidad. Las proporciones y los porcentajes ofrecen la
misma información, auque estos últimos se emplean más por ser más fácil su comprensión.
PROPORCIÓN POBLACIONAL
En poblaciones dicotómicas con una proporción de éxitos el estimador puntual del parámetro es
la proporción muestral de éxitos, p, que coincide con la media de la muestra cuando se codifica como 1
la característica que se considera como éxito y 0 la que se considera no éxito. A partir de un tamaño
muestral moderadamente grande el estadístico p tiene una distribución aproximadamente normal. El
intervalo de confianza para la proporción poblacional está centrado en la proporción muestral; siendo
El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extraída de
una población grande. A causa de las muchas observaciones que podemos realizar en la población es
posible teóricamente (para datos continuos) elegir los intervalos de clase muy pequeños y todavía tener
un número adecuado de observaciones dentro de cada clase. Así se tiene que el polígono de frecuencias
o el de frecuencias relativas para una población grande puede estar formado por muchos pequeños
segmentos rectos que aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas
de frecuencias o curvas de frecuencias relativas, respectivamente.
MEDIANA ESTADÍSTICA
ESTADISTICOS DE VARIABILIDAD
ESTADÍSTICOS DE POSICIÓN
Para una variable discreta, se define el percentil de orden k, como la observación, Pk, que deja por
debajo de si el k% de la población. Esta definición nos recuerda a la mediana, pues como consecuencia
de la definición es evidente que
Med= P50
Los cuantiles son puntos tomados a intervalos regulares de la función de distribución de una variable
aleatoria.
El término cuantil fue usado por primera vez por Kendall en 1940. El cuantil de orden p de una
distribución (con 0 < p < 1) es el valor de la variable que marca un corte de modo que una
proporción p de valores de la población es menor o igual que . Por ejemplo, el cuantil de orden
0,36 dejaría un 36% de valores por debajo y el cuantil de orden 0,50 se corresponde con
la mediana de la distribución.
CUARTILES
Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales.
Utilizando cuartilespuede evaluar rápidamente la dispersión y la tendencia central de un
conjunto de datos, que son los pasos iniciales importantes para comprender sus datos. 25% de
los datos es menor que o igual a este valor.
DECIL (ESTADÍSTICA)
En estadística descriptiva, el concepto decil se refiere a cada uno de los 9 valores que dividen un grupo
de datos (clasificados con una relación de orden) en diez partes iguales, y de manera que cada parte
representa un décimo de la población. En resumen, los deciles son cada uno de los nueve valores que
dividen un conjunto de datos en diez grupos con iguales efectivos. Son los nueve valores que dividen la
serie de datos en diez partes
EL PERCENTIL
es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a
mayor, el valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en
un grupo de observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se encuentran el 20 por
ciento de las observaciones.
Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la
muestra son valores menores que él y el 100-i % restante son mayores.
Aparecen citados en la literatura científica por primera vez por Francis Galton en 18851
P25 = Q1.
P50 = Q2 = mediana.
P75 = Q3.
ESTADÍSTICOS DE DISPERSIÓN:
RANGO INTERCUARTÍLICO
Definición
El rango intercuartílico es una medida de variabilidad adecuada cuando la medida de posición central
empleada ha sido la mediana. Se define como la diferencia entre el tercer cuartil (Q3) y el primer cuartil
(Q1), es decir: RQ = Q3 - Q1. A la mitad del rango intercuartil se le conoce como desviación cuartil (DQ),
es afectada muy poco por cuentas extremas. Esto lo hace una buena medida de dispersión para
distribuciones sesgadas: DQ = RQ/2= (Q3 - Q1)/2.
RANGO SEMICUARTIL
obtiene evaluando .
DESVIACIÓN MEDIA
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la
media. Se simboliza por y se calcula aplicando la fórmula
Informa de lo muy dispersados (o no) que están los datos. Una desviación media elevada implica mucha
variabilidad en los datos, mientras que una desviación media igual a cero implica que todos los valores
son iguales y por lo tanto coinciden con la media.
VARIANZA
En teoría de probabilidad, la varianza o variancia (que suele representarse como {\displaystyle \sigma
^{2}} ) de una variable aleatoria es una medida de dispersióndefinida como la esperanza del
cuadrado de la desviación de dicha variable respecto a su media. O en pocas palabras, es la media de los
residuos al cuadrado.
DESVIACIÓN TÍPICA
Para conocer con detalle un conjunto de datos, no solo basta con conocer las medidas de tendencia
central, sino que necesitamos conocer también la desviación que presentan los datos en su distribución
respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más
acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones.
MEDIDAS DE ASIMETRIA Y CURTOSIS
SESGO
Sesgo proviene de sesgar, un verbo que hace referencia a torcer o atravesar algo hacia uno de sus lados.
El término, por lo tanto, se utiliza para hablar de algo torcido, cortado o que se sitúa de forma oblicua.
SESGO SIMETRICO
SESGO POSITIVO
En estadística tradicional se dice que hay sesgo cuando los valores empíricos de un suceso no coinciden
con la media aritmética, luego la puntuación diferencial no es igual a cero. En la teoría de Probabilidad
Imposible se dirá que hay sesgo cuando la probabilidad empírica de sujeto u opción no es idéntica a la
probabilidad teórica, siendo entonces el Nivel de Sesgo distinto de cero. Si la diferencia de probabilidad
empírica menos teórica es igual a un valor positivo entonces se dirá que hay sesgo positivo, indicando el
Nivel de Sesgo, la diferencia de ambas variables, la probabilidad empírica menos la teórica, el valor
cuantitativo en que la probabilidad empírica excede o supera a la probabilidad teórica. En caso inverso,
que el valor del Nivel Sesgo sea igual a un valor negativo, entonces hay sesgo negativo, siendo la medida
de en cuanto la probabilidad empírica se encuentra por debajo de la teórica.
SESGO NEGATIVO
Estudios de sesgo negativo son aquellos que estudian probabilidades empíricas inferiores a la
probabilidad en igualdad de oportunidades, la probabilidad teórica, 1/N. Dada una probabilidad empírica
cualquiera inferior a probabilidad en igualdad de oportunidades, inversión de N, 1/N, producirá un sesgo
negativo proporcional a la diferencia de ambas probabilidades, empírica menos teórica. Cuando el
objeto de estudio sea la investigación de las tendencias empíricas inferiores a lo que debería ser un
comportamiento en igualdad de oportunidades, se dice que es un estudio de sesgo negativo.
CURTOSIS
La curtosis de una variable estadística/aleatoria es una característica de forma de su distribución de
frecuencias/probabilidad.
Según su concepción clásica, una mayor curtosis implica una mayor concentración de valores de la
variable muy cerca de la media de la distribución (pico) y muy lejos de la misma (colas), al tiempo que
existe una relativamente menor frecuencia de valores intermedios (hombros). Esto explica una forma de
la distribución de frecuencias/probabilidad con colas más gruesas, con un centro más apuntado y una
menor proporción de valores intermedios entre pico y colas.
Una mayor curtosis no implica una mayor varianza, ni viceversa.
Un coeficiente de apuntamiento o de curtosis es el cuarto momento con respecto a la media
estandarizado que se define como:
donde se ha sustraído 3 (que es la curtosis de la distribución normal o gaussiana) con objeto de generar
un coeficiente que valga 0 para la Normal y tome a ésta como referencia de curtosis.
Tomando, pues, la distribución normal como referencia, una distribución puede ser: