Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Guía N°2 Estadística Uno

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD NACIONAL EXPERIMENTAL


SIMÓN RODRÍGUEZ
NUCLEO PALO VERDE

MATERIA: ESTADÍSTICA I
FACILITADOR: LIC. JOSÉ AVILA

SEPTIEMBRE 2018
I. MEDIDAS DE POSICIÓN.
Después que los datos han sido reunidos y tabulados, se inicia el análisis con el fin
de calcular un número {único, que represente o resuma todos los datos. Las
medidas de posición forman parte del conjunto de medidas descriptivas numéricas,
las cuales se clasifican en parámetros –cuando se calculan a partir de la población
total- y los estadígrafos - cuando se calculan a partir de los datos de una muestra.
Una medida de posición es un número que se toma como orientación para referirnos
a un conjunto de datos.
Uno de los problemas fundamentales que presenta un análisis estadístico, es el de
buscar el valor más representativo de una serie de valores. El primer paso que hay
que realizar para que se entienda una larga serie de valores u observaciones, es el
de resumir los datos en una distribución de frecuencia; esto no es suficiente para
fines practico, puesto que a menudo es necesario una sola medida descriptiva, y en
especial cuando se requiere comparar dos o más serie estadísticas. Es necesario
continuar el proceso de reducción hasta sustituir todos los valores observados por
uno solo que sea representativo, de tal forma que permita una interpretación global
del fenómeno en estudio; para que ese valor sea representativo debe reflejar la
tendencia de los datos individuales de la serie de valores. Un valor o dato de la serie
con estas características recibe el nombre de promedio, media o medida de
posición, esto es debido a su ubicación en la zona central de la distribución. Las
medidas de posición son de gran importancia en el resumen estadístico, ya que
representan un gran número de valores individuales por uno solo.
El valor más representativo de un conjunto de datos por lo general no es el valor
más pequeño ni el más grande, es un número cuyo valor se encuentra en un punto
intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia un valor
referido que representará la medida de posición de la serie de valores. Las medidas
de posición se emplean con frecuencia como mecanismo para resumir un gran
número de datos o cantidades con la finalidad de obtener un valor que sea
representativo de la serie.
Las Principales Medidas de Posición son:
La Media Aritmética, Mediana, Moda, los cuartiles, Deciles y Percentiles.
Todas ellas a su manera tratan de dar una idea del número alrededor del cual se
centra a todo el conjunto de datos.

CARACTERÍSTICAS DE LAS MEDIDAS DE POSICIÓN.


• Deben ser definidas rigurosamente y no ser susceptibles de diversas
interpretaciones.
• Deben depender de todas las observaciones de la serie, de lo contrario no
sería una característica de la distribución.
• No deben tener un carácter matemático demasiado abstracto.
• Deben ser susceptibles de cálculo algebraico, rápido y fácil.
MEDIA ARITMÉTICA.

La media aritmética o simplemente la media es la medida de posición de más


importancia y utilización en las aplicaciones estadísticas por su fácil cálculo e
interpretación. Se trata del valor medio de todos los valores que toma la variable
estadística de una serie de datos. La media es el valor más representativo de la
serie de valores, es el punto de equilibrio, el centro de gravedad de la serie de datos.
Por lo general se le designa con

La media aritmética de una serie de n valores de una variable X1, X2, X3; X4,.........Xn,
es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi,
entre el número total de ellos. La fórmula se puede expresar así:

Desviaciones o desvíos.- Son diferencias algebraicas entre cada valor de la serie


o cada punto medio y la media aritmética de dicha serie, o un valor cualquiera
tomado arbitrariamente. Los desvíos o desviación se designan con la letra di.
Dado una serie de valores X1, X2, X3, Xn , se llama desvío a la diferencia entre
un valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el valor
indicado k de la serie corresponde precisamente a la media aritmética de esos
valores dados, se dice entonces que los desvíos son con respecto a la media
aritmética. En símbolo:

PROPIEDADES DE LA MEDIA ARITMÉTICA.


1. La suma de las desviaciones con respecto a la media aritmética es igual a cero.

2. La suma de las desviaciones al cuadrado de los diversos valores con respecto a


la media aritmética es menor que la suma de las desviaciones al cuadrado de
los diversos valores con respecto a cualquier punto K, que no sea la media
aritmética.

3. La media aritmética total o conjunta de dos o más serie de datos, se puede


calcular en función de las medias aritméticas parciales y del número de datos de
cada una de ellas, mediante la siguiente formula:

Donde:
en esta n1, n2, n3 y nk es el número de datos de cada
serie.

Además,

son las medias de cada una de las series.

4. La media del producto de una constante por una variable, es igual al producto de
la constante por la media de la variable.

5. La media de la suma de una constante más una variable, es igual a la media de


la variable más la constante.

De la misma forma se cumple esta propiedad para la resta.

CARACTERÍSTICAS DE LA MEDIA ARITMÉTICA.


• El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la
serie de datos.

• La media se calcula con facilidad y es única para cada caso y permite


representar mediante un solo valor la posición de la serie de valores.

• La media es una medida de posición que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.

CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS.


Para calcular la media de datos no agrupados en clases se aplica la siguiente
formula:
En donde n es el número total de datos y son los valores de la variable.

CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS


Cuando se trabaja con la distribución de frecuencia agrupada, se parte del supuesto
de que todos los datos comprendidos en un intervalo de clase se distribuyen
uniformemente a lo largo de este, entonces se puede tomar la marca de clase o
punto medio () del intervalo como adecuada representación de los valores que
conforman el mencionado intervalo. Para calcular la media en estas condiciones se
pueden utilizar tres métodos: El método directo o largo y dos métodos abreviados.
En este curso utilizaremos el primer método.

MÉTODO DIRECTO
Este método se le conoce también como método largo; el mismo resulta demasiado
engorroso cuando las magnitudes de los puntos medios o de las frecuencias de
clase son muy grandes, debido a que los cálculos son demasiados extensos. Los
pasos a seguir para calcular la media con este método son los siguientes:

1. Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos
medios de cada clase y se colocan en sus respectivas columnas, se determinan
las frecuencias de cada clase y se ubican en sus respectivas columnas.

2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto
medio (X) así:

3. Luego se calcula la media aritmética aplicando la fórmula:


Donde n es igual al número total de datos.

Ejemplo:

Calcule la media de la siguiente distribución de frecuencia correspondiente al peso


en Kg. de un grupo de obreros. Realice los cálculos respectivos para completar el
siguiente cuadro.

Solución:
LA MEDIA PONDERADA
La media ponderada o promedio ponderado es una medida aritmética en el que cada
uno de los valores se le pondera de acuerdo a su importancia con el grupo general.
Las fórmulas de media ponderada poblacional y muestral son idénticas:

Ejemplo: Un estudiante obtuvo las siguientes calificaciones en su curso de


estadística I: 19, 20, 18 y 16. Sin embargo dentro de los porcentajes la tercera
calificación es la que tiene mayor ponderación o mayor valor debido a que
representaba el 30% de la calificación final, a continuación se reflejan los datos en la
siguiente tabla:

El promedio ponderado de calificaciones de este estudiante es de 18,16 puntos.

LA MEDIA GEOMÉTRICA

La media geométrica es útil para encontrar el promedio de porcentajes,


proporciones, índices o tasas de crecimiento. Tiene mucha aplicación en el
comercio y en la economía debido a que nos interesa encontrar el porcentaje
de cambio en ventas, salarios o cualquier otro dato económico. La media de
un conjunto n de números positivos se define como la n-ésima raíz del
producto de los n valores. La fórmula de la media geométrica se escribe así:
siendo:

n: número total de dígitos


Xi: Dígitos.

La mayoría de las calculadoras pueden calcular la raíz enésima de cualquier


número.

La media geométrica será siempre menor o igual a la media aritmética, pero


nunca mayor.

Ejemplo: En una empresa quieren saber la proporción media de mujeres


en los diferentes departamentos. Para ello, se recoge el porcentaje de mujeres en
los cinco principales departamentos.

Como es la media de porcentajes, calculamos la media geométrica que es


más representativa.
LA MEDIANA
La mediana es el valor que divide en dos partes iguales, al conjunto de
observaciones ordenadas respecto de sus magnitudes, de tal manera que el número
de datos por encima de la mediana sea igual al número de datos por debajo de la
misma. Se designa por las letras Me. Tal como sucede con la media, el método de
determinación depende de si los datos son agrupados o no.

CÁLCULO DE LA MEDIANA PARA DATOS NO


AGRUPADOS (Discretos).
Para encontrar la mediana en una serie de datos no agrupados, lo primero que se
hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la
posición que esta ocupa en esa serie de datos; para ello hay que determinar si la
serie de datos es par o impar.

Si el número n es impar, entonces la posición de la mediana se determina por la


fórmula:

Luego el número que se obtiene indica el lugar o posición que ocupa la mediana en
la serie de valores, luego la mediana será el número que ocupe el lugar de lo
posición encontrada.

Si n es par, se aplica la formula


El resultado obtenido, es la posición que ocupara la mediana, pero en este caso se
ubica la posición de la mediana por ambos extremos de la serie de valores y los dos
valores que se obtengan se le saca la media y esta será la mediana buscada, por
lo tanto la mediana, en este caso, es un número que no se encuentra dentro de la
serie de datos dados.

Ejemplos:

Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los años de servicios de un grupo
de trabajadores. Determine la mediana.

Lo primero que se hace es ordenar los datos en forma creciente o decreciente; Los
datos ordenados quedaran así: 5, 6, 7, 8, 9, 10, 12.

Luego, como se trata de un número impar de datos (n=7), se aplica la fórmula:

Para ubicar la posición de la mediana. Esto indica que la mediana ocupa la posición
4, que en la serie de valores esa posición corresponde al número 8, entonces, Me
= 8.

Tomemos ahora los datos: 5, 5, 7, 9, 11, 12, 15, 18. Como se trata de un número
par de datos (n =8), la mediana está dada por:

Cuando los valores de un conjunto de datos se agrupan en una distribución de


frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana
obtenida de una distribución de frecuencia de datos puede no ser la misma que la
mediana obtenida de los datos sin arreglar en clases, pero el resultado será una
aproximación. Cuando se trata de datos agrupados, la mediana se obtiene mediante
el método de interpolación. La interpolación parte del supuesto de que los datos de
cada intervalo de la distribución están igualmente distribuidos.
PASOS PARA DETERMINAR LA MEDIANA EN DATOS
AGRUPADOS.
1. Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases,
se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fi de esa
distribución.

2. Se determina la ubicación o posición de la mediana en el intervalo de la


distribución de frecuencia, mediante la fórmula:

El resultado obtenido determinará la clase donde se encuentra ubicada la mediana,


lo cual se conseguirá en la clase donde la frecuencia acumulada Fi sea igual o
superior a este resultado. Luego se aplica la fórmula:

Ejemplo:
Dada la siguiente distribución de frecuencia referida a las horas extras laboradas
por un grupo de obreros. Calcule la mediana. Realice los cálculos respectivos para
completar el siguiente cuadro.

N° de horas Obreros
Extras

55---59 6
60---64 20
65---69 18
70---74 50
75---79 17
80---84 16
85---89 5
n=132
Solución:

Luego se busca en la frecuencia acumulada Fi, un valor que sea


igual o superior a 66, este se encuentra en la clase 70 -74, la cual llamaremos
clase mediana. Por lo tanto el límite inferior de esa clase es 70 = Li. La frecuencia
absoluta de esa clase es 50 = fi, F(i-1) = 44 y el Ic = 5. Aplicando la formula se
tiene:

Luego la mediana de esa distribución es 72.2. Esto quiere decir


que un 50 % de los obreros trabajaron horas extras por debajo de
72.2 horas y el otro 50 % trabajaron horas extras por encima de
72.2 horas.

CARACTERÍSTICAS DE LA MEDIANA.
La mediana no es afectada por los valores extremos de una serie de valores,
puesto que la misma no es calculada con todos los valores de la serie.

• La mediana no está definida algebraicamente, ya que para su cálculo no


intervienen todos los valores de la serie.

• La mediana en algunos casos no se puede calcular exactamente y esto ocurre


cuando en una serie de valores para datos no agrupados el número de datos
es par, en este caso la mediana se calcula aproximadamente.
• La mediana se puede calcular en aquellas distribuciones de frecuencia de
clases abierta, siempre y cuando los elementos centrales puedan ser
determinados.

• La suma de los valores absolutos de las desviaciones de los datos individuales


con respecto a la mediana siempre es mínima. (propiedad)

LA MODA
La moda es la medida de posición que indica la magnitud del valor que se presenta
con más frecuencia en una serie de datos; es pues, el valor de la variable que más
se repite en un conjunto de datos. De las medidas de posición la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observación
de los datos en estudio, puesto que es el dato que se observa con mayor frecuencia.
Se designa con las letras Mo.

En las representaciones gráficas la moda es el punto más alto de la gráfica. La


obtención de la moda para datos agrupados no es un valor exacto, ya que varía con
las diferentes formas de agrupar una distribución de frecuencia.
En algunas distribuciones de frecuencias o serie de datos no agrupados o
agrupados se pueden presentar dos o más modas, en estos casos se habla de serie
de datos bimodales o multimodales respectivamente. Estos tipos de distribuciones
o series de valores se deben a la falta de homogeneidad de los datos.

Cuando los datos se encuentran no agrupados la determinación de la moda es


sencilla y exacta; pero para calcularla en datos agrupados existen varios
métodos; cada uno de los cuales puede dar un valor diferente de la moda: En
este curso se dará el método de la interpolación por considerarse uno de los más
precisos en el cálculo de esta. Este método puede expresarse mediante la
siguiente fórmula:
Ejemplo:
Dada la siguiente distribución de frecuencia correspondiente al peso en Kg. de un
grupo de trabajadores de una empresa, calcule la moda.

La clase que presenta mayor frecuencia absoluta es 80--- 89, entonces será la
clase modal, donde:

Aplicando la fórmula se tiene:

Este resultado de la moda se interpreta así: La mayoría de los trabajadores tienen


un peso aproximadamente de 82.22 Kg.

CARACTERÍSTICAS DE LA MODA.
 El valor de la moda puede ser afectado grandemente por el método de
elaboración de los intervalos de clases.
 El valor de la moda no se halla afectado por la magnitud de los valores
extremos de una serie de valores, como sucede en la media aritmética.
 La moda se puede obtener en una forma aproximada muy fácilmente,
puesto que la obtención exacta es algo complicado.
 La moda tiene poca utilidad en una distribución de frecuencia que no
posea suficientes datos y que no ofrezcan una marcada tendencia central.
 No es susceptible de operaciones algebraicas posteriores.
 La moda se utiliza cuando se trabaja con escalas nominales aunque se
puede utilizar con las otras escalas.
 La moda es útil cuando se está interesado en tener una idea aproximada
de la mayor concentración de una serie de datos.
COMPARACIÓN ENTRE LA MEDIA, LA MEDIANA Y LA MODA.

OTRAS MEDIDAS POSICIONALES.

Cuando se estudió la mediana se pudo detectar que esta divide la serie de valores en dos
partes iguales, una generalización de esta medida da origen a unas nuevas medidas de
posición denominadas:

Cuartiles, Deciles y Percentiles. Estas nuevas medidas de posición surgen por la


necesidad de requerir de otras medidas que expresen diferentes situaciones de orden,
aparte de las señaladas por la mediana. Por lo tanto es interesante ubicar otras medidas
que fraccionen una serie de datos en diferentes partes. Es bueno destacar que los cuartiles,
los Deciles y los Percentiles son unas variantes de la mediana: De la misma forma los
percentiles abarcan tanto a los cuartiles como a los Deciles.

LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia


en cuatro partes iguales. Se designa por el símbolo Qc en la que c corresponde a los valores
1, 2 y 3. El Q1 es el valor debajo del cual queda el 25 % de los datos; Q3 deja el 75
% de los datos y Q2 divide la distribución de frecuencia en dos partes iguales, un 50 % que
está por debajo de los valores de Q2 y otro 50 % que está por encima del valor de Q2. El Q2
es igual a la mediana.

CÁLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene ninguna utilidad


práctica calcular los cuartiles. Para el cálculo de los cuartiles en datos agrupados en una
distribución de frecuencia existe un método por análisis gráfico y otro por determinación
numérica, por fines prácticos en esta cátedra se utilizara él último método. Para calcular los
cuartiles por el método numérico se procede de la siguiente manera:
1. Se localiza la posición del cuartil solicitado aplicando la fórmula de posición:
En donde c viene a ser el número del cuartil solicitado, n corresponde al número total
de datos de la distribución y 4 corresponde al número de cuartiles que presenta una
distribución de frecuencia.

2. Se determina la posición que ocupa el cuartil mediante la fórmula:

El resultado obtenido determinara la clase donde se encuentra ubicado el cuartil, lo cual


se conseguirá en la clase donde la frecuencia acumulada Fi que sea igual o superior a
este resultado. Luego se aplica la fórmula:

LOS PERCENTILES.- Son medidas posesiónales que dividen la distribución de


frecuencia en 100 partes iguales. Con estos se puede calcular cualquier
porcentaje de datos de la distribución de frecuencia. Los percentiles son las
medidas más utilizadas para propósitos de ubicación de valor de una serie de
datos ubicados en una distribución de frecuencia. El número de percentiles de
una distribución de frecuencia es de 99. El percentil 50 es igual a la mediana y
al cuartil 2, es decir: Me=Q2=P50% por encima y 50 % por debajo de los datos
de la distribución.

El cálculo de los percentiles es similar al cálculo de los cuartiles con una variante
en la posición de ubicación de estos, que viene expresada por la siguiente
fórmula:
Ejemplo:
Dada la siguiente distribución correspondiente al salario semanal en dólares de
un grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q 1, b)
Q2, c) Compare los resultados con la mediana, d)P25, e)P50, f) P70

a) Para calcular Q1 se determina primero la posición así:

Q1 = 115.75. Con ese valor de la posición encontrado se busca en las


frecuencias acumuladas para ver cual de esas es mayor o igual a ese valor.
Observando las frecuencias acumuladas se puede detectar que la posición
115.75 se encuentra en la clase 300------399, por lo tanto el Li = 300, fi = 90,
y la F(i-1) = 85 y Ic = 100, aplicando la formula se tiene:

Este valor de Q1 indica que el 25 % de los obreros en estudio, devengan


un salario semanal por debajo de 334.17 $ y el 75 % restante gana un
salario por encima de 334.17 $.

b) Para calcular Q2=Me se determina primero la posición de este así.

Ahora se ubica esta posición en las frecuencias acumuladas para determinar


la posición de Q2, se puede observar en la distribución que esta posición está
ubicada en la clase 400----499, entonces, Li = 400, fi = 120, F(i-1) = 175 y Ic
= 100, aplicando la formula se tiene:
Este resultado de Q2 establece que el 50 % de los obreros de este
estudio, devengan un salario semanal por debajo de 447.08 $ y el otro
50 % devenga un sueldo por encima de 447.08 $. Calcule la mediana y
compárela con este resultado.

c) Calcular, Q2 = P50, además P25 = Q1, la comprobación de estos resultados


se le deja como practica al estudiante.

f) Para calcular P70 lo primero que se hace es determinar la posición,

Ahora se ubica este resultado en la columna de frecuencias acumuladas para


encontrar la posición de P70 en la distribución de frecuencia. Como se puede
observar en la tabla de distribución de frecuencia, P70 se encuentra ubicado
en la clase 500 599, entonces, Li = 500, fi = 70, F(i-1) = 295 y
Ic = 100, aplicando la formula se tiene:

Esto indica que el 70 % de los obreros devengan un sueldo semanal que


está por debajo de 541.57 $ y que el 30% de los restantes obreros, ganan
un salario por encima de 541.57 $.

También podría gustarte