Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Fundamentos Básicos de La Estadistica

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 23

REPUBLICA BOLIVARIANA DE VENEZUELA

INSTITUTO UNIVERSITARIO DE ADMINISTRACIÓN INDUSTRIAL- IUTA


PUBLICIDAD Y MERCADEO
Profesor: Rubén Jacobo

VARGAS L., Adriana C. C.I.: 24.899.689

Sección 291A1

Caracas, 20 de junio 2018


INTRODUCCION

La estadística es un método efectivo para describir con exactitud los valores


de datos económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve
como herramienta para relacionar y analizar dichos datos.

El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los


datos, sino sobre todo en el proceso de “interpretación” de esa información.

La estadística es una serie de técnicas y métodos para ordenar y agrupar


convenientemente una serie de datos provenientes de un levantamiento de
información de una muestra, los cuales son procesados para obtener un
estadístico, el cual nos da una idea del comportamiento de dicha muestra.

En el presente trabajo se estudiaran los fundamentos básicos de la


estadística, distribuciones de frecuencias, medidas de tendencia central y de
posición, las medidas de dispersión y de asimetría, exponiendo la utilidad de la
estadística como herramienta de análisis.
FUNDAMENTOS BASICOS DE LA ESTADISTICA

La estadística es una rama especializada de las matemáticas que se ocupa


de reunir, organizar y analizar datos numéricos cuyo fin es el análisis de conjuntos
de datos y que ayuda a resolver problemas como el diseño de experimentos y la
toma de decisiones.

La Estadística para su mejor estudio se ha dividido en dos grandes ramas:


Estadística Descriptiva y la Estadística Inferencial.

La Estadística Descriptiva consiste en la presentación de datos en forma


de tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos
y está diseñada para resumir o describir los mismos, sin factores pertinentes
adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como
tales. Es en general utilizada en la etapa inicial de los análisis, cuando se tiene
contacto con los datos por primera vez.

La Estadística Inferencial se deriva de muestras, de observaciones


hechas sólo acerca de una parte de un conjunto numeroso de elementos y esto
implica que su análisis requiere de generalizaciones que van más allá de los
datos. La Estadística Inferencial investiga o analiza una población partiendo de
una muestra tomada.

La Estadística descriptiva y la inferencial comprenden la estadística


aplicada. Hay también una disciplina llamada estadística matemática, la cual se
refiere a las bases teóricas de la materia, e incluye el estudio de las
probabilidades.

La Probabilidad puede ser pensada como la teoría matemática utilizada


para estudiar la incertidumbre oriunda de fenómenos de carácter aleatorio, o sea,
producto del azar.

Aplicaciones de la Estadística: La Estadística se aplica en todas las


ramas o áreas de la ciencia. Aplicación en los negocios: Estudios de mercado.
Estudio del valor de un cliente. Predicción de ventas. Evaluación del territorio de
ventas. Análisis de Mercadeo directo y promociones. Entre otros.
En las ciencias naturales: se utiliza en modelos termodinámicos complejos,
en física cuántica, mecánica de fluidos, etc.

En las ciencias sociales y económicas: En el desarrollo demográfico y la


sociología aplicada.

En las ciencias médicas: Se utiliza para diversas actividades de la medicina,


entre las que se encuentran: Realización y análisis en la investigación médica,
diagnóstico de enfermedades, predicción del resultado probable de un programa
de intervención, etc.

Un estudio estadístico consta de las siguientes fases: Recogida de datos.


Organización y representación de datos. Análisis de datos. Obtención de
conclusiones.

Definiciones fundamentales de conceptos estadísticos

Para lograr cierto dominio del lenguaje técnico de la estadística, es


recomendable conocer las definiciones de diferentes términos empleados en la
estadística, entre los que están:

Población. Es el conjunto de todos los posibles elementos que intervienen


en un experimento o en un estudio. La hay de dos tipos

Población finita. Es aquella que indica que es posible alcanzarse o


sobrepasarse al contar. Es aquella que posee o incluye un número limitado
de medidas y observaciones.

Población infinita. Es infinita si se incluye un gran conjunto de


medidas y observaciones que no pueden alcanzarse en el conteo. Son
poblaciones infinitas porque hipotéticamente no existe límite en cuanto al
número de observaciones que cada uno de ellos puede generar.

Muestra. Un conjunto de medidas u observaciones tomadas a partir de una


población dada. Es un subconjunto de la población.

Muestra representativa. Un subconjunto representativo seleccionado de


una población de la cual se obtuvo.
Muestreo. Al estudio de la muestra representativa.

Censo. Al estudio completo de la población.

Parámetro. Lo constituyen las características medibles en una población


completa. Se le asigna un símbolo representado por una letra griega.

Estadístico o estadígrafo. Es la medida de una característica relativa a


una muestra. La mayoría de los estadísticos muéstrales se encuentran por medio
de una fórmula y suelen asignárseles nombres simbólicos que son letras latinas.

Datos estadísticos Los datos son agrupaciones de cualquier número de


observaciones relacionadas. Para que se considere un dato estadístico debe tener
dos características: 1) Que sean comparables entre sí. 2) Que tengan alguna
relación.

Variable: Se refiere a cualquier valor que puede asumir un elemento de un


conjunto. Variable estadística es lo que se observa o mide sobre las unidades
estadísticas. Son características que varían de un individuo a otro. Es el conjunto
de valores que constituye un carácter estadístico.

Las variables estadísticas se clasifican en dos grupos:

Variables Cualitativas: Estas variables representan las características o


propiedades de los objetos o elementos en estudio, relativas a las cualidades.
Cuando no es posible hacer medidas numéricas, son susceptibles de clasificación.
Ejemplo: La marca de un vehículo. Color de autos: rojo, verde, azul.

Variables cuantitativas o escalar: Estas variables indican de los objetos o


elementos en estudio, las cantidades.

Las variables cuantitativas, a su vez, se dividen en dos grupos:

Variables discretas: Es la variable que toman única y


exclusivamente valores enteros. Son ejemplos de Variables discretas: El
número de hijos de una familia. La cantidad de artículos en una tienda. El
número de estudiantes (1,2,3,4)
Variables continúas, Es aquella que teóricamente puede tomar
cualquier valor en una escala de medidas, ya sea entero o fraccionario.
Ejemplo: las medidas de los recién nacidos, la estatura de los ciudadanos
de un determinado colectivo, la medición de temperaturas, etcétera.

DISTRIBUCION DE FRECUENCIA

La distribución de frecuencia es una disposición tabular de datos


estadísticos, ordenados ascendente o descendentemente, de acuerdo a la
frecuencia de cada dato. Las frecuencias pueden ser:

Frecuencia absoluta (fi): Es el número de veces que se repite un


determinado valor de la variable (xi). Propiedad: la suma de todas las frecuencias
absolutas es igual al total de observaciones (n).

Frecuencia acumulada (Fi): Las frecuencias acumuladas de una


distribución de frecuencias son aquellas que se obtienen de las sumas sucesivas
de las fi que integran cada una de las filas de una distribución de frecuencia, esto
se logra cuando la acumulación de las frecuencias se realiza tomando en cuenta
la primera fila hasta alcanzar la última. Propiedad: La última frecuencia
acumulada absoluta es igual al total de observaciones.

Frecuencia relativa (hi): Es aquella que resulta de dividir cada una de las
frecuencias absolutas entre el número total de datos. Las frecuencias relativas son
un porcentaje, ya que relacionan una parte del conjunto con el total La
correspondencia entre los valores de la variable y su frecuencia relativa determina
lo que denominamos “distribución de frecuencias relativas”. Propiedad: la suma
de todas las frecuencias relativas es igual a la unidad.

Frecuencia relativa acumulada (Hi): Es aquella que resulta de dividir cada


una de las frecuencias acumuladas entre número total de datos. Se designa con
las letras Hi. Propiedad: La última frecuencia relativa acumulada es la unidad.
DISTRIBUCION DE FRECUENCIA (GRAFICA)

Una vez que se han recolectado los datos de la muestra y se han


construido las tablas de distribución de frecuencia, es necesario realizar una
representación gráfica de la información que nos permita tener una idea clara,
precisa y rápida de las observaciones de la muestra.

Existen muchos tipos de gráficas en las que se pueden representar las que
se pueden representar las frecuencias absolutas, frecuencias relativas,
frecuencias acumuladas y frecuencias relativas acumuladas.

Los diferentes tipos de gráficas que se pueden utilizar para representar las
observaciones de un determinado fenómeno y la selección del tipo de gráfica
dependen de la variable en estudio.

Si la variable en estudio es de tipo cualitativo, las gráficas


recomendadas pueden ser: De barras (horizontales o verticales). De pastel o
circulares.

Diagrama de barras: Un diagrama de barras se utiliza para de presentar


datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos
ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y
sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas. Los
datos se representan mediante barras de una altura proporcional a la frecuencia.

Color ojos Empleados

Negros 14

Marrones 24

Verdes 4

Azules 8

De pastel o circulares: Se puede utilizar para todo tipo de variables, pero


se usa frecuentemente para las variables cualitativas. Los datos se representan en
un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia
absoluta correspondiente. El diagrama circular se construye con la ayuda de un
transportador de ángulos.

Si la variable en estudio es de tipo cuantitativo, las gráficas


recomendadas pueden ser: Histogramas. Polígonos de frecuencias. Ojivas.

Histogramas: Es una gráfica de barras verticales que representa una


distribución de frecuencias de una variable cuantitativa. El histograma se
construye colocando primero los límites reales de clase en el eje horizontal y las
frecuencias en el eje vertical, se traza una barra rectangular para cada clase, los
límites reales de clase se utilizan para medir el ancho de la base de la barra y la
frecuencia para medir la altura.

Polígonos de frecuencias: Se construye a partir de los datos de la tabla de


frecuencias. Un histograma puede transformarse en un polígono de frecuencias
uniendo mediante segmentos los puntos medios (marca de clase) ubicados en la
parte superior de los rectángulos, los rectángulos no son parte del polígono, pero
se emplean como ayuda visual. El polígono que se forma comienza en el punto
medio de la clase que se encuentra inmediatamente antes de la clase más baja y
termina en el punto medio de la clase inmediata posterior a la clase más alta.

Tanto el histograma como el polígono de frecuencias nos permiten obtener


una imagen rápida de las principales características de los datos, tales como;
tendencias, concentración de puntos, máximos y mínimos.

Ojivas:
Es un polígono
de

frecuencias acumuladas o frecuencias relativas acumuladas y tiene las siguientes


características: Un título que identifica a la muestra o población. Una escala
vertical que representa la frecuencia acumulada o la frecuencia relativa
acumulada. Una escala horizontal que inicia con el límite real inferior de la primera
clase y termina con el límite real superior de la última clase.
MEDIDAS DE TENDENCIA CENTRAL Y DE POSICION CENTRAL

MEDIDAS DE TENDENCIA CENTRAL:

Son medidas estadísticas que pretenden resumir en un solo valor a un


conjunto de valores. Representan un centro en torno al cual se encuentra ubicado
el conjunto de los datos. Las medidas de tendencia central más utilizadas son:
media, mediana y moda.

Los procedimientos para obtener las medidas estadísticas difieren


levemente dependiendo de la forma en que se encuentren los datos. Si los datos
se encuentran ordenados en una tabla estadística diremos que se encuentran
“agrupados” y si los datos no están en una tabla hablaremos de datos “no
agrupados”.

La media aritmética: Es la más utilizada. Es el valor central alrededor del


cual están la mayoría de las observaciones. Sólo puede calcularse para variables
cuantitativas. La media se expresa en la misma unidad que los datos originales:
centímetros, horas, gramos, etc. La media aritmética es el valor obtenido al sumar
todos los datos y dividir el resultado entre el número total de datos.

Es el símbolo de la media aritmética.


La mediana: La utilizaremos cuando la distribución sea muy
asimétrica. Los valores extremos no le afectan (a diferencia de la
media aritmética) ya que para su cálculo sólo se toman los valores que
ocupan posiciones centrales. Se puede calcular para todo tipo de variables,
excepto cualitativas. La Mediana de una variable X, representada por Md, se
define como el valor de la variable que divide la distribución de frecuencias en dos
partes iguales, conteniendo cada una el 50% de las observaciones.

Cálculo de la mediana:

1. Ordenamos los datos de menor a mayor.

2. Si la serie tiene un número impar de medidas la mediana es la


puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6 M e = 5

3. Si la serie tiene un número par de puntuaciones la mediana es la media


entre las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12 M e = 9.5

Cálculo de la mediana para datos agrupados: La mediana se encuentra


en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de
las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se
encuentre

Li es el límite inferior de la clase donde se encuentra la mediana.

Es la semisuma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

La mediana es independiente de las amplitudes de los intervalos.


La moda: Se puede calcular para variables cualitativas y cuantitativas. Se
representa por Mo y se define como el valor o categoría de la variable con mayor
frecuencia absoluta.

Si los datos están agrupados en intervalos, la moda se puede calcular


excepto si el intervalo modal coincide con el intervalo abierto.

Si la variable es cualitativa, la moda es la categoría con la máxima


frecuencia.

Si la variable es cuantitativa, la moda es el valor con la máxima frecuencia


absoluta.

Si la variable es cuantitativa con datos en intervalos, se localiza el intervalo


modal (intervalo con la frecuencia máxima) y la moda es el punto medio de dicho
intervalo. Podemos tener distinto número de modas en la distribución (1=
unimodal) (2=bimodal) (3=trimodal); etc.

Distribución amodal = cuando no hay moda ya que todos los valores tienen
la misma frecuencia absoluta.

Hallar la moda de la distribución:

2, 3, 3, 4, 4, 4, 5, 5 Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y


esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir,
tiene varias modas.

1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 M o = 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no


hay moda. 2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el


promedio de las dos puntuaciones adyacentes.

0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálculo de la moda para datos agrupados: 1º Todos los intervalos tienen
la misma amplitud.

Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.

fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.

También se utiliza otra fórmula de la moda que da un valor aproximado de


ésta:

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La fórmula de la moda aproximada cuando existen distintas amplitudes es:

MEDIDAS DE POSICIÓN

La medida de tendencia central busca un indicador para representar a un


conjunto de datos. En cambio, las medidas de posición buscan un indicador para
representar a un sujeto o a un dato en particular. Las medidas o índices de
posición, informan acerca de la posición relativa de un sujeto con respecto a su
grupo de referencia. Dependiendo de cuántos valores de la variable utilicemos
para dividir la distribución, hablaremos de, cuartiles, deciles o percentiles
Cuartiles: Son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la
mediana.

Cálculo de los cuartiles: Ordenamos los datos de menor a mayor.2.


Buscamos el lugar que ocupa cada cuartil mediante la expresión

Número impar de datos 2, 5, 3, 6, 7, 4, 9

Número par de datos 2, 5, 3, 4, 6, 7, 1, 9

Cálculo de los cuartiles para datos agrupados: En primer lugar


buscamos la clase donde se encuentra, en la tabla de las
frecuencias acumuladas.

Li es el límite inferior de la clase donde se encuentra el cuartil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del cuartil.

ai es la amplitud de la clase.
Deciles: Son los nueve valores que dividen la serie de datos en diez partes
iguales. Los deciles dan los valores correspondientes al 10%, al 20%. y al 90% de
los datos. D5 coincide con la mediana.

Cálculo de los deciles: En primer lugar buscamos la clase donde


se encuentra, en la tabla de las frecuencias
acumuladas.

Li es el límite inferior de la clase donde se encuentra el decil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase el decil.

ai es la amplitud de la clase.

Percentiles: Son los 99 valores que dividen la serie de datos en 100 partes
iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99%
de los datos. P50 coincide con la mediana. P50 coincide con D5.

Cálculo de los percentiles: En primer lugar buscamos la clase


donde se encuentra, en la tabla de las
frecuencias acumuladas

Li es el límite inferior de la clase donde se encuentra el percentil.

N es la suma de las frecuencias absolutas.

Fi-1 es la frecuencia acumulada anterior a la clase del percentil.

ai es la amplitud de la clase.
MEDIDAS DE DISPERSION

La utilización de una medida de posición escogida para representar a los


datos no indica otras características que el conjunto de observaciones que posee.
No todas las observaciones son iguales a la medida de posición tomada o
seleccionada; en general los datos difieren unos de otros, por lo tanto se hace
necesario encontrar ciertos índices o medidas que indiquen la variabilidad o
dispersión del conjunto de observaciones que se estudian.

Una medida de variabilidad es un número que nos indica el grado de


dispersión en un conjunto de datos. Si el valor es pequeño (respecto de la unidad
de medida) entonces hay una gran uniformidad entre los datos (homogénea). Por
el contrario, un gran valor nos indica poca uniformidad (heterogénea). Cuando es
cero quiere decir que todos los datos son iguales.

Las medidas de dispersión se clasifican en dos grupos:

Medidas de Dispersión Absoluta: Son aquellas que vienen expresadas en


las mismas unidades originales que indican la serie de datos. Entre las medidas
de dispersión absoluta se encuentran: el rango, el rango intercuartilico, la
desviación media, la varianza y la desviación típica.

Medidas de Dispersión Relativas: Estas medidas vienen expresadas en


valores abstractos o porcentajes; su principal función es la de determinar entre
varias distribuciones la de mayor o menor dispersión. La medida de dispersión
relativa de mayor importancia es el coeficiente de variación.

Rango o recorrido: Es la medida de dispersión más sencilla y se define


como la diferencia entre el valor más alto menos el valor más pequeño y se
designa por R. Es decir, R = Xmax - Xmin para datos no agrupados. Si los datos
están agrupados en K clases el rango será la diferencia entre el límite superior de
la K-esima clase menos el límite inferior de la primera clase. El rango nos dará una
primera idea sobre la dispersión de los datos ya que si su valor es pequeño nos
indicará una gran concentración de los datos, y si por el contrario su valor es
grande nos puede indicar una gran variabilidad o dispersión de los datos
Rangos especiales: El rango nos da una idea de la dispersión total de las
observaciones, por lo tanto puede estar afectada por valores extremos dando en
consecuencia una idea de alta dispersión. Por tal motivo, se han definido otros
rangos que tratan de subsanar este problema.

Rango íntercuartilico: Se define como la diferencia entre el cuartil tres


(Q3) y el cuartil uno (Q1) de una distribución de frecuencia y se expresa así:

RI = Q3 − Q1.

Rango semi-íntercuartilica: Es la diferencia entre el Q3 y el Q1 dividido


entre dos.

Si los valores de la RI o RSI son pequeños indica una alta concentración de


los datos de la distribución en los valores centrales de la serie de datos. Estas
medidas se utilizan para comparar los grados de variación de los valores centrales
en diferentes distribuciones de frecuencias. Los mismos no son afectados por los
valores extremos, no se adaptan a la manipulación algebraica, por tal motivo son
de poco utilidad.

Desviación media: La desviación media de un conjunto de n


observaciones x1, x2, x3,. . .xn, es el promedio de los valores absolutos de las
desviaciones (di) con respecto a la media aritmética o la mediana.

La Desviación Media a pesar de que para su cálculo se toman todas las


observaciones de la serie, por el motivo de no tomar en cuenta los signos de las
desviaciones (di), es de difícil manejo algebraico. Su utilización en estadística es
muy reducida o casi nula, su importancia es meramente histórica, ya que de esta
fórmula es la que da origen a la desviación típica o estándar.

La desviación respecto a la media es la diferencia en valor absoluto entre


cada valor de la variable estadística y la media aritmética. Di = |x - x|

La desviación media es la media aritmética de los valores absolutos de las

desviaciones respecto a la media. La desviación media se representa por


Varianza: Una manera de resolver el problema de los signos de las
desviaciones respecto de la media aritmética es elevándolos al cuadrado y luego
sumar todos los resultados obtenidos. Esta suma se puede considerar como una
medida de la dispersión total de los valores.

Aquellos que estén más alejados de la media aritmética tendrán un aporte


mayor a esta suma de cuadrados. Su mayor utilidad se presenta en la estadística
inductiva y se puede interpretar como una medida de variación promedio (o el
promedio de la suma de los cuadrados). Se obtiene dividiendo la variación total
entre el número de unidades o medidas. Se designa por la letra S 2. La varianza es
la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística. La varianza se representa por

Varianza para datos agrupados:

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes


expresiones que son equivalentes a las anteriores.
Desviación típica: Como la varianza es el promedio de los desvíos
respecto de la media elevados al cuadrado, viene entonces expresada en
unidades cuadradas.

La desviación típica como medida absoluta de dispersión, es la que mejor


nos proporciona la variación de los datos con respecto a la media aritmética, su
valor se encuentra en relación directa con la dispersión de los datos, a mayor
dispersión de ellos, mayor desviación típica, y a menor dispersión, menor
desviación típica.

La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz


cuadrada de la media de los cuadrados de las puntuaciones de desviación. La
desviación típica se representa por σ.

Desviación típica para datos agrupados:

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que


son equivalentes a las anteriores.

Coeficiente de variación: Es la relación entre la desviación típica de una


muestra y su media.
El coeficiente de variación se suele expresar en porcentajes:

El coeficiente de variación permite comparar las dispersiones de dos


distribuciones distintas, siempre que sus medias sean positivas. Se calcula para
cada una de las distribuciones y los valores que se obtienen se comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.

MEDIDAS DE ASIMETRIA

Asimetría: Es una medida de forma de una distribución que permite


identificar y describir la manera como los datos tiende a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la distribución. Permite identificar las
características de la distribución de datos sin necesidad de generar el gráfico. La
asimetría presenta las siguientes formas:

Asimetría Negativa o a la Izquierda: Se da cuando en una distribución la


minoría de los datos está en la parte izquierda de la media. Este tipo de
distribución presenta un alargamiento o sesgo hacia la izquierda, es decir, la
distribución de los datos tiene a la izquierda una cola más larga que a la derecha.
También se dice que una distribución es simétrica a la izquierda o tiene sesgo
negativo cuando el valor de la media aritmética es menor que la mediana y éste

valor de la mediana a su vez es menor que la moda, en símbolos

Nota: Sesgo es el grado de asimetría de una distribución, es decir, cuánto


se aparta de la simetría.

Simétrica: Se da cuando en una distribución se distribuyen


aproximadamente la misma cantidad de los datos a ambos lados de la media
aritmética. No tiene alargamiento o sesgo. Se representa por una curva normal en
forma de campana llamada campana de Gauss (matemático Alemán 1777-1855) o
también conocida como de Laplace (1749-1827).También se dice que una
distribución es simétrica cuando su media aritmética, su mediana y su moda son

iguales, en símbolos Md=Mo


Asimetría Positiva o a la Derecha: Se da cuando en una distribución la
minoría de los datos está en la parte derecha de la media aritmética. Este tipo de
distribución presenta un alargamiento o sesgo hacia la derecha, es decir, la
distribución de los datos tiene a la derecha una cola más larga que a la izquierda.

También se dice que una distribución es simétrica a la derecha o tiene


sesgo positivo cuando el valor de la media aritmética es mayor que la mediana y
éste a valor de la mediana a su vez es mayor que la moda, en símbolos

Dispersión relativa: Las medidas de variabilidad, estudiadas hasta ahora,


solo permitían medir las dispersiones absolutas de los términos de la muestra. Las
medidas, tomadas en esas condiciones, serán de utilidad, solo cuando se trata de
analizar una sola muestra; pero, cuando hay que establecer comparaciones entre
distintas muestras, será necesario expresar tales medidas en valores relativos,
que pueden ser proporciones o porcentajes.

Las medidas de dispersión relativas permiten comparar grupos de series


distintas en cuanto a su variación, independientemente de las unidades en que se
midan las diferentes características en consideración. Generalmente las medidas
de dispersión relativas se expresan en porcentajes, facilitando así el estudio con
medidas procedentes de otras series de valores La dispersión relativa viene a ser
igual a la dispersión absoluta dividida entre el promedio.

Existen varias medidas de dispersión relativa, pero, la más usada es el


coeficiente de variación de Pearson, este es un índice de variabilidad sin
dimensiones, lo que permite la comparación entre diferentes distribuciones de
frecuencias, medidas en diferentes unidades. El coeficiente de variación de
Pearson se designa con las letras CV.
CONCLUSIÓN

La Estadística trata del recuento, ordenación y clasificación de los datos


obtenidos por las observaciones, para poder hacer comparaciones y sacar
conclusiones.

En relación a los conceptos fundamentales podemos nombrar: la población,


muestra, muestreo, datos, etc. En cuanto a las variables estadísticas, las variables
cualitativas se refieren a características o cualidades que no pueden ser medidas
con números, mientras que una variable cuantitativa si, por tanto se pueden
realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: variable
discreta es aquella que solo puede tomar un número finito de valores entre dos
valores cualesquiera de una característica. Una variable continua es aquella que
puede tomar un número infinito de valores entre dos valores cualesquiera de una
característica.

Referente a la distribución de frecuencias o tabla de frecuencias es una


ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su
frecuencia correspondiente. Asimismo, los gráficos más usados son, diagrama de
barras que se utiliza para de presentar datos cualitativos o datos cuantitativos de
tipo discreto. Los datos se representan mediante barras de una altura proporcional
a la frecuencia. Polígono de frecuencias que se forma uniendo los extremos de las
barras mediante segmentos. También se puede realizar trazando los puntos que
representan las frecuencias y uniéndolos mediante segmentos. Los diagramas de
sectores se pueden utilizar para todo tipo de variables, pero se usa
frecuentemente para las variables cualitativas. Los datos se representan en un
círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia
absoluta correspondiente ángulo. Un histograma es una representación gráfica de
una variable en forma de barras. Se utilizan para variables continuas o para
variables discretas, con un gran número de datos, y que se han agrupado en
clases.
Las medidas de tendencia central como lo es la media, la moda y la
mediana, son útiles para determinar el comportamiento de una distribución de
datos, pues al compararlos con los valores de la zona o intervalo normal, nos
indican que tan simétrica es la distribución sin graficarla.

Las medidas de posición son Los deciles son los nueve valores que dividen
la serie de datos en diez partes iguales, dan los valores correspondientes al 10%,
al 20%.y al 90% de los datos. Los cuartiles son los tres valores de la variable
dividen a un conjunto de datos ordenados en cuatro partes iguales. Los percentiles
son los 99 valores que dividen la serie de datos en 100 partes iguales. Los
percentiles dan los valores correspondientes al 1%, al 2%. y al 99% de los datos.

La desviación típica nos indica cuan dispersos se encuentran los datos en


una distribución. Su importancia radica entre otras, ya que a mayor dispersión,
menos representativo será el promedio de la serie. La desviación media es la
media aritmética de los valores absolutos de las desviaciones respecto a la media.
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la
media de una distribución estadística.

También podría gustarte