Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Teoría de Estadisica Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 44

Estadística Descriptiva

2
a estadística, es una Ciencia relativamente nueva pero con miles de años

L de uso empírico, María y José parten de Nazaret a Belén para ser


censados por los romanos. ¡Hace 2000 años éste imperio llevaba un
control estadístico de lo que poseían sus colonias para luego cobrar
impuestos¡.
En la actualidad los procedimientos estadísticos son de particular
importancia en las Ciencias Económicas y Sociales para reducir y abstraer
datos. La estadística a diferencia de la matemática no genera resultados
exactos, los resultados siempre tienen asociada un grado de incertidumbre
o error, esta trata de lograr una aproximación de la realidad, la cual es
siempre mucho más compleja y rica que el modelo que podemos abstraer.
Si bien esta ciencia es ideal para describir procesos cuantitativos, tiene
serios problemas para explicar “el porqué” cualitativo de las cosas.
(Divosvky & Montenegro, 2010)
En general podemos hablar de dos tipos de estadísticas, las descriptivas que nos
permiten resumir las características de grandes grupos de individuos y las
inferenciales que nos permite dar respuestas a preguntas (hipótesis) sobre
poblaciones grandes a partir de datos de grupos pequeños o muestras. En este
apartado se abordará fundamentalmente contenidos de estadística descriptiva.

El mundo de los negocios, y en general cualquier actividad humana, se manifiesta


fundamentalmente a través de datos de diferentes tipos, los cuales requieren, de
acuerdo con su naturaleza, un tratamiento particular. Del correcto manejo de la
información depende en gran medida el éxito de una organización, de un negocio,
de una investigación científica o social, de un acuerdo comercial así como de una
decisión individual. De aquí la importancia de contar con instrumentos que
permitan establecer con claridad qué elementos u observaciones se van a
considerar , qué atributos se desea conocer de ellos, cómo se les va a medir, qué
tratamiento se puede dar a los datos, qué usos se piensa dar a la información
generada y cómo puede ésta interpretarse correctamente. (UNAM, 2012)

La estadística nos permite establecer líneas de trabajo con los métodos


adecuados para observar, medir, recopilar y analizar datos, referidos
particularmente a situaciones dónde se generan volúmenes grandes de éstos, así
como preparar, presentar e interpretar información. Esta proporcional los
elementos básicos para fundamentar cómo planear recolecta y análisis de datos
para que de ellos se puedan extraer conclusiones confiables así como el tipo de
conclusiones y confianza que nos merecen los datos. Su metodología se ha
desarrollado básicamente en el último siglo y de manera muy rápida, gracias en
parte al advenimiento de las computadoras y los sistemas de información.

La Estadística Aplicada ofrece eficaces procedimientos prácticos: para


medir la situación existente, para determinar la capacidad o el rendimiento
de máquinas, procesos o materiales, para controlar muchas operaciones,

3
para estimar materiales, procesos o métodos. El contador público al participar
en la formulación de proyecciones financieras, en la formulación y evaluación de
alternativas de inversión, al supervisar y controlar todas las actividades
económicas de una empresa, al evaluar el ambiente político, social y económico
del país con el objeto de diagnosticar la incidencia en las finanzas y programas de
una empresa, requiere de técnicas de investigación que se sustentan en
métodos y procedimientos estadísticos, como la estadística descriptiva y la
estadística inferencial que permiten el análisis de hechos económicos y
sociales, poniendo de manifiesto sus características más relevantes y fijando las
limitaciones, condiciones y alcance de las conclusiones que de dicho análisis
estadístico puedan extraerse.

Esta asignatura está estrechamente relacionada con el método científico, en la


recopilación, organización, presentación y análisis de datos; tanto para obtener
conclusiones como para tomar decisiones con base en los análisis efectuados.
Los contenidos están relacionados entre sí como son: El Conceptual, las teorías,
definiciones, propiedades y teoremas. El Procedimental, que desarrolla
habilidades y destrezas tales como: capacidades para argumentar, analiza, criticar
y tomar decisiones. El actitudinal que proporciona valores, como la
responsabilidad, el orden, y compañerismo.

4
Unidad I: Estadística Descriptiva

Objetivos

 Explicar los conceptos, definiciones, propiedades fundamentales de la


Estadística Descriptiva
 Aplicar conceptos, definiciones, y propiedades fundamentales de la
Estadística descriptiva en la resolución de ejercicios
 Valorar la importancia de la Estadística descriptiva como herramienta para
la solución de problemas de su entorno social.
 Participar activamente en las distintas formas organizativas del proceso
enseñanza- aprendizaje basada en la cooperación grupal

1.- Breve historia de la estadística Tomado de (Valdes, 2012)

Desde los comienzos de la civilización han existido formas sencillas de estadísticas, pues
ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de
madera y paredes de cuevas para contar el número de personas, animales o ciertas
cosas. Hacia el año 3000 A.C. los babilonios usaban ya pequeñas tablillas de arcilla para
recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o
cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta
del país mucho antes de construir las pirámides en el siglo XXXI A. C. Los libros bíblicos
de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero
contiene dos censos de la población de Israel y el segundo describe el bienestar material
de las diversas tribus judías. En China existían registros numéricos similares con
anterioridad al año 2000 A.C. Los griegos clásicos realizaban censos cuya información se
utilizaba hacia el año 594 A.C. para cobrar impuestos.

El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la
población, superficie y renta de todos los territorios bajo su control. Durante la edad media
sólo se realizaron algunos censos exhaustivos en Europa. Los reyes carolingios Pipino el
Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la
Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de
Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información
obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El
registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y
en 1662 apareció el primer estudio estadístico notable de población, titulado Observations
on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres).

Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania,


realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la
primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico

5
para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores
aceptaron la necesidad de reducir la información a valores numéricos para evitar la
ambigüedad de las descricpciones verbales. En nuestros días, la estadística se ha
convertido en un método efectivo para describir con exactitud los valores de los datos
económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como
herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no
consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación
de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance
de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar,
con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados
de éstas se pueden utilizar para analizar datos estadísticos.

La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y


para predecir el tipo y la cantidad de datos necesarios en un determinado estudio
estadístico.

1.2.- Marco conceptual de la estadística

1.2.1- Definición e importancia de la estadística

La estadística es el arte y la ciencia de recolectar, analizar, presentar e interpretar


datos. Casi todos los estudiantes de áreas relacionadas con los negocios o la
economía necesitan tomar un curso de estadística. Los datos consisten en
hechos/informaciones y cifras que se recolectan y analizan.

La estadística es comúnmente considerada como una colección de hechos


numéricos expresados en términos de una relación sumisa, y que han sido
recopilado a partir de otros datos numéricos.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la
estadística como un valor resumido, calculado, como base en una muestra de
observaciones que generalmente, aunque no por necesidad, se considera como
una estimación de parámetro de determinada población; es decir, una función de
valores de muestra.
"La estadística es una técnica especial apta para el estudio cuantitativo de los
fenómenos de masa o colectivo, cuya mediación requiere una masa de
observaciones de otros fenómenos más simples llamados individuales o
particulares". (Gini, 1953.)
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para
recoger, organizar, resumir y analizar datos, así como para sacar conclusiones
válidas y tomar decisiones razonables basadas en tal análisis.

6
"La estadística es la ciencia que trata de la recolección, clasificación y
presentación de los hechos sujetos a una apreciación numérica como base a la
explicación, descripción y comparación de los fenómenos". (Yale y Kendal, 1954).
Los tipos de estudios estadísticos tienen vital importancia en la
investigación, ya que la finalidad de ésta es que a partir de la recolección de
“buenos datos”, proyectar conclusiones claras y de gran significancia, por ello se
hace distinción en la forma de obtener los datos; y que para lograrlo están las
técnicas de diseño estadístico, las cuales comprenden lo siguientes:

1) Estudios observacionales, donde el investigador es el observador y se utiliza


principalmente para describir lo suficiente respecto al problema.

2) Estudios experimentales, donde se hacen interpretaciones bastantes claras de


diferencias, por medio de procedimientos aleatorios.

3) Estudio de muestreo, donde una investigación empieza a tomar forma como


tal, debido a que dependiendo de la obtención de muestras significativas se
obtienen resultados significativos que para una investigación es el objetivo
primordial en su desarrollo y conclusión.

La importancia de la estadística para los estudiantes se aprecia desde distintas


ópticas, a continuación tres citas elementales indicadas por (Tapia, 2010)

 Todo ciudadano estamos en continuo contacto con las estadísticas en


todos los medios de comunicación. Debemos saber comprender la
información que se ofrece para detectar mentiras y tomar decisiones
informadas.
 Como lector de artículos de investigación debe poder comprender la
información cuantitativa que se le ofrece en los artículos que lee.
 Como productor de investigaciones, debe poder utilizar las estadísticas en
sus propias investigaciones.

1.2.2 Clasificación de la estadística

(Tapia, 2010) afirma que en general, la estadística según los métodos que aporta,
se puede dividir en las tres ramas siguientes: Estadística descriptiva, Estadística
inferencial e inferencia Bayesiana.

7
1.2.3.1 Estadística Descriptiva

La Estadística descriptiva proporciona los métodos que permiten organizar, resumir,


presentar y describir los resultados de las observaciones de la característica de
interés, contenida en una muestra, con el objeto de hacer estimaciones, por lo
general puntuales, sobre las características principales de la población (su
distribución, media poblacional, variabilidad, etc.). La mayor parte de la
información estadística en periódicos, revistas, informes de empresas y
otras publicaciones consta de datos que se resumen y presentan en una forma
fácil de leer y de entender. A estos resúmenes de datos, que pueden ser
tabulares, gráficos o numéricos se les conoce como estadística descriptiva.
(Anderson, 2008)

(Álvarez, 2012) indica que: El término “Estadística Descriptiva” se engloban las


técnicas que nos permitirán realizar un análisis elemental de las bservaciones
experimentales observadas. Esta analiza series de datos (por ejemplo, edad de
una población, altura de los estudiantes de una escuela, temperatura en los meses
de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas
variables.

En relación a la estadística descriptiva, Ernesto Rivas Gonzáles dice; "Para el


estudio de estas muestras, la estadística descriptiva nos provee de todos sus
medidas; medidas que cuando quieran ser aplicadas al universo total, no tendrán
la misma exactitud que tienen para la muestra, es decir al estimarse para el
universo vendrá dada con cierto margen de error; esto significa que el valor de la
medida calculada para la muestra, en el oscilará dentro de cierto límite de
confianza, que casi siempre es de un 95 a 99% de los casos.

1.2.4 Malos usos de los datos estadísticos

La estadística es una herramienta científica. Su valor depende de cómo se utilice


como herramienta. (Anderson, 2008) afirma que la estadística es frecuentemente
mal utilizada siendo los siguientes ejemplos algunos de los malos usos comunes
de datos estadísticos:

Datos estadísticos inadecuados. Tales como cuando el tamaño de la


muestra no es el adecuado o bien, no es representativo de la población. Existen
muchas otras clases de datos inadecuados. Por ejemplo, algunos datos son
respuestas inexactas de una encuesta, porque las preguntas usadas en la misma
son vagas o engañosas, algunos datos son toscas imitaciones porque no hay
disponibles datos exactos o es demasiado costosa su obtención, y algunos datos
son irrelevantes en un problema dado, porque el estudio estadístico no está bien
planeado. y en algunas ocasiones los datos son inventados por el encuestador al
no encontrar personas que quieran responder a la encuesta por larga o
tendenciosa.

8
Un sesgo del usuario. Significa que un usuario de los datos perjudicialmente
dé más énfasis a ciertos hechos, los cuales son empleados para mantener su
predeterminada posición u opinión.

Existen dos clases de sesgos; conscientes e inconscientes. Ambos son


comunes en el análisis estadístico. Hay numerosos ejemplos de sesgos
conscientes.

Por ejemplo un anuncio de publicidad, frecuentemente utiliza estadística para


probar que su producto es muy superior al producto de su competidor. Un político
usa la estadística como herramienta para querer mostrar la preferencia a su
candidatura, etc. Es casi imposible que un sesgo inconsciente esté
completamente ausente de un trabajo estadístico.

En lo que respecta al ser humano, es difícil obtener una actitud completamente


objetiva al abordar un problema, aun cuando un científico debe tener una mente
abierta. Un estadístico debe estar enterado del hecho de que su interpretación de
los resultados del análisis estadístico está influenciado por su propia experiencia,
conocimiento y antecedentes con relación al problema dado.

Supuestos falsos. En el análisis estadístico frecuentemente se hacen


supuestos. Un estadístico debe ser extremadamente cuidadoso para evitar
supuestos falsos. Supuestos falsos pueden ser hechos por quien usa los datos, o
bien quien:
a) está tratando deliberadamente de confundir a los oyentes,
b) carece de conocimiento de métodos estadísticos o
c) es simplemente descuidado.
No es raro que un anunciante proponga deliberadamente que no existe mercancía
de primera clase fuera de su producto o bien que no está enterado de ello. Una
línea de tendencia no debería ser dibujada para el propósito de pronosticar las
ventas futuras si los datos estadísticos están limitados a un corto período de
tiempo, especialmente cuando se trata de un período de sólo tres meses.

Supuestos falsos hechos por descuidos son numerosos. Muchos experimentados


hombres de negocios, por ejemplo, saben que nuestra economía es dinámica y
que el poder de compra del dinero o el valor del dólar cambia año tras año. Sin
embargo, frecuentemente cuando uno hace una proyección para futuras
transacciones, la persona hará un supuesto descuidado que el valor del dólar y las
condiciones económicas son de esperarse que sean exactamente las mismas en
el futuro.

9
Errores en operaciones matemáticas. El razonamiento estadístico basado en
respuestas equivocadas de operaciones matemáticas frecuentemente conduce a
conclusiones falsas.

De igual manera, como afirma (Tapia, 2010), se puede manipular datos con análisis de
estadística. Compare los resultados de este encuesta de estudiantes en las que
9,800 electores dijeron estar a favor del candidato A y 10,000 del candidato B,
quien es ganador para usted?

Así por ejemplo Las estadísticas muestran que casi todos los accidentes de
circulación se producen entre vehículos que ruedan a velocidad moderada. Muy
pocos ocurren a más de 150 km/h. ¿Significa esto que resulta más seguro
conducir a gran velocidad? No, de ninguna manera. Con frecuencia, las
correlaciones estadísticas no reflejan causas y efectos. Casi todo el mundo circula
a velocidad moderada, y como es natural, la mayoría de los accidentes se
producen a estas velocidades

1.3 Variables estadísticas

Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos
que pueden ser expresados mediante números. Son caracteres susceptibles de
medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc. Las
variables son características cuantificables.
Según, Murray R. Spiegel, (1992) "una variable es un símbolo, tal como X, Y, Hx,
que puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado
dominio de la variable. Si la variable puede tomar solamente un valor, se llama
constante."

10
Todos los elementos de la población poseen los mismos tipos de caracteres, pero
como estos en general no suelen representarse con la misma intensidad, es obvio
que las variables toman distintos valores. Por lo tanto estos distintos números o
medidas que toman los caracteres son los "valores de la variable". Todos ellos
juntos constituyen una variable.
Los atributos también llamados caracteres cualitativos, son aquellos que no son
susceptibles de medición, es decir que no se pueden expresar mediante un
número.

IUTIN (1997). "Reciben el nombre de variables cualitativas o atributos, aquellas


características que pueden presentarse en individuos que constituyen un conjunto.

La forma de expresar los atributos es mediante palabras, por ejemplo; profesión,


estado civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan
en la misma forma en todos los elementos. Estas distintas formas en que se
presentan los atributos reciben el nombre de "modalidades". Ejemplo El estado
civil de cada uno de los estudiantes del curso de estadísticas I, no se presenta en
la misma modalidad en todos.

Como afirma (Álvarez, 2012) El aspecto que deseamos estudiar (edad, sexo,
peso, entre otras.) recibe el nombre de VARIABLE ESTADÍSTICA. La
clasificación más tradicional de las variables estadísticas es la siguiente:
1.3.1 Variables Cualitativas
Los valores de las observaciones quedan expresados por características o
atributos es decir que emplean etiquetas o nombres para identificar un atributo en
cada elemento siendo para estas empleadas las escalas de medición nominal u
ordinal que pueden ser no numéricos o numéricos. En simples palabras no se
pueden medir numéricamente Por ejemplo: Estado civil; Color preferido, sexo,
nacionalidad, Nivel de estudios entre otros.

Dentro de ellas podremos subdividirlas en función de que puedan ser ordenadas


(Nivel de estudios) o no tenga sentido una determinada ordenación que se

11
establezca (Color preferido, Razas,).

1.3.2 Variables cuantitativas


Los valores de las observaciones son numéricos (cuantificables) y, en
consecuencia, ordenables.. A su vez las variables cuantitativas se subdividen en
dos tipos :

DISCRETAS : Toman valores concretos es decir sólo pueden tomar valores


enteros (1, 2, 8, -4, etc.). Por ejemplo: número de estudiantes de la carrera de
ciencias económicas (puede ser 1, 2, 3 ,etc, pero, por ejemplo, nunca podrá ser
3.45).

CONTINUAS : Pueden tomar cualquier valor de un cierto intervalo, . Por ejemplo, el


promedio de notas del I semestre 80.3 puntos, 94.57 puntos ( incluye otros ejemplos
relacionados al Peso, ingresos económicos convertidos a moneda nacional,
precios del producto).

1.3.3 Otros nomenclaturas de variables

Las variables también se pueden clasificar en:

Variables unidimensionales: sólo recogen información sobre una característica


(por ejemplo: edad de los alumnos de una clase).

Variables bidimensionales: recogen información sobre dos características de la


población (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen información sobre tres o más


características (por ejemplo: edad, altura y peso de los alumnos de una clase).

1.4 Escalas de medición de variables

Las cuatro escalas de medición que se usan para obtener datos sobre una
determinada variable son nominal, ordinal, de intervalo y de razón.

La escala de medición para una variable es nominal cuando los datos son
etiquetas o nombres que se usan para identificar un atributo de un elemento.

La escala es ordinal si los datos presentan las propiedades de los datos


nominales y tiene sentido hablar del orden o jerarquía de los datos

La escala es de intervalo si los datos presentan las propiedades de los datos


ordinales y los intervalos entre valores se expresan en términos de una unidad fija
de medición.

12
Por último, la escala de medición es de razón si los datos presentan las propiedades de los datos
de intervalo y tiene sentido hablar de la razón entre dos valores.
Tipos de variables

Cualitativas Cuantitativas

Nominales Ordinales Discretas Continuas

Tarea 1

1.- Construya variables relacionadas con su entorno, 5 nominales, 5 ordinales.

2.Clasifique las siguientes variables.

Promedio de notas . No de artículos de inventario


Diámetro de una casa. Belleza de una flor.
Color de ojos. Temperatura semanal.
Tipo de techo. Largo de peces de un estanque.
Vida útil de un monitor Diámetro de un tornillo
Peso de un estudiante

3. entre los participantes del grupo de clases tomar datos de 15 variables al


menos por ejemplo: Edad, Sexo, Procedencia, etc. Y luego ordénelos en forma de
matriz de datos, recodifique la información cualitativa en numérica.

4. Basado en los ejemplos

Ejemplos:

Nominal: está asociada a nombres. Ejemplo: Marca de auto, Sexo, Religión

Ordinal: tiene asociado un orden. Ejemplo: Nivel educacional, Estado nutricional,


Nivel Socioeconómico

13
Discreta: sólo puede tomar un número finito (o contable) de posible valores.
Ejemplo: El número de respuestas correctas en una prueba de 5 preguntas de V o
F.

0 1 2 3 4 5

Continua: puede tomar cualquier valor en un intervalo(s). Ejemplo: Cantidad de


agua en un vaso de 50 ml.

0 50
50 ml

20 ml

0 ml

Determine qué tipo son las siguientes variables. Si son variables cualitativas
(nominal u ordinal ) o cuantitativas (discretas o continuas).

a) Marca de automóvil
b) Duración de un compacto (segundos)
c) Número de temas de un compacto
d) Nivel educacional (básica, media, universitaria)
e) Temperatura al mediodía en Talca (grados Celcius)
f) Estado civil (soltero, casado, divorciado, viudo)
g) Cantidad de lluvia en un año en Talca (mm3)

1.5 individuo, Población, muestra, censo

En muchas situaciones se requiere información acerca de grupos grandes de


elementos (individuos, empresas, votantes, hogares, productos, clientes, etc.).
Pero, debido al tiempo, costo y a otras consideraciones, sólo es posible recolectar
los datos de una pequeña parte de este grupo. Al grupo grande de elementos en
un determinado estudio se le llama población (La población es el conjunto de
todos los elementos de interés en un estudio determinado.) y al grupo pequeño
muestra (La muestra es un subconjunto de la población.) .

14
Cuando se estudia el comportamiento de una variable hay que distinguir muy bien
los siguientes conceptos:

Individuo: cualquier elemento que porte información sobre el fenómeno que se


estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un
individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.

Población: conjunto de todos los individuos (personas, objetos, animales, etc.)


que porten información sobre el fenómeno que se estudia. Por ejemplo, si
estudiamos el precio de la vivienda en una ciudad, la población será el total de las
viviendas de dicha ciudad.

Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el


precio de la vivienda de una ciudad, lo normal será no recoger información sobre
todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele
seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo.

"Se llama muestra a una parte de la población a estudiar que sirve para
representarla". Murria R. Spiegel (1991).

"Una muestra es una colección de algunos elementos de la población, pero no de


todos". Levin & Rubin (1996).

"Una muestra debe ser definida en base de la población determinada, y las


conclusiones que se obtengan de dicha muestra solo podrán referirse a la
población en referencia", Cadenas (1974).

(Anderson, 2008) refieren que al proceso de realizar un estudio para recolectar


datos de toda una población se le llama censo. Al proceso de efectuar un estudio
para recolectar datos de una muestra se le llama encuesta muestral. Una de las
principales contribuciones de la estadística es emplear datos de una muestra para
hacer estimaciones y probar hipótesis acerca de las características de una
población mediante un proceso al que se le conoce como inferencia estadística.

El estudio de muestras es más sencillo que el estudio de la población completa;


cuesta menos y lleva menos tiempo. Por último se aprobado que el examen de
una población entera todavía permite la aceptación de elementos defectuosos, por
tanto, en algunos casos, el muestreo puede elevar el nivel de calidad. Una
muestra representativa contiene las características relevantes de la población en
las mismas proporciones que están incluidas en tal población.
Los expertos en estadística recogen datos de una muestra. Utilizan esta
información para hacer referencias sobre la población que está representada
por la muestra. En consecuencia muestra y población son conceptos
relativos

15
Se entiende por censo aquella numeración que se efectúa a todos y cada uno de
los caracteres componentes de una población. Para Levin & Rubin (1996)
"Algunas veces es posible y práctico examinar a cada persona o elemento de
la población que deseamos describir. A esto lo llamamos una numeración
completa o censo. Utilizamos el muestro cuando no es posible contar o
medir todos los elementos de la población”.
Si es posible listar (o enumerar) y observar cada elemento de la población, los
censos se utilizan rara vez porque a menudo su compilación es bastante difícil,
consume mucho tiempo por lo que resulta demasiado costoso.
Se entiende por encuesta las observaciones realizadas por muestreo, es decir
son observaciones parciales.
El diseño de encuestas parte de la premisa de que si queremos conocer algo
sobre el comportamiento de una población o individuo, lo mejor, más directo y
simple es preguntárselo directamente a ellas. (Cadenas, 1974).
Según Antonio Napolitano "La encuesta, es un método mediante el cual se quiere
averiguar. Se efectúa a través de cuestionarios verbales o escritos que son
aplicados a un gran número de personas".
Una población es un todo y una muestra es una fracción o segmento de ese
todo.
Procesos de manejos de datos
Tomado de (Divovskiy R, 2009)

“A partir de la realidad observable se debe crear un modelo numérico


teórico para intentar estudiar ésta realidad”

Una vez que los datos se han codificado, transferidos a una matriz y
guardado en una computadora podemos proceder a analizarlos, proceso
que se hace con un programa estadístico como SPSS o INFOSTAT, de
forma manual solo se pueden manejar pocos datos y variables es por ello
que el énfasis de este libro está más en la interpretación de resultados que
en los procedimientos de cálculo.

El procedimiento de análisis sugerido se esquematiza en la figura siguiente:

Definición de Ejecución de
Creación de la Interpretación
análisis a análisis en
matriz de datos de resultados
realizar computadora

16
En general se debe buscar de primero cómo describir sus datos y posteriormente
efectuar el análisis estadístico para relacionar las variables generadas. Los tipos
de análisis son variados y cada método tiene su razón de ser un propósito
específico, “la estadística no es un fin en sí misma, sino una herramienta para
analizar datos”.

Los principales análisis que pueden efectuarse son:

 Estadística descriptiva de las variables.


 Pruebas de hipótesis para la toma de decisiones.
La estadística está ligada a la toma, organización, presentación y
análisis de un grupo de datos”.

Una primera tarea luego de construir una tabla o matriz de datos, es explorarlos
buscando información atípica o anormal y corregir los casos que la información
extraña se deba a una mala digitación o error en la recolección de datos.

Habitualmente, la información primaria sobre los individuos, es decir, la forma más


elemental en la que se expresan los datos es la de una matriz, en la que aparecen
en la primera columna los individuos identificados de alguna manera y en las
siguientes columnas las observaciones de los diferentes caracteres en estudio
para cada uno de los individuos, dicha matriz recibe el nombre de matriz de datos.
Vea la tabla ejemplo tomada de (Tapia, 2010, pág. 17)

Lo siguiente para observar el comportamiento de los datos es realizar una


“distribución frecuencias” en forma de tabla y gráficos. Para esto, los datos se
agrupan en clases o categorías y para grupo se calcula las frecuencias absolutas
y relativas.

En este momento es importante poder definir el tipo de escala de medición usada,


sucesión de medidas que permite organizar datos o para agrupar los datos, en

17
este sentido se pueden reconocer diferentes escalas:, tal y como se ha
comentado.

 Las Escalas Nominales, son discontinuas y se usan cuando describimos algo


dándole un nombre a cada categoría o clase y estas son mutuamente
excluyentes. A cada categoría se le adjudica un valor numérico. Por ejemplo la
variable Departamento con las categorías “Estelí, Nueva Segovia, Madriz,
Otra”.
 Las Escalas Ordinales, son discontinuas y se usan donde hay un orden
jerárquico de un conjunto de objetos o eventos con respecto a algún atributo
específico, por ejemplo ordenar los ingresos en tres niveles: “alto =1”, “medio =
2” y “bajo = 3”.
 Las Escalas de Intervalos Iguales, estas pueden ser sumadas, restadas
multiplicadas y divididas sin afectar las distancias relativas entre las
calificaciones. Por ejemplo las medidas de temperatura en Grados C0, las
calificaciones de un examen en una escala de 1 a 100. En esta escala el “0” es
arbitrario y no necesariamente representa ausencia, también nos dice que un
valor de 30 puntos de un examen de español no necesariamente representa la
mitad de conocimiento de un valor de 60 puntos.
 Las Escala de Razón Constante, tienen todas las propiedades de las Escalas
de intervalos más un cero absoluto, por ejemplo las medidas de tiempo, peso y
distancia, el valor “0” representa ausencia del valor.

Un caso especial de escala ordinal es la escala de Likert, esta escala es muy


usada en las ciencias sociales y se usa para medir actitudes, “Una actitud es una
predisposición aprendida para responder consistentemente de una manera
favorable o desfavorable”. Así las personas tenemos actitudes hacia muy diversos
objetos o símbolos, por ejemplo: actitudes hacia la política económica, un
profesor, la ley, nosotros, etc. Las actitudes están relacionadas con el
comportamiento que mantenemos.

Estas mediciones de actitudes deben interpretarse como “síntomas” y no como


hechos. Esta escala es bipolar porque mide tanto el grado positivo como negativo
de cada enunciado y consiste en un conjunto de ítem presentado en forma de
afirmaciones o juicios ante los cuales se pide reacción a los sujetos en estudio en
una escala de 5 puntos, cada punto tiene un valor numérico.

Un ejemplo de cómo calificar con afirmaciones positivas es ¿Le gusta cómo se


imparte la clase de estadística?:
1- Muy en desacuerdo, 2- En desacuerdo, 3- Ni de acuerdo, ni en desacuerdo,
4- De acuerdo, 5-Muy de acuerdo.
Estar de acuerdo con la idea presentada significa un puntaje mayor.

1.5.1 Población

18
El concepto de población en estadística va más allá de lo que comúnmente se
conoce como tal. Una población se precisa como un conjunto finito o infinito de
personas u objetos que presentan características comunes.

"Una población es un conjunto de todos los elementos que estamos estudiando,


acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una población es un conjunto de elementos que presentan una característica


común". Cadenas (1974).

El tamaño que tiene una población es un factor de suma importancia en el proceso


de investigación estadística, y este tamaño vienen dado por el número de
elementos que constituyen la población, según el número de elementos la
población puede ser finita o infinita. Cuando el número de elementos que integra la
población es muy grande, se puede considerar a esta como una población infinita,
por ejemplo; el conjunto de todos los números positivos. Una población finita es
aquella que está formada por un limitado número de elementos, por ejemplo; el
número de estudiante del Recinto Leonel Rugama de la UNAN Managua.

Cuando la población es muy grande, es obvio que la observación de todos los


elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para
hacerlo. Para solucionar este inconveniente se utiliza una muestra estadística.

1.5.2 Muestreo
El muestro no es más que el procedimiento empleado para obtener una o más
muestras de una población; el muestreo es una técnica que sirve para obtener una
o más muestras de población. Se realiza una vez que se ha establecido un marco
muestral representativo de la población, se procede a la selección de los
elementos de la muestra aunque hay muchos diseños de la muestra.
Al tomar varias muestras de una población, las estadísticas que calculamos para
cada muestra no necesariamente serían iguales, y lo más probable es que
variaran de una muestra a otra.
Ejemplo;
Consideremos como una población a los estudiantes de educación del municipio
de Estelí, determinando por lo menos dos caracteres ser estudiados en dicha
población;
 Religión de los estudiantes
 Sexo.

19
Muestreo es el proceso para obtener información acerca del conjunto de una
población o universo examinando sólo una parte del mismo. Existen dos métodos
para seleccionar muestras de poblaciones; el muestreo no aleatorio o de juicio y el
muestreo aleatorio o de probabilidad. En este último todos los elementos de la
población tienen la oportunidad de ser escogidos en la muestra. Una muestra
seleccionada por muestreo de juicio se basa en la experiencia de alguien con la
población. Algunas veces una muestra de juicio se usa como guía o muestra
tentativa para decidir como tomar una muestra aleatoria más adelante. Las
muestras de juicio evitan el análisis estadístico necesarios para hacer muestras de
probabilidad.

(Tapia, 2010) indica que Un estadístico es una medida cuantitativa, derivada de


un conjunto de datos de una muestra, con el objetivo de estimar o contrastar
características de una población o modelo estadístico.
Un parámetro es un valor o medida que representa a una población, tal como la
media aritmética, la proporción de individuos que presentan determinada
característica, la desviación estándar y la varianza, etc.

Dentro de este contexto, será necesario asumir un estadístico o estimador como


una variable aleatoria con una determinada distribución, y que será la pieza clave
en las dos amplias categorías de la inferencia estadística: la estimación y el
contraste de hipótesis. El concepto de estimador, como herramienta fundamental,
lo caracterizamos mediante una serie de propiedades que nos servirán para elegir
el “mejor” para un determinado parámetro de una población, así como algunos
métodos para la obtención de ellos, tanto en la estimación puntual como por
intervalos.
¿Cómo deducir la ley de probabilidad sobre determinado carácter de una
población cuando sólo conocemos una muestra?

Este es un problema al que nos enfrentamos cuando, por ejemplo, tratamos de


estudiar la relación entre las visitas realizadas de un grupo de clientes a un
negocio determinado, y el monto de las compras realizadas por éstos e intentemos
extender las conclusiones obtenidas sobre una muestra, a la población total de los
clientes de la empresa.

A continuación, estudiaremos algunas técnicas de muestreo basados en una rama


de la estadística denominada teoría del muestreo.

En estos aspectos de muestreo, cabe el ejemplo indicado por (Tapia, 2010, pág.
26) el cual Suponga que desea medir el grado de preferencia de los habitantes de
la ciudad de Estelí, hacia los restaurantes locales, pero por problemas económicos
sólo es posible acceder a los consumidores de ciertos barrios.

20
Surgen los siguientes cuestionamientos:

¿A quién deseo generalizar los A todos los habitantes de Hermosillo


resultados? (población teórica).
¿A quién puedo acceder en el estudio? A todos los habitantes en las colonias
visitadas (población estudiada).
¿Cómo puedo acceder a ellos? Numerando los sujetos accesibles
(espacio o marco muestral).

1.5.3 Ventajas del muestreo

En nuestro estudio de la realidad, frecuentemente debemos de hacer frente a


conjuntos muy grandes de hechos, situaciones, mediciones, etc. Si deseamos
instalar una cafetería en nuestra facultad, debemos tener muy en claro quiénes
serán nuestros clientes: pueden ser los estudiantes de la propia facultad, los
maestros y el personal administrativo de la misma y tal vez algunos visitantes.
Todas estas personas conformarán la población cuyos hábitos de consumo de
alimentos y bebidas deseamos conocer.

1.5.4 Estimador de un parámetro

Para comprender lo de estimadores de un parámetro es necesario comprender los


fundamentos del muestreo. La teoría de las probabilidades es el fundamento de
los métodos de muestreo. El material sobre teoría de probabilidad constituye la
base de la inferencia estadística, rama de la estadística que tiene que ver con el
uso de los conceptos de la probabilidad para tratar con la toma de decisiones en
condiciones de incertidumbre. (Badii, 2010)

La aplicación del teorema del límite central o teorema central del límite a la
distribución muestral de las medias de muestras, que vimos con anterioridad,
permite utilizar la distribución de probabilidad normal para crear intervalos de
confianza para la media de la población. Este afirma que, para grandes muestras
aleatorias, la distribución muestral de las medias de muestras está más próxima a
una distribución de probabilidad normal. La aproximación es más precisa para
muestras grandes. Ésta es una de las conclusiones más útiles en Estadística.
También nos indica que cuando se extraen muestras de tamaño mayor a 30 o bien

21
de cualquier tamaño pero provenientes de una población normal, la distribución
muestral de medias tiene un comportamiento aproximadamente normal, por lo que

se puede utilizar la fórmula de la distribución normal con

S, es equivalente al error estándar de la media, entonces la fórmula para calcular


la probabilidad del comportamiento del estadístico, en este caso la media de la
muestra , quedaría de la siguiente manera

Es posible razonar sobre la distribución muestral de las medias de muestras sin


contar con información alguna sobre la forma de la distribución original de la que
se toma la muestra. En otras palabras, el teorema del límite central es válido para
todas las distribuciones.

El método de muestro así como la metodología de muestreo debe quedar


plasmada en los papeles de trabajo correspondientes. Es necesario definir el
objetivo, seleccionar el plan de muestreo adecuado, definir el nivel de
confianza y precisión deseada, seleccionar la muestra, realizar las pruebas,
determinar estadísticos y evaluar resultados. Toda medida de tendencia
central o de dispersión obtenida de una población, se conoce como parámetro de
la población; aquellas que son obtenidas de una muestra se denominan
estimadores, ya que con ellas se realizará la estimación de esos parámetros.

La estimación es el procedimiento que consiste en emplear los estadísticos


obtenidos de una muestra para inferir o estimar los parámetros de una población.

22
Existen dos tipos de estimaciones fundamentales las por punto y por intervalo de
confianza.

Los estimadores por punto consisten en emplear


un solo valor de la muestra para estimar el
parámetro poblacional respectivo. Los de
intervalo Es el rango dentro del cual se espera
que se encuentre el valor del parámetro en
cuestión, la ventaja de la estimación por intervalos es que muestra la exactitud con
que estima el parámetro a menor longitud del intervalo mayor exactitud en la
estimación. la probabilidad de que un intervalo contenga el parámetro que se
estima se denomina coeficiente de confianza. Un valor cercano a la unidad indica
un intervalo más reducido.

Para comprender mejor lo de intervalos supongamos que se estima que el


promedio de aprobados de a asignatura es el 85 %, dato reflejado mediante un
solo número, o podríamos afirmar que el porcentaje de aprobados osicla entre el
56 % y 92%. El primer tipo se llama estimación puntual, ya que se puede asociar
al único número que presenta la estimación, un punto sobre una recta. El segundo
tipo se llama estimación por intervalo, porque se tienen dos puntos que definen un
intervalo sobre una recta.

Los Parámetros y estimadores más usuales son:

23
Tomado de Estadística Administrativa I, Pág. 63. M. en C. José Luis Hernández González

Supongamos que se han hecho las siguientes 4 medidas: 821. 783. 834. 855. Hallar la
media. desviación estándar. varianza y desviación estándar relativa. La media de estas
cuatro medidas es:

Para evitar la acumulación de errores al redondear. en la media y en la desviación


estándar se retinen un dígito más que en los datos originales (cifra no significativa) que se
indica como subíndice. La desviación estándar es:

24
La varianza es:

La desviación estándar relativa es:

Es importante hacer referencia que muchos de los procedimientos pueden ser realizados
con calculadora.

1.8 Recopilación, organización, presentación y análisis de datos

El proceso seguido en el estudio estadístico de una cierta característica o variable,


puede subdividirse en tres pasos sucesivos indicados a continuación:

RECOGIDA DE DATOS: Planteado el test o encuesta oportuno y recogidos los


datos que correspondan, el primer análisis que realizaremos es el del tipo de
variable que pretendemos estudiar (Cualitativa o Cuantitativa; Discreta o
Continua). Esto condicionará en gran medida su posterior tratamiento.

ORGANIZACIÓN DE LOS DATOS: Determinado el modo de agrupamiento de las


observaciones, procedemos a su recuento, construyendo la tabla de frecuencias.
Posteriormente podremos visualizar tales frecuencias de forma gráfica con el
diagrama estadístico apropiado

ANÁLISIS FINAL: La obtención de muy diversas conclusiones respecto de la


variable estudiada, se podrá realizar con auxilio de los diferentes parámetros
estadísticos (de centralización , posición , dispersión , etc.) (Álvarez, 2012)

Tablas de frecuencias,

Lo primero para construir una TDF es definir el “número de clases” o intervalos a


crear y el “ancho” de cada intervalo. Para que los gráficos permitan visualizar

25
tendencias de la variable en estudios, el número de clases se recomienda que no
sean menor de 3 ni mayor de 20. Al ancho de clase se calcula dividiendo el Rango
(valor mayor – valor menor), con un valor que debe variar entre 3 y 20. Hay que
utilizar más clases cuando se tiene más datos disponibles, si el número de clases
es muy grande es posible tener muchas clases vacías, si es demasiado pequeño
podrían quedar ocultas características importantes de los datos al agruparlos. Se
tendría que determinar el número de clases a partir de la cantidad de datos
presente y de su uniformidad, en general con menos de treinta datos se usa una
TDF con 3-5 clases, para tener un criterio sobre el número de clases en función
del número de datos ver la tabla siguiente . .
Tabla para determinar el número de clases de una TDF
Número datos Número de clases
30-50 5-7
51-100 6-10
101-250 7-12
+250 10-20

El valor central de una clase se llama “marca de clase”, este valor se usa para
construir los gráficos de polígonos de frecuencia. Veamos un ejemplo de cómo se
construye una Tabla de Distribución de Frecuencias.
Es importante resaltar que con las variables nominales no se construyen
intervalos, límites ó marcas de clase, esto no tiene sentido con este tipo de
variable.

Tabla de Distribución de frecuencias, TDF.

Clase Límite Inferior Lim. Superior Marca de Frecuencia Frecuencia Frecuencia


clase
Igual a Menor a Absoluta Relativa Acumulada

1 1,200 <1,300 1,250 1 0.04 1

2 1,300 <1,400 1,350 8 0.33 9

3 1,400 <1,500 1,450 7 0.29 16

4 1,500 <1,600 1,550 4 0.17 20

5 1,600 <1,700 1,650 4 0.17 24

Total 24 1.00

26
Ejemplo de gráfico construido con estos datos

0.35

0.28
frecuencia relativa

0.21

0.14

0.07

0.00
1100 1200 1300 1400 1500 1600 1700 1800
C$

“Histograma y Polígono de Frecuencias Relativas de Ingresos semanales de 24 familias

27
Se puede observar que la información que lleva el gráfico es completa, incluye
todos los datos y permite explicar el contenido del mismo por ejemplo: la barra de
mayor altura contiene la moda y al no ser un gráfico simétrico concluyo que la
media y mediana son diferentes y que los datos son sesgados hay un
agrupamiento de frecuencias a la izquierda del centro.
Una manera de representar una distribución de Frecuencias es:
1. Por medio de un gráfico de Barras con variables nominales.
2. Con un Histograma con variables continuas.
3. Un polígono de Frecuencias cuando se quieren mostrar las frecuencias
absolutas.
4. Con un gráfico de Pastel cuando se tienen porcentajes o proporciones.

1.11 Gráfico de datos

Tomado de (Dicovskiy, 2009)

Los gráficos nos permiten presentar la información que dan los datos de manera
rápida, resumida y fácil de entender. Los gráficos se pueden clasificar de múltiples
maneras. pero en éste texto los consideraremos como: univariados, bivariados y
multivariados, según el número de variables involucradas.

Gráficos univariados, Ejemplo de edad de una muestra de personas, datos


presentados en forma de Histograma de frecuencias. En este gráfico las barras se
encuentran unidas, no habiendo espacio entre las barras. Para su construcción
primero se tiene que hacer una tabla de distribución de frecuencias, TDF, donde se
precisen los límites reales de frecuencia, que se usan para construir las barras. El
centro de cada barra es la “marca de clase”, esta medida se usa para construir
polígonos.

30

20

10

0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90

Edad
Histograma de Frecuencias absolutas, de la edad, de una muestra de personas de una comunidad rural del Departamento
de Estelí. 2008.

28
Este gráfico univariado se acompaña de estadística descriptiva: medias,
medianas, desvíos estándares, coeficientes de variación e intervalos de
confianza.

Otro ejemplo

Gráfico lineal: Se utiliza para mostrar las frecuencias absolutas o relativas de


una variable discreta, son representadas mediante líneas verticales proporcionales
a dichas frecuencias.

“Gráfico de Pastel o Sectores” Ejemplo del nivel de educación, de una muestra


de 598 personas de origen rural. Este Gráfico creado con frecuencias y
porcentajes, permite resaltar segmentos de clases determinadas.

29
otros
19%

primaria
45%
ninguno

15%

secundari a
21%

Gráfico de pastel o sectores.

Tomado de (Morales, 2012)

Pictograma es un gráfico cuyo uso es similar al de sector circular representada por medio
de una figura o dibujo que identifique a la variable en estudio. Este gráfico se utiliza para
mostrar producciones en una serie cronológica. mostrar producciones en una serie
cronológica.

30
“Gráfico de Barras bivariado”. Ejemplo de las notas de tres asignaturas
presentadas en forma de barras. Este resume la media de notas obtenido por
asignatura. Entre barra y barra hay un espacio. El gráfico observado a
continuación se construyó con una variable nominal, asignatura y una variable
75.5

75.2
75.0

74.5

74.0

73.5
73.5

73.0
73.0

72.5
72.5

72.0
Matematica Contabilidad Programación Algebra

Asignatura
continua, nota.

“Polígono de Frecuencias” Ejemplo de un donde se grafica en el tiempo el


desarrollo de una enfermedad, tizón temprano, en el follaje de las platas de
tomate. Este polígono se construye con los valores medio de cada clase, Marca de
clase y las frecuencias por clase.

El Polígono es una línea quebrada que se construye uniendo los


puntos medios en la parte superior de cada barra, marca de clase
de un histograma

31
30

20

10

0
13 20 27 34 41 48 55 62 69 76

Días despues del trasplante

Polígono de frecuencias acumuladas, en porcentaje del desarrollo de una


enfermedad fungosa, en plantas de tomate.

Gráficos Multivariados. Son gráficos que incorporan 2 o más variables.


Gráfico de Barras que incorpora 4 variables dicotómicas (si- no)

120
Este tipo de gráfico
permite resumir de
100
98
manera muy eficiente
la información de
80 hasta 6 o 7 variables.
Es ideal para usar
con variables
60
dicotómica, SI y NO.

40 43

30
20
19 Gráfico De Barras,
Bivariado en
0 Agrupamientos
Escuela Cercana Agua Potable Teléfono
Electricidad Asistencia Médica

32
Gráfico bivariado, se puede acompañar de una tabla de contingencia de
frecuencias o porcentajes y con una prueba estadística X2 de independencia.

“Un Gráfico permite ver

rápidamente lo que dicen los

1.12 Medidas de Tendencia Central

Al forjarnos una imagen mental de la distribución de frecuencias de un conjunto de


mediciones, una de las primeras apreciaciones descriptivas de interés es una
medida de tendencia central, es decir, una que localiza el centro de la distribución.

Una de las medidas de tendencia central más común y útil es la media común o
“media aritmética”, pero también son de importancia, según las circunstancias y el
tipo de variables la “moda” y la “mediana”. Otras medidas de tendencia central
menos usadas son la “media geométrica” y la “media cuadrática”.

La sumatoria, un concepto básico introductorio:

33
En matemática, el símbolo Griego Sigma “” en mayúscula se utiliza para indicar
sumatoria de datos donde:

∑1𝑛 𝑥̅𝑖 = x1 +x2 +x3 +x4 +. ..... +


xn

Siendo “x” un valor de una medición de la variable en estudio e “i” un índice que
varía de “1 a n “.El número de datos de la muestra se identifica con la letra “n”.

1.12. 1 Media Aritmética

La media aritmética o simplemente media de un conjunto de mediciones es la


medida de tendencia central más usada y conocida. Esta medida se simboliza
como x (x con raya) cuando representa la media de una muestra y como  (letra
griega minúscula) para representar la media poblacional. Tanto “𝒙 ̅” o “µ” son la
suma de todos los valores de la muestra o población divididos por el número de
casos. En el caso de la media de una muestra esta es igual a: “ x (x 1 + x2 + x3
+…+ xn)/ n” donde “n” es el número de datos de la muestra y “x” el valor numérico
del dato. La fórmula simplificada de la media es:
∑𝒏 𝒙 𝒊
𝒙̅= 𝟏
𝒏
Cuando se tienen datos agrupados en una distribución de frecuencias se obtiene
el punto medio de cada intervalo y se determina media de la siguiente manera:
𝑘
𝑥̅̅ = (∑1 𝑥̅𝑀 𝑓)⁄𝑛
Donde “k” es el número de intervalos, “n” el número total de datos, “f” es la
frecuencia de la clase y “xM” el punto medio de cada intervalo.

Una debilidad de la media aritmética es su sensibilidad a valores extremos de la


distribución y carece de sentido con variables cualitativas.

∑𝒏
𝟏 𝒙𝒊
𝑵
𝟏 𝒙𝒊
Media Aritmética 𝒙̅= Muestra µ= Población
𝒏 𝑵

“n” es el número de datos de la muestra y “N” el de la población.

1.12.1 Ejemplo de cálculo de una media

Si tengo la nota de un examen de matemáticas de 10 estudiantes en una escala


de 1 a 100 donde:
Estudiante “Variable Nota = xi” Valor de xi
Luis X1 62
Alberto X2 68
Juan X3 92

34
Pedro X4 88
Roberto X5 55
María X6 79
Raquel X7 89
Luisa X8 92
Rosa X9 67
Diana X10 69
761.

10
1 xi =
En este caso “i” varia de 1 a 10.

Media de notas de los estudiantes = (  x )/10 = 761/10 = 76.1


10

1 i
Pueden ampliar lecturas en
http://www.deie.mendoza.gov.ar/aem/material/teoria/MEDIDAS%20DE%20TE
NDENCIA%20CENTRAL%20Y%20DE%20VARIABILIDAD.pdf

1.12.2 La Mediana

La segunda medida de tendencia central en importancia es la mediana. La


mediana “Me” de un conjunto de mediciones “x1, x2, x3,. .. , xn” es el valor de “x” que
se encuentra en el punto medio o centro cuando se ordenan los valores de menor
a mayor, ranking. Esta medida no sufre la influencia de valores extremos atípicos.

Si las mediciones de un conjunto de datos se ordenan de menor a mayor valor y


“n” es impar, la mediana corresponderá a la medición con el orden “(n + 1) / 2”. Si
el número de mediciones es par, n = par, la mediana se escoge como el valor de
“x” a la mitad de las dos mediciones centrales, es decir como el valor central entre
la medición con ranking “n/2” y la que tiene ranking “(n/2) + 1”.
Reglas para calcular la mediana
 Ordenar las mediciones de menor a mayor
 Si “n” es impar, la mediana “m” es la medición con rango “(n + 1) / 2”
 Si “n” es par, la mediana “m” es el valor de “x” que se encuentra a la mitad entre la
medición con ranking “n / 2” y la medición con ranking “(n /2)+1”.

1.12.2.1 Ejemplo de cálculo de una mediana.

En el ejemplo de las notas de matemáticas “la mediana” se construye ordenando


los datos de menor a mayor:

Estudiante “Datos ordenados” Valor de xi


Roberto 1 55
Luis 2 62
Rosa 3 67

35
Alberto 4 68
Diana 5 69
María 6 79
Pedro 7 88
Raquel 8 89
Juan 9 92
Luisa 10 92

Como “n” es par, la mediana es igual a la mitad entre la medición con ranking “n /
2” y la medición con ranking “(n/2) +1”, donde n / 2 = 5 y (n /2) +1)= 6.
El dato 5 vale 69 y el dato 6=79, entonces “la mediana” es igual a 69 + 79 / 2= 74
En este ejemplo la mediana es semejante a la media.

1.12.3 La Moda

La moda, Mo, es la medida de tendencia central más fácil de calcular y también es


la más sujeta a fluctuaciones cuando cambian unos pocos valores de la
distribución. Por esta razón la moda se suele usar para una evaluación rápida de
la tendencia central. La moda se define como “el valor más frecuente de una
distribución”. En una tabla de frecuencias, la frecuencia mayor es la que contiene
a la moda. Esta medida se usa más y tiene más sentido cuando se describen
datos cualitativos, de hecho es la única medida de tendencia central que funciona
con este tipo de escala.

La moda es el valor más frecuente y


funciona bien con escalas nominales

1.12.4 Comparaciones entre las diferentes medidas

Las tres medidas de tendencia central, la media, mediana y moda, no son


igualmente útiles para obtener una medida de tendencia central. Por el contrario,
cada una de estas medidas tiene características que hacen que su empleo sea
una ventaja en ciertas condiciones y en otras no.

La media es la medida de tendencia central, generalmente más usada y tiene la


característica que incorpora todos los datos de la variable en su cálculo por lo
tanto su valor suele ser más estable. Además se suele preferir en la construcción
de pruebas de hipótesis, estadística inferencial. Se usa sin problema cuando las
distribuciones tienen forma simétrica y no existen valores extremos atípicos.

36
La mediana suele ser la medida preferida cuando se emplea una escala
ordinal, estas son las situaciones donde el valor asignado a cada caso no
tiene otro significado más que el indicar el orden entre los casos. Por
ejemplo saber en una clase cuales alumnos están dentro del 50% con
mejores notas y cuales dentro del 50% con peores notas. También se suele
preferir la mediana cuando unos pocos valores extremos distorsionan el
valor de la media. Por ejemplo si tengo 9 personas con 0 ingresos y uno sola
que tiene ingresos de 10 unidades, la media dar a entender que la mayoría
recibe 1 unidad, cuando esto no es real.

La moda en ciertas condiciones puede ser la más apropiada, por ejemplo cuando
se quiere información rápida y cuando la precisión no sea un factor especialmente
importante. En ciertos casos solo esta medida tiene sentido por ejemplo si un
equipo de fútbol lleva la estadística por jugador (escala ordinal) de la cantidad de
pases que realiza por juego, la Moda detecta quien es el que mejor distribuyendo
la pelota, en este caso la media y la mediana no tendrían significado, solo la
moda.

Aunque no necesariamente una escala de medida nos debe decir qué tipo de
medida de tendencia central debemos usar, pero si nos ayuda a determinar cuál
es la más apropiada.

Un aspecto interesante entre las tres medidas es su comportamiento referente a la


simetría que toma una distribución. Cuando las distribuciones son simétricas, sin
sesgo, caso de la distribución Normal que tiene forma de campana, “la media, la
mediana y la moda coinciden”. Si la distribución es asimétrica con sesgo positivo,
hay más datos hacia la izquierda de la media, entonces “la media es mayor que la
mediana y esta mayor que la moda”. Si ocurre lo contrario, el sesgo es negativo,
entonces “la media es menor que la mediana y ésta menor que la moda”.

1.12.4 Otras medidas de tendencia central

1.12.4.1 La Media Geométrica

La media geométrica se define como xg  n x1x2 x3..xn , por ejemplo la media


geométrica de los valores “4, 5, 4, 6” es xg  4 (4)(5)(4)(6)  4.68

Su valor siempre es menor o igual a la media aritmética. Una ventaja de su uso es


que considera todos los valores de la distribución y es menos sensible que la
media aritmética a los valores extremos, sin embargo es de cálculo complicado y
si un valor vale 0 se anula.

37
1.12.4.2 La Media Cuadrática

Se construye a partir de suma de los cuadrados de un conjunto de valores. Su


x12  x22  x32  ...  xn2
forma de cálculo es xc  2
, si tomamos los valores
n
anteriores la media cuadrática tiene el siguiente valor
42  52  42  62
xc  2  4.81
4
Se utiliza cuando se quiere evitar los efectos de los signos negativos. Ésta media
solo puede tomar valores positivos. Luego veremos que el desvío estándar es un
tipo de media cuadrática.

1.12.4.3 Cuartiles, Deciles y Percentiles

Cuartiles: si a un conjunto de datos se ordena de mayor a menor, el valor central


es la mediana, este valor divide el grupo, en dos subgrupos cada uno con el 50 %
de los datos. Si a cada subgrupo ordenado se le marca el valor central, tenemos
así tres valores seleccionados que llamaremos Cuartiles, Q 1, Q2 y Q3. Estos
valores dividen al conjunto de datos en cuatro grupos con igual número de
términos, cada cuartil contiene el 25% de los datos. La mediana es el cuartil dos,
Q2. Con los Cuartiles se construye un gráfico especial, “el diagrama de caja”, este
permite visualizar la variabilidad de los datos por Cuartil.

En el diagrama de caja, el centro de la caja es el Q2, la mediana, los bordes de la


caja son el Q1 y el Q3. En los extremos del diagrama se trazan dos rayas
horizontales que representan los valores máximo y mínimo de la distribución y que
no se consideran anómalos. Para hallar los valores de las rayas se multiplica la
amplitud inter cuartil (Q3 -Q1) por 1,5 y el resultado se suma a Q3 y se resta a Q1.
Por último, por encima y por debajo de las rayas se representan de forma
individual los valores extremos y anómalos de la distribución.

Diagrama de caja, variable: cantidad de carne consumida por año.

38
Carne consumida por año
18.7

14.9
Kg

11.2
Mediana

7.5

3.7

Deciles, si el conjunto de valores, ordenados de mayor a menor, se dividen en diez


partes iguales, los valores que dividen los datos se llaman deciles y son nueve, D 1,
D2,..D9.
Percentiles, si se tiene un conjunto de datos muy numerosos y a este se lo divide
en 100 partes iguales, cada valor que divide los datos se llama percentil, P 1, P2,
P3,…P99.

1.13 Medidas de Dispersión o de Variabilidad

Las medidas de variabilidad indican la dispersión de los datos en la escala de


medición y son tan importantes como las medidas de tendencia central y así como
éstas son valores puntuales en una distribución, las medidas de dispersión son
“intervalos”, distancias o un número de unidades en la escala de medición. Este
tipo de medida se complementa con las medidas de centralidad y ambas permiten
describir a la mayoría de las distribuciones. Los tipos de medidas de Dispersión
más comunes son: “el Rango”, “el Desvío Estándar” y la “Varianza”.

1.13.1 El Rango

El Rango, Recorrido o Amplitud de un conjunto de mediciones, “es la diferencia


entre el valor mayor y el valor menor”, indica el número necesario y mínimo de
unidades, en la escala de medición, para incluir los valores mínimo y máximo. Es
la medida de dispersión más fácil de calcular, pero también es la menos estable al
estar fuertemente influenciada por valores extremos atípicos.

Cuanto más grande es el rango, mayor será la dispersión de los datos de una
distribución. Es adecuada para medir la variación de pequeños conjuntos de
datos.

39
1.13.2 El Desvío Estándar

El Desvío Estándar es la medida de dispersión más ampliamente usada y es la


más estable ya que depende de todos los valores de la distribución. Es la media
cuadrática de la desviación de los valores con respecto a la media, aunque una
definición completa sería: “la raíz cuadrada de la suma de las desviaciones
alrededor de la media, elevadas al cuadrado y divididas entre el número de casos
menos uno” en el caso de “S”.

Desvío Estándar “S”: la raíz cuadrada


de la suma de las desviaciones
alrededor de la media, elevadas al
cuadrado y divididas entre el número de
casos menos uno.

Cuando se trabaja con muestras el desvío estándar se simboliza con una “S” y con
la letra sigma minúscula “” cuando se usan datos de una población. Su fórmula
de cálculo tradicional es:

𝑁 𝑛
𝜎 = √(∑ (𝑥̅𝑖 − µ)2) /𝑁 𝑆 = √(∑ (𝑥̅𝑖 − 𝑥̅̅)2) /(𝑛 − 1)
1 1

Donde i es cualquier valor de “1” a “n” o “N”, y “n” es el número total de datos de la
muestra y “N” de la población.

El desvío estándar, “S” o “”, se interpreta como cuanto se desvía de la media un


conjunto de valores. Este valor se grafica como un intervalo, el cual tiene un valor
menor que el del rango. Esta medida tiene sentido cuando las variables son
cuantitativas.

Cálculo del desvió estándar “S” por suma de cuadrados, para datos no
agrupados.

El desvió estándar se puede expresar también de la siguiente manera:


𝑛 (∑𝑛 𝑥̅)2
2
√∑1 𝑥̅ −
1
𝑆= 𝑛
𝑛−1

40
Esta forma de resolución es equivalente a la forma de cálculo tradicional, es de
más fácil resolución cuando se tienen calculadoras de mano que hacen sumas de
cuadrados.

Cálculo del desvió estándar “S” para datos agrupados


̅)𝟐𝒇
∑𝒌𝒊=𝟏(𝒙𝒊 − 𝒙
𝑺=√
𝒏−𝟏
Donde “xi” es la marca de clase “i”, “k” en el número de clases, “f” frecuencia por
clase y “n” en número total de datos.

1.13.2.1 Ejemplo de cálculo de Desvío Estándar “S”

Con el ejemplo de las notas de matemáticas haremos cálculo de “S”

“S”= ((55  76.1)2  (62  76.1)2  (67  76.1)2  (68  76.1)2  (69  76.1)2  (79  76.1)2 
= 13.6 (88  76.1)  (89  76.1)  (92  76.1)  (92  76.1) ) / 9
2 2 2 2

Se
sugiere hacer estos cálculos usando una calculadora científica en función
estadística.

1.13.3 La Varianza
La varianza es el desvío estándar elevado al cuadrado y se simboliza con “S2”
cuando es de una muestra, o “2 cuando es poblacional. Este es una medida que
se usa en muchas pruebas de Hipótesis estadísticas, por ejemplo “el Análisis de
Varianza, ANDEVA” que se basa en la descomposición y relación de las varianzas
de las causas de variación de los datos. Pero para fines descriptivos se prefiere
usar el desvío estándar en vez de la varianza, que suele ser un valor mayor y
difícil de interpretar.

1.13.4 El Coeficiente de variación

El coeficiente de variación, CV, es un cociente entre el desvío estándar y la media


𝐒
de los datos, expresado en porcentaje, CV = 𝐱̅̅ 100.Este coeficiente permite
comparar la variabilidad de diferentes muestras en una misma variable o la
variabilidad existente entre variables diferentes. Una investigación experimental en
el campo agropecuario que tenga un CV menor al 10 %, muestra que en el
experimento hubo un muy buen control del error experimental entre las diferentes
repeticiones, sin embargo en procesos productivos industriales éste valor de
variabilidad en una variable de salida, sería muy alto, en general se aceptan
valores muy pequeños, inferiores al 1%.

Compilado y adaptado por maestro Sergio J. Navarro Hudiel

43
1.14 Interpretación de las medidas de tendencia central y de la variabilidad.

Cabe destacar que al describir nuestros datos, debemos interpretar nuestros datos
de tendencia central y de variabilidad en conjunto y no de manera separada. Con
la media y el desvío estándar se pueden construir intervalos donde están la
mayoría de los datos. La moda, mediana y el rango pueden completar la
información sobre la distribución y así tener una buena idea de lo que sucede con
la variable en estudio.
En una variable continua:

 La media, la mediana y la moda son puntos en una recta.


 El desvío estándar y el rango son intervalos.

1.15 Otras medidas útiles en Estadística Descriptiva

Como afirma, (Mateu, 2013), Las medidas de forma de una distribución se pueden
clasificar en dos grandes grupos o bloques: medidas de asimetría y medidas de
curtosis. Cuando los polígonos de frecuencia de una variable se presentan en
forma de curva hay dos medidas esenciales para describir estas curvas: “La
Asimetría” y la “Curtosis”.

Cuando al trazar una vertical, en el diagrama de barras o histograma, de una


variable, según sea esta discreta o continua, por el valor de la media, esta vertical,
se transforma en eje de simetría, decimos que la distribución es simétrica.
Diremos pues, que es simétrica, cuando a ambos lados de la media aritmética
haya el mismo nº de valores de la variable, equidistantes de dicha media dos a
dos, y tales que cada par de valores equidistantes tiene la misma frecuencia
absoluta. En caso contrario, dicha distribución será asimétrica o diremos que
presenta asimetría.

Compilado y adaptado por maestro Sergio J. Navarro Hudiel


SIMÉTRICA ASIMÉTRICA A ASIMÉTRICA A

SIMÉTRICA ASIMÉTRICA A ASIMÉTRICA A

1.15.1 La Asimetría o Sesgo

La Asimetría es una medida necesaria para conocer cuánto se parece nuestra


distribución a la distribución teórica de una “curva normal”, curva con forma de
campana, y constituye un indicador del lado de la curva donde se agrupan las
frecuencias. Esta medida se construye con el valor medio, la mediana y el desvió
estándar. Si el valor del sesgo es cero (asimetría = 0), la curva de distribución es
simétrica, en este caso coinciden los valores de la media, la mediana y la moda.
Cuando el sesgo es positivo, la media es mayor que la mediana, quiere decir que
hay valores agrupados hacia la izquierda de la curva y la cola de la distribución es
más larga a la derecha. Cuando el sesgo es negativo, la media es menor a la
mediana, significa que los valores tienden a agruparse hacia la derecha de la
curva, por encima de la media y la cola de la distribución es más larga a la
(𝒙
̅− 𝑴𝒐𝒅𝒂)
izquierda. Su forma de cálculo original es: 𝑺𝒆𝒔𝒈𝒐 = pero como
𝑺
aproximadamente se cumple que

“Media – Moda = 3 (Media - Mediana)”, se usa la siguiente forma de cálculo


práctico del sesgo:
𝟑(𝒙
̅ − 𝑴𝒆)
𝑺𝒆𝒔𝒈𝒐 =
𝑺

Compilado y adaptado por maestro Sergio J. Navarro Hudiel


Consumo Kg/ año de cereal por país
0.34
Asimetria 0.93
0.25

0.17

0.08

0.00
15

Histograma de consumo de cereal en Kg/ año por habitante de diferentes países.


En este gráfico se observa una asimetría o sesgo positivo de 0.93, hay un
agrupamiento de datos a la izquierda de la curva de distribución normal, curva en
color negro.

Se sugiere ampliar lectura en www3.uji.es/~mateu/tema4-d37.doc


http://www3.uji.es/~mateu/

1.15.1.1 Sesgo estandarizado,

es una medida que se calcula de la siguiente manera:


𝑺𝒆𝒔𝒈𝒐
𝑺𝒆𝒔𝒈𝒐𝒆𝒔𝒕𝒂𝒏𝒅𝒂𝒓𝒊𝒛𝒂𝒅𝒐 =
√𝟔 ⁄ 𝒏
Para datos que siguen una distribución normal (ver Capítulo 3) el sesgo
estandarizado debe caer dentro de un intervalo (-2,+2).
IV- Bibliografía de Referencia

Arens Alvin A. / Loebbecke James K. Auditoría . Un enfoque Integral. Pearson Educación . Sexta
edición.México.1996 .Capítulos 12 y 14.

Berenson Mark L. / Levine David M.. Estadística básica en Administración. Conceptos y Aplicaciones
Prentice Hall Hispanoamericana S.A. Sexta Edición México 1996
Departamento de Auditoría Interna .Centro de Estudios Monetarios .Manual de Muestreo para
Auditores . México .1986.
Di Rienzo J.A.. Casanoves F.. Balzarini M.G.. Gonzalez L.. Tablada M.. Robledo C.W.
(2008). InfoStat. versión 2008. Grupo InfoStat. FCA. Universidad Nacional de Córdoba.
Argentina.

Estadística Descriptiva y Probabilidad. Teoría y Problemas (Revisi´on: Febrero 2006) I. Espejo Miranda,
F. Fernandez Palacios, M. A. Lopez Sánchez, M. Muñoz M.

Estadística para Administración. Berenson Mark L/ Levine David M/Kriehbiel Timothy C Editorial
Pearson. Cuarta edición 2006

Estadística Aplicada a la Administración y la Economía. Leonardo J. Kazmier, Editorial Mc Graw- Hill,


Interamericana. Año 2006, México.
Probabilidad y Estadística. Samuel Fuenlabrada de la Vega. Editorial Mc Graw- Hill, Tercera edición
2008 Mexico

Estadística para Administración y Economía. Levin Richard I / Rubin David S. Editorial Pearson
Educación. Edición 2010.

Scheaffer Richard L. / Mendenhall William / Ott Lyman. Elementos de Muestreo. Grupo Editorial
Iberoamérica. México. 1987

Taylor . Donald H. / Glezen . C. William . Auditoría : Conceptos y Procedimientos . Ediciones


Orientación S.A de C.V. México . Capítulos 8 y 16.

Calculadoras estadísticas

http://www.pwpamplona.com/antwen/calcu.html

http://www.med.unne.edu.ar/biblioteca/calculos/calculadora.htm
http://es.easycalculation.com/statistics/statistics.php

http://es.ncalculators.com/statistics/sample-size-calculadora.htm

http://www.alcula.com/es/calculadoras/estadistica/

http://www.surveysoftware.net/sscalce.htm

También podría gustarte