Instituto Tecnologico Euroamericano

INSTITUTO TECNOLOGICO EUROAMERICANO
CARRERA: ADMINISTRACION DE EMPRESAS
HORARIO: NOCTURNO
SEMESTRE: II SEMESTRE
MATERIA: ESTADISTICA I
PROFESOR: ING. JOSE ALVARADO
ESTUDIANTE: JUAN RIOS BARRERA
Historia de la Estadística
La palabra Estadística procede del vocablo “Estado”, pues era función
principal de los Gobiernos de los Estados establecer registros de
población, nacimientos, defunciones, impuestos, cosechas... La
necesidad de poseer datos cifrados sobre la población y sus
condiciones materiales de existencia han debido hacerse sentir desde
que se establecieron sociedades humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos

de la civilización han existido formas sencillas de estadística, pues ya
se utilizaban representaciones gráficas y otros símbolos en pieles,
rocas, palos de madera y paredes de cuevas para contar el número
de personas, animales o ciertas cosas.
 Su origen empieza posiblemente en la isla de Cerdeña, donde

existen monumentos prehistóricos pertenecientes a los
Nuragas, las primeros habitantes de la isla; estos monumentos
constan de bloques de basalto superpuestos sin mortero y en
cuyas paredes de encontraban grabados toscos signos que han
sido interpretados con mucha verosimilidad como muescas que
servían para llevar la cuenta del ganado y la caza.
 Hacia el año 3.000 a.C. los babilonios usaban ya pequeñas

tablillas de arcilla para recopilar datos en tablas sobre la
producción agrícola y los géneros vendidos o cambiados
mediante trueque.
 Los egipcios ya analizaban los datos de la población y la renta

del país mucho antes de construir la pirámides.En los antiguos
monumentos egipcios se encontraron interesantes documentos
en que demuestran la sabia organización y administración de
este pueblo; ellos llevaban cuenta de los movimientos
poblacionales y continuamente hacían censos. Tal era su
dedicación por llevar simpre una relación de todo que hasta
tenían a la diosa Safnkit, diosa de los libros y las cuentas. Todo
esto era hecho bajo la dirección del Faraón y fue a partir del
año 3050 a.C.
 En la Biblia observamos en uno de los libros del Pentateuco,

bajo el nombre de Números, el censo que realizó Moisés
después de la salida de Egipto. Textualmente dice: "Censo de
las tribus: El día primero del segundo año después de la salida
de Egipto, habló Yavpe a Moisés en el desierto de Sinaí en el
tabernáculo de la reunión, diciendo: "Has un censo general de
toda la asamblea de los hijos de Israel, por familias y por
linajes, describiendo por cabezas los nombres de todos los
varones aptos para el servicio de armas en Israel. En el libro
bíblico Crónicas describe el bienestar material de las diversas
tribus judías.
 En China existían los censos chinos ordenados por el emperador

Tao hacia el año 2.200 a.C.
 Posteriormente, hacia el año 500 a.C., se realizaron censos

en Roma para conocer la población existente en aquel
momento. Se erigió la figura del censor, cuya misión consistía
en controlar el número de habitantes y su distribución por los
distintos territorios.
 En la Edad Media, en el año 762, Carlomagno ordenó la

creación de un registro de todas sus propiedades, así como de
los bienes de la iglesia.
 Después de la conquista normanda de Inglaterra en 1.066, el

rey Guillermo I, el Conquistador, elaboró un catastro que puede
considerarse el primero de Europa.
 Los Reyes Católicos ordenaron a Alonso de Quintanilla en 1.482

el recuento de fuegos (hogares) de las provincias de Castilla.
En 1.662 un mercader de lencería londinense, John Graunt, publicó
un tratado con las observaciones políticas y naturales, donde Graunt
pone de manifiesto las cifras brutas de nacimientos y defunciones
ocurridas en Londres durante el periodo 1.604-1.661, así como las
influencias que ejercían las causas naturales, sociales y políticas de
dichos acontecimientos. Puede considerarse el primer trabajo
estadístico serio sobre la población.
Curiosamente, Graunt no conocía los trabajos de B. Pascal » (1.623-

1.662) ni de C. Huygens (1.629-1.695) sobre estos mismos temas.
Un poco más tarde, el astrónomo Edmund Halley (1.656- 1.742)
presenta la primera tabla de mortalidad que se puede considerar
como base de los estudios contemporáneos. En dicho trabajo se
intenta establecer el precio de las anualidades a satisfacer a las
compañías de seguros. Es decir, en Londres y en París se estaban
construyendo, casi de manera simultánea, las dos disciplinas que
actualmente llamamos estadística y probabilidad.
En el siglo XIX, la estadística entra en una nueva fase de su

desarrollo con la generalización del método para estudiar fenómenos
de las ciencias naturales y sociales. Galton » (1.822-1.911)
y Pearson(1.857-1936) se pueden considerar como los padres de la
estadística moderna, pues a ellos se debe el paso de la estadística
deductiva a la estadística inductiva.
Los fundamentos de la estadística actual y muchos de los métodos de

inferencia son debidos a R. A. Fisher. Se interesó primeramente por
la eugenesia, lo que le conduce, siguiendo los pasos de Galton a la
investigación estadística, sus trabajos culminan con la publicación de
la obra Métodos estadísticos para investigaciones. En él aparece la
metodología estadística tal y como hoy la conocemos.
A partir de mediados del siglo XX comienza lo que podemos

denominar la estadística moderna, uno de los factores determinantes
es la aparición y popularización de los computadores. El centro de
gravedad de la metodología estadística se empieza a desplazar
técnicas de computación intensiva aplicadas a grandes masas de
datos, y se empieza a considerar el método estadístico como un
proceso iterativo de búsqueda del modelo ideal
Las aplicaciones en este periodo de la Estadística a la Economía

conducen a una disciplina con contenido propio: la Econometría. La
investigación estadística en problemas militares durante la segunda
guerra mundial y los nuevos métodos de programación matemática,
dan lugar a la Investigación Operativa.
Estadística descriptiva
Describe, analiza y representa un grupo de datos utilizando métodos

numéricos y gráficos que resumen y presentan la información
contenida en ellos. Para esto se utilizan las tablas y gráficos de
frecuencias absolutas y relativas, y los estimadores de las medidas de
tendencia central, dispersión, sesgo y kurtosis.
Tablas de frecuencia, es una tabla resumen en la que se disponen los

datos divididos en grupos ordenados numéricamente, denominados
clases o categorías. El número de datos u observaciones que
pertenecen a determinada clases de llama frecuencia de clase, el
punto medio de cada clase o categoría se llama marca de clase y la
longitud de una clase se conoce como intervalo de clase. La
frecuencia absoluta es el número o cantidad de observaciones iguales
o semejantes que se encuentran comprendidas dentro de un
determinado intervalo de clase: mientras la frecuencia relativa es el
cociente que resulta de dividir la frecuencia absoluta de una clase
para la suma total de frecuencias de todas las clases de una tabla de
frecuencias.
Representación Gráfica.- La representación gráfica de una

distribución de frecuencias depende del tipo de datos que la
constituya.
Representación Gráfica:
Diagrama de sectores: Está representación gráfica consiste en dividir

un círculo en tantos sectores circulares como modalidades presente el
carácter cualitativo, asignando un ángulo central a cada sector
circular proporcional a la frecuencia absoluta ni, consiguiendo de esta
manera un sector con área proporcional también a ni.
Histograma: Al ser esta representación una representación por áreas,

hay que distinguir si los intervalos en los que aparecen agrupados los
datos son de igual amplitud o no.
Medidas descriptivas
Los fenómenos biológicos no suelen ser constantes, por lo que será

necesario que junto a una medida que indique el valor alrededor del
cual se agrupan los datos, se asocie una medida que haga referencia
a la variabilidad que refleje dicha fluctuación. Estudiaremos los
estadísticos que nos van a orientar sobre cada uno de estos niveles
de información: valores alrededor de los cuales se agrupa la muestra,
la mayor o menor fluctuación alrededor de esos valores, nos
interesaremos en ciertos valores que marcan posiciones
características de una distribución de frecuencias así como su
simetría y su forma.
En este sentido pueden examinarse varias características, siendo las
más comunes:
La tendencia central de los datos;
La dispersión o variación con respecto a este centro;
Los datos que ocupan ciertas posiciones.
La simetría de los datos.
La forma en la que los datos se agrupan.
Estadísticos de tendencia central: las tres medidas más usuales de

tendencia central son la media, mediana y moda.
La Media. También llamada media aritmética, es una medida

descriptiva que se calcula sumando los valores numéricos y
dividiendo entre el número de valores. A la media poblacional se la
conoce como μ (mu) y la media muestral como x (x barra). Cálculo
de la media poblacional μ:

x
N
Donde N es el tamaño de la población y x son los valores de los datos

de la población.
Cálculo de la media muestral x :
x
x
n
Donde n es el tamaño de la muestra y x son todos los valores que

toma la muestra.
La Mediana es el valor central de la variable, es decir, supuesta la

muestra ordenada en orden creciente o decreciente, el valor que
divide en dos partes la muestra. La principal característica de esta
medida es que al menos el 50% de las observaciones son menores o
iguales a ella.
Calculo de la mediana: cuando N es impar, hay un término central
xN 1
2 que será el valor de la mediana. Cuando N es par, hay dos
términos centrales la mediana será el promedio de estos dos
valores.
La moda es el valor de la variable que tenga mayor frecuencia

absoluta, la que más se repite, es la única medida de centralización
que tiene sentido estudiar en una variable cualitativa, pues no precisa
la realización de ningún cálculo
Medidas de variabilidad o dispersión

Los estadísticos de tendencia central o posición nos indican donde se
sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos
indican si esas puntuaciones o valores están próximas entre sí o si
por el contrario están o muy dispersas. Algunas de las principales
medidas son:
Rango. Se obtiene restando el valor más bajo de un conjunto de

observaciones del valor más alto, se denota como R. Es fácil de
calcular y sus unidades son las mismas que las de la variable, aunque
posee varios inconvenientes:
No utiliza todas las observaciones (sólo dos de ellas);
Se puede ver muy afectada por alguna observación extrema;
El rango aumenta con el número de observaciones, o bien se queda

igual. En cualquier caso nunca disminuye.
Varianza. Es una medida de dispersión que mide la tendencia de las

observaciones individuales a desviarse con respecto a la media. La
varianza para los datos de una población esta determinada por la
siguiente ecuación:
2  
( x   )2
N
Donde x son los valores de la población, μ es la media poblacional y

N es el número de observaciones en la población.
Desviación Estándar también mide la variabilidad de las

observaciones con respecto a la media, es igual a la raíz cuadrada de
la varianza. Esta medida de dispersión siempre es positiva y se
denota por  . Se calcula a través de la ecuación:
  (x  ) 2
Medidas de posición. Las medidas de posición o localización dividen la

distribución en partes iguales, sirven para clasificar a un individuo o
elemento dentro de una determinada población o muestra. Éstas son:
Cuartiles: divide a la población o muestra en cuatro partes iguales.
Deciles: divide a la población en diez partes iguales.
Percentiles: divide a la población en cien partes iguales.
Simetría de los datos. Sabemos cómo calcular valores alrededor de

los cuales se distribuyen las observaciones de una variable sobre una
muestra y sabemos cómo calcular la dispersión que ofrecen los
mismos con respecto al valor de central. Nos proponemos dar un
paso más allá en el análisis de la variable. En primer lugar, nos
vamos a plantear el saber si los datos se distribuyen de forma
simétrica con respecto a un valor central, o si bien la gráfica que
representa la distribución de frecuencias es de una forma diferente
del lado derecho que del lado izquierdo.
Medida de apuntamiento, Curtosis: La curtosis es una medida del

apuntamiento, que nos indicará si la distribución es muy apuntada o
poco apuntada. Este coeficiente lo vamos a denotar por K y se calcula
según la siguiente expresión:
ESTADISTICA INFERENCIAL
El propósito de un estudio estadístico suele ser, como hemos venido

citando, extraer conclusiones acerca de la naturaleza de una
población. Al ser la población grande y no poder ser estudiada en su
integridad en la mayoría de los casos, las conclusiones obtenidas
deben basarse en el examen de solamente una parte de la muestra,
lo que nos lleva, en primer lugar a la justificación, necesidad y
definición de las diferentes técnicas de muestreo.
Los primeros términos obligados a los que debemos hacer referencia,

serán los de estadístico y estimador.
Dentro de este contexto, será necesario asumir un estadístico o

estimador como una variable aleatoria con una determinada
distribución, y que será la pieza clave en las dos amplias categorías
de la inferencia estadística: la estimación y el contraste de hipótesis.
El concepto de estimador, como herramienta fundamental, lo

caracterizamos mediante una serie de propiedades que nos servirán
para elegir el “mejor” para un determinado parámetro de una
población, así como algunos métodos para la obtención de ellos,
tanto en la estimación puntual como por intervalos.
La tarea fundamental de la estadística inferencial, es hacer
inferencias acerca de la población a partir de una muestra extraída de
la misma.
Técnicas de muestreo sobre una población
La teoría del muestreo tiene por objetivo, el estudio de las relaciones

existentes entre la distribución de un carácter en dicha población y
las distribuciones de dicho carácter en todas sus muestras.
Las ventajas de estudiar una población a partir de sus muestras son

principalmente:
Coste reducido
Mayor rapidez
Más posibilidad de estudio
De este modo se ve que al hacer estadística inferencial debemos

enfrentarnos con dos problemas:
Elección de la muestra (muestreo).
Extrapolación de las conclusiones obtenidas sobre la muestra, al resto

de la población (inferencia).
Tipos de errores
Entre la muestra con la que se trabaja y la población de interés,

aparece la denominada población de muestreo: población (la mayor
parte de las veces no definida con precisión) de la cual nuestra
muestra es una muestra aleatoria. En consecuencia la generalización
está amenazada por dos posibles tipos de errores: error aleatorio que
es el que las técnicas estadísticas permiten cuantificar y críticamente
dependiente del tamaño muestral, pero también de la variabilidad de
la variable a estudiar y el error sistemático que tiene que ver con la
diferencia entre la población de muestreo y la población de interés y
que sólo puede ser controlado por el diseño del estudio.
El problema se resuelve en base al conocimiento de la "distribución

muestral" del estadístico que se use. Concretando, por ejemplo en la
media. Si para cada muestra posible calculamos la media muestral (
) obtenemos un valor distinto ( es un estadístico: es una variable
aleatoria y sólo depende de la muestra), habrá por tanto una fpd para
, llamada distribución muestral de medias. La desviación típica de
esta distribución se denomina error típico de la media.
Evidentemente, habrá una distribución muestral para cada
estadístico, no sólo para la media, y en consecuencia un error típico
para cada estadístico.
Si la distribución muestral de un estadístico estuviera relacionada con

algún parámetro de interés, ese estadístico podría ser un estimador
del parámetro.
Población
Una población es un conjunto de sujetos o individuos con

determinadas características demográficas, de la que se obtiene
la muestra o participantes en un estudio a la que se quiere extrapolar
los resultados de dicho estudio (inferencia estadística). La estadística
es comúnmente considerada como una colección de hechos
numéricos expresados en términos de una relación sumisa, y que han
sido recopilado a partir de otros datos numéricos. Como base en una
muestra de observaciones que generalmente, aunque no por
necesidad, se considera como una estimación de parámetro de
determinada población; es decir, una función de valores de muestra
Tamaño
El tamaño de la muestra normalmente es representado por "n" y
siempre es un número entero positivo. No se puede hablar de ningún
tamaño exacto de la muestra, ya que puede variar dependiendiendo
de los diferentes marcos de investigación. Sin embargo, si todo lo
demás es igual, una muestra de tamaño grande brinda mayor
precisión en las estimaciones de las diversas propiedades de la
población
¿Cuál debe ser el tamaño de la muestra?
Determinar el tamaño de la muestra que se va a seleccionar es un

paso importante en cualquier estudio de investigación. Por ejemplo,
un investigador desea determinar la prevalencia de problemas
oculares en niños en edad escolar y quiere realizar una encuesta.
La pregunta importante que debe ser contestada en todas las
encuestas de muestra es: "¿Cuántos participantes deben ser elegidos
para una encuesta?" Sin embargo, la respuesta no puede ser dada sin
tener en cuenta los objetivos y circunstancias de las investigaciones.
La elección del tamaño de la muestra depende de consideraciones no

estadísticas y estadísticas. Las consideraciones no estadísticas
pueden incluir la disponibilidad de los recursos, la mano de obra, el
presupuesto, la ética y el marco de muestreo. Las consideraciones
estadísticas incluirán la precisión deseada de la estimación de la
prevalencia y la prevalencia esperada de los problemas oculares en
niños en edad escolar.
Para determinar el tamaño adecuado de las muestras es necesario
seguir los tres criterios:
1. Nivel de precisión
El nivel de precisión, también llamado error de muestreo, es el rango

en donde se estima que está el valor real de la población. Este rango
se expresa en puntos porcentuales. Por lo tanto, si un investigador
descubre que el 70% de los agricultores de la muestra han adoptado
una tecnología recomendada con una tasa de precisión de ~+mn~
5%, el investigador puede concluir que entre el 65% y el 75% de los
agricultores de la población han adoptado la nueva tecnología.
2. Nivel de confianza
El intervalo de confianza es la medida estadística del número de

veces de cada 100 que se espera que los resultados se encuentren
dentro de un rango específico.
Por ejemplo, un intervalo de confianza de 90% significa que los
resultados de una acción probablemente cubrirán las expectativas el
90% de las veces.
La idea básica descripta en el Teorema del límite central es que

cuando una población se muestrea muchas veces, el valor promedio
de un atributo obtenido es igual al valor real de la población. En otras
palabras, si un intervalo de confianza es del 95%, significa que 95 de
100 muestras tendrán el valor real de la población dentro del rango
de precisión.
3. Grado de variabilidad
Dependiendo de la población objetivo y los atributos a considerar, el

grado de variabilidad varía considerablemente. Cuanto más
heterogénea sea una población, mayor deberá ser el tamaño de la
muestra para obtener un nivel óptimo de precisión. Ten en cuenta
que una proporción de 55% indica un nivel más alto de variabilidad
que un 10% o un 80%. Esto se debe a que 10% y 80% significa que
una gran mayoría no posee o posee el atributo en cuestión.
Existen muchos enfoques para determinar el tamaño de la muestra,
incluyendo el uso de un censo en el caso de poblaciones más
pequeñas, el uso de tablas publicadas, imitar un tamaño de muestra
de estudios similares y aplicar fórmulas para calcular un tamaño de la
muestra.
Atributo
Atributo se puede definir como una característica que define un

elemento. Ejemplo color de cabello, sexo, experiencia (Poca, media,
mucha) o estado civil, Se puede asignar número a cada categoría.
Cualitativa
Los atributos se definen como una característica cualitativa.
Color de cabello:
(1)Negro (2) Castaño (3) Rubio (4) Calvo
Variable Discreta:
Son cantidades numerales que varían, son contables o medible.
Ejemplo: El peso, la edad, cantidad de años estudiando.
Variable CONTINUA
Peso:
86,2314 kg
123,435 kg
97.65 kg

Instituto Tecnologico Euroamericano

Cargado por

Copyright:

Formatos disponibles

Instituto Tecnologico Euroamericano

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Instituto Tecnologico Euroamericano

Cargado por

Copyright:

Formatos disponibles

INSTITUTO TECNOLOGICO EUROAMERICANO

CARRERA: ADMINISTRACION DE EMPRESAS

PROFESOR: ING. JOSE ALVARADO

ESTUDIANTE: JUAN RIOS BARRERA

Es difícil conocer los orígenes de la Estadística. Desde los comienzos

 Su origen empieza posiblemente en la isla de Cerdeña, donde

 Hacia el año 3.000 a.C. los babilonios usaban ya pequeñas

 Los egipcios ya analizaban los datos de la población y la renta

 En la Biblia observamos en uno de los libros del Pentateuco,

 En China existían los censos chinos ordenados por el emperador

 Posteriormente, hacia el año 500 a.C., se realizaron censos

 En la Edad Media, en el año 762, Carlomagno ordenó la

 Después de la conquista normanda de Inglaterra en 1.066, el

 Los Reyes Católicos ordenaron a Alonso de Quintanilla en 1.482

Curiosamente, Graunt no conocía los trabajos de B. Pascal » (1.623-

En el siglo XIX, la estadística entra en una nueva fase de su

Los fundamentos de la estadística actual y muchos de los métodos de

A partir de mediados del siglo XX comienza lo que podemos

Las aplicaciones en este periodo de la Estadística a la Economía

Describe, analiza y representa un grupo de datos utilizando métodos

Tablas de frecuencia, es una tabla resumen en la que se disponen los

Representación Gráfica.- La representación gráfica de una

Diagrama de sectores: Está representación gráfica consiste en dividir

Histograma: Al ser esta representación una representación por áreas,

Los fenómenos biológicos no suelen ser constantes, por lo que será

La tendencia central de los datos;

La dispersión o variación con respecto a este centro;

Los datos que ocupan ciertas posiciones.

La simetría de los datos.

La forma en la que los datos se agrupan.

Estadísticos de tendencia central: las tres medidas más usuales de

La Media. También llamada media aritmética, es una medida

Donde N es el tamaño de la población y x son los valores de los datos

Cálculo de la media muestral x :

Donde n es el tamaño de la muestra y x son todos los valores que

La Mediana es el valor central de la variable, es decir, supuesta la

Calculo de la mediana: cuando N es impar, hay un término central

La moda es el valor de la variable que tenga mayor frecuencia

Medidas de variabilidad o dispersión

Rango. Se obtiene restando el valor más bajo de un conjunto de

No utiliza todas las observaciones (sólo dos de ellas);

Se puede ver muy afectada por alguna observación extrema;

El rango aumenta con el número de observaciones, o bien se queda

Varianza. Es una medida de dispersión que mide la tendencia de las

Donde x son los valores de la población, μ es la media poblacional y

Desviación Estándar también mide la variabilidad de las

Medidas de posición. Las medidas de posición o localización dividen la

Cuartiles: divide a la población o muestra en cuatro partes iguales.

Deciles: divide a la población en diez partes iguales.

Percentiles: divide a la población en cien partes iguales.

Simetría de los datos. Sabemos cómo calcular valores alrededor de

Medida de apuntamiento, Curtosis: La curtosis es una medida del

El propósito de un estudio estadístico suele ser, como hemos venido

Los primeros términos obligados a los que debemos hacer referencia,

Dentro de este contexto, será necesario asumir un estadístico o

El concepto de estimador, como herramienta fundamental, lo

Técnicas de muestreo sobre una población

La teoría del muestreo tiene por objetivo, el estudio de las relaciones