MI-3 - Mas Sanchez Juan Alonso - Conceptos - Tema 1
MI-3 - Mas Sanchez Juan Alonso - Conceptos - Tema 1
MI-3 - Mas Sanchez Juan Alonso - Conceptos - Tema 1
CARRERA:
INGENIERIA INDUSTRIAL
ASIGNATURA:
PROBABILIDAD Y ESTADÍSTICA
SEMESTRE Y GRUPO:
2(DO) SEMESTRE (MI3)
NOMBRE Y MATRICULA:
JUAN ALONSO MAS SANCHEZ
20470278
PROFESOR:
RAMON AGUSTIN BOCOS PATRON
FECHA DE ENTREGA:
09 DE SEPTIEMBRE DEL 2021
INDICE
INTRODUCCION.........................................................................................................4
1. ¿Qué es la Estadística moderna? ¿Por qué estudiarla?...................................................5
2. Partes en que se divide la estadística moderna para su estudio ......................................6
3. El método científico en la Estadística .............................................................................6
4. Métodos para la obtención de datos..................................................................................
5. ¿En qué consiste el principio “BEBS” (Basura Entra, Basura Sale)
o “GIGO” (en inglés)?.....................................................................................................7
6. ¿Cómo recolectar datos?..................................................................................................7
7. Tipos de datos estadísticos .............................................................................................8
8. Propiedades que describen una serie numérica de datos ................................................8
9. Datos no agrupados, medidas de tendencia central.......................................................10
9.1 Media aritmética, Media ponderada, Mediana, Moda ......................................11
10. Comparación entre la Media, Mediana y moda (ventajas y desventajas).....................12
11. Datos no agrupados, medidas de dispersión..................................................................14
11.1 Rango, Varianza, Desviación estándar, Coeficiente de variación ................14
12. El manejo de grandes cantidades de datos.....................................................................16
13. Datos agrupados, medidas de tendencia central............................................................17
14. Datos agrupados, medidas de dispersión.......................................................................19
15. Datos agrupados, medidas de posición..........................................................................19
15.1 Cuantiles: Cuartiles, Deciles, Percentiles......................................................19
15.2 Rango intercuartílico......................................................................................20
16. Las distribuciones de frecuencias, frecuencias relativas y de porcentajes....................21
17. Los histogramas, el polígono de frecuencias o de porcentajes
y la curva de porcentaje acumulado u ojiva..................................................................21
18. Importancia de la forma de los datos ............................................................................23
2|Página
18.1.-Simétrica, asimétrica o sesgada ¿Cómo se ubican las medidas
de tendencia central dependiendo de la forma?...........................................................23
18.2.-Uso de polígonos para comparar grupos datos...................................................24
18.3.-Medidas de forma: Curtosis y asimetría ............................................................27
19-Teorema de Chebyshev....................................................................................................27
20.-Gráficas para datos cualitativos ó categóricos ...............................................................28
20.1-Gráfica de barras y gráfica de pastel...................................................................29
21.- mapa conceptual de la estadística...................................................................................30
22.-conclusion........................................................................................................................31
23.- Fuentes de información bibliográfica y/o digital consultadas........................................32
24.- Nombre y URL de 2 videos consultados en
YouTube sobre el contenido del tema...................................................................................33
3|Página
INTRODUCCION
La estadística es el estudio de los modos de recolectar y analizar datos con el fin de
establecer conclusiones acerca del medio del cual se han obtenido los datos. a es la
ciencia que trata sobre la toma, organización recopilación, presentación y análisis de
datos para deducir conclusiones sobre ellos y para tomar decisiones que estén de
acuerdo con los análisis efectuados.
4|Página
1.-¿QUE ES LA ESTADISTICA MODERNA? ¿POR QUE ESTUDIARLA?
Hace cien años, H. G. Wells comento que “el pensamiento estadístico algún día será
tan necesario para la ciudadanía eficiente como la capacidad de leer y escribir”. Cada
dia de nuestras vidas estamos expuestos a una amplia variedad de información
numérica relativa a fenómenos como la actividad del mercado de valores, los
hallazgos de estudios de mercado, los resultados de encuestas de opinión, las tasas de
desempleo, los pronósticos de éxito futuro de industrias específicas y datos
deportivos. El tema de la estadística moderna abarca la recolección, presentación y
caracterización de información para ayudar tanto en el análisis de datos como el
proceso de la toma de decisiones.
En termino de áreas funcionales de negocios, la estadística puede aplicarse en:
Contabilidad
Para seleccionar muestras con propósitos de auditoria.
Para comprender los derroteros de costos en contabilidad de costos.
Finanzas
Para estas al tanto de medidas financieras en el transcurso del tiempo.
Para desarrollar formas de pronosticar valores de estas medidas en momentos
futuros.
Administración
Para describir características de empleados dentro de una organización.
Para mejorar la calidad de los productos fabricados o de los servicios
procurados por la organización.
Mercadeo
Para estimar la proporción de clientes que prefieren un producto en vez de otro
y la razón de estos.
Para sacar conclusiones respecto a la estrategia de publicidad que seria mas útil
para el incremento de ventas de un producto.
¿Por qué estudiarla?
Porque los datos estadísticos y las conclusiones obtenidas aplicando metodología
estadística ejercen una profunda influencia en casi todos los campos de la actividad
5|Página
humana. En particular, la estadística invade cada vez más cualquier investigación
relativa a salud pública. Este crecimiento, probablemente relacionado con el interés
por aumentar la credibilidad y confiabilidad de las investigaciones, no garantiza que
en todos los casos la metodología estadística haya sido correctamente utilizada, o
peor aún, que sea válida.
2.-PARTES EN QUE SE DIVIDE LA ESTADISTICA MODERNA PARA SU
ESTUDIO
La estadística se divide en dos grandes ramas de estudio que son: La estadística
descriptiva, la cual se encarga de la recolección, clasificación y descripción de datos
muéstrales o poblacionales, para su interpretación y análisis, que es de la que nos
ocuparemos en este curso; y la estadística matemática o inferencial, que desarrolla
modelos teóricos que se ajusten a una determinada realidad con cierto grado de
confianza. Estas dos ramas no son independientes; por el contrario, son
complementarias y entre ambas dan la suficiente ilustración sobre una posible
realidad futura, con el fin de que quien tenga poder de decisión, tome las medidas
necesarias para transformar ese futuro o para mantener las condiciones existentes.
La estadística descriptiva puede definirse como aquellos métodos que incluyen la
recolección, presentación y caracterización de un conjunto de datos con el fin de
describir apropiadamente las diversas características de ese conjunto de datos
La estadística inferencial puede definirse como aquellos métodos que hacen posible
la estimación de una característica de una población o la toma de una decisión
referente a una población, basándose solo en los resultados de la muestra.
3.-EL METODO CIENTIFICO EN LA ESTADISTICA
Podemos definir Estadística como la ciencia de los datos, El método científico es un
conjunto de principios y procedimientos para la búsqueda sistemática del
conocimiento.
El método científico está compuesto por los siguientes pasos:
1. Formula una teoría (problema).
2. Recoger datos para probar la teoría.
3. Analizar los datos.
4. Interpretar los resultados y tomar una decisión.
6|Página
El método científico es un procedimiento iterativo de aprendizaje. No podemos tener
certeza de la veracidad de las teorías que probemos usando el método científico, eso
es inherente a la ciencia. La ciencia está, por lo tanto, todo el tiempo revisando sus
teorías. La Estadística no es un conjunto de diferentes técnicas aisladas unas de otras,
sino que la Estadística, en conjunto con el método científico, nos entrega un
procedimiento analítico para tomar decisiones.
4.-METODOS PARA LA OBTENCION DE DATOS
Pueden utilizarse varias herramientas básicas para describir y resumir un conjunto
grade de datos. La manera más simple, pero quizás la más significativa, es la serie
ordenada. Se asume que los puntajes de CI de cinco recién graduados de la
Universidad de Podunk son 75,73,91,83 y 80. Una serie ordenada simplemente
enumera tales observaciones en orden ascendente o descendente. Los cinco valores
pueden aparecer como 73,75,80,83,91. La serie ordenada proporciona alguna
agrupación al conjunto de datos; por ejemplo, se puede ver de inmediato que los
valores extremos son 73,91. Sin embargo, la utilidad de una serie ordenada es
limitado.
5.-¿EN QUE CONCISTE EL PRINCIPIO “BEBS” (BASURA ENTRA, BASURA
SALE) O “GIGO” (EN INGLES)?
La frase Basura Entra Basura Sale (GIGO por sus siglas en inglés ‘Garbage In
Garbage Out’) es muy conocida en el ámbito de la programación de computadoras.
Describe el hecho de que el rendimiento de una computadora es tan bueno como su
entrada (su programación o diseño de su sistema operativo). ¿Esto aplica también
para nuestra mente o para nuestro cerebro?
El mejor programa no puede recoger datos sin sentido y producir resultados
coherentes. Desde luego, BEBS se aplica mucho más ampliamente que sólo al campo
de computadoras.
La calidad en el rendimiento de casi todo sistema o proceso depende de la calidad de
información en su entrada.
Si comenzamos a aplicar este orden de ideas a nuestro cerebro, podemos comenzar a
visualizar dos tipos de pensamientos:
Pensamiento Divergente: Se refiere a la capacidad de partir de una idea central y
avanzar hacia muchas ideas.
Pensamiento Convergente: Es la capacidad de partir de muchas ideas (un brain
storming, por ejemplo) y llegar a una sola idea o con conclusión.
7|Página
En los tiempos actuales, ambos tipos de pensamientos son vitales para generar nuevas
ideas e innovaciones en nuestras áreas de trabajo o en nuestros negocios.
Aunado a lo anterior, ciertas investigaciones han llegado a la conclusión de que lo
que pensamos, la forma en que pensamos, y la manera en que pensamos mientras
reflexionamos, cambia materialmente la estructura biológica de nuestro cerebro.
¿Qué significa esto?
Quiere decir que, a diferencia de las computadoras, nosotros (nuestro cerebro),
tenemos la capacidad de modificar el resultado final de, digamos ciertas conductas o
comportamientos que quizá no sean los mejores, sin importar lo que dio origen a esos
comportamientos.
6.-¿COMO RECOLECTAR DATOS?
Existen diferentes métodos mediante los cuales se pueden obtener datos estadísticos.
A continuación, te mencionamos los principales
Información publicada: Los datos estadísticos pueden obtenerse a través de la
recolección de datos originales. La persona u organización que se encarga de
obtenerlos es la fuente primaria, mientras que la persona que compila la información
es la fuente secundaria.
Conoce más de la diferencia entre datos primarios y datos secundarios.
Diseño de un experimento: La experimentación se realiza con un control estricto del
tratamiento que se le ofrece a los participantes del estudio.
Conducción de una encuesta: Este es otro método para obtener datos estadísticos. Se
diseña la encuesta, se recolectan los datos, se editan, se codifican y se tabulan para su
análisis.
Aquí un tabulador de encuestas que te será de gran utilidad.
Realizar un estudio observacional: El investigador observa el comportamiento de los
individuos que participan en el estudio, mientras se encuentran en su entorno natural.
Este proceso puede realizarse de formas diferentes para ayudar en el proceso de toma
de decisiones.
7.-TIPOS DE DATOS ESTADISTICOS
Datos categóricos
Los datos categóricos también conocidos como datos cualitativos, representan
características como el género, el idioma, etc. de una persona. También pueden tomar
8|Página
valores numéricos, por ejemplo: 1 para mujeres y 0 para hombres. Ten en cuenta que
esos números no tienen significado matemático.
Los tipos de datos estadísticos categóricos se clasifican en:
Datos nominales: Otros de los tipos de datos estadísticos son los que tienen valores
nominales que representan unidades discretas y se usan para etiquetar variables que
no tienen un valor cuantitativo.
Estos datos no tienen un orden, aunque cambiara el orden de sus valores, no cambia
su significado.
Datos ordinales: Los datos ordinales representan unidades discretas y ordenadas. Por
lo tanto, es casi lo mismo que los datos nominales, excepto que su orden es
importante.
Las escalas ordinales generalmente, se usan para medir características no numéricas
como la felicidad, la satisfacción del cliente, etc.
Datos numéricos
Estos tipos de datos estadísticos también se conocen como datos cuantitativos, y se
refieren a una medida o recuento. Se clasifican de la siguiente manera:
Datos discretos: Los datos estadísticos son discretos cuando sus valores son distintos
y separados. Es decir, cuando los datos sólo pueden tomar ciertos valores.
Este tipo de datos no se puede medir, pero se pueden contar . Básicamente
representan información que se puede clasificar.
Datos continuos: Los datos continuos representan mediciones y, por lo tanto, sus
valores. no se pueden contar pero se pueden medir. A su vez, estos se clasifican de la
siguiente manera:
Datos de intervalo: Los datos de intervalo representan unidades ordenadas que tienen
la misma diferencia . Por lo tanto, hablamos de datos de intervalo cuando tenemos
una variable que contiene valores numéricos que están ordenados y donde conocemos
las diferencias exactas entre los valores.
El problema con los datos de valores de intervalo es que podemos sumar y restar,
pero no podemos multiplicar, dividir o calcular razones. Debido a que no existe un
cero verdadero, no se pueden aplicar muchas estadísticas descriptivas e inferenciales.
Datos de relación: También son unidades ordenadas que tienen la misma diferencia.
Los datos de relación son los mismos que los valores de intervalo, con la diferencia
de que tienen un cero absoluto.
9|Página
8.-PROPIEDADES QUE DESCRIBEN UNA SERIE NUMERICA DE DATOS
Una variable es numérica cuando el resultado de la observación o medición es un
número.
Se clasifican en:
a) Discretos. La variable sólo puede tomar un cierto conjunto de valores posibles. En
general, aparecen por conteo.
Ejemplo: número de miembros del hogar, número de intervenciones quirúrgicas,
número de casos notificados de una cierta patología.
b) Continuos. Generalmente son el resultado de una medición que se expresa en
unidades. Las mediciones pueden tomar teóricamente un conjunto infinito de valores
posibles dentro de un rango. En la práctica los valores posibles de la variable están
limitados por la precisión del método de medición o por el modo de registro.
Ejemplos: altura, peso, pH, nivel de colesterol en sangre.
La distinción entre datos discretos y continuos es importante para decidir qué método
de análisis estadístico utilizar, ya que hay métodos que suponen que los datos son
continuos.
Consideremos por ejemplo, la variable edad. Edad es continua, pero si se la registra
en
años resulta ser discreta. En estudios con adultos, en que la edad va de 20 a 70 años,
por ejemplo, no hay problemas en tratarla como continua, ya que el número de
valores posibles es muy grande. Pero en el caso de niños en edad preescolar, si la
edad se registra en años debe tratarse como discreta, en tanto que si se la registra en
meses puede tratarse como continua.
Del mismo modo, la variable número de pulsaciones/min. es una variable discreta,
pero se la trata como continua debido al gran número de valores posibles.
Los datos numéricos (discretos o continuos) pueden ser transformados en categóricos
y ser tratados como tales. Aunque esto es correcto no necesariamente es eficiente y
siempre es preferible registrar el valor numérico de la medición, ya que esto permite:
- Analizar la variable como numérica ⇒ Análisis estadístico más simple y más
potente.
- Armar nuevas categorías usando criterios diferentes.
10 | P á g i n a
Sólo en casos especiales es preferible registrar datos numéricos como categóricos,
por
ejemplo, cuando se sabe que la medición es poco precisa (número de cigarrillos
diarios,
número de tazas de café en una semana).
9.-DATOS NO AGRUPADOS, MEDIDAS DE TENDENCIA CENTRAL
para que una calificación tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos
criterios estadísticos.
Este puntaje, por sí mismo tiene muy poco significado a menos que
podamos conocer el total de puntos que obtiene una persona
promedio al participar en esa prueba, saber cuál es la calificación
menor y mayor que se obtiene, y cuán variadas son esas
calificaciones.
11 | P á g i n a
9.1 MEDIA ARITMETICA, MEDIA PONDERADA, MEDIANA, MODA
Mediana Ponderada
En donde:
X = Observación individual
12 | P á g i n a
Q= el peso o ponderación asignada a cada observación
MEDIA
Ventajas
Es la medida de tendencia central más usada.
Emplea en su cálculo toda la información disponible.
Se expresa en las mismas unidades que la variable en estudio.
El promedio se estable en el muestreo.
Es un valor único.
Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).
Se emplea a menudo en cálculos estadísticos posteriores.
Es útil para llevar a cabo procedimientos estadísticos como la comparación de
medias de varios conjuntos de datos.
Presenta rigor matemático.
En la gráfica de frecuencia representa el centro de gravedad.
Desventajas
Es sensible a los valores extremos.
No es recomendable emplearla en distribuciones muy asimétricas.
Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede no
pertenecer al conjunto de valores de la variable.
Si el conjunto de datos es muy grande puede ser tedioso su cálculo manual.
No se puede calcular para datos cualitativos.
No se puede calcular para datos que tengan clases de extremo abierto, tanto
superior como inferior.
MEDIANA
Ventajas:
Fácil de calcular si el número de observaciones no es muy grande.
No se ve influenciada por valores extremos, ya que solo influyen los valores
centrales.
13 | P á g i n a
Fácil de entender.
Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con
clase de extremo abierto.
Es la medida de tendencia central más representativa en el caso de variables que
solo admiten la escala ordinal.
Desventajas
No utiliza en su “cálculo” toda la información disponible.
No pondera cada valor por el número de veces que se ha repetido.
Hay que ordenar los datos antes de determinarla.
MODA
Ventajas
No requiere cálculos.
Puede usarse para datos tanto cuantitativos como cualitativos.
Fácil de interpretar.
No se ve influenciada por valores extremos.
Se puede calcular en clases de extremo abierto.
Desventajas
Para conjuntos pequeños de datos su valor no tiene casi utilidad, si es que de hecho
existe. Solo tiene significado en el caso de una gran cantidad de datos.
No utiliza toda la información disponible.
No siempre existe, si los datos no se repiten.
En ocasiones, el azar hace que una sola observación no represente el valor más
frecuente del conjunto de datos.
Difícil de interpretar si los datos tiene 3 o más modas.
14 | P á g i n a
DESVIACION ESTANDAR: Denota con el símbolo σ o s, dependiendo de la
procedencia del conjunto de datos, es una medida de dispersión para variables de
razón (variables cuantitativas o cantidades racionales) y de intervalo.
Se define como la raíz cuadrada de la varianza de la variable.
Para un mejor entendimiento, se muestran las formulas con las que se llega al
resultado y claro ejemplo para obtener la desviacion estandar.
15 | P á g i n a
VARIANZA: Se refieren a la media aritmética de los cuadrados de las desviaciones
de cada valor respecto de la media aritmética de los datos, por lo que a veces también
se denomina desviación cuadrática media.
Se utilizan cualquiera de las formulas para obtener un resultado, va dependiendo si se
calcula toda una poblacion o solo una muestra de esa poblacion.
Un ejemplo es el siguiente:
Para Conway el uso de estas dos primeras habilidades converge en lo que se conoce
como “machine learning” que siendo un uso poderoso de los datos, no es todavía
Data Science o Ciencia de Datos. El agregó una habilidad adicional:
17 | P á g i n a
13DATOS AGRUPADOS, MEDIDAS DE TENDENCIA CENTRAL
En medidas estadísticas que se usan para describir cómo se puede resumir la
localización de los datos. Ubican e identifican el punto alrededor del cual se centran
los datos. Las más utilizadas son: la media, la mediana y la moda.
MEDIA
Si en una tabla de distribución de frecuencia, con clases, los puntos medios
son: y las respectivas frecuencias son , la media aritmética se
calcula de la siguiente manera:
Donde el número total de observaciones es
MEDIANA
Cuando los datos se encuentran agrupados en una distribución de frecuencia no se
conocen los datos originales, por lo tanto, es necesario estimar la mediana
mediante los siguientes pasos:
1. Calcular el valor
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano).
Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada
es igual o mayor que
3. Aplicando la siguiente fórmula con los valores del intervalo mediano:
donde:
= Límite inferior de la clase de donde se encuentra la mediana
= Total de frecuencias
= Frecuencia acumulada anterior a la clase mediana
= Frecuencia del intervalo mediano
= amplitud del intervalo de clase
18 | P á g i n a
MODA
Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con
datos agrupados, se habla de intervalo modal.
Si todos los intervalos tienen la misma amplitud, la moda se calcula por medio
de:
donde:
= Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).
= Frecuencia absoluta del intervalo modal.
= Frecuencia absoluta del intervalo anterior al modal.
= Frecuencia absoluta del intervalo posterior al modal.
= Amplitud de los intervalos.
19 | P á g i n a
(𝑃1,𝑃2,𝑃3,𝑃4,….,𝑃11, 𝑃12,. . , 𝑃15,…𝑃50,…,𝑃62,….,𝑃75, …,𝑃84,
….,𝑃97,𝑃98,𝑃99 ) que dividen en 100 partes iguales un conjunto de datos
ordenados de menor a mayor. Por ejemplo, el percentil 12 o 𝑃12 es el valor que
acumula por debajo de él un 12% de valores iguales o inferiores a él. El percentil
15 o 𝑃15 es el valor que acumula por de bajode él un 15% de valores iguales o
inferiores a él. En la posición central la ocupa el 𝑃50 que coincide con la mediana
(𝑀𝑒) de los datos.
20 | P á g i n a
El rango intercuartil utiliza la mediana como medida central. Entonces, el resultado
del rango intercuartil será próximo a la mediana o segundo cuartil (Q2) si hay pocos
valores extremos.
Un Polígono de Frecuencia es el nombre que recibe una clase de gráfico que se crea a
partir de un histograma de frecuencia. Los histogramas emplean columnas verticales
para reflejar las frecuencias, los polígonos de frecuencia se forman uniendo los
puntos más altos de cada una de las columnas del Histograma.
22 | P á g i n a
frecuencia, se forma o se construye uniendo los puntos más altos de cada columna
pero de un Histograma que represente las Frecuencias Acumuladas.
Al estar construido en función de las frecuencias acumuladas permite ver cuántas
observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo
exhibir los números asignados a cada intervalo.
En este caso la Ojiva es la línea azul, pero se ha dejado el Histograma, por dos
razones: (1) Para visualizar un histograma de Frecuencias Acumuladas; y, (2) Para
tener una visión más clara de lo que representa la Ojiva.
Cabe destacar que las Ojivas también se pueden hacer a la inversa, comenzando con
la mayor y terminando con la menor frecuencia.
Estos 3 tipos de gráficos son muy útiles y son fáciles de interpretar cuando estamos
trabajando con tablas de frecuencia.
18.-IMPORTANCIA DE LA FORMA DE DATOS
Las medidas de la forma son utilizadas para describir características tales como la
simetría (o asimetría) que presenta la distribución de los datos, o qué tan aplanada o
picuda es la forma de la distribución.
Para cuantificar la simetría de una distribución de datos se utiliza el coeficiente de
sesgo (cs), cuya ecuación es:
n
1
∑
n i=1
( xi −x)
3
cs= 3
s
23 | P á g i n a
En términos generales, se trata de un promedio de las diferencias de las mediciones
de la variable con respecto a la media (𝑋𝑖 − 𝑋̅)3. Dado que las diferencias están
elevadas al cubo, el coeficiente de sesgo puede tener un valor positivo, un valor
negativo o un valor igual a cero.
18.1.-SIMETRICA, ASIMETRICA O SESGADA ¿COMO SE UBICAN LAS
MEDIDAS DE TENDENCIA CENTRAL DEPENDIENDODE LA FORMA?
Un valor positivo del coeficiente de sesgo nos indica que, en el promedio de
diferencias elevadas al cubo, tienen mayor predominancia los términos en donde las
Xi son mayores que 𝑋̅, es decir, tienen mayor peso las diferencias con signo positivo.
Este hecho se manifiesta como una cola de valores a la derecha de la media. Un sesgo
positivo implica la existencia de observaciones con valores altos de la variable en
comparación con la mayoría de las observaciones.
Por el contrario, un sesgo negativo implica que, en el promedio, pesan más los
términos en donde Xi son menores que 𝑋̅, lo que implica una cola de valores a la
izquierda de la media. Así, un coeficiente de sesgo negativo implica la existencia de
observaciones con valores bajos de la variable en comparación con la mayoría de las
observaciones.
Un coeficiente de sesgo igual a cero implica que hay una compensación entre los
términos de diferencias al cubo con valores positivos y con valores negativos que
contribuyen al promedio. En este punto hay que mencionar que una distribución con
coeficiente de sesgo igual a cero puede tomar diferentes formas. Una distribución
simétrica forzosamente tendrá un coeficiente de sesgo igual a cero, pero si una
distribución tiene coeficiente de sesgo igual a cero, no necesariamente tendrá una
forma simétrica. Por otra parte, es pertinente mencionar que en la práctica será difícil
encontrar una distribución de los datos en donde el coeficiente de sesgo cs sea
exactamente igual a cero, pero sí se podrán encontrar coeficientes con valores
“cercanos” a cero, en donde cualitativamente se podría decir que la distribución
exhibe simetría al analizar el histograma correspondiente.
24 | P á g i n a
18.2.-USO DE POLIGONOS PARA COMPARAR GRUPOS DE DATOS
La principal función de una gráfica poligonal es indicar los cambios sufridos por un
fenómeno dentro de un período definido de tiempo o en relación con otro fenómeno
conocido como frecuencia.
De esta manera, es una herramienta útil para comparar el estado de las variables en el
tiempo o en contraposición con otros factores (Lane, 2017).
Esta gráfica se deriva en muchos casos de un histograma en cuanto a que los puntos
que se marcan en el plano cartesiano corresponden a aquellos que abarcan las barras
del histograma.
Representación gráfica
La gráfica utiliza segmentos de recta que ascienden o descienden dentro del plano
cartesiano, dependiendo del valor que se les dé a los puntos que marcan el cambio en
el comportamiento de las variables tanto en el eje X como en el Y.
Una particularidad importante que debe ser tenida en cuenta cuando se quiere
representar una gráfica poligonal, es que tanto las variables en el eje X como las
25 | P á g i n a
frecuencias en el eje Y deben ser marcadas con el título de aquello que están
midiendo.
Por otro lado, para poder hacer un gráfico poligonal, deben ser agregados dos
intervalos en los extremos, cada uno de ellos de igual tamaño y con una frecuencia
equivalente a cero.
De esta manera, se toma el límite mayor y menor de la variable analizada y cada uno
se divide por dos, para determinar el lugar en dónde debe iniciar y terminar la línea
de la gráfica poligonal (Xiwhanoki, 2012).
Estos datos se deben organizar en parejas cuya ubicación dentro del plano cartesiano
será representada por un punto. Para formar el gráfico poligonal, los puntos deben ser
unidos en sentido de izquierda a derecha
Ejemplo 1
26 | P á g i n a
La estatura de los estudiantes está representada en el eje X o eje horizontal en una
escala definida en cm como su título lo indica, cuyo valor incrementa cada cinco
unidades.
Por otro lado, el número de estudiantes está representado en el eje Y o eje vertical en
una escala que aumenta su valor cada 20 unidades.
27 | P á g i n a
lo que implica que es más puntiaguda y con colas más anchas que la distribución
normal de referencia. Finalmente, a una distribución más aplanada y con colas menos
anchas que las de las de la distribución normal de referencia se le denomina
platocúrtica y tiene un ck < 0
19.-TEOREMA DE CHEBYSHEV
La desigualdad de Chebyshev es un teorema utilizado en estadística que proporciona
una estimación conservadora (intervalo de confianza) de la probabilidad de que una
variable aleatoria con varianza finita se sitúe a una cierta distancia de su esperanza
matemática o de su media.
Su expresión formal es la siguiente:
Partiendo de esta expresión general y desarrollando la parte que queda dentro del
valor absoluto tendríamos lo siguiente:
28 | P á g i n a
Si prestamos atención a la expresión anterior, se aprecia que la parte de la izquierda
no es más es un intervalo de confianza. Este nos ofrece tanto una cota inferior, como
una superior para el valor estimado. Por lo tanto, la desigualdad de Chebyshev nos
dice la probabilidad mínima de que el parámetro poblacional se encuentre dentro de
una determinada cantidad de desviaciones típicas por encima o por debajo de su
media. O dicho de otra manera, nos da la probabilidad de que de que el parámetro
poblacional se encuentre dentro de ese intervalo de confianza.
29 | P á g i n a
MAPA CONCEPTUAL DE ESTADISTICA
30 | P á g i n a
CONCLUSION
31 | P á g i n a
La Estadística es una ciencia matemática que se utiliza para describir, analizar e
interpretar ciertas características de un conjunto de individuos llamado población.
Cuando nos referimos a muestra y población hablamos de conceptos relativos pero
estrechamente ligados. Una población es un todo y una muestra es una fracción o
segmento de ese todo.
32 | P á g i n a
FUENTES DE INFORMACIONBIBLIOGRAFICA Y/O DIGITAL
CONSULTADAS
U.S. Department of Health and Human Services. (2000, 29 agosto). Módulo 4:
Métodos de Recaudación de Información - Sección 2:1 | ORI - The Office of
Research Integrity. Research Integrity. https://ori.hhs.gov/m%C3%B3dulo-4-m
%C3%A9todos-de-recaudaci%C3%B3n-de-informaci%C3%B3n-secci
%C3%B3n-2-1
Ortega, C. (2021, 19 agosto). ¿Cuáles son los tipos de datos estadísticos?
QuestionPro. https://www.questionpro.com/blog/es/tipos-de-datos-estadisticos/
L. (2001, 1 marzo). ESTADISTICA DESCRIPTIVA. PDF.
https://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo
%20descriptiva.pdf
Skcp.588, F. L. D. E. B. (2020, 15 febrero). MEDIDAS DE TENDENCIA
CENTRAL PARA DATOS NO AGRUPADOS. issuu.
https://issuu.com/skcp.588/docs/estadistica-convertido/s/10217360
WORDPRESS. (2014, 5 noviembre). Ventajas y desventajas,. «Estadística
Descriptíva». https://estadisticassandmary.wordpress.com/ventajas-y-
desventajas/
Quevedo, F. (2011, 2 marzo). Medidas de tendencia central y dispersión -
Medwave. MEDWAVE.
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
ARAVENA TIZANO, J. E. (2019, 6 abril). Estadistica. PDF.
http://www.liceooscarcastro.cl/A-2/images/CORMUN_ESTUDIA/CURSOS/1
%C2%B0medio/03Matematicas/SEM02/MAT_1MED_CLAS_SEM02.pdf
Rodó, P. (2021, 12 enero). Rango intercuartílico. Economipedia.
https://economipedia.com/definiciones/rango-intercuartilico.html
Pascuzzo, A., & Perfil, V. T. M. (2004, 15 junio). Histogramas, Polígonos de
Frecuencia y Ojivas. BLOGGER.
http://aldanalisis.blogspot.com/2014/04/histogramas-poligonos-de-frecuencia-
y.html
Sanjuán, F. J. M. (2021, 3 marzo). Desigualdad de Chebyshev. Economipedia.
https://economipedia.com/definiciones/desiguladad-chebyshev-teorema.html
A.N.O.N.I.M.O. (2007, 11 junio). Representaciones graficas. PDF.
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/tema2.pdf
PORRAS VELAZQUEZ, G. A. (2004, 17 septiembre). Medidas de
Tendencias. PDF.
https://centrogeo.repositorioinstitucional.mx/jspui/bitstream/1012/161/1/17-
33 | P á g i n a
Recordando%20las%20Medidas%20de%20Tendencia%20Central%2C%20de
%20Dispersi%C3%B3n%20y%20de%20la%20Forma%20-
%20%20Diplomado%20en%20An%C3%A1lisis%20de%20Informaci
%C3%B3n%20Geoespacial.pdf
Jervis, T. M. (2019, 29 octubre). gráfica poligonal. Lifeder.
https://www.lifeder.com/grafica-poligonal/
gobierno abierto. (2016, 15 diciembre). El Manejo de los Grandes Datos. El
Data Scientist. Parte I. – Asociación Gobierno Abierto. agaargentina.
https://www.agaargentina.org/2016/12/15/el-manejo-de-los-grandes-datos-el-
data-scientist-parte-i/
REVISTA EUREKA. (2009, 6 enero). MÉTODO CIENTÍFICO DE
INVESTIGACIÓN ESTADÍSTICA. PDF.
https://www.redalyc.org/pdf/920/92012998004.pdf
34 | P á g i n a