MI-3 - Mas Sanchez Juan Alonso - Conceptos - Tema 1

INSTITUTO TECNOLOGICO DE CAMPECHE
CARRERA:
INGENIERIA INDUSTRIAL

ASIGNATURA:
PROBABILIDAD Y ESTADÍSTICA

SEMESTRE Y GRUPO:
2(DO) SEMESTRE (MI3)
NÚM.. Y NOMBRE DEL TRABAJO:

INVESTIGACIÓN CONCEPTUAL #1
NÚM. Y NOMBRE DE LA UNIDAD:

ESTADÍSTICA DESCRIPTIVA #1
NOMBRE Y MATRICULA:
JUAN ALONSO MAS SANCHEZ
20470278

PROFESOR:
RAMON AGUSTIN BOCOS PATRON

FECHA DE ENTREGA:
09 DE SEPTIEMBRE DEL 2021
INDICE
INTRODUCCION.........................................................................................................4
1. ¿Qué es la Estadística moderna? ¿Por qué estudiarla?...................................................5
2. Partes en que se divide la estadística moderna para su estudio ......................................6
3. El método científico en la Estadística .............................................................................6
4. Métodos para la obtención de datos..................................................................................
5. ¿En qué consiste el principio “BEBS” (Basura Entra, Basura Sale)
o “GIGO” (en inglés)?.....................................................................................................7
6. ¿Cómo recolectar datos?..................................................................................................7
7. Tipos de datos estadísticos .............................................................................................8
8. Propiedades que describen una serie numérica de datos ................................................8
9. Datos no agrupados, medidas de tendencia central.......................................................10
9.1 Media aritmética, Media ponderada, Mediana, Moda ......................................11
10. Comparación entre la Media, Mediana y moda (ventajas y desventajas).....................12
11. Datos no agrupados, medidas de dispersión..................................................................14
11.1 Rango, Varianza, Desviación estándar, Coeficiente de variación ................14
12. El manejo de grandes cantidades de datos.....................................................................16
13. Datos agrupados, medidas de tendencia central............................................................17
14. Datos agrupados, medidas de dispersión.......................................................................19
15. Datos agrupados, medidas de posición..........................................................................19
15.1 Cuantiles: Cuartiles, Deciles, Percentiles......................................................19
15.2 Rango intercuartílico......................................................................................20
16. Las distribuciones de frecuencias, frecuencias relativas y de porcentajes....................21
17. Los histogramas, el polígono de frecuencias o de porcentajes
y la curva de porcentaje acumulado u ojiva..................................................................21
18. Importancia de la forma de los datos ............................................................................23
2|Página
18.1.-Simétrica, asimétrica o sesgada ¿Cómo se ubican las medidas
de tendencia central dependiendo de la forma?...........................................................23
18.2.-Uso de polígonos para comparar grupos datos...................................................24
18.3.-Medidas de forma: Curtosis y asimetría ............................................................27
19-Teorema de Chebyshev....................................................................................................27
20.-Gráficas para datos cualitativos ó categóricos ...............................................................28
20.1-Gráfica de barras y gráfica de pastel...................................................................29
21.- mapa conceptual de la estadística...................................................................................30
22.-conclusion........................................................................................................................31
23.- Fuentes de información bibliográfica y/o digital consultadas........................................32
24.- Nombre y URL de 2 videos consultados en
YouTube sobre el contenido del tema...................................................................................33
3|Página
INTRODUCCION
La estadística es el estudio de los modos de recolectar y analizar datos con el fin de
establecer conclusiones acerca del medio del cual se han obtenido los datos. a es la
ciencia que trata sobre la toma, organización recopilación, presentación y análisis de
datos para deducir conclusiones sobre ellos y para tomar decisiones que estén de
acuerdo con los análisis efectuados.
La Estadística es una disciplina que utiliza recursos matemáticos para organizar y

resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones
respecto de ellos. Por ejemplo, la estadística interviene cuando se quiere conocer el
estado sanitario de un país, a través de ciertos parámetros como la tasa de morbilidad
o mortalidad de la población.
En este caso la estadística describe la muestra en términos de datos organizados y

resumidos, y luego infiere conclusiones respecto de la población. Aplicada a la
investigación científica, también infiere cuando provee los medios matemáticos para
establecer si una hipótesis debe o no ser rechazada. La estadística puede aplicarse a
cualquier ámbito de la realidad, y por ello es utilizada en física, química, biología,
medicina, astronomía, psicología, sociología, lingüística, demografía, etc. Y es
importante en todos los contextos desde el estudiantil, de trabajo y profesional por
que se aplica en la vida diaria de cada uno de estos en el estudiantil por ejemplo para
sacar tu promedio de una calificación o para saber la media o cuanto necesitas para
ciertas materias.
4|Página
1.-¿QUE ES LA ESTADISTICA MODERNA? ¿POR QUE ESTUDIARLA?
Hace cien años, H. G. Wells comento que “el pensamiento estadístico algún día será
tan necesario para la ciudadanía eficiente como la capacidad de leer y escribir”. Cada
dia de nuestras vidas estamos expuestos a una amplia variedad de información
numérica relativa a fenómenos como la actividad del mercado de valores, los
hallazgos de estudios de mercado, los resultados de encuestas de opinión, las tasas de
desempleo, los pronósticos de éxito futuro de industrias específicas y datos
deportivos. El tema de la estadística moderna abarca la recolección, presentación y
caracterización de información para ayudar tanto en el análisis de datos como el
proceso de la toma de decisiones.
En termino de áreas funcionales de negocios, la estadística puede aplicarse en:
Contabilidad
 Para seleccionar muestras con propósitos de auditoria.
 Para comprender los derroteros de costos en contabilidad de costos.
Finanzas
 Para estas al tanto de medidas financieras en el transcurso del tiempo.
 Para desarrollar formas de pronosticar valores de estas medidas en momentos
futuros.
Administración
 Para describir características de empleados dentro de una organización.
 Para mejorar la calidad de los productos fabricados o de los servicios
procurados por la organización.
Mercadeo
 Para estimar la proporción de clientes que prefieren un producto en vez de otro
y la razón de estos.
 Para sacar conclusiones respecto a la estrategia de publicidad que seria mas útil
para el incremento de ventas de un producto.
¿Por qué estudiarla?
Porque los datos estadísticos y las conclusiones obtenidas aplicando metodología
estadística ejercen una profunda influencia en casi todos los campos de la actividad
5|Página
humana. En particular, la estadística invade cada vez más cualquier investigación
relativa a salud pública. Este crecimiento, probablemente relacionado con el interés
por aumentar la credibilidad y confiabilidad de las investigaciones, no garantiza que
en todos los casos la metodología estadística haya sido correctamente utilizada, o
peor aún, que sea válida.
2.-PARTES EN QUE SE DIVIDE LA ESTADISTICA MODERNA PARA SU
ESTUDIO
La estadística se divide en dos grandes ramas de estudio que son: La estadística
descriptiva, la cual se encarga de la recolección, clasificación y descripción de datos
muéstrales o poblacionales, para su interpretación y análisis, que es de la que nos
ocuparemos en este curso; y la estadística matemática o inferencial, que desarrolla
modelos teóricos que se ajusten a una determinada realidad con cierto grado de
confianza. Estas dos ramas no son independientes; por el contrario, son
complementarias y entre ambas dan la suficiente ilustración sobre una posible
realidad futura, con el fin de que quien tenga poder de decisión, tome las medidas
necesarias para transformar ese futuro o para mantener las condiciones existentes.
La estadística descriptiva puede definirse como aquellos métodos que incluyen la
recolección, presentación y caracterización de un conjunto de datos con el fin de
describir apropiadamente las diversas características de ese conjunto de datos
La estadística inferencial puede definirse como aquellos métodos que hacen posible
la estimación de una característica de una población o la toma de una decisión
referente a una población, basándose solo en los resultados de la muestra.
3.-EL METODO CIENTIFICO EN LA ESTADISTICA
Podemos definir Estadística como la ciencia de los datos, El método científico es un
conjunto de principios y procedimientos para la búsqueda sistemática del
conocimiento.
El método científico está compuesto por los siguientes pasos:
1. Formula una teoría (problema).
2. Recoger datos para probar la teoría.
3. Analizar los datos.
4. Interpretar los resultados y tomar una decisión.
6|Página
El método científico es un procedimiento iterativo de aprendizaje. No podemos tener
certeza de la veracidad de las teorías que probemos usando el método científico, eso
es inherente a la ciencia. La ciencia está, por lo tanto, todo el tiempo revisando sus
teorías. La Estadística no es un conjunto de diferentes técnicas aisladas unas de otras,
sino que la Estadística, en conjunto con el método científico, nos entrega un
procedimiento analítico para tomar decisiones.
4.-METODOS PARA LA OBTENCION DE DATOS
Pueden utilizarse varias herramientas básicas para describir y resumir un conjunto
grade de datos. La manera más simple, pero quizás la más significativa, es la serie
ordenada. Se asume que los puntajes de CI de cinco recién graduados de la
Universidad de Podunk son 75,73,91,83 y 80. Una serie ordenada simplemente
enumera tales observaciones en orden ascendente o descendente. Los cinco valores
pueden aparecer como 73,75,80,83,91. La serie ordenada proporciona alguna
agrupación al conjunto de datos; por ejemplo, se puede ver de inmediato que los
valores extremos son 73,91. Sin embargo, la utilidad de una serie ordenada es
limitado.
5.-¿EN QUE CONCISTE EL PRINCIPIO “BEBS” (BASURA ENTRA, BASURA
SALE) O “GIGO” (EN INGLES)?
La frase Basura Entra Basura Sale (GIGO por sus siglas en inglés ‘Garbage In
Garbage Out’) es muy conocida en el ámbito de la programación de computadoras.
Describe el hecho de que el rendimiento de una computadora es tan bueno como su
entrada (su programación o diseño de su sistema operativo). ¿Esto aplica también
para nuestra mente o para nuestro cerebro?
El mejor programa no puede recoger datos sin sentido y producir resultados
coherentes. Desde luego, BEBS se aplica mucho más ampliamente que sólo al campo
de computadoras.
La calidad en el rendimiento de casi todo sistema o proceso depende de la calidad de
información en su entrada.
Si comenzamos a aplicar este orden de ideas a nuestro cerebro, podemos comenzar a
visualizar dos tipos de pensamientos:
Pensamiento Divergente: Se refiere a la capacidad de partir de una idea central y
avanzar hacia muchas ideas.
Pensamiento Convergente: Es la capacidad de partir de muchas ideas (un brain
storming, por ejemplo) y llegar a una sola idea o con conclusión.
7|Página
En los tiempos actuales, ambos tipos de pensamientos son vitales para generar nuevas
ideas e innovaciones en nuestras áreas de trabajo o en nuestros negocios.
Aunado a lo anterior, ciertas investigaciones han llegado a la conclusión de que lo
que pensamos, la forma en que pensamos, y la manera en que pensamos mientras
reflexionamos, cambia materialmente la estructura biológica de nuestro cerebro.
¿Qué significa esto?
Quiere decir que, a diferencia de las computadoras, nosotros (nuestro cerebro),
tenemos la capacidad de modificar el resultado final de, digamos ciertas conductas o
comportamientos que quizá no sean los mejores, sin importar lo que dio origen a esos
comportamientos.
6.-¿COMO RECOLECTAR DATOS?
Existen diferentes métodos mediante los cuales se pueden obtener datos estadísticos.
A continuación, te mencionamos los principales
Información publicada: Los datos estadísticos pueden obtenerse a través de la
recolección de datos originales. La persona u organización que se encarga de
obtenerlos es la fuente primaria, mientras que la persona que compila la información
es la fuente secundaria.
Conoce más de la diferencia entre datos primarios y datos secundarios.
Diseño de un experimento: La experimentación se realiza con un control estricto del
tratamiento que se le ofrece a los participantes del estudio.
Conducción de una encuesta: Este es otro método para obtener datos estadísticos. Se
diseña la encuesta, se recolectan los datos, se editan, se codifican y se tabulan para su
análisis.
Aquí un tabulador de encuestas que te será de gran utilidad.
Realizar un estudio observacional: El investigador observa el comportamiento de los
individuos que participan en el estudio, mientras se encuentran en su entorno natural.
Este proceso puede realizarse de formas diferentes para ayudar en el proceso de toma
de decisiones.
7.-TIPOS DE DATOS ESTADISTICOS
Datos categóricos
Los datos categóricos también conocidos como datos cualitativos, representan
características como el género, el idioma, etc. de una persona. También pueden tomar
8|Página
valores numéricos, por ejemplo: 1 para mujeres y 0 para hombres. Ten en cuenta que
esos números no tienen significado matemático.
Los tipos de datos estadísticos categóricos se clasifican en:
Datos nominales: Otros de los tipos de datos estadísticos son los que tienen valores
nominales que representan unidades discretas y se usan para etiquetar variables que
no tienen un valor cuantitativo.
Estos datos no tienen un orden, aunque cambiara el orden de sus valores, no cambia
su significado.
Datos ordinales: Los datos ordinales representan unidades discretas y ordenadas. Por
lo tanto, es casi lo mismo que los datos nominales, excepto que su orden es
importante.
Las escalas ordinales generalmente, se usan para medir características no numéricas
como la felicidad, la satisfacción del cliente, etc.
Datos numéricos
Estos tipos de datos estadísticos también se conocen como datos cuantitativos, y se
refieren a una medida o recuento. Se clasifican de la siguiente manera:
Datos discretos: Los datos estadísticos son discretos cuando sus valores son distintos
y separados. Es decir, cuando los datos sólo pueden tomar ciertos valores.
Este tipo de datos no se puede medir, pero se pueden contar . Básicamente
representan información que se puede clasificar.
Datos continuos: Los datos continuos representan mediciones y, por lo tanto, sus
valores. no se pueden contar pero se pueden medir. A su vez, estos se clasifican de la
siguiente manera:
Datos de intervalo: Los datos de intervalo representan unidades ordenadas que tienen
la misma diferencia . Por lo tanto, hablamos de datos de intervalo cuando tenemos
una variable que contiene valores numéricos que están ordenados y donde conocemos
las diferencias exactas entre los valores.
El problema con los datos de valores de intervalo es que podemos sumar y restar,
pero no podemos multiplicar, dividir o calcular razones. Debido a que no existe un
cero verdadero, no se pueden aplicar muchas estadísticas descriptivas e inferenciales.
Datos de relación: También son unidades ordenadas que tienen la misma diferencia.
Los datos de relación son los mismos que los valores de intervalo, con la diferencia
de que tienen un cero absoluto.
9|Página
8.-PROPIEDADES QUE DESCRIBEN UNA SERIE NUMERICA DE DATOS
Una variable es numérica cuando el resultado de la observación o medición es un
número.
Se clasifican en:
a) Discretos. La variable sólo puede tomar un cierto conjunto de valores posibles. En
general, aparecen por conteo.
Ejemplo: número de miembros del hogar, número de intervenciones quirúrgicas,
número de casos notificados de una cierta patología.
b) Continuos. Generalmente son el resultado de una medición que se expresa en
unidades. Las mediciones pueden tomar teóricamente un conjunto infinito de valores
posibles dentro de un rango. En la práctica los valores posibles de la variable están
limitados por la precisión del método de medición o por el modo de registro.
Ejemplos: altura, peso, pH, nivel de colesterol en sangre.
La distinción entre datos discretos y continuos es importante para decidir qué método
de análisis estadístico utilizar, ya que hay métodos que suponen que los datos son
continuos.
Consideremos por ejemplo, la variable edad. Edad es continua, pero si se la registra
en
años resulta ser discreta. En estudios con adultos, en que la edad va de 20 a 70 años,
por ejemplo, no hay problemas en tratarla como continua, ya que el número de
valores posibles es muy grande. Pero en el caso de niños en edad preescolar, si la
edad se registra en años debe tratarse como discreta, en tanto que si se la registra en
meses puede tratarse como continua.
Del mismo modo, la variable número de pulsaciones/min. es una variable discreta,
pero se la trata como continua debido al gran número de valores posibles.
Los datos numéricos (discretos o continuos) pueden ser transformados en categóricos
y ser tratados como tales. Aunque esto es correcto no necesariamente es eficiente y
siempre es preferible registrar el valor numérico de la medición, ya que esto permite:
- Analizar la variable como numérica ⇒ Análisis estadístico más simple y más
potente.
- Armar nuevas categorías usando criterios diferentes.
10 | P á g i n a
Sólo en casos especiales es preferible registrar datos numéricos como categóricos,
por
ejemplo, cuando se sabe que la medición es poco precisa (número de cigarrillos
diarios,
número de tazas de café en una semana).
9.-DATOS NO AGRUPADOS, MEDIDAS DE TENDENCIA CENTRAL
para que una calificación tenga significado hay que contar con
elementos de referencia generalmente relacionados con ciertos
criterios estadísticos.
Supóngase que un determinado alumno obtiene 35 puntos en una

prueba de matemática.
Este puntaje, por sí mismo tiene muy poco significado a menos que
podamos conocer el total de puntos que obtiene una persona
promedio al participar en esa prueba, saber cuál es la calificación
menor y mayor que se obtiene, y cuán variadas son esas
calificaciones.
Medidas de tendencia central: Son indicadores estadísticos que

muestran hacía que valor (o valores) se agrupan los datos.
Existen tres medidas comunes para identificar el centro de un

conjunto de datos: la media, mediana y moda. En cada caso, se ubican
alrededor del punto en donde se aglomeran los datos.
11 | P á g i n a
9.1 MEDIA ARITMETICA, MEDIA PONDERADA, MEDIANA, MODA
Media aritmética: Medida de tendencia central usualmente llamada

promedio, se define como la división de la suma de todos los valores
entre el numero de datos.
MEDIANA: Del conjunto de datos obtenidos es el valor que al

organizar los datos en orden ascendente o descenderte a la mitad o
centro de los mismos. La posición que ocupa la mediana puede ser
determinada mediante la siguiente fórmula:
Mediana =X [(n/2) +1/2]
Ejemplo: Dados los siguientes 8 datos ordenados en orden

ascendente: 5,8,8,11,11,11,14,16., encuentra la mediana.
Utilizando la fórmula para ubicar la posición del dato que representa

la mediana indica que:
Mediana = (8/2) +1/2 = 4.5
Por lo que la mediana está ubicada entre el dato 4 y 5; el valor del

dato 4 es “ 11” y del dato 5 es “ 11”, por lo que al sacar el promedio, da
que la mediana de la muestra estudiada es 11.
MODA: Es el dato que ocurre con mayor frecuencia en un conjunto de

elementos estudiados. Del ejemplo anterior donde los datos
recopilados son: 5,8,8,11,11,11,14,16; el dato que ocurre con mayor
frecuencia es el valor 1, siendo este valor la moda.
MEDIA PONDERADA: es una media aritmética, en la cual se considera

a cada uno de los valores de acuerdo con su importancia en el grupo.
Mediana Ponderada
En donde:
X = Observación individual
12 | P á g i n a
Q= el peso o ponderación asignada a cada observación
Medidas de Tendencia Central para datos agrupados
Cuando se trabaja con datos que han sido agrupados en una

distribución de frecuencias, no se sabe con certeza los valores
individuales de cada dato. Por lo que se utilizan métodos alternos
para aproximar los valores de las medidas descriptivas.
10.-COMPARACION ENTRE LA MEDIA, MEDIANA Y MODA (VENTAJAS Y

DESVENTAJA)
MEDIA
Ventajas
 Es la medida de tendencia central más usada.
 Emplea en su cálculo toda la información disponible.
 Se expresa en las mismas unidades que la variable en estudio.
 El promedio se estable en el muestreo.
 Es un valor único.
 Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).
 Se emplea a menudo en cálculos estadísticos posteriores.
 Es útil para llevar a cabo procedimientos estadísticos como la comparación de
medias de varios conjuntos de datos.
 Presenta rigor matemático.
 En la gráfica de frecuencia representa el centro de gravedad.
Desventajas
 Es sensible a los valores extremos.
 No es recomendable emplearla en distribuciones muy asimétricas.
 Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede no
pertenecer al conjunto de valores de la variable.
 Si el conjunto de datos es muy grande puede ser tedioso su cálculo manual.
 No se puede calcular para datos cualitativos.
 No se puede calcular para datos que tengan clases de extremo abierto, tanto
superior como inferior.
MEDIANA
Ventajas:
 Fácil de calcular si el número de observaciones no es muy grande.
 No se ve influenciada por valores extremos, ya que solo influyen los valores
centrales.
13 | P á g i n a
 Fácil de entender.
 Se puede calcular para cualquier tipos de datos cuantitativos, incluso los datos con
clase de extremo abierto.
 Es la medida de tendencia central más representativa en el caso de variables que
solo admiten la escala ordinal.
Desventajas
 No utiliza en su “cálculo” toda la información disponible.
 No pondera cada valor por el número de veces que se ha repetido.
 Hay que ordenar los datos antes de determinarla.
MODA
Ventajas
 No requiere cálculos.
 Puede usarse para datos tanto cuantitativos como cualitativos.
 Fácil de interpretar.
 No se ve influenciada por valores extremos.
 Se puede calcular en clases de extremo abierto.
Desventajas
 Para conjuntos pequeños de datos su valor no tiene casi utilidad, si es que de hecho
existe. Solo tiene significado en el caso de una gran cantidad de datos.
 No utiliza toda la información disponible.
 No siempre existe, si los datos no se repiten.
 En ocasiones, el azar hace que una sola observación no represente el valor más
frecuente del conjunto de datos.
 Difícil de interpretar si los datos tiene 3 o más modas.
11.-12DATOS NO AGRUPADOS,, MEDIDAS DE DISPERSION

Los datos no agrupados son el conjunto de datos que no se ha clasificado y se es
presentada en su forma de aparición en una tabla de datos donde cada valor se
representa de forma individual. Por lo general este conjunto comprende una cantidad
de elementos menor a 30 (n<30) con poca o nula repetición
11.1 RANGO, VARIANZA, DESVIACION ESTANDAR, COEFICIENTE DE
VARIACION
RANGO: El rango de un conjunto de números es la diferencia entre el mayor y el
menor de todos ellos. Hay 2 maneras de expresar ésta medida:
 La diferencia entre los valores mayores y menor.
 Los valores mayor y menor del grupo.
14 | P á g i n a
DESVIACION ESTANDAR: Denota con el símbolo σ o s, dependiendo de la
procedencia del conjunto de datos, es una medida de dispersión para variables de
razón (variables cuantitativas o cantidades racionales) y de intervalo.
Se define como la raíz cuadrada de la varianza de la variable.
Para un mejor entendimiento, se muestran las formulas con las que se llega al
resultado y claro ejemplo para obtener la desviacion estandar.
15 | P á g i n a
VARIANZA: Se refieren a la media aritmética de los cuadrados de las desviaciones
de cada valor respecto de la media aritmética de los datos, por lo que a veces también
se denomina desviación cuadrática media.
Se utilizan cualquiera de las formulas para obtener un resultado, va dependiendo si se
calcula toda una poblacion o solo una muestra de esa poblacion.
Un ejemplo es el siguiente:
12.-EL MANEJO DE GRANDES DATOS CANTIDADES DE DATOS

En Ciencia de Datos, se trata de descubrir cosas y construir conocimiento, lo que
requiere preguntas motivantes sobre el mundo e hipótesis. Y que éstas sean
convertidas en datos coleccionados, estructurados y testeables con métodos
estadísticos. Por ello el ‘Data Scientist’ requiere distintas habilidades. Hace ya unos
años Drew Conway concibió un diagrama de Venn para visualizar su definición de
Científico de Datos o Data Scientist y las tres habilidades esenciales:
 Habilidades para ‘hacking de datos’ (área azul en el diagrama). Para ser un

exitoso “hacker de datos” se requeriría poder manipular archivos de texto en la
línea de comando, comprender operaciones vectorizadas, pensar
algorítmicamente. Simplificando: destrezas que nos permiten obtener datasets
16 | P á g i n a
“limpios”, estructurados, a partir de una masa ingente y a simple vista confusa
de datos (Big Data).
 Conocimiento de matemáticas y estadística (área en colorado). Una vez
conseguidos y limpios los datos, el siguiente paso es extraer contenido de ellos.
Para hacer esto es necesario aplicar métodos estadísticos y matemáticos
apropiados. También requiere saber qué es una regresión de MCO(*) y cómo
interpretarla. El resultado será un modelo. Se exploran grandes cantidades de
datos buscando mejorar un algoritmo que exprese su comportamiento en una
especie de fórmula, que se usará para inferencias o en forma predictiva con
otros datos.
Para Conway el uso de estas dos primeras habilidades converge en lo que se conoce
como “machine learning” que siendo un uso poderoso de los datos, no es todavía
Data Science o Ciencia de Datos. El agregó una habilidad adicional:
 Expertise sustancial (área en amarillo). Un doctorando o estudiante,

investigador, alguien que pasa tiempo adquiriendo sólidas bases de
conocimiento en algún campo de las ciencias (amarillo). Si además desarrolla
habilidades en las áreas de matemática y estadística (herramientas del
investigador científico tradicional) se ubicaría en la intersección de color
anaranjado en el diagrama de Conway.
17 | P á g i n a
13DATOS AGRUPADOS, MEDIDAS DE TENDENCIA CENTRAL
En medidas estadísticas que se usan para describir cómo se puede resumir la
localización de los datos. Ubican e identifican el punto alrededor del cual se centran
los datos. Las más utilizadas son: la media, la mediana y la moda.
MEDIA

Si en una tabla de distribución de frecuencia, con clases, los puntos medios
son: y las respectivas frecuencias son , la media aritmética se
calcula de la siguiente manera:

Donde el número total de observaciones es

MEDIANA

Cuando los datos se encuentran agrupados en una distribución de frecuencia no se
conocen los datos originales, por lo tanto, es necesario estimar la mediana
mediante los siguientes pasos:
1. Calcular el valor
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano).
Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada
es igual o mayor que
3. Aplicando la siguiente fórmula con los valores del intervalo mediano:

donde:

= Límite inferior de la clase de donde se encuentra la mediana
= Total de frecuencias
= Frecuencia acumulada anterior a la clase mediana
= Frecuencia del intervalo mediano
= amplitud del intervalo de clase

18 | P á g i n a
MODA

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con
datos agrupados, se habla de intervalo modal.

Si todos los intervalos tienen la misma amplitud, la moda se calcula por medio
de:

donde:

= Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).
= Frecuencia absoluta del intervalo modal.
= Frecuencia absoluta del intervalo anterior al modal.
= Frecuencia absoluta del intervalo posterior al modal.
= Amplitud de los intervalos.
14.-DATOS AGRUPADOS, MEDIDAS DE DISPERSION

Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.
15.-DATOS AGRUPADOS, MEDIDAS DE POSICION
Las medidas de posición son aquellas en donde puedes dividir los datos en dos partes
iguales, llamada mediana, lo puedes dividir en cuatro partes iguales llamado cuartiles,
en diez partes iguales llamados deciles y en percentiles dividir en 100 partes iguales.
La mediana es una medida de posición con respecto a los datos centrales porque se
divide en dos partes ( 50%) En la siguiente presentación se abordará el concepto de
medidas de posición, así como su uso y el cálculo de la misma para datos no
agrupados y agrupados.
15.1 CUANTILES: CUARTILES, DECILES, PERCENTILES
PERCENTIL(𝑷𝒊): Es una medida de posición que asume 99 valores enumerados
del 1 al 99
19 | P á g i n a
(𝑃1,𝑃2,𝑃3,𝑃4,….,𝑃11, 𝑃12,. . , 𝑃15,…𝑃50,…,𝑃62,….,𝑃75, …,𝑃84,
….,𝑃97,𝑃98,𝑃99 ) que dividen en 100 partes iguales un conjunto de datos
ordenados de menor a mayor. Por ejemplo, el percentil 12 o 𝑃12 es el valor que
acumula por debajo de él un 12% de valores iguales o inferiores a él. El percentil
15 o 𝑃15 es el valor que acumula por de bajode él un 15% de valores iguales o
inferiores a él. En la posición central la ocupa el 𝑃50 que coincide con la mediana
(𝑀𝑒) de los datos.
CUARTIL(𝑸𝒊):Es una medida de posición que asume 3 valores (𝑄1,𝑄2 y 𝑄3 ) que

dividen al conjunto de datos ordenados de menor a mayor en 4 partes iguales. El
Cuartil 1 o 𝑄1 es el valor que acumula por debajo de él un 25% de valores iguales
o inferiores a él. El Cuartil 2 o 𝑄2 es el valor que acumula por debajo de él un
50% de valores iguales o inferiores a él. El Cuartil 3 o 𝑄3 es el valor que acumula
por debajo de él un 75% de valores iguales o inferiores a él. La posición central la
ocupa 𝑄2 que coincide con la mediana (𝑀𝑒) de los datos.
DECIL(𝑫𝒊):
Es una medida de posición que asume 9 valores enumerada del 1 al 9
(𝐷1,𝐷2,𝐷3,𝐷4,𝐷5,𝐷6,𝐷7,𝐷8 y 𝐷9) que dividen al conjunto de datos ordenados de
menor a mayor en 10 partes iguales. Por ejemplo, el Decil 1 o 𝐷1 es el valor que
acumula por debajo de él un 10% de valores iguales o inferiores a él. El Decil 5 o
𝐷5 es el valor que acumula por debajo de él un 50% de valores iguales o inferiores
a él. La posición central la ocupa el 𝐷5 que coincide con la mediana (𝑀𝑒) de los
datos. Haz una recta y ubica los deciles del 1 al 9 con sus respectivos %.
QUINTIL(𝑲𝒊):
Es una medida de posición que asume 4 valores enumerados del 1 al 4 (𝐾1,𝐾2,𝐾3
𝑦,𝐾4) que dividen al conjunto de datos de menor a mayor en 5 partes iguales. El
quintil 𝐾1, 𝐾2, 𝐾3 y 𝐾4 a cumulan por debajo de él un 20%, 40%, 60% y 80%
respectivamente, de valores iguales o inferiores a ellos. Haz una recta y ubica en
ella los quintiles del 1 al 4 con sus respectivos %.
15.2.-RANGO INTERCUARTILICO
En otras palabras, el rango intercuartílico es la diferencia entre el penúltimo y el
primer cuartil de una distribución utilizado en el diagrama de caja. Generalmente
utilizado en el diagrama de caja que utiliza la mediana como medida central.
La forma abreviada de nombrar al rango intercuartílico es RIC o RQ.
20 | P á g i n a
El rango intercuartil utiliza la mediana como medida central. Entonces, el resultado
del rango intercuartil será próximo a la mediana o segundo cuartil (Q2) si hay pocos
valores extremos.
El rango intercuartil está considerado un estadístico robusto por su baja exposición a

valores extremos. Esto es debido a que solo se consideran las observaciones entre el
tercer cuartil y el primer cuartil. Todas las observaciones fuera de ese rango quedan
excluidas del cálculo y, por tanto, solo se tienen en cuenta las observaciones más
cercanas a la mediana, es decir, al segundo cuartil.
La presencia de varios valores extremos entre el primer y el tercer cuartil hará
aumentar mucho el rango intercuartílico y también la mediana, pero a una tasa menor.
Esta situación es poco probable dado que los datos muy extremos tienden a ser poco
comunes.
16.-LAS DISTRIBUCIONES DE FRECUENCIAS, FRECUENCIAS RELATIVAS
Y DE PORCENTAJES
Cuando tenemos una serie de datos, primero hay que organizarlos en forma ordenada.
Los datos agrupados se pueden describir por medio de tablas, graficas y medidas
numéricas.
Para datos no agrupados también podemos someterlos a algunos análisis. Cuando se
tiene un gran número de datos, habrá que distribuirlos en intervalos de clases y
determinar con exactitud el número de elementos pertenecientes a cada uno de estos.
DISTRIBUCIONES DE FRECUENCIA RELATIVA.
La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total de
frecuencias de todas las clases. El resultado se expresa generalmente como
porcentaje. La suma de las frecuencias relativas de todas las clases es 1 o 100%. Una
tabla de distribución de frecuencias relativas o distribución porcentual se obtiene al
sustituir las frecuencias relativas por las frecuencias de las clases. Las gráficas no
cambian.
En la parte vertical de los ejes de coordenadas únicamente pondríamos las
frecuencias relativas.Los gráficos que resultan se llaman histogramas de
frecuencias relativas o histogramas porcentuales y polígonos de frecuencias relativas
o polígonos porcentuales.
DISTRIBUCIONES DE FRECUENCIA ACUMULADA.
Una distribución de frecuencias acumulada está diseñada para mostrar el número o
porcentaje de elementos que son menores que cierto valor especifico o iguales a éste.
21 | P á g i n a
Las distribuciones se pueden convertir fácilmente a distribuciones acumuladas
mediante sumas sucesivas de frecuencias de clase, es decir la frecuencia total de
todos los valores menores que el límite real superior de clase.
17.-LOS HISTOGRAMAS, EL POLIGONO DE FRECUENCIAS O DE
PORCENTAJES Y LA CURVA DE PORCENTAJE ACUMULADO U OJIVA
Un Histograma es la representación gráfica de una tabla de frecuencias. El
histograma puede ser: de frecuencias absolutas, de frecuencias relativas, de
frecuencias absolutas acumuladas y de frecuencias relativas acumuladas.
Más profundamente, el histograma de frecuencias es una representación visual de los
datos en donde se evidencian fundamentalmente tres características: forma,
acumulación o tendencia posicional y dispersión o variabilidad.
Un Polígono de Frecuencia es el nombre que recibe una clase de gráfico que se crea a
partir de un histograma de frecuencia. Los histogramas emplean columnas verticales
para reflejar las frecuencias, los polígonos de frecuencia se forman uniendo los
puntos más altos de cada una de las columnas del Histograma.
Podemos observar que el polígono de frecuencia es la línea roja que une el centro de

cada barra del histograma. Sólo se ha dejado el histograma para una mayor
comprensión del concepto que se desea ilustrar.
Ojivas.
Una Ojiva se utiliza para representar la frecuencia acumulada. Similar al Polígono de
22 | P á g i n a
frecuencia, se forma o se construye uniendo los puntos más altos de cada columna
pero de un Histograma que represente las Frecuencias Acumuladas.
Al estar construido en función de las frecuencias acumuladas permite ver cuántas
observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo
exhibir los números asignados a cada intervalo.
En este caso la Ojiva es la línea azul, pero se ha dejado el Histograma, por dos
razones: (1) Para visualizar un histograma de Frecuencias Acumuladas; y, (2) Para
tener una visión más clara de lo que representa la Ojiva.
En este ejemplo se visualiza claramente lo que se conceptualizó antes, por ejemplo,

se puede ver rápidamente que hay 8 secciones con 39 alumnos o menos.
Cabe destacar que las Ojivas también se pueden hacer a la inversa, comenzando con
la mayor y terminando con la menor frecuencia.
Estos 3 tipos de gráficos son muy útiles y son fáciles de interpretar cuando estamos
trabajando con tablas de frecuencia.
18.-IMPORTANCIA DE LA FORMA DE DATOS
Las medidas de la forma son utilizadas para describir características tales como la
simetría (o asimetría) que presenta la distribución de los datos, o qué tan aplanada o
picuda es la forma de la distribución.
Para cuantificar la simetría de una distribución de datos se utiliza el coeficiente de
sesgo (cs), cuya ecuación es:
n
1
∑
n i=1
( xi −x)
3
cs= 3
s
23 | P á g i n a
En términos generales, se trata de un promedio de las diferencias de las mediciones
de la variable con respecto a la media (𝑋𝑖 − 𝑋̅)3. Dado que las diferencias están
elevadas al cubo, el coeficiente de sesgo puede tener un valor positivo, un valor
negativo o un valor igual a cero.
18.1.-SIMETRICA, ASIMETRICA O SESGADA ¿COMO SE UBICAN LAS
MEDIDAS DE TENDENCIA CENTRAL DEPENDIENDODE LA FORMA?
Un valor positivo del coeficiente de sesgo nos indica que, en el promedio de
diferencias elevadas al cubo, tienen mayor predominancia los términos en donde las
Xi son mayores que 𝑋̅, es decir, tienen mayor peso las diferencias con signo positivo.
Este hecho se manifiesta como una cola de valores a la derecha de la media. Un sesgo
positivo implica la existencia de observaciones con valores altos de la variable en
comparación con la mayoría de las observaciones.
Por el contrario, un sesgo negativo implica que, en el promedio, pesan más los
términos en donde Xi son menores que 𝑋̅, lo que implica una cola de valores a la
izquierda de la media. Así, un coeficiente de sesgo negativo implica la existencia de
observaciones con valores bajos de la variable en comparación con la mayoría de las
observaciones.
Un coeficiente de sesgo igual a cero implica que hay una compensación entre los
términos de diferencias al cubo con valores positivos y con valores negativos que
contribuyen al promedio. En este punto hay que mencionar que una distribución con
coeficiente de sesgo igual a cero puede tomar diferentes formas. Una distribución
simétrica forzosamente tendrá un coeficiente de sesgo igual a cero, pero si una
distribución tiene coeficiente de sesgo igual a cero, no necesariamente tendrá una
forma simétrica. Por otra parte, es pertinente mencionar que en la práctica será difícil
encontrar una distribución de los datos en donde el coeficiente de sesgo cs sea
exactamente igual a cero, pero sí se podrán encontrar coeficientes con valores
“cercanos” a cero, en donde cualitativamente se podría decir que la distribución
exhibe simetría al analizar el histograma correspondiente.
24 | P á g i n a
18.2.-USO DE POLIGONOS PARA COMPARAR GRUPOS DE DATOS
La principal función de una gráfica poligonal es indicar los cambios sufridos por un
fenómeno dentro de un período definido de tiempo o en relación con otro fenómeno
conocido como frecuencia.
De esta manera, es una herramienta útil para comparar el estado de las variables en el
tiempo o en contraposición con otros factores (Lane, 2017).
Algunos ejemplos comunes que pueden ser evidenciados en la cotidianidad incluyen

el análisis de la variación de precios de ciertos productos con el paso de los años, el
cambio en el peso corporal, el incremento del salario mínimo de un país, y en
general.
En términos generales, una gráfica poligonal se utiliza cuando se quiere representar

visualmente la variación de un fenómeno en el tiempo, con el objetivo de poder
establecer comparaciones cuantitativas del mismo.
Esta gráfica se deriva en muchos casos de un histograma en cuanto a que los puntos
que se marcan en el plano cartesiano corresponden a aquellos que abarcan las barras
del histograma.
Representación gráfica
A diferencia del histograma, la gráfica poligonal no utiliza barras de diferentes alturas

para marcar el cambio de las variables dentro de un tiempo definido.
La gráfica utiliza segmentos de recta que ascienden o descienden dentro del plano
cartesiano, dependiendo del valor que se les dé a los puntos que marcan el cambio en
el comportamiento de las variables tanto en el eje X como en el Y.
Gracias a esta particularidad, la gráfica poligonal recibe su nombre, ya que la figura

resultante de la unión de los puntos con segmentos de recta dentro del plano
cartesiano, es un polígono con segmentos rectos consecutivos.
Una particularidad importante que debe ser tenida en cuenta cuando se quiere
representar una gráfica poligonal, es que tanto las variables en el eje X como las
25 | P á g i n a
frecuencias en el eje Y deben ser marcadas con el título de aquello que están
midiendo.
De esta manera, la lectura de las variables cuantitativas continuas incluidas en la

gráfica, es posible.
Por otro lado, para poder hacer un gráfico poligonal, deben ser agregados dos
intervalos en los extremos, cada uno de ellos de igual tamaño y con una frecuencia
equivalente a cero.
De esta manera, se toma el límite mayor y menor de la variable analizada y cada uno
se divide por dos, para determinar el lugar en dónde debe iniciar y terminar la línea
de la gráfica poligonal (Xiwhanoki, 2012).
Finalmente, la ubicación de los puntos de la gráfica dependerá de los datos que

previamente se tenga tanto de la variable como de la frecuencia.
Estos datos se deben organizar en parejas cuya ubicación dentro del plano cartesiano
será representada por un punto. Para formar el gráfico poligonal, los puntos deben ser
unidos en sentido de izquierda a derecha
Ejemplos de gráficas poligonales
Ejemplo 1
En un grupo de 400 estudiantes, la altura de los mismos se expresa en la siguiente

tabla:
La gráfica poligonal de esta tabla sería la siguiente:
26 | P á g i n a
La estatura de los estudiantes está representada en el eje X o eje horizontal en una
escala definida en cm como su título lo indica, cuyo valor incrementa cada cinco
unidades.
Por otro lado, el número de estudiantes está representado en el eje Y o eje vertical en
una escala que aumenta su valor cada 20 unidades.
Las barras rectangulares dentro de esta gráfica corresponden a las de un histograma.

Sin embargo, dentro de la gráfica poligonal estas barras se utilizan para representar el
ancho del intervalo de clase que abarca cada variable, y su altura marca la frecuencia
correspondiente a cada uno de estos intervalos (ByJu’s, 2016).
18.3.-MEDIDAS DE FORMA: CURTOSIS Y ASIMETRIA

el coeficiente de curtosis (ck) es la medida que define qué tan
pronunciada es la punta (o pico) en una distribución. Su significado se relaciona con
la
distribución normal, cuyo coeficiente de curtosis es cero. La expresión matemática
para
el ck es:
n
1
∑ ( x −x )4
n i=1 i
ck = −3
s4
El -3 se agrega para hacer que la curtosis de la distribución normal sea igual a cero.
Para una distribución dada, la curva normal con una media y desviación estándar
iguales a las de la distribución para la que se calcula la curtosis, sirve como patrón de
referencia. A una distribución con ck = 0 (distribución normal) se le denomina
mesocúrtica. A una distribución en donde el ck > 0 se le denomina como leptocúrtica,
27 | P á g i n a
lo que implica que es más puntiaguda y con colas más anchas que la distribución
normal de referencia. Finalmente, a una distribución más aplanada y con colas menos
anchas que las de las de la distribución normal de referencia se le denomina
platocúrtica y tiene un ck < 0
19.-TEOREMA DE CHEBYSHEV
La desigualdad de Chebyshev es un teorema utilizado en estadística que proporciona
una estimación conservadora (intervalo de confianza) de la probabilidad de que una
variable aleatoria con varianza finita se sitúe a una cierta distancia de su esperanza
matemática o de su media.
Su expresión formal es la siguiente:
X = Valor estimado
µ = Esperanza matemática del valor estimado
Ϭ = Desviación típica del valor esperado
k = Número de desviaciones típicas
Partiendo de esta expresión general y desarrollando la parte que queda dentro del
valor absoluto tendríamos lo siguiente:
28 | P á g i n a
Si prestamos atención a la expresión anterior, se aprecia que la parte de la izquierda
no es más es un intervalo de confianza. Este nos ofrece tanto una cota inferior, como
una superior para el valor estimado. Por lo tanto, la desigualdad de Chebyshev nos
dice la probabilidad mínima de que el parámetro poblacional se encuentre dentro de
una determinada cantidad de desviaciones típicas por encima o por debajo de su
media. O dicho de otra manera, nos da la probabilidad de que de que el parámetro
poblacional se encuentre dentro de ese intervalo de confianza.
La desigualdad de Chebyshev proporciona cotas aproximadas para el valor estimado.

A pesar de tener cierto grado de imprecisión, es un teorema bastante útil dado que se
puede aplicar a un amplio abanico de variables aleatorias independientemente de sus
distribuciones. La única restricción para poder utilizar esta desigualdad es que k tiene
que ser mayor que 1 (k>1).
20.-GRAFICAS PARA DATOS CUALITATIVOS O CATEGORICOS

Los gráficos más usuales para representar variables de tipo nominal son los siguientes: Diagramas de
barras: Se representa en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o las
frecuencias relativas. Si se intentan comparar varias poblaciones entre sí, usando el diagrama, existen otras
modalidades, como las mostradas en la figura 2. Cuando los tamaños de las dos poblaciones son diferentes,
es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas.
20.1.-GRAFICA DE BARRAS Y GRAFICA DE PASTEL
29 | P á g i n a
MAPA CONCEPTUAL DE ESTADISTICA
30 | P á g i n a
CONCLUSION
31 | P á g i n a
La Estadística es una ciencia matemática que se utiliza para describir, analizar e
interpretar ciertas características de un conjunto de individuos llamado población.
Cuando nos referimos a muestra y población hablamos de conceptos relativos pero
estrechamente ligados. Una población es un todo y una muestra es una fracción o
segmento de ese todo.
Podemos dividir la estadística en dos ramas; la estadística descriptiva, que se

dedica a los métodos de recolección, descripción, visualización y resumen de datos
originados a partir de los fenómenos en estudio; y la estadística inferencial, que se
dedica a la generación de los modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión.
La estadística trata en primer lugar, de acumular la masa de datos numéricos

provenientes de la observación de multitud de fenómenos, procesándolos de forma
razonable. Mediante la teoría de la probabilidad analiza y explora la estructura
matemática subyacente al fenómeno del que estos datos provienen y, trata de sacar
conclusiones y predicciones que ayuden al mejor aprovechamiento del fenómeno.
32 | P á g i n a
FUENTES DE INFORMACIONBIBLIOGRAFICA Y/O DIGITAL
CONSULTADAS
 U.S. Department of Health and Human Services. (2000, 29 agosto). Módulo 4:
Métodos de Recaudación de Información - Sección 2:1 | ORI - The Office of
Research Integrity. Research Integrity. https://ori.hhs.gov/m%C3%B3dulo-4-m
%C3%A9todos-de-recaudaci%C3%B3n-de-informaci%C3%B3n-secci
%C3%B3n-2-1
 Ortega, C. (2021, 19 agosto). ¿Cuáles son los tipos de datos estadísticos?
QuestionPro. https://www.questionpro.com/blog/es/tipos-de-datos-estadisticos/
 L. (2001, 1 marzo). ESTADISTICA DESCRIPTIVA. PDF.
https://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo
%20descriptiva.pdf
 Skcp.588, F. L. D. E. B. (2020, 15 febrero). MEDIDAS DE TENDENCIA
CENTRAL PARA DATOS NO AGRUPADOS. issuu.
https://issuu.com/skcp.588/docs/estadistica-convertido/s/10217360
 WORDPRESS. (2014, 5 noviembre). Ventajas y desventajas,. «Estadística
Descriptíva». https://estadisticassandmary.wordpress.com/ventajas-y-
desventajas/
 Quevedo, F. (2011, 2 marzo). Medidas de tendencia central y dispersión -
Medwave. MEDWAVE.
https://www.medwave.cl/link.cgi/Medwave/Series/MBE04/4934
 ARAVENA TIZANO, J. E. (2019, 6 abril). Estadistica. PDF.
http://www.liceooscarcastro.cl/A-2/images/CORMUN_ESTUDIA/CURSOS/1
%C2%B0medio/03Matematicas/SEM02/MAT_1MED_CLAS_SEM02.pdf
 Rodó, P. (2021, 12 enero). Rango intercuartílico. Economipedia.
https://economipedia.com/definiciones/rango-intercuartilico.html
 Pascuzzo, A., & Perfil, V. T. M. (2004, 15 junio). Histogramas, Polígonos de
Frecuencia y Ojivas. BLOGGER.
http://aldanalisis.blogspot.com/2014/04/histogramas-poligonos-de-frecuencia-
y.html
 Sanjuán, F. J. M. (2021, 3 marzo). Desigualdad de Chebyshev. Economipedia.
https://economipedia.com/definiciones/desiguladad-chebyshev-teorema.html
 A.N.O.N.I.M.O. (2007, 11 junio). Representaciones graficas. PDF.
http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/EDescrip/tema2.pdf
 PORRAS VELAZQUEZ, G. A. (2004, 17 septiembre). Medidas de
Tendencias. PDF.
https://centrogeo.repositorioinstitucional.mx/jspui/bitstream/1012/161/1/17-
33 | P á g i n a
Recordando%20las%20Medidas%20de%20Tendencia%20Central%2C%20de
%20Dispersi%C3%B3n%20y%20de%20la%20Forma%20-
%20%20Diplomado%20en%20An%C3%A1lisis%20de%20Informaci
%C3%B3n%20Geoespacial.pdf
 Jervis, T. M. (2019, 29 octubre). gráfica poligonal. Lifeder.
https://www.lifeder.com/grafica-poligonal/
 gobierno abierto. (2016, 15 diciembre). El Manejo de los Grandes Datos. El
Data Scientist. Parte I. – Asociación Gobierno Abierto. agaargentina.
https://www.agaargentina.org/2016/12/15/el-manejo-de-los-grandes-datos-el-
data-scientist-parte-i/
 REVISTA EUREKA. (2009, 6 enero). MÉTODO CIENTÍFICO DE
INVESTIGACIÓN ESTADÍSTICA. PDF.
https://www.redalyc.org/pdf/920/92012998004.pdf
NOMBRE Y URL DE 3 VIDEOS CONSULTADOS EN YOUTUBE SOBRE

CONTENIDO DEL TEMA
 ACADEMIA INTERNET. (2015, 11 febrero). Estadística (curso completo),
tabla de frecuencias, media mediana y moda [Vídeo]. YouTube.
https://www.youtube.com/watch?v=zAGn--QNmg8
 Profe Jaime. (2020, 25 mayo). Estadística (Curso completo) Tabla de
frecuencias, media, mediana y moda. | Profe Jaime R. [Vídeo]. YouTube.
https://www.youtube.com/watch?v=-dAt9V-WlgE
 Matemática Canal luvicon. (2019, 21 julio). APRENDE ESTADÍSTICA
DESDE CERO. Datos agrupados, tabla de frecuencias. Vídeo 135 [Vídeo].
YouTube. https://www.youtube.com/watch?v=Z6m36y6B8ag
34 | P á g i n a

MI-3 - Mas Sanchez Juan Alonso - Conceptos - Tema 1

Cargado por

Copyright:

Formatos disponibles

MI-3 - Mas Sanchez Juan Alonso - Conceptos - Tema 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

MI-3 - Mas Sanchez Juan Alonso - Conceptos - Tema 1

Cargado por

Copyright:

Formatos disponibles

INSTITUTO TECNOLOGICO DE CAMPECHE

NÚM.. Y NOMBRE DEL TRABAJO:

NÚM. Y NOMBRE DE LA UNIDAD:

La Estadística es una disciplina que utiliza recursos matemáticos para organizar y

En este caso la estadística describe la muestra en términos de datos organizados y

Supóngase que un determinado alumno obtiene 35 puntos en una

Medidas de tendencia central: Son indicadores estadísticos que

Existen tres medidas comunes para identificar el centro de un

Media aritmética: Medida de tendencia central usualmente llamada

MEDIANA: Del conjunto de datos obtenidos es el valor que al

Mediana =X [(n/2) +1/2]

Ejemplo: Dados los siguientes 8 datos ordenados en orden

Utilizando la fórmula para ubicar la posición del dato que representa

Mediana = (8/2) +1/2 = 4.5

Por lo que la mediana está ubicada entre el dato 4 y 5; el valor del

MODA: Es el dato que ocurre con mayor frecuencia en un conjunto de

MEDIA PONDERADA: es una media aritmética, en la cual se considera

Medidas de Tendencia Central para datos agrupados

Cuando se trabaja con datos que han sido agrupados en una

10.-COMPARACION ENTRE LA MEDIA, MEDIANA Y MODA (VENTAJAS Y

11.-12DATOS NO AGRUPADOS,, MEDIDAS DE DISPERSION

12.-EL MANEJO DE GRANDES DATOS CANTIDADES DE DATOS

 Habilidades para ‘hacking de datos’ (área azul en el diagrama). Para ser un

 Expertise sustancial (área en amarillo). Un doctorando o estudiante,

14.-DATOS AGRUPADOS, MEDIDAS DE DISPERSION

CUARTIL(𝑸𝒊):Es una medida de posición que asume 3 valores (𝑄1,𝑄2 y 𝑄3 ) que

El rango intercuartil está considerado un estadístico robusto por su baja exposición a

Podemos observar que el polígono de frecuencia es la línea roja que une el centro de

En este ejemplo se visualiza claramente lo que se conceptualizó antes, por ejemplo,

Algunos ejemplos comunes que pueden ser evidenciados en la cotidianidad incluyen

En términos generales, una gráfica poligonal se utiliza cuando se quiere representar

A diferencia del histograma, la gráfica poligonal no utiliza barras de diferentes alturas

Gracias a esta particularidad, la gráfica poligonal recibe su nombre, ya que la figura

De esta manera, la lectura de las variables cuantitativas continuas incluidas en la

Finalmente, la ubicación de los puntos de la gráfica dependerá de los datos que

Ejemplos de gráficas poligonales

En un grupo de 400 estudiantes, la altura de los mismos se expresa en la siguiente

La gráfica poligonal de esta tabla sería la siguiente:

Las barras rectangulares dentro de esta gráfica corresponden a las de un histograma.

18.3.-MEDIDAS DE FORMA: CURTOSIS Y ASIMETRIA

X = Valor estimado

µ = Esperanza matemática del valor estimado

Ϭ = Desviación típica del valor esperado

k = Número de desviaciones típicas

La desigualdad de Chebyshev proporciona cotas aproximadas para el valor estimado.

20.-GRAFICAS PARA DATOS CUALITATIVOS O CATEGORICOS

20.1.-GRAFICA DE BARRAS Y GRAFICA DE PASTEL

Podemos dividir la estadística en dos ramas; la estadística descriptiva, que se

La estadística trata en primer lugar, de acumular la masa de datos numéricos

NOMBRE Y URL DE 3 VIDEOS CONSULTADOS EN YOUTUBE SOBRE

También podría gustarte