TEMA9

BLOQUE IV
INTRODUCCIÓN A LA
QUIMIOMETRÍA
-TEMA 9: Tratamiento de datos en Química Analítica

- TEMA 10: Herramientas para asegurar la comparabilidad
de datos analíticos
- TEMA 11: Calibración metodológica univariante
TEMA 9: TRATAMIENTO DE
DATOS EN QUÍMICA ANALÍTICA
- Concepto y finalidad de la quimiometría
- Quimiometría y proceso analítico
- Concepto de población y muestra
- Tipos de error
- Distribución de probabilidad normal
- Distribución muestral de la media
- Intervalo de confianza
- Expresión de resultados
CONCEPTO Y FINALIDAD DE LA QUIMIOMETRÍA
QUÍMICA ANALÍTICA ESTADÍSTICA
QUIMIOMETRÍA
Quimiometría Química
Biometría Biología
Sociometría Sociología
Econometría Economía
Psicometría Psicología
Prof. Massart (1997)
Disciplina química que utiliza la matemática, la estadística y la lógica

formal para diseñar o seleccionar procedimientos experimentales
óptimos, proporcionar la máxima información química relevante a partir
del análisis de datos químicos y obtener conocimientos a partir de
sistemas químicos.
QUIMIOMETRÍA Y PROCESO ANALÍTICO
La quimiometría mejora el rendimiento del proceso analítico en
todas sus etapas y asegura la calidad de los resultados
DEFINICIÓN DE PROBLEMA
DESARROLLO
MÉTODO
Diseño de experimentos
OPTIMIZACIÓN
MUESTREO Representativo
MEDIDA
TRATAMIENTO DE LA MUESTRA Y MEDIDA

INTERPRETACIÓN
Herramientas para
OBTENCIÓN Y TRATAMIENTO DE DATOS asegurar la calidad de
los datos
DATOS
Herramientas para
INTERPRETACIÓN DE RESULTADOS * interpretar los
resultados
DISEÑO DE EXPERIMENTOS
Condiciones de extracción Bradford

Experimento
Disolvente Temperatura Tiempo [Proteínas]
(% EtOH) (oC) (min) (g/100 g bagazo) Superficie de Respuesta Estimada
Time=10,0
1 50 90 10 0,77 ± 0,08
2 100 155 10 0,36 ± 0,03
3 50 155 17 2,2 ± 0,1
4 0 155 10 0,88 ± 0,04
380
5 0 90 3 0,20 ± 0,02
6 50 90 10 0,77 ± 0,01
4,7% EtOH
280
7 50 90 10 0,83 ± 0,08 155 ºC
Bradford
8 0 25 10 0,13 ± 0,02 10 min 180
9 100 90 3 0,30 ± 0,02
10 50 90 10 0,83 ± 0,07 5 ciclos 80
160
11 50 155 3 1,10 ± 0,03 -20 120
80
12 50 25 17 0,34 ± 0,04 0 20 40
40 60 Temperature
13 50 90 10 0,79 ± 0,05 80 100 0
14 100 25 10 0,26 ± 0,02 Solvent (EtOH)
15 100 90 17 0,30 ± 0,06

16 0 90 17 0,20 ± 0,02
17 50 25 3 0,31 ± 0,02
CONCEPTO DE POBLACIÓN Y MUESTRA
Población: conjunto ilimitado de resultados de características comunes. A
veces se considera que la población es un número finito si este es
suficientemente elevado.
Muestra de población: se refiere a un pequeño número de resultados que debe

ser representativo de la población. El objetivo del análisis químico es el
conocimiento de la población a través del estudio de la muestra.
Ante la inseguridad de que la muestra sea representativa de la población,

las conclusiones se expresaran en términos de probabilidad
PARÁMETROS QUE DEFINEN LA POBLACIÓN Y FORMA DE ESTIMARLOS
μ: media de la población. En ausencia de errores se corresponderá con el

valor verdadero. La estimación de “μ” a partir de un número reducido de datos
(muestra de población) es la media ( ). x
σ: desviación estándar de la población. La estimación de σ a partir de un
número reducido de datos (muestra de población) es la desviación estándar
(s).
Descriptores de una población
N
Estimación tendencia
 xi
N
 ( xi   ) 2
 i 1  i 1
dispersión
Estimación
N N
central
Descriptores de una muestra de población

n n
x i  i
( x  x ) 2
x i 1 s i 1
n 1
n
n = número reducido de datos

N = número de datos de la población
TIPOS DE ERROR
No existen resultados cuantitativos de interés si no van acompañados
de alguna estimación de los errores inherentes a los mismos
Errores groseros o accidentales: errores que son tan importantes y

evidentes que obligan a desechar la medida y volverla a repetir.
Errores aleatorios: son errores debidos al azar y, por tanto, suelen

mostrar una distribución normal PRECISIÓN
Errores sistemáticos: no dependen del azar y por tanto no muestran

una distribución normal SESGO
Error total = Error sistemático + Error aleatorio

Diferenciación entre error sistemático y error aleatorio
Cuatro estudiantes realizan cada uno un mismo análisis en el que se

valoran 10.00 mL de NaOH 0.1 M con HCl 0.1 M. Cada estudiante repite el
experimento cinco veces y los resultados obtenidos son:
Estudiante Resultados Media

A 10.08 10.11 10.09 10.10 10.12 10.10
B 9.88 10.14 10.02 9.80 10.21 10.01
C 10.19 9.79 9.69 10.05 9.78 9.90
D 10.04 9.98 10.02 9.97 10.04 10.01
EA ES EA ES
10.00 10.00
A •••
••  C • •• • •  
9.70 9.80 9.90 10.10 10.20 10.30 9.70 9.80 9.90 10.10 10.20 10.30
10.00 10.00
B •• •• •  D • •• 
9.70 9.80 9.90 10.10 10.20 10.30 9.70 9.80 9.90 10.10 10.20 10.30
Parámetros para estimar el sesgo
XR = valor aceptado
Error (absoluto) = x- XR
x = valor central
Error (relativo) = 100 ( x - XR) / XR
Parámetros para estimar la precisión

N n
 ( xi   ) 2
 i
( x  x ) 2
 i 1 s i 1
N n 1
Para una serie de datos grande (> 20) Para una seria de datos pequeña (< 20)
Otros parámetros para estimar la precisión (dispersión)

Varianza = el cuadrado de la desviación estándar, s2 o σ2
Desviación estándar relativa DER/RSD (%) = 100 σ / µ ≈ 100 s /x

Relación de los errores sistemáticos y aleatorios con la exactitud y la
precisión
Definición Exactitud (IUPAC (1998) e ISO (1993))
Mide el grado de concordancia entre el resultado de una medida y el

valor real del mesurando (valor de referencia aceptado del analito).
Definición Precisión (IUPAC (1998) e ISO (1994))
Grado de concordancia entre los resultados de ensayos independientes

obtenidos en unas condiciones bien definidas.
La precisión describe los errores aleatorios, el sesgo describe

los errores sistemáticos y la exactitud, como grado de
proximidad entre el valor de una medida y el valor verdadero,
incorpora ambos tipos de error (aleatorios y sistemáticos)
Errores aleatorios Errores sistemáticos
PRECISIÓN EXACTITUD SESGO
A B
Baja precisión + sesgo Alta precisión + mucho sesgo

→ medida poco exacta → medida muy poco exacta
C D
Baja precisión + no sesgo Alta precisión + no sesgo

→ medida exacta → medida muy exacta
DISTRIBUCIÓN DE PROBABILIDAD NORMAL
La distribución de los resultados obtenidos sobre una población se
obtiene al representar la frecuencia de las medidas en un histograma 
la forma de la distribución afecta al tipo de tests estadísticos que se
pueden utilizar.
Resultados de 50 determinaciones de concentración de ión nitrato (μg/mL)
x
A partir de los resultados que se muestran en la siguiente tabla de frecuencia,
dibujar el histograma
Resultado 85 86 87 88 89 90 91 92 93
Frec. Resulta. 10 5 15 41 60 51 27 12 6
Número total de medidas: 227

Solo puede aplicarse el método estadístico si la muestra presenta una
distribución de probabilidad normal, es decir, si los datos están
dispuesto de forma simétrica alrededor de un valor central que tiene la
máxima frecuencia
MUESTRA POBLACIÓN
Función de errores de Laplace-Gauss

DISTRIBUCIÓN DE
PROBABILIDAD
NORMAL
Comprobación de que un grupo
Histograma de datos procede de una
distribución normal:
6 representando los datos de
5 frecuencia acumulada (%) en un
papel de probabilidad normal
frecuencia
4
3
2
1
0
0.2 0.25 0.3 0.35 0.4 0.45
Concentración Pb
Gráficos → Gráficos exploratorios →

Gráfico probabilidad normal/histograma
Descripción → Datos numéricos →

análisis de una variable → Gráfico de
probabilidad normal/histograma
(Descripción → datos numéricos → análisis de una variable → resumen estadístico)
Resumen Estadístico para Col_1
Recuento 50
Promedio 0,4996
Mediana 0,5
Desviación Estándar 0,0162832
Coeficiente de Variación 3,25925%
Mínimo 0,46
Máximo 0,53
Rango 0,07
Sesgo Estandarizado -0,744915
Curtosis Estandarizada -0,34417
El StatAdvisor
Esta tabla muestra los estadísticos de resumen para Col_1. Incluye medidas de tendencia central,
medidas de variabilidad y medidas de forma.
De particular interés aquí son el sesgo estandarizado y la curtosis estandarizada, las cuales pueden
utilizarse para determinar si la muestra proviene de una distribución normal. Valores de estos
estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que
tendería a invalidar cualquier prueba estadística con referencia a la desviación estándar.
En este caso, el valor del sesgo estandarizado se encuentra dentro del rango esperado para datos
provenientes una distribución normal.
El valor de curtosis estandarizada se encuentra dentro del rango esperado para datos provenientes de
una distribución normal.
Parámetros característicos de una distribución de probabilidad normal
Asimetría o sesgo: Es un indicador del grado de asimetría de una distribución

de probabilidad.
Sesgo/asimetría = 0
Distribución normal
Sesgo negativo Sesgo positivo
Una distribución de probabilidad normal es simétrica, es decir, los datos deben

ser simétricos en torno a la media y no debe observarse sesgo (la media de los
datos debe coincidir con la mediana).
Una distribución de probabilidad normal debe presentar el mismo número de

datos a ambos lados del valor medio, es decir, debe haber el mismo número de
desviaciones positivas que negativas
Curtosis: Es una medida de la forma o apuntamiento de las distribuciones. La
curtosis da información a cerca de la frecuencia de datos alrededor de la
media o, lo que es lo mismo, de cuan puntiaguda es una distribución.
Coeficiente de curtosis: <<< 0 → platicúrtica
= 0 → mesocúrtica Distribución normal
>>> 0 → leptocúrtica
Una distribución de probabilidad normal debe presentar

un coeficiente de curtosis lo más cercano a “0”
Características de una distribución de probabilidad normal
1. En este tipo de distribución, los resultados están distribuidos

simétricamente alrededor del valor central.
2. La probabilidad de encontrar una medida

cualquiera dentro de unos límites cualesquiera, x1 y
x2, es igual al área que se encuentra bajo la curva.
3. Efecto de la
magnitud de los errores
aleatorios.
4. Efecto de la
3 3 presencia de errores
sistemáticos (µ ≠ valor
real).
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Si de una población definida por “μ” y “σ” se toman diversos grupos de
muestras todos ellos de “n” observaciones y se halla la media de cada grupo
se tienen una nueva distribución cuya media es la misma que la media de la
población pero cuya desviación estándar no lo es (es menor) y se denomina
error estándar de la media:

error estándar de la media 
n
¿Cuáles son las ventajas de trabajar con la distribución muestral de la

media?
- La precisión analítica se puede mejorar al aumentar el número de

medidas: menor error estándar.
- Aún cuando la población original no esté distribuida normalmente, la

distribución de la media muestral tiende a mostrar una distribución
normal al aumentar “n”. Teorema del límite central
Ejemplo 1 :
Se quiere determinar la concentración de

Ca en una leche por EAA y para ello se
preparan 10 muestras que dan lugar a 10
determinaciones del contenido de Ca en la
leche. Sin embargo, cada una de estas
medidas es a la vez la medida de 5
LA DISTRIBUCIÓN DE LAS MEDIAS
medidas que ha hecho el equipo (las
TIENE UNA DISPERSIÓN MENOR QUE
muestras se han medido por
LA DISTRIBUCIÓN DE LOS DATOS DE
quintuplicado), lo que hace un total de 50
PARTIDA
determinaciones.
- Cada una de las 10 medidas es una

media muestral (DE 5 MEDIDAS).
- La distribución de las medias muestrales

está más centrada (menos dispersa) que la
distribución de los datos originales.
Ejemplo 2: Determinación de concentración de ión nitrato (μg/mL)
Media = 0.4996
Desviación estándar = 0.0164
0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486
Media = 0.4996
Desviación estándar = 0.0066
Las medias obtenidas (medias muestrales) se encuentran más agrupadas

entre sí que la medida originales (la desviación estándar es menor que la de
los datos originales)
INTERVALO DE CONFIANZA
Intervalo de valores que en
ausencia de errores
Intervalo de confianza = x sistemáticos debería
incluir al valor verdadero
Límites de confianza
x
Amplitud del intervalo
Precisión de Número de Nivel de certeza (z) que

las medidas medidas queramos tener
Desviación n Cuanto mayor sea la amplitud del

estándar intervalo, mayor será la certeza
(σ o s) de que el valor esté incluido
Nivel de certeza (z)
3 3
EXPRESIÓN DE RESULTADOS
Utilizando medias

VALOR VERDADERO  µ ±zσ muestrales
z( )
n
Si se dispone de una media muestral de “n > 50” medidas:
s x  1.96 (
s
) Certeza del 95%
xz( ) s
n
n x  2.58 ( ) Certeza del 99%

n
Cuantas más probabilidades de acierto queramos más se deberá

ensanchar el intervalo de confianza para garantizar que el verdadero
valor quede incluido
s
Intervalo de confianza de muestra grande (n > 50): xz( )
n
s
Intervalo de confianza de muestra pequeña (n < 50) : x  t n1 ( )
n
grados de libertad
NC
α
Nivel de significación (α): probabilidad de que el intervalo de confianza
no incluya al valor verdadero o riesgo de que el valor verdadero no
esté incluido en el intervalo de confianza (en tanto por 1).
Nivel de confianza (NC): probabilidad de encontrar el valor verdadero

dentro del intervalo de confianza (en tanto por 100)
NC NC
   
NC (%) = (1-α) x 100
Si el valor verdadero no se encuentra dentro del intervalo

de confianza es posible afirmar que además de errores
aleatorios, existen errores sistemáticos
Se determinó el contenido de ión sodio de una muestra de orina utilizando un
electrodo selectivo de iones, obteniéndose los siguientes valores: 102, 97, 99,
98, 101, 106 mM. ¿Cuáles son los límites de confianza al 95% y 99%, para la
concentración de ión sodio?
Media = 100.5 mM
S = 3.27 mM
Datos n = 6 (5 g.l.)
t5 (95%) = 2.57
t5 (99%) = 4.03
Límites de confianza al 95%: 100.5 ± 2.57 x 3.27 / √6 = 100.5 ± 3.4 mM

100 ± 4 mM
Límites de confianza al 99%: 100.5 ± 4.03 x 3.27 / √6 = 100.5 ± 5.4 mM

100 ± 6 mM
- El intervalo de confianza tendrá una sola cifra significativa (se pueden llegar a admitir 2).
- El intervalo de confianza se redondea por exceso.
- El valor medio se redondea siguiendo las reglas de redondeo.

TEMA9

Cargado por

Copyright:

Formatos disponibles

TEMA9

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

TEMA9

Cargado por

Copyright:

Formatos disponibles

BLOQUE IV

-TEMA 9: Tratamiento de datos en Química Analítica

QUÍMICA ANALÍTICA ESTADÍSTICA

Prof. Massart (1997)

Disciplina química que utiliza la matemática, la estadística y la lógica

TRATAMIENTO DE LA MUESTRA Y MEDIDA

Condiciones de extracción Bradford

14 100 25 10 0,26 ± 0,02 Solvent (EtOH)

15 100 90 17 0,30 ± 0,06

Muestra de población: se refiere a un pequeño número de resultados que debe

Ante la inseguridad de que la muestra sea representativa de la población,

PARÁMETROS QUE DEFINEN LA POBLACIÓN Y FORMA DE ESTIMARLOS

μ: media de la población. En ausencia de errores se corresponderá con el

Descriptores de una muestra de población

n = número reducido de datos

Errores groseros o accidentales: errores que son tan importantes y

Errores aleatorios: son errores debidos al azar y, por tanto, suelen

Errores sistemáticos: no dependen del azar y por tanto no muestran

Error total = Error sistemático + Error aleatorio

Cuatro estudiantes realizan cada uno un mismo análisis en el que se

Estudiante Resultados Media

Error (relativo) = 100 ( x - XR) / XR

Parámetros para estimar la precisión

Otros parámetros para estimar la precisión (dispersión)

Desviación estándar relativa DER/RSD (%) = 100 σ / µ ≈ 100 s /x

Definición Exactitud (IUPAC (1998) e ISO (1993))

Mide el grado de concordancia entre el resultado de una medida y el

Definición Precisión (IUPAC (1998) e ISO (1994))

Grado de concordancia entre los resultados de ensayos independientes

La precisión describe los errores aleatorios, el sesgo describe

PRECISIÓN EXACTITUD SESGO

Baja precisión + sesgo Alta precisión + mucho sesgo

Baja precisión + no sesgo Alta precisión + no sesgo

Número total de medidas: 227

Función de errores de Laplace-Gauss

Gráficos → Gráficos exploratorios →

Descripción → Datos numéricos →

Asimetría o sesgo: Es un indicador del grado de asimetría de una distribución

Sesgo negativo Sesgo positivo

Una distribución de probabilidad normal es simétrica, es decir, los datos deben

Una distribución de probabilidad normal debe presentar el mismo número de

Coeficiente de curtosis: <<< 0 → platicúrtica

= 0 → mesocúrtica Distribución normal

Una distribución de probabilidad normal debe presentar

1. En este tipo de distribución, los resultados están distribuidos

2. La probabilidad de encontrar una medida

¿Cuáles son las ventajas de trabajar con la distribución muestral de la

- La precisión analítica se puede mejorar al aumentar el número de

- Aún cuando la población original no esté distribuida normalmente, la

Se quiere determinar la concentración de

- Cada una de las 10 medidas es una

- La distribución de las medias muestrales

Las medias obtenidas (medias muestrales) se encuentran más agrupadas

Precisión de Número de Nivel de certeza (z) que

Desviación n Cuanto mayor sea la amplitud del

n x  2.58 ( ) Certeza del 99%

Cuantas más probabilidades de acierto queramos más se deberá

Nivel de confianza (NC): probabilidad de encontrar el valor verdadero

NC (%) = (1-α) x 100