Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

TEMA9

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 30

BLOQUE IV

INTRODUCCIÓN A LA
QUIMIOMETRÍA

-TEMA 9: Tratamiento de datos en Química Analítica


- TEMA 10: Herramientas para asegurar la comparabilidad
de datos analíticos
- TEMA 11: Calibración metodológica univariante
TEMA 9: TRATAMIENTO DE
DATOS EN QUÍMICA ANALÍTICA
- Concepto y finalidad de la quimiometría
- Quimiometría y proceso analítico
- Concepto de población y muestra
- Tipos de error
- Distribución de probabilidad normal
- Distribución muestral de la media
- Intervalo de confianza
- Expresión de resultados
CONCEPTO Y FINALIDAD DE LA QUIMIOMETRÍA

QUÍMICA ANALÍTICA ESTADÍSTICA

QUIMIOMETRÍA

Quimiometría Química
Biometría Biología
Sociometría Sociología
Econometría Economía
Psicometría Psicología

Prof. Massart (1997)

Disciplina química que utiliza la matemática, la estadística y la lógica


formal para diseñar o seleccionar procedimientos experimentales
óptimos, proporcionar la máxima información química relevante a partir
del análisis de datos químicos y obtener conocimientos a partir de
sistemas químicos.
QUIMIOMETRÍA Y PROCESO ANALÍTICO
La quimiometría mejora el rendimiento del proceso analítico en
todas sus etapas y asegura la calidad de los resultados

DEFINICIÓN DE PROBLEMA
DESARROLLO
MÉTODO

Diseño de experimentos
OPTIMIZACIÓN

MUESTREO Representativo
MEDIDA

TRATAMIENTO DE LA MUESTRA Y MEDIDA


INTERPRETACIÓN

Herramientas para
OBTENCIÓN Y TRATAMIENTO DE DATOS asegurar la calidad de
los datos
DATOS

Herramientas para
INTERPRETACIÓN DE RESULTADOS * interpretar los
resultados
DISEÑO DE EXPERIMENTOS

Condiciones de extracción Bradford


Experimento
Disolvente Temperatura Tiempo [Proteínas]
(% EtOH) (oC) (min) (g/100 g bagazo) Superficie de Respuesta Estimada
Time=10,0
1 50 90 10 0,77 ± 0,08
2 100 155 10 0,36 ± 0,03
3 50 155 17 2,2 ± 0,1
4 0 155 10 0,88 ± 0,04
380
5 0 90 3 0,20 ± 0,02
6 50 90 10 0,77 ± 0,01
4,7% EtOH
280
7 50 90 10 0,83 ± 0,08 155 ºC

Bradford
8 0 25 10 0,13 ± 0,02 10 min 180
9 100 90 3 0,30 ± 0,02
10 50 90 10 0,83 ± 0,07 5 ciclos 80
160
11 50 155 3 1,10 ± 0,03 -20 120
80
12 50 25 17 0,34 ± 0,04 0 20 40
40 60 Temperature
13 50 90 10 0,79 ± 0,05 80 100 0

14 100 25 10 0,26 ± 0,02 Solvent (EtOH)

15 100 90 17 0,30 ± 0,06


16 0 90 17 0,20 ± 0,02
17 50 25 3 0,31 ± 0,02
CONCEPTO DE POBLACIÓN Y MUESTRA
Población: conjunto ilimitado de resultados de características comunes. A
veces se considera que la población es un número finito si este es
suficientemente elevado.

Muestra de población: se refiere a un pequeño número de resultados que debe


ser representativo de la población. El objetivo del análisis químico es el
conocimiento de la población a través del estudio de la muestra.

Ante la inseguridad de que la muestra sea representativa de la población,


las conclusiones se expresaran en términos de probabilidad

PARÁMETROS QUE DEFINEN LA POBLACIÓN Y FORMA DE ESTIMARLOS

μ: media de la población. En ausencia de errores se corresponderá con el


valor verdadero. La estimación de “μ” a partir de un número reducido de datos
(muestra de población) es la media ( ). x
σ: desviación estándar de la población. La estimación de σ a partir de un
número reducido de datos (muestra de población) es la desviación estándar
(s).
Descriptores de una población
N
Estimación tendencia

 xi
N

 ( xi   ) 2
 i 1  i 1

dispersión
Estimación
N N
central

Descriptores de una muestra de población


n n

x i  i
( x  x ) 2

x i 1 s i 1
n 1
n

n = número reducido de datos


N = número de datos de la población
TIPOS DE ERROR
No existen resultados cuantitativos de interés si no van acompañados
de alguna estimación de los errores inherentes a los mismos

Errores groseros o accidentales: errores que son tan importantes y


evidentes que obligan a desechar la medida y volverla a repetir.

Errores aleatorios: son errores debidos al azar y, por tanto, suelen


mostrar una distribución normal PRECISIÓN

Errores sistemáticos: no dependen del azar y por tanto no muestran


una distribución normal SESGO

Error total = Error sistemático + Error aleatorio


Diferenciación entre error sistemático y error aleatorio

Cuatro estudiantes realizan cada uno un mismo análisis en el que se


valoran 10.00 mL de NaOH 0.1 M con HCl 0.1 M. Cada estudiante repite el
experimento cinco veces y los resultados obtenidos son:

Estudiante Resultados Media


A 10.08 10.11 10.09 10.10 10.12 10.10
B 9.88 10.14 10.02 9.80 10.21 10.01
C 10.19 9.79 9.69 10.05 9.78 9.90
D 10.04 9.98 10.02 9.97 10.04 10.01

EA ES EA ES
10.00 10.00
A •••
••  C • •• • •  
9.70 9.80 9.90 10.10 10.20 10.30 9.70 9.80 9.90 10.10 10.20 10.30

10.00 10.00
B •• •• •  D • •• 
9.70 9.80 9.90 10.10 10.20 10.30 9.70 9.80 9.90 10.10 10.20 10.30
Parámetros para estimar el sesgo

XR = valor aceptado
Error (absoluto) = x- XR
x = valor central

Error (relativo) = 100 ( x - XR) / XR

Parámetros para estimar la precisión


N n

 ( xi   ) 2
 i
( x  x ) 2

 i 1 s i 1

N n 1
Para una serie de datos grande (> 20) Para una seria de datos pequeña (< 20)

Otros parámetros para estimar la precisión (dispersión)


Varianza = el cuadrado de la desviación estándar, s2 o σ2

Desviación estándar relativa DER/RSD (%) = 100 σ / µ ≈ 100 s /x


Relación de los errores sistemáticos y aleatorios con la exactitud y la
precisión

Definición Exactitud (IUPAC (1998) e ISO (1993))

Mide el grado de concordancia entre el resultado de una medida y el


valor real del mesurando (valor de referencia aceptado del analito).

Definición Precisión (IUPAC (1998) e ISO (1994))

Grado de concordancia entre los resultados de ensayos independientes


obtenidos en unas condiciones bien definidas.

La precisión describe los errores aleatorios, el sesgo describe


los errores sistemáticos y la exactitud, como grado de
proximidad entre el valor de una medida y el valor verdadero,
incorpora ambos tipos de error (aleatorios y sistemáticos)
Errores aleatorios Errores sistemáticos

PRECISIÓN EXACTITUD SESGO

A B

Baja precisión + sesgo Alta precisión + mucho sesgo


→ medida poco exacta → medida muy poco exacta

C D

Baja precisión + no sesgo Alta precisión + no sesgo


→ medida exacta → medida muy exacta
DISTRIBUCIÓN DE PROBABILIDAD NORMAL
La distribución de los resultados obtenidos sobre una población se
obtiene al representar la frecuencia de las medidas en un histograma 
la forma de la distribución afecta al tipo de tests estadísticos que se
pueden utilizar.
Resultados de 50 determinaciones de concentración de ión nitrato (μg/mL)

x
A partir de los resultados que se muestran en la siguiente tabla de frecuencia,
dibujar el histograma

Resultado 85 86 87 88 89 90 91 92 93

Frec. Resulta. 10 5 15 41 60 51 27 12 6

Número total de medidas: 227


Solo puede aplicarse el método estadístico si la muestra presenta una
distribución de probabilidad normal, es decir, si los datos están
dispuesto de forma simétrica alrededor de un valor central que tiene la
máxima frecuencia

MUESTRA POBLACIÓN

Función de errores de Laplace-Gauss


DISTRIBUCIÓN DE
PROBABILIDAD
NORMAL
Comprobación de que un grupo
Histograma de datos procede de una
distribución normal:
6 representando los datos de
5 frecuencia acumulada (%) en un
papel de probabilidad normal
frecuencia

4
3
2
1
0
0.2 0.25 0.3 0.35 0.4 0.45
Concentración Pb

Gráficos → Gráficos exploratorios →


Gráfico probabilidad normal/histograma

Descripción → Datos numéricos →


análisis de una variable → Gráfico de
probabilidad normal/histograma
(Descripción → datos numéricos → análisis de una variable → resumen estadístico)
Resumen Estadístico para Col_1
Recuento 50
Promedio 0,4996
Mediana 0,5
Desviación Estándar 0,0162832
Coeficiente de Variación 3,25925%
Mínimo 0,46
Máximo 0,53
Rango 0,07
Sesgo Estandarizado -0,744915
Curtosis Estandarizada -0,34417
El StatAdvisor

Esta tabla muestra los estadísticos de resumen para Col_1. Incluye medidas de tendencia central,
medidas de variabilidad y medidas de forma.

De particular interés aquí son el sesgo estandarizado y la curtosis estandarizada, las cuales pueden
utilizarse para determinar si la muestra proviene de una distribución normal. Valores de estos
estadísticos fuera del rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que
tendería a invalidar cualquier prueba estadística con referencia a la desviación estándar.

En este caso, el valor del sesgo estandarizado se encuentra dentro del rango esperado para datos
provenientes una distribución normal.

El valor de curtosis estandarizada se encuentra dentro del rango esperado para datos provenientes de
una distribución normal.
Parámetros característicos de una distribución de probabilidad normal

Asimetría o sesgo: Es un indicador del grado de asimetría de una distribución


de probabilidad.

Sesgo/asimetría = 0

Distribución normal

Sesgo negativo Sesgo positivo

Una distribución de probabilidad normal es simétrica, es decir, los datos deben


ser simétricos en torno a la media y no debe observarse sesgo (la media de los
datos debe coincidir con la mediana).

Una distribución de probabilidad normal debe presentar el mismo número de


datos a ambos lados del valor medio, es decir, debe haber el mismo número de
desviaciones positivas que negativas
Curtosis: Es una medida de la forma o apuntamiento de las distribuciones. La
curtosis da información a cerca de la frecuencia de datos alrededor de la
media o, lo que es lo mismo, de cuan puntiaguda es una distribución.

Coeficiente de curtosis: <<< 0 → platicúrtica

= 0 → mesocúrtica Distribución normal

>>> 0 → leptocúrtica

Una distribución de probabilidad normal debe presentar


un coeficiente de curtosis lo más cercano a “0”
Características de una distribución de probabilidad normal

1. En este tipo de distribución, los resultados están distribuidos


simétricamente alrededor del valor central.

2. La probabilidad de encontrar una medida


cualquiera dentro de unos límites cualesquiera, x1 y
x2, es igual al área que se encuentra bajo la curva.

3. Efecto de la
magnitud de los errores
aleatorios.

4. Efecto de la
3 3 presencia de errores
sistemáticos (µ ≠ valor
real).
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Si de una población definida por “μ” y “σ” se toman diversos grupos de
muestras todos ellos de “n” observaciones y se halla la media de cada grupo
se tienen una nueva distribución cuya media es la misma que la media de la
población pero cuya desviación estándar no lo es (es menor) y se denomina
error estándar de la media:


error estándar de la media 
n

¿Cuáles son las ventajas de trabajar con la distribución muestral de la


media?

- La precisión analítica se puede mejorar al aumentar el número de


medidas: menor error estándar.

- Aún cuando la población original no esté distribuida normalmente, la


distribución de la media muestral tiende a mostrar una distribución
normal al aumentar “n”. Teorema del límite central
Ejemplo 1 :

Se quiere determinar la concentración de


Ca en una leche por EAA y para ello se
preparan 10 muestras que dan lugar a 10
determinaciones del contenido de Ca en la
leche. Sin embargo, cada una de estas
medidas es a la vez la medida de 5
LA DISTRIBUCIÓN DE LAS MEDIAS
medidas que ha hecho el equipo (las
TIENE UNA DISPERSIÓN MENOR QUE
muestras se han medido por
LA DISTRIBUCIÓN DE LOS DATOS DE
quintuplicado), lo que hace un total de 50
PARTIDA
determinaciones.

- Cada una de las 10 medidas es una


media muestral (DE 5 MEDIDAS).

- La distribución de las medias muestrales


está más centrada (menos dispersa) que la
distribución de los datos originales.
Ejemplo 2: Determinación de concentración de ión nitrato (μg/mL)

Media = 0.4996
Desviación estándar = 0.0164

0.506 0.504 0.502 0.496 0.502 0.492 0.506 0.504 0.500 0.486

Media = 0.4996
Desviación estándar = 0.0066

Las medias obtenidas (medias muestrales) se encuentran más agrupadas


entre sí que la medida originales (la desviación estándar es menor que la de
los datos originales)
INTERVALO DE CONFIANZA
Intervalo de valores que en
ausencia de errores
Intervalo de confianza = x sistemáticos debería
incluir al valor verdadero

Límites de confianza

x
Amplitud del intervalo

Precisión de Número de Nivel de certeza (z) que


las medidas medidas queramos tener

Desviación n Cuanto mayor sea la amplitud del


estándar intervalo, mayor será la certeza
(σ o s) de que el valor esté incluido
Nivel de certeza (z)

3 3
EXPRESIÓN DE RESULTADOS
Utilizando medias

VALOR VERDADERO  µ ±zσ muestrales
z( )
n
Si se dispone de una media muestral de “n > 50” medidas:

s x  1.96 (
s
) Certeza del 95%
xz( ) s
n

n x  2.58 ( ) Certeza del 99%


n

Cuantas más probabilidades de acierto queramos más se deberá


ensanchar el intervalo de confianza para garantizar que el verdadero
valor quede incluido
s
Intervalo de confianza de muestra grande (n > 50): xz( )
n
s
Intervalo de confianza de muestra pequeña (n < 50) : x  t n1 ( )
n
grados de libertad
NC
α
Nivel de significación (α): probabilidad de que el intervalo de confianza
no incluya al valor verdadero o riesgo de que el valor verdadero no
esté incluido en el intervalo de confianza (en tanto por 1).

Nivel de confianza (NC): probabilidad de encontrar el valor verdadero


dentro del intervalo de confianza (en tanto por 100)

NC NC
   

NC (%) = (1-α) x 100

Si el valor verdadero no se encuentra dentro del intervalo


de confianza es posible afirmar que además de errores
aleatorios, existen errores sistemáticos
Se determinó el contenido de ión sodio de una muestra de orina utilizando un
electrodo selectivo de iones, obteniéndose los siguientes valores: 102, 97, 99,
98, 101, 106 mM. ¿Cuáles son los límites de confianza al 95% y 99%, para la
concentración de ión sodio?

Media = 100.5 mM
S = 3.27 mM
Datos n = 6 (5 g.l.)
t5 (95%) = 2.57
t5 (99%) = 4.03

Límites de confianza al 95%: 100.5 ± 2.57 x 3.27 / √6 = 100.5 ± 3.4 mM


100 ± 4 mM

Límites de confianza al 99%: 100.5 ± 4.03 x 3.27 / √6 = 100.5 ± 5.4 mM


100 ± 6 mM
- El intervalo de confianza tendrá una sola cifra significativa (se pueden llegar a admitir 2).
- El intervalo de confianza se redondea por exceso.
- El valor medio se redondea siguiendo las reglas de redondeo.

También podría gustarte