Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Metodo Kriging

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 21

KRIGING

C & PE 940, 19 de octubre de 2005

Geoff Bohling
Asistente científico
Geoff@kgs.ku.edu Kansas Geological
Survey
864-2093

Gastos generales y otros recursos disponibles en:

http://People.ku.edu/~gbohling/cpe940
¿Qué es Kriging?

Interpolación óptima basada en la regresión contra los valores


observados de z de alrededor de los puntos de datos,
ponderados según los valores de covarianza espacial.

Pronunciación: "G duro" (como en Danie Krige) o suave "g" (á



Georges Matheron), elija

¿Qué es interpolación? Estimación de una variable en una


ubicación de valores observados en torno lugares. Por ejemplo,
estimación de la porosidad a u= (2000 m, 4700 m) con base en
valores de porosidad en los puntos de seis datos más cercanos en
nuestra zona unas datos:

Parece razonable estimar f u por un promedio ponderado ∑l af a ,


con pesos l una dada por una función decreciente de
la distancia, da , u a los datos de punto de un .
Todos los algoritmos de interpolación (inverso de la distancia al
cuadrado, splines, funciones de base radial, triangulación, etc.)
estiman el valor en un lugar determinado como una suma
ponderada de los valores de datos en que lugares. Casi todos
asignan pesos de acuerdo a las funciones que le dan un peso
decreciente con la distancia de separación cada vez
mayor. Kriging asigna pesos según una función de ponderación
(moderado) basada en datos, en lugar de una función arbitraria,
pero es sólo un algoritmo de interpolación y dará resultados muy
similares a otros en muchos casos (Isaaks y Srivastava, 1989). En
particular:

- Si las ubicaciones de datos son bastante densa y uniformemente


distribuidos en toda el área de estudio, obtendrá estimaciones
bastante buenas independientemente del algoritmo de
interpolación.
- Si las ubicaciones de los datos caen en unos racimos con
grandes lagunas en el medio, obtendrá estimaciones poco
fiables independientemente del algoritmo de interpolación.
- Casi todos los algoritmos de interpolación se subestiman los
agudos y sobreestimar los bajos; Esto es inherente a un
promedio y si no media un algoritmo de interpolación no
consideramos razonable

Algunas ventajas de kriging:

- Ayuda a compensar los efectos de datos, clustering, asignar


puntos individuales dentro de un cluster de menos peso que los
puntos de datos aislados (otratamiento de racimos más como
puntos únicos)
- Ofrece estimación del error de estimación (varianza de kriging),
junto con la estimación de la variable Z, sí mismo (pero error
mapa es básicamente una versión escala de un mapa de la
distancia al punto más cercano de los datos, no decir únicos)
- Disponibilidad de error de estimación proporciona la base para
la simulación estocástica de realizaciones posibles de Z()u)
Terminología y método de Kriging

Goovaerts, 1997: "todos los estimadores de kriging son más que


variantes del estimador de regresión lineal básica Z*(u) definidas
como

Z ."
un = 1

con

u,uuna : vectores de ubicación para el punto de estimación y los


vecinos de puntos de datos, indexado por un
n (u): número de puntos de datos en la vecindad local utilizado
para la estimación de Z*()u)
m (u),m()uun ): valores esperados (medios)
de Z()(u) y Z( uun ) l un (u): kriging peso asignado al
dato z()u un ) para estimación de ubicación u; misma
referencia recibirán diverso peso para ubicación de
estimación diferentes

Z (u) se trata como un campo aleatorio con un componente de


tendencia, m()(u)y un componente
residual, R()(u)= Z () (u)− m()(u). Kriging estima residual
en u como la suma ponderada de los residuos en alrededor de
puntos de datos. Pesos de Kriging, l una , se derivan de la función
de covarianza o semivariograma, que debe caracterizar el
componente residual. Distinción entre tendencia y residual algo
arbitraria; varía con la escala.

Desarrollo aquí seguirá la de Pierre Goovaerts, 1997, de Geo-


estadística para la evaluación de recursos naturales, Oxford
University Press.
Seguiremos trabajando con nuestros datos de porosidad de
ejemplo, incluso mirando en detalle de resultados en la región
de seis punto de datos mostrada anteriormente:
Fundamentos de Kriging

Una vez más, es la forma básica del estimador de kriging

n ()u )

Z * (u) − m (u) = ∑ l un [Z()uun )−m()(uun )]


un = 1

El objetivo es determinar pesos, l una , que minimizan la varianza


del estimador
)
s E 2 (u) = Var {{Z*()(u)− Z()u }

bajo la restricción de insesgadez E {{Z * () (u)−Z()(u)}= 0.


El campo aleatorio (RF) Z(u) se descompone en componentes
residuales y tendencia, Z()(u)= R()(u)+ m (u), con el
componente residual tratada como un fr con un medio
estacionario de 0 y una covarianza estacionaria (una función de
retardo, h, pero no de posición, u):

E {{R()(u)}= 0

COV{}R()(u)R()(u+h)}= E{R()(u) ⋅ R (u+h)} = CR ()h)

La función de covarianza residual generalmente se deriva del


modelo de semivariograma
entrada, CR () (h)= CR (0)−g () (h)= umbral −g()(h). Así el
semivariograma que alimentamos a un programa de kriging debe
representar el componente residual de la variable.

Los tres variantes principales kriging simple, ordinario y kriging


con tendencia, difieren en sus tratamientos de la componente de
tendencia, m(u).
Kriging simple

Por kriging simple, asumimos que el componente de tendencia es


una constante conocida media, m(u) = m, para que

Z SK *
. un = 1

Esta estimación es automáticamente imparcial, desde


)
[
E[Z()uun )−m]= 0, por lo que E Z * SK (u ]= m = E[Z(u)]. El
error de estimación de ZSK* () (u)− Z()(u) es una combinación
lineal de variables aleatorias que representan residuos en los
puntos de datos, uuna y el punto de estimación, u:
ZSK*
n ()u )
= ∑ l SK un
un = 1

Usando las reglas para la varianza de una combinación lineal de


variables aleatorias, la varianza del error es entonces dada por

(u)
un

=1

Para minimizar la varianza error, tomar el derivado de la


expresión anterior con respecto a cada uno de los pesos de
kriging y establecer cada derivado a cero. Esto nos lleva al
siguiente sistema de ecuaciones:
n ()u )

∑ l SK b (u) CR ()ua −ub) = CR ()uun −u) un =1,,n()(u)


b=1
Debido a la constante media, la función de covarianza para Z(u)
es el mismo que para el componente
residual, C()(h) = CR ()h ), por lo que podemos escribir el
sistema kriging simple directamente en términos deh de C()():
n ()u )

∑ l SK b (u) C ()ua −ub) = C ()uun −u) un =1,,n()(u).


b=1

Esto puede escribirse en forma de matriz como


K l SK (u) = k

donde KSK es la matriz de covarianzas entre los puntos de datos,


con elementos K j = ()(u me − u j ), k es el vector de
C
covarianzas entre los puntos de datos y el punto de estimación,
con los elementos de k =C(ui − u), y l SK () (u) es el vector de
los pesos de kriging simple
para los puntos circundantes. Si el modelo de covarianza es lícito
(es decir, el modelo de semivariograma subyacente es lícito) y no
dos puntos son auxilio coubicados, entonces la matriz de
covarianzas de datos es positiva definida y podemos solucionar
para los pesos de kriging utilizando
l SK = K − 1 k

Una vez que tenemos los pesos de kriging, podemos calcular la


estimación kriging y la varianza de kriging, que viene dado por

n ()u )
s SK 2
un=1

después de sustituir los pesos de kriging en la expresión de la


varianza de error anterior.

Entonces, ¿todo este matemáticas hacer? Encuentra un conjunto


de pesas para estimar el valor de la variable en la u ubicación de
valores en un conjunto de puntos vecinos. El peso en cada punto
de datos generalmente disminuye al aumentar la distancia a ese
punto, de acuerdo con las disminución covarianzas de estimación
de datos especificados en el vector de la derecho, k. Sin
embargo, el conjunto de pesas también está diseñado para tener
en cuenta para la redundancia entre los puntos de datos,
representada en las covarianzas de punto de datos de puntos de
datos en la matriz K. Multiplicando k por K-1 (a la izquierda) le
downweight puntos cayendo en grupos en relación con puntos
aislados a la misma distancia.

Vamos a aplicar kriging simple a nuestros datos de porosidad,


usando el semivariograma esférico que encajamos, con cero
pepita, un umbral de 0.78 y una gama de m: 4141

Como estamos usando un semivariograma esférico, la función de


covarianza está dada por

(
C (h) = C (0) −g (h) = 0,78⋅ ) 1−1,5⋅()(h 4141)+ 0,5⋅()(h

4141) 3 )
para distancias de separación, h, m 4141 y 0 fuera de ese
rango. El diagrama siguiente muestra los elementos del vector
derecho, k =[0.38,0.56,0.32,0.49,0.46,0.37]T , de enchufar las
distancias de punto datos de estimación de esta
covarianza función:

La matriz de distancias entre los pares de puntos de datos


(redondeados al metro más cercano) está dada por

Punto 1 Punto 2 Punto 3 Punto 4 Punto 5 Punto 6


Punto 1 0 1897 3130 2441 1400 1265
Punto 2 1897 0 1281 1456 1970 2280
Punto 3 3130 1281 0 1523 2800 3206
Punto 4 2441 1456 1523 0 1523 1970
Punto 5 1400 1970 2800 1523 0 447
Punto 6 1265 2280 3206 1970 447 0

Esto se traduce en una matriz de covarianza de los datos de


0,78 0,78 0.06 0,17 0.40 0.43
0,28 0.78 0,39 0.27
0.28 0.43 0,43 0,37 0.11 0.20
0,27 0.37 0,37 0,37 0.06
0.06 0,39 0.11 0,78 0,78
K = 0.17 0.20 0.06 0.27 0.65 0.27 0.65

0.40 0,78

0.43

(redondea a dos decimales). Tenga en cuenta en particular la


correlación relativamente alta entre los puntos 5 y 6, separados
por 447 m. Es el vector resultante de los pesos de kriging

l 1 0.1475

l2 0.4564

va 34 =K−1k= −00.2709.0205

l 5 0.2534

l6 − 0.0266

Aviso que punto 6 se asigna un peso muy pequeño en relación


con datos punto 1, a pesar de a la misma distancia desde el punto
de estimación y sobre la misma covarianza de datos-
toestimation-punto (k1 = 0.38, k6 = 0,37). esto es porque datos
punto 6 es efectivamente "defendido" por el cercano punto de
datos 5. Puntos 5 y 6 se correlacionan bastante fuertemente uno
con el otro y 5 tiene una correlación más fuerte con el punto de
estimación, por lo que el punto 6 efectivamente es
ignorado. Tenga en cuenta que las covarianzas y, por tanto, los
pesos de kriging dependen totalmente de la configuración de
datos y el modelo de covarianza, no los valores de datos reales.
Porosidades en los puntos 5 y 6 podrían ser en realidad muy
diferentes y esto no tendría ninguna influencia en los pesos de
kriging.

El valor de porosidad media para los pozos de 85 es 14.70%, y


los valores de porosidad en los pozos de seis ejemplo son 13.84%
12.15%, 12.87%, 12,68%, 14.41% y 14.59%. El residuo
estimado de la media en la u viene dada por la dot product de los
pesos de kriging y el vector de residuos en los puntos de datos:

R (u) ¿ = ? ′ Run
- 0.86

- 2.55

= ]
[0,15 0,46 −0,02 0,27 0,25 −0.03 -
-1.83
2.01 = −1,87

-0,28

- 0.10

Agregar la media espalda en este estimado residual da una


porosidad estimada de Zˆ ()(u)= R()(u)+ m = −1,87 + =14,70
12.83%. Del mismo modo, enchufar los pesos de kriging y el
vector k en la expresión de la varianza de estimación da una
variación de 0.238 (cuadrado %). Teniendo en cuenta estas dos
piezas de información, podemos representar la porosidad u =
(2000 m, 4700 m) como una distribución normal con una media
de 12.83% y una desviación estándar de 0,49%. Tenga en cuenta
que, como los pesos de kriging, la estimación de la varianza
depende totalmente de la configuración de datos y la función de
covarianza, no en los valores de los datos ellos mismos. La
varianza de kriging estimada sería la misma sin importar si los
valores de porosidad real en el barrio eran muy similares o muy
variable. La influencia de los valores de datos, a través de la
instalación del modelo de semivariograma, es absolutamente
indirecta.
Aquí están las estimaciones kriging simple y desviación estándar
en una cuadrícula de 100 x 80 con separación de 100 metros
utilizando el modelo de semivariograma esférico y calcular cada
valor de rejilla de 16 más datos del vecino puntos (bien
ubicaciones):
Algunas características a destacar:

Suavidad: interpolados superficie básicamente será tan suave


como sea posible dadas las limitaciones de los datos; en muchos
casos, probablemente más suaves que la superficie "real".

Las dianas: porque Krigeaje promedio entre puntos de datos,


extremos locales suelen ser en lugares bien; las dianas son
inevitables. Esto es cierto de casi todos los algoritmos de
interpolación. Forma extrema esto es discontinuidades de
artefacto en lugares bien modelo de semivariograma incluye
importante nugget.

Mapa de error refleja puntos de datos, no los valores de


datos: mapa de la desviación estándar kriging depende
totalmente de la configuración de datos y la función de
covarianza; esencialmente un mapa de distancia a más cercano
bien escalado por la función de covarianza.

Kriging Ordinario
Por kriging ordinario, en lugar de asumir que la media es
constante sobre todo el dominio, suponemos que es constante
en el barrio local de cada punto de estimación, es que

m ()uun ) = m (u) para cada uno como valor de los


datos, Z()uun ), que estamos usando
para calcular Z()(u). En este caso, el estimador de kriging puede
ser escrito

Z * (u) = m (u) + n ∑ (u) l un (u) [Z()uun )−m()(u)]


un = 1

= n ∑ (u) l un (u) Z ()uun ) +

1−unn∑()=u1)l un () (u) m(u)

un=1

y filtramos la media local desconocida requiriendo que los pesos


de kriging suma 1, conduciendo a un estimador de kriging
ordinario de

n (u) n ()u )

Z ∑l unOK()(u)Z()uun ) con ∑l un OK (u) = 1.


un = 1 un = 1

Con el fin de minimizar la varianza de error con la condición


de unidad de la suma de los pesos, realmente configurar el
sistema minimizar la varianza de error más un término
adicional que implica un parámetro de Lagrange, mOK( ) u ):
L =s E 2 (u) + 2mOK(u) 1−unn∑()= u 1 )l un (u)

así que esa minimización con respecto a los parámetros de


Lagrange obliga a la restricción para ser obedecido:

1 ∂L=1−n∑()(u)l () (u) = 0
2 ∂m un
En este caso, el sistema de ecuaciones para los pesos de kriging
resulta ser

n
b ∑ ()=u1) l OK b (u) CR ()ua −ub ) + m OK (u) = CR ()uun −
u) un =1,,n()(u)

n ()u )

b=1

donde CR () (h) es una vez más la función de covarianza para el


componente residual de la variable. En el kriging simple,
podríamos equiparar CR () (h) y C()(h), la función de covarianza
de la variable sí mismo, debido a la asunción de una media
constante. Que la igualdad no tiene aquí, pero en la práctica la
sustitución se hace a menudo de todos modos, en el supuesto de
que el semivariograma, de que C()(h) se deriva, filtra con
eficacia la influencia de grandes tendencias en la media.

De hecho, la restricción de unidad de la suma de los pesos


permite que el sistema kriging ordinario que se indicarán
directamente en términos del semivariograma (en lugar de los
valores deh) CR (anteriores). En un sentido, kriging ordinario es
el método de interpolación que naturalmente se desprende de un
análisis del semivariograma, ya que ambas herramientas tienden
a filtrar las tendencias en la media.

Una vez obtenidos los pesos de kriging (y parámetro de


Lagrange), la varianza del error kriging ordinario se da por

n (u) s ∑l unOK()(u)C()(uun −u
) − mOK(u).
un = 1
En términos de la matrix, el sistema kriging ordinario es una
versión aumentada del sistema kriging simple. Para nuestro
ejemplo de seis puntos sería:

0,78 0.28 0.06 0,17 0.40 0.43 1de 1.00l 0.38


0.43 0.78 0,39 0.27 0,20
0.28 0,78 0,43 0,37 0.11 0,06 1.00 l2 0,56
0.39 0.37 0,37 0,37 0,27 3de 1.00l 0.32
0.06 0.27 0.11 0,78 0,78 0,65
0.20 0.06 0.27 0.65 0,78
1.00 l 4 = de 0.49
0.17 1.00 1.00 1.00 1.00
1.00
5de 1.00l 0,46
0.40

0.43 6de 1.00l 0.37


0.00 m
1.00
1.00
cual es la solución

l 1 0.1274

l2 De 0.4515
l3 − 0.0463

l4 = K −1 k = De 0.2595
l 5 0.2528

l6 −0.0448

m 0.0288

La estimación kriging ordinario u = (2000 m, 4700 m) resulta ser


12.93% con una desviación estándar de 0.490%, sólo ligeramente
diferente de los valores de kriging simple de 12.83% y 0.488%.
Con 16 vecinos más cercanos para cada punto de estimación, la
estimación de porosidad de kriging ordinario y la desviación
estándar se parecen mucho como los de kriging simple:
Kriging con tendencia

Kriging con tendencia (método conocido como kriging universal)


es mucho como kriging ordinario, excepto que en vez de
conexión a un medio local en el barrio del punto de estimación,
encajamos una tendencia lineal o de orden superior (x,
y) coordenadas de los puntos de datos. Un local lineal (a.k.a.,
primer orden) modelo tendencia vendría dada por
m (u) = m ()x, y) = un 0 + un 1 x + un 2 y

Como tal modelo en el sistema kriging implica al mismo tipo de


extensión como de kriging ordinario, con la adición de dos más
parámetros de Lagrange y dos más columnas y filas en la matriz
de K cuyos elementos (distinto de cero) son x e y coordenadas de
los puntos de datos. Las tendencias de mayor orden (cuadrática,
cúbica) podrían manejarse de la misma manera, pero en la
práctica es raro utilizar nada más que una moda de primer
orden. Kriging ordinario es kriging con un modelo de tendencia
de la orden del zeroth.

Si la variable de interés muestra una tendencia significativa, sería


un enfoque típico intentar estimar un semivariograma "de
tendencia" utilizando uno de los métodos descritos en la
Conferencia de semivariograma y entonces alimentan este
kriging con tendencia firstorder. Sin embargo, Goovaerts (1997)
advierte en contra de este enfoque y en su lugar recomienda
realizar el kriging simple de los residuos de una tendencia
mundial (con una media constante de 0) y luego agregando los
residuos interpolados en la tendencia mundial.
Algunos de los muchos temas he saltado o lustrados

Cokriging: Kriging utilizando información de uno o más


correlaciona variables secundarias o kriging multivariante en
general. Requiere el desarrollo de modelos para cross-covarianza
– covarianza entre dos variables diferentes en función del retraso.

Indicador Kriging: Kriging de variables indicadoras, que


representan la calidad de miembro en un conjunto de
categorías. Utilizar con variables categóricas naturalmente como
facies o variables continuas que han sido thresholded en
categorías (por ejemplo, cuartiles, deciles). Especialmente útil
para conservar la conectividad de las regiones de alta y
meteorizadas. Aplicación directa de kriging a perm se lave casi
siempre valores extremos.

Discontinuidades de artefacto: Kriging utilizando un modelo de


semivariograma con una pepita de importante será crear
discontinuidades, con la superficie interpolada saltando arriba o
abajo para agarrar cualquier punto de datos que se corresponde
con un nodo de red (punto de estimación ). Soluciones: kriging
factorial (filtrar el componente de pepita) o algunos otros
interpolación tipo de alisado (exacto), como alisar ranuras. O, si
usted realmente quiere exacta interpolación, utiliza un modelo de
semivariograma sin una pepita.

Algoritmo de la búsqueda: el algoritmo para seleccionar puntos


de datos de vecinos puede tener al menos tanta influencia en la
estimación como el algoritmo de interpolación sí mismo. He
utilizado un simple más cercano a la búsqueda de vecino. Un par
de alternativas incluyen búsquedas de cuadrante y octante, que
busquen tantos puntos de datos dentro de una cierta distancia en
cada cuadrante u octante que rodea el punto de datos.

También podría gustarte