Procesos Estocasticos
Procesos Estocasticos
Procesos Estocasticos
Mtodos Bayesianos
Materia:
Procesos Estocsticos
Integrantes:
Briones Ruth
Curso:
N5J
Redes Bayesianas
Historia
El trmino "redes bayesianas" fue acuado por Judea Pearl en 1985
para hacer hincapi en tres aspectos:25
1. El carcter a menudo subjetivo de la informacin de entrada.
2. La dependencia de acondicionamiento de Bayes como base
para la actualizacin de la informacin.
3. La distincin entre los modos causales y probatorio de
razonamiento, lo que subraya Thomas Bayes en un documento
publicado pstumamente en 1763.26
A finales de 1980 los textos seminales Razonamiento Probabilstico en Sistemas
Inteligentes27 y Razonamiento Probabilstico en Sistemas Expertos28 resumen las
propiedades de las redes Bayesianas y ayud a establecer las mismas como un campo de
estudio.
Variantes informales de este tipo de redes se utilizaron por primera vez por el jurista John
Henry Wigmore, en forma de grafos de Wigmore, para analizar la evidencia en un juicio en
1913.23 :6676 Otra variante, llamada diagrama de rutas, fue desarrollada por el genetista
Sewall Wright29 y utilizado en ciencias de la conducta y sociales (en su mayora con modelos
paramtricos lineales).
Definicin
Una red bayesiana, red de Bayes, red de
creencia, modelo
bayesiano (de Bayes) o modelo probabilstico
en
un
grafo
acclico dirigido es un modelo grafo probabilstico
(un tipo de modelo
esttico) que representa un conjunto de variables
aleatorias y sus
dependencias condicionales a travs de un grafo
acclico
dirigido
(DAG por sus siglas en ingls). Por ejemplo, una
red
bayesiana
puede representar las relaciones probabilsticas
entre
enfermedades y sntomas. Dados los sntomas, la red puede ser usada para computar la
probabilidad de la presencia de varias enfermedades.
Formalmente, las redes bayesianas son grafos dirigidos acclicos cuyos nodos representan
variables aleatorias en el sentido de Bayes: las mismas pueden ser cantidades observables,
variables latentes, parmetros desconocidos o hiptesis. Las aristas representan
dependencias condicionales; los nodos que no se encuentran conectados representan
variables las cuales son condicionalmente independientes de las otras. Cada nodo tiene
asociado una funcin de probabilidad que toma como entrada un conjunto particular de
valores de las variables padres del nodo y devuelve la probabilidad de la variable
representada por el nodo. Por ejemplo, si por padres son
variables booleanas entonces la
funcin de probabilidad puede ser representada por una tabla de
entradas, una entrada
para cada una de las
posibles combinaciones de los padres siendo verdadero o falso.
Ideas similares pueden ser aplicadas a grafos no dirigidos, y posiblemente cclicos; como son
las llamadas redes de Markov.
Ejemplo:
Supongamos que hay dos eventos los cuales pueden causar que la hierba est hmeda: que
el rociador est activado o que est lloviendo. Tambin supongamos que la lluvia tiene un
efecto directo sobre el uso del rociador (usualmente cuando llueve el rociador se encuentra
apagado). Entonces la situacin puede ser modelada con una red Bayesiana (como hemos
visto). Las tres variables tienen dos posibles valores, T (para verdadero) y F (para falso). La
funcin de probabilidad conjunta es:
donde los nombres de las variables han sido abreviados a G = Hierba hmeda, S = Rociador
activado, y R = Lloviendo.
El modelo puede responder preguntas como "Cul es la probabilidad de que est lloviendo
dado que la hierba est hmeda?" usando la frmula de probabilidad condicional y sumando
sobre todas las variables incordias:
de
Si por otra parte queremos predecir el impacto que tendr encender el rociador, tenemos
entoncs
con el trmino
eliminado,
mostrando que la accin tiene efecto sobre la hierba pero no sobre la lluvia.
Estas predicciones no son factibles cuando alguna de las variables no son observadas, como
en la mayora de los problemas de evaluacin. El efecto de la accin
puede mantenerse
predictivo, sin embargo, cada vez un criterio llamado "puerta trasera" es satisfecho.1 Los
estados que, si un conjunto Z de nodos se puede observar que d-separa (o bloquea) todos
los
caminos
de
"puestra
trasera"
desde
X
hasta
Y
entonces
. Un camino de puestra trasera es uno que
termina con una flecha hacia X. Los conjuntos que satisfacen el criterio de puerta trasera son
llamados "suficientes" o "admisibles". Por ejemplo, el conjunto Z=R es admisible para
predecir el efecto de S=T sobre G, porque R d-separa el (nico) camino de puerta trasera S?
R?G. Sin embargo, si S no es observado, no hay otro conjunto que d-separe este camino y el
efecto de encender los rociadores (S=T) sobre la hierba (G) no puede ser predecido desde
observaciones pasivas. Nosotros entonces decimos que
no est
identificado. Esto refleja el hecho de que, careciendo de datos intervencionales, no podemos
determinar si la dependencia observada entre S y G es debido a una conexin casual o
debido a una artificial creada por una causa comn, R. (ver paradoja de Simpson)
Para determinar si una relacin casual es identificada desde una red Bayesiana arbitraria con
variables no obervadas, uno puede usar las tres reglas de "do-calculus"1 2 y probar si todos
los trminos do pueden ser eliminados de la expresin de la relacin, as conforme que la
cantidad deseada es estimable desde la frecuencia de datos.
Usar una red de bayesian puede salvar las cantidades considerables de la memoria, si las
dependencias en el reparto conjunto estn escasas. Por ejemplo, una manera ingenua de
guardar las probabilidades condicionales de 10 variables con dos valores como una tabla
requiere el espacio de almacenamiento para
valores. Si las distribuciones locales
de ninguna variable depende de ms de 3 variables padre, la representacin de la red de
bayesiana solamente tiene que almacenar a lo sumo
valores.
Una ventaja de las redes bayesianas es que es intuitivamente ms fcil para un ser humano
comprender (un conjunto escaso de) dependencias directas y distribuciones locales que la
distribucin conjunta completa.
Aplicaciones:
Las redes Bayesianas se utilizan para el modelado del conocimiento en biologa
computacional y bioinformtica (redes reguladoras de genes, la estructura de la protena, la
expresin de genes de anlisis,15 el aprendizaje de epistasis a partir de los conjuntos de
datos de GWAS16 ), la medicina,17 biomonitoreo,18 la clasificacin de documentos,
recuperacin de informacin,19 la bsqueda semntica,20 el procesamiento de imgenes,
fusin de datos, sistemas de soporte de decisiones,21 la ingeniera, los juegos y la ley.
La independencia Condicional se verifica mediante el criterio de separacion-D.
Antes de definir formalmente la separacion-D, es necesario distinguir tres tipos de nodos de
acuerdo a las direcciones de los arcos que inciden en el nodo:
Nodos en secuencia: X -> Y ->Z.
Clasificadores Bayesianos
Un clasificador, en general, suministra una funcin que mapea (clasifica) un dato (instancia),
especificado por una serie de caractersticas o atributos, en una o
un grafo), (ii) unir dos variables en una sola (combinar dos nodos). La idea se ilustra en
forma grfica en la figura 3; y abajo se explican a detalle ambas operaciones.
Eliminacin de una variable consiste simplemente de eliminar un atributo, Xi del clasificador,
lo que puede ser por dos razones: (a) el atributo no es relevante para la clase, (b) el atributo
no es independiente de algn otro atributo, Xj. La razn para (b) es que si dos atributos son
altamente dependientes, dan bsicamente la misma informacin, as que uno es redundante
y se puede eliminar.