Procesos Estocasticos

Universidad De Guayaquil
Facultad De Ciencias, Matemticas Y Fsicas

Ingeniera De Networking Y Telecomunicaciones
Mtodos Bayesianos
Materia:
Procesos Estocsticos
Integrantes:
Briones Ruth
Curso:
N5J
Redes Bayesianas
Historia
El trmino "redes bayesianas" fue acuado por Judea Pearl en 1985
para hacer hincapi en tres aspectos:25
1. El carcter a menudo subjetivo de la informacin de entrada.
2. La dependencia de acondicionamiento de Bayes como base
para la actualizacin de la informacin.
3. La distincin entre los modos causales y probatorio de
razonamiento, lo que subraya Thomas Bayes en un documento
publicado pstumamente en 1763.26
A finales de 1980 los textos seminales Razonamiento Probabilstico en Sistemas
Inteligentes27 y Razonamiento Probabilstico en Sistemas Expertos28 resumen las
propiedades de las redes Bayesianas y ayud a establecer las mismas como un campo de
estudio.
Variantes informales de este tipo de redes se utilizaron por primera vez por el jurista John
Henry Wigmore, en forma de grafos de Wigmore, para analizar la evidencia en un juicio en
1913.23 :6676 Otra variante, llamada diagrama de rutas, fue desarrollada por el genetista
Sewall Wright29 y utilizado en ciencias de la conducta y sociales (en su mayora con modelos
paramtricos lineales).
Definicin
Una red bayesiana, red de Bayes, red de
creencia, modelo
bayesiano (de Bayes) o modelo probabilstico
en
un
grafo
acclico dirigido es un modelo grafo probabilstico
(un tipo de modelo
esttico) que representa un conjunto de variables
aleatorias y sus
dependencias condicionales a travs de un grafo
acclico
dirigido
(DAG por sus siglas en ingls). Por ejemplo, una
red
bayesiana
puede representar las relaciones probabilsticas
entre
enfermedades y sntomas. Dados los sntomas, la red puede ser usada para computar la
probabilidad de la presencia de varias enfermedades.
Formalmente, las redes bayesianas son grafos dirigidos acclicos cuyos nodos representan
variables aleatorias en el sentido de Bayes: las mismas pueden ser cantidades observables,
variables latentes, parmetros desconocidos o hiptesis. Las aristas representan
dependencias condicionales; los nodos que no se encuentran conectados representan
variables las cuales son condicionalmente independientes de las otras. Cada nodo tiene
asociado una funcin de probabilidad que toma como entrada un conjunto particular de
valores de las variables padres del nodo y devuelve la probabilidad de la variable
representada por el nodo. Por ejemplo, si por padres son
variables booleanas entonces la
funcin de probabilidad puede ser representada por una tabla de
entradas, una entrada
para cada una de las
posibles combinaciones de los padres siendo verdadero o falso.
Ideas similares pueden ser aplicadas a grafos no dirigidos, y posiblemente cclicos; como son
las llamadas redes de Markov.
Existen algoritmos eficientes que llevan a cabo la inferencia y el aprendizaje en redes

bayesianas. Las redes bayesianas que modelan secuencias de variables (ej seales del habla
o secuencias de protenas) son llamadas redes bayesianas dinmicas. Las generalizaciones de las
redes bayesianas que pueden representar y resolver problemas de decisin bajo
incertidumbre son llamados diagramas de influencia.
Ejemplo:
Supongamos que hay dos eventos los cuales pueden causar que la hierba est hmeda: que
el rociador est activado o que est lloviendo. Tambin supongamos que la lluvia tiene un
efecto directo sobre el uso del rociador (usualmente cuando llueve el rociador se encuentra
apagado). Entonces la situacin puede ser modelada con una red Bayesiana (como hemos
visto). Las tres variables tienen dos posibles valores, T (para verdadero) y F (para falso). La
funcin de probabilidad conjunta es:
donde los nombres de las variables han sido abreviados a G = Hierba hmeda, S = Rociador
activado, y R = Lloviendo.
El modelo puede responder preguntas como "Cul es la probabilidad de que est lloviendo
dado que la hierba est hmeda?" usando la frmula de probabilidad condicional y sumando
sobre todas las variables incordias:
Como est sealado explcitamente en el numerador del ejemplo, la funcin de probabilidad

conjunta es usada para calcular cada iteracin de la funcin de sumatoria, marginalizando
sobre en el numerador y sobre y en el denominador.
Si, por otra parte, deseamos responder una pregunta intermedia: "Cul es la probabilidad
de que llueva dado que la hierba est hmeda?" la respuesta puede ser dada por la postintervencin de la funcin de distribucin conjunta
obtenida removiendo el factor
esperarse, la probabilidad
.
de
de la distribucin de pre-intervencin. Como era de

que llueva no es afectada por la accin:
Si por otra parte queremos predecir el impacto que tendr encender el rociador, tenemos
entoncs
con el trmino
eliminado,
mostrando que la accin tiene efecto sobre la hierba pero no sobre la lluvia.
Estas predicciones no son factibles cuando alguna de las variables no son observadas, como
en la mayora de los problemas de evaluacin. El efecto de la accin
puede mantenerse
predictivo, sin embargo, cada vez un criterio llamado "puerta trasera" es satisfecho.1 Los
estados que, si un conjunto Z de nodos se puede observar que d-separa (o bloquea) todos
los
caminos
de
"puestra
trasera"
desde
X
hasta
Y
entonces
. Un camino de puestra trasera es uno que
termina con una flecha hacia X. Los conjuntos que satisfacen el criterio de puerta trasera son
llamados "suficientes" o "admisibles". Por ejemplo, el conjunto Z=R es admisible para
predecir el efecto de S=T sobre G, porque R d-separa el (nico) camino de puerta trasera S?
R?G. Sin embargo, si S no es observado, no hay otro conjunto que d-separe este camino y el
efecto de encender los rociadores (S=T) sobre la hierba (G) no puede ser predecido desde
observaciones pasivas. Nosotros entonces decimos que
no est
identificado. Esto refleja el hecho de que, careciendo de datos intervencionales, no podemos
determinar si la dependencia observada entre S y G es debido a una conexin casual o
debido a una artificial creada por una causa comn, R. (ver paradoja de Simpson)
Para determinar si una relacin casual es identificada desde una red Bayesiana arbitraria con
variables no obervadas, uno puede usar las tres reglas de "do-calculus"1 2 y probar si todos
los trminos do pueden ser eliminados de la expresin de la relacin, as conforme que la
cantidad deseada es estimable desde la frecuencia de datos.
Usar una red de bayesian puede salvar las cantidades considerables de la memoria, si las
dependencias en el reparto conjunto estn escasas. Por ejemplo, una manera ingenua de
guardar las probabilidades condicionales de 10 variables con dos valores como una tabla
requiere el espacio de almacenamiento para
valores. Si las distribuciones locales
de ninguna variable depende de ms de 3 variables padre, la representacin de la red de
bayesiana solamente tiene que almacenar a lo sumo
valores.
Una ventaja de las redes bayesianas es que es intuitivamente ms fcil para un ser humano
comprender (un conjunto escaso de) dependencias directas y distribuciones locales que la
distribucin conjunta completa.
Aplicaciones:
Las redes Bayesianas se utilizan para el modelado del conocimiento en biologa
computacional y bioinformtica (redes reguladoras de genes, la estructura de la protena, la
expresin de genes de anlisis,15 el aprendizaje de epistasis a partir de los conjuntos de
datos de GWAS16 ), la medicina,17 biomonitoreo,18 la clasificacin de documentos,
recuperacin de informacin,19 la bsqueda semntica,20 el procesamiento de imgenes,
fusin de datos, sistemas de soporte de decisiones,21 la ingeniera, los juegos y la ley.
La independencia Condicional se verifica mediante el criterio de separacion-D.
Antes de definir formalmente la separacion-D, es necesario distinguir tres tipos de nodos de
acuerdo a las direcciones de los arcos que inciden en el nodo:
Nodos en secuencia: X -> Y ->Z.
Nodos divergentes: X<- Y ->Z.

Nodos convergentes: X ->Y<-Z.
Clasificadores Bayesianos
Un clasificador, en general, suministra una funcin que mapea (clasifica) un dato (instancia),
especificado por una serie de caractersticas o atributos, en una o
Clasificador Bayesiano Simple

Un clasificador bayesiano obtiene la probabilidad posterior de cada clase, Ci, usando la regla
de Bayes, como el producto de la probabilidad a priori de la clase por la probabilidad
condicional de los atributos (E) dada la clase, dividido por la probabilidad de los atributos:
El clasificador bayesiano simple (CBS) se basa en la suposicin de que todos los atributos
son independientes dada la clase; esto es, cada atributo Xi es condicionalmente
independiente de los dems atributos dada la clase:
Bajo estas consideraciones, la ecuacin 2 se puede escribir como:
Donde P(X) se puede considerar como una constante de normalizacin.

El CBS reduce drsticamente la complejidad del clasificador bayesiano en espacio y tiempo
de clculo. En cuanto a espacio de memoria, se requiere la probabilidad previa de las m
clases (vector de 1Xm), y las n probabilidades condicionales de cada atributo dada la clase
(si suponemos que los atributos son discretos con K posibles valores, esto implica N matrices
de mXk). Bsicamente el espacio requerido aumenta linealmente con el Nmero de
atributos. Tambin el clculo de la probabilidad posterior se vuelve muy eficiente, ya que se
requieren del orden de n multiplicaciones para calcular la probabilidad posterior de cada
clase dados los atributos (complejidad lineal).
Clasificador Bayesiano Semi-Simple

La idea del clasificador bayesiano semi-simple(CBSS) es transformar la estructura bsica del
clasificador bayesiano simple para lidiar con atributos que no son independientes, pero a la
vez mantener la misma eficiencia del CBS. Para esto, se propone una metodologa que
mejora la estructura inicial del CBS, mediante transformaciones locales a dicha estructura.
Se consideran dos operaciones bsicas: (i) eliminar una variable (un nodo si lo vemos como
un grafo), (ii) unir dos variables en una sola (combinar dos nodos). La idea se ilustra en
forma grfica en la figura 3; y abajo se explican a detalle ambas operaciones.
Eliminacin de una variable consiste simplemente de eliminar un atributo, Xi del clasificador,
lo que puede ser por dos razones: (a) el atributo no es relevante para la clase, (b) el atributo
no es independiente de algn otro atributo, Xj. La razn para (b) es que si dos atributos son
altamente dependientes, dan bsicamente la misma informacin, as que uno es redundante
y se puede eliminar.
Clasificacin Visual De Piel

La deteccin de personas en imgenes tiene muchas aplicaciones actualmente, como en
sistemas de seguridad, interaccin hombre-mquina, reconocimiento de ademanes, etc. Una
forma muy sencilla y rpida de contar con un detector inicial de personas es el clasificar los
pixeles de la imagen en Piel o no piel en base a sus atributos de color.
Este clasificador puede ser suficiente en algunas aplicaciones, y en otras proveer un
procesamiento inicial de la imagen, para luego utilizar otros mtodos ms sofisticados en las
regiones Candidatas.
Usualmente loas pixeles en una imagen digital se representan como la combinacin de 3
colores primarios: Rojo (R), Verde (G) y Azul (B), en lo que se conoce como el modelo RGB
(iniciales en ingles). Cada componente de color puede tomar diferentes valores numricos
usualmente en el rango 0:::255.
De esta forma podemos construir un CBS para piel tomando estos 3 atributos: R, G, B. Sin
embargo, existen otras representaciones o modelos de color, como HSV, Y IQ, etc. As que
puede ser que otro modelo de mejores resultados, e incluso un combinacin de atributos de
diferentes modelos.

Procesos Estocasticos

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Procesos Estocasticos

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Procesos Estocasticos

Cargado por

Copyright:

Formatos disponibles

Universidad De Guayaquil

Facultad De Ciencias, Matemticas Y Fsicas

Existen algoritmos eficientes que llevan a cabo la inferencia y el aprendizaje en redes

Como est sealado explcitamente en el numerador del ejemplo, la funcin de probabilidad

de la distribucin de pre-intervencin. Como era de

Nodos divergentes: X<- Y ->Z.

Clasificador Bayesiano Simple

Donde P(X) se puede considerar como una constante de normalizacin.

Clasificador Bayesiano Semi-Simple

Clasificacin Visual De Piel

También podría gustarte