Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Material de Estudio Actividad 3.2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 46

ITs

UED Simulacin UNIDAD 3: GENERACIN DE VARIABLES ALEATORIAS


[8]

3.2 GENERACIN VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

Cuando se establecen las bases racionales subyacentes al empleo de los mtodos existentes para generar valores de variables aleatorias en una computadora digital, se parte de dos problemas un tanto divergentes. Estos dos problemas de tipo distinto se pueden clasificar convenientemente como determinsticos, es decir, no probabilsticos o bien, como estocsticos. En la actualidad se ha popularizado el trmino Monte Carlo como sinnimo para el concepto simulacin de procesos estocsticos. Sin embargo, conviene anotar que en el pasado, este trmino se aplic tan slo al emplear los mtodos de simulacin estocstica para la resolucin de problemas estrictamente determinsticos.

En un principio, lo mtodos de simulacin estocstica fueron aplicados por los matemticos y los cientficos relacionados con las reas de la Fsica, para resolver ciertos problemas determinsticos que se podan expresar mediante ecuaciones matemticas para las cuales sus soluciones no resultaban fciles de obtener, utilizando los criterios convencionales de los mtodos numricos o analticos. Cabe considerar el hecho de que para cierto nmero de problemas matemticos de importancia reconocida, existe la posibilidad de que, una vez encontrado un proceso estocstico cuya distribucin de probabilidad o cuyos parmetros satisfagan las propiedades matemticas que se requieran, quedan resueltas las ecuaciones que caracterizan a estos problemas. An ms, desde un punto de vista computstico pudiera resultar ms eficiente construir tal tipo de procesos a la vez que generar su estadstica, empleando la computadora en lugar de seguir los mtodos

convencionales. Entre los problemas matemticos determinsticos para los que se ha encontrado que la simulacin estocstica resulta til en la obtencin de soluciones, se cuentan: evaluacin de las integrales mltiples, la solucin de ecuaciones de

Material de Estudio

Ing. Arturo Flores Orozco

ITs
UED Simulacin diferencias de orden superior, problemas complejos relacionados con fenmenos de espera y problemas de planeacin en talleres.

Pese a que existen mtodos analticos para resolver cada uno de estos problemas, los de simulacin han demostrado ser mucho ms efectivos que otros mtodos conocidos que se pueden llamar ortodoxos. Conviene hacer notar que las soluciones que se obtienen mediante la simulacin no aportan ms ventajas que las soluciones analticas estndar para un mismo problema. La simulacin, por lo tanto, es simplemente una tcnica de anlisis numrico que se debe preferir slo si su eficiencia relativa al proporcionar soluciones numricas resulta ser superior a la de otras tcnicas.

El segundo tipo de problemas que se presta a la solucin con los mtodos de simulacin estocstica, surge en aquellas situaciones en las que se requiere un cierto mtodo de muestreo estocstico, aunque la toma de una muestra resulta imposible o econmicamente impracticable. Tal puede ser el caso relacionado con los datos obtenidos sobre las fallas de la maquinaria en una industria en la que no se dispone de archivos precisos, relativos a la historia de una mquina o mquinas en particular; o bien, la informacin no conocida sobre la demanda para cierta fecha futura que tendr algn producto de una compaa. En ambos casos estos datos estadsticos son imposibles de obtener; sin embargo, quiz se disponga de cierto conocimiento respecto a la poblacin en la que se originan los datos. Por ejemplo, puede haber sido observado que el tiempo entre las fallas de una mquina, es posible aproximarlo por medio de una distribucin de probabilidad exponencial negativa. La caracterstica que permite diferenciar entre este tipo de simulacin y el experimento de muestreo en el sentido clsico, es la que proporciona el modelo estocstico. La simulacin estocstica comprende la construccin de un modelo probabilstico del proceso bajo estudio, mientras que el experimento de muestreo clsico en estadstica, con frecuencia es operado directamente sobre los datos escuetos.

Material de Estudio

Ing. Arturo Flores Orozco

ITs
UED Simulacin

La generacin de estadsticas simuladas, o sea de valores de las variables aleatorias, tienen una naturaleza enteramente numrica y debe configurarse mediante la aportacin de nmeros pseudoaleatorios. Estos nmeros se introducen al proceso o sistema bajo estudio (en donde el sistema se representa por un modelo probabilstico) a fin de obtener ciertas cifras (o valores de las variables aleatorias) de las cuales se obtengan las respuestas.

Como regla general, el proceso de simulacin estocstica comprende una actividad de reemplazo del universo estadstico de elementos que se emplean en el sistema por su contraparte terica, un universo descrito por una distribucin probabilstica supuesta (por ejemplo, una distribucin normal), seguido de un muestreo efectuado sobre esta poblacin terica, con la ayuda de cierto tipo de generador de nmeros aleatorios.

Sin embargo, en algunos casos es posible que sea difcil encontrar una distribucin terica convencional que describa un proceso estocstico particular o alguno de los componentes de dicho proceso. En estos casos, el proceso estocstico se puede reproducir (o si se quiere, simular) tan slo mediante un muestreo aplicado sobre las distribuciones empricas en lugar de considerar alguna de las distribuciones tericas conocidas. (Obviamente, esta consideracin presupone la existencia de de datos empricos). Resulta aconsejable el empleo, en primer lugar, de las distribuciones tericas convencionales y si ninguna de ellas describe adecuadamente el comportamiento del proceso, entonces se deber, necesariamente, recurrir a distribuciones empricas.

Al considerar los procesos estocsticos que involucran variables continuas o discretas, pero siempre de tipo aleatorio, se define una funcin F (x) llamada funcin de distribucin acumulativa de x, la cual denota la probabilidad de que una variable aleatoria X tome un valor menor o igual a x.

Material de Estudio

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Si la variable aleatoria es discreta, entonces x tendr valores especficos y F (x) ser una funcin escalonada. Si F (x) es continua en el dominio de x, entonces esta funcin se podr diferenciar, para lo cual se define f (x) = dF (x) / dx. La derivada f(x) recibe el nombre de funcin de densidad de probabilidad . La funcin de distribucin acumulativa se puede proponer matemticamente como sigue:

Donde F (x) se define en el intervalo 0

F (x)

1 y f (t) representa el valor de

la funcin de densidad de probabilidad de la variable aleatoria X cundo X = t.

Los valores (nmeros pseudoaleatorios) de las variables aleatorias distribuidas uniformemente en el intervalo (0, 1) juegan un papel muy importante en la generacin de los valores de las variables aleatorias, obtenidas a partir de otros tipos de distribucin de probabilidad. Generalmente, se denota r a los valores de variables aleatorias uniformes cuando 0 r 1 y F (r) = r

Se tienen tres mtodos bsicos para generar los valores de variables aleatorias a partir de las distribuciones de probabilidad: el mtodo de la transformada inversa, el de rechazo y el de composicin. Estos mtodos o alguna de sus variantes respectivas, proporcionan la base general para simular la mayora de las distribuciones de probabilidad.

3.2.1 Mtodos para generar variables aleatorias: transformada inversa, aceptacin rechazo, convolucin, directos.

Material de Estudio

Ing. Arturo Flores Orozco

ITs
UED a) El mtodo de la transformada inversa
[8]

Simulacin

Si se desea generar los valores xi de las variables aleatorias a partir de cierta estadstica de poblacin cuya funcin de densidad est dada por f (x), en primer lugar se debe obtener la funcin de distribucin acumulativa F (x) (vase la figura 3.13). Puesto que F (x) se define sobre el rango de 0 a 1, se pueden generar nmeros aleatorios distribuidos uniformemente y adems hacer F (x) = r. Resulta claro, entonces, cmo queda x determinada unvocamente por r = F (x).

F (x) = r

r0

x x0 Figura 3.13 Una funcin de distribucin acumulativa

Sigue, por lo tanto, que para cualquier valor particular de r, que se genere, por ejemplo r0, siempre es posible encontrar el valor de x; en este caso x0, que corresponde a r0 debido a la funcin inversa de F, si es conocida. Esto es:

Donde

es la transformacin inversa (o mapeo) de r sobre el intervalo

unitario en el dominio de x. Si se generan nmeros aleatorios uniformes Material de Estudio 5 Ing. Arturo Flores Orozco

ITs
UED Simulacin correspondientes a una F(x) dada, se puede resumir, matemticamente, este mtodo como sigue:

Entonces:

Y consecuentemente densidad de probabilidad.

es una variable que tiene a f (x) como funcin de Este criterio equivale a resolver la ecuacin

en x, en trminos de r.

b) El mtodo de aceptacin rechazo

[8]

Si f (x) es una funcin acotada y x tiene adems un rango finito, como a x b, entonces se puede utilizar la tcnica de aceptacin rechazo para

generar los valores de variables aleatorias. La aplicacin de esta tcnica requiere que se proceda de acuerdo con las siguientes etapas:

1. Normalizar el rango de f mediante un factor de escala c tal que:

2. Definir a x como una funcin lineal de r, o sea:

3. Generar parejas de nmeros aleatorios ( r1, r2). Material de Estudio 6 Ing. Arturo Flores Orozco

ITs
UED Simulacin

4. Siempre que se encuentre una pareja de nmeros aleatorios que satisfagan la relacin:

Dicho par ser aceptado y se utilizar a: generado de la variable aleatoria.

como el valor

La teora sobre la que se apoya este mtodo se basa en el hecho ya conocido relativo a la probabilidad de que r sea menor o igual a ; siendo este:

En consecuencia, si x se elige al azar dentro del rango (a, b) de acuerdo con la ecuacin y en el caso de que se rechaza, la funcin

de densidad de probabilidad de los valores de x aceptados deber ser igual a f(x). Tocher ha demostrado que la esperanza matemtica del nmero de intentos que se realizan, antes de encontrar una pareja exitosa, es igual a 1/c. Esto implica que para ciertas funciones de densidad de probabilidad este mtodo puede resultar sumamente ineficaz.

c) El mtodo de convolucin

La distribucin de probabilidad de la suma de dos o ms variables aleatorias independientes es llamada una convolucin de las distribuciones de las variables originales. El mtodo de convolucin por lo tanto se refiere a la adicin de dos o ms variables aleatorias juntas para obtener una nueva variable aleatoria con la distribucin deseada
[2]

Material de Estudio

Ing. Arturo Flores Orozco

ITs
UED Simulacin La idea del mtodo de convolucin es expresar la muestra que se desea como suma estadstica de otras variables aleatorias fciles de muestrear
[12]

Entonces el mtodo de convolucin se puede expresar como

[1]

d) Mtodos directos [3]

Existen algunas distribuciones como la distribucin erlang, la distribucin normal, etc., cuya simulacin a travs del mtodo de la transformada inversa sera demasiado complicada. Para stas y algunas otras distribuciones, es posible utilizar algunas de sus propiedades para facilitar y agilizar el proceso de generacin de nmeros al azar.

Depender as entonces de la variable aleatoria a simular, el mtodo directo que se emplee para la generacin de los valores correspondientes a dicha variable aleatoria. 3.2.1.1 Generacin de variables aleatorias discretas. [8]

Se encuentra definido un nmero muy significativo de distribuciones de probabilidad para variables aleatorias que solamente toman valores discretos, esto es, enteros no negativos. La distribucin acumulativa de probabilidad para una variable aleatoria discreta X se define de manera muy similar a la de la ecuacin :

Material de Estudio

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Donde f(x) es la frecuencia o funcin de probabilidad de X, definida por valores enteros x tales que:

f(x) = P(X = x) , , ,

Para x

Las distribuciones discretas de probabilidad son muy tiles cuando se les emplea como modelos estocsticos para ciertos procesos de conteo, ya sea sobre muestras finitas o no finitas, donde la presencia o ausencia de un atributo dicotmico est gobernada por el azar. Desde un punto de vista emprico las distribuciones discretas pueden tambin ocurrir como resultado de redondear medidas continuas sobre una escala discreta. Sin embargo, estrictamente hablando, las distribuciones discretas de probabilidad resultan ser los modelos ms apropiados para fenmenos aleatorios cuando los valores de las variables aleatorias se pueden determinar por medio de procesos de conteo.

a) Distribucin Poisson

Si se toma una serie de n ensayos independientes de Bernoulli, en cada uno de los cuales se tenga una probabilidad p muy pequea relativa a la ocurrencia de un cierto evento, a medida que n tiende al infinito, la probabilidad de x ocurrencias est dada por la distribucin de Poisson:

, , ,

Material de Estudio

Ing. Arturo Flores Orozco

ITs
UED Simulacin Siempre y cuando se permita que p se aproxime a cero de manera que se satisfaga la relacin consistentemente. Se sabe que np es el valor esperado es el valor esperado de la

de la distribucin binomial y se puede demostrar que

distribucin de Poisson. De hecho, tanto el valor esperado como la variancia de la distribucin de Poisson coinciden en el valor . Tambin se puede demostrar que si x es una variable de Poisson con parmetro , entonces para valores muy grandes de , se puede utilizar la distribucin normal con y para

aproximar la distribucin de x.

Los eventos que se distribuyen en forma poissoniana ocurren frecuentemente en la naturaleza; por ejemplo, el nmero de aeroplanos que descienden en un aeropuerto en un perodo de veinticuatro horas puede ser considerablemente grande. Aun as, resulta muy pequea la probabilidad de que un avin aterrice durante un segundo determinado. Por lo tanto, se puede esperar que en un perodo determin do, l pro ilid d de que desciend n , , , viones, obedecer a las

leyes de la distribucin de Poisson. Esta distribucin es particularmente til cuando se trata con problemas en los que se da la ocurrencia de eventos aislados sobre un intervalo continuo de tiempo, o bien cuando resulta posible prescribir el nmero de veces que ocurre un evento aunque no el nmero de veces que no ocurre.

Para simular una distribucin de Poisson con parmetro

, se puede servir

ventajosamente de la relacin conocida entre las distribuciones exponenciales y de Poisson. Se puede justificar que si 1) el nmero total de eventos que ocurren durante un intervalo de tiempo dado es independiente del nmero de eventos que ya han ocurrido previamente al inicio del intervalo y 2) la probabilidad de que un evento ocurra en el intervalo de t a t + es aproximadamente para todos los valores de

t, entonces: a), la funcin de densidad del intervalo t entre las ocurrencias de eventos consecutivos es el tiempo t es: e , y b), la probabilidad de que ocurran x eventos durante

Material de Estudio

10

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Para toda x y para toda t.

Considrese un horizonte de tiempos que se inicia en el origen 0 como punto de referencia y que se ha dividido en intervalos unitarios, como se ilustra en la figura 3.14. Supngase tambin que los eventos ocurren a lo largo del mencionado horizonte y que se denota por el smbolo ( ). Se supondr que el intervalo t entre eventos obedece a una distribucin exponencial cuyo valor esperado es igual a .

Con estos antecedentes se implica que el nmero de eventos x que ocurren durante un tiempo unitario seguirn una distribucin de Poisson cuyo valor esperado estar dado por .

t= 1 t1 t2 t3 t4 t5 t6

t= 1 t7 t8

X= 1

X= 2

X= 3

X= 4

X= 1

X= 2

X= 3

X= 1

Figura 3.14 Eventos distribuidos en forma poissoniana, sobre una escala de tiempo.

Un mtodo para generar valores de variable aleatoria con distribucin de Poisson deber considerar la generacin de intervalos t1, t2, t3, , distribuidos en forma exponencial con un valor esperado igual a 1. Una vez generados estos intervalos aleatorios, se acumulan hasta que su suma exceda al valor de .

En trminos matemticos el valor poissoniano x se determina haciendo uso de la siguiente desigualdad: Material de Estudio 11 Ing. Arturo Flores Orozco

ITs
UED Simulacin

, , ,

Donde los valores de la variable aleatoria ti se generan por medio de la frmula: lo

Con una media unitaria.

Un mtodo ms rpido para generar los valores poissonianos x es el que consiste en reformular la ecuacin manera siguiente: , , , de la

b) Distribucin binomial

Las variables aleatorias definidas por el nmero de eventos exitosos en una sucesin de n ensayos independientes de Bernoulli, para los cuales la probabilidad de xito es p en cada ensayo, siguen una distribucin binomial. Este modelo estocstico tambin se puede aplicar al proceso de muestreo aleatorio con reemplazo, cuando los elementos muestreados tienen slo dos tipos de atributos (por ejemplo si y no, o respuestas como defectuoso o aceptable). El diseo de una muestra aleatoria de n elementos es anloga a n ensayos independientes de Bernoulli, en los que x es un valor binomial que est denotando al nmero de elementos de una muestra de tamao n con atributos idnticos. Es sta la analoga

Material de Estudio

12

Ing. Arturo Flores Orozco

ITs
UED Simulacin que sita la distribucin binomial como uno de los modelos ms importantes en las reas del muestreo estadstico y del control de calidad.

La distribucin binomial proporciona la probabilidad de que un evento o acontecimiento tenga lugar x veces en un conjunto de n ensayos, donde la probabilidad de xito est dada por p. La funcin de probabilidad para la distribucin binomial se puede expresar de la manera siguiente:

Donde x se toma como un entero definido en el intervalo finito , , , que se le asocia el valor q = (1 p)

n, y al

El valor esperado y la variancia de la variable binomial X son:

La segunda expresin implica que la variancia de las variables binomiales siempre tiene un valor menor al de la media. An ms, ntese cmo se define en la ecuacin correspondiente de n q. q la distribucin de (n x) con un valor esperado

Cuando se conocen la media y la variancia, resulta inmediata la determinacin de p y de n, las cuales pueden calcularse como sigue:

Material de Estudio

13

Ing. Arturo Flores Orozco

ITs
UED n Simulacin

La distribucin normal proporciona, cuando n es muy grande, una buena aproximacin para la distribucin binomial. Puesto que con la distribucin normal resulta posible manipular valores negativos, a fin de hacer un buen uso de tal distribucin, la probabilidad de registrar observaciones negativas deber ser despreciablemente pequea.

En la prctica esto significa que el valor esperado deber ser por lo menos tres veces mayor que la desviacin estndar, o sea:

Lo cual implica que n

Los valores de variable aleatoria con distribucin binomial se pueden generar de muy diversos modos, aunque uno de los mtodos ms simples, que en el caso de que el valor de n sea moderado resulta uno de los mtodos ms eficientes, es el basado en la reproduccin de ensayos de Bernoulli, siguiendo el mtodo de aceptacin rechazo. Este mtodo empieza con valores conocidos de p y de n y

consiste en generar n nmeros aleatorios despus de fijar x0 igual a cero. Para cada nmero aleatorio ri se efecta una prueba y la variable xi se incrementa

de acuerdo con el siguiente criterio:

xi = xi

+ 1

si ri

xi = xi

si ri > p

Material de Estudio

14

Ing. Arturo Flores Orozco

ITs
UED Simulacin Despus de haberse generado n nmeros aleatorios, el valor de xn ser igual al valor de la variable aleatoria con distribucin binomial x. Este procedimiento se puede repetir tantas veces como valores binomiales se requieran.

Un segundo mtodo para generar valores binomiales es el que se basa en las sumas aleatorias de valores de variables aleatorias con distribucin geomtrica, con lo cual se obtiene el nmero de xitos en n ensayos. En el caso de que p sea pequeo, este mtodo puede ser mucho ms rpido.

c) Distribucin geomtrica

Entre las primeras y probablemente ms simples de las formulaciones matemticas de procesos estocsticos, se encuentra la llamada de ensayos de Bernoulli. Estos ensayos son experimentos independientes al azar, en los que el resultado de cada ensayo queda registrado, ya sea como un xito o un fracaso. La probabilidad de xito se denota por p ( p ) y se supone que p es constante

para cualquier sucesin particular de ensayos.

La probabilidad de un fracaso se denota por q, donde:

q = 1

Una sucesin de ensayos Bernoulli, combinada con cierto proceso de conteo, viene a constituir la base conceptual para una gran familia de distribuciones discretas de probabilidad, incluyendo la geomtrica, binomial negativa, Poisson y otras distribuciones binomiales. Los valores de variable aleatoria que se generan al contar el nmero de fracasos en una sucesin de ensayos (o eventos) antes de que ocurra el primer xito, son valores de variable aleatoria que se ajustan a una distribucin geomtrica. La distribucin geomtrica de probabilidad tiene un gran valor y utilidad

Material de Estudio

15

Ing. Arturo Flores Orozco

ITs
UED Simulacin en el rea del control estadstico de calidad, as como tambin para las distribuciones de rezagos y movimientos en modelos economtricos.

La distribucin geomtrica queda descrita por la siguiente funcin de probabilidad: , , ,

Y la funcin de distribucin acumulativa est definida por:

, , , ,

Puesto que por definicin se tiene F(x) = P(X F(0) = p, el rango de F(x) es p F(x .

x), y como P(X = 0) =

Por otra parte, P(X > x) = 1 adems:

F(x), lo que implica que P(X > 0) = q y

El valor esperado y la variancia de la variable geomtrica, estn dados por:

Esta ltima expresin implica que la variancia difiere de la media en un factor de 1 / p. Material de Estudio 16 Ing. Arturo Flores Orozco

ITs
UED Simulacin

La distribucin geomtrica tiene slo un parmetro p, el cual se puede expresar como una funcin de la media EX.

Para generar en una computadora valores de variable aleatoria con distribucin geomtrica se emplea la tcnica de la transformacin inversa y la frmula que aparece en la ecuacin es unitario, resulta que: . Al observar que el rango de la expresin

Y consecuentemente: lo lo

Donde al valor x siempre se le redondea al entero que sea menor. Esto se puede lograr de manera muy simple con slo retener los nmeros hasta antes del punto decimal, o bien convirtiendo los nmeros en modo de punto flotante al de punto fijo. Para generar un valor de variable aleatoria con distribucin geomtrica haciendo uso de esta tcnica, se requiere nicamente el empleo de un nmero aleatorio uniforme, tal como lo muestra la ecuacin: lo lo

Se tiene un mtodo alternativo que utiliza la tcnica de aceptacin

rechazo

para generar valores con distribucin geomtrica, capaces de reproducir los ensayos Material de Estudio Ing. Arturo Flores Orozco

17

ITs
UED Simulacin de Bernoulli en una computadora. Por lo general, se prefiere este ltimo mtodo, en relacin al que se menciona en primer trmino, cuando se requiere una mejor precisin para grandes valores de p. En primer lugar, se define una variable x que se usar como contador, por lo que se le iguala a un valor nulo. A continuacin se genera una sucesin de valores de variable aleatoria uniformes r1, r2, , ri, , l cu l

termina cuando se alcanza un valor de ri que resulta ser menor o igual que p. Para cada valor de ri en la sucesin, que sea mayor que p, se incrementa el valor de x en uno. En otras palabras, se contar el nmero de fallas o sea el nmero de veces que ri tiene un valor mayor que p. Cuando se logra el primer valor de ri menor que p se termina la sucesin y el valor de x corresponde al valor de la variable aleatoria con distribucin geomtrica. Despus de reinstaurar el valor de x a cero se genera una segunda sucesin que conduce a un segundo valor de x.

En lo expuesto anteriormente se defini a x como el nmero de fallas que ocurren antes del primer xito; sin embargo, se puede volver a definir a x en forma tal que incluya, tanto el nmero de fracasos como al primer xito. Pese a que el proceso para generar valores de variable aleatoria con distribucin geomtrica, es similar al procedimiento previamente explicado, las ecuaciones se reformulan de la siguiente manera: , , , , , y

3.2.1.2 Generacin de variables aleatorias continuas. [7]

Hay muchos mtodos diferentes para generar variables aleatorias continuas. La seleccin de un algoritmo particular depender de la distribucin a partir de la cual se Material de Estudio 18 Ing. Arturo Flores Orozco

ITs
UED Simulacin quiere generar, tomando en cuenta factores como la exactitud de las variables aleatorias, las eficiencias de cmputo y almacenaje y la complejidad del algoritmo. a) Distribucin uniforme [8]

Quiz la funcin de densidad de probabilidad ms simple es aquella que se caracteriza por ser constante, en el intervalo (a, b) y cero fuera de l. Esta funcin de densidad define la distribucin conocida como uniforme o rectangular. La distribucin uniforme surge cuando se estudian las caractersticas de los errores por redondeo al registrar un conjunto de medidas sujetas a cierto nivel de precisin. Por ejemplo, si se registran medidas de peso con una aproximacin determinada en gramos, puede suponerse que la diferencia en gramos entre el peso real y el peso registrado corresponde a un cierto nmero entre 0.5 y + 0.5, y que el error se encuentra

distribuido uniformemente en este intervalo. El valor ms sobresaliente que puede tener la distribucin uniforme respecto a las tcnicas de simulacin radica en su simplicidad y en el hecho de que tal distribucin se puede emplear para simular variables aleatorias a partir de casi cualquier tipo de distribucin de probabilidad.

Matemticamente, la funcin de densidad uniforme se define como sigue:

a < x < b f(x) = 0 Fuera del intervalo (a, b)

En esta expresin, X es una variable aleatoria definida en el intervalo (a, b). La grfica de la distribucin uniforme queda ilustrada en la figura 3.15.

La funcin de la distribucin acumulativa F(x), para una variable aleatoria X uniformemente distribuida, se puede representar por:

Material de Estudio

19

Ing. Arturo Flores Orozco

ITs
UED Simulacin

El valor esperado y la variancia de una variable aleatoria uniformemente distribuida estn dados por las siguientes expresiones:

Al efectuar aplicaciones de esta funcin, los parmetros de la funcin de densidad uniforme, esto es, los valores numricos de a y de b, no necesariamente deben ser conocidos en forma directa. En casos tpicos, aunque esto no sucede en todas las distribuciones uniformes, solamente se conoce la media y la variancia de la estadstica que se va a generar. En estos casos, los valores de los parmetros se deben derivar al resolver y el sistema que consta de las ecuaciones

, para a y para b,

pues se supone que EX y VX son conocidos. Este procedimiento, semejante a una tcnica de estimacin conocida en la literatura estadstica como mtodo de momentos, proporciona las siguientes expresiones:

Material de Estudio

20

Ing. Arturo Flores Orozco

ITs
UED Simulacin Para simular una distribucin uniforme sobre cierto intervalo conocido (a, b) se deber, en primer lugar, obtener la transformacin inversa para la ecuacin , . de acuerdo con la ecuacin

f (x)

x a b

Figura 3.15 Grafica de la distribucin uniforme

En seguida se genera un conjunto de nmeros aleatorios correspondiente al rango de las probabilidades acumulativas, es decir, los valores de variables aleatorias uniformes definidas sobre el rango 0 a 1. Cada nmero aleatorio r determina, de manera nica, un valor de la variable aleatoria x uniformemente distribuida.

Para aclarar estas afirmaciones es probable que lo mejor sea presentar una explicacin grfica. La figura 3.16 ilustra cmo cada valor generado de r est asociado con uno y slo un valor de x. Por ejemplo, el valor especfico de la funcin

Material de Estudio

21

Ing. Arturo Flores Orozco

ITs
UED Simulacin de distribucin acumulativa en r0 determina el valor de x en x0. Obviamente, este procedimiento se puede repetir tantas veces como se desee y en cada repeticin se generar un nuevo valor de x.

F (x)

r0

x 0 a x0 b

Figura 3.16

La generacin de valores de variables aleatorias se puede seguir, mediante el uso de probabilidades acumulativas de muchas otras distribuciones. An ms, esta tcnica sirve de base para desarrollar los mtodos ms generales de los procesos de Monte Carlo.

b) Distribucin exponencial

Durante la experiencia diaria, se observa cmo transcurren los intervalos de tiempo definidos entre las ocurrencias de los eventos aleatorios distintos, y sobre la base de un plan de tiempos completamente independientes, se recibe informacin sobre numerosos eventos que ocurren alrededor. Bastara con citar los nacimientos, defunciones, accidentes, o conflictos mundiales, por mencionar slo algunos. Si es

Material de Estudio

22

Ing. Arturo Flores Orozco

ITs
UED Simulacin muy pequea la probabilidad de que ocurra un evento en un intervalo corto, y si la ocurrencia de tal evento es, estadsticamente independiente respecto a la ocurrencia de otros eventos, entonces el intervalo de tiempo entre ocurrencias de eventos de este tipo estar distribuido en forma exponencial.

El hecho de que en el mundo real un proceso estocstico proporcione o no efectivamente valores de variables aleatorias de tipo exponencial, constituye una cuestin emprica cuya confirmacin depende del grado en que se satisfagan las suposiciones que sirven de base a la distribucin exponencial.

Especficamente, para los valores de variables aleatorias de tipo exponencial se deben satisfacer las siguientes suposiciones: 1. La probabilidad de que ocurra un evento en el intervalo , 2. es una constante que no depende de t o de algn otro factor. , ocurra ms de un

es

3. La probabilidad de que durante un intervalo evento, tiende a 0 a medida que que el de .

, y su orden de magnitud deber ser menor

Curiosamente, se ha encontrado que el comportamiento de un considerable nmero de procesos dependientes del tiempo satisfacen las anteriores suposiciones un tanto fuertes. Por ejemplo, el intervalo entre los accidentes en una fbrica, la llegada de pedidos a una compaa, el registro de pacientes en un hospital, el aterrizaje de aviones en un aeropuerto, etc., satisfacen una distribucin exponencial.

Se dice que una variable aleatoria X, tiene una distribucin exponencial, si se puede definir a su funcin de densidad como:

Material de Estudio

23

Ing. Arturo Flores Orozco

ITs
UED Con y Simulacin

La funcin de distribucin acumulativa de X est dada por:

Y la media junto con la variancia de X se pueden expresar como:

En la figura 3.17 aparece la grfica de la distribucin exponencial.

f(x) 1

F(x)

Figura 3.17

Obsrvese que, como la distribucin exponencial solamente tiene un parmetro , es posible expresarlo como: Material de Estudio 24 Ing. Arturo Flores Orozco

ITs
UED Simulacin

Existen muchas maneras para lograr la generacin de valores de variables aleatorias exponenciales. Puesto que F(x) existe explcitamente, la tcnica de la transformacin inversa permite desarrollar mtodos directos para dicha generacin.

Debido a la simetra que existe entre la distribucin uniforme sigue la intercambiabilidad de F(x) y 1 F(x). Por lo tanto:

Y consecuentemente:

lo

lo

Por consiguiente, para cada valor del nmero pesudoaleatorio r se determina un nico valor para x. Los valores de x toman tan slo magnitudes no negativas, debido a que lo p r , y adems se ajustan a la funcin de densidad

exponencial con un valor esperado EX. Conviene hacer notar, que pese a que est tcnica parece en principio muy simple, es preciso recordar que en una computadora digital el clculo del logaritmo natural involucra una expansin en serie de potencias (o una tcnica equivalente de aproximacin) para cada valor de variable aleatoria uniforme que se deba generar.
Comentario [a1]: La tcnica de la transformacin inversa no es el nico mtodo para generar valores de variables aleatorias exponenciales con procedimientos internos.

c) Distribucin normal

La ms conocida y ms ampliamente utilizada distribucin de probabilidad es sin duda la distribucin normal y su popularidad se debe cuando menos a dos

Material de Estudio

25

Ing. Arturo Flores Orozco

ITs
UED razones que presentan sus propiedades generales. L s prue Simulacin s m temtic s

sealan, que bajo ciertas condiciones de calidad , resulta justificado que se espere una distribucin normal mientras que la experiencia estadstica muestre que, de hecho, muy a menudo l s distri uciones se pro im n l norm l

La distribucin normal basa su utilidad en el teorema del lmite central. Este teorema postula que, la distribucin de probabilidad de la suma de N valores de variable aleatoria xi independientes pero idnticamente distribuidos, con medias respectivas y variancias se aproxima asintticamente a una distribucin normal,

a medida que N se hace muy grande, y que dicha distribucin tiene como media y variancia respectivamente, a:

En consecuencia, el teorema del lmite central permite el empleo de distribuciones normales para representar medidas globales operadas sobre los efectos de causas (errores) aditivas distribuidas en forma independiente, sin importar la distribucin de probabilidad a que obedezcan las mediciones de causas individuales. El carcter que se atribuye a esta forma de interpretacin del teorema del lmite central resulta de particular importancia, ya que de esta manera se provee una justificacin matemtica para manipular la evidencia emprica, que tan frecuentemente aparece en los datos distribuidos en forma aproximadamente normal, obtenidos en una gran mayora de problemas de investigacin.

Material de Estudio

26

Ing. Arturo Flores Orozco

ITs
UED Simulacin Otro rasgo valiosamente prctico de la distribucin normal, es su utilidad para aproximar distribuciones de Poisson y binomiales para mencionar slo dos entre muchas. A partir de la distribucin normal, se pueden derivar otras muchas de las distribuciones existentes que juegan un papel muy importante en la estadstica moderna, por ejemplo, la Ji cuadrada, la t, y la distribucin F, las cuales se originan a partir de consideraciones hechas sobre la distribucin de probabilidad de la suma de los cuadrados de un nmero especfico de valores de variables aleatoria con una distribucin normal estndar.

Si la variable aleatoria X tiene una funcin de densidad f(x) dada como:

Con

positiva, entonces se dice que X tiene una distribucin normal o y . En la figura 3.18 se muestra la ya conocida

Gaussiana, con parmetros

grfica con su forma de campana, de la funcin de densidad normal.

Si los parmetros de la distribucin normal tienen los valores

la funcin de distribucin recibir el nombre de distribucin normal estndar, con funcin de densidad:

Cualquier distribucin normal se puede convertir a la forma estndar, mediante la siguiente substitucin:

Material de Estudio

27

Ing. Arturo Flores Orozco

ITs
UED Simulacin

La funcin de distribucin acumulativa F(x) o F(z) no existe en forma explcita; sin embargo, esta ltima se encuentra totalmente tabulada en cualquier libro sobre estadstica.

f(x)

x Figura 3.18 Una distribucin normal.

El valor esperado y la variancia de la distribucin normal no estndar estn dados por:

EX = x VX =
2

Existen varios mtodos para generar en una computadora, valores de variable aleatoria distribuidos en forma normal. Entre los que se encuentran:

El procedimiento del lmite central:

Material de Estudio

28

Ing. Arturo Flores Orozco

ITs
UED A fin de simular una distribucin normal con media x y variancia Si r1, r2, Simulacin
x 2

dadas, se

debe proponer la siguiente interpretacin matemtica del teorema del lmite central. , rN representan variables aleatorias independientes, cada una de las y

cuales posee la misma distribucin de probabilidad caracterizada por E(ri) = Var (ri) = , entonces:

lim

Donde:

Tanto de la definicin de la distribucin normal estndar como de la ecuacin , se sigue que z es un valor de variable aleatoria con distribucin normal estndar.

El procedimiento para simular valores normales utilizando computadoras requiere el uso de la suma de K valores de variable aleatoria distribuidos uniformemente; esto es, la suma de r1, r2, , rK, con cada ri definida en el intervalo

0 < r1 < 1. Aplicando la convencin notacional de la forma matemtica del teorema Material de Estudio 29 Ing. Arturo Flores Orozco

ITs
UED Simulacin del lmite central, as como los conocimientos previos de la distribucin uniforme, se tiene que:

Pero, por definicin, z es un valor de variable aleatoria con distribucin normal estndar que se puede escribir en la forma sugerida por la ecuacin ,

donde x es un valor de variable aleatoria distribuido en forma normal que se va a simular, con media x y variancia , se obtiene: . Igualando las ecuaciones y

Y resolviendo para x, se tiene que:

Material de Estudio

30

Ing. Arturo Flores Orozco

ITs
UED Por lo tanto, mediante la ecuacin Simulacin se

puede proporcionar una formulacin muy simple para generar valores de variable aleatoria normalmente distribuidos, cuya media sea igual a x y variancia . Para

generar un solo valor de x (un valor de variable aleatoria con distribucin normal) bastar con sumar K nmeros aleatorios definidos en el intervalo de 0 a 1. Substituyendo el valor de esta suma en la ecuacin anterior, as como tambin los valores de x y para la distribucin deseada, se encontrar que se ha determinado

un valor particular de x. Ciertamente, este procedimiento se puede repetir tantas veces como valores de variable aleatoria normalmente distribuidos se requieran.

El valor de K que debe aplicarse a las frmulas usualmente se determina al establecer las condiciones de balance entre la eficiencia de cmputo y la precisin. Al considerar la convergencia asinttica implicada por el procedimiento del lmite central, es deseable que K corresponda a un nmero muy grande. Considerando el tiempo que comprende la generacin de K valores uniformes por cada valor de variable aleatoria normal, sera preferible que K estuviera asociada a un nmero muy pequeo.

En la prctica de simulacin se recomienda una K = 10, como el menor valor deseable. Sin embargo, con K = 12 se logra una cierta ventaja computacional, ya que en la ecuacin se puede evitar una

multiplicacin constante. No obstante, este valor de K trunca la distribucin a los lmites +6, y adems, se he encontrado que no es confiable para valores de x mayores que tres de las desviaciones estndar, aunque pese a lo anterior, la experiencia muestra que este criterio conduce a programas de razonable rapidez. Con el fin de obtener mayor precisin se deben considerar valores mayores para K (del orden de K = 24), de acuerdo con la llamada tcnica de aproximacin de Teichroew, aunque en estos casos la eficiencia del procedimiento del lmite central resulta significativamente menor a la de otros criterios.

Material de Estudio

31

Ing. Arturo Flores Orozco

ITs
UED Simulacin

La aproximacin de Teichroew mejora la precisin de las probabilidades de los eventos extremos, obtenidas con el procedimiento del lmite central. Con K = 12 se deber calcular el valor de:

Y el siguiente polinomio servir para obtener el valor de la variable aleatoria z distribuida normalmente:

Donde:

a1 = 3.949846138 a3 = 0.252408784 a5 = 0.076542912 a7 = 0.008355968 a9 = 0.029899776

El procedimiento directo:

Sean r1 y r2 dos valores de variable aleatoria independientes distribuidos de modo uniforme y definidos en el intervalo (0, 1), entonces:

lo

cos

lo

sen

Material de Estudio

32

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Sern dos valores de variable aleatoria obtenidos a partir de una distribucin normal estndar. Con este mtodo se logran resultados exactos y su velocidad de cmputo se puede comparar con la del mtodo del lmite central, sujeto a la eficiencia de ciertas subrutinas para funciones especiales.

El procedimiento rpido:

Se afirma que esta tcnica es la ms rpida, aunque se le imputa que emplea varios cientos de ubicaciones de memoria para almacenar en la computadora ciertas constantes especficas. Las desviaciones aleatorias normales se calculan a partir de la mezcla de tres densidades:

Los fundamentos racionales en los que se basa esta mezcla establecen que del 95 al 87 por ciento del tiempo slo se usa g1(x), lo cual proporciona inmediatamente una variable normal con una tabla de longitud mnima. Las otras dos funciones son considerablemente ms complicadas; si se desean mayores detalles o informacin sobre las constantes que emplea este procedimiento, se pueden encontrar en la referencia: A as o u o G a o mal Ra om a abl s de

Marsaglia G. y MacLaren, M. D.

Tambin pueden emplearse otros caminos, para generar valores de variable aleatoria normales, como el mtodo de rechazos (Von Neumann) y el mtodo de Hastings, aunque ninguno de estos mtodos ofrece ms simplicidad, precisin o rapidez, que los vistos previamente.

Material de Estudio

33

Ing. Arturo Flores Orozco

ITs
UED d) Distribuciones gamma - Erlang Simulacin

Si un determinado proceso consiste de k eventos sucesivos y si el total del tiempo transcurrido para dicho proceso se puede considerar igual a la suma de k valores independientes de la variable aleatoria con distribucin exponencial, cada uno de los cuales tiene un parmetro definido , la distribucin de esta suma y k. La suma de los k

coincidir con una distribucin gamma con parmetros

(donde k es un entero positivo) valores de variable aleatoria con distribucin exponencial con un mismo parmetro , tambin recibe el nombre de distribucin

Erlang. Desde un punto de vista matemtico la distribucin de Erlang no es otra cosa que la convolucin de k distribuciones exponenciales, o sea la distribucin de la suma de k variables exponenciales. Aun ms, si k se adeca a la distribucin binomial negativa o a la distribucin geomtrica, entonces la suma de k valores de variable aleatoria, con la misma , adoptar la forma de una distribucin gamma. La forma ms general de una distribucin gamma se obtiene al considerar a k con valores positivos pero sin que estn restringidos a ser enteros. Casi siempre resulta posible ajustar alguna de las formas de la distribucin gamma a un buen nmero de distribuciones de datos estadsticos sesgados en forma positiva.

La funcin gamma est descrita mediante la siguiente funcin de densidad:

Donde

y x se considera no negativo. Pese a que no existe una

forma explcita para describir la funcin acumulativa de la distribucin gamma, Pearson ha logrado presentar, en forma tabular, los valores de la llamada funcin gamma incompleta. Respecto a la media y la variancia de esta distribucin, sus correspondientes expresiones estn formuladas como sigue:

Material de Estudio

34

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Si k = 1, entonces la distribucin gamma resulta ser idntica a la distribucin exponencial; mientras que si k es un entero positivo, la distribucin gamma coincide con la distribucin Erlang. Conviene tambin anotar que, a medida que k se incrementa, la distribucin gamma tiende, en forma asinttica, a una distribucin normal.

Para generar valores de variable aleatoria con distribucin gamma y con un valor esperado y variancia dados, se pueden emplear las siguientes frmulas a fin de determinar los parmetros de f (x) en la ecuacin:

Debido a que para una distribucin gamma no se puede formular explcitamente una funcin de distribucin acumulativa, se debe considerar un mtodo alternativo para generar valores de variable aleatoria con distribucin gamma. En relacin a tales valores que satisfacen la distribucin Erlang, stos se pueden generar con slo reproducir el proceso aleatorio sobre el cual se basa la distribucin de Erlang. Para lograr este resultado se debe tomar la suma de los k valores de variable aleatoria con distribucin exponencial x1, x2, ,xk, cuyo valor esperado es el mismo e igual a 1 / . Material de Estudio 35 Ing. Arturo Flores Orozco

ITs
UED Simulacin En consecuencia, el valor de la variable aleatoria (Erlang) x se puede expresar como:

En lugar de la ecuacin anterior, se puede utilizar una forma computacional equivalente y ms rpida, que la substituye. Esta expresin corresponde a la siguiente frmula:

El problema de generar valores de variable aleatoria con distribucin gamma cuando el parmetro k no es un entero, queda an en la actividad como un problema por resolverse, ya que en este caso todava no se formula un mtodo estocstico satisfactorio, sin lo cual no puede justificarse algn proceso de simulacin correspondiente. Empero, se delineara uno de los intentos producidos para resolver esta dificultad. Si k es un nmero racional, entonces se lo puede expresar mediante la suma de un entero ms una fraccin, de modo tal que 0 < q < 1; ms an, si , entonces se tiene que , con .

Ntese que slo se considera el caso en que k > 1. Puesto que el valor esperado, la variancia y el tercer momento central de k, la distribucin gamma de parmetro k se puede aproximar con slo considerar una mezcla adecuada de valores de variable aleatoria con distribucin gamma, para la cual se eligen valores de probabilidad q y valores de con probabilidad 1 q. con

Si los valores de k son suficientemente grandes, entonces la aproximacin lograda con este criterio proporcionar resultados ms satisfactorios.

Material de Estudio

36

Ing. Arturo Flores Orozco

ITs
UED e) Distribucin Beta Simulacin

La distribucin Beta corresponde a los cocientes que se producen con dos variables gamma x1 y (x1 + x2), donde x1 y x2 son dos variables independientes gamma a las que corresponde un mismo valor de los parmetros , k1 y k2, respectivamente, de modo que k = (k1 + k2) resulte el parmetro de (x1 + x2). La variable Beta est dada por:

Por lo tanto, para generar un valor de variable aleatoria x con distribucin Beta, se debe obtener el cociente de dos valores de variable aleatoria con distribucin gamma, uno con parmetro k1 y el otro con parmetro k2. La funcin de densidad de la distribucin Beta es:

Con un valor esperado y una variancia iguales a:

Donde a y b corresponden a los parmetros k1 y k2 de los valores de variables aleatorias con distribucin gamma, que cumplen la ecuacin:

Material de Estudio

37

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Esta distribucin Beta tiene una amplia aplicacin, principalmente en los programas referentes al empleo de las tcnicas de camino crtico, como por ejemplo PERT. Con estos mismos principios se puede obtener una versin generalizada de la distribucin Beta, llamada distribucin de Dirichlet, para la cual basta considerar en el modelo ms de dos cocientes no constantes. Este caso suele surgir al simular vectores fijos o renglones de matrices estocsticas cuyas entradas estn asociadas a situaciones de probabilidad variable, as como tambin, cuando se modelan composiciones aleatorias de ciertas unidades fsicas que se encuentran subdivididas en partes o componentes distribuidas al azar.
[1]

f) Distribucin triangular

A partir de la funcin de densidad triangular:

Calcular la probabilidad de cada uno de los segmentos de la funcin::

Material de Estudio

38

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Ya que los segmentos por separado no son funciones de densidad, se ajustan dividiendo por su correspondiente .

Expresando la funcin como una combinacin convexa se obtiene:

Donde:

Primero se integra para aplicar el mtodo de la transformada inversa a cada segmento de la funcin:

Material de Estudio

39

Ing. Arturo Flores Orozco

ITs
UED Simulacin

Luego, despejando x y sustituyendo

en F(x) se obtiene:

Por ltimo, al expresar la ecuacin anterior incluyendo la funcin indicadora se tiene que:

3.2.1.3 Generacin de variables aleatorias empricas. [13]

El mtodo preciso para generar variables de una distribucin depender, por supuesto, de la forma de la distribucin y los valores numricos que se estimaron o especificaron para sus parmetros, pero hay algunas ideas generales que tienen aplicacin en la mayor parte de las distribuciones. Debido a que la puesta en prctica es un poco diferente para variables aleatorias discretas y continuas, se considerarn por separado.

Material de Estudio

40

Ing. Arturo Flores Orozco

ITs
UED a) Distribuciones discretas empricas Simulacin

Se comenzar considerando las variables aleatorias discretas. Para tomar un ejemplo simple, suponer que se desea generar una variable aleatoria discreta X con valores posibles 2, 0 y 3 con funcin de masa de probabilidad (PMF, por sus siglas

en ingls) dada por:

Puesto que las probabilidades en una funcin de masa de probabilidad tienen que sumar 1, se puede dividir el intervalo unitario [0, 1] en subintervalos con amplitudes iguales a los valores individuales dados por la funcin de masa de probabilidad, en este caso, [0, 0.1), [0.1, 0.6) y [0.6, 1]. Si se genera un nmero aleatorio U, se distribuir de modo uniforme en el intervalo completo [0, 1], de modo que caer en el primer subintervalo con probabilidad 0.1 probabilidad 0.6 0 = 0.1, en el segundo con 0.6 = 0.4. As, se

0.1 = 0.5 y en el tercero con probabilidad 1

establecera X en su primer valor, suceder con probabilidad 0.1 = p(

2, si U cae en el primer subintervalo, lo cual 2), como se desea. De manera similar, se

establece X en 0 si U cae en el segundo subintervalo (probabilidad 0.5) y se establece X en 3 si U cae en el tercer subintervalo (probabilidad 0.4). Este proceso, que es correcto para generar X con la distribucin deseada, se ilustra en la figura 3.19.

Otra forma de examinar este algoritmo es invirtiendo, en un sentido, la funcin de distribucin acumulada (Cumulative Distribution Function, CDF) de X,

F(x) = P(X

x), como se ilustra en la figura 3.20. Primero, generar un nmero

aleatorio U, despus graficarlo en el eje vertical, luego leer en la grfica (izquierda o derecha) hasta encontrar uno de los saltos en la funcin de distribucin acumulada y, por ltimo, leer y devolver X como (= 2, 0 o 3 en este ejemplo). En el ejemplo

Material de Estudio

41

Ing. Arturo Flores Orozco

ITs
UED Simulacin mostrado, U cae entre 0.6 y 1, y se obtiene una variable X = 3. ste es claramente el mismo algoritmo descrito antes mostrado en la figura 3.19, pero prepara las cosas para generar variables aleatorias continuas.

0.1

0.5

0.4

U: Us o 0.0 0.1 1.0 de fu X= 3 nc X = 2 X= 0 io ne s Figura 3.19 Generacin de una variable aleatoria discreta de pr ob ab ili F(x) da 1.0 d U 0.6

0.1 x 2 0 3 Grupo X = 3

Figura 3.20 Generacin de una variable aleatoria discreta va inversin de la funcin de distribucin acumulada

Material de Estudio

42

Ing. Arturo Flores Orozco

ITs
UED Simulacin Este mtodo, examinndolo en cualquiera de las formas anteriores, se generaliza claramente a cualquier distribucin discreta con un nmero finito de posibles . De hecho, se puede usar incluso si la cantidad de es infinita. En

cualquier caso, el trabajo real se reduce a cierta clase de bsqueda para hallar el subintervalo [0, 1] en el cual cae un nmero aleatorio U, luego de volver X como la apropiada. Si el nmero de variables es grande, esta bsqueda se puede volver

lenta, en cuyo caso hay mtodos diferentes por completo para la generacin de variables.

b) Distribuciones continuas empricas

Considerando ahora la generacin de variables a partir de una distribucin de probabilidad continua, en tal caso, no se puede pensar en trminos de la probabilidad de obtener (exactamente) un valor particular devuelto puesto que esta probabilidad siempre ser cero. En cambio, se necesita pensar en trminos de la X devuelta localizada entre dos valores. Como un ejemplo especfico, tomar la distribucin exponencial con media = 5, que tiene funcin de densidad de probabilidad (PDF):

Y una funcin de distribucin acumulada:

Para generar una variable X de esta distribucin, iniciar (como siempre) creando un nmero aleatorio U. Despus igualar U a la funcin de distribucin acumulada (evaluada en la incgnita X) y despejar X en trminos del valor de U (no conocido):

Material de Estudio

43

Ing. Arturo Flores Orozco

ITs
UED Simulacin

(Obviamente, reemplazar el 5 con cualquier valor de

le da la forma

general para generar una variable exponencial). Esta solucin para X en trminos de U se llama funcin de distribucin acumulada inversa de U, escrita como X = F 1(U) [= 5 ln (1 U) en el ejemplo], puesto que esta transformacin desh ce para U lo

que F hace para X.

El algoritmo de la funcin de distribucin acumulada inversa para este ejemplo se muestra en la figura 3.21 (notar la similitud para el caso discreto en la figura 3.20). Primero generar un nmero aleatorio U, graficarlo en el eje vertical, luego leer en la grfica para obtener X, que es claramente la solucin para la ecuacin U = F(X).

Para ver por qu este algoritmo es correcto, se necesita demostrar que la variable X devuelta caer a la izquierda de cualquier valor fijo con probabilidad

igual a F( ), porque esto es precisamente lo que significa para la funcin de distribucin acumulada de X ser F. De la figura 3.21, se ve que, puesto que F es una funcin creciente, se obtendr si y slo si se extrae una U que es y ; la figura 3.21 ilustra esto para tal valor de U. As, los eventos

son equivalentes, por lo tanto deben tener la misma probabilidad. Pero puesto que U est distribuida de modo uniforme en [0, 1], ser con probabilidad ,

Material de Estudio

44

Ing. Arturo Flores Orozco

ITs
UED debido a que como se desea. se halla entre 0 y 1. As, P(variable devuelta X es Simulacin )= ,

1.0

F(x)

0.5 U

0.0 0

10

15

20

Figura 3.21 Generacin de una variable aleatoria continua va inversin de la funcin de distribucin acumulada

Aunque podra parecer extrao, hay en realidad una atraccin intuitiva hacia este algoritmo. Lo que se desea es que las X devueltas sigan la funcin de densidad , as que se quieren muchas X donde es alta y no muchas donde es

baja. Ahora la funcin de distribucin acumulada F(x) es la integral (indefinida) de la funcin de densidad de probabilidad (funcin pendiente) de F(x). As, donde pronunciada; donde ; en otras palabras, es la derivada

es alta, la pendiente de F(x) ser

es baja, F(x) ser creciente slo de manera lenta (es decir, comienza en su punto ms alto

con poca pendiente). En el ejemplo exponencial,

en x = 0 y luego desciende; por lo tanto, F(x) se incrementa de manera abrupta justo a la derecha de 0, y luego se aplana su pendiente conforme se avanza a la derecha, que es donde se vuelve ms pequea. Ahora, ubicarse en la figura 3.21 y

Material de Estudio

45

Ing. Arturo Flores Orozco

ITs
UED Simulacin pararse justo a la derecha del eje vertical. Tomar una manguera de jardn que rociar letras U de modo uniforme a la derecha, y abrir la llave. Cuando las letras U se encuentren con la curva F(x) escurrirn hacia el eje horizontal, aterrizando para definir sus X devueltas. Las letras U dispersadas de modo uniforme tendrn ms probabilidades de chocar con la curva F(x) donde est ms inclinada (en este caso exponencial, al comienzo de su ascenso) puesto que es un objetivo ms grande desde donde se est parado. Slo algunas de las letras U (las ms altas) chocarn con F(x) en su porcin recta superior. As, si se examina dnde cayeron las X, habr ms en la parte izquierda (donde menos en la parte derecha (donde se desea para la presente distribucin. es alta y F(x) asciende abruptamente), y habr es baja y F(x) asciende poco). Esto es lo que

La idea de la funcin de distribucin acumulada inversa funciona, en principio, para cualquier distribucin continua. Pero, dependiendo de la distribucin particular, ponerla en prctica podra no ser fcil. Algunas distribuciones, a diferencia del ejemplo exponencial anterior, no tienen frmula de forma cerrada para la funcin de distribucin acumulada F(x), as que no es posible una frmula simple para generar las X (un ejemplo notable de esto es la distribucin normal). Sin embargo, en muchos casos, se pueden usar mtodos numricos para aproximar la solucin de U = F(X) para X a un grado muy alto de exactitud (con equivocacin menor que el error de redondeo de la computadora). Hay tambin mtodos completamente diferentes para generar variables que se usan a veces.

Material de Estudio

46

Ing. Arturo Flores Orozco

También podría gustarte