Notas de Clase de Programación Dinámica-Clase 3
Notas de Clase de Programación Dinámica-Clase 3
Notas de Clase de Programación Dinámica-Clase 3
Como ya sabemos este problema consiste en encontrar los valores u0* ; ; uT* óptimos de
la senda de la variable de control (la cual determina a las variables de estado vía la
T
ecuación de transición) que hacen que la suma f ( y ; u ) sea máxima.
t =0
t
t t Nótese que
directamente de la ecuacion de transición. Esto quiere decir que en este caso el control
optimo uT no es determinado resolviendo un problema de optimización, pero todos los
*
determinar yT +1 .
La “función valor optimo” o “función valor” en el instante t del problema (1) mediante
f ( y ;u )
T
Vt ( yt ) = maximizar j
j j
ut ; ;uT
j =t
que representa el máximo del problema (1) a partir del periodo t, t 0;1; ;T
La llamada ecuación de Bellman es:
Al igual que en control óptimo, realizaremos un artificio de forma que eliminemos del
componente 𝛽 𝑡 que acompaña a la función de beneficios.
Particularmente, multiplicaremos a toda la expresión por el recíproco del factor de
descuento.
− tVt ( yt ) = − t maximizar t f (ut ; yt ) + Vt +1 ( yt +1 )
ut
Wt
= maximizar f (ut ; yt ) + Vt +1 ( yt +1 )
− t −1
ut
Wt +1
Es decir,
f g * *
0=
ut
( yt* , ut* ) + W 't +1 ( yt*+1 )
ut
( yt , ut )
f g * *
W 't ( yt ) = ( yt* , ut* ) + W 't +1 ( yt*+1 ) ( yt , ut )
*
yt yt
( t t)
y * = g y * , u*
t +1
■
f g
0= + W 't +1
ut ut
f g
W 't = + W 't +1 (BS)
y t y t
y = g ( y ,u )
t +1 t t
Esta condición con la ecuación de transición nos permite (al menos teóricamente)
resolver algunos problemas de optimización dinámica con factor de descuento. La
ventaja de esta forma de la ecuacion de Bellman es que no involucra potencias de
f g * *
( )
La ecuacion W 't yt =
*
yt
( yt* , ut* ) + W 't +1 ( yt*+1 )
yt
( yt , ut ) se le conoce como ecuación
de Benveniste-Scheinkman (B-S).
Ejemplo
Un individuo cuenta con un stock de ahorro st . Cada periodo el agente retira de sus
ahorros un monto igual a ct para destinarlo al consumo. El stock de ahorro que queda,
st − ct , se deposita en un banco que paga una tasa de interés constante r, 0 r 1. De
este modo en el siguiente periodo el nuevo stock de ahorros será igual a (1 + r )( st − ct )
Esta operación se repite periodo a periodo hasta el momento T . El comportamiento de
los ahorros se expresa a través de la ecuación de movimiento
st +1 = (1 + r )( st − ct ) , t = 0;1; ; T , s0 = A, sT +1 = 0
El problema es entonces
T
maximizar U = t ln ( ct )
t =0
sujeto a st +1 = (1 + r )( st − ct ) , t = 0;1; ; T , s0 = A, sT +1 = 0
La ecuación de Bellman es
𝑊𝑡 (𝑠𝑡 ) = max{ln(𝑐𝑡 ) + 𝛽𝑊𝑡+1 (𝑠𝑡+1 )}
{𝑐𝑡 }
1 ′
( 1) − 𝛽(1 + 𝑟)𝑊𝑡+1 =0
𝑐𝑡
′
(2) 𝑊𝑡′ = 𝛽(1 + 𝑟)𝑊𝑡+1
De (1) tenemos
1 1 1 1
W 't +1 = W 't = .
(1 + r ) ct (1 + r ) ct −1
1 1 1 1
W 't = (1 + r ) W 't +1 = (1 + r )
(1 + r ) ct −1 (1 + r ) ct
1
=
ct
Entonces,
1 1 1 1 (1 + r ) 1 (1 + r )
= = = ct +1 = (1 + r ) ct
(1 + r ) ct −1 ct ct −1 ct ct ct +1
ct +1 = (1 + r ) ct
cuya solución es
𝑡
𝑐𝑡 = 𝐻1 (𝛽(1 + 𝑟))
Es decir,
𝑡
𝑠𝑡+1 = (1 + 𝑟)𝑠𝑡 − (1 + 𝑟)𝐻1 (𝛽(1 + 𝑟))
Solucion
La ley de movimiento, unida con la restricción de recursos, toma la siguiente forma
kt +1 = Akt − ct + (1 − ) kt
Así, la ecuacion de Bellman a valor corriente toma la forma
sujeto a kt +1 = Akt − ct + (1 − ) kt
1 k 1 1 1
(1) + W 't +1 t +1 = − W 't +1 W 't +1 = W 't =
ct ct ct ct ct −1
kt +1
( 2) W 't = W 't +1 = ( Akt −1 + 1 − )W 't +1
kt
1
=
ct −1 ct
( Akt −1 + 1 − ) t = ( Akt −1 + 1 − )
c
ct −1
Si bien hemos encontrado una ecuación que describe el movimiento del consumo, esta n
también depende de kt y no solo ello, sino que además es no lineal. En ese sentido, no es
posible tener una solución que permita obtener el consumo óptimo en cada periodo del
tiempo, ni mucho menos tener una función de política. Por ello, se hace necesario indagar
en nuevos métodos que permitan conocer un poco más la trayectoria óptima. En
particular, se requerirán algunas herramientas de linealización que serán analizadas más
adelante.
Programación dinámica con factor de descuento en horizonte temporal infinito
Una cuestión importante aquí tiene que ver con que siendo esta serie infinita es posible
que sea divergente. La presencia del factor de descuento , 0 1 es importante
para la convergencia de la serie bajo el supuesto de que f (ut ; yt ) sea acotada, es decir,
f (ut ; yt ) M para algún M 0 . En este caso, se tendría
f (ut ; yt ) M t f (ut ; yt ) M t
La convergencia de la serie M
t =0
t
implicaría la convergencia(absoluta) de la serie
t =0
t
f (ut ; yt )
y
f g ( yt , ut )
0= ( yt , ut ) + W 't +1
ut ut
f g ( yt , ut )
W 't = ( yt , ut ) + W 't +1 (BS)
yt yt
y = g ( y ,u )
t +1 t t
Ejemplo
Consideremos el problema clásico
maximizar U = t ln ( ct )
t =0
sujeto a kt +1 = (1 + r ) kt − ct , k0 dado
Ecuacion de Bellman Wt ( yt ) = maximizar ln ( ct ) + Wt +1 ( kt +1 ) ,
ct
Las condiciones de primer orden son:
1
0 = − W 't +1 ( kt +1 )
ct
W 't ( kt ) = (1 + r ) W 't +1 ( kt +1 )
kth+1 = (1 + r ) kth
la cual tiene solución kth = B (1 + r ) . Proponemos la solucion particular en la forma
t
ktp = C ( (1 + r ) )
t
Simplificando obtenemos
C ( (1 + r ) ) = (1 + r ) C − A
de donde
A
C=
(1 + r )(1 − )
Luego,
( (1 + r ) )
A t
ktp =
(1 + r )(1 − )
En consecuencia
( (1 + r ) )
A
kt = B (1 + r ) +
t t
(1 + r )(1 − )
Hacemos la hipótesis de que el valor del capital es acotado en todo instante de tiempo,
esto implica que B = 0 y además pedimos que (1 + r ) 1 por lo tanto
( (1 + r ) )
A t
kt =
(1 + r )(1 − )
A
Evaluando en t = 0 se obtiene k0 =
(1 + r )(1 − )
En consecuencia,
kt = k0 ( (1 + r ) )
t
el consumo es
ct = A ( (1 + r ) )
t
En consecuencia,
ct = k0 (1 + r )(1 − ) ( (1 + r ) )
t