Cálculo II - 2004 - Funciones Diferenciables de RN en RM
Cálculo II - 2004 - Funciones Diferenciables de RN en RM
Cálculo II - 2004 - Funciones Diferenciables de RN en RM
*
Cálculo II (2004)
T (x) = Axt ,
1
Ejemplo 3 (Coordenadas cilı́ndricas). Si en el ejemplo anterior agregamos la
“altura” z de un punto (x, y, z) de R3 , obtenemos
1. Aplicaciones diferenciables
Definición 1 (Aplicación diferenciable). Sean f : U → Rm , U abierto
en Rn . La aplicación f es diferenciable en un punto a ∈ U , cuando existen
una transformación lineal T : Rn → Rm y una aplicación p : B ∗ (0, ε) → Rm ,
con ε > 0 suficientemente pequeño, tales que para todo v ∈ Rn con a + v ∈
B ∗ (a, ε), se verifica
r(v)
f (a + v) − f (a) = T (v) + r(v), lı́m = 0.
v→0 kvk
2
Si ponemos v = 0 en (4) vemos que p se puede definir en v = 0 poniendo
p(0) = 0. Consideremos entonces, de aquı́ en más, p : B(0, ε) → Rm .
Como las transformaciones lineales son continuas, es inmediato obtener
que si f es diferenciable en un punto a entonces es continua: tenemos f (a +
v) → f (a) si v → 0, como se ve tomando lı́mite a la derecha en (4).
Ejemplo 5. Veamos que una transformación lineal T : Rn → Rm es diferen-
ciable. Tenemos
T (a + v) − T (a) = T (v),
por lo que se verifica la definición (4), con dTa = T , y p(v) = 0 para todo
v ∈ Rn .
Como una aplicación f : U → Rm equivale a sus m funciones coordenadas
f1 , . . . , fm , es natural relacionar la diferenciabilidad de una aplicación con la
de sus funciones coordenadas. Las coordenadadas son funciones reales de
variable vectorial, cuya diferenciabilidad definimos en el capı́tulo anterior.
Teorema 1. Consideremos f = (f1 , . . . , fm ) : U → Rm , a ∈ U , abierto de
Rn . Entonces la aplicación f es diferenciable en a si y sólo si sus coordenadas
f1 , . . . , fm son diferenciables en a.
Demostración. Supongamos primero que la aplicación f es diferenciable en
a, y escribamos la identidad vectorial (4) como m identidades escalares. De-
signando T = (T1 , . . . , Tm ), p = (p1 , . . . , pm ), tenemos
3
Ejemplo 6 (Curva diferenciable). Una curva λ = (λ1 , . . . , λn ) : I → Rn es
diferenciable en un punto a del intervalo real I si son diferenciables sus coor-
denadas. Obtenemos entonces la misma definición de curva diferenciable del
capı́tulo anterior. Además, si λ es diferenciable en a ∈ I, tenemos
λ(a + h) − λ(a) |h|
= dλa (1) + p(h),
h h
con p(h) → 0 (h → 0), de donde resulta, que
5
Demostración. La demostración es análoga a la de la regla de la cadena
para funciones, pero (paradójicamente) mas sencilla, facilitada por el cálculo
matricial.
Como f es diferenciable en a, existe p : B(0, ε) → Rm tal que, si a + v ∈
B(0, ε) tenemos
6
la curva λ(t) = a + tv, en el dominio, obtenemos la curva en el recorrido
µ(t) = f λ(t) . La velocidad de esta curva en el punto µ(0) = b = f (a),
está dada por
µ0 (0) = dµ0 (1) = d f ◦ λ)0 (1) = dfa ◦ dλ0 (1) = dfa (v),
7
Además, un difeomorfismo es siempre un homeomorfismo, y un homeo-
morfismo es siempre biyectivo, siendo falsos ambos recı́procos. En particular,
la función f (x) = x3 es un homeomorfismo, es diferenciable, pero no es un
difeomorfismo.
Con estas definiciones, nuestro problema es obtener condiciones para que
una aplicación de clase C 1 sea un difeomorfismo, o, por lo menos, un difeo-
morfismo local.
Recordemos que dada una función de una variable f : I → R, donde I es
un intervalo de R, si f es derivable y f 0 (x) > 0 en I, obtenemos que existe
su función inversa f −1 : f (I) → I, que es derivable, y su derivada vale
0 1
f −1 (y) = ,
f 0 f −1 (y)
8
por lo que
9
de donde obtenemos (19).
Veamos ahora (b). Como f es diferenciable en los puntos x ∈ [a, a + v]
estamos en las hipótesis de la parte (a). Además, como (∂f /∂v)(x) = dfx (v),
aplicando la desigualdad (17) obtenemos
kdfx (v)k ≤ |||dfx ||| kvk ,
por lo que (20) se obtiene de (19), concluyendo la demostración.
El siguiente ejemplo muestra que no es posible obtener igualdad en el
teorema del valor medio para aplicaciones.
Ejemplo 8. Consideremos la curva λ : R → R2 dada por λ(t) = (t2 , t3 ), y el
intervalo [0, 1] = [a, a + v] con a = 0, v = 1. Si existe θ ∈ (0, 1) tal que
∂λ
(1, 1) = λ(1) − λ(0) = (θ) = λ0 (θ) = (2θ, 3θ2 ),
∂v
√
necesariamente se verifica, simúltaneamente, θ = 1/2, y θ = 1/ 3, lo que es
imposible. Este ejemplo muestra que no es posible obtener un teorema del
valor medio con igualdad en el contexto de las aplicaciones.
Estudiemos ahora algunas condiciones necesarias que verifican las aplica-
ciones cuando son difeomorfismos.
Teorema 4. Consideremos un difeomorfismo f : U → V , con inversa dada
por f −1 : V → U , donde U ⊂ Rn , V ⊂ Rm son abiertos. Entonces, se verifica
m = n y, para cada a ∈ U con b = f (a), los diferenciales dfa y d(f −1 )b son
transformaciones lineales invertibles e inversas, es decir
−1
d(f −1 )b = dfa , (21)
lo que en términos de matrices jacobianas se traduce en
J(f −1 )(b) = Jf (a)]−1 .
10
El siguiente teorema muestra que un homeomorfismo f diferenciable en un
punto a, con diferencial dfa invertible, tiene aplicación inversa diferenciable
en b = f (a).
Teorema 5 (Diferenciabilidad de la inversa de un homeomorfismo).
Sea f : U → V un homeomorfismo entre los conjuntos abiertos U ⊂ Rn y
V ⊂ Rm .
(a) Si f es diferenciable en a ∈ U y el diferencial dfa es una transformación
lineal invertible, entonces f −1 : V → U es diferenciable en b = f (a).
(b) Si f es diferenciable en U y dfx es invertible para todo x ∈ U , entonces
f es un difeomorfismo.
Demostración. Observemos primero que (b) es consecuencia directa de (a).
Veamos entonces la demostración de (a).
−1
Según vimos, si f −1 es diferenciable en b, su diferencial es dfa . Escri-
bimos entonces la condición de diferenciabilidad para f −1 en b, definiendo
−1
f −1 (b + w) − f −1 (b) − dfa (w)
q(w) = . (22)
kwk
11
que contradice que dfa es invertible. Entonces, como p(v) → 0 si w → 0,
obtenemos, en vista de (23), que
kwk
v
≥
dfa v
− kp(v)k ≥ m ,
=
dfa + p(v)
kvk
kvk
kvk
2
en un entorno adecuado del origen. Tenemos entonces que kvk / kwk ≤ m/2,
obteniendo que q(w) → 0 si w → 0, concluyendo la demostración.
Para demostrar el teorema de la función inversa precisamos el siguiente
resultado, basado en la completitud de Rn , que fundamenta el método de las
aproximaciones
sucesivas. Dados X ⊂ Rn y g : X → X definimos la sucesión
(k)
g (x) de los iterados de x ∈ X por g de la siguiente forma:
Entonces, existe un único z ∈ X tal que g(z) = z, que llamamos punto fijo
de g. Además
z = lı́m g (k) (x), (24)
k
para todo x ∈ X.
12
Por otra parte
x − g (p) (x)
≤ kx − g(x)k +
g(x) − g (2) (x)
+ · · · +
g (p−1) (x) − g (p) (x)
1
≤ 1 + λ + · · · + λp−1 kx − g(x)k ≤
kx − g(x)k .
1−λ
En conclusión
(j)
g (x) − g (i) (x)
≤ λi
kx − g(x)k < ε,
1−λ
si i ≥ i0 con i0 suficientemente grande. Obtenemos entonces que la sucesión
g (k) (x) verifica la condición de Cauchy, por lo que existe z = lı́m g (k) (x), y
z ∈ X por ser X cerrado. Finalmente, basados en la continuidad de g (que
es lipchitziana por ser una contracción), tenemos
g(x) = x − f (x),
13
cero si x → 0. Esto implica, en vista de (18), que |||dgx ||| → 0 (x → 0), por
lo que existe una bola cerrada B[0, 2ε] ⊂ U tal que
1
|||dgx ||| ≤ para todo x ∈ B[0, 2ε]. (26)
2
Aplicando la desigualdad del valor medio obtenemos, si x, y ∈ B[0, 2ε],
que se verifica
1
kg(x) − g(y)k ≤ sup |||dgx+θy ||| kx − yk ≤ kx − yk , (27)
0<θ<1 2
lo que, en particular, si y = 0, nos da
1
kg(x)k ≤ kxk .
2
Obtenemos entonces que g : B[0, 2ε] → B[0, ε], y es una contracción con
constante 1/2.
Definimos la aplicación inversa en la bola abierta V0 = B(0, ε). Tomemos
y ∈ V0 para ver que existe un único x ∈ B[0, 2ε] tal que y = f (x).
Para esto trasladamos según y la aplicación g, definiendo, para x ∈
B[0, 2ε] la aplicación
Se verifica
1
kgy (x)k ≤ kyk + kg(x)k < ε + kxk ≤ 2ε
2
por lo que gy : B[0, 2ε] → B[0, 2ε]. La acotación (27) nos permite ver que gy
también es una contracción. En efecto
1
kgy (x1 ) − gy (x2 )k ≤ kg(x1 ) − g(x2 )k ≤ kx1 − x2 k . (28)
2
En conclusión existe un único x ∈ B[0, 2ε] tal que gy (x) = x, es decir, un
único x ∈ B[0, ε] tal que y = f (x), como querı́amos verificar. Además, el
conjunto
U0 = f −1 (V0 ) ⊂ B[0, 2ε] ⊂ U
es abierto, por ser f continua y V0 abierto (Teorema del capı́tulo 1). Es-
tas consideraciones nos permiten concluir que f : U0 → V0 es una función
biyectiva. Nos resta ver que f −1 : V0 → U0 es continua y diferenciable.
14
Sean entonces y1 , y2 ∈ V0 , y x1 = f −1 (y1 ), x2 = f −1 (y2 ). Dado que
x = g(x) + f (x) tenemos
15
Para enunciar en nuestro caso la condición equivalente a Fy (x0 , y0 ) 6= 0
del teorema de la función implı́cita en dos variable, introducimos la notación
∂F1 ∂F1
∂y
· · · ∂ym
∂F ∂(F1 , . . . , Fm ) . 1 .. ,
= = .. .
∂y ∂(y1 , . . . , ym ) ∂Fm ∂Fm
∂y1
· · · ∂ym
16
según nuestra hipótesis, por lo que del teorema de la aplicación inversa
obtenemos que existe una bola Bn+m = B (x0 , y0 ), ε tal que ϕ restrin-
gida a Bn+m es un difeomorfismo, con aplicación inversa que designamos
ψ(u, v) = ψ1 (u, v), . . . , ψn (u, v), . . . , ψn+m (u, v) . Observemos que, según la
forma que tiene ϕ en (30), donde sus primeras coordenadas son la identidad,
esta propiedad se obtiene también para ψ, que por lo tanto se puede escribir
como
ψ(u, v) = u, h(u, v)
donde h = (ψn+1 , . . . , ψn+m ). Veamos ahora que f (x) = h(x, 0) verifica
(a), para x ∈Bn = B(x0 , δ), con δ > 0 suficientemente pequeño, tal que
ψ B (x0 , 0), δ ⊂ Bn+m . En efecto, como (x, 0) ∈ B (x0 , 0), δ porque
x ∈ B(x0 , δ), y tenemos
x, F x, f (x) = ϕ(x, f (x)) = ϕ x, h(x, 0)
= ϕ ψ(x, 0) = (x, 0),
obteniendo que
F x, f (x) = 0. (31)
Veamos ahora (b). La aplicación f es diferenciable, por estar formada por
1
coordenadas de una aplicación diferenciable, mientras que F es de clase C .
Designando g(x) = x, f (x) , tenemos F ◦ g = 0, y podemos aplicar la regla
de la cadena en (31), para obtener JF ◦ Jg = 0. Si escribimos los jacobianos
en bloques tenemos
∂(F1 , . . . , Fm ) ∂(F1 , . . . , Fm ) ∂(F1 , . . . , Fm )
JF = = ,
∂(x1 , . . . , xn , y1 , . . . , ym ) ∂(x1 , . . . , xn ) ∂(y1 , . . . , ym )
" #
∂(x1 , . . . , xn , f1 , . . . , fm ) Idn
Jg = = ∂(f1 ,...,fm ) .
∂(x1 , . . . , xn ) ∂(x1 ,...,xn )
17
Ejemplo 9. Queremos estudiar el conjunto M de puntos (x, y, z) ∈ R3 que
verifican (
x2 + y 2 = 1
y=z
Tenemos (1, 0, 0) ∈ M . Consideremos la aplicación F = (F1 , F2 ) : R3 → R2
dada por
F (x, y, z) = (x2 + y 2 − 1, y − z).
Observamos que m+n = 3 y m = 2, es decir, podemos despejar dos variables,
digamos x, y en función de la tercera z. Como F ∈ C 1 , resta verificar la
condición de no anulación del determinante del jacobiano
∂(F1 , F2 ) 2x 2y
=
∂(x, y) 0 1
En el punto (1, 0, 0) tenemos det ∂(F1 , F2 )/∂(x, y) = 2 6= 0, por lo que
aplicando el teorma de la aplicación implı́cita obtenemos que existe una
2
función f : (−ε, ε) → R , dada por f (z) = x(z), y(z) tal que se veri-
fica F x(z), y(z), z = 0. En otros términos M es (localmente) la curva
λ : (−ε, ε) → R3 de ecuación λ(z) = x(z), y(z), z . Calculemos el vector
t
tangente a esta curva en z = 0. Tenemos ∂F/∂z = (F1 )z , (F2 )z . Por eso,
en el punto (1, 0, 0), tenemos
−1
0 0
∂(x, y) 2 0 0 0
x (0), y (0) = (1, 0, 0) = − × =
∂z 0 1 −1 1
De aquı́ concluı́mos que λ0 (0) = (0, 1, 1), que es el vector tangente a la curva
M en el punto (1, 0, 0).
Teorema 9 (Multiplicadores de Lagrange).
Consideremos U abierto en Rn+m , f : U → R, g = (g1 , . . . , gm ) : U → Rm ,
ambas funciones de clase C 1 .
(a) Si p ∈ M = g −1 (0) y f presenta extremo relativo condicionado a g en p,
entonces el conjunto de vectores
{∇f (p), ∇g1 (p), . . . , ∇gm (p)} (32)
es linealmente dependiente.
(b) Si además Jg(p) tiene rango m (rango máximo), entonces existen reales
λ1 , . . . , λm , llamados multiplicadores de Lagrange, tales que
∇f (p) = λ1 ∇g1 (p) + · · · + λm ∇gm (p).
18
Demostración. Comencemos observando que (b) es inmediato a partir de (a).
Supongamos entonces, para demostrar (a), por absurdo, que el conjunto de
m + 1 vectores en (32) es linealmente independiente. Obtenemos entonces
que la matriz
∇f
∂(f, g1 , . . . , gm ) ∇g1
= ..
∂(x1 , . . . , xn+m ) .
∇gm
tiene sus m + 1 filas linealmente independientes, y por lo tanto, tiene rango
m + 1. Tiene entonces también m + 1 columnas linealmente independien-
tes, que por simplicidad en la notación, suponemos son las m + 1 prime-
ras. Designemos p = (p1 , . . . , pm , pm+1 , . . . , pn+m ). Fijando entonces las varia-
bles pm+2 , . . . , pm+n obtenemos que la aplicación auxiliar y = (y0 , . . . , ym ) =
ϕ(x1 , . . . , xm+1 ) dada por
y0 = f (x1 , . . . , xm+1 , pm+2 , . . . , pm+n )
y1 = g1 (x1 , . . . , xm+1 , pm+2 , . . . , pm+n )
..
.
ym = gm (x1 , . . . , xm+1 , pm+2 , . . . , pm+n )
tiene jacobiano no nulo en el punto a = (p1 , . . . , pm+1 ), y por lo tanto,
existe una bola B(a, ε) en donde ϕ es un difeomorfismo. Ademas ϕ(a) =
f (p), g1 (p), . . . , gm (p) = f (p), 0, . . . , 0 . Como existe la inversa
de ϕ, para
δ > 0 suficientemente pequeño, los puntos f (p) ± δ, 0, . . . , 0 tienen preima-
gen en la bola B(a, ε), y por este motivo, estos puntos pertenecen a g −1 (0),
y f no presenta extremo relativo condicionado en p, contradiciendo nuestra
hipótesis. En conclusión, la matriz no tiene rango m + 1, y los vectores en
(32) son linealmente dependientes, como querı́amos probar.
Al igual que en la búsquda de los extermos de f con una condición g = 0,
el teorema de los multiplicadores de Lagrange da una condición necesaria para
la existencia de extremos relativos con varias condiciones g = (g1 , . . . , gm ) =
0. Una vez descartados los puntos de M = g −1 (0) en los que f , g no son
de clase C 1 , y aquellos en los que Jg no tiene rango máximo, los extremos
condicionados se presentan únicamente en aquellos puntos en los que existen
λ1 , . . . , λm reales tal que
∇f (p) = λ1 ∇g1 (p) + · · · + λm ∇gm (p).
19
Para buscar estos puntos consideramos la función auxiliar
L(x1 , . . . , xn , λ1 , . . . , λm ) = f − λ1 g1 − · · · − λm gm ,
20