Cálculo II - 2004 - Funciones Diferenciables de RN en RM

Diferenciabilidad de funciones de Rn en Rm
*
Cálculo II (2004)
En este capı́tulo generalizamos la noción de diferenciabilidad para funcio-

nes vectoriales de variable vectorial, que también llamamos aplicaciones. Una
aplicación es entonces una función f : X → Rm , donde X es un subconjunto
de Rn .
Ejemplo 1 (Transformaciones Lineales). Un ejemplo central de aplicaciones
son las transformaciones lineales, es decir, las aplicaciones T : Rn → Rm que
verifican T (αx + βy) = αT (x) + βT (y) para α, β reales, x, y vectores en Rn ,
todos arbitrarios. Recordemos que dada una transformación lineal T como
antes existe una única matriz A = ((aij )) de tamaño m × n, que llamamos
matriz asociada, tal que se verifica
T (x) = Axt ,
asumiendo que x = (x1 , . . . , xn ) es un vector fila. Si las funciones coordenadas

de T son T1 , . . . , Tm , tenemos Ti (x) = hAi , xi, para cada i = 1, . . . , m donde
Ai = (ai1 , . . . , ain ) designa la i-ésima fila de la matriz A.
Otros casos importantes de aplicaciones son los cambios de coordenadas,
como los que vemos a continuación.
Ejemplo 2 (Coordenadas Polares).
El cambio de coordenadas cartesianas (x, y) a coordenadas polares (ρ, θ),
viene dado por la aplicación
x = ρ cos θ, y = ρ sen θ, (1)
que definimos del dominio X = [0, ∞) × [0, 2π) en R2 .

*
Notas para el curso de la Licenciatura en Matemática, Facultad de Ciencias, prepara-
das por Ernesto Mordecki.
1
Ejemplo 3 (Coordenadas cilı́ndricas). Si en el ejemplo anterior agregamos la
“altura” z de un punto (x, y, z) de R3 , obtenemos
x = ρ cos θ, y = ρ sen θ, z = z, (2)
aplicación definida de X = [0, ∞) × [0, 2π) × R en R3 , que llamamos cambio

de coordenadas cilı́ndricas.
Ejemplo 4 (Coordenadas esféricas). Ahora describimos un punto (x, y, z) de
R3 mediante sus coordenadas esféricas, designadas (ρ, θ, ϕ), de forma que
x = ρ cos θ sen ϕ, y = ρ sen θ sen ϕ, z = ρ cos ϕ, (3)
aplicación definida de X = [0, ∞) × [0, 2π) × [0, π) en R3 .
1. Aplicaciones diferenciables
Definición 1 (Aplicación diferenciable). Sean f : U → Rm , U abierto
en Rn . La aplicación f es diferenciable en un punto a ∈ U , cuando existen
una transformación lineal T : Rn → Rm y una aplicación p : B ∗ (0, ε) → Rm ,
con ε > 0 suficientemente pequeño, tales que para todo v ∈ Rn con a + v ∈
B ∗ (a, ε), se verifica
f (a + v) − f (a) = T (v) + kvk p(v), lı́m p(v) = 0. (4)

v→0
La transformación lineal anterior se llama diferencial de la aplicación f en

el punto a, y se designa dfa . Decimos además que f es diferenciable en U
cuando es diferenciable en todo a ∈ U .
Introduciendo la aplicación r(v) = kvkp(v), que llamamos resto, las fór-

mulas en (4) pueden escribirse como
r(v)
f (a + v) − f (a) = T (v) + r(v), lı́m = 0.
v→0 kvk
Estamos entonces definiendo que una aplicación es diferenciable en un punto

a cuando su incremento se puede aproximar por una transformación lineal.
Observemos además que esta definición generaliza la de diferenciabilidad de
funciones de varias variables (caso m = 1) del capı́tulo anterior.
2
Si ponemos v = 0 en (4) vemos que p se puede definir en v = 0 poniendo
p(0) = 0. Consideremos entonces, de aquı́ en más, p : B(0, ε) → Rm .
Como las transformaciones lineales son continuas, es inmediato obtener
que si f es diferenciable en un punto a entonces es continua: tenemos f (a +
v) → f (a) si v → 0, como se ve tomando lı́mite a la derecha en (4).
Ejemplo 5. Veamos que una transformación lineal T : Rn → Rm es diferen-
ciable. Tenemos
T (a + v) − T (a) = T (v),
por lo que se verifica la definición (4), con dTa = T , y p(v) = 0 para todo
v ∈ Rn .
Como una aplicación f : U → Rm equivale a sus m funciones coordenadas
f1 , . . . , fm , es natural relacionar la diferenciabilidad de una aplicación con la
de sus funciones coordenadas. Las coordenadadas son funciones reales de
variable vectorial, cuya diferenciabilidad definimos en el capı́tulo anterior.
Teorema 1. Consideremos f = (f1 , . . . , fm ) : U → Rm , a ∈ U , abierto de
Rn . Entonces la aplicación f es diferenciable en a si y sólo si sus coordenadas
f1 , . . . , fm son diferenciables en a.
Demostración. Supongamos primero que la aplicación f es diferenciable en
a, y escribamos la identidad vectorial (4) como m identidades escalares. De-
signando T = (T1 , . . . , Tm ), p = (p1 , . . . , pm ), tenemos
fi (a + v) − fi (a) = Ti (v) + kvk pi (v), lı́m pi (v) = 0,

v→0
para i = 1, . . . , m, que es la definición de diferenciabilidad de la función fi en

a, dado que Ti (v) = hAi , vi, donde Ai es la i-ésima fila de la matriz asociada
a T.
Reciprocamente, si f1 , . . . , fm son diferenciables en a, existen funciones
p1 , . . . , pm tales que
fi (a + v) − fi (a) = dfia (v) + kvk pi (v), lı́m pi (v) = 0,

v→0
para i = 1, . . . , m. Luego, con

T (v) = df1a (v), . . . , dfma (v) , (5)
y p = (p1 , . . . , pm ), la aplicación f verifica la definición (4) en el punto a,

concluyendo la demostración.
3
Ejemplo 6 (Curva diferenciable). Una curva λ = (λ1 , . . . , λn ) : I → Rn es
diferenciable en un punto a del intervalo real I si son diferenciables sus coor-
denadas. Obtenemos entonces la misma definición de curva diferenciable del
capı́tulo anterior. Además, si λ es diferenciable en a ∈ I, tenemos
λ(a + h) − λ(a) |h|
= dλa (1) + p(h),
h h
con p(h) → 0 (h → 0), de donde resulta, que
λ0 (a) = dλa (1), (6)
es decir, la velocidad de la curva en el instante a se obtiene como el valor del

diferencial de la curva en a, evaluado en el vector v = 1.
La matriz asociada al diferencial dfa de una aplicación f en un punto a se
llama matriz jacobiana, o más brevemente jacobiano, y se designa mediante
Jf (a). De la fórmula (5) obtenemos, si f = (f1 , . . . , fm ) es diferenciable en
a, que se verifica
dfa (v) = df1a (v), . . . , dfma (v) , (7)
y como dfia (v) = h∇fi (a), vi, resulta que la fila i-ésima de Jf (a) es el gra-
diente ∇fi (a). En otros términos, hemos demostrado que
 ∂f1 ∂f1

∂x1
(a) · · · ∂xn
(a)
Jf (a) =  .. ..
. (8)
 
. .
∂fm ∂fm
∂x1
(a) · · · ∂xn (a)
De aquı́ resulta además la unicidad del diferencial de una aplicación diferen-

ciable en un punto.
Definimos la derivada direccional de una aplicación f en un punto a con
respecto de un vector v ∈ Rn , que designamos (∂f /∂v)(a), como el valor del
lı́mite en Rm dado por
∂f f (a + tv) − f (a)
(a) = lı́m ,
∂v t→0 t
cuando existe. A partir de la definición resulta que la derivada direccional de
una aplicación existe, si y sólo si existen las derivadas direccionales de sus
funciones coordenadas. Además, en caso de existencia, se verifica
∂f ∂f
1 ∂fm
(a) = (a), . . . , (a) . (9)
∂v ∂v ∂v
4
Pero (∂fi /∂v)(a) = dfia (v), por lo que el vector obtenido en (9), en vista de
(7), es la imagen de v por el diferencial de f , es decir
∂f
(a) = dfa (v).
∂v
La fórmula anterior es una generalización a aplicaciones de la que obtuvimos
para funciones reales de varias variables.
Teorema 2 (Regla de la Cadena para aplicaciones).
Consideremos las aplicaciones f : U → Rm donde U ⊂ Rn , g : V → Rp , don-
de f (U ) ⊂ V ⊂ Rm , con U, V abiertos. Supongamos que f es diferenciable en
a ∈ U , y que g es diferenciable en b = f (a). Entonces, la función compuesta
h = g ◦ f : U → Rp es diferenciable en el punto a. Mas aún, el diferencial de
h en a es la composición del diferencial de g en b con el diferencial de f en
a, es decir
dha = dgb ◦ dfa , (10)
lo que expresado a través de las matrices jacobianas da la fórmula
Jh(a) = Jg(b) × Jf (a), (11)
donde × designa el producto de matrices.

Antes de la demostración veamos que este teorema generaliza la regla
de la cadena de funciones del capı́tulo anterior. Supongamos para esto que
p = 1. Según vimos, f = (f1 , . . . , fm ) es diferenciable si y sólo si f1 , . . . , fm
son diferenciables, y las hipótesis de ambos teoremas coinciden si p = 1. En
este caso el jacobiano de g es una matriz 1 × m, y viene dado por
h ∂g ∂g i
Jg(b) = (b) · · · (b) . (12)
∂y1 ∂ym
Por su parte, el jacobiano de h es una matriz 1 × n, dada por
h ∂h ∂h i
Jh(a) = (a) · · · (a) . (13)
∂x1 ∂xn
Es claro entonces que multiplicando Jg(b) dado en (12) por Jf (a) dado en
(8), que es igual a Jh(a) dado en (13), obtenemos las n fórmulas para las
derivadas parciales de la función compuesta de la regla de la cadena para
funciones.
5
Demostración. La demostración es análoga a la de la regla de la cadena
para funciones, pero (paradójicamente) mas sencilla, facilitada por el cálculo
matricial.
Como f es diferenciable en a, existe p : B(0, ε) → Rm tal que, si a + v ∈
B(0, ε) tenemos
f (a + v) − f (a) = dfa (v) + kvk p(v), lı́m p(v) = 0. (14)

v→0
Como g es diferenciable en b = f (a), existe q : B(0, δ) → Rp tal que
g(b + w) − g(b) = dgb (w) + kwk q(w), lı́m q(v) = 0.

v→0
Sustituyendo w = f (a+v)−f (a) dado en (14) en la fórmula anterior, tenemos

h(a + v) − h(a) = g(b + w) − g(b) = dgb dfa (v) + kvk p(v) + kwk q(w).
Introduciendo la función auxiliar P (v), podemos entonces escribir

h(a + v) − h(a) = dgb ◦ dfa (v) + kvk P (v), (15)
kwk
P (v) = dgb p(v) + q(w). (16)
kvk
Si demostramos que P (v) → 0 (v → 0), en vista de (15) resulta que h es
diferenciable en a, y que su diferencial verifica (10). En primer lugar, como
la norma de v/ kvk es uno, tenemos
kwk v
≤ dfa + kp(v)k ≤ |||dfa ||| + kp(v)k ,

kvk kvk
que es una función acotada si v → 0. Luego w → 0 cuando v → 0 y el
segundo sumando a la derecha en (16) tiende a cero. El primero tiende a cero
dado que dgb es continua, y p(v) → 0. Esto concluye la demostración.
Observación. Una demostración alternativa de la regla de la cadena para
aplicaciones se basa en la regla de la cadena para funciones. Demostramos
que las coordenadas de h son diferenciables, y obtenemos la fórmula (11) a
partir de las fórmulas para el cálculo de las derivadas.
La regla de la cadena recién demostrada nos permite obtener una in-
terpretación geométrica del diferencial de una aplicación. Sea f : U → Rm
diferenciable en a ∈ U , abierto de Rn . Dado un vector v ∈ Rn , considerando
6
la curva λ(t) = a + tv, en el dominio, obtenemos la curva en el recorrido
µ(t) = f λ(t) . La velocidad de esta curva en el punto µ(0) = b = f (a),
está dada por
µ0 (0) = dµ0 (1) = d f ◦ λ)0 (1) = dfa ◦ dλ0 (1) = dfa (v),
donde aplicamos (6). Si suponemos entonces que un punto se encuentra en

λ(t) en el instante t, mientras la función f nos da la imagen de su posición,
el diferencial dfa nos da la velocidad a la que se mueve esta imagen.
2. Teorema de la aplicación inversa

Comencemos con algunas definiciones relativas a la regularidad de apli-
caciones y de sus inversas. Decimos que una aplicación es de clase C k cuando
sus funciones coordenadas son de clase C k para k = 0, 1, . . . , ∞.
Definición 2. (a) Una aplicación f : X → Y , donde X ⊂ Rn , Y ⊂ Rm ,

es un homeomorfismo cuando es biyectiva, continua en X, y su aplicación
inversa f −1 : Y → X es continua en Y . Cuando existe un homeomorfismo
f : X → Y decimos que X e Y son homeomorfos.
(b) Una aplicación f : U → V , donde U ⊂ Rn , V ⊂ Rm , ambos abiertos,
es un difeomofismo cuando es biyectiva, diferenciable en U , y su aplicación
inversa f −1 : V → U es diferenciable en V . Cuando existe un difeomorfismo
f : U → V decimos que U y V son difeomorfos.
(c) Una aplicación f : X → Rm , donde X ⊂ Rn , es un difeomorfismo local
en a ∈ X cuando existen dos conjuntos abiertos U, V , tales que a ∈ U ⊂ X,
V ⊂ Rm , de forma que la restricción de f a U en V , es decir, f : U → V , es
un difeomorfismo.
(d) Un C k -difeomorfismo es un difeomorfismo tal que él y su inverso son de
clase C k , para k = 1, . . . , ∞.
Observemos que la composición de homeomorfismos es un homeomor-

fismo (porque la composición de aplicaciones continuas es continua), y que
la composición de difeomorfismos es un difeomorfismo (por la regla de la
cadena).
Es también sencillo de verificar que si h = g ◦ f , donde f es un difeomor-
fimso local en un punto a, y g es un difeomorfismo local en el punto b = f (a),
entonces h es un difeomorfismo local en a.
7
Además, un difeomorfismo es siempre un homeomorfismo, y un homeo-
morfismo es siempre biyectivo, siendo falsos ambos recı́procos. En particular,
la función f (x) = x3 es un homeomorfismo, es diferenciable, pero no es un
difeomorfismo.
Con estas definiciones, nuestro problema es obtener condiciones para que
una aplicación de clase C 1 sea un difeomorfismo, o, por lo menos, un difeo-
morfismo local.
Recordemos que dada una función de una variable f : I → R, donde I es
un intervalo de R, si f es derivable y f 0 (x) > 0 en I, obtenemos que existe
su función inversa f −1 : f (I) → I, que es derivable, y su derivada vale
0 1
f −1 (y) = ,
f 0 f −1 (y)
como resulta del teorema de la función inversa en R.

En este capı́tulo los resultados son mas modestos, dado que, en general,
no es posible invertir una aplicación en todo su dominio. Como el rol de la
derivada lo juega el diferencial, que es una transformación lineal, comenzamos
recordando cuando una transformación lineal es invertible.
Ejemplo 7. Sea T : Rn → Rm una transformación lineal. Recordemos que si
m 6= n la transformación T no puede ser invertible. Si m = n la transforma-
ción lineal T es invertible si y sólo si det(T ) 6= 0. Además, en este caso la
aplicación inversa es también una transformación lineal, su matriz asociada
es la matriz inversa de la matriz de T , por lo que es diferenciable. Es decir,
T : Rn → Rn con det(T ) 6= 0 es un difeomorfismo.
Veamos ahora dos propiedades de la norma |||T ||| de una transformación
lineal que serán útiles en lo que sigue. En primer lugar, si v ∈ Rn no es nulo,
poniendo x = v/ kvk tenemos
kT (v)k = kvk × kT (x)k ≤ |||T ||| × kvk . (17)
De aquı́ resulta que las transformaciones lineales son funciones lipchitzianas,

con constante |||T |||.
Veamos ahora que, si A = ((aij )) es la matriz de T , tenemos
|||T ||| ≤ mn máx{|aij | : i = 1, . . . , m; j = 1, . . . , n}. (18)
En efecto, si x = x1 e1 +· · ·+xn en , y kxk = 1, tenemos |xi | ≤ 1 (i = 1, . . . , n),
8
por lo que
kT (x)k ≤ |x1 | kT (e1 )k + · · · + |xn | kT (en )k ≤ kT (e1 )k + · · · + kT (en )k

≤ m kT (e1 )k∞ + · · · + kT (en )k∞
≤ mn máx{|aij | : i = 1, . . . , m; j = 1, . . . , n}.
El teorema del valor medio no es válido en el contexto de las aplicaciones.

Sin embargo, vale el siguiente resultado.
Teorema 3 (Desigualdad del valor medio).
Sea f : U → Rm con U abierto en Rn . Consideremos un punto a ∈ U y un
vector v de Rn , tal que el intervalo [a, a + v] esté contenido en U .
(a) Supongamos que f restringida a [a, a + v] es una función continua, y que
existe la derivada direccional (∂f /∂v)(x) para todo x ∈ (a, a + v). Entonces,

∂f
kf (a + v) − f (a)k ≤ sup .
(a + θv) (19)
0<θ<1 ∂v

(b) Cuando f es diferenciable para cada x ∈ [a, a + v], se verifica

kf (a + v) − f (a)k ≤ sup |||dfa+θv ||| kvk . (20)
0<θ<1
Demostración. Dado w ∈ Rm , la función auxiliar φ : [0, 1] → R definida

mediante φ(t) = hw, f (a + tv)i es continua, por serlo f restringida a [a, a+v].
Tenemos además

φ(θ + h) − φ(θ) f (a + θv + hv) − f (a + θv) ∂f
= w, → w, (a + θv) ,
h h ∂v
si h → 0, por lo que φ es derivable en (0, 1). Aplicando entonces el teorema
de Lagrange obtenemos que existe θ ∈ (0, 1) tal que φ(1) − φ(0) = φ0 (θ).
Como φ(1) = hw, f (a + v)i, φ(0) = hw, f (a)i, tomando w = f (a + v) − f (a)
y aplicando la desigualdad de Cauchy-Schwarz, resulta
kf (a + v) − f (a)k2 = hw, f (a + v) − f (a)i = φ(1) − φ(0) = φ0 (θ)

∂f ∂f
= w, (a + θv) ≤ kwk (a + θv)
∂v ∂v

∂f
≤ kf (a + v) − f (a)k sup (a + θv) ,
0<θ<1 ∂v

9
de donde obtenemos (19).
Veamos ahora (b). Como f es diferenciable en los puntos x ∈ [a, a + v]
estamos en las hipótesis de la parte (a). Además, como (∂f /∂v)(x) = dfx (v),
aplicando la desigualdad (17) obtenemos
kdfx (v)k ≤ |||dfx ||| kvk ,
por lo que (20) se obtiene de (19), concluyendo la demostración.
El siguiente ejemplo muestra que no es posible obtener igualdad en el
teorema del valor medio para aplicaciones.
Ejemplo 8. Consideremos la curva λ : R → R2 dada por λ(t) = (t2 , t3 ), y el
intervalo [0, 1] = [a, a + v] con a = 0, v = 1. Si existe θ ∈ (0, 1) tal que
∂λ
(1, 1) = λ(1) − λ(0) = (θ) = λ0 (θ) = (2θ, 3θ2 ),
∂v
√
necesariamente se verifica, simúltaneamente, θ = 1/2, y θ = 1/ 3, lo que es
imposible. Este ejemplo muestra que no es posible obtener un teorema del
valor medio con igualdad en el contexto de las aplicaciones.
Estudiemos ahora algunas condiciones necesarias que verifican las aplica-
ciones cuando son difeomorfismos.
Teorema 4. Consideremos un difeomorfismo f : U → V , con inversa dada
por f −1 : V → U , donde U ⊂ Rn , V ⊂ Rm son abiertos. Entonces, se verifica
m = n y, para cada a ∈ U con b = f (a), los diferenciales dfa y d(f −1 )b son
transformaciones lineales invertibles e inversas, es decir
−1
d(f −1 )b = dfa , (21)
lo que en términos de matrices jacobianas se traduce en
J(f −1 )(b) = Jf (a)]−1 .

Demostración. Como el diferencial de la identidad IdU : U → U es la trans-

formación lineal identidad Idn : Rn → Rn , aplicando la regla de la cadena en
la igualdad IdU = f −1 ◦ f , obtenemos
Idn = d IdU )a = d f −1 ◦ f a = d(f −1 )b ◦ dfa .

En conclusión, la transformación lineal d(f −1 )b es invertible, y tiene inversa

dfa , probando (21). Además, como dfa es una transformación lineal, resulta
m = n, concluyendo la demostración.
10
El siguiente teorema muestra que un homeomorfismo f diferenciable en un
punto a, con diferencial dfa invertible, tiene aplicación inversa diferenciable
en b = f (a).
Teorema 5 (Diferenciabilidad de la inversa de un homeomorfismo).
Sea f : U → V un homeomorfismo entre los conjuntos abiertos U ⊂ Rn y
V ⊂ Rm .
(a) Si f es diferenciable en a ∈ U y el diferencial dfa es una transformación
lineal invertible, entonces f −1 : V → U es diferenciable en b = f (a).
(b) Si f es diferenciable en U y dfx es invertible para todo x ∈ U , entonces
f es un difeomorfismo.
Demostración. Observemos primero que (b) es consecuencia directa de (a).
Veamos entonces la demostración de (a).
−1
Según vimos, si f −1 es diferenciable en b, su diferencial es dfa . Escri-
bimos entonces la condición de diferenciabilidad para f −1 en b, definiendo
−1
f −1 (b + w) − f −1 (b) − dfa (w)
q(w) = . (22)
kwk
Se trata entonces de verificar que q(w) → 0 (w → 0). Tenemos a = f −1 (b).

Designando v = f −1 (b + w) − f −1 (b), tenemos a + v = f −1 (b + w), y como f
es diferenciable en a, podemos escribir
w = b + w − b = f (a + v) − f (a) = dfa (v) + kvk p(v), lı́m p(v) = 0.

v→0
Sustituyendo esta última expresión en (22), tenemos

−1
f −1 (b + w) − f −1 (b) − dfa

dfa (v) + kvk p(v)
q(w) = (23)
kwk
−1 kvk

= − dfa p(v).
kwk
Como f y f −1 son continuas obtenemos que v → 0 si y sólo si w → 0.

−1
Entonces, si w → 0 resulta que p(v) → 0, y por ser dfa continua, es
suficiente ver que el cociente kvk / kwk permanece acotado si w → 0. Veamos
que inf{kdfa (x)k : kxk = 1} = m > 0.En efecto, de anularse este ı́nfimo,
aplicando el teorema de Weierstrass (la función dfa es continua, y el dominio
{kxk = 1} es compacto) resulta que existe x 6= 0 tal que dfa (x) = 0, lo
11
que contradice que dfa es invertible. Entonces, como p(v) → 0 si w → 0,
obtenemos, en vista de (23), que

kwk v
≥ dfa v − kp(v)k ≥ m ,

= dfa + p(v)
kvk kvk kvk 2
en un entorno adecuado del origen. Tenemos entonces que kvk / kwk ≤ m/2,
obteniendo que q(w) → 0 si w → 0, concluyendo la demostración.
Para demostrar el teorema de la función inversa precisamos el siguiente
resultado, basado en la completitud de Rn , que fundamenta el método de las
aproximaciones
sucesivas. Dados X ⊂ Rn y g : X → X definimos la sucesión
(k)
g (x) de los iterados de x ∈ X por g de la siguiente forma:
g (0) (x) = x, g (k) (x) = g g (k−1) (x) (k = 1, 2, . . . ).

Teorema 6 (de la contracción).

Consideremos un subconjunto X cerrado de Rn , y una aplicación g : X → X.
Supongamos que g es una contracción, es decir, existe λ ∈ (0, 1) tal que
kg(x) − g(y)k ≤ λ kx − yk , para todos x, y ∈ X.
Entonces, existe un único z ∈ X tal que g(z) = z, que llamamos punto fijo
de g. Además
z = lı́m g (k) (x), (24)
k
para todo x ∈ X.
Demostración. Veamos primero que si existe un punto fijo, este es único. En

efecto, si z1 = g(z1 ), z2 = g(z2 ), tenemos
kz1 − z2 k = kg(z1 ) − g(z2 )k ≤ λ kz1 − z2 k ,
de donde kz1 − z2 k = 0, y resulta z1 = z2 .

Para verificar la existencia de un punto fijo, tomemos cualquier x ∈ X.
Si x 6= g(x) veriquemos que la sucesión de los iterados de x es una sucesión
de Cauchy en X. Sea entonces ε > 0. Para dos ı́ndices i < j = i + p, tenemos
(j)
g (x) − g (i) (x) = g (i) g (p) (x) − g (i) (x)

≤ λi g (p) (x) − x .
12
Por otra parte

x − g (p) (x) ≤ kx − g(x)k + g(x) − g (2) (x) + · · · + g (p−1) (x) − g (p) (x)
1
≤ 1 + λ + · · · + λp−1 kx − g(x)k ≤

kx − g(x)k .
1−λ
En conclusión
(j)
g (x) − g (i) (x) ≤ λi
kx − g(x)k < ε,
1−λ
si i ≥ i0 con i0 suficientemente grande. Obtenemos entonces que la sucesión
g (k) (x) verifica la condición de Cauchy, por lo que existe z = lı́m g (k) (x), y
z ∈ X por ser X cerrado. Finalmente, basados en la continuidad de g (que
es lipchitziana por ser una contracción), tenemos
z = lı́m g (k) (x) = lı́m g g (k−1) (x) = g(z),

k k
verificando que z es el punto fijo que buscábamos.

Estamos ahora en condiciones de demostrar el teorema más importante
del capı́tulo.
Teorema 7 (Teorema de la aplicación inversa).
Consideremos f : U → Rn de clase C 1 en U , abierto de Rn . Si el diferencial

de f en a es una transformación lineal invertible, es decir, si det Jf (a) 6= 0,
entonces f es un difeomorfismo local en a, es decir, existen dos abiertos
U0 , V0 que verifican a ∈ U0 ⊂ U , V0 ⊂ Rn , y tales que f : U0 → V0 es un
difeomorfismo.
Demostración. Comencemos con la demostración en el caso particular en el
que
a = 0, f (a) = 0, dfa = Idn , (25)
para luego obtener el caso general a partir de éste.
Consideremos para ésto la aplicación auxiliar
g(x) = x − f (x),
definida en U . Esta aplicación tiene diferencial nulo en el origen porque dg0 =

Idn −df0 = 0, por lo que la matriz jacobiana es nula, y todas las derivadas
parciales de las coordenadas de g son nulas, y por ser continuas, tienden a
13
cero si x → 0. Esto implica, en vista de (18), que |||dgx ||| → 0 (x → 0), por
lo que existe una bola cerrada B[0, 2ε] ⊂ U tal que
1
|||dgx ||| ≤ para todo x ∈ B[0, 2ε]. (26)
2
Aplicando la desigualdad del valor medio obtenemos, si x, y ∈ B[0, 2ε],
que se verifica
1
kg(x) − g(y)k ≤ sup |||dgx+θy ||| kx − yk ≤ kx − yk , (27)
0<θ<1 2
lo que, en particular, si y = 0, nos da
1
kg(x)k ≤ kxk .
2
Obtenemos entonces que g : B[0, 2ε] → B[0, ε], y es una contracción con
constante 1/2.
Definimos la aplicación inversa en la bola abierta V0 = B(0, ε). Tomemos
y ∈ V0 para ver que existe un único x ∈ B[0, 2ε] tal que y = f (x).
Para esto trasladamos según y la aplicación g, definiendo, para x ∈
B[0, 2ε] la aplicación
gy (x) = y + g(x) = y + x − f (x).
Se verifica
1
kgy (x)k ≤ kyk + kg(x)k < ε + kxk ≤ 2ε
2
por lo que gy : B[0, 2ε] → B[0, 2ε]. La acotación (27) nos permite ver que gy
también es una contracción. En efecto
1
kgy (x1 ) − gy (x2 )k ≤ kg(x1 ) − g(x2 )k ≤ kx1 − x2 k . (28)
2
En conclusión existe un único x ∈ B[0, 2ε] tal que gy (x) = x, es decir, un
único x ∈ B[0, ε] tal que y = f (x), como querı́amos verificar. Además, el
conjunto
U0 = f −1 (V0 ) ⊂ B[0, 2ε] ⊂ U
es abierto, por ser f continua y V0 abierto (Teorema del capı́tulo 1). Es-
tas consideraciones nos permiten concluir que f : U0 → V0 es una función
biyectiva. Nos resta ver que f −1 : V0 → U0 es continua y diferenciable.
14
Sean entonces y1 , y2 ∈ V0 , y x1 = f −1 (y1 ), x2 = f −1 (y2 ). Dado que
x = g(x) + f (x) tenemos
kx2 − x1 k ≤ kg(x2 ) − g(x1 )k + kf (x2 ) − f (x1 )k

1
≤ kx2 − x1 k + kf (x2 ) − f (x1 )k ,
2
obteniendo que
−1
f (y2 ) − f −1 (y1 ) = kx2 − x1 k ≤ 2 kf (x2 ) − f (x1 )k = 2 ky2 − y1 k .

de donde f −1 resulta Lipchitziana, por lo tanto continua.

Para concluir que f es un difeomorfismo, observemos que det Jf (0) = 1,
y por ser f de clase C 1 existe una bola, que suponemos B[0, 2ε], en donde
det Jf (x) 6= 0. Aplicamos entonces (b) en el teorema 5 para obtener que f
es un difeomorfismo en U0 . Esto concluye la demostración en el caso particular
(25).
Veamos por último la demostración en el caso general. Dada f en las
condiciones del teorema, consideramos g(z) = z + a y
−1
f˜(z) = dfa

f g(z) − f (a) .
La aplicación f˜ verifica las condiciones del teorema, y además verifica (25),

por lo que es un difeomorfismo local en z = 0. Además
f (x) = dfa ◦ f˜ g −1 (x) + f (a).

Es decir, f es un difeomorfismo local en a por ser composición de difeomor-

fismos locales. Esto conlcuye la demostración
3. Teorema de la aplición implı́cita y multi-

plicadores de Lagrange
En esta sección vemos primero como se aplica el teorema de la aplica-
ción inversa para “despejar” variables y = (y1 , . . . , ym ) en función de otras
x = (x1 , . . . , xn ), cuando existe una relación entre ellas dada por un sistema
de ecuaciones Fi (x1 , . . . , xn , y1 , . . . , ym ) = 0 (i = 1, . . . , m), relación que en
notación vectorial escribimos F (x, y) = 0, si F = (F1 , . . . , Fm ).
15
Para enunciar en nuestro caso la condición equivalente a Fy (x0 , y0 ) 6= 0
del teorema de la función implı́cita en dos variable, introducimos la notación
 ∂F1 ∂F1

∂y
· · · ∂ym
∂F ∂(F1 , . . . , Fm )  . 1 ..  ,
= =  .. . 
∂y ∂(y1 , . . . , ym ) ∂Fm ∂Fm
∂y1
· · · ∂ym
que es el jacobiano de la aplicación de la variable y = (y1 , . . . , ym ), que se

obtiene cuando x = (x1 , . . . , xn ) permanece constante. Designamos además
(x0 , y0 ) = (x10 , . . . , xn0 , y10 , . . . , ym0 ).
Teorema 8 (Teorema de la aplicación implı́cita).

Sean (x0 , y0 ) ∈ U , abierto en Rn+m , F = (F1 , . . . , Fm ): U → Rm de clase C 1 ,
tales que F (x0 , y0 ) = 0. Supongamos que det ∂F/∂y (x0 , y0 ) 6= 0. Entonces:
(a) Existen bolas Bn = B(x0 , δ), Bm = B(y0 , ε) tales que Bn × Bm ⊂ U , y
una función f : Bn → Bm de clase C 1 tal que
F (x, y) = 0 ⇔ y = f (x) para todo (x, y) ∈ Bn × Bm .
(b) Si x ∈ Bn el jacobiano de f verifica

h ∂F i−1 ∂F
Jf (x) = − x, f (x) (x, f (x) . (29)
∂y ∂x
Demostración. Para utilizar el teorema de la aplicación inversa, consideremos
ϕ : U → Rn+m definido mediante

ϕ(x, y) = x, F (x, y) . (30)
La aplicación ϕ es diferenciable en U por serlo sus coordenadas y, derivando,

obtenemos que su jacobiano, escrito en bloques, vale

Idn 0
Jϕ = ∂F ∂F .
∂x ∂y
Para calcular el determinante de este jacobiano desarrollamos por las prime-

ras n filas, y obtenemos
∂F
det(Jϕ)(x0 , y0 ) = det (x0 , y0 ) 6= 0,
∂y
16
según nuestra hipótesis, por lo que del teorema de la aplicación inversa
obtenemos que existe una bola Bn+m = B (x0 , y0 ), ε tal que ϕ restrin-
gida a Bn+m es un difeomorfismo, con aplicación inversa que designamos
ψ(u, v) = ψ1 (u, v), . . . , ψn (u, v), . . . , ψn+m (u, v) . Observemos que, según la
forma que tiene ϕ en (30), donde sus primeras coordenadas son la identidad,
esta propiedad se obtiene también para ψ, que por lo tanto se puede escribir
como
ψ(u, v) = u, h(u, v)
donde h = (ψn+1 , . . . , ψn+m ). Veamos ahora que f (x) = h(x, 0) verifica
(a), para x ∈Bn = B(x0 , δ), con δ > 0 suficientemente pequeño, tal que
ψ B (x0 , 0), δ ⊂ Bn+m . En efecto, como (x, 0) ∈ B (x0 , 0), δ porque
x ∈ B(x0 , δ), y tenemos

x, F x, f (x) = ϕ(x, f (x)) = ϕ x, h(x, 0)

= ϕ ψ(x, 0) = (x, 0),
obteniendo que
F x, f (x) = 0. (31)
Veamos ahora (b). La aplicación f es diferenciable, por estar formada por
1
coordenadas de una aplicación diferenciable, mientras que F es de clase C .
Designando g(x) = x, f (x) , tenemos F ◦ g = 0, y podemos aplicar la regla
de la cadena en (31), para obtener JF ◦ Jg = 0. Si escribimos los jacobianos
en bloques tenemos

∂(F1 , . . . , Fm ) ∂(F1 , . . . , Fm ) ∂(F1 , . . . , Fm )
JF = = ,
∂(x1 , . . . , xn , y1 , . . . , ym ) ∂(x1 , . . . , xn ) ∂(y1 , . . . , ym )
" #
∂(x1 , . . . , xn , f1 , . . . , fm ) Idn
Jg = = ∂(f1 ,...,fm ) .
∂(x1 , . . . , xn ) ∂(x1 ,...,xn )
Imponiendo la condición JF × Jg = 0 obtenemos

∂(F1 , . . . , Fm ) ∂(F1 , . . . , Fm ) ∂(f1 , . . . , fm )
× Idn + × = 0,
∂(x1 , . . . , xn ) ∂(y1 , . . . , ym ) ∂(x1 , . . . , xn )
de donde resulta (b), por ser ∂(F 1 ,...,Fm )
∂(y1 ,...,ym )
una matriz invertible. Finalmente
observamos que las derivadas de f se obtienen a partir de las derivadas de
F , que son continuas, evaluadas en x y en f (x). Como f es continua, por ser
diferenciable, y la composición de aplicaciones continuas es continua, resulta
que f es de clase C 1 . Esto concluye la demostración.
17
Ejemplo 9. Queremos estudiar el conjunto M de puntos (x, y, z) ∈ R3 que
verifican (
x2 + y 2 = 1
y=z
Tenemos (1, 0, 0) ∈ M . Consideremos la aplicación F = (F1 , F2 ) : R3 → R2
dada por
F (x, y, z) = (x2 + y 2 − 1, y − z).
Observamos que m+n = 3 y m = 2, es decir, podemos despejar dos variables,
digamos x, y en función de la tercera z. Como F ∈ C 1 , resta verificar la
condición de no anulación del determinante del jacobiano

∂(F1 , F2 ) 2x 2y
=
∂(x, y) 0 1

En el punto (1, 0, 0) tenemos det ∂(F1 , F2 )/∂(x, y) = 2 6= 0, por lo que
aplicando el teorma de la aplicación implı́cita obtenemos que existe una
2
función f : (−ε, ε) → R , dada por f (z) = x(z), y(z) tal que se veri-
fica F x(z), y(z), z = 0. En otros términos M es (localmente) la curva
λ : (−ε, ε) → R3 de ecuación λ(z) = x(z), y(z), z . Calculemos el vector
t
tangente a esta curva en z = 0. Tenemos ∂F/∂z = (F1 )z , (F2 )z . Por eso,
en el punto (1, 0, 0), tenemos
−1
0 0
∂(x, y) 2 0 0 0
x (0), y (0) = (1, 0, 0) = − × =
∂z 0 1 −1 1
De aquı́ concluı́mos que λ0 (0) = (0, 1, 1), que es el vector tangente a la curva
M en el punto (1, 0, 0).
Teorema 9 (Multiplicadores de Lagrange).
Consideremos U abierto en Rn+m , f : U → R, g = (g1 , . . . , gm ) : U → Rm ,
ambas funciones de clase C 1 .
(a) Si p ∈ M = g −1 (0) y f presenta extremo relativo condicionado a g en p,
entonces el conjunto de vectores
{∇f (p), ∇g1 (p), . . . , ∇gm (p)} (32)
es linealmente dependiente.
(b) Si además Jg(p) tiene rango m (rango máximo), entonces existen reales
λ1 , . . . , λm , llamados multiplicadores de Lagrange, tales que
∇f (p) = λ1 ∇g1 (p) + · · · + λm ∇gm (p).
18
Demostración. Comencemos observando que (b) es inmediato a partir de (a).
Supongamos entonces, para demostrar (a), por absurdo, que el conjunto de
m + 1 vectores en (32) es linealmente independiente. Obtenemos entonces
que la matriz  
∇f
∂(f, g1 , . . . , gm )  ∇g1 
=  .. 
 
∂(x1 , . . . , xn+m )  . 
∇gm
tiene sus m + 1 filas linealmente independientes, y por lo tanto, tiene rango
m + 1. Tiene entonces también m + 1 columnas linealmente independien-
tes, que por simplicidad en la notación, suponemos son las m + 1 prime-
ras. Designemos p = (p1 , . . . , pm , pm+1 , . . . , pn+m ). Fijando entonces las varia-
bles pm+2 , . . . , pm+n obtenemos que la aplicación auxiliar y = (y0 , . . . , ym ) =
ϕ(x1 , . . . , xm+1 ) dada por
y0 = f (x1 , . . . , xm+1 , pm+2 , . . . , pm+n )
y1 = g1 (x1 , . . . , xm+1 , pm+2 , . . . , pm+n )
..
.
ym = gm (x1 , . . . , xm+1 , pm+2 , . . . , pm+n )
tiene jacobiano no nulo en el punto a = (p1 , . . . , pm+1 ), y por lo tanto,
existe una bola B(a, ε) en donde ϕ es un difeomorfismo. Ademas ϕ(a) =
f (p), g1 (p), . . . , gm (p) = f (p), 0, . . . , 0 . Como existe la inversa
de ϕ, para
δ > 0 suficientemente pequeño, los puntos f (p) ± δ, 0, . . . , 0 tienen preima-
gen en la bola B(a, ε), y por este motivo, estos puntos pertenecen a g −1 (0),
y f no presenta extremo relativo condicionado en p, contradiciendo nuestra
hipótesis. En conclusión, la matriz no tiene rango m + 1, y los vectores en
(32) son linealmente dependientes, como querı́amos probar.
Al igual que en la búsquda de los extermos de f con una condición g = 0,
el teorema de los multiplicadores de Lagrange da una condición necesaria para
la existencia de extremos relativos con varias condiciones g = (g1 , . . . , gm ) =
0. Una vez descartados los puntos de M = g −1 (0) en los que f , g no son
de clase C 1 , y aquellos en los que Jg no tiene rango máximo, los extremos
condicionados se presentan únicamente en aquellos puntos en los que existen
λ1 , . . . , λm reales tal que
∇f (p) = λ1 ∇g1 (p) + · · · + λm ∇gm (p).
19
Para buscar estos puntos consideramos la función auxiliar
L(x1 , . . . , xn , λ1 , . . . , λm ) = f − λ1 g1 − · · · − λm gm ,
y observamos que los extremos condicionados de f a g son puntos crı́ticos de

la función L. Veamos una aplicación de este procedimiento.
Ejemplo 10. Queremos determinar los puntos del conjunto M del ejemplo
9 cuya distancia al origen es máxima y mı́nima. Para eso consideramos la
función f (x, y, z) = x2 + y 2 + z 2 (cuyos extremos coinciden con los de la
distancia al origen) y la condición g(x, y, z) = (x2 + y 2 − 1, y − z) = 0.
Tenemos entonces
L(x, y, z, λ, µ) = x2 + y 2 + z 2 − λ(x2 + y 2 − 1) − µ(y − z).
Las ecuaciones que se obtienen de imponer ∇L = 0 son


 Lx = 2x(1 − λ) = 0
Lλ = −x2 − y 2 + 1 = 0
Ly = 2y(1 − λ) − µ = 0
Lµ = −y + z = 0
Lz = 2z + µ = 0

Si sustituı́mos y = z y observamos que x = 0 ó λ = 1, obtenemos todas las

soluciones de este sistema, que son (1, 0, 0), (−1, 0, 0), (0, 1, 1) y (0, −1, −1).
Evualuando la funcón en estos puntos obtenemos que √ la distancia mı́nima es
1, que se da en los puntos (±1, 0, 0), y la máxima 2 que se presenta en los
puntos (0, ±1, ±1).
20

Cálculo II - 2004 - Funciones Diferenciables de RN en RM

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Cálculo II - 2004 - Funciones Diferenciables de RN en RM

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Cálculo II - 2004 - Funciones Diferenciables de RN en RM

Cargado por

Copyright:

Formatos disponibles

Diferenciabilidad de funciones de Rn en Rm

En este capı́tulo generalizamos la noción de diferenciabilidad para funcio-

asumiendo que x = (x1 , . . . , xn ) es un vector fila. Si las funciones coordenadas

x = ρ cos θ, y = ρ sen θ, (1)

que definimos del dominio X = [0, ∞) × [0, 2π) en R2 .

x = ρ cos θ, y = ρ sen θ, z = z, (2)

aplicación definida de X = [0, ∞) × [0, 2π) × R en R3 , que llamamos cambio

x = ρ cos θ sen ϕ, y = ρ sen θ sen ϕ, z = ρ cos ϕ, (3)

aplicación definida de X = [0, ∞) × [0, 2π) × [0, π) en R3 .

f (a + v) − f (a) = T (v) + kvk p(v), lı́m p(v) = 0. (4)

La transformación lineal anterior se llama diferencial de la aplicación f en

Introduciendo la aplicación r(v) = kvkp(v), que llamamos resto, las fór-

Estamos entonces definiendo que una aplicación es diferenciable en un punto

fi (a + v) − fi (a) = Ti (v) + kvk pi (v), lı́m pi (v) = 0,

para i = 1, . . . , m, que es la definición de diferenciabilidad de la función fi en

fi (a + v) − fi (a) = dfia (v) + kvk pi (v), lı́m pi (v) = 0,

para i = 1, . . . , m. Luego, con

y p = (p1 , . . . , pm ), la aplicación f verifica la definición (4) en el punto a,

λ0 (a) = dλa (1), (6)

es decir, la velocidad de la curva en el instante a se obtiene como el valor del

De aquı́ resulta además la unicidad del diferencial de una aplicación diferen-

Jh(a) = Jg(b) × Jf (a), (11)

donde × designa el producto de matrices.

f (a + v) − f (a) = dfa (v) + kvk p(v), lı́m p(v) = 0. (14)

Como g es diferenciable en b = f (a), existe q : B(0, δ) → Rp tal que

g(b + w) − g(b) = dgb (w) + kwk q(w), lı́m q(v) = 0.

Sustituyendo w = f (a+v)−f (a) dado en (14) en la fórmula anterior, tenemos

Introduciendo la función auxiliar P (v), podemos entonces escribir

donde aplicamos (6). Si suponemos entonces que un punto se encuentra en

2. Teorema de la aplicación inversa

Definición 2. (a) Una aplicación f : X → Y , donde X ⊂ Rn , Y ⊂ Rm ,

Observemos que la composición de homeomorfismos es un homeomor-

como resulta del teorema de la función inversa en R.

kT (v)k = kvk × kT (x)k ≤ |||T ||| × kvk . (17)

De aquı́ resulta que las transformaciones lineales son funciones lipchitzianas,

|||T ||| ≤ mn máx{|aij | : i = 1, . . . , m; j = 1, . . . , n}. (18)

En efecto, si x = x1 e1 +· · ·+xn en , y kxk = 1, tenemos |xi | ≤ 1 (i = 1, . . . , n),

kT (x)k ≤ |x1 | kT (e1 )k + · · · + |xn | kT (en )k ≤ kT (e1 )k + · · · + kT (en )k

El teorema del valor medio no es válido en el contexto de las aplicaciones.

(b) Cuando f es diferenciable para cada x ∈ [a, a + v], se verifica

Demostración. Dado w ∈ Rm , la función auxiliar φ : [0, 1] → R definida

kf (a + v) − f (a)k2 = hw, f (a + v) − f (a)i = φ(1) − φ(0) = φ0 (θ)

Demostración. Como el diferencial de la identidad IdU : U → U es la trans-

En conclusión, la transformación lineal d(f −1 )b es invertible, y tiene inversa

Se trata entonces de verificar que q(w) → 0 (w → 0). Tenemos a = f −1 (b).

w = b + w − b = f (a + v) − f (a) = dfa (v) + kvk p(v), lı́m p(v) = 0.

Sustituyendo esta última expresión en (22), tenemos

Como f y f −1 son continuas obtenemos que v → 0 si y sólo si w → 0.

g (0) (x) = x, g (k) (x) = g g (k−1) (x) (k = 1, 2, . . . ).

Teorema 6 (de la contracción).

kg(x) − g(y)k ≤ λ kx − yk , para todos x, y ∈ X.

Demostración. Veamos primero que si existe un punto fijo, este es único. En

kz1 − z2 k = kg(z1 ) − g(z2 )k ≤ λ kz1 − z2 k ,

de donde kz1 − z2 k = 0, y resulta z1 = z2 .

z = lı́m g (k) (x) = lı́m g g (k−1) (x) = g(z),

verificando que z es el punto fijo que buscábamos.

definida en U . Esta aplicación tiene diferencial nulo en el origen porque dg0 =

gy (x) = y + g(x) = y + x − f (x).