Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Apuntes Cal I - 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 157

Matemáticas: Cálculo I

Grado en Ingeniería de Tecnologías de Telecomunicación

Ramón González Rodríguez


Matemáticas: Cálculo I

Índice general

Capítulo 1. Introducción 3
1.1. Propiedades básicas de los números reales 3
1.2. Sucesiones de números reales 6
1.3. Funciones reales de variable real 7
1.4. Composición de funciones 25
1.5. Funciones inyectivas. Función inversa 26

Capítulo 2. Continuidad de funciones de una variable 31


2.1. Límites 31
2.2. Continuidad 39
2.3. Teorema de los Valores Intermedios 42
2.4. El Teorema de Bolzano 43
2.5. El método de bisección 43

Capítulo 3. Continuidad de funciones de varias variables 45


3.1. El espacio euclídeo n-dimensional 45
3.2. Abiertos y cerrados en Rn 48
3.3. Funciones de varias variables 52
3.4. Límites de funciones de varias variables 55
3.5. Continuidad de funciones de varias variables 62
3.6. El Teorema de Bolzano para campos escalares 67

Capítulo 4. Sistemas de coordenadas en el plano y en el espacio 69


4.1. Coordenadas polares 69
4.2. Coordenadas cilíndricas 73
4.3. Coordenadas esféricas 76
4.4. Anexo I: Cónicas 80
4.5. Anexo II: Cuádricas 83

Capítulo 5. Derivación de funciones de una variable y aplicaciones de la derivada 91


5.1. Derivada de una función en un punto. 91
5.2. Función derivada, derivadas sucesivas y propiedades 95
5.3. Regla de la Cadena 98
5.4. Derivación de funciones inversas 98
5.5. Derivación implícita 99
5.6. Máximos y mínimos 101
5.7. El teorema del valor medio 104
5.8. La Regla de L’Hôpital. 108
5.9. Estudio local de la gráfica de una función 109
5.10. El polinomio de Taylor 112
5.11. El método de Newton 115
5.12. Anexo I: Tablas de derivadas 115
1
Matemáticas: Cálculo I.

Capítulo 6. Diferenciabilidad de funciones de varias variables 119


6.1. Derivada direccional y derivadas parciales 119
6.2. Diferenciabilidad 125
6.3. El plano tangente 130
6.4. Regla de la Cadena 133
6.5. Derivadas de orden superior 134
6.6. Operadores diferenciales 138
Capítulo 7. Aplicaciones del cálculo diferencial 141
7.1. Extremos relativos 141
7.2. Extremos condicionados 148
7.3. El Método de Newton 155

2
Matemáticas: Cálculo I

Capítulo 1

Introducción

El objetivo de este tema es recordar las principales propiedades de los números reales y de las
funciones reales de variable real más básicas.

1.1. Propiedades básicas de los números reales


Comenzaremos esta sección haciendo un breve repaso del conjunto de los números reales,
denotado por R, así como de sus propiedades más relevantes. En la materia también manejaremos
otros conjuntos numéricos como los números naturales
N = {1, 2, 3, . . . },
los números enteros
Z = {0, ±1, ±2, ±3, . . . },
los números racionales
p
Q={ / p, q ∈ Z, q 6= 0},
q
y, de manera muy puntual, los números complejos
C = {a + bi / a, b ∈ R, i2 = −1}.
Para los anteriores conjuntos de números tenemos los siguientes contenidos.
N ⊆ Z ⊆ Q ⊆ R ⊆ C.
Los contenidos previos son estrictos ya que, por ejemplo, el número −3 es entero y no es
1 √
natural. El número es racional pero no es entero, el número 2 es un número real que no se
2
puede representar como cociente de dos números enteros y, finalmente, la unidad imaginaria i es
un número complejo que no es real ya que cumple que i2 = −1.
Todo número real admite una representación decimal. Si el número pertenece al conjunto de
los números racionales, el decimal correspondiente es periódico; por ejemplo,
1 2 157 9
= 0,50, = 0, 6, = 0,317, = 1, 285714,
2 3 495 7
donde la línea sobre los números indica que la secuencia de dígitos se repite sucesivamente. Por
otro lado, si la representación decimal no es periódica el número se llama irracional y el conjunto
de dichos números se denotá por I. Por ejemplo

2 = 1, 414213562373095 . . . , π = 3, 141592653589793 . . . ,
son números irracionales. Así pues, los números reales son la unión de los números racionales y los
irracionales:
R = Q ∪ I.
Para cada par de números reales a y b existe un único número real llamado suma de a y b,
denotado por a + b, y un único número real llamado producto de a y b, denotado por a.b, tales
que se cumplen las siguientes propiedades:
(i) a + b = b + a y a · b = b · a, ∀ a, b ∈ R.
(ii) a + (b + c) = (a + b) + c y a · (b · c) = (a · b) · c, ∀ a, b, c ∈ R.
3
Matemáticas: Cálculo I.

(iii) a · (b + c) = a · b + a · c, ∀ a, b, c ∈ R.
(iv) Existen dos números reales 0 y 1 tales que 0 + a = a y 1 · · · a = a, ∀ a ∈ R.
(v) Para todo número real a existe un número real −a, llamado el opuesto de a, tal que a +
(−a) = 0
(vi) Para todo número real no nulo a existe un número real a−1 , llamado el inverso de a, tal que
a · a−1 = 1.
La primera de las propiedades indica que la suma y el producto son operaciones conmutativas,
la segunda propiedad afirma que suma y producto son asociativas y la tercera expresa el carácter
distributivo del producto respecto de la suma. En la cuarta propiedad tenemos que el número 0
es el elemento neutro de la suma y que el número 1 lo es del producto. Finalmente, la quinta y la
sexta propiedades indican que todo número tiene opuesto para la suma y que todo número real
no nulo tiene inverso para el producto. Este inverso se también se denota por
1
a−1 = .
a
En lo que sigue, por comodidad, denotaremos el producto de dos números reales a y b como
ab. De las propiedades anteriores se deduce de forma fácil que 0 y 1 son únicos y que para todo a
real no nulo −a y a−1 también son únicos. Obviamente −0 = 0.
Un conjunto con dos operaciones satisfaciendo las propiedades anteriores se llama cuerpo
conmutativo. Por lo tanto, los números reales son un cuerpo conmutativo. Los números racionales
también lo son si utilizamos como operaciones la suma y el producto de números racionales. Sin
embargo, los números enteros no lo son ya que el número 2 no tiene inverso para el producto de
números enteros.
Los números reales se pueden representar mediante puntos en una recta. En ella se elige un
punto arbitrario O, que se llama origen, y corresponde al número real 0. Cada número positivo x
se representa mediante el punto en esa recta que está una distancia de x unidades hacia la derecha
del origen, y cada número negativo −x, se representa mediante el punto que está x unidades a la
izquierda del origen. Así, cada número real se representa como un punto de la recta, y cada punto
de la recta se corresponde con un sólo número real.
−x O x

Los números reales están ordenados. Se dice que a es menor o igual que b y se escribe a ≤ b
si b − a es un número no negativo. Esto significa, desde un punto de vista geométrico, que si a es
distinto de b, a está a la izquierda de b en la recta numérica anterior. Cuando a ≤ b y a y b son
distintos diremos también que a es menor que b y lo representaremos como a < b. La relación ≤
es de orden ya que se cumplen las propiedades reflexiva
a ≤ a ∀a ∈ R,
antisimétrica
a≤byb≤a ⇒ a=b
y transitiva
a ≤ b y b ≤ c ⇒ a ≤ c.
El orden es total ya que para cada par de números reales a y b se tiene que a ≤ b o b ≤ a.
Por otro lado también se cumplen las propiedades
(1) Para todo número real c, si a ≤ b, se tiene que a + c ≤ b + c,
(2) Para todo número real c > 0, si a ≤ b, se tiene que ac ≤ bc,
gracias a las cuales R se convierte en un cuerpo conmutativo ordenado.
De forma sencilla, de las propiedades anteriores pueden deducirse las siguientes desigualdades.
(1) Si 0 < a ≤ b ⇒ −a ≥ −b.
4
Matemáticas: Cálculo I.

1 1
(2) Si 0 < a ≤ b ⇒ ≥ .
a b
1 1
(3) Si a ≤ b < 0 ⇒ ≥ .
a b
Definición 1.1.1. Sea S un subconjunto de R y sea a un número real. Si a ≤ s para todo s ∈ S,
diremos que a es una cota inferior de S y que S está acotado inferiormente por a.
Sea b otro número real tal que b ≥ s para todo s ∈ S. En este caso diremos que b es una cota
superior de S y que S está acotado superiormente por b.
Todo conjunto S acotado superior e inferiormente se llamará conjunto acotado.
Definición 1.1.2. Un número real m se dice que es el mínimo de un conjunto S si pertenece a S
y es una cota inferior de S, i. e., m ∈ S y m ≤ s para todo s ∈ S. En el caso de que m sea un
mínimo de S lo denotaremos como m = min(S).
Un número real M se dice que es el máximo de un conjunto S si pertenece al conjunto S y
es una cota superior de S, i. e., M ∈ S y M ≥ s para todo s ∈ S. En el caso de que M sea un
máximo de S lo denotaremos como M = max(S).
Definición 1.1.3. Un número real a se dice que es el ínfimo de un conjunto S si es la mayor cota
inferior de S, i. e., a ≤ s para todo s ∈ S y cada a0 > a no es cota inferior de S. Si a es el ínfimo
de S se denotará como a = inf (S).
Equivalentemente, el ínfimo de un conjunto S es el máximo del conjunto de cotas inferiores
de S. Además, si a = inf (S), tendremos que a = min(S) si y solo si a ∈ S.
Un número real b se dice que es el supremo de un conjunto S si es la menor cota superior del
S, i. e., b ≤ s para todo s ∈ S y cada b0 < b no es cota superior de S. Si b es el supremo de S se
denotará como b = sup(S).
Equivalentemente, el supremo de un conjunto S es el mínimo del conjunto de cotas superiores
de S. Además, si b = sup(S), tendremos que b = max(S) si y solo si b ∈ S.
El siguiente resultado es la propiedad que caracteriza la diferencia fundamental entre Q y R.
Teorema 1.1.4. Todo subconjunto no vacío de R acotado superiormente tiene supremo.
La propiedad análoga (todo subconjunto no vacío de R acotado inferiormente tiene ínfimo)
es consecuencia del anterior teorema.
Definición 1.1.5. Para cualesquiera a y b números reales llamaremos intervalos a los subconjuntos
de R definidos de la siguiente forma:
(i) Intervalo acotado y abierto:
(a, b) = {x ∈ R : a < x < b};
(ii) Intervalo acotado, cerrado por la izquierda y abierto por la derecha:
[a, b) = {x ∈ R : a ≤ x < b};
(iii) Intervalo acotado, abierto por la izquierda y cerrado por la derecha:
(a, b] = {x ∈ R : a < x ≤ b};
(iv) Intervalo acotado y cerrado:
[a, b] = {x ∈ R : a ≤ x ≤ b};
(v) Intervalo abierto, acotado inferiormente pero no superiormente:
(a, +∞) = {x ∈ R : x > a};
(vi) Intervalo cerrado, acotado inferiormente pero no superiormente:
[a, +∞) = {x ∈ R : x ≥ a};
5
Matemáticas: Cálculo I.

(vii) Intervalo abierto, acotado superiormente pero no inferiormente:


(−∞, b) = {x ∈ R : x < b};
(viii) Intervalo cerrado, acotado superiormente pero no inferiormente:
(−∞, b] = {x ∈ R : x ≤ b};
(ix) Intervalo no acotado inferior ni superiormente:
(−∞, +∞) = R.
En R los intervalos cerrados y acotados [a, b] reciben el nombre de intervalos compactos.
Ejemplo 1.1.6. Sea el conjunto S = { n1 / n ∈ N} ∪ (2, 3] ∪ [4, +∞). Esta claro que S no está
acotado superiormente y, por lo tanto, no tiene supremo ni máximo. Por otro lado, todo número
perteneciente al intervalo (−∞, 0] es una cota inferior para S. Así pues 0 es el ínfimo de S y, como
no pertenece al conjunto, S no tiene mínimo.
El conjunto T = { n1 / n ∈ N} ∪ {3} cumple que es acotado inferiormente siendo el ínfimo 0.
Por otro lado es acotado superiormente siendo el supremo 3. El número 0 no es el mínimo de S y
3 es su máximo.

1.2. Sucesiones de números reales


En esta sección se darán unas nociones básicas sobre sucesiones de números reales que serán
de utilidad en el resto del curso.
Definición 1.2.1. Una sucesión de números reales es una correspondencia que asigna a cada
número natural n un único número real xn . Esto lo podemos representar de la siguiente manera:
x : n ∈ N −→ x(n) = xn ∈ R.
Diremos que el número real xn es el término n-ésimo de la sucesión.
Definición 1.2.2. Sea {xn } una sucesión de números reales y sea x0 ∈ R. Se dirá que x0 es el
límite de {xn } cuando n tiende al infinito si
∀ ε > 0, ∃Nε ∈ N / n ≥ Nε ⇒ |xn − x0 | < ε .
En tal caso, se denotará por
x0 = lı́m xn ,
n→∞
o {xn } → x0 , y se dirá que {xn } converge a x0 .
1
Ejemplo 1.2.3. Por ejemplo, el límite de la sucesión {xn = } existe y vale 0. Si tomamos ε > 0
n
y
1 1
|xn − 0| = | − 0| = < ε
n n
se obtiene que
1
n> .
ε
1
Así pues, eligiendo Nε > , si n > Nε , se cumple que
ε
1 1 1
| − 0| = < < ε,
n n Nε
y, por lo tanto,
1
lı́m = 0.
n→∞ n

Teorema 1.2.4. Sea {xn } una sucesión de números reales. El límite de {xn }, si existe, es único.
6
Matemáticas: Cálculo I.

Definición 1.2.5. Se dirá que la sucesión de números reales {xn } está acotada o limitada supe-
riormente si existe un número real M tal que xn < M , ∀n ∈ N.
Se dirá que la sucesión de números reales {xn } está acotada o limitada inferiormente si existe
un número real N tal que N < xn , ∀n ∈ N
Definición 1.2.6. Sea {xn } una sucesión de números reales. Se dirá que {xn } es una sucesión:
(i) Creciente si xn+1 ≥ xn , ∀n ∈ N.
(ii) Decreciente si xn+1 ≤ xn , ∀n ∈ N.
(iii) Estrictamente creciente si xn+1 > xn , ∀n ∈ N.
(iv) Estrictamente decreciente si xn+1 < xn , ∀n ∈ N.
Teorema 1.2.7. (Teorema de las sucesiones monótonas). Se verifican las siguientes dos propieda-
des:
(i) Toda sucesión monótona creciente acotada superiormente es convergente.
(ii) Toda sucesión monótona decreciente acotada inferiormente es convergente.
Teorema 1.2.8. Sean {xn } e {yn } dos sucesiones de números reales convergentes a x0 e y0 ,
respectivamente. Entonces,
(i) lı́m (xn + yn ) = x0 + y0 ,
n→∞
(ii) lı́m (xn yn ) = x0 y0 ,
n→∞
xn x0
(iii) lı́m = , siempre que y0 6= 0,
n→∞ yn y0
(iv) lı́m xynn = xy00 , siempre que x0 > 0,
n→∞
(v) Si {zn } es otra sucesión y lı́m xn = lı́m yn y xn ≤ zn ≤ yn , entonces lı́m zn = x0 .
n→∞ n→∞ n→∞
Teorema 1.2.9. Todo número real es el límite de una sucesión de números racionales.
Así pues, si a ∈ R existe una sucesión {xn }, con xn ∈ Q, tal que
lı́m xn = a.
n→∞

1.3. Funciones reales de variable real


El estudio de las funciones reales de variable real constituye los cimientos de este curso. En
esta sección se introducen los principales conceptos que necesitaremos en lo que sigue.
Definición 1.3.1. Sea D un subconjunto de R. Una función real de variable real (o de forma más
abreviada una función) es una correspondencia f : D → R que asigna a cada elemento x ∈ D un
único elemento f (x) ∈ R que se denominará imagen de x.
El conjunto D se llamará dominio de definición de f y se denotará como Dom(f ). Se llamará
imagen de f al conjunto f (D) = {f (x) / x ∈ D}. Este conjunto también se suele denotar como
Im(f ). En estos apuntes utilizaremos ambas notaciones.
Dado un subconjunto D de R, la función identidad de D está dada por
idD : D → R, idD (x) = x.
Entonces, Dom(idD ) = D y idD (D) = D.
Definición 1.3.2. Dada una función f : D → R, se denomina gráfica de f a la representación en
el plano R2 de los puntos
{(x, f (x)) / x ∈ D}.
Definición 1.3.3. Sean f : D1 → R, g : D2 → R dos funciones. Las funciones combinación lineal
de f y g, denotada por αf + βg (α, β ∈ R), producto de f por g, denotada por f.g, y cociente de
f
f entre g, denotada por , se definen como:
g
7
Matemáticas: Cálculo I.

(i) αf + βg : D1 ∩ D2 → R,
(αf + βg)(x) = αf (x) + βg(x).
(ii) f.g : D1 ∩ D2 → R,
(f.g)(x) = f (x).g(x).
f
(iii) : {x ∈ D1 ∩ D2 / g(x) 6= 0} → R,
g
f f (x)
(x) = .
g g(x)
Definición 1.3.4. Una función f : D → R es estrictamente monótona creciente si para cualquier
par de números reales distintos x, y ∈ D se cumple que x < y =⇒ f (x) < f (y).
Diremos que f es estrictamente monótona decreciente si x < y =⇒ f (x) > f (y).
Si en las definiciones anteriores se cambia < por ≤ y > por ≥ tendremos las definiciones de
función monótona creciente y función monótona decreciente respectivamente.
Definición 1.3.5. Se define la función valor absoluto | | : R → R como la dada por

x si x ≥ 0
|x| =
−x si x < 0
Así pues el valor absoluto es una función que tiene como dominio R e imagen
|R| = {x ∈ R : x ≥ 0}.
La gráfica de la función valor absoluto está dada por:

x
−2 −1 0 1 2

Proposición 1.3.6. Se tienen las siguientes propiedades:


(i) |x| ≥ 0, ∀ x ∈ R y además |x| = 0 ⇐⇒ x = 0.
(ii) |x| = | − x|, ∀ x ∈ R.
(iii) |xy| = |x||y|, ∀ x, y ∈ R.
(iv) |x + y| ≤ |x| + |y|, ∀ x, y ∈ R.
(v) Si x2 ≤ y 2 se tiene que |x| ≤ |y|.
La propiedad (iv) recibe el nombre de desigualdad triangular. Obviamente x2 < y 2 implica
que |x| < |y|. Por otro lado, también tenemos las siguientes propiedades:
(1) Si r > 0, |x| = r ⇐⇒ x = ±r.
(2) Si r > 0, |x| ≤ r ⇐⇒ −r ≤ x ≤ r ⇐⇒ x ∈ [−r, r].
(3) Si r > 0, |x| ≥ r ⇐⇒ x ≤ −r o x ≥ r ⇐⇒ x ∈ (−∞, −r] ∪ [r, +∞).
La propiedad (2) permite caracterizar el intervalo cerrado centrado en x0 ∈ R y de radio
r > 0, [x0 − r, x0 + r], utilizando las propiedades del valor absoluto:
x ∈ [x0 − r, x0 + r] ⇐⇒ |x − x0 | ≤ r.
8
Matemáticas: Cálculo I.

Análogamente, para intervalos abiertos tenemos una caracterización similar:


x ∈ (x0 − r, x0 + r) ⇐⇒ |x − x0 | < r.
Usando razonamientos parecidos se obtiene que
x ∈ (−∞, x0 − r] ∪ [x0 + r, +∞) ⇐⇒ |x − x0 | ≥ r
y
x ∈ (−∞, x0 − r) ∪ (x0 + r, +∞) ⇐⇒ |x − x0 | > r.
Definición 1.3.7. Una función f : D → R se dirá que es acotada cuando exista un número K > 0
tal que:
|f (x)| ≤ K, ∀ x ∈ D.
Definición 1.3.8. Se definen las potencias de exponente natural de un número real x de la forma
siguiente:
x0 = 1, x1 = x, . . . , xn = xxn−1 , . . .
De esta forma para cada n ∈ N tendremos una función fn : R → R, llamada función potencial
de exponente n, dada por
fn (x) = xn .
Obviamente su dominio es R y su imagen es R, cuando n es impar, y [0, +∞) cuando n es
par. Así pues, estas funciones no son acotadas.
Por ejemplo, en la siguiente figura podemos ver las gráficas de f2 (x) = x2 y f3 (x) = x3 :

2 f2 (x)
f3 (x)
x
−2 0 2

−2

−4

Teniendo en cuenta la definición de las potencias de exponente natural se obtienen de forma fácil
las siguientes propiedades que se cumplen para todo número real x y cualquier m, n ∈ N:
(1) xm xn = xm+n .
(2) (xm )n = xmn .
(3) xn y n = (xy)n .
n  
n
X n k n−k
(4) (x + y) = x y siendo
k
k=0
 
n n!
=
k k!(n − k)!
con n! = 1 · 2 · · · (n − 1) · n.
9
Matemáticas: Cálculo I.

Definición 1.3.9. Se llama polinomio con coeficientes reales a cada una de las funciones p : R → R
dadas por
n
X
p(x) = ai xi = a0 + a1 x + · · · + an xn
k=0

donde k ∈ N y ai ∈ R para cada 0 ≤ k ≤ n. Los números reales ai se llaman coeficientes del


polinomio y si an es no nulo, se dice que el grado del polinomio es n.
Los polinomios de grado cero dan lugar a funciones constantes, esto es rectas paralelas al eje
OX, y los de grado uno son rectas no paralelas al eje OX. Por ejemplo

12

10

y
2
1

x
−2 0 2

x
−2 −1 0 1 2
s(x) = 3x + 6 r(x) = 1

son dos gráficas asociadas a polinomios de grado uno y cero respectivamente.


Se dice que α ∈ R es una raíz de un polinomio p(x) si p(α) = 0. Esto último es equivalente a
afirmar que

p(x) = (x − α)q(x)

donde q(x) es un polinomio de grado una unidad menos que p(x). Como es bien sabido, un
polinomio de coeficientes reales no tiene porque tener raíces reales. Por ejemplo, p(x) = x2 + 1 no
tiene ninguna raíz real. Otro ejemplo de esta situación puede ser el polinomio m(x) = x2 + x + 1.
Esta propiedad de no tener raíces reales es equivalente a decir que su gráfica no corta el eje OX (o
está por encima de dicho eje o está por debajo) y, por lo tanto, el signo de la función polinómica
es constante en todo R. Por ejemplo, la gráfica de m(x) = x2 + x + 1 es

10
Matemáticas: Cálculo I.

x
−2 0 2

y, de esta forma, queda claro que la función solo toma valores positivos en la recta real.
Diremos que un polinomio es irreducible si es de grado uno o de grado dos sin raíces reales.
Por ejemplo, los polinomios p(x) = x2 + 1, m(x) = x2 + x + 1, q(x) = 3x − 1 son irreducibles. Sin
embargo, los polinomios s(x) = x2 −5x+6 y r(x) = x2 +2x+1 no lo son, ya que s(x) = (x−2)(x−3)
y r(x) = (x + 1)2 . Esto implica que sus gráficas cortan al eje OX como se puede comprobar en las
siguientes figuras:

y 4
6

4
2

(3, 0)
x x
0 2 4 −2 (−1, 0) 0
s(x) = x2 − 5x + 6 r(x) = x2 + 2x + 1
Como se ve en las gráficas anteriores, para s(x) el signo de la función no cambia en aquellos
intervalos donde no existen raíces. En el caso de r(x) tenemos una raíz real doble.
Cuando un polinomio m(x) = x2 +a1 x+a0 con coeficientes reales de grado dos no tiene raíces
reales, sus raíces son complejas. Si z = a + bi es una de ellas, otra raíz es su conjugada z = a − bi.
Por otro lado, teniendo en cuenta que un polinomio de grado n con coeficientes reales no tiene
más de n raíces distintas (contando las reales y complejas), para el caso del polinomio irreducible
de grado dos tenemos que
m(x) = (x − z)(x − z).
Por ejemplo,
m(x) = x2 + x + 1 = (x − z)(x − z)
11
Matemáticas: Cálculo I.

−1 3
con z = + i.
2 2
Teorema 1.3.10. Sea p(x) = a0 + a1 x + · · · + an xn un polinomio con coeficientes reales tal que
an 6= 0. Entonces p(x) se puede factorizar de forma única (salvo el orden), como producto de
polinomios irreducibles, esto es:
p(x) = an (x − x1 )α1 · · · (x − xr )αr (x2 + c1 x + b1 )β1 · · · (x2 + cs x + bs )βs
donde x1 , · · · , xr son las raíces reales del polinomio repetidas cada una según su multiplicidad y s
se corresponde con el número de pares de raíces complejas conjugadas de p(x) (contadas como en
caso de las reales tantas veces como su multiplicidad).
Ejemplo 1.3.11. Supongamos que tomamos el polinomio p(x) = 3x5 + 3x4 − 6x2 . Sacando factor
común a x tenemos que
p(x) = x2 q(x), q(x) = 3x3 + 3x2 − 6
y esto implica que x1 = 0 es una raíz doble. También q(1) = 0 y gracias a esto se sigue que x2 = 1
es otra raíz real y que
p(x) = 3x2 (x − 1)t(x), t(x) = x2 + 2x + 2.
Finalmente, las raíces de t(x) son complejas ya que

2 −2 ± −4
z + 2z + 2 = 0 ⇐⇒ z = = −1 ± 2i.
2
Por lo tanto,
p(x) = 3(x − 0)(x − 0)(x − 1)(x2 + 2x + 2)
es la factorización en polinomios irreducibles de p(x) y su gráfica está dada por
y

x
0 1

−1

Definición 1.3.12. Sea x un número real no nulo y sea n un número entero negativo. Se define
xn como
1
xn = −n .
x
Por lo tanto, podemos definir para todo entero negativo la función potencial de exponente n
como:
fn : (−∞, 0) ∪ (0, +∞) → R
donde
1
fn (x) = −n .
x
12
Matemáticas: Cálculo I.

Por ejemplo, en la siguiente gráfica tenemos la representación de la función


1
f−2 (x) = 2
x
en el conjunto D = (−1, −1/10) ∪ (1/10, 1).
100

80

y 60

40

20

−1 −0,75 −0,5 −0,25 0 0,25 0,5 0,75 1


x

Como se puede observar, a medida que nos acercamos a cero, bien por la derecha o bien por
la izquierda, la función toma cada vez valores mayores (no es acotada).
En esta otra gráfica
1,000

500

0
y

−500

−1,000

−1 −0,75 −0,5 −0,25 0 0,25 0,5 0,75 1


x

tenemos la representación de
1
f−3 (x) =
.
x3
Dado que el cubo de un negativo es negativo, en este caso, cuando nos acercamos a 0 por la
izquierda obtenemos valores cada vez más pequeños (no es acotada).
Definición 1.3.13. Sea x un número real y n un número natural no nulo. Se dice que el número
real α es una raíz n-ésima de x si αn = x. Esto se representará como
√ 1
α = n x = xn .
Teniendo en cuenta esta definición se tiene lo siguiente:
√ 1
(i) Si n es impar y x ∈ R, definimos n x = x n como el único número real y tal que y n = x.
√ 1
(ii) Si n es par y x ∈ [0, +∞), definimos n x = x n como el único número real y ≥ 0 tal que
y n = x.

13
Matemáticas: Cálculo I.

m m m √
(iii) Si ∈ Q con irreducible y positivo, dado x ∈ [0, +∞) definimos x n = n xm .
n n
m m m
(iv) Si ∈ Q con irreducible y negativo, dado x ∈ (0, +∞) definimos x n = −1m .
n n x n

La siguiente gráfica es la correspondiente a la función raíz cuadrada en el intervalo [0, 2].

x
0 1 2


x = x1/2
Definición 1.3.14. Sea x ∈ (0, +∞) y α un número real positivo. Se define xα como
xα = lı́m xxn
n→∞
donde {xn } es una sucesión de números racionales cuyo límite es α. Téngase en cuenta que xα está
bien definido gracias al Teorema 1.2.9 y a que se puede probar que la definición es independiente
de la sucesión de números racionales que converge a α. Cuando el exponente α sea un número real
negativo se define xα de la siguiente forma:
1
xα = −α .
x
m m
Si tomamos α > 0, como para irreducible y positivo 0 n = 0 se tiene que 0α = 0. Así pues,
n
cuando α es positivo, se puede definir la función potencial de exponente real como
fα : [0, +∞) → R,
donde fα (x) = xα .
También, para todo α real negativo se puede definir la función potencial de exponente real
como
fα : (0, +∞) → R,
1
donde fα (x) = −α .
x
Por ejemplo, la gráfica siguiente es la de la función fπ en el intervalo [0, 1].
y

x
0 1

fπ (x) = xπ
Teniendo en cuenta todo lo anterior, si x, y ∈ [0, +∞) y α, β ∈ R, siempre que existan ambas
potencias, se tiene lo siguiente:
(1) xα xβ = xα+β .
(2) (xα )β = xαβ .
14
Matemáticas: Cálculo I.

(3) xα y α = (xy)α .
Definición 1.3.15. Sea a un número real positivo y tal que a 6= 1. Se define la exponencial en
base a como la función
ga : R → R
dada por ga (x) = ax .
El número a se conoce con el nombre de base de la función exponencial y en las siguientes
figuras podemos ver dos gráficas asociadas a este tipo de funciones.

y
16

14

y
12

4
10

6
2

4
(0, 1)
2
(0, 1) x
x 0
0 −2 2 4
−2 2 4
g2 (x) = 2x g1/2 (x) = (1/2)x
Como se puede observar en las gráficas anteriores, cuando a = 2 se tiene una función estric-
tamente creciente y cuando a = 1/2 se tiene una función estrictamente decreciente.
En general este tipo de funciones tiene como dominio a toda la recta real y su imagen es el
intervalo abierto (0, +∞). Además, cuando a > 1 se tiene una función estrictamente creciente y
cuando a < 1 se tiene una función estrictamente decreciente.
Finalmente, también podemos garantizar que
(1) a0 = 1,
(2) ax ay = ax+y ,
(3) (ax )y = axy ,
son propiedades que cumplen este tipo de funciones.
Si considerásemos en la definición el caso a = 1, obtendríamos la función g1 (x) = 1x = 1 que
es una función constante (su gráfica es la de la recta y = 1). También en este punto nos podríamos
preguntar si es posible definir 00 . Sobre esta última cuestión existe cierta polémica (ver el video
de Eduardo Sáenz de Cabezón https://www.youtube.com/watch?v=lqBXU-9Y3kU) ya que existen
varias opciones (por ejemplo, no sería una barbaridad asumir que 00 = 1).
Un caso particular interesante de la función exponencial es cuando tomamos como base a el
número irracional
e = 2,718281828546 . . .
15
Matemáticas: Cálculo I.

En este caso la función ge = ex se llama función exponencial. La función exponencial tiene


como dominio toda la recta real, su imagen es el intervalo abierto (0, +∞) (no es acotada), y dado
que e > 1, es estrictamente creciente.
Además, aplicando las propiedades generales también se obtiene que:
(1) e0 = 1,
(2) ex ey = ex+y ,
(3) (ex )y = exy ,
siendo su gráfica:
y

1 (0, 1)

x
−2 −1 0 1

ge (x) = ex
Definición 1.3.16. Sea a un número real positivo y tal que a 6= 1. Se define el logaritmo de base
a como la función
la : (0, +∞) → R
dada por la (x) = y siendo y el único número real tal que ay = x. Nótese que y es único ya que la
función exponencial de base a es estrictamente creciente o decreciente. Normalmente la notación
que se utiliza es
y = loga (x).
Cuando a = e, el logaritmo se suele llamar natural o neperiano. En este caso la función le se
denota como
le (x) = ln(x).
De esta forma, ln(x) = y si, y solo si, ey = x.
En general, la imagen de la función logaritmo de base a es R y es una función estrictamente
creciente si a > 1 y estrictamente decreciente si a < 1 (no es acotada). Además se cumplen las
siguientes propiedades:
(1) loga (1) = 0,
(2) loga (xy) = loga (x) + loga (y),
(3) loga (x/y) = loga (x) − loga (y),
(4) loga (xα ) = α loga (x).
Por lo tanto, cuando a = e, obtenemos las igualdades:
(1) ln(1) = 0,
(2) ln(xy) = ln(x) + ln(y),
(3) ln(x/y) = ln(x) − ln(y),
(4) ln(xα ) = α ln(x).
En la figura siguiente tenemos la gráfica de la función dada por el logaritmo neperiano. Como
se puede comprobar es creciente y su imagen es toda la recta real.
16
Matemáticas: Cálculo I.

(1, 0)
x
0 2 4

−2

−4

le (x) = ln(x)

Finalmente, para todo a número real positivo tal que a 6= 1 (ln(a) 6= 0) y para todo x ∈ R, se
cumple que
ax = ex ln(a)

ya que
ln(ax ) = x ln(a) = ln(ex ln(a) ).

Además también se puede garantizar que, dado x > 0,

ln(x)
loga (x) = ,
ln(a)

ya que, si
z = loga (xln(a) ),

se obtiene az = xln(a) . Entonces, z = ln(x). Por lo tanto,

ln(x) = loga (xln(a) ) = ln(a) loga (x)

y despejando se obtiene la igualdad.


Estas últimas igualdades implican que las funciones exponenciales y logarítmicas en otras
bases distintas de a = e se pueden describir en términos de exponenciales y logaritmos neperianos.

Definición 1.3.17. Sea C1 la circunferencia de centro (0, 0) y radio r = 1, esto es:

C1 = {(x, y) ∈ R2 / x2 + y 2 = 1}.

Se define el radián como el ángulo barrido al desplazarse una longitud l = 1 sobre la circun-
ferencia C1 .
17
Matemáticas: Cálculo I.

r=1 l=1

α = 1 rad

Así pues a una circunferencia entera le corresponde un ángulo de 2π radianes. Equivalente-


mente, 360◦ son 2π radianes. Utilizando esta correspondencia, mediante reglas de tres, podemos
conocer la expresión de cualquier ángulo en radianes si conocemos su expresión en grados y vice-
versa. Por ejemplo, si un ángulo es de xr radianes su valor en grados es

180 · xr
xg = .
π
Definición 1.3.18. Para cada número real α se definen el coseno y el seno de α como las coor-
denadas del punto de la circunferencia C1 obtenido al girar desde el eje OX un ángulo de |α|
radianes en sentido antihorario si α es mayor o igual que cero y en sentido horario si α es negativo.
Se denotarán respectivamente por cos(α) y sen(α).

(cos(α), sen(α))

r=1

Dado que el punto (cos(α), sen(α)) pertenece a la circunferencia C1 se tiene que

cos2 (α) + sen2 (α) = 1

para todo α.
Además, por semejanza de triángulos, se tiene que la definición de coseno y seno es indepen-
diente de la circunferencia centrada en (0, 0) que tomemos. Supongamos que en la siguiente figura

18
Matemáticas: Cálculo I.

(a, b)

la circunferencia interior es C1 y que la exterior es otra centrada en (0, 0) con un radio r mayor
que 1 (en el caso de que el radio fuese menor razonaríamos de la misma forma). Entonces, por
semejanza de triángulos, el coseno de α se obtiene como el cateto contiguo partido por la longitud
del radio y el seno del mismo ángulo como el cateto opuesto partido por la longitud del radio, i.
e.,
a b
cos(α) = , sen(α) = ,
r r
o, lo que es lo mismo,
a = r cos(α), b = r sen(α).
De esta forma podemos definir dos funciones
f : R → R, f (x) = cos(x),

g : R → R, g(x) = sen(x),
cuyas imágenes son el intervalo cerrado [−1, 1] (son acotadas). Por ejemplo, sus gráficas en el
intervalo [−2π, 2π] están dadas por
y
1

x
−6 −5 −4 −3 −2 −1 0 1 2 3 4 5 6

−1

f (x) = cos(x)

y
1

x
−6 −5 −4 −3 −2 −1 0 1 2 3 4 5 6

−1

g(x) = sen(x)
19
Matemáticas: Cálculo I.

Como se puede observar en las gráficas anteriores las funciones seno y coseno son periódicas
de periodo 2π, o lo que es lo mismo, para todo x ∈ R se tiene que

cos(x + 2π) = cos(x), sen(x + 2π) = sen(x).

Esto último implica que conociendo los valores del coseno y del seno en el intervalo [0, 2π)
podemos obtener los valores de la función en toda la recta real. Es más, gracias a que se cumplen
las siguientes igualdades

cos(−x) = cos(x), sen(−x) = − sen(x),

cos(π − x) = − cos(x), sen(π − x) = sen(x),

podemos afirmar que para conocer los valores de estas dos funciones es suficiente saber su valor
en ángulos del intervalo [0, π/2).
Entre las propiedades importantes del seno y del coseno podemos citar:

sen(x + y) = sen(x) cos(y) + cos(x) sen(y),

sen(x − y) = sen(x) cos(y) − cos(x) sen(y),

cos(x + y) = cos(x) cos(y) − sen(x) sen(y),

cos(x − y) = cos(x) cos(y) + sen(x) sen(y).

Si en las interiores igualdades tomamos y = x y utilizamos que cos2 (x)+sen2 (x) = 1, podemos
demostrar que
1 + cos(2x) 1 − cos(2x)
cos2 (x) = , sen2 (x) = ,
2 2
para todo x ∈ R
Finalmente, también se cumple para todo número real x que

sen(2x) = 2 sen(x) cos(x),

cos(2x) = cos2 (x) − sen2 (x).

Definición 1.3.19. Sea x ∈ R un número real tal que cos(x) 6= 0. Se define la tangente de x como

sen(x)
tg(x) = .
cos(x)

Los puntos en los cuales se anula el coseno son


π
B={ ± kπ / k ∈ N}
2
y esto implica que podemos definir una función, llamada función tangente,

h : R − B → R, h(x) = tg(x).
20
Matemáticas: Cálculo I.

4,5

x
(−π/2, 0) 0 (π/2, 0)

−4,5

−9

h(x) = tg(x)
En la figura precedente podemos ver la representación gráfica de la función tangente en el
intervalo [−π/2+1/10, π/2−1/10]. Esta claro que a medida que x tienda a −π/2 la función tenderá
a −∞ y cuando x tienda a π/2 la función tomará valores que tenderán a +∞. Obviamente, como
el seno y el coseno son funciones periódicas, la tangente también lo será.
y

4,5

x
−4,5 0 4,5

−4,5

−9

Periodicidad de la tangente
A la vista de la gráfica está claro que la imagen de la función tangente es todo R.

Definición 1.3.20. Sea x ∈ R un número real tal que cos(x) 6= 0. Se define la secante de x como
1
sec(x) = .
cos(x)
21
Matemáticas: Cálculo I.

Los puntos en los cuales se anula el coseno son


π
B = { ± kπ / k ∈ N}
2
y esto implica que podemos definir una función, llamada función secante,
h : R − B → R, h(x) = sec(x).
y

4,5

x
(−π/2, 0) 0 (π/2, 0)

h(x) = sec(x)
En la figura precedente podemos ver la representación gráfica de la función secante en el
intervalo [−π/2 + 1/10, π/2 − 1/10]. Esta claro que a medida que x tienda a −π/2 la función
tenderá a +∞ y cuando x tienda a π/2 la función tomará valores que tenderán también a +∞.
Obviamente, como el coseno es una función periódica, la secante también lo será.
y

5,5

x
0

−5,5

Periodicidad de la secante
A la vista de la gráfica está claro que la imagen de la función secante es (−∞, −1] ∪ [1, +∞).
Definición 1.3.21. Sea x ∈ R un número real tal que sen(x) = 6 0. Se define la cosecante de x
como
1
cosec(x) = .
sen(x)
Los puntos en los cuales se anula el seno son B = {±kπ / k ∈ N} y esto implica que podemos
definir una función, llamada función cosecante,
h : R − B → R, h(x) = cosec(x).
22
Matemáticas: Cálculo I.

4,5

(π, 0)
x
0

h(x) = cosec(x)

En la figura precedente podemos ver la representación gráfica de la función cosecante en el


intervalo [1/10, π − 1/10]. Esta claro que a medida que x tienda a 0 la función tenderá a +∞ y
cuando x tienda a π la función tomará valores que tenderán a +∞. Obviamente, como el seno es
una función periódica, la cosecante también lo será.

4,5

x
0 4,5

−4,5

−9

Periodicidad de la cosecante

A la vista de la gráfica está claro que la imagen de la función cosecante es coincidente con la
de la secante y vale (−∞, −1] ∪ [1, +∞).

Definición 1.3.22. Sea x ∈ R un número real tal que sen(x) 6= 0. Se define la cotangente de x
como
cos(x)
cotg(x) = .
sen(x)
Los puntos en los cuales se anula el seno son B = {±kπ / k ∈ N} y esto implica que podemos
definir una función, llamada función cotangente,

h : R − B → R, h(x) = cotg(x).
23
Matemáticas: Cálculo I.

4,5

(π, 0)
x
0

−4,5

−9

h(x) = cotg(x)
En la figura precedente podemos ver la representación gráfica de la función cotangente en el
intervalo [1/10, π − 1/10]. Esta claro que a medida que x tienda a 0 la función tenderá a +∞ y
cuando x tienda a π la función tomará valores que tenderán a −∞. Obviamente, como el seno y
el coseno son funciones periódicas, la cotangente también lo será.
y

4,5

x
0 4,5

−4,5

−9

Periodicidad de la cotangente
A la vista de la gráfica está claro que la imagen de la función cotangente es todo R.
Finalmente, para estas funciones se cumplen las siguientes igualdades.
(1) Sea x ∈ R un número real tal que cos(x) 6= 0. Entonces
1 + tg2 (x) = sec2 (x).
24
Matemáticas: Cálculo I.

(2) Sea x ∈ R un número real tal que sen(x) 6= 0. Entonces


1 + cotg2 (x) = cosec2 (x).

1.4. Composición de funciones


En esta sección estudiaremos una operación que podemos realizar con funciones y que es
distinta a las vistas en la Definición 1.3.3.
Definición 1.4.1. Sean f : A → R y g : B → R. Si f (A) ⊂ B, se define la composición
g ◦ f : A → R como la función dada por
(g ◦ f )(x) = g(f (x))
para todo x ∈ A.
Ejemplo 1.4.2. Por ejemplo, si f (x) = x2 + 1 y g(x) = ln(x), se define
g◦f :R→R
como
(g ◦ f )(x) = g(f (x)) = ln(x2 + 1), ∀ x ∈ R.
Esta composición la podemos hacer ya que la imagen de f está contenida en el dominio de g.
Teniendo en cuenta la definición de composición de funciones, no todo par de funciones se
pueden componer. Por ejemplo, si tomamos f : R → R con f (x) = x3 y g : (0, +∞) :→ R
tal que g(x) = ln(x), no podemos calcular g ◦ f ya que f (R) = (−∞, +∞) no está contenido
en (0, +∞). Ahora bien, si restringimos f al intervalo (0, +∞), se puede calcular g ◦ f ya que
f (0, +∞) ⊂ (0, +∞). De hecho, el intervalo (0, +∞) es el mayor subconjunto en el que podemos
definir g ◦ f .
x−2 √
Ejemplo 1.4.3. Dadas las funciones f (x) = y g(x) = x se tiene que
x−1
Dom(f ) = R − {1} = (−∞, 1) ∪ (1 + ∞).
Los elementos de la forma f (x) pueden tomar valores negativos y positivos. En los primeros
no podemos calcular su raíz cuadrada y esto implica que (g ◦ f )(x) existe si, y solo si, f (x) ≥ 0.
x−2
f (x) ≥ 0 ⇐⇒ ≥ 0 ⇐⇒ x ∈ (−∞, 1) ∪ [2 + ∞).
x−1
Por lo tanto, el mayor subconjunto del dominio de f en el que podemos definir g ◦ f es
(−∞, 1) ∪ [2 + ∞). En este caso,
g ◦ f : (−∞, 1) ∪ [2 + ∞) → R
está dada por
r
x−2 x−2
(g ◦ f )(x) = g(f (x)) = g( )= .
x−1 x−1
Si lo que queremos es calcular el mayor subconjunto del dominio de g en el que se puede
definir f ◦ g, tendremos que tener en cuenta que f no está definida para un único valor que es
z = 1. Por lo tanto si g(x) = 1 no podemos calcular (f ◦ g)(x). Ahora bien,

g(x) = 1 ⇐⇒ x = 1 ⇐⇒ x = 1.
Por lo tanto, el mayor subconjunto del dominio de g en el que podemos definir f ◦ g es
Dom(g) − {1} = [0, 1) ∪ (1 + ∞). En este caso,
f ◦ g : [0, 1) ∪ (1 + ∞) → R
25
Matemáticas: Cálculo I.

está dada por √


√ x−2
(f ◦ g)(x) = f (g(x)) = f ( x) = √ .
x−1
De esta forma también queda comprobado que, en general, f ◦ g 6= g ◦ f . De hecho no tienen
porque existir ambas y la existencia de una composición no implica la existencia de la otra. Por
ejemplo, si f : R → R está dada por f (x) = −ex y g : (0, +∞) → R por g(x) = ln(x), se tiene que
g ◦ f no existe para ningún x ∈ R ya que f (x) = −ex < 0 para todo x ∈ R. Sin embargo, para
todo x ∈ (0, +∞) se cumple que
(f ◦ g)(x) = f (g(x)) = −eln(x) = −x
lo que implica que existe f ◦ g : (0, +∞) → R y (f ◦ g)(x) = −x.
Lo que se cumple es que la composición es asociativa.
Proposición 1.4.4. Sean f : D1 → R, g : D2 → R y h : D3 → R tres funciones. Si f (D1 ) ⊂ D2
y g(D2 ) ⊂ D3 se tiene que
h ◦ (g ◦ f ) = (h ◦ g) ◦ f.

1.5. Funciones inyectivas. Función inversa


Definición 1.5.1. Diremos que una función f : D → R es inyectiva si para cualquier par de
números reales distintos x, z ∈ D sus correspondientes imágenes f (x), f (z) también son distintas.
Así pues, si f es inyectiva, para cada y ∈ f (D) existe un único x ∈ D tal que f (x) = y.
Por lo tanto, las funciones inyectivas son aquellas que cumplen que
[x, z ∈ D y f (x) = f (z) =⇒ x = z]
Ejemplo 1.5.2. Por ejemplo, la función f : R → R dada por f (x) = x2 no es inyectiva ya que
1 6= −1 y f (−1) = f (1) = 1. Sin embargo f (x) = x3 es inyectiva.
Definición 1.5.3. Diremos que una función f : D → R es invertible si existe otra función
g : B → R tal que g ◦ f = idD y f ◦ g = idB .
La función g se llamará inversa de f y en lo que sigue se denotará como f −1 . Nótese que
f −1 ◦ f = idD ⇐⇒ (f −1 ◦ f )(x) = x, ∀ x ∈ D
y
f ◦ f −1 = idB ⇐⇒ (f ◦ f −1 )(y) = y, ∀ y ∈ B.
Además
x = f −1 (y) ⇐⇒ y = f (x).
Proposición 1.5.4. Sea f : D → R una función inyectiva. Entonces f admite inversa dada por
f −1 : B = f (D) → R
donde, para todo y ∈ f (D), se define f −1 (y) = x siendo x el único elemento de D tal que f (x) = y.
Así pues, si f es inyectiva, f tiene inversa f −1 y el dominio de dicha inversa es la imagen de
f . Además D = f −1 (B).
Ejemplo 1.5.5. Por ejemplo, las funciones exponencial y logaritmo neperiano, f (x) = ex y g(x) =
ln(x), son inversas ya que
g(f (x)) = ln(ex ) = x, ∀ x ∈ R = D, f (g(y)) = eln(y) = y, ∀ y ∈ (0, +∞) = B.
En la siguiente figura se puede observar claramente la relación que existe entre la gráfica de
f (x) = ex y la de su inversa f −1 (x) = ln(x). De hecho lo que ocurre en general es que las gráficas
de las funciones f y f −1 son simétricas respecto al la recta y = x (gráfica de la función identidad
26
Matemáticas: Cálculo I.

de R, i. e., h : R → R con h(x) = x) ya que un punto (x, y) pertenece a la gráfica de f si, y solo
si, (y, x) pertenece a la gráfica de f −1 .
y
8

4 h(x)
f (x)
g(x)
2

x
−2 0 2 4 6 8

−2

En general, aunque una función f : D → R sea inyectiva, no es sencillo calcular su inversa. De


todas formas, saber que una función es invertible es de gran utilidad aunque no se pueda calcular
de forma explicita dicha inversa.
Una de las clases más interesantes de funciones inyectivas son las funciones monótonas. Es
muy fácil probar que toda función estrictamente monótona es inyectiva y como consecuencia es
invertible. Por ejemplo, la función f (x) = 3x + ex es estrictamente creciente ya que si x < y se
tiene que f (x) = 3x + ex < f (y) = 3y + ey .
Ejemplo 1.5.6. En este ejemplo calcularemos con todo detalle la inversa de una función inyectiva.
Dada la función
ex + 2
f : (−∞, 0) ∪ (0, +∞) → R, f (x) = x ,
e −1
es sencillo demostrar que es inyectiva ya que
f (x) = f (z) ⇐⇒ ex = ez ⇐⇒ x = z.
Por lo tanto tiene inversa. Como sabemos que se cumple la equivalencia
x = f −1 (y) ⇐⇒ y = f (x)
podemos escribir
ex + 2
y = f (x) = ⇐⇒ yex − y = ex + 2 ⇐⇒ ex (y − 1) = y + 2.
ex − 1
Ahora bien, ya que ex es positivo e y − 1, y + 2 no se pueden anular al mismo tiempo, la
anterior igualdad solo tiene sentido cuando y − 1 e y + 2 son los dos no nulos y del mismo signo.
Entonces, y es igual a f (x) para un x ∈ (−∞, 0) ∪ (0, +∞) si, y solo si,
y ∈ (−∞, −2) ∪ (1, +∞) = f ((−∞, 0) ∪ (0, +∞))
y en este caso
y+2 y+2
ex =⇐⇒ x = ln( ).
y−1 y−1
Como consecuencia la inversa de f esta dada por
y+2
f −1 : (−∞, −2) ∪ (1, +∞) → R, f −1 (y) = ln( ).
y−1
En la parte final del tema veremos las funciones inversas de las funciones coseno, seno y
tangente.
27
Matemáticas: Cálculo I.

Definición 1.5.7. Sea x ∈ [−1, 1]. Se define el arco coseno de x como el único z ∈ [0, π] tal que
cos(z) = x. Así pues tenemos una función llamada función arco coseno,
f : [−1, 1] → [0, π], f (x) = arccos(x),
con gráfica
y

(−1, π) (0, π)
3

x
−1 0 1

h(x) = arccos(x)
Esta función es la inversa de la función coseno definida en el intervalo [0, π]. La función coseno
tiene inversa en este intervalo ya que es inyectiva en [0, π] y en la siguiente figura podemos ver la
simetría de la que hablamos para una función y su inversa.

(−1, π) (0, π)
3

(π, 0)
x
−2 −1 0 1 2 3

−1 (π, −1)

−2

Definición 1.5.8. Sea x ∈ [−1, 1]. Se define el arco seno de x como el único z ∈ [−π/2, π/2] tal
que sen(z) = x. Así pues tenemos una función llamada función arcoseno,
f : [−1, 1] → [−π/2, π/2], f (x) = arcsen(x),
28
Matemáticas: Cálculo I.

con gráfica
y

(0, π/2) (1, π/2)

x
−1 0 1

−1

(−1, −π/2) (0, −π/2)

f (x) = arcsen(x)
Esta función es la inversa de la función seno definida en el intervalo [−π/2, π/2]. La función
seno tiene inversa en este intervalo ya que es inyectiva en [−π/2, π/2].
Definición 1.5.9. Sea x ∈ (−∞, ∞). Se define el arco tangente de x como el único z ∈ (−π/2, π/2)
tal que tg(z) = x. Así pues tenemos una función llamada función arco tangente,
f : (−∞, ∞) → (−π/2, π/2), f (x) = arctg(x),
con gráfica en el intervalo [−6, 6]
y
y = π/2

x
−6 −5 −4 −3 −2 −1 0 1 2 3 4 5 6

−1

y = −π/2

f (x) = arctg(x)
Esta función es la inversa de la función tangente definida en el intervalo (−π/2, π/2). La
función tangente tiene inversa en este intervalo ya que es inyectiva en (−π/2, π/2).
Finalmente, decir que de forma similar se podrían definir las funciones arco cotangente, arco
secante y arco cosecante.

29
Matemáticas: Cálculo I.

30
Matemáticas: Cálculo I

Capítulo 2

Continuidad de funciones de una variable

En este tema se estudiarán los conceptos de límite de una función en un punto y de límite en
el infinito. La definición de límite es básica para entender la noción de continuidad. En la parte
final del tema se presentarán dos teoremas en los cuales la hipótesis de continuidad es esencial.
Estos teoremas son el teorema de los valores intermedios y el teorema de Bolzano. Finalmente,
como aplicación del Teorema de Bolzano se estudiará el método de bisección.

2.1. Límites
Definición 2.1.1. Sea x0 ∈ R y sea f una función definida en los intervalos abiertos (x0 − r, x0 )
y (x0 , x0 + r) para algún r > 0. Se dice que existe el límite de f en x0 si se da una de las tres
siguientes posibilidades:
(i) lı́m f (x) = y0 ∈ R. Esto es,
x→x0

lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ |f (x) − y0 | < ε] .


x→x0

(ii) lı́m f (x) = +∞. Esto es,


x→x0

lı́m f (x) = +∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ f (x) > M ] .


x→x0

(iii) lı́m f (x) = −∞. Esto es,


x→x0

lı́m f (x) = −∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 + δ), x 6= x0 =⇒ f (x) < −M ] .


x→x0

Si no sucede ninguna de las situaciones anteriores, diremos que no existe el límite de f en x0 .


De una forma menos formal podemos decir que lo que ocurre en la situación (i) de esta
definición es que las imágenes de puntos próximos a x0 se acercan al punto y0 . En (ii) lo que tenemos
es que las imágenes de puntos próximos a x0 se hacen arbitrariamente grandes y, finalmente, en
(iii) las imágenes de puntos próximos a x0 se hacen arbitrariamente pequeñas.
Definición 2.1.2. Sea f una función. Sea x0 un número real y supongamos que f está definida
en un intervalo de la forma (x0 − r, x0 ) para algún número real r > 0. Diremos que existe el límite
por la izquierda de f en x0 si se da una de las siguientes tres posibilidades:
(i) lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 ) =⇒ |f (x) − y0 | < ε] .
x→x−
0
(ii) lı́m f (x) = +∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 ) =⇒ f (x) > M ] .
x→x−
0
(iii) lı́m f (x) = −∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 − δ, x0 ) =⇒ f (x) < −M ] .
x→x−
0

Al igual que en la definición anterior, podemos decir que lo que ocurre en la situación (i)
de esta definición es que las imágenes de puntos próximos a x0 por la izquierda se acercan al
punto y0 . En (ii) lo que tenemos es que las imágenes de puntos próximos a x0 por la izquierda se
hacen arbitrariamente grandes y, finalmente, en (iii) las imágenes de puntos próximos a x0 por la
izquierda se hacen arbitrariamente pequeñas.
31
Matemáticas: Cálculo I.

Si
lı́m f (x) = ±∞
x→x−
0

se dice que la recta vertical al eje OX dada por x = x0 es una asíntota vertical de la gráfica de f
por la izquierda.
De forma completamente análoga, si cambiamos el intervalo (x0 − δ, x0 ) por el intervalo
(x0 , x0 + δ), podemos definir el límite por la derecha de f en el punto x0 cuando la función f está
definida en un intervalo del tipo (x0 , x0 + r) para algún número real r > 0. Se denotará
lı́m f (x).
x→x+
0

Así pues, se dirá que existe el límite por la derecha de f en x0 si se da una de las siguientes
tres posibilidades:
(i) lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃δ > 0 / x ∈ (x0 , x0 + δ) =⇒ |f (x) − y0 | < ε]
x→x+
0
(ii) lı́m f (x) = +∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 , x0 + δ) =⇒ f (x) > M ]
x→x+
0
(iii) lı́m f (x) = −∞ ⇐⇒ [∀ M > 0, ∃δ > 0 / x ∈ (x0 , x0 + δ) =⇒ f (x) < −M ]
x→x+
0

Si lı́m f (x) = ±∞ se dice que la recta vertical al eje OX dada por x = x0 es una asíntota
x→x+
0
vertical de la gráfica de f por la derecha.
Ejemplo 2.1.3. Si f : R → R es la función identidad, es muy sencillo comprobar usando la
definición que para todo x0 real
lı́m f (x) = lı́m f (x) = lı́m f (x) = x0 .
x→x− x→x+ x→x0
0 0

También es fácil probar que si f : R → R es la función constante f (x) = c entonces para todo
x0 real
lı́m f (x) = lı́m f (x) = lı́m f (x) = c.
x→x− x→x+ x→x0
0 0

Ejemplo 2.1.4. Si representamos la gráfica de la función cosecante en el intervalo (0, π) nos


encontramos con que las rectas x = 0 y x = π son dos asíntotas verticales (una por la derecha y
otra por la izquierda) ya que
lı́m f (x) = +∞ = lı́m f (x)
x→0+ x→π −
y

4,5

(π, 0)
x
0

f (x) = cosec(x)
32
Matemáticas: Cálculo I.

Teorema 2.1.5. Si la función f está definida en (x0 − r, x0 ) ∪ (x0 , x0 + r) para un número real
r > 0 entonces lı́m f (x) existe si y solo si existen los límites laterales y son iguales, i. e.,
x→x0

∃ lı́m f (x), lı́m f (x) y lı́m f (x) = lı́m f (x)


x→x−
0 x→x+
0 x→x−
0 x→x+
0

Ejemplo 2.1.6. Por ejemplo, sea la función f : (−∞, 0) ∪ (0, ∞) → R dada por f (x) = 1/|x|. Su
gráfica en el intervalo (−3, 0) ∪ (0, 3) es la que se representa en el dibujo siguiente.

x
−3 0 3

f (x) = 1/|x|
Existe lı́m f (x) = +∞ ya que la función f (x) = 1/|x| toma valores tan grandes como que-
x→0
ramos y positivos cuando x se aproxima a cero bien por la derecha bien por la izquierda. Más
formalmente, existe el límite de f (x) cuando x tiende a cero ya que existen los límites laterales
lı́m f (x), lı́m f (x) y además
x→0+ x→0−
lı́m f (x) = +∞ = lı́m f (x).
x→0+ x→0−

Ejemplo 2.1.7. Sea la función f : R → R definida por f (x) = |x|. Su gráfica en el intervalo
(−2, 0) ∪ (0, 2) está dada por:

x
−2 −1 0 1 2

f (x) = |x|
Entonces existe el límite de f (x) cuando x tiende a cero ya que existen los límites laterales
lı́m f (x), lı́m f (x) y ambos son coincidentes e iguales a 0. Por lo tanto,
x→0+ x→0−
lı́m f (x) = 0.
x→0
33
Matemáticas: Cálculo I.

Ejemplo 2.1.8. Sea f : (−∞, 0) ∪ (0, +∞) → R dada por f (x) = sen(x)/x. Se tiene que
lı́m f (x) = 1
x→0
ya que
lı́m f (x) = 1 = lı́m f (x).
x→0− x→0+
La gráfica de esta función en (−3, 0) ∪ (0, 3) está dada por:

x
−3 −2 −1 0 1 2 3

sen(x)
f (x) =
x
Ejemplo 2.1.9. Sea la función dada por

3 si x ≤ 0
f (x) =
ln(x) si x > 0.
Su gráfica en el intervalo [−3, 3] está dada por
y

x
−2 0 2

−2

−4

Observando la gráfica tenemos que


lı́m f (x) = 3 6= −∞ = lı́m f (x)
x→0− x→0+
y, por lo tanto no existe lı́m f (x).
x→0

Definición 2.1.10. Sea f una función definida en un intervalo abierto no acotado (a, +∞) para
un cierto a ∈ R. Se dirá que existe el límite de f cuando x tiende al infinito ( o de f en +∞) si
se da una de las tres siguientes posibilidades:
(i) lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃K > 0 / x > K =⇒ |f (x) − y0 | < ε] .
x→+∞
(ii) lı́m f (x) = +∞ ⇐⇒ ∀ K > 0, ∃K 0 > 0 / x > K 0 =⇒ f (x) > K .
 
x→+∞
(iii) lı́m f (x) = −∞ ⇐⇒ ∀ K > 0, ∃K 0 > 0 / x > K 0 =⇒ f (x) < −K .
 
x→+∞
34
Matemáticas: Cálculo I.

En el caso de que no se dé ninguna de las tres posibililades anteriores, se dirá que no existe
el límite de f cuando x tiende a infinito.
De forma similar se define el límite de f en −∞ si f está definida en un intervalo abierto
(−∞, b) para un cierto b ∈ R. Más concretamente, diremos que existe el límite de f cuando x
tiende al menos infinito ( o de f en −∞) si se da una de las tres siguientes posibilidades:

(i) lı́m f (x) = y0 ⇐⇒ [∀ ε > 0, ∃K > 0 / x < −K =⇒ |f (x) − y0 | < ε] .


x→−∞
(ii) lı́m f (x) = +∞ ⇐⇒ ∀ K > 0, ∃K 0 > 0 / x < −K 0 =⇒ f (x) > K .
 
x→−∞
(iii) lı́m f (x) = −∞ ⇐⇒ ∀ K > 0, ∃K 0 > 0 / x < −K 0 =⇒ f (x) < −K .
 
x→−∞

Si y0 ∈ R es el límite de f en ±∞, entonces la recta horizontal y = y0 es una asíntota


horizontal de la gráfica de f .

Ejemplo 2.1.11. Dada la función arco tangente,

f : (−∞, ∞) → [−π/2, π/2], f (x) = arctg(x),

sabemos que su gráfica es

y
y = π/2

x
−6 −5 −4 −3 −2 −1 0 1 2 3 4 5 6

−1

y = −π/2

f (x) = arctg(x)

Por lo tanto,

lı́m f (x) = −π/2, lı́m f (x) = π/2.


x→−∞ x→+∞

Como consecuencia se tiene que las rectas y = ±π/2 son asíntotas horizontales de la gráfica
de f .

Ejemplo 2.1.12. Dada la función exponencial,

f : R → R, f (x) = ex ,
35
Matemáticas: Cálculo I.

sabemos que su gráfica es


y

1 (0, 1)

x
−5 −4 −3 −2 −1 0 1

f (x) = ex
Por lo tanto,
lı́m f (x) = 0, lı́m f (x) = +∞.
x→−∞ x→+∞
Como consecuencia se tiene que la recta y = 0 es una asíntota horizontal de la gráfica de f .
Ejemplo 2.1.13. Dada la función
f : R → R, f (x) = cos(x),
su gráfica está dada por
y
1

x
−6 −5 −4 −3 −2 −1 0 1 2 3 4 5 6

−1

f (x) = cos(x)
Así pues, los límites lı́m f (x) y lı́m f (x) no existen ya que cuando x tiende a ±∞ sus
x→−∞ x→+∞
imágenes están fluctuando entre todos los posibles valores comprendidos entre −1 y 1 de forma
infinita.
Proposición 2.1.14. Sea x0 un número real o x0 = ±∞. Se cumplen las siguientes propiedades:
(i) Sean f y g dos funciones. Supongamos que existen los límites lı́m f (x) y lı́m g(x) y que
x→x0 x→x0
ambos son números reales. Entonces:
(i-1) lı́m (αf (x) + βg(x)) = α lı́m f (x) + β lı́m g(x) para todos α y β reales.
x→x0  x→x0   x→x0 

(i-2) lı́m (f (x) · g(x)) = lı́m f (x) · lı́m g(x) .


x→x0 x→x0 x→x0
lı́m f (x)
f (x) x→x0
(i-3) lı́m = , si lı́m g(x) 6= 0.
x→x0 g(x) lı́m g(x) x→x0
x→x0
    lı́m g(x)
g(x) x→x0
(i-4) lı́m f (x) = lı́m f (x) , si lı́m f (x) > 0.
x→x0 x→x0 x→x0

36
Matemáticas: Cálculo I.

Algunas de las propiedades anteriores se pueden extender al caso en que alguno de los límites
es ±∞, teniendo en cuenta que (+∞)+(+∞) = +∞, (+∞)·(+∞) = +∞, λ·(+∞) = +∞
si λ > 0, λ · (+∞) = −∞ si λ < 0, (+∞)+∞ = +∞.
(ii) Si lı́m f (x) = 0 y g es una función acotada en un entorno del punto x0 , se tiene que
x→x0

lı́m (f (x) · g(x)) = 0.


x→x0

(iii) Sean f, g, h tres funciones tales que h(x) ≤ f (x) ≤ g(x) en un entorno del punto x0 y
supongamos que lı́m h(x) = lı́m g(x). Entonces
x→x0 x→x0

lı́m f (x) = lı́m h(x) = lı́m g(x).


x→x0 x→x0 x→x0

(iv) lı́m f (x) = 0 ⇐⇒ lı́m |f (x)| = 0.


x→x0 x→x0

sen(x)
Ejemplo 2.1.15. La propiedad (ii) implica que lı́m = 0, ya que sen(x) está acotada, se
x→∞ x
tiene que
−1 sen(x) 1
≤ ≤
x x x
y
−1 1
lı́m = 0 = lı́m .
x→+∞ x x→+∞ x

Es un hecho que el cálculo de límites conduce en muchos casos a indeterminaciones. Las


principales son las de tipo:
0 ∞
∞ − ∞, 0 · ∞, , , 00 , 1∞ , ∞0 .
0 ∞
Una buena parte de ellas se pueden resolver utilizando la Regla de L’Hôpital, que se introduce
en el tema cuatro de estos apuntes. En los siguientes ejemplos veremos algunos casos que se pueden
abordar sin usar dicha regla.
Ejemplo 2.1.16. En este primer ejemplo trabajaremos con la función f (x) = 2x − x2 . Si tratamos
de calcular el límite de f (x) cuando x tiende a +∞ obtenemos una indeterminación del tipo
∞ − ∞. Ahora bien,
lı́m f (x) = lı́m 2x − x2 = (+∞) − (+∞)2 = −∞,
x→+∞ x→+∞

ya que el orden del infinito negativo de la resta es mayor.


Por otro lado, cuando x tiende a −∞ no tenemos una indeterminación ya que:
lı́m f (x) = lı́m 2x − x2 = (−∞) − (−∞)2 = −∞.
x→−∞ x→−∞

Si tomamos la función f (x) = 3x3 + 2x2 , se tiene que el límite de f (x) cuando x tiende a −∞
proporciona una indeterminación del tipo −∞ + ∞. De forma análoga al caso anterior,
lı́m f (x) = lı́m 3x3 + 2x2 = (−∞)3 + (−∞)2 = (−∞)3 + (+∞)2 = −∞,
x→−∞ x→−∞

ya que el orden del infinito negativo de la resta es mayor.


Finalmente, si f (x) = x2 − 3x + 1, al calcular el límite de f (x) cuando x tiende a +∞
obtenemos una indeterminación del tipo ∞ − ∞. Razonando como antes,
lı́m f (x) = lı́m x2 − 3x + 1 = (+∞)2 − (+∞) == (+∞)2 − ∞ = +∞,
x→+∞ x→+∞

ya que el orden del infinito positivo es mayor que el negativo.


37
Matemáticas: Cálculo I.

Ejemplo 2.1.17. En este ejemplo calcularemos el límite


p p
lı́m x2 + 1 − x2 + x.
x→+∞
Obviamente, nos encontramos ante una indeterminación del tipo ∞ −√∞. Para poder √ eliminar
el problema dado por la indeterminación dividimos y multiplicamos por √x2 + 1 + √ x2 + x (esto
no supone un problema ya que cuando x tiende a +∞ la función g(x) = x2 + 1 + x2 + x es no
nula). Por lo tanto,
√ √ √ √
p
2
p
2
( x2 + 1 − x2 + x)( x2 + 1 + x2 + x)
lı́m x + 1 − x + x = lı́m √ √
x→+∞ x→+∞ x2 + 1 + x2 + x
√ 2 √ 2
x2 + 1 − x2 + x x2 + 1 − x2 − x 1−x
= lı́m √ √ = lı́m √ √ = lı́m √ √
x→+∞ x2 + 1 + x2 + x x→+∞ x2 + 1 + x2 + x x→+∞ x2 + 1 + x2 + x
1−x
x√ 1/x − 1
= lı́m √ = lı́m p p = −1/2.
x→+∞ 2
x +1+ x +x 2 x→+∞ 1 + 1/x + 1 + 1/x

x2

√ En el cálculo anterior hemos utilizado que, si x > 0, entonces x2 = x. Si x < 0, se tiene que
2
x = −x. Por lo tanto,
1−x
p p
x√ 1/x − 1
lı́m x2 + 1− x2 + x = lı́m √ = − lı́m p p = 1/2.
x→−∞ x→−∞ 2
x +1+ x +x 2 x→−∞ 1 + 1/x + 1 + 1/x

− x2
Ejemplo 2.1.18. Dado
1
lı́m (x2 + 6x + 9)
x→−3 x+3
nos encontramos con una indeterminación del tipo 0 · ∞, ya que α = −3 es raíz del polinomio
x2 + 6x + 9. Teniendo en cuenta esto,
1 (x + 3)2
lı́m (x2 + 6x + 9) = lı́m = lı́m x + 3 = 0.
x→−3 x + 3 x→−3 x + 3 x→−3

Ejemplo 2.1.19. Calculemos el límite


x2 − 4x + 3
lı́m .
x→3 x3 − x2 − 6x
0
En este caso nos encontramos con una indeterminación del tipo , ya que α = 3 es raíz del
0
polinomio que aparece en el numerador y del que está en el denominador. Teniendo en cuenta esto,
x2 − 4x + 3 (x − 3)(x − 1) x−1
lı́m 3 2
= lı́m = lı́m = 2/15.
x→3 x − x − 6x x→3 x(x − 3)(x + 2) x→3 x(x + 2)

Ejemplo 2.1.20. En este ejemplo calcularemos el límite


3x2
lı́m √ .
x→0 1 − 1 − x

Está claro que en el cálculo de este límite nos encontramos con una indeterminación del tipo
0
. Teniendo en cuenta esto,
0
√ √
3x2 3x2 (1 + 1 − x) 3x2 (1 + 1 − x)
lı́m √ = lı́m √ √ = lı́m
x→0 1 − 1 − x x→0 (1 − 1 − x)(1 + 1 − x) x→0 1−1+x
38
Matemáticas: Cálculo I.

= lı́m 3x(1 + 1 − x) = 0.
x→0

Ejemplo 2.1.21. Dado


2x2 + 3
lı́m ,
x→+∞ x3 − x2 − 6x

nos encontramos con una indeterminación del tipo . Teniendo en cuenta esto, se divide nume-

rador y denominador entre la mayor potencia de x, esto es, x3 .
2x2 + 3 2/x + 3/x3
lı́m = lı́m = 0.
x→+∞ x3 − x2 − 6x x→∞ 1 − 1/x − 6/x2

Ejemplo 2.1.22. Sea x0 un número real o ±∞. Si tenemos una función f tal que lı́m f (x) = 1
x→x0
y al mismo tiempo existe otra función g tal que lı́m g(x) = ±∞, al calcular el límite
x→x0

lı́m f (x)g(x)
x→x0
aparece la indeterminación 1∞ . En este caso, se puede demostrar que
lı́m f (x)g(x) = lı́m eg(x)(f (x)−1) .
x→x0 x→x0
Por ejemplo, si queremos calcular el límite
  1
1 x2 − 1
lı́m ,
x→1+ x
1 1
nos encontramos con una indeterminación del tipo 1+∞ siendo f (x) = y g(x) = 2 .
x x −1
Entonces
1 1 1 1−x
g(x)(f (x) − 1) = .( − 1) = 2 .
x2
−1 x x −1 x
1 1−x 1
= . =−
(x + 1)(x − 1) x (x + 1)x
y, dado que,
1
lı́m − = −1/2
x→1+(x + 1)x
se obtiene el siguiente valor para el límite buscado:
  1
1 x2 − 1 1
lı́m = e−1/2 = √ .
x→1+ x e
2.2. Continuidad
Definición 2.2.1. Sea I = (a, b) un intervalo abierto y sea f : I → R una función. Diremos que
f es continua en un punto x0 ∈ I si existe el límite de f en x0 y
lı́m f (x) = f (x0 ).
x→x0
Equivalentemente,
∀ ε > 0, ∃ δ > 0 / |x − x0 | < δ =⇒ |f (x) − f (x0 )| < ε
o, también,
∀ ε > 0, ∃ δ > 0 / x ∈ (x0 − δ, x0 + δ) =⇒ f (x) ∈ (f (x0 ) − ε, f (x0 ) + ε).
En el caso de que f no sea continua en x0 , se dirá que f tiene o presenta una discontinuidad
en el punto x0 . Existen dos tipos de discontinuidades:
39
Matemáticas: Cálculo I.

(i) Discontinuidad de salto: se da cuando existen los límites laterales de f en x0 pero no


coinciden o coincidiendo son distintos del valor de la función en el punto. Diremos que el
salto es finito si los dos límites laterales son finitos. En el caso de que alguno de ellos sea
infinito, se dirá que el salto es infinito.
(ii) Discontinuidad esencial: se da cuando no existe alguno de los límites laterales de f en x0 .
La siguiente figura muestra un caso de continuidad en el punto x0 . Siempre que fijemos un
ε > 0 podemos encontrar δ > 0 tal que las imágenes de los puntos del intervalo (x0 − δ, x0 + δ)
pertenecen al intervalo (f (x0 ) − ε, f (x0 ) + ε).

f (x0 ) + ε

f (x0 )

f (x0 ) − ε
x
0 x0 − δ x0 x0 + δ
1

Sea I = (a, b) un intervalo abierto y sea f : I → R una función. Se dice que f es continua
en un conjunto A ⊂ I si es continua en todos los puntos de A. Si una función f está definida
en un intervalo cerrado y acotado I = [a, b], se dice que es continua en I si es continua en (a, b),
lı́m f (x) = f (a) (f es continua por la derecha en a) y lı́m f (x) = f (b) (f es continua por la
x→a+ x→b−
izquierda en b).
Ejemplos 2.2.2.
(1) Sea f : R → R definida por

3x + 1 si x ≤ 0
f (x) =
−3 si x > 0.
En este caso tenemos una discontinuidad de salto finito en x0 = 0, ya que
lı́m f (x) = 1 ; lı́m f (x) = −3.
x→0− x→0+

(2) Sea f : R → R definida por



4 si x ≤ 0
f (x) =
ln(x) si x > 0.
En este caso tenemos una discontinuidad de salto infinito en x0 = 0, ya que
lı́m f (x) = 4 ; lı́m f (x) = lı́m ln(x) = −∞.
x→0− x→0+ x→0+

(3) Sea f : R → R definida por



1 si x ≤ 0
f (x) =
sen(1/x) si x > 0.
40
Matemáticas: Cálculo I.

En este caso tenemos una discontinuidad esencial en x0 = 0, ya que no existe

lı́m f (x) = lı́m sen(1/x).


x→0+ x→0+

Es fácil de comprobar que cuando x se aproxime a cero por la derecha, la función f


tomará todos los valores entre −1 y 1 en cada intervalo [1/(kπ), 1/(kπ + 2π)], siendo k un
número natural.

Proposición 2.2.3. Sean f y g dos funciones definidas en un intervalo I = (a, b) y sea x0 ∈ I.


Se cumplen las siguientes propiedades:
(i) Si f y g son continuas en x0 , también lo son αf + βg para todos α y β números reales.
(ii) Si f y g son continuas en x0 , también lo es g.f .
f
(iii) Si f y g son continuas en x0 y g(x0 ) 6= 0, también lo es .
g
Las funciones más conocidas son continuas en sus dominios de definición. Por ejemplo:
(1) Las funciones dadas por polinomios, i. e., funciones polinómicas,

p(x) = a0 + a1 x + a2 x2 + · · · + an xn ,

donde a0 , a1 , . . . , an ∈ R, son continuas en toda la recta real.


(2) Las funciones racionales, i. e., funciones dadas por cocientes de polinomios r(x) = p(x)/q(x),
son continuas en su dominio de definición (el conjunto dado por los x reales tales que
q(x) 6= 0).
(3) La función exponencial ex es continua en R y ln(x) es continua en (0, ∞).
(4) Las funciones trigonométricas clásicas sen(x), cos(x), tg(x) y sus inversas arcsen(x), arccos(x),
arctg(x) son continuas en sus correspondientes dominios de definición.
Los ejemplos anteriores, combinados con las propiedades que se enunciaron previamente,
permiten probar la continuidad de muchas funciones. Por ejemplo:

Ejemplo 2.2.4. Utilizando las propiedades anteriores es fácil ver que la función
ln(x) + arctan(x)
f (x) =
x2 − 1
es continua en (0, 1) ∪ (1, +∞), ya que es el resultado de operaciones algebraicas con funciones
continuas y el denominador no se anula en (0, 1) ∪ (1, +∞).

Otros resultados interesantes relacionados con la continuidad de una función en un punto son
los siguientes.

Proposición 2.2.5. Si g : I → R es una función continua en b ∈ I y f es una función tal que


f (x) ∈ I y existe lı́m f (x) = b entonces lı́m g(f (x)) = g(b). En otras palabras,
x→x0 x→x0
 
lı́m g(f (x)) = g lı́m f (x) .
x→x0 x→x0

Proposición 2.2.6. Sean f : I → R y g : J → R dos funciones, definidas en sendos intervalos I


y J, tales que f (I) ⊂ J. Si f es una función continua en x0 y g es una función continua en f (x0 )
se tiene que g ◦ f es continua en x0 y además

lı́m (g ◦ f )(x) = g(f (x0 )).


x→x0

41
Matemáticas: Cálculo I.

2.3. Teorema de los Valores Intermedios


Esta parte del tema contiene una serie de resultados importantes que se cumplen cuando
trabajamos con funciones continuas.
Teorema 2.3.1. Sea f : I → R una función continua definida en un intervalo I. Entonces su
imagen f (I) es un intervalo. Cuando I = [a, b] es un intervalo cerrado y acotado, se cumple que
f (I) también es un intervalo cerrado y acotado, esto es, f (I) = [c, d].
Teorema 2.3.2. Sea f : [a, b] → R una función continua. Se puede garantizar que existen m, M ∈
R tales que m = mı́n f (x), M = máx f (x).
x∈[a,b] x∈[a,b]

Ejemplo 2.3.3. Por ejemplo, sea f : [0, 2] → R la función definida por f (x) = x4 − 2x2 . Entonces
mı́n f (x) = f (1) = −1 , máx f (x) = f (2) = 8.
x∈[0,2] x∈[0,2]

1
x
0 2
-1

f (x) = x4 − 2x2
Nota 2.3.4. El Teorema 2.3.1 no tiene por qué ser cierto si f no cumple la condición de continui-
dad o, por otro lado, no está definida en un intervalo cerrado y acotado. Por ejemplo, la función
f : (0, 2) → R dada por f (x) = 1/x es claramente continua en (0, 2) pero no existe máx f (x) ya
x∈(0,2)
que lı́m f (x) = +∞.
x→0+

Teorema 2.3.5 (Teorema de los Valores Intermedios). Sea f : [a, b] → R una función continua.
Sean m = mı́n f (x), M = máx f (x). Se verifica que dado cualquier c tal que m < c < M existe
x∈[a,b] x∈[a,b]
al menos un número xc ∈ (a, b) tal que f (xc ) = c.
Ejemplo 2.3.6. Consideremos la siguiente función real de variable real:
π π
f : [− , ] −→ R
2 2
x −→ f (x) = x (sen(x) + 1) .
La función anterior cumple que
42
Matemáticas: Cálculo I.

f es continua,
f (−π/2) = 0 < 2,
f (π/2) = π > 2,
y, por lo tanto, toma el valor 2 en algún punto del intervalo de [− π2 , π2 ] ya que gracias al Teorema
de los Valores Intermedios, sabemos que existe un elemento x2 ∈ (−π/2, π/2) tal que f (x2 ) = 2.

2.4. El Teorema de Bolzano


Teorema 2.4.1 (Teorema de Bolzano). Sea f : [a, b] → R una función continua. Si se cumple que
f (a)f (b) < 0 entonces existe al menos un x0 en el intervalo (a, b) tal que f (x0 ) = 0.
El teorema de Bolzano es una consecuencia inmediata del Teorema de los Valores Intermedios
y se puede usar para probar la existencia de puntos de corte de la gráfica de f con el eje OX, i.
e., ceros o raíces de f , en un intervalo determinado.
Ejemplo 2.4.2. Por ejemplo, la función continua f : [0, 2] → R definida por f (x) = x4 − 2x2 tiene
un cero en el intervalo [1, 2], ya que f (1) = 1 − 2 = −1 < 0 y f (2) = 16 − 8 = 8 > 0.
Ejemplo 2.4.3. Supongamos que tenemos una función f : [−1, 1] −→ R continua tal que toma el
mismo valor en los extremos del intervalo, i. e., f (−1) = f (1), y ese valor es distinto de f (0). Con
estas condiciones se puede demostrar que existe un punto α ∈ [0, 1] tal que f (α) = f (α − 1).
En efecto, si definimos la función
g : [0, 1] −→ R
x −→ g(x) = f (x) − f (x − 1).
se tendrá que es continua en el intervalo [0, 1] y
g(0) = f (0) − f (−1) = f (0) − f (1),
g(1) = f (1) − f (0).
Por lo tanto, g(0) · g(1) < 0 y, aplicando el Teorema de Bolzano, podemos garantizar que
existe un punto α ∈ (0, 1) tal que g(α) = 0 o, lo que es lo mismo, f (α) = f (α − 1).
Una de las consecuencias importantes del Teorema de Bolzano es el siguiente resultado.
Corolario 2.4.4. Sea f : I → R una función continua en un intervalo I. Si f no se anula en I
entonces el signo de f es constante en I.

2.5. El método de bisección


Partiendo de la ideas aportadas por el Teorema de Bolzano y de las propiedades de los
límites de sucesiones se puede construir un algoritmo que permita calcular una raíz de una función
f : [a, b] → R continua tal que f (a)f (b) < 0.
La idea subyace tras el método a seguir consiste en construir una sucesión de intervalos
{[ak , bk ] ; k ∈ N}
cada uno de longitud la mitad del anterior y de forma que todos contengan en (ak , bk ) una raíz
de f . Esto último queda garantizado si en [ak , bk ] se dan las condiciones para poder aplicar el
Teorema de Bolzano.
Para ello tomamos como intervalo inicial el de extremos
a0 = a, b0 = b.
A partir del intervalo [ak , bk ] tal que f (ak )f (bk ) < 0 se calcula su punto medio
ak + bk
xk = .
2
43
Matemáticas: Cálculo I.

Si f (xk ) = 0 obtenemos que xk es la raíz buscada. Si f (xk ) 6= 0 y f (ak )f (xk ) < 0, existe al
menos una raíz de f en [ak , xk ]. Entonces tomamos
ak+1 = ak , bk+1 = xk .
Si f (ak )f (xk ) > 0, se tiene que f (xk )f (bk ) < 0, y por lo tanto, existe al menos una raíz de f en
[xk , bk ]. Entonces tomamos
ak+1 = xk , bk+1 = bk .
A partir del intervalo [ak+1 , bk+1 ] se calcula su punto medio y se repite el proceso anterior.
De esta forma, por la propia construcción de los intervalos, tenemos que
a = a0 ≤ a1 ≤ a2 ≤ · · · ≤ ak < xk < bk ≤ · · · ≤ b1 ≤ b0 = b
y esto implica que la sucesión (ak ) es monótona creciente acotada superiormente y que la sucesión
(bk ) es monótona decreciente acotada inferiormente. Por lo tanto, el teorema de las sucesiones
monótonas garantiza que ambas son convergentes:
∃ α, β ∈ R / α = lı́m an , β = lı́m bn .
n→∞ n→∞
Como
bk−1 − ak−1 b0 − a0
bk − ak = = ··· =
2 2k
se tiene que
α = lı́m an = lı́m xn = lı́m bn = β
n→∞ n→∞ n→∞
y la sucesión (xn ) resulta ser convergente.

Para comprobar que el límite de (xn ) es justamente la raíz buscada necesitamos conocer el
siguiente resultado que relaciona la convergencia y la continuidad.
Teorema 2.5.1. Sea f una función real de variable real definida y continua en un intervalo [a, b].
Sea α ∈ (a, b). Si (xn ) es una sucesión de números reales contenida en (a, b) y con límite α entonces
f (α) = lı́m f (xn ).
n→∞

Aplicando el resultado anterior y las propiedades del álgebra de límites tenemos que
0 ≥ lı́m f (ak )f (bk ) = f (α)2 ≥ 0
n→∞
y, por lo tanto,
f (α) = 0.
Así pues α es raíz de f . Además podemos obtener la siguiente acotación para el error ek :
bk − ak b−a
|ek | = |xk − α| ≤ = k+1 .
2 2
Por lo tanto, dado ε > 0, para hacer el error |ek | < ε basta que se verifique
b−a
< ε,
2k+1
esto es, basta aplicar el algoritmo hasta la iteración k tal que
log( b−a
ε )
k> − 1.
log(2)

44
Matemáticas: Cálculo I

Capítulo 3

Continuidad de funciones de varias variables

3.1. El espacio euclídeo n-dimensional


Dado un número natural n se define el conjunto Rn como
Rn = {v = (v1 , . . . , vn ) / vi ∈ R, i ∈ {1, . . . , n}}.
En lo que sigue los elementos de Rn se denominarán también con el nombre de vectores. De
esta forma R1 = R,
R2 = {v = (v1 , v2 ) / v1 , v2 ∈ R} = {x = (x, y) / x, y ∈ R}
y también
R3 = {v = (v1 , v2 , v3 ) / v1 , v2 , v3 ∈ R} = {x = (x, y, z) / x, y, z ∈ R}.
El conjunto Rn tiene una estructura de R-espacio vectorial donde la suma de vectores está
dada por
u + v = (u1 , . . . , un ) + (v1 , . . . , vn ) = (u1 + v1 , . . . , un + vn )
y el producto de escalares (números reales) por vectores se define como
λu = λ(u1 , . . . , un ) = (λu1 , . . . , λun ).
En este espacio vectorial el vector nulo está dado por θRn = (0, . . . , 0) y Rn es de dimensión
finita igual a n.
Definición 3.1.1. Para dos vectores u, v ∈ Rn se define el producto escalar de u por v como
 
v1 n
t  ..  X
< u, v >= uv = (u1 , . . . , un )  .  = ui vi .
vn i=1

Este producto escalar también se conoce como producto escalar usual del R-espacio vectorial
Rn . Verifica las siguientes propiedades:
(1) < u, u > ≥ 0 ∀ u ∈ Rn . Además, < u, u >= 0 ⇐⇒ u = θRn .
(2) < u + w, v >=< u, v > + < w, v > ∀ u, v, w ∈ Rn .
(3) < u, v + w >=< u, v > + < u, w > ∀ u, v, w ∈ Rn .
(4) < λu, v >=< u, λv >= λ < u, v > ∀ u, v ∈ Rn , λ ∈ R.
(5) < u, v >=< v, u > ∀ u, v, ∈ Rn .
El espacio Rn se llama espacio euclídeo n-dimensional ya que es un R-espacio vectorial donde
tenemos definido un producto escalar. Este producto escalar dará lugar a una norma.
Ejemplo 3.1.2. Supongamos que tomamos en R3 dos vectores u = (1, 1, 2) y v = (0, 2, 1), entonces
 
0
< u, v >= uvt = (1, 1, 2)  2  = 1 · 0 + 1 · 2 + 2 · 1 = 4.
1
45
Matemáticas: Cálculo I.

Definición 3.1.3. Se define la norma usual sobre Rn como


√ q
kuk = < u, u > = u21 + · · · + u2n .

Se dirá que un vector u es unitario si kuk = 1.


Ejemplos 3.1.4. Supongamos que tomamos en R3 el vector u = (1, 1, 2), entonces
p
kuk = 12 + 12 + 22 = 6.
En el caso de n = 1 la norma inducida en R es el valor absoluto, ya que para todo u = u ∈ R

kuk = u2 = |u|.
Proposición 3.1.5. Se cumplen las siguientes propiedades:
(i) ∀ u ∈ Rn kuk ≥ 0. kuk = 0 ⇐⇒ u = θRn .
(ii) kαuk = |α|kuk ∀ u ∈ Rn α ∈ R.
(iii) ku + vk ≤ kuk + kvk ∀ u, v ∈ Rn .
u
Si u es un vector de Rn no nulo, es muy fácil comprobar que es unitario. Además se
kuk
verifica la desigualdad
| < u, v > | ≤ kukkvk,
conocida como desigualdad de Schwartz.
La desigualdad de Schwartz indica que, si u, v son dos vectores no nulos del espacio euclideo
Rn , se cumple que
| < u, v > |
≤1
kukkvk
y, como consecuencia,
< u, v >
−1 ≤ ≤ 1.
kukkvk
Definición 3.1.6. Se llamará ángulo entre dos vectores no nulos u y v al único número real
α ∈ [0, π] tal que
< u, v >
cos(α) = .
kukkvk
Así pues para cualquier par de vectores u y v de Rn se tiene que
< u, v >= kukkvk cos(α)
siendo α el ángulo que forman.
La existencia de una norma también nos permite introducir un concepto de distancia.
Definición 3.1.7. Definimos la distancia usual entre u y v de Rn como

d(u, v) = ku − vk = < u − v, u − v >.
Así pues,
p
d(u, v) = (u1 − v1 )2 + · · · + (un − vn )2 .
Ejemplo 3.1.8. En la siguiente figura se puede ver que la distancia en R3 entre u = (1, 1, 3) y
v = (2, 1, 1) se corresponde con la norma del vector u − v. Así pues,
p √
d(u, v) = (1 − 2)2 + (1 − 1)2 + (3 − 1)2 = 5.
46
Matemáticas: Cálculo I.

u = (1, 1, 3)
u−v
v = (2, 1, 1)

Proposición 3.1.9. La distancia entre vectores de Rn cumple las siguientes propiedades:


(i) d(u, u) = 0 ∀ u ∈ Rn .
(ii) d(u, v) = d(v, u) ∀ u, v ∈ Rn .
(iii) d(u, v) ≤ d(u, w) + d(w, v) ∀ u, v, w ∈ Rn .
Definición 3.1.10. Dados u, v ∈ R3 se define el producto vectorial de u por v como el único vector
u × v que cumple las siguientes condiciones:
(i) ku × vk = kukkvksen(α), siendo α el ángulo formado por ambos vectores.
(ii) u × v es ortogonal a u y a v, i. e., < u, u × v >=< v, u × v >= 0..
(iii) El sentido de u × v está dado por el avance de un sacacorchos girando de u a v.

u×v

v u

u×v

u v
giro antihorario giro horario
Dados u = (u1 , u2 , u3 ), v = (v1 , v2 , v3 ) ∈ R3 se puede calcular de forma fácil el producto
vectorial de ambos de la siguiente manera:
u × v = (u2 v3 − u3 v2 , u1 v3 − u3 v1 , u1 v2 − u2 v1 )

e1 e2 e3

= u1 u2 u3
v1 v2 v3
donde e1 , e2 , e3 representan a los vectores de la base canónica de R3 . Entonces, si u = (u1 , u2 , u3 ) =
u1 e1 + u2 e2 + u3 e3 y v = (v1 , v2 , v3 ) = v1 e1 + v2 e2 + v3 e3 , se tiene que
u × v = (u2 v3 − u3 v2 )e1 + (u1 v3 − u3 v1 )e2 + (u1 v2 − u2 v1 )e3 .
Proposición 3.1.11. Dados u, v, w ∈ R3 se cumple lo siguiente:
47
Matemáticas: Cálculo I.

(i) u × v = θR3 si y solo si u y v son paralelos o alguno de los dos es nulo.


(ii) u × v = −v × u.
(iii) u × (v + w) = u × v + u × w.
(iv) (u + v) × w = u × w + v × w.
(v) Para todo número real α se cumple que (αu) × v = u × (αv) = α(u × v).

3.2. Abiertos y cerrados en Rn


Definición 3.2.1. Sea x0 ∈ Rn . Tomemos un número real positivo r. Se define la bola abierta en
Rn de centro x0 y radio r como el subconjunto de Rn dado por
BRn (x0 , r) = {x ∈ Rn / d(x, x0 ) < r}.
La correspondiente bola cerrada se define como el subconjunto de Rn dado por
BRn [x0 , r] = {x ∈ Rn / d(x, x0 ) ≤ r}.
Obviamente para todo x0 ∈ Rn y todo número real positivo r se tiene que
BRn (x0 , r) ⊂ BRn [x0 , r].
Ejemplos 3.2.2. Supongamos que n = 1 y que tomamos x0 ∈ R y r un número real positivo.
Entonces:
BR (x0 , r) = {x ∈ R / d(x, x0 ) < r} = {x ∈ R / |x − x0 | < r}
= {x ∈ R / − r < x − x0 < r} = {x ∈ R / x0 − r < x < x0 + r} = (x0 − r, x0 + r)
Así pues, en R las bolas abiertas de centro x0 coinciden con los intervalos abiertos centrados
en x0 .
x0 − r x0 x0 + r

Entonces,
BR [x0 , r] = [x0 − r, x0 + r],
y, por lo tanto, en R las bolas cerradas de centro x0 coinciden con los intervalos cerrados centrados
en x0 .
Supongamos ahora que n = 2, que x0 = (x0 , y0 ) ∈ R2 y que r es un número real positivo.
Entonces:
p
BR2 (x0 , r) = {x = (x, y) ∈ R2 / d(x, x0 ) < r} = {x = (x, y) ∈ R2 / (x − x0 )2 + (y − y0 )2 < r}
= {x = (x, y) ∈ R2 / (x − x0 )2 + (y − y0 )2 < r2 }.
Así pues, en R2 las bolas abiertas de centro x0 coinciden con los interiores de las circunferencias
centradas en x0 .
y

r
x0

48
Matemáticas: Cálculo I.

Para las bolas cerradas tendríamos que incluir los correspondientes puntos de la circunferencia
ya que
BR2 [x0 , r] = {x = (x, y) ∈ R2 / (x − x0 )2 + (y − y0 )2 ≤ r2 }.

La siguiente figura muestra una bola cerrada en R2 .


y

r
x0

Siguiendo de la misma forma, en R3 para x0 = (x0 , y0 , z0 ) se tiene que

BR3 (x0 , r) = {x = (x, y, z) ∈ R3 / (x − x0 )2 + (y − y0 )2 + (z − z0 )2 < r2 }

y
BR3 [x0 , r] = {x = (x, y, z) ∈ R3 / (x − x0 )2 + (y − y0 )2 + (z − z0 )2 ≤ r2 }.

Entonces, en dimensión tres, las bolas abiertas de centro x0 coinciden con los interiores de las
esferas centradas en x0 y para obtener los puntos de la correspondiente bola cerrada tenemos que
añadir los puntos de la esfera

(x − x0 )2 + (y − y0 )2 + (z − z0 )2 = r2

a los de la bola abierta.

Definición 3.2.3. Se dice que un subconjunto S de Rn es acotado si se puede meter dentro de


una bola cerrada. Esto es, existe un x0 ∈ Rn y un número real positivo r tales que

S ⊂ BRn [x0 , r].

Ejemplos 3.2.4. En R es obvio que todo subconjunto que tenga cota inferior y cota superior se
puede meter en una bola cerrada. De hecho en R la definición anterior coincide con la definición
de conjunto acotado introducida en Definición 1.1.1.
Supongamos que en R2 tomamos el conjunto

S = {(x, y) ∈ R2 / − 1 < x < 1, −1 < y < 1},

entonces S es acotado ya que


S ⊂ BR2 [(0, 0), 2)].

La siguiente figura muestra el conjunto S y la bola BR2 [(0, 0), 2)] que lo contiene:
49
Matemáticas: Cálculo I.

(0, 2)

x
(1, 0)

Si tomamos en R2 el conjunto
S = {(x, y) ∈ R2 / − 1 < x < 1, y > 0},
entonces S no es acotado, ya que no podemos construir una bola cerrada que lo contenga. En este
caso y puede tomar valores arbitrariamente grandes.
Definición 3.2.5. Se dice que un subconjunto A de Rn es un conjunto abierto si para todo x0
perteneciente a A existe un r > 0 tal que
BRn (x0 , r) ⊂ A.
Dado un subconjunto B de Rn , se dirá que x0 ∈ B es un punto interior si existe un r > 0 tal
que
BRn (x0 , r) ⊂ B.
Entonces un subconjunto de Rn es abierto si, y solo si, todos sus puntos son interiores.
Ejemplos 3.2.6. Obviamente cualquier bola abierta es un ejemplo de conjunto abierto. Por ejem-
plo, si tomamos una bola abierta en R2 de centro x0 con radio r, dado z0 en dicha bola, podemos
elegir s < min{d(z0 , x0 ), r − d(z0 , x0 )}. Entonces
BR2 (z0 , s) ⊂ BR2 (x0 , r).

z0

x0

Supongamos que en R2 tomamos el conjunto


A = {(x, y) ∈ R2 / y > 0},
entonces A es un conjunto abierto de R2 .
Esto es así, ya que, si x0 = (x0 , y0 ) pertenece a A, existe
d((x0 , y0 ), (x0 , 0))
r=
2
50
Matemáticas: Cálculo I.

tal que
BR2 (x0 , r) ⊂ A.

x0

(0, 0) (x0 , 0) x

Definición 3.2.7. Se dice que un subconjunto C de Rn es un conjunto cerrado si su complementario


Rn − C es abierto.
El conjunto Rn − C está definido como
Rn − C = {x0 ∈ Rn / x0 ∈
/ C}
Por lo tanto, todos los complementarios de abiertos son conjuntos cerrados. En particular,
los complementarios de bolas abiertas son conjuntos cerrados. Toda bola cerrada es un conjunto
cerrado ya que su complementario es un conjunto abierto.
Definición 3.2.8. Sea un subconjunto B de Rn . Se dice que x0 ∈ Rn es un punto frontera de B
si para todo r > 0 se tiene que
BRn (x0 , r) ∩ B 6= ∅, BRn (x0 , r) ∩ (Rn − B) 6= ∅.
Entonces, x0 es un punto frontera de B si cualquier bola centrada en x0 contiene puntos que
están en B y que están fuera de B. La frontera de B se denotará como F r(B).
Ejemplos 3.2.9. Por ejemplo, dado el conjunto
B = [−1, 1) ∪ {3} ∪ [7, +∞)
su frontera está dada por
F r(B) = {−1, 1, 3, 7}.
Por otro lado, la frontera de una bola abierta en Rn BRn (x0 , r) está dada por
F r(BRn (x0 , r)) = {z ∈ Rn / d(x0 , z) = r}.
Por ejemplo, teniendo en√ cuenta lo anterior, en R2 la circunferencia x2 + y 2 = 2 es la frontera
de la bola abierta BR2 ((0, 0), 2).
Finalmente, supongamos que en R2 tomamos el conjunto
A = {(x, y) ∈ R2 / y > 0}.
Como sabemos A es un conjunto abierto de R2 , y además
F r(A) = {(x, y) ∈ R2 / y = 0},
i. e., la frontera de A es el eje OX.
51
Matemáticas: Cálculo I.

3.3. Funciones de varias variables


Definición 3.3.1. Sea D un subconjunto de Rn . Una función de varias variables, con dominio D,
es una correspondencia f : D ⊂ Rn → Rm que asigna a cada elemento de x ∈ D un único elemento
f (x) ∈ Rm que se llamará imagen de x.
Si m = 1, la función de varias variables se llamará campo escalar, y si m > 1, se llamará
campo vectorial.
Dada una función de varias variables f : D ⊂ Rn −→ Rm , su gráfica se define como el
subconjunto de Rn+m dado por
{(x, f (x)) / x ∈ D}.
Por lo tanto, si n + m > 3 no podremos visualizar dicha gráfica ya que necesitaremos cuatro
o más dimensiones.
Obviamente si n = m = 1 la definición anterior es la definición de función real de variable real
introducida en la Definición 1.3.1. Lo mismo ocurre con la noción de gráfica. Cuando n = m = 1,
coincide con la introducida en la Definición 1.3.2.
Ejemplos 3.3.2. Por ejemplo
f : R3 −→ R2
x = (x, y, z) −→ f (x) = (x + y + z − 1, x2 + z 3 ),
es un campo vectorial.
Por otro lado,
f : R3 −→ R
x = (x, y, z) −→ f (x) = x2 + y 2 + z 2 − 1,
es un ejemplo de campo escalar.
Finalmente,
f : R −→ R4
x −→ f (x) = (x2 , sen(x) + 1, x3 + 1, x),
es otro ejemplo de campo vectorial.
Ejemplo 3.3.3. Dado D = [−5, 5] × [−5, 5] = {x = (x, y) ∈ R2 / x, y ∈ [−5, 5]}, el campo escalar
f : D ⊂ R2 → R definido por
f (x) = x2 + y 2
tiene como gráfica

f (x) = x2 + y 2
Definición 3.3.4. Dada f : D ⊂ Rn → Rm una función de varias variables, como f (x) ∈ Rm se
tiene que
f (x) = (f1 (x), . . . , fm (x))
52
Matemáticas: Cálculo I.

donde para todo i ∈ {1, . . . , m}


fi (x) = f (x)i ,
siendo f (x)i la componente i-ésima del vector f (x) de Rm . Por lo tanto, cada función de varias
variables, está determinada por m campos escalares, que se llamarán componentes de f , dados
por
fi : D ⊂ Rn → R
donde
fi (x) = f (x)i ,
i ∈ {1, . . . , m}.
Esta descomposición en componentes justifica la notación

f = (f1 , . . . , fm ) : D ⊂ Rn → Rm

que utilizaremos de ahora en adelante.

Ejemplo 3.3.5. Por ejemplo, si D = {x = (x, y, z) ∈ R3 /x > 0}, el campo vectorial

f : D ⊂ R3 −→ R2 √
x = (x, y, z) −→ f (x) = (ln(x) + y + z − 1, x + z 2 + 1),

está determinado por las siguientes componentes

f1 : D ⊂ R3 −→ R
x = (x, y, z) −→ f1 (x) = ln(x) + y + z − 1,
y
f2 : D ⊂ R3 −→ R √
x = (x, y, z) −→ f2 (x) = x + z 2 + 1.

Definición 3.3.6. Dado un campo escalar o vectorial f : D ⊂ Rn −→ Rm , diremos que es acotado


cuando exista un número K > 0 tal que:

kf (x)k ≤ K, ∀ x ∈ D.

Nota 3.3.7. Obviamente, en el caso n = m = 1, la definición anterior coincide con la definición


de acotación para funciones reales de una variable real (ver Definición 1.3.7).

Ejemplo 3.3.8. Por ejemplo, si D = {x = (x, y, z) ∈ R3 /x > 0}, el campo escalar

f : D ⊂ R3 −→ R
x = (x, y, z) −→ f (x) = ln(x) + y + z − 1,

no es acotado, ya que ln(x) toma valores tan grandes como queramos.


Por otro lado, el campo escalar

f : R2 −→ R
x = (x, y) −→ f (x) = sen(xy) + 1,

está acotado, ya que el seno es una función acotada. De hecho, en este caso,

|f (x)| ≤ 2, ∀ x ∈ R2 .
53
Matemáticas: Cálculo I.

f (x) = sen(xy) + 1
Definición 3.3.9. Dado un campo escalar f : D ⊂ Rn −→ R, se definen sus conjuntos de nivel
como los conjuntos de puntos de Rn donde la función f toma un mismo valor K ∈ R. Así pues,
dado K ∈ R su correspondiente conjunto de nivel está dado por:
CK = {x ∈ Rn / f (x) = K}.
Si n = 2, los conjuntos de nivel se llamarán curvas de nivel. Si n = 3, los conjuntos de nivel
se llamarán superficies de nivel.
Ejemplo 3.3.10. Supongamos que tomamos el campo escalar
f : D ⊂ R3 −→ R
x = (x, y, z) −→ f (x) = x2 + y 2 + z 2 .
Entonces la superficie de nivel para K = 1 está dada por
C1 = {x ∈ R3 / f (x) = 1} = {x = (x, y, z) ∈ R3 / x2 + y 2 + z 2 = 1},
o, equivalentemente, C1 es la esfera de centro θR3 = (0, 0, 0) y radio r = 1.

C1 = {x = (x, y, z) ∈ R3 / x2 + y 2 + z 2 = 1}
54
Matemáticas: Cálculo I.

3.4. Límites de funciones de varias variables


Definición 3.4.1. Sea A un subconjunto abierto de Rn y sea x0 ∈ A ∪ F r(A). Sea
f : A ⊂ Rn −→ Rm
una función de varias variables. Diremos que el límite de f cuando x tiende a x0 es y0 ∈ Rm cuando:
∀  > 0 ∃ δ > 0 / 0 < kx − x0 k ≤ δ, x ∈ A, =⇒ kf (x) − y0 k ≤ .
En el caso en el que se cumpla la condición anterior, denotaremos por
lı́m f (x) = y0
x→x0
al límite.
Debe tenerse en cuenta que la norma kx − x0 k se toma en Rn y que la norma kf (x) − y0 k se
toma en Rm .
Al igual que en el caso de funciones reales de una sola variable, la existencia del límite en un
punto x0 , no implica que exista f (x0 ).
Si f es un campo escalar, la anterior definición queda de la siguiente forma: diremos que el
límite de f cuando x tiende a x0 es y0 ∈ R si
∀  > 0 ∃ δ > 0 / 0 < kx − x0 k ≤ δ, x ∈ A, =⇒ |f (x) − y0 | ≤ .
Teorema 3.4.2. Sea A un subconjunto abierto de Rn y sea x0 ∈ A∪F r(A). Sea f : A ⊂ Rn −→ Rm
una función de varias variables cuyas componentes son
f = (f1 , . . . , fm )
y sea y0 = (y01 , . . . , y0m ) ∈ Rm .
Entonces lı́m f (x) = y0 si, y solo si, lı́m fi (x) = y0i para todo i ∈ {1, . . . , m}.
x→x0 x→x0

Gracias al resultado anterior podemos garantizar que la existencia del límite para f : A ⊂
Rn −→ Rm está ligada a la existencia del límite de sus campos escalares componentes. Es por esto
que para estudiar límites de funciones de varias variables es suficiente estudiar límites de campos
escalares. Por lo tanto, cuando existe el límite, se tiene que
lı́m f (x) = ( lı́m f1 (x), . . . , lı́m fm (x)).
x→x0 x→x0 x→x0
El cálculo de límites de funciones de varias variables es mucho más complicado que en una
variable ya que en R solo nos podemos acercar a un punto por la derecha o por la izquierda. Sin
embargo, en el plano, o en otro espacio de dimensión superior, el número de posibles direcciones o
subconjuntos por los que nos podemos acercar a un punto es infinito y no podemos dirimir si un
límite existe o no comprobando esas infinitas direcciones. Por ejemplo, sea
A = R2 − {(x, −x) / x ∈ R}
y pensemos en el caso del siguiente campo escalar f : A ⊂ R2 → R donde, si x = (x, y) ∈ A,
x2 + y
f (x) = .
x+y
Si calculamos límite en (0, 0) según el conjunto
S = {x = (x, y) ∈ A / x = y},
dado que, para todo x ∈ S,
x2 + x 1
f (x) = = (x + 1),
2x 2
cuando x tienda a (0, 0) por el subconjunto S, el límite tomará el valor
1 1
lı́m (x + 1) = .
x→0 2 2
55
Matemáticas: Cálculo I.

Por otro lado, si


T = {x = (x, y) ∈ A / x = 0},
se tiene que para todo x ∈ T ,
y
f (x) = = 1.
y
Así pues, cuando x tienda a (0, 0) por el subconjunto T , el límite tomará el valor 1.
Finalmente, si
R = {x = (x, y) ∈ A / y = 0}
se tiene que para todo x ∈ R,
x2
f (x) = = x.
x
De esta forma, cuando x tienda a (0, 0) por el subconjunto R, el límite tomará el valor
lı́m x = 0.
x→0

La siguiente figura ilustra las tres direcciones por las que nos hemos acercado a (0, 0).
T
S

R
(0, 0)

En el caso anterior, lo lógico sería afirmar que el límite de f cuando x tiende a (0, 0) no existe,
ya que encontramos al menos dos direcciones o conjuntos, por los cuales nos podemos acercar a
(0, 0), que dan lugar a resultados distintos.
Definición 3.4.3. Sea A un subconjunto abierto de Rn y sea x0 ∈ A ∪ F r(A). Sea
f : A ⊂ Rn −→ Rm
una función de varias variables. Dado un subconjunto S ⊂ A tal que x0 ∈ S ∪ F r(S), diremos que
y0 = (y01 , · · · , y0m ) ∈ Rm es el límite cuando x tiende a x0 según el subconjunto S si:
x ∈ S,
∀>0∃δ>0/ ⇒ kf (x) − y0 k ≤ .
0 < kx − x0 k ≤ δ
En el caso de que se cumpla la condición anterior, denotaremos por
lı́m f (x) = y0
x → x0
x∈S
al límite según el conjunto S.
El siguiente teorema garantiza que el límite de una función de varias variables reales en un
punto existe, si, y solo si, existen los límites según cualquier subconjunto por el que nos podamos
acercar al punto y toman todos el mismo valor.
56
Matemáticas: Cálculo I.

Teorema 3.4.4. Sea A un subconjunto abierto de Rn y sea x0 ∈ A ∪ F r(A). Sea


f : A ⊂ Rn −→ Rm
una función de varias variables. Entonces existe
lı́m f (x)
x→x0

y toma el valor y0 si, y solo si, para todo subconjunto S ⊂ A tal que x0 ∈ S ∪ F r(S) existe
lı́m f (x)
x → x0
x∈S
y toma el valor y0 .
Puesto que es imposible estudiar el límite de todos los posibles subconjuntos por los cuales
nos podamos acercar a x0 , el teorema anterior nos proporciona un criterio negativo para el estudio
de la existencia de límites que consiste en lo siguiente: supongamos que existen dos subconjuntos
S, T ⊂ A, con x0 ∈ S ∪ F r(S) y x0 ∈ T ∪ F r(T ), tales que
lı́m f (x) 6= lı́m f (x)
x → x0 x → x0
x∈S x∈T
entonces no existe el límite de la función f cuando x tiende a x0 .
Obviamente si encontramos una dirección a través de la cual el límite no existe también
tendremos que no existe el límite de la función f cuando x tiende a x0 .
Ejemplo 3.4.5. Sea A = R2 − {(0, 0)} y tomemos el campo escalar f : A ⊂ R2 → R donde, si
x = (x, y) ∈ A,
2xy
f (x) = 2 .
x + y2
Si tomamos el subconjunto de A
Sm = {x = (x, y) ∈ A / y = mx},
se tendrá que para todo x ∈ Sm
2mx2 2m
f (x) = 2 2
=
x (1 + m ) 1 + m2
y, por lo tanto, cuando x tienda a (0, 0) por el subconjunto Sm , el límite tomará el valor
2m
lı́m f (x) = .
x → (0, 0) 1 + m2
x ∈ Sm
El resultado anterior depende de m. De hecho, cuando m = 1 vale 1 y cuando m = −1 vale
−1. De esta forma queda claro que el límite depende de la recta por la que nos acercamos al punto
y esto implica que
lı́m f (x)
x → (0, 0)
no existe.
La siguiente figura nos aclara lo que pasa en un entorno de (0, 0).
57
Matemáticas: Cálculo I.

2xy
f (x) =
x2 + y 2
Ejemplo 3.4.6. Sea el campo escalar f : R2 → R dado por

x2 y
si x = (x, y) 6= (0, 0)


 4
f (x) = x + y2


0 si x = (x, y) = (0, 0).

Si tomamos, como en el ejemplo anterior, el conjunto


Sm = {x = (x, y) ∈ R2 / y = mx},
se tendrá que para todo x ∈ Sm
mx3 mx
f (x) = = 2
x2 (x2 + m2 ) x + m2
y, por lo tanto, cuando x tienda a (0, 0) por el subconjunto Sm , el límite tomará el valor
mx
lı́m f (x) = lı́m 2 = 0.
x → (0, 0) x→0 x + m2
x ∈ Sm
El resultado anterior no depende de m. Esto es, el valor del límite vale lo mismo independien-
temente de la recta por la que nos acerquemos a origen de coordenadas. Ahora bien, si tomamos
T = {x = (x, y) ∈ R2 / y = x2 },
se tendrá que, para todo x ∈ T ,
x4 1
f (x) = =
x4
+ x4 2
y, por lo tanto, cuando x tienda a (0, 0) por el subconjunto T , el límite tomará el valor
1 1
lı́m f (x) = lı́m = .
x → (0, 0) x→0 2 2
x∈T
Así pues,
lı́m f (x)
x → (0, 0)
58
Matemáticas: Cálculo I.

no existe.
La siguiente figura nos aclara lo que pasa en un entorno de (0, 0) cuando nos acercamos al
punto por la parábola y = x2 .

x2 y
f (x) = , x 6= (0, 0).
x4 + y 2
En el siguiente resultado podemos encontrar algunas propiedades que nos resultarán útiles a
la hora de calcular límites de funciones de varias variables.
Proposición 3.4.7. Sea A un subconjunto abierto de Rn y sea x0 ∈ A ∪ F r(A).
(i) Supongamos que f, g : A ⊂ Rn −→ Rm son dos funciones de varias variables. Si existen los
límites lı́m f (x), lı́m g(x) y son iguales a y0 ∈ Rm y z0 ∈ Rm respectivamente, también
x→x0 x→x0
existe el límite de la función αf + βg, para todos α y β reales, y además se cumple que
lı́m (αf + βg)(x) = αy0 + βz0 = α lı́m f (x) + β lı́m g(x).
x→x0 x→x0 x→x0

(ii) Supongamos que f, g : A ⊂ Rn −→ R son campos escalares. Si existen los límites lı́m f (x),
x→x0
lı́m g(x) y son iguales a y0 ∈ R y z0 ∈ R respectivamente, también existe el límite de la
x→x0
función f.g y además se cumple que
lı́m (f.g)(x) = y0 z0 = lı́m f (x). lı́m g(x).
x→x0 x→x0 x→x0

(iii) Supongamos que f, g : A ⊂ Rn −→ R son campos escalares. Si existen los límites lı́m f (x),
x→x0
lı́m g(x) y son iguales a y0 ∈ R y z0 ∈ R, z0 6= 0, respectivamente, también existe el límite
x→x0
f
de la función y además se cumple que
g
lı́m f (x)
f y0 x→x0
lı́m ( )(x) = = .
x→x0 g z0 lı́m g(x)
x→x0

(iv) Supongamos que f, g : A ⊂ Rn −→ R son campos escalares. Si existen los límites lı́m f (x),
x→x0
lı́m g(x) y son iguales a y0 > 0 y z0 ∈ R respectivamente, también existe el límite de la
x→x0

59
Matemáticas: Cálculo I.

función f g y además se cumple que


lı́m g(x)
lı́m (f g )(x) = y0z0 = ( lı́m f (x))x→x0 .
x→x0 x→x0

(v) Supongamos que f : A ⊂ Rn −→ R es un campo escalar. Si se cumple que lı́m f (x) = 0 y


x→x0
g : A ⊂ Rn −→ R es otro campo escalar acotado en un entorno de x0 , entonces
lı́m (f.g)(x) = 0.
x→x0

(vi) Supongamos que f, g, h : A ⊂ Rn −→ R son tres campos escalares tales que


h(x) ≤ f (x) ≤ g(x)
en un entorno de x0 y que lı́m h(x) = lı́m g(x), entonces
x→x0 x→x0

lı́m f (x) = lı́m h(x) = lı́m g(x).


x→x0 x→x0 x→x0

Nota 3.4.8. Para dos funciones de varias variables f, g : A ⊂ Rn −→ Rm , dados α y β reales, la


función
αf + βg : A ⊂ Rn −→ Rm ,
está dada por:
(αf + βg)(x) = αf (x) + βg(x).
Para dos campos escalares f, g : A ⊂ Rn −→ R, la función
f.g : A ⊂ Rn −→ R,
está dada por:
(f g)(x) = f (x).g(x).
En las mismas circunstancias, si B es un entorno de x0 ∈ A donde la función g no se anula,
f
: B ⊂ Rn −→ R,
g
está dada por:
f f (x)
( )(x) = .
g g(x)
Similarmente, si B es un entorno de x0 ∈ A donde la función f es positiva,
f g : B ⊂ Rn −→ R,
está dada por:
(f g )(x) = f (x)g(x) .
Por otro lado, tal como pasaba en el caso de funciones de una sola variable algunas de las
propiedades anteriores se pueden extender al caso en que alguno de los límites es ±∞, teniendo
en cuenta las relaciones (+∞) + (+∞) = +∞, (+∞) · (+∞) = +∞, λ · (+∞) = +∞ si λ > 0,
λ · (+∞) = −∞ si λ < 0, (+∞)+∞ = +∞. Finalmente, el cálculo de límites de campos escalares
también conduce a indeterminaciones del tipo:
0 ∞
∞ − ∞, 0 · · · ∞, , , 00 , 1∞ , ∞0 .
0 ∞
Ejemplo 3.4.9. Sea el campo escalar f : R2 → R dado por
f (x) = x2 sen(x2 + y 2 + 1).
Para este campo, como el seno está acotado por 1, se tiene que
−x2 ≤ f (x) ≤ x2
60
Matemáticas: Cálculo I.

para todo x = (x, y) ∈ R2 . Por lo tanto, ya que


lı́m x2 = 0
x→(0,0)

obtenemos, gracias a la propiedad (vi) de la proposición anterior, que


lı́m f (x) = 0.
x→(0,0)

La siguiente figura nos aclara lo que pasa en un entorno de (0, 0) cuando calculamos el límite.

f (x) = x2 sen(x2 + y 2 + 1).


Otro resultado que nos puede servir para calcular límites es el siguiente.
Teorema 3.4.10. Sea A un subconjunto abierto de Rn y sea x0 ∈ A. Supongamos que f : A ⊂
Rn −→ R es un campo escalar y que existen BRn (x0 , r) ⊂ A, y0 ∈ R y un campo escalar ϕ :
BRn (x0 , r) → R, cumpliendo
|f (x) − y0 | ≤ ϕ(x)
para todo x ∈ BRn (x0 , r). Entonces, si
lı́m ϕ(x) = 0,
x→x0

se tiene que
lı́m f (x) = y0 .
x→x0

Ejemplo 3.4.11. Sea el campo escalar f : R2 → R dado por



x2 − y 2
 xy 2 si x = (x, y) 6= (0, 0)


f (x) = x + y2


0 si x = (x, y) = (0, 0).

Para todo x = (x, y) de R2 se tiene lo siguiente:


x2 − y 2 |x2 − y 2 |
|f (x) − 0| = |xy | = |xy| ≤ |xy|.
x2 + y 2 x2 + y 2
Por lo tanto, tomando ϕ : R2 → R como
ϕ(x) = |xy|,
61
Matemáticas: Cálculo I.

se puede deducir que


lı́m f (x) = 0,
x→(0,0)
ya que
lı́m ϕ(x) = 0.
x→(0,0)
La gráfica de la función anterior está dada por:

x2 − y 2
f (x) = xy , x 6= (0, 0).
x2 + y 2
En este caso, se cumple también que
lı́m f (x) = 0 = f ((0, 0)),
x→(0,0)

i. e., el límite coincide con el valor de la función en el punto. Esta propiedad es la que motiva la
primera definición de la sección siguiente.

3.5. Continuidad de funciones de varias variables


Definición 3.5.1. Sea A un subconjunto abierto de Rn y sea x0 ∈ A. Sea f : A ⊂ Rn −→ Rm una
función de varias variables. Diremos que f es continua en x0 si:
∀  > 0 ∃ δ > 0 / 0 < kx − x0 k ≤ δ, x ∈ A, =⇒ kf (x) − f (x0 )k ≤ .
En otras palabras, f es continua en x0 si existe
lı́m f (x)
x→x0

y toma el valor f (x0 ). Equivalentemente,


lı́m f (x) = ( lı́m f1 (x), . . . , lı́m fm (x)) = (f (x0 )1 , . . . , f (x0 )m ) = f (x0 ).
x→x0 x→x0 x→x0

Ejemplo 3.5.2. Dados Rn y j ∈ {1, · · · , n}, se define la proyección j-ésima como el campo escalar
pj : Rn → R
dado por
pj (x) = xj
donde xj es la componente j-ésima de x.
62
Matemáticas: Cálculo I.

Todas las proyecciones son funciones continuas ya que si x0 ∈ R se tiene que


v
u n
q uX
2
|pj (x) − pj (x0 )| = |xj − x0j | = (xj − x0j ) ≤ t (xj − x0j )2 = kx − x0 k.
j=1

Por lo tanto, dado  > 0, si tomamos δ = , kx − x0 k ≤ δ implica que |pj (x) − pj (x0 )| ≤ .
Ejemplo 3.5.3. Dados A ⊂ Rn y k ∈ R, se define la el campo escalar constante en A de valor k
como
gk : A ⊂ Rn → R
dado por
gk (x) = k.
Todos los campos escalares constantes son continuos ya que si x0 ∈ A se tiene que
v
u n
uX
|gk (x) − gk (x0 )| = |k − k| = 0 ≤ t (xj − x0j )2 = kx − x0 k.
j=1

Por lo tanto, dado  > 0, si tomamos δ un número real cualquiera, kx − x0 k ≤ δ implica que
|gk (x) − gk (x0 )| ≤ .
Ejemplo 3.5.4. En la sección anterior vimos que el campo escalar f : R2 → R dado por

x2 − y 2
 xy 2 si x = (x, y) 6= (0, 0)


f (x) = x + y2


0 si x = (x, y) = (0, 0)

es continuo en x0 = (0, 0) ya que


lı́m f (x) = 0 = f (0, 0)).
x→(0,0)

Por ejemplo, el campo escalar g : R2 → R dado por



x2 − y 2
 xy 3 2 si x = (x, y) 6= (0, 0)


g(x) = x + y2


3 si x = (x, y) = (0, 0)

no es continuo en x0 = (0, 0), ya que


lı́m g(x) = 0 6= 3 = g((0, 0)).
x→(0,0)

Finalmente, el campo escalar h : R2 → R dado por



x2 y
si x = (x, y) 6= (0, 0)


 4
h(x) = x + y2


0 si x = (x, y) = (0, 0)

no es continuo en x0 = (0, 0), ya que no existe el límite de la función en (0, 0) (ver Ejemplo 3.4.6).
Teorema 3.5.5. Sea A un subconjunto abierto de Rn y sea x0 ∈ A. Sea f : A ⊂ Rn −→ Rm una
función de varias variables cuyas componentes son
f = (f1 , . . . , fm ).
Entonces f es continua en x0 si, y solo si, fi es continua en x0 para todo i ∈ {1, . . . , m}.
63
Matemáticas: Cálculo I.

Gracias al resultado anterior podemos garantizar que la continuidad de f : A ⊂ Rn −→ Rm


en x0 está ligada a la continuidad de sus campos escalares componentes en x0 . Gracias a esta
propiedad podemos reducir el estudio de la continuidad de funciones de varias variables al estudio
de la continuidad de campos escalares.
Proposición 3.5.6. Sea A un subconjunto abierto de Rn y sea x0 ∈ A.
(i) Si f, g : A ⊂ Rn −→ Rm funciones de varias variables continuas en x0 , se cumple que
αf + βg es continua en x0 para todos α y β reales.
(ii) Si f, g : A ⊂ Rn −→ R son campos escalares continuos en x0 , se cumple que f.g es un
campo escalar continuo en x0 .
(iii) Si f, g : A ⊂ Rn −→ R son campos escalares continuos en x0 y g no se anula en un entorno
f
de x0 , se cumple que es un campo escalar continuo en x0 .
g
Ejemplo 3.5.7. Sea f : R3 −→ R3 el campo vectorial dado por
x2 + y 2
f (x) = (x2 + y 2 + z 2 + 1, , x y).
1 + x2
Entonces, es un campo vectorial continuo en todo R3 ya que:
La primera componente es una función continua resultado de productos de las tres proyec-
ciones p1 (x) = x, p2 (x) = y, p3 (x) = z, y su suma con la función constante g1 (x) = 1.
La segunda componente es una función continua resultado de un cociente de funciones
continuas donde el denominador es siempre distinto de cero.
La tercera componente es una función continua resultado de productos de las proyecciones
p1 (x) = x, p2 (x) = y.
Ejemplo 3.5.8. El campo escalar f : R2 → R dado por

xy − x2 − y
6 0
si x + y =



f (x) = x+y


0 si x + y = 0

es continuo en todo x0 ∈
/ T , donde T es la recta dada por
T = {x = (x, y) ∈ R2 / x + y = 0}.
d(x0 , T )
Esto es así por lo siguiente: dado x0 ∈
/ T si tomamos r = se tiene que la bola abierta
2
BR2 (x0 , r) no contiene ningún punto de T . Entonces la función f es continua en BR2 (x0 , r) ya que
en esa bola está dada como cociente de continuas y no se anula el denominador.
y

x0

T
64
Matemáticas: Cálculo I.

Si x0 ∈ T entonces x0 = (x0 , −x0 ). Por lo tanto,


lı́m f (x) = 0,
x → (x0 , −x0 )
x∈T

ya que la función se anula en todos los puntos de T . Sea B = R2 − T , entonces


∞ si − 2x20 + x0 6= 0



lı́m f (x) =
x → (x0 , −x0 ) 0
si − 2x20 + x0 = 0


x∈B 0

Como consecuencia obtenemos que la función f no es continua en los puntos de T que cumplen
la condición −2x20 + x0 6= 0.
Los que cumplen la condición −2x20 + x0 = 0 son
−2x20 + x0 = 0 ⇐⇒ x0 (−2x0 + 1) = 0 ⇐⇒ x0 = 0, o x0 = 1/2.
Esto da lugar a dos puntos (0, 0) y (1/2, −1/2) en los cuales aparece una indeterminación del
0
tipo .
0
Para x0 = (0, 0) tomemos la recta S = {x = (x, y) ∈ R2 / x = 0}. Entonces,
lı́m f (x) = −1 6= 0 = lı́m f (x)
x → (0, 0) x → (0, 0)
x∈S x∈T

lo que implica que el límite de f cuando x tiende a (0, 0) no existe. Por lo tanto, f tampoco es
continua en (0, 0).
Para x0 = (1/2, −1/2) tomemos la recta R = {x = (x, y) ∈ R2 / x = 1/2}. Entonces,
−1/2y − 1/4
lı́m f (x) = lı́m = −1/2 6= 0 = lı́m f (x)
x → (1/2, −1/2) y → −1/2 1/2 + y x → (1/2, −1/2)
x∈R x∈T

lo que implica que el límite de f cuando x tiende a (1/2, −1/2) no existe. Por lo tanto, f tampoco
es continua en (1/2, −1/2).
Gracias a todo lo anterior podemos concluir que f es continuo en R2 − T .
Definición 3.5.9. Sea A un subconjunto abierto de Rn y sea B un subconjunto abierto de Rm .
Sean f : A ⊂ Rn −→ Rm y g : B ⊂ Rm −→ Rp dos funciones de varias variables tales que
f (A) ⊂ B. Se define la composición de f con g como la función de varias variables
g ◦ f : A ⊂ Rn −→ Rp
dada por
(g ◦ f )(x) = g(f (x)).
Ejemplo 3.5.10. Sea f : A ⊂ Rn −→ Rm una función de varias variables y tomemos pi : Rm −→ R
la proyección en la componente i-ésima. Entonces
(pi ◦ f )(x) = pi (f (x)) = f (x)i = fi (x).
Por lo tanto, la composición de f con la proyección i-ésima es justamente la componente
i-ésima de f .
65
Matemáticas: Cálculo I.

Ejemplo 3.5.11. Sea f : R3 −→ R un campo escalar dado por


f (x) = x2 + |y + z| + 1.
Sea la función real de variable real g : (0, +∞) → R dada por:
ln(x)
g(x) = .
x
Entonces, como f (x) > 0, podemos hacer la composición g ◦ f : R3 −→ R donde
ln(x2 + |y + z| + 1)
(g ◦ f )(x) = g(f (x)) = g(x2 + |y + z| + 1) = .
x2 + |y + z| + 1
Proposición 3.5.12. Sea A un subconjunto abierto de Rn y B un subconjunto abierto de Rm . Sean
f : A ⊂ Rn −→ Rm y g : B ⊂ Rm −→ Rp dos funciones de varias variables tales que f (A) ⊂ B.
Si f es continua en x0 y g es continua en f (x0 ), se tiene que g ◦ f es continua en x0 .
Ejemplo 3.5.13. Sea f : R3 −→ R el campo escalar dado por
sen(xyz)
f (x) = 2 .
x + y2 + z2 + 1
Entonces, es un campo escalar continuo en todo R3 ya que:
El numerador es una función continua resultado de productos de las tres proyecciones
p1 (x) = x, p2 (x) = y, p3 (x) = z, y la composición con la función continua seno.
El denominador es una función continua resultado de productos de las tres proyecciones y
suma de estos productos con la función constante g1 (x) = 1.
El denominador no se anula en todo el dominio.
Proposición 3.5.14. Sea A un subconjunto abierto de Rn y sea x0 ∈ A. Sea f : A ⊂ Rn −→ R
un campo escalar continuo en x0 . Si g : B ⊂ R → R es una función tal que
lı́m g(t) = ω0 ,
t→f (x0 )

se cumple que
lı́m g(f (x)) = ω0 .
x→x0
Ejemplo 3.5.15. En este ejemplo trataremos de calcular el límite de la función
h : A ⊂ R2 → R
cuando x tiende a (0, 0), donde A = BR2 ((0, 0), 1) − (0, 0) y
3(x2 + y 2 )2
h(x) = p .
1 − 1 − (x2 + y 2 )
El valor de la función anterior en un punto x distinto del (0, 0) se obtiene como h(x) = g(f (x))
siendo
f : BR2 ((0, 0), 1) ⊂ R2 → R, f (x) = x2 + y 2 ,
y
3t2
g : (0, 1) → R, g(t) = √ .
1− 1−t
La función f es continua en todo su dominio (en particular lo es en (0, 0)) y f (0, 0) = 0.
Además, por el Ejemplo 2.1.20 se tiene que
3t2
lı́m g(t) = lı́m √ = 0.
t→f (0,0)=0 t→0 1 − 1 − t

Entonces,
lı́m h(x) = lı́m g(f (x)) = 0.
x→(0,0) x→(0,0)

66
Matemáticas: Cálculo I.

3.6. El Teorema de Bolzano para campos escalares


En la parte final de este tema se estudiará la generalización del Teorema de Bolzano para
campos escalares.
Definición 3.6.1. Sean a, b ∈ Rn . Se define el segmento de extremos a y b como
L[a, b] = {x ∈ Rn / x = (1 − t)a + tb, t ∈ [0, 1]}.
Ejemplo 3.6.2. Dados en R2 a = (2, 2) y b = (1, 0) se tiene que
L[a, b] = {x ∈ R2 / x = (1 − t)(2, 2) + t(1, 0), t ∈ [0, 1]} = {x ∈ R2 / x = (2 − t, 2 − 2t), t ∈ [0, 1]}.
y
a = (2, 2)

L[a, b]

x
b = (1, 0)

Teorema 3.6.3 (Teorema de Bolzano). Sea A un subconjunto abierto de Rn y sea f : A ⊂ Rn −→ R


un campo escalar continuo en A. Supongamos que para a, b ∈ A el segmento L[a, b] está contenido
en A. Entonces, si f (a)f (b) < 0, existe al menos un x0 ∈ L[a, b] tal que f (x0 ) = 0.
Ejemplo 3.6.4. El campo escalar f : R2 → R dado por

x2 − y 2
 xy 2 si x = (x, y) 6= (0, 0)


f (x) = x + y2


0 si x = (x, y) = (0, 0)

es continuo en R2 . La función es continua en el abierto R2 − (0, 0) ya que es el resultado de


operaciones con funciones continuas y no se anula el denominador. En (0, 0) ya vimos en el Ejemplo
3.5.4 que la función resulta ser continua.
Si tomamos a = (1, 3) y b = (3, 1) se tiene que f (a)f (b) < 0 y, por lo tanto, gracias al Teorema
de Bolzano, podemos afirmar que existe al menos un x0 ∈ L[(1, 3), (3, 1)] tal que f (x) = 0.

67
Matemáticas: Cálculo I.

68
Matemáticas: Cálculo I

Capítulo 4

Sistemas de coordenadas en el plano y en el espacio

En este tema se estudiarán diferentes tipos de coordenadas tanto en el plano como en el espa-
cio tridimensional. Hasta ahora hemos representado los puntos de los espacios R2 y R3 utilizando
coordenadas cartesianas; sin embargo en muchos casos es conveniente hacer un cambio de coor-
denadas para describir de una forma distinta una región concreta de dichos espacios. Este tipo de
cambios son especialmente útiles para abordar problemas de integración.

4.1. Coordenadas polares


En esta primera sección introduciremos la coordenadas polares y sus variantes.
Definición 4.1.1. Dado el conjunto
[0, +∞) × [0, 2π) = {(r, α) / r ∈ [0, +∞), α ∈ [0, 2π)},
se define el cambio a coordenadas polares como la función
T : [0, +∞) × [0, 2π) → R2
dada por
T ((r, α)) = (r cos(α), r sen(α)).
Obviamente todo punto x = (x, y) 6= (0, 0) del espacio R2 se puede representar de forma única
usando un (r, α) ∈ [0, +∞) × [0, 2π) de la siguiente forma:
p
r = kxk = x2 + y 2 , x = r cos(α), y = r sen(α).

x = (r cos(α), r sen(α))
(0, y)
r

(x, 0)

Dicho de una forma no muy formal, cuando usamos coordenadas polares estamos pensando
que cada punto x = (x, y) del espacio R2 se puede identificar con un punto de una circunferen-
cia centrada en el origen de coordenadas θR2 = (0, 0). Es por esto que las coordenadas polares
introducidas en esta definición se llaman coordenadas polares centradas.
Si se trata de describir regiones donde es más conveniente optar por un centro x0 = (x0 , y0 ) que
no sea el origen de coordenadas, debemos utilizar el cambio a coordenadas polares descentradas.
Dado x0 = (x0 , y0 ) ∈ R2 , se define el cambio a coordenadas polares descentradas como la función
T : [0, +∞) × [0, 2π) → R2
69
Matemáticas: Cálculo I.

dada por
T ((r, α)) = (x0 + r cos(α), y0 + r sen(α)).
Al igual que antes, cuando usamos coordenadas polares descentradas estamos pensando que
cada punto x = (x, y) del espacio R2 se puede identificar con un punto de una circunferencia
centrada ahora en x0 = (x0 , y0 ).

x = (x0 + r cos(α), y0 + r sen(α))


y

r
x0 α

x
(0, 0)

Ejemplo 4.1.2. Sea el subconjunto


D = {x = (x, y) ∈ R2 / x2 + y 2 ≤ 1, y ≥ x, y ≥ −x, }
de R2 . Entonces, D está formado por los puntos del plano tales que son interiores a la circunferencia
x2 + y 2 = 1 y además quedan por encima de las rectas y = x e y = −x. En la siguiente figura
podemos comprobar que el conjunto D se corresponde con la región coloreada en azul.
y
y=x
(0, 1)

y = −x
Así pues, cualquier punto x = (x, y) ∈ D es de la forma
x = (r cos(α), r sen(α)) = T ((r, α))
donde r ∈ [0, 1] y α ∈ [π/4, 3π/4]. Por lo tanto,
D = T (Ω)
con Ω = [0, 1] × [π/4, 3π/4].
70
Matemáticas: Cálculo I.

Ejemplo 4.1.3. Sea el subconjunto


D = {x = (x, y) ∈ R2 / x2 + y 2 ≤ 1, x ≥ 0, }
de R2 . Entonces, D está formado por los puntos del plano tales que son interiores a la circunferencia
x2 + y 2 ≤ 1 y además se encuentran a la derecha del eje OY .
y

(0, 1)

Así pues, cualquier punto x = (x, y) ∈ D es de la forma


x = (r cos(α), r sen(α)) = T ((r, α))
donde r ∈ [0, 1] y α ∈ [0, π/2] ∪ [3π/2, 2π). Por lo tanto,
D = T (Ω)
con Ω = [0, 1] × ([0, π/2] ∪ [3π/2, 2π)).
Si en vez de pensar los puntos del espacio como pertenecientes a una circunferencia centrada
en el origen los pensamos como pertenecientes a una elipse de ecuación
x2 y 2
+ 2 = 1,
a2 b
para a, b números reales positivos (ver figura siguiente),

(0, b)
x = (x, y)

(a, 0)

podremos introducir el cambio a coordenadas elípticas de la siguiente forma.


Definición 4.1.4. Sea el conjunto
[0, +∞) × [0, 2π) = {(r, α) / r ∈ [0, +∞), α ∈ [0, 2π)}.
71
Matemáticas: Cálculo I.

Sean a, b dos números reales positivos. Se define el cambio a coordenadas elípticas centradas
como la función
T : [0, +∞) × [0, 2π) → R2
dada por
T ((r, α)) = (ar cos(α), br sen(α)).
Cuando a = b = 1 se recuperan las coordenadas polares centradas y está claro que
T ((r, α)) = (ar cos(α), br sen(α))
es un punto de la elipse
x2 y2
+ = 1.
(ar)2 (br)2
Si se trata de describir regiones donde es más conveniente optar por un centro x0 = (x0 , y0 ) que
no sea el origen de coordenadas, debemos utilizar el cambio a coordenadas elípticas descentradas.
Dado x0 = (x0 , y0 ) ∈ R2 , se define el cambio a coordenadas elípticas descentradas como la función
T : [0, +∞) × [0, 2π) → R2
dada por
T ((r, α)) = (x0 + ar cos(α), y0 + br sen(α)).
En este caso, T ((r, α)) = (x0 + ar cos(α), y0 + br sen(α)) es un punto de una elipse de ecuación
(x − x0 )2 (y − y0 )2
+ = 1.
(ar)2 (br)2
Ejemplo 4.1.5. Supongamos que tenemos la región
D = {x = (x, y) ∈ R2 / 3x2 + 4(y − 5)2 ≤ 1, y ≥ 5, }
de R2 . Entonces, D está formado por los puntos del plano tales que son interiores a la elipse
x2 (y − 5)2
√ + =1
(1/ 3)2 (1/2)2
y además se encuentran por encima de la recta y = 5. Como la elipse anterior no está centrada√en
el (0, 0), será conveniente usar el cambio a coordenadas elípticas descentradas donde a = 1/ 3,
b = 1/2 y x0 = (0, 5). En la figura siguiente se representa la región D

(0, 11/2 = 5 + 1/2)

(0, 5)
√ √
(−1/ 3, 5) (1/ 3, 5)

(0, 9/2 = 5 − 1/2)

72
Matemáticas: Cálculo I.

donde podemos comprobar que, tomando Ω = [0, 1] × [0, π] y el cambio a coordenadas elípticas
descentradas
T : [0, +∞) × [0, 2π) → R2
1 1
T ((r, α)) = ( √ r cos(α), 5 + r sen(α)),
3 2
podemos garantizar que T (Ω) = D.

4.2. Coordenadas cilíndricas


En esta sección comenzaremos el estudio de los cambios de coordenadas asociadas al espacio
tridimensional con la introducción de las coordenadas cilíndricas.
Definición 4.2.1. Dado el conjunto
[0, +∞) × [0, 2π) × R = {(r, α, z) / r ∈ [0, +∞), α ∈ [0, 2π), z ∈ R},
se define el cambio a coordenadas cilíndricas centradas como la función
T : [0, +∞) × [0, 2π) × R → R3
dada por
T ((r, α, z)) = (r cos(α), r sen(α), z).
Todo punto x = (x, y, z) 6= (0, 0, 0) del espacio R3 se puede representar de forma única usando
un (r, α, z) ∈ [0, +∞) × [0, 2π) × R de la siguiente forma:
p
r = x2 + y 2 , x = r cos(α), y = r sen(α), z = z.
Cuando usamos coordenadas cilíndricas centradas estamos pensando que cada punto x =
(x, y, z) del espacio R3 se puede identificar con un punto de un cilindro cuyo corte con el plano
XY es una circunferencia centrada en el origen de coordenadas θR3 = (0, 0, 0).
z

x = (r cos(α), r sen(α), z)

y
r
α

De la misma forma que en el caso de las coordenadas polares, también se puede pensar en
coordenadas cilíndricas descentradas si se cambia el origen de coordenadas θR3 = (0, 0, 0) por otro
punto x0 = (x0 , y0 , z0 ) de R3 .
Definición 4.2.2. Dado x0 = (x0 , y0 , z0 ) de R3 , se define el cambio a coordenadas cilíndricas
descentradas como la función
T : [0, +∞) × [0, 2π) × R → R3
73
Matemáticas: Cálculo I.

dada por
T ((r, α, z)) = (x0 + r cos(α), y0 + r sen(α), z).
Ejemplo 4.2.3. En este ejemplo describiremos utilizando coordenadas cilíndricas centradas la
región de R3 dada por:
p
D = {x = (x, y, z) ∈ R3 / 2 − z ≥ x2 + y 2 , z ≥ x2 + y 2 }
p
La ecuación 2 − z = x2 + y 2 es la de un paraboloide y z = x2 + y 2 es la de un cono recto.
En las figuras siguientes podemos ver como son sus gráficas:

p
2 − z = x2 + y 2 z= x2 + y 2
Teniendo en cuenta lo anterior, es fácil ver que D esta formado por los puntos del espacio que
están dentro del cono, dentro del paraboloide y con z ≥ 0. En la figura siguiente se muestra la
región D

Región D
siendo la intersección del cono y del paraboloide una circunferencia de radio 1 y centro (0, 0)
colocada a altura z = 1. Como consecuencia, si queremos describir la región usando coordenadas
cilíndricas el ángulo α debe pertenecer al intervalo [0, 2π), el radio r al intervalo [0, 1], y z varia
entre las condiciones que se obtienen cuando forzamos al punto T ((r, α, z)) = (rcos(α), rsen(α), z)
a cumplir, en primer lugar, la ecuación del cono y en segundo lugar la ecuación del paraboloide.
Así pues, para el cono tenemos que
p p √
z = (rcos(α))2 + (rsen(α))2 = r2 (cos2 (α) + sen2 (α)) = r2 = ±r
74
Matemáticas: Cálculo I.

y esto implica r = z. Por otro lado, para el paraboloide se obtiene que


2 − z = (rcos(α))2 + (rsen(α))2 = r2 (cos2 (α) + sen2 (α)) = r2 ,
o, equivalentemente, z = 2 − r2 . Por lo tanto, si tomamos
Ω = {(r, α, z) / r ∈ [0, 1], α ∈ [0, 2π), r ≤ z ≤ 2 − r2 }
se tiene que T (Ω) = D.
Ejemplo 4.2.4. En este ejemplo describiremos utilizando coordenadas cilíndricas la región de R3
dada por:
D = {x = (x, y, z) ∈ R3 / x2 + (y + 2)2 ≤ 4, 6 + x ≤ z ≤ 6 − x}
Dado que x2 + (y − 2)2 = 4 es la ecuación de un cilindro cuya intersección con el plano z = 0
es una circunferencia de radio r = 2 y centro (0, −2), en este caso será mejor describir la región
usando coordenadas cilíndricas descentradas del tipo
T ((r, α, z)) = (r cos(α), −2 + r sen(α), z).
Entonces la condición 6 + x ≤ z ≤ 6 − x implica que
6 + r cos(α) ≤ z ≤ 6 − r cos(α)
y, por lo tanto,
6 + r cos(α) ≤ 6 − r cos(α) ⇐⇒ 2r cos(α) ≤ 0 ⇐⇒
r cos(α) ≤ 0 ⇐⇒ r = 0 o cos(α) ≤ 0.
π 3π
Así pues, α ∈ [ , ] y, como los puntos de la región D deben de estar dentro del cilindro,
2 2
r ∈ [0, 2]. En la figura siguiente se muestra la región D

Región D
Por lo tanto, si tomamos
π 3π
Ω = {(r, α, z) / r ∈ [0, 2], α ∈ [ , ], 6 + r cos(α) ≤ z ≤ 6 − r cos(α)}
2 2
se tiene que T (Ω) = D.
75
Matemáticas: Cálculo I.

También se puede formular un cambio de variable cuando trabajamos con cilindros de base
elíptica.
Definición 4.2.5. Dado el conjunto [0, +∞) × [0, 2π) × R, para cada par de reales positivos a y
b, se define el cambio a coordenadas cilíndricas centradas de base elíptica como la función
T : [0, +∞) × [0, 2π) × R → R3
dada por
T ((r, α, z)) = (ar cos(α), br sen(α), z).
De la misma forma que en el caso de las coordenadas cilíndricas, también se puede pensar
en coordenadas cilíndricas descentradas de base elíptica si se cambia el origen de coordenadas
θR3 = (0, 0, 0) por otro punto x0 = (x0 , y0 , z0 ) de R3 .
Dado x0 = (x0 , y0 , z0 ) de R3 , se define el cambio a coordenadas cilíndricas descentradas de
base elíptica como la función
T : [0, +∞) × [0, 2π) × R → R3
dada por
T ((r, α, z)) = (x0 + ar cos(α), y0 + br sen(α), z).

4.3. Coordenadas esféricas


En esta sección continuamos el estudio de los cambios de coordenadas asociadas al espacio
tridimensional introduciendo las coordenadas esféricas.
Definición 4.3.1. Dado el conjunto
[0, +∞) × [0, 2π) × [0, π] = {(ρ, α, β) / ρ ∈ [0, +∞), α ∈ [0, 2π), β ∈ [0, π]},
se define el cambio a coordenadas esféricas centradas como la función
T : [0, +∞) × [0, 2π) × [0, π] → R3
dada por
T ((ρ, α, β)) = (ρ cos(α) sen(β), ρ sen(α) sen(β), ρ cos(β)).
Todo punto x = (x, y, z) 6= (0, 0, 0) del espacio R3 se puede representar de forma única usando
un (ρ, α, β) ∈ [0, +∞) × [0, 2π) × [0, π] donde
p
ρ = kxk = x2 + y 2 + z 2
y los ángulos α y β son los representados en la siguiente figura:
z

x = (ρ cos(α) sen(β), ρ sen(α) sen(β), ρ cos(β))

β ρ
z = ρ cos(β)
y
r = ρ sen(β)
α
(r cos(α), r sen(α), 0)

x
76
Matemáticas: Cálculo I.

De la misma forma que en el caso de las coordenadas polares, también se puede pensar en
coordenadas esféricas descentradas si se cambia el origen de coordenadas θR3 = (0, 0, 0) por otro
punto x0 = (x0 , y0 , z0 ) de R3 .
Definición 4.3.2. Dado x0 = (x0 , y0 , z0 ) de R3 , se define el cambio a coordenadas esféricas
descentradas como la función
T : [0, +∞) × [0, 2π) × [0, π] → R3
dada por
T ((ρ, α, β)) = (x0 + ρ cos(α) sen(β), y0 + ρ sen(α) sen(β), z0 + ρ cos(β)).
Ejemplo 4.3.3. En este ejemplo describiremos utilizando coordenadas esféricas centradas la región
de R3 dada por:
D = {x = (x, y, z) ∈ R3 / z 2 ≥ x2 + y 2 , x2 + y 2 + z 2 ≤ 1, z ≥ 0}
La ecuación z 2 = x2 + y 2 es la de un cono, la ecuación x2 + y 2 + z 2 = 1 es la de una esfera
de centro (0, 0, 0) y radio 1, y la ecuación z = 0 es la del plano XY . Por lo tanto, D está formado
por los puntos del espacio que están dentro del cono y de la esfera y además por encima del plano
XY .
En la figura siguiente se muestra la región D

Región D
donde √
z 2 = x2 + y 2

2 2
⇒ 2z = 1 ⇒ z = ±
x2 + y 2 + z 2 = 1 2
y, por lo tanto, la intersección del cono y la esfera es una circunferencia de ecuación

2 2 2 2
x +y =( )
2

2
colocada a altura z = . De esta forma tenemos que ρ ∈ [0, 1], α ∈ [0, 2π) y, por otro lado, como
2
se puede observar en la figura siguiente (la región D es la parte coloreada en amarillo),

77
Matemáticas: Cálculo I.

(0, 0, 1)
√ √ √ √
2 2 2 2
(0, − , ) (0, , )
2 2 2 2

π
ρ=1 β=
4

y
(0, 1, 0)

√ √ √
2 2 2
existe un triángulo de vértices (0, 0, 0), (0, 0, ) y (0, , ) que nos indica que el ángulo β
2 2 2
π
pertenece al intervalo [0, ]. Así pues, si tomamos
4
π
Ω = [0, 1] × [0, 2π) × [0, ],
4
para
T : [0, +∞) × [0, 2π) × [0, π] → R3
dada por
T ((ρ, α, β)) = (ρ cos(α) sen(β), ρ sen(α) sen(β), ρ cos(β)),
se tiene que T (Ω) = D.

Ejemplo 4.3.4. En este ejemplo describiremos utilizando coordenadas esféricas centradas la región
de R3 dada por:

z2
D = {x = (x, y, z) ∈ R3 / x2 + y 2 + ≤ 1, x2 + y 2 + z 2 ≥ 1, x ≥ 0, y ≥ 0, z ≥ 0}.
4
z2
La ecuación x2 + y 2 + = 1 es la de un elipsoide de centro (0, 0, 0), a = b = 1 y c = 2. La
4
2 2 2
ecuación x + y + z = 1 es la de una esfera de centro (0, 0, 0) y radio 1. Por lo tanto, D está
formado por los puntos del espacio que están dentro del elipsoide, fuera de la esfera y con sus tres
π
componentes positivas. Esto implica que α, β ∈ [0, ].
2
En la figura siguiente se muestra la región D
78
Matemáticas: Cálculo I.

Región D
donde, como se puede observar de forma fácil, ρ varia entre las condiciones que se obtienen cuando
forzamos al punto
T ((ρ, α, β)) = (ρ cos(α) sen(β), ρ sen(α) sen(β), ρ cos(β))
a cumplir, en primer lugar, la ecuación de la esfera y en segundo lugar la ecuación del elipsoide.
Así pues, para la esfera tenemos que
1 = ρ2 cos2 (α) sen2 (β) + ρ2 sen2 (α) sen2 (β) + ρ2 cos2 (β) = ρ2
y esto implica ρ = 1. Por otro lado, para el elipsoide se obtiene que
ρ2 cos2 (β)
1 = ρ2 cos2 (α) sen2 (β) + ρ2 sen2 (α) sen2 (β) + ,
4
o, equivalentemente,
ρ2 cos2 (β)
1 = ρ2 sen2 (β) + ⇐⇒ 4 = 4ρ2 sen2 (β) + ρ2 cos2 (β) ⇐⇒ 4 = ρ2 (3 sen2 (β) + 1)
4
2
⇐⇒ ρ = ± p .
2
3sen (β) + 1
Por lo tanto, si tomamos
2 π
Ω = {(ρ, α, β) / 1 ≤ ρ ≤ p , α, β ∈ [0, ]}
3sen2 (β) + 1 2
se tiene que T (Ω) = D para T el cambio a coordenadas esféricas centradas.
Finalmente introducimos las coordenadas elipsoidales.
Definición 4.3.5. Dado el conjunto
[0, +∞) × [0, 2π) × [0, π] = {(ρ, α, β) / ρ ∈ [0, +∞), α ∈ [0, 2π), β ∈ [0, π]},
se define el cambio a coordenadas elipsoidales centradas como la función
T : [0, +∞) × [0, 2π) × [0, π] → R3
dada por
T ((ρ, α, β)) = (aρ cos(α) sen(β), bρ sen(α) sen(β), cρ cos(β)),
donde a, b y c son números reales positivos.
79
Matemáticas: Cálculo I.

Dado x0 = (x0 , y0 , z0 ) de R3 , se define el cambio a coordenadas elipsoidales descentradas como


la función
T : [0, +∞) × [0, 2π) × [0, π] → R3
dada por
T ((ρ, α, β)) = (x0 + aρ cos(α) sen(β), y0 + bρ sen(α) sen(β), z0 + cρ cos(β)),
donde, como en el caso centrado, a, b y c son números reales positivos.

4.4. Anexo I: Cónicas


Definición 4.4.1. Se llama cónica al conjunto de puntos x = (x, y) ∈ R2 que cumplen una ecuación
del tipo
a11 x2 + a12 xy + a22 y 2 + b1 x + b2 y + c = 0,
donde aij , bi , c son números reales y al menos uno de los coeficientes aij es no nulo.
Existen cuatro tipos de cónicas: elipses, hipérbolas, parábolas y pares de rectas. La clasifica-
ción de estas cónicas es sencilla si no tienen términos cruzados (a12 = 0) mediante la técnica de
compleción de cuadrados. Dicha técnica consiste en escribir un polinomio ax2 + bx en la forma
a(x − d)2 + e donde d y e son los únicos números reales tales que hacen iguales ambos polinomios.
En el caso de que la cónica tenga una ecuación de la forma
a11 x2 + a22 y 2 + c = 0,
diremos que está centrada en el origen. Si no es así, el lugar geométrico del plano dado por los pun-
tos de la cónica estará centrado en otro punto del espacio bidimensional que vendrá determinado
por la compleción de cuadrados.
Ejemplo 4.4.2. Dada la cónica 2x2 + y 2 + x + y + 1 = 0, tenemos que:

2 2 2 2 2 −4d = 1
2x + x = 2(x − d) + e ⇐⇒ 2x + x = 2x − 4dx + 2d + e ⇐⇒
2d2 + e = 0
⇐⇒ d = −1/4, e = −1/8.
Por lo tanto,
2x2 + x = 2(x + 1/4)2 − 1/8.
De la misma forma,

2 2 2 2 2 −2d = 1
y + y = (y − d) + e ⇐⇒ y + y = y − 2dy + d + e ⇐⇒
d2 + e = 0
⇐⇒ d = −1/2, e = −1/4.
Por lo tanto,
y 2 + y = (y + 1/2)2 − 1/4.
Entonces, se tiene que
2x + y 2 + x + y + 1 = 2(x + 1/4)2 − 1/8 + (y + 1/2)2 − 1/4 + 1 = 2(x + 1/4)2 + (y + 1/2)2 + 5/8
2

y, como consecuencia, la cónica también admite como ecuación


2(x + 1/4)2 + (y + 1/2)2 + 5/8 = 0
lo que implica que el lugar geométrico dado por sus puntos no está centrado en el origen de
coordenadas.
Ejemplo 4.4.3. Dada la cónica de ecuación (x − 1)2 + 3(y + 2)2 − 12 = 0, la podremos caracterizar
de forma equivalente con la ecuación
(x − 1)2 (y + 2)2 (x − 1)2 (y + 2)2
+ = 1 ⇐⇒ √ + = 1.
12 12/3 ( 12)2 22
80
Matemáticas: Cálculo I.

Para clasificar las cónicas sin términos cruzados se completan cuadrados y se compara el resul-
tado (ecuación reducida de la cónica) con las ecuaciones que aparecen en los siguientes apartados
(en ellos se mostrarán además ejemplos de las principales cónicas que hemos manejado en este
tema) donde recogemos los casos principales excluyendo los pares de rectas y los casos complejos.
Elipse: La ecuación reducida de esta cónica centrada en el origen está dada por
x2 y 2
+ 2 = 1.
a2 b
Por lo tanto, aparecen las dos variables elevadas al cuadrado, el término independiente
es 1 y todas la variables tienen coeficiente positivo.
En la siguiente figura se representa el lugar geométrico dado por los puntos de una elipse
centrada en el origen de coordenadas.

(0, b)
x = (x, y)

(a, 0)

Si cambiamos el origen por otro punto x0 = (x0 , y0 ) ∈ R2 la ecuación reducida de la


elipse queda de la forma siguiente:
(x − x0 )2 (y − y0 )2
+ = 1.
a2 b2
Una circunferencia es una elipse donde a = b. Entonces sus ecuaciones reducidas son
x2 + y 2 = a2 ,
para el caso centrado en el origen y radio a, y
(x − x0 )2 + (y − y0 )2 = a2 ,
para el caso centrado en otro punto x0 = (x0 , y0 ) ∈ R2 y radio a.
La siguiente figura representa el lugar geométrico dado por los puntos de una circunfe-
rencia centrada en el origen de coordenadas.

x = (x, y)

(a, 0)

81
Matemáticas: Cálculo I.

Hipérbola: La ecuación reducida de esta cónica centrada en el origen está dada por

x2 y 2 x2 y 2
− 2 =1 o − + 2 = 1.
a2 b a2 b

Por lo tanto, aparecen las dos variables elevadas al cuadrado, el término independiente
es 1 y las variables tienen coeficientes de signos opuestos.
En la figura siguiente

x
−4 −3 −2 −1 0 1 2 3 4
−1

−2

−3

se puede ver el lugar geométrico de los puntos del plano que determinan la hipérbola

x2 y2
− √ = 1.
22 ( 5)2

Si cambiamos el origen por otro punto x0 = (x0 , y0 ) ∈ R2 las ecuaciones reducidas de la


hipérbola quedan de la forma siguiente:

(x − x0 )2 (y − y0 )2 (x − x0 )2 (y − y0 )2
− =1 o − + = 1.
a2 b2 a2 b2

Parábola: La ecuación reducida de esta cónica centrada en el origen está dada por

ax2 − y = 0 o x − ay 2 = 0.

Por lo tanto, aparecen las dos variables con una sola elevada al cuadrado y el término
independiente es 0.
En la figura siguiente, se puede ver el lugar geométrico de los puntos del plano que
determinan las parábolas y = 2x2 e y = −2x2 .

82
Matemáticas: Cálculo I.

2
y = 2x2
1

x
−1 0 1

−1
y= −2x2
−2

Si cambiamos el origen por otro punto x0 = (x0 , y0 ) ∈ R2 la ecuación reducida de la


parábola queda de la forma siguiente:

a(x − x0 )2 − (y − y0 ) = 0 o a(y − y0 )2 − (x − x0 ) = 0.

4.5. Anexo II: Cuádricas


Definición 4.5.1. Se llama cuádrica al conjunto de puntos x = (x, y, z) ∈ R3 que cumplen una
ecuación del tipo

a11 x2 + a12 xy + a13 xz + a22 y 2 + a23 yz + a33 z 2 + b1 x + b2 y + b3 z + c = 0,

donde aij , bi , c son números reales y al menos uno de los coeficientes aij es no nulo.

Para clasificar las cuádricas sin términos cruzados (a12 = a13 = a23 = 0 ) se completan
cuadrados y se compara el resultado (ecuación reducida de la cuádrica) con las ecuaciones que
aparecen en los siguientes apartados (en ellos se mostrarán además ejemplos de las principales
cuádricas que hemos manejado en este tema) donde recogemos los casos principales excluyendo
los pares de planos, los casos en los que solo existe un punto o una recta o los casos complejos.

Elipsoide: La ecuación reducida de esta cuádrica centrada en el origen está dada por

x2 y 2 z 2
+ 2 + 2 = 1.
a2 b c

Por lo tanto, aparecen las tres variables elevadas al cuadrado, el término independiente
es 1 y todas la variables tienen coeficiente positivo.
En la siguiente figura se representa un elipsoide centrado en el origen donde a = 1/2,
b = 2 y c = 1.
83
Matemáticas: Cálculo I.

x2 y2
+ + z2 = 1
1/4 4
Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del
elipsoide queda de la forma siguiente:
(x − x0 )2 (y − y0 )2 (z − z0 )2
+ + = 1.
a2 b2 c2
Una esfera es un elipsoide donde a = b = c. Entonces sus ecuaciones reducidas son
x2 + y 2 + z 2 = a2 ,
para el caso centrado en el origen y radio a, y
(x − x0 )2 + (y − y0 )2 + (z − z0 )2 = a2 ,
para el caso centrado en otro punto x0 = (x0 , y0 , z0 ) ∈ R3 y radio a.
En la siguiente figura se representa una esfera centrada en el origen donde el radio es
a = 2.

x2 + y 2 + z 2 = 4
Hiperboloide de una hoja: La ecuación reducida de esta cuádrica centrada en el origen está
dada por
x2 y 2 z 2
+ 2 − 2 = 1.
a2 b c
84
Matemáticas: Cálculo I.

Por lo tanto, aparecen las tres variables elevadas al cuadrado, el término independiente
es 1 y una variable tiene coeficiente negativo.
En la siguiente
√ figura se representa un hiperboloide de una hoja centrado en el origen
donde a = 1, b = 2 y c = 3.

y2 z2
x2 + − =1
2 9
Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del
hiperboloide de una hoja queda de la forma siguiente:
(x − x0 )2 (y − y0 )2 (z − z0 )2
+ − = 1.
a2 b2 c2
Hiperboloide de dos hojas (hiperboloide elíptico): La ecuación reducida de esta cuádrica
centrada en el origen está dada por
x2 y 2 z 2
− − 2 + 2 = 1.
a2 b c
Por lo tanto, aparecen las tres variables elevadas al cuadrado, el término independiente
es 1 y dos variables tienen coeficiente negativo.
En la siguiente√figura se representa un hiperboloide de dos hojas centrado en el origen
donde a = 1, b = 2 y c = 3.

y2 z2
−x2 − + =1
2 9
85
Matemáticas: Cálculo I.

Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del


hiperboloide de dos hojas queda de la forma siguiente:

(x − x0 )2 (y − y0 )2 (z − z0 )2
− − + = 1.
a2 b2 c2

Cono: La ecuación reducida de esta cuádrica centrada en el origen está dada por

x2 y 2 z 2
+ 2 − 2 = 0.
a2 b c

Por lo tanto, aparecen las tres variables elevadas al cuadrado, el término independiente
es 0 y una variable tiene coeficiente negativo.
En la siguiente figura se representa un cono centrado en el origen donde a = 1, b = 1 y
c = 3.

z2
x2 + y 2 − =0
9
Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del
cono queda de la forma siguiente:

(x − x0 )2 (y − y0 )2 (z − z0 )2
+ − = 0.
a2 b2 c2

Paraboloide elíptico: La ecuación reducida de esta cuádrica centrada en el origen está dada
por

x2 y 2
+ 2 − cz = 0.
a2 b

Por lo tanto, aparecen las tres variables con dos de ellas elevadas al cuadrado, el término
independiente es 0 y las variables elevadas al cuadrado tienen el mismo signo.
En la siguiente figura se representa un paraboloide elíptico centrado en el origen donde
a = 1, b = 2 y c = 1.
86
Matemáticas: Cálculo I.

y2
x2 + −z =0
4
Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del
paraboloide elíptico queda de la forma siguiente:

(x − x0 )2 (y − y0 )2
+ − c(z − z0 ) = 0.
a2 b2
Paraboloide hiperbólico: La ecuación reducida de esta cuádrica centrada en el origen está
dada por
x2 y 2
− 2 − cz = 0.
a2 b
Por lo tanto, aparecen las tres variables con dos de ellas elevadas al cuadrado, el término
independiente es 0 y las variables elevadas al cuadrado tienen signo opuesto.
En la siguiente figura se representa un paraboloide hiperbólico centrado en el origen
donde a = 4, b = 3 y c = 1.

x2 y 2
− −z =0
16 9
87
Matemáticas: Cálculo I.

Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del


paraboloide hiperbólico queda de la forma siguiente:

(x − x0 )2 (y − y0 )2
− − c(z − z0 ) = 0.
a2 b2

Cilindro elíptico: La ecuación reducida de esta cuádrica centrada en el origen está dada por

x2 y 2
+ 2 = 1.
a2 b

Por lo tanto, aparecen dos variables elevadas al cuadrado, el término independiente es


1 y todas la variables tienen coeficiente positivo.
En la siguiente figura se representa un cilindro elíptico centrado en el origen donde a = 1
y b = 2.

y2
x2 + =1
4
Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del
cilindro elíptico queda de la forma siguiente:

(x − x0 )2 (y − y0 )2
+ = 1.
a2 b2

Cilindro hiperbólico: La ecuación reducida de esta cuádrica centrada en el origen está dada
por

x2 y 2
− 2 = 1.
a2 b
Por lo tanto, aparecen dos variables elevadas al cuadrado, el término independiente es
1 y las variables tienen coeficientes de signos opuestos.
En la siguiente figura se representa un cilindro hiperbólico centrado en el origen donde
a = 1 y b = 2.
88
Matemáticas: Cálculo I.

y2
x2 − =1
4
Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del
cilindro hiperbólico queda de la forma siguiente:
(x − x0 )2 (y − y0 )2
− = 1.
a2 b2
Cilindro parabólico: La ecuación reducida de esta cuádrica centrada en el origen está dada
por
y 2 − ax = 0.
Por lo tanto, aparecen dos variables, solo una elevada al cuadrado y el término inde-
pendiente es 0.
En la siguiente figura se representa un cilindro parabólico centrado en el origen donde
a = 2.

y 2 − 2x = 0
Si cambiamos el origen por otro punto x0 = (x0 , y0 , z0 ) ∈ R3 la ecuación reducida del
cilindro parabólico queda de la forma siguiente:
(y − y0 )2 − a(x − x0 ) = 0.

89
Matemáticas: Cálculo I.

90
Matemáticas: Cálculo I

Capítulo 5

Derivación de funciones de una variable y aplicaciones de la


derivada

5.1. Derivada de una función en un punto.


Definición 5.1.1. Sean I un intervalo abierto de R y f : I → R una función. Sea x0 ∈ I. Diremos
que f es derivable en x0 , si existe el siguiente límite
f (x0 + h) − f (x0 )
lı́m
h→0 h
y es finito.
En caso de que exista y sea finito, el límite anterior, se llama derivada de f en x0 y se denotará
como f 0 (x0 ). En el caso de que el límite no exista o no sea finito, se dirá que f no es derivable en
x0 , o que no existe la derivada de la función f en el punto x0 .
La existencia de f 0 (x0 ) es equivalente a la existencia y finitud del límite:

f (x) − f (x0 )
f 0 (x0 ) = lı́m .
x→x0 x − x0
Para pasar de un límite a otro es suficiente poner h = x − x0 . Está claro que hacer tender h
a cero es lo mismo que hacer tender x a x0 .

Ejemplo 5.1.2. Sea k un número real. La función constante f (x) = k es derivable en toda la recta
real y
f (x + h) − f (x) k−k
f 0 (x) = lı́m = lı́m = 0.
h→0 h h→0 h
La función f (x) = x es derivable para todo x ∈ R y

f (x + h) − f (x) (x + h) − x h
f 0 (x) = lı́m = lı́m = lı́m = 1.
h→0 h h→0 h h→0 h

La función f (x) = x2 es derivable en todo R y se cumple que

f (x + h) − f (x) (x + h)2 − x2 h2 + 2xh


f 0 (x) = lı́m = lı́m = lı́m = lı́m (h + 2x) = 2x.
h→0 h h→0 h h→0 h h→0

Nota 5.1.3. La interpretación geométrica de la derivada es la siguiente. Dados x0 ∈ R y h ∈ R,


el cociente
f (x0 + h) − f (x0 )
h
representa la pendiente de la recta secante y = Rh (x) que pasa por los puntos del plano P =
(x0 , f (x0 )) y P 0 = (x0 + h, f (x0 + h)). Estos puntos están sobre la gráfica de f y las rectas
y = Rh (x) se aproximan, cuando h tiende a cero, a la recta y = R(x) tangente a la gráfica de f
en el punto P = (x0 , f (x0 )).
91
Matemáticas: Cálculo I.

2
y = Rh (x)

(0, f (x0 + h)) P0

y = R(x)
(0, f (x0 )) P

x
0 (x0 , 0) (x0 + h, 0)
1

Por tanto, una función f es derivable en x0 si existe la recta tangente a la gráfica de f en el


punto P = (x0 , f (x0 )). La derivada de f en x0 representa la pendiente de dicha recta tangente,
cuya ecuación es

y = R(x) = f (x0 ) + f 0 (x0 )(x − x0 ).


Por ejemplo, la función f (x) = x2 tiene derivada en x0 = 1 siendo f 0 (1) = 2. Así pues, la
recta tangente a la gráfica de f en el punto (1, 1) tiene como ecuación
y = R(x) = 1 + 2(x − 1) = 2x − 1.
Por otro lado, la interpretación física de la derivada está relacionada con el concepto de
velocidad: supongamos que conocemos la posición r(t) en cada instante de tiempo t de un objeto.
Empleando la fórmula de la velocidad para el movimiento uniforme
e
v= ,
t
donde e representa el espacio y t el tiempo, es fácil calcular la velocidad media del objeto en un
intervalo de tiempo [t0 , t]:
r(t) − r(t0 )
v= .
t − t0
A medida que el intervalo de tiempo considerado es más reducido, el cociente anterior tiende
al valor de la velocidad instantánea del objeto. De esta forma, el valor de la velocidad en un
92
Matemáticas: Cálculo I.

instante de tiempo t0 viene dado por

r(t) − r(t0 )
v(t0 ) = lı́m ,
t→t0 t − t0

que resulta ser el valor de la derivada de la función de posición del objeto en el punto t0 .

Definición 5.1.4. Sea una función f : I → R, donde I es un intervalo abierto. Sea x0 ∈ I. Se


define la derivada por la izquierda de f en x0 , y se denotará por f 0 (x−
0 ), como el límite

f (x0 + h) − f (x0 )
f 0 (x−
0 ) = lı́m ,
h→0− h

siempre que exista y sea un número real.


De forma análoga, podemos definir la derivada por la derecha f 0 (x+
0 ) tomando el límite por
la derecha:
f (x0 + h) − f (x0 )
f 0 (x+
0 ) = lı́m ,
h→0+ h
Proposición 5.1.5. Sea la función f : I → R, donde I es un intervalo abierto y supongamos que
f es continua en I. La función f es derivable en x0 ∈ I si, y sólo si, existen f 0 (x− 0 +
0 ) y f (x0 ) y
además f 0 (x− 0 + 0 0 − 0 +
0 ) = f (x0 ). En este caso f (x0 ) = f (x0 ) = f (x0 ).

Ejemplos 5.1.6.
(1) Tomemos la función f : R → R dada por f (x) = |x|. La gráfica de dicha función

x
−2 −1 0 1 2

f (x) = |x|

permite ver de forma fácil que no es derivable en x0 = 0, ya que

f (0 + h) − f (0) |h| −h
f 0 (0− ) = lı́m = lı́m = lı́m = −1
h→0− h h→0− h h→0− h

f (0 + h) − f (0) |h| h
f 0 (0+ ) = lı́m = lı́m = lı́m = 1.
h→0+ h h→0 − h h→0 h+

(2) La función
−x2 si x ≤ 0

f (x) =
x2 si x > 0

tiene como gráfica a


93
Matemáticas: Cálculo I.

x
−2 0 2

−2

−4

y es derivable en x0 = 0 y f 0 (0) = 0, ya que es continua en R y


−h2
f 0 (0− ) = lı́m = lı́m (−h) = 0
h→0− h h→0−

h2
f 0 (0+ ) = lı́m = lı́m h = 0.
h→0− h h→0−

Nota 5.1.7. Si f es una función definida en un intervalo cerrado y acotado [a, b], se dirá que f es
derivable en [a, b] si lo es en el intervalo abierto (a, b) y existen la derivada por la derecha en a y
la derivada por la izquierda en b.
Usando la definición de derivada de una función en un punto es posible obtener las siguientes
reglas de derivación.
Proposición 5.1.8. Si f (x) = xα , α ∈ R, entonces f 0 (x) = αxα−1 .
Ejemplo 5.1.9. Usando proposición anterior se tiene que la derivada de la función f (x) = xπ es
f 0 (x) = πxπ−1 y la derivada de la función g(x) = x−2 esta dada por g 0 (x) = −2x−3 .
Proposición 5.1.10. Para todo número real positivo a distinto de 1, la derivada de la función
f (x) = loga (x), es
1 1
f 0 (x) = .
ln(a) x
Ejemplo 5.1.11. Gracias al resultado anterior se tiene que la derivada de la función logaritmo
neperiano f (x) = ln(x) es
1 1 1
f 0 (x) = = ,
ln(e) x x
ya que ln(e) = 1. Por otro lado, la derivada de g(x) = log10 (x) (función logaritmo decimal) es
1 1
g 0 (x) =
ln(10) x
Proposición 5.1.12. Para todo número real positivo a la derivada de la función f (x) = ax , está
dada por:
f 0 (x) = ln(a)ax
94
Matemáticas: Cálculo I.

Ejemplo 5.1.13. Por ejemplo, si se aplica la proposición anterior a la función exponencial, f (x) =
ex , se tiene que
f 0 (x) = ln(e)ex = ex .
La derivada de la función exponencial de base 3, g(x) = 3x está dada por
g 0 (x) = ln(3)3x
Proposición 5.1.14. Las derivadas de las funciones trigonométricas sen(x), cos(x), tg(x), cosec(x),
sec(x) y cotg(x) están dadas por:
f (x) = sen(x) ⇒ f 0 (x) = cos(x) ,
g(x) = cos(x) ⇒ g 0 (x) = − sen(x) ,
1 cos2 (x) + sen2 (x)
h(x) = tg(x) ⇒ h0 (x) = = = 1 + tg2 (x) ,
cos2 (x) cos2 (x)
tg(x) sen(x)
s(x) = sec(x) ⇒ s0 (x) = = ,
cos(x) cos2 (x)
−cotg(x) cos(x)
t(x) = cosec(x) ⇒ t0 (x) = =− ,
sen(x) sen2 (x)
−1 cos2 (x) + sen2 (x)
r(x) = cotg(x) ⇒ r0 (x) = = − = −(1 + cotg2 (x)).
sen2 (x) sen2 (x)
5.2. Función derivada, derivadas sucesivas y propiedades
Definición 5.2.1. Sea I un intervalo abierto. Sea f : I → R una función definida en I. Diremos
que f es derivable en el intervalo I si es derivable en todos los puntos de I.
Si f es derivable en I, se define la función derivada de f como:
f 0 : I −→ R
x 7→ f 0 (x)
Procediendo de una forma similar, si la función f 0 es derivable en I, podemos definir la función
derivada segunda (o derivada de orden 2) de f como:
f 00 : I −→ R
x 7→ f 00 (x) = (f 0 )0 (x)
En este caso diremos que f es dos veces derivable en I y f 00 = f (2) se denomina derivada
segunda de f .
En general, para todo n ≥ 2, si existe la derivada de orden n − 1 de f y f (n−1) es derivable
en el intervalo I, se define la función derivada n-ésima (o derivada de orden n de f como:
f (n) : I −→ R
x 7→ f (n) (x) = (f (n−1) )0 (x)
En este caso, se dice que f es n veces derivable en I. Finalmente, por convenio, se define
f (0) (x) = f (x).
Definición 5.2.2. Sea I un intervalo abierto. Sea f : I → R una función definida en I. Se dirá
que la función f es de clase n en I, y se denotará como
f ∈ C n (I),
si f es n veces derivable en I y su derivada n-ésima f (n) es continua.
Cuando f tiene derivadas continuas de todos los órdenes diremos que f es de clase infinito y
esto se denotará como f ∈ C ∞ (I).
95
Matemáticas: Cálculo I.

Ejemplos 5.2.3.
(1) La función f (x) = ex es de clase infinito en R ya que existen todas las derivadas sucesivas
de f y todas son continuas. Es más, f (n) (x) = ex , ∀ n ∈ N.
(2) La función f : R → R dada por

−x2 si x ≤ 0

f (x) =
x2 si x > 0
es derivable en R. Su derivada

−2x si x ≤ 0
f 0 (x) = ,
2x si x > 0
que tiene como gráfica
y

x
−2 0 2

es continua en R pero no es derivable en x = 0. Por lo tanto f ∈ C 1 (R) pero f 6∈ C 2 (R).

Teorema 5.2.4. Sea f : I → R una función, definida en un intervalo abierto I, y consideremos


un punto x0 ∈ I. Si f es derivable en x0 , entonces f es continua en x0 .

Nota 5.2.5. El recíproco del anterior teorema es falso. No toda función continua es derivable. Por
ejemplo, la función valor absoluto f (x) = |x| es continua en R pero no es derivable en x = 0 como
pudimos comprobar en (1) de Ejemplos 5.1.6.

Teorema 5.2.6. (Derivadas de funciones definidas a trozos) Sea f una función continua en un
punto x0 y derivable en (x0 − r, x0 ) y (x0 , x0 + r) para un cierto r > 0. Si existen y son reales
lı́m f 0 (x) y lı́m f 0 (x), se cumple que f es una función derivable en x0 si, y sólo si,
x→x−
0 x→x+
0

lı́m f 0 (x) = lı́m f 0 (x).


x→x−
0 x→x+
0

Además, en las condiciones anteriores, f 0 (x0 ) = lı́m f 0 (x) y, como consecuencia, f 0 es con-
x→x0
tinua en x0 .

Ejemplo 5.2.7. El resultado anterior simplifica el estudio de la derivabilidad cuando tenemos una
función definida a trozos. Por ejemplo, volvamos al segundo caso de los Ejemplos 5.2.3 y tomemos
la función f : R → R dada por
−x2 si x ≤ 0

f (x) =
x2 si x > 0
Como vimos antes f es derivable para todo x 6= 0 y

0 −2x si x < 0
f (x) =
2x si x > 0
96
Matemáticas: Cálculo I.

Como lı́m f 0 (x) = lı́m f 0 (x) = 0, podemos afirmar que f es derivable en x = 0 y además
x→0− x→0+
f 0 (0) = 0. Por tanto f 0 está definida y es continua en R. Por otro lado,

00 −2 si x < 0
f (x) =
2 si x > 0
y esto implica que lı́m f 00 (x) = −2 6= lı́m f 00 (x) = 2. Por lo tanto, no existe f 00 (0).
x→0− x→0+

Proposición 5.2.8. Sean f : I → R, g : I → R dos funciones definidas en un intervalo abierto I


y derivables en un punto x0 ∈ I. Entonces:
(i) f + g es derivable en x0 y (f + g)0 (x0 ) = f 0 (x0 ) + g 0 (x0 ).
(ii) αf es derivable en x0 y (αf )0 (x0 ) = αf 0 (x0 ), ∀ α ∈ R.
(iii) f · g es derivable en x0 y (f · g)0 (x0 ) = f 0 (x0 )g(x0 ) + f (x0 )g 0 (x0 ).
f
(iv) Si g(x0 ) 6= 0, es derivable en x0 y
g
f f 0 (x0 )g(x0 ) − f (x0 )g 0 (x0 )
( )0 (x0 ) = .
g (g(x0 ))2
Ejemplo 5.2.9. Usando las propiedades anteriores, en estos ejemplos veremos como se calculan
derivadas de funciones concretas:
Sea
f : R −→ R
x 7→ f (x) = x2 + 3x + 1
En este caso, tenemos que f (x) es una suma de tres sumandos y sabemos derivar cada uno
de ellos. En consecuencia
f 0 (x) = 2x + 3 + 0 = 2x + 3 .
La función
g : R −→ R
x 7→ g(x) = 2x sen(x)
es el producto de las funciones 2x y sen(x). Aplicando la regla de derivación de un producto de
funciones,
g 0 (x) = 2 sen(x) + 2x cos(x) .
La función h definida por
h : R −→ R
x
x 7→ h(x) = sen2 (x) + cos3 (x) +
+1 x2
se puede descomponer en tres sumandos; los dos primeros son el resultado de potencias de las
funciones sen(x) e cos(x), mientras que el tercero es un cociente. Aplicando las reglas respectivas
a cada uno de los sumandos resulta
1 (x2 + 1) − x 2x
h0 (x) = 2 sen(x) cos(x) + 3 cos2 (x)(− sen(x)) + .
(x2 + 1)2
Las funciones seno y coseno están definidas en todo R. Además, el tercer sumando también
tiene por dominio todo R ya que el denominador nunca puede ser cero. Entonces, el dominio de h
es R y razonando de una forma similar es fácil verificar que también es el dominio de h0 .
Finalmente, la función
l(x) = ln(x) − tg(x)
97
Matemáticas: Cálculo I.

es una suma de dos sumandos, donde el primeiro sólo está definido para números reales positivos
y el segundo para los valores de x tales que cos(x) 6= 0. Entonces, el dominio de l está dado por
π
Dom(l) = {x ∈ R | x > 0 / x 6= + nπ, n = 0, 1, 2, . . . } .
2
La derivada de la función tiene la expresión
1
l0 (x) = − (1 + tg2 (x)) .
x

5.3. Regla de la Cadena


El siguiente resultado se denomina con el nombre de Regla de la Cadena y nos dará una
fórmula para calcular la derivada de una composición de dos funciones.
Teorema 5.3.1. (Regla de la Cadena) Sean f : I → R y g : J → R dos funciones, definidas en
sendos intervalos abiertos I y J, tales que f (I) ⊂ J. Si f es derivable en un punto x0 de I y g es
derivable en f (x0 ) entonces la función compuesta g ◦ f es derivable en x0 y además
(g ◦ f )0 (x0 ) = g 0 (f (x0 )) · f 0 (x0 ).
Ejemplo 5.3.2. En este ejemplo, se aplica la Regla de la Cadena para calcular la derivada de la
función h definida por
h : R −→ R
x 7→ h(x) = sen(x2 )
La función que queremos derivar es composición de
f : R −→ R
x 7→ f (x) = x2
y
g : R −→ R
x 7→ g(z) = sen(z),
ya que
(g ◦ f )(x) = g(f (x)) = g(x2 ) = sen(x2 ) = h(x).
Por lo tanto, la derivada de h está dada por
h0 (x) = g 0 (f (x)) · f 0 (x) = cos(x2 ) 2x = 2x cos(x2 ),
ya que f y g son funciones derivables para todo x ∈ R.

5.4. Derivación de funciones inversas


Otro resultado interesante que nos permite el cálculo de derivadas de funciones es el siguiente
teorema:
Teorema 5.4.1. Sean f : I → R una función continua e inyectiva definida sobre un intervalo I.
Sea J = f (I) y sea f −1 : J → R su inversa. Si f es derivable en un punto x0 de I y además
f 0 (x0 ) 6= 0, entonces f −1 es derivable en y0 = f (x0 ) y su derivada es
1
(f −1 )0 (y0 ) = .
f 0 (x 0)
98
Matemáticas: Cálculo I.

En general, es posible obtener mediante aplicación del resultado anterior las siguientes expre-
siones para las inversas de las funciones trigonométricas
1
f (x) = arcsen(x) ⇒ f 0 (x) = √ ,
1 − x2
1
g(x) = arccos(x) ⇒ g 0 (x) = − √ ,
1 − x2
1
h(x) = arctg(x) ⇒ h0 (x) = .
1 + x2
Ejemplo

5.4.2. Para calcular el valor de la derivada de la función f (x) = arcsen(x) en el punto
3
2 , mediante la aplicación del resultado anterior, simplemente tenemos en cuenta que la función
f (x) = arcsen(x)

es la función inversa de función g(x) = sen(x), para la cual sabemos que
g(π/3) = 2 y que g 0 (x) = cos(x). Por tanto, g 0 (π/3) = cos(π/3) = 1/2. En consecuencia
3

√ !
3 1
f0 = f 0 (sen(π/3)) = 0 = 2.
2 g (π/3)

Obviamente, en este caso es bastante más sencillo calcular el valor de la derivada empleando
la regla de derivación de la función arcsen(x):
√ !
1 3 1
f 0 (x) = √ ⇒ f0 =q = 2.
1−x 2 2 1 − 43

Ejemplo 5.4.3. Dado D = {π + 2kπ / k ∈ Z}, tomemos A = R − D. Dada la función


f : A −→ R
sen(x)
x 7→ f (x) = arctg( ),
1 + cos(x)
aplicando la Regla de la Cadena y las propiedades estudiadas en esta sección, obtenemos que su
derivada está dada por
1 cos(x)(1 + cos(x)) + sen2 (x)
f 0 (x) = .
sen(x) 2 (1 + cos(x))2
1+( )
1 + cos(x)

1 1 + cos(x) 1 1
= 2 . 2
= .
sen (x) (1 + cos(x)) 2 + 2 cos(x) 1 + cos(x)
1+
(1 + cos(x))2 (1 + cos(x))2

(1 + cos(x))2 1 1
= . = .
2(1 + cos(x)) 1 + cos(x) 2

5.5. Derivación implícita


En ciertos casos nos podemos encontrar con que la variable y no está expresada de forma
explícita en función de la variable x, sino de forma implícita mediante una expresión dada por una
función de dos variables. Por ejemplo, esto ocurre en el caso de la curva
C = {x = (x, y) ∈ R2 / ex+y + y 2 x = 1}
99
Matemáticas: Cálculo I.

ex+y + y 2 x = 1
donde
C = {x = (x, y) ∈ R2 / f (x) = 0}
siendo f (x) = ex+y + y 2 x − 1. De esta forma podemos ver C como la intersección de la superficie
dada por la gráfica del campo escalar f (x) = ex+y + y 2 x − 1 y el plano z = 0:

ex+y + y 2 x = 1
Si escribimos y = y(x) y aplicamos la Regla de la Cadena junto con las propiedades de las
derivadas, se obtiene que
ex+y(x) + y(x)2 x = 1 =⇒ (1 + y 0 (x))ex+y(x) + 2xy(x)y 0 (x) + y(x)2 = 0.
100
Matemáticas: Cálculo I.

Como la curva C pasa por el punto (0, 0), gracias a la expresión de la línea anterior, se tiene
que
1 + y 0 (0) = 0 ⇐⇒ y 0 (0) = −1
y, por lo tanto, la pendiente de la recta tangente a la curva en el punto (0, 0) es −1. De esta forma
podemos garantizar que la ecuación de la recta tangente en (0, 0) es
y = −x.

5.6. Máximos y mínimos


Esta sección está dedicada al estudio de los resultados que podemos utilizar para localizar los
extremos de una función.
Definición 5.6.1. Sea D un subconjunto de R y sea f : D → R una función. Se dirá que f tiene un
máximo relativo en x0 ∈ D si existe r > 0 tal que, para todo x ∈ D cumpliendo que |x − x0 | < r,
f (x) ≤ f (x0 ).
Diremos que f tiene un mínimo relativo en x0 ∈ D si existe r > 0 tal que, para todo x ∈ D
tal que |x − x0 | < r, f (x) ≥ f (x0 ).
Nota 5.6.2. (1) En cualquiera de los dos casos de la definición anterior diremos que f alcanza
un extremo relativo en el punto x0 .
(2) Si las desigualdades que relacionan f (x) y f (x0 ) son estrictas, diremos que el extremo es
estricto (máximo estricto si f (x) < f (x0 ) o mínimo estricto si f (x) > f (x0 )).
(3) En el caso de que las desigualdades f (x) ≤ f (x0 ) o f (x) ≥ f (x0 ) se verifiquen para cualquier
x ∈ D, se dirá que el extremo es absoluto.
(4) Gracias al Teorema 2.3.2 sabemos que, si f : [a, b] → R es una función continua, entonces
f siempre alcanza el máximo y el mínimo absolutos, i. e., existen α, β ∈ [a, b] tales que
f (α) ≤ f (x) ≤ f (β), ∀ x ∈ [a, b].
El siguiente resultado relaciona la existencia de extremos con la anulación de la derivada. Su
demostración es muy simple y constituye la base para obtener la mayor parte de los resultados
importantes que quedan por ver en este tema.
Teorema 5.6.3. (Teorema del Extremo Relativo o de Fermat) Sea I un intervalo abierto de R y
sea f : I → R una función derivable en I. Si f presenta un extremo relativo en un punto x0 ∈ I
entonces f 0 (x0 ) = 0.
Demostración. Si se cumple que f 0 (x0 ) > 0, entonces
f (x) − f (x0 )
lı́m = f 0 (x0 ) > 0.
x→x0 x − x0
Por lo tanto, las diferencias f (x) − f (x0 ) y x − x0 tienen el mismo signo en un intervalo
(x0 − r, x0 + r) para algún r > 0. Así pues, dado x ∈ (x0 − r, x0 + r), se tiene que f (x) > f (x0 )
si x > x0 y f (x) < f (x0 ) si x < x0 . Esto implica que la función f no presenta en x0 un extremo
relativo.
Por otro lado, si f 0 (x0 ) < 0, utilizando un razonamiento análogo llegamos a la misma conclu-
sión: la función f no presenta en x0 un extremo relativo. Así pues, si f tiene un extremo relativo
en x0 , necesariamente f 0 (x0 ) = 0. t
u

Nota 5.6.4. (1) El teorema precedente sólo da una condición necesaria para la existencia de
extremos. La condición f 0 (x0 ) = 0 no es suficiente para garantizar que f presente un extremo
en el punto x0 . Por ejemplo, la función f : R → R dada por f (x) = x3 no tiene ningún
extremo relativo y cumple que f 0 (0) = 0.
101
Matemáticas: Cálculo I.

Por otro lado, es interesante resaltar que una función continua puede no ser derivable
en un punto y presentar un extremo en dicho punto. Por ejemplo, la función f : R → R,
dada por f (x) = |x|, tiene un extremo absoluto en x0 = 0 y como sabemos no es derivable
en dicho punto.
y
8

2
y

4
x
−2 0 2

−2

2
−4

−6

x
−8 −2 0 2
f (x) = x3 f (x) = |x|
(2) El Teorema del Extremo Relativo sólo puede ser aplicado en intervalos abiertos. Si f está
definida en un intervalo cerrado y acotado [a, b] y es diferenciable en el intervalo (a, b),
el teorema se puede usar en dicho intervalo abierto. En los extremos del intervalo a, b se
debe estudiar de forma separada la posible existencia de extremos. Por ejemplo, la función
f (x) = x3 definida en el intervalo [−2, 2] tiene dos extremos: un mínimo absoluto en x = −2
y un máximo absoluto en x = 2, siendo
f 0 (−2+ ) = f 0 (2− ) = 12 6= 0.
En este caso, los extremos están localizados en los extremos del intervalo y no existe
ninguno en (−2, 2).
La primera consecuencia importante del Teorema del Extremo Relativo es el conocido como
Teorema de Rolle.
Teorema 5.6.5. (Teorema de Rolle) Sea f : [a, b] → R una función derivable en (a, b) y continua
en [a, b]. Si f (a) = f (b) entonces existe un punto x0 ∈ (a, b) tal que f 0 (x0 ) = 0.
Demostración. Si f es constante en [a, b] entonces f 0 (x) = 0 para todo x ∈ (a, b). Por otro lado,
si f no es constante, se cumple que el mínimo y el máximo absolutos de f en el intervalo [a, b] son
necesariamente distintos. Como por hipótesis, f (a) = f (b), uno de ellos se alcanzará en un punto
x0 ∈ (a, b). Aplicando ahora el Teorema del Extremo Relativo, podemos garantizar que f 0 (x0 ) = 0.
t
u

Ejemplo 5.6.6. Veamos que la derivada de la función f : R → R


f (x) = x3 + 4x2 − 7x − 10
102
Matemáticas: Cálculo I.

tiene una raíz en el intervalo [−1, 2]. Es evidente que f es continua en [−1, 2] y derivable en (−1, 2)
por ser un polinomio. Además, f (−1) = f (2) = 0. Así pues, el Teorema de Rolle garantiza que
existe al menos un punto x0 ∈ (−1, 2) tal que f 0 (x0 ) = 0.
Nota 5.6.7. (1) Todas las hipótesis del Teorema de Rolle son absolutamente necesarias. Si
alguna de ellas no se da, el teorema no se verifica en general. Así por ejemplo:
• La función f : [−1, 1] → R, f (x) = |x|, no es derivable en x0 = 0 y esto implica
que la función no es derivable en (−1, 1). Como es fácil comprobar todas las otras
condiciones del teorema se cumplen, sin embargo no se verifica el Teorema de Rolle ya
que la derivada es no nula para todo x 6= 0.
• La función f : [0, 1] → R, f (x) = x, si 0 < x ≤ 1, y f (0) = 1 no es continua en
x0 = 0. A pesar de que es derivable en (0, 1) no se cumple que f 0 (x0 ) = 0 para algún
x0 ∈ (0, 1).
(2) El punto x0 tal que f 0 (x0 ) = 0 no es único en general (el Teorem de Rolle lo que afirma
es que existe al menos un punto perteneciente a (a, b) donde se anula la primera derivada).
Por ejemplo, f : [0, 2π] → R, f (x) = sen(x) cumple las condiciones y su derivada se anula
en π/2 y 3π/2. También puede ocurrir que las derivadas laterales en a y b, si existen, se
anulen.
(3) Nótese que el Teorema de Rolle garantiza que, si f : [a, b] → R es una función derivable
en (a, b), continua en [a, b] y se cumple que f (a) = f (b), entonces existe un punto x0 en el
intervalo abierto (a, b) donde la recta tangente a la gráfica de f en el punto (x0 , f (x0 )) es
paralela al eje OX. Por ejemplo, f : [π/2, 3π/2] → R, f (x) = cos(x) cumple las condiciones
y su derivada f 0 (x) = − sen(x) se anula en π. La recta tangente en el punto (π, −1) es
y = −1.

(π, 0)
x
0 1 2 3 4

−1 y = −1
(π, −1)

f (x) = cos(x)
Como consecuencia del Teorema de Rolle obtenemos el siguiente corolario.
Corolario 5.6.8. Sea I un intervalo y f : I → R una función derivable en I. Se cumple que entre
dos ceros consecutivos de f existe necesariamente al menos un cero de f 0 . Así pues, si f 0 tiene n
ceros en I, la función f tiene a lo sumo n + 1 ceros en I.
Demostración. Sean x1 < x2 dos ceros consecutivos de f . Entonces la función f restringida al
intervalo [x1 , x2 ] cumple que es continua en dicho intervalo y además f (x1 ) = f (x2 ) = 0. Por lo
tanto, podemos aplicar el Teorema de Rolle y garantizar que existe al menos un punto x0 perte-
neciente al intervalo abierto (x1 , x2 ) tal que f 0 (x0 ) = 0. t
u

103
Matemáticas: Cálculo I.

x
Ejemplo 5.6.9. Como podemos ver en su gráfica, la función f (x) = ex − − 3 tiene exactamente
2
una raíz positiva
y

x
−2 −1 0 1 2

−1

−2

f (x) = ex − x/2 − 3
Veamos que la anterior afirmación es cierta utilizando el Teorema de Rolle y su Corolario
5.6.8. La derivada de la función es f 0 (x) = ex − 1/2 y
f 0 (x) = ex − 1/2 = 0 ⇐⇒ ex = 1/2 ⇐⇒ x = ln(1/2).
Ya que ln(1/2) < 0, la derivada de f no tiene raíces en (0, ∞) y, usando el corolario del Teorema
de Rolle, podemos garantizar que f tiene a lo sumo una raíz positiva. Además, f (0) = −2 < 0,
f (2) = e2 − 4 > 0 (ya que e > 2) y la función es continua en [0, 2]. Así pues, podemos afirmar
gracias al Teorema de Bolzano, que f tiene un cero en el intervalo (0, 2).

5.7. El teorema del valor medio


Teorema 5.7.1. (Teorema del Valor Medio o de los Incrementos Finitos) Sea f : [a, b] → R
una función derivable en (a, b) y continua en [a, b]. Entonces existe al menos un punto x0 en el
intervalo abierto (a, b) tal que
f (b) − f (a) = f 0 (x0 )(b − a).
Demostración. Este resultado se puede plantear como una consecuencia del Teorema de Rolle
ya que su prueba consiste en aplicar el citado teorema a la diferencia entre f y la recta que pasa
por por los puntos (a, f (a)) y (b, f (b)). Sea g : [a, b] → R la función definida por dicha diferencia,
i. e.,
 
f (b) − f (a)
g(x) = f (x) − f (a) + (x − a) .
b−a
Ya que g es una función derivable y que g(a) = g(b) = 0, existe al menos un x0 ∈ (a, b) tal
que g 0 (x0 ) = 0. Así pues,
f (b) − f (a)
g 0 (x0 ) = f 0 (x0 ) − = 0 =⇒ f (b) − f (a) = f 0 (x0 )(b − a).
b−a
t
u
En los resultados siguientes se presentan algunas consecuencias importantes del Teorema del
Valor Medio.
104
Matemáticas: Cálculo I.

Corolario 5.7.2. Sea f : (a, b) → R una función derivable. Si f 0 (x) = 0 para todo x ∈ (a, b)
entonces f es constante en (a, b). Como consecuencia, si f y g son funciones derivables en (a, b)
tales que f 0 (x) = g 0 (x) para todo x ∈ (a, b), se tiene que f (x) = g(x) + K, para todo x ∈ (a, b),
donde K es una constante.
Demostración. Sean x1 y x2 dos números cualesquiera del intervalo (a, b) tales que x1 < x2 .
Como f es derivable en (a, b) también lo es en (x1 , x2 ) y además también es continua en [x1 , x2 ].
Gracias a lo anterior se dan las condiciones para poder aplicar el Teorema del Valor Medio y
garantizar que existe x0 ∈ [x1 , x2 ] tal que
f (x2 ) − f (x1 ) = f 0 (x0 )(x2 − x1 ).
Como f 0 (x0 ) = 0 se obtiene que f (x2 ) − f (x1 ) = 0 o, equivalentemente, f (x2 ) = f (x1 ). Así
pues, la función es constante.
La parte final del resultado es consecuencia de que (f − g)0 (x) = 0.
Corolario 5.7.3. (Intervalos de crecimiento y decrecimiento) Sea f una función derivable en un
intervalo abierto (a, b).
(i) Si f 0 (x) > 0 para todo x ∈ (a, b), se tiene que f es estrictamente creciente en (a, b).
(ii) Si f 0 (x) < 0 para todo x ∈ (a, b), se tiene que f es estrictamente decreciente en (a, b).
Demostración. Se probará el apartado (i). La prueba para el apartado (ii) es similar y se deja
como ejercicio. En efecto, sean x1 , x2 ∈ (a, b) tales que x1 < x2 . Como podemos aplicar el Teorema
del Valor Medio en el intervalo [x1 , x2 ] para la función f , existe x0 ∈ (x1 , x2 ) tal que f (x2 )−f (x1 ) =
f 0 (x0 )(x2 − x1 ). Entonces:
f 0 (x0 ) > 0 =⇒ f (x2 ) − f (x1 ) > 0 =⇒ f (x1 ) < f (x2 )
y la función resulta ser estrictamente creciente. t
u
Corolario 5.7.4. (Determinación de máximos y mínimos relativos) Sea I un intervalo abierto y
sea f : I → R una función dos veces derivable en I. Tomemos un punto x0 ∈ I tal que f 0 (x0 ) = 0.
Entonces:
(i) Si f 00 (x0 ) > 0, f presenta un mínimo relativo estricto en x0 .
(ii) Si f 00 (x0 ) < 0, f presenta un máximo relativo estricto en x0 .
Demostración. Como en el corolario anterior, probaremos el primer apartado dejando el se-
gundo como ejercicio. Ya que f 00 (x0 ) > 0, la función f 00 toma valores mayores que cero en
(x0 − r, x0 + r) ⊂ I para algún r > 0. Gracias al Corolario 5.7.3 sabemos que f 0 es estricta-
mente creciente en el intervalo (x0 − r, x0 + r). Por lo tanto, f 0 (x) > f 0 (x0 ) = 0 si x > x0 y
f 0 (x) < f 0 (x0 ) = 0 si x < x0 . Así pues, f es estrictamente decreciente en (x0 − r, x0 ) y estricta-
mente creciente en (x0 , x0 + r), i. e., f presenta en x0 un mínimo relativo estricto. t
u

Ejemplo 5.7.5. Se pretende determinar las dimensiones del cilindro de mayor volumen entre todos
aquellos que tienen la misma superficie k.
Si R denota el radio de la base del cilindro y h la altura del mismo, la superficie total del
cilindro viene dada por
S = 2πRh + 2πR2 = 2πR(R + h)
que tiene que ser constante e igual a k, de forma que, por ejemplo,
k − 2πR2
h= .
2πR
El volumen del cilindro se puede calcular mediante
k − 2πR2 Rk − 2πR3
V = πR2 h = πR2 = .
2πR 2
105
Matemáticas: Cálculo I.

Debemos calcular los extremos relativos de la función volumen, que ahora es una función
dependiente del radio R (ya que k es una constante dada). Derivando V con respecto a R,
k − 6πR2
V 0 (R) =
2
e, igualando a cero, resulta que el posible extremo de la función V se obtiene cuando
r
k
R= .

Puesto que la derivada segunda de la función V con respecto a R es
V 00 (R) = −6πR < 0 ,
p
se tiene que en el punto R = k/(6π) la función V tiene un máximo relativo. Para este punto,
las dimensiones del cilindro son r
k
R= , h = 2R .

Definición 5.7.6. Sea I un intervalo abierto y f : I → R una función derivable en I (ba-
jo estas condiciones siempre podremos definir la recta tangente a la gráfica de f en un punto
(x0 , f (x0 )), x0 ∈ I).
Diremos que la función f es convexa en I si la gráfica de f queda por encima de cualquier
recta tangente a dicha gráfica en los puntos del intervalo I. Por otro lado, si la gráfica de f queda
por debajo de cualquier recta tangente a dicha gráfica en los puntos del intervalo I, se dirá que
f es cóncava en I. Si f es convexa a un lado del punto x0 y cóncava al otro lado, diremos que f
presenta en x0 un punto de inflexión.

En las siguiente figuras podemos ver un caso de función convexa y = x2 y otro de función
cóncava y = −x2 .

4
y

x
−2 −1 0 1 2
3

(−1, −1) −1
2

−2
1 (1, 1)

−3
x
−2 −1 0 1 2

−4

f (x) = x2 g(x) = −x2


Corolario 5.7.7. (Concavidad y convexidad) Sea I un intervalo abierto y sea f : I → R una
función dos veces derivable en I.
106
Matemáticas: Cálculo I.

(i) Si f 00 (x) > 0 para todo x ∈ I, f es convexa en I.


(ii) Si f 00 (x) < 0 para todo x ∈ I, f es cóncava en I.
(iii) Si f presenta en x0 un punto de inflexión, se cumple que f 00 (x0 ) = 0.
Ejemplo 5.7.8. Dada la función f (x) = ex − x/2 − 3 se tiene que
f 0 (x) = ex − 1/2, f 00 (x) = ex > 0.
Por lo tanto, f es convexa en todo su dominio de definición (ver gráfica en Ejemplo 5.6.9).
Ejemplo 5.7.9. Dada la función f (x) = x4 − 4x3 se tiene que
f 0 (x) = 4x3 − 12x2 , f 00 (x) = 12x2 − 24x.
De esto se deduce que
f 0 (x) = 0 ⇐⇒ 4x3 − 12x2 = 0 ⇐⇒ 4x2 (x − 3) = 0 ⇐⇒ x = 0 o x = 3.
Como f 00 (0) = 0 y f 00 (3) = 36 > 0 podemos afirmar que f presenta en x0 = 3 un mínimo
relativo. Además, dado que f 0 (x) > 0 si x > 3 y f 0 (x) < 0 si x < 3, podemos afirmar que f es
creciente en (3, +∞) y decreciente en (−∞, 3).
Por otro lado,
f 00 (x) = 0 ⇐⇒ 12x2 − 24x = 0 ⇐⇒ 12x(x − 2) = 0 ⇐⇒ x = 0 o x = 2.
Como f 00 (0) = 0 y f 00 (2) = 0 podemos afirmar que ambos puntos son candidatos a puntos de
inflexión. Dado que
f 00 (x) > 0 ⇐⇒ x ∈ (−∞, 0) ∪ (2, +∞)
y
f 00 (x) < 0 ⇐⇒ x ∈ (0, 2),
tenemos que la función es convexa en (−∞, 0) ∪ (2, +∞) y cóncava en (0, 2). Esto confirma que
los puntos 0 y 2 son puntos de inflexión.

x
0 4

−4

−8

−12

−16 −→ (2, −16)

−20

−24

(3, −27)

f (x) = x4 − 4x3
107
Matemáticas: Cálculo I.

5.8. La Regla de L’Hôpital.


En esta sección se introduce el que de hecho es el método más efectivo para el cálculo de
límites en el caso de indeterminaciones.
Teorema 5.8.1. (Regla de L’Hôpital) Sea x0 ∈ R. Sean f y g dos funciones derivables en (x0 −
r, x0 ) y (x0 , x0 + r) para algún r > 0. Asumamos que g 0 no se anula en ambos intervalos y que se
cumple:
(1) lı́m f (x) = lı́m g(x) = 0 o lı́m f (x) = lı́m g(x) = ∞,
x→x0 x→x0 x→x0 x→x0
f 0 (x)
(2) Existe lı́m 0 = l (l ∈ R ∪ {±∞}).
x→x0 g (x)
f (x)
Entonces, existe lı́m y además
x→x0 g(x)
f (x) f 0 (x)
lı́m = lı́m 0 .
x→x0 g(x) x→x0 g (x)

El resultado previo sigue siendo cierto si x0 = ±∞ y f y g son derivables en intervalos abiertos


no acotados. También se puede aplicar el resultado para el cálculo de límites laterales cuando el
f
cociente sólo esté definido a la izquierda o a la derecha del punto x0 .
g

Ejemplo 5.8.2. Como aplicación directa de la Regla de L’Hôpital podemos calcular el límite
sen(x)
lı́m .
x→0 x
0
donde existe una indeterminación del tipo . En este caso tenemos que
0
sen(x) cos(x)
lı́m = lı́m = cos(0) = 1.
x→0 x x→0 1
Por lo tanto, obtenemos lo mismo que en el Ejemplo 2.1.8.
Ejemplo 5.8.3. En el siguiente ejemplo utilizaremos la Regla de de L’Hôpital para estudiar la
diferenciabilidad de la función
(1 − x)e−3x

si x ≤ 1
f (x) = 2 2
(x − 1) ln(x − 1) si x > 1.
En primer lugar está claro que la función es continua en (−∞, 1) ∪ (1, ∞) ya que se obtiene
como resultado de operaciones algebraicas y composiciones de funciones continuas. Por otro lado,
ln(x2 − 1)
lı́m f (x) = lı́m
x→1+ x→1+ 1
(x − 1)2

lo que da lugar a una indeterminación del tipo .

Entonces aplicando la Regla de de L’Hôpital tenemos que
2x
2
ln(x − 1) 2 −x(x − 1)2
lı́m f (x) = lı́m = lı́m x − 1 = lı́m =0
x→1+ x→1+ 1 x→1+ −2 x→1+ x+1
(x − 1)2 (x − 1)3
y, por lo tanto, lı́mx→1+ f (x) = 0 = f (1).
Como
lı́m f (x) = lı́m (1 − x)e−3x = 0,
x→1− x→1−
108
Matemáticas: Cálculo I.

obtenemos que la función es continua en x0 = 1 y, como consecuencia, en toda la recta real.


La función es diferenciable en (−∞, 1)∪(1, ∞) ya que se obtiene como resultado de operaciones
algebraicas y composiciones de funciones diferenciables. Pasemos al estudio de la difenciabilidad
en x0 = 1.
Por un lado,
f (1 + h) − f (1) ln((1 + h)2 − 1)
lı́m = lı́m h ln((1 + h)2 − 1) = lı́m
h→0+ h h→0+ h→0+ 1
h

lo que da lugar a una indeterminación del tipo .

Aplicando otra vez la Regla de de L’Hôpital tenemos que
2h + 2
f (1 + h) − f (1) 2
ln((1 + h) − 1) 2 2h + 2
lı́m = lı́m = lı́m h + 2h = lı́m −h =0
h→0+ h h→0+ 1 h→0+ −1 h→0+ h+2
h h2
Finalmente,
f (1 + h) − f (1)
lı́m = lı́m −e−3(1+h) = −e−3 .
h→0 − h h→0−
Como las derivadas laterales son distintas, la función no es diferenciable en x0 = 1. Por lo
tanto, f es diferenciable en (−∞, 1) ∪ (1, ∞).

5.9. Estudio local de la gráfica de una función


En esta sección, utilizando un ejemplo concreto, presentaremos un esquema que será útil para
representar la gráfica de una función real de variable real. Así pues, dada la función
x2
f (x) =
x−1
se trata de obtener su gráfica.
1. Dominio. Determinemos en primer lugar el dominio de f . En este caso,
Dom(f ) = R − {1} .
2. Cortes con los ejes. En segundo lugar calcularemos los puntos de corte con los ejes. Para
los puntos de corte con el eje OY, x debe ser nulo. Por lo tanto,
02
y= = 0,
0−1
y, como consecuencia, el punto (0, 0) pertenece a la gráfica de f .
En los cortes con el eje OX, tenemos que asumir y = 0. Esto implica que es necesario
resolver la ecuación
x2
0= ,
x−1
que tiene como única solución x = 0. Como consecuencia, el único corte con el eje OX es
en el punto (0, 0).
3. Simetrías. Puede tener interés determinar las posibles simetrías de la función f , ya que en
el caso de existir permiten reducir el trabajo de representación de forma considerable.
Si la función es par, i. e., f (x) = f (−x), su gráfica es simétrica con respecto al eje OY.
En este caso basta con estudiar que pasa cuando x es mayor o igual que cero y después
hacer la simetría correspondiente.
Si la función es impar, i. e., f (x) = −f (−x), su gráfica es simétrica con respecto al
origen. Como en el caso anterior es suficiente estudiar que pasa cuando x es mayor o igual
que cero y después hacer la simetría correspondiente.
109
Matemáticas: Cálculo I.

En nuestro caso se tiene que


x2 x2
f (x) = , f (−x) = ,
x−1 −x − 1
y esto implica que la gráfica de la función no es simétrica ni respecto al eje OY ni respecto
al origen.
4. Peridiocidad. La función f será periódica de período T si
f (x + T ) = f (x) , ∀x ∈ R .
Si una función es periódica, basta con representarla en un período concreto. Obviamente
esto simplifica su representación gráfica.
Para f está claro que no existe un número real T tal que f sea periódica de período T .
5. Discontinuidades. Por la propia definición, f es continua en todo su dominio (resultado
de operaciones algebraicas con funciones continuas). Dado que f presenta en x0 = 1 una
asíntota vertical (lo veremos en el siguiente apartado), su gráfica tiene en dicho punto un
salto infinito.
6. Asíntotas. Tenemos que estudiar tres tipos.
a) Horizontales o paralelas al eje OX. Para su cálculo simplemente tenemos que determi-
nar los límites de la función f cuando x tiende a +∞ e a −∞.
En este caso,
x2 x2
lı́m = +∞, lı́m = −∞ ,
x→+∞ x − 1 x→−∞ x − 1

de forma que la función no tiene asíntotas horizontales ( en el caso de que alguno de los
límites anteriores fuese un número real k, la función f tendría una asíntota horizontal
de ecuación y = k).
b) Verticales o paralelas al eje OY. En este caso tenemos que obtener los números reales
β para los que
lı́m f (x) = ∞ ,
x→β
o
lı́m f (x) = ∞ ,
x→β +
o
lı́m f (x) = ∞ ,
x→β −
En el caso de f , para β = 1, se tiene que
x2 x2
lı́m = +∞, lı́m = −∞ .
x→1+ x − 1 x→1− x − 1
Por lo tanto, la recta x = 1 es una asíntota vertical de la función f .
c) Oblícuas o no paralelas a los ejes. Se trata de obtener las rectas de la forma y = mx+n
donde
f (x)
m = lı́m , n = lı́m (f (x) − mx) .
x→∞ x x→∞
En el caso de f se tiene que
f (x) x2
m = lı́m = lı́m = 1,
x→∞ x x→∞ x(x − 1)

x2 x
n = lı́m (f (x) − x) = lı́m − x = lı́m = 1,
x→∞ x→∞ x − 1 x→∞ x − 1
y así la recta y = x + 1 es una asíntota oblícua.
110
Matemáticas: Cálculo I.

7. Crecimiento, decrecimiento y extremos. Usando la derivada de f podemos calcular los inter-


valos de crecimiento y decrecimiento y a partir de ellos los extremos de la función. Entonces,
2x(x − 1) − x2 x2 − 2x
f 0 (x) = =
(x − 1)2 (x − 1)2
y f 0 (x) = 0 para x = 0 o x = 2. Por otro lado, si x < 0, f 0 (x) > 0 y f es creciente en
(−∞, 0). Si 0 < x < 1 se tiene que f 0 (x) < 0 y, por tanto, f es decreciente en (0, 1). Además,
si 1 < x < 2 entonces f 0 (x) < 0 y, a causa de esto, f es decreciente en (1, 2). Finalmente,
si x > 1, se tiene f 0 (x) > 0 y, por lo tanto, f es creciente en (2, +∞).
8. Concavidad, convexidad y puntos de inflexión. Como se probó en los resultados precedentes,
la derivada segunda de la función f nos da la información necesaria para estudiar su carácter
cóncavo o convexo. Así pues
2
f 00 (x) = ,
(x − 1)3
y, por lo tanto, si x > 1 entonces f 00 (x) > 0, siendo la función convexa en (1, +∞), y si
x < 1 entonces f 00 (x) < 0, siendo la función cóncava en (−∞, 1).
Con toda la información previa podemos alcanzar una idea muy aproximada de la gráfica de
la función f , que deberá ser semejante a la de la figura siguiente donde la gráfica de la función se
representa en color azul y las dos asíntotas en rojo:

3 y =x+1

1 x=1

x
−5 −4 −3 −2 −1 0 1 2 3 4 5

−1

−2

−3

−4

x2
f (x) =
x−1
111
Matemáticas: Cálculo I.

5.10. El polinomio de Taylor


Sea I un intervalo y tomemos f : I → R una función derivable en I. En esta sección estu-
diaremos como aproximar la función f usando un polinomio, llamado polinomio de Taylor, en un
entorno de un punto x0 ∈ I.
El polinomio p1 (x) más simple que proporciona una aproximación de la función f en un
entorno de un punto x0 ∈ I es el dado por la recta tangente a la gráfica de f en el punto
(x0 , f (x0 )), i. e., p1 (x) es el polinomio de grado uno dado por
p1 (x) = f (x0 ) + f 0 (x0 )(x − x0 ).
Se puede probar de forma sencilla, resolviendo un sistema de ecuaciones lineales, que p1 (x) es
el único polinomio de grado uno tal que
p1 (x0 ) = f (x0 ), p01 (x0 ) = f 0 (x0 ).
De esta forma la recta tangente proporciona una aproximación simple de los valores de la
función f en puntos muy próximos a x0 .
Si f fuese dos veces derivable en I, también se cumple que existe un único polinomimio p2 (x)
de grado 2 que satisface las relaciones
p2 (x0 ) = f (x0 ), p02 (x0 ) = f 0 (x0 ), p002 (x0 ) = f 00 (x0 ).
Este polinomio proporciona una aproximación de la función f en un entorno de un punto
x0 ∈ I mejor que la dada por p1 (x). Por lo tanto todo parece indicar que, si seguimos aumentando
el grado, se obtendrán mejores aproximaciones de la función en un entorno de x0 .
Definición 5.10.1. Sea I un intervalo abierto y tomemos f : I → R una función n veces derivable
en I. Definimos el polinomio de Taylor de grado n de f centrado en x0 como el único polinomio
pn (x) de grado menor o igual que n satisfaciendo las n + 1 ecuaciones
pn (x0 ) = f (x0 ), p0n (x0 ) = f 0 (x0 ), . . . , p(n)
n (x0 ) = f
(n)
(x0 ).
Su unicidad queda garantizada gracias a que sus coeficientes se pueden obtener como la
solución de un sistema de ecuaciones lineales compatible determinado. Teniendo en cuenta esto,
la expresión del polinomio de Taylor está dada por
f 00 (x0 ) f (n) (x0 )
pn (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + (x − x0 )2 + · · · + (x − x0 )n
2! n!
n
X f (k) (x0 )
= f (x0 ) + (x − x0 )k .
k!
k=1

Ejemplo 5.10.2. Por ejemplo, si f (x) = ex y x0 = 0, el polinomio de Taylor de grado 3 de f


centrado en cero es
f 00 (0) 2 f 000 (0) 3 x2 x3
p3 (x) = f (0) + f 0 (0)x + x + x =1+x+ + ,
2! 3! 2 6
ya que
f (0) = f 0 (0) = f 00 (0) = f 000 (0) = e0 = 1.
Gracias a p3 (x), se puede aproximar f (x) = ex en puntos próximos a cero. Por ejemplo, si
tomamos x = 1/2,
p3 (1/2) = 1 + 1/2 + 1/8 + 1/48 = 1,64583
R
y, por otro lado, Matlab en formato largo da el siguiente valor

e = 1,648721270700128,
con lo que podemos afirmar que las dos primeras cifras decimales coinciden.
112
Matemáticas: Cálculo I.

En la figura siguiente podemos ver la gráfica de la función f (x) = ex y las de los correspon-
dientes polinomios de Taylor de grados 1, 2 y 3 centrados en x0 = 0. Como se puede ver, a medida
que aumentamos el grado, la gráfica del polinomio de Taylor se aproxima cada vez más a la gráfica
de la función en un entorno del cero.
y
20

18

16

14

12

10
f (x)
8 p3 (x)
p2 (x)
p1 (x)
6

x
−4 −2 0 2

−2

−4

El teorema que se enuncia a continuación, conocido como Teorema de Taylor, nos indica la
forma de estimar el error cometido cuando se aproxima una función en un entorno de un punto
por un polinomio de Taylor de grado dado.

Teorema 5.10.3. (Teorema de Taylor) Sea f : [a, b] → R una función derivable n + 1 veces y sea
x0 ∈ [a, b]. Para cada x perteneciente al intervalo [a, b] se puede asegurar que existe un número αx
entre x0 y x tal que f (x) = pn (x) + rn (x), siendo

f (n+1) (αx )
rn (x) = (x − x0 )n+1 .
(n + 1)!
Definición 5.10.4. El sumando rn (x) se llama resto del polinomio de Taylor de grado n de f
centrado en x0 y obviamente proporciona el error cometido en la aproximación de la función usando
el polinomio de Taylor ya que se tiene lo siguiente:

|f (x) − pn (x)| = |rn (x)|.


113
Matemáticas: Cálculo I.

Ejemplo 5.10.5. El polinomio de Taylor de grado tres de f (x) = sen(x) centrado en x0 = 0


está dado por p3 (x) = x − x3 /6. Teniendo en cuenta el Teorema de Taylor, el error cometido al
aproximar sen(1/2) por p3 (1/2) está dado por

f (iv) (α )  1 4
x
|r3 (1/2)| = ,

4! 2
donde αx ∈ (0, 1/2).
Como la función seno está acotada
|f (iv) (αx )| = | sen(αx )| ≤ 1, ∀ αx ∈ (0, 1/2),
se tiene que:
1
| sen(1/2) − p3 (1/2)| = |r3 (1/2)| ≤
= 0,00260417.
4! 24
Nótese que p3 (1/2) = 1/2 − 1/48 = 0,479167 y, por otro lado, Matlab R
en formato largo
proporciona
sen(1/2) = 0,479425538604203.
Para finalizar esta sección enunciaremos dos corolarios del Teorema de Taylor que permiten
caracterizar extremos relativos y puntos de inflexión.
Corolario 5.10.6. Sea I un intervalo abierto y sea f : I → R una función de clase m > 1. Sea
x0 ∈ I tal que f 0 (x0 ) = 0 y sea n ≤ m el orden de la primera derivada de f que no se anula en
x0 , i. e., f (k) (x0 ) = 0 si k < n y f (n) (x0 ) 6= 0. Entonces:
(i) Si n es par y f (n) (x0 ) > 0, se tiene que f presenta un mínimo relativo estricto en x0 .
(ii) Si n es par y f (n) (x0 ) < 0, se tiene que f presenta un máximo relativo estricto en x0 .
(iii) Si n es impar, se tiene que f no presenta un extremo relativo en x0 .
Corolario 5.10.7. Sea I un intervalo abierto y sea f : I → R una función de clase m > 2. Sea
x0 ∈ I tal que f 00 (x0 ) = 0 y sea n ≤ m el orden de la primera derivada de f mayor que dos que
no se anula en x0 , i. e., f (k) (x0 ) = 0 si 2 ≤ k < n y f (n) (x0 ) 6= 0. En estas condiciones se puede
asegurar que f tiene un punto de inflexión en x0 si y sólo si n es impar.
Ejemplo 5.10.8. Dada la función
f (x) = x4 − 4x3
se tiene que
f 0 (x) = 4x3 − 12x2 , f 00 (x) = 12x2 − 24x, f (3) (x) = 24x − 24, f (4) (x) = 24, f (5) (x) = 0.
Entonces, como vimos en el Ejemplo 5.7.9, se tiene que
f 0 (x) = 0 ⇐⇒ x = 0 o x = 3
y
f 00 (x) = 0 ⇐⇒ x = 0 o x = 2.
Dado x0 = 0,
f 00 (0) = 0, f (3) (0) = −24
y esto implica que x0 = 0 es un punto de inflexión, ya que n = 3.
Dado x0 = 3,
f 0 (3) = 0, f 00 (3) = 36 > 0
y esto implica que x0 = 3 es un mínimo relativo estricto, ya que n = 2.
Dado x0 = 2,
f 00 (2) = 0, f (3) (2) = 24
y esto implica que x0 = 2 es un punto de inflexión, ya que n = 3.
114
Matemáticas: Cálculo I.

5.11. El método de Newton


Al igual que el algoritmo de bisección, el algoritmo de Newton sirve para aproximar una raíz
α de la ecuación

f (x) = 0

cuando f es una función dada suficientemente regular. Supongamos que x1 es una aproximación
de α y sea la tangente a la curva y = f (x) en x1 . Sea x2 la intersección de dicha tangente con el
eje de abcisas OX; el punto x2 que así se obtiene es una nueva aproximación de α. Nótese que la
tangente a y = f (x) en x1 y el punto x2 son

y − f (x1 ) = f 0 (x1 )(x − x1 ),

f (x1 )
x2 = x1 − ,
f 0 (x1 )

respectivamente.
El método tendrá interés si x2 es una mejor aproximación de α que x1 , cosa que se puede
asegurar bajo ciertas condiciones. En general si partimos de un x0 inicial la sucesión asociada al
algoritmo de Newton está dada por (xn ) donde

f (xn )
xn+1 = xn −
f 0 (xn )

y el error en el paso n es en = |xn − α|.

Teorema 5.11.1. (Método de Newton) Sea f : [a, b] → R una función de clase dos en [a, b] tal
que existe un
(a) f (a) y f (b) tienen distinto signo.
(b) La primera derivada de f es no nula en [a, b].
(c) La segunda derivada de f no cambia de signo en [a, b].
Entonces se verifica que:
(1) En (a, b) hay una y sólo una raíz α de la ecuación f (x) = 0.
(2) Si partimos de un punto inicial x0 ∈ [a, b] tal que f (x0 )f 00 (x0 ) > 0, entonces la sucesión
(xn ) definida por recurrencia como

f (xn )
xn+1 = xn −
f 0 (xn )

converge a la raíz α.

5.12. Anexo I: Tablas de derivadas


Para finalizar el tema, en las siguientes tablas se resumen las derivadas de las funciones
elementales así como sus principales propiedades.
115
Matemáticas: Cálculo I.

Derivada de Resultado
Función potencial
f 0 (x) = αxα−1
f : x ∈ D ⊂ R 7→ f (x) = xα ∈ R
Función exponencial
f 0 (x) = ln(a)ax
f : x ∈ D ⊂ R 7→ f (x) = ax ∈ R
Función logarítmica 1 1
f 0 (x) =
f : x ∈ D ⊂ R 7→ f (x) = loga (x) ∈ R ln(a) x
Función seno
f 0 (x) = cos(x)
f : x ∈ D ⊂ R 7→ f (x) = sen(x) ∈ R
Función coseno
f 0 (x) = − sen(x)
f : x ∈ D ⊂ R 7→ f (x) = cos(x) ∈ R
Función tangente 1
f 0 (x) = 1 + tg2 (x) =
f : x ∈ D ⊂ R 7→ f (x) = tg(x) ∈ R cos2 (x)
Función cotangente −1
f 0 (x) = −(1 + cotg2 (x)) =
f : x ∈ D ⊂ R 7→ f (x) = cotg(x) ∈ R sen2 (x)
Función secante tg(x)
f 0 (x) =
f : x ∈ D ⊂ R 7→ f (x) = sec(x) ∈ R cos(x)
Función cosecante 0 −cotg(x)
f (x) =
f : x ∈ D ⊂ R 7→ f (x) = cosec(x) ∈ R sen(x)
Función arco seno 1
f 0 (x) = √
f : x ∈ D ⊂ R 7→ f (x) = arcsen(x) ∈ R 1 − x2
Función arco coseno −1
f 0 (x) = √
f : x ∈ D ⊂ R 7→ f (x) = arccos(x) ∈ R 1 − x2
Función arco tangente 1
f 0 (x) =
f : x ∈ D ⊂ R 7→ f (x) = arctg(x) ∈ R 1 + x2
Función arco cotangente −1
f 0 (x) =
f : x ∈ D ⊂ R 7→ f (x) = arccotg(x) ∈ R 1 + x2

2
y = Rh (x)

(0, f (x0 + h)) P0

y = f (x0 ) + f 0 (x0 )(x − x0 )

(0, f (x0 )) P
x
0 (x0 , 0) 1 (x0 + h, 0)

116
Matemáticas: Cálculo I.

Derivada de Resultado
f (x) − f (x0 )
Una función lı́m
en un punto x→x0 x − x0
f (x0 + h) − f (x0 )
f : x ∈ I ⊂ R 7→ f (x) ∈ R = lı́m
h→0 h
Una función constante
f 0 (x) = 0
f : x ∈ I ⊂ R 7→ f (x) = α ∈ R
Suma de funciones
f 0 (x) + g 0 (x)
f + g : x ∈ I ⊂ R 7→ f (x) + g(x) ∈ R
Producto de una constante por una función
λf 0 (x)
λf : x ∈ I ⊂ R 7→ λ f (x) ∈ R
Producto de funciones
f 0 (x)g(x) + f (x)g 0 (x)
f g : x ∈ I ⊂ R 7→ f (x)g(x) ∈ R
Cociente de funciones f 0 (x)g(x) − f (x)g 0 (x)
f /g : x ∈ I ⊂ R 7→ f (x)/g(x) ∈ R (g(x))2
Composición de funciones
g 0 (f (x)) f 0 (x)
g ◦ f : x ∈ I ⊂ R 7→ g(f (x)) ∈ R
Función inversa
f : x ∈ I ⊂ R 7→ f (x) ∈ R 1
g 0 (f (x)) =
g : y ∈ J ⊂ R 7→ g(y) ∈ R f 0 (x)
(g ◦ f )(x) = x, (f ◦ g)(y) = y

117
Matemáticas: Cálculo I.

118
Matemáticas: Cálculo I

Capítulo 6

Diferenciabilidad de funciones de varias variables

6.1. Derivada direccional y derivadas parciales


Definición 6.1.1. Sea A un conjunto abierto de Rn y sea f : A ⊂ Rn −→ Rm una función de
varias variables. Sea x0 ∈ A y v ∈ Rn un vector. Se define la derivada de f en x0 según el vector
v, que denotaremos por Dv f (x0 ), como el límite
f (x0 + tv) − f (x0 )
Dv f (x0 ) = lı́m ,
t→0 t
cuando exista y sea finito.
Si el vector v es unitario (kvk = 1), se dice que Dv f (x0 ) es la derivada direccional de f en x0
según la dirección de v.
Ejemplo 6.1.2. Sea f : R2 −→ R el campo escalar dado para cada x = (x, y) por
 2
x +y
, x 6= y,



f ((x, y)) = x−y


0 x = y.

La derivada de f en (0, 1) según el vector v = (1, 2) está dada por el límite


f ((0, 1) + t(1, 2)) − f ((0, 1)) f ((t, 2t + 1)) + 1 t2 + 2t + 1 − t − 1
Dv f ((0, 1)) = lı́m = lı́m = lı́m
t→0 t t→0 t t→0 −t(t + 1)
t(t + 1)
= lı́m = −1.
t→0 −t(t + 1)

Ejemplo 6.1.3. Sea f : R2 −→ R el campo escalar dado para cada x = (x, y) por
 2
x sen(y) + y 2 sen(x)
, x = (x, y) 6= (0, 0),


x2 + y 2

f ((x, y)) =


0 x = (x, y) = (0, 0).

La derivada de f en (0, 0) según un vector genérico v = (a, b) está dada por el límite
f ((0, 0) + t(a, b)) − f ((0, 0)) f ((ta, tb)) − f ((0, 0))
Dv f ((0, 0)) = lı́m = lı́m
t→0 t t→0 t
a2 sen(tb) + b2 sen(ta)
= lı́m
t→0 t(a2 + b2 )
0
que da lugar a una indeterminación del tipo . Aplicando la Regla de L’Hôpital obtenemos que
0
a b cos(tb) + b2 a cos(ta)
2 a2 b + b2 a
Dv f (0, 0) = lı́m = .
t→0 a2 + b2 a2 + b2
Así pues, la derivada de f en (0, 0) según un vector depende claramente de dicho vector.
119
Matemáticas: Cálculo I.

Ejemplo 6.1.4. Dado el campo escalar f : R2 → R dado por



x2 y
si x = (x, y) 6= (0, 0)


 4
f (x) = x + y2


0 si x = (x, y) = (0, 0).

sabemos que no es continuo en el punto (0, 0) ya que no existe lı́m f (x) (ver Ejemplo 3.4.6). Sin
x→(0,0)
embargo, existen las derivadas en (0, 0) según cualquier vector v = (v1 , v2 ) no nulo de R2 ya que
f ((0, 0) + t(v1 , v2 )) − f ((0, 0)) f ((0 + tv1 , 0 + tv2 )) − f ((0, 0))
Dv f ((0, 0)) = lı́m = lı́m
t→0 t t→0 t

 0 si v1 = 0 o v2 = 0
t3 v12 v2 v12 v2

f (tv1 , tv2 ) 
= lı́m = lı́m 5 4 = lı́m 2 4 =
t→0 t t→0 t v1 + t3 v22 t→0 t v1 + v22 v2
 1 si v1 6= 0 y v2 6= 0


v2
Así pues, la existencia de las derivadas en un punto según cualquier vector no implica la
continuidad de la función en dicho punto. Recuérdese que en el caso de funciones de una sola
variable la existencia de la derivada en un punto implicaba la continuidad en ese mismo punto.
En el caso de las funciones de varias variables la verificación de muchas propiedades se ligaba
a que dichas propiedades se cumpliesen para sus campos escalares componentes. Con las derivadas
en un punto según un vector se cumple esta propiedad.
Teorema 6.1.5. Sea A un conjunto abierto de Rn y sea f : A ⊂ Rn −→ Rm una función de varias
variables con campos escalares componentes
f = (f1 , . . . , fm ).
Sea x0 ∈ A y v ∈ Rn un vector. Se cumple que existe Dv f (x0 ) si y solo si existen y son finitas
Dv fi (x0 ), i ∈ {1, . . . , m}.
Además
Dv f (x0 ) = (Dv f1 (x0 ), . . . , Dv fm (x0 )).
Gracias al teorema anterior podemos garantizar que el estudio de la existencia de las derivadas
de un campo vectorial en un punto según un vector se reduce al estudio del mismo problema pero
para campo escalares.
Definición 6.1.6. Sea A un conjunto abierto de Rn y sea f : A ⊂ Rn −→ Rm una función de
varias variables. Sea x0 ∈ A y ej ∈ Rn el j-ésimo vector de la base canónica de Rn . Se define la
derivada parcial j-ésima de f en x0 , que denotaremos por Dj f (x0 ), como el límite
f (x0 + tej ) − f (x0 )
Dj f (x0 ) = lı́m ,
t→0 t
cuando exista y sea finito.
Así pues, Dj f (x0 ) es la derivada direccional de f en x0 según la dirección de ej . Como la base
canónica de Rn tiene n vectores e1 , . . . , en , aparecerán n derivadas parciales.
Ejemplo 6.1.7. Sea f : R2 −→ R el campo escalar dado para cada x = (x, y) por
f ((x, y)) = xy 2 + y 3 .
Entonces, si x = (x, y) ∈ R2 ,
f ((x, y) + t(1, 0)) − f ((x, y)) f ((x + t, y)) − f ((x, y))
D1 f ((x, y)) = lı́m = lı́m
t→0 t t→0 t
120
Matemáticas: Cálculo I.

(x + t)y 2 + y 3 − xy 2 − y 3
= lı́m = y2
t→0 t
Este resultado es el mismo que obtendríamos si derivásemos la expresión xy 2 + y 3 respecto a
la variable x pensando que y es un parámetro que no depende de x.
Por otro lado,

f ((x, y) + t(0, 1)) − f ((x, y)) f ((x, y + t)) − f ((x, y))


D2 f ((x, y)) = lı́m = lı́m
t→0 t t→0 t
x(y + t)2 + (y + t)3 − xy 2 − y 3
= lı́m
t→0 t
xy 2 + 2xyt + xt2 + y 3 + 3y 2 t + 3yt2 + t3 − xy 2 − y 3
lı́m = lı́m 2xy + xt + 3y 2 + 3yt + t2
t→0 t t→0

= 2xy + 3y 2 .
De una forma similar a la primera derivada parcial, este resultado es el mismo que obtendría-
mos si derivásemos la expresión xy 2 + y 3 respecto a la variable y pensando que x es un parámetro
que no depende de y.
Sea A un conjunto abierto de Rn y sea f : A ⊂ Rn −→ Rm una función de varias variables. En
general, para obtener la j-ésima derivada parcial se pueden aplicar las reglas de la derivación de
funciones de una variable; el procedimiento está dado por la ideas expuestas en el ejemplo anterior:
se deriva respecto a la variable j-ésima xj pensando que las restantes variables son parámetros
que no depende de xj .
Por ejemplo, para calcular las derivadas parciales del campo escalar f : R2 −→ R dado para
cada x = (x, y) por
f (x, y) = x2 + y 2 + 2xy,
derivaríamos la expresión con respecto a x suponiendo que la y es un parámetro no dependiente
de x,
D1 f ((x, y)) = 2x + 2y,
y para calcular la segunda derivada parcial, derivaríamos la expresión con respecto a y, suponiendo
que la x es un parámetro no dependiente de y:
D2 f ((x, y)) = 2y + 2x.
Para las derivadas parciales también se usará la notación
∂f
Dj f (x) = (x).
∂xj
Así pues, en el caso de la función anterior:
∂f
D1 f ((x, y)) = 2x + 2y = (x, y)
∂x
y
∂f
D2 f ((x, y)) = 2y + 2x = (x, y).
∂y
Ejemplo 6.1.8. Dado el campo escalarf : R2 → R
 xy

 2 si x = (x, y) 6= (0, 0)
x + y2
f (x) =

0 si x = (x, y) = (0, 0).

121
Matemáticas: Cálculo I.

calcularemos las derivadas parciales para todo punto x = (x, y) ∈ R2 . Por un lado, para cualquier
punto (x, y) 6= (0, 0), la función viene definida por la expresión

xy
f ((x, y)) =
x2 + y2

y, por lo tanto, para calcular las derivadas parciales, seguimos lo expuesto en los párrafos anteriores.
Entonces,

y(x2 + y 2 ) − 2x2 y
D1 f ((x, y)) = ,
(x2 + y 2 )2
y

x(x2 + y 2 ) − 2xy 2
D2 f ((x, y)) = .
(x2 + y 2 )2

Para el punto (0, 0) no nos queda otro remedio que usar la definición. Así pues:

f ((0, 0) + t(1, 0)) − f (0, 0) f ((t, 0)) 0


D1 f ((0, 0)) = lı́m = lı́m = lı́m = 0
t→0 t t→0 t t→0 t

f ((0, 0) + t(0, 1)) − f (0, 0) f ((0, t)) 0


D2 f ((0, 0)) = lı́m = lı́m = lı́m = 0.
t→0 t t→0 t t→0 t

Es importante resaltar que en este ejemplo la función no es continua en (0, 0) ya que

lı́m f (x)
x→(0,0)

no existe. En efecto, si

T = {x = (x, y) ∈ R2 / y = 0}

se tendrá que, para todo x ∈ T ,

f (x) = 0

y, por lo tanto, cuando x tienda a (0, 0) por el subconjunto T , el límite tomará el valor 0. Por otro
lado, si

S = {x = (x, y) ∈ R2 / x = y} − {(0, 0)}

se tendrá que, para todo x ∈ S,


1
f (x) =
2
1
y, como consecuencia, cuando x tienda a (0, 0) por el subconjunto S, el límite tomará el valor .
2
La siguiente figura permite ver la gráfica de la función del ejemplo.
122
Matemáticas: Cálculo I.

xy
f (x) = , x 6= (0, 0)
+ y2x2
Como consecuencia de lo anterior, podemos afirmar que la existencia de las derivadas parciales
en un punto no implica la continuidad de la función en dicho punto.
Gracias al Teorema 6.1.5 obtenemos el siguiente corolario.
Corolario 6.1.9. Sea A un conjunto abierto de Rn y sea f : A ⊂ Rn −→ Rm una función de
varias variables con campos escalares componentes
f = (f1 , . . . , fm ).
Sea x0 ∈ A. Se cumple que existe la derivada parcial j-ésima Dj f (x0 ) si y solo si existen las
derivadas parciales j-ésimas Dj fi (x0 ), i ∈ {1, . . . , m}.
Además
Dj f (x0 ) = (Dj f1 (x0 ), . . . , Dj fm (x0 )).
Por lo tanto, podemos garantizar que el estudio de la existencia de las derivadas parciales de
un campo vectorial se reduce al estudio del mismo problema pero para campo escalares.
Definición 6.1.10. Sea A un conjunto abierto de Rn y sea f : A ⊂ Rn −→ Rm una función de
varias variables con campos escalares componentes
f = (f1 , . . . , fm ).
Supongamos que existen todas las derivadas parciales de f en un punto x0 ∈ A, i. e., existen
Dj f (x0 ) = (Dj f1 (x0 ), . . . , Dj fm (x0 ))
para todo j ∈ {1, . . . , n}. Se define la matriz de Jacobi de f en x0 como la matriz real de m filas
y n columnas dada por
 
D1 f1 (x0 ) D2 f1 (x0 ) . . . Dn f1 (x0 )
 
 
 D1 f2 (x0 ) D2 f2 (x0 ) . . . Dn f2 (x0 ) 
 
Df (x0 ) =   ∈ Mm×n (R).
 
 .. .. .. .. 

 . . . . 

 
D1 fm (x0 ) D2 fm (x0 ) . . . Dn fm (x0 )
123
Matemáticas: Cálculo I.

Así pues, la columna j-ésima de la matriz de Jacobi coincide con la derivada parcial j-ésima
de la función y entonces Df (x0 ) se puede escribir por columnas como:

Df (x0 ) = D1 f (x0 ) D2 f (x0 ) . . . Dn f (x0 ) .

Si f : A ⊂ Rn −→ R es un campo escalar, la matriz de Jacobi de f en x0 recibe el nombre


de gradiente de f en x0 (vector gradiente de f en x0 ). En este caso se representa como ∇f (x0 ) y
entonces:

∇f (x0 ) = D1 f (x0 ) D2 f (x0 ) . . . Dn f (x0 ) .
Por lo tanto, dada f : A ⊂ Rn −→ Rm una función de varias variables con campos escalares
componentes
f = (f1 , . . . , fm ),
se tiene que:
 
∇f1 (x0 )
 
 
 ∇f2 (x0 ) 
 
Df (x0 ) =  .
 
 .. 

 . 

 
∇fm (x0 )

Ejemplo 6.1.11. Sea f : R3 −→ R el campo escalar dado para cada x = (x, y, z) por

f (x) = cos(xy + z).

El gradiente de f en cada punto x = (x, y, z) está dado por

∇f (x) = (−y sen(xy + z), −x sen(xy + z), − sen(xy + z)) ,

ya que

D1 f (x) = −y sen(xy + z), D2 f (x) = −x sen(xy + z), D3 f (x) = − sen(xy + z).

Ejemplo 6.1.12. Sea f : R3 −→ R3 el campo escalar dado para cada x = (x, y, z) por

f (x) = (xy + z, x2 + cos(y), y + z 2 )

La matriz de Jacobi de f en cada punto x = (x, y, z) está dada por


 
y x 1
Df (x) =  2x − sen(y) 0  ,
0 1 2z
ya que
D1 f1 (x) = y, D2 f1 (x) = x, D3 f1 (x) = −1,

D1 f2 (x) = 2x, D2 f2 (x) = − sen(y), D3 f2 (x) = 0,


y
D1 f3 (x) = 0, D2 f3 (x) = 1, D3 f3 (x) = 2z.
124
Matemáticas: Cálculo I.

6.2. Diferenciabilidad
En esta sección asumiremos que A es un conjunto abierto de Rn y que f : A ⊂ Rn −→ Rm es
una función de varias variables con campos escalares componentes f = (f1 , . . . , fm ) para el cual
existen todas las derivadas parciales de f en un punto x0 ∈ A, i. e., existen
Dj f (x0 ) = (Dj f1 (x0 ), . . . , Dj fm (x0 ))
para todo j ∈ {1, . . . , n}. Por lo tanto, existe la matriz de Jacobi de f en x0 .
Dado que en estos apuntes estamos escribiendo los vectores en fila, para un v = (v1 , · · · , vn ) ∈
R , denotaremos por Df (x0 )v el vector de Rn dado por
n

Df (x0 )v = (Df (x0 )vt )t .


Definición 6.2.1. Dada f : A ⊂ Rn −→ Rm y x0 ∈ A, diremos que f es diferenciable en x0 si
f (x0 + h) − f (x0 ) − Df (x0 )h
lı́m = θR m .
h→θRn khk
Que el límite anterior sea nulo es equivalente a que
kf (x0 + h) − f (x0 ) − Df (x0 )hk
lı́m =0
h→θRn khk
y a que
f (x) − f (x0 ) − Df (x0 )(x − x0 )
lı́m = θRm .
x→x0 kx − x0 k
Nota 6.2.2. Sea una función f : I → R donde I es un intervalo abierto de R. Sea x0 ∈ I. En el
tema dedicado al cálculo diferencial de funciones de una sola variable dijimos que f es derivable
en x0 , si existe el siguiente límite
f (x0 + h) − f (x0 )
lı́m
h→0 h
0
y es finito. Ese límite es lo que se define como f (x0 ) y esto implica que
f (x0 + h) − f (x0 ) f (x0 + h) − f (x0 )
lı́m = f 0 (x0 ) ⇐⇒ lı́m − f 0 (x0 ) = 0
h→0 h h→0 h
f (x0 + h) − f (x0 ) − f 0 (x0 )h
⇐⇒ lı́m = 0.
h→0 h
Finalmente, teniendo en cuenta que para funciones de una sola variable la matriz de Jacobi
es la derivada, i. e., Df (x0 ) = f 0 (x0 ), obtenemos que f es derivable en x0 si y solo si
f (x0 + h) − f (x0 ) − Df (x0 )h
lı́m = 0.
h→0 h
Así pues, la Definición 6.2.1, cuando se particulariza al caso de funciones de una sola variable,
es justamente la noción clásica de diferenciabilidad para funciones reales de variable real.
Al igual que la continuidad, la diferenciabilidad de f está controlada por la diferenciabilidad
de cada una de sus componentes.
Teorema 6.2.3. Sea f : A ⊂ Rn −→ Rm una función de varias variables, con campos escalares
componentes f = (f1 , . . . , fm ), y sea x0 ∈ A. La función f es diferenciable en x0 si y solo si fi es
diferenciable en x0 para todo i ∈ {1, . . . , m}.
Además, para una función ser diferenciable en un punto x0 implica ser continua en dicho
punto.
Teorema 6.2.4. Sea f : A ⊂ Rn −→ Rm una función de varias variables y sea x0 ∈ A. Si la
función f es diferenciable en x0 entonces f es continua en x0 .
125
Matemáticas: Cálculo I.

Ejemplo 6.2.5. Sea el campo escalar f : R2 → R dado por



x2 y 2
si x = (x, y) 6= (0, 0)


 2
f (x) = x + y2


0 si x = (x, y) = (0, 0).

Para todo x = (x, y) de R2 se tiene lo siguiente:


x2 y 2 |x2 y 2 |
|f (x) − 0| = | | = ≤ y2.
x2 + y 2 x2 + y 2
Por lo tanto, tomando ϕ : R2 → R como
ϕ(x) = y 2 ,
se puede deducir que
lı́m f (x) = 0,
x→(0,0)
ya que
lı́m ϕ(x) = 0.
x→(0,0)
La gráfica de la función anterior está dada por:

x2 y 2
f (x) = , x 6= (0, 0).
x2 + y 2
En este caso, se cumple también que
lı́m f (x) = 0 = f (0, 0),
x→(0,0)

i. e., el límite coincide con el valor de la función en el punto. Por la tanto la función es continua
en (0, 0) (si no fuese continua en el punto ya no sería diferenciable).
Pasemos ahora al estudio de la existencia de las derivadas parciales en (0, 0). En primer lugar
se tiene que
f ((0, 0) + t(1, 0)) − f (0, 0) f ((t, 0))
D1 f ((0, 0)) = lı́m = lı́m =0
t→0 t t→0 t
y, por otro lado,
f ((0, 0) + t(0, 1)) − f (0, 0) f ((0, t))
D2 f ((0, 0)) = lı́m = lı́m = 0.
t→0 t t→0 t
126
Matemáticas: Cálculo I.

Así pues,

∇f ((0, 0)) = Df ((0, 0)) = (0, 0).

Entonces,

h21 h22
f ((0, 0) + (h1 , h2 )) − f ((0, 0)) − Df ((0, 0))(h1 , h2 ) h2 + h22
lı́m = lı́m p1
(h1 ,h2 )→(0,0) k(h1 , h2 )k (h1 ,h2 )→(0,0) h21 + h22

h21 h22
= lı́m = 0,
(h1 ,h2 )→(0,0) k(h1 , h2 )k3

ya que

h21 h22 ≤ (h21 + h22 )(h21 + h22 ) = k(h1 , h2 )k2 k(h1 , h2 )k2 = k(h1 , h2 )k4

y, por lo tanto,

h21 h22 k(h1 , h2 )k4


lı́m ≤ lı́m = lı́m k(h1 , h2 )k = 0.
(h1 ,h2 )→(0,0) k(h1 , h2 )k3 (h1 ,h2 )→(0,0) k(h1 , h2 )k3 (h1 ,h2 )→(0,0)

Como el límite anterior es nulo podemos garantizar que la función es diferenciable en (0, 0).

Ejemplo 6.2.6. Sea el campo escalar f : R2 → R dado por



xy 2
si x = (x, y) 6= (0, 0)


x2 + y2

f (x) =


0 si x = (x, y) = (0, 0).

Para todo x = (x, y) de R2 se tiene lo siguiente:

xy 2 |xy 2 |
|f (x) − 0| = | | = ≤ |x|.
x2 + y 2 x2 + y 2

Por lo tanto, tomando ϕ : R2 → R como

ϕ(x) = |x|,

se puede deducir que

lı́m f (x) = 0,
x→(0,0)

ya que

lı́m ϕ(x) = 0.
x→(0,0)

La gráfica de la función anterior está dada por:


127
Matemáticas: Cálculo I.

xy 2
f (x) = , x 6= (0, 0).
x2 + y 2
En este caso, se cumple también que
lı́m f (x) = 0 = f (0, 0),
x→(0,0)

i. e., el límite coincide con el valor de la función en el punto. Por la tanto la función es continua
en (0, 0) (si no fuese continua en el punto ya no sería diferenciable).
Pasemos ahora al estudio de la existencia de las derivadas parciales en (0, 0). En primer lugar
se tiene que
f ((0, 0) + t(1, 0)) − f (0, 0) f ((t, 0))
D1 f ((0, 0)) = lı́m = lı́m =0
t→0 t t→0 t
y, por otro lado,
f ((0, 0) + t(0, 1)) − f (0, 0) f ((0, t))
D2 f ((0, 0)) = lı́m = lı́m = 0.
t→0 t t→0 t
Así pues,
∇f ((0, 0)) = Df ((0, 0)) = (0, 0).
Entonces,
h1 h22
f ((0, 0) + (h1 , h2 )) − f ((0, 0)) − Df ((0, 0))(h1 , h2 ) h2 + h22
lı́m = lı́m p1
(h1 ,h2 )→(0,0) k(h1 , h2 )k (h1 ,h2 )→(0,0) h21 + h22
h1 h22
= lı́m p .
(h1 ,h2 )→(0,0) (h2 + h2 ) h2 + h2
1 2 1 2
Si
T = { = (l1 , l2 ) ∈ R2 / l1 = 0}
se tendrá que para todo l ∈ T la función g : R2 → R dada por
l1 l22
g(l) = p
(l12 + l22 ) l12 + l22
si l 6= (0, 0) y por g((0, 0)) = 0, es tal que
g(l) = 0.
128
Matemáticas: Cálculo I.

Por lo tanto, cuando l tienda a (0, 0) por el subconjunto T , el límite tomará el valor 0. Por
otro lado, si
S = {l = (l1 , l2 ) ∈ R2 / l1 = l2 },
se tendrá que, para todo l ∈ S no nulo,
1
g(l) = √
2 2
1
y, como consecuencia, cuando l tienda a (0, 0) por el subconjunto S, el límite tomará el valor √ .
2 2
Esto último implica que el límite
h1 h22
lı́m p
(h1 ,h2 )→(0,0) (h2 + h2 ) h2 + h2
1 2 1 2
no existe y gracias a ello podemos garantizar que la función f no es diferenciable en (0, 0).
Teorema 6.2.7. Sea f : A ⊂ Rn −→ Rm una función de varias variables y sea x0 ∈ A. Si f es
diferencible en x0 tenemos que Dv f (x0 ) = Df (x0 )vt para todo v∈ Rn .
Teorema 6.2.8. Sea f : A ⊂ Rn −→ Rm una función de varias variables y sea x0 ∈ A. Si son
continuas las derivadas parciales Dj fi , ∀i = 1, . . . , m, ∀j = 1, . . . , n, en una bola abierta de centro
x0 contenida en A, entonces f es diferenciable en x0 .
Ejemplo 6.2.9. Sea f : R3 → R2 el campo vectorial cuyas componentes están dadas para todo
x = (x, y, z) por
f1 (x) = x2 y + z, f2 (x) = cos(xy) + 2z 3 .
Las derivadas parciales de las dos componentes están dadas por:
D1 f1 (x) = 2xy, D2 f1 (x) = x2 , D3 f1 (x) = 1,
D1 f2 (x) = −y sen(xy), D2 f2 (x) = −x sen(xy), D3 f2 (x) = 6z 2 .
Como todas son funciones continuas en R3 podemos afirmar que f es diferenciable en R3 .
Ejemplo 6.2.10. Sea el campo escalar f : R → R dado por
  
2 1
 x sen si x 6= 0


x
f (x) =


0 si x = 0.

La función f es derivable en x0 = 0 y su derivada


    
1 1
 2x sen − cos si x 6= 0


x x
f 0 (x) =


0 si x = 0.

no es continua en dicho punto ya que no existe el límite


 
1
lı́m cos .
x→0 x
Nota 6.2.11. Por lo tanto, a modo de resumen, se tiene lo siguiente:


Derivadas parciales continuas Diferenciabilidad
:

129
Matemáticas: Cálculo I.


Diferenciabilidad Existencia de derivadas parciales
:


Diferenciabilidad Continuidad
:

Para finalizar esta sección veremos algunas propiedades básicas de las funciones diferenciables.
Proposición 6.2.12. Dadas f, g : A ⊂ Rn −→ Rm y x0 ∈ A, si f y g son diferenciables en x0
también lo es f + g y además:
D(f + g)(x0 ) = Df (x0 ) + Dg(x0 ).
Proposición 6.2.13. Dada f : A ⊂ Rn −→ Rm y x0 ∈ A, si f es diferenciable en x0 también lo
es αf para todo α real. Además:
D(αf )(x0 ) = αDf (x0 ).
Proposición 6.2.14. Sean f : A ⊂ Rn −→ Rm , g : A ⊂ Rn −→ R y x0 ∈ A. Si f y g son
diferenciables en x0 también lo es f g y
D(f g)(x0 ) = g(x0 )Df (x0 ) + f (x0 )t Dg(x0 ).
Proposición 6.2.15. Sean f : A ⊂ Rn −→ Rm , g : A ⊂ Rn −→ R y x0 ∈ A. Si f y g son
diferenciables en x0 y además g no se anula en una bola abierta centrada en x0 y contenida en A,
f
se tiene que es diferenciable en x0 y
g
f g(x0 )Df (x0 ) − f (x0 )t Dg(x0 )
D( )(x0 ) = .
g g(x0 )2

6.3. El plano tangente


Definición 6.3.1. Sea f : A ⊂ R3 → R un campo escalar tal que todas sus derivadas parciales
son continuas. Sea K ∈ R y sea
CK = {x = (x, y, z) ∈ A / f (x) = K},
su correspondiente superficie de nivel.
Dado un punto x0 = (x0 , y0 , z0 ) ∈ CK la ecuación del plano tangente a la superficie CK en el
punto x0 = (x0 , y0 , z0 ) está dada por
< ∇f (x0 ), (x − x0 , y − y0 , z − z0 ) >= 0,
equivalentemente,
D1 f (x0 )(x − x0 ) + D2 f (x0 )(y − y0 ) + D3 f (x0 )(z − z0 ) = 0.
De esta forma se tiene que todos los puntos x de dicho plano tangente cumplen que ∇f (x0 )
es un vector ortogonal a x − x0 .
Ejemplo 6.3.2. Sea f : R3 → R un campo escalar dado por
f (x) = 3xy + z 2
y consideremos la superficie de nivel dada por K = 4, i. e.,
C4 = {x = (x, y, z) ∈ R3 / 3xy + z 2 = 4}.
130
Matemáticas: Cálculo I.

Sea x0 = (1, 1, 1) ∈ C4 . Entonces, la ecuación del plano tangente a la superficie C4 en el punto


x0 está dada por
< ∇f (x0 ), (x − 1, y − 1, z − 1) >= 0.
Equivalentemente,
3(x − 1) + 3(y − 1) + 2(z − 1) = 0.
La siguiente figura representa el plano tangente a la superficie en el punto dado.

3(x-1)+3(y-1)+2(z-1)=0
Sea g : B ⊂ R2 → R un campo escalar definido en un abierto B y tal que todas sus derivadas
parciales son continuas. Sea f : A = B × R ⊂ R3 → R el campo escalar dado por
f (x) = g((x, y)) − z.
Sea
C0 = {x = (x, y, z) ∈ A / f (x) = 0},
su superficie de nivel para K = 0. Entonces, el lugar geométrico de los puntos del espacio perte-
necientes a C0 coincide con la gráfica de g ya que
C0 = {x = (x, y, z) ∈ A / g((x, y)) = z}.
Así pues el plano tangente a la superficie dada por la gráfica de g en un punto
x0 = (x0 , y0 , z0 = g((x0 , y0 ))
es
D1 f (x0 )(x − x0 ) + D2 f (x0 )(y − y0 ) + D3 f (x0 )(z − z0 ) = 0 ⇐⇒
D1 g((x0 , y0 ))(x − x0 ) + D2 g((x0 , y0 ))(y − y0 ) − (z − g((x0 , y0 ))) = 0
o, lo que es lo mismo,  
x − x0
z − g((x0 , y0 )) = ∇g((x0 , y0 )) .
y − y0
La anterior ecuación afirma que un punto x = (x, y, z) ∈ R3 está en el plano tangente si y
solo si (x − x0 , y − y0 , z − g((x0 , y0 ))) es ortogonal a (D1 g((x0 , y0 )), D2 g((x0 , y0 )), −1).
Desde otro punto de vista, la ecuación del plano tangente es una generalización de la ecuación
de la recta tangente a la gráfica de una función real de variable real. Recuérdese que, dada f : I → R
una función definida en un intervalo abierto I, si f es derivable en x0 ∈ I, la derivada de f en x0
131
Matemáticas: Cálculo I.

es la pendiente de la recta tangente a la gráfica de f en el punto (x0 , f (x0 )). La ecuación de dicha
recta está dada por:
y − f (x0 ) = f 0 (x0 )(x − x0 ).
La ecuación anterior también se puede escribir como

< (f 0 (x0 ), −1), (x − x0 , y − f (x0 )) >= 0

y esto quiere decir que un punto (x, y) ∈ R2 está en la recta tangente, si y solo si (x−x0 , y −f (x0 ))
es ortogonal a (f 0 (x0 ), −1).

Ejemplo 6.3.3. Sea g : R2 → R el campo escalar dado por g((x, y)) = 4 − x2 − y 2 . El plano
tangente a la gráfica de g en el punto P = (0, 1, 3) es
 
x−0
z − 3 = ∇g((0, 1))
y−1

siendo
∇g((x, y)) = (−2x, −2y)
y
∇g((0, 1)) = (0, −2).
Entonces la ecuación del plano tangente queda como

z = 5 − 2y.

z=5-2y
132
Matemáticas: Cálculo I.

6.4. Regla de la Cadena


En el caso de funciones de una variable estudiamos un resultado que afirmaba que la compo-
sición de funciones diferenciables era diferenciable. A partir de este hecho se obtiene una fórmula
conocida como Regla de la Cadena (ver Teorema 5.3.1). En esta sección veremos que este resultado
sigue siendo cierto para funciones de varias variables.
Teorema 6.4.1. (Regla de la Cadena) Sea A un abierto de Rn y B un abierto de Rm . Sean
f : A ⊂ Rn → Rm y g : B ⊂ Rm → Rp dos funciones de varias variables tales que f (A) ⊂ B. Si
f es diferenciable en x0 ∈ A y g es diferenciable en f (x0 ) ∈ B se cumple que la composición g ◦ f
es diferenciable en x0 ∈ A. Además:
D(g ◦ f )(x0 ) = Dg(f (x0 ))Df (x0 ).
Ejemplo 6.4.2. Sea g : R2 → R un campo escalar diferenciable en R2 del que se sabe que
∇g((2, 2)) = (1, 2). Sea h : R3 → R otro campo escalar dado por
h(x) = g((x2 y + z, y))
para todo x = (x, y, z) ∈ R3 .
En este ejemplo calcularemos Dh((1, 2, 0)) utilizando la Regla de la Cadena, ya que está claro
que h = g ◦ f , siendo f : R3 → R2 el campo vectorial dado por
f (x) = (x2 y + z, y)
para todo x = (x, y, z) ∈ R3 .
Entonces como f y g son diferenciables, h también lo es para todo x = (x, y, z) ∈ R3
Dh(x) = D(g ◦ f )(x) = Dg(f (x))Df (x).
Como consecuencia,
Dh((1, 2, 0)) = D(g ◦ f )((1, 2, 0)) = Dg(f ((1, 2, 0)))Df ((1, 2, 0)) = Dg((2, 2))Df ((1, 2, 0)),
ya que f ((1, 2, 0)) = (2, 2).
Ahora bien,
2xy x2 1
 
Df (x) =
0 1 0
y entonces  
4 1 1
Df ((1, 2, 0)) = .
0 1 0
Por otro lado
Dg((2, 2)) = ∇g((2, 2)) = (1, 2).
Teniendo en cuenta todo lo anterior, podemos afirmar que:
 
4 1 1
Dh((1, 2, 0)) = (1 2) = (4 3 1).
0 1 0
Ejemplo 6.4.3. Sea f : R3 → R2 el campo vectorial dado por
f (x) = (sen(xy + z), (1 + x2 )yz )
para todo x = (x, y, z) ∈ R3 .
Sea g : R2 → R2 el campo vectorial dado por
g(x) = (x + ey , y + ex )
para todo x = (x, y) ∈ R2 .
En este ejemplo calcularemos D(g ◦ f )((1, −1, 1)) utilizando la Regla de la Cadena.
En primer lugar se obtendrán las derivadas parciales de f .
D1 f1 (x) = y cos(xy + z), D2 f1 (x) = x cos(xy + z), D3 f1 (x) = cos(xy + z),
133
Matemáticas: Cálculo I.

D1 f2 (x) = 2xyz(1 + x2 )yz−1 , D2 f2 (x) = (1 + x2 )yz z ln(1 + x2 ), D3 f2 (x) = (1 + x2 )yz y ln(1 + x2 ).


Las anteriores derivadas parciales son continuas en todo R3 . Por tanto f es diferenciable en
3
R .
En segundo lugar se obtendrán las derivadas parciales de g.
D1 g1 (x) = 1, D2 g1 (x) = ey ,
D1 g2 (x) = ex , D2 g2 (x) = 1.
Las anteriores derivadas parciales son continuas en todo R2 . Por tanto g es diferenciable en
R2 .
Como consecuencia obtenemos que g ◦ f es diferenciable en todo punto de R3 y, por tanto,
podemos usar la Regla de la Cadena en todo punto; en particular podemos usarla en (1, −1, 1)
obteniendo que
D(g ◦ f )((1, −1, 1)) = Dg(f ((1, −1, 1)))Df ((1, −1, 1)) = Dg((0, 1/2))Df ((1, −1, 1)).
Ahora bien, como
 
y cos(xy + z) x cos(xy + z) cos(xy + z)
Df (x) = ,
2xyz(1 + x2 )yz−1 (1 + x2 )yz z ln(1 + x2 ) (1 + x2 )yz y ln(1 + x2 )
se tiene que  
−1 1 1
Df ((1, −1, 1)) = .
−1/2 ln(2)/2 − ln(2)/2
Por otro lado,
1 ey
 
Dg(x) = ,
ex 1
y esto implica que  √ 
1 e
Dg((0, 1/2)) = .
1 1
Finalmente,
 √  
e1 −1 1 1
D(g ◦ f )((1, −1, 1)) =
1 1 −1/2 ln(2)/2 − ln(2)/2
 √ √ √ 
−1 − e/2 1 + e ln(2)/2 1 − e ln(2)/2
= .
−3/2 1 + ln(2)/2 1 − ln(2)/2

6.5. Derivadas de orden superior


Definición 6.5.1. Sea A un conjunto abierto de Rn . Sea f : A ⊂ Rn −→ Rm una función de varias
variables. Si existe Dj f (x), para todo j ∈ {1, . . . , n} y para todo x ∈ A, y Dj f (x) es continua,
para todo j ∈ {1, . . . , n}, diremos que f es una aplicación de clase uno en A y lo denotaremos por
f ∈ C 1 (A).
Para cada j ∈ {1, . . . , n}, sea Dj f : A ⊂ Rn −→ Rm la aplicación dada por
f (x + tej ) − f (x)
Dj f (x) = lı́m .
t→0 t
Si para todos j, k ∈ {1, . . . , n} existe Dk (Dj f )(x), diremos que f tiene derivadas parciales de
segundo orden en x y denotaremos por Djk f (x) a:
Dj f (x + tek ) − Dj f (x)
Djk f (x) = Dk (Dj f )(x) = lı́m .
t→0 t
Si además Djk f existe y es continua para todos j, k ∈ {1, . . . , n}, diremos que f es una
aplicación de clase dos en A y lo denotaremos por f ∈ C 2 (A).
134
Matemáticas: Cálculo I.

En general, si existen Dj1 ,j2 ,...,jp f (derivadas parciales de orden p) y son continuas para todos
j1 , j2 , . . . , jp ∈ {1, . . . , n}, diremos que f es una aplicación de clase p en A y lo denotaremos por
f ∈ C p (A).
Finalmente, si f ∈ C p (A) para todo p ∈ N, diremos que f es una aplicación de clase infinito
en A y lo denotaremos como f ∈ C ∞ (A).
Nota 6.5.2. En el caso de trabajar con campos escalares f : R2 → R también se utiliza la siguiente
notación para las derivadas parciales de orden dos:
∂f ∂ ∂f ∂2f ∂ ∂f ∂2f
D1 f = =⇒ D11 f = ( )= , D 12 f = ( ) = ,
∂x ∂x ∂x ∂x2 ∂y ∂x ∂y∂x
∂f ∂ ∂f ∂2f ∂f ∂f ∂2f
D2 f = =⇒ D21 f = ( )= , D22 f = ( )= .
∂y ∂x ∂y ∂x∂y ∂y ∂y ∂y 2
Definición 6.5.3. Sea A un conjunto abierto de Rn . Sea f : A ⊂ Rn −→ R un campo escalar. Sea
x0 ∈ A. Si para todos j, k ∈ {1, . . . , n} existe Djk f (x0 ), se define la matriz de Hesse de f en x0 (o
matriz hessiana de f en x0 ) como la matriz cuadrada dada por:
 
D11 f (x0 ) D12 f (x0 ) . . . D1n f (x0 )
 
 
 D21 f (x0 ) D22 f (x0 ) . . . D2n f (x0 ) 
 
Hf (x0 ) = 
 

 .. .. .. 

 . . . . . . 

 
Dn1 f (x0 ) Dn2 f (x0 ) . . . Dnn f (x0 )
Ejemplo 6.5.4. Sea el campo escalar f : R3 → R dado por
f (x) = xeyz + x + y + z
con x = (x, y, z).
Entonces sus derivadas parciales de primer orden son
D1 f (x) = eyz + 1, D2 f (x) = xzeyz + 1, D3 f (x) = xyeyz + 1.
Como todas las derivadas parciales de primer orden existen y son continuas, se puede decir
que f ∈ C 1 (R3 ).
Las derivadas parciales de orden dos están dadas por:
D11 f (x) = 0, D12 f (x) = zeyz , D13 f (x) = yeyz ,
D21 f (x) = zeyz , D22 f (x) = xz 2 eyz , D23 f (x) = xeyz + xyzeyz ,

D31 f (x) = yeyz , D32 f (x) = xeyz + xyzeyz , D33 f (x) = xy 2 eyz .
Como todas las derivadas parciales de segundo orden existen y son continuas, se puede decir
que f ∈ C 2 (R3 ).
Además, la matriz de Hesse de f en x está dada por:
z ey z y ey z
 
0
Hf (x) =  z ey z x z 2 ey z x ey z + x y z ey z 
y ey z x ey z + x y z ey z x y 2 ey z
Teorema 6.5.5. (Teorema de Schwarz) Sea A un conjunto abierto de Rn . Sea f : A ⊂ Rn −→ R
una función de varias variables. Sea x0 ∈ A, supongamos que f ∈ C 1 (A) y que, dados i, j ∈
{1, . . . , n}, existe Dij f en A y es continua en x0 . Entonces existe Dji f (x0 ) y además se cumple
que
Dij f (x0 ) = Dji f (x0 ).
135
Matemáticas: Cálculo I.

Nota 6.5.6. Gracias al Teorema de Schwarz, si para todos i, j ∈ {1, . . . , n} existe Dij f en A y son
continuas en x0 , podemos garantizar que la matriz de Hesse de f en x0 es simétrica. En particular,
para cualquier campo escalar de clase dos en un abierto A ⊂ Rn se puede asegurar que la matriz
de Hesse en cualquier punto de dicho abierto es simétrica. Esto se puede ver en el Ejemplo 6.5.7.
Ejemplo 6.5.7. Sea el campo escalar f : R2 → R dado por
f (x) = x3 + cos(xy)
con x = (x, y).
Entonces sus derivadas parciales de primer orden son
D1 f (x) = 3x2 − y sen(xy), D2 f (x) = −x sen(xy).
Como todas las derivadas parciales de primer orden existen y son continuas, se puede decir
que f ∈ C 1 (R2 ).
Las derivadas parciales de orden dos están dadas por:
D11 f (x) = 6x − y 2 cos(xy), D12 f (x) = − sen(xy) − xy cos(xy),
D21 f (x) = − sen(xy) − xy cos(xy), D22 f (x) = −x2 cos(xy).
Como todas las derivadas parciales de segundo orden existen y son continuas, se puede decir
que f ∈ C 2 (R2 ). Por lo tanto, la matriz de Hesse de f en x es simétrica y está dada por:
6x − y 2 cos(xy)
 
− sen(xy) − xy cos(xy)
Hf (x) =
− sen(xy) − xy cos(xy) −x2 cos(xy)
Ejemplo 6.5.8. Sea el campo vectorial f : R3 → R2 dado por
f (x) = (x2 y, z + y 2 )
con x = (x, y, z). Sea g : R2 → R un campo escalar de clase dos en R2 y consideremos el campo
escalar h = g ◦ f . Está claro que, como g y f son de clase dos, esto implica que h también lo es.
Por lo tanto, aplicando el Teorema de Schwarz, se tiene que
D12 h(x) = D21 h(x), D13 h(x) = D31 h(x), D23 h(x) = D32 h(x)
para todo x ∈ R3 .
La función h es la composición de f y g. Aplicando la Regla de la Cadena tenemos que
Dh(x) = D(g ◦ f )(x) = Dg(f (x))Df (x)
2xy x2 0
 
= (D1 g(f (x)), D2 g(f (x)))
0 2y 1
y, por lo tanto,
D1 h(x) = 2xyD1 g(f (x)) = 2xy(D1 g ◦ f )(x),
D2 h(x) = x D1 g(f (x)) + 2yD2 g(f (x)) = x2 (D1 g ◦ f )(x) + 2y(D2 g ◦ f )(x),
2

D3 h(x) = D2 g(f (x)) = (D2 g ◦ f )(x).


Si queremos calcular las derivadas de segundo orden de h, debemos derivar en las expresiones
anteriores. Así pues es necesario volver a aplicar la Regla de la Cadena a las composiciones
D1 g ◦ f, D2 g ◦ f.
En primer lugar se tiene que:
D(D1 g ◦ f )(x) = D(D1 g)(f (x))Df (x)
2xy x2 0
 
= (D11 g(f (x)), D12 g(f (x)))
0 2y 1
y, por lo tanto,
D1 (D1 g ◦ f )(x) = 2xyD11 g(f (x)),
136
Matemáticas: Cálculo I.

D2 (D1 g ◦ f )(x) = x2 D11 g(f (x)) + 2yD12 g(f (x)),

D3 (D1 g ◦ f )(x) = D12 g(f (x)).


Por otro lado,

D(D2 g ◦ f )(x) = D(D2 g)(f (x))Df (x)

2xy x2 0
 
= (D21 g(f (x)), D22 g(f (x)))
0 2y 1
y, por lo tanto,
D1 (D2 g ◦ f )(x) = 2xyD21 g(f (x)),

D2 (D2 g ◦ f )(x) = x2 D21 g(f (x)) + 2yD22 g(f (x)),

D3 (D2 g ◦ f )(x) = D22 g(f (x)).


Como consecuencia, la matriz de Hesse de h
 
D11 h(x) D12 h(x) D13 h(x)
Hh(x) =  D21 h(x) D22 h(x) D23 h(x)  ,
D31 h(x) D32 h(x) D33 h(x)

tendrá como coeficientes a:

D11 h(x) = 2yD1 g(f (x)) + 2xyD1 (D1 g ◦ f )(x) = 2yD1 g(f (x)) + 4x2 y 2 D11 g(f (x)),

D12 h(x) = 2xD1 g(f (x)) + 2xyD2 (D1 g ◦ f )(x) = 2xD1 g(f (x)) + 2xy(x2 D11 g(f (x)) + 2yD12 g(f (x)))

= 2xD1 g(f (x)) + 2x3 yD11 g(f (x)) + 4xy 2 D12 g(f (x)),

D13 h(x) = 2xyD3 (D1 g ◦ f )(x) = 2xyD12 g(f (x))


,
D21 h(x) = D12 h(x) = 2xD1 g(f (x)) + 2x3 yD11 g(f (x)) + 4xy 2 D12 g(f (x)),

D22 h(x) = x2 D2 (D1 g ◦ f )(x) + 2D2 g(f (x)) + 2yD2 (D2 g ◦ f )(x)

= x2 (x2 D11 g(f (x)) + 2yD12 g(f (x))) + 2D2 g(f (x)) + 2y(x2 D21 g(f (x)) + 2yD22 g(f (x)))

= 2D2 g(f (x)) + x4 D11 g(f (x)) + 4x2 yD12 g(f (x)) + 4y 2 D22 g(f (x)),

D23 h(x) = x2 D3 (D1 g ◦ f )(x) + 2yD3 (D2 g ◦ f )(x)

= x2 D12 g(f (x)) + 2yD22 g(f (x)),

D31 h(x) = D13 h(x) = 2xyD12 g(f (x)),

D32 h(x) = D23 h(x) = x2 D12 g(f (x)) + 2yD22 g(f (x)),

D33 h(x) = D3 (D2 g ◦ f )(x) = D22 g(f (x)).


137
Matemáticas: Cálculo I.

6.6. Operadores diferenciales


En esta sección del tema veremos las propiedades más básicas de los principales operadores
diferenciales.
Definición 6.6.1. Sea A un conjunto abierto de Rn . Sea f : A ⊂ Rn −→ R un campo escalar y
tomemos x0 ∈ A. Se define el gradiente de f en x0 como la matriz de Jacobi de f en x0 .
Tal como se vio al principio de este tema, el gradiente de f en x0 se representa como ∇f (x0 ),
i. e., 
∇f (x0 ) = D1 f (x0 ) D2 f (x0 ) . . . Dn f (x0 ) .
También se sabe que, si f : R3 → R es un campo escalar de clase uno y K ∈ R, dada
CK = {x = (x, y, z) ∈ R3 / f (x) = K},
la superficie de nivel asociada a K, se puede afirmar que ∇f (x0 ) es un vector normal a CK , i.
e., ∇f (x0 ) es ortogonal al plano tangente a la superficie CK en el punto x0 = (x0 , y0 , z0 ) (ver
Definición 6.3.1).
Ejemplo 6.6.2. Sea f : R3 → R un campo escalar dado por
f (x) = x2 + y 2 + z 2 ,
y consideremos la superficie de nivel C3 , i. e.,
C3 = {x = (x, y, z) ∈ R3 / f (x) = 3}.
Está claro que f es de clase infinito en R3 y además C3 es la esfera de centro (0, 0, 0) y radio

r = 3. El plano tangente a C3 en (1, 1, 1) está dado por
< ∇f ((1, 1, 1)), (x − 1, y − 1, z − 1) >= 0.
Equivalentemente,
2(x − 1) + 2(y − 1) + 2(z − 1) = 0 ⇐⇒ z = 3 − x − y.
La siguiente figura representa el plano tangente a la superficie en el punto dado.

z =3−x−y
138
Matemáticas: Cálculo I.

Definición 6.6.3. Sea F : Rn → Rn un campo vectorial tal que existen D1 F1 , . . . , Dn Fn . Se define


la divergencia de F como el campo escalar div(F ) : Rn → R dado por
div(F ) = D1 F1 + · · · + Dn Fn .
Por ejemplo, si F es el campo de velocidades de un gas (o de un fluido) div(F ) representa
la razón de expansión por unidad de volumen bajo el flujo del gas (o del fluido). Entonces, si
div(F ) < 0 se tiene que el gas (fluido) se está contrayendo, si div(F ) > 0 se tiene que el gas (fluido)
se está expandiendo y si div(F ) = 0 (solenoidal) se tiene que el gas (fluido) ni se comprime ni se
expande.
Ejemplo 6.6.4. Sea F : R3 → R3 el campo vectorial dado por
F (x) = (x2 y, zx, xy + z 2 )
siendo x = (x, y, z).
Entonces,
div(F )(x) = D1 F1 (x) + D2 F2 (x) + D3 F3 (x) = 2xy + 0 + 2z = 2(xy + z).
Definición 6.6.5. Sea F : R3 → R3 un campo vectorial tal que existen todas sus derivadas
parciales. Se define el rotacional de F como el campo vectorial rot(F ) : R3 → R3 dado por

i j k

rot(F ) = D1 D2 D3
F1 F2 F3
= (D2 F3 − D3 F2 , D3 F1 − D1 F3 , D1 F2 − D2 F1 ).
Por ejemplo, si F representa el flujo de un fluido, cuando rot(F ) es nulo significa que una
rueda rígida dotada de paletas flota en el fluido moviéndose con el pero sin rotar alrededor de su
eje, i. e., el fluido no tiene remolinos. Los campos vectoriales tales que rot(F ) = (0, 0, 0) se llaman
irrotacionales.
Ejemplo 6.6.6. Sea F : R3 → R3 el campo vectorial dado por
F (x) = (x2 y, zx, xy + z 2 )
siendo x = (x, y, z).
Entonces,
i j k

rot(F )(x) = D1 D2 D3 (x)
F1 F2 F3
= (D2 F3 (x) − D3 F2 (x), D3 F1 (x) − D1 F3 (x), D1 F2 (x) − D2 F1 (x))
= (x − x, 0 − y, z − x2 ) = (0, −y, z − x2 ).
Ejemplo 6.6.7. Sea f : R3 → R un campo escalar de clase dos. Entonces su gradiente es irrota-
cional. Esto es así, ya que, por el Teorema de Schwarz, las derivadas cruzadas son iguales:

i j k

rot(∇f )(x) = D1 D2 D3 (x)
D1 f D2 f D3 f
= (D2 (D3 f ) − D3 (D2 f ), D3 (D1 f ) − D1 (D3 f ), D1 (D2 f ) − D2 (D1 f ))(x)
= (D32 f − D23 f, D13 f − D31 f, D21 f − D12 f )(x) = (0, 0, 0).
Nota 6.6.8. Dado F : R3 → R3 un campo vectorial, rot(F ) también se puede expresar como
rot(F ) = ∇ × F
donde × es el producto vectorial y ∇ = (D1 , D2 , D3 ).
139
Matemáticas: Cálculo I.

Ejemplo 6.6.9. Sea F : R3 → R3 un campo vectorial de clase dos. Entonces div(rot(F )) = 0.


Esto es así, ya que por el Teorema de Schwarz las derivadas cruzadas son iguales:
 
i j k

div(rot(F )) = div  D1 D2 D3 
F1 F2 F3
= div((D2 F3 − D3 F2 , D3 F1 − D1 F3 , D1 F2 − D2 F1 )).
D21 F3 − D31 F2 + D32 F1 − D12 F3 + D13 F2 − D23 F1 = 0.
Definición 6.6.10. Sea A un abierto de Rn . Sea f : A ⊂ Rn −→ R un campo escalar y supongamos
que existen D11 f, · · · , Dnn f en A. Se define el operador de Laplace (o Laplaciano) de f como la
divergencia del gradiente de f . Se denota por ∇2 f (∆f ) y entonces
∇2 f = D11 f + · · · + Dnn f.
Ejemplo 6.6.11. Sea f : R3 → R un campo escalar dado por
f (x) = x2 + y 2 + z 2 ,
siendo x = (x, y, z). Entonces,
∇2 f (x) = D11 f (x) + D22 f (x) + D33 f (x) = 2 + 2 + 2 = 6.

140
Matemáticas: Cálculo I

Capítulo 7

Aplicaciones del cálculo diferencial

7.1. Extremos relativos


Definición 7.1.1. Sea A un subconjunto abierto de Rn . Sea f : A ⊂ Rn −→ R un campo escalar.
Se dirá que f tiene en x0 ∈ A un máximo relativo (respectivamente un mínimo relativo), si existe
r > 0 tal que la bola BRn (x0 , r) ⊂ A y f (x) ≤ f (x0 ) (respectivamente, f (x) ≥ f (x0 )), para todo
x ∈ BRn (x0 , r) tal que x 6= x0 .
Se dirá que f tiene en x0 ∈ A un máximo relativo estricto (respectivamente un mínimo
relativo estricto), si existe r > 0 tal que la bola BRn (x0 , r) ⊂ A y f (x) < f (x0 ) (respectivamente,
f (x) > f (x0 )), para todo x ∈ BRn (x0 , r) tal que x 6= x0 .
El primer resultado de esta sección, proporciona una condición necesaria para la existencia
de extremos relativos de funciones escalares diferenciables.
Teorema 7.1.2. (Condición necesaria de primer orden para la existencia de extremos relativos.)
Sea A un subconjunto abierto de Rn . Sea f : A ⊂ Rn −→ R un campo escalar. Si f tiene un
extremo relativo en x0 y f es diferenciable en una bola centrada en x0 y contenida en A, se tiene
que ∇f (x0 ) = θRn .
Nota 7.1.3. El resultado anterior proporciona una condición necesaria. Como sabemos por la teoría
de funciones de una variable el recíproco del teorema previo no es cierto en general: recuérdese que
la función f (x) = x3 tiene derivada nula en el punto x0 = 0 y no presenta un extremo en dicho
punto.
Si ∇f (x0 ) = θRn y f no alcanza un extremo en x0 , se dice que f tiene en x0 un punto de silla.
En estos puntos, la gráfica del campo escalar f crece en algunas direcciones cerca de x0 y decrece
en otras. Por ejemplo, esto es lo que pasa en un entorno del punto (0, 0) para el campo escalar
x2 y 2
f ((x, y)) = − . La gráfica de dicho campo da lugar a un paraboloide hiperbólico.
16 9

x2 y 2
f ((x, y)) = −
16 9
141
Matemáticas: Cálculo I.

Los puntos x0 ∈ A tales que ∇f (x0 ) = θRn se llaman puntos críticos de la función. Por
ejemplo, (0, 0) es un punto crítico para el campo escalar
x2 y 2
f ((x, y)) =−
16 9
definido antes. Sin embargo, f no presenta un extremo en (0, 0).
Definición 7.1.4. Sea M ∈ Mn×n (R) una matriz simétrica y sea ωM : Rn → R,
ωM (x) = xM xt
su forma cuadrática asociada.
(i) Diremos que M es una matriz definida positiva si ωM (x) > 0 para todo x ∈ Rn , x 6= θRn .
(ii) Diremos que M es una matriz definida negativa si ωM (x) < 0 para todo x ∈ Rn , x 6= θRn .
(iii) Diremos que M es una matriz indefinida si existen un par de vectores x, z Rn tales que
ωM (x) > 0 y ωM (z) < 0.
El siguiente resultado permite caracterizar de forma sencilla, usando determinantes, las ma-
trices definidas positivas o negativas.
Teorema 7.1.5. Sea M ∈ Mn×n (R) una matriz simétrica y sea ∆k el k-ésimo menor principal
de M , i. e.,
m11 . . . m1k

m21 . . . m2k
∆k = .. .. .

. .

mk1 . . . mkk
(1) La matriz M es definida positiva si, y solo si, ∆k > 0 para todo k ∈ {1, . . . , n}.
(2) La matriz M es definida negativa si, y solo si, ∆2r+1 < 0 y ∆2r > 0 para r = 0, 1, . . . . Esto
es, los menores de orden impar son negativos y los de orden par son positivos:
∆1 < 0, ∆2 > 0, ∆3 < 0, . . .
(3) Si el determinante de M es no nulo, M es indefinida en cualquier otro caso que sea distinto
de los dos primeros.
Gracias a los autovalores de la matriz M también podemos caracterizar si es definida positiva
o negativa.
Teorema 7.1.6. Sea M ∈ Mn×n (R) una matriz simétrica.
(1) La matriz M es definida positiva si, y solo si, todos sus autovalores son positivos.
(2) La matriz M es definida negativa si, y solo si, todos sus autovalores son negativos.
(3) Si el determinante de M es no nulo, M es indefinida si, y solo si, admite autovalores
positivos y negativos.
Ejemplo 7.1.7. Por ejemplo, la matriz
 
−1 −2
M=
−2 −6
es definida negativa ya que
∆1 = −1 < 0, ∆2 = det(A) = 2 > 0.
Por otro lado, la matriz  
−1 −2
M=
−2 6
es indefinida, ya que
∆1 = −1 < 0, ∆2 = det(A) = −10 < 0.
142
Matemáticas: Cálculo I.

Teorema 7.1.8. (Condición suficiente de segundo orden para la existencia de extremos) Sea A
un subconjunto abierto de Rn y sea f : A ⊂ Rn −→ R un campo escalar. Supongamos que f es de
clase dos en una bola abierta centrada en x0 ∈ A y contenida en A y que además ∇f (x0 ) = θRn .
Entonces:
(1) Si Hf (x0 ) es definida positiva, f presenta en x0 un mínimo relativo estricto.
(2) Si Hf (x0 ) es definida negativa, f presenta en x0 un máximo relativo estricto.
(3) Si Hf (x0 ) es indefinida con determinante no nulo, se tiene que x0 no es un punto de extremo
relativo para f . En este caso x0 es un punto de silla.

Ejemplo 7.1.9. Sea el campo escalar f : R2 → R dado por

f (x) = x3 + 3xy + y 3

siendo x = (x, y).


Es claro que f ∈ C 2 (R2 ), además como

∇f (x) = (3x2 + 3y, 3x + 3y 2 ),

la igualdad

∇f (x) = (0, 0)

es equivalente a que:

3x2 + 3y = 0 ⇔ −y = x2 ,
3x + 3y 2 = 0 ⇔ −x = y 2 .

Por lo tanto, los únicos puntos que anulan el gradiente son (0, 0) y (−1, −1).
La matriz de Hesse está dada por
 
6x 3
Hf (x) = .
3 6y

En consecuencia:
 
0 3
Hf ((0, 0)) = ,
3 0

 
−6 3
Hf ((−1, −1)) =
3 −6

y esto implica que:


Para Hf (0, 0), ∆1 = 0 y ∆2 = −9, por lo tanto, la matriz no es ni definida positiva ni
definida negativa. Como su determinante es no nulo, esto implica que en el punto (0, 0) se
tiene un punto de silla.

Para Hf (−1, −1), ∆1 = −6 y ∆2 = 27, por lo tanto, la matriz de Hesse es definida negativa
y podemos asegurar que f tiene en (−1, −1) un máximo relativo estricto.

143
Matemáticas: Cálculo I.

f (x) = x3 + 3xy + y 3

Ejemplo 7.1.10. Sea el campo escalar f : R3 → R dado por


f (x) = (x2 − 1)y + y 2 + x2 + z 2 (x2 + 1)
siendo x = (x, y, z).
Es claro que f ∈ C 2 (R3 ), además como
∇f (x) = (2xy + 2x + 2xz 2 , 2y + x2 − 1, 2z(x2 + 1)),
la igualdad ∇f (x) = (0, 0, 0) es equivalente a que:
2xy + 2x + 2xz 2 = 0
2y + x2 − 1 = 0 .
2z(x2 + 1) = 0
Entonces z = 0, ya que x2 + 1 es siempre distinto de cero. Teniendo en cuenta esto, el sistema
anterior se reduce a
2xy + 2x = 0
2y + x2 − 1 = 0
y, de la primera ecuación, obtenemos que x = 0 o y = −1. Si x = 0, usando la segunda ecuación,
2
√ que y = 1/2. Si y = −1, usando otra vez la segunda ecuación, se tiene que x = 3, i. e.,
se tiene
x = ± 3.
Por lo tanto, aparecen tres candidatos a extremos:
√ √
P1 = (0, 1/2, 0), P2 = ( 3, −1, 0), P3 = (− 3, −1, 0).
144
Matemáticas: Cálculo I.

La matriz de Hesse está dada por


2y + 2 + 2z 2 2x
 
4xz
Hf (x) =  2x 2 0 .
4xz 2
0 2(x + 1)
En consecuencia:
   √ 
3 0 0 √ 0
√ 2 3 0
Hf ((0, 1/2, 0)) =  0 2 0  , Hf ( 3, −1, 0) =  2 3 2 0 ,
0 0 2 0 0 8
 √ 
√ 0√ −2 3 0
Hf (− 3, −1, 0) =  −2 3 2 0 .
0 0 8
y esto implica que:
Para Hf ((0, 1/2, 0)) los tres autovalores son positivos, por lo tanto, la matriz es definida
positiva y esto implica que en el punto (0, 1/2, 0) se tiene un mínimo.

Para Hf (( 3, −1, 0)) la matriz no es ni definida
√ positiva ni definida negativa. Como su
determinante es no nulo, esto implica que en ( 3, −1, 0) se tiene un punto de silla.

Para Hf ((− 3, −1, 0)) la matriz no es ni definida
√ positiva ni definida negativa. Como su
determinante es no nulo, esto implica que en (− 3, −1, 0) se tiene un punto de silla.
Definición 7.1.11. Sea B un subconjunto de Rn y sea f : B ⊂ Rn −→ R un campo escalar. Sea
x0 ∈ B. Se dice que f alcanza en x0 un máximo absoluto si f (x) ≤ f (x0 ) para todo x ∈ B. Si
f (x) ≥ f (x0 ) para todo x ∈ B, diremos que f alcanza en x0 un mínimo absoluto.
Cuando estudiamos la noción de continuidad para funciones de una sola variable pudimos ver
como toda función continua definida en un intervalo cerrado y acotado [a, b] alcanza un máximo
y un mínimo absolutos. A continuación se enunciará un resultado que amplía esta propiedad a
campos escalares.
Teorema 7.1.12. (Existencia de extremos absolutos) Sea B un subconjunto cerrado y acotado de
Rn y sea f : B ⊂ Rn −→ R un campo escalar continuo en B. Entonces f alcanza en B un máximo
y un mínimo absolutos.
Nota 7.1.13. Sea B un subconjunto cerrado y acotado de Rn y sea f : B ⊂ Rn −→ R un campo
escalar continuo en B. Para localizar los extremos absolutos de f en B se procede de la siguiente
forma:
(i) Se localizan los puntos contenidos en el interior de B (abierto más grande contenido en B)
donde se anula el gradiente de f (puntos críticos de f en el interior de B).

(ii) Se localizan los puntos contenidos en el interior de B donde f no es diferenciable.

(iii) Se localizan los candidatos a extremos del campo escalar f restringido a la frontera de B.

(iv) Se calcula el valor de f en cada uno de los puntos obtenidos en los apartados (i), (ii) y (iii).
En aquellos donde f alcance el valor mayor, se encontrarán los máximos absolutos, y en
aquellos donde alcance el valor menor tendremos los mínimos absolutos.
Ejemplo 7.1.14. Sea el campo escalar f : R2 → R dado por
f (x) = x2 + y 2 − xy + x + y
145
Matemáticas: Cálculo I.

siendo x = (x, y). Si tomamos el conjunto


B = {x ∈ R2 / x ≤ 0, y ≤ 0, x + y ≥ −3}
se cumple que B es cerrado y acotado y que f es continuo en B. En la siguiente figura podemos
ver una representación de B
y

(−3, 0) R2
x

R3
R1

(0, −3)

en la que se observa que su frontera F r(B) está dividida en tres zonas distintas:
F r(B) = R1 ∪ R2 ∪ R3
donde
R1 = {x ∈ R2 / x = 0, −3 ≤ y ≤ 0},
R2 = {x ∈ R2 / y = 0, −3 ≤ x ≤ 0},
R3 = {x ∈ R2 / y = −x − 3, −3 ≤ x ≤ 0}.
El interior de B esta dado por
{x ∈ R2 / x < 0, y < 0, x + y > −3},
i. e., la parte pintada en amarillo de la siguiente figura
y

(−3, 0)
x

(0, −3)

Como la función f es de clase infinito en todo R2 , si admite algún extremo en el interior de


B, necesariamente será en un punto del interior de B donde se anule el gradiente. Entonces,
∇f (x) = (2x − y + 1, 2y − x + 1),
146
Matemáticas: Cálculo I.

y la igualdad ∇f (x) = (0, 0) es equivalente a que

2x − y + 1 = 0 ⇔ 2x − y = −1,
2y − x + 1 = 0 ⇔ −x + 2y = −1.

Por lo tanto, tenemos un sistema lineal compatible determinado cuya única solución es P1 =
(−1, −1). Este punto está en el interior de B y esto implica que es candidato a extremo absoluto.
La restricción de la función f a R1 da lugar a una nueva función de una sola variable dada
por f1 : [−3, 0] → R donde:

f1 (y) = y 2 + y.

Los posibles candidatos a extremos son los puntos y ∈ (−3, 0) para los cuales f10 (y) = 0,
y = −3 e y = 0. Como f10 (y) = 2y + 1 = 0 si, y solo si, y = −1/2, obtenemos los siguientes
candidatos

P2 = (0, −3), P3 = (0, −1/2), P4 = (0, 0).

La restricción de la función f a R2 da lugar a una nueva función de una sola variable dada
por f2 : [−3, 0] → R donde:

f2 (x) = x2 + x.

Los posibles candidatos a extremos son los puntos x ∈ (−3, 0) para los cuales f20 (x) = 0,
x = −3 y x = 0. Como f20 (x) = 2x + 1 = 0 si, y solo si, x = −1/2, obtenemos los siguientes nuevos
candidatos

P5 = (−3, 0), P6 = (−1/2, 0).

La restricción de la función f a R3 da lugar a una nueva función de una sola variable dada
por f3 : [−3, 0] → R donde:

f3 (x) = x2 + (−3 − x)2 − x(−3 − x) + x + (−3 − x) = 3x2 + 9x + 6.

Los posibles candidatos a extremos son los puntos x ∈ (−3, 0) para los cuales f30 (x) = 0,
x = −3 y x = 0. Como f30 (x) = 6x + 9 = 0 si, y solo si, x = −3/2, obtenemos el siguiente nuevo
candidato

P7 = (−3/2, −3/2).

Para todos los candidatos se tiene

f (P1 ) = −1, f (P2 ) = 6, f (P3 ) = −1/4, f (P4 ) = 0, f (P5 ) = 6,

f (P6 ) = −1/4, f (P7 ) = −3/4

y, como consecuencia, podemos asegurar que f presenta un mínimo absoluto en P1 y dos máximos
absolutos en P2 y en P5 .
147
Matemáticas: Cálculo I.

x2 y 2
f ((x, y)) = −
16 9

7.2. Extremos condicionados


En muchos problemas de cálculo de extremos se desea maximizar o minimizar un cierto campo
escalar sujeto a ciertas restricciones o condiciones adicionales. Por ejemplo: maximizar el campo
escalar f : R2 → R sujeto a la condición x2 + y 2 = 1.

Teorema 7.2.1. (Teorema de los Multiplicadores de Lagrange) Sea A un subconjunto abierto de


Rn . Sea f : A ⊂ Rn → R un campo escalar y g : A ⊂ Rn → Rm una función de varias variables tal
que m < n. Supongamos que f y g son de clase uno en A. Entonces, si x0 es un extremo relativo de
f condicionado por g(x) = θRm y rang(Dg(x0 )) = m, existen λ1 , . . . , λm escalares reales, llamados
multiplicadores de Lagrange, tales que x0 es un punto crítico del campo escalar
F = f + λ1 g1 + · · · + λm gm .

Nota 7.2.2. El teorema anterior se puede usar para determinar los extremos absolutos de un
campo escalar de clase uno f : Rn → R en un conjunto cerrado y acotado B. El método consiste
en lo siguiente: en primer lugar se calcularían los puntos críticos de f en el interior de B igualando
su gradiente a cero y a continuación usaríamos el Teorema de los Multiplicadores de Lagrange
para encontrar los extremos en la frontera de B.

Ejemplo 7.2.3. Sea A el subconjunto abierto de R3 dado por


A = {x = (x, y, z) ∈ R3 / x > 0, y > 0, z > 0}.
148
Matemáticas: Cálculo I.

Sea f : A ⊂ R3 → R el campo escalar definido como


f (x) = ln(x) + ln(y) + 3 ln(z).
Supongamos que tenemos el campo escalar g : A ⊂ R3 → R donde
g(x) = x2 + y 2 + z 2 − 20.
Entonces es claro que ambos campos son de clase uno en R3 y que m = 1 < n = 3. En este
ejemplo trataremos de encontrar los candidatos a extremos condicionados de f cuando usamos la
restricción g(x) = 0, i. e., x2 + y 2 + z 2 = 20.
Siguiendo el Teorema de los Multiplicadores de Lagrange tomemos el nuevo campo escalar
F = f + λg.
Entonces,
F (x) = f (x) + λg(x) = ln(x) + ln(y) + 3 ln(z) + λ(x2 + y 2 + z 2 − 20).
Todos los extremos condicionados de f por g(x) = 0 son puntos críticos de F . Por lo tanto,
los candidatos a extremos condicionados surgen de igualar el gradiente de F a cero. Como
1 1 3
∇F (x) = ( + 2λx, + 2λy, + 2λz)
x y z
tenemos que ∇F (x) = (0, 0, 0) si, y solo si,
1
+ 2λx = 0,
x
1
+ 2λy = 0,
y

3
+ 2λz = 0.
z
o, equivalentemente,
2λx2 = −1,
2λy 2 = −1,
2λz 2 = −3.
Por otro lado, como x2 + y 2 + z 2 = 20, sumando las tres ecuaciones anteriores obtenemos que
2λ(x2 + y 2 + z 2 ) = −5. Esto implica que
5 1
40λ = −5 ⇐⇒ λ = − =−
40 8
y, como consecuencia,
x2 = 4,
y 2 = 4,
z 2 = 12.
Como las tres componentes del punto crítico tienen que estar en A solo tenemos un candidato
que es √
P = (2, 2, 2 3).
Teorema 7.2.4. (Condiciones suficientes) Sea A un subconjunto abierto de Rn . Sea f : A ⊂
Rn → R un campo escalar y g : A ⊂ Rn → Rm una función de varias variables tal que m < n.
Supongamos que f y g son de clase dos en A. Sea x0 ∈ A tal que g(x0 ) = θRm y que rang(Dg(x0 )) =
m. Sea
U = {u ∈ Rn / Dg(x0 )u = θRm } = Ker(Dg(x0 ))
149
Matemáticas: Cálculo I.

Si x0 es un punto crítico de
F = f + λ1 g1 + · · · + λm gm
y ω : U ⊂ Rn → R la forma cuadrática dada por
ω(u) = uHF (x0 )ut
Entonces:
(i) Si ω es definida positiva, f presenta en x0 un mínimo local estricto condicionado por g(x0 ) =
θRm .
(ii) Si ω es definida negativa, f presenta en x0 un máximo local estricto condicionado por
g(x0 ) = θRm .
(iii) Si ω es indefinida y no degenerada, f presenta en x0 un punto de silla.
Nota 7.2.5. Al igual que en casos anteriores, como estamos denotando los vectores en fila, tenemos
que
Dg(x0 )u = (Dg(x0 )ut )t .
Ejemplo 7.2.6. Volvamos al Ejemplo 7.2.3. En este caso f y g son de clase dos y
Dg(x) = (2x, 2y, 2z)
Por lo tanto, el rango de √ √
Dg((2, 2, 2 3)) = (4, 4, 4 3)
es uno y coincide con m.
Por otro lado,
√ √
U = {u = (u1 , u2 , u3 ) ∈ R3 / (4, 4, 4 3)u = 0} = {u = (u1 , u2 , u3 ) ∈ R3 / u1 + u2 + 3u3 = 0}
√ √
3 3 3
= {u = (u1 , u2 , u3 ) ∈ R / u3 = − u1 − u2 }
3 3
y la matriz de Hesse está dada por
 1 
− 2 + 2λ 0 0
 x 
 1 
HF (x) =   0 − 2 + 2λ 0 .
y 
3
 
0 0 − 2 + 2λ
z
Para λ = −1/8
1
 
 2 − 0 0


 1 
HF ((2, 2, 2 3)) =  0 −
 0 
2 
 1 
0 0 −
2
y esto implica que ya es definida negativa en todo R3 . En cualquier caso,
√ √
3 3
ω((u1 , u2 , − u1 − u2 ))
3 3
1
 
 −2 0 0  u1

√ √
3 3  1  u2 √
= (u1 , u2 , − u1 − u2 )  0 − λ 0   √

3 3 3 3

 2 
 1  − u1 − u2
0 0 − + 3 3
√ 2 √
2 2 3 3
= −u1 /2 − −u2 /2 − 1/2( u1 + u2 ) < 0
3 3
150
Matemáticas: Cálculo I.

para todo vector no nulo de U . √


Por lo tanto, f presenta en P = (2, 2, 2 3) un máximo local estricto condicionado por x2 +
y 2 + z 2 = 20.
Ejemplo 7.2.7. En este caso, utilizando los multiplicadores de Lagrange, calcularemos los extremos
del campo escalar f (x) = x + y + z condicionados por x2 + y 2 = 2 y x + z = 1.
El campo escalar f es de clase dos en R3 . Por otro lado, las dos condiciones provienen de
igualar al vector (0, 0) el campo vectorial g : R3 → R2 definido como
g(x) = (x2 + y 2 − 2, x + z − 1) = (g1 (x), g2 (x)).
Se tiene que m = 2 < 3 y  
2x 2y 0
Dg(x) =
1 0 1
tiene rango dos siempre que x o y sean no nulos.
Sea
F = f + λ1 g1 + λ2 g2 .
Entonces,
F (x) = x + y + z + λ1 (x2 + y 2 − 2) + λ2 (x + z − 1)
y ∇F (x) = (0, 0, 0) si, y solo si,
1 + 2λ1 x + λ2 = 0,

1 + 2λ1 y = 0,

1 + λ2 = 0.
Esto implica que λ2 = −1 y, utilizando la primera ecuación, llegamos a la conclusión de que
2λ1 x = 0 ⇐⇒ λ1 = 0 o x = 0.
Si λ1 = 0, por la segunda ecuación, tenemos que 1 =√0 (lo que es imposible). Entonces
necesariamente x = 0 y, como x2 + y 2 = 2, se tiene que y = ± 2. Además, como x + z = 1, z = 1.
Finalmente, √
1 1 2
λ1 = − =± √ =± .
2y 2 2 4
Así pues, los candidatos a extremos condicionados son

√ 2
P1 = (0, − 2, 1), λ1 = , λ2 = −1,
4

√ 2
P2 = (0, 2, 1), λ1 = − , λ2 = −1
4
y la matriz de Hesse es  
2λ1 0 0
HF (x) =  0 2λ1 0  .
0 0 0

Estudiemos el primer caso. En primer lugar el rango de Dg((0, − 2, 1)) es máximo y

U = {u = (u1 , u2 , u3 ) ∈ R3 / Dg((0, − 2, 1))u = θR2 }

3 −2 2u2 = 0
= {u = (u1 , u2 , u3 ) ∈ R / }
u1 + u3 = 0
= {u = (u1 , 0, −u1 ) ∈ R3 / u1 ∈ R}.
151
Matemáticas: Cálculo I.

Como  √ 
2
0 0 
√  2 √
HF ((0, − 2, 1)) =  2 ,
 
 0 0 
2
0 0 0
se tiene que
ω((u1 , 0, −u1 ))
 √ 
2
 2 0 0   u1 

= (u1 , 0, −u1 )  2 0 
 

 0 0  −u
2 1
0 0 0

2 2
= u >0
2 1
para todo vector no nulo de U . √
Por lo tanto, f presenta en P1 = (0, − 2, 1) un mínimo local estricto condicionado por
x2 + y 2 = 2 y x + z = 1. √
Veamos ahora el otro caso. En primer lugar el rango de Dg((0, 2, 1)) es máximo y

U = {u = (u1 , u2 , u3 ) ∈ R3 / Dg((0, 2, 1))u = θR2 }

2 2u2 = 0
= {u = (u1 , u2 , u3 ) ∈ R3 / }
u1 + u3 = 0
= {u = (u1 , 0, −u1 ) ∈ R3 / u1 ∈ R}.
Como  √ 
2
− 0 0 
√  2 √
HF ((0, 2, 1)) =  2 ,
 
 0 − 0 
2
0 0 0
se tiene que
ω((u1 , 0, −u1 ))
 √ 
2
 − 2 0

0   u1 
= (u1 , 0, −u1 )  2 0 
 


 0 0  −u
2 1
0 0 0

2 2
=− u <0
2 1
para todo vector no nulo de U . √
Por lo tanto, f presenta en P2 = (0, 2, 1) un máximo local estricto condicionado por x2 +y 2 =
2 y x + z = 1.
Ejemplo 7.2.8. Sea f : R2 → R el campo escalar definido por f (x) = y 2 − 4x y tomemos el
conjunto cerrado y acotado dado por la bola cerrada de centro (0, 0) y radio r = 3., i. e.,
BR2 [(0, 0), 3] = {x = (x, y) ∈ R2 / x2 + y 2 ≤ 9}.
Está claro que f es un campo escalar de clase dos y, como ∇f (x) = (−4, 2y) 6= (0, 0), f no
tiene puntos críticos en el interior de BR2 [(0, 0), 3] (el interior de BR2 [(0, 0), 3] es la bola abierta
BR2 ((0, 0), 3)).
152
Matemáticas: Cálculo I.

Como la frontera de BR2 [(0, 0), 3] son los puntos


F r(BR2 [(0, 0), 3]) = {x = (x, y) ∈ R2 / x2 + y 2 = 9},
para encontrar candidatos a extremos en dicho conjunto tenemos que plantear un problema de
extremos condicionados para f con condicionamiento dado por x2 + y 2 = 9, i. e., por la anulación
del campo escalar de clase dos g : R2 → R definido por g(x) = x2 + y 2 − 9. Para este campo
Dg(x) = (2x, 2y) y, entonces, el rango de Dg(x) es máximo para todo punto no nulo de R2 .
Además, en este caso m = 1 < 2.
Sea
F = f + λg.
Entonces,
F (x) = y 2 − 4x + λ(x2 + y 2 − 9)
y ∇F (x) = (0, 0) si, y solo si,
2λx − 4 = 0,

2y(1 + λ) = 0.
Gracias a la segunda ecuación sabemos que y = 0 o λ = −1. Si y = 0, como x2 + y 2 = 9,
tenemos que x2 = 9, i. e., x = ±3. Cuando x = 3 se cumple que 6λ − 4 = 0 o, equivalentemente,
2 2
λ = . Por otro lado, si x = −3 se cumple que −6λ − 4 = 0 o, equivalentemente, λ = − . En el
3 3
caso λ = −1, gracias√a la primera ecuación, obtenemos x = −2 y, como x2 + y 2 = 9, tenemos que
y 2 = 5, i. e., y = ± 5. Por lo tanto, tenemos cuatro candidatos en la frontera de BR2 [(0, 0), 3]
para ser extremos condicionados. Estos son
2
P1 = (3, 0), λ = ,
3
2
P2 = (−3, 0), λ = − ,
√ 3
P3 = (−2, 5), λ = −1,

P4 = (−2, − 5), λ = −1
y la matriz de Hesse es  
2λ 0
Hf (x) = .
0 2 + 2λ
Estudiemos el primer caso. En primer lugar el rango de Dg((3, 0)) = (6, 0) es máximo y
U = {u = (u1 , u2 ) ∈ R2 / Dg((3, 0))u = 0}
= {u = (u1 , u2 ) ∈ R3 / 6u1 = 0}
= {u = (0, u2 ) ∈ R2 / u2 ∈ R}.
Como  
4
 3 0 
HF ((3, 0)) =  10 
0
3
se tiene que  
4
 3 0   0  10
ω((0, u2 )) = (0, u2 )  10  u2 = u22 > 0
0 3
3
para todo vector no nulo de U . Por lo tanto, f presenta en P1 = (3, 0) un mínimo local estricto
condicionado por x2 + y 2 = 9.
153
Matemáticas: Cálculo I.

Para el segundo caso tenemos lo siguiente: el rango de Dg((−3, 0)) = (−6, 0) es máximo y
U = {u = (u1 , u2 ) ∈ R2 / Dg((−3, 0))u = 0}
= {u = (u1 , u2 ) ∈ R2 / − 6u1 = 0}
= {u = (0, u2 ) ∈ R2 / u2 ∈ R}.
Como  
4
 −3 0 
HF ((−3, 0)) =  2 ,
0
3
se tiene que  
4
 −3 0  0  2
ω((0, u2 )) = (0, u2 )  2  u2 = u22 > 0
0 3
3
para todo vector no nulo de U . Por lo tanto, f presenta en P2 = (−3, 0) un mínimo local estricto
condicionado por x2 + y 2 = 9. √ √
En el tercer caso el rango de Dg((−2, 5)) = (−4, 2 5) es máximo y

U = {u = (u1 , u2 ) ∈ R2 / Dg((−2, 5))u = 0}

= {u = (u1 , u2 ) ∈ R2 / − 4u1 + 2 5u2 = 0}

5
= {u = ( u2 , u2 ) ∈ R2 / u2 ∈ R}.
2
Como

 
−2 0
HF ((−2, 5)) = ,
0 0
se tiene que
 √
√ √

5 5
  5
ω(( u2 , u2 )) = ( u2 , u2 )
−2 0  u2  = − 5 u2 < 0
2 2 0 0 2 2 2
u2

para todo vector no nulo de U . Por lo tanto, f presenta en P3 = (−2, 5) un máximo local estricto
condicionado por x2 + y 2 = 9. √ √
Finalmente, el rango de Dg((−2, − 5)) = (−4, −2 5) es máximo y

U = {u = (u1 , u2 ) ∈ R2 / Dg((−2, − 5))u = 0}

= {u = (u1 , u2 ) ∈ R2 / − 4u1 − 2 5u2 = 0}

5
= {u = (− u2 , u2 ) ∈ R2 / u2 ∈ R}.
2
Como

 
−2 0
HF ((−2, − 5)) = ,
0 0
se tiene que
 √
√ √

5 5
  5
ω((− u2 , u2 )) = (− u2 , u2 )
−2 0  − u2  = − 5 u2 < 0
2 2 0 0 2 2 2
u2

para todo vector no nulo de U . Por lo tanto, f presenta en P4 = (−2, − 5) un máximo local
estricto condicionado por x2 + y 2 = 9.
154
Matemáticas: Cálculo I.

Como BR2 [(0, 0), 3] es cerrado y acotado y f es un campo escalar continuo en BR2 [(0, 0), 3],
se puede asegurar que f admite extremos absolutos en BR2 [(0, 0), 3]. Los candidatos saldrán de
los extremos condicionados calculados anteriormente. Como
f (P1 ) = −12, f (P2 ) = 12, f (P3 ) = 13, f (P4 ) = 13,
tenemos dos máximos absolutos en P3 y P4 y un mínimo absoluto en P1 .

x2 y 2
f ((x, y)) = −
16 9

7.3. El Método de Newton


Sea A un conjunto abierto de Rn . Sea f : A ⊂ Rn −→ Rn una función de varias variables.
Para resolver la ecuación
f (x) = θRn
se puede utilizar una generalización del Método de Newton que hemos estudiado en la última
sección del Tema 5 (ver Sección 5.11). Para ello se construye una sucesión de vectores {xm } donde
se parte de un x0 inicial y, por recurrencia, se construye xm+1 como
xm+1 = xm − Df (xm )−1 f (xm )
donde, como estamos escribiendo los vectores en fila,
Df (xm )−1 f (xm ) = (Df (xm )−1 f (xm )t )t
y, obviamente, estamos suponiendo que existe la matriz inversa de la matriz de Jacobi Df (xn ) en
cada uno de los pasos.
155
Matemáticas: Cálculo I.

Obtener la expresión
Df (xm )−1 f (xm )
es, en general, muy costoso en términos computacionales ya que implica calcular en cada paso la
inversa de una matriz. Ahora bien, para evitar este problema se puede implementar la estrategia
siguiente: si definimos
∆xm = xm+1 − xm
se tiene que
∆xm = −Df (xm )−1 f (xm ) ⇐⇒ Df (xm )∆xm = −f (xm ).
Entonces, dado xn , se calcula ∆xn resolviendo el sistema anterior y a continuación se obtiene
xn+1 como
xm+1 = xm + ∆xm .
Bajo buenas condiciones se puede garantizar que la anterior sucesión de vectores converge a
una solución de la ecuación inicial.

156

También podría gustarte