Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

02MAIR Calculo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 70

Cálculo

02MIAR | Matemáticas para la IA


Funciones reales de variable real
Una función real de variable real es una función de la forma f : A ! R, donde A ✓ R.
Cuando se especifique sólo la regla y no el dominio de la función, se entenderá que éste
es el mayor subconjunto de los números reales posible donde dicha regla tiene sentido.
Ejemplos
1. Tiene sentido definir la función f (x) = x 2 sobre todos los números reales, es decir,
f : R ! R.
p
2. La función f (x) = x sólo tiene sentido tomarla sobre los números no negativos,
luego f : [0, +1) ! R.
3. La función f (x) = log(x) sólo tiene sentido tomarla sobre los números positivos,
luego f : (0, +1) ! R.
4. Tiene sentido definir la función f (x) = x1 sobre todos los reales salvo el 0, luego
f : ( 1, 0) [ (0, +1) ! R.
Funciones reales de variable real
Una función real de variable real f : A ! R puede representarse gráficamente en dos
dimensiones, considerando como coordenada X (abscisas) los diferentes valores del
dominio y como coordenada Y (ordenadas) los valores de f asociados:
{(x, f (x)) 2 R2 : x 2 A}.
Funciones reales de variable real
Consideremos la función siguiente:
2x 2
f (x) = .
x2 1
¿Qué ocurre en x = 1? ¿Y en x = 1?
Cálculo infinitesimal

Definición
Sea f : A ! R y c 2 A, de forma que (c ⇢, c + ⇢) ✓ A para algún ⇢ > 0. Diremos que
existe el lı́mite L 2 R de f cuando x tiende a c, que denotaremos por lı́m f (x) = L, si
x!c

8" > 0, 9 " > 0 : 0 < |x c| < " ! |f (x) L| < ".

Intuitivamente, lo que indica la definición anterior es el siguiente enunciado: dado un


margen de error cualquiera, podemos encontrar un intervalo lo suficientemente pequeño
centrado en c (asociado al margen de error proporcionado), de forma que la distancia
entre f (x) y L está siempre por debajo de ese margen de error dado en el intervalo
considerado.
Cálculo infinitesimal
Cálculo infinitesimal
Definición
I Diremos que lı́m f (x) = L si
x!c±

8" > 0, 9 " > 0 : 0 < ±(x c) < " ! |f (x) L| < ".
I Diremos que lı́m f (x) = ±1 si
x!c±

8M > 0, 9 M > 0 : 0 < ±(x c) < M ! ±f (x) > ±M.


I Diremos que lı́m f (x) = 1 si
x!c
8M > 0, 9 M > 0 : 0 < |x c| < M ! |f (x)| > M.
I Diremos que lı́m f (x) = L si
x!±1
8" > 0, 9K" > 0 : ±x > ±K" ! |f (x) L| < ".
I Diremos que lı́m f (x) = ±1 si
x!±1
8M > 0, 9KM > 0 : ±x > ±KM ! ±f (x) > ±M.
Cálculo infinitesimal

Teorema
Se cumple:
9 lı́m f (x) = L $ 9 lı́m f (x) = L ^ 9 lı́m+ f (x) = L.
x!c x!c x!c

Propiedades
Si 9 lı́m f (x) = L1 y 9 lı́m g (x) = L2 , entonces:
x!c x!c
I 9 lı́m f (x) ± g (x) = L1 ± L2 .
x!c
I 9 lı́m f (x)g (x) = L1 L2 .
x!c
f (x) L1
I Si L2 6= 0, 9 lı́m = .
x!c g (x) L2
Continuidad
Definición
Diremos que una función f es continua en un punto c si

9 lı́m f (x) = f (c).


x!c

En caso de que la continuidad se dé en todos los puntos de su dominio, diremos además
que f es continua.

Ejemplos
1. Todas las funciones polinómicas son continuas.
2. f (x) = |x| es continua.
3. f (x) = log(x) es continua en todo su dominio.
p
4. f (x) = x es continua en todo su dominio.
Continuidad

Ejemplos
5. Sea f dada por (
x 2 + 1 x < 0,
f (x) =
x 1 x 0.
Entonces

lı́m f (x) = lı́m (x 2 + 1) = 1 6= lı́m+ f (x) = lı́m+ (x 1) = 1,


x!0 x!0 x!0 x!0

luego 6 9 lı́m f (x), por lo que f no es continua en 0.


x!0
Continuidad

Ejemplos
6. Sea f dada por 8
> 3
<x + 2 x < 1,
f (x) = 4 x = 1,
>
:
5x 2 x > 1.
Entonces

lı́m f (x) = lı́m (x 3 + 2) = 3 = lı́m+ f (x) = lı́m+ (5x 2) = 3.


x!1 x!1 x!1 x!1

Luego 9 lı́m f (x) = 3. Sin embargo, f (1) = 4 6= 3, por lo que f no es continua en 1.


x!1
Continuidad

Ejemplos
7. Sea f dada por 8
2x 2
>
< x2 1
x26 { 1, 1},
f (x) = 0 x = 1,
>
:
1 x = 1.
Entonces
2x2
I lı́m f (x) = lı́m = 1 = f (1), luego f es continua en 1.
x!1 x!1 x 2
1
2x 2
I lı́m f (x) = lı́m = +1 = 6 0 = f ( 1), luego f no es continua en 1.
x! 1 + x! 1 x 2
+ 1
Continuidad

Propiedades
Sean f y g funciones continuas en c 2 R. Entonces:
I f ± g es continua en c.
I fg es continua en c.
f
I Si g (c) 6= 0, entonces es continua en c.
g
I g f es continua en c.
Continuidad

Teorema (Teorema de Bolzano)


Sea f : A ! R continua y a, b 2 R, con a < b y [a, b] ✓ A. Si f (a)f (b) < 0, entonces
9c 2 (a, b) tal que f (c) = 0.

Ejemplo
Probemos que la ecuación sin(x) = cos(x) tiene una solución entre 0 y ⇡2 . En efecto, si
definimos f (x) = sin(x) cos(x), se tiene por una parte que f (0) = 1 y, por otra
parte, f ⇡2 = 1, luego f (0)f ( ⇡2 ) < 0, por lo que 9c 2 (0, ⇡2 ) tal que f (c) = 0, es decir:

f (c) = 0 $ sin(c) cos(c) = 0 $ sin(c) = cos(c).


Cálculo diferencial

Definición
Sea f : A ✓ R ! R. Diremos que f es derivable en un punto c 2 int(A) (9⇢ > 0:
(c ⇢, c + ⇢) ✓ A) si
f (c + h) f (c)
9 lı́m .
h!0 h
En tal caso, llamaremos derivada de f en c al valor anterior y lo denotaremos por

df f (c + h) f (c)
f 0 (c) = (c) = lı́m .
dx h!0 h
Además, si f es derivable en x, 8x 2 int(A), diremos que f es derivable.
Cálculo diferencial
Cálculo diferencial
En general, se conocen las expresiones generales de las derivadas de las funciones
elementales:

f (x) f 0 (x) f (x) f 0 (x)


xr rx r 1 1
n
X n
X ln(x)
ak x k kak x k 1 x
1
k=0 k=1 loga (x)
sin(x) cos(x) ln(a)x
1
cos(x) sin(x) arcsin(x) p
1 x2
tan(x) 1 + tan2 (x) 1
arc cos(x) p
ex ex 1 x2
1
ax ln(a)ax arctan(x)
1 + x2
Cálculo diferencial
Ejemplos
1. Sea f (x) = 2x 5 + 4x 3 x 2 + x 7. Entonces f 0 (x) = 10x 4 + 12x 2 2x + 1.
p 1
2. Sea f (x) = x. Podemos escribir f (x) = x 2 . Por tanto:
1 1 1 1 1 1 1
f 0 (x) = x 2 1 = x 2 = 1 = p .
p 2 2 2x2 2 x
3 4
4
3. Sea f (x) = x . Podemos escribir f (x) = x , luego:
3

4 4 4 1 4p
f 0 (x) = x 3 1 = x 3 = 3 x.
3 3 3
1
4. Sea f (x) = . Entonces podemos escribir f (x) = x 1 , por lo que:
x
1
f 0 (x) = ( 1) · x 1 1 = x 2 = .
x2
Cálculo diferencial

Propiedades
Sean f , g funciones derivables en x. Entonces:
1. [f (x) ± g (x)]0 = f 0 (x) ± g 0 (x).
2. [f (x)g (x)]0 = f 0 (x)g (x) + f (x)g 0 (x) ( regla del producto).
3. En particular, si a 2 R, [af (x)]0 = af 0 (x).
4. [g (f (x))]0 = g 0 (f (x))f 0 (x) ( regla de la cadena).
 0
1 g 0 (x)
5. En particular, si g (x) 6= 0: =
g (x) g (x)2
6. En
 particular, combinando 2 y 5, si g (x) 6= 0 entonces
0
f (x) f (x)g (x) f (x)g 0 (x)
0
= .
g (x) g (x)2
Cálculo diferencial

Ejemplos
Calculamos f 0 (x) para los siguientes casos:
1. f (x) = x 2 ln(x).
f 0 (x) = 2x ln(x) + x.

2. f (x) = sin(cos(x)).
f 0 (x) = cos(cos(x)) sin(x).
3. f (x) = sin(e cos(x) ).
f 0 (x) = cos(e cos(x) )e cos(x) sin(x).
4. f (x) = x sin(x) ln(x 2 ).

f 0 (x) = sin(x) ln(x 2 ) + x cos(x) ln(x 2 ) + 2 sin(x).


Cálculo diferencial
De la regla de la cadena se deducen las siguientes fórmulas generalizadas:

F (x) F 0 (x) F (x) F 0 (x)


r r 1 0
f (x) rf (x) f (x) f 0 (x)
0 loga (f (x))
sin(f (x)) cos(f (x))f (x) ln(a)f (x)
cos(f (x)) sin(f (x))f 0 (x) f 0 (x)
arcsin(f (x)) p
2 0 1 f (x)2
tan(f (x)) [1 + tan (f (x))]f (x)
f 0 (x)
e f (x) e f (x) f 0 (x) arc cos(f (x)) p
1 f (x)2
af (x) ln(a)af (x) f 0 (x) f 0 (x)
f 0 (x) arctan(f (x))
ln(f (x)) 1 + f (x)2
f (x)
Cálculo diferencial

Teorema (Teorema de Rolle)


Sea f : A ! R, a, b 2 R, a < b, tales que es f es continua en [a, b] ✓ A y derivable en
(a, b). Si f (a) = f (b), entonces 9c 2 (a, b) tal que f 0 (c) = 0.

Teorema (Regla de l’Hôpital)


Sean f , g funciones reales de variable real, cumpliendo lı́mx!c f (x) = lı́mx!c g (x) = 0 o
±1. Si 9⇢ > 0 tal que 8x 2 (c ⇢, c) [ (c, c + ⇢) f y g son derivables, con g (x) 6= 0,
f 0 (x)
y 9 lı́m 0 , entonces
x!c g (x)
f (x) f 0 (x)
9 lı́m = lı́m 0 .
x!c g (x) x!c g (x)
Cálculo diferencial
Ejemplo
x 1 x
Obtengamos lı́mx!+1 1 + x1 . Para ello, definimos L = lı́mx!+1 1 + x
y,
aprovechando la continuidad de f :
 ✓ ◆x ✓ ◆x
1 1
ln(L) = ln lı́m 1 + = lı́m ln 1 +
x!+1 x x!+1 x
✓ ◆ 1
1 ln 1 + x
= lı́m x ln 1 + = lı́m 1
x!+1 x x!+1
x
1
x2
1+ x1 1
= lı́m 1 = lı́m 1 = 1.
x!+1 x!+1 1 +
x2 x

Por tanto, ln(L) = 1, luego L = e 1 = e.


Cálculo diferencial

Definición
Diremos que f es derivable n veces en c si 9f (n) (c), donde f (0) (c) = f (c) y
f (k) (c) = (f (k 1) )0 (c), 1  k  n.

Si una función es derivable n veces en todo su dominio, diremos que f es n veces


derivable, y llamaremos a f (n) derivada de orden n de f .

Ejemplos
1. Sea f (x) = sin(x). Calculemos f 00 (x). f 0 (x) = cos(x) ! f 00 (x) = sin(x).
2. Sea f (x) = x 3 x + 2. Obtengamos f 000 (x). f 0 (x) = 3x 2 1 ! f 00 (x) = 6x !
f 000 (x) = 6.
Monotonı́a
Definición
Sea f : A ! R. Diremos que f es (estrictamente) creciente en B ✓ A si 8a, b 2 B,
a < b, f (a)  f (b) (resp., f (a) < f (b)).

Definición
Sea f : A ! R. Diremos que f es (estrictamente) decreciente en B ✓ A si 8a, b 2 B,
a < b, f (a) f (b) (resp., f (a) > f (b)).

Teorema
Sea f : A ! R y B ✓ A intervalo abierto, con f derivable en B. Entonces:
I Si f 0 (x) 0 (resp., f 0 (x) > 0) 8x 2 B, entonces f es creciente (resp.,
estrictamente creciente) en B.
I Si f 0 (x)  0 (resp., f 0 (x) < 0) 8x 2 B, entonces f es decreciente (resp.,
estrictamente decreciente) en B.
Extremos
Definición
Sea f : A ! R y B ✓ A. Diremos que un punto c 2 B es un máximo absoluto de f
en B si f (c) f (x) 8x 2 B.
Definición
Sea f : A ! R y B ✓ A. Diremos que un punto c 2 B es un mı́nimo absoluto de f en
B si f (c)  f (x) 8x 2 B.
Definición
Sea f : A ! R. Diremos que un punto c 2 A es un máximo relativo o local de f si
9⇢ > 0 tal que f (c) f (x) 8x 2 (c ⇢, c + ⇢).
Definición
Sea f : A ! R. Diremos que un punto c 2 A es un mı́nimo relativo o local de f si
9⇢ > 0 tal que f (c)  f (x) 8x 2 (c ⇢, c + ⇢).
Extremos
Puntos crı́ticos
Definición
Sean f : A ! R, c 2 A. c es un punto crı́tico de f si 9f 0 (c) = 0.

Ejemplo
Sea f (x) = 2x 3 3x 2 ! f 0 (x) = 6x 2 6x. Imponiendo f 0 (x) = 0, se obtiene x = 0 y
x = 1, por lo que f tiene dos puntos crı́ticos: 0 y 1.

Teorema
Sea c un punto crı́tico de f y n 2 el primer natural tal que f (n) (c) 6= 0. Entonces:
I Si n es par, se tienen dos casos:
I Si f (n) (c) < 0, entonces c es un máximo relativo de f .
I Si f (n) (c) > 0, entonces c es un mı́nimo relativo de f .
I Si n es impar, entonces c es un punto de inflexión de f .
Puntos crı́ticos
Puntos crı́ticos

Ejemplos
1. Vimos anteriormente que los puntos crı́ticos de f (x) = 2x 3 3x 2 son x = 0 y
x = 1. Tenemos f 0 (x) = 6x 2 6x y f 00 (x) = 12x 6.
I Por una parte, para x = 0 se tiene f 00 (0) = 6 < 0, por lo que 0 es un máximo
relativo de f .
I Por otra parte, para x = 1, tenemos f 00 (1) = 6 > 0, por lo que 1 es un mı́nimo
relativo de f .
2. Sea f (x) = x 3 . En este caso, f 0 (x) = 3x 2 , por lo que su único punto crı́tico es
x = 0. Si calculamos f 00 , obtenemos f 00 (x) = 6x, con lo cual f 00 (0) = 0. Por otra
parte, f 000 (x) = 6, luego f 000 (0) = 6. Por tanto, 0 es un punto de inflexión y no es
extremo local, puesto que f (x) < f (0) para x < 0 y f (x) > f (0) para x > 0.
Optimización
Ejemplo
Un comerciante vende un determinado producto por un valor de 50 euros, con una media
de 200 clientes mensuales. Por otra parte, sabe que por cada euro que aumente el precio,
perderá un promedio de 2 clientes mensuales. ¿Cuánto tiene que aumentar el precio para
aspirar a obtener el mayor beneficio posible?
I Si x es el aumento de precio, la función de ganancia mensual es
f (x) = (50 + x)(200 2x) = 2x 2 + 100x + 10000.
I Analizamos f 0 con el fin de buscar puntos crı́ticos: f 0 (x) = 4x + 100, luego el
único punto crı́tico correspondiente a la identidad f 0 (x) = 0 es x = 25.
I Calculamos f 00 (x) = 4 y obtenemos f 00 (25) = 4 < 0, luego hay un máximo
relativo en x = 25.
I Por tanto, deberá aumentar el precio 25 euros.
Optimización

Ejercicio
Un algoritmo satisface la siguiente propiedad. Si éste se ejecuta en paralelo a través de
dos procesadores, cada procesador pierde un 0.8 % de eficiencia con respecto a su
funcionamiento original sin ir en paralelo. Si es ejecutado en paralelo a través de tres
procesadores, cada procesador pierde un 1.6 % de eficiencia con respecto al
funcionamiento original. Si hay cuatro, un 2.4 % con respecto al funcionamiento original,
y ası́ sucesivamente (tras cada procesador añadido en paralelo, cada uno de ellos pierde
un 0.8 % de eficiencia con respecto a su funcionamiento original sin ir en paralelo con
otros). ¿Cuál es el número óptimo de procesadores en paralelo para ejecutar el algoritmo
lo más rápidamente posible?
Método de Newton
Descenso de gradiente

I No todas las funciones que se desean optimizar tienen una expresión sencilla, con
una derivada que se pueda conocer globalmente, obteniéndose directamente los
puntos crı́ticos.
I Ejemplo: funciones de coste en el entrenamiento de una red neuronal.
I Esto precisa de métodos que permitan aproximarse a mı́nimos locales vı́a un
conjunto discreto de evaluaciones.
I Descenso de gradiente (caso de una variable):
I Dada f : A ! R, elegimos un valor inicial x0 2 A.
I Para n 0, obtenemos xn+1 como sigue:
0
xn+1 = xn nf (xn ),

donde n > 0 recibe el nombre de ratio de aprendizaje.


Descenso de gradiente
Puntos crı́ticos
Posibles elecciones del ratio de aprendizaje:
I n = > 0, valor constante, lo suficientemente pequeño como para garantizar la
convergencia.
I Método de Newton modificado sobre f 0 :
I Aproximación local de f 0 vı́a recta tangente:
f 0 (x) ⇡ f 0 (xn ) + (x xn )f 00 (xn ).
I Aproximación de un x tal que f 0 (x) = 0:
f 0 (xn )
f 0 (xn ) + (x xn )f 00 (xn ) = 0 $ x = xn .
f 00 (xn )
I Construcción del método iterativo:
f 0 (xn ) 1
xn+1 = xn = xn f 0 (xn ) = xn nf
0
(xn ),
|f 00 (xn )| |f 00 (x n )|
1
donde n = 00 .
|f (xn )|
Descenso de gradiente
I Método de la secante modificado sobre f 0 (evita tener que trabajar sobre f 00 ):
I Aproximación de f 00 (xn ) en términos de f 0 :
f 0 (xn ) f 0 (xn 1)
f 00 (xn ) ⇡ .
xn xn 1
I Redefinición del método:
0
xn+1 = xn nf (xn ), n 1,
donde 0 = h, con h > 0 pequeño, y
1 |xn xn 1 |
n = = , n 1.
0 0
f (xn ) f (xn 1) |f 0 (xn ) f 0 (xn 1 )|
xn xn 1

I En resumen, posibles elecciones de n (entre muchas otras):


8
1 <h n=0
n = h, n = , n = |x xn 1 |
|f 00 (xn )| : 0 n n>0
|f (xn ) f 0 (xn 1 )|
Cálculo integral
Definición
Sea f : A ✓ R ! R y F : A ✓ R ! R. Diremos que F es una primitiva de f si F 0 = f .

Ejemplos
1. Una primitiva de 6x 2 es 2x 3 .
1
2. Una primitiva de e 2x+1 es e 2x+1 .
2
3. Otra primitiva de 6x es 2x 3 + 1.
2

1
4. Otra primitiva de e 2x+1 es e 2x+1 7.
2
5. 2x + C son primitivas de 6x 2 , 8C 2 R.
3

1
6. e 2x+1 + C son primitivas de e 2x+1 , 8C 2 R.
2
Cálculo integral

Teorema
Si f es continua y F1 , F2 son primitivas de f , entonces 9C 2 R tal que F2 F1 = C .
Esto motiva la siguiente definición:
Definición
Definimos Z
f (x)dx

como la familia formada por todas las primitivas de f .


Por el teorema anterior, bastará con encontrar una única primitiva F cumpliendo F 0 = f ,
puesto que el resto de primitivas posibles vendrá unı́vocamente determinado por las
funciones de la forma F + C , con C 2 R.
Cálculo integral

Para calcular primitivas elementales, basta con fijarse en las tablas de las derivadas en
sentido inverso:
R R
f (x) f (x)dx f (x) f (x)dx
r 1 r +1
x r +1
x +C 1
ln(x) + C
cos(x) sin(x) + C x
1
sin(x) cos(x) + C p arcsin(x) + C
1 x 2
1 + tan2 (x) tan(x) + C 1
x x
p arc cos(x) + C
e e +C 1 x2
1 1
ax ln(a)
ax + C arctan(x) + C
1 + x2
Cálculo integral

R R
f (x) f (x)dx f (x) f (x)dx
r 0 1
g (x) g (x) r +1
g (x)r +1 +C g 0 (x)
ln(g (x)) + C
cos(g (x))g 0 (x) sin(g (x)) + C g (x)
sin(g (x))g 0 (x) cos(g (x)) + C g 0 (x)
p arcsin(g (x)) + C
2 0 1 g (x)2
[1 + tan (g (x))]g (x) tan(g (x)) + C
g 0 (x)
e g (x) g 0 (x) e g (x) + C p arc cos(g (x)) + C
1 g (x)2
1
ag (x) g 0 (x) ln(a)
ag (x) +C g 0 (x)
arctan(g (x)) + C
1 + g (x)2
Cálculo integral

Ejemplos
Z
1. 2x cos(x 2 )dx = sin(x 2 ) + C .
Z p Z
1 1 1 2 3 1p 2
2. 2
x x + 1dx = 2x(x 2 + 1) 2 dx = · (x 2 + 1) 2 + C = (x + 1)3 + C .
2 2 3 3
Z Z Z
sin(x) sin(x)
3. tan(x)dx = dx = dx = ln cos(x) + C.
cos(x) cos(x)
Z Z
1 1
4. 2
dx = dx = arctan(x 2) + C .
x 4x + 5 1 + (x 2)2
Cálculo integral
I Algunas integrales no pueden realizarse de forma inmediata a través de los métodos
elementales, como por ejemplo
Z
x sin(x)dx.

I Un método para calcular algunas primitivas como la anterior es el conocido como


integración por partes, que se basa en la fórmula de la derivada de un producto:

(uv )0 = u 0 v + uv 0 .

Tomando primitivas:
Z Z Z Z
0 0 0
uv = uv+ uv ! uv = uv vu 0 .
Cálculo integral
Nuestro objetivo es aproximar el área que encierra una función f en un determinado
intervalo [a, b]:
Cálculo integral
I Una forma de obtener una solución aproximada es considerar una partición del
intervalo [a, b] en n subintervalos con extremos
P = {a = x0 < x1 < · · · < xn 1 < xn = b} y considerar en cada caso el área de
rectángulo con base en el subintervalo [xi 1 , xi ] y altura f (⇠i ), para algún conjunto
de puntos intermedios R = {⇠i 2 [xi 1 , xi ], 1  i  n}, cuya área será por tanto
(xi xi 1 )f (⇠i ), 1  i  n.
I Por tanto, una aproximación del área que encierra f en [a, b] asociada a dicha
partición consiste en sumar las áreas de dichos rectángulos:
n
X
f (P, R) = (xi xi 1 )f (⇠i ).
i=1

I En los casos en los que f tenga un comportamiento “razonable” en [a, b], cabe
esperar que al aumentar n (el número de intervalos) la expresión anterior se irá
aproximando cada vez más al área que se desea calcular.
Cálculo integral
Definición
Sea f : A ✓ R ! R y a, b 2 R tal que a < b y [a, b] ✓ A. Sea
P = {a = x0 < x1 < · · · < xn 1 < xn = b} una partición asociada a dicho intervalo.
Llamamos suma inferior de Riemann asociada a dicha partición al resultado de
calcular la siguiente suma de áreas de rectángulos:
Xn

f (P) = (xi xi 1 ) ı́nf f (x).


x2[xi 1 ,xi ]
i=1

Definición
En las condiciones anteriores, llamamos suma superior de Riemann al resultado de
calcular la siguiente suma de áreas de rectángulos:
Xn
⌃f (P) = (xi xi 1 ) sup f (x).
i=1 x2[xi 1 ,xi ]
Cálculo integral
I En el caso particular en que los puntos de una partición P estén igualmente
equiespaciados, diremos que la partición es uniforme, en cuyo caso se cumple
xi xi 1 = b n a , 1  i  n.
I En tal caso, podemos escribir
n n
b aX b aX
f (P) = ı́nf f (x), ⌃f (P) = sup f (x).
n i=1 x2[xi 1 ,xi ] n i=1 x2[xi 1 ,xi ]
Cálculo integral
Definición
Diremos que f es integrable Riemann en [a, b] si
sup f (P) = ı́nf ⌃f (P).
P P
En tal caso, llamaremos
Z b
f (x)dx = sup f (P) = ı́nf ⌃f (P),
a P P

que representa el área encerrada por f entre a y b, y que recibe el nombre de integral
definida de f en [a, b].

Teorema (Regla de Barrow)


Z b
Si F es una primitiva de f , entonces f (x)dx = F (b) F (a).
a
Cálculo integral
Funciones de varias variables

Definición
Una función real de varias variables es una función de la forma f : A ! R, con
A ✓ Rn , n > 1.

Ejemplos
p
1. f : R2 ! R dada por f (x, y ) = x 2 + y 2 es una función de dos variables (que en
este caso representa el módulo de un vector con coordenadas (x, y )).
2. Sea A = {(x, y ) 2 R2 | x > y } ✓ R2 . Entonces f : A ! R dada por
f (x, y ) = ln(x y ) es una función de dos variables.
3. f : R3 ! R dada por f (x, y , z) = x 2 + yz sin(⇡(x + z)) es un ejemplo de una
función de tres variables.
Funciones de varias variables
Al igual que en el caso de las funciones reales de variable real, las funciones de varias
variables de la forma f : A ! R, con A ✓ Rn pueden representarse gráficamente, en
forma del siguiente conjunto:
{(x; f (x)) | x 2 A} ✓ Rn+1 .
Derivadas parciales
Definición
Sea f : A ✓ Rn ! R y (x1 , . . . , xn ) 2 A. Diremos que f admite derivada parcial en la
dirección del eje i si
f (x1 , . . . , xi + h, . . . , xn ) f (x1 , . . . , xi , . . . , xn )
9 lı́m .
h!0 h
En tal caso, llamamos derivada parcial i-ésima de f en (x1 , . . . , xn ) al valor anterior, y
la denotamos por
@f f (x1 , . . . , xi + h, . . . , xn ) f (x1 , . . . , xi , . . . , xn )
(x1 , . . . , xn ) = lı́m .
@xi h!0 h
Además, si todas las derivadas parciales existen, llamamos gradiente de f en
(x1 , . . . , xn ) a la expresión
✓ ◆
@f @f
rf (x1 , . . . , xn ) = (x1 , . . . , xn ), . . . , (x1 , . . . , xn ) .
@x1 @xn
Derivadas parciales

Ejemplos
@f @f
1. Sea f (x, y ) = 2x + 3y . Entonces @x (x, y ) = 2 y @y (x, y ) = 3, luego
rf (x, y ) = (2, 3).
@f @f
2. Consideremos f (x, y ) = x 2 + y 2 . Entonces @x (x, y ) = 2x y @y (x, y ) = 2y , luego
rf (x, y ) = (2x, 2y ).
@f @f
3. Tomemos f (x, y , z) = xy + z. Entonces @x (x, y , z) = y , @y (x, y , z) = x y
@f
@z
(x, y , z) = 1, luego rf (x, y , z) = (y , x, 1).
4. Sea f (x, y , z) = x ln(x 2 + y 2 + z 2 ) + sin(⇡yz). Entonces
@f 2x 2 @f 2xy
@x
(x, y , z) = ln(x 2 + y 2 + z 2 ) + x 2 +y 2 +z 2 , @y (x, y , z) = x 2 +y 2 +z 2 + ⇡z cos(⇡yz),
@f 2xz
@z
(x, y , z) = x 2 +y 2 +z 2 + ⇡y cos(⇡yz).
Derivadas direccionales
Definición
Sea f : A ✓ Rn ! R. Diremos que f admite derivada en la dirección de v 2 Rn en
x 2 Rn si
f (x + hv ) f (x)
9 lı́m .
h!0 h
En tal caso, denotaremos por Dv f (x) al lı́mite anterior, que llamaremos derivada
direccional de f en x en la dirección de v .
Obsérvese que en el caso particular de los vectores de la base canónica de Rn ,
@f
ei = (0, . . . , 0, |{z}
1 , 0, . . . , 0), se cumple Dei f (x) = @x i
(x).
i

Teorema
En las condiciones anteriores, se cumple Dv f (x) = rf (x) · v .
Derivadas direccionales
I Combinando lo anterior con propiedades del producto escalar:
Dv f (x) = rf (x) · v = krf (x)k2 kv k2 cos(✓),
donde ✓ 2 [0, 2⇡[ es el ángulo que forman rf (x) y v .
I En particular:
krf (x)k2 kv k2  Dv f (x)  krf (x)k2 kv k2
| {z } | {z }
✓=⇡ ✓=0
I Si ✓ = 0, entonces v / rf (x) y
Dv f (x) = krf (x)k2 kv k2 cos(0) = krf (x)k2 kv k2 .
rf (x) es la dirección de mayor crecimiento de f en x.
I Si ✓ = ⇡, entonces v / rf (x) y
Dv f (x) = krf (x)k2 kv k2 cos(⇡) = krf (x)k2 kv k2 .
rf (x) es la dirección de mayor decrecimiento de f en x.
Regla de la cadena
Teorema (Regla de la cadena)
Sean g : Rn ! Rm , f : Rm ! R y a 2 Rn tales que 9rgi (a) 8i 2 {1, . . . , m} ^
9rf (g (a)). Entonces la composición f g : Rn ! R, dada por
(f g )(a) = f (g (a)) = f (g1 (a), . . . , gm (a)), cumple
✓ ◆
@(f g ) @g @g @g1 @gm
9 (a) = rf (g (a)) · (a), donde = ,..., .
@xj xj xj xj xj
Notación sin ambigüedades (referenciando sólo direcciones):
m
X
Dej (f g )(a) = rf (g (a)) · Dej g (a) = Dei f (g (a))Dej gi (a).
i=1
Forma más informal e imprecisa (referenciando variables):
m
@(f g ) X @f @gi
= .
@xj i=1
@gi @xj
Regla de la cadena

Ejemplos
1. Sea f : R2 ! R dada por
f (s, t) = s 2 t 2 + 1.
Se pide calcular
@
[f (x + 2y , 3x y )].
@x
I Método 1. Proceder directamente:
f (x + 2y , 3x y ) = (x + 2y )2 (3x y )2 + 1.
Entonces
@
[f (x + 2y , 3x y )] = 2(x + 2y ) 2(3x y ) · 3 = 10y 16x.
@x
Regla de la cadena
Ejemplos
1. Sea f : R2 ! R dada por
@f @f
f (s, t) = s 2 t 2 + 1. ! (s, t) = 2s, (s, t) = 2t
@s @t
I Método 2. Aplicar la regla de la cadena:

f (x + 2y , 3x y ) = f (s(x, y ), t(x, y )) = (f g )(x, y ),

donde g : R2 ! R2 viene dada por ⇢ @s


g (x, y ) = (s(x, y ), t(x, y )) = (x + 2y , 3x y )! @x (x, y ) =1
@t
@x (x, y ) =3
Entonces
@(f g ) @f @s @f @t
(x, y ) = (g (x, y )) (x, y ) + (g (x, y )) (x, y )
@x @s @x @t @x
= 2(x + 2y ) · 1 2(3x y ) · 3 = 10y 16x.
Regla de la cadena

Ejemplos
2. Sea f : R2 ! R, verificando
9De1 f = De2 f .
Demuéstrese que la función g : R ! R dada por g (x) = f (x, x) es constante.
Podemos ver g = f w , donde w : R ! R2 dada por w (x) = (x, x). Por tanto:
@(f w ) @w1 @w2
g 0 (x) = (x) = De1 f (x, x) (x) + De2 f (x, x) (x)
@x @x @x
= De1 f (x, x) · 1 + De2 f (x, x) · ( 1)
= De1 f (x, x) De2 f (x, x) = 0.

Como f 0 (x) = 0 8x 2 R, entonces f es constante.


Derivadas de segundo orden
Al igual que en el caso de funciones de variable real, podemos considerar las derivadas de
orden superior. Las derivadas de orden 2 son de gran interés en términos de
optimización, que son de la forma
@f
@ 2f @ @x
= i
, 1  i, j  n.
@xi @xj @xj

Ejemplos
@f @f
1. Sea f (x, y ) = xy + sin(x), luego @x
(x, y ) = y + cos(x), @y
(x, y ) = x. Por tanto:
I @2f
(x, y ) = sin(x).
@x 2
I @2f
@x@y (x, y ) = 1.
I @2f
@y @x (x, y ) = 1.
I @2f
(x, y ) = 0.
@y 2
Derivadas de segundo orden
Ejemplos
2 y2
2. Sea f (x, y ) = e x + 2x 5 y 3
I @f
@x (x, y ) = 2xe x2 y2 + 10x 4 y 3 .
I
2
@ f x y2 2 2 2

@x 2 (x, y ) = 2e + 4x 2 e x y + 40x 3 y 3 .
I @2f 2 2

@x@y (x, y ) = 4xye x y + 30x 4 y 2 .


I @f
@y (x, y ) = 2ye x
2 y2 + 6x 5 y 2 .
I
2
@f y2
@y @x (x, y ) = 4xye x + 30x 4 y 2 .
I @2f 2 2 2
y2
@y 2 (x, y ) = 2e x y
+ 4y 2 e x + 12x 5 y .

Teorema (Teorema de Schwarz)


Si existen las segundas derivadas de f y son continuas, entonces 8i, j 2 {1, 2, . . . , n} se
2f 2f
cumple @x@i @x j
= @x@j @x i
.
Puntos crı́ticos
Definición
Sea f : A ✓ Rn ! R. Diremos que x 2 A es un punto crı́tico de f si
rf (x) = (0, . . . , 0).

Ejemplo
Sea f (x, y ) = x 2 + y 2 xy 3x. Calculemos sus puntos crı́ticos. Para ello, lo primero
que debemos calcular es su gradiente:
rf (x, y ) = (2x y 3, 2y x).
Imponiendo la condición rf (x, y ) = (0, 0), se obtiene el siguiente sistema de
ecuaciones:
2x y =3
x + 2y = 0
de donde se obtiene como solución (x, y ) = (2, 1).
Hessiano

Definición
Sea f : A ✓ Rn ! R dos veces derivable en x 2 A. Definimos la matriz hessiana de f
en el punto x = (x1 , . . . , xn ) 2 A como la siguiente matriz n ⇥ n:
0 @2f @2f @2f 1
@x1 @x1
(x) @x1 @x2
(x) ··· @x1 @xn
(x)
B @2f
(x) @2f
(x) ··· @2f
(x) C
B @x2 @x1 @x2 @x2 @x2 @xn C
Hf (x) = B .. .. ... .. C
@ . . . A
@2f @2f @2f
@xn @x1
(x) @xn @x2
(x) ··· @xn @xn
(x)
Hessiano

Teorema
Sea f : A ✓ Rn ! R y a 2 A cumpliendo que 9rf (a) = 0 (es decir, a es un punto
crı́tico de f ) y 9Hf (a). Entonces:
I Si Hf (a) es una matriz definida positiva, entonces a es un mı́nimo local de f .
I Si Hf (a) es una matriz definida negativa, entonces a es un máximo local de f .
I Si los autovalores de Hf (a) tienen signos diferentes y ninguno es nulo, entonces a es
un punto de silla de f .
I Si hay algún valor propio nulo, entonces el criterio no es concluyente.
Hessiano

Caso particular n = 2:
Teorema
Sea f : A ✓ R2 ! R y (x0 , y0 ) 2 A cumpliendo que 9rf (x0 , y0 ) = 0 (es decir, (x0 , y0 ) es
un punto crı́tico de f ) y 9Hf (x0 , y0 ). Entonces:
I Si det Hf (x0 , y0 ) > 0, tenemos las siguientes posibilidades:
I Si @2f
(x , y ) > 0, entonces (x0 , y0 ) es un mı́nimo local de f .
@x 2 0 0
I Si @2f
(x , y ) < 0, entonces (x0 , y0 ) es un máximo local de f .
@x 2 0 0
I Si det Hf (x0 , y0 ) < 0, entonces (x0 , y0 ) es un punto de silla de f .
I Si det Hf (x0 , y0 ) = 0, entonces el criterio no es concluyente.
Hessiano

Punto de silla.
Hessiano
Ejemplo
La matriz hessiana asociada a la función del ejemplo anterior,
f (x, y ) = x 2 + y 2 xy 3x, es
! ✓ ◆
@2f @2f
@x 2 (x, y ) @x@y
(x, y ) 2 1
Hf (x, y ) = @2f @2f = .
@y @x
(x, y ) @y 2 (x, y ) 1 2

En particular, como Hf (x, y ) es constante, si evaluamos en el punto crı́tico, (2, 1),


obtenemos ✓ ◆
2 1
Hf (2, 1) = .
1 2
@2f
Como det Hf (2, 1) = 3 > 0 y @x 2
(2, 1) = 2 > 0, podemos concluir que (2, 1) es un
mı́nimo local de f .
Descenso de gradiente
Descenso de gradiente: xn+1 = xn n rf (xn )
Descenso de gradiente
I Sea f : A ✓ Rk ! R tal que 9rf y x0 2 A un punto de partida. Entonces el
método de descenso de gradiente se puede expresar como sigue:

xn+1 = xn n rf (xn ),

donde n > 0 es el ratio de aprendizaje.


I Posibles elecciones del ratio de aprendizaje (entre muchas otras):
I Constante: n = h, para h > 0 suficientemente pequeño.
I Variable. Dado h > 0 suficientemente pequeño:
8
>
<h n=0
n = |(xn xn 1 ) · [rf (xn ) rf (xn 1 )]|
>
: n 1
krf (xn ) rf (xn 1 )k22
I Obsérvese que el caso variable se reduce al método de la secante modificado visto
para k = 1 (ejercicio).
¡Muchas gracias!

Contacto:
david.zorio@campusviu.es

También podría gustarte