Gradientti on matemaattinen differentiaalioperaattori , joka on määritelty usean muuttujan skalaarifunktioille
f
:
R
n
→
R
{\displaystyle f:\mathbb {R} ^{n}\rightarrow \mathbb {R} }
. Gradientti ilmaisee funktion suurimman muutosnopeuden (gradienttivektorin pituus ) ja tämän suurimman muutoksen suunnan. Funktio kasvaa voimakkaimmin gradientin suuntaan ja vähenee voimakkaimmin negatiivisen gradientin suuntaan.[ 1]
Esimerkkinä kahden muuttujan funktion
f
(
x
,
y
)
=
x
e
x
2
+
y
2
{\displaystyle f(x,y)={\frac {x}{e^{x^{2}+y^{2}}}}}
gradientti ilmaistuna vektorikenttänä . Väri kuvaa funktion arvoa (isot punaisella, pienet sinisellä) ja vektorit gradienttia kussakin pisteessä.
Karteesisessa koordinaatistossa gradientti on vektori, jonka komponentteina ovat funktion osittaisderivaatat . Esimerkiksi kolmen muuttujan funktion gradientti merkitään
g
r
a
d
(
f
)
{\displaystyle grad(f)}
tai symbolin nabla avulla
∇
f
{\displaystyle \nabla f}
ja määritellään
∇
f
(
x
,
y
,
z
)
=
∂
∂
x
f
(
x
,
y
,
z
)
i
→
+
∂
∂
y
f
(
x
,
y
,
z
)
j
→
+
∂
∂
z
f
(
x
,
y
,
z
)
k
→
{\displaystyle \nabla f(x,y,z)={\frac {\partial }{\partial x}}f(x,y,z){\vec {i}}+{\frac {\partial }{\partial y}}f(x,y,z){\vec {j}}+{\frac {\partial }{\partial z}}f(x,y,z){\vec {k}}}
,
missä
i
→
,
j
→
{\displaystyle {\vec {i}},{\vec {j}}}
ja
k
→
{\displaystyle {\vec {k}}}
-komponenttien kertoimet ovat funktion osittaisderivaattoja muuttujien
x
,
y
{\displaystyle x,y}
ja
z
{\displaystyle z}
suhteen. Yleisen
n
{\displaystyle n}
muuttujan funktion gradientti määritellään
∇
f
(
x
)
=
[
∂
f
∂
x
1
(
x
)
,
∂
f
∂
x
2
(
x
)
,
⋯
,
∂
f
∂
x
n
(
x
)
]
T
{\displaystyle \nabla f(\mathbf {x} )={\begin{bmatrix}{\frac {\partial f}{\partial x_{1}}}(\mathbf {x} ),&{\frac {\partial f}{\partial x_{2}}}(\mathbf {x} ),&\cdots &,{\frac {\partial f}{\partial x_{n}}}(\mathbf {x} )\end{bmatrix}}^{T}}
,
missä
x
{\displaystyle \mathbf {x} }
on funktion muuttujien muodostama vektori
x
=
[
x
1
,
x
2
,
⋯
,
x
n
]
T
{\displaystyle \mathbf {x} ={\begin{bmatrix}x_{1},&x_{2},&\cdots ,&x_{n}\end{bmatrix}}^{T}}
.
Gradienttia voidaan pitää derivaatan yleistyksenä usean muuttujan funktioille. Gradientti on erikoistapaus Jacobin matriisista , joka on määritelty monen muuttujan vektoriarvoisille funktioille
f
:
R
n
→
R
p
{\displaystyle \mathbf {f} :\mathbb {R} ^{n}\rightarrow \mathbb {R} ^{p}}
.
Määritelmiä ja laskusääntöjä
muokkaa
Yhden muuttujan tapauksessa funktion differentiaali määriteltiin
Δ
f
(
x
)
=
f
′
(
x
)
Δ
x
{\displaystyle \Delta f(x)=f'(x)\Delta x\;}
,
ja yleisesti funktion differentiaali määritellään gradientin avulla
Δ
f
(
x
)
=
∇
f
⋅
Δ
x
{\displaystyle \Delta f(\mathbf {x} )=\nabla f\cdot \Delta \mathbf {x} }
,
missä piste kuvaa kahden vektorin pistetuloa .
Gradientin avulla voidaan määrittää helposti myös suunnattu derivaatta : Funktion suunnattu derivaatta vektorin
e
→
{\displaystyle {\vec {e}}}
suuntaan on
∂
e
→
f
(
x
)
=
∇
f
(
x
)
⋅
e
→
0
{\displaystyle \partial _{\vec {e}}f(\mathbf {x} )=\nabla f(\mathbf {x} )\cdot {\vec {e}}_{0}}
,
missä
e
→
0
{\displaystyle {\vec {e}}_{0}\;}
on
e
→
{\displaystyle {\vec {e}}\;}
:n suuntainen yksikkövektori (vektori, jonka pituus on yksi). Pistetulo on suurin, kun lasketaan suunnattua derivaattaa gradientin suuntaan ja pienin, kun lasketaan suunnattua derivaattaa negatiivisen gradientin suuntaan.[ 2]
Mikäli funktion muuttujat riippuvat esimerkiksi parametrista t , eli
x
=
[
x
1
(
t
)
,
x
2
(
t
)
,
⋯
,
x
n
(
t
)
]
T
{\displaystyle \mathbf {x} ={\begin{bmatrix}x_{1}(t),&x_{2}(t),&\cdots ,&x_{n}(t)\end{bmatrix}}^{T}}
,
saadaan funktion derivaatta parametrin suhteen gradientin avulla lausekkeesta
d
f
(
x
(
t
)
)
d
t
=
∇
f
(
x
)
⋅
x
′
(
t
)
{\displaystyle {\frac {df(\mathbf {x} (t))}{dt}}=\nabla f(\mathbf {x} )\cdot \mathbf {x} '(t)}
,
missä siis
x
′
(
t
)
=
[
x
1
′
(
t
)
,
x
2
′
(
t
)
,
⋯
,
x
n
′
(
t
)
]
T
{\displaystyle \mathbf {x} '(t)={\begin{bmatrix}x_{1}'(t),&x_{2}'(t),&\cdots ,&x_{n}'(t)\end{bmatrix}}^{T}}
.
Tämä tunnetaan niin sanottuna ketjusääntönä .
Gradientti käyräviivaisissa koordinaatistoissa
muokkaa
Napakoordinaatistossa annetulle funktiolle gradientti on
∇
f
(
r
,
ϕ
)
=
e
→
r
∂
f
∂
r
+
e
→
ϕ
1
r
∂
f
∂
ϕ
{\displaystyle \nabla f(r,\phi )={\vec {e}}_{r}{\frac {\partial f}{\partial r}}+{\vec {e}}_{\phi }{\frac {1}{r}}{\frac {\partial f}{\partial \phi }}}
,
sylinterikoordinaatistossa
∇
f
(
r
,
ϕ
,
z
)
=
e
→
r
∂
f
∂
r
+
e
→
ϕ
1
r
∂
f
∂
ϕ
+
e
→
z
∂
f
∂
z
{\displaystyle \nabla f(r,\phi ,z)={\vec {e}}_{r}{\frac {\partial f}{\partial r}}+{\vec {e}}_{\phi }{\frac {1}{r}}{\frac {\partial f}{\partial \phi }}+{\vec {e}}_{z}{\frac {\partial f}{\partial z}}}
sekä pallokoordinaatistossa
∇
f
(
r
,
θ
,
ϕ
)
=
e
→
r
∂
f
∂
r
+
e
→
θ
1
r
∂
f
∂
θ
+
e
→
ϕ
1
r
sin
θ
∂
f
∂
ϕ
{\displaystyle \nabla f(r,\theta ,\phi )={\vec {e}}_{r}{\frac {\partial f}{\partial r}}+{\vec {e}}_{\theta }{\frac {1}{r}}{\frac {\partial f}{\partial \theta }}+{\vec {e}}_{\phi }{\frac {1}{r\sin \theta }}{\frac {\partial f}{\partial \phi }}}
.
Huomaa, että viimeinen laskusääntö on pätevä pallokoordinaatistossa, jossa muunnoskaavat ovat
{
x
=
r
sin
θ
cos
ϕ
y
=
r
sin
θ
sin
ϕ
z
=
r
cos
θ
{\displaystyle {\begin{cases}x=r\sin \theta \cos \phi \\y=r\sin \theta \sin \phi \\z=r\cos \theta \end{cases}}}
↑ Adams, Robert A.: ”12.7 Gradients and Directional Derivatives”, Calculus: A Complete Course , s. 680. Pearson: Addison Wesley, 6. painos.
↑ Adams, Robert A.: ”12.7 Gradients and Directional Derivatives”, Calculus: A Complete Course , s. 681. Pearson: Addison Wesley, 6. painos.