Open navigation menu

Scribd

0% found this document useful (0 votes)

32 views32 pages

Understanding Multilayer Perceptrons

Uploaded by

priyanshunandanee22b1749

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

32 views32 pages

Understanding Multilayer Perceptrons

Uploaded by

priyanshunandanee22b1749

Copyright

© © All Rights Reserved

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

5 Multilayer Perceptrons

167
168 Multilayer Perceptrons
169 Multilayer Perceptrons

퐿−1

Fig. 5.1.1 An MLP with a hidden layer of ﬁve hidden units.

X ∈ R푛×푑 푛
푑 ℎ
H ∈ R푛×ℎ

W (1) ∈ R푑×ℎ b (1) ∈ R1×ℎ W (2) ∈ Rℎ×푞

b (2) ∈ R1×푞 O∈ R푛×푞

H = XW (1) + b (1) ,
(5.1.1)
O = HW (2) + b (2) .
170 Multilayer Perceptrons

W = W (1) W (2) b = b (1) W (2) +

b (2)
O = (XW (1) + b (1) )W (2) + b (2) = XW (1) W (2) + b (1) W (2) + b (2) = XW + b.
(5.1.2)

휎(푥) = max(0, 푥)
휎(·)

H = 휎(XW (1) + b (1) ),

(5.1.3)
O = HW (2) + b (2) .

X
휎

H (1) =
휎1 (XW (1) +b (1) ) H (2) = 휎2 (H (1) W (2) +b (2) )
171 Multilayer Perceptrons

푥
0

ReLU(푥) = max(푥, 0). (5.1.4)

172 Multilayer Perceptrons

pReLU(푥) = max(0, 푥) + 훼 min(0, 푥). (5.1.5)

1
sigmoid(푥) = . (5.1.6)
1 + exp(−푥)
173 Multilayer Perceptrons

푑 exp(−푥)
sigmoid(푥) = = sigmoid(푥) (1 − sigmoid(푥)) . (5.1.7)
푑푥 (1 + exp(−푥)) 2

−1 1
1 − exp(−2푥)
tanh(푥) = . (5.1.8)
1 + exp(−2푥)
174 Multilayer Perceptrons

푑
tanh(푥) = 1 − tanh2 (푥). (5.1.9)
푑푥
175 Multilayer Perceptrons

푥Φ(푥) Φ(푥)
휎(푥) = 푥 sigmoid( 훽푥)

푥 sigmoid(훽푥)

tanh(푥) + 1 = 2 sigmoid(2푥)

102

102
176 Multilayer Perceptrons

28 ×
28 = 784
177 Implementation of Multilayer Perceptrons
178 Multilayer Perceptrons
179 Implementation of Multilayer Perceptrons

103

103
180 Multilayer Perceptrons

ℓ2

x ∈ R푑

z = W (1) x, (5.3.1)

W (1) ∈ Rℎ×푑
z ∈ Rℎ 휙
ℎ

h = 휙(z). (5.3.2)

h
W (2) ∈ R푞×ℎ
푞

o = W (2) h. (5.3.3)
181 Forward Propagation, Backward Propagation, and Computational Graphs

푙 푦

퐿 = 푙 (o, 푦). (5.3.4)

ℓ2
휆
휆 2 2
푠= W (1) + W (2) , (5.3.5)
2
ℓ2

퐽 = 퐿 + 푠. (5.3.6)

Fig. 5.3.1 Computational graph of forward propagation.

Y = 푓 (X) Z = 푔(Y)
X, Y, Z
Z X
휕Z 휕Z 휕Y
= , . (5.3.7)
휕X 휕Y 휕X
182 Multilayer Perceptrons

W (1) W (2)
휕퐽/휕W (1) 휕퐽/휕W (2)

퐽 = 퐿+푠
퐿 푠
휕퐽 휕퐽
=1 = 1. (5.3.8)
휕퐿 휕푠

o
휕퐽 휕퐽 휕퐿 휕퐿
= , = ∈ R푞 . (5.3.9)
휕o 휕퐿 휕o 휕o

휕푠 휕푠
= 휆W (1) = 휆W (2) . (5.3.10)
휕W (1) 휕W (2)
휕퐽/휕W (2) ∈ R푞×ℎ

휕퐽 휕퐽 휕o 휕퐽 휕푠 휕퐽
= , + , = h + 휆W (2) . (5.3.11)
휕W (2) 휕o 휕W (2) 휕푠 휕W (2) 휕o

W (1)

휕퐽/휕h ∈ Rℎ
휕퐽 휕퐽 휕o 휕퐽
= , = W (2) . (5.3.12)
휕h 휕o 휕h 휕o

휙 휕퐽/휕z ∈ Rℎ
z

휕퐽 휕퐽 휕h 휕퐽
= , = 휙 (z) . (5.3.13)
휕z 휕h 휕z 휕h

휕퐽/휕W (1) ∈ Rℎ×푑

휕퐽 휕퐽 휕z 휕퐽 휕푠 휕퐽
= , + , = x + 휆W (1) . (5.3.14)
휕W (1) 휕z 휕W (1) 휕푠 휕W (1) 휕z
183 Forward Propagation, Backward Propagation, and Computational Graphs

(5.3.5)
W (1) W (2)

(5.3.11)
h

X 푓 푛×푚
푓 X
184 Multilayer Perceptrons

104
104

퐿 x o 푙
푓푙 W (푙) h (푙 )
h (0) =x

h (푙) = 푓푙 (h (푙−1) ) o = 푓 퐿 ◦ · · · ◦ 푓1 (x). (5.4.1)

o
W (푙 )
휕W (푙) o = 휕h ( 퐿−1) h ( 퐿) · · · 휕h (푙) h (푙+1) 휕W (푙) h (푙) .
(5.4.2)
M (퐿) = M (푙+1) = v (푙) =

퐿−푙 M ( 퐿) · · · M (푙+1)
v (푙)
185 Numerical Stability and Initialization

M (푙)

휎
1/(1+exp(−푥))
186 Multilayer Perceptrons

휎2 = 1

W (1)

W (1) = 푐 푐

W (1)

W (1)
187 Numerical Stability and Initialization

표푖
푛 푥푗 푤푖 푗

푛
표푖 = 푤푖 푗 푥 푗 . (5.4.3)
푗=1

푤푖 푗
휎2

푥푗 훾2
푤푖 푗
표푖
푛
퐸 [표푖 ] = 퐸 [푤 푖 푗 푥 푗 ]
푗=1
푛
(5.4.4)
= 퐸 [푤 푖 푗 ]퐸 [푥 푗 ]
푗=1

= 0,

[표푖 ] = 퐸 [표2푖 ] − (퐸 [표 푖 ]) 2
푛
= 퐸 [푤 2푖 푗 푥 2푗 ] − 0
푗=1
푛 (5.4.5)
= 퐸 [푤 2푖 푗 ]퐸 [푥 2푗 ]
푗=1

= 푛 휎2 훾2 .
푛 휎2 = 1
188 Multilayer Perceptrons

푛 휎2 = 1 푛

1 2
(푛 + 푛 )휎 2 = 1 휎= . (5.4.6)
2 푛 +푛

2
휎2 = 푛 +푛
푎2
푈 (−푎, 푎) 3
푎2
3 휎2

6 6
푈 − , . (5.4.7)
푛 +푛 푛 +푛
189 Generalization in Deep Learning

105
105
190 Multilayer Perceptrons
191 Generalization in Deep Learning

ℓ2

x 푘 푘
x푖 푑(x, x푖 ) 푘 =1 1

1 푑
휙(x)
192 Multilayer Perceptrons

휖
193 Generalization in Deep Learning

ℓ2 ℓ1

ℓ2
194 Multilayer Perceptrons

106 106

ℓ2
195 Dropout

휖 ∼ N (0, 휎 2 ) x x = x+휖
퐸 [x ] = x

푝 ℎ
ℎ

0 푝
ℎ = ℎ
(5.6.1)
1− 푝

퐸 [ℎ ] = ℎ

푝
ℎ2
ℎ5 ℎ2
ℎ5

ℎ1 , . . . , ℎ5

Fig. 5.6.1 MLP before and after dropout.

196 Multilayer Perceptrons

1 1− 푝 0 푝
푈 [0, 1]
푝
197 Dropout
198 Multilayer Perceptrons

ℎ
ℎ

You might also like

Multilayer Perceptron Overview
No ratings yet
Multilayer Perceptron Overview
24 pages
Multilayer Perceptron Overview
No ratings yet
Multilayer Perceptron Overview
9 pages
Multilayer Perceptrons Explained
No ratings yet
Multilayer Perceptrons Explained
6 pages
Neural Networks Overview and Training
No ratings yet
Neural Networks Overview and Training
40 pages
Overview of Artificial Neural Networks
No ratings yet
Overview of Artificial Neural Networks
97 pages
Multi-layer Perceptron Overview
No ratings yet
Multi-layer Perceptron Overview
48 pages
Understanding Neural Networks Basics
No ratings yet
Understanding Neural Networks Basics
50 pages
Nonlinear Regression & Perceptrons
No ratings yet
Nonlinear Regression & Perceptrons
7 pages
MLP for Uppercase Handwritten Recognition
No ratings yet
MLP for Uppercase Handwritten Recognition
4 pages
Perceptron: Foundations and Applications
No ratings yet
Perceptron: Foundations and Applications
13 pages
Machine Learning and Data Mining: Prof. Alexander Ihler
No ratings yet
Machine Learning and Data Mining: Prof. Alexander Ihler
29 pages
Single Layer Perceptrons Overview
No ratings yet
Single Layer Perceptrons Overview
9 pages
Statistical Modeling of Multi-Layer Perceptrons
No ratings yet
Statistical Modeling of Multi-Layer Perceptrons
13 pages
Understanding Multi-Layer Perceptrons
No ratings yet
Understanding Multi-Layer Perceptrons
54 pages
Multilayer Perceptron Learning Guide
No ratings yet
Multilayer Perceptron Learning Guide
19 pages
Understanding Perceptrons and MLPs
No ratings yet
Understanding Perceptrons and MLPs
11 pages
Rosenblatt's 1958 Perceptron Overview
No ratings yet
Rosenblatt's 1958 Perceptron Overview
87 pages
Multi-layer Perceptron Explained
No ratings yet
Multi-layer Perceptron Explained
202 pages
Notes ML 02 Slides RNN ANN
No ratings yet
Notes ML 02 Slides RNN ANN
105 pages
Deep Learning Fundamentals and Models
No ratings yet
Deep Learning Fundamentals and Models
63 pages
Multi-Layer Perceptron Overview Guide
No ratings yet
Multi-Layer Perceptron Overview Guide
15 pages
Limitations of Single Layer Perceptron
No ratings yet
Limitations of Single Layer Perceptron
20 pages
Multilayer Perceptrons in Machine Learning
No ratings yet
Multilayer Perceptrons in Machine Learning
24 pages
MLP Architecture and Training Insights
No ratings yet
MLP Architecture and Training Insights
50 pages
Multilayer Perceptrons Overview
No ratings yet
Multilayer Perceptrons Overview
15 pages
Multilayer Perceptron Network Analysis
No ratings yet
Multilayer Perceptron Network Analysis
7 pages
MLP Classifier Architecture and Parameters
No ratings yet
MLP Classifier Architecture and Parameters
27 pages
Overview of Multilayer Perceptrons
No ratings yet
Overview of Multilayer Perceptrons
2 pages
Understanding Multi-Layer Perceptrons
No ratings yet
Understanding Multi-Layer Perceptrons
16 pages
Multilayer Perceptron Fundamentals
No ratings yet
Multilayer Perceptron Fundamentals
71 pages
Understanding Neural Networks Basics
No ratings yet
Understanding Neural Networks Basics
4 pages
Perceptron and Multilayer Perceptron Guide
No ratings yet
Perceptron and Multilayer Perceptron Guide
42 pages
Understanding Multi-Layer Perceptrons
No ratings yet
Understanding Multi-Layer Perceptrons
54 pages
Supervised Learning with Neural Networks
No ratings yet
Supervised Learning with Neural Networks
34 pages
Medical Pattern Recognition: ANNs Explained
No ratings yet
Medical Pattern Recognition: ANNs Explained
42 pages
Multi-layer Perceptron and Backpropagation
No ratings yet
Multi-layer Perceptron and Backpropagation
54 pages
Neural Networks: Perceptrons & Learning
No ratings yet
Neural Networks: Perceptrons & Learning
114 pages
CC511 Week 5 - 6 - NN - BP
No ratings yet
CC511 Week 5 - 6 - NN - BP
62 pages
Multilayer Perceptrons in Deep Learning
No ratings yet
Multilayer Perceptrons in Deep Learning
52 pages
Multilayer Perceptrons Overview
No ratings yet
Multilayer Perceptrons Overview
50 pages
Deep Learning Fundamentals Overview
No ratings yet
Deep Learning Fundamentals Overview
20 pages
Understanding Neural Networks Basics
No ratings yet
Understanding Neural Networks Basics
61 pages
Understanding Neural Networks Basics
No ratings yet
Understanding Neural Networks Basics
21 pages
Neural Networks and Gradient Descent
No ratings yet
Neural Networks and Gradient Descent
84 pages
Neural Network Basics for Recognition
No ratings yet
Neural Network Basics for Recognition
12 pages
Perceptron and Multilayer Networks Explained
No ratings yet
Perceptron and Multilayer Networks Explained
28 pages
Introduction to Neural Networks
No ratings yet
Introduction to Neural Networks
6 pages
MLFFNN and Perceptron Analysis
No ratings yet
MLFFNN and Perceptron Analysis
19 pages
Understanding Perceptron Algorithms
No ratings yet
Understanding Perceptron Algorithms
12 pages
Neural Networks: From Perceptrons to Training
No ratings yet
Neural Networks: From Perceptrons to Training
45 pages
Machine Learning Machine Learning: Learning Highly Non-Linear Functions
No ratings yet
Machine Learning Machine Learning: Learning Highly Non-Linear Functions
28 pages
Multi-layer Perceptron Backpropagation Overview
No ratings yet
Multi-layer Perceptron Backpropagation Overview
60 pages
Understanding Perceptron Flow in Neural Networks
No ratings yet
Understanding Perceptron Flow in Neural Networks
35 pages
Perceptrons and Multilayer Networks Explained
No ratings yet
Perceptrons and Multilayer Networks Explained
25 pages
Perceptrons in Neural Networks Explained
No ratings yet
Perceptrons in Neural Networks Explained
5 pages
Classifying Fruits with ANN Model
No ratings yet
Classifying Fruits with ANN Model
33 pages
Fixed-Weight Neural Networks Explained
No ratings yet
Fixed-Weight Neural Networks Explained
14 pages
Perceptron Weight Update Formula
No ratings yet
Perceptron Weight Update Formula
20 pages
CNN-LSTM Hybrid Model Implementation
No ratings yet
CNN-LSTM Hybrid Model Implementation
2 pages
Hopfield Network Energy Dynamics
No ratings yet
Hopfield Network Energy Dynamics
57 pages
Understanding Recurrent Neural Networks
No ratings yet
Understanding Recurrent Neural Networks
4 pages
Overview of Artificial Neural Networks
No ratings yet
Overview of Artificial Neural Networks
13 pages
Understanding Artificial Neural Networks
No ratings yet
Understanding Artificial Neural Networks
29 pages
Deep Learning Lab Practical Exam AD3511
No ratings yet
Deep Learning Lab Practical Exam AD3511
3 pages
Greedy Layerwise Pre-training Explained
No ratings yet
Greedy Layerwise Pre-training Explained
18 pages
Agglomerative Min Clustering Guide
No ratings yet
Agglomerative Min Clustering Guide
4 pages
MLP Backpropagation Algorithm Overview
No ratings yet
MLP Backpropagation Algorithm Overview
17 pages
Clustering Methods in Unsupervised Learning
No ratings yet
Clustering Methods in Unsupervised Learning
21 pages
Cluster Analysis Methods Overview
No ratings yet
Cluster Analysis Methods Overview
5 pages
Neural Networks and Fuzzy Systems: Neurolab
No ratings yet
Neural Networks and Fuzzy Systems: Neurolab
17 pages
LSTM and GRU Overview in Deep Learning
No ratings yet
LSTM and GRU Overview in Deep Learning
44 pages
Siamese Network for One-Shot Learning
No ratings yet
Siamese Network for One-Shot Learning
51 pages
Deep Learning Fundamentals Overview
No ratings yet
Deep Learning Fundamentals Overview
109 pages
Deep Learning Exam Questions July 2023
No ratings yet
Deep Learning Exam Questions July 2023
4 pages
Data Mining Exam Questions and Answers
No ratings yet
Data Mining Exam Questions and Answers
56 pages
Feedforward Neural Network Overview
No ratings yet
Feedforward Neural Network Overview
35 pages
Deep Learning Course Overview
No ratings yet
Deep Learning Course Overview
9 pages
LSTM vs GRU: Key Differences Explained
No ratings yet
LSTM vs GRU: Key Differences Explained
62 pages
Agglomerative Clustering Example Steps
No ratings yet
Agglomerative Clustering Example Steps
3 pages
History and Basics of the Perceptron
No ratings yet
History and Basics of the Perceptron
21 pages
Recognizing "AND" Logic with Perceptron
No ratings yet
Recognizing "AND" Logic with Perceptron
8 pages
Understanding "α ∉ a_α" δ-Systems
100% (2)
Understanding "α ∉ a_α" δ-Systems
145 pages
Neural Networks Exam Questions 2019
No ratings yet
Neural Networks Exam Questions 2019
5 pages
Deep Learning Course Syllabus
No ratings yet
Deep Learning Course Syllabus
1 page
IF4071 Deep Learning Course Outline
0% (1)
IF4071 Deep Learning Course Outline
1 page