0% found this document useful (0 votes)

138 views

Back Propagation - Machine Learning

The document describes experiments with a neural network for digit recognition. In the original assignment, the author found that 1000 epochs and a learning rate of 0.5 produced good results, with low error even with some corrupted pixels. However, there seemed to be overfitting as error was higher for more corrupted pixels. In the extra credit task using ASCII digits, the network overfit more, with error converging quickly during training but being high for more corrupted pixels during testing.

Uploaded by

Evelyn Mahasin

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

138 views

Back Propagation - Machine Learning

Uploaded by

Evelyn Mahasin

Available Formats

Download as DOCX, PDF, TXT or read online on Scribd

You are on page 1/ 8

HW5

Results of original assignment

Conclusion/discussion
I experimented with the epochs and learning rate and found 1000 and 0.5 to be good. Even 100 epochs
produced good enough results. Test results error are very low, even with 8 corrupted pixels (<0.1 avg
MSE). However, there seem to be overfitting, based on the high MSE for 8 corrupted pixels compared to
8.
Results of extra credit

Conclusion/discussion
The network seemed to overfit more than the original assignment with the ASCII case. We can see this
by seeing how fast the MSE converges on training, but produces a high MSE at 8 corrupted pixels
(compared to 4)
Backprop code

function hw4
% define constants
trainingEpochs = 1000;
testingEpochs = 1000;
learningRate = 0.5;
noOfNeurons = 4;
error(1:trainingEpochs+1) = 0;
error1(1:testingEpochs+1) = 0;
error2(1:testingEpochs+1) = 0;
error3(1:testingEpochs+1) = 0;
noOfIterations(1:trainingEpochs+1) = 0;

% initial weights and biases (random b/w -0.5 and 0.5)

% 3 neuron hidden layer
W1 = (-0.5 + (0.5+0.5)*rand(30,noOfNeurons))';
b1 = (-0.5 + (0.5+0.5)*rand(1,noOfNeurons))';
W2 = -0.5 + (0.5+0.5)*rand(3,noOfNeurons);
b2 = -0.5 + (0.5+0.5)*rand(1,1);

% inputs p0 = 0, p1 = 1, p2 = 2
p0 = [-1 1 1 1 1 -1 1 -1 -1 -1 -1 1 1 -1 -1 -1 -1 1 1 -1 -1 -1 -1 1 -1 1 1
1 1 -1]';
p1 = [-1 -1 -1 -1 -1 -1 1 -1 -1 -1 -1 -1 1 1 1 1 1 1 -1 -1 -1 -1 -1 -1 -1
-1 -1 -1 -1 -1]';
p2 = [1 -1 -1 -1 -1 -1 1 -1 -1 1 1 1 1 -1 -1 1 -1 1 -1 1 1 -1 -1 1 -1 -1 -
1 -1 -1 1]';
P = [p0 p1 p2];

% targets
t0 = [1 0 0]';
t1 = [0 1 0]';
t2 = [0 0 1]';
T = [t0 t1 t2];

% backprop training for <trainingEpochs> iterations

for x = 1:trainingEpochs
% random one out of 3 test cases
r = randi(3);
% fwdComp, backProp, update
[out1, out2] = fwdComp(P(:,r), W1, b1, W2, b2);
[sens1, sens2] = backProp(out1, out2, T(:,r), W2);
[W1, b1, W2, b2] = update(W1, b1, W2, b2, learningRate, sens1, sens2,
out1, P(:,r));

% increase counter and error

noOfIterations(x+1) = (x+1);
error(x) = sum((T(:,r) - out2).^2);
end

% plot backprop results

plot(noOfIterations, error)
title('Backpropagation ANN Training Results')
xlabel('Number of Iterations')
ylabel('Mean Squared Error')

% testing for <testingEpochs> iterations

for t = 1:3
for y = 1:testingEpochs

[~, out2] = fwdComp(addNoise(P(:,t),0), W1, b1, W2, b2);

error1(y) = sum((T(:,t) - out2).^2);
[~, out2] = fwdComp(addNoise(P(:,t),4), W1, b1, W2, b2);
error2(y) = sum((T(:,t) - out2).^2);
[~, out2] = fwdComp(addNoise(P(:,t),8), W1, b1, W2, b2);
error3(y) = sum((T(:,t) - out2).^2);
end
end

% plot pixel corruption results with 0, 4, and 8 pixels changed

graphx = 0:4:8;
graphy = [mean(error1) mean(error2) mean(error3)];
bar(graphx,graphy);
title('Backpropagation ANN Testing Results')
xlabel('Number of Corrupted Pixels')
ylabel('Average Mean Squared Error')
end

function out = addNoise(originalDigit, pixelsChanged)

% find random pixel positions
r = randi([1 30], 1, pixelsChanged);

% for randomly chosen pixels, flip values

for idx = 1:pixelsChanged
originalDigit(r(idx)) = originalDigit(r(idx)) * -1;
end

out = originalDigit;
end

function [out1,out2] = fwdComp(input, W1, b1, W2, b2)

out1 = logsig(W1 * input + b1);
out2 = logsig(W2 * out1 + b2);
end

function [sens1,sens2] = backProp(out1, out2, target, W2)

% fdots using derivative of logsig
fdot2 = diag((ones(size(out2))-out2).*out2);
fdot1 = diag((ones(size(out1))-out1).*out1);
% backprop starting w/ second layer
sens2 = -2 * fdot2 * (target - out2);
sens1 = fdot1 * W2' * sens2;
end

function [W1n, b1n, W2n, b2n] = update(W1, b1, W2, b2, learningRate, sens1,
sens2, out1, input)
W2n = W2 - (learningRate * sens2 * out1');
b2n = b2 - (learningRate * sens2);
W1n = W1 - (learningRate * sens1 * input');
b1n = b1 - (learningRate * sens1);
end

Extra credit code (same, just different inputs, targets, test param, other
param)

function hw4ext
% define constants
trainingEpochs = 1000;
testingEpochs = 1000;
learningRate = 0.5;
noOfNeurons = 4;
error(1:trainingEpochs+1) = 0;
error1(1:testingEpochs+1) = 0;
error2(1:testingEpochs+1) = 0;
error3(1:testingEpochs+1) = 0;
noOfIterations(1:trainingEpochs+1) = 0;

% initial weights and biases (random b/w -0.5 and 0.5)

% 3 neuron hidden layer
W1 = (-0.5 + (0.5+0.5)*rand(30,noOfNeurons))';
b1 = (-0.5 + (0.5+0.5)*rand(1,noOfNeurons))';
W2 = -0.5 + (0.5+0.5)*rand(3,noOfNeurons);
b2 = -0.5 + (0.5+0.5)*rand(1,1);

% p0 = 0, p1 = 1, ... , p6 = 6
p0 = [-1 1 1 1 1 -1 1 -1 -1 -1 -1 1 1 -1 -1 -1 -1 1 1 -1 -1 -1 -1 1 -1 1 1
1 1 -1]';
p1 = [-1 -1 -1 -1 -1 -1 1 -1 -1 -1 -1 -1 1 1 1 1 1 1 -1 -1 -1 -1 -1 -1 -1
-1 -1 -1 -1 -1]';
p2 = [1 -1 -1 -1 -1 -1 1 -1 -1 1 1 1 1 -1 -1 1 -1 1 -1 1 1 -1 -1 1 -1 -1 -
1 -1 -1 1]';
p3 = [-1 -1 -1 -1 -1 -1 -1 1 -1 -1 1 -1 1 -1 -1 -1 -1 1 1 -1 1 -1 -1 1 -1
1 -1 1 1 -1]';
p4 = [-1 -1 -1 -1 -1 -1 1 1 1 -1 -1 -1 -1 -1 1 -1 -1 -1 1 1 1 1 1 1 -1 -1
-1 -1 -1 -1]';
p5 = [-1 -1 -1 -1 -1 -1 1 1 1 -1 1 -1 1 -1 1 -1 -1 1 1 -1 1 -1 -1 1 1 -1 -
1 1 1 -1]';
p6 = [-1 -1 -1 -1 -1 -1 -1 1 1 1 1 -1 1 -1 1 -1 -1 1 1 -1 1 -1 -1 1 1 -1 -
1 1 1 -1]';
P = [p0 p1 p2 p3 p4 p5 p6];

% targets
t0 = [0 1 1 0 0 0 0];
t1 = [0 1 1 0 0 0 1];
t2 = [0 1 1 0 0 1 0];
t3 = [0 1 1 0 0 1 1];
t4 = [0 1 1 0 1 0 0];
t5 = [0 1 1 0 1 0 1];
t6 = [0 1 1 0 1 1 0];
T = [t0 t1 t2 t3 t4 t5 t6];
% backprop training for <trainingEpochs> iterations
for x = 1:trainingEpochs
% random one out of 7 test cases
r = randi(7);
% fwdComp, backProp, update
[out1, out2] = fwdComp(P(:,r), W1, b1, W2, b2);
[sens1, sens2] = backProp(out1, out2, T(:,r), W2);
[W1, b1, W2, b2] = update(W1, b1, W2, b2, learningRate, sens1, sens2,
out1, P(:,r));

% increase counter and error

noOfIterations(x+1) = (x+1);
error(x) = sum((T(:,r) - out2).^2);
end

% plot backprop results

plot(noOfIterations, error)
title('Backprop ASCII ANN Training Results')
xlabel('Number of Iterations')
ylabel('Mean Squared Error')

% testing for <testingEpochs> iterations

for t = 1:7
for y = 1:testingEpochs
[~, out2] = fwdComp(addNoise(P(:,t),0), W1, b1, W2, b2);
error1(y) = sum((T(:,t) - out2).^2);
[~, out2] = fwdComp(addNoise(P(:,t),4), W1, b1, W2, b2);
error2(y) = sum((T(:,t) - out2).^2);
[~, out2] = fwdComp(addNoise(P(:,t),8), W1, b1, W2, b2);
error3(y) = sum((T(:,t) - out2).^2);
end
end

% % plot pixel corruption results with 0, 4, and 8 pixels changed

% graphx = 0:4:8;
% graphy = [mean(error1) mean(error2) mean(error3)];
% bar(graphx,graphy);
% title('Backprop ASCII ANN Testing Results')
% xlabel('Number of Corrupted Pixels')
% ylabel('Average Mean Squared Error')
end

function out = addNoise(originalDigit, pixelsChanged)

% find random pixel positions
r = randi([1 30], 1, pixelsChanged);

% for randomly chosen pixels, flip values

for idx = 1:pixelsChanged
originalDigit(r(idx)) = originalDigit(r(idx)) * -1;
end

out = originalDigit;
end
function [out1,out2] = fwdComp(input, W1, b1, W2, b2)
out1 = logsig(W1 * input + b1);
out2 = logsig(W2 * out1 + b2);
end

function [sens1,sens2] = backProp(out1, out2, target, W2)

Module 4 - S8 CSE NOTES - KTU DEEP LEARNING NOTES - CST414
No ratings yet
Module 4 - S8 CSE NOTES - KTU DEEP LEARNING NOTES - CST414
21 pages
Matlab Codes
75% (8)
Matlab Codes
92 pages
Implementation
No ratings yet
Implementation
14 pages
Report For Numerical Techniques Assignments
No ratings yet
Report For Numerical Techniques Assignments
18 pages
Industrial Computing Artificial Neural Network Eng. Byron Lima MSC
100% (1)
Industrial Computing Artificial Neural Network Eng. Byron Lima MSC
13 pages
Matlab Code For Radial Basis Functions
100% (2)
Matlab Code For Radial Basis Functions
13 pages
F.Y Engg Grap
No ratings yet
F.Y Engg Grap
17 pages
MATLAB Lecture - 8 2018
No ratings yet
MATLAB Lecture - 8 2018
10 pages
Ermias Atnafu Math Assignment (2)
No ratings yet
Ermias Atnafu Math Assignment (2)
14 pages
Solutions To Homework 8o
No ratings yet
Solutions To Homework 8o
11 pages
Matlab Program For Method of Bisection Method When No. of Iterations Is Given
No ratings yet
Matlab Program For Method of Bisection Method When No. of Iterations Is Given
27 pages
BaiTapLonGeneticAlgorithm 2019
No ratings yet
BaiTapLonGeneticAlgorithm 2019
6 pages
Misdayanti Praktikum 5
No ratings yet
Misdayanti Praktikum 5
13 pages
Gauss Seidal
No ratings yet
Gauss Seidal
7 pages
Using Randomness To Predict Nonrandom Numbers
No ratings yet
Using Randomness To Predict Nonrandom Numbers
10 pages
Code
No ratings yet
Code
10 pages
Matlab Programs
No ratings yet
Matlab Programs
16 pages
Manual For Neural and Matlab Applications
No ratings yet
Manual For Neural and Matlab Applications
37 pages
EE 553 Homeworks Moyo
No ratings yet
EE 553 Homeworks Moyo
27 pages
Assignment-5
No ratings yet
Assignment-5
37 pages
Nnfuzzysampleprograms
No ratings yet
Nnfuzzysampleprograms
9 pages
Probability Density Function of Various Distribution
No ratings yet
Probability Density Function of Various Distribution
16 pages
Simulation Portfolio For APM 3714
No ratings yet
Simulation Portfolio For APM 3714
7 pages
Assignment 3 Solution
No ratings yet
Assignment 3 Solution
16 pages
CAAD Report
No ratings yet
CAAD Report
47 pages
C Apps Question 2
No ratings yet
C Apps Question 2
11 pages
MATLAB Assignment Removed
No ratings yet
MATLAB Assignment Removed
10 pages
Homework 4 Neural Networks: Submitted To
No ratings yet
Homework 4 Neural Networks: Submitted To
11 pages
Experiments - With - Convolutional - Neural - Network - 2 - 6b.ipynb - Colaboratory
No ratings yet
Experiments - With - Convolutional - Neural - Network - 2 - 6b.ipynb - Colaboratory
6 pages
MATLABLoopingExercise and Solution
No ratings yet
MATLABLoopingExercise and Solution
5 pages
Lab Manual Soft Computing
100% (1)
Lab Manual Soft Computing
44 pages
Cg Practical File
No ratings yet
Cg Practical File
21 pages
CS Practical File
No ratings yet
CS Practical File
11 pages
Newton's Forward Difference Formula
No ratings yet
Newton's Forward Difference Formula
1 page
numerical Analysis report. Togola Molobaly Dit Bébé. 202352180026
No ratings yet
numerical Analysis report. Togola Molobaly Dit Bébé. 202352180026
13 pages
Recursion3
No ratings yet
Recursion3
9 pages
Numerical Analysis Lab 6: Syed Muhammad Hussain Rizvi 241736 Bscs-8a
No ratings yet
Numerical Analysis Lab 6: Syed Muhammad Hussain Rizvi 241736 Bscs-8a
3 pages
Answer: Problem#1
No ratings yet
Answer: Problem#1
12 pages
Matlab Lecture
No ratings yet
Matlab Lecture
6 pages
Exam DT106G
No ratings yet
Exam DT106G
6 pages
whatcwhat
No ratings yet
whatcwhat
17 pages
02_dataType
No ratings yet
02_dataType
7 pages
ROB521 Assignment 3 PDF
No ratings yet
ROB521 Assignment 3 PDF
7 pages
Find The Output Set - 1 Question - 1
No ratings yet
Find The Output Set - 1 Question - 1
6 pages
ROB521 Assignment 3
No ratings yet
ROB521 Assignment 3
7 pages
Function: 'Datain - Dat' 'R' '%G %G'
No ratings yet
Function: 'Datain - Dat' 'R' '%G %G'
35 pages
Perceptrón Multicapa
No ratings yet
Perceptrón Multicapa
6 pages
C Programming MCQ
No ratings yet
C Programming MCQ
9 pages
C Lab Manual
No ratings yet
C Lab Manual
12 pages
Data Flow Model
No ratings yet
Data Flow Model
5 pages
Halstead Software Science
100% (1)
Halstead Software Science
2 pages
Soft Computing Lab File
No ratings yet
Soft Computing Lab File
26 pages
cs-2 Lab Codes
No ratings yet
cs-2 Lab Codes
9 pages
150+ C Pattern Programs
From Everand
150+ C Pattern Programs
Hernando Abella
No ratings yet
Amazing Java: Learn Java Quickly
From Everand
Amazing Java: Learn Java Quickly
Andrei Besedin
No ratings yet
Computer Engineering Laboratory Solution Primer
From Everand
Computer Engineering Laboratory Solution Primer
Karan Bhandari
No ratings yet
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Evolutionary Algorithms
From Everand
Evolutionary Algorithms
Alain Petrowski
No ratings yet
C Programming
From Everand
C Programming
Netra
No ratings yet
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Shortcuts to College Calculus Refreshment Kit
From Everand
Shortcuts to College Calculus Refreshment Kit
Juan Acevedo
No ratings yet
Turing Variations
No ratings yet
Turing Variations
57 pages
1 Finite Autometa
No ratings yet
1 Finite Autometa
21 pages
Candia - Trakhtenbrot's Theorem
No ratings yet
Candia - Trakhtenbrot's Theorem
26 pages
Unit IV Artificial Neural Networks
No ratings yet
Unit IV Artificial Neural Networks
25 pages
Converting NFA To DFA - Solved Examples - Gate Vidyalay
No ratings yet
Converting NFA To DFA - Solved Examples - Gate Vidyalay
14 pages
Assignment 2023
No ratings yet
Assignment 2023
1 page
CSCI-2400 Models of Computation: Fall 2005 Costas Busch - RPI 1
No ratings yet
CSCI-2400 Models of Computation: Fall 2005 Costas Busch - RPI 1
18 pages
Formula
No ratings yet
Formula
15 pages
Forecasting PDF
No ratings yet
Forecasting PDF
101 pages
ARIMA MODEL Determining P, D, Q
No ratings yet
ARIMA MODEL Determining P, D, Q
9 pages
6 - RNN LSTM & Gru
No ratings yet
6 - RNN LSTM & Gru
14 pages
DR - Amin.ML Ch07 DeepLearning 1
No ratings yet
DR - Amin.ML Ch07 DeepLearning 1
12 pages
96320
No ratings yet
96320
58 pages
Diagram For ANN
No ratings yet
Diagram For ANN
2 pages
Class Lecture Notes 5
No ratings yet
Class Lecture Notes 5
23 pages
Tutorial 4
No ratings yet
Tutorial 4
2 pages
Artificial Neural Network
100% (1)
Artificial Neural Network
35 pages
How To Model Residual Errors To Correct Time Series Forecasts With Python
No ratings yet
How To Model Residual Errors To Correct Time Series Forecasts With Python
22 pages
AI Lab 12 Lab Tasks - 39
No ratings yet
AI Lab 12 Lab Tasks - 39
12 pages
Tensorflow, Keras and Deep Learning
No ratings yet
Tensorflow, Keras and Deep Learning
51 pages
Supervised Learning
No ratings yet
Supervised Learning
14 pages
Dl Question Bank
No ratings yet
Dl Question Bank
23 pages
Module 5 Atc
No ratings yet
Module 5 Atc
12 pages
Unit IV Toc QB Ans
No ratings yet
Unit IV Toc QB Ans
38 pages
Tabla Función Gamma
No ratings yet
Tabla Función Gamma
2 pages
Chapter Twenty - Time Series
No ratings yet
Chapter Twenty - Time Series
28 pages
DL Unit-4
No ratings yet
DL Unit-4
26 pages
ARIMAX
No ratings yet
ARIMAX
10 pages
Department of Mathematics Birla Institute of Technology Mesra, Ranchi Tutorial - 3
No ratings yet
Department of Mathematics Birla Institute of Technology Mesra, Ranchi Tutorial - 3
1 page