0% found this document useful (0 votes)

5 views

vertopal.com_Untitled57

The document outlines a machine learning workflow using various regression models including Recursive Least Squares, Decision Tree, Random Forest, XGBoost, and an Artificial Neural Network (ANN) to predict a target variable from a dataset. It includes data preprocessing steps such as scaling and train-test splitting, model training with hyperparameter tuning using GridSearchCV, and evaluation of model performance using metrics like MSE, MAE, and R² score. Finally, the results are saved to an Excel file for comparison.

Uploaded by

Akash Layek

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

vertopal.com_Untitled57

Uploaded by

Akash Layek

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

import pandas as pd

import numpy as np
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.metrics import mean_squared_error, mean_absolute_error,
r2_score
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from xgboost import XGBRegressor
from sklearn.preprocessing import StandardScaler

# For ANN
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.wrappers.scikit_learn import KerasRegressor

# Load dataset
df = pd.read_csv("Imbalanced_PV_Fault_Dataset.csv")

X = df.drop(columns=["Feature_0", "Fault_Flag"])
y = df["Feature_0"]

# Train-test split
X_train, X_test, y_train, y_test = train_test_split(X, y,
test_size=0.2, random_state=42)

# Scaling
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# ----------- Recursive Least Squares -----------

class RecursiveLeastSquares:
def __init__(self, num_features, lambda_factor=0.99, delta=1.0):
self.num_features = num_features
self.lambda_factor = lambda_factor
self.P = np.eye(num_features) * delta
self.theta = np.zeros(num_features)

def update(self, X, y):

X = np.array(X).reshape(-1, 1)
y = np.array(y)
K = self.P @ X / (self.lambda_factor + X.T @ self.P @ X)
self.theta += (y - X.T @ self.theta) * K.flatten()
self.P = (self.P - K @ X.T @ self.P) / self.lambda_factor

rls = RecursiveLeastSquares(num_features=X.shape[1])
for i in range(len(X_train)):
rls.update(X_train.iloc[i].values, y_train.iloc[i])
y_rls_pred = [np.dot(rls.theta, x) for x in X_test.values]
# ----------- GridSearchCV Models -----------

# Decision Tree
dtr = DecisionTreeRegressor(random_state=42)
dtr_param = {'max_depth': [3, 5, 10, None]}
dtr_grid = GridSearchCV(dtr, dtr_param, cv=5)
dtr_grid.fit(X_train, y_train)
dtr_pred = dtr_grid.best_estimator_.predict(X_test)

# Random Forest
rfr = RandomForestRegressor(random_state=42)
rfr_param = {'n_estimators': [50, 100], 'max_depth': [5, 10, None]}
rfr_grid = GridSearchCV(rfr, rfr_param, cv=5)
rfr_grid.fit(X_train, y_train)
rfr_pred = rfr_grid.best_estimator_.predict(X_test)

# XGBoost
xgb = XGBRegressor(random_state=42, verbosity=0)
xgb_param = {'n_estimators': [50, 100], 'max_depth': [3, 5, 10]}
xgb_grid = GridSearchCV(xgb, xgb_param, cv=5)
xgb_grid.fit(X_train, y_train)
xgb_pred = xgb_grid.best_estimator_.predict(X_test)

# ----------- ANN Model -----------

def build_ann():
model = Sequential()
model.add(Dense(64, input_dim=X_train.shape[1],
activation='relu'))
model.add(Dense(32, activation='relu'))
model.add(Dense(1)) # Output layer
model.compile(optimizer='adam', loss='mse')
return model

ann = KerasRegressor(build_fn=build_ann, epochs=100, batch_size=16,

verbose=0)
ann.fit(X_train_scaled, y_train)
ann_pred = ann.predict(X_test_scaled)

/var/folders/tt/9tcd3n611x1_n7ww1jb91r500000gn/T/
ipykernel_27794/2130103562.py:1: DeprecationWarning: KerasRegressor is
deprecated, use Sci-Keras (https://github.com/adriangb/scikeras)
instead. See https://www.adriangb.com/scikeras/stable/migration.html
for help migrating.
ann = KerasRegressor(build_fn=build_ann, epochs=100, batch_size=16,
verbose=0)

# ----------- Metrics -----------

metrics = {
"Model": ["RLS", "Decision Tree", "Random Forest", "XGBoost",
"ANN"],
"MSE": [
mean_squared_error(y_test, y_rls_pred),
mean_squared_error(y_test, dtr_pred),
mean_squared_error(y_test, rfr_pred),
mean_squared_error(y_test, xgb_pred),
mean_squared_error(y_test, ann_pred),
],
"MAE": [
mean_absolute_error(y_test, y_rls_pred),
mean_absolute_error(y_test, dtr_pred),
mean_absolute_error(y_test, rfr_pred),
mean_absolute_error(y_test, xgb_pred),
mean_absolute_error(y_test, ann_pred),
],
"R² Score": [
r2_score(y_test, y_rls_pred),
r2_score(y_test, dtr_pred),
r2_score(y_test, rfr_pred),
r2_score(y_test, xgb_pred),
r2_score(y_test, ann_pred),
]
}

comparison_df = pd.DataFrame(metrics)
print(comparison_df)

# Optional: print best parameters

print("\nBest Parameters:")
print("DTR:", dtr_grid.best_params_)
print("RFR:", rfr_grid.best_params_)
print("XGB:", xgb_grid.best_params_)

Model MSE MAE R² Score

0 RLS 4.525742e-26 1.691223e-13 1.000000
1 Decision Tree 1.820721e-01 3.104887e-01 0.921079
2 Random Forest 6.800423e-02 1.663037e-01 0.970523
3 XGBoost 4.184689e-02 1.506359e-01 0.981861
4 ANN 2.230879e-04 1.038437e-02 0.999903

Best Parameters:
DTR: {'max_depth': None}
RFR: {'max_depth': None, 'n_estimators': 100}
XGB: {'max_depth': 3, 'n_estimators': 100}

import pandas as pd

# Assuming `comparison_df` already exists from previous code

# and contains columns: "Model", "MSE", "MAE", "R² Score"

# Define output file name

output_file = "comparison_report.xlsx"
# Save to Excel
comparison_df.to_excel(output_file, index=False)

print(f"Comparison report saved as '{output_file}' in your current

working directory.")

Comparison report saved as 'comparison_report.xlsx' in your current

working directory.

Regression Analysis - Cheatsheet
No ratings yet
Regression Analysis - Cheatsheet
9 pages
A Comprehensive Analysis of Machine Learning Models For Algorithmic Trading of Bitcoin
No ratings yet
A Comprehensive Analysis of Machine Learning Models For Algorithmic Trading of Bitcoin
11 pages
Model Evaluation and Selection Cheatsheet 1708023215
No ratings yet
Model Evaluation and Selection Cheatsheet 1708023215
7 pages
Mercedes-Benz Greener Manufacturing Ai
0% (1)
Mercedes-Benz Greener Manufacturing Ai
16 pages
Supple Maximizing Performance in Cs CuBiCl
No ratings yet
Supple Maximizing Performance in Cs CuBiCl
5 pages
To Improve The Performance of Models Predicting Ba
No ratings yet
To Improve The Performance of Models Predicting Ba
6 pages
AML_code_for_m2
No ratings yet
AML_code_for_m2
7 pages
COMPARISON - Jupyter Notebook
No ratings yet
COMPARISON - Jupyter Notebook
5 pages
5) Randomforest - Ipynb - Colaboratory
No ratings yet
5) Randomforest - Ipynb - Colaboratory
12 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
Decision Tree Algorithm in Machine Learning
No ratings yet
Decision Tree Algorithm in Machine Learning
13 pages
Experiment 2 FDL - Jupyter Notebook
No ratings yet
Experiment 2 FDL - Jupyter Notebook
2 pages
FB Models PDF
No ratings yet
FB Models PDF
14 pages
ML Codes
No ratings yet
ML Codes
9 pages
Hyperparameter Tuning
No ratings yet
Hyperparameter Tuning
7 pages
Classification Review
No ratings yet
Classification Review
8 pages
Models
No ratings yet
Models
2 pages
Time Series Forecasting Basic Eda Prediction
No ratings yet
Time Series Forecasting Basic Eda Prediction
4 pages
Slip
No ratings yet
Slip
5 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
AIH_Lab2
No ratings yet
AIH_Lab2
10 pages
ML Lab File Final.docx - Google Docs
No ratings yet
ML Lab File Final.docx - Google Docs
17 pages
Soft Sensor Code
No ratings yet
Soft Sensor Code
4 pages
Soft Sensor Code
No ratings yet
Soft Sensor Code
4 pages
ai int-1
No ratings yet
ai int-1
6 pages
Import Numpy As NP Import Pandas As PD
No ratings yet
Import Numpy As NP Import Pandas As PD
7 pages
Heart Disease 50% Code
No ratings yet
Heart Disease 50% Code
3 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
ml using python programs
No ratings yet
ml using python programs
12 pages
Random Forest: Implementaciones de Scikit-Learn Sobre QSAR
100% (1)
Random Forest: Implementaciones de Scikit-Learn Sobre QSAR
11 pages
ml lab programs 2
No ratings yet
ml lab programs 2
16 pages
ML_assignment
No ratings yet
ML_assignment
10 pages
QB 1
No ratings yet
QB 1
11 pages
S-10
No ratings yet
S-10
11 pages
vertopal.com_project
No ratings yet
vertopal.com_project
16 pages
16BCB0126 VL2018195002535 Pe003
No ratings yet
16BCB0126 VL2018195002535 Pe003
40 pages
Homework: Grid Search For Hyperparameter Tuning: From Sklearn - Model - Selection Import Train - Test - Split
No ratings yet
Homework: Grid Search For Hyperparameter Tuning: From Sklearn - Model - Selection Import Train - Test - Split
9 pages
Import Library Python
No ratings yet
Import Library Python
10 pages
Hyperparameter Tuning
No ratings yet
Hyperparameter Tuning
9 pages
Sentimental
No ratings yet
Sentimental
11 pages
21brs1474 ML Lab 2
No ratings yet
21brs1474 ML Lab 2
25 pages
Codigo Modelo
No ratings yet
Codigo Modelo
5 pages
8 To 12 Jaimeen
No ratings yet
8 To 12 Jaimeen
34 pages
05 E RandomForest LoanData
No ratings yet
05 E RandomForest LoanData
8 pages
ML Record Print
No ratings yet
ML Record Print
20 pages
ML Brefing
No ratings yet
ML Brefing
28 pages
AML_lab[1] (1)
No ratings yet
AML_lab[1] (1)
14 pages
Lab - 7 - 21130616 - TranhThanhVu - Ipynb - Colab
No ratings yet
Lab - 7 - 21130616 - TranhThanhVu - Ipynb - Colab
10 pages
Programs Lab Bca
No ratings yet
Programs Lab Bca
16 pages
Lab 1. Boston House
No ratings yet
Lab 1. Boston House
7 pages
AI ML - Cycle 2 Programs (1)
No ratings yet
AI ML - Cycle 2 Programs (1)
15 pages
Python Essential Methods In Machine Learning
No ratings yet
Python Essential Methods In Machine Learning
6 pages
Approachin190808095205 PDF
No ratings yet
Approachin190808095205 PDF
112 pages
Machine Learning Presentaion
No ratings yet
Machine Learning Presentaion
15 pages
ML 7
No ratings yet
ML 7
6 pages
PA DA2_merged
No ratings yet
PA DA2_merged
29 pages
ANN_EXPERIENTIAL_LEARNING
No ratings yet
ANN_EXPERIENTIAL_LEARNING
43 pages
Deep Learning Perceptron
No ratings yet
Deep Learning Perceptron
10 pages
LAB-4 Report
No ratings yet
LAB-4 Report
21 pages
Artificial Intelligence May Minor Project
No ratings yet
Artificial Intelligence May Minor Project
8 pages
The Essential R Reference
From Everand
The Essential R Reference
Mark Gardener
No ratings yet
Credit Card Default
No ratings yet
Credit Card Default
30 pages
Data Analytics lab manual
No ratings yet
Data Analytics lab manual
47 pages
Unit 2
No ratings yet
Unit 2
28 pages
Release Kinetics - Concepts and Applications
No ratings yet
Release Kinetics - Concepts and Applications
9 pages
Predicting Bank Insolvencies Using Machine Learning Techniques
No ratings yet
Predicting Bank Insolvencies Using Machine Learning Techniques
42 pages
Introduction To Survey Methodology and Sampling Techniques (PDFDrive)
No ratings yet
Introduction To Survey Methodology and Sampling Techniques (PDFDrive)
1,046 pages
CIM Ch3 19pages 13jan2020
No ratings yet
CIM Ch3 19pages 13jan2020
19 pages
Customer Retail Shopping Analysis 1686591558
No ratings yet
Customer Retail Shopping Analysis 1686591558
45 pages
A Practical Guide To MLR Forecasting in APO Demand Planning
No ratings yet
A Practical Guide To MLR Forecasting in APO Demand Planning
15 pages
A Review Paper On Prediction of Construction Productivity Using Artificial Neural Network Model
No ratings yet
A Review Paper On Prediction of Construction Productivity Using Artificial Neural Network Model
8 pages
Sales Forecasting Elsvier
No ratings yet
Sales Forecasting Elsvier
19 pages
Innovations in Sustainable Energy and Technology 2021
100% (2)
Innovations in Sustainable Energy and Technology 2021
382 pages
The Coefficient of Determination R-Squared Is More Informative Than SMAPE, MAE, MAPE, MSE and RMSE in Regression Analysis Evaluation
No ratings yet
The Coefficient of Determination R-Squared Is More Informative Than SMAPE, MAE, MAPE, MSE and RMSE in Regression Analysis Evaluation
25 pages
Srs
No ratings yet
Srs
3 pages
Chapter 7 - Methods of Finding Estimators: Chapter 7 For BST 695: Special Topics in Statistical Theory. Kui Zhang, 2011
No ratings yet
Chapter 7 - Methods of Finding Estimators: Chapter 7 For BST 695: Special Topics in Statistical Theory. Kui Zhang, 2011
30 pages
Chapter 08
No ratings yet
Chapter 08
66 pages
Unit 4 MCQ
No ratings yet
Unit 4 MCQ
10 pages
Looking Inside SAS Forecast Studio: White Paper
No ratings yet
Looking Inside SAS Forecast Studio: White Paper
15 pages
N Unbiased
No ratings yet
N Unbiased
15 pages
ANN With GA
100% (1)
ANN With GA
3 pages
Market and Demand Analysis
33% (3)
Market and Demand Analysis
25 pages
3570 6517 2 PB
No ratings yet
3570 6517 2 PB
5 pages
Forecasting Models
No ratings yet
Forecasting Models
12 pages
Kernel Density Estimation and Its Application
No ratings yet
Kernel Density Estimation and Its Application
8 pages
Second Course in Statistics Regression Analysis 7th Edition Mendenhall Solutions Manual download
100% (1)
Second Course in Statistics Regression Analysis 7th Edition Mendenhall Solutions Manual download
48 pages
Agricolae Manual PDF
No ratings yet
Agricolae Manual PDF
156 pages
Product Quality Prediction in Pulsed Laser Cutting
No ratings yet
Product Quality Prediction in Pulsed Laser Cutting
18 pages
Sales and Distribution Management by Tapan K Panda
88% (8)
Sales and Distribution Management by Tapan K Panda
102 pages
RCS Prediction of A Target Based On The Machine Learning
No ratings yet
RCS Prediction of A Target Based On The Machine Learning
3 pages

vertopal.com_Untitled57

Uploaded by

vertopal.com_Untitled57

Uploaded by

import pandas as pd

# ----------- Recursive Least Squares -----------

def update(self, X, y):

# ----------- ANN Model -----------

ann = KerasRegressor(build_fn=build_ann, epochs=100, batch_size=16,

# ----------- Metrics -----------

# Optional: print best parameters

Model MSE MAE R² Score

# Assuming `comparison_df` already exists from previous code

# Define output file name

print(f"Comparison report saved as '{output_file}' in your current

Comparison report saved as 'comparison_report.xlsx' in your current

You might also like