Preprocessing_1

These are preprocessing slides

Uploaded by

Fareeha Butt

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

14 views

Preprocessing_1

These are preprocessing slides

Uploaded by

Fareeha Butt

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 11

Attributes Types in

Machine Learning
By Dr. Adven
What are Attributes?
• Attributes, also known as features or variables, are the different
characteristics or properties of the data in Machine learning. They are
crucial as they define the type of information collected and determine
the kind of analysis that can be performed
Types of Attributes
Nominal Attributes
• Nominal attributes represent categories or names.
• Examples: Gender (Male, Female), Hair Color (Black, Brown, Blonde),
Nationality (American, Canadian).
Ordinal Attributes
• Ordinal attributes represent categories with a meaningful order but no
consistent difference between them.
• Examples: Education Level (High School, Bachelor's, Master's, PhD),
Customer Satisfaction (Very Dissatisfied, Dissatisfied, Neutral, Satisfied,
Very Satisfied).
Types of Attributes
Interval Attributes
• Definition: Interval attributes represent numerical values with
meaningful intervals but no true zero point.
• Examples: Temperature in Celsius or Fahrenheit, Calendar dates (e.g.,
years 2000, 2001, 2002).
Ratio Attributes
• Ratio attributes represent numerical values with meaningful intervals
and a true zero point.
• Examples: Height, Weight, Age, Salary, Distance.
Types of Attributes
Binary Attributes
• Binary attributes have only two categories or states.
• Examples: Yes/No, True/False, Male/Female, Pass/Fail.
Discrete Attributes
• Discrete attributes have a finite or countable number of values.
• Examples: Number of children, Number of cars owned, Shoe size.
Continuous Attributes
• Continuous attributes have an infinite number of possible values
within a range.
• Examples: Temperature, Height, Weight, Time.
Role of Attributes in Data Mining
• Attributes play a crucial role in data mining tasks, such as:
1.Classification: Attributes serve as input features to classify data into
predefined categories.
2.Clustering: Attributes help in grouping data points into clusters based
on similarity.
3.Association Rule Mining: Attributes are used to find relationships
between different variables in the dataset.
4.Regression: Attributes are used to predict a continuous target
variable.
Attribute Transformation
• Normalization: Scaling attributes to a specific range, often [0,1] or [-
1,1].
• Standardization: Transforming attributes to have a mean of zero and
a standard deviation of one.
• Discretization: Converting continuous attributes into discrete
attributes.
• Encoding: Converting categorical attributes into numerical formats,
such as one-hot encoding.
Data Cleaning
• There are various steps and techniques used in data cleaning and
preprocessing in machine learning. Here's an explanation of each
1. Parsing: Parsing involves analyzing a string of symbols, either in
natural language or computer languages, to understand its
structure. In data mining it refers to the process of breaking down
data into its components, such as splitting a full name into first and
last names or extracting date components from a timestamp.
Data Cleaning
2. Correcting: Correcting refers to fixing errors or inaccuracies in the data.
• This step involves identifying and correcting incorrect data entries, such
as typos, spelling errors, or logical inconsistencies (e.g., a future date for
a past event).
3. Standardizing: Standardizing is the process of bringing data into a
common format or structure.
• Standardizing ensures consistency in data format across the dataset. For
example, converting all dates to a single format (e.g., "YYYY-MM-DD") or
standardizing measurement units (e.g., converting all weights to
kilograms).
Data Cleaning
4. Dealing with Missing Values: Handling missing values involves
strategies to address gaps in the data.
• In Data Mining: Techniques include:
• Imputation: Replacing missing values with estimated ones, such as
mean, median, or mode.
• Deletion: Removing records or variables with missing data if they are
minimal or insignificant.
• Prediction: Using algorithms to predict missing values based on other
available data.
Data Cleaning
5. Dealing with Noisy Data: Noisy data refers to data that contains
errors, outliers, or irrelevant information.
• Methods to handle noisy data include:
• Smoothing Techniques: Such as binning, clustering, or regression, to
reduce noise.
• Outlier Detection: Identifying and treating data points that deviate
significantly from the rest of the data.
• Filtering: Removing or transforming data that is irrelevant or
contributes to noise in the dataset.

Comptia Data+ Da0-001
No ratings yet
Comptia Data+ Da0-001
10 pages
IADC Daily Report
100% (1)
IADC Daily Report
1 page
Unit - 1 Notes - Introduction To Data-Analytics PDF
0% (1)
Unit - 1 Notes - Introduction To Data-Analytics PDF
106 pages
Elen C-Series-User-Manual
100% (1)
Elen C-Series-User-Manual
68 pages
R21 DM Unit1
No ratings yet
R21 DM Unit1
77 pages
MSDSModule 2
No ratings yet
MSDSModule 2
35 pages
Chap.3 Data Preprocessing
No ratings yet
Chap.3 Data Preprocessing
6 pages
Ch.3 Data Preprocessing
No ratings yet
Ch.3 Data Preprocessing
16 pages
Types of attributes-1
No ratings yet
Types of attributes-1
8 pages
Unit 3
No ratings yet
Unit 3
30 pages
M2 PPT
No ratings yet
M2 PPT
60 pages
DS Handout 3
No ratings yet
DS Handout 3
4 pages
Dmml Notes
No ratings yet
Dmml Notes
89 pages
Unit 2- Data Representation
No ratings yet
Unit 2- Data Representation
44 pages
Unit-2Exploratory-Analysis
No ratings yet
Unit-2Exploratory-Analysis
37 pages
DWM Sem V Module 2 - Introduction To Data Mining, Data Exploration and Data Pre-Processing
No ratings yet
DWM Sem V Module 2 - Introduction To Data Mining, Data Exploration and Data Pre-Processing
55 pages
cs3352-foundations-of-data-science-unit-ii
No ratings yet
cs3352-foundations-of-data-science-unit-ii
34 pages
DSUR_EA2352001010391_W7
No ratings yet
DSUR_EA2352001010391_W7
3 pages
DataCleaning
No ratings yet
DataCleaning
28 pages
Antim-Prahar-Data-Analytics-for-Business-Decisions-2025_compressed
No ratings yet
Antim-Prahar-Data-Analytics-for-Business-Decisions-2025_compressed
44 pages
Data Science S3mca
No ratings yet
Data Science S3mca
55 pages
Preprocessing
No ratings yet
Preprocessing
50 pages
UNIT02
No ratings yet
UNIT02
41 pages
Unit1-Data Science Fundamentals
No ratings yet
Unit1-Data Science Fundamentals
35 pages
Week 4 DMM(1) (1)
No ratings yet
Week 4 DMM(1) (1)
21 pages
253777
No ratings yet
253777
66 pages
Data Analytics Theory
No ratings yet
Data Analytics Theory
35 pages
Exam-1
No ratings yet
Exam-1
12 pages
Unit 2
No ratings yet
Unit 2
11 pages
03 Data Science Process_Fall 23-24
No ratings yet
03 Data Science Process_Fall 23-24
38 pages
Module 3
No ratings yet
Module 3
66 pages
Module 3
No ratings yet
Module 3
66 pages
L7-Data Interpretation and Presentation
No ratings yet
L7-Data Interpretation and Presentation
8 pages
DATA WRANGLING
No ratings yet
DATA WRANGLING
9 pages
Data Mining
No ratings yet
Data Mining
5 pages
Data preprocessing (1)
No ratings yet
Data preprocessing (1)
77 pages
Machine Learning Pipeline: Created by Arbaz Ali
No ratings yet
Machine Learning Pipeline: Created by Arbaz Ali
32 pages
UNIT-2
No ratings yet
UNIT-2
19 pages
Data Preprocessing
100% (1)
Data Preprocessing
33 pages
Down 2
No ratings yet
Down 2
61 pages
Research Methods 4
No ratings yet
Research Methods 4
39 pages
Unit 2 1
No ratings yet
Unit 2 1
70 pages
ML 3170724 Unit-2
No ratings yet
ML 3170724 Unit-2
40 pages
Data Cleaning Wrangling
No ratings yet
Data Cleaning Wrangling
42 pages
FDS CH 3
No ratings yet
FDS CH 3
2 pages
Data Exploration
No ratings yet
Data Exploration
12 pages
BUSINESS ANALYTICS
No ratings yet
BUSINESS ANALYTICS
14 pages
Measurement and Scalingt Echniques
No ratings yet
Measurement and Scalingt Echniques
56 pages
Statistics 1A Lecture Notes Article
No ratings yet
Statistics 1A Lecture Notes Article
123 pages
Quantitative and Qualitative
No ratings yet
Quantitative and Qualitative
41 pages
Quantitative Research Methods - Data Processing and Analysis
No ratings yet
Quantitative Research Methods - Data Processing and Analysis
25 pages
Unit2PreparingtoModelpptx 2023 09 02 14 52 40
No ratings yet
Unit2PreparingtoModelpptx 2023 09 02 14 52 40
43 pages
Data Wrangling
No ratings yet
Data Wrangling
17 pages
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
No ratings yet
Lab Assignment 1 Title: Data Wrangling I: Problem Statement
12 pages
Measurement Scale: Dr. Myint Moe Moe Khin Professor / Head Department of Statistics Monywa University of Economics
No ratings yet
Measurement Scale: Dr. Myint Moe Moe Khin Professor / Head Department of Statistics Monywa University of Economics
27 pages
Data Mining Notes
No ratings yet
Data Mining Notes
25 pages
Module 2
No ratings yet
Module 2
42 pages
4 - Finding and Fixing Data Quality Issues
No ratings yet
4 - Finding and Fixing Data Quality Issues
48 pages
DWDM REFERENCE NOTES
No ratings yet
DWDM REFERENCE NOTES
126 pages
Data Preprocessing Techniques Cleaning Transformation and Integration
No ratings yet
Data Preprocessing Techniques Cleaning Transformation and Integration
6 pages
3 Ravi
No ratings yet
3 Ravi
82 pages
Basic Concepts in Data Structures
From Everand
Basic Concepts in Data Structures
K.Meenendranath Reddy
No ratings yet
CS4230_Assignment2
No ratings yet
CS4230_Assignment2
1 page
Naive_Bayes_classifier (1)
No ratings yet
Naive_Bayes_classifier (1)
15 pages
decisiontrees (1)
No ratings yet
decisiontrees (1)
28 pages
SVMs[1]
No ratings yet
SVMs[1]
30 pages
Week 6 Applications of Stack
No ratings yet
Week 6 Applications of Stack
15 pages
Week 10 Trees
No ratings yet
Week 10 Trees
44 pages
1 IT
No ratings yet
1 IT
1 page
shafia_thesis_ppt[1][1][1]
No ratings yet
shafia_thesis_ppt[1][1][1]
22 pages
Leonard Orr 52CODES
No ratings yet
Leonard Orr 52CODES
22 pages
090L, 100L
No ratings yet
090L, 100L
62 pages
Human Potential Course Vivobarefoot AU
No ratings yet
Human Potential Course Vivobarefoot AU
1 page
5 Ood
No ratings yet
5 Ood
40 pages
Introduction To Oracle Linux - Shell and Command Line
No ratings yet
Introduction To Oracle Linux - Shell and Command Line
1 page
Chapter (7) Beams: Revision
No ratings yet
Chapter (7) Beams: Revision
12 pages
Module 2 Lesson 2.2
No ratings yet
Module 2 Lesson 2.2
9 pages
Teaching Collocations
100% (1)
Teaching Collocations
15 pages
General Questions For Interview: Q1: Tell Me About Yourself
No ratings yet
General Questions For Interview: Q1: Tell Me About Yourself
5 pages
My Log
No ratings yet
My Log
6 pages
DM PKA BLM Download-All
No ratings yet
DM PKA BLM Download-All
39 pages
A Rapid LCMS Method For Evaluation of EPA 1694 and 6810 Contaminants in Drinking Water
No ratings yet
A Rapid LCMS Method For Evaluation of EPA 1694 and 6810 Contaminants in Drinking Water
1 page
Traverse Computation
No ratings yet
Traverse Computation
9 pages
SDET Bottles Filling and Capping Machine Operation Manual
No ratings yet
SDET Bottles Filling and Capping Machine Operation Manual
10 pages
Rig-44-Rev-C-2-15-19
No ratings yet
Rig-44-Rev-C-2-15-19
1 page
HUAWEI CUN U29-Bitel Phone Upgrade Guide - V1.1 - 20161128
No ratings yet
HUAWEI CUN U29-Bitel Phone Upgrade Guide - V1.1 - 20161128
10 pages
EIM 9 Quarter 2 Module 3
No ratings yet
EIM 9 Quarter 2 Module 3
23 pages
Transcendental Dissonance: Thank You
No ratings yet
Transcendental Dissonance: Thank You
2 pages
Sequential Calibration of Options
No ratings yet
Sequential Calibration of Options
15 pages
Physics Lesson Notes On Heat Capacity and Specific Heat Capacity
No ratings yet
Physics Lesson Notes On Heat Capacity and Specific Heat Capacity
5 pages
Summative Test in Science 6
100% (2)
Summative Test in Science 6
1 page
On The Use Non-Stationary Penalty Functions T o Solve Nonlinear Constrained Optimization Problems With GA's
No ratings yet
On The Use Non-Stationary Penalty Functions T o Solve Nonlinear Constrained Optimization Problems With GA's
6 pages
This Study Resource Was Shared Via: Course Description
No ratings yet
This Study Resource Was Shared Via: Course Description
3 pages
Time Distance
No ratings yet
Time Distance
23 pages
PST, Sw9, Spring 2017
No ratings yet
PST, Sw9, Spring 2017
13 pages
Chapter 1-Fundamental Principles of Counting PDF
No ratings yet
Chapter 1-Fundamental Principles of Counting PDF
7 pages
MASONRY Handout
100% (1)
MASONRY Handout
20 pages
The Research Process
No ratings yet
The Research Process
43 pages