Welcome to Scribd!

0% found this document useful (0 votes)

18 views

DSBDA Lab Assignment No 10

Uploaded by

sanudantal42003

The document discusses creating visualizations like histograms and boxplots of features in an iris flower dataset. It provides instructions to download the iris dataset, examine the feature types, create a histogram for each feature, create a boxplot for each feature, and identify outliers from the boxplots.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

DSBDA Lab Assignment No 10

Uploaded by

sanudantal42003

0% found this document useful (0 votes)

18 views3 pages

Original Title

DSBDA_Lab_Assignment_No_10

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

18 views3 pages

DSBDA Lab Assignment No 10

Uploaded by

sanudantal42003

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 3

Search inside document

Group A

Assignment No: 10

Title of the Assignment: Data Visualization III

Download the Iris flower dataset or any other dataset into a DataFrame. (e.g.,
https://archive.ics.uci.edu/ml/datasets/Iris ). Scan the dataset and give the inference as:
1. List down the features and their types (e.g., numeric, nominal) available in the dataset.
2. Create a histogram for each feature in the dataset to illustrate the feature distributions.
3. Create a box plot for each feature in the dataset.
4. Compare distributions and identify outliers.

Objective of the Assignment: Students should be able to perform the data Visualization
operation using Python on any open source dataset

Prerequisite:
1. Basic of Python Programming
2. Seaborn Library, Concept of Data Visualization.
3. Types of variables

Theory:
Histograms:
A histogram is basically used to represent data provided in a form of some groups.It is accurate
method for the graphical representation of numerical data distribution. It is a type of bar plot where
X-axis represents the bin ranges while Y-axis gives information about frequency.
The following table shows the parameters accepted by matplotlib.pyplot.hist() function :
Attribute Parameter

x array or sequence of array

bins optional parameter contains integer or sequence or strings

density optional parameter contains boolean values

range optional parameter represents upper and lower range of bins

optional parameter used to create type of histogram [bar, barstacked, step, stepfilled],
histtype default is “bar”

align optional parameter controls the plotting of histogram [left, right, mid]

weights optional parameter contains array of weights having same dimensions as x

bottom location of the basline of each bin

rwidth optional parameter which is relative width of the bars with respect to bin width

color optional parameter used to set color or sequence of color specs

label optional parameter string or sequence of string to match with multiple datasets

log optional parameter used to set histogram axis on log scale

Algorithm:
1. Import required libraries.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import pylab
import seaborn as sns
import os
2. Create the data frame for downloaded iris.csv dataset.
os.chdir("D:\Pandas")
df =
pd.read_csv("Iris.csv") df
3. Apply data preprocessing techniques.
df.isnull().sum()
df.describe()
4. Plot the box plot for each feature in the dataset and observe and detect the
outliers. sns.set(style ="whitegrid", palette = "GnBu_d", rc =
{'figure.figsize':(11.7,8.27)} ) sns.boxplot(x='Species', y='SepalLengthCm', data=df)
plt.title('Distribution of sepal length')
plt.show()
5. Plot the histogram for each feature in the dataset.
df.hist()

Viva Questions
1. For the iris dataset, list down the features and their types.
2. Write a code to create a histogram for each feature. (iris dataset)
3. Write a code to create a boxplot for each feature. (iris dataset)
4. Identify the outliers from the boxplot drawn for iris dataset.

Cedex
Document189 pages
Cedex
Wilna
No ratings yet
Data Visulation
Document8 pages
Data Visulation
kashyapnirmala295
No ratings yet
Exercise and Experiment 3
Document14 pages
Exercise and Experiment 3
h8792670
No ratings yet
Pandas What Can Pandas Do For You ?: Statsmodels SM Seaborn Sns
Document9 pages
Pandas What Can Pandas Do For You ?: Statsmodels SM Seaborn Sns
NohaM.
No ratings yet
DSBDL Write Ups 8 To 10
Document7 pages
DSBDL Write Ups 8 To 10
sdaradeyt
No ratings yet
CO-367 Machine Learning Lab File: Submitted To: Submitted by
Document12 pages
CO-367 Machine Learning Lab File: Submitted To: Submitted by
Shubham Anand
No ratings yet
Muthayammal College of Arts and Science Rasipuram: Assignment No - 1
Document10 pages
Muthayammal College of Arts and Science Rasipuram: Assignment No - 1
Gopi Balakrishnan
No ratings yet
Lab Cs
Document38 pages
Lab Cs
gbalu0061
No ratings yet
Module IV
Document43 pages
Module IV
saikumar.addanki990
No ratings yet
Tensor Flow and Keras Sample Programs
Document22 pages
Tensor Flow and Keras Sample Programs
vinothkumar0743
No ratings yet
Boxplot
Document8 pages
Boxplot
rahul.mani
No ratings yet
Machinelearning Prac
Document17 pages
Machinelearning Prac
SHREYANSH NIGAM
No ratings yet
Visualization Library Documentation
Document16 pages
Visualization Library Documentation
grithik02
No ratings yet
Data Structures: Steven Skiena
Document25 pages
Data Structures: Steven Skiena
Pusat Tuisyen Bestari Ilmu
No ratings yet
Essential Python Data Visualization Libraries 1687141550
Document16 pages
Essential Python Data Visualization Libraries 1687141550
boda prasanth
No ratings yet
Python For Statistics
Document40 pages
Python For Statistics
hod.cs.dck
No ratings yet
Data Visualization
Document28 pages
Data Visualization
vsy9926
No ratings yet
Charts and Graphs in Python and R
Document1 page
Charts and Graphs in Python and R
same here
No ratings yet
DA R Unit-4
Document32 pages
DA R Unit-4
deepikach564
No ratings yet
Matplotlib Notes
Document5 pages
Matplotlib Notes
asayushsingh638
No ratings yet
2.1 Exploratory Data Analysis Using Python
Document12 pages
2.1 Exploratory Data Analysis Using Python
Kakashi Hatake
No ratings yet
Saveetha Institute of Medical and Technical Sciences: Unit V Plotting and Regression Analysis in R
Document63 pages
Saveetha Institute of Medical and Technical Sciences: Unit V Plotting and Regression Analysis in R
Muzakir Laikh Khan
No ratings yet
Matplotlib in Python
Document43 pages
Matplotlib in Python
Aamna Raza
No ratings yet
Program Syntax DVP
Document12 pages
Program Syntax DVP
Khyathi Kiran
No ratings yet
Data Analysis and Visulaization Experiment
Document104 pages
Data Analysis and Visulaization Experiment
Kashik Sredharan
No ratings yet
BDA File
Document26 pages
BDA File
sahil raturi
No ratings yet
Viva Voce
Document5 pages
Viva Voce
gangwar098preeti
No ratings yet
06 Plots Export Plots
Document17 pages
06 Plots Export Plots
the killerboy
100% (1)
Computing Programming With Python (W10)
Document30 pages
Computing Programming With Python (W10)
Anh Nguyễn Song Tường
No ratings yet
R Reference Card
Document6 pages
R Reference Card
tarikaltuncu
No ratings yet
Machine Learning Experiment
Document69 pages
Machine Learning Experiment
Kashik Sredharan
No ratings yet
Ass 10 DSBDL
Document9 pages
Ass 10 DSBDL
Anvi
No ratings yet
introduction_to_R_Charts_Graphs_AN_15_09_2024 (1)
Document8 pages
introduction_to_R_Charts_Graphs_AN_15_09_2024 (1)
Raj Kumar
No ratings yet
Data Visualization Using Matplotlib and Seaborn
Document28 pages
Data Visualization Using Matplotlib and Seaborn
thirosul
No ratings yet
Rasterio: Presenters: Sushma Ghimire (13) Ashmin Sharma Pokharel (19) Asim Shrestha
Document22 pages
Rasterio: Presenters: Sushma Ghimire (13) Ashmin Sharma Pokharel (19) Asim Shrestha
Sarthak Regmi
No ratings yet
تحليل وعرض البيانات
Document7 pages
تحليل وعرض البيانات
Mohamed Mostafa
No ratings yet
Introduction To R
Document52 pages
Introduction To R
HuGo HuGo HuGo
No ratings yet
Introduction To R
Document36 pages
Introduction To R
Refael Lav
No ratings yet
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
Document11 pages
Pierian Data - Python For Finance & Algorithmic Trading Course Notes
Ishan Sane
No ratings yet
Imp Details
Document6 pages
Imp Details
Jyotirmay Sahu
No ratings yet
DSA-Chapter-3.1-2024 (1)
Document9 pages
DSA-Chapter-3.1-2024 (1)
roinieva22
No ratings yet
Exp7 11 Data Science
Document23 pages
Exp7 11 Data Science
Nikhil Ranjan 211
No ratings yet
Chapter 3 2 Python Libraries
Document41 pages
Chapter 3 2 Python Libraries
Mlt Negessa
No ratings yet
Content From Jose Portilla's Udemy Course Learning Python For Data Analysis and Visualization Notes by Michael Brothers, Available On
Document13 pages
Content From Jose Portilla's Udemy Course Learning Python For Data Analysis and Visualization Notes by Michael Brothers, Available On
sam egoroff
No ratings yet
Data Analysis Lab - Final - 23-24
Document11 pages
Data Analysis Lab - Final - 23-24
forallofus435
No ratings yet
Lab 3 - SciKitLearn ML
Document2 pages
Lab 3 - SciKitLearn ML
manalluna9
No ratings yet
R/Rpad Reference Card: Slicing and Extracting Data
Document5 pages
R/Rpad Reference Card: Slicing and Extracting Data
nikhil4tp
No ratings yet
R Exercises 3 PDF
Document91 pages
R Exercises 3 PDF
Soumi Banerjee
No ratings yet
Part 6
Document11 pages
Part 6
Naji Saleh
No ratings yet
R-Cheat Sheet
Document4 pages
R-Cheat Sheet
Prasad Marathe
100% (1)
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
Document7 pages
Asset-V1 VIT+MBA109+2020+type@asset+block@Introductio To ML Using Python
Kartik Bhathire
No ratings yet
Cs3361 Data Science Laboratory
Document139 pages
Cs3361 Data Science Laboratory
karthickamsec
No ratings yet
Package Arulesviz': R Topics Documented
Document8 pages
Package Arulesviz': R Topics Documented
arclite123
No ratings yet
Data Science 1-5
Document15 pages
Data Science 1-5
developer adarsh
No ratings yet
unit 5
Document28 pages
unit 5
rohith96kum
No ratings yet
Murali Internship
Document34 pages
Murali Internship
chirusaikokkirala
No ratings yet
Week 3 Q&A (1)
Document10 pages
Week 3 Q&A (1)
parkerupsc
No ratings yet
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
Rating: 3 out of 5 stars
3/5 (1)
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
From Everand
Rust Package 100 Knocks: One-Hour Mastery Series 2024 Edition
Kanto
No ratings yet
Mastering Data Structures and Algorithms in C and C++
From Everand
Mastering Data Structures and Algorithms in C and C++
Sachin Naha
No ratings yet
Introduction to Algorithms
From Everand
Introduction to Algorithms
S VASIST
No ratings yet
Quizzes SB
Document364 pages
Quizzes SB
ngân hà ma
No ratings yet
Presenting Data and Graphics
Document15 pages
Presenting Data and Graphics
Slokans XI
No ratings yet
Uncertainty, Data & Judgement: Extra Exercises
Document53 pages
Uncertainty, Data & Judgement: Extra Exercises
Sergio Goldin
No ratings yet
Add Math Sba
Document21 pages
Add Math Sba
Michael Timson
100% (3)
Unit Iv List, Tuple and Dictionaries
Document135 pages
Unit Iv List, Tuple and Dictionaries
SUSEENDRAN RAMAKRISHNAN
No ratings yet
Ch.5 Errors During The Measuremen T Process
Document82 pages
Ch.5 Errors During The Measuremen T Process
D7ooM_612
No ratings yet
4 Heterogenitas
Document46 pages
4 Heterogenitas
Ran Tan
No ratings yet
Hydrology Chapter 7
Document78 pages
Hydrology Chapter 7
Ikram Rimli
No ratings yet
Texture Analysis Methods - A Review
Document33 pages
Texture Analysis Methods - A Review
Marcelo Queiroz
No ratings yet
Histogram - 2
Document19 pages
Histogram - 2
Jibran Zeb Shah
No ratings yet
Ignou Statistics2
Document153 pages
Ignou Statistics2
Satheesh Kalanilayam
No ratings yet
Output SmartPLS 27 September 2024 Brostrapping
Document153 pages
Output SmartPLS 27 September 2024 Brostrapping
shinta widyasari
No ratings yet
9) Interpreting Histograms
Document14 pages
9) Interpreting Histograms
Romeo Bordallo Jr.
No ratings yet
Promodel Version History
Document37 pages
Promodel Version History
Gonzalo Contreras
No ratings yet
Various Measures of Central Tendency
Document17 pages
Various Measures of Central Tendency
purivikrant
No ratings yet
12 Statistics
Document27 pages
12 Statistics
viswanath
No ratings yet
Diagrammatic Presentation 1
Document4 pages
Diagrammatic Presentation 1
Khushi Pradhan
No ratings yet
GE 4 Module 10
Document16 pages
GE 4 Module 10
Jirah Joy Peañar
No ratings yet
Lab 1 Me 303
Document12 pages
Lab 1 Me 303
jpw
No ratings yet
Functional Estimation For Density, Regression Models and Processes (Odile Pons)
Document205 pages
Functional Estimation For Density, Regression Models and Processes (Odile Pons)
chisn235711
No ratings yet
Concise Revision Course Csec HSB - Compress
Document173 pages
Concise Revision Course Csec HSB - Compress
Naomi Rodrigues
100% (1)
Lesson 3
Document24 pages
Lesson 3
123 123
No ratings yet
What Is A Data Source?: Unit-Vii Data Interpretation
Document79 pages
What Is A Data Source?: Unit-Vii Data Interpretation
sawmya shanmuganathan
No ratings yet
Adaptive Modeler Users Guide
Document138 pages
Adaptive Modeler Users Guide
aaandrei
No ratings yet
UNIT-III Data Warehouse and Minig Notes MDU
Document42 pages
UNIT-III Data Warehouse and Minig Notes MDU
neha srivastava
No ratings yet
Mean, Median and Mode
Document11 pages
Mean, Median and Mode
Seerat Pannu
0% (1)
Department of Education: 4 QUARTER - Module 5
Document12 pages
Department of Education: 4 QUARTER - Module 5
Ronelyn Plaza
No ratings yet
Yellow Light Blue Simple and Minimal College Thesis Education Presentation
Document15 pages
Yellow Light Blue Simple and Minimal College Thesis Education Presentation
kmrdubaipd
No ratings yet
PDF
Document185 pages
PDF
zxfzen
No ratings yet