0% found this document useful (0 votes)

3 views

python-Copy1

The document outlines a data analysis process using Python, specifically focusing on a dataset from an Excel file named 'heat_data.xlsx'. It includes steps for checking missing values, visualizing data through histograms and boxplots, calculating descriptive statistics, and building a linear regression model to analyze the relationship between variables. Additionally, it performs a t-test and ANOVA to assess differences in thermal properties between two variables, Y1 and Y2.

Uploaded by

Ky Phong Hoang

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

3 views

python-Copy1

Uploaded by

Ky Phong Hoang

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 5

python-Copy1

May 6, 2022

[1]: import pandas as pd

import numpy as np

[2]: # câu a
df = pd.read_excel("heat_data.xlsx")

[3]: df.head()

[3]: X1 X2 X3 X4 X5 X6 X7 X8 Y1 Y2
0 0.98 514.5 294.0 110.25 7.0 2 0.0 0 15.55 21.33
1 0.98 514.5 294.0 110.25 7.0 3 0.0 0 15.55 21.33
2 0.98 514.5 294.0 110.25 7.0 4 0.0 0 15.55 21.33
3 0.98 514.5 294.0 110.25 7.0 5 0.0 0 15.55 21.33
4 0.90 563.5 318.5 122.50 7.0 2 0.0 0 20.84 28.28

[4]: # Câu b xác định missing value

df.isna().sum()

[4]: X1 0
X2 0
X3 0
X4 0
X5 0
X6 0
X7 0
X8 0
Y1 0
Y2 0
dtype: int64

[5]: df.isnull().sum()

[5]: X1 0
X2 0
X3 0
X4 0
X5 0

1
X6 0
X7 0
X8 0
Y1 0
Y2 0
dtype: int64

[6]: # không có giá trị miss_value ,Xác định outlier bằng boxplot các cột có outlier␣
,→la X2, X3,X4

df.boxplot( figsize=(15,10))

# plt.show()

[6]: <matplotlib.axes._subplots.AxesSubplot at 0x26e52a36af0>

[7]: import matplotlib.pyplot as plt

import seaborn as sb

[8]: # Câu c visualize

df.hist(layout=(5,4), figsize=(15,10))

# plt.show()

2
[8]: array([[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E54EFCEB0>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E54F341C0>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E54F62550>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E54F8E9A0>],
[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E54FBCD30>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E54FF4130>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E54FF4220>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E5501F6D0>],
[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E5507AF10>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E550B13D0>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E550DE760>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E550FED60>],
[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E55137220>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E55164670>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E55190AF0>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E551BFFA0>],
[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E551F6460>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E552208B0>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E55250D30>,
<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E5528A1C0>]],
dtype=object)

[9]: # Câu c thống kê mô tả

df.describe()

[9]: X1 X2 X3 X4 X5 X6 \
count 768.000000 768.000000 768.000000 768.000000 768.00000 768.000000
mean 0.764167 671.708333 318.500000 176.604167 5.25000 3.500000
std 0.105777 88.086116 43.626481 45.165950 1.75114 1.118763
min 0.620000 514.500000 245.000000 110.250000 3.50000 2.000000
25% 0.682500 606.375000 294.000000 140.875000 3.50000 2.750000

3
50% 0.750000 673.750000 318.500000 183.750000 5.25000 3.500000
75% 0.830000 741.125000 343.000000 220.500000 7.00000 4.250000
max 0.980000 808.500000 416.500000 220.500000 7.00000 5.000000

X7 X8 Y1 Y2
count 768.000000 768.00000 768.000000 768.000000
mean 0.234375 2.81250 22.307195 24.587760
std 0.133221 1.55096 10.090204 9.513306
min 0.000000 0.00000 6.010000 10.900000
25% 0.100000 1.75000 12.992500 15.620000
50% 0.250000 3.00000 18.950000 22.080000
75% 0.400000 4.00000 31.667500 33.132500
max 0.400000 5.00000 43.100000 48.030000

[10]: #Câu d tính cor ta thấy X6, X8 gần như có có giá trị ảnh hướng tới Y1, Y2 loại␣
,→ra khỏi mô hình

corr = df.corr()

corr.style.background_gradient(cmap='coolwarm', axis=None)
mask = np.zeros_like(corr, dtype=bool)
mask[np.triu_indices_from(mask)] = True
corr[mask] = np.nan
(corr
.style
.background_gradient(cmap='coolwarm', axis=None, vmin=-1, vmax=1)
.highlight_null(null_color='#f1f1f1') # Color NaNs grey
.set_precision(2))

[10]: <pandas.io.formats.style.Styler at 0x26e5580faf0>

[11]: X = df[["X1","X2","X3","X4","X5","X7"]]
y = df['Y1']

[12]: # Câu d xây dựng mô hình tuyến tính thu nhiệt

from sklearn.linear_model import LinearRegression
lm = LinearRegression()
lm.fit(X,y)

[12]: LinearRegression()

[13]: # Phương trình hồi quy tuyến tính

lm.intercept_, lm.coef_

[13]: (81.1821953125,
array([-6.24378443e+01, -1.38242706e+12, 1.38242706e+12, 2.76485412e+12,
4.18270683e+00, 2.04058407e+01]))

4
[14]: # câu e
import scipy.stats as stats

[15]: stats.ttest_ind(a=df['Y1'],b=df['Y2'])

[15]: Ttest_indResult(statistic=-4.557390897279331, pvalue=5.589851371275724e-06)

[16]: # p_value = 0.00055% < 5% chứng tỏ không có sự khác biệt về mức độ thu nhiệt và␣
,→tỏa nhiệt

[17]: # câu f
import statsmodels.api as sm
from statsmodels.formula.api import ols

[18]: df_melt=pd.melt(df.reset_index(), id_vars=['index'], value_vars=['Y1','Y2'])

[19]: model = ols('value ~ C(variable)', data=df_melt).fit()

anova_table = sm.stats.anova_lm(model, typ=2)
anova_table

[19]: sum_sq df F PR(>F)

C(variable) 1997.175243 1.0 20.769812 0.000006
Residual 147505.757543 1534.0 NaN NaN

[ ]:

Delhivery Mani
No ratings yet
Delhivery Mani
79 pages
Step by Step Binance Guide
0% (1)
Step by Step Binance Guide
96 pages
Math Reproducibles - Grade 6
From Everand
Math Reproducibles - Grade 6
Vicky Shiotsu
5/5 (4)
Math Workbook - Grade 2
From Everand
Math Workbook - Grade 2
Ruth Herlihy
5/5 (1)
Mzc64 Quick Start Guide
No ratings yet
Mzc64 Quick Start Guide
8 pages
Power Tips For Toyota Avanza Xenia Users
100% (1)
Power Tips For Toyota Avanza Xenia Users
7 pages
Data Preparation Project
No ratings yet
Data Preparation Project
23 pages
Daily AI Exercise - Kmeans - KNN
No ratings yet
Daily AI Exercise - Kmeans - KNN
15 pages
Xu hướng cuối kì
No ratings yet
Xu hướng cuối kì
10 pages
UDTK
No ratings yet
UDTK
42 pages
bbt9
No ratings yet
bbt9
17 pages
Exercise Data Analysis
No ratings yet
Exercise Data Analysis
25 pages
Descriptives: => rà soát từng biến
No ratings yet
Descriptives: => rà soát từng biến
5 pages
THỐNG KÊ MÔ TẢ
No ratings yet
THỐNG KÊ MÔ TẢ
9 pages
SL kiemsoat
No ratings yet
SL kiemsoat
8 pages
Bai Nop Ngay 03.12.23pdf
No ratings yet
Bai Nop Ngay 03.12.23pdf
4 pages
ch12bt20 GDP-update
No ratings yet
ch12bt20 GDP-update
15 pages
THẢO NGUYÊN
No ratings yet
THẢO NGUYÊN
8 pages
Kinh tế lượng code R
No ratings yet
Kinh tế lượng code R
10 pages
Lab 01 Ds Project 01
No ratings yet
Lab 01 Ds Project 01
10 pages
chitieu
No ratings yet
chitieu
2 pages
OUTPUT
No ratings yet
OUTPUT
14 pages
Crosstabs
No ratings yet
Crosstabs
10 pages
0483 - Trần Công Sơn - Bài Tập Số 2
No ratings yet
0483 - Trần Công Sơn - Bài Tập Số 2
12 pages
THỰC HÀNH 07012025
No ratings yet
THỰC HÀNH 07012025
7 pages
pandas.py
No ratings yet
pandas.py
20 pages
Pandas PD Matplotlib - Pyplot PLT Numpy NP: Import As Import As Import As
No ratings yet
Pandas PD Matplotlib - Pyplot PLT Numpy NP: Import As Import As Import As
11 pages
No Ph.D. Game Design With Three.js
From Everand
No Ph.D. Game Design With Three.js
Nikiforos Kontopoulos
No ratings yet
choyennhu
No ratings yet
choyennhu
10 pages
group-2-th (1)
No ratings yet
group-2-th (1)
25 pages
BT Chuong3 4
No ratings yet
BT Chuong3 4
2 pages
Data_Analyzer
No ratings yet
Data_Analyzer
10 pages
Bai2 Data - Pandas
No ratings yet
Bai2 Data - Pandas
11 pages
HANDLING MISSING VALUES AND OUTLIERS
No ratings yet
HANDLING MISSING VALUES AND OUTLIERS
4 pages
Bangchay R
No ratings yet
Bangchay R
3 pages
đề 2
No ratings yet
đề 2
5 pages
BTVN1 - Colaboratory
No ratings yet
BTVN1 - Colaboratory
4 pages
45
No ratings yet
45
11 pages
Trần Vũ Khánh Hưng ITCSIU21182 TMC Lab2
No ratings yet
Trần Vũ Khánh Hưng ITCSIU21182 TMC Lab2
12 pages
Profound Python Data Science
From Everand
Profound Python Data Science
Onder Teker
No ratings yet
Thống kê mô tả
No ratings yet
Thống kê mô tả
3 pages
HỒ ĐẮC LÂM
No ratings yet
HỒ ĐẮC LÂM
21 pages
Mate Minat X
No ratings yet
Mate Minat X
28 pages
ch0bt2 1
No ratings yet
ch0bt2 1
11 pages
Pandas
No ratings yet
Pandas
2 pages
Column1: Frequency
No ratings yet
Column1: Frequency
38 pages
Pandas PD Scipy Matplotlib - Pyplot PLT Matplotlib - Ticker TK Numpy NP
No ratings yet
Pandas PD Scipy Matplotlib - Pyplot PLT Matplotlib - Ticker TK Numpy NP
6 pages
ch0bt10 1
No ratings yet
ch0bt10 1
9 pages
Develop Snakes & Ladders Game Complete Guide with Code & Design
From Everand
Develop Snakes & Ladders Game Complete Guide with Code & Design
Anurag Pandey
No ratings yet
DS Problem Statements and Codes
No ratings yet
DS Problem Statements and Codes
21 pages
Advanced C Concepts and Programming: First Edition
From Everand
Advanced C Concepts and Programming: First Edition
Gayatri
3/5 (1)
Microsoft Visual Basic Interview Questions: Microsoft VB Certification Review
From Everand
Microsoft Visual Basic Interview Questions: Microsoft VB Certification Review
Equity Press
No ratings yet
(OUTPUT - W) XỬ LÝ DỮ LIỆU NGHIÊN CỨU - SV. LÊ NGỌC TƯỜNG VY
No ratings yet
(OUTPUT - W) XỬ LÝ DỮ LIỆU NGHIÊN CỨU - SV. LÊ NGỌC TƯỜNG VY
43 pages
1234
No ratings yet
1234
14 pages
bài mẫu phân tích phương sai
No ratings yet
bài mẫu phân tích phương sai
29 pages
Math Reproducibles - Grade 4
From Everand
Math Reproducibles - Grade 4
Linda Cernak
5/5 (3)
dv mid internal 1
No ratings yet
dv mid internal 1
8 pages
hanoi 2019 và 2020-descriptive statistics
No ratings yet
hanoi 2019 và 2020-descriptive statistics
7 pages
Trực quan hóa luật kết hợp
No ratings yet
Trực quan hóa luật kết hợp
4 pages
Tài Liệu System Identification Toolbox Tiếng Việt - Tài Liệu, eBook, Giáo Trình
No ratings yet
Tài Liệu System Identification Toolbox Tiếng Việt - Tài Liệu, eBook, Giáo Trình
22 pages
L2 1pdf
No ratings yet
L2 1pdf
18 pages
Math Reproducibles - Grade 2
From Everand
Math Reproducibles - Grade 2
Vicky Shiotsu
3.5/5 (3)
BTAP6
No ratings yet
BTAP6
3 pages
Bee Lok
No ratings yet
Bee Lok
1 page
SSL 38 Sresky
No ratings yet
SSL 38 Sresky
1 page
Complete Download (Ebook) Fundamentals of Meteorology by Vlado Spiridonov, Mladjen Ćurić ISBN 9783030526542, 9783030526559, 3030526542, 3030526550 PDF All Chapters
100% (8)
Complete Download (Ebook) Fundamentals of Meteorology by Vlado Spiridonov, Mladjen Ćurić ISBN 9783030526542, 9783030526559, 3030526542, 3030526550 PDF All Chapters
65 pages
Unit 3
No ratings yet
Unit 3
64 pages
Penjelasan Project SIK - 2022-2023 Gasal
No ratings yet
Penjelasan Project SIK - 2022-2023 Gasal
5 pages
Electric Drive Ebjc Ebja Ebra Ebjd Repair Manual Eng
No ratings yet
Electric Drive Ebjc Ebja Ebra Ebjd Repair Manual Eng
283 pages
Cryptography in Blockchain
No ratings yet
Cryptography in Blockchain
24 pages
Satip A 004 06
No ratings yet
Satip A 004 06
10 pages
Industrial Engineering Mec 422 2 Unit Course Note WK1-3
No ratings yet
Industrial Engineering Mec 422 2 Unit Course Note WK1-3
8 pages
Micro Units Case Studies PDF
No ratings yet
Micro Units Case Studies PDF
10 pages
Chapter 6 Notes - Student1
No ratings yet
Chapter 6 Notes - Student1
79 pages
Lesson 1-34
No ratings yet
Lesson 1-34
67 pages
Gradient-Based Feature Extraction From Raw Bayer Pattern Images
No ratings yet
Gradient-Based Feature Extraction From Raw Bayer Pattern Images
12 pages
1 s2.0 002008919290052U Main
No ratings yet
1 s2.0 002008919290052U Main
6 pages
A fully digital approach to replicate peri-implant soft tissue contours and emergence profile in the esthetic zone
No ratings yet
A fully digital approach to replicate peri-implant soft tissue contours and emergence profile in the esthetic zone
5 pages
DSR Micro Project PDF
No ratings yet
DSR Micro Project PDF
26 pages
Vedant's Resumé
No ratings yet
Vedant's Resumé
1 page
Proyecto de Telenovela
No ratings yet
Proyecto de Telenovela
1 page
Week29 - Unit 4 Lunchtime
100% (1)
Week29 - Unit 4 Lunchtime
5 pages
182SWD-21
No ratings yet
182SWD-21
6 pages
Diagrama de Seguridad
No ratings yet
Diagrama de Seguridad
2 pages
PINN Gentle Introduction
No ratings yet
PINN Gentle Introduction
26 pages
Lecture Slides (Week 8) - Final Version
No ratings yet
Lecture Slides (Week 8) - Final Version
33 pages
Gerund Phrase 2
No ratings yet
Gerund Phrase 2
5 pages
3
No ratings yet
3
8 pages
Polynomials
No ratings yet
Polynomials
3 pages
Mumbai University Result
No ratings yet
Mumbai University Result
96 pages