0% found this document useful (0 votes)

5 views

Python Session 14092024.ipynb - Colab

The document contains a Python notebook that demonstrates various statistical tests including Z-tests, T-tests, ANOVA, and correlation analyses using libraries like NumPy, SciPy, and Statsmodels. It covers scenarios such as testing average weights of newborns, sales strategies, and the impact of marketing campaigns, providing calculated statistics like Z-scores, T-scores, and P-values. Additionally, it includes visualizations and interpretations of results for different statistical methods.

Uploaded by

psdamania1973

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

5 views

Python Session 14092024.ipynb - Colab

Uploaded by

psdamania1973

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 6

9/28/24, 3:14 PM Python Session 14092024.

ipynb - Colab

# Import necessary libraries

import numpy as np
import scipy.stats as stats
import pandas as pd
from statsmodels.stats.weightstats import ztest

Z-Test

keyboard_arrow_down Scenario 1: Testing if the average weight of newborns differs from the hospital's claim
# 1. Z-Test
# Scenario 1: Testing if the average weight of newborns differs from the hospital's claim
sample_mean = 3.4
population_mean = 3.5
std_dev = 0.5
n = 50
z_score = (sample_mean - population_mean) / (std_dev / np.sqrt(n))
p_value = stats.norm.cdf(z_score) * 2 # Two-tailed test
print("Z-Test (Scenario 1):")
print(f"Z-Score: {z_score}")
print(f"P-Value: {p_value}\n")

Z-Test (Scenario 1):

Z-Score: -1.4142135623730963
P-Value: 0.1572992070502848

Start coding or generate with AI.

keyboard_arrow_down Scenario 2: Testing if a marketing campaign increased average daily sales

sample_mean = 2100
population_mean = 2000
std_dev = 300
n = 50
z_score = (sample_mean - population_mean) / (std_dev / np.sqrt(n))
p_value = stats.norm.cdf(z_score) * 2 # Two-tailed test
print("Z-Test (Scenario 2):")
print(f"Z-Score: {z_score}")
print(f"P-Value: {p_value}\n")

Start coding or generate with AI.

t-test

One-Sample T-Test

keyboard_arrow_down Scenario 1: Testing if the average score of students differs from 75

# Scenario 1: Testing if the average score of students differs from 75
sample_scores = np.array([70, 72, 68, 74, 76, 69, 71, 73, 70, 75, 77, 74, 73, 69, 72])
t_score, p_value = stats.ttest_1samp(sample_scores, 75)
print("One-Sample T-Test (Scenario 1):")
print(f"T-Score: {t_score}")
print(f"P-Value: {p_value}\n")

https://colab.research.google.com/drive/1Vp85nKWtvXIv2ZReKpIguicdBscWpeVv#printMode=true 1/6
9/28/24, 3:14 PM Python Session 14092024.ipynb - Colab

keyboard_arrow_down Scenario 2: Testing if a new sales strategy increased monthly sales from $5000
# Scenario 2: Testing if a new sales strategy increased monthly sales from $5000
sample_sales = np.array([5200, 5100, 5300, 5400, 5000, 5100, 5200, 5300, 5000, 5400,
5200, 5300, 5100, 5200, 5400, 5300, 5100, 5200, 5300, 5400])
t_score, p_value = stats.ttest_1samp(sample_sales, 5000)
print("One-Sample T-Test (Scenario 2):")
print(f"T-Score: {t_score}")
print(f"P-Value: {p_value}\n")

Start coding or generate with AI.

Two-Sample T-Test

keyboard_arrow_down Scenario 1: Testing if there is a difference in average test scores between two classes
# Scenario 1: Testing if there is a difference in average test scores between two classes
class_A_scores = np.array([80, 82, 85, 87, 79, 83, 86, 88, 82, 84, 85, 86, 89, 81, 87])
class_B_scores = np.array([75, 77, 79, 76, 78, 77, 76, 79, 78, 77, 75, 76, 77, 78, 76])
t_score, p_value = stats.ttest_ind(class_A_scores, class_B_scores)
print("Two-Sample T-Test (Scenario 1):")
print(f"T-Score: {t_score}")
print(f"P-Value: {p_value}\n")

Start coding or generate with AI.

keyboard_arrow_down Scenario 2: Testing if there is a difference in sales between two stores

# Scenario 2: Testing if there is a difference in sales between two stores
store_A_sales = np.array([3000, 3100, 3200, 3300, 3400, 3100, 3200, 3000, 3100, 3200,
3300, 3400, 3000, 3100, 3200, 3000, 3100, 3300, 3400, 3100,
3200, 3000, 3100, 3200, 3300, 3400, 3000, 3100, 3200, 3300])
store_B_sales = np.array([3200, 3300, 3400, 3200, 3300, 3200, 3400, 3300, 3400, 3200,
3300, 3400, 3200, 3300, 3400, 3200, 3300, 3200, 3400, 3300,
3400, 3200, 3300, 3400, 3200, 3300, 3400, 3200, 3300, 3400])
t_score, p_value = stats.ttest_ind(store_A_sales, store_B_sales)
print("Two-Sample T-Test (Scenario 2):")
print(f"T-Score: {t_score}")
print(f"P-Value: {p_value}\n")

keyboard_arrow_down Paired T-Test

# Scenario 1: Testing if a training program improves productivity
before_training = np.array([10, 12, 11, 13, 12, 11, 14, 12, 15, 13])
after_training = np.array([15, 16, 15, 18, 17, 16, 19, 17, 20, 18])
t_score, p_value = stats.ttest_rel(before_training, after_training)
print("Paired T-Test (Scenario 1):")
print(f"T-Score: {t_score}")
print(f"P-Value: {p_value}\n")

# Scenario 2: Testing if a promotional offer impacts sales

before_promo = np.array([5000, 5100, 5200, 5300, 5000, 5100, 5200, 5300, 5000, 5400,
5200, 5300, 5100, 5200, 5400])
after_promo = np.array([5300, 5400, 5500, 5600, 5300, 5400, 5500, 5600, 5300, 5700,
5500, 5600, 5400, 5500, 5700])
t_score, p_value = stats.ttest_rel(before_promo, after_promo)
print("Paired T-Test (Scenario 2):")

https://colab.research.google.com/drive/1Vp85nKWtvXIv2ZReKpIguicdBscWpeVv#printMode=true 2/6
9/28/24, 3:14 PM Python Session 14092024.ipynb - Colab
print(f"T-Score: {t_score}")
print(f"P-Value: {p_value}\n")

Paired T-Test (Scenario 1):

T-Score: -36.0
P-Value: 4.873628935030659e-11

Paired T-Test (Scenario 2):

T-Score: -inf
P-Value: 0.0

C:\Users\admin\AppData\Local\Temp\ipykernel_5468\1620158596.py:14: RuntimeWarning: Precision loss occurred in moment calculation due

t_score, p_value = stats.ttest_rel(before_promo, after_promo)

Start coding or generate with AI.

keyboard_arrow_down 1. One-Way ANOVA

# Dataset for One-Way ANOVA (Advertising Budget vs. Sales for 3 different campaigns)
data = {'Campaign 1': [500, 700, 800, 900, 950],
'Campaign 2': [1000, 1100, 1200, 1250, 1300],
'Campaign 3': [400, 450, 500, 550, 600]}

df = pd.DataFrame(data)

Campaign 1 Campaign 2 Campaign 3

0 500 1000 400

1 700 1100 450

2 800 1200 500

3 900 1250 550

4 950 1300 600

# One-Way ANOVA
f_stat, p_val = stats.f_oneway(df['Campaign 1'], df['Campaign 2'], df['Campaign 3'])

print("F-Statistic:", f_stat)
print("P-Value:", p_val)

F-Statistic: 32.31279620853076
P-Value: 1.4751779256171162e-05

# Since p value is less than 0.5, hence we will reject the null hypothesis,
# Hence there is not statistical difference between these 3 campaigns

Start coding or generate with AI.

keyboard_arrow_down 2. Two-Way ANOVA

import statsmodels.api as sm
from statsmodels.formula.api import ols

# Dataset for Two-Way ANOVA

data = {'Sales': [500, 700, 800, 950, 400, 600, 1000, 1200, 1300, 1250],
'Ad_Campaign': ['Campaign 1', 'Campaign 1', 'Campaign 1', 'Campaign 1', 'Campaign 2',
'Campaign 2', 'Campaign 2', 'Campaign 2', 'Campaign 3', 'Campaign 3'],
'Store': ['Store A', 'Store B', 'Store A', 'Store B', 'Store A',
'Store B', 'Store A', 'Store B', 'Store A', 'Store B']}

df = pd.DataFrame(data)

https://colab.research.google.com/drive/1Vp85nKWtvXIv2ZReKpIguicdBscWpeVv#printMode=true 3/6
9/28/24, 3:14 PM Python Session 14092024.ipynb - Colab
# Two-Way ANOVA
model = ols('Sales ~ C(Ad_Campaign) + C(Store) + C(Ad_Campaign):C(Store)', data=df).fit()
anova_table = sm.stats.anova_lm(model, typ=2)
print(anova_table)

sum_sq df F PR(>F)
C(Ad_Campaign) 417875.0 2.0 1.915759 0.260872
C(Store) 49000.0 1.0 0.449284 0.539387
C(Ad_Campaign):C(Store) 22875.0 2.0 0.104871 0.902836
Residual 436250.0 4.0 NaN NaN

Start coding or generate with AI.

keyboard_arrow_down 3. Pearson’s Correlation

import pandas as pd
from scipy.stats import pearsonr

# Dataset (Advertising Budget vs. Sales)

data = {'Advertising Budget ($)': [10000, 20000, 15000, 25000, 30000],
'Sales (Units)': [500, 1200, 850, 1500, 2000]}

df = pd.DataFrame(data)

# Pearson's Correlation
corr, _ = pearsonr(df['Advertising Budget ($)'], df['Sales (Units)'])
print(f'Pearson Correlation: {corr}')

Pearson Correlation: 0.9963607400395207

keyboard_arrow_down 4. Spearman’s Rank Correlation

from scipy.stats import spearmanr

# Dataset (Customer Satisfaction Rank vs. Revenue Rank)

data = {'Customer Satisfaction Rank': [1, 3, 2, 4],
'Revenue Rank': [2, 4, 1, 3]}

df = pd.DataFrame(data)

# Spearman's Correlation
corr, _ = spearmanr(df['Customer Satisfaction Rank'], df['Revenue Rank'])
print(f'Spearman Correlation: {corr}')

Spearman Correlation: 0.6000000000000001

keyboard_arrow_down 5. Point-Biserial Correlation

from scipy.stats import pointbiserialr

# Dataset (Coupon Usage vs. Amount Spent)

data = {'Used Coupon': [1, 0, 1, 0], # Binary variable: 1 = Yes, 0 = No
'Amount Spent ($)': [250, 180, 300, 120]}

df = pd.DataFrame(data)

# Point-Biserial Correlation
corr, _ = pointbiserialr(df['Used Coupon'], df['Amount Spent ($)'])
print(f'Point-Biserial Correlation: {corr}')

Point-Biserial Correlation: 0.9147021665807529

keyboard_arrow_down 6. Cross-Correlation (Time-Series)

import numpy as np
import matplotlib.pyplot as plt

https://colab.research.google.com/drive/1Vp85nKWtvXIv2ZReKpIguicdBscWpeVv#printMode=true 4/6
9/28/24, 3:14 PM Python Session 14092024.ipynb - Colab

# Time-series dataset (Social Media Mentions vs. Sales)

social_media_mentions = np.array([500, 600, 700, 850])
sales = np.array([50000, 52000, 55000, 70000])

# Cross-Correlation
cross_corr = np.correlate(social_media_mentions - np.mean(social_media_mentions), sales - np.mean(sales), mode='full')
lags = np.arange(-len(sales) + 1, len(sales))

# Plot the cross-correlation

plt.plot(lags, cross_corr)
plt.title('Cross-Correlation between Social Media Mentions and Sales')
plt.xlabel('Lag')
plt.ylabel('Cross-Correlation')
plt.show()

keyboard_arrow_down 7. Kendall’s Tau Correlation

from scipy.stats import kendalltau

# Dataset (Performance Rank vs. Promotion Rank)

data = {'Performance Rank': [2, 1, 3, 2],
'Promotion Rank': [3, 1, 4, 2]}

df = pd.DataFrame(data)

# Kendall's Tau Correlation

corr, _ = kendalltau(df['Performance Rank'], df['Promotion Rank'])
print(f'Kendall Tau Correlation: {corr}')

Kendall Tau Correlation: 0.912870929175277

Start coding or generate with AI.

https://colab.research.google.com/drive/1Vp85nKWtvXIv2ZReKpIguicdBscWpeVv#printMode=true 5/6
9/28/24, 3:14 PM Python Session 14092024.ipynb - Colab

https://colab.research.google.com/drive/1Vp85nKWtvXIv2ZReKpIguicdBscWpeVv#printMode=true 6/6

Silly Linguistics March19 No10
No ratings yet
Silly Linguistics March19 No10
22 pages
Fresco
100% (2)
Fresco
17 pages
Chapter 6 - Advanced Machine Learning PDF
No ratings yet
Chapter 6 - Advanced Machine Learning PDF
37 pages
Sales
No ratings yet
Sales
7 pages
Data Analytics Program
No ratings yet
Data Analytics Program
11 pages
ml record
No ratings yet
ml record
21 pages
Machine
100% (1)
Machine
45 pages
Step 1: Finding The Data Set: "Amazon - Reviews - Multilingual - UK - v1 - 00.tsv - GZ" 'RT' "Utf8"
No ratings yet
Step 1: Finding The Data Set: "Amazon - Reviews - Multilingual - UK - v1 - 00.tsv - GZ" 'RT' "Utf8"
4 pages
ML Record
No ratings yet
ML Record
18 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
Coe Projects
No ratings yet
Coe Projects
7 pages
DA Practicle Answers Easyw
No ratings yet
DA Practicle Answers Easyw
30 pages
House Pricing
No ratings yet
House Pricing
15 pages
DM Slip Solutions
100% (1)
DM Slip Solutions
24 pages
ML MANUAL WITH OUTPUTS (2)
No ratings yet
ML MANUAL WITH OUTPUTS (2)
30 pages
Python Programs
No ratings yet
Python Programs
7 pages
Exp 1
No ratings yet
Exp 1
11 pages
Is Lab Aman Agarwal PDF
No ratings yet
Is Lab Aman Agarwal PDF
8 pages
Big Data Merged
No ratings yet
Big Data Merged
7 pages
Machine Learning Hands-On
100% (1)
Machine Learning Hands-On
18 pages
Stat Lab
No ratings yet
Stat Lab
24 pages
Machine Learnin
100% (2)
Machine Learnin
23 pages
Machine Failure Prediction
No ratings yet
Machine Failure Prediction
11 pages
Lab Assignment 2
No ratings yet
Lab Assignment 2
1 page
m08 v01 Store Sales Prediction
No ratings yet
m08 v01 Store Sales Prediction
39 pages
ANLY 502 Final Report
No ratings yet
ANLY 502 Final Report
7 pages
Sofcomputing Da2
No ratings yet
Sofcomputing Da2
7 pages
Experiment No.:1: Program
No ratings yet
Experiment No.:1: Program
7 pages
MlLabManualdocx 2024 09 04 22 02 58
No ratings yet
MlLabManualdocx 2024 09 04 22 02 58
19 pages
Srushti ML Assign1
No ratings yet
Srushti ML Assign1
9 pages
Part I
No ratings yet
Part I
12 pages
Naive - Bayes - Ipynb - Colab
No ratings yet
Naive - Bayes - Ipynb - Colab
3 pages
Cancer Disease Classification
No ratings yet
Cancer Disease Classification
6 pages
Sanket ML Assign1
No ratings yet
Sanket ML Assign1
9 pages
PythonFile[1]
No ratings yet
PythonFile[1]
5 pages
Data Science Manual
No ratings yet
Data Science Manual
16 pages
DA_012307
No ratings yet
DA_012307
8 pages
Apply Logistic Regression To Amazon Reviews Data Set (M)
No ratings yet
Apply Logistic Regression To Amazon Reviews Data Set (M)
11 pages
Da Program
No ratings yet
Da Program
18 pages
hemraj_python_ass1
No ratings yet
hemraj_python_ass1
7 pages
Komal ML Assg1
No ratings yet
Komal ML Assg1
9 pages
LSTM - Jupyter Notebook
No ratings yet
LSTM - Jupyter Notebook
7 pages
Wine Classification
No ratings yet
Wine Classification
10 pages
21brs1474 ML Lab 2
No ratings yet
21brs1474 ML Lab 2
25 pages
G Pandey Practical
No ratings yet
G Pandey Practical
33 pages
Data Mining Practicals
No ratings yet
Data Mining Practicals
22 pages
20MIS1025 - DecisionTree - Ipynb - Colaboratory
No ratings yet
20MIS1025 - DecisionTree - Ipynb - Colaboratory
4 pages
Machine Learning with PySpark and MLlib — Solving a Binary Classification Problem _ by Susan Li _ Towards Data Science
No ratings yet
Machine Learning with PySpark and MLlib — Solving a Binary Classification Problem _ by Susan Li _ Towards Data Science
10 pages
Data Mining & Data Science Practical Slips
No ratings yet
Data Mining & Data Science Practical Slips
45 pages
Python Code - Summary Statistics
No ratings yet
Python Code - Summary Statistics
6 pages
Practical-8: Import As Import As Import As Import Import As
No ratings yet
Practical-8: Import As Import As Import As Import Import As
9 pages
Machine Learning Lab New
No ratings yet
Machine Learning Lab New
14 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2)_removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2)_removed
24 pages
P06 The Classification Pipeline Ans
No ratings yet
P06 The Classification Pipeline Ans
16 pages
京东某商品比价分析
No ratings yet
京东某商品比价分析
19 pages
21bit0706 VL2024250106861 Da
No ratings yet
21bit0706 VL2024250106861 Da
7 pages
Variosalgoritmos - Jupyter Notebook
100% (1)
Variosalgoritmos - Jupyter Notebook
9 pages
1 - Sentiment - Analysis - NLP - Ipynb - Codes Only
No ratings yet
1 - Sentiment - Analysis - NLP - Ipynb - Codes Only
5 pages
DA Part-B New
No ratings yet
DA Part-B New
7 pages
7 Ass
No ratings yet
7 Ass
4 pages
Python For Beginners
From Everand
Python For Beginners
Célio Azevedo
No ratings yet
Banking_Financial_Parameters_CIE_4
No ratings yet
Banking_Financial_Parameters_CIE_4
9 pages
FOUNDATION COURSE
No ratings yet
FOUNDATION COURSE
15 pages
Data for Linear Regression
No ratings yet
Data for Linear Regression
1,401 pages
BP ASSIGNMENT
No ratings yet
BP ASSIGNMENT
10 pages
Book1 ECXEL CSA
No ratings yet
Book1 ECXEL CSA
11 pages
Web Application Management Console - Onbase 18 Module Reference Guide PDF
No ratings yet
Web Application Management Console - Onbase 18 Module Reference Guide PDF
89 pages
Importance of Studying Religion
No ratings yet
Importance of Studying Religion
5 pages
ASL 2 Syllabus
No ratings yet
ASL 2 Syllabus
2 pages
Processor and Memory Organization
No ratings yet
Processor and Memory Organization
17 pages
Gerund Vs Participle
100% (1)
Gerund Vs Participle
6 pages
Unit 6 Written Quiz: Name: /50
No ratings yet
Unit 6 Written Quiz: Name: /50
3 pages
Class 10th Sanskrit Model Paper 2022 Up Board Exam 2022
No ratings yet
Class 10th Sanskrit Model Paper 2022 Up Board Exam 2022
5 pages
Ethics Lecture FinalVersion
No ratings yet
Ethics Lecture FinalVersion
118 pages
Calculation For Shear Connection (Shear and Axial) : Inputs in Shaded Cells
No ratings yet
Calculation For Shear Connection (Shear and Axial) : Inputs in Shaded Cells
3 pages
A Forgotten Liberator The Life and Struggle of Savitribai Phule by Braj Ranjan Mani (Ed), Pamela Sardar (Ed)
No ratings yet
A Forgotten Liberator The Life and Struggle of Savitribai Phule by Braj Ranjan Mani (Ed), Pamela Sardar (Ed)
78 pages
Old Latin PDF
No ratings yet
Old Latin PDF
14 pages
Java J2ee Objective Type
No ratings yet
Java J2ee Objective Type
3 pages
Dual Diploma Student Quickstart 2023-2024final
No ratings yet
Dual Diploma Student Quickstart 2023-2024final
16 pages
Curriculo de Mozart Dias Martins
No ratings yet
Curriculo de Mozart Dias Martins
2 pages
Yoga Origin History Development
No ratings yet
Yoga Origin History Development
29 pages
Past Simple Reg Irreg Verbs Grammar Exercises 1c2ba Eso Curso 2013 14
No ratings yet
Past Simple Reg Irreg Verbs Grammar Exercises 1c2ba Eso Curso 2013 14
13 pages
Algorithmic Aspects in Information and Management: 12th International Conference, AAIM 2018, Dallas, TX, USA, December 3-4, 2018, Proceedings Shaojie Tang 2024 Scribd Download
100% (4)
Algorithmic Aspects in Information and Management: 12th International Conference, AAIM 2018, Dallas, TX, USA, December 3-4, 2018, Proceedings Shaojie Tang 2024 Scribd Download
50 pages
EWS Samples All Levels
No ratings yet
EWS Samples All Levels
159 pages
Empowerment Technologies Q2 Module 6
No ratings yet
Empowerment Technologies Q2 Module 6
40 pages
Language Acquisition and Language Learning
No ratings yet
Language Acquisition and Language Learning
2 pages
Varieties of English - A Typological Approach
100% (1)
Varieties of English - A Typological Approach
328 pages
GM4 (Cpuc)
No ratings yet
GM4 (Cpuc)
171 pages
70-740 Updated
No ratings yet
70-740 Updated
338 pages
Primergy Serverview Suite: Irmc S2 - Integrated Remote Management Controller (Firmware Version 3.77A)
No ratings yet
Primergy Serverview Suite: Irmc S2 - Integrated Remote Management Controller (Firmware Version 3.77A)
532 pages
For (Var Startvalue Var Endvalue Var Var+increment) (Code To Be Executed
No ratings yet
For (Var Startvalue Var Endvalue Var Var+increment) (Code To Be Executed
8 pages
Tolstoy On Musical Mimesis
No ratings yet
Tolstoy On Musical Mimesis
18 pages
Sci PDF 1711184907878
No ratings yet
Sci PDF 1711184907878
19 pages
Phrases and Clauses
No ratings yet
Phrases and Clauses
31 pages
t06 Chan Si Ning 10184757h Task 2 Music Movement Lesson Plan-Marked
No ratings yet
t06 Chan Si Ning 10184757h Task 2 Music Movement Lesson Plan-Marked
6 pages