Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Laboratorio 4 Python

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 3

Laboratorio_4

October 8, 2019

Se importan las librerías:


[0]: import pandas as pd
import numpy as np
Se hace lectura del archivo:
[2]: df = pd.read_csv('worldcup2014.csv')
df.head()
[2]: team continent group ... goles_diferencia puntos clasificado
0 Brazil southamerica A ... 5 7 1
1 Mexico northamerica A ... 3 7 1
2 Croatia europe A ... 0 3 0
3 Cameroon africa A ... 8 0 0
4 Netherlands europe B ... 7 9 1

[5 rows x 13 columns]
Se obtienen los continenetes:
[3]: df['continent'].unique()
[3]: array(['southamerica', 'northamerica', 'europe', 'africa', 'asia'],
dtype=object)
Se hacen dataframes de cada uno de los continentes:
[0]: africa_df = df[df['continent'] == 'africa']
europe_df = df[df['continent'] == 'europe']
asia_df = df[df['continent'] == 'asia']
northamerica_df = df[df['continent'] == 'northamerica']
southamerica_df = df[df['continent'] == 'southamerica']
Se genera un dataframe reportando las metricas:
[5]: continent = []
store_mean = []
store_std = []
for d in [africa_df, europe_df, asia_df, northamerica_df, southamerica_df]:
continent.append(d.iloc[0,1])
store_mean.append(round(np.mean(d['goles_favor']),2))
store_std.append(round(np.var(d['goles_favor']),2))
tmp = pd.DataFrame({'continente': continent, 'media_goles': store_mean,␣
,→'std_goles': store_std})

1
tmp
[5]: continente media_goles std_goles
0 africa 3.60 2.64
1 europe 4.77 6.33
2 asia 2.25 0.69
3 northamerica 3.25 1.69
4 southamerica 5.67 3.89
Frecuencias según continente:
[6]: count_group = df['continent'].value_counts()
count_group
[6]: europe 13
southamerica 6
africa 5
northamerica 4
asia 4
Name: continent, dtype: int64
Expresando como probabilidad:
[7]: count_group = df['continent'].value_counts('%').round(1)
count_group
[7]: europe 0.4
southamerica 0.2
africa 0.2
northamerica 0.1
asia 0.1
Name: continent, dtype: float64
Probabilidad de pasar a la siguiente ronda por continente:
[8]: for d in [africa_df, europe_df, asia_df, northamerica_df, southamerica_df]:
print(d.iloc[0, 1],"\nProbabilidad de clasificación:\n",d['clasificado'].
,→value_counts('%'))

africa
Probabilidad de clasificación:
0 0.6
1 0.4
Name: clasificado, dtype: float64
europe
Probabilidad de clasificación:
0 0.538462
1 0.461538
Name: clasificado, dtype: float64
asia
Probabilidad de clasificación:
0 1.0
Name: clasificado, dtype: float64

2
northamerica
Probabilidad de clasificación:
1 0.75
0 0.25
Name: clasificado, dtype: float64
southamerica
Probabilidad de clasificación:
1 0.833333
0 0.166667
Name: clasificado, dtype: float64

[9]: for d in [africa_df, europe_df, asia_df, northamerica_df, southamerica_df]:


print(d.iloc[0, 1])
tmp = pd.Series(np.where(d['juegos_ganados'] == 0, 0, 1))
print(tmp.value_counts('%'))

africa
1 0.6
0 0.4
dtype: float64
europe
1 0.846154
0 0.153846
dtype: float64
asia
0 1.0
dtype: float64
northamerica
1 0.75
0 0.25
dtype: float64
southamerica
1 1.0
dtype: float64

También podría gustarte