Pandas
Pandas
Pandas
En el siguiente link podrás descargar archivos .csv, para ello crear una cuenta usando correo de Gmail
https://www.kaggle.com/datasets/
#Importando librerías
import pandas as pd
columns = ['age',"short_name","nationality","player_positions","skill_dribbling"]
players_copy = players[columns]
print(players_copy.sort_values(by=['age'],ascending=[False]).head(10))
#Creando variables y filtro solo a los jugadores de Barcelona FC y Real Madrid
barcelona_fc = players_copy[players_copy['club']=='FC Barcelona']
print(barcelona_fc.head(20))
#Mostrando estadístico de cuantos ganan los jugadores (values_eur) del real madrid
print(real_madrid['value_eur'].describe())
#Filtrando y mostrando los jugadores del real Madrid que ganan más de 35000000 euros
rm_salarios = real_madrid[real_madrid['value_eur']>35000000]
print(rm_salarios)
print(real_madrid[real_madrid['value_eur']>35000000])
#Filtrando y mostrando jugadores con dribleo mayor a 90 y número de camiseta 10 (2 filtros simultáneos)
players_top = players[(players['dribbling']>90)&(players['team_jersey_number']==10)]
print(players_top)
print(mix['team_position'].value_counts())
print(mix.groupby(by = "team_position")["team_position"].count())
#Importando librerías
import pandas as pd
import matplotlib.pyplot as plt
plt.subplot(122)
plt.boxplot(barcelona_fc['overall'])
plt.title('Barcelona')
plt.grid(True)
plt.show()
#
plt.hist(players_copy['power_jumping'])
plt.xlabel('Potencia en salto')
plt.ylabel('Cantidad de jugadores')
plt.title('RESUMEN POTENCIA EN SALTO')
plt.show()
TUTORIALES
Curso completo
https://www.youtube.com/watch?v=1CIZFu_qWvk&list=PLjdo6jnQHJFYUxftilqXD1pgzq9E9yJze&index=1
Conociendo pandas
https://www.youtube.com/watch?v=8ASjvOIyyl8
Limpieza de datos
https://www.youtube.com/watch?v=znlyEA8h9_M
https://www.youtube.com/watch?v=bGnD1Ki7j-g