Pr谩ctica con Pandas, Dataframes y Seaborn 馃惣

Traducci贸n por Guillermo Rodr铆guez Guerrero (UNAM ENES Le贸n, Gto., M茅xico)


Exploraci贸n de datos

Cargando e inspeccionando los datos

Despu茅s de visitar Michigan y aprender que se pueden cultivar uvas para vino (隆y que se puede hacer vino!) En un lugar tan fr铆o, decides que te gustar铆a comenzar un vi帽edo all铆. Has visto los vi帽edos y sabes que, aunque es posible cultivar uvas de vinificaci贸n all铆, a veces hace demasiado fr铆o. Uno se pregunta si, debido al cambio clim谩tico, Michigan pronto tendr谩 un clima m谩s c谩lido y m谩s adecuado para el cultivo de uvas.

Sabes que Europa tiene una larga historia de cultivo de uvas y te preguntas si mantuvieron registros que pudieran indicar c贸mo responden las uvas a los cambios de temperatura. Encuentras un estudio que ha recopilado numerosos registros de fechas de cosecha de uvas durante m谩s de cuatro siglos y tambi茅n una base de datos de anomal铆as de temperatura en Europa que se remontan a 1655.

Usando el conjunto de datos proporcionado, grape_harvest.csv (descarga aqu铆), explora c贸mo la fecha de cosecha de la uva europea cambia con respecto a la temperatura a lo largo de siglos de datos.

Para comenzar, importa pandas en la celda siguiente:

# Importa pandas aqu铆

Luego, lee en grape_harvest.csv usando la funci贸n pd.read_csv() un marco de datos de pandas.

# Lee los datos de la cosecha aqu铆
# Coloca grape_harvest.csv en el mismo directorio desde el que est谩s ejecutando este .ipynb
# Si est谩 en un directorio diferente, deber谩s especificar la ruta al archivo 

# Alternativamente, puede leer los datos de GitHub usando la siguiente URL:
# https://raw.githubusercontent.com/DanChitwood/PlantsAndPython/master/grape_harvest.csv

Ahora, escribe un c贸digo para inspeccionar las propiedades de los datos y luego responde las siguientes preguntas:

Usa una funci贸n de pandas para mirar las primeras cinco l铆neas de datos:

# Pon tu c贸digo aqu铆

Usa una funci贸n de pandas para ver las 煤ltimas cinco l铆neas de datos:

# Pon tu c贸digo aqu铆

Usa una funci贸n de pandas para ver un resumen de las estad铆sticas (como el recuento, el m铆nimo, el m谩ximo y la media) para columnas con datos continuos:

# Pon tu c贸digo aqu铆

Utiliza una funci贸n de pandas para obtener los nombres de las columnas.

# Pon tu c贸digo aqu铆

Para una de las columnas que es una variable categ贸rica, usa una funci贸n para enumerar todos los niveles para esa variable.

# Pon tu c贸digo aqu铆

Para la variable categ贸rica, tambi茅n usa una funci贸n para determinar cu谩ntas filas hay que representan cada nivel.

# Pon tu c贸digo aqu铆

驴Cu谩ntas filas hay en este conjunto de datos?

# Pon tu c贸digo aqu铆

隆Felicitaciones por leer los datos y explorar su estructura! En la siguiente actividad, exploraremos la relaci贸n entre las fechas de cosecha de la uva y el clima.