Clase 15: gráficos pro con `Plotly`¶

En esta clase usaremos la libería plotly para ver visualizaciones y tablas. Plotly es un paquete potente que permite realizar gráficos interactivos de gran calidad visual. Veremos:

Cómo instalar
Tablas
Gráfico de líneas
Gráfico de puntos (scatter)
Gráfico de barras
Gráfico de torta
Gráfico de burbujas
Mapas de calor
Histogramas
Gráficos de error
Bráfico de cajas

1. Introducción¶

La librería plotly es una librería de python open-source que soporta más de 40 tipos de gráficos interactivos, en el ámbito estadístico, financiero, geográfico, científico, etc.

Esta librería requiere algunos pasos adicionales en su instalación con respecto a otras librerías.

El detalle de la instalación lo pueden encontrar en el siguiente link: https://plotly.com/python/getting-started/

Pasos para instalar plotly:

Abrir el Compand Prompt en Anaconda (pantalla negra). Los siguientes códigos los debe colocar en esta terminal.
Pueden instalar mediante pip o conda:
- pip install plotly==4.14.3
- conda install -c plotly plotly=4.14.3
Si van a trabajar desde Jupyter Notebook deben instlar los siguientes paquetes adicionales usando pip o conda:
- pip install “notebook>=5.3” “ipywidgets>=7.5”
- conda install “notebook>=5.3” “ipywidgets>=7.5”
Si trabajan con JupyterLab deben instalar usando pip o conda:
- pip install jupyterlab “ipywidgets>=7.5”
- conda install jupyterlab “ipywidgets>=7.5”
Instalar nodejs:
- Chequear si tiene instalado el programa. En el Command Prompt ejecutar node -v, le va a mostrar si tiene instalado el programa y qué versión tiene. Si lo tiene instalado saltar los siguientes dos pasos.
- Descargar el instalador para su sistema operativo: https://nodejs.org/es/download/
- Ejecutar el archivo instalado
Una vez tenga chequeado que tiene instalado el nodejs ejecutar:
- jupyter labextension install jupyterlab-plotly@4.14.3
- Ver si la instalación arroja algún error!

Una vez realizados estos 6 pasos, debería poder ejecutar el siguiente código en un JupyterLab y le debería mostrar un gráfico de barras.

import plotly.graph_objects as go
fig = go.Figure(data=go.Bar(y=[2, 3, 1]))
fig.show()

2. Tablas¶

go.Table nos va a entragar un interfaz para visualizar datos mediante tablas, en formato de filas-columnas. Estas tablas las podemos enchular según las necesidades del caso.

#Importar librería
import plotly.graph_objects as go

#Valores a mostrar 
encabezado = ['A Scores', 'B Scores']
valores = [[100, 90, 80, 90], [95, 85, 75, 95]]

#Crear figura
#1. llamar librería y función: go.Figure()
#2. Definir datos: data=[]
#3. Usar go.Table() para definir encabezado (header) y valores(cells)
#4. Guardamos el resultado en una variable -> alpicamos fig.show()
fig = go.Figure(data=[go.Table(header=dict(values=encabezado),
                               cells=dict(values=valores))
                     ])
fig.show()

Podemos arreglar

fig = go.Figure(data=[go.Table(
    #Encabezado
    header=dict(values=encabezado,
                line_color='red', #Color borde: cambiar rojo
                fill_color='lightskyblue', #Color fondo
                align='left'), #Alineación
    #Valores
    cells=dict(values=valores,
               line_color='darkslategray',#Color borde
               fill_color='lightcyan', #Color rojo
               align='left')) #Alineación
])

#Una vez creado el fig podemos editar su tamaño
fig.update_layout(width=300, height=300)
fig.show()

Para modificar el formato de los datos, ejemplo número de decimales, podemos usar format

encabezado = ['A Scores', 'B Scores', 'C Scores']
valores = [[100, 90, 80, 90], [95, 85, 75, 95], [95.12345, 85.12345, 75.12345, 95.12345]]

fig = go.Figure(data=[go.Table(
    #Encabezado
    header=dict(values=encabezado,
                line_color='darkslategray', #Color borde: cambiar rojo
                fill_color='lightskyblue', #Color fondo
                align='left'), #Alineación
    #Valores
    cells=dict(values=valores,
               line_color='darkslategray',#Color borde
               fill_color='lightcyan', #Color rojo
               align='left', #Alineación
               format = [None, ".1f", ".2f"])) #Formato: en una lista va según el número de columnas
                ])

#Una vez creado el fig podemos editar su tamaño
fig.update_layout(width=400, height=300)
fig.show()

3. Gráficos de líneas¶

Para este ejemplo vamos a usar la librería plotly.express. Dentro de esta tenemos el DataFrame gapminder datos de expectativa de vida, población, PIB por país.

#Importamos la librería
import plotly.express as px

#Usamos un subconjunto de los datos, seleccionamos América
df = px.data.gapminder().query("continent=='Americas'")
df.head()

	country	continent	year	lifeExp	pop	gdpPercap	iso_alpha	iso_num
48	Argentina	Americas	1952	62.485	17876956	5911.315053	ARG	32
49	Argentina	Americas	1957	64.399	19610538	6856.856212	ARG	32
50	Argentina	Americas	1962	65.142	21283783	7133.166023	ARG	32
51	Argentina	Americas	1967	65.634	22934225	8052.953021	ARG	32
52	Argentina	Americas	1972	67.065	24779799	9443.038526	ARG	32

fig = px.line(df, x="year", y="lifeExp", color='country')
fig.show()

df_sur = df[(df.country=="Argentina" )| (df.country=="Chile") | (df.country=="Uruguay")]
fig = px.line(df_sur, x="year", y="gdpPercap", color='country')
fig.show()

Usamos plotly.express cuando hacemos un ejercicio sencillo. Para comenzar a ejemplos más genéricos o en algunos casos, más complejos, vamos a usar go.Scatter

Como primer ejemplo, vamos a usar una función de los DataFrame llamada pivot_table que nos va a permitir modificar nuestra serie del tipo [Fecha, PIB, Pais] a [Fecha, PIB, Argentina, Chile, Uruguay].

df.head()

	country	continent	year	lifeExp	pop	gdpPercap	iso_alpha	iso_num
48	Argentina	Americas	1952	62.485	17876956	5911.315053	ARG	32
49	Argentina	Americas	1957	64.399	19610538	6856.856212	ARG	32
50	Argentina	Americas	1962	65.142	21283783	7133.166023	ARG	32
51	Argentina	Americas	1967	65.634	22934225	8052.953021	ARG	32
52	Argentina	Americas	1972	67.065	24779799	9443.038526	ARG	32

import pandas as pd
df_sur2 = pd.pivot_table(df_sur, values=["gdpPercap"], index=["year"], columns="country" )
df_sur2.head()

	gdpPercap
country	Argentina	Chile	Uruguay
year
1952	5911.315053	3939.978789	5716.766744
1957	6856.856212	4315.622723	6150.772969
1962	7133.166023	4519.094331	5603.357717
1967	8052.953021	5106.654313	5444.619620
1972	9443.038526	5494.024437	5703.408898

#Importamos la librería
import plotly.graph_objects as go

#Creamos figura
fig = go.Figure()
#Primer plot

#go.Scatter(x=variable_x, y=variable_y)
fig.add_trace(go.Scatter(x=df_sur2.index, y=df_sur2.gdpPercap.Argentina,
                    mode='lines',
                    name='Argentina'))

#Segundo plot
fig.add_trace(go.Scatter(x=df_sur2.index, y=df_sur2.gdpPercap.Chile,
                    mode='lines+markers',
                    name='Chile'))

# #Tercer plot
fig.add_trace(go.Scatter(x=df_sur2.index, y=df_sur2.gdpPercap.Uruguay,
                    mode='markers', name='Uruguay'))

fig.show()

4. Gráfico de puntos (scatter)¶

Para un gráfico simple podemos volver a usar plotly.express

#Definimos el tipo gráfico
fig = px.scatter(df_sur, x="gdpPercap", y="lifeExp", color = "country")
fig.show()

Podemos agregar una tercera dimensión, representada en el tamaño de la burbuja. Para esto usamos el argumento size y podemos transformlo en un gráfico de burbujas.

#Definimos el tipo gráfico
fig = px.scatter(df_sur, x="gdpPercap", y="lifeExp", color = "country", size="pop")
fig.show()

Otro ejemplo es agregar una escala de colores para resaltar una categoría

import plotly.graph_objects as go
import numpy as np

df_chile = df[(df.country=="Chile")]

fig = go.Figure(data=go.Scatter(
    x = df_chile.gdpPercap,
    y = df_chile.lifeExp,
    mode='markers',
    marker=dict(
        size=16,
        color=df_chile.lifeExp, #set color equal to a variable
        colorscale='Viridis', # one of plotly colorscales
        showscale=True
    )
))

fig.show()

5. Gráfico de barras¶

fig = px.bar(df_chile, x='year', y='pop')
fig.show()

df_total = px.data.gapminder()
df_2007 = df_total[df_total.year==2007]
df_2007.head()

	country	continent	year	lifeExp	pop	gdpPercap	iso_alpha	iso_num
11	Afghanistan	Asia	2007	43.828	31889923	974.580338	AFG	4
23	Albania	Europe	2007	76.423	3600523	5937.029526	ALB	8
35	Algeria	Africa	2007	72.301	33333216	6223.367465	DZA	12
47	Angola	Africa	2007	42.731	12420476	4797.231267	AGO	24
59	Argentina	Americas	2007	75.320	40301927	12779.379640	ARG	32

fig = px.bar(df_2007, x="continent", y="pop", title="Wide-Form Input")
fig.show()

6. Gráfico de torta¶

df.loc[df['pop'] < 8.e6, 'country'] = 'Other countries' # Represent only large countries
fig = px.pie(df, values='pop', names='country', title='Población en América')
fig.show()

7. Animación¶

df.head()

	country	continent	year	lifeExp	pop	gdpPercap	iso_alpha	iso_num
48	Argentina	Americas	1952	62.485	17876956	5911.315053	ARG	32
49	Argentina	Americas	1957	64.399	19610538	6856.856212	ARG	32
50	Argentina	Americas	1962	65.142	21283783	7133.166023	ARG	32
51	Argentina	Americas	1967	65.634	22934225	8052.953021	ARG	32
52	Argentina	Americas	1972	67.065	24779799	9443.038526	ARG	32

import plotly.express as px
df = px.data.gapminder()

fig = px.scatter(df, x="gdpPercap", y="lifeExp", 
                 animation_frame="year", 
                 animation_group="country",
                 size="pop", 
                 color="continent", 
                 hover_name="country", 
                 facet_col="continent",
                 log_x=True, size_max=45, range_x=[100,100000], range_y=[25,90]
                )
fig.show()

fig = px.bar(df, x="continent", y="pop", 
             color="continent",
             animation_frame="year", 
             animation_group="country", 
             range_y=[0,4000000000])
fig.show()

8. Mapa de calor¶

df = px.data.gapminder().query("continent=='Americas'")
df.head()

	country	continent	year	lifeExp	pop	gdpPercap	iso_alpha	iso_num
48	Argentina	Americas	1952	62.485	17876956	5911.315053	ARG	32
49	Argentina	Americas	1957	64.399	19610538	6856.856212	ARG	32
50	Argentina	Americas	1962	65.142	21283783	7133.166023	ARG	32
51	Argentina	Americas	1967	65.634	22934225	8052.953021	ARG	32
52	Argentina	Americas	1972	67.065	24779799	9443.038526	ARG	32

fig = go.Figure(data=go.Heatmap(
        z=df.lifeExp,
        x=df.year,
        y=df.country,
        colorscale='Viridis'
        ))

fig.update_layout(
    title='Expectativa de vida',
    xaxis_nticks=13)

fig.update_layout(width=750, height=750)
fig.show()

9. sunburst charts¶

import plotly.express as px

df = px.data.gapminder().query("year == 2007")


fig = px.sunburst(df, path=['continent', 'country'], values='pop', color='lifeExp',
                  hover_data=['iso_alpha'])
fig.show()

10. Treemap¶

df.head()

	country	continent	year	lifeExp	pop	gdpPercap	iso_alpha	iso_num
11	Afghanistan	Asia	2007	43.828	31889923	974.580338	AFG	4
23	Albania	Europe	2007	76.423	3600523	5937.029526	ALB	8
35	Algeria	Africa	2007	72.301	33333216	6223.367465	DZA	12
47	Angola	Africa	2007	42.731	12420476	4797.231267	AGO	24
59	Argentina	Americas	2007	75.320	40301927	12779.379640	ARG	32

import plotly.express as px
import numpy as np
df = px.data.gapminder().query("year == 2007")

fig = px.treemap(df, path=[px.Constant('world'), 'continent', 'country'], values='pop',  
                  hover_data=['iso_alpha'])
fig.show()

11. Histograma¶

import plotly.express as px
df = px.data.tips()
fig = px.histogram(df, x="total_bill", y="tip", color="sex", marginal="rug", hover_data=df.columns)
fig.show()

12. box plots¶

import plotly.express as px
df = px.data.tips()
fig = px.box(df, x="day", y="total_bill", color="smoker", notched=True)
fig.show()

Introducción a python

Clase 15: gráficos pro con `Plotly`¶

1. Introducción¶

2. Tablas¶

3. Gráficos de líneas¶

4. Gráfico de puntos (scatter)¶

5. Gráfico de barras¶

6. Gráfico de torta¶

7. Animación¶

8. Mapa de calor¶

9. sunburst charts¶

10. Treemap¶

11. Histograma¶

12. box plots¶

Actividad¶

Introducción a python

Clase 15: gráficos pro con Plotly¶

1. Introducción¶

2. Tablas¶

3. Gráficos de líneas¶

4. Gráfico de puntos (scatter)¶

5. Gráfico de barras¶

6. Gráfico de torta¶

7. Animación¶

8. Mapa de calor¶

9. sunburst charts¶

10. Treemap¶

11. Histograma¶

12. box plots¶

Actividad¶

Clase 15: gráficos pro con `Plotly`¶