/
Integración de PyGWalker en los Notebooks

Integración de PyGWalker en los Notebooks

Disponible desde la versión 6.2.0-Xenon

Introducción

Onesait Platform integra PyGWalker como herramienta de análisis y visualización de datos para Jupyter, que convierte los DataFrames Pandas en una interfaz de usuario interactiva para la exploración visual.

image-20240917-140058.png

Acerca de PyGWalker

PyGWalker (pronunciado como «Pig Walker» en inglés) es la abreviatura de «Python binding of Graphic Walker». Integra Jupyter Notebook con Graphic Walker, una alternativa de código abierto a Tableau. Permite a los científicos de datos tanto visualizar como limpiar y anotar los datos con simples operaciones de arrastrar y soltar, e incluso realizar consultas en lenguaje natural.

En el siguiente vídeo se explica su funcionamiento:

Cómo usar PygWalker desde los Notebooks

Crear un nuevo Notebook

En primer lugar habrá que crear un nuevo Notebook. Para ello, desde Control Panel y con una cuenta con rol de «administrador» o «analista» se navegará hasta el menú de Procesamiento > Mis Notebooks.

image-20241211-151140.png

Desde el listado de Notebooks, se creará uno nuevo pulsando el botón de «+»:

image-20240917-141610.png

Lo primero que se tendrá que hacer será indicar el nombre que tendrá el Notebook:

image-20240917-141701.png

Hecho esto, se podrá proceder a crear el Notebook.

Configurar el Notebook

En primer paso será instalar librería de PyGWalker. Esto se hará en el primer párrafo del experimento mediante pip, invocando previamente el intérprete del shell de Zeppelin:

%sh pip install pygwalker

Al ejecutar el párrafo, se instalará la librería y dependencias necesarias.

image-20240917-142129.png

En un segundo párrafo, se tendrán que importar las librerías de «pandas» y «pygwalker» mediante el intérprete de Python:

%python import pandas as pd import pygwalker as pyg

Con esto ya se tendría montado el entorno y listo para trabajar.

Cargar datos al Notebook

Como datos de ejemplo, se va a utilizar el siguiente archivo CSV que se encuentra en un repositorio de GitHub: https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv

Para incluirlo en el Notebook, se creará un nuevo párrafo con el intérprete de Python en donde se leerá como archivo CSV:

%python iris = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv')

Hecho esto, el siguiente paso será indicar a PyGWalker que analice y explore los datos de manera interactiva usando gráficos del CSV que se ha introducido. Esto se hará mediante la función pyg.walk():

%python walker = pyg.walk(iris)

Si se ejecuta este párrafo, se comprobará que sale una ristra enorme de código alfanumérico, pero nada realmente visual.

image-20240917-143057.png

Para poder visualizarlo correctamente habrá que imprimir el resultado, invocando la función de walker.to_html(), que generará el visor de datos:

%python print("%html " + walker.to_html())

El resultado será como el siguiente:

image-20240917-143552.png

Código completo

%sh pip install pygwalker
%python import pandas as pd import pygwalker as pyg
%python iris = pd.read_csv('https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv')
%python walker = pyg.walk(iris)
%python print("%html " + walker.to_html())

Related content