...
Creada la Entidad, se regresará al listado de Entidades del usuario, en donde se podrá comprobar que aparece correctamente.
...
Paso 2.- Cargar los datos en MinIO
Aunque en el paso anterior era posible cargar los datos directamente, se quiere mostrar cómo subir el archivo de datos a un bucket de MinIO.
...
Hecho esto, el archivo CSV con los datos de diabetes aparecerá en el listado del Bucket:
...
Puesto que más adelante será necesariose va a necesitar, es recomendable apuntar la ruta del archivo subido. Esto se puede ver en el listado de archivos inferior, que para este caso sería «analyticsbucket/datalake/diabetes_raw/select_diabetes.tab_20230927170218.csv».
...
Paso 3.- Crear el Notebook
...
Aparecerá entonces una ventana pidiendo que se introduzca el nombre del Notebook a crear. Aquí se indicará el nombre que interese, que para este ejemplo será «notebook_diabetes».
...
Una vez creado el Notebook, se procederá a configuración.
Paso 4.- Configurar el Notebook
El Notebook se compondrá se varios párrafos, cada uno de ellos orientado a definir una tarea.
En un primer párrafo se van a importar las librerías que se van a necesitar para llevar a cabo el experimento, así como definir el entorno de trabajo como variable global.
Code Block | ||
---|---|---|
| ||
%python
import warnings
import requests
import io
import pandas as pd
import numpy as np
import mlflow
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.model_selection import train_test_split
from sklearn.linear_model import ElasticNet
from sklearn.linear_model import lasso_path, enet_path
# Set here the URL of the Platform instance
environment = "https://lab.onesaitplatform.com"
baseurl = environment + "/controlpanel/api/objectstorage" |
Para este tutorial se hará uso de CloudLab, la instancia de experimentación de Onesait Platform.
...
Seguidamente, en un nuevo párrafo, se definirán los parámetros de entrada que se ejecutarán como proceso en el Notebook.
Code Block | ||
---|---|---|
| ||
%python
token = z.input("token")
filepath = z.input("filepath")
alpha_str = z.input("alpha")
l1_ratio_str = z.input("l1_ratio")
alpha = float(alpha_str)
l1_ratio = float(l1_ratio_str) |
Algunos de estos parámetros (lo que presentan un z.input()
) serán campos a introducir por el usuario que lleve a cabo el experimento, siendo:
...
Token: el token personal del usuario que lleva a cabo el experimento, y que puede encontrarse en el menú contextual anejo al nombre de usuario.
...
FilePath: la localización del archivo de datos que se ha cargado en MinIO, y que se comentó que era interesante apuntar. Como recordatorio, sería: «analyticsbucket/datalake/diabetes_raw/select_diabetes.tab_20230927170218.csv»
Alpha y l1_ratio: dos parámetros del experimento, que se mantendrán con el valor de «0.05».
...
También podemos importar este archivo que contiene el cuaderno completo para este ejemplo (sólo tienes que establecer el parámetro token).
...