Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Table of Contents
stylenone
Info

Disponible desde Release 6.0.0

Introducción

Esta funcionalidad permite gestionar, mediante que un usuario administrador , la posibilidad de que los usuarios creen entidades en diferentes buckets de un S3 externo definido, es decir, desde el propio MinIO de plataforma, como el propio S3 de AWS u otros sistemas compatibles con el protocolo. Será necesario tener un metastore propio para este S3 externo al crear las tablas de presto en el mismo.

Mediante la configuración centralizada se definirá la configuración remota de acceso. Las credenciales utilizadas, deben permitir el listado de buckets, así como la creación de carpetas y ficheros en los mismos.

Con esto dado, un usuario administrador podrá asignar buckets a usuarios, bien por el sistema de compartir propio, bien como recurso de un proyecto. Finalmente, los usuarios que tengan permisos podrán crear nuevas entidades en los diferentes buckets permitiendo contenedores de diferentes capas/áreas de procesamiento de datos, tener un bucket para staging, otro para business warehouse otro para un datamartde plataforma pueda segmentar un bucket S3 (bien sea AWS S3 o MinIO) en buckets virtuales asignados a los diferentes usuarios de plataforma.

De esta forma, sin necesidad de tener diferentes buckets físicos puedo usar cada bucket virtual para un tema concreto, teniendo separados sus usos (datamart, staging,…).

¿Cómo usarlo?

Configuración necesaria

Para activar esta funcionalidad, es necesario completar unos pasos previos:

  • Creación de un nuevo servicio de metastorage apuntando a este sistema S3. Para esta parte se podrá usar la imagen del propio de plataforma para MinIO. Se generará un nuevo servicio que para AWS llamaremos presto-metastore-server-aws. La imagen, en su versión actual:

presto-metastore-server:5.0.0

Y apuntando a AWS con las variables de entorno, además de la URL del servicio

- MINIO_ROOT_USER → con el Access Key

- MINIO_ROOT_PASSWORD → secret key

- MINIO_SERVER_ENDPOINT → endpoint http/https del servicio S3

...

Con esto tendremos el servicio corriendo y apuntado a AWS

...

  • Configurar el sistema S3 en la configuración centralizada de plataforma. Dentro de la configuración Platform el path onesaitplatform/env/externals3

...

Aunque con la configuración inicial debería estar apuntando, también será necesario revisar que los paths:

onesaitplatform/env/database/prestodb-externals3-catalog → nombre catalog de presto (por defecto externals3)

onesaitplatform/env/database/prestodb-externals3-schema → nombre catalog de presto (por defecto default)

  • Crear un nuevo catalog de presto en plataforma (con el nombre indicado en el paso anterior en onesaitplatform/env/database/prestodb-externals3-catalog) apuntando a metastorage creado previamente (propiedad hive.metastorage.url) con las siguientes propiedades:

...

Creación del Bucket S3 en AWS

Una vez realizados los pasos anteriores y teniendo configurado correctamente las credenciales para AWS, lo primero será acceder a nuestra consola de AWS:

...

Accederemos a sección de Amazon S3

...

Y daremos a “crear bucket” para acceder al formulario de creación. Dentro del mismo rellenaremos los diferentes campos y crearemos nuestro bucket:

...

Al crear el bucket se nos notificará de la creación del mismo y aparecerá en el listado de buckets

...

Creación del Bucket Virtual asociado en plataforma

A partir de aquí, si vamos a plataforma con un usuario administrador y vamos a la opción Gestión de Buckets Virtuales/Virtual Buckets Management

...

Damos a crear y podremos ver el listado de buckets de AWS

...

Seleccionamos el nuevo bucket creado y rellenamos el resto de campos

...

Al darle a crear, podremos ver el resumen, así como el path completo generado

...

En este punto, será interesante asignar permisos a los usuarios desarrolladores para que puedan crear entidades sobre este nuevo bucket virtual, es decir que puedan crear entidades sobre la carpeta con el path “data/input” en el bucket de AWS onesaitdatamart

...

Creación de la entidad en el Bucket Virtual

Finalmente podremos crear una entidad en este bucket virtual con el usuario al que hemos dado permiso en el paso anterior.

Al logarnos en plataforma podemos ir al listado de bucket que de modo informativo se nos mostrará, aunque no tendremos opciones de edición o borrado ya que pertenecen al usuario administrador.

...

Para crear una nueva entidad sobre este Bucket Virtual, iremos a la creación de entidades historicas:

...

Dentro, nos aparecerá la opción de creación de entidades sobre buckets virtuales

...

Similar a la creación de entidades históricas iremos rellenando el formulario con las diferentes opciones de creación de la entidad

...

Abajo, podremos seleccionar el Bucket Virtual donde queremos que se cree la entidad. Si actualizamos la SQL (botón Update SQL) podremos ver la sentencia de creación completa apuntando al bucket real de AWS en EXTERNAL_LOCATION

...

Finalmente, dando a crear, tendremos nuestra nueva entidad

...

Si navegamos a la consola de AWS, podremos ver como se ha creado el path completo de la nueva entidad

...

Operaciones sobre la Entidad

Podremos insertar datos que aparecerán como nuevos ficheros en el S3 de AWS

...

image-20240326-211741.pngImage Added

Y consultarlos sin problema:

...