Skip to end of metadata
Go to start of metadata

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 8 Next »

Disponible desde Release 6.0.0

Introducción

Esta funcionalidad permite gestionar, mediante un usuario administrador, la posibilidad de que los usuarios creen entidades en diferentes buckets de un S3 externo definido, es decir, tanto desde el propio MinIO de plataforma, como el propio S3 de AWS u otros sistemas compatibles con el protocolo. Será necesario tener un metastore propio para este S3 externo al crear las tablas de presto en el mismo.

Mediante la configuración centralizada se definirá la configuración remota de acceso. Las credenciales utilizadas, deben permitir el listado de buckets, así como la creación de carpetas y ficheros en los mismos.

Con esto dado, un usuario administrador podrá asignar buckets a usuarios, bien por el sistema de compartir propio, bien como recurso de un proyecto. Finalmente, los usuarios que tengan permisos podrán crear nuevas entidades en los diferentes buckets permitiendo contenedores de diferentes capas/áreas de procesamiento de datos, tener un bucket para staging, otro para business warehouse otro para un datamart

¿Cómo usarlo?

Configuración necesaria

Para activar esta funcionalidad, serán necesarios unos pasos previos:

  • Creación de un nuevo servicio de metastorage apuntando a este sistema S3. Para esta parte se podrá usar la imagen del propio de plataforma para MinIO. Se generará un nuevo servicio que para AWS llamaremos presto-metastore-server-aws. La imagen, en su versión actual:

presto-metastore-server:5.0.0

Y apuntando a AWS con las variables de entorno, además de la URL del servicio

- MINIO_ROOT_USER → con el Access Key

- MINIO_ROOT_PASSWORD → secret key

- MINIO_SERVER_ENDPOINT → endpoint http/https del servicio S3

image-20240326-140318.png

Con esto tendremos el servicio corriendo y apuntado a AWS

image-20240326-140736.png
  • Configurar el sistema S3 en la configuración centralizada de plataforma. Dentro de la configuración Platform el path onesaitplatform/env/externals3

image-20240326-142942.png

Aunque con la configuración inicial debería estar apuntando, también será necesario revisar que los paths:

onesaitplatform/env/database/prestodb-externals3-catalog → nombre catalog de presto (por defecto externals3)

onesaitplatform/env/database/prestodb-externals3-schema → nombre catalog de presto (por defecto default)

  • Crear un nuevo catalog de presto en plataforma (con el nombre indicado en el paso anterior en onesaitplatform/env/database/prestodb-externals3-catalog) apuntando a metastorage creado previamente (propiedad hive.metastorage.url) con las siguientes propiedades:

image-20240326-154034.png

Creación del Bucket S3 en AWS

Una vez realizados los pasos anteriores y teniendo configurado correctamente las credenciales para AWS, lo primero será acceder a nuestra consola de AWS:

image-20240326-201026.png

Accederemos a sección de Amazon S3

image-20240326-201152.png

Y daremos a “crear bucket” para acceder al formulario de creación. Dentro del mismo rellenaremos los diferentes campos y crearemos nuestro bucket:

image-20240326-201436.png

Al crear el bucket se nos notificará de la creación del mismo y aparecerá en el listado de buckets

image-20240326-201647.png

Creación del Bucket Virtual asociado en plataforma

A partir de aquí, si vamos a plataforma con un usuario administrador y vamos a la opción Gestión de Buckets Virtuales/Virtual Buckets Management

image-20240326-202757.png

Damos a crear y podremos ver el listado de buckets de AWS

image-20240326-202842.png

Seleccionamos el nuevo bucket creado y rellenamos el resto de campos

image-20240326-203015.png

Al darle a crear, podremos ver el resumen, así como el path completo generado

image-20240326-203123.png

En este punto, será interesante asignar permisos a los usuarios desarrolladores para que puedan crear entidades sobre este nuevo bucket virtual, es decir que puedan crear entidades sobre la carpeta con el path “data/input” en el bucket de AWS onesaitdatamart

image-20240326-203631.png

Creación de la entidad en el Bucket Virtual

En este punto, finalmente, crearemos una entidad en este bucket virtual con el usuario al que hemos dado permiso en el paso anterior.

Al logarmos con el usuario developer en plataforma podemos ir al listado de bucket que de modo informativo se nos mostrará, aunque no tendremos opciones de edición o borrado ya que pertenecen al usuario administrador.

image-20240326-204200.png

Para crear una nueva entidad sobre este Bucket Virtual, iremos a la creación de entidades historicas:

image-20240326-204404.png

Dentro, nos aparecerá la opción de creación de entidades sobre buckets virtuales

image-20240326-204513.png

Similar a la creación de entidades históricas iremos rellenando el formulario con las diferentes opciones de creación de la entidad

image-20240326-210724.png

Abajo, podremos seleccionar el Bucket Virtual donde queremos que se cree la entidad. Si actualizamos la SQL (botón Update SQL) podremos ver la sentencia de creación completa apuntando al bucket real de AWS en EXTERNAL_LOCATION

image-20240326-211013.png

Finalmente, dando a crear, tendremos nuestra nueva entidad

image-20240326-211112.png

Si navegamos a la consola de AWS, podremos ver como se ha creado el path completo de la nueva entidad

image-20240326-211244.png

Operaciones sobre la Entidad

Podremos insertar datos que aparecerán como nuevos ficheros en el S3 de AWS

image-20240326-211703.png

image-20240326-211741.png

Y consultarlos sin problema:

image-20240326-211846.png

  • No labels