...
Esta funcionalidad permitirá poder monitorizar el consumo individual y en conjunto de los notebooks y tener controles sobre los mismos en plataforma (pantallas de los notebooks), de modo que sea viable ver y controlar su estado para poder pararlos de forma correcta sobre la interfaz, poder ver procesos en ejecución, etc, etc
Modos de ejecución de notebooks
Los notebooks de plataforma, basados en apache zeppelin, se ejecutan en base a intérpretes con diferentes configuraciones. De modo que un notebook, puede ejecutar intérpretes en diferentes modos.
En plataforma se contemplan 3 modos de ejecución de intérpretes en notebooks:
Shared → El proceso del intérprete, se comparte con todos los notebooks, de modo que no se pueden hacer ejecuciones paralelas del mismo notebook. El manager es el mismo para ese intérprete
Por notebook:
Scoped → El proceso del intérprete es común para todos los notebooks por lo tanto es un manager de varias ejecuciones
Isolated → El proceso del intérprete está separado también por notebook con lo que el manager sólo maneja un notebook
Además, existen los modos de ejecución en k8s de modo que la ejecución de cada notebook se delega en cada pod. El manager se mantiene en este pod a modo de control de los diversos tipos de ejecuciones.
En base a esto, será el manager (proceso RemoteInterpreterServer) el encargado de reportar la información de métricas y ejecuciones a plataforma, independientemente de donde se ejecute.
Estructura de la monitorización
Se tendrán dos monitorizaciones que se complementan la una a la otra.
Monitorización de consumo → esta monitorización, almacenada en una entidad de tipo timeseries, tendrá un reporte periódico (configurable a nivel pod del módulode notebooks) y, por defecto, estará a 10 segundos. Se tendrán datos con clave el notebook-intérprete, ya que, según el tipo de ejecución aplicará uno u otro. En intérpretes “shared“, será necesario cruzar con la entidad de monitorización para saber que notebook ha consumido el intérprete.
Monitorización de ejecución → esta monitorización hará de “history“ de ejecuciones, se almacenará en una entidad propia y podrá ser desactivada si no se cree necesaria. Esta, cruzada con la anterior, podremos saber el consumo real por párrafo.