Info |
---|
A partir de la versión 3.1.0 en el Control Panel se ha pasado a denominar Entidades a las Ontologías. Esto no altera ninguna funcionalidad, simplemente se ha cambiado la nomenclatura para un mejor entendimiento del concepto. |
La información que proviene de la ingesta y procesamiento queda almacenada en el Semantic Data Hub de la plataforma, como hemos dicho es el motor de persistencia de la plataforma.
...
Soporta el almacenamiento de la información en diferentes repositorios Stores (actualmente soportados MongoDB, Bases de datos relacionales, Elasticsearch, Kudu, BigQuery, HIVE, CosmosDB y a nivel de consulta cualquier BD con driver JDBC) además de permitir siempre consultar en SQL sea cual sea el repositorio subyacente.
...
Plataforma propone una Arquitectura Data Centric
...
, es decir una arquitectura donde los datos son el activo principal y permanente, mientras que las aplicaciones van y vienen. En estas arquitecturas el modelo de datos precede a la implementación de cualquier aplicación dada y será válido mucho después de que se reemplacen.
En la plataforma se soporta a través del concepto de Entidad (también llamada Ontología)
...
, este concepto es el que permite aislar a la plataforma de las tecnologías de persistencia subyacentes ofreciendo una capa de abstracción SQL. La información que proviene de la ingesta y procesamiento queda almacenada en el Semantic Data Hub de la plataforma, como hemos dicho es el motor de persistencia de la plataforma.
...
Sus principales características:
Soporta el almacenamiento de la información en diferentes repositorios Stores (actualmente soportados MongoDB, Bases de datos relacionales, Elasticsearch, Kudu, BigQuery, HIVE, CosmosDB, base de datos de grafos y a nivel de consulta cualquier BD con driver JDBC) además de permitir siempre consultar en SQL sea cual sea el repositorio subyacente.
La Plataforma permite en función de los requerimientos de cada proyecto (volúmenes de información en tiempo real e histórico, accesos mayoritariamente de lectura o escritura, mayor cantidad de procesos analíticos, tecnologías previamente existentes en los clientes, etc.) seleccionar el motor de persistencia más adecuado, conceptualmente se manejan estos conceptos en plataforma:
Base Datos Tiempo Real (RealTimeDB): está pensada para soportar un gran volumen de inserciones y consultas online de forma muy eficiente. La plataforma abstrae de la tecnología subyacente permitiendo usar BD como Mongo, Elastic, Kudu, BD relacionales,…
Base Datos Histórica y Analítica (HistoricalDB): está pensado para almacenar toda la información que ya no forma parte del mundo online (por ejemplo, información de años anteriores que ya no se consulta) y para soportar procesos analíticos que extraen conocimiento de estos datos (algoritmos). La plataforma soporta tecnologías como HIVE (con Impala o Presto para consultas online), SAP HANA, BigQuery, Cosmos DB, SparkSQL,…
Área de Staging: permite almacenar ficheros en raw y sin procesar por la plataforma, para su posterior ingesta. Suele usarse HDFS como almacenamiento aunque la plataforma permite usar otros como GridFS.
Base Datos GIS: permite el almacenamiento de información geográfica y su posterior consulta y procesamiento, la plataforma soporta MongoDB, Elastic, PostGIS entre otras.
Toda la definición y manejo de estas entidades se realiza desde el Control Panel de la Plataforma:
Listado de Entidades/Ontologías (vistas por Rol Administrador) con niveles de visibilidad,…
...