Principios de Data Governance
Necesidad del Gobierno del Dato
Actualmente en las empresas se detectan múltiples problemas asociados al dato y su gestión, lo que redunda en diversos problemas operativos al tiempo que imposibilita la utilización del dato como activo estratégico.
Estas carencias y problemáticas comunes asociadas a la gestión del dato afectan a diferentes dimensiones de los proyectos:
Indisponibilidad:
Fuentes de información heterogéneas y dispersas que dificultan la obtención de información.
Grandes volúmenes de información no tratables con tecnología actual.
Falta de entendimiento entre áreas de Negocio y Sistemas.
Falta de credibilidad
Deficiencias en la calidad de la información que se está tratando.
Duplicidad e incoherencia de información.
Necesidad de realizar asunciones en la reconstrucción de información histórica.
Preparación muy manual de la información.
Sin visión única
Diferencia de criterios entre la información manejada por las diferentes unidades de negocio.
Dominios de información con acceso restringido.
Falta de iniciativas cross de aportación de valor.
Principios del Data Governance
Data Governance se refiere a la gestión de la disponibilidad, integridad, usabilidad y seguridad de los datos utilizados en una organización o sistema, en nuestro caso en Plataforma.
La calidad de los datos viene marcada por la calidad de los mismos al momento de su captura en el origen de la información. Por lo tanto, es primordial respetar una serie de principios para asegurar la misma.
Para asegurar una homogeneidad y coherencia en el entendimiento de los datos, es necesario definir un diccionario de datos y siempre mantener actualizada su información y trazabilidad.
Se debe implantar una arquitectura de datos coherente, desde el operacional hasta su explotación, es importante que los datos estén validados, documentados y que se conozca exactamente su trazabilidad.
Para una explotación de los datos optima, se deben definir criterios de agregación, asegurar una granularidad de los datos suficiente y que los procesos sean automatizados.
Para garantizar la seguridad de los datos, se deben definir, otorgar y administrar correctamente los perfiles adecuados de acceso a la información así como opciones de encriptación, cifrado y anonimización de los datos.
Es primordial definir una serie de políticas y reglamentos a respetar para asegurar el correcto funcionamiento del Modelo de Gobierno del Dato.
Principios del Data Governance: CALIDAD
PREMISAS DE CALIDAD:
Completitud de la información: Aseguramiento que los datos estandarizados en conjunto poseen lógica para su explotación.
Visión global de negocio / infraestructura: Establecimiento de la definición de negocio para el dato, permitiendo identificarlos a través de una visón end to end, así como con una visión de infraestructura que permita conocer la ubicación física del dato.
Responsabilidad de los datos: Asignación de responsabilidades y roles sobre la gestión de información, fiabilidad, integridad, aprovisionamiento y explotación de los datos, a través de un modelo de gobierno que facilite el seguimiento de su evolución.
Datos eficientes: Cumplimiento de los principios de no duplicidad, integridad y consistencia de los datos.
ELEMENTOS CLAVE EN EL ASEGURAMIENTO DE LA CALIDAD
Definición de estándares: Generación de requerimientos mínimos de información para considerar el dato como correcto (verificación de longitudes, tipología de datos, formatos).
Validación del dato: Establecimiento de mecanismos de validación que permitan la integración del dato en la infraestructura de almacenamiento de acuerdo a los estándares establecidos, minimizando la ocurrencia de incidencias.
Visión cross del ciclo de vida del dato: Identificar el proceso completo del ciclo de vida del dato, permitiendo una gestión global del mismo a través de la trazabilidad y mapeo de la información.
Implementación de una metodología. Implementar procedimientos perfectamente delimitados y establecidos que permitan la ejecución constante de mejores prácticas.
Principios del Data Governance: HOMOGENEIDAD
Trazabilidad del dato Datos perfectamente identificables con base en su trazabilidad, mapeo y seguimiento a lo largo de los procesos; permitiendo darle continuidad a la cohesión y coherencia de información.
Ajustado a la definición del negocio (precisión del dato) Se deben considerar únicamente los datos requeridos de acuerdo a la necesidad del negocio, evitando información duplicada, aumentando la exactitud y acotación de las bases.
Información relacionada: Mantenimiento de los datos bajo reglas lógicas y criterios que permitan establecer relaciones entre los diferentes repositorios, facilitando a su vez la agregación con base en la diferente tipología.
Estandarización: Definir estándares para el dato, desde los procesos de aprovisionamiento, almacenamiento y explotación, estableciendo reglas constantes para asignación de nombres y metodologías claras para definir procedimientos.
Apoyo en la infraestructura: Hacer uso de las herramientas que faciliten la trazabilidad funcional y técnica de cada dato: administración de bases de datos, diseño de bases de datos, creación y mantenimiento para el sistema de base de datos.
Procesos alineados a la organización / normativa: Cumplimiento de los procedimientos de acuerdo a la visión de la entidad, así como de los agentes reguladores, acotando el margen de la información.
Principios del Data Governance: ARQUITECTURA DE DATOS
Una arquitectura sólida, debe basarse en principios clave que soporten la estructura de la misma. A continuación tienes nuestra visión:
Robustez y Flexibilidad. Generar una arquitectura escalable, que permita la incorporación ágil de nuevas piezas y componentes estructurales.
Fuentes únicas. Evitar duplicidad en los almacenamientos de información, generando sinergias y evitando el re-trabajo a través de un análisis detallado de la información.
Visión end to end. Mantener la trazabilidad de los datos en todo momento, para identificar el flujo informacional y los procesos de transformación.
Los principios deben contemplar:
Aprovisionamiento:
Alineamiento y estandarización de los procesos de entrada.
Identificación clara de fuentes / BBDD / archivos / aplicativos, así como la acotación de la tipología de información: canales, web, riesgos.
Definición de procesos de validación de los datos de entrada.
Procesos y Almacenamiento:
Definición de la infraestructura y tecnología de soporte con desempeño óptimo y capacidad de almacenamiento histórico.
Generar repositorios centralizados con información validada alineados a la estrategia corporativa.
Definir procesos de cálculo y transformación del dato acorde a la necesidad del negocio.
Homogeneidad y cohesión en los datos.
Explotación:
Identificación de las Herramientas de explotación / distribución.
Definición de métricas y estándares para definición de reporting.
Alinear medios de entrega y áreas responsables.
Control inventariado de salidas para evitar duplicidad en construcciones / desarrollos.
Generar sinergias con base en desarrollos existentes.
Seguimiento y Control:
Documentación: Llevar un correcto seguimiento de todos los procesos, acciones y decisiones que se toman para generar la arquitectura de datos, así como del ciclo de vida del dato: aprovisionamiento, extracción, carga, explotación.
Áreas usuarias alineadas: Alineamiento de las áreas usuarias para responsabilización de acuerdo a su participación dentro del proceso.
Visión global: que permita el alineamiento del ciclo de vida con la estructura y procedimientos corporativos.
Principios del Data Governance: AGREGACIÓN
Definición de la agregación: La arquitectura de datos y la infraestructura tecnológica debe dar soporte a una definición que contenga los criterios de agrupación y dimensiones del dato para lograr una agregación al mínimo nivel de detalle, que complementariamente debe estar documentada.
Exactitud e Integridad de la información Para que el dato pueda tener una agregación adecuada, el dato debe contar con un nivel definido de exactitud e integridad, con el fin de generar el cálculo del riesgo de una manera precisa y fiable para satisfacer las necesidades de explotación bajo condiciones normales y de estrés
Automatización: Se busca eliminar las manualidades en los aprovisionamientos de información, implementando procesos automáticos que tomen la información y realicen el cálculo de los procesos definidos, permitiendo una correcta profundización en los distintos niveles de información.
Análisis por eje de información: La adecuada agregación informacional requiere análisis de los distintos cruces que el dato puede tener a través de cualquier campo con otros similares, permitiendo obtener una visión transversal de la información a través de sus diferentes ejes y dimensiones, permitiendo agregar y profundizar al mínimo nivel de detalle.
Definición clara de la estructura lógica: La estructura del modelo de datos debe estar basado en una estructura definida bajo una visión de explotación en diferentes niveles y vistas, soportada por la consistencia y cohesión entre los diferentes módulos o componentes.
Principios del Data Governance: SEGURIDAD
Disponibilidad del dato: Mantener el dato disponible para quien deba acceder a él; presentándose en tiempo y forma, ya sean para aprovisionamientos, usuarios, aplicativos o procesos varios, permitiendo el cumplimiento de los niveles de servicio.
Segmentación de la información por tipo: Definir criterios para englobar los datos en grupos (críticos, sensibles, etc.) que permitan la asignación de criterios de acuerdo al tipo, facilitando la gestión de los perfiles.
Conjunción de visión tecnológica y de negocio: Implementación de normas específicas de seguridad a nivel físico y lógico para la protección de datos de acuerdo al nivel de riesgo establecido por la entidad.
Gestión de perfilados: Gestión de accesos de acuerdo a estándares permitidos por tipología de usuarios: Usuario: Visión limitada de acuerdo al perfil definido y Administrador: Gestor de accesos con visión global de la información.
Bitácoras: Logs que permitan tener una visión global del flujo de la información y los responsables de dicho tratamiento, ya sea de manipulación de datos, extracción, accesos a bases, aplicaciones, archivos, etc.