Thor Olavsrud
Senior Writer

Che cos’è la data governance? Ecco le best practice per la gestione degli asset di dati

In primo piano
06 Aug 202315 minuti
Governance dei datiGestione dei dati

La governance dei dati definisce ruoli, responsabilità e processi per garantire il controllo e la proprietà delle risorse di dati in tutta l’azienda.

data-center-man-it-specialist-tablet
Credito: Shutterstock

La definizione di data governance

La governance dei dati è un sistema per definire chi, all’interno di un’azienda, ha l’autorità e il controllo sugli asset di dati e su come questi possono essere utilizzati. Comprende le persone, i processi e le tecnologie necessarie per gestire e proteggere le risorse di dati.

Il Data Governance Institute [in inglese] lo definisce come “un sistema di diritti decisionali e di responsabilità per i processi legati alle informazioni, eseguito secondo modelli concordati che descrivono chi può intraprendere quali azioni con quali informazioni, e quando, in quali circostanze, utilizzando quali metodi”.

La Data Management Association [in inglese] (DAMA) International la definisce come “la pianificazione, la supervisione e il controllo della gestione dei dati, il loro uso e quello delle fonti correlate”.

Il framework della governance dei dati

La governance dei dati può essere meglio considerata come una funzione che supporta la strategia globale di gestione delle informazioni di un’azienda. Tale struttura fornisce un approccio olistico alla raccolta, alla gestione, alla protezione e all’archiviazione dei dati. Per aiutare a capire di che cosa dovrebbe occuparsi un framework, DAMA immagina la gestione dei dati come una ruota, con la governance dei dati come fulcro da cui si irradiano le seguenti 10 aree di conoscenza della gestione dei dati:

Architettura dei dati [in inglese]: la struttura complessiva dei dati e delle risorse correlate ai dati come parte integrante dell’architettura aziendale.

Modellazione e progettazione dei dati: analisi, progettazione, costruzione, test e manutenzione.

Archiviazione e operazioni sui dati: distribuzione e gestione delle risorse fisiche di dati strutturati.

Sicurezza dei dati: garantire la privacy, la riservatezza e l’accesso appropriato.

Integrazione e interoperabilità dei dati: acquisizione, estrazione, trasformazione, spostamento, consegna, replica, federazione, virtualizzazione e supporto operativo.

Documenti e contenuti: archiviazione, protezione, indicizzazione e abilitazione all’accesso ai dati presenti in fonti non strutturate, e loro messa a disposizione per l’integrazione e l’interoperabilità con i dati strutturati.

Dati di riferimento e anagrafici: gestione dei dati condivisi per ridurre la ridondanza e garantire una migliore qualità dei dati attraverso la definizione e l’uso standardizzato dei loro valori.

Data warehousing e business intelligence (BI) [in inglese]: gestire l’elaborazione analitica dei dati e consentire l’accesso ai dati di supporto alle decisioni per il reporting e l’analisi.

Metadati: raccolta, categorizzazione, mantenimento, integrazione, controllo, gestione e distribuzione dei metadati.

Qualità dei dati: definizione, monitoraggio, mantenimento dell’integrità dei dati e miglioramento della loro qualità.

Quando si stabilisce una strategia, si deve prendere in considerazione ogni aspetto della raccolta, della gestione, dell’archiviazione e dell’utilizzo dei dati.

Il Business Application Research Center [in inglese] (BARC) avverte che la governance dei dati è un programma molto complesso e continuativo, non un’iniziativa “a macchia d’olio”, e corre il rischio che i partecipanti perdano fiducia e interesse nel tempo. Per ovviare a questo problema, il BARC consiglia di iniziare con un progetto basato su un prototipo gestibile o specifico per un’applicazione, per poi estenderlo a tutta l’azienda in base alle lezioni apprese.

Per l’implementazione, BARC raccomanda le seguenti fasi:

  • Definire gli obiettivi e comprendere i vantaggi
  • Analizzare lo stato attuale e le delta analysis
  • Definire una tabella di marcia
  • Convincere gli stakeholder e stanziare il budget per il progetto
  • Sviluppare e pianificare il programma di governance dei dati
  • Implementare il programma di governance dei dati
  • Monitoraggio e controllo

Data governance vs data management

La governance dei dati è solo una parte della disciplina generale della gestione dei dati, anche se importante. Riguarda i ruoli, le responsabilità e i processi per garantire la responsabilità e la proprietà delle risorse di dati, e il DAMA definisce la gestione dei dati come “un termine generale che descrive i processi utilizzati per pianificare, specificare, abilitare, creare, acquisire, mantenere, utilizzare, archiviare, recuperare, controllare ed eliminare i dati”.

Sebbene data management sia diventata una locuzione comune per descrivere questo contesto, a volte viene indicata come gestione delle risorse di dati o gestione delle informazioni aziendali (EIM). Gartner descrive l’EIM [in inglese] come “una disciplina integrativa per strutturare, descrivere e governare le risorse informative attraverso i confini organizzativi e tecnici per migliorare l’efficienza, promuovere la trasparenza e consentire la comprensione del business”.

L’importanza della data governance

La maggior parte delle aziende dispone già di una forma di governance per singole applicazioni, business unit o funzioni, anche se i processi e le responsabilità sono informali. Ma è importante anche poter stabilire un controllo sistematico e formale su questi processi e su queste responsabilità. Ciò può aiutare le aziende a rimanere reattive, soprattutto quando crescono fino a raggiungere dimensioni in cui non è più efficiente per i singoli svolgere compiti interfunzionali. Molti dei vantaggi complessivi della gestione dei dati possono essere realizzati solo dopo che l’azienda ha stabilito una governance sistematica dei dati. Alcuni di questi vantaggi includono:

  • Un supporto decisionale migliore e più completo grazie a dati coerenti e uniformi in tutta l’azienda.
  • Regole chiare per la modifica dei processi e dei dati che aiutino l’azienda e l’IT a diventare più agili e scalabili.
  • Riduzione dei costi in altre aree della gestione dei dati grazie alla fornitura di meccanismi di controllo centrali
  • Aumento dell’efficienza grazie alla possibilità di riutilizzare i processi e i dati
  • Maggiore fiducia nella qualità dei dati e nella documentazione dei processi per la loro gestione.
  • Maggiore conformità alle normative sui dati

Gli obiettivi della data governance

L’obiettivo è stabilire i metodi, le responsabilità e i processi per standardizzare, integrare, proteggere e archiviare i dati aziendali. Secondo il BARC, gli obiettivi principali di un’impresa dovrebbero essere i seguenti:

  • Ridurre al minimo i rischi
  • Stabilire regole interne per l’utilizzo dei dati
  • Implementare i requisiti di conformità
  • Migliorare la comunicazione interna ed esterna
  • Aumentare il valore dei dati
  • Facilitare la loro amministrazione
  • Ridurre i costi
  • Contribuire a garantire la continuità dell’azienda attraverso la gestione e l’ottimizzazione dei rischi.

BARC osserva che tali programmi si estendono sempre ai livelli strategico, tattico e operativo delle imprese e devono essere trattati come processi continui e iterativi.

I principi della data governance:

Secondo il Data Governance Institute, otto principi sono al centro di tutti i programmi di data governance e stewardship di successo:

  1. Tutti i partecipanti devono avere integrità nei rapporti reciproci. Devono essere sinceri e disponibili nel discutere le motivazioni, i vincoli, le opzioni e gli impatti delle decisioni relative ai dati.
  2. I processi di governance e stewardship dei dati richiedono trasparenza. Deve essere chiaro a tutti i partecipanti e ai revisori come e quando le decisioni e i controlli relativi ai dati sono stati introdotti nei processi.
  3. Le decisioni, i processi e i controlli relativi ai dati soggetti alla governance dei dati devono essere verificabili e devono essere accompagnati da una documentazione che supporti i requisiti di audit operativi e di conformità.
  4. Devono definire chi è responsabile delle decisioni, dei processi e dei controlli interfunzionali relativi ai dati.
  5. Devono definire chi è responsabile delle attività di stewardship che sono a carico dei singoli collaboratori e dei gruppi di data steward.
  6. I programmi devono definire le responsabilità in modo da introdurre controlli e bilanciamenti tra i team aziendali e tecnologici e tra coloro che creano/raccolgono le informazioni, coloro che le gestiscono, coloro che le utilizzano e coloro che introducono standard e requisiti di conformità.
  7. Il programma deve introdurre e sostenere la standardizzazione dei dati aziendali.
  8. I programmi devono supportare attività di gestione delle modifiche proattive e reattive per i valori dei dati di riferimento e la struttura/uso dei dati master e dei metadati.

Le best practice nella governance dei dati

Le strategie di governance dei dati devono essere adattate per soddisfare al meglio i processi, le esigenze e gli obiettivi di un’impresa. Tuttavia, ci sono sei best practice fondamentali che vale la pena seguire:

  1. Identificare gli elementi critici dei dati e trattarli come una risorsa strategica.
  2. Definire politiche e procedure per l’intero ciclo di vita dei dati.
  3. Coinvolgere gli utenti aziendali nel processo di governance.
  4. Non trascurare la gestione dei dati master [in inglese].
  5. Comprendere il valore delle informazioni.
  6. Non limitare eccessivamente l’uso dei dati.

Per ulteriori informazioni sulla corretta governance dei dati, vedere “6 best practice per una buona governance dei dati [in inglese]”.

Le sfide della governance dei dati

Avere in azienda una buona governance dei dati non è un compito semplice. Richiede lavoro di squadra, investimenti e risorse, oltre a pianificazione e monitoraggio. Alcune delle principali sfide di un programma di governance dei dati includono:

Mancanza di leadership dei dati: come altre funzioni aziendali, la governance dei dati richiede una forte leadership esecutiva che deve dare una direzione al team preposto, lo sviluppo di politiche da seguire per tutti i membri dell’azienda e un impianto di comunicazione costante tra i leader dell’azienda.

Mancanza di risorse: le iniziative di governance dei dati possono essere in difficoltà per mancanza di investimenti in termini di budget o di personale. La governance dei dati deve essere gestita e pagata da qualcuno, ma raramente genera entrate da sola. La governance dei dati e la gestione dei dati in generale, tuttavia, sono essenziali nello sfruttamento dei dati per generare entrate.

Dati isolati: i dati possono diventare isolati e segmentati nel tempo, soprattutto quando le linee di business o altre funzioni sviluppano nuove fonti di dati, applicano nuove tecnologie e così via. Il programma di governance dei dati deve continuamente abbattere i nuovi silos.

Per ulteriori informazioni su queste e altre difficoltà, vedere “7 errori di governance dei dati da evitare [in inglese]”.

I software e i vendor della data governance

La governance dei dati è un programma continuo più che una soluzione tecnologica, ma esistono strumenti con funzioni ad hoc che possono aiutare a sostenere il vostro programma. Lo strumento più adatto alla vostra azienda dipenderà dalle vostre esigenze, dal volume dei dati e dal budget. Secondo PeerSpot [in inglese], alcune delle soluzioni più diffuse sono:

Soluzione per la data governanceDescrizione e caratteristiche
Collibra GovernanceCollibra è una soluzione aziendale che automatizza molte attività di governance e stewardship. Include un gestore di policy, un helpdesk e un dizionario per i dati, e un glossario aziendale.
SAS Data ManagementCostruito sulla piattaforma SAS, SAS Data Management offre un’interfaccia grafica basata sui ruoli per la gestione dei processi e comprende un glossario aziendale integrato, la gestione dei metadati SAS e di terze parti e la lineage visualization.
erwin Data Intelligence (DI) for Data Governanceerwin DI combina funzionalità di data catalog e data literacy per fornire consapevolezza e accesso alle risorse di dati disponibili. Offre indicazioni sull’uso di tali risorse di dati e garantisce il rispetto delle policy e delle best practice in materia di dati.
Informatica AxonInformatica Axon è un hub di raccolta e un marketplace di dati per il supporto dei programmi. Le caratteristiche principali includono un glossario aziendale collaborativo, la possibilità di visualizzare il percorso dei dati e di generare misurazioni della loro qualità in base alle definizioni aziendali.
SAP Data HubSAP Data Hub è una soluzione di orchestrazione dei dati che aiuta a scoprire, perfezionare, arricchire e governare tutti i tipi, le varietà e i volumi di dati. Aiuta le aziende a stabilire le impostazioni di sicurezza e i criteri di controllo dell’identità per utenti, gruppi e ruoli, e a semplificare le best practice e i processi per la gestione dei criteri e la security logging.
AlationAlation è un catalogo per i dati aziendali che li indicizza automaticamente in base alla fonte di provenienza. Una delle sue funzionalità principali, TrustCheck, fornisce “guardrail” in tempo reale ai flussi di lavoro. Pensato specificamente per supportare la self-service analytics, TrustCheck collega linee guida e regole agli asset di dati.
Varonis Data Governance SuiteLa soluzione di Varonis automatizza le attività di protezione e gestione dei dati sfruttando un Metadata Framework scalabile che consente alle aziende di gestire l’accesso ai dati, visualizzare gli audit trail di ogni file ed evento di posta elettronica, identificare la proprietà dei dati tra le diverse unità aziendali e trovare e classificare i dati e i documenti sensibili.
IBM Data GovernanceIBM Data Governance sfrutta l’apprendimento automatico per raccogliere e curare le risorse di dati. Il catalogo integrato aiuta le aziende a trovare, raccogliere, analizzare, preparare e condividere i dati.

Le certificazioni della data governance

La governance dei dati è un sistema, ma esistono alcune certificazioni [in inglese] che possono aiutare la vostra azienda a ottenere dei vantaggi, tra cui le seguenti:

  • DAMA Certified Data Management Professional (CDMP)
  • Data Governance and Stewardship Professional (DGSP)
  • edX Enterprise Data Management
  • SAP Certified Application Associate – SAP Master Data Governance

Per le certificazioni correlate: “10 certificazioni per la gestione dei dati master che danno buoni frutti [in inglese]”.

I ruoli della data governance

Ogni azienda compone la propria governance dei dati in modo diverso, ma ci sono alcuni punti in comune.

Il comitato direttivo

I programmi di governance si estendono a tutta l’azienda e in genere partono da un comitato direttivo che comprende il senior management, spesso di C-level o vice president responsabili delle linee di business. Morgan Templar, autore di Get Governed: Building World Class Data Governance Programs, afferma che le responsabilità dei membri del comitato direttivo comprendono la definizione della strategia generale di governance con risultati specifici, la promozione del lavoro dei data steward e la responsabilizzazione dell’organizzazione di governance rispetto a tempistiche e risultati.

I proprietari dei dati

Secondo Templar, i proprietari dei dati sono persone responsabili nell’assicurare che le informazioni all’interno di uno specifico dominio di dati siano governate attraverso i sistemi e le linee di business. In genere, sono membri del comitato direttivo, anche se possono essere membri non votanti. I proprietari dei dati sono responsabili di:

  • Approvare i glossari e le altre definizioni dei dati
  • Garantire l’accuratezza delle informazioni in tutta l’azienda
  • Dirigere le attività relative alla qualità dei dati
  • Rivedere e approvare gli approcci, i risultati e le attività di gestione dei dati master
  • Collaborare con gli altri data owner per risolvere i problemi dei dati
  • Revisione di secondo livello per i problemi identificati dai data steward
  • Fornire al comitato direttivo input su soluzioni software, politiche o requisiti normativi del proprio dominio di dati.

I data steward

I data steward sono responsabili della gestione quotidiana dei dati. Sono esperti di materia che comprendono e comunicano il significato e l’uso delle informazioni, afferma Templar, e lavorano con altri data steward in tutta l’azienda come organo di governo per la maggior parte delle decisioni sui dati. I data steward sono responsabili di:

  • Essere responsabili per il loro dominio di dati
  • Identificare i problemi dei dati e collaborare con gli altri data steward per risolverli
  • Agire come membro del consiglio degli steward dei dati.
  • Proporre, discutere e votare le policy sui dati e le attività del comitato
  • Riferire al proprietario dei dati e ad altri stakeholder all’interno di un dominio di dati
  • Lavorare in modo interfunzionale tra le linee di business per garantire la gestione e la comprensione dei dati del proprio dominio.

Per saperne di più sulla data governance: