1. Community
  2. News
  • 13 gennaio 2022
  • News

Data Governance: per condurre il proprio eco-sistema di dati

Attraverso la Data Governance è possibile avere consapevolezza e gestione complessiva dei data asset agevolando la cooperazione da parte di tutti gli interlocutori che ruotano attorno al dato stesso.

Condividi:

I Dati sono l’elemento fondamentale per supportare decisioni e azioni di business e non solo. Parafrasando Edwards Deming: “Senza dati sei solo un’altra persona con un’opinione”. Oggi, siamo nell’era del data-everywhere: nel solo 2016 sono stati generati tanti dati quanti ne sono stati prodotti durante l’intera storia dell’umanità sino all’anno precedente. Gli studiosi prevedono che tra dieci anni questa quantità raddoppierà ogni 12 ore. La qualità dei dati è quindi fondamentale, “Bad data is worse than no data”, e si riflette inevitabilmente sulla qualità di decisioni/azioni che ne conseguono ed è correlata ai rischi di trattamento dei dati stessi. 

In quale modo è possibile usufruire di questa mole di dati? Quanti di questi sappiamo navigarli, combinarli e interpretarli? Per quali abbiamo garanzie di legittimità d’uso, conformità alle normative e rispetto di principi etici? 

Data Governance in mondo “Data-Driven”

Per evitare l’accumulo compulsivo ed evitare il data-paradox, ovvero la disponibilità di una mole di dati maggiore rispetto alla capacità di gestione con relativi rischi, occorre governare i dati, per poterli trattare, combinare e azionare in modo mirato, efficace, legittimo e sostenibile. 

In un mondo data-driven i Dati stessi devono essere concepiti e gestiti come “prodotto/servizio” (“Data as a Product”) piuttosto che solo all’ambito di applicazioni/processi (“Data as a by-product”). In sostanza “Data as a Product” significa applicare l’approccio “product thinking” ai dataset, assicurandosi che abbiano una serie di funzionalità in termini di comprensibilità, fruibilità, affidabilità, security o  compliance. 

Il mantra è “the right data to the right people at the right time”. Questo significa fornire dati adeguati ai vari Data Consumer così che, in quanto owner del proprio dominio, possano sfruttarli e mixarli in modo vantaggioso, legittimo e sostenibile per le proprie specifiche finalità d’uso ed esigenze temporali. 

Ciò implica la necessità di una data-strategy & governance efficace e un approccio integrato su vari fronti: 

  • data literacy, divulgazione per diffondere consapevolezza/cultura del dato (Business Glossary & Data Catalog, Data Profiling, ecc.) 
  • data usability in modalità ibrida “umani più robot”, in base ai  principi FAIR secondo cui i dati sono Findable (identificabili/ricercabili), Accessible (disponibili/interrogabili), Interoperable (integrabili/mixabili tramite interfacce/servizi di erogazione self-service), Reusable (ri-utilizzabili con livello di qualità/affidabilità adeguata) 
  • data risk & compliance, valutazione e gestione dei livelli di sicurezza (autenticazione, anonimizzazione, retention, ecc.) e conformità alle normative (GDPR, privacy, riservatezza, copyright, Codice di Condotta, …) 
  • data platform, ecosistema tecnologico per il trattamento end-to-end del dato(vedi la Platform Vision di Cerved). 

In questo contesto la Data Governance consente di cogliere le opportunità di valore del dato facendo fronte alla complessità dei dati stessi (volumi/numerosità, eterogeneità, dinamicità, distribuzione, ecc) nel rispetto delle normative.  [vediFigura 1 – Fonte: Whitepaper by Digital4 di maggio 2021

Nell’era “data-everywhere” la Data Governance oltre che in ottica Data Economy in senso finanziario tradizionale assume importanza anche in termini etici, sociali, per impatto ambientale, ecc. 

Ecco quindi alcune definizioni di Data Governance

  • secondo Data Governance Institute è “un sistema di diritti decisionali e responsabilità per i processi relativi alle informazioni, eseguito secondo modelli concordati che descrivono chi può intraprendere quali azioni con quali informazioni e quando, in quali circostanze, utilizzando quali metodi”.  
  • secondo Gartner Glossary è “la mappatura dei diritti decisionali e del quadro di responsabilità per garantire l’adozione di comportamenti appropriato nella valutazione, produzione, consumo e controllo di dati e analisi”.  
  • secondo DAMA International “è l’esercizio dell’autorità e del controllo (pianificazione, monitoraggio e applicazione) nella gestione dei data asset”.  
Data Governance e modello organizzativo

In uno scenario complesso e distribuito (per domini e competenze) la sfida è quella di trovare il giusto equilibrio nell’organizzazione consentendo ai diversi “Data Domain” di evolversi e scalare in autonomia, garantendo al contempo che i “Data-as-a-Product” che ne risultano siano fruibili con alti gradi di interoperabilità, coerenti con gli altri domini dell’intera organizzazione e conformi con la strategia aziendale e le normative. 

Il modello organizzativo più appropriato sembra essere quello di tipo federated, in cui interagiscono le varie figure coinvolte sia come stakeholder (Data Consumer, Legal, Audit) sia come ruoli operativi, tra cui: 

  • Data Governance Function come perno/regia con visione olistica che attraverso la definizione di linee guida, standard, policy indirizza e supporta azioni/controlli coerenti e distribuiti sia rispetto ai diversi “Data Domain” sia rispetto alle diverse discipline di “Data Management”;  
  • Data Product Owner, che ha la visione end-to-end del proprio dominio dati di competenza e concepisce/gestisce il dato come “prodotto” nell’ambito dei processi di business, relazionandosi sia con gli stakeholder di business sai con i team tecnici e cross funzionali; 
  • Data Quality Function, per analisi e monitoraggio della qualità dei dati, al fine di garantire che siano adatti alle esigenze dei Data Consumer e conformi alle normative; 
  • Data Scientist, ”…specializzati nell’Innovazione e che attraverso la conoscenza di algoritmi, tecnologie abilitanti e sfruttando il patrimonio di dati a disposizione, traggono valore dai big data…” (Leggi l’articolo:  La figura del Data Scientist in Cerved); 
  • Data Engineer, “…professionista che ha il compito di progettare, realizzare e mantenere, interfacce e meccanismi per l’accesso ai dati aziendali…” (Leggi l’articolo: La figura del Data Engineer in Cerved). 
Data Governance in Cerved

In Cerved la Data Governance è mirata a definire e supportare metodologia, linee guida, policy e standard per attuare iniziative di Data Management con il massimo livello di maturità lungo le seguenti due direzioni [vedi Figura 2 – Data Governance journey in Cerved]: 

  • orizzonte “more value” per abilitare progetti di sviluppo prodotti, servizi e iniziative di innovazione basate su dati e algoritmi;  
  • orizzonte “less risk” per garantire la corretta regolamentazione in ambito dati, promuovendo trasparenza e conformità. 

In termini organizzativi il modello prevede differenti ruoli e competenze specifiche per ciascun data-domain e una funzione che fa da perno ai fini di uniformità e coerenza delle azioni collettive.  
Il framework di riferimento è quello della community internazionale DAMA, ci cui Cerved è “silver member” attraverso DAMA Italy, il capitolo italiano proprio dell’International Data Management Association. 

L’approccio adottato per le iniziative di Data Governance è di tipo: 

  • iterativo, con fasi iniziali che generano subito benefici ed evoluzioni successive per progressi incrementali;   
  • ibrido, mix tra intelligenza umana e automazione (robot) per scalare e diversificare controlli e interventi; 
  • non invasivo, in cui piuttosto che applicare in modo prescrittivo modelli e framework si declinano azioni e interventi valutandone le specificità di dominio e in modo che siano integrate e sostenibili all’interno del corrispondente processo operativo.   

Alcune delle iniziative di Data Governance (in termini di processi/metodologia, ruoli e strumenti) attuate da Cerved: 

  • Data Constellation. In ottica data literacy & democratization è il sistema di Data Glossary & Metadata Management rivolto sia ai business stakeholder che al personale tecnico. Rappresenta un dizionario comune e una bussola di orientamento tra i vari domini dati. 

Include:  

  • sezione di schede con descrizione semantica, logica di acquisizione e aggiornamento per il dominio dati in questione, link ad aree verticali di approfondimento successivo; 
  • sezione dedicata ai “KPI” (consistenze, trend storici, caratteristiche/profilo dei dataset);  
  • sezione “how-to” per navigare i dataset (modello dati, esempi di interrogazioni e result set, …); 
  • sezione “data quality”, con la descrizione del ciclo di vita di ciascun dataset, evidenziandone step/azioni di qualità e per quali finalità/dimensione.  
  • Data Rules Radar. Catalogo delle Business Rules sui dati con change management ibrido (combinazione di componente automatica più knowledge del Data Owner); 
  • Data in Motion. Sistema di monitoraggio di indicatori di Data Quality (KQI) e dei processi di Data Lineage con dashboard (di sintesi e di dettaglio) e alert/notifiche per segnalazione anomalie; 
  • Data Classification. Inventario, categorizzazione e risk assessment dei principali dataset gestiti in Cerved secondo le dimensioni di classe di riservatezza/confidenzialità, tipologia di fonte, compliance normativa (GDPR, Codice di condotta, copyright, …), misure di sicurezza applicate, complessità e dimensione archivi, policy di conservazione.