Attraverso la Data Governance è possibile avere consapevolezza e gestione complessiva dei data asset agevolando la cooperazione da parte di tutti gli interlocutori che ruotano attorno al dato stesso.
I Dati sono l’elemento fondamentale per supportare decisioni e azioni di business e non solo. Parafrasando Edwards Deming: “Senza dati sei solo un’altra persona con un’opinione”. Oggi, siamo nell’era del data-everywhere: nel solo 2016 sono stati generati tanti dati quanti ne sono stati prodotti durante l’intera storia dell’umanità sino all’anno precedente. Gli studiosi prevedono che tra dieci anni questa quantità raddoppierà ogni 12 ore. La qualità dei dati è quindi fondamentale, “Bad data is worse than no data”, e si riflette inevitabilmente sulla qualità di decisioni/azioni che ne conseguono ed è correlata ai rischi di trattamento dei dati stessi.
In quale modo è possibile usufruire di questa mole di dati? Quanti di questi sappiamo navigarli, combinarli e interpretarli? Per quali abbiamo garanzie di legittimità d’uso, conformità alle normative e rispetto di principi etici?
Per evitare l’accumulo compulsivo ed evitare il data-paradox, ovvero la disponibilità di una mole di dati maggiore rispetto alla capacità di gestione con relativi rischi, occorre governare i dati, per poterli trattare, combinare e azionare in modo mirato, efficace, legittimo e sostenibile.
In un mondo data-driven i Dati stessi devono essere concepiti e gestiti come “prodotto/servizio” (“Data as a Product”) piuttosto che solo all’ambito di applicazioni/processi (“Data as a by-product”). In sostanza “Data as a Product” significa applicare l’approccio “product thinking” ai dataset, assicurandosi che abbiano una serie di funzionalità in termini di comprensibilità, fruibilità, affidabilità, security o compliance.
Il mantra è “the right data to the right people at the right time”. Questo significa fornire dati adeguati ai vari Data Consumer così che, in quanto owner del proprio dominio, possano sfruttarli e mixarli in modo vantaggioso, legittimo e sostenibile per le proprie specifiche finalità d’uso ed esigenze temporali.
Ciò implica la necessità di una data-strategy & governance efficace e un approccio integrato su vari fronti:
In questo contesto la Data Governance consente di cogliere le opportunità di valore del dato facendo fronte alla complessità dei dati stessi (volumi/numerosità, eterogeneità, dinamicità, distribuzione, ecc) nel rispetto delle normative. [vediFigura 1 – Fonte: Whitepaper by Digital4 di maggio 2021]
Figura 1 – Fonte: Whitepaper by Digital4 di maggio 2021
Ecco quindi alcune definizioni di Data Governance:
In uno scenario complesso e distribuito (per domini e competenze) la sfida è quella di trovare il giusto equilibrio nell’organizzazione consentendo ai diversi “Data Domain” di evolversi e scalare in autonomia, garantendo al contempo che i “Data-as-a-Product” che ne risultano siano fruibili con alti gradi di interoperabilità, coerenti con gli altri domini dell’intera organizzazione e conformi con la strategia aziendale e le normative.
Il modello organizzativo più appropriato sembra essere quello di tipo federated, in cui interagiscono le varie figure coinvolte sia come stakeholder (Data Consumer, Legal, Audit) sia come ruoli operativi, tra cui:
Figura 2 – Data Governance journey in Cerved
In Cerved la Data Governance è mirata a definire e supportare metodologia, linee guida, policy e standard per attuare iniziative di Data Management con il massimo livello di maturità lungo le seguenti due direzioni [vedi Figura 2 – Data Governance journey in Cerved]:
In termini organizzativi il modello prevede differenti ruoli e competenze specifiche per ciascun data-domain e una funzione che fa da perno ai fini di uniformità e coerenza delle azioni collettive.
Il framework di riferimento è quello della community internazionale DAMA, ci cui Cerved è “silver member” attraverso DAMA Italy, il capitolo italiano proprio dell’International Data Management Association.
L’approccio adottato per le iniziative di Data Governance è di tipo:
Alcune delle iniziative di Data Governance (in termini di processi/metodologia, ruoli e strumenti) attuate da Cerved:
Include:
- sezione di schede con descrizione semantica, logica di acquisizione e aggiornamento per il dominio dati in questione, link ad aree verticali di approfondimento successivo;
- sezione dedicata ai “KPI” (consistenze, trend storici, caratteristiche/profilo dei dataset);
- sezione “how-to” per navigare i dataset (modello dati, esempi di interrogazioni e result set, …);
- sezione “data quality”, con la descrizione del ciclo di vita di ciascun dataset, evidenziandone step/azioni di qualità e per quali finalità/dimensione.