Riepilogo delle azioni

AZIONE 1

RISPETTA I PRINCIPI DELLE SEGUENTI NORMATIVE E LINEE GUIDA

D.lgs 7 marzo 2005 n. 82 e s.m.i- Il Codice dell’Amministrazione Digitale (CAD) - in particolare articoli 50 “Disponibilità dei dati delle pubbliche amministrazioni”, 52 “Accesso telematico e riutilizzo dei dati delle pubbliche amministrazioni” che introduce il principio dell’Open Data by default, e 68 comma 3 per la definizione di dato aperto.

D.lgs 24 gennaio 2006, n.36, come modificato dal D.lgs 18 maggio 2015 n. 102 - Attuazione della direttiva 2013/37/UE (che modifica la direttiva 2003/98/CE relativa al ”Riutilizzo dell’informazione del settore pubblico).

Statuto internazionale degli open data.

Linee guida europee su licenze standard e dataset raccomandati e tariffe da applicare nel riutilizzo di dati pubblici.

Piano triennale per l’informatica nella PA (2017-2019) - sezione Dati della Pubblica Amministrazione.

AZIONE 2

RICORDA E VERIFICA ART. 68 COMMA 3 DEL CAD …

  • Dato pubblico – dato conoscibile da chiunque. A seguito delle modifiche apportate con il D. Lgs. n.179/2016, il CAD non contempla più, tra le altre, la definizione di dato pubblico. Tuttavia, nel contesto delle presenti linee guida, si ritiene opportuno continuare a fare riferimento al concetto di dato pubblico come precedentemente definito.

  • Formato dei dati di tipo aperto - un formato reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi.

  • Dato aperto - un dato che risponde ai seguenti principi di base:

    1. Disponibile (requisito giuridico) secondo i termini di una licenza che ne permetta l’utilizzo da parte di chiunque, anche per finalità commerciali, in formato disaggregato;
    2. Accessibile (requisito tecnologico) attraverso le tecnologie dell’informazione e della comunicazione, in formato aperto e con i relativi metadati;
    3. Gratuito (requisito economico):
    • disponibili gratuitamente oppure
    • disponibili ai costi marginali sostenuti per la loro riproduzione, messa a disposizione e divulgazione. AgID, su proposta dell’amministrazione titolare, determina le tariffe standard e le pubblica sul proprio sito istituzionale.

    Eccezione: dati per i quali le pubbliche amministrazioni e gli organismi di diritto pubblico generano utili sufficienti per coprire una parte sostanziale dei costi di raccolta, produzione, riproduzione e diffusione. Con decreti dei Ministeri competenti, di concerto con il Ministero dell’economia e delle finanze, sentita AgID, si determinano le tariffe e le modalità di versamento a fronte delle suddette attività.

AZIONE 3

VERIFICA LA CONFORMITA” AL MODELLO PER I DATI APERTI…

Si adotta il modello qualitativo per i dati aperti sul Web, noto come modello a cinque stelle, così come rappresentato in Figura 2. In particolare, si raccomanda un percorso graduale verso la produzione nativa di Linked Open Data – LOD (livello cinque stelle), iniziando dal livello 3 di Figura 2.

Produzione e pubblicazione di dati aperti solo di livello 1 e 2 non sono più ammessi: quest’ultimi devono essere accompagnati da quelli che rispecchiano le caratteristiche dei livelli 3 e/o superiori (per esempio, rilasciare dati strutturati solo in excel con licenza aperta non è ammesso; questi devono essere sempre affiancati da dati strutturati in formato non proprietario).

AZIONE 4

CORREDA I DATI CON I RELATIVI METADATI …

La metadatazione ricopre un ruolo essenziale laddove i dati sono esposti a utenti terzi e a software. I metadati, infatti, consentono una maggiore comprensione e rappresentano la chiave attraverso cui abilitare più agevolmente la ricerca, la scoperta, l’accesso e quindi il riuso dei dati stessi. A tale scopo, si adotta il modello per i metadati rappresentato in Figura 3.

Il modello si focalizza sugli aspetti qualitativi dei metadati, è indipendente dal particolare schema proposto e, in parte, anche dal formato fisico di rappresentazione. La classificazione qualitativa dei metadati si fonda su due fattori principali: legame tra dato-metadato e livello di dettaglio.

AZIONE 5

RISPETTA IL PROFILO DI METADATAZIONE DCAT-AP_IT …

Per i metadati descrittivi generali, ovvero non dipendenti dalle tipologie di dati, si adotta il profilo nazionale DCAT-AP_IT, rispettando le obbligatorietà, le raccomandazioni e seguendo gli esempi così come definiti nella relativa specifica e ontologia.

Il profilo, disponibile secondo gli standard del Web Semantico (si veda Architettura dell’informazione del settore pubblico), si basa sullo standard DCAT e su vocabolari ampiamente utilizzati nel Web quali per esempio Dublin Core e schema.org. Il profilo si applica a tutti i tipi di dati pubblici (non solo a dati di tipo aperto), è pienamente conforme a quello europeo DCAT-AP, quest’ultimo nato al fine di uniformare la specifica dei metadati descrittivi per tutti gli stati membri europei, facilitando lo scambio di informazioni e l’interoperabilità anche transfrontaliera e favorendo il riutilizzo e la valorizzazione dell’informazione.

AZIONE 6

INDIVIDUA UNA DATA GOVERNANCE E ASSICURATI CHE I PROCESSI INTEGRINO IL RILASCIO DI DATI APERTI E IL COINVOLGIMENTO DEGLI UTENTI …

Si adotta il modello operativo mostrato in Figura 5. Il modello ha l’obiettivo di garantire la produzione e la pubblicazione di dati (aperti) di qualità attraverso un processo omogeneo, auto-sostenibile, coordinato tra gli organi interni dell’amministrazione, con la definizione di procedimenti condivisi che possano creare un tessuto sufficientemente robusto e stabile nei suoi punti fondamentali, e necessariamente elastico per l’applicazione alle diverse realtà amministrative.

Per attuare il modello è necessario (i) definire una chiara data governance interna con l’individuazione di ruoli e relative responsabilità; (ii) integrare le sue fasi sia verticalmente, rispetto ai processi interni già consolidati, che orizzontalmente rispetto alle necessità delle diverse amministrazioni. L’applicazione del modello deve avvenire in maniera costante: le attività non si esauriscono con la mera pubblicazione dei dati, ove questo sia possibile, ma devono prevedere un costante aggiornamento, monitoraggio e coinvolgimento con gli utenti finali.

AZIONE 7

DEFINISCI UNA CHIARA STRATEGIA DI COINVOLGIMENTO INTERNO ED ESTERNO

Si raccomanda alle amministrazioni di accompagnare il modello operativo con azioni di coinvolgimento degli stakeholder sia interni all’amministrazione che esterni. Il coinvolgimento interno può avvenire attraverso la diffusione della cultura dei dati di qualità e aperti, facendo comprendere l’impatto di questa diffusione anche in termini semplificativi delle procedure interne.

Il coinvolgimento esterno passa in primo luogo dall’identificazione dei soggetti da coinvolgere (e.g., studenti universitari, soggetti preposti a indagini e analisi statistiche e/o economiche, startup e aziende). In secondo luogo esso passa dalla definizione della forma di coinvolgimento, da quella più semplice della comunicazione, anche interattiva, all’individuazione di scenari d’uso affiancati da forme più strutturate di coinvolgimento quali l’organizzazione di eventi per promuovere alcune tipologie di dataset e/o per analizzare casi d’uso, hackaton e app showcase.

AZIONE 8

FACILITA IL COORDINAMENTO TRA IL LIVELLO NAZIONALE E LOCALE ATTRAVERSO GLI OPEN DATA …

Diverse pubbliche amministrazioni centrali, al fine di adempiere a specifici obblighi normativi a loro assegnati o per dar seguito a impegni presi in iniziative internazionali (e.g., Open Government Partnership), hanno necessità di raccogliere dati provenienti dal livello di governo locale (e.g., SIOPE per la rilevazione telematica degli incassi e dei pagamenti di tutte le amministrazioni, ISTAT per le rilevazioni relative ai censimenti o ai numeri civici, Dipartimento della Protezione Civile che opera quasi esclusivamente sulla base di tale modello). In queste situazioni, si raccomanda alle amministrazioni di coordinarsi tra loro prima di intraprendere iniziative singole isolate. In particolare, le amministrazioni centrali possono assumere un ruolo di coordinatore e di promotore di apertura dei dati secondo i livelli più alti del modello per i dati aperti proposto dalle presenti linee guida, definendo anche schemi comuni secondo quanto descritto in “Architettura dell’informazione del settore pubblico”.

Si raccomanda poi di mantenere il colloquio, mediante scambio di dati, tra il livello centrale e locale attraverso l’uso dei dati aperti stessi, ove presenti, automatizzando quanto più possibile il processo di acquisizione da parte del livello centrale.

AZIONE 9

GARANTISCI LE SEGUENTI DIMENSIONI DI QUALITA” DEI DATI …

Partendo dalle quattro caratteristiche, delle 15 previste dall’ISO/IEC 25012, individuate nella Determinazione Commissariale n. 68/2013 dell’AgID per le banche dati di interesse nazionale critiche, si garantisce il loro costante rispetto in tutto il processo di gestione e pubblicazione dei dati anche aperti. Queste quattro caratteristiche sono:

  • accuratezza (sintattica e semantica) - il dato, e i suoi attributi, rappresenta correttamente il valore reale del concetto o evento cui si riferisce;
  • coerenza - il dato, e i suoi attributi, non presenta contraddittorietà rispetto ad altri dati del contesto d’uso dell’amministrazione titolare;
  • completezza – il dato risulta esaustivo per tutti i suoi valori attesi e rispetto alle entità relative (fonti) che concorrono alla definizione del procedimento;
  • attualità (o tempestività di aggiornamento) - il dato, e i suoi attributi, è del “giusto tempo” (è aggiornato) rispetto al procedimento cui si riferisce.

AZIONE 10

RISPETTA L’ARCHITETTURA DELL’INFORMAZIONE DEL SETTORE PUBBLICO CON I RELATIVI STANDARD, FORMATI E VOCABOLARI…

Si adotta l’architettura dell’informazione del settore pubblico come mostrata in Figura 6. Per tutti i dati di riferimento e “core”, si raccomanda di non ridefinire degli schemi o modelli per i dati ma di riutilizzare quelli dell’architettura nazionale dell’informazione del settore pubblico, in larga parte allineati (collegati) a standard aperti del Web e disponibili in formati aperti standard.

Questa raccomandazione si applica anche ai dati di domini verticali, dove, in alcuni casi, soprattutto per quelli riferibili alle base di dati chiave, ontologie/modelli per i dati saranno definiti e utilizzati nella rappresentazione delle basi di dati stesse.

AZIONE 11

SELEZIONA I FORMATI CHE MEGLIO SI ADATTANO AL CONTENUTO E AI DATI DA CONDIVIDERE E RILASCIARE …

Si adottano formati aperti senza assumere che gli utenti possano leggere formati proprietari. Nel caso inevitabile di rilascio in formati proprietari, è necessario assicurare la disponibilità anche di un’alternativa non proprietaria. È necessario evitare di utilizzare un formato per dati non strutturati (e.g., PDF) in presenza di dati strutturati (e.g., è da evitare la pubblicazione di tabelle di tassi di assenza in PDF, privilegiando un formato come il CSV).

Si raccomanda inoltre, nel rilasciare i dati secondo i formati sotto riportati, di specificare la codifica dei caratteri privilegiando, ove possibile, UTF 8. Infine, nel caso di rilascio programmato di dati, è da evitare l’uso di formati per dati non strutturati, privilegiando formati “machine-readable”.

AZIONE 12

ASSICURATI DI ASSEGNARE UNA LICENZA AI DATASET…

L’informazione sul tipo di licenza è metadato indispensabile per determinare come poter riutilizzare il dataset. Deve pertanto essere sempre specificata indicando, il nome, la versione e fornendo il riferimento al testo della licenza.

Nel contesto dei dati aperti, considerando la definizione Open Data fornita dal CAD e dall’Open Knowledge Foundation (OKFN), per cui un dato è aperto se è “liberamente usabile, riutilizzabile e ridistribuibile da chiunque per qualsiasi scopo, soggetto al massimo alla richiesta di attribuzione e condivisione allo stesso modo, le sole licenze ammesse per abilitare l’effettivo paradigma dell’Open Data sono classificate come mostrato in Figura 6.

Come evidenziato in Figura 6, tutte le licenze che non consentono lavori derivati, anche per finalità commerciali, i.e., licenze che riportano chiaramente clausole Non Commercial - NC e/o Non Derivative – ND e/o ogni altra clausola che limita la possibilità di riutilizzo e ridistribuzione dei dati, non possono essere ritenute valide per identificare dataset aperti.

AZIONE 13

DEFINISCI GLI ASPETTI DI COSTO PER I DATI …

Premesse le azioni di condivisione dei dati tra pubbliche amministrazioni per finalità istituzionali (art. 50 del CAD), che avvengono esclusivamente a titolo gratuito, nel caso dell’Open Data si suggerisce azioni volte a renderli disponibili esclusivamente a titolo gratuito.

Tuttavia, è prevista la possibilità di richiedere per il riutilizzo dei dati un corrispettivo specifico, limitato ai costi sostenuti effettivamente per la riproduzione, messa a disposizione e divulgazione dei dati. In tali casi, come previsto dall’art. 7 del D.Lgs 24 gennaio 2006, n. 36, AgID determina, su proposta motivata del titolare del dato, le tariffe standard da applicare, pubblicandole sul proprio sito istituzionale. Nel pieno rispetto dei principi di trasparenza e verificabilità, tali tariffe sono determinate sulla base del “Metodo dei costi marginali” esplicitato nella Comunicazione della Commissione 2014/C - 240/01 contenente, tra gli altri, gli orientamenti sulla tariffazione.

AZIONE 14

PUBBLICA I DATI MA SOLO DOPO AVER COMPLETATO LE AZIONI PRECEDENTI…

Prima di pubblicare i dati, assicurati di aver completato queste azioni precedenti e quindi:

  • AZIONE 1 e AZIONE 2 : di aver chiari i principi delle normative in materia di dati pubblici e loro riutilizzo;
  • AZIONE 3 e AZIONE 4: di aver compreso e selezionato il livello più appropriato del modello per i dati e i metadati , tenendo conto che il requisito minimo per i dati è il livello 3;
  • AZIONE 6 – censimento: di aver identificato nel censimento dei dati la domanda e l’impatto sociale ed economico che possono e riescono a generare;
  • AZIONE 6 – analisi giuridica delle fonti: di aver verificato eventuali limitazioni giuridiche (proprietà dei dati, privacy, ecc.);
  • AZIONE 5: di aver predisposto i metadati secondo il profilo DCAT-AP_IT;
  • AZIONE 9: di aver pianificato le attività in modo da mantenere i dati costantemente aggiornati e da garantire altri aspetti di qualità (i.e.., completezza, accuratezza, coerenza);
  • AZIONE 10: di aver descritto i dati di riferimento e «core» secondo i modelli indicati nell’architettura di riferimento per l’informazione del settore pubblico;
  • AZIONE 11: di aver predisposto i dati con almeno un formato aperto machine-readable;
  • AZIONE 12: di aver assegnato una licenza aperta, possibilmente quella raccomandata dalle presenti linee guida (CC-BY 4.0).

Durante la fase di pubblicazione è necessario garantire agli utenti la possibilità di ottenere i dati in bulk, ovvero fornirli in blocco in un file o insieme di file, senza richiedere credenziali di accesso (a meno di farlo per mere iniziative conoscitive dell’utenza che dovranno essere comunque esplicitate, dando all’utente la possibilità di rifiutare e/o rimanere anonimo), e di interrogare il dato mediante la messa a disposizione di API (Application Programming Interface) che possono essere usate anche per acquisire piccole porzioni dei dati. Nel caso di pubblicazione di LOD è necessario garantire che gli URI dei dati siano persistenti e deferenziabili e che uno SPARQL endpoint sia presente per abilitare funzioni di interrogazione. Infine, assicurati di documentare i dati pubblicati in dati.gov.it (AZIONE 15).

AZIONE 15

ASSICURATI CHE I METADATI RELATIVI AI TUOI DATASET SIANO PRESENTI NEL PORTALE NAZIONALE DEI DATI …

Ai sensi dell’articolo 1 comma 8 del D.Lgs. 18 Maggio 2015, n.102, il portale nazionale dei dati aperti (dati.gov.it) è l’unico riferimento per la documentazione e la ricerca di tutti i dati aperti della pubblica amministrazione. Esso, inoltre, è l’unico ad abilitare il colloquio con l’analogo portale europeo .

Il portale nazionale dei dati aperti include i metadati, conformi al profilo DCAT-AP_IT, che descrivono i dati aperti delle amministrazioni. Le amministrazioni sono tenute pertanto a inserire e a mantenere aggiornati, attraverso le modalità di alimentazione previste dal catalogo, tali metadati. I dati primari, il cui riferimento è pubblicato sul portale nazionale, rimangono presso il titolare del dato che conserva la responsabilità della loro divulgazione a livello nazionale. Come già precedentemente riportato, i dati geografici devono essere documentati esclusivamente presso il Repertorio Nazionale dei Dati Territoriali (RNDT) che, in maniera automatizzata, si occupa dell’allineamento con il portale nazionale dei dati.