Processo di caricamento dati sul portale DataRep

Il processo da seguire per pubblicare dataset sul repository DataRep coinvolge due entità: il Metadata Editor ed il DataRep, ed è descritto per linee generali nella seguente figura e nei seguenti punti:

_images/1.png
Utente
  • carica il dataset nel proprio spazio su Google Drive

  • crea la scheda descrittiva

    • compila i metadati

    • seleziona i file da pubblicare

  • richiede la validazione della scheda

Ufficio Gestione Dati (UGD)
  • procede alla validazione della scheda

  • verifica se assegnare il DOI

  • pubblica su DataRep

Caricamento del dataset sullo spazio Google Drive personale

Inizialmente l’utente carica il dataset all’interno di uno spazio dati personale e privato sul cloud di Google Drive.

I passi necessari sono illustrati nelle seguenti figure.

Tramite il proprio spazio personale istituzionale sul Google Drive, l’utente carica il dataset da pubblicare sul portale DataRep.

_images/2.png

Successivamente l’utente rende accessibili gli stessi files del dataset mediante la funzionalità «Ottieni link» o «Get link».

_images/3.png

È necessario selezionare l’opzione «Chiunque abbia il link» o «Anyone with the link» generando univocamente un link per ciascun file che sarà utilizzato dal Metadata Manager per l’operazione di upload su DataRep.

_images/4.png

Un dataset può essere composto da uno o più file a cui corrisponderanno di conseguenza più link.

È consigliato archiviare in un unico file di tipo zip o tar, rar i differenti file , così da creare un unico link di condivisione.

Crezione della scheda descrittiva dal Metadata Editor

Ottenuto il link di condivisione, l’utente si autentica sul portale del Metadata Editor utilizzando il proprio account istituzionale (nome.cognome@ingv.it come per l’accesso alla posta elettronica) al fine di creare una scheda descrittiva del dataset:

  1. Il primo passo consiste nella creazione di una nuova scheda descrittiva in bozza - Drafts, scegliendo se iniziare da una scheda vuota o dalla copia di una scheda già esistente da completare;

  2. A questo punto il sistema consente di inizializzare una nuova bozza, permettendo all’utente di scegliere se creare un nuovo record che descrive il dataset, a cui: a) non è ancora stato assegnato nessun DOI, b) è già stato assegnato un DOI.

_images/5.png
  1. Il web-form verrà mostrato all’utente come un’anteprima e sarà compilabile solo in parte in quanto la scheda vera e propria non verrà creata nel sistema fino a quanto l’utente non avrà cliccato il bottone «Create» in fondo alla scheda.

Compilazione dei Metadati

Scelta la modalità di creazione del nuovo record (paragrafo precedente), il sistema mostrerà un web-form con diversi campi da compilare che costituiscono i metadati caratteristici di una pubblicazione scientifica.

Solo dopo aver cliccato il bottone «Create» in fondo alla pagina la scheda sarà creata nel sistema e sarà editabile in ogni sua parte.

Quando la scheda viene creata sarà inserita nel metadata editor sotto forma di bozza (draft) e sarà considerata tale fino alla fine del processo di validazione, processo che verrà avviato dall’utente quando avrà terminato la

compilazione della scheda.

L’utente descriverà il dataset compilando esaustivamente quanti più campi possibili tra quelli disponibili come nella scheda di esempio della seguente figura.

_images/6.png

Nota

In particolare, il campo “Landing page” non deve essere compilato, perché questa informazione verrà restituita automaticamente dalla logica del portale DataRep non appena, verrà fatta richiesta di pubblicazione.

Nella compilazione della scheda, dovranno essere indicati anche un referente scientifico e uno tecnologico (le due figure possono coincidere). I referenti andranno indicati nella sezione dei metadati denominata “Info specific to INGV”. Oltre ai metadati obbligatori, evidenziati in blu nella scheda (Fig. sopra), si suggerisce di compilare anche informazioni utili come la copertura temporale, geografica e soprattutto eventuali relazioni con altri dati o pubblicazioni nell’apposita sezione “Relations to other data and publications”.

Infine, è anche possibile caricare un’immagine di copertina in fondo al web-form alla scritta “upload a cover image file”.

_images/16.png

Durante la compilazione dei campi è possibile verificarne la correttezza in ogni momento agendo sul bottone “Check if this record can be validated”, posizionato in alto sulla form di caricamento dei metadati.

_images/12.png

Se il processo rileva errori o campi obbligatori non compilati, tutte le anomalie saranno dettagliatamente elencate dal Metadata Editor e l’utente potrà procedere alla loro risoluzione.

_images/13.png

Si consiglia di salvare frequentemente le modifiche durante la compilazione cliccando sul bottone "Save" in fondo alla scheda per evitare il rischio di perdere informazioni già inserite. La scheda può essere compilata a più riprese sia da parte dal referente scientifico che dal referente tecnologico, ma non nello stesso istante.

Se è necessario permettere ad altre persone di editare la scheda, queste possono essere aggiunte dai referenti nella sezione ``Additional users allowed to update

metadata of this record`` nella sezione di metadati “Info specific to INGV”.

Quando la compilazione della bozza della scheda sarà ultimata e il sistema di verifica automatico non rileverà più errori, l’utente potrà avviare il processo di validazione cliccando sul bottone “Start the validation process” all’inizio della scheda.

Selezione dell’elenco di file da pubblicare

A questo punto l’utente aggiunge l’elenco dei file da caricare su DataRep:

Il Metadata Editor mostrerà le funzioni di caricamento sul portale DataRep quando le due condizioni seguenti saranno soddisfatte:

  1. Il dataset deve essere dichiarato statico nella sezione di metadati “Details about data”. Se necessario, in futuro sarà possibile pubblicare nuove revisioni, pubblicando un nuovo dataset seguendo la stessa procedura con l’accortezza di indicare la relazione con la versione precedente nella sezione di metadati “Relations to other data and publications”. Nell’immagine in basso un esempio di selezione del tipo in statico.

_images/7.png

Nota

Con statico si intende che il dataset non verrà più aggiornato dopo la sua pubblicazione.

  1. Almeno una persona elencata tra i “Main authors” della sezione di metadati “Data producers” deve essere affiliata all’Osservatorio Etneo.

_images/8.png

Le funzioni per caricare dati su DataRep saranno mostrate solo dopo che l’elenco degli autori sarà compilato.

E’ possibile verificare in ogni momento le affiliazioni di ciascun autore cliccando sul bottone Check affiliations sotto l’elenco degli autori.

_images/14.png

Ciascun autore affiliato all’INGV può aggiornare direttamente le proprie informazioni (affiliazione compresa) modificando il proprio profilo nella sezione “People” del Metadata Editor. Le modifiche apportate ai profili personali saranno monitorate.

A questo punto è possibile procedere alla selezione dei file da pubblicare su DataRep che erano precedentemente stati caricati sul Google Drive. Per fare ciò:

  1. espandere la sezione “Data Access and Distribution” di metadati;

  2. selezionare Osservatorio Etneo Open Data Repository nel campo “Target Repository where data will be uploaded”;

_images/10.png
  1. cliccare il bottone “Modify the list”, per aprire la maschera di selezione dei files da Google Drive;

  2. inserire i link, generati come visto nel paragrafo like Caricamento del dataset sullo spazio Google Drive personale, a ciascun file

_images/9.png
  1. per verificare che i dati siano caricabili su DataRep cliccare sul bottone “Check Google Drive files”, la spunta verde in corrispndenza della colonna Check indica che sarà possibile procedere al caricamento;

_images/11.png
  1. infine cliccare sul bottone SAVE in fondo alla scheda per salvare la Bozza creata.

Validazione della scheda e assegnazione del DOI (Ufficio Gestione Dati)

Quando la compilazione della scheda sarà completata si potrà procedere alla validazione cliccando sul bottone “Start the validation process”.

Avvertimento

in caso di problemi, l’Ufficio Gestione Dati si occuperà di contattare l’utente per eventuali correzioni o integrazioni.

La figura seguente mostra gli stati di avanzamento del processo di validazione.

_images/15.png

La validazione potrebbe arrivare fino a tre gradi di approvazione a seconda delle caratteristiche del dataset e degli autori indicati:

  • il primo grado di validazione è in capo all’Ufficio Gestione Dati, nello specifico il coordinatore e un referente per ciascuno dei Dipartimenti indicati;

  • il secondo grado è in capo ai Direttori delle Sezioni coinvolte identificate automaticamente dal Metadata Editor in base alle affiliazioni disponibili nella sezione “People” corrispondenti agli autori elencati;

  • il terzo grado di validazione è in capo ai Direttori dei Dipartimenti indicati in “INGV Department” nella sezione di metadati “Info specific to INGV”.

Nota

se il dataset è una nuova versione di un dataset già validato e pubblicato in precedenza, si attiverà automaticamente solo il primo grado di validazione.

Pubblicazione sul portale DataRep

L’ultimo step, nel processo di upload di un dataset sul portale DataRep, è demandato ai responsabili dell’Ufficio Gestione Dati. L’interfaccia web del Metadata Editor, per queste figure, mette a disposizione due bottoni, mostrati nella figura sottostante.

  • Il bottone "Upload a draft" caricherà su DataRep una bozza della scheda, contenente dati e metadati senza rendere la landing-page pubblicamente accessibile.

  • Il bottone "Upload and publish or edit an already published record", caricherà su DataRep la scheda contenente dati e metadati e pubblicherà automaticamente la landing-page.

_images/17.png

La landing-page creata dal Portale DataRep è mostrata nella figura sotto

_images/18.png

In particolare è possibile notare come la pagina creata conterrà:

  • un estratto dei metadati inseriti sul Metadata Editor,

  • il DOI assegnato alla pubblicazione,

  • il dataset,

  • la possibilità di esportare i metadati nei diversi formati supportati dal portale.

Una email notifica gli amministratori del portale che una nuova pubblicazione è stata effettuata ed è disponibile; sarà loro compito accettarla per renderla visibile tra i contenuti recenti visualizzati nella home-page di DataRep.

_images/19.png