Tabella vs. Linked Data
Per imparare a usare Wikidata Query Service, si deve prima capire la struttura di Wikidata, cioè come si presenta un database di dati collegati.
In questo tutorial, molti esempi saranno basati sui dati presenti nella seguente tabella:
ID elemento | Titolo | Regista | Durata | Incasso al Box office (in $) |
wd:Q17738 | Guerre stellari: Episodio IV: Una nuova speranza | George Lucas | 121 | 775398007 |
wd:Q181795 | Guerre stellari: Episodio V: L’Impero colpisce ancora | Irvin Kershner | 124 | 538400000 |
wd:Q181803 | Guerre stellari: Episodio VI: Il ritorno dello Jedi | Richard Marquand | 134 | 475100000 |
wd:Q165713 | Guerre stellari: Episodio I – La minaccia fantasma | George Lucas | 136 | 1027044677 |
wd:Q181069 | Guerre stellari: Episodio II: L’attacco dei cloni | George Lucas | 142 | 649398328 |
wd:Q42051 | Guerre stellari: Episodio III – La vendetta dei Sith | George Lucas | 140 | 848800000 |
wd:Q6074 | Guerre stellari: Il risveglio della Forza | J. J. Abrams | 135 | 2068223624 |
wd:Q18486021 | Guerre stellari: Gli ultimi Jedi | Rian Johnson | 152 | 1332539889 |
wd:Q20977110 | Guerre stellari: L’ascesa di Skywalker | J. J. Abrams | 141 | 851058441 |
Questo è un piccolo set di dati che descrivono in dettaglio alcune informazioni sui film della serie “Guerre stellari” Per ogni film vengono mostrati alcuni attributi o proprietà: il titolo del film, il suo regista, la sua durata (in minuti) e l’incasso al botteghino accumulato dal film (in dollari). Se hai familiarità con Excel o SQL, questo modo di presentare i dati dovrebbe sembrarti familiare. Tuttavia, Wikidata non è un database basato su tabelle, come quello sopra, ma piuttosto ha un formato “Linked Data”. Cosa significa?
In un modello di dati collegati (linked data), i dati nella prima riga della tabella sopra sarebbero rappresentati come:
Wikidata, che utilizza il formato dei linked data, memorizza le informazioni sotto forma di dichiarazioni. Le dichiarazioni, formalmente note come triple “soggetto, predicato, oggetto”, hanno una struttura Oggetto-Proprietà-Valore.
Ad esempio, l’affermazione “Il cielo ha il colore blu” consiste in:
(1) un soggetto (“il cielo”)
(2) un predicato (“ha il colore”)
(3) un oggetto (“blu”).
Allo stesso modo, l’affermazione “Guerre stellari Episodio IV: Una nuova speranza è stato diretto da George Lucas” consiste in (1) un soggetto / oggetto “Guerre stellari Episodio IV: Una nuova speranza”, (2) un predicato / proprietà “è stato diretto da “, e (3) un oggetto / valore “George Lucas”.
Puoi pensare a ciascuna riga nella tabella dati di sopra come un elemento, le intestazioni delle colonne come nomi di proprietà e le celle di dati come valori della proprietà.
Quindi, un altro modo per descrivere questi dati è attraverso le dichiarazioni. Ad esempio, per l’elemento nella prima riga della tabella, i dati possono essere descritti con le istruzioni:
Elemento (item) | Proprietà | Valore |
Q17738 | titolo | Guerre stellari Episodio IV: Una nuova speranza |
Q17738 | regista | George Lucas |
Q17738 | durata | 121 minutes |
Q17738 | incasso | 775398007 |
Le dichiarazioni descrivono le caratteristiche dettagliate di un oggetto e sono costituite da coppie proprietà-valore, come “regista: George Lucas” o “durata: 121 minuti”.
Le proprietà in Wikidata hanno una P seguita da un numero. Ad esempio, la proprietà “regista” è P57.
Il valore di questa proprietà per l’elemento Q17738 (Guerre stellari Episodio IV: Una nuova speranza) è George Lucas, che è anche un oggetto – Q38222.
Non tutti i valori sono anche elementi. Ad esempio, il valore della proprietà “durata” (P2047) per l’item Q17738 è 121 minuti.
Alcune proprietà potrebbero avere valori che non sono elementi. Come indicato, ad esempio, il valore della proprietà “durata” (P2047) per l’articolo Q17738 è “121 minuti”, che è una quantità. Il valore di “data di pubblicazione” (P577) negli Stati Uniti è “25 maggio 1977”, una data. Altri tipi di dati utilizzati di frequente sono le stringhe (una catena di caratteri, come testi o codici), coordinate geografiche e testi monolingua (una stringa che non viene tradotta in altre lingue). Wikidata ha attualmente 27 diversi tipi di dati e puoi trovare maggiori informazioni su di essi qui.