La struttura di Wikidata

Tabella vs. Linked Data 

Per imparare a usare Wikidata Query Service, si deve prima capire la struttura di Wikidata, cioè come si presenta un database di dati collegati.

In questo tutorial, molti esempi saranno basati sui dati presenti nella seguente tabella:

ID elemento TitoloRegistaDurataIncasso al Box office (in $)
wd:Q17738
Guerre stellari: Episodio IV: Una nuova speranza
George Lucas121775398007
wd:Q181795 Guerre stellari: Episodio V: L’Impero colpisce ancoraIrvin Kershner124538400000
wd:Q181803 Guerre stellari: Episodio VI: Il ritorno dello JediRichard Marquand134475100000
wd:Q165713 Guerre stellari: Episodio I – La minaccia fantasmaGeorge Lucas1361027044677
wd:Q181069 Guerre stellari: Episodio II: L’attacco dei cloniGeorge Lucas142649398328
wd:Q42051 Guerre stellari: Episodio III – La vendetta dei SithGeorge Lucas140848800000
wd:Q6074 Guerre stellari: Il risveglio della ForzaJ. J. Abrams1352068223624
wd:Q18486021 Guerre stellari: Gli ultimi JediRian Johnson1521332539889
wd:Q20977110 Guerre stellari: L’ascesa di SkywalkerJ. J. Abrams 141 851058441

Questo è un piccolo set di dati che descrivono in dettaglio alcune informazioni sui film della serie “Guerre stellari” Per ogni film vengono mostrati alcuni attributi o proprietà: il titolo del film, il suo regista, la sua durata (in minuti) e l’incasso al botteghino accumulato dal film (in dollari). Se hai familiarità con Excel o SQL, questo modo di presentare i dati dovrebbe sembrarti familiare. Tuttavia, Wikidata non è un database basato su tabelle, come quello sopra, ma piuttosto ha un formato “Linked Data”. Cosa significa?

In un modello di dati collegati (linked data), i dati nella prima riga della tabella sopra sarebbero rappresentati come:

Wikidata, che utilizza il formato dei linked data, memorizza le informazioni sotto forma di dichiarazioni. Le dichiarazioni, formalmente note come triple “soggetto, predicato, oggetto”, hanno una struttura Oggetto-Proprietà-Valore.

Ad esempio, l’affermazione “Il cielo ha il colore blu” consiste in:
(1) un soggetto (“il cielo”)
(2) un predicato (“ha il colore”)
(3) un oggetto (“blu”).
Allo stesso modo, l’affermazione “Guerre stellari Episodio IV: Una nuova speranza è stato diretto da George Lucas” consiste in (1) un soggetto / oggetto “Guerre stellari Episodio IV: Una nuova speranza”, (2) un predicato / proprietà “è stato diretto da “, e (3) un oggetto / valore “George Lucas”.

Puoi pensare a ciascuna riga nella tabella dati di sopra come un elemento, le intestazioni delle colonne come nomi di proprietà e le celle di dati come valori della proprietà.

Quindi, un altro modo per descrivere questi dati è attraverso le dichiarazioni. Ad esempio, per l’elemento nella prima riga della tabella, i dati possono essere descritti con le istruzioni:

Elemento (item)ProprietàValore
Q17738titoloGuerre stellari Episodio IV: Una nuova speranza
Q17738 registaGeorge Lucas
Q17738 durata121 minutes
Q17738 incasso775398007

Le dichiarazioni descrivono le caratteristiche dettagliate di un oggetto e sono costituite da coppie proprietà-valore, come “regista: George Lucas” o “durata: 121 minuti”.
Le proprietà in Wikidata hanno una P seguita da un numero. Ad esempio, la proprietà “regista” è P57.
Il valore di questa proprietà per l’elemento Q17738 (Guerre stellari Episodio IV: Una nuova speranza) è George Lucas, che è anche un oggetto – Q38222.
Non tutti i valori sono anche elementi. Ad esempio, il valore della proprietà “durata” (P2047) per l’item Q17738 è 121 minuti.

Alcune proprietà potrebbero avere valori che non sono elementi. Come indicato, ad esempio, il valore della proprietà “durata” (P2047) per l’articolo Q17738 è “121 minuti”, che è una quantità. Il valore di “data di pubblicazione” (P577) negli Stati Uniti è “25 maggio 1977”, una data. Altri tipi di dati utilizzati di frequente sono le stringhe (una catena di caratteri, come testi o codici), coordinate geografiche e testi monolingua (una stringa che non viene tradotta in altre lingue). Wikidata ha attualmente 27 diversi tipi di dati e puoi trovare maggiori informazioni su di essi qui.

Introduzione a Wikidata

Che cos’è Wikidata?

Wikidata è il progetto internazionale di Wikimedia, che mira ad essere il più grande database gratuito, proprio come Wikipedia è diventata la fonte di conoscenza più popolare al mondo.

Wikidata è un database di conoscenze gratuita e aperta che può essere letta e modificata sia da esseri umani che da macchine. Wikidata funge da archivio centrale per i dati strutturati dei suoi progetti fratelli Wikimedia, inclusi Wikipedia, Wikivoyage, Wiktionary, Wikisource e altri.

Oltre ai semplici progetti Wikimedia, Wikidata fornisce anche supporto a molti altri siti e servizi! Il contenuto di Wikidata è disponibile con una licenza gratuita, esportato utilizzando formati standard e può essere collegato ad altri set di dati aperti sul web dei dati collegati.

Wikidata/i linked data spiegati

Wikidata è un archivio centralizzato costituito principalmente da elementi (oggetti o item). Un elemento è una cosa, un’entità, un concetto. Può essere un oggetto, una persona, un evento, un luogo, un’opera d’arte, ma anche concetti più astratti come l’amore o il socialismo. Gli elementi sono identificati in modo univoco da una Q seguita da un numero.

Ad esempio, l’elemento Q17738 rappresenta il film del 1977 “Guerre stellari”. Ogni elemento ha anche un’etichetta, che è la denominazione principale assegnatale in una particolare lingua. Ciò consente di tradurre le informazioni di base necessarie per identificare l’argomento trattato dall’elemento senza privilegiare alcuna lingua.

Le etichette degli elementi non devono essere univoche. Ad esempio, Guerre stellari (Q462) rappresenta la serie di film e il franchise multimediale di Guerre stellari, mentre Guerre stellari (Q54317) rappresenta il videogioco del 1983. La descrizione in un elemento di Wikidata è una breve frase progettata per disambiguare elementi con etichette uguali o simili. Una descrizione non deve essere univoca; più elementi possono avere la stessa descrizione, tuttavia due elementi non possono avere sia la stessa etichetta che la stessa descrizione.

Skip to content