Proprietà P31 – “istanza di”
La maggior parte delle proprietà di Wikidata descrivono le caratteristiche di un oggetto: l’oggetto per Guerre stellari Episodio IV: Una nuova speranza (Q17738) ha la proprietà direttore (P57), ha una certa durata (P2047), ha il costo di produzione (P2130), e così via. Ma spesso siamo interessati a cos’è una cosa. La maggior parte degli elementi di Wikidata ha almeno un’istruzione con la proprietà P31 – istanza di – che ci dice la classe di cui questo item è un particolare esempio e membro:
- Guerre stellari Episodio IV: Una nuova speranza (Q17738) è un’istanza di un film (Q11424).
- Guerre stellari (Q22092344) è un’istanza di una serie di film (Q24856).
- Guerre stellari (Q462) è un’istanza di un franchise multimediale (Q196600).
Da notare che un articolo non è limitato ad un’istruzione P31. Per esempio, Guerre stellari: Episodio VIII – L’Ultimo Jedi (Q18486021) è un’istanza di un film (Q11424) e anche un’istanza di un film 3D (Q229390).
Si noti inoltre che le dichiarazioni P31 mirano a fare le distinzioni più generali e relegare altri dati ad altre proprietà:
George Lucas (Q38222) è un’istanza di umano (Q5).
Potremmo anche affermare che George Lucas è un esempio di regista (Q2526255), perché Lucas è ovviamente un esempio e un membro della classe dei registi. Tuttavia, la strategia di classificazione consiste nell’impostare l’istruzione “istanza di” sul valore più generale e includere informazioni più specifiche con altre proprietà. Ad esempio, che Lucas sia un regista cinematografico viene fornito con una dichiarazione utilizzando la proprietà dell’occupazione (P106).
Proprietà P279 – “sottoclasse di”
Quindi, mentre Q17738 (Star Wars: Episodio IV – Una nuova speranza) rappresenta un film particolare, ha un regista particolare (George Lucas), una durata specifica (121 minuti), un elenco di membri del cast (Carrie Fisher, Harrison Ford, … ), e così via – il film item (Q11424) è un concetto generale. I film possono avere registi, durate e membri del cast, ma il concetto generale di “film” non ha alcun regista, durata o membri del cast particolari.
I concetti generali ricevono la proprietà della sottoclasse (P279) e possono averne più di una. Per esempio:
- Film (Q11424) è una sottoclasse di opere d’arte visive (Q4502142), ma anche di opere audiovisive (Q2431196).
- Le serie di film (Q24856) sono una sottoclasse di serie di opere creative (Q7725310), opere d’arte (Q838948), opere audiovisive (Q2431196) e franchise multimediali (Q196600).
Il significato della distinzione istanza/sottoclasse
Supponiamo di volere un elenco di tutti i film che si svolgono nell’universo immaginario di Guerre stellari. Potremmo eseguire la seguente query:
La query restituisce solo 10 film. Chiaramente, nei risultati mancano alcuni film, come Star Wars: Episodio I – La minaccia fantasma (Q165713). Come mai?
Perché alcuni articoli hanno “lungometraggio” (Q24869) come valore della loro dichiarazione P31. “Film” è una sottoclasse di “film” (Q11424), ma per quanto riguarda la query il pattern nella parte WHERE della query non corrisponde a quello dell’elemento, e quindi elementi che non sono un’istanza di ” film” non corrispondono e non vengono recuperati.
Potremmo usare il costrutto UNION per selezionare film che siano un’istanza di “film” o un’istanza di “lungometraggio”:
Questa query recupera più risultati, ma è ancora possibile che ci siano elementi rilevanti (cioè, film che si svolgono nell’universo Guerre stellari) che hanno una proprietà “istanza di” con un valore che è qualche altra sottoclasse di film – film d’azione, Film in 3D, film epico… Elencare tutte le diverse sottoclassi di film nelle dichiarazioni dell’UNION non è una strategia molto buona. Una soluzione più generale è mostrata nella successiva sezione.