נתונים טבלאיים לעומת נתונים מקושרים
כדי ללמוד להשתמש בממשק השאילתות של ויקינתונים, צריך קודם להבין את המבנה של ויקינתונים, כלומר, איך נראה מסד של נתונים מקושרים.
דוגמאות רבות במדריך הזה מבוססות על הטבלה הבאה:
מספר מזהה | שם | במאי | משך | פדיון קופת כרטיסים ($) |
wd:Q17738 | מלחמת הכוכבים – פרק 4: תקווה חדשה | ג'ורג' לוקאס | 121 | 775398007 |
wd:Q181795 | מלחמת הכוכבים – פרק 5: האימפריה מכה שנית | ארווין קרשנר | 124 | 538400000 |
wd:Q181803 | מלחמת הכוכבים – פרק 6: שובו של הג'דיי | ריצ'רד מרקאנד | 134 | 475100000 |
wd:Q165713 | מלחמת הכוכבים – פרק 1: אימת הפנטום | ג'ורג' לוקאס | 136 | 1027044677 |
wd:Q181069 | מלחמת הכוכבים – פרק 2: מתקפת המשובטים | ג'ורג' לוקאס | 142 | 649398328 |
wd:Q42051 | מלחמת הכוכבים – פרק 3: נקמת הסית' | ג'ורג' לוקאס | 140 | 848800000 |
wd:Q6074 | מלחמת הכוכבים – פרק 7: הכוח מתעורר | ג'יי ג'יי אברהמס | 135 | 2068223624 |
wd:Q18486021 | מלחמת הכוכבים – פרק 8: אחרוני הג'דיי | ריאן ג'ונסון | 152 | 1332539889 |
wd:Q20977110 | מלחמת הכוכבים – פרק 9: עליית סקייווקר | ג'יי ג'יי אברהמס | 141 | 851058441 |
זהו מערך נתונים קטן שמפרט מידע על סרטים בסדרת מלחמת הכוכבים. עבור כל סרט מוצגות כמה תכונות או מאפיינים: שם הסרט, הבמאי שלו, משך הזמן שלו (בדקות) וההכנסות מכרטיסים שצבר הסרט (בדולרים). דרך זו של הצגת נתונים אמורה להיראות מוכרת למי שמכיר תוכנות כמו אקסל (Excel) או SQL. אבל ויקינתונים אינו מסד נתונים המבוסס על טבלאות, כמו זה שלמעלה, אלא בעל פורמט של "נתונים מקושרים". מה זה אומר?
כך תיוצג השורה הראשונה של הטבלה בצורה של נתונים מקושרים:
בוויקינתונים, שמשתמש בפורמט של נתונים מקושרים, המידע נשמר בצורה של הצהרות. להצהרות – הידועות פורמלית כשלישיות של "נושא, נשוא מושא" – יש מבנה של "פריט-מאפיין-ערך".
למשל, ההצהרה "השמיים בצבע תכלת" מורכבת מ:
(1) נושא ("השמיים")
(2) נשוא ("בצבע")
(3) מושא ("תכלת").
באופן דומה, ההצהרה "מלחמת הכוכבים – פרק 4: תקווה חדשה בוים על ידי ג'ורג' לוקאס" מורכבת מהנושא/פריט "מלחמת הכוכבים – פרק 4: תקווה חדשה", הנשוא/מאפיין "בוים על ידי", והמושא/ערך "ג'ורג' לוקאס" .
אפשר לחשוב על כל שורה בטבלה לעיל כעל פריט, כשכותרות העמודות הן שמות המאפיינים, והתוכן של כל תא הוא הערך שהמאפיין מקבל.
דרך אחרת לתאר נתונים אלה היא בעזרת הצהרות. למשל, הפריט בשורה הראשונה של הטבלה ניתן לתיאור על-ידי ההצהרות:
פריט (Item) | מאפיין (Property) | ערך (Value) |
Q17738 | שם | מלחמת הכוכבים – פרק 4: תקווה חדשה |
Q17738 | במאי | ג'ורג לוקאס |
Q17738 | משך | 121 דקות |
Q17738 | פדיון קופת כרטיסים | 775398007 |
ויקינתונים שומר את המידע על פריטים בצורה של קביעות. קביעות מתארות בפירוט מאפיינים של פריט, ומורכבות מצמדים של מאפיין וערך. מאפיינים בוויקינתונים מזוהים על ידי האות P ואחריה מספר. למשל, המאפיין "במאי" הוא P57.
הערך שהמאפיין הזה מקבל עבור פריט Q17738 (מלחמת הכוכבים – פרק 4: תקווה חדשה) הוא "ג'ורג' לוקאס", שהוא גם פריט בפני עצמו – Q38222. אבל לא כל ערך הוא גם פריט. למשל, הערך למאפיין "משך" (P2047) עבור הפריט Q17738 הוא 121 דקות.
יש מאפיינים שצריכים לקבל ערכים שאינם פריטים. למשל, ראינו שהערך של המאפיין "משך" עבור הפריט Q17738 הוא 121 דקות – ערך כמותי. הערך של המאפיין "תאריך הוצאה לאור" (P577) בארצות הברית הוא "25 במאי 1977", ערך מסוג תאריך. סוגי נתונים נפוצים אחרים הם מחרוזת (רצף של תווים, למשל של אותיות או קוד), קואורדינטות, וטקסט חד-לשוני (מחרוזת שאינה מתורגמת לשפות אחרות). בוויקינתונים יש כיום 27 סוגי נתונים שונים. עוד מידע עליהם ניתן למצוא כאן.