ויקינתונים, או ויקידאטה, הוא מיזם בינלאומי של תנועת ויקימדיה, שמטרתו להפוך למסד הנתונים החופשי הגדול בעולם, כפי שוויקיפדיה הפכה למקור המידע הנפוץ ביותר.
ויקינתונים הוא מאגר נתונים פתוח וחופשי שניתן לכתיבה ולעריכה על ידי בני אדם וגם על ידי מכונות. ויקינתונים מהווה מאגר מרכזי לכל המידע המובנה במיזמי ויקימדיה, כגון: ויקיפדיה, ויקימילון, ויקיטקסט, ויקימסע, ואחרים.
ויקינתונים גם מספק תמיכה לאתרים ושירותים אחרים מעבר למיזמים של ויקימדיה. התוכן בוויקינתונים זמין ברישיון חופשי, ניתן לייצא אותו בפורמטים סטנדרטיים, ולקשרו למערכי נתונים אחרים ברשת האינטרנט.
הסבר על ויקינתונים ונתונים מקושרים
ויקינתונים הוא מאגר אחסון מרכזי המורכב בעיקר מפריטים, שיכולים לייצג כל דבר, יישות או מושג. פריט יכול להיות חפץ, אדם, אירוע, מקום, יצירת אמנות, אך גם מושגים מופשטים יותר כמו אהבה או סוציאליזם. פריטים מקבלים מזהה ייחודי המתחיל באות Q ואחריה מספר.
למשל, פריט Q17738 מייצג את הסרט "מלחמת הכוכבים" משנת 1977 . לכל פריט יש גם תווית – השם המקובל לאותו פריט בשפה מסוימת. ניתן להזין תווית בכל שפה נתונה. בצורה זו ניתן לזהות את הפריט ולהציג מידע בסיסי עבורו בצורה שאינה תלוית-שפה ולא מתעדפת שפה אחת על פני השנייה.
תוויות של פריטים לא חייבות להיות ייחודיות. למשל, הפריט "מלחמת הכוכבים" (Q462) מייצג את סדרת סרטי המדע הבדיוני וזיכיון המדיה. גם לפריט Q54317 יש את אותה התווית "מלחמת הכוכבים", אך הוא מייצג את משחק הווידאו בשם זה, מ-1983. התיאור של פריט ויקינתונים הוא ביטוי קצר שמטרתו להבחין בין פריטים שיש להם תווית זהה או דומה. גם התיאור של פריט לא צריך להיות ייחודי – לפריטים רבים יש את אותו תיאור. אבל לא יכולים להיות שני פריטים עם אותה תווית ואותו תיאור.
זהו מערך נתונים קטן שמפרט מידע על סרטים בסדרת מלחמת הכוכבים. עבור כל סרט מוצגות כמה תכונות או מאפיינים: שם הסרט, הבמאי שלו, משך הזמן שלו (בדקות) וההכנסות מכרטיסים שצבר הסרט (בדולרים). דרך זו של הצגת נתונים אמורה להיראות מוכרת למי שמכיר תוכנות כמו אקסל (Excel) או SQL. אבל ויקינתונים אינו מסד נתונים המבוסס על טבלאות, כמו זה שלמעלה, אלא בעל פורמט של "נתונים מקושרים". מה זה אומר?
כך תיוצג השורה הראשונה של הטבלה בצורה של נתונים מקושרים:
בוויקינתונים, שמשתמש בפורמט של נתונים מקושרים, המידע נשמר בצורה של הצהרות. להצהרות – הידועות פורמלית כשלישיות של "נושא, נשוא מושא" – יש מבנה של "פריט-מאפיין-ערך".
למשל, ההצהרה "השמיים בצבע תכלת" מורכבת מ: (1) נושא ("השמיים") (2) נשוא ("בצבע") (3) מושא ("תכלת"). באופן דומה, ההצהרה "מלחמת הכוכבים – פרק 4: תקווה חדשה בוים על ידי ג'ורג' לוקאס" מורכבת מהנושא/פריט "מלחמת הכוכבים – פרק 4: תקווה חדשה", הנשוא/מאפיין "בוים על ידי", והמושא/ערך "ג'ורג' לוקאס" .
אפשר לחשוב על כל שורה בטבלה לעיל כעל פריט, כשכותרות העמודות הן שמות המאפיינים, והתוכן של כל תא הוא הערך שהמאפיין מקבל.
דרך אחרת לתאר נתונים אלה היא בעזרת הצהרות. למשל, הפריט בשורה הראשונה של הטבלה ניתן לתיאור על-ידי ההצהרות:
פריט (Item)
מאפיין (Property)
ערך (Value)
Q17738
שם
מלחמת הכוכבים – פרק 4: תקווה חדשה
Q17738
במאי
ג'ורג לוקאס
Q17738
משך
121 דקות
Q17738
פדיון קופת כרטיסים
775398007
ויקינתונים שומר את המידע על פריטים בצורה של קביעות. קביעות מתארות בפירוט מאפיינים של פריט, ומורכבות מצמדים של מאפיין וערך. מאפיינים בוויקינתונים מזוהים על ידי האות P ואחריה מספר. למשל, המאפיין "במאי" הוא P57. הערך שהמאפיין הזה מקבל עבור פריט Q17738 (מלחמת הכוכבים – פרק 4: תקווה חדשה) הוא "ג'ורג' לוקאס", שהוא גם פריט בפני עצמו – Q38222. אבל לא כל ערך הוא גם פריט. למשל, הערך למאפיין "משך" (P2047) עבור הפריט Q17738 הוא 121 דקות.
יש מאפיינים שצריכים לקבל ערכים שאינם פריטים. למשל, ראינו שהערך של המאפיין "משך" עבור הפריט Q17738 הוא 121 דקות – ערך כמותי. הערך של המאפיין "תאריך הוצאה לאור" (P577) בארצות הברית הוא "25 במאי 1977", ערך מסוג תאריך. סוגי נתונים נפוצים אחרים הם מחרוזת (רצף של תווים, למשל של אותיות או קוד), קואורדינטות, וטקסט חד-לשוני (מחרוזת שאינה מתורגמת לשפות אחרות). בוויקינתונים יש כיום 27 סוגי נתונים שונים. עוד מידע עליהם ניתן למצוא כאן.