https://frosthead.com

הרוב הגדול של נתונים גולמיים ממחקרים מדעיים ישנים עשוי כעת להיות חסר

אחד היסודות של השיטה המדעית הוא השתקפות התוצאות. במעבדה בכל מקום בעולם, חוקר אמור להיות מסוגל ללמוד את אותו הנושא כמו מדען אחר ולהעתיק את אותם נתונים, או לנתח את אותם נתונים ולהבחין באותם דפוסים.

זו הסיבה שממצאי המחקר שפורסם היום בביולוגיה נוכחית כל כך עניינים. כשקבוצת חוקרים ניסתה לשלוח דוא"ל למחברים של 516 מחקרים ביולוגיים שפורסמו בין 1991 ל -2011 ולבקש את הנתונים הגולמיים, הם נחרדו לגלות שיותר מ- 90 אחוז מהנתונים העתיקים ביותר (מתוך מאמרים שנכתבו לפני יותר מעשרים שנה) היו לא נגיש. בסך הכל, אפילו כולל מאמרים שפורסמו כבר בשנת 2011, הם הצליחו רק לאתר את הנתונים עבור 23 אחוזים.

"כולם יודעים שאם תבקש מחוקר נתונים ממחקרים ישנים הם ישתלמו להם, כי הם לא יודעים איפה זה", אומר טימותי וויינס, זואולוג מאוניברסיטת קולומביה הבריטית, שהוביל המאמץ. "אבל באמת מעולם לא היו הערכות שיטתיות של כמה מהר הנתונים שנמצאים בידי המחברים נעלמים באמת."

כדי להעריך את הערכתם, הקבוצה שלו בחרה בסוג נתונים שהיה יחסית עקבי לאורך זמן - מדידות אנטומיות של צמחים ובעלי חיים - וחפרו בין 25 ל -40 ניירות לכל שנה משונה במהלך התקופה שהשתמשו בסוג זה של נתונים, כדי לראות אם הם היו יכולים לצוד את המספרים הגולמיים.

כמות מפתיעה של פניותיהם הופסקה בשלב הראשון מאוד: במשך 25 אחוז מהמחקרים לא ניתן היה למצוא כתובות דוא"ל פעילות, עם כתובות מנותקות הרשומות על גבי העיתון עצמו וחיפושים ברשת לא מציגים כתובות אקטואליות. עבור עוד 38 אחוזים מהמחקרים, שאילתותיהם לא הובילו לתגובה. 7 אחוזים נוספים מערכות הנתונים אבדו או לא היו נגישים.

"חלק מהזמן, למשל, הוא נשמר על דיסקטים בגודל 3 וחצי אינץ ', כך שאיש לא יכול היה לגשת אליו, מכיוון שכבר לא היו להם הכוננים המתאימים", אומר Vines. מכיוון שהרעיון הבסיסי של שמירת נתונים הוא כך שאפשר להשתמש בהם על ידי אחרים במחקר עתידי, התיישנות מסוג זה הופכת את הנתונים ללא תועלת.

אלה עשויים להיראות כמו מכשולים ארציים, אך מדענים הם בדיוק כמו כולנו - הם משנים כתובות דוא"ל, הם מקבלים מחשבים חדשים עם כוננים שונים, הם מאבדים את גיבוי הקבצים שלהם - כך שמגמות אלה משקפות בעיות מערכתיות חמורות במדע.

ושמירת נתונים היא כה חשובה, כדאי לזכור, כי אי אפשר לחזות לאילו כיוונים מחקר יעבור בעתיד. גפנים, למשל, ערך מחקר משלו על זוג מינים קרפדים ילידי מזרח אירופה שנראים בתהליך הכלאה. בשנות השמונים, לדבריו, צוות חוקרים נפרד עבד על אותו נושא ונתקל בעיתון ישן שתיעד את חלוקת הקרפדות הללו בשנות השלושים. הידיעה שההפצה שלהם השתנתה מעט יחסית במהלך העשורים שחלפו בין השנים, אפשרה למדענים לבצע כל מיני חישובים שלא היו מתאפשרים אחרת. "הנתונים המקוריים שהיו זמינים, ממחקר ישן וקטן מאוד שנכתב בפולנית, היו מועילים להפליא לחוקרים שהגיעו כעבור 70 שנה", הוא אומר.

יש גם את העובדה כי כל כך הרבה ממחקר זה משולם במימון ציבורי, וחלק גדול ממנו מגיע באמצעות מענקים שקובעים כי הנתונים המתקבלים יהפכו לרשות הציבור באופן חופשי. בנוסף, נתוני שדה מושפעים מנסיבות הסביבה בה הם נאספים - אי אפשר לשכפל בצורה מושלמת בהמשך, כאשר התנאים השתנו.

מה הפיתרון? כתבי-עת מסוימים - כולל אקולוגיה מולקולרית, בהם Vines עורך מנהל - נקטו מדיניות המחייבת מחברים להגיש נתונים גולמיים יחד עם מאמרים, ומאפשרת ליומן עצמו לארכוב את הנתונים בתמיד. אף כי כתבי עת, כמו אנשים, רגישים לשינוי כתובות דוא"ל והתיישנות טכנולוגית, ניתן לנהל בקלות רבה יותר בעיות אלה בסדר גודל המוסדי.

הרוב הגדול של נתונים גולמיים ממחקרים מדעיים ישנים עשוי כעת להיות חסר