https://frosthead.com

כיצד הביאה מרגרט דייהוף את המחשוב המודרני לביולוגיה

בשנת 1984, הקרן הלאומית למחקר ביו-רפואי השיקה מאגר נתונים מקוון חינם הכולל למעלה מ 283, 000 רצפי חלבון. כיום משאב המידע לחלבון מאפשר למדענים בכל רחבי העולם ליטול חלבון לא ידוע, להשוות אותו לאלפי החלבונים הידועים במאגר, ולקבוע את הדרכים בהן הוא דומה ושונה. מנתונים אלה הם יכולים להסיק במהירות ובמדויק את ההיסטוריה האבולוציונית של חלבון ואת הקשר שלו לצורות חיים שונות.

מקורו הצנוע של בסיס נתונים מקוון מאסיבי זה מתחיל הרבה לפני האינטרנט. הכל התחיל באטלס של רצף החלבון והמבנה, ספר מודפס משנת 1965, המכיל את 65 רצפי החלבון הידועים אז, שחוברו על ידי אישה בשם מרגרט דייהוף. כדי ליצור את האטלס שלה, השתמשה דייוף בטכנולוגיות מחשב מתקדמות כדי למצוא פתרונות לשאלות ביולוגיות, ועזרו להקים לידתו של תחום חדש שאנו מכנים כיום ביואינפורמטיקה. Dayhoff, במקורו ככימאי, רתם טכנולוגיות חדשות ומתפתחות של עידן המחשוב שלאחר מלחמת העולם השנייה, וכלים חלוצים בהם כימאים, ביולוגים ואסטרונומים כאחד יוכלו להשתמש בהם במחקר חוצה תחומי המקורות על החיים בכדור הארץ.

דייהוף (אז מרגרט אוקלי) נולדה בפילדלפיה ב- 11 במרץ 1925 לרות קלארק, מורה למתמטיקה בתיכון, וקנת אוקלי, בעלת עסק קטן. בגיל עשר עברה משפחתה לעיר ניו יורק. שם היא למדה בבתי ספר ציבוריים, ובסופו של דבר הפכה להיות החסיד של היישוב בייסייד בשנת 1942. היא למדה במכללת וושינגטון סקוור באוניברסיטת ניו יורק במלגה, וסיימה את לימודיה בהצטיינות במתמטיקה רק שלוש שנים מאוחר יותר בשנת 1945.

באותה שנה דייהוף נכנסה לאוניברסיטת קולומביה כדי לקבל תואר שלישי בכימיה קוונטית תחת חונכות של הכימאי הבולט וחוקר המבצעים במלחמת העולם השנייה ג'ורג 'קימבול. קבלתה הייתה נדירה באותה תקופה. לאחר מלחמת העולם השנייה, יותר גברים נכנסו למדעים, והכימיה הפכה לנשלטת עוד יותר על גברים מאשר בעשור הקודם, כאשר רק חמישה אחוזים מהדוקטורים בכימיה עברו לנשים, ירידה משמונה אחוזים.

בתקופתו של דייהוף באוניברסיטה, קולומביה הייתה חממה לטכנולוגיית המחשוב. זה התגאה בכמה ממעבדות המחשוב הראשונות בארה"ב, ובשנת 1945 הפך לבית המעבדה המדעית ווטסון של יבמ בראשות האסטרונום ווג'יי אקרט. מעבדת ווטסון שימשה לראשונה כמרכז מחשוב לבעלות הברית בחודשים האחרונים של מלחמת העולם השנייה. לאחר המלחמה הפך לאתר לפיתוח כמה ממחשבי העל הראשונים, כולל המחשבון האלקטרוני Selective Sequence Electronic (SSEC), אשר אחר כך השתמש אקרט לחישוב מסלולי ירח למשימות אפולו.

עם הטכנולוגיה הזו בהישג יד, שילב דייהוף את העניין שלה בכימיה עם מחשוב באמצעות מכונות כרטיסים מחוברים - למעשה מחשבים דיגיטליים מוקדמים. המכונות אפשרו לדייהוף להפוך את חישוביה לאוטומטיים, לאגור אלגוריתם על מערך כרטיסים אחד ונתונים על גבי אחר. באמצעות המכונה היא הצליחה לעבד חישובים בצורה מהירה ומדויקת בהרבה מאשר ביד.

הנושא הספציפי של דייהוף היה תרכובות אורגניות פולי-מחזוריות, שהן מולקולות המורכבות משלושה אטומים או יותר המחוברים לטבעת קרובה. היא השתמשה במכונות כרטיסי החבטה כדי לבצע מספר רב של חישובים על אנרגיות התהודה של המולקולות (ההבדל בין האנרגיה הפוטנציאלית של מולקולה של מצב ספציפי למצב ממוצע) כדי לקבוע את ההסתברות לקשר מולקולרי ולמרחקי הקשר.

דייהוף סיימה את לימודיה לתואר שלישי בכימיה קוונטית בשלוש שנים בלבד. המחקר שהיא לקחה כסטודנטית לתואר שני התפרסם, כשקימבול היה חבר משותף, בשנת 1949 בכתב העת לפיזיקה כימית תחת הכותרת הפשוטה חישוב כרטיס ניקוב של אנרגיות תהודה.

בנוסף, בשנת 1948, התחתן דייהוף עם אדוארד דייהוף, סטודנט לפיזיקה ניסיונית, אותה הכירה בקולומביה. בשנת 1952, הזוג עבר לוושינגטון הבירה, שם אדוארד נכנס לתפקיד בלשכה הלאומית לתקנים ודייהוף ילדה את בתה הראשונה משתי בנותיה, רות. דייהוף נשרה במהרה מהמחקר כדי להפוך לאמא להישאר בבית אצל רות ובתה הצעירה ג'ודית, פרט לתפקיד של שנתיים לאחר הפקודה הדוקטורט באוניברסיטת מרילנד.

כשחזרה למחקר והחלה להגיש בקשה למענקים למימון עבודתה בשנת 1962, נפגשה בהלם. מכוני הבריאות הלאומיים דחו את בקשת המענק שרשמה את דייהוף כחוקר ראשי, וההסבר ש" [דייהוף] היה מחוץ למגע אינטימי באמת מזה זמן ... עם האזור המסובך והמתקדם הזה במהירות ", כפי שכותב ההיסטוריון ברונו סטראסר ב ספרו הקרוב איסוף ניסויים: ביצוע ביולוגיה של ביג דאטה . טיפוס עלייה מסוג זה לנשים שקיבלו פסק זמן לגדל ילדים הוא רק אחת הדרכים שמוסדות מדעיים הפריעו - והמשיכו להפריע לקידום האישה.

למרות חוסר התמיכה של ה- NIH, דייהוף עמדה להיכנס לעשור התוצאתי ביותר בקריירה שלה. בשנת 1960, היא קיבלה הזמנה גורלית מרוברט לדלי, ביופיזיקאי חלוץ אותו פגשה באמצעות בעלה, להצטרף אליו לקרן הלאומית למחקר ביו-רפואי בסילבר ספרינג, מרילנד. לדלי ידע כי כישורי המחשוב של דייהוף יהיו מכריעים למטרת הקרן לשלב את תחומי המחשוב, הביולוגיה והרפואה. היא תשמש כמנהלת המשנה שלו במשך 21 שנה.

פעם במרילנד, היה לדייהוף חירום חופשי להשתמש במיינפריים IBM 7090 החדש של אוניברסיטת ג'ורג'טאון. מערכת יבמ תוכננה לטיפול באפליקציות מורכבות, עם מהירויות מחשוב מהירות שש פעמים מהדגמים הקודמים. מהירות זו הושגה על ידי החלפת טכנולוגית צינור ואקום בתפזורת איטית יותר, עם טרנזיסטורים מהירים ויעילים יותר (הרכיבים המייצרים את ה- 1 ו- 0 של המחשבים). באמצעות המיינפריים, דייוף ו לדלי החלו לחפש ולהשוות רצפי פפטיד עם תוכניות FORTRAN שכתבו בעצמם בניסיון להרכיב רצפים חלקיים לחלבון שלם.

יבמ 7090 קונסולת המפעילה של יבמ 7090 במרכז המחקר של איימס ב- NASA בשנת 1961, עם שני בנקים של כונני קלטת מגנטיים של יבמ 729. (נאס"א)

המחויבות של דייהוף ולדלי ליישם ניתוח מחשבים לביולוגיה וכימיה הייתה חריגה. "תרבות הניתוח הסטטיסטי, קל וחומר של המחשוב הדיגיטלי, הייתה זרה לחלוטין לרוב [ביוכימאים], " מסביר שטרסר בראיון ל- Smithsonian.com . "חלקם אף התגאו בכך שהם לא 'תיאורטיקנים', וכך הבינו ניתוח נתונים באמצעות מודלים מתמטיים."

עם זאת, תחום מדעי אחד שבו היה מוערך יותר במומחיות המחשבים של דייהוף היה האסטרונומיה. העניין הזה במחשוב היה בין השאר בזכות WJ Eckhart, שבשנת 1940 השתמש במכונות כרטיסי אגרוף של יבמ כדי לחזות מסלולי כדור הארץ. ובשנות השישים העניין האמריקני בחקר החלל היה בעיצומו, מה שאומר מימון לנאס"א. באוניברסיטת מרילנד פגש דייהוף את הספקטרוסקופיסט אליס ליפינקוט, שהביא אותה לשיתוף פעולה של שש שנים עם קארל סייגן בהרווארד בשנת 1961. שלושתם פיתחו מודלים תרמודינמיים של איפור כימי של החומר, ודייהוף המציא תוכנית מחשב שתוכנה יכול לחשב ריכוזי שיווי משקל של גזים באטמוספרות פלנטריות.

עם התוכנית של דייהוף, היא, ליפינקוט וסאגן הצליחו לבחור אלמנט לניתוח, מה שמאפשר להם לחקור קומפוזיציות אטמוספריות רבות ושונות. בסופו של דבר הם פיתחו מודלים אטמוספריים לנוגה, יופיטר, מאדים ואפילו לאווירה קדומה של כדור הארץ.

במהלך חקר השמיים, דייהוף העלה גם שאלה שחוקרים בדקו מאז לפחות בשנות החמישים: מה תפקידם של חלבונים? רצף חלבונים היה אמצעי להשגת התשובה, אך רצף חלבונים בודדים היה לא יעיל ביותר. דייהוף ולדלי נקטו בגישה אחרת. במקום לנתח חלבונים בבידוד, הם השוו בין חלבונים המופקים ממיני צמחים ובעלי חיים שונים. "על ידי השוואה בין רצפי אותו חלבון במינים שונים, ניתן היה לראות אילו חלקים מהרצף תמיד זהים בכל המינים, אינדיקציה טובה לכך שחלק זה של הרצף היה קריטי לתועלת החלבון", אומר סטראסר.

דייהוף התעמק במבט עמוק יותר והביט בהיסטוריה המשותפת של חלבונים. היא ניתחה לא רק את החלקים שהיו זהים בכל המינים, אלא גם את הווריאציות שלהם. "הם לקחו את ההבדלים הללו כמדד למרחקים אבולוציוניים בין מינים, מה שאיפשר להם לשחזר עצים פילוגנטיים", מסביר שטרסר.

דייהוף, שהיה מוכן תמיד לרתום את כוחה של טכנולוגיה חדשה, פיתח שיטות ממוחשבות לקביעת רצפי חלבון. היא ניהלה ניתוח מחשב של חלבונים במגוון רחב של מינים, החל מפטריית הקנדידה ועד לוויתן. ואז היא השתמשה בהבדלים שלהם כדי לקבוע את יחסי אבותיהם. בשנת 1966, בעזרת ריצ'רד אק, יצר דייוף את השחזור הראשון של עץ פילוגנטי.

במאמר של סיינטיפיק אמריקן משנת 1969, "ניתוח מחשבים של התפתחות חלבונים", הציגה דייהוף לציבור את אחד העצים הללו יחד עם מחקריה המשתמשים במחשבים לרצף חלבונים. "כל רצף חלבון שהוקם, כל מנגנון אבולוציוני שמואר, כל חידוש מרכזי בהיסטוריה הפילוגנטית שנחשף ישפר את הבנתנו את תולדות החיים", כתבה. היא ניסתה להראות לקהילה במדעי החיים את הפוטנציאל של דגמים ממוחשבים.

המטרה הבאה שלה הייתה לאסוף את כל החלבונים הידועים במקום אחד בו החוקרים יכלו למצוא רצפים ולהשוות אותם לאחרים. שלא כמו היום, כאשר קל לקרוא מקורות למסד נתונים אלקטרוני עם מילת מפתח בלבד, דייהוף נאלץ לסרוק כתבי-עת פיזיים כדי למצוא את החלבונים שהיא חיפשה. במקרים רבים פירוש הדבר היה לבדוק טעויות של עבודת החוקרים. אפילו בעזרת מחשב, עבודת האיסוף והקטלוג של הרצפים דרשה כמויות זמן גדולות ועין מדעית מבחינה.

לא כולם ראו ערך במה שהיא עושה. בעיני חוקרים אחרים, עבודתו של דייהוף דמתה את עבודות האיסוף והקטלוג של תולדות הטבע של המאה ה -19 ולא עבודתו הניסיונית של מדען המאה העשרים. "איסוף, השוואה וסיווג של דברים מהטבע נראה מיושן עבור ביולוגים ניסויים רבים במחצית השנייה של המאה העשרים, " אומר סטאסר. הוא מתייחס לדייהוף כאל "מבחוץ". "היא תרמה לתחום שלא היה קיים ולכן לא הייתה לו הכרה מקצועית", הוא אומר.

בשנת 1965 פירסמה דייהוף לראשונה את אוסף 65 החלבונים הידועים שלה באטלס רצף החלבון והמבנה, גרסה מודפסת של מסד הנתונים שלה. בסופו של דבר הנתונים עברו לקלטת מגנטית, וכעת הם חיים ברשת כאשר החוקרים ממשיכים להשתמש בנתונים שלה כדי למצוא אלפי חלבונים נוספים. מאגרי מידע ביו-רפואיים נוספים הצטרפו לקבוצה, ביניהם בנק הנתונים לחלבונים, אוסף שיתופי של חומצות חלבון וגרעין שהושק בשנת 1971, ו- GenBank, מאגר הרצפים הגנטיים שהושק בשנת 1982. דייהוף החל במהפכה מדעית.

"כיום, כל פרסום בודד בביולוגיה ניסיונית מכיל שילוב של נתונים ניסיוניים חדשים והסיקות השואות מהשוואה עם נתונים אחרים שהועמדו במאגר מידע ציבורי, גישה שדייהוף החל לפני כחצי מאה", אומר סטראסר.

עם התפתחות ביו-אינפורמטיקה, משימות האיסוף והחישוב נפלו במידה רבה על נשים. משתפי הפעולה של דייהוף באטלס היו כולם נשים למעט לדלי. כמו "מחשבי" הנשים של נאס"א בשנות ה -60 ונשים שוברות הקודים של מלחמת העולם השנייה, נשים אלו נדחקו עד מהרה לשולי העיסוק המדעי. בהתייחסו ל"נערות ENIAC "שתיכנתו את המחשב הדיגיטלי הראשון למטרות כלליות, ההיסטוריונית של המחשוב ג'ניפר לייט כותבת כי" זה בגדר הסיווגים התעסוקתיים הנמוכים במעמד נמוך כל כך שנשים עסקו בעבודה חסרת תקדים. "

ברישומה הביוגרפי של דייהוף, כתב לויס ט האנט, שעבד איתה על האטלס, כי דייהוף האמין כי חקירתה באווירה הקדומה של כדור הארץ עשויה להעניק לה "את המתחמים הדרושים להיווצרות החיים." זה, אולי אפילו יותר מאשר מחשוב, זה מה שקושר בין החלקים השונים במחקר המדעי של דייהוף. החל מהחלבון הזעיר לאווירה העצומה, חיפש דייהוף את סודות הופעת החיים בכוכב לכת זה. למרות שהיא לא פתחה את כולם, היא נתנה למדע המודרני את הכלים והשיטות להמשך החיפוש.

כיצד הביאה מרגרט דייהוף את המחשוב המודרני לביולוגיה