אנוטציית DNA
אנוטציית DNA (או אנוטציית גנום) הוא תהליך של זיהוי אזורים מקודדים בגנום וקביעת התפקידים של כל גן.
אנוטציה היא צורת הערה שנועדה לתת הסבר. כאשר גנום מרוצף, הוא צריך לעבור אנוטציה כדי לתת משמעות לרצף הנוקלאוטידים.
אנוטציה של מקטע DNA נעשית באמצעות השוואת למידע ידוע, ובתהליך מזוהים העשרות ומרכיבים שונים כגון, גבולות אינטרונים ואקסונים, רצפי בקרה, חזרות, שמות גנים ותוצרי חלבונים. האנוטציות מאוחסנות במאגרי מידע גנומיים כמו Mouse Genome Informatics, FlyBase, ו-WormBase.
ככל שגנומים נחקרים יותר, נאסף מידע רב על גנומים שונים, דבר המאפשר לעוסקים באנוטציה לתת אנוטציות מדויקות יותר לגנים שונים שקיבלו בעבר אנוטציה זהה.
המרכז הלאומי לאנוטציה ביוארפואית (The National Center for Biomedical Ontology), מפתח כלים לאנוטציה אוטומטית של רשומות ממאגרי מידע המבוססים על תיאור מילולי שלהן. חומר לימודי על היבטים של אנוטצית DNA נמצא באתר של Gene Ontology. כשיטה כללית, ל-dcGO יש תהליך אוטומטי שנועד להסיק באופן סטטיסטי קשרים בין מושגים אונטולוגיים לבין דומיינים של חלבונים או לבין קומבינציות של דומיינים מהאנוטציה הקיימת ברמת הגן או ברמת החלבון.
תהליך האנוטציה
אנוטציה גנומית מכילה שלושה שלבים עיקריים:
- זיהוי חלקים לא מקודדים לחלבון בגנום
- זיהוי רכיבים על הגנום, תהליך שנקרא חיזוי גנים
- צירוף מידע ביולוגי לרכיבים הנ"ל
אנוטציה ידנית משלבת בין שלושת השלבים ודורשת מיומנויות, אך ישנם כלים אוטומטיים לאנוטציה אשר משתמשים באמצעים חישוביים ומזרזים מאוד את התהליך. באופן אידיאלי, שתי השיטות הולכות יד ביד ומשלימות זו את זו כחלק מאותו צינור עיבוד נתונים.
הדרך הפשוטה ביותר לבצע אנוטציה של גנים היא לחפש דמיון רצפי (הומולוגיה) באמצעות כלים שמבוססים על הומולוגיה רצפית כמו BLAST. הרצף מושווה לרצפים שכבר עברו אנוטציה, ומידע זה משמש לביצוע אנוטציה על הרצף הנבדק. ישנם כלים שמשתמשים במידע על ההקשר הגנומי, ציוני דמיון, מידע ניסויי ושילובים בין משאבים אחרים. מאגרי מידע אחרים (כמו Ensembl) מסתמכים על מקורות מידע שנאספו בין בצורה ידנית והן באמצעות מגוון כלים חישוביים בצינור האנוטציה הגנומית שלהם.
ניתן לחלק את האנוטציות לשני סוגים:
- אנוטציה מבנית - כוללת את הזיהוי של מרכיבים גנומיים:
- מסגרות קריאה ומיקומן
- מבני גנים
- אזורים מקודדים
- מיקום של מרכיבי בקרה
- אנוטציה תפקודית - כוללת את הצירוף של מידע ביולוגי למרכיבים הגנומיים:
- תפקודים ביוכימיים
- תפקודים ביולוגיים
- בקרות ואינטראקציות בהן מעורב הרכיב
- ביטוי
תהליך האנוטציה יכול לכלול ניסויים ביולוגיים ואנליזות אין סיליקו. לדוגמה, גישות המתבססות על פרוטאוגנומיקה מנצלות מידע על חלבונים מבוטאים, לרוב באמצעות תוצאות של ספקטרומטר מסה על מנת לשפר את האנוטציות הקיימות.
מגוון כלי תכנות פותחו כדי לאפשר למדענים לצפות ולשתף אנוטציות גנומיות.
בוויקיפדיה, הגהה גנומית החלה להיות אוטומטית בחסות Gene Wiki portal המפעיל בוט שאוסף מידע גנטי ממאגרי מידע מחקריים ויוצר אנוטציות לגנים על הבסיס הזה.
חשיבות
ניתן לתאר את זיהוי מיקומם של גנים או רכיבי בקרה כהגדרת רשימת ה"חלקים" הביולוגיים להרכבה ותפקוד ראוי של האורגניזם השלם. מדענים עדיין נמצאים בשלב מוקדם בתהליך של תיחום הרשימה והבנת אופן הפעולה המשותף של חלקיה. אנוטציה גנומית עודנה מהווה אתגר גדול העומד בפני מדענים רבים החוקרים את הגנום האנושי, מכיוון שקיים מידע ריצוף של אלפי גנומים של בני אדם, וכן בפני חוקרי אורגניזמים אחרים – בין אם מדובר באורגניזם מודל ובין אם לא, מכיוון שהכלים שפותחו לא בהכרח מתאימים לכל אורגניזם, וכן בעיות נוספות כגון ריצוף חסר או חלקי של הגנום.
קהילה מדעית
אנוטציה גנומית היא תחום פעיל שכוללת מספר ארגונים שונים בקהילת מדעי החיים. פירות המאמץ המחקרי מפורסמות במאגרי מידע ביולוגיים ציבוריים שניתן לגשת אליהם דרך האינטרנט או אמצעיים טכנולוגיים אחרים. להלן רשימת מיזמים מתמשכים הרלוונטיים לאנוטציה גנומית (לפי סדר הא'-ב'):
- Encyclopedia of DNA elements (ENCODE)
- Entrez Gene
- Ensembl
- GENCODE
- Gene Ontology Consortium
- GeneRIF
- RefSeq
- Uniprot
- Vertebrate and Genome Annotation Project (Vega)
25333166אנוטציית DNA