ENCODE
ENCODE (ראשי תיבות של: "Encyclopedia of DNA Elements" - אנציקלופדיה של מרכיבי DNA) הוא מיזם מחקר ציבורי שהושק על ידי המכון הלאומי לחקר הגנום האנושי בספטמבר 2003. לאחר השלמת פרויקט גנום האדם, שבו נקבע מהו רצף הבסיסים המרכיב את ה-DNA של האדם, עלה הצורך להבין את המשמעות הביולוגית של הרצף. מטרת פרויקט ENCODE היא, לפיכך, לזהות את כל המרכיבים הפונקציונליים הנמצאים בגנום האנושי.
הפרויקט מאגד קבוצות מחקר רבות מרחבי העולם לקונסורציום. המידע שנצבר בפרויקט זה זמין לכל במאגרי מידע ציבוריים.
מניעים וחשיבות
לאדם ישנם כ-20,000 גנים המקודדים לחלבונים, אשר מהווים רק כ-1.5% מה-DNA ההומאני. המטרה עיקרית של מיזם ENCODE הוא לקבוע את התפקיד של ה-DNA הלא מקודד, שכונה באופן מסורתי DNA זבל. רמות הפעילות והביטוי של גנים המקודדים לחלבונים מבוקרים על ידי הרגולום - מגוון של מרכיבים פונקציונליים ב-DNA, כגון קדמים (פרומוטורים), אזורים בעלי מבנה כרומטין מסוים ומודיפקציות על היסטונים. ההנחה היא ששינויים בבקרה של פעילות גנים פוגעים בביטוי התקין של החלבונים וכך עלולה לפגוע במסלולים מטבוליים שונים ולגרום למחלות. קביעת מיקומם של רצפי הבקרה וכיצד הם מבקרים ביטוי גנים עשויה לחשוף קשרים בין שונות בביטוי של גנים והתפתחות מחלות.
ENCODE גם שואף לשמש כמשאב מקיף כדי לאפשר לקהילה המדעית להבין טוב יותר כיצד הגנום משפיע על בריאות האדם, וכן לעורר את הפיתוח של טיפולים חדשים כדי למנוע את המחלות הללו ולטפל בהם.
הקונסורציום של ENCODE
הקונסורציום של ENCODE מורכב בעיקר ממדענים אשר קיבלו מימון מהמכון הלאומי לחקר הגנום האנושי. שלב הפיילוט כלל שמונה קבוצות מחקר, ו-12 קבוצות שהשתתפו בשלב של פיתוח הטכנולוגיות. אחרי 2007, בסוף שלב הפיילוט, מספר המדענים השייכים לקונסורציום עמד על 440 מדענים השייכים ל-32 מעבדות ברחבי העולם. כיום המיזם מעניק קרנות למעבדות ברחבי העולם, כאשר כל מענק מחקר מיועד למטרה מסוימת. רשימה של קבוצות המחקר ושל מענקי המחקר ניתן למצוא באתר המיזם[1].
המיזם מהווה חלק מהקונסורציום הבינלאומי לאפיגנום האנושי (IHEC).
מיזם ENCODE
המיזם תוכנן לפעול בשלבים. השלב הראשון והשני יושמו בו זמנית, ובהן התקיים שלב הפיילוט ושלב הפיתוח הטכנולוגי. בשלב הפיילוט נבחנו נוסו שיטות שונות הקיימות בעולם המחקר כדי לאפיין רצף DNA. בשלב הפיתוח הטכנולוגי פותחו כלים חדשים כדי לייצר מידע רחב היקף על מרכיבים פונקציונליים בגנום. לאחר השלמת השלבים הללו, נערך שלב הייצור, שבו יושמו השיטות והכלים מהשלבים הקודמים כדי ליצור נתונים שיהוו את תוכן האנציקלופדיה. כיום המיזם נמצא בשלבו הרביעי, שמהווה המשך לשלב הקודם, והוא כולל איפיון פונקציונלי וניתוח אינטגרטיבי עבור האנציקלופדיה.
מטרת השלבים הראשונים הוא לזהות סדרה של תהליכים בהם יהיה ניתן ליצור בצורה היעילה והחסכונית ביותר בתפוקה גבוהה מידע על המרכיבים הפונקציונליים בגנום. שלב הפיילוט נועד לגלות פערים במערך הכלים לאיתור מרכיבים פונקציונליים שהיה קיים אז, וכן לבדוק האם הכלים הקיימים יעילים מספיק ומתאימים ליישום בהיקף נרחב. חלק מהבעיות הללו טופלו בשלב השני של המיזם, אשר נועדה ליצור ולשפר כלים לחיזוי מרכיבים פונקציונליים חדשים ולזיהויין של המרכיבים הידועים. בעזרת שני השלבים הללו הותוותה הדרך הטובה והיעילה כדי לנתח את 98.5% של ה-DNA הלא מקודד בצורה מקיפה, יעילה וחסכונית.
שלב 1+2: פיילוט
שלב הפיילוט בדק והשווה בין שיטות קיימות כדי לאפיין מרכיבים פונקציונליים בגנום. הקונסורציום נבנה כקונסורציום פתוח, וחוקרים שונים ממגוון תחומים חברו יחד כדי להעריך את היתרונות היחסיים טכנולוגיות, טכניקות ואסטרטגיות קיימות. שלב הפיילוט דרש שיתוף פעולה מתמיד של ביולוגים חישוביים וביולוגים נסיינים, כדי לשפר ולייעל את השיטות. בתור מטרה ראשונית הוגדר היעד של איפיון אזורים מסוימים המהווים כ-1% מהגנום (30Mbp). כל הנתונים שנצברו בשלב זה הועלו תוך זמן קצר למאגרי מידע ציבוריים.
בחירת האזורים לשלב הפיילוט
לשלב הפיילוט נבחרו אזורים בהיקף של כ-1% מהגנום (30Mbp). אזורים אלו שימשו כבסיס לבחינת יעילות של מגוון שיטות וטכנולוגיות למציאת מרכיבים בגנום האנושי. לפני קביעת האזורים, הוחלט כי 50% מהאזורים לפיילוט ייבחרו בצורה ידנית, והיתר ייבחרו בצורה אקראית. הקריטריונים לבחירה הידני הם אזורים בהם ישנם גנים או רצפים אחרים שנחקרו היטב, וכן קיומם של נתוני על רצפים השוואתיים רבים. בשיטה זו הוגדרו 14 מקטעים באורך כולל של כ-15Mbp, בטווח אורך שבין 2Mbp ל-500Kbp. יתר ה-50% הורכב מ-3- מקטעים באורך קבוע של 500Kbp שנבחרו בצורה אקראית המבוססת על צפיפות גנית ורמת שימור של אזורים לא מקודדים (ראו פירוט). ההחלטה להשתמש בקריטריונים אלו נעשה על מנת להבטיח דגימה טובה של אזורים גנומיים מתוך כלל הרצף הקיים. הגנום חולק ל-3 חלקים: 20% עליונים, 30% בינוניים ו-50% תחתונים, על פני מערכת צירים שתלויה בצפיפות הגנים במקטע, ורמת השימור של האזורים הלא מקודדים בהשוואה לרצף האורתולוגי מעכבר.
- צפיפות גנים: ציון של צפיפות גנים נמדד על ידי חישוב של אחוז הבסיסים עליהם מוגדר רצף של גן במאגר ה-Ensembl או כ-mRNA בכלי ה-BLAT של הדפדפן הגנומי של אוניברסיטת קליפורניה.
- שימור אזור לא מקודד: האזור חולק לחלונות לא חופפים באורך של 125 זוגות בסיסים. חלונות כאלו שהראו חפיפה של פחות מ-75% עם הרצף המקביל מעכבר הוסרו. כדי לבדוק שהאזורים לא מקודדים נבדקה החפיפה למאגרי נתונים רבים, כגון Ensembl, GenBank ו-spliced ESTs.
תוצאות שלב הפיילוט
שלב הפיילוט הסתיים בהצלחה והתוצאות פורסמו בכתב העת נייצ'ר ביוני 2007 ובגיליון מיוחד של Genome Research. הפרסום כלל את הדיווח על המידע שנצבר שזמין לציבור וכן גילויים חדשים על תפקידים האזורים הלא מקודדים. דגשים מתוך הפרסום:
- הגנום משועתק בצורה נרחבת, בצורה כזו שרוב הבסיסים קשורים לפחות לתעתיק ראשי אחד, ותעתיקים רבים מקשרים בין אזורים מרוחקים בגנום כדי ליצור אזורים שמהם משועתקים חלבונים.
- תעתיקים רבים שאינם מקודדים לחלבונים זוהו, כאשר רבים מהם חופפים לאזורים שזוהו כאזורים המקודדים לחלבון ואחרים לאזורים שנחשבו למושתקים מבחינה שעתוקית.
- זוהו אתרי תחילת שעתוק (TSS) רבים, בעלי מאפיינים דומים לקדמים ידועים, כמו מבנה הכרומטין ורצף הכרה של חלבונים.
- רצפי בקרה המקיפים אתר תחילת שעתוק מבוזרים בצורה סימטרית, כך שאין העדפה לכיווניות של מעלה הזרם.
- נגישות הכרומטין ומודיפיקציות על היסטונים מנבאים בצורה טובה נוכחות ופעילות של אתר תחילת שעתוק.
- אזורים הרגישים לחיתוך על ידי דנא"ז המרוחקים מגנים הם בעלי מאפיינים ברורים המבדילים אותם מקדמים. חלקם מראים מאפיינים של מבודדים.
- תזמון שכפול ה-DNA נמצא בהתאמה למבנה הכרומטין.
- 5% מהבסיסים בגנום מזוהים בבטחה כנמצאים תחת דחפים אבולוציוניים ביונקים. עבור כ-60% מבסיסים אלו יש עדויות לפעילות על בסיס ניסויים שנערכו.
- אף על פי שקיימת חפיפה בין אזורים גנומיים שזוהו על ידי ניסויים לבין אלו שהוגדרו כנמצאים תחת דחפים אבולוציוניים, לא כל הבסיסים באזור מראים על דחף אבולוציוני.
- מרכיבים פונקציונליים שונים מגוונים מבחינת הרצף שלהם בהשוואה של אנשים שונים.
- באופן מפתיע, מרכיבים פונקציונליים שונים אינם נמצאים תחת דחפים אבולוציוניים ביונקים. זה מצביא על האפשרות כי קיים מאגר של מרכיבים נייטרלים אשר פעילים מבחינה ביוכימית אך אין להם יתרון ספציפי לאורגניזם. ייתכן כי זה משמש מעין מחסן לתכונות שיובילו לברירה טבעית, כמקור של מרכיבים ספציפיים למין מסוים, ופונקציונליות שמורה אך לא אורתולוגית בין זנים.
שלב 3: שלב יצירת התוכן
בספטמבר 2007 החל המכון הלאומי לחקר הגנום האנושי במימון השלב השלישי של המיזם - בהיקף של למעלה מ-80 מיליון דולר על פני ארבע שנים. בשלב זה גם פעל מרכז תיאום נתונים, מרכז ניתוח נתונים ומרכז לפיתוח טכנולוגיות. בשלב זה, עם התפתחות טכנולוגיית ריצוף DNA, מדענים אספו מידע רב, בהיקף של כ-15 טרה-בתים של נתונים. עד 2010, למעלה מ-1000 ניסויים ברמה גנומית נערכו. ניסויים אלו הראו אלו אזורים משועתקים ל-RNA, אילו אזורים כנראה משמשים כאזורי בקרה בסוגי תאים מסוימים, ואילו אזורים נמצאים בקשר עם מגוון חלבונים שנבדקו. הניסויים העיקרי בהם השתמשו כדי לבנות את מאגר הנתונים הם: ChIP-seq, DNase I Hypersensitivity,RNA-seq ובדיקת המתילציות על DNA.
תוצאות שלב יצירת התוכן
בספטמבר 2012 המיזם פרסם סדרה רחבה יותר של תוצאות, בצורה של 30 מאמרים שפורסמו בו זמנית במספר כתבי עת: שישה בנייצ'ר, שישה ב-Genome Biology, וגיליון מיוחד עם 18 פרסומים של Genome Research. המאמרים תיארו את יצירת התוכן וניתוח ראשוני של 1,640 מערכי נתונים שנועדו לאפיין את כלל המרכיבים בגנום האנושי, שהתבצעו ב-147 סוגי תאים שונים. נתונים אלו שולבו עם נתונים אחרים, כמו ניסויים נוספים שהתבצעו ברמה הגנומית (GWAS) ואזורים בעלי דחפים אבולוציוניים. מאמצים אלו חשפו מאפיינים חשובים על ארגון ותפקוד הגנום האנושי, שהתפרסמו במאמר סקירה שהוקדש לעניין:
- הרוב המכריע של הגנום האנושי (80.4%) משתתף בלפחות תהליך ביוכימי אחד שמערב RNA או כרומטין בלפחות סוג תא אחד. רוב הגנום שוכן בסמיכות לאירוע רגולטורי: 95% מהגנום נמצא בטווח של 8Kbp מאתר קישור של DNA וחלבון (כפי שהתגלה בניסויי ChIP-seq ומציאת טביעת רגל חלבונית באמצעות DNase I) ו-99% נמצא בטווח של 1.7Kbp מאירוע ביוכימי שנמדד על ידי ENCODE.
- מרכיבים הייחודיים לפרימטים, וכן מרכיבים שלא זוהה אצלם שום דחף אבולוציוני ליונקים מראים במצטבר על ברירה שלילית, ולכן מצופה שלפחות חלקם יהיו פונקציונליים.
- סיווג הגנום לשבע מצבי כרומטין מצביע על קיומה של קבוצה של 399,124 אזורים בעלי מאפיינים דמויי-מעצם ו-70,292 אזורים בעלי מאפיינים דמויי-קדם, וכן מאות אלפי אזורים 'שקטים' אשר אינם מראים שום מאפיינים ידועים. סיווג הגנום ברזולוציה גבוהה יוצר קבוצות בעלי מצב כרומטין מסוים עם מאפיינים פונקציונליים מיוחדים.
- ניתן לכמת את המתאם בין ייצור מולקולות RNA ועיבודן לבין סמנים על הכרומטין וקישור של גורמי שיעתוק לקדם, כך שניתן לומר שפונקציונליות של הקדם יכולה להסביר את רוב השינויים בביטוי RNA.
- שינויים רבים באזורים שאינם מקודדים נמצאו במרכיבים שזוהו ב-ENCODE. מספרם הוא לפחות בגודל של השינויים המתרחשים באזורים מקודדים.
- SNP הקשורים למחלות שזוהו באמצעות ניסויים ברמה הגנומית (GWAS) מעושרים באזורים שאינם מקודדים לחלבונים, כאשר רובם שכנו בתוך מרכיבים גנומיים שזוהו, בסמוך לגן ידוע המקודד לחלבון. במקרים רבים, ניתן לקשר בין הפנוטיפ של המחלה לסוג תא או לגורם שעתוק מסוים.
הגילוי המרעיש ביותר של המיזם הוא שהחלק הפעיל ב-DNA האנושי גבוה במידה ניכרת מהאומדנים האופיטמיים: כ-80% מהגנום הוגדר כבעל פעילות ביוכימית, כאשר רובו מעורב בבקרה של רמות הביטוי של האזורים המקודדים, המהווים כ-1.5% מה-DNA. המרכיבים הבולטים שנוספו ל'אנציקלופדיה' בשלב זה:
- מפה של האזורים הרגישים לחיתוך על ידי האנזים DNase I, המהווים סמן לאזורי בקרה, מכיוון שהם נגישים לקישור של חלבונים שיכולים להשפיע על ביטוי גנים. זוהו כ-3 מיליון אזורים כאלו, אשר כללו בתוכם כמעט את כל האתרים הרגישים הידועים עד אז, וכן אתרים חדשים.
- לקסיקון של רצפי DNA קצרים היוצרים רצפי הכרה לחלבונים קושרי DNA. כ-8.4 מיליון רצפים כאלו נמצאו, המהווים כמות של יותר מפי שניים מהאקסום. באלפי קדמים נמצאו רצפים המכילים טביעות רגל של חלבונים.
- שרטוט ראשוני של רשת גורמי השעתוק, כלומר, מפה הקישורים של גורמי שעתוק המעודדים או מדכאים ביטוי גנים. הרשת התגלתה כרשת מורכבת, כאשר חלבונים פועלים ברמות שונות, וכן לולאות משוב מסוגים שונים.
- מדידה של האחוז הגנומי המסוגל לשעתק ל-RNA. חלק זה הוערך בלמעלה מ-75%, הרבה יותר מאשר האומדנים שהיו עד אז. המיזם גם החל בסיווג סוגי תעתיקי ה-RNA הנוצרים מאזורים שונים.
מיזמים נוספים
עם ההתקדמות לשלבו השלישי של המיזם, הוחלט להתרחב גם למיזמים נוספים בעלי מטרות מקבילות.
modENCODE
MODel organism ENCyclopedia Of DNA Elements) -modENCODE, בעברית: אנציקלופדיית מרכיבי DNA של אורגניזם מודל), הוא מיזם שמטרתו לזהות את האזורים הפונקציונליים באורגניזם מודל, ספציפית בזבוב הפירות ובסי אלגנס. ההרחבה לחיות נוספות מאפשר אימות לתוצאות הניסוייות והחישוביות מהמיזם באדם, דבר שקשה או בלתי אפשרי לעשות באדם. המימון לפרויקט ניתן ב-2007 מאת ה-NIH, והוא הופנה לכמה מעבדות מחקר בארצות הברית. המיזם הושלם בשנת 2012.
modERN
modERN (קיצור של model organism encyclopedia of regulatory networks, בעברית: האנציקלופדיה של רשתות הבקרה באורגניזם מודל), הוא הסתעפות של modENCODE. המיזם איחד את קבוצות המחקר שעסקו בזבוב הפירות ובתולעת סי אלגנס ומתמקד בזיהויים של אתרי קישור לגורמי שעתוק. המיזם החל במקביל לשלבו השלישי של ENCODE, ואמור להסתיים בשנת 2017. עד היום פורסמו 198 ניסויים, ועוד כ-500 נמצאים בשלב הניתוח.
גנומיקה של בקרת גנים
בתחילת שנת 2015 הושק המיזם לחקר בגנומיקה של בקרת גנים ((Genomics of Gene Regulation (GGR) על ידי ה-NIH. מטרת המיזם הוא לחקור רשתות גנים ומסלולים במערכות שונות בגוף, כדי להבין בצורה מעמיקה יותר את המנגנונים השולטים בביטוי גנים. נתוני המיזם מאוחסנים בפורטל מיזם ENCODE.
'מפת דרכים'
בשנת 2008 החלו ליצור ב-NIH את הקונסרציום למיפוי מפת הדרכים האפיגנטית, שמטרתו ליצור משאב ציבורי של מידע אפיגנטי אנושי כדי לזרז מחקרים בתחומי הביולוגיה הבסיסית והביולוגיה היישומית. המשימה הושלמה בפברואר 2015, בפרסום של ניתוח אינטגרטיבי של 111 אפיגנומים אנושיים. יחד עם 16 אפיגנומים ממיזם ה-ENCODE, הקונסרציום הגדיר אזורי בקרה על סמך השוואה של 127 אפיגנומים שונים. האפיגנומים זמינים לציבור הרחב במרשתת.
fruitENCODE
האנציקלופדיה של מרכיבי ה-DNA המשפיעים על התפתחות פרות בצמחים, שואפת להכיל מידע על המתילציות על ה-DNA, מודיפיקציות היסטונויות, נגישות הכרומטין, ביטוי הגנים, אזורי קישור של גורמי שעתוק של כל הפירות הבשרניים לאורך שלבי ההתפתחות שלו.
הסתייגויות
על אף שהקונסרציום טוען כי הם עוד רחוקים מסיום המיזם, נתקבלו תגובות חיוביות רבות לאור הפרסומים המדעיים והפופולריים של המיזם. טענת המיזם כי 80% מרצף ה-DNA פעיל ביוכימית הוביל לכותרות במדע הפופולרי שהכריז על מות ה-DNA זבל. עם זאת, הטענה בדבר הפונקציונליות הנרחבת של הגנום אינו מקובל בקרב כל החוקרים. המבקרים טוענים שהמונח פונקציונלי בו השתמשו במיזם קיבל פרשנות מאוד נרחבת, כך שכל קטע שעובר שעתוק מוגדר כפעיל, וזאת בניגוד לדעה הרווחת במחקר (המתבססת על שמירות רצפית הנלמדת מגנומיקה השוואתית) שישנם אזורים ב-DNA אשר עוברים שעתוק ואינם פעילים, כגון פסוידוגנים. בנוסף, נטען כי המיזם ביכרו רגישות על פני סגוליות, דבר המוביל לשגיאה מסוג I. טענה נוספת כנגד במיזם הוא הבחירה השרירותית של שורות התאים וגורמי השעתוק שנחקרו, כמו גם היעדר ביקורות מתאימות, דבר שעלול להוביל לכך שרצפים אקראיים של DNA מתנהגים בצורה דומה לאזורים שהוגדרו על ידי המיזם.
בתגובה לחלק מהביקורות, מדענים טענו שהמידע ב-ENCODE אשר נובע באופן ישיר מניסויים ביוכימיים משקף במידה רבה יותר את תפקוד ה-DNA מאשר המידע העקיף שנכרה בגנומיקה השוואתית, מכיוון שאומדני השמירות הרצפית הם יחסיים ומורכבים לבצע בגלל המנעד הגדול של גודל הגנום של יצורים שונים, אפילו של יצורים קרובים מאוד מבחינה אבולוציונית. המדענים טוענים שניתן להשתמש באומדן של שמירות הרצפית כדי לחזות מרכיבים פונקציונלים ברצף ה-DNA, אך הוא לא מגביל את המציאות הממשית של רצף פעיל. יתר על כן, נראה כי חלק גדול מהגנום מעורב בבקרת שעתוק אפיגנטית וחיוני להתפתחות של יצורים מורכבים. זו אינה טענה חדשה, וכבר עשרות שנים נטען כי ישנו חשיבות לאזורים הלא מקודדים ב-DNA. מלכתחילה המיזם לא שאף להגדיר אזורים על סמך השמירות האבולוציונית, אלא על סמך החשיבות הרפואית, מכיוון שברירה אבולוציונית אינה הכרחית ומספיקה כדי לבסס תפקוד מסוים. זוהי הגישה שבה נקטו במיזם, וישנן גישות אחרות במחקר החולקות על קו מחשבה זה.
בנוגע לטענה על השימוש במונח פונקציונלי, טענו חוקרים כי המיזם הגדיר מלכתחילה את המונח כאלמנטים בעלי תפקיד ביוכימי רלוונטי, כך שהיה מדויק יותר לנסח את המסקנה בצורה כזו: 80% מהגנום מעורב בפעילות ביוכימית סיבתית בתופעות הנחשבות רלוונטיות למחקר הביו-רפואי. עניין המינוח מתמזער בעוד המיזם צובר תאוצה, כאשר יותר ויותר מדענים מפרסמים מחקרים בהם מעורב מידע שנאגר במיזם, ואילו המאמרים המבקרים את המינוח התמעטו. אחד מהמדענים המשתתפים במיזם הגדיר את המונח פונקציונלי ככזה אשר יש לו פעילות ביוכימית ספציפית: שעתוק RNA, מודיפקציה היסטונית, רגישות לאנזים חיתוך, קישור לגורם שעתוק, מוטיב של גורם שעתוק ואקסונים.
ב-2014 ציינו חוקרי ה-ENCODE כי בספרות המקצועית הוגדרו אזורים פעילים בגנום באופן שונה בהתאמה לגישה המחקרית שננקטה. שלוש הגישות העיקריות לזיהוי אזורים פעילים הם גישות גנטיות (המתבססות על שינוי בפנוטיפ), גישות אבולוציוניות (המתבססות על שמירות) וגישות ביוכימיות (המתבססות על ניסויים ביוכימיים, כפי שנעשה במיזם זה). לשלוש הגישות יש מגבלות: בגישות הגנטיות יתפספסו אזורים פונקציונליים שאינם באים לידי ביטוי באורגניזם, בגישות האבולוציונית יש בעיית של שונות גנומית מרובה אפילו בין יצורים קרובים והגישות הביוכימיות חושפות סימנים שלא בהכרח מעידים על פעילות. החוקרים טוענים שבניגוד לשתי הגישות הראשונות, הגישות הביוכימיות לא רק מרמזות על פוטנציאל הפעילות של רצף מסוים, אלא גם נותנות מידע על סוגי תאים בהם הרצף פעיל. שילוב של הגישות השונות יחד כמשלימות אחת את השנייה יכול לסייע באיתור אזורים פעילים במצבים תקינים ובמחלות. הם טוענים כי המפות הביוכימיות של הגנום שפורסמו במסגרת המיזם התגלו כבעלי הערך הרב ביותר, מכיוון שהם משמשים נקודות פתיחה למחקרים נוספים שמנסים להבין את הקשר בין חתימות אופייניות לפעילות מולקולרית, תאית ושל האורגניזם עצמו.
ביקורת נוספת על המיזם היא במישור הכלכלי. עלותו הגבוהה של המיזם (כ-400 מיליון דולר), מבטאת העדפה של תמיכה ב'מדע גדול', וזה בא על חשבון מחקרים יזומים על ידי חוקרים, הנחשבים יצרניים יותר. ישנם חוקרים הטוענים כי התועלת המופקת מהמיזם לא מגיע להיקף ההשקעה הכספית. כדי לבדוק את הטענה הזו, נבדקו כמות המאמרים שפורסמו ולמידע מה-ENCODE היה חלק מרכזי בהם. זוהי לא משימה טריוואלית, מכיוון שהמונח ENCODE אינו ייחודי למיזם והוא נמצא בשימוש נרחב. עד 2012 התפרסמו כ-300 מאמרים כאלו, מתוכם 110 של מעבדות אשר לא קיבלו מימון מהמיזם.
ביקורות נשמעו לא רק מהפן הכלכלי, אלא גם מהזמן שהושקע במיזם. נטען כי כמות התוצאות לא מצדיקה את כמות הזמן במיזם, אשר מבחינה מהותית לא יושלם לעולם. על אף ההשוואות למיזם ה-HGP, מיזם גנום האדם, למיזם זה היה נקודות סיום ברורה, אשר אין כרגע למיזם ה-ENCODE.
אנשי המיזם מציגים סימפתיות לסוגיות המדעיות, במקביל לניסיונות להצדיק את המאמצים, על ידי מתן ראיונות והסברים מפורטים הן לקהילה המדעית והן לציבור הרחב. הם מזכירים כי לקח חצי מאה מאז שהבינו שה-DNA הוא החומר התורשתי ועד לפענוח הרצף, ולכן הם משערים שגם מיזם זה נדרש מימד של זמן כדי להבין את חשיבותו.
ראו גם
26472944ENCODE