המילון ההיסטורי ללשון העברית
המילון ההיסטורי ללשון העברית הוא מפעל מחקרי רחב היקף של האקדמיה ללשון העברית, שמטרתו להעמיד מילון מדעי ללשון העברית על כל רבדיה ההיסטוריים, מן העת העתיקה ועד שנת 1947. בראש המערכת עומד פרופ' חיים אליעזר כהן, וחברים בה פרופ' שמואל פסברג וד"ר גבריאל בירנבאום, שמשמש גם ככותב הערכים הראשי.
הקמת מפעל המילון ההיסטורי
יוזם מפעל המילון ההיסטורי היה נשיאהּ הראשון של האקדמיה ללשון העברית, פרופ' נפתלי הרץ טור סיני, שהעלה את הרעיון בשנות החמישים. ההחלטה על הקמת המפעל התקבלה באקדמיה בשנת 1955.[1] בשנים הראשונות נעשתה מלאכת הכנת המילון בלשון המקרא בלבד, בראשותו של פרופ' טור סיני ובמימון מוסד ביאליק.
בשנת 1959 הוחלט לשנות את מתכונת המילון. במקום לשון המקרא, הוחלט להתמקד בלשון החוץ מקראית, והקשר עם מוסד ביאליק נותק. האקדמיה החליטה על הקמת "מועצת מערכת המילון ההיסטורי",[2] ולמנהל המילון נתמנה פרופ' זאב בן חיים, אשר עמד בראש מפעל זה עד שנת 1992.
לצורך קביעת דמותו של המילון, ביקר בן חיים במערכות של מילונים חשובים באירופה, בהם המילון האנגלי של אוקספורד וה-Thesaurus Linguae Latinae. דין וחשבון על ממצאיו פורסמו בשנת 1959.[3]
בשנים 2011-1992 עמד בראש המפעל פרופסור אברהם טל.
הכנת המילון
איסוף המקורות
השלב הראשון בהכנת המילון היה בחירת היצירות שמהן יישאב החומר למילון. לצד היצירות החשובות מבחינת השפעתן על האומה (מקרא, משנה, תלמוד, מדרש) נקבע כי המקורות למילון יכללו גם יצירות הנותנות ייצוג לתקופות שונות ולמקומות גאוגרפיים שונים, אף אם חשיבותן הספרותית אינה רבה. כמו כן נכללו חיבורי הקראים, ונראה שאף חיבורי השומרונים עתידים להיכלל בין המקורות.
היות שמדובר במקורות רבים מאוד, החליט בן חיים להתמקד במקורות העת העתיקה: מחתימת המקרא ועד סוף תקופת הגאונים. הוחלט שלא לכלול את המקרא בין מקורות אלו, משום שהחומר המקראי נתון לחוקרים בקונקורדנציות ובמילונים טובים, וניתן בקלות לשאוב אותו משם.
בהתאם לתוכנית זו הוציאה האקדמיה בשנת 1963 את "ספר המקורות", הכולל רשימה כרונולוגית מפורטת של המקורות למילון, ולגבי כל מקור - באילו מהדורות וכתבי יד הוא נתון, ומהו כתב היד שממנו יובא החומר למילון. מהדורה שנייה מתוקנת של ספר המקורות יצאה בשנת 1970.
עם המקורות למילון ניתן למנות את:
- החומר האפיגרפי הקדום (חרסי לכיש, מגילות מדבר יהודה, תעודות נחל חבר)
- המשנה (על פי כתב יד קאופמן)
- התלמוד הבבלי (על פי כתבי יד תימניים)
- התלמוד הירושלמי (על פי כתב יד ליידן)
- מדרשי הלכה
- מדרשי אגדה
הקמת מסד הנתונים
השלב השני בהכנת המילון היה הכנת התשתית הטקסטואלית לצורך ליקוט חומר הגלם למילון. כל המקורות הספרותיים שנקבעו כבסיס למילון הועתקו למסד נתונים ממוחשב על פי כתב היד הטוב ביותר שלהם. עובדי המילון עברו על כל מילה במסד הנתונים ותייגו אותה לערך המילונאי שאליה היא משתייכת. בצורה זו הלכה ונוצרה קונקורדנציה רחבת היקף של כל המקורות העבריים הנכללים במאגר, ועובד המילון יכול היה לשלוף, תוך שניות בודדות, את כל המשפטים שבהם מופיעה מילה מסוימת בכל המקורות שהועלו למסד הנתונים.
בשנת 1982 פירסמה האקדמיה ערך לדוגמה מתוך המילון. הערך שנקבע היה השורש ער"ב על כל נגזרותיו, כגון: מערב, ערובה, עירובון, ערביים וכו' (למעשה מדובר במספר שורשי ער"ב הומוגרפיים). הערך לדוגמה כולל 88 עמודים, והוא התפרסם בכתב העת "לשוננו" שמוציאה האקדמיה ללשון העברית.[4]
בשנת 1992, עם הגיעו לגיל 84, פרש פרופ' זאב בן חיים מניהול המילון, ותחתיו נתמנה פרופ' אברהם טל. פרופ' טל החליט לפתוח את מסד הנתונים, שעד כה היה זמין לעובדי המילון בלבד, לציבור הרחב. בעקבות החלטתו זו יצא מספר שנים מאוחר יותר (1998) תקליטור הכולל את מסד הנתונים הממוחשב של התקופה העתיקה וכן תוכנה לחיפוש. תקליטור זה כונה "מאגרים".
מספר שנים מאוחר יותר, ועקב הצורך המתמיד לעדכן את מסד הנתונים, הוחלט לזנוח את פרסום המאגר באמצעות תקליטור, ולעבור לשיטה מקוונת. בשנת 2005, לאחר תקופת ניסיון קצרה, הועלה מסד הנתונים לאתר האינטרנט של האקדמיה ללשון העברית, ושמו - כשם התקליטור - "מאגרים". הגרסה המקוונת של "מאגרים" נחנכה באופן רשמי על ידי ראש הממשלה אהוד אולמרט בעת ביקורו באקדמיה ב־19 ביוני 2006, והיא נגישה כיום תמורת דמי שימוש שנתיים.
כיום כולל מסד הנתונים את כל החיבורים העיקריים של הלשון העברית בעת העתיקה. כיום (2012) הוקלדו למאגר למעלה מ-7,900 חיבורים, הכוללים למעלה מתשעה מיליוני מילים, וקיימים בו למעלה מ-36,000 ערכים. העבודה על מסד הנתונים נמשכת באופן מתמיד, הן בשל הצורך לעדכן את המסד על פי התקדמות המחקר, והן משום שמעת לעת מתגלים חיבורים עתיקים נוספים.
כתיבת הערכים
אף על פי ששלב הכנת מסד הנתונים טרם הסתיים במלואו (ולא ידוע מתי יסתיים), החלה האקדמיה בשנת 2005 בשלב השלישי והאחרון, והוא כתיבת הערכים של המילון. מטעמי נוחות הוחלט להתחיל בערכים של האות ת'. את הערכים כותב ד"ר גבריאל בירנבאום.
בחודש יוני 2006 הופצה בין חברי האקדמיה ועובדיה חוברת ניסיונית של המילון, הכוללת מקבץ ערכים קטן שנכתב עד אז. לשם המחשה, ערכי השורש תרגם מתפרסים במהדורה זו על פני 7 עמודים (14 טורים), והערכים תרנגול, וכן תרנגולת מתפרסים על פני 6 עמודים (12 טורים).
המילון כיום ובעתיד
אף על פי שכתיבת ערכי המילון החלה להיכתב רק בשנת 2005, מסד הנתונים שהוכן עבורו משמש חוקרים רבים, וכמעט אין עבודת מחקר שנעשית בתחום העברית הקלאסית וספרותה שאינה נזקקת בצורה ישירה או עקיפה למאגר זה. לפי גלעד צוקרמן, המילון ההיסטורי הוא התרומה החשובה ביותר של האקדמיה ללשון העברית למדינת ישראל והמקבילה הקרובה ביותר בארץ למילון האנגלי של אוקספורד.[5]
קישורים חיצוניים
- דף המילון ההיסטורי באתר האקדמיה ללשון העברית
- מסד הנתונים "מאגרים" באתר האקדמיה ללשון העברית
- ניר חסון, מלה אחר מלה: חוקרי האקדמיה מתעדים אלפי שנות שפה עברית, באתר הארץ, 6 באפריל 2012
הערות שוליים
- ^ זכרונות האקדמיה ללשון העברית, כרך א, עמ' 45.
- ^ זכרונות האקדמיה ללשון העברית, כרך ה, עמ' 62.
- ^ ז' בן-חיים, "לעשייתו של המילון ההיסטורי ללשון העברית", לשוננו כג (תשי"ט), עמ' 123-102.
- ^ לשוננו מו (התשמ"ב), חוברת 4-3.
- ^ עמ' 140 במאמר פוסקנות מפוכחת (realistic prescriptivism), מאמר אקדמי על האקדמיה ללשון העברית מאת פרופ' גלעד צוקרמן בכתב העת עיונים בשפה וחברה 1 (1), 2008, עמ' 154-135 (באנגלית).
23470060המילון ההיסטורי ללשון העברית