Music OCR

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

Music OCR הוא יישום של טכנולוגית זיהוי תווים אופטי לצורך המרת תווי מוזיקה מודפסים לפורמט דיגיטלי בר-עריכה (כגון MusicXML ו-LilyPond) ובר-נגינה (כגון MIDI).

היסטוריה

מחקר ראשוני בזיהוי של תווי מוזיקה מודפסים נעשה בשנות ה-60 המאוחרות של המאה ה-20 ב-MIT ומכונים נוספים. [1]

המוצר המסחרי הראשון בתחום, MIDISCAN, שוחרר ב-1991 על ידי חברת Musitek.

בניגוד לזיהוי אופטי של טקסט, שבו המילים מעובדות בטור, זיהוי אופטי של מוזיקה מחייב עיבוד של אלמנטים מקבילים. לכן, המיקום היחסי של סימני הדינמיקה והוראות ביצוע מוזיקליות נוספות מהווים חלק חשוב מאלגוריתם הזיהוי.

לתוכנות זיהוי מודרניות יכולת דיוק של מעל ל-99% עבור סריקה איכותית וסימון סטנדרטי.[דרוש מקור] מכיוון שנקודה מסמלת סטקטו או הארכת תו, כל "הפרעה" בסריקה עלולה לגרום לשגיאות בפענוח.

תוכנות לזיהוי אופטי של תווי מוזיקה

תוכנות קוד פתוח

  • Audiveris - מבוסס ג'אווה (רישיון: GPL)

תוכנות מסחריות

shazam (גרסה לפלאפונים)

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא Music OCR בוויקישיתוף

הערות שוליים

  1. ^ Pruslin, Dennis Howard, Automatic Recognition of Sheet Music, 1966 (גישה לקובץ בתאריך 2007-01-24)
Logo hamichlol 3.png
הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0