דחיסת תמונה
דחיסת תמונה היא הפעולה של דחיסת נתונים המיושמת על תמונות דיגיטליות, כדי להפחית את עלות האחסון והשידור שלהן. אלגוריתמים יכולים לנצל את מאפייני הראייה האנושית ואת המאפיינים הסטטיסטיים של התמונה כדי לספק תוצאות טובות בהרבה בהשוואה לשיטות דחיסת נתונים כלליות המשמשות לנתונים דיגיטליים אחרים.[1] תמונות דחוסות נשמרות בקובץ תמונה.
דחיסת תמונה מאבדת נתונים ומשמרת נתונים
דחיסת תמונה יכולה להיות מאבדת נתונים או משמרת נתונים. האלגוריתמים המשמשים לדחיסה מאבדת ודחיסה משמרת הם בעלי אופי שונה לחלוטין. דחיסה מאבדת מתאימה לתמונות טבעיות בעוד שדחיסה משמרת עדיפה לתמונות כגון גרפיקה, שרטוטים טכניים, קליפ ארט או קומיקס.
עבור תמונות טבעיות יתרונה הגדול של דחיסה מאבדת הוא יחס דחיסה עדיף, לעיתים באופן דרמטי, אך חסרונה הגדול הוא אובדן איכות. אבדן האיכות הוא פרמטר נשלט בדחיסה מאבדת ויכול לנוע בין אבדן זניח ובלתי מורגש עד לעיוותי דחיסה בוטים. ככל שהתמונה דחוסה יותר, דהיינו קטנה יותר בגודלה, איכות התמונה פוחתת.
דחיסת תמונות מאבדת נתונים מותאמת לראייה האנושית. היא יוצרת היררכיה בין פרטי התמונה על בסיס חשיבותם, כאשר החשיבות נגזרת ממאפייני הראייה. בפרט, שני מאפיינים מקבלים ביטוי בולט.
- הראייה האנושית רגישה פחות למרכיבי תמונה בתדירות גבוהה. אלו הם המרכיבים שמשתנים במהירות, שאפשר גם לקרוא להם הפרטים הקטנים.
- הראייה האנושית רגישה לשינוי בבהירות הרבה יותר מאשר לשינוי בצבע.
כאשר אלגוריתם הדחיסה המאבדת בוחר אילו נתונים לא לקודד, דהיינו לאבד, הבחירה היא בנתונים הפחות חשובים, שהראייה האנושית רגישה אליהם כמה שפחות.
הבחירה ברמת הדחיסה תשקף את האיזון הרצוי בין גודל לאיכות. דחיסה מאבדת נתונים המייצרת הבדלים זניחים עשויה להיקרא דחיסה משמרת נתונים חזותיים.
במקרים מסוימים נעשה שימוש בדחיסה משמרת עבור תמונות טבעיות. כאשר חשוב שלא לאבד אף פרט, למשל בהדמיה רפואית, דחיסה משמרת היא המועדפת.
קידוד התמרה
קידוד התמרה הוא השיטה הנפוצה ביותר לדחיסת תמונה מאבדת נתונים. מדובר בעיקר בשתי התמרות.
- התמרת קוסינוס בדידה (DCT), הייתה פיתוח מרכזי בדחיסת נתוני תמונה. ההתמרה הוצגה לראשונה ב-1972, על ידי נאסיר אחמד, כטכניקת דחיסה מאבדת נתונים.[2] דחיסת DCT הפכה לבסיס ל-JPEG, שהוצג על ידי קבוצת המומחים לצילום (JPEG) ב-1992.[3] JPEG דוחס תמונות לגדלים קטנים בהרבה, והפך לפורמט התמונה הנפוץ ביותר.[4] אלגוריתם הדחיסה המאוד יעיל של DCT היה אחראי במידה רבה לתפוצה הרחבה של תמונות דיגיטליות וצילום דיגיטלי,[5] עם כמה מיליארדי תמונות JPEG שנוצרו מדי יום נכון לשנת 2015.[6] התמרת קוסינוס בדידה (DCT) שייכת למשפחת ההתמרות הקשורות לפורייה.[7] ה-DCT מכונה לפעמים "DCT-II" בהקשר של קבוצת התמרות קוסינוס בדידות (ראו התמרת קוסינוס בדידה). ההתמרה מפרקת את התמונה למרכיבי גל בעלי תדירות, מה שמאפשר לקודד בדיוק נמוך יותר, או לא לקודד כלל, את המרכיבים שאליהם העין רגישה פחות.
- גם התמרת wavelet, החדשה יותר, נמצאת בשימוש נרחב. תקן JPEG 2000 פותח משנת 1997 עד 2000 על ידי ועדת JPEG בראשות Touradj Ebrahimi (לימים נשיא JPEG).[8] שלא כמו JPEG המתבסס על DCT, פורמט JPEG 2000 מתבסס על אלגוריתמים של התמרת waveket בדידה (DWT). הוא משתמש בהתמרת CDF 9/7 (שפותחה בידי אינגריד דובישי ב-1992) עבור אלגוריתם הדחיסה המאבדת שלו,[9] ובהתמרת wavelet של Le Gall-Tabatabai (LGT) 5/3[10][11] (פותח על ידי דידייה Le Gall and Ali J. Tabatabai בשנת 1988)[12] עבור הדחיסה המשמרת שלו.[9] טכנולוגיית JPEG 2000, כולל ההרחבה Motion JPEG 2000, נבחרה כתקן קידוד הווידאו לקולנוע דיגיטלי בשנת 2004.[13]
בשני המקרים, JPEG ו-JPEG2000, קידוד תמונה מתבצע בחמישה שלבים.
- התמרת צבעים. פיקסל של תמונה צבעונית מורכב משלושה רכיבי צבע: אדום, ירוק וכחול. התמרת צבעים ממירה את שלושת הצבעים ברכיב של בהירות ושני רכיבי צבעיות (צִבְעִיּוּת, באנגלית: chroma). ההמרה מתבצעת מפני שהעין האנושית רגישה לרכיב הבהירות הרבה יותר מאשר לרכיבי הצבעיות, כך שפגיעה באיכות הצבעיות פוגעת באיכות התמונה הרבה פחות מאשר פגיעה באיכות הבהירות. אפשר לכן לקודד רק חלק ממידע הצבעיות, בפרט על ידי דגימת הצבעיות בהפרדה נמוכה יותר. ב-JPEG קיימת אופציה לשמור רק רבע ממידע הצבעיות, לעומת מידע הבהירות. אופציה זו, לבדה, מספקת יחס דחיסה של 2:1 עוד לפני שלבי הדחיסה הבאים. התמרת הצבעים השכיחה היא YCbCr.
- חלוקה לבלוקים. JPEG מחלק את התמונה לבלוקים של 8x8 פיקסלים. ב-JPEG2000 אפשר לבחור את גודל הבלוק והוא יכול להיות מלבני, ואף התמונה כולה יכולה להיות בלוק.
- התמרה גלית. JPEG משתמש ב-התמרת קוסינוס בדידה (DCT) ו-JPEG2000 משתמש בהתמרת wavelet.
- קוונטיזציה. לאחר ההתמרה, המקדמים שייצרה ההתמרה עוברים קוונטיזציה כדי להפחית את מספר הביטים הנחוץ לייצוגם, וזאת על חשבון האיכות. זהו השלב העיקרי שבו נוצרים אבדן נתונים, ירידה באיכות וחסכון בגודל. כאמור לעיל, הקוונטיזציה מתבססת על מאפייני הראייה האנושית. הפלט של שלב הקוונטיזציה הוא רצף של מספרים שלמים.
- קידוד אנטרופיה. זהו השלב הסופי והוא משתמש בדחיסה משמרת. ב-JPEG, הפלט של הקוונטיזציה מקודד כל ואילו ב-JPEG2000, לא בהכרח.
שיטות נוספות לדחיסה מאבדת נתונים:
- קוונטיזציה של צבע מצמצמת את מרחב הצבעים לכמה צבעים "מייצגים" בתמונה. הצבעים שנבחרו מפורטים בלוח הצבעים ברשומה הראשית של התמונה הדחוסה. כל פיקסל מצביע לאינדקס של צבע בלוח הצבעים. ניתן לשלב שיטה זו עם גוונון כדי למנוע מעברים חדים.
- לוח צבעים לתמונות שלמות, לרוב 256 צבעים, נמצא בשימוש בפורמטים של קובצי GIF ו-PNG.
- לוח צבעים לבלוק, לרוב 2 או 4 צבעים לכל בלוק של 4x4 פיקסלים, נמצא בשימוש ב-BTC, CCC, S2TC ו-S3TC.
- תת-דגימת צבעיות מיישמת את התמרת הצבעים המשמשת כשלב הראשון בקידוד התמרה לדחיסת תמונה מאבדת, כמוסבר לעיל.
- דחיסה פרקטלית מסתמכת על כך שלעיתים קרובות חלק אחד בתמונה דומה לחלקים אחרים באותה התמונה.
שיטות לדחיסה משמרת נתונים:
- קידוד אורך חזרה - משמש בשיטת ברירת המחדל ב-PCX וכאחת האפשריות ב-BMP, TGA, TIFF
- קידוד על ידי חזוי - משמש ב-DPCM
- קידוד אנטרופיה - שתי טכניקות קידוד האנטרופיה הנפוצות ביותר הן קידוד אריתמטי וקוד האפמן
- אלגוריתמים של מילון מותאם כגון LZW - משמשים ב-GIF ו-TIFF
- DEFLATE - משמש ב-PNG, MNG ו-TIFF
- קודי שרשרת
תכונות נוספות
המטרה המרכזית של דחיסת תמונה היא השגת איכות התמונה הטובה ביותר ביחס דחיסה (או קצב נתונים) נתון. עם זאת, ישנן תכונות חשובות נוספות לשיטות דחיסת תמונה:
מדרגיות: מתייחסת באופן כללי להפחתה מדורגת של איכות. שמות אחרים למדרגיות הם "קידוד בצעדים" או "זרמי נתונים מוטמעים". למרות הסתירה הפנימית, מדרגיות עשויה להימצא גם בדוחסים משמרים, לרוב על ידי מעבר על הפיקסלים בצעדים של בניית דיוק. מדרגיות שימושית במיוחד עבור תצוגה מקדימה של תמונות בזמן הורדתן (למשל בדפדפן אינטרנט) או למתן גישה לתמונות בדרגות איכות שונות. ישנם מספר סוגים של מדרגיות:
- איכות מדורגת או שכבות מדורגות: זרם הנתונים משפר באופן מדורג את איכות התמונה המשוחזרת.
- רזולוציה מדורגת: הצעד הראשון הוא קידוד תמונה ברזולוציה נמוכה יותר, ובעקבותיו קידוד מדורג של הפער לרזולוציות גבוהות יותר.[14][15]
- דירוג רכיבים: גרסה ראשונה בגווני אפור, ואז הוספת צבע מלא.
קידוד אזור עניין: חלקים מסוימים בתמונה מקודדים באיכות גבוהה יותר מאחרים. אפשר לשלב קידוד זה עם מדרגיות, דהיינו לקודד חלקים אלה תחילה, ואחרים לאחר מכן.
מטא נתונים: נתונים דחוסים יכולים להכיל מידע על התמונה שיאפשר חלוקה לקטגוריות, חיפוש או דפדוף בתמונות. מידע כזה עשוי לכלול נתונים סטטיסטיים של צבע ומרקם, תמונות קטנות לתצוגה מקדימה ומידע על יוצר או זכויות יוצרים.
כוח עיבוד: אלגוריתמים לדחיסה דורשים כמויות שונות של כוח עיבוד לקידוד ולפענוח. חלק מהאלגוריתמים המספקים דחיסה גבוהה מחייבים גם כוח עיבוד גבוה.
האיכות של שיטת דחיסה נמדדת לעיתים קרובות לפי שיא היחס אות-לרעש. הוא מודד את כמות הרעש שנוצרה על ידי דחיסה מאבדת של התמונה. עם זאת, השיפוט הסובייקטיבי של הצופה נחשב גם כמדד חשוב, אולי המדד החשוב ביותר.
קישורים חיצוניים
- Image compression – lecture from MIT OpenCourseWare
- Image Coding Fundamentals
- A study about image compression – with basics, comparing different compression methods like JPEG2000, JPEG and JPEG XR / HD Photo
- Data Compression Basics – includes comparison of PNG, JPEG and JPEG-2000 formats
- FAQ:What is the state of the art in lossless image compression? from comp.compression
- IPRG – an open group related to image processing research resources
- Advantages And Disadvantages of Image Compressor
הערות שוליים
- ^ "Image Data Compression".
- ^ Ahmed, Nasir (בינואר 1991). "How I Came Up With the Discrete Cosine Transform". Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z.
{{cite journal}}
: (עזרה) - ^ "T.81 – DIGITAL COMPRESSION AND CODING OF CONTINUOUS-TONE STILL IMAGES – REQUIREMENTS AND GUIDELINES" (PDF). CCITT. בספטמבר 1992. נבדק ב-12 ביולי 2019.
{{cite web}}
: (עזרה) - ^ "The JPEG image format explained". BT.com. BT Group. 31 במאי 2018. נבדק ב-5 באוגוסט 2019.
{{cite web}}
: (עזרה) - ^ "What Is a JPEG? The Invisible Object You See Every Day". The Atlantic. 24 בספטמבר 2013. נבדק ב-13 בספטמבר 2019.
{{cite web}}
: (עזרה) - ^ Baraniuk, Chris (15 באוקטובר 2015). "Copy protections could come to JPEGs". BBC News. BBC. נבדק ב-13 בספטמבר 2019.
{{cite news}}
: (עזרה) - ^ Nasir Ahmed, T. Natarajan and K. R. Rao, "Discrete Cosine Transform," IEEE Trans. Computers, 90–93, Jan. 1974.
- ^ Taubman, David; Marcellin, Michael (2012). JPEG2000 Image Compression Fundamentals, Standards and Practice: Image Compression Fundamentals, Standards and Practice. Springer Science & Business Media. ISBN 9781461507994.
- ^ 9.0 9.1 Unser, M.; Blu, T. (2003). "Mathematical properties of the JPEG2000 wavelet filters" (PDF). IEEE Transactions on Image Processing. 12 (9): 1080–1090. Bibcode:2003ITIP...12.1080U. doi:10.1109/TIP.2003.812329. PMID 18237979. אורכב מ-המקור (PDF) ב-2019-10-13.
- ^ Sullivan, Gary (8–12 בדצמבר 2003). "General characteristics and design considerations for temporal subband video coding". ITU-T. Video Coding Experts Group. נבדק ב-13 בספטמבר 2019.
{{cite web}}
: (עזרה) - ^ Bovik, Alan C. (2009). The Essential Guide to Video Processing. Academic Press. p. 355. ISBN 9780080922508.
- ^ Le Gall, Didier; Tabatabai, Ali J. (1988). "Sub-band coding of digital images using symmetric short kernel filters and arithmetic coding techniques". ICASSP-88., International Conference on Acoustics, Speech, and Signal Processing: 761–764 vol.2. doi:10.1109/ICASSP.1988.196696.
- ^ Swartz, Charles S. (2005). Understanding Digital Cinema: A Professional Handbook. Taylor & Francis. p. 147. ISBN 9780240806174.
- ^ Burt, P.; Adelson, E. (1 באפריל 1983). "The Laplacian Pyramid as a Compact Image Code". IEEE Transactions on Communications. 31 (4): 532–540. CiteSeerX 10.1.1.54.299. doi:10.1109/TCOM.1983.1095851.
{{cite journal}}
: (עזרה) - ^ Shao, Dan; Kropatsch, Walter G. (בפברואר 3–5, 2010). Špaček, Libor; Franc, Vojtěch (eds.). "Irregular Laplacian Graph Pyramid" (PDF). Computer Vision Winter Workshop 2010. Nové Hrady, Czech Republic: Czech Pattern Recognition Society.
{{cite journal}}
: (עזרה)
דחיסת תמונה34695409Q412438