חישוב רב-משתתפים בטוח
בקריפטוגרפיה ואבטחת מידע, חישוב רב משתתפים בטוח (באנגלית: Secure multi-party computation; בקיצור SMPC או MPC), הוא ענף בקריפטוגרפיה העוסק בשיטות לחישוב פונקציה מוסכמת של קלטים ממשתתפים שונים באופן שהקלטים עצמם נשארים סודיים וזאת מבלי להיעזר בצד שלישי. בניגוד לקריפטוגרפיה רגילה בין משתתפים שסומכים זה על זה כשהפרוטוקול אמור להגן עליהם מפני גורמים חיצוניים, במודל זה המשתתפים לא בהכרח סומכים זה על זה והפרוטוקול אמור להגן על המשתתפים עצמם זה מזה במידה וחלקם או רובם בלתי הגונים או מושחתים.
מערכת קריפטוגרפית רגילה אמורה בשלב כלשהו לפענח את המידע הסודי ולאחסנו במקום כלשהו בזיכרון במצב גלוי לפחות לפרק זמן מסוים וזה מהווה סיכון בפני עצמו. במיוחד אם השרת האמון על הגנה על המידע נפרץ או בגד באימון שניתן בו. הקריפטוגרפיה המוכרת כיום מטפלת רק בהגנה על מידע בעת העברתו או בעת אחסונו, חישוב רב משתתפים מנסה לתת מענה לחוליה החסרה והיא הגנה על המידע בזמן עיבודו. כך שהמידע אינו מגיע למצב גלוי באף שלב. לחישוב רב משתתפים חשיבות רבה בהיבטים שונים של אבטחת מידע כמו מחשוב ענן, הצבעה דיגיטלית, מכרז מקוון, מִדּוּד (בוחן ביצועים) וניתוח סטטיסטי.
היסטוריה
חישוב רב משתתפים נחשב לאחד היעדים החשובים ביותר של הקריפטוגרפיה המודרנית ולו היסטוריה ארוכה. החל עם עבודתו של אנדרו יאו, בתחילת שנות השמונים של המאה הקודמת, שהציע פרוטוקול לשני משתתפים שנקרא בקיצור 2PC[1][2]. הפרוטוקול תואר בצורת משל הנקרא בעיית המליונרים שהיא בעיה בוליאנית. שני מיליונרים רוצים לדעת מי מהם יותר עשיר מבלי לחשוף את הונם האישי. במקרה זה הקלט הוא הונם האישי והפלט הוא סיבית אחת. הוא הציע פתרון המבוסס על מעגל בוליאני מעוות. לאחר מכן הציעו גולדרייך, מיקאלי וויגדרזון הרחבה של הפרוטוקול ליותר משתתפים, המבוסס על חלוקת סוד והוכחה באפס ידיעה[3], מה שהפך במרוצת הזמן למודל כללי ששימש כהשראה ובסיס לפרוטוקולים החדשים שבאו אחריו[4][5]. מתוך כך התפתח ענף חדש בקריפטוגרפיה הנקרא חישוב פונקציונלי בטוח בקיצור (SFE) או באופן כללי יותר קריפטוגרפיה פונקציונלית (בקיצור FE).
עד שנות ה-2000 נחשב חישוב רב משתתפים לנושא בעל ערך תאורטי בלבד, במרוצת השנים חלה התקדמות משמעותית וכיום כבר אפשר למנות מספר מערכות מעשיות שפועלות בהצלחה על עיקרון של חישוב רב משתתפים בטוח. בשנת 2008 הופעל לראשונה פרויקט חישוב רב משתתפים בטוח במסגרת מכרז לחוזי סלק סוכר בהשתתפות 1200 מגדלים בדנמרק[6]. הפרויקט נועד להעריך את מחיר השוק של סלק הסוכר בהסתמך על נתונים שנאספו מהמגדלים בצורה כזו שאף אחד מהם לא נזקק לחשוף את תעריפי הקנייה/מכירה שלו. אמנם החישוב ארך כשלושים דקות, שזה לא רע עבור אירוע שקורה רק פעם בשנה, אבל במקרה הכללי זה עשוי להיות בעייתי. נושא היעילות הוא הבעיה הגדולה ביותר של התחום הזה ושל הקריפטוגרפיה המתקדמת בכלל.
באופן כללי אפשר לבסס חישוב רב משתתפים על שילוב של ארבעה פרימיטיבים קריפטוגרפיים ידועים: הצפנה הומומורפית, העברה עלומה, הוכחה באפס ידיעה וחלוקת סוד. הצפנה הומומורפית מלאה פרקטית לא קיימת לכן ישנן הצעות לשימוש בהצפנה הומומורפית חלקית, כמו SPDZ[7]. הפרוטוקולים הראשונים שפותחו הסתמכו על ההנחה שקיים ערוץ תקשורת בטוח כך שכל אחד מהשחקנים יכול להעביר לשני הודעה בצורה מזוהה כמו למשל בשימוש עם תשתית PKI (עם חתימה דיגיטלית ופונקציית גיבוב) והפרוטוקול אמור להתמודד עם סיטואציה שבה חלק מהשחקנים הגונים וחלקם מה שנקרא 'הגונים למחצה' או מושחתים, כשרובם נחשבים הגונים וכן גם בסיטואציות שבהן רוב השחקנים מושחתים. ההבדל בין שחקן הגון למחצה לבין שחקן מושחת הוא שהראשון ממלא אחר הוראות הפרוטוקול אבל הוא בכל זאת מעוניין לדעת כמה שיותר על הסודות של האחרים ואילו בשני ההנחה היא שהוא מסוגל לסטות מהוראות הפרוטוקול במטרה לעוות את התוצאה ולגרום לפלט שונה. חישוב רב משתתפים בטוח כללי אמור לתת מענה גם במקרים בהם לא קיים ערוץ בטוח בין השחקנים וכולם למעט אחד מושחתים. במקרה הכללי בלתי אפשרי להבטיח חישוב רב משתתפים אם יותר משליש מהשחקנים אינם הגונים או מושחתים. במרוצת השנים המודל הכללי של חישוב רב משתתפים בטוח הפך כר פורה למחקר.
תיאור כללי
בעיית חישוב רב משתתפים היא כדלהלן: ישנם שחקנים המסומנים , כל אחד מהם מחזיק במידע פרטי משלו המסומנים בהתאמה. ונניח שהם הסכימו על פונקציה שהם רוצים לחשב על המידע הפרטי שלהם, אבל הם אינם סומכים זה על זה והם לא רוצים לחשוף או לשתף את המידע האישי שלהם. פתרון פשוט לבעיה האמורה יכול להיות הפרוטוקול הבא: השחקנים ימנו צד שלישי נאמן וימסרו לו את כל המידע הפרטי שלהם. הוא יחשב עבורם את הפונקציה על המידע הפרטי ויפרסם את התוצאה. זהו הפתרון שננקט בפועל בימינו אבל יש בו חסרונות. לא תמיד האמון שניתן בצד השלישי מוצדק ובמיוחד ייתכנו סיטואציות מסוימות שבהן אי אפשר לסמוך על צד שלישי. פרוטוקול MPC אמור להחליף את הפונקציונליות של הצד השלישי, בשני היבטים חשובים:
- פרטיות. המידע המושג מהרצת הפרוטוקול אינו אמור לסייע לאף שחקן או קואליציה של שחקנים לא הגונים לגלות משהו אודות המידע הפרטי של שחקן אחר, מעבר למידע שנחשף באופן אינהרנטי כתוצאה מהפרוטוקול עצמו.
- נכונות. כל קואליציה של שחקנים בלתי הגונים המשתפים פעולה כדי להטות את תוצאת הפרוטוקול לא תוכל לכפות על שחקן הגון להוציא פלט לא נכון, במילים אחרות שחקן הגון יכול לסמוך על כך שפלט הפרוטוקול נכון אפילו בנוכחות שחקנים מושחתים.
ההגדרה האחרונה מחמירה מאוד בכך שהיא אומרת שהפרוטוקול מבטיח שהתוצאה תהיה תמיד נכונה חרף מאמצי השחקנים המושחתים, שלא בהכרח ממלאים אחר הוראות הפרוטוקול, והם יעשו הכול כדי להטות את התוצאה ולהשיג מידע סודי כלשהו של שחקנים אחרים. מסתבר שהגדרה זו בלתי אפשרית ליישום בעולם האמיתי במקרים מסוימים ולכן הוצעה גרסה יותר מרוככת שלה, שמבטיחה רק כי בכל מקרה שבו התוצאה אינה נכונה הדבר יתגלה ויגרום לעצירת הפרוטוקול. היכולת של שחקן הגון לעצור את הפרוטוקול יכולה להספיק במקרים רבים.
מודל ביטחון
כדי להעריך ביטחון של פרוטוקול חישוב רב משתתפים קריפטוגרפי, מאמצים סגנון של "סימולציה". נניח שקיים עולם אידיאלי שבו הפרוטוקול מבוצע על ידי צד שלישי נאמן ובהגדרה מוסכם שהצד השלישי תמיד הגון ודיסקרטי. בעולם האמיתי הפרוטוקול מבוצע על ידי השחקנים עצמם והמתקיף שיכול להיות אחד או יותר מהשחקנים המשתתפים בפרוטוקול, או גורמים חיצוניים, שמנסים לגלות מידע פרטי של אחד או יותר מהשחקנים ההגונים. אומרים שהפרוטוקול יהיה בטוח אם כל התקפה שתימצא נגד הפרוטוקול אפשר יהיה "לדמות" גם בעולם האידיאלי. קיומו של סימולטור כזה מבטיח שהפרוטוקול המעשי יהיה קרוב במידת האפשר לעולם האידיאלי שהוא בטוח בהגדרה.
השאלה העיקרית שעוסקים בה מהיבט תאורטי היא עם כמה יריבים הפרוטוקול יכול להתמודד בו זמנית. ההנחה היא שכל היריבים מתואמים ביניהם, אם כי זה לא בהכרח תמיד נכון. העדפה היא להבטיח שהפרוטוקול בטוח גם אם רק שחקן אחד בלבד נותר הגון, אבל במקרה כזה העלות מבחינה חישובית גבוהה ולא תמיד זה ניתן. לעומת זאת אם נוכל להתפשר על מצב שבו רק מיעוט מהשחקנים מושחת אז אפשר להגיע לפרוטוקול יעיל מבחינה מעשית. כמו כן יש להבחין בין יריבים סטטיים לבין יריבים אדפטיביים. במקרה השני, היריב יכול להחליט איזה שחקן להשחית אחרי שהפרוטוקול מתחיל.
שאלה נוספת שמתעוררת היא עם איזה סוגים של יריבים הפרוטוקול מסוגל להתמודד. קיימים ארבעה סוגים עיקריים בהתאם לאסטרטגיה שלהם:
- יריב פסיבי. היריב הבסיסי ביותר, שמניחים שהוא אינו יכול לסטות ממהלכי הפרוטוקול, אלא הוא מוכרח לבצע את הפרוטוקול כלשונו ומתוך כך הוא מנסה לגלות מידע לגבי הקלט של שחקנים אחרים. יש עניין בדיון התאורטי לגבי יריב פסיבי, למרות שזו הגדרה מאוד חלשה, כי אפשר להוכיח שניתן להמיר פרוטוקול בטוח נגד יריב פסיבי לפרוטוקול בטוח נגד יריב אקטיבי.
- יריב אקטיבי. יריב כזה שמניחים שהוא יכול לסטות ממהלכי הפרוטוקול כרצונו במטרה לשנות את התוצאה והוא מנסה לאסוף כמה שיותר מידע לגבי הקלט של השחקנים ההגונים.
- יריב סמוי. הוא יריב אקטיבי שמסתיר את כוונתו. הוא אינו בהכרח מבצע את הפרוטוקול כלשונו אבל מצד שני הוא לא רוצה להיתפס בקלקלתו. האם גורם הנחשב הגון יעמיד בסכנה את המוניטין שלו כדי להשיג מידע כלשהו על שחקן אחר תלוי בחשיבות המידע שהוא מנסה להשיג לעומת ההפסד במידה שהוא נתפס.
- יריב רציונלי. זהו היבט חדש יחסית שדן ביריב שיש לו מטרה ספציפית והוא מוכן לרמות כדי להשיג יתרון משמעותי לגבי מטרה זו בלבד. מקרה כזה הוא ביטוי לחיבור בין שני תחומים, קריפטוגרפיה ותורת המשחקים ויש לזה השלכות מעשיות במקרים כמו מכרז מקוון[8].
מעבר ליריבים המנויים, תמיד קיים האיום של יריב חיצוני. מה שנקרא התקפת אדם באמצע. להתקפה כזו חשיבות רבה במיוחד במקרים בהם הפרוטוקול רץ במקביל עם שחקנים שונים, כך שהיריב יכול להצליב מידע בין הריצות השונות של הפרוטוקול. בקריפטוגרפיה סיטואציה כזו נקראת בשם הכללי מודל הרכבה אוניברסלי (באנגלית Universal Composable) בקיצור UC שדן בביטחון של פרוטוקול אינטראקטיבי קריפטוגרפי המורץ במקביל עם קלט שונה. הוכח שאין אפשרות להשיג מורכבות כזו בחישוב רב משתתפים בטוח אלא רק במקרה שבו יש לכל הצדדים סוד משותף, או באמצעות תשתית מפתח ציבורי, שמן הסתם יהיה צורך בה בכל מקרה.
פרוטוקול רב משתתפים בטוח מכיל מגבלה מובנית שאומרת שהשחקנים תמיד יכולים להשיג מידע כלשהו מתוך שילוב המידע הפרטי שלהם והתוצאה הסופית. אי אפשר להתחמק מזה. לצורך המחשה אם בפרוטוקול משתתפים שני שחקנים שמחשבים את סכום הקלטים שלהם, ברור שכל שחקן יכול לגלות מהו הקלט של השחקן השני בהינתן הקלט שלו והתוצאה הסופית כל מה שהוא צריך לעשות זה לחסר את הקלט שלו מהתוצאה ולקבל את הקלט של השחקן השני. פרוטוקול רב משתתפים אינו מבטיח שהמידע הפרטי ישאר סודי מעבר למה שיכול להבטיח מודל צד שלישי אידיאלי.
כשמדברים על פרוטוקול חישוב רב משתתפים בטוח בדרך כלל מנסחים אותו במונחים של מעגל אלקטרוני. ישנם שני סוגים: מעגל בוליאני ומעגל אריתמטי. למעשה עם מעגל בוליאני אפשר לבנות מעגל אריתמטי אבל הוא פחות יעיל. במעגל בוליאני של יאו המודל מורכב משני צדדים, צד נקרא בונה מעגל וצד נקרא מעריך. מצפין או מערבל את המעגל ושולח אותו ל-. בשלב זה מקבל מפתח המתאים לקלט של שהוא הסיבית . כדי לפענח את המידע צריך להשיג גם את המפתח אך חייב להיות מוסתר מ-. כדי להשיג את המפתח מ- באופן מוסתר הוא משתמש בפרוטוקול העברה עלומה שבו מפיק שני קלטים ו- מגריל סיבית קלט אחת ובסיום הפרוטוקול השיג את מבלי ש- יידע מהו . הערבול של המעגל מתבצע כך: כאשר רוצה להסתיר שער AND הוא מחשב ארבעה טקסטים מוצפנים:
אז הוא מבצע תמורה אקראית שלהם (מערבב אותם) ושולח את התוצאות ל- שיכול לפענח רק את הטקסט המוצפן שמתאים למפתח ומזה הוא יכול לדעת מהו . ההנחה היא ש- יכול לזהות הבדל בין פענוח נכון לפענוח לא נכון, אפשר למשל להוסיף מספר קבוע של אפסים בסוף ההודעה לפני ההצפנה כך שבסבירות גבוהה רק המפתח הנכון יניב תוצאה שתכיל מספר קבוע של אפסים בסופה, לעומת זאת פענוח עם מפתח שגוי יניב תוצאה הנראית אקראית לגמרי. דרך אחרת יותר יעילה נקראת Point-and-permute שבה אם נתייחס לשער המוצפן כאל טבלה, אפשר לקבוע שחלק מסיביות המפתחות ישמשו כאינדקסים לשורה ועמודה. הפלט של השערים יכול לשמש כמפתח להצפנת השכבה הבאה של שערים וכן הלאה, או ש- יכריז מהם . בכל אופן בדרך זו אפשר להצפין מעגל שלם בצורה שהמעריך יוכל לחשב את הפלט מבלי לדעת מהו הקלט. שזו המטרה של חישוב רב משתתפים.
הפרוטוקול של יאו שתואר בתמצית בטוח רק במסגרת מודל שבו היריב פסיבי בלבד. הבעיה העיקרית היא ש- יכול עקרונית לשלוח ל- מעגל המחשב פונקציה אחרת ממה שהוסכם מראש מבלי ש- יוכל לדעת זאת. כלומר במקרה כזה הוא יריב אקטיבי שיכול לסטות ממהלכי הפרוטוקול. באופן כללי כדי להתאים את הפרוטוקול שיהיה בטוח גם נגד יריב אקטיבי אפשר להפעיל פרוטוקול משני שנקרא Cut-and-choose כמו בהוכחה באפס ידיעה. ישלח ל- מספר מרובה של עותקים של המעגל הבוליאני המעוות ו- יבחר תת-קבוצה אקראית של מעגלים ש- יצטרך "לפתוח" (לחשוף בפניו את המעגלים המקוריים המתאימים להם), אם הוא רואה בכל המקרים שהמעגלים מחשבים את הפונקציה המוסכמת אז סטטיסטית הוא יכול להיות משוכנע ש- לא מרמה אותו ומנסה להגניב פונקציה אחרת.
למעגל אריתמטי יש עדיפות במקרים מסוימים מהיבט של יעילות. מעגל זה בדרך כלל מיישמים עם פונקציית הצפנה הומומורפית חלקית מעל פעולת החיבור או פעולת הכפל, למשל אם וכן אז כאשר הפעולה היא פעולה אריתמטית מודולו כלשהו. במקרה כזה יכול לשלוח ל- את שבתורו ינצל את תכונת ההומורפיות של ההצפנה כדי לחשב את . כעת יכול לפענח את זה כדי לקבל את מודולו . זהו מעין שיתוף סוד בין ל- מעל פעולת החיבור של ו- שהם הכפולה של הקלטים ו- כך שמתקיים .
פרויקטים
נכון לשנת 2019 קיימים מספר פרויקטים לחישוב רב משתתפים בטוח לשימוש כללי, ביניהם:
- Fairplay. חישוב פונקציות בטוח (SFE) שהוקם בחסות האוניברסיטה העברית בירושלים. זוהי מערכת מפותחת המאפשרת חישוב מעגל בוליאני על ידי שנים או יותר שחקנים עם ביטחון פאסיבי.
- VIFF תשתית המאפשרת יישום חישוב רב משתתפים בטוח הכולל אפשרות לחישובים אריתמטיים כמו חיבור וכפל בהתבסס על שיתוף סוד פסידו-אקראי של שמיר. עם תמיכה למקביליות.
- Sharemind. מערכת חישוב בטוח לשלושה משתתפים עם אפשרות לשחקן לא הגון פסיבי אחד לכל היותר. המערכת פותחה על ידי חברת Cybernetica מאסטוניה. הרעיון הוא במקום להחזיק בבסיס נתונים מרכזי לפזר את בסיס הנתונים על פני מספר נקודות חישוב. הפרויקט מתמקד סביב הבעיה של שיתוף וניתוח של מידע ממקורות שונים.
- TASTY. פרויקט חישוב בטוח לשני משתתפים המאפשר חישובים בוליאניים ואריתמטיים עם ביטחון פאסיבי בלבד, הפועל על שילוב של מעגל בוליאני מעוות עם הצפנה הומומורפית.
- Jana. בסיס נתונים התומך בחישוב רב משתתפים בטוח, שפותח על ידי חברת Galois מארצות הברית. בסיס הנתונים פועל לפי מודל שנקרא Priavte Data as Service או בקיצור PDaaS לבסיס נתונים יחסי. הייחודיות בבסיס הנתונים הזה שהוא מאפשר לבצע חישובים וסטטיסטיקות על המידע המצוי במסד הנתונים מבלי לפענח אותו.
- Partisia שהוקם על ידי חברה מדנמרק שנחשבת לחלוצה בתחום MPC. עיקר התמחותה הוא מכרזים מקוונים והיא יישמה לראשונה חישוב רב משתתפים במכרז לסוכר.
- Unbound Tech. חברה ישראלית המציעה תמיכה בשמירה על סודות ארגוניים כמו מפתחות הצפנה בכל סיטואציה בהתבסס על טכנולוגיות MPC.
הערות שוליים
- ^ Andrew C. Yao, Protocols for secure computations (extended abstract)
- ^ Andrew Chi-Chih Yao: How to Generate and Exchange Secrets (Extended Abstract). FOCS 1986: 162-167
- ^ Goldreich, Oded & Micali, Siltnb & Wigderson, Avi. (1987). A Completeness Theorem for Protocols with Honest Majority. Conference Proceedings of the Annual ACM Symposium on Theory of Computing
- ^ Zvi Galil, Stuart Haber, Moti Yung: Cryptographic Computation: Secure Fault-Tolerant Protocols and the Public-Key Model
- ^ David Chaum, Ivan Damgård, Jeroen van de Graaf: Multiparty Computations Ensuring Privacy of Each Party's Input and Correctness of the Result. 87-119
- ^ P. Bogetoft, D. Christensen, I. Damgard, M. Geisler, T. Jakobsen, M. Krøigaard, J. Nielsen, J. Nielsen, K. Nielsen, J. Pagter, M. Schwartzbach, and T. Toft. Secure multiparty computation goes live. In Financial Cryptography, 2009
- ^ I. Damgard, V. Pastro, N. P. Smart, and S. Zakarias. Multiparty computation from somewhat homomorphic encryption. In Advances in Cryptology – CRYPTO 2012, volume 7417 of LNCS, pages 643–662. Springer, 2012
- ^ P. Miltersen, J. Nielsen, and N. Triandopoulos. Privacy-enhancing auctions using rational cryptography. In CRYPTO, 2009
28408715חישוב רב-משתתפים בטוח