נפה ריבועית

שיטת הנפה הריבועית היא שיטה מהירה לפירוק לגורמים של מספר שלם, המתאימה בעיקר למספרים בני 40–100 ספרות עשרוניות (אלגוריתם rho של פולרד עדיף לפירוק מספרים קטנים יותר, בעוד שבמספרים ארוכים יותר נפת שדה המספרים היא השיטה היעילה ביותר).

שיטת הנפה הריבועית, שהייתה השיטה הראשונה בעלת סיבוכיות תת-מעריכית לבעיית הפירוק לגורמים, פותחה על ידי קארל פומרנץ בשנת 1981. פומרנץ הרחיב, למעשה, רעיונות קודמים של מוריס קרייצ'יק וג'ון ד' דיקסון. זו הייתה השיטה המהירה ביותר (באופן אסימפטוטי), עד להמצאתה של נפת שדה המספרים, ב-1993.

עקרונות הנפה הריבועית

בדומה לשיטות פירוק אחרות של מספרים שלמים הנקראות "ריבוע אקראי" (Random square), גם שיטת הנפה הריבועית מנסה לאתר זוג שלמים אקראיים $x, y$ עבורם $x^{2} \equiv y^{2} (\mod n)$ אבל $x \equiv̸ y (\mod n)$ . זוג כזה מאפשר לפרק את $n$ , משום ש- $n ∣ (x^{2} - y^{2}) = (x - y) (x + y)$ אולם אינו מחלק של $x - y$ או $x + y$ . על כן בסבירות גבוהה המחלק המשותף המקסימלי $\gcd {x - y, n}$ (שאותו אפשר למצוא ביעילות באמצעות אלגוריתם אוקלידס) יהיה גורם אמיתי של $n$ .

בקווים כלליים, הנפה הריבועית מבוססת על ייצור מספרים שיש להם הצגה ידועה כמספר ריבועי מחד, והצגת מספרים השקולים למכפלות של מספרים כאלה מודולו $n$ כריבועים בעזרת פירוק חלקי לגורמים, מאידך.

נגדיר $Q (x) = (x + ⌊ \sqrt{n} ⌋)^{2} - n = {\tilde{x}}^{2} - n$ , ונחשב את $Q (x_{1}), Q (x_{2}), \dots, Q (x_{k})$ (בסעיפים הבאים יוסבר כיצד למצוא $x_{i}$ מתאימים).

מתוך קבוצת ה- $Q (x)$ אנחנו מחפשים תת-קבוצה של מספרים, שמכפלתם היא ריבוע ידוע: $Q (x_{i_{1}}) Q (x_{i_{2}}) \dots Q (x_{i_{r}}) = y^{2}$ . ברגע שמטרה זו הושגה מתקיים $Q (x) \equiv {\tilde{x}}^{2} (\mod n)$ , ולכן גם

Q (x_{i_{1}}) Q (x_{i_{2}}) \dots Q (x_{i_{r}}) \equiv ({\tilde{x}}_{i_{1}} \cdot {\tilde{x}}_{i_{2}} \dots {\tilde{x}}_{i_{r}})^{2} (\mod n)

כך מצאנו $x, y$ מתאימים לדרישות. אם המספר $n$ הוא מכפלה של שני מספרים ראשוניים גדולים, אז מתקיים בהסתברות $x \equiv \pm y (\mod n)$ בהסתברות 0.5, ואז תוצאת ה-gcd תהיה $n$ או 1; במקרה כזה יש להמשיך את תהליך הייצור, ולמצוא זוג אחר של מספרים כמתואר לעיל.

תיאור האלגוריתם

קלט: מספר פריק $n$

פלט: אחד הגורמים הראשוניים של $n$

בחירת גורמי בסיס
בוחרים בסיס גורמים (Factor base) אותו מסמנים $S = p_{1}, p_{2}, \dots, p_{t}$ , כאשר $p_{1} = - 1$ ויתר האלמנטים הם המספרים הראשוניים $p_{i}$ החל מ-2 ועד לגבול מסוים, כאשר בוחרים רק את הראשוניים $p_{i}$ אשר $n$ הוא שארית ריבועית מודולו $p_{i}$ , כלומר שלהם סימן לז'נדר $(\frac{n}{p}) = 1$ . הגבול העליון $B$ נקרא גבול חלקות (Smoothness bound) ולמעשה מכתיב את גודל בסיס הגורמים. הערך $t$ מייצג את מספר הגורמים הראשוניים בבסיס, מספר זה ישפיע ישירות על כמות הווקטורים הדרושים לפירוק $n$ ועל גודלם.
הכנת מאגר זוגות שלמים $a_{i}, b_{i}$
מכינים $t + 1$ זוגות שלמים $a_{i}, b_{i}$ כדלהלן: מחשבים את השורש השלם של $n$ אותו מסמנים ב- $m$ . מכינים את הפולינום $q (x) = (x + m)^{2} - n$ , מחשבים את $b_{i} = q (x)$ ובודקים אם $b_{i}$ הוא מספר חלק ביחס ל- $B$ (כלומר שכל גורמיו הראשוניים נמצאים בבסיס הגורמים). אם $b_{i}$ אינו מספר חלק ביחס ל- $B$ , בוחרים $x$ אחר (לפי הסדר הזה: $0, - 1, + 1, - 2, + 2, \dots$ ). אם $b_{i}$ הוא אכן מספר חלק כלומר ניתן לייצגו כמכפלה של גורמי בסיס: $b_{i} = \prod_{j = 1}^{t} p_{j}^{e_{i j}}$ , אזי מגדירים את $a_{i} = x + m$ , זוג הערכים $(a_{i}, b_{i})$ נוסף למאגר.
הערה: ניתן לבדוק חלקות באמצעות חלוקה נסיונית (פשוט על ידי חלוקה בכל גורמי הבסיס), אולם שלב זה הוא הקריטי והארוך ביותר באלגוריתם ועל כן יעילותו מתבטאת בעיקר באופן בו מיושמת בדיקת החלקות. באופן מעשי מקובל להשתמש בתהליך הניפוי (sieving) המתואר להלן.
מציאת מספר ריבועי
כיוון שהגורמים של כל $b_{i}$ ידועים, קל למצוא תת-קבוצה של $b_{i}$ אשר מכפלתה היא מספר ריבועי. כיוון שצריך רק מספרים שהחזקה של כל גורם $p_{i}$ שלהם זוגית. ניתן לפשט זאת על ידי הכנת וקטור בינארי של המעריכים מודולו 2 כלומר $(v_{i 1}, v_{i 2}, \dots, v_{i t})$ כאשר $v_{i j} = e_{i j} mod 2$ . כיוון שבהכרח בווקטור זה תמצא תלות ליניארית כלשהי, משתמשים באלגברה ליניארית כדי למצוא תת-קבוצה $T$ של וקטורים שסכומה הוא וקטור האפס $\sum_{i \in T} v_{i} = 0$ . משנמצאה תת-קבוצה כזו, מכפילים את המספרים החלקים $b_{i}$ המתאימים (שהמציין $i$ שלהם ב- $T$ ), כלומר מחשבים את $x = \prod_{i \in T} a_{i} mod n$ . בהכרח מתקיים כי $\prod_{i \in T} b_{i}$ הוא מספר ריבועי. כמו כן ניתן לראות שגם מכפלת ריבועיהם של כל $a_{i}$ המתאימים יהיה מספר ריבועי. כלומר $\prod_{i \in T} a_{i}^{2} mod n$ נותן מספר ריבועי.
חישוב $x, y$
מחשבים את השורשים הריבועיים של התוצאה האמורה, את האחד מוצאים על ידי חישוב שורש ריבועי של התוצאה האמורה ואת השני על ידי הכפלת מספרי $a_{i}$ המתאימים. מציבים ב- $x$ את $\prod_{i \in T} a_{i}$ וב- $y$ את השורש הריבועי של $\prod_{i \in T} b_{i}$ . מספרים אלה עונים על הדרישה האמורה, כלומר ריבועיהם שקולים מודולו $n$ . בדרך כלל קיימות מספר תלויות ליניאריות כך שבסבירות גבוהה אחת מהן תניב $x, y$ כאלה שאינם שקולים מודולו $n$ .
מציאת גורם ראשוני
מחשבים את המחלק המשותף המקסימלי של ההפרש של $x - y$ עם $n$ . התוצאה תהיה גורם ראשוני של $n$ , אשר עשוי להיות גם גורם טריוויאלי כמו $n$ עצמו או 1. במקרה כזה, מנסים שוב עם תלות ליניארית אחרת של המספרים החלקים.

הגדרת בסיס הגורמים וטווח הניפוי

שיטת הנפה דורשת דרך יעילה למצוא $x_{i}$ כך שהמכפלה $\prod Q (x_{i})$ תתן מספר ריבועי. כדי שזה יתקיים צריך שכל גורם ראשוני המחלק את המכפלה יחלק אותה מספר זוגי של פעמים. לשם כך צריך לפרק לגורמים ראשוניים כל אחד מן המספרים $Q (x_{i})$ המרכיבים את המכפלה.

כדי לפשט את הבדיקה אנחנו מעוניינים כי $Q (x_{i})$ יהיו קטנים ככל האפשר, ויתחלקו בראשוניים מתוך קבוצת ראשוניים ידועה לנו – לקבוצה זו נקרא "בסיס הגורמים" ונסמן אותה ב- $B$ . גודלה של הקבוצה $B$ משפיע על ביצועי האלגוריתם, ולכל גרסה של הניפוי הריבועי יש לחשב את ה- $B$ האופטימלי לפי גודלו של $n$ .

לצורך הצגת האלגוריתם, נסמן $B = {p_{1}, \dots, p_{k}}$ , המספרים הראשוניים הקטנים, לפי סדרם. כדי ש- $Q (x)$ יהיה קטן אנחנו צריכים לבחור $x$ קטן, ואז $Q (x) \sim 2 \sqrt{n} x$ . נבחר אפוא את טווח הניפוי $[1, M]$ .

שיפורים אפשריים

א. אם נוסיף לבסיס הגורמים גם את 1-, אז מספרים הקרובים ל- $n$ מלמטה גם הם מספרים קטנים יחסית, וניתן לבחור $x < 0$ ועדיין לקבל מספרים שקל יחסית לעבוד איתם. כך הכפלנו את טווח הניפוי ל- $[- M, M]$ .

ב. את בסיס הגורמים אפשר להקטין על ידי "בדיקת היתכנות": אם $p ∣ Q (x)$ אז $(x + \sqrt{n})^{2} = Q (x) + n \equiv n (\mod p)$ , ולכן צריך להכניס לבסיס הגורמים רק מספרים ראשוניים המקיימים, עבור $x$ מתוך טווח הניפוי, את התנאי $(x + \sqrt{n})^{2} \equiv n (\mod p)$ . זוהי בדיקה שאפשר להשלים בסיבוכיות נמוכה, לפי משפט ההיפוך הריבועי של גאוס, שמאפשר לחשב את סימן לז'נדר בזמן לוגריתמי (בדומה לחישוב המחלק המשותף המקסימלי באלגוריתם אוקלידס).

הניפוי – Sieving

הגדרה: המספר $x$ הוא חלק מעל הקבוצה $B$ , אם כל הגורמים הראשוניים של $x$ נמצאים ב- $B$ .

בשלב הניפוי אנחנו מחפשים $Q (x)$ שיכולים להיות חלק מקבוצה המרכיבה מכפלה שהיא מספר ריבועי. לשם כך אנחנו צריכים לעבור על $x$ מתוך טווח הניפוי, לחשב את $Q (x)$ ולבדוק האם $Q (x)$ חלק מעל $B$ . עבור כל אחד מהמספרים שמתקבלים, אנו צריכים לבדוק אם הוא חלק על ידי מעבר וחלוקה בבסיס הגורמים. פעולה סדרתית כזו אינה מעשית מבחינת זמן ביצוע. לכן נעבוד על בסיס הגורמים במקביל.

לכל $p$ בבסיס הגורמים אם $p ∣ Q (x)$ אז גם $p ∣ Q (x + p)$ . ובכיוון ההפוך, אם $x \equiv y (\mod p)$ אז גם $Q (x) \equiv Q (y) (\mod n)$ .

לכל $p$ נפתור $Q (x) = s^{2} \equiv 0 (\mod p), x \in ℤ_{p}$ . את המשוואה הזאת ניתן לפתור על ידי האלגוריתם של Shanks-Tonelli.
פתרון המשוואה הריבועית יתן לנו שני שורשים, נסמן אותם $S_{1} p, S_{2} p = p - S_{1} p$ . מכאן אנו רואים כי $Q (x_{i})$ עבור $x_{i}$ מתוך טווח החיפוש מתחלק ב- $p$ כאשר $x_{i} = S_{1} p, S_{2} p + p k$ עבור $k$ שלם.

כעת בתהליך שמזכיר מאוד את מכונת השרשראות של להמר, אנחנו מתקדמים ולכל $x$ אנחנו בודקים באלו ראשוניים מבסיס הגורמים $Q (x)$ מתחלק. כדי לבצע את החיפוש הזה על כל טווח הניפוי כדאי לחלק את העבודה למספר מחשבים במקביל – וכל מחשב יקבל חלק מטווח הניפוי. אנחנו בודקים האם $Q (x)$ הוא חלק, אם לא – נפטרים ממנו ועוברים ל- $x$ הבא, ואם כן שומרים אותו בתוך מטריצה שתוגדר בהמשך.

שיפורים אפשריים

פעולת חילוק היא פעולה מורכבת. לכן במקום לעשות חישוב מדויק, כדי לבדוק במהירות את ה”חלקות” של $Q (x)$ נבצע הערכה באמצעות מספר הביטים של הגורמים ש- $Q (x)$ מתחלק בהם, וכך במהירות גבוהה נקבל תוצאות וודאיות במרבית המקרים, ובאלה שיש לגביהם ספק – נפטרים מהם ועוברים הלאה, לא חסרים לנו מספרים לבדוק.

שלב המטריצה

בשלב זה אנחנו מחזיקים קבוצה $Q$ של מספרים גדולים $Q (x_{i})$ – ואנו צריכים למצוא קבוצה חלקית ל- $Q$ כך שמכפלת האיברים של הקבוצה החלקית תתן מספר ריבועי. לשם כך נגדיר וקטור של חזקות שמייצג מספרים חלקים מעל בסיס הראשוניים שלנו $B$ .

עבור $m$ מספר חלק מעל $B$ : $m = \prod_{i = 1}^{k} p_{i}^{v_{i}} ⟹ v (m) = (v_{1}, v_{2}, \dots, v_{k})$

אנחנו צריכים למצוא קבוצת וקטורים המייצגים מספרים מתוך $Q$ כך שמכפלת המספרים תהיה מספר ריבועי. לשם כך אנחנו צריכים למצוא קבוצת וקטורי חזקות שסכומם יתן וקטור שכל איבריו זוגיים.

נבנה מטריצה V של וקטורי חזקות, המייצגים $Q (x)$ חלקים מעל $B$ . ועכשיו אנו צריכים למצוא וקטור בינארי $\vec{e}$ שהכפלתו במטריצה תתן וקטור שכל איבריו זוגיים. על ידי דירוג מטריצות ניתן לפתור את המטריצה, ולקבל וקטור $\vec{e}$ מתאים.

שיפורים אפשריים

כדי לעשות זאת קל יותר לחישוב נמיר את המטריצה $V$ למטריצה בינארית $V_{2}$ . ואז וקטור $\vec{e} \neq 0$ שמקיים $V_{2} \cdot \vec{e} = 0$ יהווה פתרון גם עבור המטריצה $V$ .
חשוב לציין שווקטורים מודולו 2 אינם ייצוג חד-חד-ערכי של וקטורי חזקות – אולם החסכון בזמן חישוב ובגודל הזיכרון – אף שהוא ליניארי בלבד – משתלם למרות הצורך בהחזקת מיפוי בין הווקטור הבינארי למספר המקורי שהוא מייצג.

דוגמאות לייצוג וקטורי מעל בסיס B

$\begin{matrix} B = {2, 3, 5, 7, 11, 13, 17} ⟹ p_{k} = 17 \\ \begin{matrix} 3 651 921 & = & 2^{0} \cdot 3^{2} \cdot 5^{0} \cdot 7^{4} \cdot 1 1^{0} \cdot 1 3^{2} \cdot 1 7^{0} & = & v (0, 2, 0, 4, 0, 2, 0) & \equiv & v (0, 0, 0, 0, 0, 0, 0) (\mod 2) \\ 11 662 & = & 2^{1} \cdot 3^{0} \cdot 5^{0} \cdot 7^{3} \cdot 1 1^{0} \cdot 1 3^{0} \cdot 1 7^{1} & = & v (1, 0, 0, 3, 0, 0, 1) & \equiv & v (1, 0, 0, 1, 0, 0, 1) (\mod 2) \\ 1071 & = & 2^{0} \cdot 3^{2} \cdot 5^{0} \cdot 7^{1} \cdot 1 1^{0} \cdot 1 3^{0} \cdot 1 7^{1} & = & v (0, 2, 0, 1, 0, 0, 1) & \equiv & v (0, 0, 0, 1, 0, 0, 1) (\mod 2) \end{matrix} \end{matrix}$

סיבוכיות

סיבוכיות הנפה הריבועית תלויה בגודל הבסיס $B$ . בסיס ראשוניים הכולל את כל הראשוניים עד $n$ יביא לכך שכל $Q (x)$ הוא חלק מעל $B$ , וכך תהיה הסיבוכיות למציאת $Q (x)$ מתאים $O (1)$ בלבד. אולם, גודלה של המטריצה במקרה כזה (כ- $\frac{n}{\log (n)}$ ) אינו מאפשר לנו ליהנות מהיעילות של השלב הראשון. מצד שני, בסיס ראשוניים קטן מאוד (למשל הראשוניים עד 1000) ייצר לנו מטריצה קטנה ונוחה לפתרון, ועל כך נשלם בסיכוי זעיר למצוא $Q (x)$ חלק מעל $B$ .

נסמן ב- $φ (x, B)$ את מספר המספרים החלקים מעל $B$ בטווח $[1, x]$ . הסיכוי שמספר אקראי בתחום זה יהיה חלק מעל $B$ הוא $\frac{φ (x, B)}{x}$ , ולכן כדי למצוא מספר אחד מתאים אנחנו צריכים לעבור על $\frac{x}{φ (x, B)}$ מספרים אקראיים. חשוב להדגיש שהמספרים $Q (x)$ אינם אקראיים במובן הפורמלי, אך כל הניתוחים ההיוריסטיים של שיטות הפירוק נעשים בהנחה שהם אקראיים במידה מספקת. כיוון שאנחנו צריכים $| B | = k$ מספרים כאלו לבניית המטריצה (כדי להבטיח פתרון לא טריוויאלי), אנחנו צריכים לעבור על $k \frac{x}{φ (x, B)}$ מספרים. עלות הבדיקה שמועמד $Q (x)$ הוא חלק מעל $B$ היא ליניארית ב- $B$ , ולכן העבודה הכוללת בייצור היא $k^{2} \frac{x}{φ (x, B)}$ פעולות (של ניסיון חילוק מספר בגודל $\sqrt{n}$ בראשוני קטן).

פומרנץ הראה שכדי לקבל את המינימום עבור הנוסחה הזו צריך שהאיבר הגדול ב- $B$ , אותו סימנו $p_{k}$ , יהיה קרוב ל- $\exp (0.5 \sqrt{\log (x) \log (\log (x))})$ , והעבודה הנדרשת היא $\exp (2 \sqrt{\log (x) \log (\log (x))})$ , כלומר כ- $p_{k}^{4}$ .

אבל מהו $x$ ?
באלגוריתם הניפוי הריבועי אנחנו מייצרים $Q (x)$ מסדר גודל של $n^{0.5 + ε}$ כאשר $ε$ קטן מאוד (מכיוון שמספר המועמדים שנבדוק הוא חזקה קטנה של $n$ ); כלומר $x = n^{0.5 + ε}$ . לכן סדר הגודל של שלב הניפוי הוא $\exp (2 \sqrt{\log (x) \log (\log (x))})$ .

לאחר שהנתונים נאספו במטריצה בגודל $k \times k$ , צריך למצוא פתרון לא טריוויאלי, בעלות של $O (k^{3})$ . למעשה החלק הזה של האלגוריתם הוא מהיר בהרבה, מכיוון שהמטריצה דלילה. בכל אופן מדובר בסיבוכיות זניחה ביחס לשלב איסוף המשוואות.

נפת שדה המספרים מול הנפה הריבועית

שיטה נוספת לפירוק מספר לגורמים היא נפת שדה המספרים (Number Field Sieving), זוהי שיטה מהירה יותר אסימפטוטית מהנפה הריבועית (Quadratic Sieve), אך מסובכת הרבה יותר.

שתי השיטות מחולקות לשני שלבים: שלב הניפוי ושלב מטריצה.

סדר הגודל של שלב הניפוי בנפת שדה המספרים הוא $\exp (c \sqrt[3]{\log (n) \log (\log (n))^{2}})$ , כאשר $c$ משתנה לפי סוג הניפוי המדויק בו משתמשים (ברוב המימושים $1.5 \leq c \leq 2$ ).

אסימפטוטית זהו סדר גודל קטן יותר משל הנפה הריבועית, אבל במספרים "קטנים" (עד 100 ספרות) עדיף להשתמש בנפה הריבועית בגלל המסובכות של נפת שדה המספרים.

מקורות

Landquist, E., “MATH 488: Cryptographic Algorithms”, “The Quadratic Sieve Factoring Algorithm”, December 14, 2001
Pomerance, C., “A Tale of Two Sieves”, December, 1996.

ראו גם

TWINKLE – מכשיר אלקטרואופטי תאורטי, המממש את שיטת הנפה הריבועית לפירוק מהיר לגורמים.

מימושים

C Quadratic Sieve – מימוש בתחום הציבורי של אלגוריתם הנפה הריבועית בשפת C. פורסם בשנת 2022, תומך בפירוק גורמים אצוותי של מספרים עד 330 סיביות, ומפיק תוצאות בפורמט JSON או CSV.

קישורים חיצוניים

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

נפה ריבועית41109563Q1151850