שפת סף

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש

שפת סף או אַסֶמבּליאנגלית: Assembly) היא שפת התכנות הבסיסית והקרובה ביותר לשפת מכונה.

בשפת הסף, בצורתה הבסיסית, קיימת התאמה בין ההוראות שכותב המתכנת ובין ההוראות המופקות מהן בשפת מכונה, כלומר, כל הוראה יחידה באסמבלי מתורגמת להוראה אחת או יותר בשפת מכונה. לכן, כמו שפת המכונה, גם שפת הסף פועלת באופן ישיר על תאי הזיכרון של המחשב, על האוגרים הפנימיים של המעבד ועל יציאות הקלט/פלט של המחשב, ובפרטנות רבה. כתוצאה מכך, לכל סדרת מעבדים יש שפת סף משלה, כתלות בסט הפקודות של המעבד.

Motorola 6800 Assembly Language

תכנות בשפת סף נחשב לקשה הרבה יותר מבשפות התכנות העיליות, בין היתר משום ששפת סף אינה אינטואיטיבית וקלה לקריאה כמו השפות העיליות. תכנות בשפת סף, במיוחד כזה הנחשב ליעיל, מחייב להכיר היטב את חומרת המחשב, בעוד שבשפות עיליות המהדר דואג להתאימן לחומרה. מעבר לכך, לשם ביצוע כל פעולה, ולו הפשוטה ביותר, עשויות להידרש הוראות שפת סף רבות. לדוגמה, כדי להציב במשתנה A את סכומם של המשתנים B ו־C, מספיקה בשפה עילית פקודה יחידה מצורה דומה ל־ A := B + C. באסמבלי, לעומת זאת, הפעולה תהיה ארוכה יותר, לדוגמה:

mov ax, B – העבר את הערך B אל אוגר ax

add ax, C – הוסף את הערך C לערך שנמצא באוגר ax

mov A, ax – העבר את הערך שנמצא באוגר ax אל הכתובת של המשתנה A

התכנות בשפת סף היה נפוץ למדי ואפילו דומיננטי, למרות הקושי שבו, עד לתחילת שנות ה־70 של המאה העשרים, וזאת בשל משאבי המחשב המוגבלים שעמדו לרשות המתכנתים ובשל היכולת ליצור קוד יעיל במהירות־הביצוע וחסכוני בזיכרון, יותר מקוד שנוצר בשפות עיליות. בעקבות השתכללות המהדרים של השפות העיליות, לא נותר עוד הבדל משמעותי שיצדיק את הטרחה שבכתיבה בשפת סף, והשימוש בה נדיר כיום. כיום היא משמשת בעיקר כותבי מערכות הפעלה, מפתחים של חלקי תוכנה שדרושים להם ביצועים מהירים במיוחד או תקשורת ישירה עם רכיבי חומרה (כמו מנהלי התקנים), וכן כותבי וירוסים מתוחכמים.

המהדר של שפת הסף, המתרגם את קובצי ההוראות לשפת מכונה, נקרא אסמבלר (Assembler).

בגלל ששפת סף תלויה בקוד המכונה שספציפי למערכות מחשוב שונות, כל שפת סף יכולה לשמש רק לארכיטקטורת מחשב מסוימת.

אסמבלי במעבדי 8086

הקדמה

נכון לשנת 2020, חלק גדול מהמעבדים בשוק מבוססים על סדרת 8086 של אינטל, וגם שפת הסף שלהם מבוססת על שפת הסף של המעבד אינטל 8086.

היות ששפת אסמבלי עוסקת בגישה ישירה לזיכרון ולהתקנים חיצוניים (באמצעות out ו־in), רצוי להכיר מספר עקרונות מנחים בסיסים:

ארכיטקטורת פון נוימן – על פי ארכיטקטורה זו, אשר פותחה על ידי מדען המחשב והמתמטיקאי ג׳ון פון ניומן במאה ה־20, הנתונים וההוראות מאוחסנים באותו זיכרון. המחשב עצמו מחולק ל־4 רכיבים מרכזיים:

  • זיכרון – מכיל נתונים, כתובות, והוראות
  • מעבד – מקבל, מפרש ומריץ את ההוראות מהזיכרון
  • התקנים חיצוניים (I/O – Input/Output) – כגון מקלדת, עכבר, רמקול, מיקרופון או דיסק און קי.
  • אפיקי נתונים (Busses) – פסים אלו אחראים להעברת נתונים, הוראות, ופקודות בקרה בין המעבד, הזיכרון, וההתקנים החיצוניים. בעבר, רוחב של אפיק נתונים היה בגודל "מילה" (16 סיביות) או 32 סיביות ("מילה כפולה" – Double Word), אך במחשבים רבים היום הוא כבר 64 סיביות.

הגדרת סביבת עבודה

כתיבת הקוד בשפת סף מחולקת למספר שדות הנקראים מקטעים (segments). במקטע אשר מיועד ליצירת משתנים, יש ליצור משתנים. במקטע אשר נועד להגדרת מחסניות, יש להגדיר מחסניות. במקטע אשר מיועד לכתיבת קוד, יש לכתוב קוד, וכן הלאה. המקטעים נקראים בשמות שונים בסביבות עבודה שונות. טקסט זה יכיל את 3 המקטעים העיקריים:

  • מקטע המידע – data segment, נקרא לעיתים DATASEG
  • מקטע המחסנית – stack segment
  • מקטע הקוד – Code Segment, אשר נקרא לעיתים CODESEG

אחת מסביבות העבודה הנוחות ביותר ללמידת שפת סף היא Emu8086 אשר פועלת במערכת ההפעלה Windows. סביבה זו היא בעצם אמולציה של המעבד הישן 8086 של אינטל (אשר פתח את סדרת מעבדי x86).

אוגרים

אוגרים (Registers) הם יחידות זיכרון של המעבד שבאמצעותן מתבצעות פעולות שונות. למעבד לוקח זמן מאוד קצר לגשת אליהם ולכן שימוש בהם הוא יעיל.

האוגרים בטבלה להלן נכונים לדור הבסיסי של מעבד 8086 – כיום נעשו שינויים – הוסיפו ושינו אוגרים בהתאם להתפתחות הטכנולוגיה. למשל ax, שגודלו 16 סיביות הוא חלק מאוגר eax שגודלו 32 סיביות (Double Word). עם זאת, האוגרים המצוינים בטבלה עדיין תקפים מפאת עקרון התאימות לאחור של מעבדי אינטל (קוד שנכתב למעבד ישן יותר יהיה ניתן להרצה על מעבד חדיש יותר). כל אחד מארבעת האוגרים ax, ‏bx,‏ cx ‏ו־dx מורכב מ־2 אוגרים של 8 ביט – h ‏(high) ו־l ‏(low). שינוי של אחד מהאוגרים הקטנים יוביל לשינוי אוגר גדול, ולהפך – שינוי של אוגר גדול יוביל לשינוי של האוגרים הקטנים. לדוגמה, אם נשנה את al, ערך ax ישתנה בהתאם, ולהפך.

האוגר מספר סיביות תפקיד
ax ‏(Accumulator Register – צובר)

מורכב משני אוגרים של 8 ביט: al, ah

16 משמש לפעולות אריתמטיות ולוגיות. ניתן לבצע זאת באוגרים אחרים, אך השימוש ב־ax בדרך כלל יעיל יותר.
bx ‏(Base Address Register – כתובת בסיס)

מורכב משני אוגרים של 8 ביט: bl, bh

16 משמש לשמירת כתובות בזיכרון
cx ‏(Count Register – מונה)

מורכב משני אוגרים של 8 ביט: cl, ch

16 המונה מונה דברים, כגון כמות הפעמים שהלולאה בוצעה, או כמות תווים בקובץ או במחרוזת.
dx ‏(Data Register – מידע)

מורכב משני אוגרים של 8 ביט: dl, dh

16 משמש לפעולות אריתמטיות מסוימות וכן לשמירת כתובות של התקנים חיצוניים
si ‏(Source Index – מצביע מקור) 16 ניתן להשתמש בו כמצביע כדי לפנות לכתובת בזיכרון, ובטיפול במחרוזות
di ‏(Destination Index – מצביע יעד) 16 כמו si, ניתן להשתמש בו כמצביע כדי לפנות לכתובת בזיכרון, ובטיפול במחרוזות
bp ‏(Base Pointer – מצביע בסיס) 16 שומר את המיקום האחרון של מקטע המחסנית
sp ‏(Stack Pointer – מצביע מחסנית) 16 מצביע על הכתובת בזיכרון שמכילה את ראש המחסנית. שינוי אוגר זה יגרום לתקלות בתוכנית. אין לשנותו.
ip – קיצור של Instruction Pointer מצביע על כתובת הזיכרון שתוכנה עומד לעיבוד. פקודות קפיצה (jump) משתמשות באוגר זה על מנת לקפוץ לכתובת שונה בקוד התוכנה.
ds – קיצור של data segment מצביע על הכתובת של מקטע המידע
ss – קיצור של stack segment מצביע על הכתובת של מקטע המחסנית
cs – קיצור של code segment מצביע על הכתובת של מקטע הקוד
es – קיצור של extra segment מצביע על הכתובת של מקטע הזיכרון העודף
FLAGS – אוגר הדגלים 16 מייצג שורה של ״דגלים״ אשר נדלקים בהתאם להתרחשותם של אירועים שונים בתוכנה. לדוגמה, דגל האפס (zero flag) "יוּרם" (יהפוך מ־0 ל־1) כאשר תוצאה של פקודה כלשהי תהיה 0.

פקודות בסיסיות

פקודות מובנות באסמבלי יכולות לקבל בין 0 ל־2 ערכים. הן מבצעות פעולות לוגיות ואריתמטיות כגון השמה, חיבור, חיסור, כפל, חילוק, השוואה, קפיצות (jmp), קפיצות מותנות (je, jne, jb, ja וכו׳).

הפקודה מספר האופרנדים מה היא עושה דוגמאות
mov a, b 2 (פעולה בינארית) השמה

a = b

mov ax,5

mov bx,ax

add a, b 2 (פעולה בינארית) חיבור

a = a + b

add bl,al

add ax,6

sub a, b 2 (פעולה בינארית) חיסור

a = a - b

sub al,ah

sub dx,dx

inc a 1 (פעולה אונארית) הוספת 1 (increment)

a = a + 1

inc cx

inc dl

dec a 1 (פעולה אונארית) חיסור 1 (decrement)

a = a - 1

dec bx

dec dh

neg a 1 (פעולה אונארית) מינוס

a = - a

neg ch

neg ax

mul a 1 (פעולה אונארית) כפל, ושמירה של התוצאה באוגר ax

ax = ax * a

imul a 1 (פעולה אונארית) כפל של מספרים לא מסומנים (unisigned)

ax = ax * a

div a 1 (פעולה אונארית) חילוק, ושמירה של התוצאה באוגר ax

idiv a 1 (פעולה אונארית) חילוק מספרים לא מסומנים (unsinged)

not a 1 (פעולה אונארית)
and a b 2 (פעולה בינארית)
or a b 2 (פעולה בינארית)
jmp label 1 (פעולה אונארית) קפיצה לתווית מסוימת בקוד (לשורה אחרת) mov ax,6
jmp skip
inc bx
sub cx,4
:skip
je label 1 (פעולה אונארית) קפיצה לתווית מסוימת אם שני ערכים שווים בערכם cmp al, 6
je after
inc bl
:after
jne label 1 (פעולה אונארית) קפיצה לתווית מסוימת אם שני ערכים לא שווים בערכם
ja label 1 (פעולה אונארית) קפיצה לתווית מסוימת אם הערך הראשון גדול מהשני
jb label 1 (פעולה אונארית) קפיצה לתווית מסוימת אם הערך הראשון קטן מהשני
loop label 1 (פעולה אונארית) לולאה לתווית מסוימת, חוזרת CX פעמים בכך שמורידה

את ערכו כל ריצה ב-1.

דוגמאות קוד

מאקרו למעבר שורה :

macro move_line
 pusha
 mov dl,10
 mov ah,2
 int 21h
 mov dl,13
 int 21h
 popa
 endm

מאקרו להדפסת ספרה כתו :

macro print_digit digit
 pusha
 mov dl,digit
 add dl,30h
 mov ah,2h
 int 21h
 popa
 endm

לסיקור מקיף יותר של שפת סף, ניתן לגשת למדריך בוויקיספר העברי.[1]

ראו גם

קישורים חיצוניים

הערות שוליים

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

35686239שפת סף