匯編語言的準備知識-給初次接觸匯編者2

字號：小 中 大

匯編指令的操作數可以是內存中的數據，如何讓程序從內存中正確取得所需要的數據就是對內存的尋址。
    INTEL 的CPU 可以工作在兩種尋址模式:實模式和保護模式。前者已經過時，就不講了， WINDOWS 現在是32位保護模式的系統， PE 文件就基本是運行在一個32位線性地址空間，所以這里就只介紹32位線性空間的尋址方式。
    其實線性地址的概念是很直觀的，就想象一系列字節(jié)排成一長隊，第一個字節(jié)編號為0，第二個編號位1，。。。。一直到4294967295(十六進制FFFFFFFF，這是32位二進制數所能表達的值了)。這已經有4GB的容量! 足夠容納一個程序所有的代碼和數據。當然，這并不表示你的機器有那么多內存。物理內存的管理和分配是很復雜的內容，初學者不必在意，總之，從程序本身的角度看，就好象是在那么大的內存中。
    在INTEL系統中，內存地址總是由"段選擇符:有效地址"的方式給出。段選擇符(SELECTOR)存放在某一個段寄存器中，有效地址則可由不同的方式給出。段選擇符通過檢索段描述符確定段的起始地址，長度(又稱段限制)，粒度，存取權限，訪問性質等。先不用深究這些，只要知道段選擇符可以確定段的性質就行了。一旦由選擇符確定了段，有效地址相對于段的基地址開始算。比如由選擇符1A7選擇的數據段，其基地址是400000，把1A7 裝入DS中，就確定使用該數據段。 DS:0 就指向線性地址400000。 DS:1F5278 就指向線性地址5E5278。我們在一般情況下，看不到也不需要看到段的起始地址，只需要關心在該段中的有效地址就行了。在32位系統中，有效地址也是由32位數字表示，就是說，只要有一個段就足以涵蓋4GB線性地址空間，為什么還要有不同的段選擇符呢? 正如前面所說的，這是為了對數據進行不同性質的訪問。非法的訪問將產生異常中斷，而這正是保護模式的核心內容，是構造優(yōu)先級和多任務系統的基礎。這里有涉及到很多深層的東西，初學者先可不必理會。
    有效地址的計算方式是: 基址+間址*比例因子+偏移量。這些量都是指段內的相對于段起始地址的量度，和段的起始地址沒有關系。比如，基址=100000，間址=400，比例因子=4，偏移量=20000，則有效地址為:
    100000+400*4+20000=100000+1000+20000=121000。對應的線性地址是400000+121000=521000。 (注意，都是十六進制數)。
    基址可以放在任何32位通用寄存器中，間址也可以放在除ESP外的任何一個通用寄存器中。比例因子可以是1， 2， 4 或8。偏移量是立即數。如: [EBP+EDX*8+200]就是一個有效的有效地址表達式。當然，多數情況下用不著這么復雜，間址，比例因子和偏移量不一定要出現。
    內存的基本單位是字節(jié)(BYTE)。每個字節(jié)是8個二進制位，所以每個字節(jié)能表示的的數是11111111，即十進制的255。一般來說，用十六進制比較方便，因為每4個二進制位剛好等于1個十六進制位， 11111111b = 0xFF。內存中的字節(jié)是連續(xù)存放的，兩個字節(jié)構成一個字(WORD)，兩個字構成一個雙字(DWORD)。在INTEL架構中，采用small endian格式，即在內存中，高位字節(jié)在低位字節(jié)后面。舉例說明:十六進制數803E7D0C，每兩位是一個字節(jié)，在內存中的形式是: 0C 7D 3E 80。在32位寄存器中則是正常形式，如在EAX就是803E7D0C。當我們的形式地址指向這個數的時候，實際上是指向第一個字節(jié)，即0C。我們可以指定訪問長度是字節(jié)，字或者雙字。假設DS:[EDX]指向第一個字節(jié)0C:
    mov AL， byte ptr DS:[EDX] ;把字節(jié)0C存入AL
    mov AX， word ptr DS:[EDX] ;把字7D0C存入AX
    mov EAX， dword ptr DS:[EDX] ;把雙字803E7D0C存入EAX
    在段的屬性中，有一個就是缺省訪問寬度。如果缺省訪問寬度為雙字(在32位系統中經常如此)，那么要進行字節(jié)或字的訪問，就必須用byte/word ptr顯式地指明。
    缺省段選擇：如果指令中只有作為段內偏移的有效地址，而沒有指明在哪一個段里的時候，有如下規(guī)則：
    如果用ebp和esp作為基址或間址，則認為是在SS確定的段中；
    其他情況，都認為是在DS確定的段中。
    如果想打破這個規(guī)則，就必須使用段超越前綴。舉例如下：
    mov eax， dword ptr [edx] ;缺省使用DS，把DS:[EDX]指向的雙字送入eax
    mov ebx， dword ptr ES:[EDX] ;使用ES:段超越前綴，把ES:[EDX]指向的雙字送入ebx
    堆棧：
    堆棧是一種數據結構，嚴格地應該叫做“棧”?！岸选笔橇硪环N類似但不同的結構。SS 和 ESP 是INTEL對棧這種數據結構的硬件支持。push/pop指令是專門針對棧結構的特定操作。SS指定一個段為棧段，ESP則指出當前的棧頂。push xxx 指令作如下操作：
    把ESP的值減去4；
    把xxx存入SS:[ESP]指向的內存單元。
    這樣，esp的值減小了4，并且SS:[ESP]指向新壓入的xxx。所以棧是“倒著長”的，從高地址向低地址方向擴展。pop yyy 指令做相反的操作，把SS:[ESP]指向的雙字送到yyy指定的寄存器或內存單元，然后把esp的值加上4。這時，認為該值已被彈出，不再在棧上了，因為它雖然還暫時存在在原來的棧頂位置，但下一個push操作就會把它覆蓋。因此，在棧段中地址低于esp的內存單元中的數據均被認為是未定義的。
    最后，有一個要注意的事實是，匯編語言是面向機器的，指令和機器碼基本上是一一對應的，所以它們的實現取決于硬件。有些看似合理的指令實際上是不存在的，比如:
    mov DS:[edx]， ds:[ecx] ;內存單元之間不能直接傳送
    mov DS， 1A7 ;段寄存器不能直接由立即數賦值
    mov EIP， 3D4E7 ;不能對指令指針直接操作。

匯編語言的準備知識-給初次接觸匯編者2

字號： 小 中 大

字號：小中大