Bài 3 Lập Trình Hợp Ngữ

Các tập tin .EXE và .COM

DOS chỉ có thể thi hành được các tập tin dạng .COM và .EXE. Tập tin .COM thường dùng để xây dựng cho các chương trình nhỏ còn .EXE dùng cho các chương trình lớn.

Tập tin .COM

- Tập tin .COM chỉ có một đoạn nên kích thước tối đa của một tập tin loại này là 64 KB.
- Tập tin .COM được nạp vào bộ nhớ và thực thi nhanh hơn tập tin .EXE nhưng chỉ áp dụng được cho các chương trình nhỏ.
- Chỉ có thể gọi các chương trình con dạng near.
Khi thực hiện tập tin .COM, DOS định vị bộ nhớ và tạo vùng nhớ dài 256 byte ở vị trí 0000h, vùng này gọi là PSP (Program Segment Prefix), nó sẽ chứa các thông tin cần thiết cho DOS. Sau đó, các mã lệnh trong tập tin sẽ được nạp vào sau PSP ở vị trí 100h và đưa giá trị 0 vào stack. Như vậy, kích thước tối đa thực sự của tập tin .COM là 64 KB - 256 byte PSP - 2 byte stack.
Tất cả các thanh ghi đoạn đều chỉ đến PSP và thanh ghi con trỏ lệnh IP chỉ đến 100h, thanh ghi SP có giá trị 0FFFEh.

Tập tin .EXE

- Nằm trong nhiều đoạn khác nhau, kích thước thông thường lớn hơn 64 KB.
- Có thể gọi được các chương trình con dạng near hay far.
- Tập tin .EXE chứa một header ở đầu tập tin để chứa các thông tin điều khiển cho tập tin.

Khung của một chương trình hợp ngữ

Khung của một chương trình hợp ngữ có dạng như sau:
TITLE Chương trình hợp ngữ
.MODEL Kiểu kích thước bộ nhớ
;Khai bao quy mô sử dụng bộ nhớ
.STACK Kích thước
;Khai báo dung lượng đoạn Stack
.DATA
;Khai báo đoạn dữ liệu
msg DB 'Hello$'
.CODE 
;Khai báo đoạn mã
main PROC
...
CALL Subname
;Gọi chương trình con
....
main ENDP
Subname PROC 
;Định nghĩa chương trình con
....
RET 
Subname ENDP END main 
  • Quy mô sử dụng bộ nhớ:
Thông thường, các ứng dụng đơn giản chỉ đòi hỏi mã chương trình không quá 64 KB và dữ liệu cũng không lớn hơn 64 KB nên ta sử dụng ở dạng Small:
.MODEL SMALL 
  • Khai báo kích thước stack:
Khai báo stack dùng để dành ra một vùng nhớ dùng làm stack (chủ yếu phục vụ cho chương trình con), thông thường ta chọn khoảng 256 byte là đủ để sử dụng (nếu không khai báo thì chương trình dịch tự động cho kích thước stack là 1 KB):
.STACK 256
  • Khai báo đoạn dữ liệu:
Đoạn dữ liệu dùng để chứa các biến và hằng sử dụng trong chương trình.
  • Khai báo đoạn mã:
Đoạn mã dùng chứa các mã lệnh của chương trình. Đoạn mã bắt đầu bằng một chương trình chính và có thể có các lệnh gọi chương trình con (CALL). Một chương trình chính hay chương trình con bắt đầu bằng lệnh PROC và kết thúc bằng lệnh ENDP (đây là các lệnh giả của chương trình dịch). Trong chương trình con, ta sử dụng thêm lệnh RET để trả về địa chỉ lệnh trước khi gọi chương trình con.

Cú pháp của các lệnh trong chương trình hợp ngữ

Một dòng lệnh trong chương trình hợp ngữ gồm có các trường (field) sau (không nhất thiết phải đầy đủ tất cả các trường):
Trường tên chứa nhãn, tên biến hay tên thủ tục. Các tên nhãn có thể chứa tối đa 31 ký tự, không chứa ký tự trắng (space) và không được bắt đầu bằng số (A: hay Main:). Các nhãn được kết thúc bằng dấu ':'.
Trường lệnh chứa các lệnh sẽ thực hiện. Các lệnh này có thể là các lệnh thật (MOV) hay các lệnh giả (PROC). Các lệnh thật sẽ được dịch ra mã máy. Trường toán hạng chứa các toán hạng cần thiết cho lệnh (AH,10h). Trường chú thích phải được bắt đầu bằng dấu ';'. Trường này chỉ dùng cho người lập trình để ghi các lời giải thích cho chương trình. Chương trình dịch sẽ bỏ qua các lệnh nằm phía sau dấu ;.

Khai báo dữ liệu

Khi khai báo dữ liệu trong chương trình, nếu sử dụng số nhị phân, ta phải dùng thêm chữ B ở cuối, nếu sử dụng số thập lục phân thì phải dùng chữ H ở cuối. Chú ý rằng đối với số thập lục phân, nếu bắt đầu bằng chữ A..F thì phải thêm vào số 0 ở phía trước.
1011b ; Số nhị phân
1111 ; Số thập phân
1011h ; Số thập lục phân

Khai báo biến

Khai báo biến nhằm để chương trình dịch cung cấp một địa chỉ xác định trong bộ nhớ. Ta dùng các lệnh giả sau để định nghĩa các biến ứng với các kiểu dữ liệu khác nhau: DB (define byte), DW (define word) và DD (define double word).
Ngoài ra ta có thể dùng các toán tử DUP lồng vào nhau khi khai báo biến mảng. Giả sử ta cần khai báo mảng A9 có các giá trị gán ban đầu 1,2,3,1,1,3,2,2,1,1,3,2,2. Ta có thể thực hiện như sau:
A9 DB 1,2,3,1,1,3,2,2,1,1,3,2,2
Hay: A9 DB 1,2,3,2 DUP(1,1,3,2,2)
Hay: A9 DB 1,2,3,2 DUP(2 DUP(1),3,2 DUP(2))
Đối với các biến có nhiều hơn 1 byte, byte thấp sẽ chứa ở ô nhớ có địa chỉ thấp và byte cao sẽ chứa ở ô nhớ có địa chỉ cao.
A10 DW 1234h
Biến A10 giả sử bắt đầu lưu tại địa chỉ 1000h thì ô nhớ 1000h chứa giá trị 34h còn ô nhớ 1001h chứa giá trị 12h.
Đối với biến kiểu chuỗi (string), thực chất là một mảng các ký tự, ta có thể khai báo như sau:
A11 DB 'ABCD' 
Hay
A11 DB  65h,66h,67h,68h 
Sau lệnh khai báo này thì ô nhớ 1000h (giả sử biến A11 lưu trữ tại địa chỉ 1000h) chứa 'A', 1001h chứa 'B', 1002h chứa 'C' và 1003h chứa 'D'.

Khai báo hằng

Các hằng khai báo trong chương trình hợp ngữ bằng lệnh giả EQU để chương trình dễ hiểu hơn. Hằng có thể ở dạng số, ký tự hay chuỗi.
A12 EQU 10 
A13 EQU 'AAA' 
Sau khi sử dụng khai báo này, nếu ta dùng lệnh:
 MOV AH,A12 
thì AH = 10h
A14 DB 'B',A13 
thì khai báo chuỗi A14 với giá trị gán ban đầu là 'BAAA'.

Các toán tử trong hợp ngữ

  • Toán tử số học:
Trong đó bt, bt1, bt2 là các biểu thức hằng, n là số nguyên.
MOV AH,(8+1)*7/3
; AH ← 21
MOV AH, 00010001b shr 2
; AH ← 0000 0100b
MOV AH,00010001b shl 2 
; AH ← 0100 0100b
MOV AH,100 mod 3
; AH ← 1
  • Toán tử logic:
Bao gồm các toán tử AND, OR, NOT, XOR
MOV AH,10 OR 4 AND 2
; AH = 10
MOV AH, 0F0h AND 7Fh
; AH = 70h
  • Toán tử quan hệ:
Các toán tử quan hệ so sánh 2 biểu thức, cho giá trị true (-1) nếu điều kiện thoả và false (0) nếu không thoả.
  • Các toán tử cung cấp thông tin:
 Toán tử SEG:
SEG bt
Toán tử SEG xác định địa chỉ đoạn của biểu thức bt. bt có thể là biến, nhãn, hay các toán hạng bộ nhớ.
 Toán tử OFFSET:
OFFSET bt
Toán tử OFFSET xác định địa chỉ offset của biểu thức bt. bt có thể là biến, nhãn, hay các toán hạng bộ nhớ.
MOV AX,SEG A
; Nạp địa chỉ đoạn và địa chỉ offset
MOV DS,AX
; của biến A vào cặp thanh ghi
MOV AX,OFFSET A
; DS:AX
 Toán tử chỉ số [ ]: (index operator)
Toán tử chỉ số thường dùng với toán hạng trưc tiếp và gián tiếp.
 Toán tử (:) (segment override operator)
Segment:bt
Toán tử : quy định cách tính địa chỉ đối với segment được chỉ. Segment là các thanh ghi đoạn CS, DS, ES, SS.
Khi sử dụng toán tử : kết hợp với toán tử [ ] thì segment: phải đặt ngoài toán tử [ ].
Cách viết [CS:BX] là sai, ta phải viết CS:[BX]
 Toán tử TYPE:
TYPE bt
Trả về giá trị biểu thị dạng của biểu thức bt.
- Nếu bt là biến thì sẽ trả về 1 nếu biến có kiểu byte, 2 nếu biến có kiểu word, 4 nếu biến có kiểu double word.
- Nếu bt là nhãn thì trả về 0FFFFh nếu bt là near và 0FFFEh nếu bt là far.
- Nếu bt là hằng thì trả về 0.
 Toán tử LENGTH:
LENGTH bt
Trả về số các đơn vị cấp cho biến bt
 Toán tử SIZE:
SIZE bt
Trả về tổng số các byte cung cấp cho biến bt
A DD 100 DUP(?)
MOV AX,LENGTH A
; AX = 100
MOV AX,SIZE A
; AX = 400
  • Các toán tử thuộc tính:
 Toán tử PTR:
Loai PTR bt
Toán tử này cho phép thay đổi dạng của biểu thức bt.
- Nếu bt là biến hay toán hạng bộ nhớ thì Loai là byte, word hay dword.
- Nếu bt là nhãn thì Loai là near hay far.
A DW 100 DUP(?)
B DD ?
MOV AH,BYTE PTR A
; Đưa byte đầu tiên trong mảng A vào thanh ghi AH
MOV AX,WORD PTR B
; Đưa 2 byte thấp trong biến B vào thanh ghi AX
  • Toán tử HIGH, LOW:
HIGH bt
LOW bt
Cho giá trị của byte cao và thấp của biểu thức bt, bt phải là một hằng.
A EQU 1234h 
MOV AH,HIGH A
; AH ← 12h
MOV AH,LOW A
; AH ← 34h

Các cách định địa chỉ trong hợp ngữ

 Toán hạng trực tiếp:
Toán hạng trực tiếp là một biểu thức hằng xác định. Các hằng số có thể ở dạng thập phân (có dấu và không dấu), nhị phân, thập lục phân, các hằng số định nghĩa bằng lệnh EQU, …
MOV AH,10 
MOV AH,1010b MOV AH,0Ah MOV AH,A12 
MOV AX,OFFSET msg MOV AX,SEG msg 
 Toán hạng thanh ghi:
Các thanh ghi có thể sử dụng trong phép định địa chỉ thanh ghi là AH, BH, CH, DH, AL, BL, CL, DL, AX, BX, CX, DX, SP, BP, SI, DI, CS, DS, ES, SS.
 Toán hạng bộ nhớ:
Trực tiếp:
Toán hạng này xác định dữ liệu lưu trong bộ nhớ tại một địa chỉ xác định khi dịch, địa chỉ này là một biểu thức hằng (có thể kết hợp với toán tử chỉ số [ ] hay toán tử +, -, :). Thanh ghi đoạn mặc định là thanh ghi DS nhưng ta có thể dùng toán tử : để chỉ thanh ghi đoạn khác.
A DW 1000h
B DB 100 DUP(0)
MOV AX,A
; Chuyển nội dung của biến A vào
MOV AX,[A]
; thanh ghi AX
MOV AH,B 
; Truy xuất phần tử đầu tiên của
MOV AH,B[0]
; mảng B
MOV AH,B + 1
; Truy xuất phần tử thứ hai của
MOV AH,B[1]
; mảng B
MOV AH,B + 5
; Truy xuất phần tử thứ 6 của
MOV AH,B[5]
; mảng B
Lệnh MOV AX,[1000h] sẽ chuyển giá trị 1000h vào thanh ghi AX. Nếu muốn chuyển nội dung tại ô nhớ 1000h vào thanh ghi AX thì phải dùng lệnh MOV AX,DS:[1000h] hay MOV AX,DS:1000h
Gián tiếp:
Toán hạng bộ nhớ gián tiếp cho phép dùng các thanh ghi BX, BP, SI, DI để chỉ các giá trị trong bộ nhớ.
MOV BX,2 
MOV SI,3
MOV AH,B[BX]  
; Chuyển phần tử thứ 3 của mảng B vào thanh ghi AH
MOV AH,B[BX+1]  
; Chuyển phần tử thứ 4 của mảng B vào thanh ghi AH (BX ;+ 1 = 3)
MOV AH,B[BX]+1  
; Chuyển phần tử thứ 6 của mảng B ; vào thanh ghi AH
MOV AH,B[BX+SI]
MOV AH,B[BX][SI] MOV AH,[B+BX+SI] 
MOV AH,[B][BX][SI]  
; BX + SI = 5
MOV AH,B[BX+SI+5] 
;Chuyển phần tử thứ 11 của mảng B vào thanh ghi AH
MOV AH,B[BX][SI]+5 
;BX + SI + 5 = 10
MOV AH,[B+BX+SI+5]

Tạo và thực thi chương trình hợp ngữ

Ta có thể tạo và thực thi một chương trình hợp ngữ trên một máy PC theo các bước sau:
- Dùng một chương trình soạn thảo văn bản không định dạng (như NC) tạo một tập tin chứa chương trình hợp ngữ (gán phần mở rộng của tập tin này là .ASM, giả sử là TEMP.ASM).
- Dùng chương trình TASM.EXE (Turbo Assembler) để dịch ra mã máy dạng .OBJ: TASM TEMP
- Sau khi dịch xong, ta sẽ được file TEMP.OBJ chứa các mã máy của chương trình. Để chuyển thành file thực thi, ta dùng chương trình TLINK.EXE để chuyển thành tập tin .EXE: TLINK TEMP
- Nếu tập tin thực thi ở dạng .COM thì ta dùng thêm chương trình EXE2BIN.EXE: EXE2BIN TEMP TEMP.COM

0 Comment:

Đăng nhận xét

Thank you for your comments!