第四章 第一个程序
4.1 一个源程序从写出到执行的过程
简要过程:
编写编译连接执行
编写汇编源程序
使用文本编辑器,用汇编语言编写汇编源程序
对源程序进行编译连接
使用汇编语言编译程序对源程序文件中的源程序进行编译,产生目标文件;再用连接程序对目标文件进行连接,生成可在操作系统中直接运行的可执行文件。
可执行文件
可执行文件中包含两部分内容:
- 程序(从原程序中的汇编指令翻译过来的机器码)和数据(源程序中定义的数据)
- 相关的描述信息(比如:程序有多大、要占多少内存空间等)
执行可执行文件中的程序
在操作系统中,执行可执行文件中的程序。
操作系统依照可执行文件中的描述信息,将可执行文件中的机器码和数据加载入内存,并进行相关的初始化(比如:设置CS:IP指向第一条要执行的指令),然后由CPU执行程序。
4.2 源程序
汇编指令
有对应的机器码的指令,可以被编译为机器指令,最终为CPU所执行
伪指令
没有对应的机器码的指令,最终不被CPU所执行。
谁来执行伪指令呢?
伪指令是由编译器来执行的指令,编译器根据伪指令来进行相关的编译工作
4.2.1 定义一个段
segment和ends是一对成对使用的伪指令,这是在写可被编译器编译的汇编程序时,必须要用到的一对伪指令。
segment和ends的功能是定义一个段,segment说明一个段开始,ends 说明一个段结束。
一个段必须有一个名称来标识,使用格式为:段名 segment 段名 ends
一个汇编程序是由多个段组成的,这些段被用来存放代码、数据或当作栈空间来使用。
一个有意义的汇编程序中至少要有一个段,这个段用来存放代码。
end
end 是一个汇编程序的结束标记,编译器在编译汇编程序的过程中,如果碰到了伪指令 end,就结束对源程序的编译。
如果程序写完了,要在结尾处加上伪指令end 。否则,编译器在编译程序时,无法知道程序在何处结束。
注意:不要搞混了end和ends。
源程序中的程序
汇编源程序:
伪指令(编译器处理)
汇编指令(编译为机器码)
程序:源程序中最终由计算机执行、处理的指令或数据。
程序最先以汇编指令的形式存在源程序中,经编译、连接后转变为机器码,存储在可执行文件中,
标号
一个标号指代了一个地址
codesg:放在segment的前面,作为一个段的名称,这个段的名称最终将被编译、连接程序处理为一个段的段地址。
4.2.2 DOS中的程序运行
DOS是一个单任务操作系统。
- 一个程序P2在可执行文件中,则必须有一个正在运行的程序P1,将P2从可执行文件中加载入内存后,将CPU的控制权交给P2,P2才能得以运行。P2开始运行后,P1暂停运行。
- 而当P2运行完毕后,应该将CPU的控制权交还给使它得以运行的程序P1,此后,P1继续运行
程序返回
我们的程序最先以汇编指令的形式存在源程序中,经编译、连接后转变为机器码,存储在可执行文件中
一个程序结束后,将CPU的控制权交还给使它得以运行的程序,我们称这个过程为:程序返回。
具体操作
mov ax ,4C00H
int 21H
这两条指令所实现的功能就是程序返回
目的 | 相关指令 | 指令性质 | 指令执行者 |
---|---|---|---|
通知编译器一个段结束 | 段名 ends | 伪指令 | 编译时,编译器执行 |
通知编译器程序结束 | end | 伪指令 | 编译时,编译器执行 |
程序返回 | mov ax,4c00H;int 21H | 汇编指令 | 编译时,由CPU执行 |
4.4 编辑源程序
一般来说,有两类错误使我们得不到所期望的目标文件:
(1)我们程序中有“Severe Errors”;
(2)找不到所给出的源程序文件。
4.5 连接
我们用汇编语言编程,就要用到 :编辑器(Edit)、编译器(masm)、连接器(link)、调试工具(debug)等所有工具,而这些工具都是在操作系统之上运行的程序,所以我们的学习过程必须在操作系统的环境中进行。
连接的作用:
- 当源程序很大时,可以将它分为多个源程序文件来编译,每个源程序编译成为目标文件后,再用连接程序将它们连接到一起,生成一个可执行文件;
- 程序中调用了某个库文件中的子程序,需要将这个库文件和该程序生成的目标文件连接到一起,生成一个可执行文件;
- 一个源程序编译后,得到了存有机器码的目标文件,目标文件中的有些内容还不能直接用来生成可执行文件,连接程序将这此内容处理为最终的可执行信息。
所以,在只有一个源程序文件,而又不需要调用某个库中的子程序的情况下,也必须用连接程序对目标文件进行处理,生成可执行文件。
注意
对于连接的过程,可执行文件是我们要得到的最终结果。
4.6 以简化的方式进行编译和连接
我们编译、连接的最终目的是用源程序文件生成可执行文件。
在这个过程中所产生的中间文件都可以忽略。我们可以用一种较为简捷的方式进行编译、连接。
4.6.1 操作系统的外壳
操作系统是由多个功能模块组成的庞大 、复杂的软件系统。任何通用的操作系统 ,都要提供一个称为shell(外壳)的程序 ,用户(操作人员)使用这个程序来操作计算机系统工作。
DOS中有一个程序command.com ,这个程序在 DOS 中称为命令解释器,也就是DOS系统的shell。
4.6.2 1.exe的执行过程:
1.exe的执行过程:
- 我们在提示符“C:\masm”后面输入可执行文件的名字“1”,按Enter键。
问题:执行操作时,有一个正在运行的程序将1.exe中的程序加载入内存,这个正在运行的程序是什么?它将程序加载入内存后,如何使程序得以运行?
我们在DOS中直接执行 1.exe 时,是正在运行的command将1.exe中的程序加载入内存。
command设置CPU的CS:IP指向程序的第一条指令(即程序的入口),从而使程序得以运行。
- 1.exe中的程序运行;
- 运行结束,返回,再次显示提示符“C:\masm”。
**问题:**执行第(3)步操作,程序运行结束后,返回到哪里?
程序运行结束后,返回到command中,CPU继续运行command
4.8 可执行文件中的程序装入内存并运行的原理
EXE文件中的程序的加载过程
-
程序加载后,ds中存放着程序所在内存区的段地址,这个内存区的偏移地址为 0 ,则程序所在的内存区的地址为:ds:0;
-
这个内存区的前256 个字节中存放的是PSP,dos用来和程序进行通信。
-
从 256字节处向后的空间存放的是程序。
-
所以,我们从ds中可以得到PSP的段地址SA,PSP的偏移地址为 0,则物理地址为SA×16+0。
-
因为PSP占256(100H)字节,所以程序的物理地址是:
SA×16+0+256= SA×16+16×16=(SA+16)×16+0
可用段地址和偏移地址表示为:SA+10:0。
4.9 程序执行过程的跟踪
Debug 可以将程序加载入内存,设置CS:IP指向程序的入口,但Debug并不放弃对CPU 的控制,这样,我们就可以使用Debug 的相关命令来单步执行程序 ,查看每条指令指令的执行结果。
Debug命令:**
—r
查看其他指令
—u
不执行程序中的每一条指令,并观察每条指令的执行结果
—t
int 21的执行
—p
退出debug
—Q
将返回到command中,因为debug是由command加载运行的
注意:
需要注意的是,在 DOS 中运行程序时,是command将程序加载入内存;所以程序运行结束后返回到command中
而在这里是debug 将程序加载入内存,所以程序运行结束后要返回到debug中。
加载顺序说明
我们在 DOS中用 “debug 1.exe” 运行debug对1.exe进行跟踪时,
程序加载的顺序是:
command加载Debug,Debug加载1.exe。
返回的顺序是:
从1.exe中的程序返回到Debug,从Debug返回到command。
来源:CSDN
作者:nishizzma
链接:https://blog.csdn.net/qq_44671752/article/details/104348545