第四章第一个程序

4.1 一个源程序从写出到执行的过程

简要过程：

编写 $\longrightarrow$ 编译 $\longrightarrow$ 连接 $\longrightarrow$ 执行

编写汇编源程序

使用文本编辑器，用汇编语言编写汇编源程序

对源程序进行编译连接

使用汇编语言编译程序对源程序文件中的源程序进行编译，产生目标文件；再用连接程序对目标文件进行连接，生成可在操作系统中直接运行的可执行文件。

可执行文件

可执行文件中包含两部分内容：

程序（从原程序中的汇编指令翻译过来的机器码）和数据（源程序中定义的数据）

相关的描述信息（比如：程序有多大、要占多少内存空间等）

执行可执行文件中的程序

在操作系统中，执行可执行文件中的程序。
操作系统依照可执行文件中的描述信息，将可执行文件中的机器码和数据加载入内存，并进行相关的初始化（比如：设置CS:IP指向第一条要执行的指令），然后由CPU执行程序。

4.2 源程序

汇编指令

有对应的机器码的指令，可以被编译为机器指令，最终为CPU所执行

伪指令

没有对应的机器码的指令，最终不被CPU所执行。

谁来执行伪指令呢？
伪指令是由编译器来执行的指令，编译器根据伪指令来进行相关的编译工作

4.2.1 定义一个段

segment和ends是一对成对使用的伪指令，这是在写可被编译器编译的汇编程序时，必须要用到的一对伪指令。
segment和ends的功能是定义一个段，segment说明一个段开始，ends 说明一个段结束。
一个段必须有一个名称来标识，使用格式为：段名 segment 段名 ends

一个汇编程序是由多个段组成的，这些段被用来存放代码、数据或当作栈空间来使用。
一个有意义的汇编程序中至少要有一个段，这个段用来存放代码。

end

end 是一个汇编程序的结束标记，编译器在编译汇编程序的过程中，如果碰到了伪指令 end，就结束对源程序的编译。
如果程序写完了，要在结尾处加上伪指令end 。否则，编译器在编译程序时，无法知道程序在何处结束。
注意：不要搞混了end和ends。

源程序中的程序

汇编源程序：

伪指令（编译器处理）

汇编指令（编译为机器码）

程序：源程序中最终由计算机执行、处理的指令或数据。

程序最先以汇编指令的形式存在源程序中，经编译、连接后转变为机器码，存储在可执行文件中，
标号

一个标号指代了一个地址

codesg：放在segment的前面，作为一个段的名称，这个段的名称最终将被编译、连接程序处理为一个段的段地址。

4.2.2 DOS中的程序运行

DOS是一个单任务操作系统。

一个程序P2在可执行文件中，则必须有一个正在运行的程序P1，将P2从可执行文件中加载入内存后，将CPU的控制权交给P2，P2才能得以运行。P2开始运行后，P1暂停运行。
而当P2运行完毕后，应该将CPU的控制权交还给使它得以运行的程序P1，此后，P1继续运行

程序返回

我们的程序最先以汇编指令的形式存在源程序中，经编译、连接后转变为机器码，存储在可执行文件中

一个程序结束后，将CPU的控制权交还给使它得以运行的程序，我们称这个过程为：程序返回。

具体操作

mov ax ，4C00H

int 21H

这两条指令所实现的功能就是程序返回

目的	相关指令	指令性质	指令执行者
通知编译器一个段结束	段名 ends	伪指令	编译时，编译器执行
通知编译器程序结束	end	伪指令	编译时，编译器执行
程序返回	mov ax，4c00H；int 21H	汇编指令	编译时，由CPU执行

4.4 编辑源程序

一般来说，有两类错误使我们得不到所期望的目标文件：
（1）我们程序中有“Severe Errors”；
（2）找不到所给出的源程序文件。

4.5 连接

我们用汇编语言编程，就要用到：编辑器（Edit）、编译器（masm）、连接器（link）、调试工具（debug）等所有工具，而这些工具都是在操作系统之上运行的程序，所以我们的学习过程必须在操作系统的环境中进行。

连接的作用：

当源程序很大时，可以将它分为多个源程序文件来编译，每个源程序编译成为目标文件后，再用连接程序将它们连接到一起，生成一个可执行文件；
程序中调用了某个库文件中的子程序，需要将这个库文件和该程序生成的目标文件连接到一起，生成一个可执行文件；
一个源程序编译后，得到了存有机器码的目标文件，目标文件中的有些内容还不能直接用来生成可执行文件，连接程序将这此内容处理为最终的可执行信息。

所以，在只有一个源程序文件，而又不需要调用某个库中的子程序的情况下，也必须用连接程序对目标文件进行处理，生成可执行文件。

注意

对于连接的过程，可执行文件是我们要得到的最终结果。

4.6 以简化的方式进行编译和连接

我们编译、连接的最终目的是用源程序文件生成可执行文件。

在这个过程中所产生的中间文件都可以忽略。我们可以用一种较为简捷的方式进行编译、连接。

4.6.1 操作系统的外壳

操作系统是由多个功能模块组成的庞大、复杂的软件系统。任何通用的操作系统，都要提供一个称为shell（外壳）的程序，用户（操作人员）使用这个程序来操作计算机系统工作。

DOS中有一个程序command.com ，这个程序在 DOS 中称为命令解释器，也就是DOS系统的shell。

4.6.2 1.exe的执行过程：

1.exe的执行过程：

我们在提示符“C:\masm”后面输入可执行文件的名字“1”，按Enter键。

问题：执行操作时，有一个正在运行的程序将1.exe中的程序加载入内存，这个正在运行的程序是什么？它将程序加载入内存后，如何使程序得以运行？

我们在DOS中直接执行 1.exe 时，是正在运行的command将1.exe中的程序加载入内存。

command设置CPU的CS:IP指向程序的第一条指令（即程序的入口），从而使程序得以运行。

1.exe中的程序运行；
运行结束，返回，再次显示提示符“C:\masm”。

**问题：**执行第（3）步操作，程序运行结束后，返回到哪里？

程序运行结束后，返回到command中，CPU继续运行command

4.8 可执行文件中的程序装入内存并运行的原理

EXE文件中的程序的加载过程

程序加载后，ds中存放着程序所在内存区的段地址，这个内存区的偏移地址为 0 ，则程序所在的内存区的地址为：ds:0；
这个内存区的前256 个字节中存放的是PSP，dos用来和程序进行通信。
从 256字节处向后的空间存放的是程序。
所以，我们从ds中可以得到PSP的段地址SA，PSP的偏移地址为 0，则物理地址为SA×16+0。
因为PSP占256（100H）字节，所以程序的物理地址是：

SA×16+0+256= SA×16+16×16=（SA+16）×16+0

可用段地址和偏移地址表示为：SA+10:0。

4.9 程序执行过程的跟踪

Debug 可以将程序加载入内存，设置CS:IP指向程序的入口，但Debug并不放弃对CPU 的控制，这样，我们就可以使用Debug 的相关命令来单步执行程序，查看每条指令指令的执行结果。

Debug命令：**

—r

查看其他指令

—u

不执行程序中的每一条指令，并观察每条指令的执行结果

—t

int 21的执行

—p

退出debug

—Q

将返回到command中，因为debug是由command加载运行的

注意：

需要注意的是，在 DOS 中运行程序时，是command将程序加载入内存；所以程序运行结束后返回到command中

而在这里是debug 将程序加载入内存，所以程序运行结束后要返回到debug中。

加载顺序说明

我们在 DOS中用 “debug 1.exe” 运行debug对1.exe进行跟踪时，

程序加载的顺序是：

command加载Debug，Debug加载1.exe。

返回的顺序是：

从1.exe中的程序返回到Debug，从Debug返回到command。

来源：CSDN

作者：nishizzma

链接：https://blog.csdn.net/qq_44671752/article/details/104348545

标签

源程序

编译程序

汇编语言

汇编指令

计算机指令

汇编语言（四）--第一个程序

第四章 第一个程序