找论文网 > 计算机论文 > 计算机应用 >

COMET虚拟机的设计与实现(1)

 摘  要  COMET虚拟机是一种为了教学目的而定义的虚拟机,其结构虽然简单,但功能完备,可作为一种教学辅助工具,帮助大学本科学习计算机课程的学生更好地理解现在计算机的结构和工作原理。作者基于原有COMET虚拟机定义,改进并实现了一个功能相对完备的虚拟机。COMET虚拟机 的开发主要突出两个原则:简单性和可移植性。本文将对COMET虚拟机的开发细节做一个完整的描述。
    关键词  COMET虚拟机; 设计; 实现
 
1  引言
    虚拟机就是一台假想的机器。一台虚拟机与一台真实存在的计算机不同之处在于前者只是一个技术规范。虚拟机技术从很早就开始研究,并且在软件技术中广为应用。目前,高度可移植的JAVA编程语言采用的就是虚拟机技术。虚拟机不仅有广泛的商业应用价值,同时也可作为一种很好的教学辅助工具。通过虚拟机,学生可以很好地学习理解计算机的结构和工作原理。因此,设计并实现一个简单的虚拟机有很好的教学意义[4,5]
    COMET虚拟机开始只是作为CASL汇编语言的运行平台而设计,并由中国计算机软件专业技术资格和水平考试大纲中给出的CASL汇编语言文本定义(下文将简称为文本)。作者在文本的基础上,对COMET虚拟机的功能进行了一定的改进和扩充,并实现了一个功能完善的虚拟机实例[1]
2  COMET虚拟机设计 2.1 逻辑结构

图1 COMET虚拟机结构
    COMET虚拟机是一台基于寄存器模型结构的计算机。COMET虚拟机系统主要包括三个部分:中央处理器(CPU)、存储器和出入输出设备。COMET计算机的逻辑结构如图1所示。
CPU是由寄存器、算术逻辑部件和控制逻辑组成。寄存器在程序运行时存储计算过程的各种信息;算术逻辑部件的功能是进行所有的算术和逻辑运算。由于COMET计算机是虚拟的计算机,因此,它的控制逻辑对于我们是透明的[1,4,5]
2.2 寄存器
    COMET虚拟机有5个通用寄存器GR(16位),一个指令计数器PC(16位)和一个标志寄存器FR(2位)。
    GR(通用寄存器) 5个通用寄存器的编号为0、1、2、3、4,分别记为GR0、GR1、GR2、GR3、GR4。这些通用寄存器用于算术、逻辑、移位等运算,其中GR1、GR2、GR3、GR4通用寄存器兼做变址寄存器。另外,GR4还兼做栈指针(SP)用,栈指针是存放栈顶地址用的寄存器。
PC(指令计数器) 在执行指令的过程中,PC中存放着正在执行的指令的第一个字的地址。当指令执行结束时,一般是把PC的内容加上当前指令的长度(不同指令的长度不同),只有在执行转移指令且条件成立时,才将转移指令地址置入PC中。
    FR(标志寄存器) 在ADD、SUB、MUL、DIV、MOD、AND、OR、EOR、CPA、CPL、SLA、SRA、SLL、SRL、LEA等指令执行结束时,根据执行的结果,将FR设置成00、01或10(大于、等于、小于或负数、零、正数)。它们不会因其他指令的执行而改变。
2.3 存储器
    COMET虚拟机是一台16位的定点计算机,主存储器的基本存储单位是字,总容量为65536(216=16k)字,各个字的地址按照0000-FFFF(十六进制)编号。一个字的16位二进制采用从左到右次序编号,如图2所示。

图2 字节顺序
     COMET虚拟机可以处理三种数据,即字符数据、带符号整数、地址数据。字符数据采用16位的Unicode字符;带符号整数采用二进制补码表示,可表示的数值范围为[-215,215-1];地址数据为无符号的整数,范围是[0,216-1]。
    在实现的COMET虚拟机中,内存的高1k字保留用于各种专用的外设寄存器[1,3]
2.4 指令系统
    COMET虚拟机和文本相比,新增加了HALT、MUL、SUB、MOD四条指令。下面只给出HALT、MUL、SUB、MOD四条指令的说明,其他的指令可以参考文本。
HALT指令执行停机操作,占一个字长。MUL指令执行乘法操作,操作规则和ADD等指令相似,占2个字长。SUB指令执行除法操作,操作规则和ADD指令相似,占2个字长。MOD指令执行取模操作,操作规则和ADD指令相似,占2个字长。
2.5 指令格式
    COMET虚拟机机器指令一般包含三种信息:OP,GR,XR,ADR。其中OP为机器指令的编号,对应第一个字的[0-7]位;GR为通用寄存器编号,对应第一个字中的[8-11]位;XR为变址寄存器编号,对应第一个字的[12-15]位,[12-15]位为0表示没有变址(GR0不能作为变址寄存器);ADR为操作数,对应地二个字的[0-15]位。如果一个指令不含某种信息(例如,没有ADR),则忽律该字段。OP、GR、XR、ADR的存储细节如图3所示。

图3 指令格式
    根据指令操作数据的类型的不同,可将COMET虚拟机的机器指令分为四种:寄存器-存储器型,存储器型,寄存器型,空操作数型。如果一个COMET虚拟机指令不涉及主存储器操作(无ADR),则为1个字长,其他均为2个字长。
2.6 字节码格式
    字节码文件是COMET虚拟机的可执行文件。在启动虚拟机时,由命令行中的参数给出字节码文件名。字节码文件含有程序的长度、装载位置、程序指令等信息。虚拟机依据这些信息,将字节码中的指令从二级存储器装载到相应的虚拟机内存。这一系列操作和操作系统的程序加载器的工作情况类似[4]
    COMET虚拟机的字节码文件是一种二进制格式文件,格式如图4所示。

图4 字节码结构
    其中addr为字节码在虚拟机内存的装载地址,len为字节码中指令的个数(不包含len和addr),ins1、ins2、…、insn为要载入虚拟机的指令。
2.7 输入输出设备
    文本中并没有明确定义COMET虚拟机的输入输出设备,只是给出IN、OUT几个IO操作宏指令。在这里,我们采用将外部设备寄存器在内存中统一编址的方法来处理输入和输出设备[1,3]
COMET虚拟机默认的I/O设备是键盘和显示器。利用操作系统提供的从定向功能用户也可以将它们重新定向到其他的设备。
    COMET虚拟机输入输出设备的两个专用寄存器为:IO_ADDR、IO_FLAG,分别对应0xFD100、xFD10地址内存。IO_ADDR用于保存要传输数据的内存地址;IO_FLAG为IO设备的标志位,其8-15位是要传输数据的个数(0表示无IO),7位表示输入或输出(1表示输入,0为输出),6位在出现IO错误时设置,3-5位为传输的类型(有字符、八进制、十进制、十六进制等),0-2位保留。
2.8  调试器
    COMET调试器是一个内嵌在虚拟机里的机器级的调试器。当需要调试一个COMET虚拟机的程序时,只需要在启动COMET虚拟机的时给出相应的命令参数就启动调试功能了[2,4]
    COMET调试器的基本功能有:显示帮助(help),运行程序直到停止(go),分步执行(step n),跳转程序(jump),显示寄存器内容(regs),显示内存数据(dMem),显示内存指令(iMem),修改内存数据(alter),遍历指令(trace),指令记数功能(print),重新装载字节码(clear),退出调试器(quit)。每个调试命令的具体用法可以参考COMET虚拟机的帮助文件。
3  COMET虚拟机实现 3.1 虚拟机数据结构
struct comet
{
         off_t pc;
         short fr;
         short gr[5];
         short mem[MEMSIZE];
} cmt;
    虚拟机结构变量cmt是一个全局变量,成员分别为:指令计数器(pc)、标志寄存器(fr)、通用寄存器(gr)、存储器(mem)。将cmt设计为全局变量的优点是个函数不用传递复杂的结构体参数,缺点是每个进程同时只能有一个虚拟机实例。
3.2 主函数
int
main(int argc, char *argv[])
{
         init(argc, argv);
         if(debug) comet_debug();
         else while(comet_step());
         fclose(source);
         return 0;
}
    函数init首先初始化COMET虚拟机并装载字节码,如果发生错误则停止。然后根据调试器状态,选择运行虚拟机的方式。如果调试开关(debug)被设置,则调用comet_debug函数在调试状态下运行COMET虚拟机。如果没有打开调试开关,则循环调用单步执行函数comet_step,直到程序结束[1,2]
3.3 字节码载入
void
comet_load(void)
{
         unsigned short n, flag[2];
         fseek(source, 0, SEEK_SET);
         n = fread(flag,
sizeof(off_t), 2, source);
         n = fread(&cmt.mem[flag[0]],
sizeof(off_t),tmp[1],source);
         /* 其他处理代码 */
}
     变量n用于记录读取字节码的数目,如果n小于相应的值,则发生字节码装载错误。变量flag用于保存字节码装载信息,分别字节码装载地址和字节码大小。
COMET字节码设计比较简单,也存在很多不足。例如,没有标志文件格式的魔数,没有更完善的错误检测措施。我们的目的是让读者了解字节码的工作原理,因此只给出了一种最简单的实现[1,2,4]
 

共2页: 1 [2] 下一页


基于JDBC的Web数据库应用程序性能优化研究
模型LOD简化的可视化实现
工商管理 | 工科论文 | 财务管理 | 管理学 | 公共管理 | 财政税收 | 证券金融 | 会计审计 | 计算机 | 法律论文 | 医药学 | 汉语言文学
社会论文 | 工科论文 | 理科论文 | 文化论文 | 艺术论文 | 文学论文 | 哲学论文 | 政治论文 | 英语论文 | 写作指导 | 计算机应用
www.zlunwen.com 找论文网 ® 版权所有 网站地图