科技学院
课程设计报告
( 2013-- 2014 年度第 1 学期)
名
院
班
学
称: 编译技术课程设计 A
信息工程系
软件 11K
系:
级:
号:
学生姓名:
指导教师:
设计周数:
成
绩:
2
日期:2013 年 12 月 11 日
《编译技术课程设计 A》
任 务 书
一、 目的与要求
1. 理解和掌握编译程序设计原理及常用的技术,建立编译程序的整体概念;
2. 理解和掌握编译程序词法分析、语法分析、语义分析、中间代码生成和目标代码生
成等几个关键环节原理和实现算法;
3. 掌握软件模块设计技能;熟悉并能较好地利用软件开发环境独立编程、调试和分析
程序运行情况,逐渐形成创新思维和从事系统软件的研究和开发能力。
二、 主要内容
定义一个简化的类 C 语言—L 语言作为源语言,重点针对词法分析、语法分析、语义分
析、中间代码生成和目标代码生成等几个关键环节进行编程和调试训练,最终设计实现 L
语言的编译程序。
通过调试 L 编译程序,了解一般编译程序的总体框架,掌握编译各阶段程序的构造,理
解和掌握错误处理方法及符号表的组织方式,理解和掌握语法制导翻译方法。还可以适当扩
展 L 语言成分,并对相应的编译程序进行扩充。可使用 C、VC++等语言编程实现。
具体内容包括:
1. 由单词的语法规则出发、画出识别单词的状态转换图,然后用程序实现扫描器设计。
2. 设计、编写和调试算法优先分析程序,了解算法优先分析器的组成结构以及对文法
的要求,掌握实现通用算法优先分析算法的方法。
3. 在算符优先分析文法的基础上进行翻译工作,生成四元式表;
4. 设计一个简单的代码生成器,该代码生成器以基本块为单位,依次将每条中间代码
变换成相应的目标代码。
5. 综合以上实验的结果,并进行集成与设计,开发出一个小型编译程序。
对于各项主要内容的实现细节描述和指导,请参考《计算机综合实践指导》编译技术的
相关内容。
三、 进度计划
序号
1
2
3
4
设计(实验)内容
词法分析器设计
算符优先分析程序设计
语法制导翻译程序设计
简单代码生成器设计
完成时间
备注
2 天
3 天
3 天
2 天
四、 设计(实验)成果要求
至少完成简单变量定义语句及包含算术运算符的赋值语句的整个编译过程,统一使用
课程设计报告书,文字清楚、工整。
五、 考核方式
实验结果(60%)+实验报告(30%)+实验过程表现(10%)
学生姓名:指导教师
2013 年 12 月 11 日
实验一、词法分析器的设计与实现
一、课程设计(综合实验)的目的与要求
1. 理解和掌握编译程序设计原理及常用的技术,建立编译程序的整体概念;
2. 理解和掌握编译程序词法分析、语法分析、语义分析、中间代码生成和目标代码生
成等几个关键环节原理和实现算法;
3. 掌握软件模块设计技能;熟悉并能较好地利用软件开发环境独立编程、调试和分析
程序运行情况,逐渐形成创新思维和从事系统软件的研究和开发能力。
二、设计(实验)正文
算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思
想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。
1、关键字作为特殊标识符处理,把它们预先安排在一张表格中(称为关键字表),当扫描
程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般
标识符。关键字表为一个字符串数组,其描述如下:
Char *rwtab[6] = {“begin”, “if”, “then”, “while”, “do”, “end”,};
程序中需要用到的主要变量为 syn,token 和 sum
2、扫描子程序的算法思想:
首先设置 3 个变量:①token 用来存放构成单词符号的字符串;②sum 用来整型单词;③syn
用来存放单词符号的种别码。
三、课程设计(综合实验)总结或结论
通过此次实验,让我了解到如何设计、编制并调试词法分析程序,加深对词法分析原理的理
解,熟悉了构造词法分析程序的手工方式的相关原理。另外,也让我重新熟悉了 C++语言的
相关内容,加深了对 C++语言的用途的理解。比如 main()函数中,用 cin>>ch;语句得到
ch 值得话,给定源程序的结果会有错误,因为得到的字符串中省略了空格,改用 cin.get(ch);
问题解决了。
四、参考文献
《编译技术基础教程》 作者:鲁斌 出版单位:清华大学出版社
附录(设计流程图、程序、表格、数据等)
流程图
变量初始化
忽略空格
是
是否文件结束?
是
返回
字母
拼字符串
是否关键字?
否
否
数字
拼数
其他
符号
运算符、
界符等符号
是
syn=10
对不同符号给
出相应的 syn 值
报错
syn 为对应关键字的
单词种别码
syn=11
返回
各种单词符号对应的种别码
单词符号
种别码
单词符号
种别码
bgin
If
Then
wile
do
end
lettet(letter|digit)*
dight dight*
+
—
*
/
1
2
3
4
5
6
10
11
13
14
15
16
:
:=
<
<>
<=
>
>=
=
;
(
)
#
17
18
20
21
22
23
24
25
26
27
28
0
源代码
#include
#include
#include
char prog[80],token[8];
char ch;
int syn,p,m=0,n,row,sum=0;
char *rwtab[6]={"begin","if","then","while","do","end"};
void scaner()
{
共分为三大块,分别是标示符、数字、符号,对应下面的 if
else if 和 else
/*
*/
for(n=0;n<8;n++) token[n]=NULL;
ch=prog[p++];
while(ch==' ')
{
}
ch=prog[p];
p++;
if((ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))
//可能是标示符或者变量名
{
m=0;
while((ch>='0'&&ch<='9')||(ch>='a'&&ch<='z')||(ch>='A'&&ch<='Z'))
{
token[m++]=ch;
ch=prog[p++];
}
token[m++]='\0';
p--;
syn=10;
for(n=0;n<6;n++)
//将识别出来的字符和已定义的标示符作比较,
if(strcmp(token,rwtab[n])==0)
{
}
syn=n+1;
break;
}
else if((ch>='0'&&ch<='9'))
//数字
{
{
sum=0;
while((ch>='0'&&ch<='9'))
{
}
sum=sum*10+ch-'0';
ch=prog[p++];
}
p--;
syn=11;
if(sum>32767)
syn=-1;
}
else switch(ch)
//其他字符
{
case'<':m=0;token[m++]=ch;
ch=prog[p++];
if(ch=='>')
{
}
syn=21;
token[m++]=ch;
else if(ch=='=')
{
}
else
{
}
syn=22;
token[m++]=ch;
syn=23;
p--;
break;
case'>':m=0;token[m++]=ch;
ch=prog[p++];
if(ch=='=')
{
}
else
{
}
syn=24;
token[m++]=ch;
syn=20;
p--;
break;
case':':m=0;token[m++]=ch;