Posted on 2008-04-13 19:42
形式系统 阅读(230)
评论(0) 编辑 收藏 引用 网摘
目的:
理解词法分析的功能,熟悉词法分析程序的构造。
内容:
(1)定义语言子集的单词
单词
|
内码
|
单词
|
内码
|
单词
|
内码
|
if
|
1
|
+=
|
9
|
,
|
17
|
else
|
2
|
>
|
10
|
;
|
18
|
while
|
3
|
>=
|
11
|
(
|
19
|
int
|
4
|
>>
|
12
|
)
|
20
|
{
|
5
|
=
|
13
|
…
|
…
|
}
|
6
|
==
|
14
|
|
|
+
|
7
|
*
|
15
|
标识符
|
100
|
++
|
8
|
**
|
16
|
数字
|
110
|
(2)构造自动机
若考虑保留字和标识符,则可采用如下两种模式:
① 模式1:将所有单词统一编制自动机(如右上图,识别int、if的自动机)
② 模式2:将所有系统保留字和标识符统一识别,因保留字从构成规则上看是标识符的一个子集。
(3)编码
① 获取有效字符
char getEffChar(){….}
② 状态转换图的实现