1 Introduction¶

1.0 什么是编译器¶

把源语言表述的源程序转换成目标语言表述的目标程序，并不是只有把高级语言写成的程序转换成可执行文件的程序才是编译器。

Tiger编译器的流程：

编译器被划分成了不同的module模块（phases阶段可以是一个或者多个module），每个模块之间通过interface接口连接。（并不是所有的编译器都是按照这个框架来的，能跑就行）

抽象语言：在模块间传递的信息的描述方式

编译器前端：理解源语言，包括词法分析、语法分析、语义分析等

编译器后端：生成目标语言

不一定是实打实的数据结构，可能是一个或者一组函数，例如词法分析和语法分析之间通过调用词法分析阶段的getNextToken()获得接口的tokens。

比较重要的两个抽象：

两个工具：

把一个将程序变成抽象的树的语法称为树语言。（感觉和CFG对应的语法树类似？）

例子：

Q：编译器如何表示这个程序？

上图为产生该程序的语法树。父节点是对应语法表达式的标签，子节点是具体的语法表达式右边的一个个内容。

树是通过语法描述的
一个树是通过一个或者多个typedef描述的（因为语法树有很多不同的节点），每一个对应了一个语法中的symbol
每一个typedef定义的是特定结构的指针
每一个struct包含一个类型域因为可能有多个产生式
如果产生式右边包含多个symbol，那么需要定义一个struct u作为多个symbol的union结构：
如果产生式右边只有一个symbol，那么就不需要union结构，直接定义一个string就可以
每一个类（产生式）会有一个constructor function（用于申请内存和赋值）：
为了减少模块交互的冲突，会给每一个模块添加独特的前缀
typedef的名称需要以小写字母开头，constructor functions需要以大写字母开头，enumeration atoms和union variants均以小写字母开头

一些工程上的规则（应该不是很重要）：