到目前为止,我们写了3个函数:InputStream,TokenStream 和 parse。为了从一段代码中获取AST,我们可以执行以下操作:
var ast = parse (TokenStream (InputStream (code ))) ;
获取AST后就可以编写Interpreter(解释器)了,这比写parser容易。我们只需走AST,以正常顺序执行表达式。
执行环境
正确执行表达式的关键是正确维护执行环境 - 一个拥有绑定变量的上下文。它将作为参数传递给我们的evaluate函数。每次我们进入”lambda”节点时,我们都必须用新变量(函数的参数)扩展环境,并用运行时传递的值对它们进行初始化。如果一个参数影响了外部作用域的变量,我们必须小心地在离开函数时恢复先前的值。
实现这个最简单的方法是使用JavaScript的原型继承。当我们输入一个函数时,我们将创建一个新的环境。这种方式当我们退出时,我们不需要做任何事情——外部env已经包含在对象本身。
以下是Environment对象的定义:
function Environment(parent) {
this.vars = Object.create(parent ? parent.vars : null);
this.parent = parent;
}
Environment.prototype = {
extend: function() {
return new Environment(this);
},
lookup: function(name) {
var scope = this;
while (scope) {
if (Object.prototype.hasOwnProperty.call(scope.vars, name))
return scope;
scope = scope.parent;
}
},
get: function(name) {
if (name in this.vars)
return this.vars[name];
throw new Error("Undefined variable " + name);
},
set: function(name, value) {
var scope = this.lookup(name);
// let's not allow defining globals from a nested environment
if (!scope && this.parent)
throw new Error("Undefined variable " + name);
return (scope || this).vars[name] = value;
},
def: function(name, value) {
return this.vars[name] = value;
}
};
一个Environment对象有一个parent属性指向父作用域。在全局作用域下parent为null。它有一个vars属性保存绑定的变量。
有以下方法:
- extend() - 创建一个子作用域。
- lookup(name) - 查找具有给定名称的变量的作用域。
- get(name) - 获取变量的当前值。如果变量未定义,则会抛出错误。
- set(name, value) - 设置变量的值。这需要查找变量定义的实际作用域。如果找不到并且我们不在全局范围内,则抛出错误。
- def(name, value) - 这会在当前范围内创建(或覆盖)一个变量。
evaluate函数
有了执行环境,我们就可以回到我们的主要问题(编写Interpreter)中来,这个evaluate函数包含了一个大switch循环,按节点类型执行不同的逻辑,下面是每个节点的说明:
function evaluate(exp, env) {
switch (exp.type) {
常量节点,我们只返回它们的值:
case "num":
case "str":
case "bool":
return exp.value;
变量是从环境中提取的。请记住,”var” token,其value属性包含变量名称名称:
case "var":
return env.get(exp.value);
对于赋值,我们需要检查左侧是否是一个 “var” token(如果不是,则抛出一个错误;现在我们不支持赋值给其他任何东西)。然后我们使用env.set设置值。
请注意,该值需要首先通过evaluate递归调用来计算。
case "assign":
if (exp.left.type != "var")
throw new Error("Cannot assign to " + JSON.stringify(exp.left));
return env.set(exp.left.value, evaluate(exp.right, env));
一个”binary”节点需要用到两个操作数。我们稍后会写这个apply_op函数,这很简单。同样,我们需要递归调用evaluator来计算left和right操作数
case "binary":
return apply_op(exp.operator,
evaluate(exp.left, env),
evaluate(exp.right, env));
一个”lambda”节点实际上会产生一个JavaScript闭包,所以它就像普通函数一样可以从JavaScript中调用。我写了一个make_lambda函数,将在后面定义它:
case "lambda":
return make_lambda(env, exp);
评估if节点很简单:首先评估if条件。如果不成立,则评估then分支并返回其值。最后如果存在else分支,就评估,否则返回false.
case "if":
var cond = evaluate(exp.cond, env);
if (cond !== false) return evaluate(exp.then, env);
return exp.else ? evaluate(exp.else, env) : false;
“prog”节点是一系列表达式。我们只是按顺序评估它们并返回最后一个的值。对于一个空序列,返回值默认为false。
case "prog":
var val = false;
exp.prog.forEach(function(exp){ val = evaluate(exp, env) });
return val;
对于一个”call”节点,我们需要调用evaluate计算func函数。首先我们评估一下,它应该返回一个正常的JS函数,然后我们评估并应用该函数。
case "call":
var func = evaluate(exp.func, env);
return func.apply(null, exp.args.map(function(arg){
return evaluate(arg, env);
}));
我们的程序不应该到下面这一步,但是为了防止在解析器中添加新的节点类型,并且忘记更新评估程序,让我们抛出一个明确的错误。
default:
throw new Error("I don't know how to evaluate " + exp.type);
}
}
这是evaluate函数的核心,你可以看到它非常简单。最后,我们还需要编写两个函数,先从最简单的apply_op函数开始:
function apply_op(op, a, b) {
function num(x) {
if (typeof x != "number")
throw new Error("Expected number but got " + x);
return x;
}
function div(x) {
if (num(x) == 0)
throw new Error("Divide by zero");
return x;
}
switch (op) {
case "+" : return num(a) + num(b);
case "-" : return num(a) - num(b);
case "*" : return num(a) * num(b);
case "/" : return num(a) / div(b);
case "%" : return num(a) % div(b);
case "&&" : return a !== false && b;
case "||" : return a !== false ? a : b;
case "<" : return num(a) < num(b);
case ">" : return num(a) > num(b);
case "<=" : return num(a) <= num(b);
case ">=" : return num(a) >= num(b);
case "==" : return a === b;
case "!=" : return a !== b;
}
throw new Error("Can't apply operator " + op);
}
它接收运算符和其中需要运算的2个数,然后执行并返回而已。与JavaScript不同,我们只要求运算符的操作数为数字,并且使用num和div函数来检查。对于字符串我们会定义其他的东西。
而make_lambda则有点微妙:
function make_lambda(env, exp) {
function lambda() {
var names = exp.vars;
var scope = env.extend();
for (var i = 0; i < names.length; ++i)
scope.def(names[i], i < arguments.length ? arguments[i] : false);
return evaluate(exp.body, scope);
}
return lambda;
}
正如你所看到的,它返回一个简单的JavaScript函数,包含环境和表达式进行执行。
重点是,创建这个函数时什么都不会发生,但是当它被调用时,它会创建时的环境所使用的参数/值(如果传递的值少于函数的参数列表,缺少的部分默认为false)。 最后evaluate其函数体。
原始功能
如你所见,我们的语言没有提供任何方式与外界进行交流。
在一些代码示例中,我使用了一些print和println函数,但它们没有在任何地方定义。
这些必须被定义为原始函数(也就是说,我们将用JavaScript编写它们并将它们插入到全局环境中)。
现在把它放在一起,这里有一个测试程序:
// some test code here
var code = "sum = lambda(x, y) x + y; print(sum(2, 3));";
// remember, parse takes a TokenStream which takes an InputStream
var ast = parse(TokenStream(InputStream(code)));
// create the global environment
var globalEnv = new Environment();
// define the "print" primitive function
globalEnv.def("print", function(txt){
console.log(txt);
});
// run the evaluator
evaluate(ast, globalEnv); // will print 5
您可以 下载 我们迄今为止编写的代码。它可以在NodeJS中运行——,例如:
echo 'sum = lambda(x, y) x + y; println(sum(2, 3));' | node lambda-eval1.js
相关文章