目录
ProCalc2000
请问,One 里有什么?
分词器
解析器
评估者
请显示您的代码?
就是这样
运算符优先级
延伸阅读
首页 后端开发 php教程 一小时表达语言

一小时表达语言

Jan 21, 2025 am 08:16 AM

The One Hour Expression Language

这篇博文最好以其原始格式查看。

这篇文章回顾了题为一小时表达语言的演示,回顾了概念和代码。1

表达式语言2,在此上下文中,计算表达式 - 字节序列,很可能是 UTF-8 字符。3 示例包括:

  • 1 1
  • //article[@title="foobar"]//image
  • .items[].foo|select(.bar = "foo")
  • a.comments > 1 and a.category not in ["misc"]

表达式语言(或 DSL4)的示例是:

  • JQ
  • Kibana 查询语言
  • XPath 语言
  • Symfony 表达语言

为什么要构建自己的表达语言? 为什么不呢? 太忙? 不用担心!它不需要几个月、几周甚至几天。 使用一小时表达语言在一小时内创建一个!5

ProCalc2000

我们将构建 ProCalc2000 表达式语言 - 2000 年及以后的下一代非科学算术计算器。

它评估诸如 1 11 2 之类的表达式,并且可以处理诸如 1 3 2 / 2.

之类的除法问题
哥斯拉 由于浮点数,哥斯拉不喜欢除法。

该语言包含数字(例如 1、2)和运算符(、-、)。 它不会*支持运算符优先级(参见附录一)或除法。

尽管它很简单,但它为添加功能提供了基础:变量、函数、管道运算符、后缀、字符串连接,甚至(违背哥斯拉的意愿)除法。

请问,One 里有什么?

评估字节序列的方法有很多,但我们将使用分词器、解析器和评估器:

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
登录后复制
登录后复制
登录后复制

分词器

也称为词法分析器或扫描器。此类将字符串拆分为称为标记的分类块。

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
登录后复制
登录后复制

例如,1 2 3 产生五个标记:

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
登录后复制
登录后复制

分词器从左到右扫描,识别有趣的块:正整数以及 、 - 和 * 运算符。空白被忽略;其他字符会导致错误。 令牌类型有整数、加号、减号和乘号。

哥斯拉 哥斯拉建议使用分词器和堆栈机,但我们将使用解析器和评估器,因为哥斯拉关心。

分词器不检查表达式的有效性;它仅对块进行分类。6 标记将传递给解析器。

解析器

解析器解释标记,将它们转换为抽象语法树(AST)。

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
登录后复制
登录后复制
登录后复制

给定一个标记列表,解析器返回一个 AST——树的根节点。 每个节点都是一个可评估的表达式;节点类型有 BinaryOp 和 Integer。

二元运算有两个操作数(例如,foo or bar 可以是 BinaryOp(Variable('foo'), 'or', Variable('bar')))。

一元运算有一个操作数(例如,-1)。

三元运算有三个操作数(例如,foo ? bar : baz)。

表达式1 1 / 5是一个以 为运算符的BinaryOp,一个操作数为1,另一个为另一个BinaryOp(1 / 5)。

class Tokenizer
{
    public function tokenize(string $expression): Tokens
    {
        // ...
    }
}
登录后复制
登录后复制

评估者

求值器接受一个 Node 并返回一个值(这里是一个整数)。 这是一个树行走翻译器。

<code>Token(Integer, 1)
Token(Plus)
Token(Integer, 2)
Token(Plus)
Token(Integer, 3)</code>
登录后复制
登录后复制

请显示您的代码?

此代码源自 PHPSW 聚会,由单元测试驱动(此处省略)。查看存储库。

哥斯拉 哥斯拉会对这段代码感到愤怒并建议重构。

分词器

首先,一个带有 Token 枚举和可选值的 TokenType 类:

class Parser
{
    public function parse(Tokens $tokens): Node
    {
        // ...
    }
}
登录后复制
<code>                        +-------------+
                        | Binary Op + | 



<p>In PHP:</p>

```php
$ast = new BinaryOp(
    left:     new Integer(1),
    operator: '+',
    right:    new BinaryOp(
        left:     new Integer(1),
        operator: '/',
        right:    new Integer(5),
    )
);</code>
登录后复制

令牌看起来像:

class Evaluator
{
    public function evaluate(Node $node): int
    {
        // ...
    }
}
登录后复制

Tokenizer 类完成以下工作:7

class Token
{
    public function __construct(
        public TokenType $type,
        public ?string $value = null
    ) {}
}
登录后复制

Tokens系列:

enum TokenType
{
    case Plus;
    case Minus;
    case Multiply;
    case Integer;
}
登录后复制
哥斯拉 Godzilla 更喜欢使用数组和 array_shift 或生成器来同时进行标记化和解析。

解析器

[
    new Token(TokenType::Integer, 50),
    new Token(TokenType::Plus),
    // ...
]
登录后复制

这是添加运算符优先级、后缀解析和管道运算符的地方。 例如,后缀解析可以处理“5 英里”这样的表达式。

评估者

class Tokenizer
{
    public function tokenize(string $expression): Tokens 
    {
        $offset = 0;
        $tokens = [];
        while (isset($expression[$offset])) {
            $char = $expression[$offset++];
            if (is_numeric($char)) {
                while (is_numeric($expression[$offset] ?? null)) {
                    $char .= $expression[$offset++];
                }
                $tokens[] = new Token(TokenType::Integer, $char);
                continue;
            }
            $token = match ($char) {
                '+' => new Token(TokenType::Plus),
                '-' => new Token(TokenType::Minus),
                '*' => new Token(TokenType::Multiply),
                ' ' => null,
                default => throw new RuntimeException(sprintf(
                    'Invalid operator: "%s"', $char
                )),
            };
            if ($token === null) {
                continue;
            }
            $tokens[] = $token;
        }
        return new Tokens($tokens);
    }
}
登录后复制

就是这样

此代码是实时编码的,包括测试。 完整的代码可以在存储库中找到。

运算符优先级

表达式 1 * 3 4 应该是 (1 * 3) 4 = 7,但由于解析方法,我们的语言将其计算为 1 * (3 4) = 78 Pratt 解析器纠正了这一点:

<code>              +-----------+  tokens  +--------+  ast  +-----------+ 
EXPRESSION ==>| Tokenizer |--------->| Parser |------>| Evaluator | => VALUE
              +-----------+          +--------+       +-----------+</code>
登录后复制
登录后复制
登录后复制
哥斯拉 哥斯拉了解递归。

延伸阅读

  • 制作口译员:罗伯特·尼斯特罗姆 (Robert Nystrom) 所著的书籍(免费网络版)
  • 表达式解析变得简单:Robert Nystrom 的博客文章
  • 堆栈机 RPN 计算器:2014 年 Igor Wiedler 发表
  • 学说词法分析器
  • PHPStan Phpdoc 解析器9

  1. 代码随着每次迭代而变化。
  2. 或更具体地说,是一个表达式语言解释器。
  3. 在 PHP 中通常称为字符串。
  4. 领域特定语言。
  5. 不存在专利。
  6. 分词器对于语法突出显示很有用。
  7. preg_方法可能会更高效。
  8. 只有在期望不同的答案时才是错误的。
  9. 树遍历是通过 Doctrine 的查询构建器发现的。

以上是一小时表达语言的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

热门话题

Java教程
1662
14
CakePHP 教程
1418
52
Laravel 教程
1311
25
PHP教程
1261
29
C# 教程
1234
24
说明PHP中的不同错误类型(注意,警告,致命错误,解析错误)。 说明PHP中的不同错误类型(注意,警告,致命错误,解析错误)。 Apr 08, 2025 am 12:03 AM

PHP中有四种主要错误类型:1.Notice:最轻微,不会中断程序,如访问未定义变量;2.Warning:比Notice严重,不会终止程序,如包含不存在文件;3.FatalError:最严重,会终止程序,如调用不存在函数;4.ParseError:语法错误,会阻止程序执行,如忘记添加结束标签。

PHP和Python:比较两种流行的编程语言 PHP和Python:比较两种流行的编程语言 Apr 14, 2025 am 12:13 AM

PHP和Python各有优势,选择依据项目需求。1.PHP适合web开发,尤其快速开发和维护网站。2.Python适用于数据科学、机器学习和人工智能,语法简洁,适合初学者。

说明PHP中的安全密码散列(例如,password_hash,password_verify)。为什么不使用MD5或SHA1? 说明PHP中的安全密码散列(例如,password_hash,password_verify)。为什么不使用MD5或SHA1? Apr 17, 2025 am 12:06 AM

在PHP中,应使用password_hash和password_verify函数实现安全的密码哈希处理,不应使用MD5或SHA1。1)password_hash生成包含盐值的哈希,增强安全性。2)password_verify验证密码,通过比较哈希值确保安全。3)MD5和SHA1易受攻击且缺乏盐值,不适合现代密码安全。

PHP行动:现实世界中的示例和应用程序 PHP行动:现实世界中的示例和应用程序 Apr 14, 2025 am 12:19 AM

PHP在电子商务、内容管理系统和API开发中广泛应用。1)电子商务:用于购物车功能和支付处理。2)内容管理系统:用于动态内容生成和用户管理。3)API开发:用于RESTfulAPI开发和API安全性。通过性能优化和最佳实践,PHP应用的效率和可维护性得以提升。

什么是HTTP请求方法(获取,发布,放置,删除等),何时应该使用? 什么是HTTP请求方法(获取,发布,放置,删除等),何时应该使用? Apr 09, 2025 am 12:09 AM

HTTP请求方法包括GET、POST、PUT和DELETE,分别用于获取、提交、更新和删除资源。1.GET方法用于获取资源,适用于读取操作。2.POST方法用于提交数据,常用于创建新资源。3.PUT方法用于更新资源,适用于完整更新。4.DELETE方法用于删除资源,适用于删除操作。

PHP:网络开发的关键语言 PHP:网络开发的关键语言 Apr 13, 2025 am 12:08 AM

PHP是一种广泛应用于服务器端的脚本语言,特别适合web开发。1.PHP可以嵌入HTML,处理HTTP请求和响应,支持多种数据库。2.PHP用于生成动态网页内容,处理表单数据,访问数据库等,具有强大的社区支持和开源资源。3.PHP是解释型语言,执行过程包括词法分析、语法分析、编译和执行。4.PHP可以与MySQL结合用于用户注册系统等高级应用。5.调试PHP时,可使用error_reporting()和var_dump()等函数。6.优化PHP代码可通过缓存机制、优化数据库查询和使用内置函数。7

PHP如何安全地上载文件? PHP如何安全地上载文件? Apr 10, 2025 am 09:37 AM

PHP通过$\_FILES变量处理文件上传,确保安全性的方法包括:1.检查上传错误,2.验证文件类型和大小,3.防止文件覆盖,4.移动文件到永久存储位置。

解释self ::,parent ::和static :: in php oop中的区别。 解释self ::,parent ::和static :: in php oop中的区别。 Apr 09, 2025 am 12:04 AM

在PHPOOP中,self::引用当前类,parent::引用父类,static::用于晚静态绑定。1.self::用于静态方法和常量调用,但不支持晚静态绑定。2.parent::用于子类调用父类方法,无法访问私有方法。3.static::支持晚静态绑定,适用于继承和多态,但可能影响代码可读性。

See all articles