水杉 Java 解析器

These details have not been verified by PyPI

Project links

Homepage

Intended Audience
- Developers
Natural Language
- Chinese (Simplified)
Operating System
- OS Independent
Programming Language
Topic
- Software Development :: Libraries

Project description

metasequoia-java：水杉 Java 解析器

安装方法

水杉 Java 解析器为纯 Python 开发，不依赖其他第三方包，在任意环境下直接 pip 安装即可（pypi 项目地址）：

pip install metasequoia-java

使用方法

解析语句：

code = "try (Rt rt = new Rt()) {} catch ( Exception1 | Exception2 e ) {} finally {}"
print(ms_java.JavaParser(ms_java.LexicalFSM(code)).parse_statement())

解析表达式：

# parse expression
code = "name += (3 + 5) * 6"
print(ms_java.JavaParser(ms_java.LexicalFSM(code)).parse_expression())

解析类型：

# parse type
code = "List<String>"
print(ms_java.JavaParser(ms_java.LexicalFSM(code), mode=ms_java.ParserMode.TYPE).parse_type())

设计思路

与其他解析逻辑一样，我们采用词法解析与语法解析分离的解析器实现方案。

词法解析：将 Unicode 字符串转换为 Token 流
语法解析：将 Token 流转换为抽象语法树

在词法解析层，我们采用有限状态自动机实现；在语法解析层，我们采用调用的方式实现。

之所以在语法解析层采用调用的方式实现，主要是出于如下 5 个考虑：

与 JDK 文档一致，在开发时不需要将 JDK 文档的语法撰写为 LALR(1) 的语法，方便后续维护开发
与 JDK 的解析逻辑一致，避免因后续 JDK 版本出现类似 non-sealed 关键字等语法，导致需要再 LALR(1) 语法下新增更多复杂处理，降低后续维护难度
更容易地保证抽象语法树与 JDK 抽象语法树的一致性
虽然会损失一定的解析性能，但是可以通过 Python 性能优化器补偿，损失可以接受
存在 >> 等运算符，在实际使用时可能需要考虑拆开为多个 Token 解析的情况

项目结构如下：

ast：抽象语法树节点及相关常量、函数等
grammar：语法解析器
lexical：词法解析器

终结符的设计思路：

在终结符类型的枚举类上，我们大体延用了 JDK 源码中的名称，但将驼峰式改为下划线式以适应 Python 的风格；
我们将每个终结符之后的空格、换行符和注释，作为该终结符的附属元素添加。

分析器设计思路：

context 后缀的类为项目、文件、类和方法的静态上下文管理器；
runtime 前缀的类为类、方法、变量的动态实例。

Project details

These details have not been verified by PyPI

Project links

Homepage

Intended Audience
- Developers
Natural Language
- Chinese (Simplified)
Operating System
- OS Independent
Programming Language
Topic
- Software Development :: Libraries

Release history Release notifications | RSS feed

This version

0.2.1

Sep 17, 2025

0.2.0

Feb 22, 2025

0.1.1

Jan 8, 2025

0.1.0

Jan 5, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

metasequoia_java-0.2.1.tar.gz (101.5 kB view details)

Uploaded Sep 17, 2025 Source

File details

Details for the file metasequoia_java-0.2.1.tar.gz.

File metadata

Download URL: metasequoia_java-0.2.1.tar.gz
Upload date: Sep 17, 2025
Size: 101.5 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.11.5

File hashes

Hashes for metasequoia_java-0.2.1.tar.gz
Algorithm	Hash digest
SHA256	`bba86732a866249ab7e3207d33034bc88938de1e008d80c246ba0d9b998e4252`
MD5	`7ddad56d23f1fdd3e8a3f5c217c27d13`
BLAKE2b-256	`dc43e064c34eb5208814347d0a82481b250b0c2a51d4187ecfa1711f1c47dc8a`

See more details on using hashes here.

metasequoia-java 0.2.1

Navigation

Verified details

Maintainers

Meta

Unverified details

Project links

Meta

Classifiers

Project description

metasequoia-java：水杉 Java 解析器

安装方法

使用方法

设计思路

Project details

Verified details

Maintainers

Meta

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

File details

File metadata

File hashes