文件翻译工具

Project description

项目Logo

DocuTranslate

简体中文 / English

DocuTranslate 是一个文件翻译工具，利用先进的文档解析引擎（如 docling 和 minerU）与大型语言模型（LLM）相结合，实现对多种格式文档的精准翻译。

新版架构采用 工作流(Workflow) 为核心，为不同类型的翻译任务提供了高度可配置和可扩展的解决方案。

✅ 支持多种格式：能翻译 pdf, docx, xlsx,md, txt, json、epub、srt 等多种文件。
✅ 表格、公式、代码识别：凭借docling、mineru实现对学术论文中经常出现的表格、公式、代码的识别与翻译
✅ json翻译：支持通过json路径(jsonpath-ng语法规范)指定json中需要被翻译的值。
✅ Word/Excel高保真翻译：支持docx、xlsx文件（暂不支持doc、xls文件）的翻译，保持原格式进行翻译。
✅ 多ai平台支持：支持绝大部分的ai平台，可以实现自定义提示词的并发高性能ai翻译。
✅ 异步支持：专为高性能场景设计，提供完整的异步支持，实现了可以多任务并行的服务接口。
✅ 交互式Web界面：提供开箱即用的 Web UI 和 RESTful API，方便集成与使用。

在翻译pdf、html等文件时会先转换为markdown，这会丢失原先的排版，对排版有要求的用户请注意

QQ交流群：1047781902

UI界面：翻译效果

论文翻译：翻译效果

小说翻译：翻译效果

整合包

对于希望快速上手的用户，我们在 GitHub Releases 上提供整合包。您只需下载、解压，并填入您的 AI 平台 API-Key 即可开始使用。

DocuTranslate: 标准版，使用在线的 minerU 引擎解析文档，推荐大多数用户使用。
DocuTranslate_full: 完整版，内置 docling 本地解析引擎，支持离线或对数据隐私有更高要求的场景。

安装

使用 pip

# 基础安装
pip install docutranslate

# 如需使用 docling 本地解析引擎
pip install docutranslate[docling]

使用 uv

# 初始化环境
uv init

# 基础安装
uv add docutranslate

# 安装 docling 扩展
uv add docutranslate[docling]

使用 git

# 初始化环境
git clone https://github.com/xunbu/docutranslate.git

cd docutranslate

uv sync

核心概念：工作流 (Workflow)

新版 DocuTranslate 的核心是 工作流 (Workflow)。每个工作流都是一个专门为特定类型文件设计的、完整的端到端翻译管道。您不再与一个庞大的类交互，而是根据您的文件类型选择并配置一个合适的工作流。

基本使用流程如下：

选择工作流：根据您的输入文件类型（例如，PDF/Word 或 TXT）选择一个工作流，如 MarkdownBasedWorkflow 或 TXTWorkflow。
构建配置：为所选工作流创建相应的配置对象（如 MarkdownBasedWorkflowConfig）。此配置对象包含了所有需要的子配置，例如：
- 转换器配置 (Converter Config): 定义如何将原始文件（如PDF）转换为 Markdown。
- 翻译器配置 (Translator Config): 定义使用哪个 LLM、API-Key、目标语言等。
- 导出器配置 (Exporter Config): 定义输出格式（如HTML）的特定选项。
实例化工作流：使用配置对象创建工作流实例。
执行翻译：调用工作流的 .read_*() 和 .translate() / .translate_async() 方法。
导出/保存结果：调用 .export_to_*() 或 .save_as_*() 方法获取或保存翻译结果。

可用工作流

工作流	适用场景	输入格式	输出格式	核心配置类
`MarkdownBasedWorkflow`	处理富文本文档，如PDF、Word、图片等。流程为：`文件 -> Markdown -> 翻译 -> 导出`。	`.pdf`, `.docx`, `.md`, `.png`, `.jpg` 等	`.md`, `.zip`, `.html`	`MarkdownBasedWorkflowConfig`
`TXTWorkflow`	处理纯文本文档。流程为：`txt -> 翻译 -> 导出`。	`.txt` 及其他纯文本格式	`.txt`, `.html`	`TXTWorkflowConfig`
`JsonWorkflow`	处理json文件。流程为：`json -> 翻译 -> 导出`。	`.json`	`.json`, `.html`	`JsonWorkflowConfig`
`DocxWorkflow`	处理docx文件。流程为：`docx -> 翻译 -> 导出`。	`.docx`	`.docx`, `.html`	`docxWorkflowConfig`
`XlsxWorkflow`	处理xlsx文件。流程为：`xlsx -> 翻译 -> 导出`。	`.xlsx`	`.xlsx`, `.html`	`XlsxWorkflowConfig`
`SrtWorkflow`	处理srt文件。流程为：`srt -> 翻译 -> 导出`。	`.srt`	`.srt`, `.html`	`SrtWorkflowConfig`
`EpubWorkflow`	处理epub文件。流程为：`epub -> 翻译 -> 导出`。	`.epub`	`.epub`, `.html`	`EpubWorkflowConfig`

在交互式界面中可以导出pdf格式

启动 Web UI 和 API 服务

为了方便使用，DocuTranslate 提供了一个功能齐全的 Web 界面和 RESTful API。

启动服务:

# 启动服务，默认监听 8010 端口
docutranslate -i

# 指定端口启动
docutranslate -i -p 8011

# 也可以通过环境变量指定端口
export DOCUTRANSLATE_PORT=8011
docutranslate -i

交互式界面: 启动服务后，请在浏览器中访问 http://127.0.0.1:8010 (或您指定的端口)。
API 文档: 完整的 API 文档（Swagger UI）位于 http://127.0.0.1:8010/docs。

使用方式

示例 1: 翻译一个 PDF 文件 (使用 `MarkdownBasedWorkflow`)

这是最常见的用例。我们将使用 minerU 引擎将 PDF 转换为 Markdown，然后使用 LLM 进行翻译。这里以异步方式为例。

import asyncio
from docutranslate.workflow.md_based_workflow import MarkdownBasedWorkflow, MarkdownBasedWorkflowConfig
from docutranslate.converter.x2md.converter_mineru import ConverterMineruConfig
from docutranslate.translator.ai_translator.md_translator import MDTranslatorConfig
from docutranslate.exporter.md.md2html_exporter import MD2HTMLExporterConfig


async def main():
    # 1. 构建翻译器配置
    translator_config = MDTranslatorConfig(
        base_url="https://open.bigmodel.cn/api/paas/v4",  # AI 平台 Base URL
        api_key="YOUR_ZHIPU_API_KEY",  # AI 平台 API Key
        model_id="glm-4-air",  # 模型 ID
        to_lang="English",  # 目标语言
        chunk_size=3000,  # 文本分块大小
        concurrent=10  # 并发数
    )

    # 2. 构建转换器配置 (使用 minerU)
    converter_config = ConverterMineruConfig(
        mineru_token="YOUR_MINERU_TOKEN",  # 你的 minerU Token
        formula_ocr=True  # 开启公式识别
    )

    # 3. 构建主工作流配置
    workflow_config = MarkdownBasedWorkflowConfig(
        convert_engine="mineru",  # 指定解析引擎
        converter_config=converter_config,  # 传入转换器配置
        translator_config=translator_config,  # 传入翻译器配置
        html_exporter_config=MD2HTMLExporterConfig(cdn=True)  # HTML 导出配置
    )

    # 4. 实例化工作流
    workflow = MarkdownBasedWorkflow(config=workflow_config)

    # 5. 读取文件并执行翻译
    print("开始读取和翻译文件...")
    workflow.read_path("path/to/your/document.pdf")
    await workflow.translate_async()
    # 或者使用同步的方式
    # workflow.translate()
    print("翻译完成！")

    # 6. 保存结果
    workflow.save_as_html(name="translated_document.html")
    workflow.save_as_markdown_zip(name="translated_document.zip")
    workflow.save_as_markdown(name="translated_document.md")  # 嵌入图片的markdown
    print("文件已保存到 ./output 文件夹。")

    # 或者直接获取内容字符串
    html_content = workflow.export_to_html()
    html_content = workflow.export_to_markdown()
    # print(html_content)


if __name__ == "__main__":
    asyncio.run(main())

示例 2: 翻译一个 TXT 文件 (使用 `TXTWorkflow`)

对于纯文本文件，流程更简单，因为它不需要文档解析（转换）步骤。这里以异步方式为例。

import asyncio
from docutranslate.workflow.txt_workflow import TXTWorkflow, TXTWorkflowConfig
from docutranslate.translator.ai_translator.txt_translator import TXTTranslatorConfig
from docutranslate.exporter.txt.txt2html_exporter import TXT2HTMLExporterConfig


async def main():
    # 1. 构建翻译器配置
    translator_config = TXTTranslatorConfig(
        base_url="https://api.openai.com/v1/",
        api_key="YOUR_OPENAI_API_KEY",
        model_id="gpt-4o",
        to_lang="中文",
    )

    # 2. 构建主工作流配置
    workflow_config = TXTWorkflowConfig(
        translator_config=translator_config,
        html_exporter_config=TXT2HTMLExporterConfig(cdn=True)
    )

    # 3. 实例化工作流
    workflow = TXTWorkflow(config=workflow_config)

    # 4. 读取文件并执行翻译
    workflow.read_path("path/to/your/notes.txt")
    await workflow.translate_async()
    # 或者使用同步的方法
    # workflow.translate()

    # 5. 保存结果
    workflow.save_as_txt(name="translated_notes.txt")
    print("TXT 文件已保存。")

    # 也可以导出翻译后的纯文本
    text = workflow.export_to_txt()


if __name__ == "__main__":
    asyncio.run(main())

示例 3: 翻译一个 json 文件 (使用 `JsonWorkflow`)

这里以异步方式为例。其中JsonTranslatorConfig的json_paths项需要指明要翻译的json路径(满足jsonpath-ng语法规范) ，仅与json路径匹配的值会被翻译。

import asyncio

from docutranslate.exporter.js.json2html_exporter import Json2HTMLExporterConfig
from docutranslate.translator.ai_translator.json_translator import JsonTranslatorConfig
from docutranslate.workflow.json_workflow import JsonWorkflowConfig, JsonWorkflow


async def main():
    # 1. 构建翻译器配置
    translator_config = JsonTranslatorConfig(
        base_url="https://api.openai.com/v1/",
        api_key="YOUR_OPENAI_API_KEY",
        model_id="gpt-4o",
        to_lang="中文",
        json_paths=["$.*", "$.name"]  # 满足jsonpath-ng路径语法,匹配路径的值都会被翻译
    )

    # 2. 构建主工作流配置
    workflow_config = JsonWorkflowConfig(
        translator_config=translator_config,
        html_exporter_config=Json2HTMLExporterConfig(cdn=True)
    )

    # 3. 实例化工作流
    workflow = JsonWorkflow(config=workflow_config)

    # 4. 读取文件并执行翻译
    workflow.read_path("path/to/your/notes.json")
    await workflow.translate_async()
    # 或者使用同步的方法
    # workflow.translate()

    # 5. 保存结果
    workflow.save_as_json(name="translated_notes.json")
    print("json文件已保存。")

    # 也可以导出翻译后的json文本
    text = workflow.export_to_json()


if __name__ == "__main__":
    asyncio.run(main())

示例 4: 翻译一个 docx 文件 (使用 `DocxWorkflow`)

这里以异步方式为例。

import asyncio

from docutranslate.exporter.docx.docx2html_exporter import Docx2HTMLExporterConfig
from docutranslate.translator.ai_translator.docx_translator import DocxTranslatorConfig
from docutranslate.workflow.docx_workflow import DocxWorkflowConfig, DocxWorkflow


async def main():
    # 1. 构建翻译器配置
    translator_config = DocxTranslatorConfig(
        base_url="https://api.openai.com/v1/",
        api_key="YOUR_OPENAI_API_KEY",
        model_id="gpt-4o",
        to_lang="中文",
        insert_mode="replace",  # 备选项 "replace", "append", "prepend"
        separator="\n",  # "append", "prepend"模式时使用的分隔符
    )

    # 2. 构建主工作流配置
    workflow_config = DocxWorkflowConfig(
        translator_config=translator_config,
        html_exporter_config=Docx2HTMLExporterConfig(cdn=True)
    )

    # 3. 实例化工作流
    workflow = DocxWorkflow(config=workflow_config)

    # 4. 读取文件并执行翻译
    workflow.read_path("path/to/your/notes.docx")
    await workflow.translate_async()
    # 或者使用同步的方法
    # workflow.translate()

    # 5. 保存结果
    workflow.save_as_docx(name="translated_notes.docx")
    print("docx文件已保存。")

    # 也可以导出翻译后的docx的二进制
    text_bytes = workflow.export_to_docx()


if __name__ == "__main__":
    asyncio.run(main())

示例 5: 翻译一个 xlsx 文件 (使用 `XlsxWorkflow`)

这里以异步方式为例。

import asyncio

from docutranslate.exporter.xlsx.xlsx2html_exporter import Xlsx2HTMLExporterConfig
from docutranslate.translator.ai_translator.xlsx_translator import XlsxTranslatorConfig
from docutranslate.workflow.xlsx_workflow import XlsxWorkflowConfig, XlsxWorkflow


async def main():
    # 1. 构建翻译器配置
    translator_config = XlsxTranslatorConfig(
        base_url="https://api.openai.com/v1/",
        api_key="YOUR_OPENAI_API_KEY",
        model_id="gpt-4o",
        to_lang="中文",
        insert_mode="replace",  # 备选项 "replace", "append", "prepend"
        separator="\n",  # "append", "prepend"模式时使用的分隔符
    )

    # 2. 构建主工作流配置
    workflow_config = XlsxWorkflowConfig(
        translator_config=translator_config,
        html_exporter_config=Xlsx2HTMLExporterConfig(cdn=True)
    )

    # 3. 实例化工作流
    workflow = XlsxWorkflow(config=workflow_config)

    # 4. 读取文件并执行翻译
    workflow.read_path("path/to/your/notes.xlsx")
    await workflow.translate_async()
    # 或者使用同步的方法
    # workflow.translate()

    # 5. 保存结果
    workflow.save_as_xlsx(name="translated_notes.xlsx")
    print("xlsx文件已保存。")

    # 也可以导出翻译后的xlsx的二进制
    text_bytes = workflow.export_to_xlsx()


if __name__ == "__main__":
    asyncio.run(main())

前置条件与配置详解

1. 获取大模型 API Key

翻译功能依赖于大型语言模型，您需要从相应的 AI 平台获取 base_url, api_key 和 model_id。

推荐模型：火山引擎的doubao-seed-1-6-flash-250715、智谱的glm-4-flash，阿里云的 qwen-plus,``qwen-turbo，deepseek的 deepseek-chat`等。

平台名称	获取APIkey	baseurl
ollama		http://127.0.0.1:11434/v1
lm studio		http://127.0.0.1:1234/v1
openrouter	点击获取	https://openrouter.ai/api/v1
openai	点击获取	https://api.openai.com/v1/
gemini	点击获取	https://generativelanguage.googleapis.com/v1beta/openai/
deepseek	点击获取	https://api.deepseek.com/v1
智谱ai	点击获取	https://open.bigmodel.cn/api/paas/v4
腾讯混元	点击获取	https://api.hunyuan.cloud.tencent.com/v1
阿里云百炼	点击获取	https://dashscope.aliyuncs.com/compatible-mode/v1
火山引擎	点击获取	https://ark.cn-beijing.volces.com/api/v3
硅基流动	点击获取	https://api.siliconflow.cn/v1
DMXAPI	点击获取	https://www.dmxapi.cn/v1

2. 获取 minerU Token (在线解析)

如果您选择 mineru作为文档解析引擎（convert_engine="mineru"），则需要申请一个免费的 Token。

访问 minerU 官网注册并申请 API。
在 API Token 管理界面创建一个新的 API Token。

注意: minerU Token 有 14 天有效期，过期后请重新创建。

3. docling 引擎配置 (本地解析)

如果您选择 docling 作为文档解析引擎（convert_engine="docling"），它会在首次使用时从 Hugging Face 下载所需的模型。

网络问题解决方案:

设置 Hugging Face 镜像 (推荐):

方法 A (环境变量): 设置系统环境变量 HF_ENDPOINT 并重启您的IDE或终端。
```
HF_ENDPOINT=https://hf-mirror.com
```
方法 B (代码中设置): 在您的 Python 脚本开头添加以下代码。

import os

os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

离线使用 (提前下载模型包):

从 GitHub Releases 下载 docling_artifact.zip。
将其解压到您的项目目录中。
在配置中指定模型路径：

from docutranslate.converter.x2md.converter_docling import ConverterDoclingConfig

converter_config = ConverterDoclingConfig(
    artifact="./docling_artifact",  # 指向解压后的文件夹
    code_ocr=True,
    formula_ocr=True
)

FAQ

Q: 8010 端口被占用了怎么办？ A: 使用 -p 参数指定一个新端口，或设置 DOCUTRANSLATE_PORT 环境变量。

Q: 支持扫描件的翻译吗？ A: 支持。请使用 mineru 解析引擎，它具备强大的 OCR 能力。

Q: 第一次使用为什么很慢？ A: 如果您使用 docling 引擎，它首次运行时需要从 Hugging Face 下载模型。请参考上文的“网络问题解决方案”来加速此过程。

Q: 如何在内网（离线）环境使用？ A: 完全可以。您需要满足两个条件：

本地解析引擎: 使用 docling 引擎，并按照上文“离线使用”的指引提前下载模型包。
本地 LLM: 使用 Ollama 或 LM Studio 等工具在本地部署语言模型，并在 TranslatorConfig 中填入本地模型的 base_url。

Q: 缓存机制是如何工作的？ A: MarkdownBasedWorkflow 会自动缓存文档解析（文件到Markdown的转换）的结果，以避免重复解析消耗时间和资源。缓存默认保存在内存中，并会记录最近的10次解析。您可以通过 DOCUTRANSLATE_CACHE_NUM 环境变量来修改缓存数量。

Star History

Project details

Release history Release notifications | RSS feed

1.7.5

Apr 24, 2026

1.7.4

Apr 24, 2026

1.7.3

Apr 19, 2026

1.7.2

Apr 8, 2026

1.7.1.post1

Mar 8, 2026

1.7.1

Mar 7, 2026

1.7.0

Mar 2, 2026

1.7.0a2 pre-release

Feb 25, 2026

1.7.0a1 pre-release

Feb 25, 2026

1.6.3.post1

Jan 19, 2026

1.6.3 yanked

Jan 18, 2026

1.6.2

Jan 11, 2026

1.6.1 yanked

Jan 10, 2026

1.6.0

Dec 31, 2025

1.5.6

Dec 17, 2025

1.5.5

Dec 14, 2025

1.5.4

Dec 12, 2025

1.5.3

Dec 4, 2025

1.5.3a1 pre-release

Dec 2, 2025

1.5.2.post1 yanked

Nov 25, 2025

1.5.2 yanked

Nov 25, 2025

1.5.1

Nov 10, 2025

1.4.18

Nov 3, 2025

1.4.17

Oct 26, 2025

1.4.16.post1

Oct 20, 2025

1.4.16

Oct 20, 2025

1.4.15

Oct 19, 2025

1.4.14

Oct 19, 2025

1.4.13

Oct 18, 2025

1.4.12

Oct 15, 2025

1.4.11

Oct 14, 2025

1.4.10

Oct 13, 2025

1.4.9

Oct 10, 2025

1.4.8

Oct 4, 2025

1.4.7

Sep 29, 2025

1.4.6

Sep 24, 2025

1.4.5

Sep 24, 2025

1.4.5b2 pre-release

Sep 24, 2025

1.4.4

Sep 17, 2025

1.4.3

Sep 9, 2025

1.4.2.post2

Sep 7, 2025

1.4.2.post1

Sep 7, 2025

1.4.2

Sep 6, 2025

1.4.1.post1

Sep 5, 2025

1.4.1

Sep 5, 2025

1.4.0

Sep 4, 2025

1.3.3

Sep 3, 2025

1.3.2

Sep 2, 2025

1.3.2a1 pre-release

Aug 30, 2025

1.3.1

Aug 30, 2025

1.3.0b1 pre-release

Aug 29, 2025

1.2.5

Aug 24, 2025

1.2.4

Aug 23, 2025

1.2.3

Aug 22, 2025

1.2.2

Aug 20, 2025

1.2.1

Aug 20, 2025

1.2.0 yanked

Aug 20, 2025

1.1.6

Aug 18, 2025

1.1.5

Aug 18, 2025

This version

1.1.3

Aug 14, 2025

1.1.1

Aug 9, 2025

1.0.0

Aug 5, 2025

0.3.3

Jul 16, 2025

0.3.2

Jul 16, 2025

0.2.41

Jul 7, 2025

0.2.40

Jul 7, 2025

0.2.39

Jul 3, 2025

0.2.38

Jun 19, 2025

0.2.37

Jun 10, 2025

0.2.36

Jun 10, 2025

0.2.35

Jun 4, 2025

0.2.34

Jun 2, 2025

0.2.31

May 29, 2025

0.2.28

May 26, 2025

0.2.27

May 26, 2025

0.2.25 yanked

May 26, 2025

Reason this release was yanked:

mathjax渲染错误

0.2.23

May 22, 2025

0.2.21

May 20, 2025

0.2.20

May 20, 2025

0.2.19

May 19, 2025

0.2.18

May 19, 2025

0.2.17

May 19, 2025

0.2.16

May 18, 2025

0.2.15

May 18, 2025

0.2.14

May 17, 2025

0.2.13

May 17, 2025

0.2.12

May 17, 2025

0.2.11

May 17, 2025

0.2.10

May 17, 2025

0.2.9

May 16, 2025

0.2.8

May 16, 2025

0.2.7

May 16, 2025

0.2.6

May 14, 2025

0.2.4

May 13, 2025

0.2.3

May 13, 2025

0.2.2.post1

May 12, 2025

0.2.2

May 12, 2025

0.2.1.post1

May 12, 2025

0.2.1

May 12, 2025

0.2.0

May 12, 2025

0.1.8

May 11, 2025

0.1.7

May 11, 2025

0.1.6

May 10, 2025

0.1.5

May 10, 2025

0.1.4

May 10, 2025

0.1.3.post1

May 10, 2025

0.1.3

May 10, 2025

0.1.2

May 10, 2025

0.1.1

May 9, 2025

0.1.0

May 9, 2025

0.0.8

May 8, 2025

0.0.7

May 8, 2025

0.0.6

May 8, 2025

0.0.5

May 8, 2025

0.0.4

May 8, 2025

0.0.3

May 8, 2025

0.0.2

May 8, 2025

0.0.1

May 8, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

docutranslate-1.1.3.tar.gz (2.8 MB view details)

Uploaded Aug 14, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

docutranslate-1.1.3-py3-none-any.whl (3.6 MB view details)

Uploaded Aug 14, 2025 Python 3

File details

Details for the file docutranslate-1.1.3.tar.gz.

File metadata

Download URL: docutranslate-1.1.3.tar.gz
Upload date: Aug 14, 2025
Size: 2.8 MB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.6.14

File hashes

Hashes for docutranslate-1.1.3.tar.gz
Algorithm	Hash digest
SHA256	`6c9a093b55d07470b9fb649e539db8784420c369f55975b8e9c1cf12db2500a9`
MD5	`0fe48ee8d52016e482b4e782efe2b56a`
BLAKE2b-256	`c06613af3986af1c11d6b5381444e5315b4c23cffa16cfc2bc5a5b2bbc10f9be`

See more details on using hashes here.

File details

Details for the file docutranslate-1.1.3-py3-none-any.whl.

File metadata

Download URL: docutranslate-1.1.3-py3-none-any.whl
Upload date: Aug 14, 2025
Size: 3.6 MB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.6.14

File hashes

Hashes for docutranslate-1.1.3-py3-none-any.whl
Algorithm	Hash digest
SHA256	`1ab96da156368954cce4bbf088d031ab70ea5f981f99922e684b4159bf410a33`
MD5	`98f42f9a73d8fcdef740dec9ccfc3046`
BLAKE2b-256	`22aa682fba1b2f9c7da7af2241740b95ba1e8cf0cbf65840b5717fbe27922bc4`

See more details on using hashes here.

docutranslate 1.1.3

Navigation

Verified details

Maintainers

Unverified details

Meta

Project description

DocuTranslate

整合包

安装

使用 pip

使用 uv

使用 git

核心概念：工作流 (Workflow)

可用工作流

启动 Web UI 和 API 服务

使用方式

示例 1: 翻译一个 PDF 文件 (使用 MarkdownBasedWorkflow)

示例 2: 翻译一个 TXT 文件 (使用 TXTWorkflow)

示例 3: 翻译一个 json 文件 (使用 JsonWorkflow)

示例 4: 翻译一个 docx 文件 (使用 DocxWorkflow)

示例 5: 翻译一个 xlsx 文件 (使用 XlsxWorkflow)

前置条件与配置详解

1. 获取大模型 API Key

2. 获取 minerU Token (在线解析)

3. docling 引擎配置 (本地解析)

FAQ

Star History

Project details

Verified details

Maintainers

Unverified details

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes

示例 1: 翻译一个 PDF 文件 (使用 `MarkdownBasedWorkflow`)

示例 2: 翻译一个 TXT 文件 (使用 `TXTWorkflow`)

示例 3: 翻译一个 json 文件 (使用 `JsonWorkflow`)

示例 4: 翻译一个 docx 文件 (使用 `DocxWorkflow`)

示例 5: 翻译一个 xlsx 文件 (使用 `XlsxWorkflow`)