Skip to main content

document translate, read & translate & write

Project description

docts

document translate, read & translate & write

借助 pygtrans 链接谷歌机器翻译

PyPI - Python Version PyPI GitHub last commit

概述

此项目我暂时只用来结合 Sisulizer 翻译 CHM帮助文档 , 但实际不仅于此, 支持配合 Sisulizer 翻译它所支持的所有格式, 理论上也是支持与其他本地化程序配合使用的.

实际案例: InstallShield2020-Documents

简单步骤总结如下:

  1. 使用 Sisulizer 提取 字符串 并导出为 xlfxls
  2. 使用此项目进行翻译并导出为xls文件
  3. Sisulizer 中导入 xls 文件, 并生成本地化文件
  4. 完成, 预览

效果可参考: InstallShield2020-Documents

环境准备

  1. 安装Sisulizer4

    此项目测试环境为 Sisulizer4 374 版

    大家可自行搜索, 推荐: 软件本地化工具 Sisulizer Enterprise Edition 4.0 Build 374 中文免费版

  2. 安装HTML Help Workshop

    可自行搜索下载, 项目 files 目录下也有提供 htmlhelp.exe

  3. 配置Sisulizer

    在菜单: 工具->平台->HTML, 如图设置

注意

  • 你当然只能在 Windows 系统里操作
  • 由于依赖 xlwings, 而它是依赖 Excel 的, 所以你必须安装 Excel, 后期会考虑移除此依赖

快速入门

Sisulizer 帮助文档为例

  1. 利用Sisulizer解析字符串并导出

    利用Sisulizer解析字符串并导出

  2. 利用 docts 进行翻译

    安装: pip install docts

    利用docts进行翻译

  3. Sisulizer 中导入翻译好的 xls 文件, 并生成本地化文件

    生成本地化文件

详细教程

暂时只有参考源码, 详细内容TODO

CHM相关

  • 微软推出的一种帮助文档格式, 实际上是一个 压缩包+自定义块数据

  • 通过解压缩工具或 hh.exe -decompile folder file.chm 命令可进行反编译, 此命令系统自带

  • 重编译需要 HTML Help Workshop (项目 files 目录下有提供), 官网已经找不到下载了, 网上能找到最新版本是1999年发布的, 😂, 但是可以用.

  • 注意: 反编译的是不支持直接重新编译的, 因为缺少 .hhp 工程文件, hhc.exe project.hhp 命令可编译 CHM 文件, 依赖 HTML Help Workshop

  • 网上找到两款免费可以重编译 CHM 文件的工具

    1. KeyTools: 亲测可用, 项目 files 目录下有提供
    2. Precision Helper: 未测试
  • 翻译 CHM文档 的一般套路如下:

    1. 反编译CHM
    2. 借助工具翻译HTML文件
    3. 重编译

    此项目借助 Sisulizer 直接支持CHM文档的特性进行操作, 个人觉得这个方法更Nice, 因为我想没有哪个本地化程序是无限制提供免费机器翻译的, 并且也不可能达到 10万条句子/10s 的速度.

  • Sisulizer 本身是支持 机器翻译 的, 可能由于盗版问题严重, 已全面停用了这一功能.

  • Sisulizer 只支持旧版 Excel 格式的 xls 文件, 而 xls 工作表最多只支持 65536条数据, 当导出句子大于这一数量时, 会丢失数据, 所以建议导出统一使用 XLIFF 选项导出为 xlf 文件, dcots 导出时会自动分量 xls 文件导出.

  • 软件本地化工具: 都好久没更新了, 三年吧

    1. Sisulizer: 使用简单, 功能强大, 我比较喜欢, 最新版是2018发布的 374

      (2018版, 似乎也是最新版)支持的文件类型

    2. SDL Passolo: 这个比较出名, 不过用得很少, 最新版也是2018出的

      (2018版, 似乎是最新版)支持的所有文件类型

    3. Radialix : 这个也用得很少, 没前面两个出名

  • 文件本地化工具:

    1. SDL Trados Studio: 和 SDL Passolo 同家, 目前最厉害的文件本地化工具吧

      (2021版)支持的所有文件类型

2021年07月08日22时14分53秒

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

docts-0.0.5.tar.gz (23.8 kB view hashes)

Uploaded Source

Built Distribution

docts-0.0.5-py3-none-any.whl (23.9 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page