Skip to main content

開放中文轉換 2 | 开放中文转换 2 | Open Chinese Convert 2

Project description

開放中文轉換 (OpenCC) 2

简体中文(中国大陆) - 繁體中文(臺灣) - English (United States)

$ pip install opencc2

基本概念

見《繁簡中文轉換概說》(原文爲大陸簡體)。

用法

在代碼中使用

從大陸簡體轉換爲臺灣繁體(臺灣正體):

>>> import opencc2
>>> cc = opencc2.Converter(from_variant='cn', to_variant='tw')
>>> cc.convert('头发,发展,内存')
'頭髮,發展,記憶體'

從臺灣繁體(臺灣正體)轉換爲大陸簡體:

>>> import opencc2
>>> cc = opencc2.Converter(from_variant='tw', to_variant='cn')
>>> cc.convert('乾坤,乾燥,計程車')
'乾坤,干燥,出租车'

opencc2.Converter 接受以下參數:

  • from_variant: 原文本的變體類型(詳見下方列表)。默認爲大陸簡體
  • to_variant: 目標文本的變體類型(詳見下方列表)。默認爲臺灣繁體(臺灣正體)
  • phrases: 是否啓用詞彙轉換(如將「内存」轉換爲「記憶體」)。默認爲「是」
  • fast: 是否啓用快速轉換(但準確率降低)。默認爲「否」

在命令行中使用

從大陸簡體轉換爲臺灣繁體(臺灣正體):

$ echo 头发,发展,内存 | opencc2 -f cn -t tw
頭髮,發展,記憶體

從臺灣繁體(臺灣正體)轉換爲大陸簡體:

$ echo 乾坤,乾燥,計程車 | opencc2 -f tw -t cn
乾坤,干燥,出租车

詳見 opencc2 -h

支持的變體類型

支持的變體類型如下:

  • OpenCC 2 繁體 (t)
  • 大陸簡體 (cn)
  • 大陸繁體 (cnt)
  • 新加坡簡體 (sg)
  • 馬來西亞簡體 (my)
  • 香港繁體 (hk)
  • 臺灣繁體(臺灣正體) (tw)

目前不支持大陸繁體、馬來西亞簡體;新加坡簡體、香港繁體不支持詞彙轉換。

開源協議

  • 代碼:MIT
  • 詞庫:Apache-2.0

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Files for opencc2, version 0.2.5
Filename, size File type Python version Upload date Hashes
Filename, size opencc2-0.2.5-py3-none-any.whl (936.8 kB) File type Wheel Python version py3 Upload date Hashes View hashes
Filename, size opencc2-0.2.5.tar.gz (5.2 kB) File type Source Python version None Upload date Hashes View hashes

Supported by

Elastic Elastic Search Pingdom Pingdom Monitoring Google Google BigQuery Sentry Sentry Error logging AWS AWS Cloud computing DataDog DataDog Monitoring Fastly Fastly CDN DigiCert DigiCert EV certificate StatusPage StatusPage Status page