Skip to main content

Pre-reform to contemporary orthography convertor for the Russian language

Project description

Prereform2modern

Преобразует текст из дореформенной орфографии в современную. Работает в Py3.


  Установка

pip install prereform2modern

  Запуск из командной строки:

 Длинный способ

python -m prereform2modern.translit_from_string "Онъ стоялъ подлѣ письменнаго стола"
Он стоял подле письменного стола

 Короткий способ

translit "Онъ стоялъ подлѣ письменнаго стола"

 Флаг -t отображает изменённые слова в старой орфографии.

translit -t "Онъ стоялъ подлѣ письменнаго стола"
Он{Онъ} стоял{стоялъ} подле{подлѣ} письменного{письменнаго} стола

  Запуск из интерпретатора:

from prereform2modern import Processor
orig_text = "Онъ стоялъ подлѣ письменнаго стола"
text_res, changes, s_json = Processor.process_text(
    text=orig_text,
    show=False,
    delimiters=False,
    check_brackets=False
    )

  Выдача

  • text_res: str

 Преобразованный текст.

print(text_res)
Он стоял подле письменного стола
  • changes: str

 Произведенные изменения.

print(changes)
Онъ --> Он
стоялъ --> стоял
подлѣ --> подле
письменнаго --> письменного
  • str_json: str

 Сведения о всех словах и символах в формате json.

import json
json.loads(s_json)
{'0': {'old_word': 'Онъ', 'type': 'word', 'word': 'Он'},
'1': {'old_word': '', 'type': 'punct', 'word': ' '},
'2': {'old_word': 'стоялъ', 'type': 'word', 'word': 'стоял'},
'3': {'old_word': '', 'type': 'punct', 'word': ' '},
'4': {'old_word': 'подлѣ', 'type': 'word', 'word': 'подле'},
'5': {'old_word': '', 'type': 'punct', 'word': ' '},
'6': {'old_word': 'письменнаго', 'type': 'word', 'word': 'письменного'},
'7': {'old_word': '', 'type': 'punct', 'word': ' '},
'8': {'old_word': '', 'type': 'word', 'word': 'стола'}}

  Параметры

method Processor.process_text(
    text, show, delimiters, check_brackets
    )
  • text: str

 Оригинальный текст в дореформенной орфографии.

  • show: boolean

 Включает в результат заменённые слова в дореформенной орфографии. Если параметр check_brackets=True, то заменённые слова показываются при любом значении параметра show.

  • delimiters: list из трех элементов типа str

 Используется для обозначения заменённых слов. Первый элемент помещается перед новым словом, а другие два элемента выделяют заменённое слово. Так, можно использовать скобки:

delimiters=['', '{', '}']
text="примеръ"
пример{примеръ}

 Или, например, теги XML (про использование тега <choice> см. здесь):

delimiters=['<choice><reg>', '</reg><orig>', '</orig></choice>']
<choice><reg>пример</reg><orig>примеръ</orig></choice>
  • check_brackets: boolean

 Помечает редакторскую правку.

text='Пройдя комнату, такъ [называемую], офиціанскую'
delimiters=['', '{', '}']
check_brackets=True
Пройдя комнату, так{такъ} <choice original_editorial_correction='[называемую]'><sic></sic>
<corr>называемую</corr></choice>, официанскую{офицiанскую}

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

prereform2modern-1.0.0.tar.gz (1.0 MB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

prereform2modern-1.0.0-py3-none-any.whl (1.0 MB view details)

Uploaded Python 3

File details

Details for the file prereform2modern-1.0.0.tar.gz.

File metadata

  • Download URL: prereform2modern-1.0.0.tar.gz
  • Upload date:
  • Size: 1.0 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.2.0 pkginfo/1.5.0.1 requests/2.24.0 setuptools/49.2.1 requests-toolbelt/0.9.1 tqdm/4.48.2 CPython/3.6.4

File hashes

Hashes for prereform2modern-1.0.0.tar.gz
Algorithm Hash digest
SHA256 bfd85936a36630fd936edbd08c1658107457b8465fe10d7eb805c9f3993b4549
MD5 57d486f2f7ab2c67675f8807a2482d93
BLAKE2b-256 88cf01482909618389036c22654d4f34aa5fd8ca48e017a5a89565174fd7d26f

See more details on using hashes here.

File details

Details for the file prereform2modern-1.0.0-py3-none-any.whl.

File metadata

  • Download URL: prereform2modern-1.0.0-py3-none-any.whl
  • Upload date:
  • Size: 1.0 MB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.2.0 pkginfo/1.5.0.1 requests/2.24.0 setuptools/49.2.1 requests-toolbelt/0.9.1 tqdm/4.48.2 CPython/3.6.4

File hashes

Hashes for prereform2modern-1.0.0-py3-none-any.whl
Algorithm Hash digest
SHA256 5bbcec3af88bea1d72978f1b30e4d66b6a28106db29edd4b65c827811c9bbdf7
MD5 638044afcf6136393378177c952164fb
BLAKE2b-256 a33f5a21aa40a86f150094f3415860d72c0c9ab468ddfa80204c1fdb7676019a

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page