Pre-reform to contemporary orthography convertor for the Russian language
Project description
Prereform2modern
Преобразует текст из дореформенной орфографии в современную. Работает в Py3.
Установка
pip install prereform2modern
Запуск из командной строки:
Длинный способ
python -m prereform2modern.translit_from_string "Онъ стоялъ подлѣ письменнаго стола"
Он стоял подле письменного стола
Короткий способ
translit "Онъ стоялъ подлѣ письменнаго стола"
Флаг -t отображает изменённые слова в старой орфографии.
translit -t "Онъ стоялъ подлѣ письменнаго стола"
Он{Онъ} стоял{стоялъ} подле{подлѣ} письменного{письменнаго} стола
Запуск из интерпретатора:
from prereform2modern import Processor
orig_text = "Онъ стоялъ подлѣ письменнаго стола"
text_res, changes, s_json = Processor.process_text(
text=orig_text,
show=False,
delimiters=False,
check_brackets=False
)
Выдача
- text_res: str
Преобразованный текст.
print(text_res)
Он стоял подле письменного стола
- changes: str
Произведенные изменения.
print(changes)
Онъ --> Он
стоялъ --> стоял
подлѣ --> подле
письменнаго --> письменного
- str_json: str
Сведения о всех словах и символах в формате json.
import json
json.loads(s_json)
{'0': {'old_word': 'Онъ', 'type': 'word', 'word': 'Он'},
'1': {'old_word': '', 'type': 'punct', 'word': ' '},
'2': {'old_word': 'стоялъ', 'type': 'word', 'word': 'стоял'},
'3': {'old_word': '', 'type': 'punct', 'word': ' '},
'4': {'old_word': 'подлѣ', 'type': 'word', 'word': 'подле'},
'5': {'old_word': '', 'type': 'punct', 'word': ' '},
'6': {'old_word': 'письменнаго', 'type': 'word', 'word': 'письменного'},
'7': {'old_word': '', 'type': 'punct', 'word': ' '},
'8': {'old_word': '', 'type': 'word', 'word': 'стола'}}
Параметры
method Processor.process_text(
text, show, delimiters, check_brackets
)
- text: str
Оригинальный текст в дореформенной орфографии.
- show: boolean
Включает в результат заменённые слова в дореформенной орфографии. Если параметр check_brackets=True, то заменённые слова показываются при любом значении параметра show.
- delimiters: list из трех элементов типа str
Используется для обозначения заменённых слов. Первый элемент помещается перед новым словом, а другие два элемента выделяют заменённое слово. Так, можно использовать скобки:
delimiters=['', '{', '}']
text="примеръ"
пример{примеръ}
Или, например, теги XML (про использование тега <choice> см. здесь):
delimiters=['<choice><reg>', '</reg><orig>', '</orig></choice>']
<choice><reg>пример</reg><orig>примеръ</orig></choice>
- check_brackets: boolean
Помечает редакторскую правку.
text='Пройдя комнату, такъ [называемую], офиціанскую'
delimiters=['', '{', '}']
check_brackets=True
Пройдя комнату, так{такъ} <choice original_editorial_correction='[называемую]'><sic></sic>
<corr>называемую</corr></choice>, официанскую{офицiанскую}
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file prereform2modern-1.0.0.tar.gz.
File metadata
- Download URL: prereform2modern-1.0.0.tar.gz
- Upload date:
- Size: 1.0 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.2.0 pkginfo/1.5.0.1 requests/2.24.0 setuptools/49.2.1 requests-toolbelt/0.9.1 tqdm/4.48.2 CPython/3.6.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
bfd85936a36630fd936edbd08c1658107457b8465fe10d7eb805c9f3993b4549
|
|
| MD5 |
57d486f2f7ab2c67675f8807a2482d93
|
|
| BLAKE2b-256 |
88cf01482909618389036c22654d4f34aa5fd8ca48e017a5a89565174fd7d26f
|
File details
Details for the file prereform2modern-1.0.0-py3-none-any.whl.
File metadata
- Download URL: prereform2modern-1.0.0-py3-none-any.whl
- Upload date:
- Size: 1.0 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.2.0 pkginfo/1.5.0.1 requests/2.24.0 setuptools/49.2.1 requests-toolbelt/0.9.1 tqdm/4.48.2 CPython/3.6.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
5bbcec3af88bea1d72978f1b30e4d66b6a28106db29edd4b65c827811c9bbdf7
|
|
| MD5 |
638044afcf6136393378177c952164fb
|
|
| BLAKE2b-256 |
a33f5a21aa40a86f150094f3415860d72c0c9ab468ddfa80204c1fdb7676019a
|