Skip to main content

Модуль для предобработки текстов журнала «Цифровые гуманитарные исследования»

Project description

LaTeX Python DOI

Модуль предобработки текстовых материалов для журнала «Цифровые гуманитарные исследования»

Подготовка текстов

В журнале статьи публикуются с использованием LaTeX. В tex из docx тексты можно перевести с помощью pandoc:

pandoc -s paper.docx -o paper.tex

Однако, текстам на русском языке требуется дополнительная обработка, связанная с правильными тире и пробелами по правилам отечественной типографии. Модуль производит все нужные преобразования автоматически.

Примеры преобразований:

  • с новым 1970-х гг. в XXI в.:с~новым 1970"=х гг.~в~XXI в.:
  • социально-экономическиесоциально"=экономические
  • коллеги - наколлеги — на
  • В.И. ЛенинаВ.\,И. Ленина
  • 1978-1984~гг.1978--1984~гг.

Кроме того, все \emph заменяются на \textit, потому что в системе стилей журнала \emph означает не курсив, а подчеркивание.

Установка

pip3 install cgi_processor

Использование

from cgi_processor import process_file, process_directory

# Обработка одного файла
process_file('example.tex')

# Обработка всех .tex файлов в папке
process_directory('./texts')

В результате исполнения этого кода в исходной папке появляется файл с тем же именем, но суффиксом _processed, например:

volodin.tex -> volodin_processed.tex

Другие ресурсы

Веб-сервис с альтернативным функционалом (не полностью совпадающим с текущим) можно найти здесь. Репозиторий проекта.

Цитирование

@software{orekhov_2025_16956677,
  author       = {Orekhov, Boris},
  title        = {Модуль предобработки текстовых материалов для
                   журнала «Цифровые гуманитарные исследования»
                  },
  month        = aug,
  year         = 2025,
  publisher    = {Zenodo},
  version      = {v0.1.2},
  doi          = {10.5281/zenodo.16956676},
  url          = {https://doi.org/10.5281/zenodo.16956676},
}

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

cgi_processor-0.1.3.tar.gz (16.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

cgi_processor-0.1.3-py3-none-any.whl (16.5 kB view details)

Uploaded Python 3

File details

Details for the file cgi_processor-0.1.3.tar.gz.

File metadata

  • Download URL: cgi_processor-0.1.3.tar.gz
  • Upload date:
  • Size: 16.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.8.0 colorama/0.4.4 importlib-metadata/4.6.4 keyring/23.5.0 pkginfo/1.8.2 readme-renderer/34.0 requests-toolbelt/0.9.1 requests/2.32.3 rfc3986/1.5.0 tqdm/4.66.4 urllib3/1.26.5 CPython/3.10.12

File hashes

Hashes for cgi_processor-0.1.3.tar.gz
Algorithm Hash digest
SHA256 378985a808a0f0e6ed27d1a162f1c422caa23b81ccfa5d51c9f4b929020947be
MD5 626243ae7703970e5da998e8451e8d6a
BLAKE2b-256 10022b42a09010257497a4bd095e2529333264ab85a7e1c80b26c31fd3c93a65

See more details on using hashes here.

File details

Details for the file cgi_processor-0.1.3-py3-none-any.whl.

File metadata

  • Download URL: cgi_processor-0.1.3-py3-none-any.whl
  • Upload date:
  • Size: 16.5 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.8.0 colorama/0.4.4 importlib-metadata/4.6.4 keyring/23.5.0 pkginfo/1.8.2 readme-renderer/34.0 requests-toolbelt/0.9.1 requests/2.32.3 rfc3986/1.5.0 tqdm/4.66.4 urllib3/1.26.5 CPython/3.10.12

File hashes

Hashes for cgi_processor-0.1.3-py3-none-any.whl
Algorithm Hash digest
SHA256 a58a2388a0b6a04ece7e1944cddc2d5391b37325684fa53e7abfe24b85e379f5
MD5 d3d4fc334872fa7ca9dd75881548a6e9
BLAKE2b-256 ee33a4bab47ad44fb09c611e3d3ccdf7d51affd0ea10d88483ab984ad1b3d181

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page