Skip to main content

Detects and recognizes text in historical, archival and handwritten documents. Optimized for fast inference with ONNX Runtime (CPU/GPU/CoreML) and optional training with PyTorch. Supports plugging custom models via a simple API.

Project description

Frame 8

Manuscript OCR

Библиотека для детекции и распознавания текста на исторических, архивных, рукописных и печатных документах.


Быстрый пример

from manuscript import Pipeline
from manuscript.utils import visualize_page

# Инициализация пайплайна
pipeline = Pipeline()

image_path = "example/image.jpg"

# Запуск пайплайна
result = pipeline.predict(image_path)

# Весь объект результата
print(result)

# Текст
text = pipeline.get_text(result["page"])
print(text)

# Визуализация
visualize_page(image_path, result["page"], show_lines=False, show_numbers=True)
Результат визуализации

Распознанный текст:

мѣстахъ губернiи могли бы подъ
руководствомъ врача, подавать
помощь заболѣвающему скоту
принимать мѣры предупрежден
развитiя эпизотiи и наблюда
за исполненiемъ означенныхъ мѣ
Сильный падежъ скота необхо
мо имѣлъ влiянiе на взысканiе
податей и повинностей съ недо
ками, которое и было менѣе усп.
но нежели въ 1870 году.
За вычетомъ...

Документация

Полная документация (English & Русский)

Подробные примеры и руководства:

  • Pipeline API - интеграция и создание кастомных компонентов

Установка

Режим 1: Пользовательская установка (только inference)

Минимальная установка для использования готовых моделей через ONNX Runtime (CPU):

pip install manuscript-ocr

Для ускорения на GPU (NVIDIA CUDA):

# Удалите CPU версию ONNX Runtime
pip uninstall onnxruntime

# Установите GPU версию
pip install onnxruntime-gpu

Для Apple Silicon (M1/M2/M3) с CoreML:

# Удалите стандартную версию
pip uninstall onnxruntime

# Установите версию для Apple Silicon (оптимизация через CoreML)
pip install onnxruntime-silicon

Режим 2: Dev установка (с обучением моделей)

Полная установка с PyTorch для обучения собственных моделей:

pip install manuscript-ocr[dev]

Для обучения на GPU (NVIDIA CUDA):

# Сначала установите manuscript-ocr[dev]
pip install manuscript-ocr[dev]

# Затем обновите PyTorch на GPU версию
pip install --upgrade torch torchvision --index-url https://download.pytorch.org/whl/cu118

Примечание: GPU версии (ONNX Runtime GPU и PyTorch CUDA) пользователь устанавливает вручную по необходимости.


Быстрый старт

from manuscript import Pipeline

# Инициализация с моделями по умолчанию (CPU)
pipeline = Pipeline()

# Обработка изображения
result = pipeline.predict("document.jpg")

# Извлечение текста
text = pipeline.get_text(result)
print(text)

Использование GPU/CoreML

# NVIDIA CUDA
detector = EAST(device="cuda")
recognizer = TRBA(device="cuda")
pipeline = Pipeline(detector=detector, recognizer=recognizer)

# Apple Silicon (M1/M2/M3)
detector = EAST(device="coreml")
recognizer = TRBA(device="coreml")
pipeline = Pipeline(detector=detector, recognizer=recognizer)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

manuscript_ocr-0.1.10.tar.gz (910.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

manuscript_ocr-0.1.10-py3-none-any.whl (959.8 kB view details)

Uploaded Python 3

File details

Details for the file manuscript_ocr-0.1.10.tar.gz.

File metadata

  • Download URL: manuscript_ocr-0.1.10.tar.gz
  • Upload date:
  • Size: 910.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.11.0

File hashes

Hashes for manuscript_ocr-0.1.10.tar.gz
Algorithm Hash digest
SHA256 88db654e430d3404cf1c8e9a2daba0620cc933a0e8237cdb36fcfd09eca976b7
MD5 be92751af5bcb59d573c9f24802c8170
BLAKE2b-256 002798991e60eec2c96c290eb3629308dc4323935c8898fc86418231d3d964c8

See more details on using hashes here.

File details

Details for the file manuscript_ocr-0.1.10-py3-none-any.whl.

File metadata

File hashes

Hashes for manuscript_ocr-0.1.10-py3-none-any.whl
Algorithm Hash digest
SHA256 a658f832d70cc6fa4ffd3767fa0f492ac969926f09cb5f5095d4565e502c7706
MD5 888e70ed75412e82b4c9ed3576bed5f4
BLAKE2b-256 8fdea2478a01438207e74d9e38b4d1df6d515305ca9c654f0c4604b291e8f6c3

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page