Detects and recognizes text in historical, archival and handwritten documents. Optimized for fast inference with ONNX Runtime (CPU/GPU/CoreML) and optional training with PyTorch. Supports plugging custom models via a simple API.
Project description
Manuscript OCR
Библиотека для детекции и распознавания текста на исторических, архивных, рукописных и печатных документах.
Быстрый пример
from manuscript import Pipeline
from manuscript.utils import visualize_page
# Инициализация пайплайна
pipeline = Pipeline()
image_path = "example/image.jpg"
# Запуск пайплайна
result = pipeline.predict(image_path)
# Весь объект результата
print(result)
# Текст
text = pipeline.get_text(result["page"])
print(text)
# Визуализация
visualize_page(image_path, result["page"], show_lines=False, show_numbers=True)
Распознанный текст:
мѣстахъ губернiи могли бы подъ
руководствомъ врача, подавать
помощь заболѣвающему скоту
принимать мѣры предупрежден
развитiя эпизотiи и наблюда
за исполненiемъ означенныхъ мѣ
Сильный падежъ скота необхо
мо имѣлъ влiянiе на взысканiе
податей и повинностей съ недо
ками, которое и было менѣе усп.
но нежели въ 1870 году.
За вычетомъ...
Документация
Полная документация (English & Русский)
Подробные примеры и руководства:
- Pipeline API - интеграция и создание кастомных компонентов
Установка
Режим 1: Пользовательская установка (только inference)
Минимальная установка для использования готовых моделей через ONNX Runtime (CPU):
pip install manuscript-ocr
Для ускорения на GPU (NVIDIA CUDA):
# Удалите CPU версию ONNX Runtime
pip uninstall onnxruntime
# Установите GPU версию
pip install onnxruntime-gpu
Для Apple Silicon (M1/M2/M3) с CoreML:
# Удалите стандартную версию
pip uninstall onnxruntime
# Установите версию для Apple Silicon (оптимизация через CoreML)
pip install onnxruntime-silicon
Режим 2: Dev установка (с обучением моделей)
Полная установка с PyTorch для обучения собственных моделей:
pip install manuscript-ocr[dev]
Для обучения на GPU (NVIDIA CUDA):
# Сначала установите manuscript-ocr[dev]
pip install manuscript-ocr[dev]
# Затем обновите PyTorch на GPU версию
pip install --upgrade torch torchvision --index-url https://download.pytorch.org/whl/cu118
Примечание: GPU версии (ONNX Runtime GPU и PyTorch CUDA) пользователь устанавливает вручную по необходимости.
Быстрый старт
from manuscript import Pipeline
# Инициализация с моделями по умолчанию (CPU)
pipeline = Pipeline()
# Обработка изображения
result = pipeline.predict("document.jpg")
# Извлечение текста
text = pipeline.get_text(result)
print(text)
Использование GPU/CoreML
# NVIDIA CUDA
detector = EAST(device="cuda")
recognizer = TRBA(device="cuda")
pipeline = Pipeline(detector=detector, recognizer=recognizer)
# Apple Silicon (M1/M2/M3)
detector = EAST(device="coreml")
recognizer = TRBA(device="coreml")
pipeline = Pipeline(detector=detector, recognizer=recognizer)
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file manuscript_ocr-0.1.10.tar.gz.
File metadata
- Download URL: manuscript_ocr-0.1.10.tar.gz
- Upload date:
- Size: 910.3 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
88db654e430d3404cf1c8e9a2daba0620cc933a0e8237cdb36fcfd09eca976b7
|
|
| MD5 |
be92751af5bcb59d573c9f24802c8170
|
|
| BLAKE2b-256 |
002798991e60eec2c96c290eb3629308dc4323935c8898fc86418231d3d964c8
|
File details
Details for the file manuscript_ocr-0.1.10-py3-none-any.whl.
File metadata
- Download URL: manuscript_ocr-0.1.10-py3-none-any.whl
- Upload date:
- Size: 959.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.11.0
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
a658f832d70cc6fa4ffd3767fa0f492ac969926f09cb5f5095d4565e502c7706
|
|
| MD5 |
888e70ed75412e82b4c9ed3576bed5f4
|
|
| BLAKE2b-256 |
8fdea2478a01438207e74d9e38b4d1df6d515305ca9c654f0c4604b291e8f6c3
|