Skip to main content

PyDocxCreator — это мой небольшой Python-проект для создания и форматирования Word-документов

Project description

PDC

PyDocxCreator — Небольшой Python-проект для создания и форматирования Word-документов с использованием библиотеки python-docx.

Я постарался заложить гибкую основу для последующего расширения.

Возможности

  • Абстрактные классы для описания стилей документа, абзацев и текста.
  • Реализация базовых стилей и логики генерации Word-документов.
  • Гибкая настройка шрифтов, отступов, выравнивания и др.

Структура проекта

  • py_docx_creator/ — модуль с основными и абстрактными классами:
    • abstract_classes/ — абстрактные интерфейсы
      • abc_document/ — абстрактные классы для описания документа и взаимодействия с ним
      • abc_style_dataclasses/ — абстрактные классы для описания стилей
    • core/ — реализация интерфейсов
      • document/ — реализация взаимодействия с документом
      • style/ — реализация пустых базовых шаблонов стилей
    • default_style_preset/ - несколько заготовленных стилей
    • enums/ - enumы шрифтов, стилей документа, выравнивания

Установка

pip install py_docx_creator

Базовый пример использования

Классическая запись в стиле python-docx

from py_docx_creator.core.document.document import Document

text = "Пример классической записи"

document = Document()
document.create_document("Документ.docx")
paragraph = document.add_paragraph_to_document(document)
run = document.add_run_to_paragraph(paragraph, text)
document.save_document()

Быстрая запись

Реализована быстрая запись с помощью метода write. При такой записи момент создания параграфа и наполнение run-а пропускается. Стили в свою очередь для параграфа и текста в нем определяются классами стилей. В данном примере используются стандартные классы стилей DefaultHeaderParagraphStyle для параграфа и DefaultHeaderTextStyle для текста в нем.

from py_docx_creator.core.document.document import Document
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle

document = Document()
document.create_document("Документ.docx")
document.write(document, "Пример быстрой записи", paragraph_style=DefaultHeaderParagraphStyle, text_style=DefaultHeaderTextStyle)
document.save_document()

Fluent запись

Реализована возможность записи в стиле Fluent где последовательно описываются стили записываемого параграфа и текста. При таком подходе каждая запись оканчивается методом .add() который записывает параграф в документ с заданным текстом и возвращает картеж из записанного параграфа и run-a (tuple[Paragraph, Run]).

from py_docx_creator.core.document.document import Document

document = Document()
document.create_document("Документ.docx")
document.paragraph("Пример Fluent записи").size(32).bold(True).italic(True).line_spacing(12).alignment(AlignParagraph.CENTER).add()
document.save_document()

Конвейерное создание документов

Предусмотрена возможность прописать шаги формирования документа в отдельной функции типа Callable. Аргументы такой функции задаются в отдельном поле класса Document.

*** Важный момент при написании функции-инструкции. Для корректной работы первый позиционный аргумент данной функции (в данном примере doc: Document) обязательно должен быть экземпляр класса Document. Данный аргумент является системным и прокидывается автоматически при выполнении кода.

from py_docx_creator.core.document.document import Document
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle

def instruction(doc: Document, **kwargs):
    file_name = kwargs.get("name", "document.docx")
    doc.name = file_name
    # Классическая запись
    paragraph = doc.add_paragraph_to_document(doc)
    run = doc.add_run_to_paragraph(paragraph, f"{file_name} - Пример классической записи")
    # Быстрая запись
    doc.write(doc, f"{file_name} - Пример быстрой записи", paragraph_style=DefaultHeaderParagraphStyle, text_style=DefaultHeaderTextStyle)
    # Fluent запись
    doc.paragraph(f"{file_name} - Пример Fluent записи").italic(True).size(18).first_line_indent(30).space_after(30).add()
    doc.save_document()

document = Document()
document.create_document("document.docx")
document.creation_instruction = instruction # инструкция по формированию документа
document.instruction_kwargs = {"name": "Конвейерное создание документов.docx"} # аргументы выполняемой функции
document.run_instruction() # запуск формирования документа 

Реализован простой агрегатор для конвейерного формирования документов DocumentCreator.

from py_docx_creator.core.document.document import Document
from py_docx_creator.core.document.document_creator import DocumentCreator
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle


def instruction(doc: Document, **kwargs):
    file_name = kwargs.get("name", "document.docx")
    # Классическая запись
    paragraph = doc.add_paragraph_to_document(doc)
    run = doc.add_run_to_paragraph(paragraph, f"{file_name} - Пример классической записи")
    # Быстрая запись
    doc.write(doc, f"{file_name} - Пример быстрой записи", paragraph_style=DefaultHeaderParagraphStyle, text_style=DefaultHeaderTextStyle)
    # Fluent запись
    doc.paragraph(f"{file_name} - Пример Fluent записи").italic(True).size(18).first_line_indent(30).space_after(30).add()
    doc.save_document()

document_creator = DocumentCreator()
for i in range(50):  # имитация конвейера
    document: Document = Document()
    document.create_document(f"{i}.docx")
    document.creation_instruction = instruction  # инструкция по формированию документа
    document.instruction_kwargs = {"name": f"{i}.docx"}  # аргументы выполняемой функции
    document_creator.add_document(document)  # список экземпляров `Document` готовых к формированию

document_creator.start_creating_documents()  # запуск формирования всех документов

Формирование документов происходит в многопоточном режиме. Количество одновременно работающих потоков задается атрибутом chunk_size у класса DocumentCreator (по умолчанию chunk_size = 5).

Стили

Реализованы базовые стили:

  • Стиль страницы
    • DefaultPageStyle - базовый стиль страницы документа (поля/отступы)
  • Стиль параграфа
    • DefaultHeaderParagraphStyle - базовый стиль параграфа для заголовка
    • DefaultMainParagraphStyle - базовый стиль параграфа для основного текста
  • Стиль текста
    • DefaultHeaderTextStyle - базовый стиль для текста заголовка
    • DefaultMainTextStyle - базовый стиль для основного текста

Создание собственных стилей

Ниже приведен пример создания стилей на основе базовых стилей

from py_docx_creator.core.document.document import Document
from py_docx_creator.default_style_preset.default_page_style import DefaultPageStyle
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle
from py_docx_creator.enums.enum_align_paragraph import AlignParagraph


class MyTextStyle(DefaultHeaderTextStyle): # Стиль текста
    italic = True
    size = 24

class MyParagraphStyle(DefaultHeaderParagraphStyle): # Стиль параграфа
    alignment = AlignParagraph.LEFT

class MyPageStyle(DefaultPageStyle): # Стиль страницы
    left_margin = 200.0

document = Document()
document.create_document("Документ.docx")
document.apply_style(document, style=MyPageStyle) # пример того как задать стиль страницы `PageStyle`
document.write(document, "Базовый пример использования", paragraph_style=MyParagraphStyle, text_style=MyTextStyle)
document.save_document()

При необходимости есть возможность создать стиль с нуля. Для этого необходимо наследоваться от базовых классов.

  • PageStyle - для стилей страницы
  • ParagraphStyle - для стилей параграфа
  • TextStyle - для стилей текста

Быстрая смена стиля

Имеется возможность подправить основные параметры стилей прямо на месте записи. Для этого имеются опциональные именованные аргументы.

  • size: float - размер шрифта
  • bold: bool - жирное начертание
  • italic: bool - курсивное начертание
  • underline: bool - подчеркнутое начертание
  • space_after: float - отступ поле параграфа
  • alignment: AlignParagraph - выравнивание параграфа
  • first_line_indent: float - отступ первой строки (красная строка)
  • with_leader: bool - заполнение строки символом _
  • leader_width: float - длинна заполнения символом _ (учитывается только при with_leader=True, значение по умолчанию 6.8)
document.write(document, "Базовый пример использования", 
               paragraph_style=DefaultHeaderParagraphStyle, 
               text_style=DefaultHeaderTextStyle,
               size=12,
               bold=True,
               alignment=AlignParagraph.RIGHT
               ...
               )

или же:

write_config = {
    "paragraph_style": DefaultHeaderParagraphStyle,
    "text_style": DefaultHeaderTextStyle,
    "size": 13,
    "bold": True,
    "space_after": 10
}

document.write(document, "Базовый пример использования", **write_config)

TODO:

  • Реализовать многопоточное формирование документов при использовании DocumentCreator
  • Реализовать взаимодействие с таблицами
  • Реализовать запись в виде списка (Word)
  • Работа над документацией
  • Рефакторинг (при необходимости)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

py_docx_creator-0.2.0.8.tar.gz (19.3 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

py_docx_creator-0.2.0.8-py3-none-any.whl (29.7 kB view details)

Uploaded Python 3

File details

Details for the file py_docx_creator-0.2.0.8.tar.gz.

File metadata

  • Download URL: py_docx_creator-0.2.0.8.tar.gz
  • Upload date:
  • Size: 19.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.14.0

File hashes

Hashes for py_docx_creator-0.2.0.8.tar.gz
Algorithm Hash digest
SHA256 4d0684aa4df7cc45d0a5558810d5345f3913df7175f38ab7d19ba4356e635fcd
MD5 246678f653f932d2672d454ba720a4fb
BLAKE2b-256 7a731b1a680ed1834048cf443703a09da25b94393bcb4358360a56585831e52e

See more details on using hashes here.

File details

Details for the file py_docx_creator-0.2.0.8-py3-none-any.whl.

File metadata

File hashes

Hashes for py_docx_creator-0.2.0.8-py3-none-any.whl
Algorithm Hash digest
SHA256 13fe07569fe63114b17b65dba8948391d79f288617921a3565db712388738673
MD5 d64c6b76d87285365df66ddcce1e0a89
BLAKE2b-256 bc13a7ba21182597787f7b0881481f5428ec7496736efb82c904ee9da7d64a29

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page