Skip to main content

PyDocxCreator — это мой небольшой Python-проект для создания и форматирования Word-документов...

Project description

PDC

PyDocxCreator — Небольшой Python-проект для создания и форматирования Word-документов с использованием библиотеки python-docx.

Я постарался заложить гибкую основу для последующего расширения.

Возможности

  • Абстрактные классы для описания стилей документа, абзацев и текста.
  • Реализация базовых стилей и логики генерации Word-документов.
  • Гибкая настройка шрифтов, отступов, выравнивания и др.

Структура проекта

  • py_docx_creator/ — модуль с основными и абстрактными классами:
    • abstract_classes/ — абстрактные интерфейсы
      • abc_document/ — абстрактные классы для описания документа и взаимодействия с ним
      • abc_style_dataclasses/ — абстрактные классы для описания стилей
    • core/ — реализация интерфейсов
      • document/ — реализация взаимодействия с документом
      • style/ — реализация пустых базовых шаблонов стилей
    • default_style_preset/ - несколько заготовленных стилей
    • enums/ - enumы шрифтов, стилей документа, выравнивания

Установка

pip install py_docx_creator

Базовый пример использования

Классическая запись в стиле python-docx

from py_docx_creator.core.document.document import Document

text = "Пример классической записи"

document = Document()
document.create_document("Документ.docx")
paragraph = document.add_paragraph_to_document(document)
run = document.add_run_to_paragraph(paragraph, text)
document.save_document()

Быстрая запись

Реализована быстрая запись с помощью метода write. При такой записи момент создания параграфа и наполнение run-а пропускается. Стили в свою очередь для параграфа и текста в нем определяются классами стилей. В данном примере используются стандартные классы стилей DefaultHeaderParagraphStyle для параграфа и DefaultHeaderTextStyle для текста в нем.

from py_docx_creator.core.document.document import Document
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle

document = Document()
document.create_document("Документ.docx")
document.write(document, "Пример быстрой записи", paragraph_style=DefaultHeaderParagraphStyle, text_style=DefaultHeaderTextStyle)
document.save_document()

Fluent запись

Реализована возможность записи в стиле Fluent где последовательно описываются стили записываемого параграфа и текста. При таком подходе каждая запись оканчивается методом .add() который записывает параграф в документ с заданным текстом и возвращает картеж из записанного параграфа и run-a (tuple[Paragraph, Run]).

from py_docx_creator.core.document.document import Document

document = Document()
document.create_document("Документ.docx")
document.paragraph("Пример Fluent записи").size(32).bold(True).italic(True).line_spacing(12).alignment(AlignParagraph.CENTER).add()
document.save_document()

Конвейерное создание документов

Предусмотрена возможность прописать шаги формирования документа в отдельной функции типа Callable. Аргументы такой функции задаются в отдельном поле класса Document.

*** Важный момент при написании функции-инструкции. Для корректной работы первый позиционный аргумент данной функции (в данном примере doc: Document) обязательно должен быть экземпляр класса Document. Данный аргумент является системным и прокидывается автоматически при выполнении кода.

from py_docx_creator.core.document.document import Document
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle

def instruction(doc: Document, **kwargs):
    file_name = kwargs.get("name", "document.docx")
    doc.create_document(file_name)
    # Классическая запись
    paragraph = doc.add_paragraph_to_document(doc)
    run = doc.add_run_to_paragraph(paragraph, "Пример классической записи")
    # Быстрая запись
    doc.write(doc, "Пример быстрой записи", paragraph_style=DefaultHeaderParagraphStyle, text_style=DefaultHeaderTextStyle)
    # Fluent запись
    doc.paragraph("Пример Fluent записи").italic(True).size(18).first_line_indent(30).space_after(30).add()

document = Document()
document.create_document("Документ.docx")
document.creation_instruction = instruction # инструкция по формированию документа
document.instruction_kwargs = {"name": "Конвейерное создание документов.docx"} # аргументы выполняемой функции
document.run_instruction(save_after=True) # запуск формирования документа 

Реализован простой агрегатор для конвейерного формирования документов DocumentCreator.

from py_docx_creator.core.document.document import Document
from py_docx_creator.core.document.document_creator import DocumentCreator
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle

def instruction(doc: Document, **kwargs):
    file_name = kwargs.get("name", "document.docx")
    doc.create_document(file_name)
    # Классическая запись
    paragraph = doc.add_paragraph_to_document(doc)
    run = doc.add_run_to_paragraph(paragraph, "Пример классической записи")
    # Быстрая запись
    doc.write(doc, "Пример быстрой записи", paragraph_style=DefaultHeaderParagraphStyle, text_style=DefaultHeaderTextStyle)
    # Fluent запись
    doc.paragraph("Пример Fluent записи").italic(True).size(18).first_line_indent(30).space_after(30).add()

document_creator = DocumentCreator()
for i in range(5): # имитация конвейера
    document: Document = Document()
    document.creation_instruction = instruction # инструкция по формированию документа
    document.instruction_kwargs = {"name": f"{i}.docx"} # аргументы выполняемой функции (в данном случае отличные друг от друга имена файлов)
    document_creator.add_document(document) # список экземпляров `Document` готовых к формированию

document_creator.start_creating_documents(save_after=True) # запуск формирования всех документов

Стили

Реализованы базовые стили:

  • Стиль страницы
    • DefaultPageStyle - базовый стиль страницы документа (поля/отступы)
  • Стиль параграфа
    • DefaultHeaderParagraphStyle - базовый стиль параграфа для заголовка
    • DefaultMainParagraphStyle - базовый стиль параграфа для основного текста
  • Стиль текста
    • DefaultHeaderTextStyle - базовый стиль для текста заголовка
    • DefaultMainTextStyle - базовый стиль для основного текста

Создание собственных стилей

Ниже приведен пример создания стилей на основе базовых стилей

from py_docx_creator.core.document.document import Document
from py_docx_creator.default_style_preset.default_page_style import DefaultPageStyle
from py_docx_creator.default_style_preset.default_paragraph_style import DefaultHeaderParagraphStyle
from py_docx_creator.default_style_preset.default_text_style import DefaultHeaderTextStyle
from py_docx_creator.enums.enum_align_paragraph import AlignParagraph


class MyTextStyle(DefaultHeaderTextStyle): # Стиль текста
    italic = True
    size = 24

class MyParagraphStyle(DefaultHeaderParagraphStyle): # Стиль параграфа
    alignment = AlignParagraph.LEFT

class MyPageStyle(DefaultPageStyle): # Стиль страницы
    left_margin = 200.0

document = Document()
document.create_document("Документ.docx")
document.apply_style(document, style=MyPageStyle) # пример того как задать стиль страницы `PageStyle`
document.write(document, "Базовый пример использования", paragraph_style=MyParagraphStyle, text_style=MyTextStyle)
document.save_document()

При необходимости есть возможность создать стиль с нуля. Для этого необходимо наследоваться от базовых классов.

  • PageStyle - для стилей страницы
  • ParagraphStyle - для стилей параграфа
  • TextStyle - для стилей текста

Быстрая смена стиля

Имеется возможность подправить основные параметры стилей прямо на месте записи. Для этого имеются опциональные именованные аргументы.

  • size: float - размер шрифта
  • bold: bool - жирное начертание
  • italic: bool - курсивное начертание
  • underline: bool - подчеркнутое начертание
  • space_after: float - отступ поле параграфа
  • alignment: AlignParagraph - выравнивание параграфа
  • first_line_indent: float - отступ первой строки (красная строка)
  • with_leader: bool - заполнение строки символом _
  • leader_width: float - длинна заполнения символом _ (учитывается только при with_leader=True, значение по умолчанию 6.8)
document.write(document, "Базовый пример использования", 
               paragraph_style=DefaultHeaderParagraphStyle, 
               text_style=DefaultHeaderTextStyle,
               size=12,
               bold=True,
               alignment=AlignParagraph.RIGHT
               ...
               )

или же:

write_config = {
    "paragraph_style": DefaultHeaderParagraphStyle,
    "text_style": DefaultHeaderTextStyle,
    "size": 13,
    "bold": True,
    "space_after": 10
}

document.write(document, "Базовый пример использования", **write_config)

TODO:

  • Реализовать многопоточное формирование документов при использовании DocumentCreator
  • Реализовать взаимодействие с таблицами
  • Реализовать запись в виде списка (Word)
  • Работа над документацией
  • Рефакторинг (при необходимости)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

py_docx_creator-0.2.0.4.tar.gz (16.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

py_docx_creator-0.2.0.4-py3-none-any.whl (25.5 kB view details)

Uploaded Python 3

File details

Details for the file py_docx_creator-0.2.0.4.tar.gz.

File metadata

  • Download URL: py_docx_creator-0.2.0.4.tar.gz
  • Upload date:
  • Size: 16.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.14.0

File hashes

Hashes for py_docx_creator-0.2.0.4.tar.gz
Algorithm Hash digest
SHA256 3e990ab234aea4ea0518134223ec20a97b34b9ddad2e1e52c7ae1ca3c624f66d
MD5 103d5a24d05a5d4e9164123194e104ee
BLAKE2b-256 a21a567141e4997ae28617969093219cbdbd2039a27641d395a054e2db7cc8a1

See more details on using hashes here.

File details

Details for the file py_docx_creator-0.2.0.4-py3-none-any.whl.

File metadata

File hashes

Hashes for py_docx_creator-0.2.0.4-py3-none-any.whl
Algorithm Hash digest
SHA256 110f8e9fddea202070e5376a257987f302ea3100772efdb3384fbd0ba0579be0
MD5 3f75b1b5fad43b3f2bac4715ce69e390
BLAKE2b-256 f79bd7182ebf21432b569038aee0062078c222475b39d2443e67b4849788b3f5

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page