A parser for extracting text from PDFs using PyPDFTK.

These details have not been verified by PyPI

Project description

Swarmauri Logo

Swarmauri Parser PyPDFTK

Form-field parser for Swarmauri built on PyPDFTK. Extracts PDF AcroForm field metadata and returns it as Swarmauri Document content.

Features

Calls pypdftk.dump_data_fields to extract field key/value pairs.
Emits a single Document with newline-delimited key: value text and metadata['source'] set to the PDF path.
Returns an empty list when no form fields exist or when parsing fails (logs the error).

Prerequisites

Python 3.10 or newer.
PyPDFTK plus the pdftk/pdftk-java binary available on the system path. Install operating-system packages: e.g., apt install pdftk-java or download pdftk for macOS/Windows.
Read access to the PDF file path you provide.

Installation

# pip
pip install swarmauri_parser_pypdftk

# poetry
poetry add swarmauri_parser_pypdftk

# uv (pyproject-based projects)
uv add swarmauri_parser_pypdftk

Quickstart

from swarmauri_parser_pypdftk import PyPDFTKParser

parser = PyPDFTKParser()
documents = parser.parse("forms/enrollment.pdf")

for doc in documents:
    print(doc.metadata["source"])
    print(doc.content)

Example output:

source: forms/enrollment.pdf
GivenName: John
FamilyName: Doe
BirthDate: 1990-01-01

Handling Missing Fields

parser = PyPDFTKParser()
docs = parser.parse("forms/plain.pdf")

if not docs:
    print("No form fields detected or parsing failed.")

Tips

Ensure pdftk is installed and available on PATH; PyPDFTK delegates to the binary.
For encrypted PDFs, remove or provide the password before parsing; pdftk cannot dump fields from password-protected documents without credentials.
Combine with other Swarmauri parsers to extract both structured form data (PyPDFTKParser) and free-form text (PyPDF2Parser or FitzPdfParser).

Want to help?

If you want to contribute to swarmauri-sdk, read up on our guidelines for contributing that will help you get started.

Project details

These details have not been verified by PyPI

Release history Release notifications | RSS feed

0.9.0

Mar 24, 2026

0.9.0.dev7 pre-release

Mar 23, 2026

0.9.0.dev5 pre-release

Mar 20, 2026

0.9.0.dev4 pre-release

Mar 20, 2026

0.9.0.dev3 pre-release

Mar 20, 2026

0.9.0.dev2 pre-release

Mar 20, 2026

0.9.0.dev1 pre-release

Mar 20, 2026

0.8.3.dev18 pre-release

Mar 20, 2026

0.8.3.dev17 pre-release

Mar 20, 2026

0.8.3.dev10 pre-release

Feb 23, 2026

0.8.3.dev5 pre-release

Feb 18, 2026

0.8.3.dev4 pre-release

Feb 17, 2026

This version

0.8.3.dev3 pre-release

Feb 17, 2026

0.8.2

Feb 17, 2026

0.8.2.dev7 pre-release

Feb 17, 2026

0.8.2.dev6 pre-release

Feb 12, 2026

0.8.0

Jan 28, 2026

0.8.0.dev21 pre-release

Jan 27, 2026

0.8.0.dev4 pre-release

Sep 11, 2025

0.8.0.dev3 pre-release

Sep 10, 2025

0.8.0.dev2 pre-release

Sep 10, 2025

0.7.5

May 23, 2025

0.7.5.dev1 pre-release

May 23, 2025

0.7.4

May 23, 2025

0.7.4.dev20 pre-release

May 23, 2025

0.7.3

Mar 31, 2025

0.7.3.dev2 pre-release

Mar 31, 2025

0.7.2

Mar 6, 2025

0.7.2.dev3 pre-release

Mar 6, 2025

0.7.2.dev2 pre-release

Mar 6, 2025

0.7.2.dev1 pre-release

Mar 6, 2025

0.7.1

Mar 6, 2025

0.7.1.dev1 pre-release

Mar 5, 2025

0.7.0

Mar 4, 2025

0.7.0.dev12 pre-release

Mar 4, 2025

0.7.0.dev11 pre-release

Mar 4, 2025

0.7.0.dev10 pre-release

Mar 4, 2025

0.7.0.dev9 pre-release

Mar 4, 2025

0.7.0.dev8 pre-release

Mar 4, 2025

0.7.0.dev7 pre-release

Mar 4, 2025

0.7.0.dev6 pre-release

Mar 4, 2025

0.7.0.dev5 pre-release

Mar 4, 2025

0.7.0.dev4 pre-release

Mar 4, 2025

0.7.0.dev3 pre-release

Mar 4, 2025

0.7.0.dev2 pre-release

Mar 3, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

swarmauri_parser_pypdftk-0.8.3.dev3.tar.gz (7.3 kB view details)

Uploaded Feb 17, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

swarmauri_parser_pypdftk-0.8.3.dev3-py3-none-any.whl (8.3 kB view details)

Uploaded Feb 17, 2026 Python 3

File details

Details for the file swarmauri_parser_pypdftk-0.8.3.dev3.tar.gz.

File metadata

Download URL: swarmauri_parser_pypdftk-0.8.3.dev3.tar.gz
Upload date: Feb 17, 2026
Size: 7.3 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.10.3 {"installer":{"name":"uv","version":"0.10.3","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}

File hashes

Hashes for swarmauri_parser_pypdftk-0.8.3.dev3.tar.gz
Algorithm	Hash digest
SHA256	`5c60c47e9e1aacdb9e07327bed4c0f03014f5c8dbaa7724dba68181ea0c28e12`
MD5	`48b0a1ef72d1eea62fa2a5f7b683798d`
BLAKE2b-256	`e30d4cbfb6d4854d963664eb2dc9ab1f831927b980212f935cae66e50260c7b2`

See more details on using hashes here.

File details

Details for the file swarmauri_parser_pypdftk-0.8.3.dev3-py3-none-any.whl.

File metadata

Download URL: swarmauri_parser_pypdftk-0.8.3.dev3-py3-none-any.whl
Upload date: Feb 17, 2026
Size: 8.3 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: uv/0.10.3 {"installer":{"name":"uv","version":"0.10.3","subcommand":["publish"]},"python":null,"implementation":{"name":null,"version":null},"distro":{"name":"Ubuntu","version":"24.04","id":"noble","libc":null},"system":{"name":null,"release":null},"cpu":null,"openssl_version":null,"setuptools_version":null,"rustc_version":null,"ci":true}

File hashes

Hashes for swarmauri_parser_pypdftk-0.8.3.dev3-py3-none-any.whl
Algorithm	Hash digest
SHA256	`6282520b970a18d855647b166d303d36050bdbc5265f9c1c4db335d619e5b32c`
MD5	`51ad256c1aa81b91a8e0a93966cf01db`
BLAKE2b-256	`054dfc6ba9f3f1fc2b3870e37774d3f1a6cc313dee96cfcd26b1596b6ed5398f`

See more details on using hashes here.

swarmauri_parser_pypdftk 0.8.3.dev3

Navigation

Verified details

Maintainers

Meta

Unverified details

Meta

Classifiers

Project description

Swarmauri Parser PyPDFTK

Features

Prerequisites

Installation

Quickstart

Handling Missing Fields

Tips

Want to help?

Project details

Verified details

Maintainers

Meta

Unverified details

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes