Open-Source Voice-to-Text mit Pay-per-Use Pricing
Project description
PayPerTranscript
Open-Source Voice-to-Text für Windows — Pay-per-Use statt Abo.
Hotkey drücken, sprechen, loslassen — Text erscheint an der Cursor-Position.
Warum PayPerTranscript?
Kommerzielle Diktierdienste kosten $12–15 pro Monat — egal ob du sie 5 Minuten oder 5 Stunden nutzt.
PayPerTranscript nutzt Cloud-basierte KI-Modelle direkt über deinen eigenen API-Key. Du zahlst nur, was du tatsächlich verbrauchst: ~0.024 Cent pro Transkription.
100 Transkriptionen kosten ca. 2.4 Cent. Ein kommerzielles Abo kostet dafür $15/Monat.
Features
| Feature | Beschreibung |
|---|---|
| Hold-to-Record | Hotkey halten, sprechen, loslassen — Text erscheint |
| Toggle-Modus | Alternativ: einmal drücken = Start, nochmal = Stop |
| App-spezifische Formatierung | Chat-Apps: locker. E-Mail: professionell. Per LLM, frei konfigurierbar. |
| Wortliste | Namen und Fachbegriffe immer korrekt transkribieren |
| Kosten-Dashboard | Jederzeit sehen, was verbraucht wurde |
| Privatsphäre | Dein API-Key, deine Daten. Keine Telemetrie, kein Tracking. |
| Open Source | MIT-Lizenz — vollständig transparent und erweiterbar |
Installation
Voraussetzungen: Windows 10/11, Python 3.12+
Option 1: pip install (empfohlen)
pip install paypertranscript
Nach der Installation einfach starten:
paypertranscript
Beim ersten Start öffnet sich ein Setup-Wizard, der durch die Konfiguration führt.
Option 2: Aus dem Quellcode
# Repository klonen
git clone https://github.com/jxnxts/PayPerTranscript.git
cd PayPerTranscript
# Virtuelle Umgebung erstellen & aktivieren
python -m venv venv
venv\Scripts\activate
# Im Entwicklungsmodus installieren
pip install -e .
# App starten
paypertranscript
# Oder mit Debug-Logging
python -m paypertranscript --debug
Nutzung
- Hotkey halten —
Ctrl+Wingedrückt halten und sprechen - Loslassen — die Aufnahme stoppt, Text wird transkribiert
- Text erscheint — direkt an der Cursor-Position eingefügt
- Tray-Icon — Rechtsklick für Einstellungen, Statistiken und mehr
Kosten
| Dienst | Preis |
|---|---|
| STT (Whisper) | $0.04 pro Stunde Audio (~0.01 Cent pro 10s) |
| LLM-Formatierung | ~$0.00002 pro Transkription (optional) |
| Gesamt | ~0.024 Cent pro Transkription |
Alle Preise basieren auf GroqCloud-Tarifen. Du nutzt deinen eigenen API-Key — kein Abo, kein Mittelsmann.
Konfiguration
Die gesamte Konfiguration ist über die grafische Oberfläche möglich:
- Einstellungen — Sprache, Hotkeys, API-Key, Overlay-Position
- Wortliste — Namen und Fachbegriffe für korrekte Transkription
- Fenster-Zuordnung — Welche App bekommt welchen Schreibstil (casual, professionell, ...)
- Statistiken — Kosten, Nutzung, Ersparnis gegenüber Abo-Diensten
Alle Daten werden lokal unter %APPDATA%\PayPerTranscript\ gespeichert.
FAQ
Text wird nicht in Admin-Fenster eingefügt
Windows blockiert Tastatureingaben von nicht-erhöhten Prozessen in erhöhte Fenster (UAC). Wenn du PayPerTranscript in Admin-Fenstern nutzen möchtest, starte die App als Administrator.
Mikrofon wird nicht erkannt
- Prüfe, ob ein Mikrofon angeschlossen und in den Windows-Soundeinstellungen aktiviert ist
- Prüfe die Datenschutz-Einstellungen: Windows-Einstellungen → Datenschutz → Mikrofon
Wie erhalte ich einen API-Key?
- Erstelle einen Account bei GroqCloud
- Gehe zu API Keys → "Create API Key"
- Kopiere den Key und füge ihn im Setup-Wizard ein
Lizenz
MIT — siehe LICENSE
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file paypertranscript-0.2.2.tar.gz.
File metadata
- Download URL: paypertranscript-0.2.2.tar.gz
- Upload date:
- Size: 74.0 kB
- Tags: Source
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
f7e49f2d7ec84ddd0140201f7b9f6832397c29d4946a4a1a9b596c7b0dca870f
|
|
| MD5 |
d0ec94204bffd8f581e518b886d7d367
|
|
| BLAKE2b-256 |
a47b5f38390afc14d029b5b96a40059d8655e24b90b9d658b60d1d2bba401114
|
Provenance
The following attestation bundles were made for paypertranscript-0.2.2.tar.gz:
Publisher:
publish.yml on nikovdany/PayPerTranscript
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
paypertranscript-0.2.2.tar.gz -
Subject digest:
f7e49f2d7ec84ddd0140201f7b9f6832397c29d4946a4a1a9b596c7b0dca870f - Sigstore transparency entry: 947288374
- Sigstore integration time:
-
Permalink:
nikovdany/PayPerTranscript@362f366d06891209b350f47bae678b26f5babc5b -
Branch / Tag:
refs/tags/v0.2.2 - Owner: https://github.com/nikovdany
-
Access:
private
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
publish.yml@362f366d06891209b350f47bae678b26f5babc5b -
Trigger Event:
release
-
Statement type:
File details
Details for the file paypertranscript-0.2.2-py3-none-any.whl.
File metadata
- Download URL: paypertranscript-0.2.2-py3-none-any.whl
- Upload date:
- Size: 90.6 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? Yes
- Uploaded via: twine/6.1.0 CPython/3.13.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c267be421e06c460f763dc20a13d3b2a92c1c891e442eb4d1907e58907e7bf96
|
|
| MD5 |
8c8301e69c07e973ad1754e3f273aed6
|
|
| BLAKE2b-256 |
c153c9183779bd5bf8f9d3cef972df163b7a12284d38deee9c007438a91f4e2c
|
Provenance
The following attestation bundles were made for paypertranscript-0.2.2-py3-none-any.whl:
Publisher:
publish.yml on nikovdany/PayPerTranscript
-
Statement:
-
Statement type:
https://in-toto.io/Statement/v1 -
Predicate type:
https://docs.pypi.org/attestations/publish/v1 -
Subject name:
paypertranscript-0.2.2-py3-none-any.whl -
Subject digest:
c267be421e06c460f763dc20a13d3b2a92c1c891e442eb4d1907e58907e7bf96 - Sigstore transparency entry: 947288375
- Sigstore integration time:
-
Permalink:
nikovdany/PayPerTranscript@362f366d06891209b350f47bae678b26f5babc5b -
Branch / Tag:
refs/tags/v0.2.2 - Owner: https://github.com/nikovdany
-
Access:
private
-
Token Issuer:
https://token.actions.githubusercontent.com -
Runner Environment:
github-hosted -
Publication workflow:
publish.yml@362f366d06891209b350f47bae678b26f5babc5b -
Trigger Event:
release
-
Statement type: