A simple script to rename Tatort episode video files to a unique pattern.
Project description
“tatorter” is a simple script to rename video files of the German police crime drama television series “Tatort” to a standardized file name format. That makes it a lot easier to archive local copies of the episodes which may come from various sources with different and/or insufficient naming schemes. The used information such as episode indexes and detective team is fetched from the list of episodes on the German Wikipedia. For each video file to be renamed, tatorter uses an easy heuristic with some fuzzy string matching to find the 5 best fitting episodes and to rename the file according to the user’s choice.
GitHub page: https://github.com/DLFW/tatorter
tatorter depends on Python 3 and can be installed with pip.
Since tatorter can handle only the original German episode names, the rest of this documentation is also written in German. :)
Deutsch
„tatorter“ ist einfaches Skript um lokale Videodateien der Serie „Tatort“ automatisch umzubenennen und so ein ein einheitliches Dateinamensschema für alle Videos zu erhalten. Das macht die Archivierung einfacher und erhöht die Übersichtlichkeit der Sammlung. Die notwendigen Daten wie Episodennummer und Ermittlerteam werden dabei aus der deutschen Wikipedia bezogen. Für jede Videodatei, die umbenannt werden soll, ermittelt tatorter die fünf besten Episoden-Treffer durch eine Heuristik mit Fuzzy-String-Suche. Der Anwender wählt dann den passenden Treffer aus.
Erhält man Tatort-Videos beispielsweise aus der ARD-Mediathek, haben diese oft Namen wie Tatort Auf einen Schlag MDR Fernsehen Video ARD Mediathek.mp4. tatorter würde für diese Datei etwa folgende Umbenennungsvorschläge machen:
================================================================================
Choose new name for "Tatort Auf einen Schlag MDR Fernsehen Video ARD Mediathek.mp4"
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
1 (84%)| 0978--Dresden--Auf einen Schlag--(Sieland, Gorniak, Mohr und Schnabel).mp4
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
2 (63%)| 0185--[Stoever und Brockmöller]--Tod auf Eis--(Stoever und Brockmöller).mp4
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
3 (57%)| 1027--Stuttgart--Stau--(Lannert und Bootz).mp4
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
4 (53%)| 0588--[Ehrlicher und Kain]--Feuertaufe--(Ehrlicher und Kain).mp4
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
5 (51%)| 0391--[Ehrlicher und Kain]--Tanz auf dem Hochseil--(Ehrlicher und Kain).mp4
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Dabei wird je ein Index (hier von 1 bis 5), eine Trefferquote (als Prozentangabe) und der zur Wahl stehende neue Dateiname angezeigt.
Verwendung
„tatorter“ benötigt Python 3. Die Installation kann mit pip vorgenommen werden (pip3 install tatorter).
Das Skript ist nur unter Linux getestet. Durch die Windows-Dateisysteme werden unter Windows viele Umbenennungen fehlschlagen, da viele Tator-Titel Zeichen enthalten, die unter Windows nicht in Dateinamen erlaubt sind.
„tatorter“ wird als Python-Skript installiert und kann damit typischerweise systemweit aufgerufen werde. Die umzubenennenen Dateien müssen mit Dateinamen oder „Globbing“-Dateinamenmuster mit „*“ und „?“ und „[…]“ als Platzhaltern als Argument übergeben werden. Etwa tatorter Schwanensee\ Tatort\ Video\ ARD\ Mediathek.mp4 oder tatorter *.mp4.
Für alle passenden Dateien werden anschließend Namensvorschläge ermittelt. Die besten fünf Treffer stehen dann jeweils zur Auswahl.
Beim ersten Start werden die notwendigen Information von der Liste der Tatort-Folgen der deutschen Wikipedia bezogen und in einer Cache-Datei .tatorter.cache im Heimverzeichnis abgelegt. Ist dieser Cache älter als 24 Stunden wird er verworfen und die Daten erneut aus der Wikipedia bezogen. Mit der Option -c kann eine andere Cache-Datei gewählt werden. Die Option -r forciert ein Update des Cache, egal wann dieser zuletzt aktulaisiert wurde.
Das Namensschema ist derzeit fest codiert und müsste bei Bedarf in cli.py (Variable file_rename_pattern) manuell angepasst werden. Dieses lautet derzeit {episode_index:0>4}--{location}--{title}--({team}), wobei location der Heimatstadt/-region des jeweiligen Ermittlerteams entspricht. Die Heimatstadt ist die einzige Information die nicht direkt aus der Wikipedia stammt, sondern anhand eines Mappings (team_to_location in grabber.py) aus dem Team abgeleitet wird. Derzeit sind alle Heimatstädte ab Episode 800 dort verzeichnet. Fehlen hier relevante „locations“, müssten diese ebenfalls händisch nachgetragen werden.
Insgesamt stehen die folgenden Variablen für das Namensschema zur Verfügung:
episode_index: Episodenindex
location: Heimatstadt/-region des Ermittlerteams
title: Titel der Episode
broadcaster: Produzierende Rundfunkanstalt
premiere: Datum der Erstaustrahlung
team: Ermittlerteam
case_index: Fall-Nummer des jeweiligen Ermittlerteams
author: Autor der Episode
director: Regisseur der Episode
GitHub-Seite: https://github.com/DLFW/tatorter
tatorter steht unter der GNU General Public License, Version 3 (GPL 3).
tatorter is a free and open project, you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation, either version 3 of the License, or any later version. tatorter is distributed in the hope that it will be useful, but without any warranty; without even the implied warranty of merchantability or fitness for a particular purpose. See the GNU General Public License for more details. |
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.