Automating JDownloader Downloads (German!)
Project description
FeedCrawler
FeedCrawler (ehemals RSScrawler) automatisiert bequem das Hinzufügen von Links für den JDownloader.
Docker
- Offizielles Repo im Docker Hub: docker-feedcrawler
- Der Betrieb als Docker-Container empfiehlt sich als Standardinstallation - vor allem für NAS-Systeme, Homeserver und sonstige Geräte die dauerhaft und möglichst wartungsfrei (headless) betrieben werden sollen. Beim (Neu-)Start des Containers wird automatisch die neueste Version heruntergeladen. Wird ein neues Image im Docker Hub bereitgestellt, sollte dennoch auf dieses aktualisiert werden!
- Für UNRAID-Server kann das Image direkt über die Community Applications bezogen und der Container so eingerichtet werden.
- Ein FlareSolverr muss lokal verfügbar sein um Cloudflare-Blockaden zu umgehen (optional)
Windows
- Jedem Release wird eine selbstständig unter Windows lauffähige Version des Feedcrawlers beigefügt.
- Hierfür müssen weder Python, noch die Zusatzpakete installiert werden.
- Einfach die jeweilige Exe herunterladen und ausführen bzw. bei Updates die Exe ersetzen.
- Ein FlareSolverr muss lokal verfügbar sein um Cloudflare-Blockaden zu umgehen (optional)
Manuelle Installation
Voraussetzungen
- Python 3.6 oder neuer
- pip
- JDownloader 2 mit My JDownloader-Konto
- FlareSolverr um Cloudflare-Blockaden zu umgehen (optional)
Installation
pip install feedcrawler
Hinweise zur manuellen Installation und Einrichtung finden sich im Wiki!
Bekannte Fehler
Kommt es nach einem Update oder Neustart des Containers zu einer sqlite3.OperationalError: database is locked
-Fehlermeldungen, so muss der Container gestoppt, die FeedCrawler.db
beliebig (bspw. zu FeedCrawler-Temp.db
)
umbenannt und direkt wieder zurück zu FeedCrawler.db
umbenannt werden. Hintergrund ist, dass der FeedCrawler nicht
während die Datenbank verwendet wird (bspw. bei aktiver Feedsuche) gestoppt werden sollte. Der Umbenennungs-Workaround
stellt sicher, dass das Betriebssystem die Datei wieder freigibt (also den Lock loslässt).
Fehler im Installationsprozess per pip deuten auf fehlende Compiler im System hin. Meist muss ein Zusatzpaket
nachinstalliert werden (Beispielsweise die VS C++ Build Tools für
Windows oder libffi per apt-get install libffi-dev
für den Raspberry Pi).
Update
pip install -U feedcrawler
Starten
feedcrawler
in der Konsole (Python muss im System-PATH hinterlegt sein)
Hostnamen festlegen
FeedCrawler kann zum durchsuchen beliebiger Webseiten verwendet werden. Ausschließlich der Anwender entscheidet, welche Seiten durchsucht werden sollen. Diese Entscheidung trifft der Anwender selbstständig, indem er die Feedcrawler.ini in der Kategorie [Hostnames] manuell befüllt (ab = xyz.com). Eingetragen werden dort reine Hostnamen (ohne https://).
Dabei gilt
- Welcher Hostname aufgerufen wird entscheidet allein der Anwender.
- Ist nicht mindestens ein Hostname gesetzt, wird der FeedCrawler nicht starten.
- Passt die aufgerufene Seite hinter dem jeweiligen Hostnamen nicht zum Suchmuster des Feedcrawlers, kann es zu Fehlern kommen.
- Weder FeedCrawler noch der Autor benennen oder befürworten spezifische Hostnamen. Fragen hierzu werden ignoriert!
Sicherheitshinweis
Der Webserver sollte nie ohne Absicherung im Internet freigegeben werden. Dazu lassen sich im Webinterface Nutzername und Passwort festlegen.
Es empfiehlt sich, zusätzlich einen Reverse-Proxy mit HTTPs-Zertifikat, bspw. kostenlos von letsencrypt, zu verwenden.
Startparameter
Parameter | Erläuterung |
---|---|
--log-level=<LOGLEVEL> |
Legt fest, wie genau geloggt wird (CRITICAL , ERROR , WARNING , INFO , DEBUG , NOTSET ) |
--config="<CFGPFAD>" |
Legt den Ablageort für Einstellungen und Logs fest |
--port=<PORT> |
Legt den Port des Webservers fest |
--jd-user=<NUTZERNAME> |
Legt den Nutzernamen für My JDownloader fest |
--jd-pass=<PASSWORT> |
Legt das Passwort für My JDownloader fest |
--jd-device=<GERÄTENAME> |
Legt den Gerätenamen für My JDownloader fest (optional, wenn nur ein Gerät vorhanden ist) |
--keep-cdc |
Leere die CDC-Tabelle (Feed ab hier bereits gecrawlt) nicht vor dem ersten Suchlauf |
Credits
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for feedcrawler-11.0.5-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | ded39df10032733c5cec8535b214e8e53a06ef0110579173c15bf8bf3c722df8 |
|
MD5 | 8f485755aef5bf12533ca3b06e4f6933 |
|
BLAKE2b-256 | d2336cafcf040f1ebfc930f463018369d2f47d6feca66388dd68eaf5aee9ac91 |