Skip to main content

Automating JDownloader Downloads (German!)

Project description

FeedCrawler

FeedCrawler (ehemals RSScrawler) automatisiert bequem das Hinzufügen von Links für den JDownloader.

Release Artifacts PyPI version PyPI - Downloads Github Sponsorship Chat aufrufen unter https://gitter.im/FeedCrawler/community GitHub license GitHub issues GitHub stars GitHub forks


Docker

  • Offizielles Repo im Docker Hub: docker-feedcrawler
  • Der Betrieb als Docker-Container empfiehlt sich als Standardinstallation - vor allem für NAS-Systeme, Homeserver und sonstige Geräte die dauerhaft und möglichst wartungsfrei (headless) betrieben werden sollen. Beim (Neu-)Start des Containers wird automatisch die neueste Version heruntergeladen. Wird ein neues Image im Docker Hub bereitgestellt, sollte dennoch auf dieses aktualisiert werden!
  • Für UNRAID-Server kann das Image direkt über die Community Applications bezogen und der Container so eingerichtet werden.
  • Ein FlareSolverr muss lokal verfügbar sein um Cloudflare-Blockaden zu umgehen (optional)

Windows

  • Jedem Release wird eine selbstständig unter Windows lauffähige Version des Feedcrawlers beigefügt.
  • Hierfür müssen weder Python, noch die Zusatzpakete installiert werden.
  • Einfach die jeweilige Exe herunterladen und ausführen bzw. bei Updates die Exe ersetzen.
  • Ein FlareSolverr muss lokal verfügbar sein um Cloudflare-Blockaden zu umgehen (optional)

Manuelle Installation

Voraussetzungen

Installation

pip install feedcrawler

Hinweise zur manuellen Installation und Einrichtung finden sich im Wiki!

Bekannte Fehler

Kommt es nach einem Update oder Neustart des Containers zu einer sqlite3.OperationalError: database is locked -Fehlermeldungen, so muss der Container gestoppt, die FeedCrawler.db beliebig (bspw. zu FeedCrawler-Temp.db) umbenannt und direkt wieder zurück zu FeedCrawler.db umbenannt werden. Hintergrund ist, dass der FeedCrawler nicht während die Datenbank verwendet wird (bspw. bei aktiver Feedsuche) gestoppt werden sollte. Der Umbenennungs-Workaround stellt sicher, dass das Betriebssystem die Datei wieder freigibt (also den Lock loslässt).

Fehler im Installationsprozess per pip deuten auf fehlende Compiler im System hin. Meist muss ein Zusatzpaket nachinstalliert werden (Beispielsweise die VS C++ Build Tools für Windows oder libffi per apt-get install libffi-dev für den Raspberry Pi).

Update

pip install -U feedcrawler

Starten

feedcrawler in der Konsole (Python muss im System-PATH hinterlegt sein)

Hostnamen festlegen

FeedCrawler kann zum durchsuchen beliebiger Webseiten verwendet werden. Ausschließlich der Anwender entscheidet, welche Seiten durchsucht werden sollen. Diese Entscheidung trifft der Anwender selbstständig, indem er die Feedcrawler.ini in der Kategorie [Hostnames] manuell befüllt (ab = xyz.com). Eingetragen werden dort reine Hostnamen (ohne https://).

Dabei gilt

  • Welcher Hostname aufgerufen wird entscheidet allein der Anwender.
  • Ist nicht mindestens ein Hostname gesetzt, wird der FeedCrawler nicht starten.
  • Passt die aufgerufene Seite hinter dem jeweiligen Hostnamen nicht zum Suchmuster des Feedcrawlers, kann es zu Fehlern kommen.
  • Weder FeedCrawler noch der Autor benennen oder befürworten spezifische Hostnamen. Fragen hierzu werden ignoriert!

Sicherheitshinweis

Der Webserver sollte nie ohne Absicherung im Internet freigegeben werden. Dazu lassen sich im Webinterface Nutzername und Passwort festlegen.

Es empfiehlt sich, zusätzlich einen Reverse-Proxy mit HTTPs-Zertifikat, bspw. kostenlos von letsencrypt, zu verwenden.

Startparameter

Parameter Erläuterung
--log-level=<LOGLEVEL> Legt fest, wie genau geloggt wird (CRITICAL, ERROR, WARNING, INFO, DEBUG, NOTSET)
--config="<CFGPFAD>" Legt den Ablageort für Einstellungen und Logs fest
--port=<PORT> Legt den Port des Webservers fest
--jd-user=<NUTZERNAME> Legt den Nutzernamen für My JDownloader fest
--jd-pass=<PASSWORT> Legt das Passwort für My JDownloader fest
--jd-device=<GERÄTENAME> Legt den Gerätenamen für My JDownloader fest (optional, wenn nur ein Gerät vorhanden ist)
--keep-cdc Leere die CDC-Tabelle (Feed ab hier bereits gecrawlt) nicht vor dem ersten Suchlauf

Credits

Project details


Release history Release notifications | RSS feed

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

feedcrawler-11.0.17.tar.gz (446.6 kB view hashes)

Uploaded Source

Built Distribution

feedcrawler-11.0.17-py3-none-any.whl (461.5 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page