Uloz.to quick multiple sessions downloader. This is fork of original https://github.com/setnicka/ulozto-downloader for pre-release pull-requests
Project description
Ulož.to downloader
Paralelní stahovač z Ulož.to inspirovaný Vžum (credits to Popcorn) s automatickým louskáním CAPTCHA kódů pomocí TensorFlow modelu z projektu ulozto-captcha-breaker (credits to Jan Palasek).
Narozdíl od originálního Vžum je tato verze napsaná v Pythonu, dá se provozovat jednoduše i na Linuxu a zdrojový kód je veřejně dostupný, což umožňuje další forky a rozšíření do budoucna. Například by mohla vzniknout "serverová" verze s webovým rozhraním.
Nápady na další vylepšení (případně rovnou pull requesty) vítány :-)
Klíčové vlastnosti
- Sám pozná downloady, kde Ulož.to umožňuje stahovat bez CAPTCHA kódů
- Dokáže přečíst sám CAPTCHA kódy díky projektu
ulozto-captcha-breaker (thx Jan Palasek)
- Louská kódy pomocí natrénovaného TensorFlow modelu
- Download linky získává přes Tor, aby se vyhnul nové limitaci ze strany Uloz.to
- Umí opakovaně využít stejný stahovací link pro více částí
- Ulož.to nyní (podzim 2020) umožňuje získat jen dva stahovací linky za minutu, ale stejný link je možné používat po dostahování původní části opakovaně pro stahování dalších částí
- Umí navazovat přerušená stahování (pokud se zachová stejný počet částí)
- Stahuje přímo do finálního souboru, jednotlivá stahování zapisují na správné místo v souboru (než program ohlásí dostahováno, je soubor neúplný)
- Konzolový status panel se statistikou úspěšnosti při získávání linků
- Celkový průběh staženo / okamžitá rychlost stahování ve druhém řádku status panelu (save progress monitor)
- Cache soubor download linků pro pokračování nebo opětovné stažení, po restartu se bez nového
získávání download linků rovnou stahuje a nové download linky se získávají jen když jich není
v cache souboru dostatek. Vytváří malý textový soubor
.ucache
jenž je možné použít znovu a stahovat maximální rychlostí ihned bez získávání linků. Tento soubor má malou velikost a lze ho např. sdílet. U velkých souborů (100ky MB) je platnost linku 48 hodin.
Instalace
Nejjednodušší je využít verzi uveřejněnou na PyPI.
Pokud máte platformu, pro který existuje na PyPI validní balíček
tflite-runtime
, můžete rovnou
instalovat speciální target s [auto-captcha]
a ulehčit si tak instalaci
TensorFlow Lite.
$ pip3 install --upgrade uld
$ pip3 install --upgrade uld[auto-captcha] # <-- doporučeno
Instalace TORu
Program vyžaduje spustitelný tor, protože používá stem a očekává ho v $PATH
.
-
Na Linuxu stačí:
$ sudo apt install tor # nebo... $ yum install tor # nebo podle vašeho balíčkovacího systému
-
Na Windows lze instalovat TorBrowser a dostat
tor.exe
do%PATH%
Instalace TensorFlow Lite (automatické louskání CAPTCHA)
Pokud jste ho instalovali automaticky přes pip, již netřeba nic řešit. Pokud pro
vaší platformu není dostupný na PyPI,
postupujte podle instrukcí na stránce TensorFlow Lite,
kde si buď instalujte balík do systému a nebo si stáhněte z odkazu správný Wheel
soubor podle své verze Pythonu (zjistíte zavoláním python3 -V
).
Instalace Tensorflow na windows (automatické louskání CAPTCHA)
V současnosti není možné instalovat tflite-runtime na Windows jako je to možné u některých verzí pythonu ma platformě Linux. Existuje však řešení:
pip install tensorflow
Toto je na Windows suštěno při: pip install uld[auto-captcha]
Je třeba ale aktuální verzi MSVC knihoven a takto nainstalované zabere vše ~1.4Gb místa ve složkách python balíčků. Poté však auto-captcha
funguje také.
Instalace Tkinter (ruční opisování CAPTCHA)
Potřebujete na systému instalovaný Tkinter (bohužel není na PyPI, takže je potřeba instalovat ručně).
Často už je instalovaný, ale pokud by náhodou nebyl, tak bývá v balíčku
python3-tk
(případně následujte instrukce na
webu Tk).
Instalace na dalších platformách
Android - Termux
Použití
Od verze 3.1 je v defaultu aktivovaná autodetekce TensorFlow a pokud je instalované, tak se použije pro automatické louskání louskání CAPTCHA kódů, jinak se vypisuje ruční opisování. Pro vynucení chování můžete použít přepínače:
--auto-captcha
vynutí použití TensorFlow Lite--manual-captcha
vynutí použití manuálního opisování
Pokud není dostupný žádný solver, lze stahovat jen soubory bez CAPTCHA.
Pro volbu počtu částí slouží přepínač --parts N
, default je 20 částí.
$ ulozto-downloader --parts 50 "https://ulozto.cz/file/TKvQVDFBEhtL/debian-9-6-0-amd64-netinst-iso"
Při využití automatického louskání doporučuji využít velký počet částí, klidně
50 (spustíte ulozto-downloader
a necháte ho pracovat, on si postupně louskne
další stahovací linky a postupně navyšuje počet najednou stahovaných částí).
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distributions
Built Distribution
File details
Details for the file uld-3.1.8-py3-none-any.whl
.
File metadata
- Download URL: uld-3.1.8-py3-none-any.whl
- Upload date:
- Size: 13.2 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.2 CPython/3.10.9
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 221b4d1ea876d404855ad11af31502d0b05023e747dbcba563090199227fe1e0 |
|
MD5 | 33477e61ad8e76385575eb32503b50b0 |
|
BLAKE2b-256 | 26c1b710456e2ced7391aebcdf431178844386df39befb0d0701d92fbb9263c1 |