A script to download risitas
Project description
Risiparse
Un script qui permet de télécharger les risitas en html et de les convertir en pdf.
Sites supportés : Jeuxvideo.com, Jvarchive.com
2sucres ne marche pas car javascript, faut sortir selenium dans ce cas-là
Installation
python3 -m pip install risiparse
Comment avoir un risitas sans message manquant ni message hors-sujet ?
Voir https://github.com/vichelisdelapaz/risicompare
Utilisation
kenny $ risiparse -h
usage: risiparse.py [-h] [--all-messages] [--no-pdf] [--debug] [--no-download] [-l LINKS [LINKS ...]] [-i IDENTIFIERS [IDENTIFIERS ...]] [--authors AUTHORS [AUTHORS ...]]
[--no-resize-images] [--download-images] [--no-match-author] [-o OUTPUT_DIR]
optional arguments:
-h, --help show this help message and exit
--all-messages Download all the messages from the author.Default : False
--no-pdf Default : False
--debug Verbose output, Default : False
--no-download Default : False
-l LINKS [LINKS ...], --links LINKS [LINKS ...]
The links file, Default : current dir/risitas-links
-i IDENTIFIERS [IDENTIFIERS ...], --identifiers IDENTIFIERS [IDENTIFIERS ...]
Give a list of words that are going to be matched by the script,example: a message that has the keyword 'hors-sujet',by adding 'hors-sujet' with this option,the
script will match the message that has this keyword. Default : chapitre
--authors AUTHORS [AUTHORS ...]
List of authors to be matched, by default the author of the first post author is considered as the author throughout the whole risitas Default : Empty
--no-resize-images When the script 'thinks' that the post contains imagesand that they are chapters posted in screenshot,it will try to display them to their full width Default : False
--download-images Whether to download images locallyIf set, this will change all img[src] link to point to the local imagesDefault : False
--no-match-author If the name of the author is pogo and the message contains pogo111, it will be downloaded automatically, this disables this feature Default : False
-o OUTPUT_DIR, --output-dir OUTPUT_DIR
Output dir, Default is current dir
Télécharger les risitas à partir de répertoire courant/risitas-links, dans rep courant/risitas-html puis convertir dans rep courant/risitas-pdf, les images susceptibles d'être des chapitres seront agrandis.
Le script essaiera de télécharger les posts de l'auteur ou d'un nom ressemblant à l'auteur, ex : pogo, pogo111, pogo112, les messages dont le nom de l'auteur contient pogo seront matchés et téléchargés. Utile si l'auteur s'est fait ban.
risiparse
Télécharger tous les messages de l'auteur
risiparse --all-messages
Ne pas télécharger les risitas, créer des pdfs depuis un répertoire contenant risitas-html
risiparse --no-download -o <foo>
Télécharger uniquement les risitas en html, à partir d'un fichier contenant des liens vers les risitas
risiparse --no-pdf -l <links-file>
Télécharger les risitas sans agrandir les images qui pourraient être des chapitres.
risiparse --no-resize-images
Télécharger les messages contenant les mots clés suivants, peut aussi inclure un regexp. Voir les regexp de python
risiparse -i "chapitre" "partie" "chapitre \d"
Télécharger les images localement et les utiliser dans l'html, utile dans le future si j'ai le temps de développer un GUI
risiparse --download-images
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for risiparse-1.0.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 8d20b084a474618723bd66a204d66899d16d43591ec1bcb389a49d872f55be46 |
|
MD5 | 3b06efb6f5d8b9c105f2279f75801c89 |
|
BLAKE2b-256 | 6b70c6d6e65b8672b203a6fba6705d5a24697dc25335db382fb6944d0939c214 |