A script to download risitas
Project description
Risiparse
Un script qui permet de télécharger les risitas en html et de les convertir en pdf.
Sites supportés : Jeuxvideo.com, Jvarchive.com
2sucres ne marche pas car javascript, faut sortir selenium dans ce cas-là
Installation
python3 -m pip install risiparse
Comment avoir un risitas sans message manquant ni message hors-sujet ?
Voir https://github.com/vichelisdelapaz/risicompare
Utilisation
kenny $ risiparse -h
usage: risiparse [-h] [--all-messages] [--no-pdf] [--debug] [--no-download] [-l LINKS] [-i IDENTIFIERS [IDENTIFIERS ...]] [--authors AUTHORS [AUTHORS ...]] [--no-resize-images]
[--download-images] [-o OUTPUT_DIR]
optional arguments:
-h, --help show this help message and exit
--all-messages Download all the messages from the author.Default : False
--no-pdf Default : False
--debug Verbose output, Default : False
--no-download Default : False
-l LINKS, --links LINKS
The links file, Default : current dir/risitas-links
-i IDENTIFIERS [IDENTIFIERS ...], --identifiers IDENTIFIERS [IDENTIFIERS ...]
Give a list of words that are going to be matched by the script,example: a message that has the keyword 'hors-sujet',by adding 'hors-sujet' with this option,the
script will match the message that has this keyword. Default : chapitre
--authors AUTHORS [AUTHORS ...]
List of authors to be matched, by default the author of the first post author is considered as the author throughout the whole risitas, Default : Empty
--no-resize-images When the script 'thinks' that the post contains imagesand that they are chapters posted in screenshot,it will try to display them to their full width Default : False
--download-images Whether to download images locallyIf set, this will change all img[src] link to point to the local imagesDefault : False
-o OUTPUT_DIR, --output-dir OUTPUT_DIR
Output dir, Default is current dir
Télécharger les risitas à partir de répertoire courant/risitas-links, dans rep courant/risitas-html puis convertir dans rep courant/risitas-pdf, les images susceptibles d'être des chapitres seront agrandis.
Le script essaiera de télécharger les posts de l'auteur ou d'un nom ressemblant à l'auteur, ex : pogo, pogo111, pogo112, les messages dont le nom de l'auteur contient pogo seront matchés et téléchargés. Utile si l'auteur s'est fait ban.
risiparse
Télécharger tous les messages de l'auteur
risiparse --all-messages
Ne pas télécharger les risitas, créer des pdfs depuis un répertoire contenant risitas-html
risiparse --no-download -o <foo>
Télécharger uniquement les risitas en html, à partir d'un fichier contenant des liens vers les risitas
risiparse --no-pdf -l <links-file>
Télécharger les risitas sans agrandir les images qui pourraient être des chapitres.
risiparse --no-resize-images
Télécharger les messages contenant les mots clés suivants, peut aussi inclure un regexp. Voir les regexp de python
risiparse -i "chapitre" "partie" "chapitre \d"
Télécharger les images localement et les utiliser dans l'html, utile dans le future si j'ai le temps de développer un GUI
risiparse --download-images
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for risiparse-0.0.1-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 33707349e4e55ff9f25ad18804249c16bdf2665f31349195a7feb733229b9037 |
|
MD5 | d05b73d50bfbdfb9410fd0720fd9f757 |
|
BLAKE2b-256 | 289105221dd330ca20a507f51937f934664f360dadcf2abbf07ad9a7c7b305b6 |