A url scraper
Project description
Podcast-Scraper
Ce script permet de récupérer les url de téléchargements de podcasts. Vous pouvez dès lors les recupérer avec votre outil favoris; par exemple wget.
Ceci est motivé par le fait que les podcast de france culture sont hebergés par apple et que tout comme les flux RSS ne permettent de telécharger uniquement quelques épisodes.
Le monde diplomatique fournit aux adhérents des podcasts de certains ses articles lus. Tout comme le précédent, le flux rss ne permet pas de récuperer l'historique. Podcast-scraper permet d'y remédier, à condition bien sûr d'avoir un abonement.
Sources Gérées
- france culture
- le monde diplomatique
- c'est tout pour l'instant
Dependencies
This needs docker to run.
Install
pip install podcast-scraper
Usage
podcast-scraper --help
Usage: podcast-scraper [OPTIONS] COMMAND [ARGS]...
Options:
--help Show this message and exit.
Commands:
csv Download or tag the podcast defined in a csv
france-culture Get podcast url for France Culture
monde-diplo Get podcast url for Monde Diplo
Exemples
podcast-scraper france-culture --url https://www.franceculture.fr/emissions/carbone-14-le-magazine-de-larcheologie > export.csv
podcast-scraper csv --csv-path export.csv --podcast-path /tmp/ --download --tag
USER=email PASSWORD=your-password podcast-scraper monde-diplo
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
File details
Details for the file podcast-scraper-0.4.0.tar.gz
.
File metadata
- Download URL: podcast-scraper-0.4.0.tar.gz
- Upload date:
- Size: 4.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.0 CPython/3.9.6
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | e07ca5fa78a420f0966adcdf21dd0378ef95872954727f1107717ea432c331d4 |
|
MD5 | 40a6653983cedca642e228afd8828fd9 |
|
BLAKE2b-256 | cda9b36d4bae29beb653497bf23cd18116fc72ee967c90f6d1e9157c62a3423e |