Skip to main content

Extract DECP files from few websites easily

Project description

Récupération des DECP de plateformes non publiées sur data.gouv.fr

Ce projet vise à développer un script permettant de télécharger facilement les données essentielles de la commande publique publiées sur des plateformes de marché qui ne publient pas sur data.gouv.fr.

Liste des plateformes identifiées :

Utiliser les script fonctions de download.py

###Utiliser les script Pour initialiser tous les sites connus

download.ROOT_XML_DIR = 'xml'
download.STAT_FILE_PATH = 'disponibilite-donnees.csv'
download.collects_multiple_platforms_data(download.get_all_platforms(),
                                          download.get_all_years_available(),
                                          force=False, thread_number=3,
                                          delay=0.2, should_initialize=True)

Le script va d'abord rechercher la liste des acheteurs connus sur chaque site, puis télécharger les DECP au format xml de ces sites et enfin aggréger le tout dans un fichier multiple_platforms.xml Un fichier de statistiques est produit: disponibilite-donnees.csv

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

decp_scraper-1.0.5.tar.gz (6.1 kB view hashes)

Uploaded Source

Built Distribution

decp_scraper-1.0.5-py3-none-any.whl (8.6 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page