A small example package for scrapping argentinian newsletters
Project description
NSCRAPY: Scraper de principales portales de noticias argentinos.
Libreria para bajar notas de clarin , pagina12, cronica y cronista.
Instalacion:
pip install nscrapy
Clases para scrapear una url de una nota.
clarin()
p12()
cronica()
cronista()
Ejemplo de uso, scrapear el portal de clarin de hoy (para pagina 12 cambiar clarin por p12) con comentarios:
from nscrapy import nscrap as ns
from nscrapy.clarin import get
notasclarin=ns.clarin()
#scrapeo el portal
notasclarin.hoy()
#las urls a las notas de hoy estan en .urls
notashoy=get(notasclarin.urls)
notashoy es una lista de objetos nota:
nota.titulo : titulo de la nota
nota.comm : comentarios
nota.com : ' '.join(comentarios)
nota.volanta : volanta de la nota
nota.bajada : resumen o subtitulo
nota.cuerpo : cuerpo nota
nota.bolds : textos en negrita
nota.bold : ' '.join(bolds)
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
nscrapy-0.0.3.tar.gz
(7.3 kB
view hashes)
Built Distribution
nscrapy-0.0.3-py3-none-any.whl
(12.8 kB
view hashes)