Skip to main content

A small example package for scrapping argentinian newsletters

Project description

NSCRAPY: Scraper de principales portales de noticias argentinos.

Libreria para bajar notas de clarin , pagina12, cronica y cronista.

Instalacion:

pip install nscrapy

Clases para scrapear una url de una nota.

clarin()
p12()
cronica()
cronista()

Ejemplo de uso, scrapear el portal de clarin de hoy (para pagina 12 cambiar clarin por p12) con comentarios:

from nscrapy import nscrap as ns
from nscrapy.clarin import get

notasclarin=ns.clarin()

#scrapeo el portal
notasclarin.hoy()

#las urls a las notas de hoy estan en .urls

notashoy=get(notasclarin.urls)

notashoy es una lista de objetos nota:

nota.titulo : titulo de la nota
nota.comm : comentarios
nota.com : ' '.join(comentarios)
nota.volanta : volanta de la nota
nota.bajada : resumen o subtitulo
nota.cuerpo : cuerpo nota
nota.bolds : textos en negrita
nota.bold : ' '.join(bolds)

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

nscrapy-0.0.3.tar.gz (7.3 kB view hashes)

Uploaded Source

Built Distribution

nscrapy-0.0.3-py3-none-any.whl (12.8 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page