Skip to main content
Join the official 2019 Python Developers SurveyStart the survey!

Analítica de Texto en el Banco de la República

Project description

BanRep: Analítica de Texto

banrep es una librería en Python para analizar conjuntos de documentos textuales.


📖Cómo usar

Visite la documentación para información detallada de uso.

Guía
Introducción Motivación de la librería
Instalación Cómo instalar en su equipo
Extracción Cómo usar para extracción de documentos
Uso general Funcionalidad principal de la librería

Instalación

Se requiere tener instalado Python 3.7.

Si es la primera vez que va a instalar este lenguaje de programación, se recomienda instalarlo usando Anaconda3 o Miniconda3. Siga las instrucciones de instalación para su sistema.

Se recomienda instalar en un entorno virtual para no interferir con otras instalaciones de python.

Tanto Anaconda como Miniconda instalan un programa llamado conda, para crear y activar un entorno virtual que instale pip.

Desde la línea de comandos (Terminal en macOS, Anaconda Prompt en windows):

# crear un entorno...
~$ conda create --name entorno python=3.7 pip jupyterlab
# confirmar que quiere descargar lo solicitado...
Proceed ([y]/n)? y
# activar el entorno creado...
~$ conda activate entorno

pip

Una vez activado el entorno, instalar usando pip. Esto instalará automáticamente las librerías que banrep requiere.

~$ pip install --upgrade banrep

Modelo de Lenguaje Natural

Se requiere un modelo pre-entrenado de Spacy, que depende del idioma del texto que se quiera procesar.

Existen diversas formas de instalar, la más fácil es usando download.

~$ python -m spacy download es_core_news_md

Cuando se piensa usar el mismo modelo para diferentes proyectos, una alternativa es hacer una instalación manual: descargar el archivo del modelo, guardarlo en el directorio deseado, y crear un vínculo simbólico a dicho modelo.

Verificar instalación

Puede verificar si banrep instaló correctamente usando python o jupyter lab desde la línea de comandos:

~$ python
>>> from banrep.corpus import MiCorpus
>>>

Si no aparece ningún error quiere decir que la instalación fue exitosa.


Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Files for banrep, version 4.1.2
Filename, size File type Python version Upload date Hashes
Filename, size banrep-4.1.2-py3-none-any.whl (17.1 kB) File type Wheel Python version py3 Upload date Hashes View hashes
Filename, size banrep-4.1.2.tar.gz (14.3 kB) File type Source Python version None Upload date Hashes View hashes

Supported by

Elastic Elastic Search Pingdom Pingdom Monitoring Google Google BigQuery Sentry Sentry Error logging AWS AWS Cloud computing DataDog DataDog Monitoring Fastly Fastly CDN SignalFx SignalFx Supporter DigiCert DigiCert EV certificate StatusPage StatusPage Status page