Skip to main content

Analítica de Texto en el Banco de la República

Project description

BanRep: Analítica de Texto

banrep es una librería en Python para analizar conjuntos de documentos textuales. Ofrece las funciones usadas recurrentemente en el Banco de la República para el preprocesamiento y análisis de texto.


📖Cómo usar

Visite la documentación para información detallada de uso.

Instalación Cómo instalar en su equipo
Extracción Cómo usar para extracción de texto en documentos
Uso general Funcionalidad principal de la librería

Instalación

Se requiere tener instalado Python 3.7.

Si es la primera vez que va a instalar este lenguaje de programación, se recomienda instalarlo usando Anaconda3 o Miniconda3. Siga las instrucciones de instalación para su sistema.

Se recomienda instalar en un entorno virtual para no interferir con otras instalaciones de python.

Tanto Anaconda como Miniconda instalan un programa llamado conda, para crear y activar un entorno virtual que instale pip.

Desde la línea de comandos (Terminal en macOS, Anaconda Prompt en windows):

# crear un entorno...
~$ conda create --name entorno python=3.7 pip jupyterlab
# confirmar que quiere descargar lo solicitado...
Proceed ([y]/n)? y
# activar el entorno creado...
~$ conda activate entorno

pip

Una vez activado el entorno, instalar usando pip. Esto instalará automáticamente las librerías que banrep requiere.

~$ pip install --upgrade banrep

Modelo de Lenguaje Natural

Se requiere un modelo pre-entrenado de Spacy, que depende del idioma del texto que se quiera procesar.

Existen diversas formas de instalar, la más fácil es usando download.

~$ python -m spacy download es_core_news_md

Cuando se piensa usar el mismo modelo para diferentes proyectos, una alternativa es hacer una instalación manual: descargar el archivo del modelo, guardarlo en el directorio deseado, y crear un vínculo simbólico a dicho modelo.

Verificar instalación

Puede verificar si banrep instaló correctamente usando python o jupyter lab desde la línea de comandos:

~$ python
>>> from banrep.linguistica import Documentos
>>>

Si no aparece ningún error quiere decir que la instalación fue exitosa.


Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

banrep-6.0.2.tar.gz (14.4 kB view details)

Uploaded Source

Built Distribution

banrep-6.0.2-py3-none-any.whl (16.7 kB view details)

Uploaded Python 3

File details

Details for the file banrep-6.0.2.tar.gz.

File metadata

  • Download URL: banrep-6.0.2.tar.gz
  • Upload date:
  • Size: 14.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.3.0 pkginfo/1.7.0 requests/2.25.1 setuptools/52.0.0.post20210125 requests-toolbelt/0.9.1 tqdm/4.56.0 CPython/3.8.5

File hashes

Hashes for banrep-6.0.2.tar.gz
Algorithm Hash digest
SHA256 42747f2cc7def0898422d8311ddfba611fb9cd9a892277c67fc05796a1dcf3a0
MD5 ed7a449b4ac80a5bb5a2e52b89fee94c
BLAKE2b-256 4e2c14fbb67b41feb28721699b772fddea5b73617fdc1cd42c189c251231b340

See more details on using hashes here.

File details

Details for the file banrep-6.0.2-py3-none-any.whl.

File metadata

  • Download URL: banrep-6.0.2-py3-none-any.whl
  • Upload date:
  • Size: 16.7 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.3.0 pkginfo/1.7.0 requests/2.25.1 setuptools/52.0.0.post20210125 requests-toolbelt/0.9.1 tqdm/4.56.0 CPython/3.8.5

File hashes

Hashes for banrep-6.0.2-py3-none-any.whl
Algorithm Hash digest
SHA256 cc4a6bff5fdf9013f22c79466e8da29eceae1f58bcd8fd2cb6f7731d01cf79da
MD5 a4dc996b88c18b5d8d56a9d8f161da01
BLAKE2b-256 1f0e093265bb3dc259ba06e61e1d152254731c4a36067cc18a94ad2d711acc2c

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page