Analítica de Texto en el Banco de la República
Project description
BanRep: Analítica de Texto
banrep es una librería en Python para analizar conjuntos de documentos textuales. Ofrece las funciones usadas recurrentemente en el Banco de la República para el preprocesamiento y análisis de texto.
📖Cómo usar
Visite la documentación para información detallada de uso.
Instalación | Cómo instalar en su equipo |
Extracción | Cómo usar para extracción de texto en documentos |
Uso general | Funcionalidad principal de la librería |
Instalación
Se requiere tener instalado Python 3.7.
Si es la primera vez que va a instalar este lenguaje de programación, se recomienda instalarlo usando Anaconda3 o Miniconda3. Siga las instrucciones de instalación para su sistema.
Se recomienda instalar en un entorno virtual para no interferir con otras instalaciones de python.
Tanto Anaconda como Miniconda instalan un programa llamado conda
, para crear y activar un entorno virtual que instale pip
.
Desde la línea de comandos (Terminal en macOS, Anaconda Prompt en windows):
# crear un entorno...
~$ conda create --name entorno python=3.7 pip jupyterlab
# confirmar que quiere descargar lo solicitado...
Proceed ([y]/n)? y
# activar el entorno creado...
~$ conda activate entorno
pip
Una vez activado el entorno, instalar usando pip
. Esto instalará automáticamente las librerías que banrep requiere.
~$ pip install --upgrade banrep
Modelo de Lenguaje Natural
Se requiere un modelo pre-entrenado de Spacy, que depende del idioma del texto que se quiera procesar.
Existen diversas formas de instalar, la más fácil es usando download
.
~$ python -m spacy download es_core_news_md
Cuando se piensa usar el mismo modelo para diferentes proyectos, una alternativa es hacer una instalación manual: descargar el archivo del modelo, guardarlo en el directorio deseado, y crear un vínculo simbólico a dicho modelo.
Verificar instalación
Puede verificar si banrep instaló correctamente usando python
o jupyter lab
desde la línea de comandos:
~$ python
>>> from banrep.linguistica import Documentos
>>>
Si no aparece ningún error quiere decir que la instalación fue exitosa.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file banrep-6.0.2.tar.gz
.
File metadata
- Download URL: banrep-6.0.2.tar.gz
- Upload date:
- Size: 14.4 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.3.0 pkginfo/1.7.0 requests/2.25.1 setuptools/52.0.0.post20210125 requests-toolbelt/0.9.1 tqdm/4.56.0 CPython/3.8.5
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 42747f2cc7def0898422d8311ddfba611fb9cd9a892277c67fc05796a1dcf3a0 |
|
MD5 | ed7a449b4ac80a5bb5a2e52b89fee94c |
|
BLAKE2b-256 | 4e2c14fbb67b41feb28721699b772fddea5b73617fdc1cd42c189c251231b340 |
File details
Details for the file banrep-6.0.2-py3-none-any.whl
.
File metadata
- Download URL: banrep-6.0.2-py3-none-any.whl
- Upload date:
- Size: 16.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/3.3.0 pkginfo/1.7.0 requests/2.25.1 setuptools/52.0.0.post20210125 requests-toolbelt/0.9.1 tqdm/4.56.0 CPython/3.8.5
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | cc4a6bff5fdf9013f22c79466e8da29eceae1f58bcd8fd2cb6f7731d01cf79da |
|
MD5 | a4dc996b88c18b5d8d56a9d8f161da01 |
|
BLAKE2b-256 | 1f0e093265bb3dc259ba06e61e1d152254731c4a36067cc18a94ad2d711acc2c |