Analítica de Texto en el Banco de la República
Project description
banrep: Analítica de Texto en el Banco de la República.
banrep es una librería para analizar conjuntos de documentos textuales.
📖Cómo usar
Visite la documentación para información detallada de uso.
Guía | |
---|---|
Introducción | Motivación de la librería |
Instalación | Cómo instalar en su equipo |
Extracción | Cómo usar el módulo de extracción |
Tópicos | Cómo usar para Análisis de Tópicos |
Instalación
Se recomienda instalar en un entorno virtual para no interferir con otras instalaciones de python.
Una opción es descargar Miniconda3, para crear y activar un entorno básico con conda
que instale pip
.
# crear un entorno...
conda create --name entorno python=3.7 pip
# confirmar que quiere descargar lo solicitado...
Proceed ([y]/n)? y
# activar el entorno creado...
conda activate entorno
pip
Una vez activado el entorno, instalar usando pip
. Esto instalará automáticamente las librerías que banrep requiere.
pip install banrep
Modelo de Lenguaje Natural
Se requiere un modelo pre-entrenado de Spacy, que depende del idioma del texto que se quiera procesar.
Existen diversas formas de instalar, la más fácil es usando download
.
python -m spacy download es_core_news_md
Cuando se piensa usar el mismo modelo para diferentes proyectos, una alternativa es hacer una instalación manual: descargar el archivo del modelo, guardarlo en el directorio deseado, y crear un vínculo simbólico a dicho modelo.
TODO: sentimiento
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.