Skip to main content

Identifique localizações brasileiras em um texto 🏘

Project description

tomba

Built with spaCy CI

Identifique endereços, bairros e outras localizações brasileiras em um texto. 🏘

Não sabe o que é o Tomba?


Essa biblioteca é experimental e está no seu estágio inicial de desenvolvimento.

Objetivo:

import tomba


tomba.get_locations(
    "Contratação de empresa de engenharia para executar obras "
    "de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)

Saída:

[
    {"type": "zipcode", "start": 92, "end": 123},
    {"type": "neighborhood", "start": 113, "end": 118}
]

Desenvolvimento

Utilizamos o poetry para empacotamento e gerenciamento das dependências.

Para instalar as dependências, execute poetry install.

Para configurar o spacy em português, execute:

poetry run python -m spacy download pt_core_news_sm

Para rodar os testes:

poetry run pytest

Para gerar um novo modelo:

poetry run python tomba/models.py

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

tomba-0.1.1a1.tar.gz (16.1 kB view hashes)

Uploaded Source

Built Distribution

tomba-0.1.1a1-py3-none-any.whl (17.0 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page