Skip to main content

Identifique localizações brasileiras em um texto 🏘

Project description

tomba

Built with spaCy CI

Identifique endereços, bairros e outras localizações brasileiras em um texto. 🏘

Não sabe o que é o Tomba?


Essa biblioteca é experimental e está no seu estágio inicial de desenvolvimento.

Objetivo:

import tomba


tomba.get_locations(
    "Contratação de empresa de engenharia para executar obras "
    "de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)

Saída:

[
    {"type": "zipcode", "start": 92, "end": 123},
    {"type": "neighborhood", "start": 113, "end": 118}
]

Desenvolvimento

Utilizamos o poetry para empacotamento e gerenciamento das dependências.

Para instalar as dependências, execute poetry install.

Para configurar o spacy em português, execute:

poetry run python -m spacy download pt_core_news_sm

Para rodar os testes:

poetry run pytest

Para gerar um novo modelo:

poetry run python tomba/models.py

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Files for tomba, version 0.1.1a1
Filename, size File type Python version Upload date Hashes
Filename, size tomba-0.1.1a1.tar.gz (16.1 kB) File type Source Python version None Upload date Hashes View
Filename, size tomba-0.1.1a1-py3-none-any.whl (17.0 kB) File type Wheel Python version py3 Upload date Hashes View

Supported by

AWS AWS Cloud computing Datadog Datadog Monitoring Facebook / Instagram Facebook / Instagram PSF Sponsor Fastly Fastly CDN Google Google Object Storage and Download Analytics Huawei Huawei PSF Sponsor Microsoft Microsoft PSF Sponsor NVIDIA NVIDIA PSF Sponsor Pingdom Pingdom Monitoring Salesforce Salesforce PSF Sponsor Sentry Sentry Error logging StatusPage StatusPage Status page