Identifique localizações brasileiras em um texto 🏘
Project description
tomba
Identifique endereços, bairros e outras localizações brasileiras em um texto. 🏘
Não sabe o que é o Tomba?
Essa biblioteca é experimental e está no seu estágio inicial de desenvolvimento.
Objetivo:
import tomba
tomba.get_locations(
"Contratação de empresa de engenharia para executar obras "
"de pavimentação localizados no CEP 44100-000, no bairro Tomba."
)
Saída:
[
{"type": "zipcode", "start": 92, "end": 123},
{"type": "neighborhood", "start": 113, "end": 118}
]
Desenvolvimento
Utilizamos o poetry para empacotamento e gerenciamento das dependências.
Para instalar as dependências, execute poetry install
.
Para configurar o spacy em português, execute:
poetry run python -m spacy download pt_core_news_sm
Para rodar os testes:
poetry run pytest
Para gerar um novo modelo:
poetry run python tomba/models.py
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
tomba-0.1.1a1.tar.gz
(16.1 kB
view hashes)
Built Distribution
tomba-0.1.1a1-py3-none-any.whl
(17.0 kB
view hashes)