Skip to main content

search for addresses in the text

Project description

address_templeter

Библиотека предназначена для поиска, смысловому разделению и чистки адресных строк.

Пример использования
  • Метод parse возвращает массив с метками для каждого токена:
<<< address_templeter.parse("г. Судак Солнечная 9 а")
>>> [('г', 'PlacePretext'), ('Судак', 'Place'), ('Солнечная', 'Street'), ('9', 'HouseNumber'), ('а', 'HouseNumber')]
  • Метод clean возвращает строку без знаков препинания и лишних пробелов. Параметр prefix указывает возвращать ли значения не являющиеся наименованиями. Параметры: name_building указывает возвращать ли наименование объекта (если оно имеется):

  • address:str - строка с адрессом

  • house:bool - возвращать номер дома (например 21-Б), наименования объекта, и его префикс (магазин, парк, прочее)По умолчанию False;

  • index:bool - возвращать почтовый индекс. По умолчанию False.

  • place_pretext:bool возвразать тип места (город, село). По умолчанию False;

  • region_pretext:bool возвразать тип региона (область, регион). Также, расшифровываться аббревиатуры и сокращения. По умолчанию False;

  • address_pretext:bool возвразать тип улицы (проспект, бульвар). Также, расшифровываться аббревиатуры и сокращения. По умолчанию False;

<<< address_templeter.clean("Ясниноватский район, возле белого магазина, Донецкая область, улица Садовая, 26а", prefix=False, house=True)
>>> Ясниноватский Садовая 26а
Установка
pip install address-templeter
Формирования дата сета и обучение

По умолчанию, библиотека уже содержит модель для использования необходимых методов.

Для формирования своей уникальной модели, необходимо:

  • Сформировать xml файл для обучения можно выполнив checked_to_xml.ipynb (необходим jupyter notebook).
  • Выполнить следующие команды для создания файла модели:
cd  /path/to/Address_Templeter
pip install parserator
parserator train training/dataset.xml address_templeter
#  По окончание обучения получится файл можели learned_settings.crfsuite
  • Переустановить библиотеку address_templeter

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

address_templeter-1.41-py3-none-any.whl (27.2 kB view details)

Uploaded Python 3

File details

Details for the file address_templeter-1.41-py3-none-any.whl.

File metadata

  • Download URL: address_templeter-1.41-py3-none-any.whl
  • Upload date:
  • Size: 27.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/47.1.1 requests-toolbelt/0.9.1 tqdm/4.46.1 CPython/3.8.2

File hashes

Hashes for address_templeter-1.41-py3-none-any.whl
Algorithm Hash digest
SHA256 ec787a20e3887d9b35b07b0b78d2f831761dc9d79de1fbe2c46b60c9b0b5c110
MD5 fa90635b7ad9e2759833cd22f2478842
BLAKE2b-256 11a6224d526a2af8b489cd1f2c729620b66ea4eb3a3c43c20c98014218bc2fdf

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page