Skip to main content

Morphological analyzer (POS tagger + inflection engine) for Russian and English (+perhaps German) languages.

Project description

WARNING: pymorphy is deprecated if favor of https://github.com/kmike/pymorphy2

Morphological analyzer (POS tagger / inflection engine) for Russian and English languages using converted AOT (http://www.aot.ru/download.php) dictionaries.

Documentation (mostly in Russian): http://pymorphy.rtfd.org/

Author: Mikhail Korobov <kmike84@gmail.com>, License: MIT.


ВНИМАНИЕ: в pymorphy больше не будут исправляться ошибки или добавляться новые возможности - разработка остановлена. Используйте https://github.com/kmike/pymorphy2.

Морфологический анализатор для русского и английского (возможно, еще немецкого) языка.

Документация: http://pymorphy.rtfd.org/

Обсуждение: http://groups.google.com/group/pymorphy

Репозиторий: https://bitbucket.org/kmike/pymorphy/

История изменений

0.5.6 (2011-09-11)

  • в релиз 0.5.5 по ошибке не вошли файлы разборщика фамилий и вошли некоторые ненужные файлы - это исправлено.
  • улучшения в разборе фамилий;
  • решена проблема со склонением слова “КИЕВ” и других, которые склонятор раньше пытался склонять как существительные в косвенных падежах;

0.5.5 (2011-08-13)

  • улучшена и упрощена документация;
  • pymorphy-speedups пересобран с Cython 0.15 (для cdb и sqlite с cache=True это почему-то дает ускорение до 1.5..2x);
  • исправлена ошибка в склонении слов (иногда при склонении бралась неосновная форма слова);
  • исправлена совместная работа pymorphy-speedups и шаблонных фильтров django (фильтры не работали для lazy-строк, например, SafeString или ugettext_lazy-строк);
  • очень экспериментальная поддержка склонения фамилий (отдельно от основного анализатора; API будет изменен в последующих релизах).

0.5.4 (2011-07-15)

  • Убрано предупреждение при одновременном обновлении pymorphy и pymorphy-speedups (например, через файл с зависимостями pip);
  • файлы setup.py и скрипт запуска тестов теперь всегда используют “родной” pymorphy, а не установленный в систему.

0.5.3 (2011-07-15)

  • Исправлена ошибка с определением версии pymorphy-speedups;
  • вместо pymorphy.split теперь pymorphy.contrib.tokenizers с функциями extract_tokens и extract_words;
  • поправлена установка из hg-репозитория для windows.

0.5.2 (2011-04-09)

  • Исправлены ошибки в sqlite-словарях (внимание: скачайте новые словари для обновления);
  • представление данных в json теперь компактнее, поэтому при использовании новых словарей должна повыситься скорость работы (особенно при отключенном кешировании);
  • ускорение отключается с предупрежденем, если версия pymorphy-speedups не соответствует версии pymorphy;
  • исправлены опечатки в документации;
  • в тесты включен скрипт разбора “Золотого стандарта” с ДИАЛОГ-2010;
  • в скрипт для конвертации словарей добавлена перекрестная проверка их корректности.

0.5.1 (2011-02-10)

  • Sqlite-бэкенд теперь должен работать в многопоточном окружении;
  • исправлена ошибка с последовательным применением шаблонных фильтров для django.

0.5.0 (2010-11-15)

  • исправления и дополнения в документации
  • для тестов используется unittest2
  • поддержка опционального модуля pymorphy-speedups с расширением на Cython (туда также перенесен метод setup_psyco). При использовании pickle-словарей скорость при установке расширения должна увеличиться в 2+ раза. Для других (более медленных) вариантов словарей относительный прирост будет не таким значительным. Осторожно: при установленном модуле все строки должны передаваться как юникодные (в.т.ч. латинские и пустые).
  • убрана зависимость от simplejson (но его лучше все равно поставить, т.к. с simplejson работа со всеми словарями, кроме pickle, ускоряется в несколько раз)
  • правильное склонение слов во втором предложном, родительном или винительном падежах
  • метод pluralize_inflected_ru теперь поддерживает не только существительные
  • более правильное разбиение на слова в фильтрах
  • Работа со словами, записанными через дефис.
  • Поддержка парсинга распознанных текстов (характерные замены букв). Довольно бесполезная штука.
  • Убран метод get_normal_forms, т.к. метод get_gram_info и так возвращает для каждого слова нормальную форму.

0.4.3 (2010-02-06)

Устранены небольшие ошибки.

0.4.0 (2010-01-07)

Упрощена установка: добавилась поддержка кроссплатформенных словарей в sqlite

0.3.5 (2009-12-15)

Интеграция с django: добавлены шаблонные фильтры для склонения и согласования слов. Переделаны правила получения нормальных форм слова (переделка ошибочная).

0.1.0 (2009-12-07)

pymorphy почти полностью переписан, документирован, оформлен как python-пакет и загружен на pypi.python.org

0.0.1 (2009-01-18)

первая версия, которая после написания была заброшена на год

Release history Release notifications

This version
History Node

0.5.6

History Node

0.5.5

History Node

0.5.4

History Node

0.5.3

History Node

0.5.2

History Node

0.5.1

History Node

0.5.0

History Node

0.4.3

History Node

0.4.2

History Node

0.4.1

History Node

0.4.0

History Node

0.3.5

History Node

0.3

History Node

0.2.1

History Node

0.2

History Node

0.1.1

History Node

0.1.1c

History Node

0.1.1b

History Node

0.1

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Filename, size & hash SHA256 hash help File type Python version Upload date
pymorphy-0.5.6.tar.gz (72.0 kB) Copy SHA256 hash SHA256 Source None Sep 11, 2011

Supported by

Elastic Elastic Search Pingdom Pingdom Monitoring Google Google BigQuery Sentry Sentry Error logging CloudAMQP CloudAMQP RabbitMQ AWS AWS Cloud computing Fastly Fastly CDN DigiCert DigiCert EV certificate StatusPage StatusPage Status page