Skip to main content

Translit russian cyrillic and slugify phrases

Project description

Латинизация русской кириллицы

Используется следующее соответствие:

  • аa;
  • бb;
  • вv;
  • гg;
  • дd;
  • еye, если стоит после ь;
  • еqe, если стоит после ъ;
  • еe, во всех остальных случаях;
  • ёyo, если стоит в начале слов, после гласных и ь;
  • ёqo, если стоит после ъ;
  • ёo, если не йотирована и стоит после непарных твердых согласных;
  • ёho, во всех остальных случаях;
  • жj;
  • зz;
  • иi;
  • йy;
  • кk;
  • лl;
  • мm;
  • нn;
  • оo;
  • пp;
  • рr;
  • сs;
  • тt;
  • уu;
  • фf;
  • хx;
  • цc;
  • чch;
  • шw;
  • щwh;
  • ъq, не требуется;
  • ыi, если стоит после непарной твердой согласной;
  • ыqi, во всех остальных случаях;
  • ьh, если стоит после согласной и она требует смягчения, в других случаях не требуется;
  • эe, если стоит после непарной твердой согласной;
  • эqh, если стоит перед а, о, у, и, е;
  • эq, во всех остальных случаях;
  • юyu, если стоит в начале слов, после гласных и ь;
  • юqu, если стоит после ъ;
  • юu, если не йотирована и стоит после непарных твердых согласных;
  • юhu, во всех остальных случаях;
  • яya, если стоит в начале слов, после гласных и ь;
  • яqa, если стоит после ъ;
  • яa, если не йотирована и стоит после непарных твердых согласных;
  • яha, во всех остальных случаях.

Хотя соответствие алгоритмическое, но в некоторых случаях их следует применять фонематически, применяя следующие правила:

  • Буквосочетание ьо после л или н, встречающееся в заимствованных словах, которое произносится с йотирование передается как yo.
  • Если на письме в заимствованных словах предполагается смягчение согласной, которое не происходит, это можно отражать отходом при латинизации от кириллического написания. Но, в основном, рекомендуется сохранять буквенное соответствие с кириллическим написанием, так как часто одной из норм является смягченное произношение. Например, допускаются два варианта произношения: со смягченной согласной перед е и с несмягчённой в слове бактерицидный.
  • В словах веешь, смеешь, вошь и подобных, там где мягкий знак не несёт орфоэпической функции он не транслитерируется, иначе проставление h меняло бы букву, например, с ш (w) на щ (wh).
  • В словах с ъ на конце, имитирующих старую орфографию, твёрдый знак опускается.

Правила разделительных знаков следующие, что является просто следствием принятых соответствий:

  • Разделительные знаки перед йотированными гласными могут обозначаться y, q. Буква y смягчает предыдущую согласную и используется для разделительного ь. Буква q используется соответственно для разделительного ъ. Так как q используется как э, то если после э идёт гласная, она отделяется h, чтобы различать э и ъ.

Примеры:

  • авдотья - avdotya;
  • отъявленный - otqavlennqiy;
  • бактерицидный - baktericidnqiy;
  • вьюга - vyuga;
  • юг - yug;
  • эра - qra;
  • эон - qhon;
  • цирк - cirk;
  • жюри - juri;
  • щебетать - whebetath;
  • парашют - parawut;
  • аллофон - allofon;
  • съезд - sqezd;
  • метр - metr;
  • мэтр - mqtr;
  • лук - luk;
  • люк - lhuk;
  • клык - klqik;
  • клик - klik;
  • клён - klhon;
  • клон - klon;
  • раса - rasa;
  • ряса - rhasa;
  • пот - pot;
  • под - pod;
  • топ - top;
  • топь - toph;
  • йод - yod;
  • яд - yad;
  • подыграть - podqigrath;
  • вожжи - vojji;
  • жужжать - jujjath;
  • объём - obqom;
  • бельё - belyo;
  • подъезд - podqezd;
  • отребье - otrebye;
  • выемка - vqiemka;
  • гальюн - galyun;
  • веет - veet;
  • веешь - veew;
  • епархия - yeparxiya;
  • ералаш - eralaw;
  • красивые - krasivqie;
  • коммерсантъ - kommersant;
  • тэер - tqeer;
  • гэй - gqy;
  • гей - gey;
  • МЭИ - MQHI.
  • каньон - kanyon;

Примеры использования кода:

При латинизации выполняется нормализация юникода, делать её вручную не нужно. См. пример 2.

from ayum.translit import to_latin

# 1
print(to_latin('Объёмом 5 литров')) # prints 'Оbqomom 5 litrov'

# 2
print(to_latin('\u0435\u0308')) # prints 'yo'
print(to_latin('\u0451'))       # prints 'yo'

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

translit_ru-1.5.tar.gz (7.1 kB view details)

Uploaded Source

Built Distribution

translit_ru-1.5-py3-none-any.whl (5.0 kB view details)

Uploaded Python 3

File details

Details for the file translit_ru-1.5.tar.gz.

File metadata

  • Download URL: translit_ru-1.5.tar.gz
  • Upload date:
  • Size: 7.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-httpx/0.27.0

File hashes

Hashes for translit_ru-1.5.tar.gz
Algorithm Hash digest
SHA256 4f5a16e3df0d7d5b58f95d072db65536df577e9f064336234bf6c892115eb51c
MD5 edf730f526cdeb12a801ae5c1cae0a77
BLAKE2b-256 4a8433f0c458e58c470f53cfcfaf2015148557f30d77ea6a331704881fe2b0e0

See more details on using hashes here.

File details

Details for the file translit_ru-1.5-py3-none-any.whl.

File metadata

  • Download URL: translit_ru-1.5-py3-none-any.whl
  • Upload date:
  • Size: 5.0 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: python-httpx/0.27.0

File hashes

Hashes for translit_ru-1.5-py3-none-any.whl
Algorithm Hash digest
SHA256 1d786d5b81121f69a350bd27c1761237a42b4a53a16fb1e4781538de484ce672
MD5 175222af4176817dada991dfbca44f91
BLAKE2b-256 828d4726501b5e5072540adfb699471f373a840e9c68cf1d498e689ec3a350c0

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page