Skip to main content

Suomenkielinen sijataivutin - Case inflector for Finnish

Project description

Taivutin

Tämä kirjasto taivuttaa suomenkielisiä nomineja (substantiivit, adjektiivit, pronominit ja numeraalit; nimisanat, laatusanat, asemosanat ja lukusanat) sijoissa (talo -> talon). Muiden sanaluokkien taivutukseen se ei (ainakaan vielä) paneudu.

Sen peruskäyttö ei vaadi sanaluokkien tai taivutusluokkien tarkkaa tuntemista.

Asennus

Helpoin tapa asentaa taivutin on PyPin kautta:

pip install taivutin

Asentaminen onnistuu kuitenkin myös suoraan tämän koodivaraston kautta. Koodivarasto ei ole sellaisenaan käyttökelpoinen, vaan se pitää asentaa. Tämä onnistuu joko ajamallla

python3 setup.py install

tai asentamalla koodiarkiston ohesta löytyvä valmiiksi käännetty .whl-paketti komennolla

pip install <paketin nimi>.whl

Molemmat menetelmät upottavat nykysuomen sanalistan Python-tiedostoon.

Käyttö

Kirjaston pääasiallinen käyttö tapahtuu Taivutin-olion taivuta-metodin kautta. Taivutin osaa taivuttaa joko mallisanan "talo" tai sijamuodon nimen mukaan.

from taivutin import Taivutin
t = Taivutin()
print(t.taivuta("makaronilaatikko", "talojen")) # 'makaronilaatikkojen'
print(t.taivuta("makaronilaatikko", "mon gen")) # 'makaronilaatikkojen'

Näin kutsuttuna taivutin yrittää arvata, miten sanaa kuuluisi taivuttaa. Sen käytöstä voi ohjata seuraavilla avainparametreilla:

  • taivutusluokka: yksi kotuksen käyttämistä taivutustyypeistä merkkijonona. Kielitoimiston sanakirja kertoo siitä löytyvälle sanalle taivutusluokan.
  • asteluokka: yksi kotuksen käyttämistä astevaihtelutyypeistä merkkijonona. Kielitoimiston sanakirja kertoo siitä löytyvälle sanalle asteluokan.
  • sointu: joko 'ETU' tai 'TAKA' riippuen siitä, halutaanko taivutuksessa etu- vai takavokaalinen vokaalisointu.
  • nimi: True, False tai None riippuen siitä, halutaanko sanaa taivuttaa erisnimenä vai yleisnimenä. None antaa taivuttimen arvata. Tämä on merkitsevää esimerkiksi etunimen Meri tapauksessa: halutaanko sana taivuttaa nimenä Meri - Merin vai yleissanana Meri - Meren.

Esimerkiksi:

t.taivuta("meri", "gen") # meren
t.taivuta("Meri", "gen") # Merin
t.taivuta("Meri", "gen", nimi=False) # Meren

Taivuttimen tuntemat sijat

Taivutin tuntee seuraavat sijat ja käyttää niistä seuraavia lyhennyksiä:

sijamuoto taivuttimen käyttämä lyhennys esimerkki
nominatiivi nom talo
genetiivi gen talon
partitiivi part taloa
essiivi ess talona
inessiivi iness talossa
elatiivi elat talosta
illatiivi ill taloon
adessiivi ade talolla
ablatiivi abl talolta
allatiivi all talolle
translatiivi trans taloksi
instruktiivi ins taloin
abessiivi abe talotta
komitatiivi kom taloineen

Vastaavat monikot saa lisäämällä sijan eteen "mon". Esimerkiksi monikon genetiivin saa komennolla t.taivuta(sana, "mon nom").

Lisenssiasioista

Pähkinänkuoressa: tätä kirjastoa voi käyttää GNU LGPL-lisenssillä. LGPL lisenssistä lisää (englanniksi). Voit käyttää kirjastoa kaupalliseen tai ei-kaupalliseen käyttöön vapaasti julkaisematta sovelluksesi koodia. Jos muokkaat kirjaston koodia, sinun tulee julkaista nämä muokkaukset samalla lisenssillä.

Tarkemmin: Itse kirjaston koodi on LPGL-lisensioitua. Lisäksi kirjasto käyttää kolmea valmista kokonaisuutta: Nykysuomen sanalistaa, Kotuksen Etunimien taivutus -aineistoa ja LGPL-lisensioitua taivutustietokomponenttia.

Nykysuomen sanalista löytyy kansiosta taivutin/nykysuomen-sanalista/. Kotimaisten kielten keskus levittää Nykysuomen sanalistaa GNU LGPL -, EUPL v.1.1 - ja Creative Commons Nimeä 3.0 Muokkaamaton -kolmoislisensioinnilla. Kolmoislisensiointi tarkoittaa, että käyttö on hyväksyttävää, kunhan se täyttää jonkin lisenssin ehdot. Lisää tietoa löytyy tiedostosta taivutin/nykysuomen-sanalista/README.md.

Etunimien taivutus löytyy kansiosta taivutin/etunimien-taivutus/. Kotimaisten kielten keskus ilmoitti sähköpostitse asiaa tiedustellessa, että sitä voi käyttää CC-BY 4.0 -lisenssin ehtojen mukaisesti.

Taivutustietokomponentti löytyy kansiosta taivutin/yhteistaivutus.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

taivutin-0.1.3-py3-none-any.whl (546.3 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page