Skip to main content

Suomenkielinen sijataivutin - Case inflector for Finnish

Project description

Taivutin

Tämä kirjasto taivuttaa suomenkielisiä nomineja (substantiivit, adjektiivit, pronominit ja numeraalit; nimisanat, laatusanat, asemosanat ja lukusanat) sijoissa (talo -> talon). Muiden sanaluokkien taivutukseen se ei (ainakaan vielä) paneudu.

Sen peruskäyttö ei vaadi sanaluokkien tai taivutusluokkien tarkkaa tuntemista.

Asennus

Helpoin tapa asentaa taivutin on PyPin kautta:

pip install taivutin

Asentaminen onnistuu kuitenkin myös suoraan tämän koodivaraston kautta. Koodivarasto ei ole sellaisenaan käyttökelpoinen, vaan se pitää asentaa. Tämä onnistuu joko ajamallla

python3 setup.py install

tai asentamalla koodiarkiston ohesta löytyvä valmiiksi käännetty .whl-paketti komennolla

pip install <paketin nimi>.whl

Molemmat menetelmät upottavat nykysuomen sanalistan Python-tiedostoon.

Käyttö

Kirjaston pääasiallinen käyttö tapahtuu Taivutin-olion taivuta-metodin kautta. Taivutin osaa taivuttaa joko mallisanan "talo" tai sijamuodon nimen mukaan.

from taivutin import Taivutin
t = Taivutin()
print(t.taivuta("makaronilaatikko", "talojen")) # 'makaronilaatikkojen'
print(t.taivuta("makaronilaatikko", "mon gen")) # 'makaronilaatikkojen'

Näin kutsuttuna taivutin yrittää arvata, miten sanaa kuuluisi taivuttaa. Sen käytöstä voi ohjata seuraavilla avainparametreilla:

  • taivutusluokka: yksi kotuksen käyttämistä taivutustyypeistä merkkijonona. Kielitoimiston sanakirja kertoo siitä löytyvälle sanalle taivutusluokan.
  • asteluokka: yksi kotuksen käyttämistä astevaihtelutyypeistä merkkijonona. Kielitoimiston sanakirja kertoo siitä löytyvälle sanalle asteluokan.
  • sointu: joko 'ETU' tai 'TAKA' riippuen siitä, halutaanko taivutuksessa etu- vai takavokaalinen vokaalisointu.
  • nimi: True, False tai None riippuen siitä, halutaanko sanaa taivuttaa erisnimenä vai yleisnimenä. None antaa taivuttimen arvata. Tämä on merkitsevää esimerkiksi etunimen Meri tapauksessa: halutaanko sana taivuttaa nimenä Meri - Merin vai yleissanana Meri - Meren.

Esimerkiksi:

t.taivuta("meri", "gen") # meren
t.taivuta("Meri", "gen") # Merin
t.taivuta("Meri", "gen", nimi=False) # Meren

Taivuttimen tuntemat sijat

Taivutin tuntee seuraavat sijat ja käyttää niistä seuraavia lyhennyksiä:

sijamuoto taivuttimen käyttämä lyhennys esimerkki
nominatiivi nom talo
genetiivi gen talon
partitiivi part taloa
essiivi ess talona
inessiivi iness talossa
elatiivi elat talosta
illatiivi ill taloon
adessiivi ade talolla
ablatiivi abl talolta
allatiivi all talolle
translatiivi trans taloksi
instruktiivi ins taloin
abessiivi abe talotta
komitatiivi kom taloineen

Vastaavat monikot saa lisäämällä sijan eteen "mon". Esimerkiksi monikon genetiivin saa komennolla t.taivuta(sana, "mon nom").

Lisenssiasioista

Pähkinänkuoressa: tätä kirjastoa voi käyttää GNU LGPL-lisenssillä. LGPL lisenssistä lisää (englanniksi). Voit käyttää kirjastoa kaupalliseen tai ei-kaupalliseen käyttöön vapaasti julkaisematta sovelluksesi koodia. Jos muokkaat kirjaston koodia, sinun tulee julkaista nämä muokkaukset samalla lisenssillä.

Tarkemmin: Itse kirjaston koodi on LPGL-lisensioitua. Lisäksi kirjasto käyttää kolmea valmista kokonaisuutta: Nykysuomen sanalistaa, Kotuksen Etunimien taivutus -aineistoa ja LGPL-lisensioitua taivutustietokomponenttia.

Nykysuomen sanalista löytyy kansiosta taivutin/nykysuomen-sanalista/. Kotimaisten kielten keskus levittää Nykysuomen sanalistaa GNU LGPL -, EUPL v.1.1 - ja Creative Commons Nimeä 3.0 Muokkaamaton -kolmoislisensioinnilla. Kolmoislisensiointi tarkoittaa, että käyttö on hyväksyttävää, kunhan se täyttää jonkin lisenssin ehdot. Lisää tietoa löytyy tiedostosta taivutin/nykysuomen-sanalista/README.md.

Etunimien taivutus löytyy kansiosta taivutin/etunimien-taivutus/. Kotimaisten kielten keskus ilmoitti sähköpostitse asiaa tiedustellessa, että sitä voi käyttää CC-BY 4.0 -lisenssin ehtojen mukaisesti.

Taivutustietokomponentti löytyy kansiosta taivutin/yhteistaivutus.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

taivutin-0.1.3-py3-none-any.whl (546.3 kB view details)

Uploaded Python 3

File details

Details for the file taivutin-0.1.3-py3-none-any.whl.

File metadata

  • Download URL: taivutin-0.1.3-py3-none-any.whl
  • Upload date:
  • Size: 546.3 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.11.3

File hashes

Hashes for taivutin-0.1.3-py3-none-any.whl
Algorithm Hash digest
SHA256 502565456e3c09d3c01edbf48c3954814918a8c51c6c3a2390c0baeafcb73919
MD5 9bea3dfc46158b5d5472b2d05231c2ee
BLAKE2b-256 cb24b002d1fcff263d881b10ee844de66e20d169bbdd4033bcfd1091519dc97c

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page