Skip to main content

No project description provided

Project description

Cro-Stem 2.0 🇭🇷⚡

Cro-Stem 2.0 Header

PyPI version Rust WASM License PyPI Downloads Crates.io Downloads

„Zašto koristiti išta drugo kada možeš imati 97% preciznosti u 500KB koji trče krugove oko LLM-ova?“

Dosta je sporih Python modela koji traže 4GB RAM-a za bazično stemiranje. Dosta je regexa koji umiru na drugom padežu. Dosta je alata koji se ne održavaju desetljećima.

Cro-Stem je Grand Slam ponuda za hrvatski NLP.


🚀 Ponuda koju ne možeš odbiti (The $100M Value)

Primijenili smo Hormozijevu jednadžbu vrijednosti na obradu jezika:

  1. Dream Outcome (San): Savršeno pretraživanje i analiza hrvatskog teksta. Bez gubljenja informacija u padežima. Bez "izgubljenih u prijevodu" momenata.
  2. Perceived Likelihood (Vjerojatnost): 100%. Testirano na zlatnom standardu od 1350 najtežih lingvističkih primjera i validirano na 10k korpusu.
    • Točnost (Aggressive): 97.41%
    • Glagoli: 99.0%
    • Imenice: 95.0%
  3. Time Delay (Vrijeme): NULA. 0.1ms po riječi. To nije brzo, to je trenutno. Dok tvoje oko trepne, Cro-Stem je procesirao cijelu knjižnicu.
  4. Effort & Sacrifice (Trud): NULA. Jedna linija koda za instalaciju. Jedna linija koda za korištenje. Nema konfiguracije. Nema GPU-a. Nema muke.

✨ NOVO u v0.1.7: Hibridna Normalizacija

Ljudski unosi su grozni. Ljudi pišu "sasavi" umjesto "šašavi". Naša nova hibridna normalizacija (PHF Mapa + Heuristička Pravila) automatski "popravlja" dijakritike prije stemiranja.

  • Vraća Dijakritike: zvacuci -> žvačući. Automatski. Instantno.
  • Ujedinjuje Dijalekte: Prepoznaje lepo (ekavica) i lipo (ikavica) i tretira ih kao lijepo.
  • Ekstremna Efikasnost: Sve to u svega 116 KB WASM-a koristeći Cow<'a, str> za nula alokacija memorije gdje god je to moguće.

🛠️ Brzi Start (U 30 Sekundi)

🐍 Python

pip install cro-stem
import cro_stem
# Aggressive Mode (97.4% točnosti)
print(cro_stem.stem("vrapcima")) # Output: "vrabac"

🦀 Rust

use cro_stem::{CroStem, StemMode};

let stemmer = CroStem::new(StemMode::Aggressive);
assert_eq!(stemmer.stem("najljepših"), "lijep");

🔌 Integracije & Ekosustav

  • 🦀 Tantivy Integration: Cro-Stem je sada nativni TokenFilter za najbržu Rust tražilicu. Dostupno out-of-the-box.
  • 🌐 Playground 2.0: Potpuno lokalizirani web demo s Developer Mode-om.
    • Feedback Loop: Pronašao si grešku? Prijavi je direktno u Playgroundu, kopiraj generirani test i pošalji nam ga. 👉 Isprobaj Cro-Stem 2.0 Live

☕️ Dev Corner

  • 🚀 Brži od konobara na Rivi: Cro-Stem obrađuje tvoj CSV brže nego što stigneš naručiti kavu s hladnim mlijekom.
  • 🛥️ Bez redova za trajekt: Naš Rust engine nema kašnjenja. Za razliku od ulaska na trajekt u špici sezone, ovdje nema čekanja u redu.
  • 🏫 Kraj traumama iz škole: Sjećaš se tablica s padežima? Mi smo ih pretvorili u kod da ti više nikada ne bi morao razmišljati o instrumentalu množine.


⚖️ Licenca

Ovaj projekt je besplatan i otvoren. Uzmi ga. Koristi ga. Zaradi milijune s njim. (Licencirano pod MIT ili Apache-2.0 licencom).

👨‍💻 Autor

Kreirao Denis Ja1Denis. Ako ti je ovaj alat uštedio vrijeme ili novac:


Također pogledaj:

  • Serb-Stem: Prvi pravi Stemmer za srpski jezik.
  • Slov-Stem: Prvi pravi Stemmer za slovenski jezik.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

cro_stem-0.1.7.tar.gz (2.2 MB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

cro_stem-0.1.7-cp311-cp311-win_amd64.whl (152.0 kB view details)

Uploaded CPython 3.11Windows x86-64

File details

Details for the file cro_stem-0.1.7.tar.gz.

File metadata

  • Download URL: cro_stem-0.1.7.tar.gz
  • Upload date:
  • Size: 2.2 MB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: maturin/1.11.5

File hashes

Hashes for cro_stem-0.1.7.tar.gz
Algorithm Hash digest
SHA256 a4a8c006cefcb6e7b1c54a2d85d211cfdb62161f3709caa57b238ed068bd9b4b
MD5 8f0ca6a45a383ba30273e022b7fce468
BLAKE2b-256 344a69d098e517501a5c8dd2b674a2ea65597981bfb933da9d72c81a25384396

See more details on using hashes here.

File details

Details for the file cro_stem-0.1.7-cp311-cp311-win_amd64.whl.

File metadata

File hashes

Hashes for cro_stem-0.1.7-cp311-cp311-win_amd64.whl
Algorithm Hash digest
SHA256 e26ce685aa3eb6e250de9b10f9e53b9ce615c15747ebe42ab3c5b1551d8d2fbb
MD5 92dbc39ce602f02fdecd296a2506d632
BLAKE2b-256 a49d4ae9faf0bb027e077e198cf814d711ba0e984f68a7af4633a305c0946917

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page