No project description provided
Project description
Cro-Stem 2.0 🇭🇷⚡
„Zašto koristiti išta drugo kada možeš imati 97% preciznosti u 500KB koji trče krugove oko LLM-ova?“
Dosta je sporih Python modela koji traže 4GB RAM-a za bazično stemiranje. Dosta je regexa koji umiru na drugom padežu. Dosta je alata koji se ne održavaju desetljećima.
Cro-Stem je Grand Slam ponuda za hrvatski NLP.
🚀 Ponuda koju ne možeš odbiti (The $100M Value)
Primijenili smo Hormozijevu jednadžbu vrijednosti na obradu jezika:
- Dream Outcome (San): Savršeno pretraživanje i analiza hrvatskog teksta. Bez gubljenja informacija u padežima. Bez "izgubljenih u prijevodu" momenata.
- Perceived Likelihood (Vjerojatnost): 100%. Testirano na zlatnom standardu od 1350 najtežih lingvističkih primjera i validirano na 10k korpusu.
- Točnost (Aggressive): 97.41%
- Glagoli: 99.0%
- Imenice: 95.0%
- Time Delay (Vrijeme): NULA. 0.1ms po riječi. To nije brzo, to je trenutno. Dok tvoje oko trepne, Cro-Stem je procesirao cijelu knjižnicu.
- Effort & Sacrifice (Trud): NULA. Jedna linija koda za instalaciju. Jedna linija koda za korištenje. Nema konfiguracije. Nema GPU-a. Nema muke.
✨ NOVO u v0.1.7: Hibridna Normalizacija
Ljudski unosi su grozni. Ljudi pišu "sasavi" umjesto "šašavi". Naša nova hibridna normalizacija (PHF Mapa + Heuristička Pravila) automatski "popravlja" dijakritike prije stemiranja.
- Vraća Dijakritike:
zvacuci->žvačući. Automatski. Instantno. - Ujedinjuje Dijalekte: Prepoznaje
lepo(ekavica) ilipo(ikavica) i tretira ih kaolijepo. - Ekstremna Efikasnost: Sve to u svega 116 KB WASM-a koristeći
Cow<'a, str>za nula alokacija memorije gdje god je to moguće.
🛠️ Brzi Start (U 30 Sekundi)
🐍 Python
pip install cro-stem
import cro_stem
# Aggressive Mode (97.4% točnosti)
print(cro_stem.stem("vrapcima")) # Output: "vrabac"
🦀 Rust
use cro_stem::{CroStem, StemMode};
let stemmer = CroStem::new(StemMode::Aggressive);
assert_eq!(stemmer.stem("najljepših"), "lijep");
🔌 Integracije & Ekosustav
- 🦀 Tantivy Integration: Cro-Stem je sada nativni
TokenFilterza najbržu Rust tražilicu. Dostupno out-of-the-box. - 🌐 Playground 2.0: Potpuno lokalizirani web demo s Developer Mode-om.
- Feedback Loop: Pronašao si grešku? Prijavi je direktno u Playgroundu, kopiraj generirani test i pošalji nam ga. 👉 Isprobaj Cro-Stem 2.0 Live
☕️ Dev Corner
- 🚀 Brži od konobara na Rivi: Cro-Stem obrađuje tvoj CSV brže nego što stigneš naručiti kavu s hladnim mlijekom.
- 🛥️ Bez redova za trajekt: Naš Rust engine nema kašnjenja. Za razliku od ulaska na trajekt u špici sezone, ovdje nema čekanja u redu.
- 🏫 Kraj traumama iz škole: Sjećaš se tablica s padežima? Mi smo ih pretvorili u kod da ti više nikada ne bi morao razmišljati o instrumentalu množine.
⚖️ Licenca
Ovaj projekt je besplatan i otvoren. Uzmi ga. Koristi ga. Zaradi milijune s njim. (Licencirano pod MIT ili Apache-2.0 licencom).
👨💻 Autor
Kreirao Denis Ja1Denis. Ako ti je ovaj alat uštedio vrijeme ili novac:
- 📧 Email: sdenis.vr@gmail.com
- 🔗 LinkedIn: Denis Sakač
Također pogledaj:
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file cro_stem-0.1.7.tar.gz.
File metadata
- Download URL: cro_stem-0.1.7.tar.gz
- Upload date:
- Size: 2.2 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: maturin/1.11.5
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
a4a8c006cefcb6e7b1c54a2d85d211cfdb62161f3709caa57b238ed068bd9b4b
|
|
| MD5 |
8f0ca6a45a383ba30273e022b7fce468
|
|
| BLAKE2b-256 |
344a69d098e517501a5c8dd2b674a2ea65597981bfb933da9d72c81a25384396
|
File details
Details for the file cro_stem-0.1.7-cp311-cp311-win_amd64.whl.
File metadata
- Download URL: cro_stem-0.1.7-cp311-cp311-win_amd64.whl
- Upload date:
- Size: 152.0 kB
- Tags: CPython 3.11, Windows x86-64
- Uploaded using Trusted Publishing? No
- Uploaded via: maturin/1.11.5
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
e26ce685aa3eb6e250de9b10f9e53b9ce615c15747ebe42ab3c5b1551d8d2fbb
|
|
| MD5 |
92dbc39ce602f02fdecd296a2506d632
|
|
| BLAKE2b-256 |
a49d4ae9faf0bb027e077e198cf814d711ba0e984f68a7af4633a305c0946917
|