Skip to main content

Bangla Natural Language Processing Toolkit

Project description

Bangla NLTK

banglanltk is a python package for Bengali Natural Language Processing Toolkit. It includes modules for Cleaning Text, Word Tokenization, Sentence Tokenization, Parts of speech tagging and Synonym.

Documents

Installation

pip install banglanltk

Usage

Cleaning Text

import banglanltk as bn
s = 'আজ আকাশ পরিষ্কার!!! মনে হয় আজ আর বৃষ্টি হবে না .........!'

print(bn.clean_text(s))

Word Tokenization

import banglanltk as bn
s = 'প্রাচীন কালে মানুষ একসময় সংখ্যা বুঝানোর জন্য ঝিনুক, নুড়ি, দড়ির গিট ইত্যাদি ব্যবহার করত।'

print(bn.word_tokenize(s))

Sentence Tokenization

import banglanltk as bn
s = ''' কম্পিউটার শব্দটি গ্রিক "কম্পিউট" শব্দ থেকে এসেছে। Compute শব্দের অর্থ গণনা করা। আর কম্পিউটার শব্দের অর্থ গণনাকারী যন্ত্র। '''

print(bn.sent_tokenize(s))

POS Tagging

import banglanltk as bn

print(bn.pos_tag('কম্পিউটার'))

Synonym

import banglanltk as bn

print(bn.synonym('হাত'))

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distributions

No source distribution files available for this release.See tutorial on generating distribution archives.

Built Distribution

banglanltk-0.0.3-py3-none-any.whl (481.0 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page