bengali transformer bengali language processing state of the art transformer
Project description
BNTRANSFORMERS
bntransformer
build with transformers for different transformer based inference task for Bengali language.
Installation
pip install bntransformer
or
pip install -U bntransformer
Dependency
- pytorch(1.6+)
Usage
Tokenization
from bntransformer import BanglaTokenizer
bntokenizer = BanglaTokenizer()
# you can custom model path or other bengali huggingface model path
# default it takes "sagorsarker/bangla-bert-base"
text = "আমি বাংলায় গান গাই ।"
tokens = bntokenizer.tokenize(text)
print(tokens)
# outputs: ['আমি', 'বাংলা', '##য', 'গান', 'গাই', '।']
Bangla Question Answering
from bntransformer import BanglaQA
bnqa = BanglaQA()
# you can custom model path or other bengali huggingface model path
# default it takes "sagorsarker/mbert-bengali-tydiqa-qa"
context = "সূর্য সেন ১৮৯৪ সালের ২২ মার্চ চট্টগ্রামের রাউজান থানার নোয়াপাড়ায় অর্থনৈতিক ভাবে অস্বচ্ছল পরিবারে জন্মগ্রহণ করেন। তাঁর পিতার নাম রাজমনি সেন এবং মাতার নাম শশী বালা সেন। রাজমনি সেনের দুই ছেলে আর চার মেয়ে। সূর্য সেন তাঁদের পরিবারের চতুর্থ সন্তান। দুই ছেলের নাম সূর্য ও কমল। চার মেয়ের নাম বরদাসুন্দরী, সাবিত্রী, ভানুমতী ও প্রমিলা। শৈশবে পিতা মাতাকে হারানো সূর্য সেন কাকা গৌরমনি সেনের কাছে মানুষ হয়েছেন। সূর্য সেন ছেলেবেলা থেকেই খুব মনোযোগী ভাল ছাত্র ছিলেন এবং ধর্মভাবাপন্ন গম্ভীর প্রকৃতির ছিলেন।"
question = "মাস্টারদা সূর্যকুমার সেনের বাবার নাম কী ছিল ?"
answers = bnqa.find_answer(context, question)
print(answer)
# output: {'score': 0.8070710301399231, 'start': 131, 'end': 141, 'answer': 'রাজমনি সেন'}
Bangla NER
from bntransformer import BanglaNER
bnner = BanglaNER()
# you can custom model path or other bengali huggingface model path
# default it takes "neuropark/sahajBERT-NER"
sentence = "আমি জাহিদ হাসান এবং আমি ঢাকায় বাস করি ।"
output = bnner.ner_tag(sentence)
print(output)
Bangla Mask Generation
from bntransformer import BanglaMaskGeneration
bnunmasker = BanglaMaskGeneration()
# you can custom model path or other bengali huggingface model path
# default it takes "sagorsarker/bangla-bert-base"
sentence = "আমি জাহিদ হাসান এবং আমি [MASK] বাস করি । "
output = bnunmasker.generate_mask(sentence)
print(output)
Bangla To English Translation
from bntransformer import BanglaTranslation
bntrans = BanglaTranslation()
# you can custom model path or other bengali huggingface model path
# default it takes "Helsinki-NLP/opus-mt-bn-en"
bn_sentence = "আমার নাম জাহিদ, আমি ঢাকায় বাস করি।"
output = bntrans.bn2en(bn_sentence)
print(output)
# output: My name is Zahid, I live in Dhaka.
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
bntransformer-2.0.0.tar.gz
(4.7 kB
view hashes)
Built Distribution
Close
Hashes for bntransformer-2.0.0-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 757a74c4ef9f808a487eb58d031ac6cc09d20aff063a21c8353ed5a6ee98f2ec |
|
MD5 | 1caa187084ffc97f47a966db7d38c813 |
|
BLAKE2b-256 | 081f5b19eaf1e30372c929aca68389b7f57371f3e7d1677da5200449caf99eac |