Skip to main content

A package for plagiarism detection on Bengali texts.

Project description

Bengali Plagiarism Checker

Bengali Plagiarism Checker library contains database of 200 books with over 4100 pages in it for detection of plagiarism in Bengali texts. This library is based on a paper titled "Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach".
Cite the paper as :

@misc{https://doi.org/10.48550/arxiv.2203.13430,
  doi = {10.48550/ARXIV.2203.13430},
  
  url = {https://arxiv.org/abs/2203.13430},
  
  author = {Ghosh, Satyajit and Ghosh, Aniruddha and Ghosh, Bittaswer and Roy, Abhishek},
  
  keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
  
  title = {Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach},
  
  publisher = {arXiv},
  
  year = {2022},
  
  copyright = {Creative Commons Attribution 4.0 International}
}


Sample Usage

import BengaliPlagiarismChecker as bpc #importing package

#input text
text="""

বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?

"""
#method to find out plagiarism
bpc.check(text)

'''
OUTPUT

[[194, #BookID
  'State Council of Educational Research and Training (SCERT)', #Author or Publisher
  'সাহিত্য মালঞ্চ', #Book name
  14,  # Page number
  23.88]] #Similarity Score


'''



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

BengaliPlagiarismCheckerTool-0.0.2.tar.gz (2.7 MB view details)

Uploaded Source

Built Distribution

File details

Details for the file BengaliPlagiarismCheckerTool-0.0.2.tar.gz.

File metadata

File hashes

Hashes for BengaliPlagiarismCheckerTool-0.0.2.tar.gz
Algorithm Hash digest
SHA256 193404c68dbd8bc25f792e23a8c6ca102f6c8662ef20adbfae20a35850b8c083
MD5 d2536203d1db7018e41d11c5be9ea521
BLAKE2b-256 5b0aa25c6295ae6b9359dbcc29e7e5b390609539537ba954525954dbdca954f7

See more details on using hashes here.

File details

Details for the file BengaliPlagiarismCheckerTool-0.0.2-py3-none-any.whl.

File metadata

File hashes

Hashes for BengaliPlagiarismCheckerTool-0.0.2-py3-none-any.whl
Algorithm Hash digest
SHA256 e3687b8f9baa558c1c3026b6de9fb36c43a137406e407a9363268cb33d1e6b7b
MD5 db9d8ac986b4001352e19433cf1c9804
BLAKE2b-256 e19f869764f10f2f2efa3e4551306070f9ad10a0b28fb76b36b7789488451fa1

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page