Skip to main content

A package for plagiarism detection on Bengali texts.

Project description

Bengali Plagiarism Checker

Bengali Plagiarism Checker library contains database of 200 books with over 4100 pages in it for detection of plagiarism in Bengali texts. This library is based on a paper titled "Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach".
Cite the paper as :
Ghosh, S., Ghosh, A., Ghosh, B., & Roy, A. (2022). Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach. arXiv preprint arXiv:2203.13430.



Sample Usage

import BengaliPlagiarismChecker as bpc #importing package

#input text
text="""

বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?

"""
#method to find out plagiarism
bpc.check(text)

'''
OUTPUT

[[194, #BookID
  'State Council of Educational Research and Training (SCERT)', #Author or Publisher
  'সাহিত্য মালঞ্চ', #Book name
  14,  # Page number
  23.88]] #Similarity Score


'''



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

BengaliPlagiarismCheckerTool-0.0.1.tar.gz (2.7 MB view details)

Uploaded Source

Built Distribution

File details

Details for the file BengaliPlagiarismCheckerTool-0.0.1.tar.gz.

File metadata

File hashes

Hashes for BengaliPlagiarismCheckerTool-0.0.1.tar.gz
Algorithm Hash digest
SHA256 c0857345335570683eeb7212b2e2d91138083e4c63ad44d8a94bbd4128ea2c4f
MD5 a3af8ac5a3f8d82766344cf8992f7164
BLAKE2b-256 f6b2e6348929e1eb3d99c3e5fa184612759ef9e1e9d98cd61ea4d08b58ff5a80

See more details on using hashes here.

File details

Details for the file BengaliPlagiarismCheckerTool-0.0.1-py3-none-any.whl.

File metadata

File hashes

Hashes for BengaliPlagiarismCheckerTool-0.0.1-py3-none-any.whl
Algorithm Hash digest
SHA256 7dac3f19bc7b84a0418a3acf9431a95b69a813d0a1b567e449b520fd2d498cb2
MD5 98d56d334c8c28dc9959f378488149d4
BLAKE2b-256 e146846e8451b155f7d976522ff15a69faa60b47e401f7aa09333ed2d4a2abb9

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page