Skip to main content

A package for plagiarism detection on Bengali texts.

Project description

Bengali Plagiarism Checker

Introducing a Python library for detecting plagiarism in Bengali texts. This library comprises 200 Bengali books with approximately 4100 pages sourced from the National Digital Library, processed using the Tesseract OCR engine. With just two lines of code, you can check for similarities in Bengali written content. If a high degree of similarity is found, it will display the book title, author name, and other details. You can install the library using the following command in the terminal:

pip install BengaliPlagiarismChecker


Sample Usage

import BengaliPlagiarismChecker as bpc #importing package

#input text
text="""

বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?

"""
#method to find out plagiarism
bpc.check(text)

'''
OUTPUT

[[194, #BookID
  'State Council of Educational Research and Training (SCERT)', #Author or Publisher
  'সাহিত্য মালঞ্চ', #Book name
  14,  # Page number
  23.88]] #Similarity Score


'''



Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

BengaliPlagiarismCheckerTool-0.0.3.tar.gz (2.7 MB view details)

Uploaded Source

Built Distribution

File details

Details for the file BengaliPlagiarismCheckerTool-0.0.3.tar.gz.

File metadata

File hashes

Hashes for BengaliPlagiarismCheckerTool-0.0.3.tar.gz
Algorithm Hash digest
SHA256 5ccc5e9d35930ba05ffc16ca97b86e97d21d1eba4dc01d54cdcf95c1a0b37f4a
MD5 0244f6dfd3068943d5814b9f46619cd6
BLAKE2b-256 57be20201aa45fc525654d7a77420c33c6398fb8ab5be5fe4c9898816c0c6a80

See more details on using hashes here.

File details

Details for the file BengaliPlagiarismCheckerTool-0.0.3-py3-none-any.whl.

File metadata

File hashes

Hashes for BengaliPlagiarismCheckerTool-0.0.3-py3-none-any.whl
Algorithm Hash digest
SHA256 e9a6f6aec7f1293765298e263c0fb39fcdefae96e89026e26133e19fcb8191d2
MD5 c156ff27b5499234a852602c9233d13f
BLAKE2b-256 5f0d9225c25acfa6bb40b50b0e5e0fa0a4439e2ddaad6bd0314b70d42683b68b

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page