A package for plagiarism detection on Bengali texts.
Project description
Bengali Plagiarism Checker
Introducing a Python library for detecting plagiarism in Bengali texts. This library comprises 200 Bengali books with approximately 4100 pages sourced from the National Digital Library, processed using the Tesseract OCR engine. With just two lines of code, you can check for similarities in Bengali written content. If a high degree of similarity is found, it will display the book title, author name, and other details. You can install the library using the following command in the terminal:
pip install BengaliPlagiarismChecker
Sample Usage
import BengaliPlagiarismChecker as bpc #importing package
#input text
text="""
বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?
"""
#method to find out plagiarism
bpc.check(text)
'''
OUTPUT
[[194, #BookID
'State Council of Educational Research and Training (SCERT)', #Author or Publisher
'সাহিত্য মালঞ্চ', #Book name
14, # Page number
23.88]] #Similarity Score
'''
This work is licensed under a Creative Commons Attribution 4.0 International License.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file BengaliPlagiarismCheckerTool-0.0.3.tar.gz
.
File metadata
- Download URL: BengaliPlagiarismCheckerTool-0.0.3.tar.gz
- Upload date:
- Size: 2.7 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.1 CPython/3.9.2
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 5ccc5e9d35930ba05ffc16ca97b86e97d21d1eba4dc01d54cdcf95c1a0b37f4a |
|
MD5 | 0244f6dfd3068943d5814b9f46619cd6 |
|
BLAKE2b-256 | 57be20201aa45fc525654d7a77420c33c6398fb8ab5be5fe4c9898816c0c6a80 |
File details
Details for the file BengaliPlagiarismCheckerTool-0.0.3-py3-none-any.whl
.
File metadata
- Download URL: BengaliPlagiarismCheckerTool-0.0.3-py3-none-any.whl
- Upload date:
- Size: 2.8 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.1 CPython/3.9.2
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | e9a6f6aec7f1293765298e263c0fb39fcdefae96e89026e26133e19fcb8191d2 |
|
MD5 | c156ff27b5499234a852602c9233d13f |
|
BLAKE2b-256 | 5f0d9225c25acfa6bb40b50b0e5e0fa0a4439e2ddaad6bd0314b70d42683b68b |