A package for plagiarism detection on Bengali texts.
Project description
Bengali Plagiarism Checker
Bengali Plagiarism Checker library contains database of 200 books with over 4100 pages in it for detection of plagiarism in Bengali texts. This library is based on a paper titled "Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach".
Cite the paper as :
@misc{https://doi.org/10.48550/arxiv.2203.13430,
doi = {10.48550/ARXIV.2203.13430},
url = {https://arxiv.org/abs/2203.13430},
author = {Ghosh, Satyajit and Ghosh, Aniruddha and Ghosh, Bittaswer and Roy, Abhishek},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Plagiarism Detection in the Bengali Language: A Text Similarity-Based Approach},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}
Sample Usage
import BengaliPlagiarismChecker as bpc #importing package
#input text
text="""
বসন্তাগমে কামিনী রায় বসন্ত কি সহসা এ নির্জন আবাসে পশিয়াছ চুপি চুপি? নবীন পল্পবে
সাজিয়াছে তরুরাজি। ঝেড়ে দিলে কবে পুরাতন জীর্ণপত্র শীতল বাতাসে বাতাবি ফুলের গন্ধ ধীরে ধীরে ভেসে আসে আমার গবাক্ষপথে ঘন কুহুরবে মুখরিত আম্রবন বসন্তই হবে উদ্যান উজ্জল শত শ্বেত পুস্প হাসে আজিও ধরনি মরে রেখেছে ধরিয়া তার স্বর্ণ কারাগারে বর্ণ গন্ধ গানে রসে স্পর্শে দিতে চাহে দেহে আর চিতে নব প্রাণ, কিন্তু হায় নিঃশেষে ভরিয়া কই দিতে পারে, মধু? দূরে কোন্খানে থাকে অদেহীরা, বধু, পারো বলে দিতে?
"""
#method to find out plagiarism
bpc.check(text)
'''
OUTPUT
[[194, #BookID
'State Council of Educational Research and Training (SCERT)', #Author or Publisher
'সাহিত্য মালঞ্চ', #Book name
14, # Page number
23.88]] #Similarity Score
'''
This work is licensed under a Creative Commons Attribution 4.0 International License.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
File details
Details for the file BengaliPlagiarismCheckerTool-0.0.2.tar.gz
.
File metadata
- Download URL: BengaliPlagiarismCheckerTool-0.0.2.tar.gz
- Upload date:
- Size: 2.7 MB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.1 CPython/3.9.2
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | 193404c68dbd8bc25f792e23a8c6ca102f6c8662ef20adbfae20a35850b8c083 |
|
MD5 | d2536203d1db7018e41d11c5be9ea521 |
|
BLAKE2b-256 | 5b0aa25c6295ae6b9359dbcc29e7e5b390609539537ba954525954dbdca954f7 |
File details
Details for the file BengaliPlagiarismCheckerTool-0.0.2-py3-none-any.whl
.
File metadata
- Download URL: BengaliPlagiarismCheckerTool-0.0.2-py3-none-any.whl
- Upload date:
- Size: 2.8 MB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/4.0.1 CPython/3.9.2
File hashes
Algorithm | Hash digest | |
---|---|---|
SHA256 | e3687b8f9baa558c1c3026b6de9fb36c43a137406e407a9363268cb33d1e6b7b |
|
MD5 | db9d8ac986b4001352e19433cf1c9804 |
|
BLAKE2b-256 | e19f869764f10f2f2efa3e4551306070f9ad10a0b28fb76b36b7789488451fa1 |