Skip to main content

Library untuk memeriksa tingkat plagiarisme.

Project description

Plagiat

Library untuk memeriksa tingkat Plagiarisme atau Similarity menggunakan Bahasa Python. Secara default library ini akan menggunakan Algoritma Rabin Karp sebagai perhitungan utamanya.

Pustaka ini dibuat hanya sebagai penunjang untuk membantu saya menguji-coba dan memahami semua konsep algoritma untuk menghitung similaritas.

Instalasi

pip install plagiat

Cara Penggunaan

Menggunakan File .txt

from plagiat.deteksi import Deteksi

file_1 = '/content/kalimat-1.txt'
file_2 = '/content/kalimat-2.txt'

cek = Deteksi(file_1, file_2, url=True).hitung()

print('Persentase plagiarisme = {0}%'.format(cek))

Menggunakan Text

from plagiat.deteksi import Deteksi

string_1 = "Aku sedang belajar kecerdasan buatan"
string_2 = "Mahasiswa yang cerdas selalu siap menerima tantangan"

cek = Deteksi(string_1, string_2, text=True).hitung()

print('Persentase plagiarisme = {0}%'.format(cek))

Menggunakan URL

from plagiat.deteksi import Deteksi

teks_1 = 'https://raw.githubusercontent.com/novay/amikom/main/datasets/text/kalimat-1.txt'
teks_2 = 'https://raw.githubusercontent.com/novay/amikom/main/datasets/text/kalimat-1.txt'

cek = Deteksi(teks_1, teks_2, url=True).hitung()

print('Persentase plagiarisme = {0}%'.format(cek))

Penggunaan Parameter

from plagiat.deteksi import Deteksi

Deteksi(teks_1, teks_2, text=True, url=True, bahasa='english', method='Cosine').hitung()

Penjelasan

  • text=True digunakan untuk mendeteksi string
    default False
  • url=True digunakan untuk mendeteksi dokumen melalui URL
    default False
  • bahasa='english' digunakan untuk menentukan bahasa yang digunakan dalam proses stopwords
    default 'indonesian'
  • method='Cosine' digunakan untuk mengubah metode yang ingin digunakan
    default 'Rabin Karp', pilihan 'Rabin Karp', 'Cosine', 'Jaccard'

Referensi

Rabin Karp:

Jaccard Similarity:

Cosine Similarity:

Disclaimer

Library ini di buat hanya untuk keperluan pembuatan tugas Data Science.

Output mungkin saja bisa berbeda dengan pustaka lain khususnya perhitungan Cosine, karena dalam implementasinya ada variasi dalam cara perhitungan vektor TF-IDF, tokenisasi kata, dan faktor-faktor lainnya. Agar hasil lebih maksimal, lebih baik handle dulu masalah stop word, n-gram, dan normalisasi secara mandiri karena perhitungan yang dilakukan dalam pustaka ini hanya melakukan normalisasi sederhana sebelum dieksekusi.

Salam hormat,
Novianto Rahmadi (22.55.2293)

Credit

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

plagiat-0.1.6.tar.gz (5.3 kB view details)

Uploaded Source

Built Distribution

plagiat-0.1.6-py3-none-any.whl (6.7 kB view details)

Uploaded Python 3

File details

Details for the file plagiat-0.1.6.tar.gz.

File metadata

  • Download URL: plagiat-0.1.6.tar.gz
  • Upload date:
  • Size: 5.3 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.11.2

File hashes

Hashes for plagiat-0.1.6.tar.gz
Algorithm Hash digest
SHA256 213652c1ae018e47033fe3ee24450f1efe3abe4e2e9e126b46dfc2c655177177
MD5 1271200a7dc424dcba24dcac6274e7e5
BLAKE2b-256 a1edcf6698bf909eacef88eb152b5ddfa55a2142598e15b0dd4665c0126a0143

See more details on using hashes here.

File details

Details for the file plagiat-0.1.6-py3-none-any.whl.

File metadata

  • Download URL: plagiat-0.1.6-py3-none-any.whl
  • Upload date:
  • Size: 6.7 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/4.0.2 CPython/3.11.2

File hashes

Hashes for plagiat-0.1.6-py3-none-any.whl
Algorithm Hash digest
SHA256 fe4d3d15e528ac515b31401ef390e6ff7c4a00475748e2a2a25d4a1a760ab184
MD5 0cbc106f1ff863fc09368f4477a2bce2
BLAKE2b-256 12902a0520c8f91b123624ec171d13ceb0cfcdca5707bacdbd78f496d93b0063

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page