Skip to main content

Fast Punctuation Restoration for Vietnamese

Project description

🛠️VFastPunct

Code by 🧑‍💻Trong-Dat Ngo.

Fast punctuation and capitalization restoration using Transformer Models for 🇻🇳Vietnamese

Installation

This repository is tested on 🐍Python 3.7+ and 🔥PyTorch 1.8.2+, as well as it works fine on macOS, Windows, Linux.

pip install VFastPunct

Run

>>> from vfastpunct import VFastPunct
>>> punct = VFastPunct(model_name='mBertPunctCap', no_cuda=False)
>>> punct('việt nam quốc hiệu chính thức là cộng hòa xã hội chủ nghĩa việt nam là một quốc gia nằm ở cực đông của bán đảo đông dương thuộc khu vực đông nam á giáp với lào campuchia trung quốc biển đông và vịnh thái lan')
'Việt Nam quốc hiệu chính thức là Cộng hòa Xã hội chủ nghĩa Việt Nam, là một quốc gia nằm ở cực Đông của bán đảo Đông Dương, thuộc khu vực Đông Nam Á, giáp với Lào, Campuchia, Trung Quốc, Biển Đông và Vịnh Thái Lan.'

Arguments:

  • model_name: The name of the architectural model that was utilized to restore punctuation and capitalization. Valid model name can be [mBertPunct, mBertPunctCap]
  • no_cuda: Whether to not use CUDA even when it is available or not.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

VFastPunct-2.0.2.tar.gz (8.9 kB view hashes)

Uploaded Source

Built Distribution

VFastPunct-2.0.2-py3-none-any.whl (13.8 kB view hashes)

Uploaded Python 3

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page