Pacote de pré-processamento de texto
Project description
DataAnalysis
DataAnalysis é uma biblioteca que pode ser usada para o pré-processamento de um arquivo csv.
Parâmetros:
input_file: nome do arquivo com a extensão csv
api_small_talks: url da api de small talks
content_column: nome ou Ãndice da coluna de conteúdo do arquivo csv
encoding: codificação do arquivo
sep: separador usado no arquivo
batch: número de batches para usar na api de small talks
Installation
Use o gerenciador de pacotes pip para instalar o DataAnalysis
pip install DataAnalysis
Usage
import DataAnalysis as da
p = da.PreProcessing(input_file, api_small_talks, content_column, encoding, sep, batch)
p.process(output_file, lower = True, punctuation = True, abbreviation = True, typo = True, small_talk = True,
emoji = True, wa_emoji = True, accentuation = True, number = True, relevant = False, cpf = True,
url = True, email = True, money = True, code = True, time = True, date = True, tagging = True)
License
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
DataAnalysis-0.0.4.tar.gz
(4.1 kB
view hashes)
Built Distribution
Close
Hashes for DataAnalysis-0.0.4-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 312e5d01ce2d085505ae7f75e45df8942d11de93c7e9c9dbfe647fd10d0f1556 |
|
MD5 | a68c6df77229df8432a4f1291d6d3d30 |
|
BLAKE2b-256 | 6684f8d230efb286d13198d7502cda5203905d28a873f4494927a46a690230e7 |