Pacote de pré-processamento de texto
Project description
DataAnalysis
DataAnalysis é uma biblioteca que pode ser usada para o pré-processamento de um arquivo csv.
Parâmetros:
input_file: nome do arquivo com a extensão csv
api_small_talks: url da api de small talks
content_column: nome ou Ãndice da coluna de conteúdo do arquivo csv
encoding: codificação do arquivo
sep: separador usado no arquivo
batch: número de batches para usar na api de small talks
Installation
Use o gerenciador de pacotes pip para instalar o DataAnalysis
pip install DataAnalysis
Usage
import DataAnalysis as da
p = da.PreProcessing(input_file, api_small_talks, content_column, encoding, sep, batch)
p.process(output_file, lower = True, punctuation = True, abbreviation = True, typo = True, small_talk = True,
emojis = True, wa_emojis = True, accentuation = True, number = True, relevant = False)
License
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
DataAnalysis-0.0.2.tar.gz
(4.0 kB
view hashes)
Built Distribution
Close
Hashes for DataAnalysis-0.0.2-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 0cff4ed22b085c907bb3e578a3872ba68b91880d8e72ef225f7c0a7c2c8abc35 |
|
MD5 | 5b1cd72987b0ea1621e9816b44046a6f |
|
BLAKE2b-256 | 903ac06a288f48f7f57694cc151501aae00161468761dcbd66e830838f75007e |