Pacote de pré-processamento de texto
Project description
DataAnalysis
DataAnalysis é uma biblioteca que pode ser usada para o pré-processamento de um arquivo csv.
Parâmetros:
input_file: nome do arquivo com a extensão csv
api_small_talks: url da api de small talks
content_column: nome ou Ãndice da coluna de conteúdo do arquivo csv
encoding: codificação do arquivo
sep: separador usado no arquivo
batch: número de batches para usar na api de small talks
Installation
Use o gerenciador de pacotes pip para instalar o DataAnalysis
pip install DataAnalysis
Usage
import DataAnalysis as da
p = da.PreProcessing(input_file, api_small_talks, content_column, encoding, sep, batch)
p.process(output_file, lower = True, punctuation = True, abbreviation = True, typo = True, small_talk = True,
emoji = True, wa_emoji = True, accentuation = True, number = True, relevant = False, cpf = True,
url = True, email = True, money = True, code = True, time = True, date = True, tagging = True)
License
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
DataAnalysis-0.0.6.tar.gz
(6.1 kB
view hashes)