A CSV analyzer tool with extended filtering and analysis capabilities

Project description

CSVAnalyzer Extended API

Ãœbersicht

Die CSVAnalyzer Extended API ist eine umfassende Python-Bibliothek, die speziell fÃ¼r die Analyse, Bereinigung, Filterung und Visualisierung von CSV-Daten entwickelt wurde. Sie bietet eine Vielzahl von Funktionen, die Entwicklern und Datenanalysten ermÃ¶glichen, CSV-Daten effizient zu verarbeiten, ohne auf externe Bibliotheken zurÃ¼ckgreifen zu mÃ¼ssen.

Installation

Um die CSVAnalyzer Extended API zu installieren, kÃ¶nnen Sie die Bibliothek direkt Ã¼ber pip installieren, nachdem Sie das Paket heruntergeladen haben:

pip install csv_analyzer_extended-1.1.zip

Klassen und Methoden

CSVAnalyzer

Diese Klasse bietet eine Vielzahl von Funktionen zur Analyse und Bereinigung von CSV-Daten.

__init__(file_path): Initialisiert den Analyzer mit dem Pfad zur CSV-Datei.
incremental_mean(column_name): Berechnet den Mittelwert einer Spalte.
incremental_median(column_name): Berechnet den Median einer Spalte.
calculate_std_dev(column_name): Berechnet die Standardabweichung einer Spalte.
calculate_variance(column_name): Berechnet die Varianz einer Spalte.
detect_anomalies_simple(column_name, threshold=1.5): Ermittelt einfache Anomalien in einer Spalte basierend auf einem Schwellenwert.
calculate_correlation(col1, col2, method='pearson'): Berechnet die Korrelation zwischen zwei Spalten (pearson oder spearman).
linear_regression(target_col, *feature_cols): FÃ¼hrt eine lineare Regression durch.
moving_average(column_name, window_size): Berechnet den gleitenden Durchschnitt einer Spalte.
remove_duplicates(): Entfernt doppelte EintrÃ¤ge.
fill_missing_values(column_name, strategy="mean"): FÃ¼llt fehlende Werte in einer Spalte auf.
normalize_column(column_name): Normalisiert die Werte einer Spalte.
standardize_column(column_name): Standardisiert die Werte einer Spalte.
plot_bar_chart(column_name): Erstellt ein Balkendiagramm einer Spalte.
plot_scatter_plot(column_name_x, column_name_y): Erstellt ein Streudiagramm zwischen zwei Spalten.
plot_histogram(column_name, bins=10): Erstellt ein Histogramm einer Spalte.

CSVSummarizer

Bietet Methoden zur Zusammenfassung von CSV-Daten.

most_frequent_values(column_name): Gibt die hÃ¤ufigsten Werte einer Spalte zurÃ¼ck.
find_outliers(column_name, threshold=1.5): Findet AusreiÃŸer in einer Spalte.
create_histogram(column_name): Erstellt ein Histogramm fÃ¼r eine Spalte.
calculate_sum(column_name): Berechnet die Summe der Werte in einer Spalte.
calculate_max(column_name): Findet den maximalen Wert in einer Spalte.
calculate_min(column_name): Findet den minimalen Wert in einer Spalte.

CSVSorter

Bietet Methoden zum Sortieren von CSV-Daten.

sort_by_column(column_name, reverse=False): Sortiert die Daten nach einer Spalte.
multi_column_sort(column_names, reverse=False): Sortiert die Daten nach mehreren Spalten.
parallel_sort(column_name, num_threads=4, reverse=False): FÃ¼hrt eine parallele Sortierung der Daten nach einer Spalte durch.

CSVFilter

Bietet eine Vielzahl von Filtermethoden, um CSV-Daten basierend auf verschiedenen Kriterien zu filtern.

filter_by_numeric_range(column_name, min_value=None, max_value=None): Filtert die Daten nach einem numerischen Bereich.
filter_by_text_pattern(column_name, pattern): Filtert die Daten nach einem Textmuster basierend auf einem regulÃ¤ren Ausdruck (Regex).
filter_by_date_range(column_name, start_date, end_date, date_format='%Y-%m-%d'): Filtert die Daten nach einem Datumsbereich.
filter_by_custom_function(column_name, custom_func): Filtert die Daten basierend auf einer benutzerdefinierten Funktion.
normalize_column(column_name): Normalisiert die Werte einer Spalte auf den Bereich [0, 1].
rank_column(column_name): Ordnet die Werte einer Spalte nach Rang.
filter_by_condition_chain(conditions): Filtert die Daten basierend auf einer Kette von Bedingungen (z.B. >=, <=, ==).
multidimensional_filter(filters): Bietet eine flexible Filterung basierend auf mehreren Kriterien und Filtern.

CSVExporter

Bietet Methoden zum Exportieren von CSV-Daten.

export_to_csv(file_path): Exportiert die Daten in eine CSV-Datei.
export_to_json(file_path): Exportiert die Daten in eine JSON-Datei.
export_to_sql(table_name, cursor): Exportiert die Daten in eine SQL-Datenbank.

Beispielanwendungen

from csv_analyzer_extended import CSVAnalyzer, CSVSummarizer, CSVSorter, CSVFilter, CSVExporter

# Analyse und Bereinigung
analyzer = CSVAnalyzer('data.csv')
mean = analyzer.incremental_mean('score')  # Erwarteter Mittelwert: 87.5
std_dev = analyzer.calculate_std_dev('score')  # Erwartete Standardabweichung: 5.5
analyzer.remove_duplicates()

# Zusammenfassung
summarizer = CSVSummarizer(analyzer.data, analyzer.header)
frequent_values = summarizer.most_frequent_values('score')

# Sortierung
sorter = CSVSorter(analyzer.data, analyzer.header)
sorted_data = sorter.sort_by_column('score')

# Filterung
filterer = CSVFilter(analyzer.data, analyzer.header)
filtered_data = filterer.filter_by_numeric_range('score', 80, 90)
filtered_data_by_date = filterer.filter_by_date_range('date', '2023-01-01', '2023-01-05')

# Export
exporter = CSVExporter(filtered_data, analyzer.header)
exporter.export_to_csv('filtered_data.csv')

Testen der API

Um sicherzustellen, dass alle Funktionen der API wie erwartet arbeiten, wurden umfassende Unittests entwickelt. Diese Tests kÃ¶nnen ausgefÃ¼hrt werden, um die verschiedenen Funktionen der API zu prÃ¼fen:

python test_csv_analyzer.py
python test_csv_summarizer.py
python test_csv_sorter.py
python test_csv_filter.py
python test_csv_exporter.py

Diese Tests decken alle wesentlichen Funktionen der API ab und gewÃ¤hrleisten, dass die API robust und fehlerfrei arbeitet.

Best Practices

Konsistente Benennung: Methoden und Klassen sind konsistent benannt, um ihre FunktionalitÃ¤t klar darzustellen.
ModularitÃ¤t: Die API ist modular aufgebaut, was es einfach macht, einzelne Komponenten wiederzuverwenden oder zu erweitern.
Fehlerbehandlung: Alle Methoden enthalten grundlegende Fehlerbehandlung, um sicherzustellen, dass die API robust ist.

Fehlerbehandlung

TypprÃ¼fung: Die Methoden der API fÃ¼hren TypprÃ¼fungen durch, um sicherzustellen, dass die Eingabedaten korrekt sind.
Ausnahmebehandlung: Bei fehlerhaften Eingaben oder unvorhergesehenen Problemen werfen die Methoden klare und aussagekrÃ¤ftige Fehlermeldungen.

ErweiterungsmÃ¶glichkeiten

Integration mit Datenbanken: Erweiterung der Exportfunktionen zur direkten Integration mit weiteren Datenbanksystemen.
Erweiterte Visualisierungen: Integration zusÃ¤tzlicher Visualisierungstypen wie Boxplots oder Heatmaps.
KÃ¼nstliche Intelligenz: HinzufÃ¼gen von Machine-Learning-Algorithmen zur Analyse und Vorhersage basierend auf den Daten.

Lizenz

Die CSVAnalyzer Extended API wird unter der MIT-Lizenz verÃ¶ffentlicht. Sie kÃ¶nnen die API frei verwenden, verÃ¤ndern und weiterverbreiten, solange die ursprÃ¼nglichen Autoren genannt werden.

Project details

Release history Release notifications | RSS feed

This version

1.2

Aug 12, 2024

1.1

Aug 12, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

csv_analyzer_extended-1.2.tar.gz (15.2 kB view details)

Uploaded Aug 12, 2024 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

csv_analyzer_extended-1.2-py3-none-any.whl (15.9 kB view details)

Uploaded Aug 12, 2024 Python 3

File details

Details for the file csv_analyzer_extended-1.2.tar.gz.

File metadata

Download URL: csv_analyzer_extended-1.2.tar.gz
Upload date: Aug 12, 2024
Size: 15.2 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/5.1.1 CPython/3.12.4

File hashes

Hashes for csv_analyzer_extended-1.2.tar.gz
Algorithm	Hash digest
SHA256	`145b63aef63e01530dae547e75b49ad2e1accabaea2e0b3c69344c0a66672298`
MD5	`b22b62c16bf578f5ec2e3048ea80ca3c`
BLAKE2b-256	`a3a83e7d364e47f75606c3f4c7b26d19ee50332df32b1643197005d6c1446398`

See more details on using hashes here.

File details

Details for the file csv_analyzer_extended-1.2-py3-none-any.whl.

File metadata

Download URL: csv_analyzer_extended-1.2-py3-none-any.whl
Upload date: Aug 12, 2024
Size: 15.9 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/5.1.1 CPython/3.12.4

File hashes

Hashes for csv_analyzer_extended-1.2-py3-none-any.whl
Algorithm	Hash digest
SHA256	`041c7805527591e33decacb7a68cdd7380b15309abf143760160f22168ef50e2`
MD5	`b0ed288adfea9a8e1fddeaf25dcfcdca`
BLAKE2b-256	`037f992aee8d58c77f5c7d886b2419f8cd866662d2ec3cbda52a1fae381634db`

See more details on using hashes here.

csv-analyzer-extended 1.2

Navigation

Verified details

Maintainers

Unverified details

Meta

Project description

CSVAnalyzer Extended API

Ãœbersicht

Inhaltsverzeichnis

Installation

Klassen und Methoden

CSVAnalyzer

CSVSummarizer

CSVSorter

CSVFilter

CSVExporter

Beispielanwendungen

Testen der API

Best Practices

Fehlerbehandlung

ErweiterungsmÃ¶glichkeiten

Lizenz

Project details

Verified details

Maintainers

Unverified details

Meta

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes