Intelligenza Artificiale la libreria python italiana dedicata all'I.A.
Project description
🚧 La libreria è ancora in fase di SVILUPPO 🚧
Intelligenza Artificiale
La libreira python creata per neofiti e datascientist che semplifica l'analisi dati e lo sviluppo di modelli di apprendimento automatico e profondo
Intelligenza-Artificiale è l'unica libreria python MADE in ITALY che permette a qualsiasi persona di :
- Leggere, Manipolare, Pulire dataset di ogni tipo
- Analizzare i dati per trasformarli in importanti informazioni
- Creare in meno di 5 righe di codice modelli di ML
- Sviluppare reti neurali
- & molto molto altro ancora
richiamando i metodi in italiano !
Installazione Libreria
La libreria intelligenzaartificiale richiede PYTHON v3.6+
Per installare la libreria puoi usare il comando pip3 .
pip3 install intelligenzaartificiale
se invece utilizzi google colab...
!pip install intelligenzaartificiale
Partizione Libreria
Al momento abbiamo deciso di partizionare la libreria in moduli, per rendere il codice il più portabile e leggero possibile.
Modulo | Import | Utilizzo |
---|---|---|
Dataset | from intelligenzaartificiale import dataset as dt | lettura e manipolazine set di dati ( .csv , .xlsx , .xls , .html , .json , sql ) |
BigDataset | from intelligenzaartificiale import bigdataset as bdt | lettura e manipolazine set di dati molto grandi compresi bigdata |
Statistica | from intelligenzaartificiale import statistica as st | analisi dati |
Preprocessing | from intelligenzaartificiale import preprocessing as pp | pulizia, manipolazione e preprocessing dei dati |
TextPreprocessing | from intelligenzaartificiale import textpreprocessing as tpp | pulizia, manipolazione e preprocessing per dati testuali |
Machine Learning | from intelligenzaartificiale import machinelearning as ml | creazione di modelli di apprendimento automatico |
Deep Learning | from intelligenzaartificiale import depplearning as dl | creazione di reti neurali |
NLP | from intelligenzaartificiale import nlp | trattamento delle informazioni testuali |
Esempi
Qui sotto troverai elencati tutti i metodi della libreria con degli esempi
Step 1 --- Modulo Dataset
Con questo modulo potrai leggere qualsiasi tipo di dataset
Leggere un file .csv
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_csv("file_name.csv")
Leggere un file excel
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_xls("file_name.xls")
Leggere un foglio specifico di un file excel
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_sheet("file_name.xls","nome_foglio")
Leggere un file html
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_html("file_name.html")
Leggere un file json
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_json("file_name.json")
Leggere un file sql
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_json("file_name.sql")
Ottenere informazioni di base sulle colonne
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_csv("file_name.csv")
print(dt.lista_colonne(il_mio_dataset))
print(dt.tipo_colonne(il_mio_dataset))
Rimuovere una o più colonne
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_csv("file_name.csv")
nuovo_dataset = dt.rimuovi_colonna(il_mio_dataset, "colonna_da_eliminare")
colonne_inutili = ["colonna3", "colonna12" , "colonna33"]
nuovo_dataset = dt.rimuovi_colonne(il_mio_dataset, colonne_inutili)
Separare i vari tipi di dato
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_csv("file_name.csv")
valori_numerici = dt.numerici(il_mio_dataset)
valori_categorici = dt.categorici(il_mio_dataset)
valori_booleani = dt.booleani(il_mio_dataset)
Eseguire semplici query sul dataset
from intelligenzaartificiale import dataset as dt
il_mio_dataset = dt.leggi_csv("file_name.csv")
acquisti_alti = dt.esegui_query(il_mio_dataset,il_mio_dataset["prezzo"]>1000)
Step 2 --- Modulo Statistica
Con questo modulo potrai fare statistiche, report e analisi sui tuoi dati
Valori Nulli o Corrotti
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import statistica as st
il_mio_dataset = dt.leggi_csv("file_name.csv")
print(st.valori_nan(il_mio_dataset))
print(st.percentuale_nan(il_mio_dataset))
#nel modulo preprocessing vedremmo come eliminare o sostituire i valori null o corrotti
Statistiche di base
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import statistica as st
il_mio_dataset = dt.leggi_csv("file_name.csv")
#statistiche su tutto il dataset
print(st.valori_nan(il_mio_dataset))
#statistiche su specifica colonna del dataset
print(st.statistiche_colonna(il_mio_dataset,"nome_colonna"))
#contare valori unici di una specifica colonna
print(st.conta_valori_unici(il_mio_dataset,"nome_colonna"))
Statistiche di base su colonna
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import statistica as st
il_mio_dataset = dt.leggi_csv("file_name.csv")
#media
print(st.media(il_mio_dataset,"nome_colonna"))
#varianza
print(st.varianza(il_mio_dataset,"nome_colonna"))
#covarianza
print(st.covarianza(il_mio_dataset,"nome_colonna"))
#quantili
print(st.quantile_25(il_mio_dataset,"nome_colonna"))
print(st.quantile_50(il_mio_dataset,"nome_colonna"))
print(st.quantile_75(il_mio_dataset,"nome_colonna"))
#min e max
print(st.min(il_mio_dataset,"nome_colonna"))
print(st.max(il_mio_dataset,"nome_colonna"))
Analizzare le correlazioni
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import statistica as st
il_mio_dataset = dt.leggi_csv("file_name.csv")
#Correlazione tra i campi del dataset
print(st.correlazione(il_mio_dataset))
#correlazione tra una colonna target e un altra colonna
print(st.correlazione_radio(il_mio_dataset, "colonna" ,"target_colonna"))
#correlazione di Spearman tra una colonna target e un altra colonna
print(st.correlazione_spearman(il_mio_dataset, "colonna" ,"target_colonna"))
#correlazione di Pearson tra una colonna target e un altra colonna
print(st.correlazione_pearson(il_mio_dataset, "colonna" ,"target_colonna"))
#classifica correlazione tra una colonna target e un altra colonna
print(st.classifica_correlazione_colonna(il_mio_dataset, "colonna" ,"target_colonna"))
Report Automatizzati
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import statistica as st
il_mio_dataset = dt.leggi_csv("file_name.csv")
#Scarica report html
st.report_dataset(il_mio_dataset")
#Salverà nella corrente un report html
#apri il tuo dataset sul web
st.apri_dataframe_nel_browser(il_mio_dataset)
#Ti consigliamo viviamente di provare questa funzione sul tuo set di dati
Step 3 --- PreProcessing
Con questo modulo potrai pulire, manipolare, standardizzare e scalare i tuoi dati
Gestire Nulli o Corrotti
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import preprocessing as pp
il_mio_dataset = dt.leggi_csv("file_name.csv")
#rimuovere righe con valori nulli o corrotti
il_mio_dataset = pp.rimuovi_nan(il_mio_dataset)
#sostituire valori nulli o corrotti con il valore medio
il_mio_dataset["colonna"] = pp.sostituisci_nan_media(il_mio_dataset,"colonna")
#sostituire valori nulli o corrotti con il valore più frequente
il_mio_dataset["colonna"] = pp.sostituisci_nan_frequenti(il_mio_dataset,"colonna")
#rimuovi una colonna se i valori mancanti sono più di un valore passato
il_mio_dataset = pp.rimuovi_colonna_se_nan(il_mio_dataset,"colonna",500)
Gestire gli outliers
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import preprocessing as pp
il_mio_dataset = dt.leggi_csv("file_name.csv")
#Rimuovere i valori outlier
il_mio_dataset["colonna"] = pp.rimuovi_outliers(il_mio_dataset,"colonna")
#Rimuovere i valori outlier e valori nulli
il_mio_dataset["colonna"] = pp.rimuovi_outliers_nan(il_mio_dataset,"colonna")
Gestire variabili testuali e categoriche
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import preprocessing as pp
il_mio_dataset = dt.leggi_csv("file_name.csv")
#effettuare il labelencoding
il_mio_dataset["nuova_colonna"] = pp.label_encoding(il_mio_dataset,"colonna")
#effettuare il labelencoding con sklearn
il_mio_dataset["nuova_colonna"] = pp.label_encoding_sklearn(il_mio_dataset,"colonna")
#effettuare il one hot encoding
il_mio_dataset["nuova_colonna"] = pp.onehot_encoding(il_mio_dataset,"colonna")
#per rimuovere la vecchia colonna
il_mio_dataset = dt.rimuovi_colonna(il_mio_dataset, "colonna")
Normalizzare i dati
from intelligenzaartificiale import dataset as dt
from intelligenzaartificiale import preprocessing as pp
il_mio_dataset = dt.leggi_csv("file_name.csv")
#normalizza intero datatset
dataset_normalizzato = pp.normalizza(il_mio_dataset,"colonna")
#normalizza una specifica colonna
il_mio_dataset["colonna"] = pp.normalizza_colonne(il_mio_dataset,"colonna")
#standardizza intero datatset
dataset_normalizzato = pp.standardizza(il_mio_dataset,"colonna")
#standardizza una specifica colonna
il_mio_dataset["colonna"] = pp.standardizza_colonne(il_mio_dataset,"colonna")
# dividi i dati in test e train
X_train, X_test, y_train, y_test = pp.dividi_train_test(il_mio_dataset, "target", testsize )
🚧 La libreria è ancora in fase di SVILUPPO 🚧
Licenza
MIT
© Copyright 2020-2022 Intelligenza Artificiale Italia!
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Hashes for intelligenzaartificiale-0.0.0.6.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | bf1faaeaf384177dd23a18c9bc0b1a352a9c5b7c466e0bb3375186d1a08e0a96 |
|
MD5 | 85486df57ff7d9ac004a8e0107c6f9ee |
|
BLAKE2b-256 | 4e26c05b898b176416b33042398260d0500c12a20360330a28994002248d1e32 |
Hashes for intelligenzaartificiale-0.0.0.6-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 1503d6be8d254eac9b28566a24598ec96906db0860b661e4533b5ceafbf0bae0 |
|
MD5 | e6b4eeb04c6441798aa572457ad850c2 |
|
BLAKE2b-256 | 6fe404a1872aa1051fae2338e4eb54f51ade40c4188247cf63dd32aebb021753 |