Skip to main content

No project description provided

Project description

TTTH Analyzer

Mô tả thư viện

logo

TTTH_Analyzer là gói thư viện hỗ trợ HV môn MDS5 thực hiện các bước phân tích đơn biến và đa biến

  • Phân tích đơn biến (phân loại và liên tục )
  • Phân tích đa biến (phân loại vs phân loại, phân loại vs liên tục )

Tính năng cung cấp:

  • Phân tích đơn biến với biến phân loại thông qua :
    • Count values
    • Barchart
  • Phân tích đơn biến với biến liên tục thông qua :
    • Các thông tin thống kê: Mean, Median, Mode, Min, Max và Range
    • Các thông tin thống kê liên quan đến sự phân tán dữ liệu như : Range, Q1, Q3 , IQR, phương sai, độ lệch, độ nhọn của phân phối
    • Trực quan hóa bằng histogram và boxplot
  • Phân tích đa biến phân loại vs phân loại thông qua:
    • Xây dựng bảng 2 chiều (two-way table)
    • Trực quan hóa bằng biểu đồ cột chồng (stacked columns bar )
    • Thực hiện phân tích thống kê bằng chi2
  • Phân tích đa biến liên tục vs phân loại thông qua:
    • Xây dựng bảng ANOVA và phân tích thống kê
    • Trực quan hóa bằng box plot

Installation

pip install ttth-mds5-analyzer

Cách sử dụng

  • Khởi tạo thư viện
from from analysis.analyzer import TTTH_Analyzer
_analyzer = TTTH_Analyzer()
  • Phân tích đơn biến phân loại
_analyzer.analyze_category_variable(variable_name='Tên biến', df='Tên DataFrame')
Trong đó:
variable_name: tên biến phân loại cần phân tích - kiểu  chuỗi (string)
df: dataframe chứa biến phân loại cần phân tích  - kiểu dataframe pandas 
Kết quả: 

result

  • Phân tích đơn biến liên tục
_analyzer.analyze_numeric_variable(variable_name='Tên biến', df='Tên DataFrame')
Trong đó:
variable_name: tên biến liên tục cần phân tích - kiểu  chuỗi (string)
df: dataframe chứa biến liên tục cần phân tích  - kiểu dataframe pandas  
Kết quả: 

result

  • Phân tích đa biến phân loại vs phân loại
_analyzer.analyze_category_vs_category(var1='Tên biến 1', var2='Tên biến 2', df='Tên DataFrame')
Trong đó:
var1: tên biến phân loại 1 cần phân tích - kiểu  chuỗi (string)
var2: tên biến phân loại 2 cần phân tích - kiểu  chuỗi (string)
df: dataframe chứa cả 2 biến phân loại cần phân tích  - kiểu dataframe pandas  
Kết quả: 

result

  • Phân tích đa biến liên tục vs phân loại
_analyzer.analyze_continous_vs_categories(continous_var='Tên biến liên tục', 
                                          category_vars=['Tên biến phân loại 1', 'Tên biến phân loại 2'], 
                                          df='Tên DataFrame')
Trong đó:
continous_var: tên biến liên tục cần phân tích - kiểu  chuỗi (string)
category_vars: danh sách hoặc tên biến phân loại cần phân tích - kiểu danh sách (list)  hoặc kiểu  chuỗi (string)
df: dataframe chứa biến phân loại và biến liên tục cần phân tích  - kiểu dataframe pandas  
Kết quả: 

result

  • Phân tích mất cân bằng
_analyzer.check_imbalance_class(variable_name='Tên biến phân loại', df='Tên DataFrame')
Trong đó:
variable_name: tên biến phân loại cần phân tích - kiểu  chuỗi (string)
df: dataframe chứa biến liên tục cần phân tích  - kiểu dataframe pandas  
Kết quả: 

result

  • Phân tích ngoại lai của biến liên tục
_analyzer.check_outlier_of_numerical_variable(numerical_variable='Tên biến liên tục',  
                                              df='Tên DataFrame')

Trong đó:
numerical_variable: tên biến liên tục cần phân tích - kiểu  chuỗi (string)
df: dataframe chứa biến phân loại và biến liên tục cần phân tích  - kiểu dataframe pandas  
Kết quả: 

result

License

MIT

**Nhanh tay đăng ký các khóa học Data Science/ Machine Learning ở TTTH Đại học KHTN để có thêm nhiều kiến thức thú vị cùng những cuộc hành trình khai phá dữ liệu **

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ttth-mds5-analyzer-0.1.0.tar.gz (8.9 kB view hashes)

Uploaded Source

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page