No project description provided
Project description
TTTH Analyzer
Mô tả thư viện
TTTH_Analyzer là gói thư viện hỗ trợ HV môn MDS5 thực hiện các bước phân tích đơn biến và đa biến
- Phân tích đơn biến (phân loại và liên tục )
- Phân tích đa biến (phân loại vs phân loại, phân loại vs liên tục )
Tính năng cung cấp:
- Phân tích đơn biến với biến phân loại thông qua :
- Count values
- Barchart
- Phân tích đơn biến với biến liên tục thông qua :
- Các thông tin thống kê: Mean, Median, Mode, Min, Max và Range
- Các thông tin thống kê liên quan đến sự phân tán dữ liệu như : Range, Q1, Q3 , IQR, phương sai, độ lệch, độ nhọn của phân phối
- Trực quan hóa bằng histogram và boxplot
- Phân tích đa biến phân loại vs phân loại thông qua:
- Xây dựng bảng 2 chiều (two-way table)
- Trực quan hóa bằng biểu đồ cột chồng (stacked columns bar )
- Thực hiện phân tích thống kê bằng chi2
- Phân tích đa biến liên tục vs phân loại thông qua:
- Xây dựng bảng ANOVA và phân tích thống kê
- Trực quan hóa bằng box plot
Installation
pip install ttth-mds5-analyzer
Cách sử dụng
- Khởi tạo thư viện
from from analysis.analyzer import TTTH_Analyzer
_analyzer = TTTH_Analyzer()
- Phân tích đơn biến phân loại
_analyzer.analyze_category_variable(variable_name='Tên biến', df='Tên DataFrame')
Trong đó:
variable_name: tên biến phân loại cần phân tích - kiểu chuỗi (string)
df: dataframe chứa biến phân loại cần phân tích - kiểu dataframe pandas
Kết quả:
- Phân tích đơn biến liên tục
_analyzer.analyze_numeric_variable(variable_name='Tên biến', df='Tên DataFrame')
Trong đó:
variable_name: tên biến liên tục cần phân tích - kiểu chuỗi (string)
df: dataframe chứa biến liên tục cần phân tích - kiểu dataframe pandas
Kết quả:
- Phân tích đa biến phân loại vs phân loại
_analyzer.analyze_category_vs_category(var1='Tên biến 1', var2='Tên biến 2', df='Tên DataFrame')
Trong đó:
var1: tên biến phân loại 1 cần phân tích - kiểu chuỗi (string)
var2: tên biến phân loại 2 cần phân tích - kiểu chuỗi (string)
df: dataframe chứa cả 2 biến phân loại cần phân tích - kiểu dataframe pandas
Kết quả:
- Phân tích đa biến liên tục vs phân loại
_analyzer.analyze_continous_vs_categories(continous_var='Tên biến liên tục',
category_vars=['Tên biến phân loại 1', 'Tên biến phân loại 2'],
df='Tên DataFrame')
Trong đó:
continous_var: tên biến liên tục cần phân tích - kiểu chuỗi (string)
category_vars: danh sách hoặc tên biến phân loại cần phân tích - kiểu danh sách (list) hoặc kiểu chuỗi (string)
df: dataframe chứa biến phân loại và biến liên tục cần phân tích - kiểu dataframe pandas
Kết quả:
License
MIT
**Nhanh tay đăng ký các khóa học Data Science/ Machine Learning ở TTTH Đại học KHTN để có thêm nhiều kiến thức thú vị cùng những cuộc hành trình khai phá dữ liệu **
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Close
Hashes for ttth-mds5-analyzer-0.0.8.3.tar.gz
Algorithm | Hash digest | |
---|---|---|
SHA256 | f40c8c9e1722d7cc12f32dcd0ec0fbc3579dc0de4d3b0722ccb6502d29ea72c5 |
|
MD5 | 9942340002b396a62cc283092a8fd853 |
|
BLAKE2b-256 | cedc06ab12e99e40df8017b72d3e8d9c299283ec973a13ac4e8512db72eb92b3 |