Educational Machine Learning library focusing on understanding models step-by-step
Project description
pysimpml là thư viện dành cho người mới học Machine Learning, tập trung vào việc giúp bạn hiểu bản chất mô hình thay vì chỉ gọi hàm có sẵn.
Thư viện xử lý được hầu hết các trường hợp cơ bản trong Machine Learning, nhưng nhiều bước được giữ lại để người học tự thao tác bằng tay, giúp hiểu rõ cách mô hình hoạt động thay vì phụ thuộc hoàn toàn vào các thư viện lớn.
Thư viện được xây dựng dựa trên: numpy — tính toán ma trận và vector pickle — lưu model torch / torchvision — hỗ trợ mở rộng deep learning pillow — xử lý ảnh csv — lưu log quá trình train (NEW)
Một điểm đặc biệt của simpmnct là khả năng in chi tiết quá trình học của mô hình, bao gồm:
Các tham số out_* có thể hiển thị: Loss theo từng epoch (out_loss) Gradient của mô hình (out_gradient) Quá trình cập nhật weight và bias (out_update) Thông tin từng epoch (out_epoch) Công thức mô hình (out_formula) Thống kê dữ liệu (out_stat) Dữ liệu trước và sau xử lý (out_data) Quá trình chia train/test (out_split) Kích thước dữ liệu (out_shape) Index train/test (out_index) Giải thích quá trình dự đoán (explain=True)
Ngoài ra hỗ trợ lưu log: Loss theo từng epoch ra file CSV (loss_csv=True) Có thể dùng để vẽ biểu đồ hoặc debug quá trình học
Người học có thể bật hoặc tắt từng phần để quan sát cách mô hình học từng bước.
Loss qua từng epoch Gradient (dw, db) Cập nhật weight và bias Công thức mô hình Quá trình predict từng bước Log loss ra file CSV để phân tích
pysimpml is a library for beginners in Machine Learning, focusing on helping you understand the fundamentals of the model rather than simply calling built-in functions.
The library handles most basic Machine Learning scenarios, but many steps are left to allow learners to manipulate them manually, helping them understand how the model works instead of relying entirely on large libraries.
The library is built on: numpy — matrix and vector computation pickle — model storage torch / torchvision — support for deep learning extensions pillow — image processing csv — training log storage (New)
A unique feature of simpmnct is its ability to print detailed model learning progress, including:
The out_* parameters can display: Loss per epoch (out_loss) Model gradient (out_gradient) Weight and bias update process (out_update) Information per epoch (out_epoch) Model formula (out_formula) Data statistics (out_stat) Data before and after processing (out_data) Train/test splitting process (out_split) Data size (out_shape) Train/test index (out_index) Prediction process explanation (explain=True)
Additionally supports logging: Saving loss per epoch to CSV file (loss_csv=True) Useful for plotting learning curves and debugging
Learners can turn each part on or off to observe how the model learns step by step.
Loss at each epoch Gradient (dw, db) Update weights and biases Model formulas Step-by-step prediction process Export training logs to CSV for analysis
Thư viện hỗ trợ: Linear Regression Logistic Regression Neural Network (Multi-Layer Perceptron) ← NEW Train/Test Split Normalize dữ liệu (data) Metrics cơ bản Save/Load model (.best) Export training logs (.csv) ← NEW
import numpy as np
Import models
from pysimpml.models import *
DATA CLASSIFICATION
X_class = np.array([ [1, 2], [2, 3], [3, 3], [6, 7], [7, 8], [8, 8] ])
y_class = np.array([0, 0, 0, 1, 1, 1])
DATA REGRESSION
X_reg = np.array([ [1], [2], [3], [4], [5], [6] ])
y_reg = np.array([2, 4, 6, 8, 10, 12])
KNN
print("\n===== KNN =====")
knn_c = KNNClassification(k=3, out_neighbor=True, out_distance=True, out_loss=True) knn_c.fit(X_class, y_class) print("KNN Class:", knn_c.predict(X_class, y_class))
knn_r = KNNRegression(k=3, weights='distance', out_neighbor=True, out_distance=True, out_loss=True) knn_r.fit(X_reg, y_reg) print("KNN Reg:", knn_r.predict(X_reg, y_reg))
DECISION TREE
print("\n===== DECISION TREE =====")
tree_c = DecisionTreeClassification(max_depth=3, loss=True, loss_csv=True) tree_c.fit(X_class, y_class) print("Tree Class:", tree_c.predict(X_class))
tree_r = DecisionTreeRegression(max_depth=3, loss=True, loss_csv=True) tree_r.fit(X_reg, y_reg) print("Tree Reg:", tree_r.predict(X_reg))
RANDOM FOREST
print("\n===== RANDOM FOREST =====")
rf_c = RandomForestClassification(n_trees=5, out_tree_train=True, out_vote=True, vote_csv=True) rf_c.fit(X_class, y_class) print("RF Class:", rf_c.predict(X_class)) print("Accuracy:", rf_c.score(X_class, y_class, explain=True))
rf_r = RandomForestRegression(n_trees=5, out_tree_train=True, out_value=True, value_csv=True) rf_r.fit(X_reg, y_reg) print("RF Reg:", rf_r.predict(X_reg)) print("MSE:", rf_r.score(X_reg, y_reg, explain=True))
TEST NEW DATA
print("\n===== TEST NEW DATA =====")
new_class = np.array([[2, 2], [7, 7]]) print("KNN Class:", knn_c.predict(new_class)) print("Tree Class:", tree_c.predict(new_class)) print("RF Class:", rf_c.predict(new_class))
new_reg = np.array([[7], [8]]) print("KNN Reg:", knn_r.predict(new_reg)) print("Tree Reg:", tree_r.predict(new_reg)) print("RF Reg:", rf_r.predict(new_reg))
lưu ý : model này là do thằng sinh viên năm 2 viết ko dùng cho dự án lớn hay dẫn đường tên lửa , có thể sai số hoặc nhiều bug tiềm ẩn , chỉ sử dụng để học hoặc làm dự án nhỏ
Please note: this model was written by a second-year student and is not intended for large projects or missile guidance. It may contain errors or potential bugs; it is only for learning or small projects
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file pysimpml-0.0.4.tar.gz.
File metadata
- Download URL: pysimpml-0.0.4.tar.gz
- Upload date:
- Size: 4.0 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
ec6e703f1a7f698be40bbafe124b7f3b3ca386d1f0416c0c6ccf534d824a048d
|
|
| MD5 |
d2c5808de221d191036dbc22af918ac4
|
|
| BLAKE2b-256 |
ea870250bb042eb20143d472c51ff62047926e65c9e865e47505c3065e2d67eb
|
File details
Details for the file pysimpml-0.0.4-py3-none-any.whl.
File metadata
- Download URL: pysimpml-0.0.4-py3-none-any.whl
- Upload date:
- Size: 3.8 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.2.0 CPython/3.12.7
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
abb845f1da01f57eeac94d182d305f3a986a84260bb24c124d6bb98a71ffbaf8
|
|
| MD5 |
9aaf31a1c56da674bd4f9b02d88fb8d8
|
|
| BLAKE2b-256 |
bd561d704b2da7dfaf21606836c176238f86d09967690ef49ef379a375cc38cf
|