An easy-to-use tool for training Pytorch deep learning models

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Project description

DeepEpochs

Pytorch深度学习模型训练工具。

安装

pip install deepepochs

使用

数据要求

训练集、验证集和测试集是torch.utils.data.Dataloader对象
Dataloaer所构造的每个mini-batch数据（collate_fn返回值）是一个tuple或list，其中最后一个是标签
- 如果训练中不需要标签，则需将最后一项置为None

指标计算

每个指标是一个函数
- 有两个参数，分别为模型预测和数据标签
- 返回值为当前mini-batch上计算的指标值或字典
- 支持基于torchmetrics.functional定义指标

实例

import torch
from torch import nn
from torch.nn import functional as F
from torchvision.datasets import MNIST
from torchvision import transforms
from torch.utils.data import DataLoader, random_split
from deepepochs import Trainer

# 1. --- datasets
data_dir = './datasets'
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.1307,), (0.3081,))])
mnist_full = MNIST(data_dir, train=True, transform=transform, download=True)
train_ds, val_ds = random_split(mnist_full, [55000, 5000])
test_ds = MNIST(data_dir, train=False, transform=transform, download=True)
train_dl = DataLoader(train_ds, batch_size=32)
val_dl = DataLoader(val_ds, batch_size=32)
test_dl = DataLoader(test_ds, batch_size=32)

# 2. --- model
channels, width, height = (1, 28, 28)
model = nn.Sequential(
    nn.Flatten(),
    nn.Linear(channels * width * height, 64), nn.ReLU(), nn.Dropout(0.1),
    nn.Linear(64, 64), nn.ReLU(), nn.Dropout(0.1),
    nn.Linear(64, 10)
)

# 3. --- optimizer
opt = torch.optim.Adam(model.parameters(), lr=2e-4)

# 4. --- train
trainer = Trainer(model, F.cross_entropy, opt, epochs=2)  # 训练器
trainer.fit(train_dl, val_dl)                             # 训练、验证
trainer.test(test_dl)                                     # 测试

序号	功能说明	代码
1	基本使用	examples/1-basic.py
2	Trainer、fit方法、test方法的常用参数	examples/2-basic-params.py
3	模型性能评价指标的使用	examples/3-metrics.py
4	Checkpoint与EarlyStop	examples/4-checkpoint-earlystop.py
5	寻找适当的学习率	examples/5-lr-find.py
6	利用Tensorboad记录训练过程	examples/6-logger.py
7	利用Tensorboard记录与可视化超参数	examples/7-log-hyperparameters.py
8	分析、解释或可视化模型的预测效果	examples/8-interprete.py
9	学习率调度	examples/9-lr-schedule.py
10	使用多个优化器	examples/10-multi-optimizers.py
11	在训练、验证、测试中使用多个Dataloader	examples/11-multi-dataloaders.py
12	基于图神经网络的节点分类	examples/12-node-classification.py
13	模型前向输出和梯度的可视化	examples/13-weight-grad-visualize.py
14	自定义Callback	examples/14-costomize-callback.py
15	通过`TrainerBase`定制`train_step`和`evaluate_step`	examples/15-customize-steps-1.py
16	通过`EpochTask`定制`train_step`和`eval_step`和`test_step`	examples/16-customize-steps-2.py
17	通过`EpochTask`定制`step`	examples/17-costomize-steps-3.py
18	内置Patch的使用	examples/18-use_patches.py
19	自定义Patch	examples/19-customize-patch.py
20	分布式训练、混合精度训练	examples/20-accelerate.py
21	梯度累积	examples/21-grad-accumulate.py

定制

方法1（示例14）
- 第1步：继承deepepochs.Callback类，定制满足需要的Callback
- 第2步：使用deepepochs.Trainer训练模型，将定制的Callback对象作为Trainer的callbacks参数
方法2（示例15）
- 第1步：继承deepepochs.TrainerBase类定制满足需要的Trainer，实现step、train_step、val_step、test_step或evaluate_step方法，它们的定义方法完全相同
  - 参数
    - batch_x：一个mini-batch的模型输入数据
    - batch_y：一个mini-batch的标签
    - **step_args：可变参数字典，即EpochTask的step_args参数
  - 返回值为None或字典
    - key：指标名称
    - value：deepepochs.PatchBase子类对象，可用的Patch有（示例18）
      - ValuePatch：根据每个mini-batch指标均值（提前计算好）和batch_size，累积计算Epoch指标均值
      - TensorPatch：保存每个mini-batch的(preds, targets)，Epoch指标利用所有mini-batch的(preds, targets)数据重新计算
      - MeanPatch：保存每个batch指标均值，Epoch指标值利用每个mini-batch的均值计算
        
        一般MeanPatch与TensorPatch结果相同，但占用存储空间更小、运算速度更快
        
        不可用于计算'precision', 'recall', 'f1', 'fbeta'等指标
      - ConfusionPatch：用于计算基于混淆矩阵的指标，包括'accuracy', 'precision', 'recall', 'f1', 'fbeta'等
    - 也可以继承PatchBase定义新的Patch，需要实现如下方法 （示例19）
      - PatchBase.add
        
        用于将两个Patch对象相加得到更大的Patch对象
      - PatchBase.forward
        
        用于计算指标，返回指标值或字典
- 第2步：调用定制Trainer训练模型。
方法（示例16、17）
- 第1步：继承deepepochs.EpochTask类，在其中定义step、train_step、val_step、test_step或evaluate_step方法
  - 它们的定义方式与Trainer中的*step方法相同
  - step方法优先级最高，即可用于训练也可用于验证和测试（定义了step方法，其他方法就会失效）
  - val_step、test_step优先级高于evaluate_step方法
  - EpochTask中的*step方法优先级高于Trainer中的*step方法
  - EpochTask的__ini__方法的**step_args会被注入*step方法的step_args 参数
- 第2步：使用新的EpochTask任务训练
  - 将EpochTask对象作为Trainer.fit中train_tasks和val_tasks的参数值，或者Trainer.test方法中tasks的参数值

数据流图

https://github.com/hitlic/deepepochs/blob/main/imgs/data_flow.png

Project details

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Release history Release notifications | RSS feed

This version

0.5.32

Apr 10, 2024

0.5.31

Mar 23, 2024

0.5.30

Mar 21, 2024

0.5.29

Mar 21, 2024

0.5.28

Mar 20, 2024

0.5.27

Feb 28, 2024

0.5.26

Feb 21, 2024

0.5.25

Feb 21, 2024

0.5.24

Feb 21, 2024

0.5.23

Jan 2, 2024

0.5.22

Dec 26, 2023

0.5.21

Dec 26, 2023

0.5.20

Dec 26, 2023

0.5.19

Dec 26, 2023

0.5.18

Dec 26, 2023

0.5.17

Dec 2, 2023

0.5.16

Dec 1, 2023

0.5.15

Dec 1, 2023

0.5.14

Dec 1, 2023

0.5.13

Dec 1, 2023

0.5.12

Dec 1, 2023

0.5.11

Nov 30, 2023

0.5.10.2

Nov 30, 2023

0.5.10.1

Nov 30, 2023

0.5.10

Nov 30, 2023

0.5.9

Nov 30, 2023

0.5.8

Nov 29, 2023

0.5.7

Nov 29, 2023

0.5.6

Nov 29, 2023

0.5.5

Nov 29, 2023

0.5.4

Nov 29, 2023

0.5.3

Nov 29, 2023

0.5.2

Nov 29, 2023

0.5.1

Nov 28, 2023

0.5.0

Nov 26, 2023

0.4.19

Nov 21, 2023

0.4.18

Nov 21, 2023

0.4.17

Nov 16, 2023

0.4.16

Nov 16, 2023

0.4.15

Nov 16, 2023

0.4.14

Nov 16, 2023

0.4.13

Nov 15, 2023

0.4.12

Nov 13, 2023

0.4.11

Nov 13, 2023

0.4.10

Nov 12, 2023

0.4.9

Nov 11, 2023

0.4.8

Nov 10, 2023

0.4.7

Nov 10, 2023

0.4.6

Nov 8, 2023

0.4.5

Nov 8, 2023

0.4.4

Nov 7, 2023

0.4.3

Nov 7, 2023

0.4.2

Nov 6, 2023

0.4.1

Nov 6, 2023

0.4.0

Nov 1, 2023

0.3.16

Oct 29, 2023

0.3.15

Oct 28, 2023

0.3.14

Oct 28, 2023

0.3.13

Oct 28, 2023

0.3.12

Oct 28, 2023

0.3.11

Oct 27, 2023

0.3.10

Oct 27, 2023

0.3.9

Oct 27, 2023

0.3.8

Oct 26, 2023

0.3.7

Oct 25, 2023

0.3.6

Oct 25, 2023

0.3.5

Oct 25, 2023

0.3.4

Oct 25, 2023

0.3.3

Oct 24, 2023

0.3.2

Oct 24, 2023

0.3.1

Oct 24, 2023

0.3.0

Oct 24, 2023

0.2.11

Oct 23, 2023

0.2.10

Oct 23, 2023

0.2.9

Oct 23, 2023

0.2.8

Oct 23, 2023

0.2.7

Oct 23, 2023

0.2.6

Oct 22, 2023

0.2.5

Oct 22, 2023

0.2.4

Oct 22, 2023

0.2.3

Oct 22, 2023

0.2.2

Oct 22, 2023

0.2.1

Oct 22, 2023

0.2.0

Oct 22, 2023

0.1.8

Oct 22, 2023

0.1.7

Oct 21, 2023

0.1.6

Oct 20, 2023

0.1.5

Oct 19, 2023

0.1.4

Oct 19, 2023

0.1.3

Oct 19, 2023

0.1.2

Oct 19, 2023

0.1.1

Oct 19, 2023

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

deepepochs-0.5.32.tar.gz (36.3 kB view hashes)

Uploaded Apr 10, 2024 Source

Built Distribution

deepepochs-0.5.32-py3-none-any.whl (41.9 kB view hashes)

Uploaded Apr 10, 2024 Python 3

Hashes for deepepochs-0.5.32.tar.gz

Hashes for deepepochs-0.5.32.tar.gz
Algorithm	Hash digest
SHA256	`0ec1c9b5c7a0896e37602b2bd96707750dd08d2112a6dc750f11fae4f6e61cad`
MD5	`1e5476fba1b72041c63f548ab6e8b01b`
BLAKE2b-256	`ed83bfa2fd24a579603ff316f0c257d9cf5b51262f25f10c0967202045ad70ad`

Hashes for deepepochs-0.5.32-py3-none-any.whl

Hashes for deepepochs-0.5.32-py3-none-any.whl
Algorithm	Hash digest
SHA256	`75004ffb8d37d7436af3183cf878e04c1fdffb2783bec0495c3881b0c96e7c81`
MD5	`4beeed9169499b89b59f8c802d27546c`
BLAKE2b-256	`12c3c9aaa107726ffba7b9062042fb9421a8ef235c2fb2c9df21adc49a95ba37`