Transformer based LLM trainer

These details have not been verified by PyPI

Project links

Project description

Impruver: Фреймворк для обучения Больших Языковых Моделей (LLM)

Русский | 中文 | English

Набор скриптов и конфигураций для самостоятельного обучения Больших Языковых Моделей (БЯМ) или же на английском Large Language Models (LLM).

Вдохновлён проектами: saiga, torchtune, nanoGPT.

Обладает следующими возможностями:

Единая конфигурация для подготовки датасетов, запуска обучения и инференса в формате YAML
- Возможно указать отдельно токенизатор и модель
- Предусмотрена возможность обучения моделей с нуля (from scratch), full-train дообучения и LoRA/Peft дообучения
Гибкая система подготовки датасетов, позволяющая скомбинировать несколько датасетов, каждый из них индивидуально нарезать и преобразовать, после чего выполнить слияние и дедупликацию
- Можно использовать датасеты типа instruct или chat произвольного формата, система преобразует их в OpenAI-подобный chat типа messages
- Можно обучать function call модели с ролями function_call и function_response
В отличие от иных реализаций использует классы из пакета transformers, однако, можно указать путь до любого другого класса описывающего модель и/или токенизатор и impruver будет использовать уже их
Поддерживает возможность распределённого обучения при помощи accelerate

При необходимости вы можете изучить документацию проекта.

Как установить

Устанавливается одной командой:

pip install impruver

После чего в PATH станет доступна утилита командной строки impruver.

Если планируется обучение моделей с использованием Flash Attention, то надо будет выполнить ещё и:

pip install setuptools psutil torch flash-attn --no-build-isolation

Доступные конфигурации

Полный список рецептов обучения и конфигураций можно посмотреть выполнив:

impruver ls

Вы можете скопировать конфигурацию локально:

impruver cp ruGPT-3.5/13B_lora_saiga2 ./ruGPT-3.5_13B_lora_saiga2.yaml

Подробнее про конфигурации в wiki проекта.

Как пользоваться

Прежде чем приступить к обучению модели необходимо подготовить и дедуплицировать датасет, после чего разделить его на тренировочный и валидационный наборы сэмплов.

Все эти задачи можно выполнить запустив рецепт compose_dataset и указав необходимую конфигурацию:

impruver run compose_dataset --config ./ruGPT-3.5_13B_lora_saiga2.yaml

Или используя конфигурацию, идущую в стандартной поставке:

impruver run compose_dataset --config ruGPT-3.5/13B_lora_saiga2

Далее запускаем рецепт finetune для обучения трансфорфмерной модели:

impruver run finetune --config ./ruGPT-3.5_13B_lora_saiga2.yaml

Скрипт тренировки поддерживает режим отправки логов в Weights and Biases, но по умолчанию это отключено, для того чтобы включить данный функционал нужно добавить опцию --report-to=wandb в команду запуска обучения.

По завершению обучения при помощи рецепта chat можно запустить интерактивный чат:

impruver run chat ./ruGPT-3.5_13B_lora_saiga2.yaml

Для того чтобы выйти из оболочки чата, используйте комбинацию клавиш Ctrl+D или Ctrl+C.

Подробнее про обучение в wiki проекта.

Лицензия

Данный проект распространяется под лицензией MIT. Подробности в файле LICENSE.

Цитирование

@misc{impruver2024sources,
    author       = {Pavel Rykov},
    title        = {{Impruver: Framework for Training Large Language Models}},
    howpublished = {\url{https://github.com/EvilFreelancer/impruver}},
    year         = {2024}
}

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

1.0.8

Feb 28, 2025

1.0.7

Jan 12, 2025

This version

1.0.6

Jan 8, 2025

1.0.5

Jan 4, 2025

1.0.4

Jan 4, 2025

1.0.3

Dec 29, 2024

1.0.2

Dec 29, 2024

1.0.1

Dec 28, 2024

1.0.0

Dec 25, 2024

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

impruver-1.0.6.tar.gz (36.4 kB view details)

Uploaded Jan 8, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

impruver-1.0.6-py3-none-any.whl (57.0 kB view details)

Uploaded Jan 8, 2025 Python 3

File details

Details for the file impruver-1.0.6.tar.gz.

File metadata

Download URL: impruver-1.0.6.tar.gz
Upload date: Jan 8, 2025
Size: 36.4 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.0.1 CPython/3.12.8

File hashes

Hashes for impruver-1.0.6.tar.gz
Algorithm	Hash digest
SHA256	`0d5c2b463c7c88721c02c9c207f9427f17e37c35743fa15c94d37e3033b2c8d2`
MD5	`e4cb0005a583ada382176bd6c9dc3fb3`
BLAKE2b-256	`d0b068ef7c59adccfdbbbf1e0d9a56b9e9494dd2c01fec198960273bb8b53c6e`

See more details on using hashes here.

File details

Details for the file impruver-1.0.6-py3-none-any.whl.

File metadata

Download URL: impruver-1.0.6-py3-none-any.whl
Upload date: Jan 8, 2025
Size: 57.0 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.0.1 CPython/3.12.8

File hashes

Hashes for impruver-1.0.6-py3-none-any.whl
Algorithm	Hash digest
SHA256	`9c5dfc6b4cf48e784d77dfc680bb18ec791e40c79f7bb9649549d50c62370b4a`
MD5	`05a3ce10edcb24c9bdf2969457f4fedb`
BLAKE2b-256	`58f06420803869ee3c17a96a14c521f2ae73caf1bd557e5e6aa34577aef64f43`

See more details on using hashes here.

impruver 1.0.6

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Impruver: Фреймворк для обучения Больших Языковых Моделей (LLM)

Рекомендованные системные требования

Как установить

Доступные конфигурации

Как пользоваться

Лицензия

Цитирование

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes