No project description provided
Project description
Создание CNN для распознавания сгенерированных изображений
Цель
Цель исследования с нуля обучить CNN распознавать сгенерированные изображения.
Результаты
Первые результаты
Для первого обучения были выбраны такие гиперпараметры:
| Параметр | Значение |
|---|---|
| Количество conv блоков | 4 |
| Количество слоев классификатора | 2 |
| Размер датасета | 1000 |
| train / val | 0.5 |
| Эпох | 30 |
Результат:
| Результат | Значение |
|---|---|
| Train Accuracy | 0.64 |
| Validation Accuracy | 0.62 |
Точность на обучении и валидации остается ниже 65%, что близко к случайному угадыванию (50%). Присутствует нестабильность, особенно на валидации, возможно, переобучение на шум или нерегулярные признаки. Также модель не переобучается сильно, но и не обучается хорошо.
Анализируя Confusion Matrix, можно сказать, что настоящие изображения распознается лучше, чем сгенерированные. Модель очень часто принимает сгенерированное изображение за реальное (126 раз предсказано реальное, но являлось сгенерированным)
Модель пока не уверенно распознает сгенерированные изображения.
На следующем цикле обучения стоит попробовать увеличить датасет (1000 изображений, которые использовались в этом цикле, довольно мало). Также попробовать добавить больше conv блоков, слоев классификатора и увеличить число базовых каналов до 128 (кажется, что у модели мало параметров и она довольно узкая чтобы распознавать сгенерированные изображения).
Вторая итерация
Гиперпараметры:
| Параметр | Значение |
|---|---|
| Количество conv блоков | 6 |
| Количество слоев классификатора | 2 |
| Размер датасета | 5000 |
| train / val | 0.7 |
| Эпох | 30 |
Результат:
| Результат | Значение |
|---|---|
| Train Accuracy | 0.50 |
| Validation Accuracy | 0.50 |
Получился ужасный результат, модель абсолютно случайно делает предсказания и не обучается вообще. Проблема скорее всего в том что модель слишком большая для малого датасета.
Confusion Matrix выглядят очень странно, особенно на валидации 1500 / 1500 раз модель предсказала изображение как сгенерированное. Почему так произошло - не понятно, возможно, это также связано с тем что размер модели и кол-во данных подобраны не верно.
В этом исследование DeepGuardNet: A Novel CNN Architecture for DeepFake Image Detection обучали модель с очень похожей на мою архитектуру, но заточенную под обнаружение DeepFake в нем они использовали 140002 изображений для обучения модели из 5 conv блоков, в каждом из которых не больше 16 каналов + 1 слой классификатора.
Прошлое предположение:
Также попробовать добавить больше conv блоков, слоев классификатора и увеличить число базовых каналов до 128
Было неверным, нужно оставить предыдущую архитектуру и увеличить кол-во данных. В используемом датасете есть 2.5 млн картинок около 900 тыс настоящие, остальные - сгенерированные ИИ. Для следующего обучения стоит попробовать взять хотя бы 200 000 изображений.
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file ai_image_detector_research-0.2.0.tar.gz.
File metadata
- Download URL: ai_image_detector_research-0.2.0.tar.gz
- Upload date:
- Size: 12.1 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/2.1.3 CPython/3.11.9 Linux/5.15.167.4-microsoft-standard-WSL2
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
56543570c6593e57a8d91c176a1f02946e1361a85a21bafd6a7cae2dd9a9034d
|
|
| MD5 |
5ddadaf1cb45060844cdbef940979f3d
|
|
| BLAKE2b-256 |
ee6e01b96177b1479def740c35c8550bfc5347c597a21543003ce15a67d820c6
|
File details
Details for the file ai_image_detector_research-0.2.0-py3-none-any.whl.
File metadata
- Download URL: ai_image_detector_research-0.2.0-py3-none-any.whl
- Upload date:
- Size: 13.7 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/2.1.3 CPython/3.11.9 Linux/5.15.167.4-microsoft-standard-WSL2
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
fe8bc985ee4a3d14cdf0eece018839e4507427f0756532eaa73b4d35d946cd50
|
|
| MD5 |
2ec70c4d54d10cd65bef65e108834252
|
|
| BLAKE2b-256 |
847d0a263fdb85b3dec0cc7921247a1924f215506fbf727932487916df5f2817
|