Skip to main content

No project description provided

Project description

Создание CNN для распознавания сгенерированных изображений

Цель

Цель исследования с нуля обучить CNN распознавать сгенерированные изображения.

Результаты

Первые результаты

Для первого обучения были выбраны такие гиперпараметры:

Параметр Значение
Количество conv блоков 4
Количество слоев классификатора 2
Размер датасета 1000
train / val 0.5
Эпох 30

Результат:

Результат Значение
Train Accuracy 0.64
Validation Accuracy 0.62

Точность на обучении и валидации остается ниже 65%, что близко к случайному угадыванию (50%). Присутствует нестабильность, особенно на валидации, возможно, переобучение на шум или нерегулярные признаки. Также модель не переобучается сильно, но и не обучается хорошо.

Анализируя Confusion Matrix, можно сказать, что настоящие изображения распознается лучше, чем сгенерированные. Модель очень часто принимает сгенерированное изображение за реальное (126 раз предсказано реальное, но являлось сгенерированным)

Модель пока не уверенно распознает сгенерированные изображения.

На следующем цикле обучения стоит попробовать увеличить датасет (1000 изображений, которые использовались в этом цикле, довольно мало). Также попробовать добавить больше conv блоков, слоев классификатора и увеличить число базовых каналов до 128 (кажется, что у модели мало параметров и она довольно узкая чтобы распознавать сгенерированные изображения).

Вторая итерация

Гиперпараметры:

Параметр Значение
Количество conv блоков 6
Количество слоев классификатора 2
Размер датасета 5000
train / val 0.7
Эпох 30

Результат:

Результат Значение
Train Accuracy 0.50
Validation Accuracy 0.50

Получился ужасный результат, модель абсолютно случайно делает предсказания и не обучается вообще. Проблема скорее всего в том что модель слишком большая для малого датасета.

Confusion Matrix выглядят очень странно, особенно на валидации 1500 / 1500 раз модель предсказала изображение как сгенерированное. Почему так произошло - не понятно, возможно, это также связано с тем что размер модели и кол-во данных подобраны не верно.

В этом исследование DeepGuardNet: A Novel CNN Architecture for DeepFake Image Detection обучали модель с очень похожей на мою архитектуру, но заточенную под обнаружение DeepFake в нем они использовали 140002 изображений для обучения модели из 5 conv блоков, в каждом из которых не больше 16 каналов + 1 слой классификатора.

Прошлое предположение:

Также попробовать добавить больше conv блоков, слоев классификатора и увеличить число базовых каналов до 128

Было неверным, нужно оставить предыдущую архитектуру и увеличить кол-во данных. В используемом датасете есть 2.5 млн картинок около 900 тыс настоящие, остальные - сгенерированные ИИ. Для следующего обучения стоит попробовать взять хотя бы 200 000 изображений.

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ai_image_detector_research-0.2.0.tar.gz (12.1 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

ai_image_detector_research-0.2.0-py3-none-any.whl (13.7 kB view details)

Uploaded Python 3

File details

Details for the file ai_image_detector_research-0.2.0.tar.gz.

File metadata

  • Download URL: ai_image_detector_research-0.2.0.tar.gz
  • Upload date:
  • Size: 12.1 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: poetry/2.1.3 CPython/3.11.9 Linux/5.15.167.4-microsoft-standard-WSL2

File hashes

Hashes for ai_image_detector_research-0.2.0.tar.gz
Algorithm Hash digest
SHA256 56543570c6593e57a8d91c176a1f02946e1361a85a21bafd6a7cae2dd9a9034d
MD5 5ddadaf1cb45060844cdbef940979f3d
BLAKE2b-256 ee6e01b96177b1479def740c35c8550bfc5347c597a21543003ce15a67d820c6

See more details on using hashes here.

File details

Details for the file ai_image_detector_research-0.2.0-py3-none-any.whl.

File metadata

File hashes

Hashes for ai_image_detector_research-0.2.0-py3-none-any.whl
Algorithm Hash digest
SHA256 fe8bc985ee4a3d14cdf0eece018839e4507427f0756532eaa73b4d35d946cd50
MD5 2ec70c4d54d10cd65bef65e108834252
BLAKE2b-256 847d0a263fdb85b3dec0cc7921247a1924f215506fbf727932487916df5f2817

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page