INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES

Autores/as

  • Kalil Garcia Canuto Unversidade Federal do Tocantins
  • Warley Gramacho da Silva Universidade Federal do Tocantins

DOI:

https://doi.org/10.20873/vol.13n.3pibic202517

Palabras clave:

Aprendizaje profundo, DCGAN, Inteligencia artificial

Resumen

Este proyecto investiga la aplicación de Redes Generativas Adversarias Convolucionales Profundas (DCGANs) para la generación de imágenes sintéticas realistas. Utilizando el 102 Flower Category Dataset, se implementó y entrenó un modelo con el objetivo de generar imágenes en color de flores con una resolución de 128x128 píxeles.

La arquitectura del modelo se basó en los principios propuestos por Radford, Metz y Chintala (2016), con un Generador que utiliza convoluciones transpuestas y un Discriminador que emplea convoluciones con paso (strided convolutions). El entrenamiento se estabilizó mediante Normalización por Lotes (Batch Normalization) y funciones de activación ReLU/LeakyReLU.

La calidad de las muestras generadas se evaluó visualmente y, cuantitativamente, mediante la métrica Fréchet Inception Distance (FID). Los resultados demuestran la capacidad de la arquitectura para aprender la distribución de un conjunto de datos complejo, alcanzando una puntuación FID de 808.74 en la época 600. Este resultado sirve como un punto de partida cuantitativo y evidencia las dificultades de utilizar esta arquitectura para generar imágenes altamente realistas con este dataset en particular.

Citas

GOODFELLOW, Ian J. et al. Generative adversarial networks. 2014. Disponível em: https://arxiv.org/abs/1406.2661. Acesso em: 4 set. 2025.

GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep learning. Cambridge: MIT Press, 2016. Disponível em: http://www.deeplearningbook.org. Acesso em: 4 set. 2025.

HEUSEL, Martin; RAMSAUER, Hubert; UNTERTHINER, Thomas; NESSLER, Bernhard; HOCHREITER, Sepp. GANs trained by a two time-scale update rule converge to a local Nash equilibrium. 2018. Disponível em: https://arxiv.org/abs/1706.08500. Acesso em: 30 ago. 2025.

IOFFE, Sergey; SZEGEDY, Christian. Batch normalization: accelerating deep network training by reducing internal covariate shift. 2015. Disponível em: https://arxiv.org/abs/1502.03167. Acesso em: 22 ago. 2025.

JAYASUMANA, Sadeep et al. Rethinking FID: towards a better evaluation metric for image generation. 2024. Disponível em: https://arxiv.org/abs/2401.09603. Acesso em: 30 ago. 2025.

KARRAS, Tero; AITTALA, Miika; HELLSTEN, Janne; LAINE, Samuli; LEHTINEN, Jaakko; AILA, Timo. Training generative adversarial networks with limited data. 2020. Disponível em: https://arxiv.org/abs/2006.06676. Acesso em: 4 set. 2025.

KINGMA, Diederik P.; BA, Jimmy. Adam: a method for stochastic optimization. 2017. Disponível em: https://arxiv.org/abs/1412.6980. Acesso em: 30 ago. 2025.

RADFORD, Alec; METZ, Luke; CHINTALA, Soumith. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks. 2015. Disponível em: https://arxiv.org/abs/1511.06434. Acesso em: 22 ago. 2025

WAN, Zhijing; WANG, Zhixiang; CHUNG, CheukTing; WANG, Zheng. A survey of dataset refinement for problems in computer vision datasets. 2023. Disponível em: https://arxiv.org/abs/2210.11717. Acesso em: 30 ago. 2025.

Publicado

2026-05-13

Cómo citar

Garcia Canuto, K., & Gramacho da Silva, W. (2026). INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES. DESAFIOS, 13(3), 197–209. https://doi.org/10.20873/vol.13n.3pibic202517

Número

Sección

PIBIC 2024-2025

Artículos más leídos del mismo autor/a

Artículos similares

1 2 3 4 > >> 

También puede Iniciar una búsqueda de similitud avanzada para este artículo.