INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES
DOI:
https://doi.org/10.20873/vol.13n.3pibic202517Palabras clave:
Aprendizaje profundo, DCGAN, Inteligencia artificialResumen
Este proyecto investiga la aplicación de Redes Generativas Adversarias Convolucionales Profundas (DCGANs) para la generación de imágenes sintéticas realistas. Utilizando el 102 Flower Category Dataset, se implementó y entrenó un modelo con el objetivo de generar imágenes en color de flores con una resolución de 128x128 píxeles.
La arquitectura del modelo se basó en los principios propuestos por Radford, Metz y Chintala (2016), con un Generador que utiliza convoluciones transpuestas y un Discriminador que emplea convoluciones con paso (strided convolutions). El entrenamiento se estabilizó mediante Normalización por Lotes (Batch Normalization) y funciones de activación ReLU/LeakyReLU.
La calidad de las muestras generadas se evaluó visualmente y, cuantitativamente, mediante la métrica Fréchet Inception Distance (FID). Los resultados demuestran la capacidad de la arquitectura para aprender la distribución de un conjunto de datos complejo, alcanzando una puntuación FID de 808.74 en la época 600. Este resultado sirve como un punto de partida cuantitativo y evidencia las dificultades de utilizar esta arquitectura para generar imágenes altamente realistas con este dataset en particular.
Citas
GOODFELLOW, Ian J. et al. Generative adversarial networks. 2014. Disponível em: https://arxiv.org/abs/1406.2661. Acesso em: 4 set. 2025.
GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep learning. Cambridge: MIT Press, 2016. Disponível em: http://www.deeplearningbook.org. Acesso em: 4 set. 2025.
HEUSEL, Martin; RAMSAUER, Hubert; UNTERTHINER, Thomas; NESSLER, Bernhard; HOCHREITER, Sepp. GANs trained by a two time-scale update rule converge to a local Nash equilibrium. 2018. Disponível em: https://arxiv.org/abs/1706.08500. Acesso em: 30 ago. 2025.
IOFFE, Sergey; SZEGEDY, Christian. Batch normalization: accelerating deep network training by reducing internal covariate shift. 2015. Disponível em: https://arxiv.org/abs/1502.03167. Acesso em: 22 ago. 2025.
JAYASUMANA, Sadeep et al. Rethinking FID: towards a better evaluation metric for image generation. 2024. Disponível em: https://arxiv.org/abs/2401.09603. Acesso em: 30 ago. 2025.
KARRAS, Tero; AITTALA, Miika; HELLSTEN, Janne; LAINE, Samuli; LEHTINEN, Jaakko; AILA, Timo. Training generative adversarial networks with limited data. 2020. Disponível em: https://arxiv.org/abs/2006.06676. Acesso em: 4 set. 2025.
KINGMA, Diederik P.; BA, Jimmy. Adam: a method for stochastic optimization. 2017. Disponível em: https://arxiv.org/abs/1412.6980. Acesso em: 30 ago. 2025.
RADFORD, Alec; METZ, Luke; CHINTALA, Soumith. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks. 2015. Disponível em: https://arxiv.org/abs/1511.06434. Acesso em: 22 ago. 2025
WAN, Zhijing; WANG, Zhixiang; CHUNG, CheukTing; WANG, Zheng. A survey of dataset refinement for problems in computer vision datasets. 2023. Disponível em: https://arxiv.org/abs/2210.11717. Acesso em: 30 ago. 2025.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2026 Kalil Garcia Canuto, Warley Gramacho da Silva

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Autores que publicam nesta revista concordam com os seguintes termos:
1. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License (CC BY-NC 4.0), permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.
2. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
3. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto posterior ao processo editorial.
4. Além disso, o AUTOR é informado e consente com a revista que, portanto, seu artigo pode ser incorporado pela DESAFIOS em bases e sistemas de informação científica existentes (indexadores e bancos de dados atuais) ou a existir no futuro (indexadores e bancos de dados futuros), nas condições definidas por este último em todos os momentos, que envolverá, pelo menos, a possibilidade de que os titulares desses bancos de dados possam executar as seguintes ações sobre o artigo:
a. Reproduzir, transmitir e distribuir o artigo, no todo ou em parte sob qualquer forma ou meio de transmissão eletrônica existente ou desenvolvida no futuro, incluindo a transmissão eletrônica para fins de pesquisa, visualização e impressão;
b. Reproduzir e distribuir, no todo ou em parte, o artigo na impressão.
c. Capacidade de traduzir certas partes do artigo.
d. Extrair figuras, tabelas, ilustrações e outros objetos gráficos e capturar metadados, legendas e artigo relacionado para fins de pesquisa, visualização e impressão.
e. Transmissão, distribuição e reprodução por agentes ou autorizada pelos proprietários de distribuidoras de bases de dados.
f. A preparação de citações bibliográficas, sumários e índices e referências de captura relacionados de partes selecionadas do artigo.
g. Digitalizar e / ou armazenar imagens e texto de artigo eletrônico.
