INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES

Kalil Garcia Canuto; Warley Gramacho da Silva

doi:10.20873/vol.13n.3pibic202517

INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES

Autores/as

Kalil Garcia Canuto Unversidade Federal do Tocantins
Warley Gramacho da Silva Universidade Federal do Tocantins

DOI:

https://doi.org/10.20873/vol.13n.3pibic202517

Palabras clave:

Aprendizaje profundo, DCGAN, Inteligencia artificial

Resumen

Este proyecto investiga la aplicación de Redes Generativas Adversarias Convolucionales Profundas (DCGANs) para la generación de imágenes sintéticas realistas. Utilizando el 102 Flower Category Dataset, se implementó y entrenó un modelo con el objetivo de generar imágenes en color de flores con una resolución de 128x128 píxeles.

La arquitectura del modelo se basó en los principios propuestos por Radford, Metz y Chintala (2016), con un Generador que utiliza convoluciones transpuestas y un Discriminador que emplea convoluciones con paso (strided convolutions). El entrenamiento se estabilizó mediante Normalización por Lotes (Batch Normalization) y funciones de activación ReLU/LeakyReLU.

La calidad de las muestras generadas se evaluó visualmente y, cuantitativamente, mediante la métrica Fréchet Inception Distance (FID). Los resultados demuestran la capacidad de la arquitectura para aprender la distribución de un conjunto de datos complejo, alcanzando una puntuación FID de 808.74 en la época 600. Este resultado sirve como un punto de partida cuantitativo y evidencia las dificultades de utilizar esta arquitectura para generar imágenes altamente realistas con este dataset en particular.

Citas

GOODFELLOW, Ian J. et al. Generative adversarial networks. 2014. Disponível em: https://arxiv.org/abs/1406.2661. Acesso em: 4 set. 2025.

GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep learning. Cambridge: MIT Press, 2016. Disponível em: http://www.deeplearningbook.org. Acesso em: 4 set. 2025.

HEUSEL, Martin; RAMSAUER, Hubert; UNTERTHINER, Thomas; NESSLER, Bernhard; HOCHREITER, Sepp. GANs trained by a two time-scale update rule converge to a local Nash equilibrium. 2018. Disponível em: https://arxiv.org/abs/1706.08500. Acesso em: 30 ago. 2025.

IOFFE, Sergey; SZEGEDY, Christian. Batch normalization: accelerating deep network training by reducing internal covariate shift. 2015. Disponível em: https://arxiv.org/abs/1502.03167. Acesso em: 22 ago. 2025.

JAYASUMANA, Sadeep et al. Rethinking FID: towards a better evaluation metric for image generation. 2024. Disponível em: https://arxiv.org/abs/2401.09603. Acesso em: 30 ago. 2025.

KARRAS, Tero; AITTALA, Miika; HELLSTEN, Janne; LAINE, Samuli; LEHTINEN, Jaakko; AILA, Timo. Training generative adversarial networks with limited data. 2020. Disponível em: https://arxiv.org/abs/2006.06676. Acesso em: 4 set. 2025.

KINGMA, Diederik P.; BA, Jimmy. Adam: a method for stochastic optimization. 2017. Disponível em: https://arxiv.org/abs/1412.6980. Acesso em: 30 ago. 2025.

RADFORD, Alec; METZ, Luke; CHINTALA, Soumith. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks. 2015. Disponível em: https://arxiv.org/abs/1511.06434. Acesso em: 22 ago. 2025

WAN, Zhijing; WANG, Zhixiang; CHUNG, CheukTing; WANG, Zheng. A survey of dataset refinement for problems in computer vision datasets. 2023. Disponível em: https://arxiv.org/abs/2210.11717. Acesso em: 30 ago. 2025.

Descargas

PDF (Português (Brasil))

Publicado

2026-05-13

Cómo citar

Garcia Canuto, K., & Gramacho da Silva, W. (2026). INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES. DESAFIOS, 13(3), 197–209. https://doi.org/10.20873/vol.13n.3pibic202517

Descargar cita

Número

Vol. 13 Núm. 3 (2026): ESPECIAL PIBIC 2025

Sección

PIBIC 2024-2025

Licencia

Derechos de autor 2026 Kalil Garcia Canuto, Warley Gramacho da Silva

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.

Autores que publicam nesta revista concordam com os seguintes termos:

1. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License (CC BY-NC 4.0), permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.

2. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.

3. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto posterior ao processo editorial.

4. Além disso, o AUTOR é informado e consente com a revista que, portanto, seu artigo pode ser incorporado pela DESAFIOS em bases e sistemas de informação científica existentes (indexadores e bancos de dados atuais) ou a existir no futuro (indexadores e bancos de dados futuros), nas condições definidas por este último em todos os momentos, que envolverá, pelo menos, a possibilidade de que os titulares desses bancos de dados possam executar as seguintes ações sobre o artigo:

a. Reproduzir, transmitir e distribuir o artigo, no todo ou em parte sob qualquer forma ou meio de transmissão eletrônica existente ou desenvolvida no futuro, incluindo a transmissão eletrônica para fins de pesquisa, visualização e impressão;

b. Reproduzir e distribuir, no todo ou em parte, o artigo na impressão.

c. Capacidade de traduzir certas partes do artigo.

d. Extrair figuras, tabelas, ilustrações e outros objetos gráficos e capturar metadados, legendas e artigo relacionado para fins de pesquisa, visualização e impressão.

e. Transmissão, distribuição e reprodução por agentes ou autorizada pelos proprietários de distribuidoras de bases de dados.

f. A preparação de citações bibliográficas, sumários e índices e referências de captura relacionados de partes selecionadas do artigo.

g. Digitalizar e / ou armazenar imagens e texto de artigo eletrônico.

INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES

Autores/as

DOI:

Palabras clave:

Resumen

Citas

Descargas

Publicado

Cómo citar

Número

Sección

Licencia

Artículos más leídos del mismo autor/a

Artículos similares

Desarrollado por

Enviar un artículo

Idioma

Información

Sobre este sistema de publicação