INTELIGÊNCIA ARTIFICIAL NA GERAÇÃO DE IMAGENS REALISTAS: TÉCNICAS E APLICAÇÕES
DOI:
https://doi.org/10.20873/vol.13n.3pibic202517Palavras-chave:
Inteligência artificial, DCGAN, aprendizado profundoResumo
A qualidade das amostras geradas foi avaliada visualmente e, quantitativamente, pela métrica Fréchet Inception Distance (FID). Os resultados demonstram a capacidade da arquitetura de aprender a distribuição de um dataset complexo, atingindo um score FID de 808.74 na época 600. Este resultado serve como um ponto de partida quantitativo e mostra as dificuldades de usar esta arquitetura para gerar imagens muito realistas com este dataset.
Referências
GOODFELLOW, Ian J. et al. Generative adversarial networks. 2014. Disponível em: https://arxiv.org/abs/1406.2661. Acesso em: 4 set. 2025.
GOODFELLOW, Ian; BENGIO, Yoshua; COURVILLE, Aaron. Deep learning. Cambridge: MIT Press, 2016. Disponível em: http://www.deeplearningbook.org. Acesso em: 4 set. 2025.
HEUSEL, Martin; RAMSAUER, Hubert; UNTERTHINER, Thomas; NESSLER, Bernhard; HOCHREITER, Sepp. GANs trained by a two time-scale update rule converge to a local Nash equilibrium. 2018. Disponível em: https://arxiv.org/abs/1706.08500. Acesso em: 30 ago. 2025.
IOFFE, Sergey; SZEGEDY, Christian. Batch normalization: accelerating deep network training by reducing internal covariate shift. 2015. Disponível em: https://arxiv.org/abs/1502.03167. Acesso em: 22 ago. 2025.
JAYASUMANA, Sadeep et al. Rethinking FID: towards a better evaluation metric for image generation. 2024. Disponível em: https://arxiv.org/abs/2401.09603. Acesso em: 30 ago. 2025.
KARRAS, Tero; AITTALA, Miika; HELLSTEN, Janne; LAINE, Samuli; LEHTINEN, Jaakko; AILA, Timo. Training generative adversarial networks with limited data. 2020. Disponível em: https://arxiv.org/abs/2006.06676. Acesso em: 4 set. 2025.
KINGMA, Diederik P.; BA, Jimmy. Adam: a method for stochastic optimization. 2017. Disponível em: https://arxiv.org/abs/1412.6980. Acesso em: 30 ago. 2025.
RADFORD, Alec; METZ, Luke; CHINTALA, Soumith. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks. 2015. Disponível em: https://arxiv.org/abs/1511.06434. Acesso em: 22 ago. 2025
WAN, Zhijing; WANG, Zhixiang; CHUNG, CheukTing; WANG, Zheng. A survey of dataset refinement for problems in computer vision datasets. 2023. Disponível em: https://arxiv.org/abs/2210.11717. Acesso em: 30 ago. 2025.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2026 Kalil Garcia Canuto, Warley Gramacho da Silva

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
Autores que publicam nesta revista concordam com os seguintes termos:
1. Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License (CC BY-NC 4.0), permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial nesta revista.
2. Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
3. Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto posterior ao processo editorial.
4. Além disso, o AUTOR é informado e consente com a revista que, portanto, seu artigo pode ser incorporado pela DESAFIOS em bases e sistemas de informação científica existentes (indexadores e bancos de dados atuais) ou a existir no futuro (indexadores e bancos de dados futuros), nas condições definidas por este último em todos os momentos, que envolverá, pelo menos, a possibilidade de que os titulares desses bancos de dados possam executar as seguintes ações sobre o artigo:
a. Reproduzir, transmitir e distribuir o artigo, no todo ou em parte sob qualquer forma ou meio de transmissão eletrônica existente ou desenvolvida no futuro, incluindo a transmissão eletrônica para fins de pesquisa, visualização e impressão;
b. Reproduzir e distribuir, no todo ou em parte, o artigo na impressão.
c. Capacidade de traduzir certas partes do artigo.
d. Extrair figuras, tabelas, ilustrações e outros objetos gráficos e capturar metadados, legendas e artigo relacionado para fins de pesquisa, visualização e impressão.
e. Transmissão, distribuição e reprodução por agentes ou autorizada pelos proprietários de distribuidoras de bases de dados.
f. A preparação de citações bibliográficas, sumários e índices e referências de captura relacionados de partes selecionadas do artigo.
g. Digitalizar e / ou armazenar imagens e texto de artigo eletrônico.
