Descrição formal das funções de ativação de modelos de aprendizado de máquina

Autores

  • Julia Assunção Leal Universidade Federal do Tocantins https://orcid.org/0009-0002-5254-8919
  • Hellena Christina Fernandes Apolinário Curso Bacharelado em Ciência da Computação, Universidade Federal do Tocantins (UFT), Palmas/TO
  • Rogério Azevedo Rocha Curso Bacharelado em Ciência da Computação, Universidade Federal do Tocantins (UFT), Palmas/TO

DOI:

https://doi.org/10.20873/uft.2675-3588.2025.v6n1.p9-18

Palavras-chave:

Inteligência Artificial, Matemática Aplicada, Funções de Ativação, ReLU, Sigmóide, TanH, Softmax, Método do gradiente

Resumo

Modelos de inteligência artificial são cada vez mais comuns em vários aspectos do dia a dia. Não só nos casos mais emblemáticas, mas também para casos corriqueiros como em sistemas de recomendação em sites de compras. Nesse sentido, é muito importante o entendimento de como esses modelos funcionam por parte dos desenvolvedores. Contudo, o uso massivo de bibliotecas para utilização desses modelos pode desfavorecer esse entendimento. Assim, esse trabalho traz a definição e demonstração formal das funções de ativação em modelos de aprendizado de máquina. Esse é um ponto fundamental para a introdução do assunto à novos desenvolvedores e cientistas que trabalharão na área. A descrição formal se aplica às clássicas funções ReLU, Sigmóide, tangente hiperbólica, softmax e gradiente descendente. Além disso, também são discutidos o impacto dessas funções no modelo LeNet-5 aplicado à base de dados MNIST.

Publicado

2025-03-13

Como Citar

[1]
Assunção Leal, J. et al. 2025. Descrição formal das funções de ativação de modelos de aprendizado de máquina. Academic Journal on Computing, Engineering and Applied Mathematics. 6, 1 (mar. 2025), 9–18. DOI:https://doi.org/10.20873/uft.2675-3588.2025.v6n1.p9-18.

Edição

Seção

Artigos de Pesquisa

Categorias