Evaluation of a Sliding Window mechanism as DataAugmentation over Emotion Detection on Speech
DOI:
https://doi.org/10.20873/uft.2675-3588.2021.v2n1.p11-18Palavras-chave:
Speech Emotion Recognition, Voice Processing, Machine Learning, Deep Neural NetworksResumo
Emotion analysis is an important field of study, with many applications for security, financial, and politician. Despite beinga subjective branch of study, emotion analysis can be simulated by Machine Learning algorithms that are trained for this purpose, throughcataloged audio datasets, they can recognize patterns in these media that could be related to corresponding emotion. Neural NetworkAlgorithms are able to work on the recognition of these emotions, with a focus only on audio, known as Speech Emotion Recognition(SER). Neural Network Algorithms generally obtain unequal averages of referring results such as recognition of emotions when applied todifferent audio datasets. This research evaluates a Data Augmentation method called Slide Window, which generates more data samplesin order to increase the averages of classification rates. The method has been applied to three public datasets: EMO-DB, SAVEE, and RAVEDESS. The experiments have shown effectiveness in the increasing of the recognition rates of about to 11.95% on the EMO-DBbase, 22.76% on SAVEE, and 18.82% on RAVEDESS when compared to other approaches in the literature.
Downloads
Publicado
Como Citar
Licença
Copyright (c) 2021 Matheus Almeida Farias da Silva, Rafael Lima de Carvalho, Tiago da Silva Almeida
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.
Autores que publicam neste periódico concordam com os seguintes termos:
- Autores mantém os direitos autorais e concedem ao periódico o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Creative Commons Attribution License (CC BY-NC 4.0), permitindo o compartilhamento do trabalho com reconhecimento da autoria do trabalho e publicação inicial neste periódico;
- Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada neste periódico (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial neste periódico;
- Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto posterior ao processo editorial;
- Além disso, o AUTOR é informado e consente com o periódico que, portanto, seu artigo pode ser incorporado pela Academic Journal on Computing, Engineering and Applied Mathematics em bases e sistemas de informação científica existentes (indexadores e bancos de dados atuais) ou a existir no futuro (indexadores e bancos de dados futuros), nas condições definidas por este último em todos os momentos, que envolverá, pelo menos, a possibilidade de que os titulares desses bancos de dados possam executar as seguintes ações sobre o artigo:
- Reproduzir, transmitir e distribuir o artigo, no todo ou em parte sob qualquer forma ou meio de transmissão eletrônica existente ou desenvolvida no futuro, incluindo a transmissão eletrônica para fins de pesquisa, visualização e impressão;
- Reproduzir e distribuir, no todo ou em parte, o artigo na impressão;
- Traduzir certas partes do artigo;
- Extrair figuras, tabelas, ilustrações e outros objetos gráficos e capturar metadados, legendas e artigo relacionado para fins de pesquisa, visualização e impressão;
- Transmissão, distribuição e reprodução por agentes ou autorizada pelos proprietários de distribuidoras de bases de dados;
- A preparação de citações bibliográficas, sumários e índices e referências de captura relacionados de partes selecionadas do artigo;
- Digitalizar e / ou armazenar imagens e texto de artigo eletrônico.