Ciência e Tecnologia: bases para o Desenvolvimento Social

20 a 25 de outubro de 2014

Trabalho 2849

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Informações geográficas, processamento de imagens e planejamento do espaço
Setor Departamento de Engenharia Elétrica
Bolsa PIBIC/CNPq
Conclusão de bolsa Sim
Apoio financeiro CNPq
Primeiro autor Lucas Graciano Cardoso
Orientador KETIA SOARES MOREIRA
Outros membros ANDRE GOMES TORRES, Lídia da Silva Freitas, Vinicius Leonardo Gadioli da Silva
Título Aperfeiçoamento do estudo do Movimento Facial por meio de Fluxo Óptico
Resumo O estudo da relação existente entre o movimento facial e a acústica da fala é importante para a compreensão do processo de produção da fala. O objetivo deste trabalho é estudar os movimentos faciais em ambientes com e sem ruído, ou seja, com e sem a presença do Efeito Lombard, e sua relação com a acústica da fala através de estimadores lineares. Na representação do movimento facial, a extração dos vetores de velocidade deste movimento é feita por meio do fluxo óptico através do método iterativo de Horn e Schunk. O fluxo óptico é obtido respeitando com rigor as restrições advindas do método utilizado de modo a se obter os melhores vetores de movimento possíveis, isto é, vetores de velocidade que indiquem mais fielmente o movimento da face durante a fala e com o mínimo de erros. De posse dos vetores de movimento é observado que as cinco primeiras componentes principais extraídas após o uso do método iterativo representam cerca de 90% da variância observada nos dados do movimento facial e que são suficientes para representar o fluxo óptico do movimento facial. Para a acústica da fala são calculados os parâmetros LSP, que estão relacionados com a geometria do trato vocal. Técnicas de estimação são aplicadas a palavras isoladas retiradas de um discurso onde locutores proferem frases e estão submetidos a diferentes tipos de ruídos que são classificados em nenhum ruído, ruído baixo, médio e alto. Os dados obtidos dos vídeos onde o locutor é submetido a um ruído alto foram utilizados para treinamento do modelo matemático pelo fato do mesmo movimentar mais a boca para proferir as palavras quando comparado com as outras situações de ruído. Com as cinco componentes principais são determinados os parâmetros LSP por meio dos estimadores modelados. Os resultados numéricos mostram que a predição das faixas de frequência dos parâmetros LSP feitas pelo modelo matemático obtiveram uma similaridade com os dados esperados que chegou a atingir 97% na faixa de frequências em torno de 2033 Hz, melhor caso; e 55% na faixa de frequências em torno de 3552 Hz, pior caso. Espera-se que tanto a metodologia utilizada neste trabalho quanto os resultados obtidos possam ajudar em trabalhos futuros e fornecer contribuições para a área de Visão Computacional.
Palavras-chave Movimento facial, Acústica da fala, Estimadores lineares
Forma de apresentação..... Painel
Gerado em 0,61 segundos.