Abstract:
Sonares de imageamento frontal são sensores de percepção subaquática que não são afetados pela turbidez. São empregados para auxiliar Veículos Operados Remotamente (ROVs) nas tarefas de exploração, navegação e mapeamento de regiões. Apesar das vantagens do uso de imagens acústicas sobre as imagens ópticas, as primeiras possuem inúmeros desafios inerentes à sua aquisição e representação. Algoritmos de Visão Computacional clássicos possuem restrições quando aplicados a imagens acústicas. O presente trabalho tem como objetivo propor um método para o problema de comparar duas cenas subaquáticas a partir de imagens acústicas obtidas por Forward Looking Sonar - Sonar de Varredura Frontal (FLS), avaliando o par de imagens quanto às suas similaridades. São descritas e comparadas algumas das principais abordagens de aprendizagem de profunda para o problema. Dentre elas foi proposta uma arquitetura de regressão para análise da cena, que foi comparada com um método desenvolvido especificamente para comparação de cenas a partir de imagens Forward Looking Sonar - Sonar de Varredura Frontal (FLS). Na comparação descrita, a arquitetura de regressão de similaridade proposta obteve melhores resultados. Também foi proposta uma nova estratégia de extração de características para imagens de FLS usando aprendizagem de métrica. Esta estratégia foi comparada com outra abordagem estado-da-arte para obtenção de características, também obtendo resultados superiores na tarefa de recuperação de imagens.
Forward-looking sonars are perception sensors unaected by underwater turbidity. FLS are used in Remotely Operated Vehicles to help them in the tasks of exploration, navigation and region mapping. Besides the advantages of working with acoustic images rather than optical images, the former presents various challenges inherent to their construction. Classic Computer Vision algorithms have many restrictions when applied to acoustic images. This work has as main goal the proposal of a method for the problem of comparing two underwater scenes perceived with FLS acoustic images, evaluating the image pair with respect to their similarities. It was described and compared some of the main deep learning approaches for the problem. One architecture for similarity regression of the underwater scenes was proposed. This novel architecture was compared with a method specifcally designed for underwater scene comparison and achieved better results. Also, a new strategy for automatic feature extraction of FLS images was proposed using deep metric learning. This strategy was compared with a new state-of-the-art approach for feature extraction, also achieving superior results in the task of acoustic image retrieval.