Abstract:
Este trabalho visa desenvolver um modelo explicável de sistema de classificação de organismos marinhos a partir de dados obtidos por meio de ecossondas. As ecossondas funcionam normalmente acopladas na parte de baixo de uma embarcação, enviando sinais acústicos para detectar peixes, moluscos, zooplâncton ou outros objetos na coluna de água, gerando registros acústicos que aparecem nos ecogramas. Atualmente, o método utilizado para classificar os registros acústicos é a caracterização de ecotipos, onde certos padrões nos registros acústicos são identificados visualmente por um especialista que, tendo por base informações chamadas descritores, determina uma classe ao registro. Para fazer a classificação utilizando meios computacionais, descritores foram extraídos de ecogramas obtidos de pesquisa pesqueira, que então foram tratados para filtrar as características que descreviam melhor os registros contidos nos ecogramas. Estes dados foram utilizados para o gerar os modelos a partir de três algoritmos de classificação de fácil explicabilidade, um que utiliza árvores de decisão e dois baseados em regras fuzzy. Os modelos obtidos foram avaliados por medidas de acurácia baseadas nos desempenhosdas classificações no treinamento. Os modelos foram também avaliados por um especialista da área, para análise de sua utilidade para descrever as espécies trabalhadas e o que poderia ser observado nestes resultados. Os modelos gerados pelos algoritmos tiveram um bom desempenho para os dados disponíveis, aonde os dados foram principalmente classificados por descritores geográficos e que, de acordo com um especialista da área, representam uma distribuição próxima da que realmente acontece para as espécies estudadas nessa região e época do ano trabalhadas.
This work aims to develop an explainable model of classification system of marine organisms from data obtained through ecosystems. Echo sounders typically work attached to the underside of a vessel, sending acoustic signals to detect fish, mollusks, zooplankton, or other objects in the water column, generating acoustic records that appear on echograms. Currently, the method used to classify acoustic records is the characterization of ecotypes, where certain patterns in acoustic records are visually identified by a specialist who, based on information called descriptors, determines a class for the record. To make the classification using computational means, descriptors were extracted from ecograms obtained from fishing research, which were then treated to filter the characteristics that best described the records contained in the ecograms. These data were used to generate the models from three easy-to-explain classification algorithms, one using decision trees and two fuzzy rules. The obtained models were evaluated by accuracy measures based on the performance of the training classifications. The models were also evaluated by an expert in the field, to analyze their usefulness to describe the worked species and what could be observed in these results. The models generated by the algorithms performed well for the available data, where the data were mainly classified by geographic descriptors and which, according to an expert in the field, represent a close distribution of what actually happens for the species studied in this region and time of the year of the data worked.