Uma análise do impacto da diversidade sobre o resultado do empilhamento de classificadores supervisionados

Lanes, Mariele de Almeida

dc.contributor.advisor	Borges, Eduardo Nunes
dc.contributor.author	Lanes, Mariele de Almeida
dc.date.accessioned	2020-03-27T20:06:28Z
dc.date.available	2020-03-27T20:06:28Z
dc.date.issued	2017
dc.identifier.citation	LANES, Mariele de Almeida. Uma análise do impacto da diversidade sobre o resultado do empilhamento de classificadores supervisionados. 2017. 70 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2017.	pt_BR
dc.identifier.uri	http://repositorio.furg.br/handle/1/8486
dc.description.abstract	Devido ao crescimento da pesquisa na área de reconhecimento de padrões, cada vez mais são testados os limites das técnicas utilizadas para a tarefa de classificação. Com isso, percebe-se que classificadores especializados e devidamente configurados são bastante eficazes. No entanto, não é uma tarefa trivial escolher o classificador mais adequado para tratar um determinado problema e configurá-lo corretamente. Além disso, não existe um algoritmo ideal para resolver todos os problemas de predição. Dessa forma, a fim de melhorar o resultado do processo de classificação, algumas técnicas combinam o conhecimento adquirido individualmente pelos algoritmos de aprendizagem visando descobrir novos padrões ainda não identificados. Entre estas técnicas, destaca-se a estratégia de empilhamento (stacking). Esta estratégia consiste na combinação dos resultados dos classificadores base, induzidos por vários algoritmos de aprendizado utilizando o mesmo conjunto de dados, por meio de outro classificador chamado de meta-classificador. O objetivo geral deste trabalho é avaliar o impacto da diversidade dos classificadores na qualidade do empilhamento, tendo como objetivos específicos estudar o método de empilhamento e a diversidade dos classificadores supervisionados. A abordagem proposta é baseada na afirmação de que quanto maior a diversidade dos padrões aprendidos pelos classificadores base, maior será a qualidade do empilhamento. Além disso, realizamos uma série de experimentos que mostram o impacto de múltiplas medidas de diversidade sobre o ganho de empilhamento, considerando muitos conjuntos de dados reais extraídos do repositório de aprendizado de máquina UCI e algumas bases de dados sintéticas com diferentes distribuições espaciais bidimensionais para auxiliar na validação por inspeção visual. A partir dos resultados desses experimentos, percebe-se que não existe uma relação significativa entre diversidade e qualidade do empilhamento.	pt_BR
dc.description.abstract	Due to the growth of research in pattern recognition area, the limits of the techniques used for the classification task are increasingly tested. Thus, it is clear that specialized and properly configured classifiers are quite effective. However, it is not a trivial task to choose the most appropriate classifier for deal with a particular problem and set it up properly. In addition, there is no optimal algorithm to solve all prediction problems. Thus, in order to improve the results of the classification process, some techniques combine the knowledge acquired individually by the learning algorithms in order to discover new patterns not yet identified. Among these techniques, there is the stacking strategy. This strategy consists in the combination of outputs of base classifiers, induced by several learning algorithms using the same dataset, by means of another classifier called meta-classifier. The main goal of this paper is to evaluate the impact of the classifiers diversity in the quality of stacking. The specific objectives are to study the stacking strategy and the diversity of supervised classifiers. The proposed approach is based on the assertion that the greater the diversity of patterns learned by base classifiers, the higher the quality of stacking. Moreover, we have performed a lot of experiments that show the impact of multiple diversity measures on the gain of stacking, considering many real datasets extracted from UCI machine learning repository, and some synthetic databases with different two-dimensional spatial distributions to aid visual inspection validation. From the results of these experiments, we can see that there is no significant relationship between diversity and stacking quality.	pt_BR
dc.language.iso	por	pt_BR
dc.rights	open access	pt_BR
dc.subject	Empilhamento	pt_BR
dc.subject	Combinação de classificadores	pt_BR
dc.subject	Diversidade	pt_BR
dc.subject	Classification	pt_BR
dc.subject	Combining classifiers	pt_BR
dc.subject	Stacking	pt_BR
dc.subject	Diversity	pt_BR
dc.title	Uma análise do impacto da diversidade sobre o resultado do empilhamento de classificadores supervisionados	pt_BR
dc.title.alternative	An analysis of the impact of diversity on stacking supervised classifiers	pt_BR
dc.type	masterThesis	pt_BR

Files in this item

48.pdf

Size: 1.220Mb Format: PDF

This item appears in the following Collection(s)

:

C3 - Mestrado em Engenharia da Computação

Show simple item record