Uma abordagem Transfer-learning para agrupamento de dados

Pereira, Igor Avila

dc.contributor.advisor	Emmendorfer, Leonardo Ramos
dc.contributor.advisor	Machado, Karina dos Santos
dc.contributor.author	Pereira, Igor Avila
dc.date.accessioned	2020-01-24T18:04:25Z
dc.date.available	2020-01-24T18:04:25Z
dc.date.issued	2014
dc.identifier.citation	PEREIRA, Igor Avila. Uma abordagem Transfer-learning para agrupamento de dados. 2014. 74 f. Dissertação (Mestrado em Engenharia da Computação) – Centro de Ciências Computacionais, Universidade Federal do Rio Grande, Rio Grande, 2014.	pt_BR
dc.identifier.uri	http://repositorio.furg.br/handle/1/8166
dc.description.abstract	Na vida cotidiana, as pessoas agrupam objetos de forma inconsciente, sem saber exatamente como a seleção de objetos que compõem um determinado grupo é feita. Assim, é uma característica da aprendizagem humana considerar o conhecimento obtido a partir de grupos anteriores para gerar novos agrupamentos. No entanto, a maioria dos algoritmos de agrupamento não considera esse tipo de conhecimento prévio. Neste contexto, este trabalho propõe um novo algoritmo de agrupamento que aplica técnica de Transfer Learning, a fim de transferir o conhecimento de agrupamentos anteriores para um agrupamento futuro. Todo dataset incorporado é submetido a um processo de pré-processamento, que combina as instâncias em pares e mapeia seus atributos em novas características, a fim de que esteja em um domínio comum. Em uma etapa de treinamento, aplica-se um classificador que extrai o conhecimento presente nos datasets. Deste modo, o conhecimento extraído dos datesets anteriores é repassado à tarefa de agrupar um novo dataset. Assim, a transferência de conhecimento contribui para o processo de formação de grupos, melhorando o resultado final do agrupamento. Experimentos foram realizados com dois conjuntos de datasets. O primeiro contém 10 datasets e o segundo 5 datasets. No primeiro conjunto, há datasets com diferentes atributos e número de instâncias. Todavia, o segundo conjunto possui apenas datasets de mesmas dimensões (dois atributos) e número de instâncias diferentes. Para ambos, utilizou-se o procedimento de validação cruzada. A cada iteração, um dataset do conjunto era definido com sendo o dataset teste, ou seja, que se deseja agrupar e os demais eram utilizados como bases auxiliares de conhecimento. No conjunto de 10 datasets aplicou-se um classificador baseado em árvores de decisão e, para o segundo conjunto um classificador baseado em regressão logística.	pt_BR
dc.description.abstract	In everyday life, people group objects unconsciously, without knowing exactly how the selection of objects that comprise a given group is made. Thus, it is a characteristic of human learning to consider the knowledge gained from earlier groups to generate new clusters. However, most clustering algorithms do not consider this type of prior knowledge. In this context, this work proposes a new clustering algorithm applying the Learning Transfer techniques in order to transfer knowledge from previous partitions for a future partition. The datasets undergo a process of pre-processing that combines instances in pairs and maps their attributes into new features in order to be in a homogeneous domain. In a training phase, we apply a classifier that extracts the datasets knowledge. Thus, the knowledge extracted from previous datesets is passed to the task of clustering a new dataset. The knowledge transfer process contributes to the formation of groups, improving the outcome of the clustering algorithm. Experiments were performed with two sets of datasets. The first contains 10 datasets and the second 5 datasets. In the first set there are datasets with different attributes and number of instances. However, the second set has only datasets with the same dimensions (two attributes) and different number of instances. For both used the cross-validation procedure. At each iteration, a dataset was defined with the set and the test dataset, that is, a dataset we want cluster and others were used as auxiliary knowledge bases. In all 10 datasets a classifier based on decision trees was applied, and for the second set, a classifier based on logistic regression was employed.	pt_BR
dc.language.iso	por	pt_BR
dc.rights	open access	pt_BR
dc.subject	Engenharia	pt_BR
dc.subject	Ciência da computação	pt_BR
dc.subject	Engenharia de computação	pt_BR
dc.subject	Transfer learning	pt_BR
dc.subject	Aprendizado computacional	pt_BR
dc.subject	Agrupamento de dados	pt_BR
dc.subject	clustering	pt_BR
dc.subject	Computer engineering	pt_BR
dc.subject	Engineering	pt_BR
dc.subject	Computation	pt_BR
dc.subject	Transfer Learning	pt_BR
dc.subject	Machine learning	pt_BR
dc.subject	Clustering	pt_BR
dc.title	Uma abordagem Transfer-learning para agrupamento de dados	pt_BR
dc.title.alternative	Transfer Learning approach to data clustering	pt_BR
dc.type	masterThesis	pt_BR

Files in this item

29.pdf

Size: 3.727Mb Format: PDF

This item appears in the following Collection(s)

:

C3 - Mestrado em Engenharia da Computação

Show simple item record