Um mecanismo automático para detectar versões de objetos XML provenientes de bibliotecas digitais
Abstract:
Artigos científicos indexados por diferentes bibliotecas digitais podem estar representados de diferentes formas. Os metadados que descrevem estes artigos são heterogêneos. Visando melhorar a qualidade da pesquisa do usuário de bibliotecas digitais, fornecendo uma resposta precisa e livre de redundância, este trabalho apresenta um mecanismo que realiza a detecção automática de versões de objetos XML provenientes de diferentes bibliotecas digitais. São propostas duas funções de similaridade: nomesIni e simNomes. Essas funções comparam os nomes dos autores, que junto ao título do artigo, possuem papel fundamental na identificação de versões. Além disso, os autores são metadados que possuem inúmeras representações distintas. Adicionalmente, algoritmos clássicos são usados para calcular a similaridade entre os demais metadados. Por fim, foram realizados experimentos visando a validação da detecção de versões que demonstraram a eficácia das funções propostas tanto na detecção (através de medidas de precisão e revocação), quanto no tempo de processamento.