Abstract:
Nos últimos anos, as pesquisas científicas têm voltado o foco para dados armazenados em meio digital sem a preocupação com o rigor da estruturação. No mundo em que vivemos, cada vez mais pessoas têm acesso sem restrições à Internet e podem divulgar suas ideias através das redes sociais. Isto faz com que exista um crescente volume de textos espalhados pela Web, principalmente nas redes sociais. Publicações em redes sociais contêm informações que, muitas vezes, podem expressar percepções relevantes a serem consideradas para a tomada de decisão, por exemplo, na gestão pública. O modelo de cidade inteligente vem com a proposta de monitorar e integrar as condições de operações das infraestruturas críticas da cidade, atuando de forma preventiva para a continuidade de suas atividades essenciais, melhorando as condições de serviços e a qualidade de vida dos cidadãos. Diante deste cenário, este trabalho utiliza técnicas de mineração de dados para serem aplicadas a coleções de postagens em redes sociais, de forma a inferir o entendimento da população a respeito de um determinado assunto ou tema. Mais precisamente, no âmbito de cidades inteligentes e seus indicadores, o objetivo desta dissertação é propor o uso de técnicas de classificação baseadas em termos representativos para que a partir destes possam ser extraídos mapas conceituais sobre os principais indicadores que compoem o nível de inteligência de um município. Com este estudo pretende-se analisar dados expressos pela população em meios as redes sociais sobre diferentes aspectos e gerar resultados que poderão ser utilizados por agentes públicos para auxiliar à tomada de decisão. Os aspectos tratam-se de características sobre determinada entidade, os quais são anotados para o processo de mineração. Além de avaliar conceitos relacionados à mineração de textos, este estudo foi aplicado em dados de grupos e páginas do Facebook que contêm informações relacionadas à cidade do Rio Grande/RS, com o intuito de classificar os textos por aspectos. Ademais, essa investigação assume o desafio tecnológico de realizar uma mineração de textos em fontes fracamente estruturadas, considerando que os dados textuais contêm pouca ou quase nenhuma estrutura. Os resultados obtidos neste estudo demonstram que o método pode ser aplicado, uma vez que as métricas de avaliação foram adequadas. A partir dos termos representativos e das classificações obtidas, é possível observar indícios sobre a percepção coletiva da população relacionada aos indicadores de qualidade de vida no âmbito de cidades inteligentes.
In recent years, scientific research has focused on data stored in digital media without concern for the rigor of structuring. In the world we live in, more and more people have unrestricted access to the Internet and can spread their ideas through social networks. This causes a growing volume of texts spread throughout the Web, especially in social networks. Publications in social networks contain information that can often express relevant perceptions to be considered for decision making, for example, in public management. The intelligent city model comes with the proposal to monitor and integrate the operational conditions of the citys critical infrastructures, acting in a preventive way for the continuity of its essential activities, improving the conditions of services and the quality of life of citizens. Given this scenario, this work uses data mining techniques to be applied to collections of postings in social networks, in order to infer the understanding of the population about a particular subject or theme. More precisely, in the context of intelligent cities and their indicators, the objective of this dissertation is to propose the use of classification techniques based on representative terms so that from these can be extracted conceptual maps on the main indicators that make up the level of intelligence of a County. This study intends to analyze data expressed by the population in social networks media on different aspects and generate results that can be used by public agents to assist in decision making. The aspects are about characteristics about a particular entity, which are annotated for the mining process. In addition to evaluating concepts related to text mining, this study was applied to data from groups and Facebook pages that contain information related to the city of Rio Grande / RS, in order to classify the texts by aspects. In addition, this research assumes the technological challenge of performing a text mining in weakly structured sources, considering that textual data contain little or no structure. The results obtained in this study demonstrate that the method can be applied, since the evaluation metrics were adequate. From the representative terms and the classifications obtained, it is possible to observe clues about the collective perception of the population related to the indicators of quality of life within the framework of intelligent cities.