A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática

O presente trabalho visa correlacionar os conceitos de folksonomia assistida e indexação automática, propondo meios para que a primeira possa ser aplicada na avaliação de sistemas de indexação automática a partir da compilação de Corpus de Referência. A perspectiva é ser capaz de responder ao seguin...

Full description

Main Author: SILVA, Bruno Felipe de Melo
Other Authors: CORRÊA, Renato Fernandes
Format: masterThesis
Language: por
Published: Universidade Federal de Pernambuco 2019
Subjects:
Online Access: https://repositorio.ufpe.br/handle/123456789/33698
Tags: Add Tag
No Tags, Be the first to tag this record!
id ir-123456789-33698
recordtype dspace
spelling ir-123456789-336982019-09-27T05:08:04Z A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática SILVA, Bruno Felipe de Melo CORRÊA, Renato Fernandes http://lattes.cnpq.br/6331812317352203 http://lattes.cnpq.br/7536537827447217 Folksonomia Assistida Indexação Social Corpus de Referência Avaliação de Sistemas de Indexação Automática Ciência da Informação O presente trabalho visa correlacionar os conceitos de folksonomia assistida e indexação automática, propondo meios para que a primeira possa ser aplicada na avaliação de sistemas de indexação automática a partir da compilação de Corpus de Referência. A perspectiva é ser capaz de responder ao seguinte problema de pesquisa: Na construção do Corpus de Referência para fins de avaliação de sistemas de indexação automática, a aplicação da folksonomia assistida traz uma melhor qualidade na indexação de artigos científicos? Para isso, buscou-se alcançar os objetivos específicos que partem inicialmente da ideia de construção da Folksonomia Assistida por meio da adaptação do modelo colaborativo de indexação social assistida de Silva (2013), onde são contemplando papeis, atividades e regras de interação entre usuários, com base no desenvolvimento de uma política de indexação social assistida que adota o Tesauro Brasileiro de Ciência da Informação. O resultado da aplicação do modelo norteou o segundo objetivo que era o de avaliar a qualidade da indexação do corpus de Souza (2005). O terceiro objetivo visou compilação do corpus de referência de artigos científicos na área de Ciência da Informação para avaliação de sistemas de indexação automática. A metodologia construída para o presente trabalho pode ser classificada como exploratória, empírica e de estudo de caso, tendo em vista o experimento realizado. Para a pesquisa fora delimitado o uso do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). O modelo colaborativo de indexação social assistida do corpus ocorreu por meio da plataforma de gerenciamento de coleção, Tainacan. O Tainacan foi utilizado como instrumento para garantir a mediação da pesquisa, visando à construção da Folksonomia Assistida. Como forma de alcançar os objetivos propostos na pesquisa foi definida etapas a serem seguidas. Essas etapas envolveram: 1) Levantar e analisar a literatura a cerca da Folksonomia assistida e a construção de corpus de referência para avaliação da indexação automática; 2) Configurar e preparar uma coleção no Tainacan, levando em conta papeis, atividades e regras de interação entre usuários, bem como inserção na coleção dos artigos do corpus de artigos de periódicos em Ciência da Informação de Souza (2005) com respectivos metadados descritivos; 3) Desenvolver uma política de indexação social assistida adotando o Tesauro brasileiro em Ciência da Informação no processo de indexação colaborativa assistida, a ser registrado no campo de metadado Tags da coleção; 4) Instruir os usuários indexadores e guiá-los no processo de indexação social assistida; 5) Analisar o resultado do processo de indexação colaborativa realizada pelos grupos de usuários, mediante comparação daquilo que consta disponibilizado no campo de metadado “assuntos”; 6) Definir e aplicar regras para compilação do corpus de referência na área de Ciência da Informação para avaliação de sistemas de indexação automática. O resultado das análises do grau de qualidade da indexação tem-se média de 32% de precisão, 69% de revocação, 28% do coeficiente de consistência e 41% de medida F. As médias alcançadas apresentam assim, algumas discrepâncias no que pode ser tratado como nível de harmonização entre as palavras-chave definidas pelos autores, quando comparada às dos usuários, acarretando problemas, dentre tantas, no ato da recuperação dos artigos. Por fim, chegou-se a conclusão que o uso da Folksonomia Assistida pode vir a ser útil no aperfeiçoamento dos objetos, processos e produtos construídos no âmbito da Ciência da Informação, principalmente no que se refere ao corpus compilado que permitiu chegar a um cenário adequado frente as correção e exclusão de termos da folksonomia realizadas. The present work goal is to correlate Assisted Folksonomy and automated indexing, propositioning ways in which the first can be applied on the assessments of automated indexing systems that come from the compilation of Reference Corpus. The perspective is to be able to respond to the following search issue: In the construction of Reference Corpus with a goal of automated indexing systems assessments, the use of Assisted Folksonomy brings a better quality in the indexing of scientific articles? To achieve that, was sought specific goals that come initially from the idea of an Assisted Folksonomy through the adaptation of the collaborative model of assisted social indexing by Silva (2013), where are considered roles, activities and interaction rules between users, based in the development of an assisted indexing policy that shall adopt the Brazilian Thesaurus of Information Science. The results of applying that model guided the second goal which was to do an assessment on the quality of the Souza (2005) indexing corpus. The third goal wanted to achieve the compilation of reference corpus of Information Science scientific articles to assessments of automated indexing systems. The methodology that was constructed for this present work can be classified as exploratory, empiric and of case studies, when you consider the experiment carried out. To do the research was asked the use of the reference corpus composed by the 60 articles of the doctoral thesis by Souza (2005). The collaborative model of social assistedindexing of the corpus occurred through the Tainacan management platform. The Taicacan was used as an instrument to guarantee the mediation of the research, in order to construct the Assisted Folksonomy. As a way to achieve the proposed goals in the research steps to be followed were defined. The process in which those steps configured were: 1) To research and evaluate the written literature about assisted Folksonomy and the building of reference corpus to an automated indexing assessment; 2) Configure and prepare a Tainacan collection, taking into consideration roles, activities and interaction rules between users as the input of the collection of the corpus of periodicals articles by Souza (2005) Information Science with respective descriptive metadata; 3) Develop an assisted indexing policy adopting the Brazilian Thesaurus of Information Science in the process of the collaborative indexing, to be inserted in the metadata field Collection Tags; 4) Instruct the indexing users and guide in the process of the social assisted indexing; 5) Annalise the results of the collaborative indexing process made by the users groups, comparing data that is found in the metadata “subjects” field; 6) Define and apply rules to do the compilation of reference corpus in the Information Science area to make assessments of the automated indexing systems. The results of analyses of the quality degree of the indexing have an average 32% of accuracy, 69% of retrieval, 28% of consistency coefficient and 41% of score-F. The average achieved, then, present some discrepancies which can be seen as a harmonization level between keywords defined by authors, when compared to users’ keywords, bringing problems, among others, in the articles retrieval action. Lastly, the conclusion found was that the use of Assisted Folksonomy can useful in the improvement of the objects, processes and products build in the Information Science field, particularly in reference of the corpus compiled that allowed to achieve a proper setting facing the corrections and exclusions of terms of the applied Folksonomy. 2019-09-26T17:54:51Z 2019-09-26T17:54:51Z 2019-02-25 masterThesis https://repositorio.ufpe.br/handle/123456789/33698 por openAccess Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ application/pdf Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Informacao
institution REPOSITORIO UFPE
collection REPOSITORIO UFPE
language por
topic Folksonomia Assistida
Indexação Social
Corpus de Referência
Avaliação de Sistemas de Indexação Automática
Ciência da Informação
spellingShingle Folksonomia Assistida
Indexação Social
Corpus de Referência
Avaliação de Sistemas de Indexação Automática
Ciência da Informação
SILVA, Bruno Felipe de Melo
A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática
description O presente trabalho visa correlacionar os conceitos de folksonomia assistida e indexação automática, propondo meios para que a primeira possa ser aplicada na avaliação de sistemas de indexação automática a partir da compilação de Corpus de Referência. A perspectiva é ser capaz de responder ao seguinte problema de pesquisa: Na construção do Corpus de Referência para fins de avaliação de sistemas de indexação automática, a aplicação da folksonomia assistida traz uma melhor qualidade na indexação de artigos científicos? Para isso, buscou-se alcançar os objetivos específicos que partem inicialmente da ideia de construção da Folksonomia Assistida por meio da adaptação do modelo colaborativo de indexação social assistida de Silva (2013), onde são contemplando papeis, atividades e regras de interação entre usuários, com base no desenvolvimento de uma política de indexação social assistida que adota o Tesauro Brasileiro de Ciência da Informação. O resultado da aplicação do modelo norteou o segundo objetivo que era o de avaliar a qualidade da indexação do corpus de Souza (2005). O terceiro objetivo visou compilação do corpus de referência de artigos científicos na área de Ciência da Informação para avaliação de sistemas de indexação automática. A metodologia construída para o presente trabalho pode ser classificada como exploratória, empírica e de estudo de caso, tendo em vista o experimento realizado. Para a pesquisa fora delimitado o uso do corpus de referência composto por 60 artigos da tese de doutorado de Souza (2005). O modelo colaborativo de indexação social assistida do corpus ocorreu por meio da plataforma de gerenciamento de coleção, Tainacan. O Tainacan foi utilizado como instrumento para garantir a mediação da pesquisa, visando à construção da Folksonomia Assistida. Como forma de alcançar os objetivos propostos na pesquisa foi definida etapas a serem seguidas. Essas etapas envolveram: 1) Levantar e analisar a literatura a cerca da Folksonomia assistida e a construção de corpus de referência para avaliação da indexação automática; 2) Configurar e preparar uma coleção no Tainacan, levando em conta papeis, atividades e regras de interação entre usuários, bem como inserção na coleção dos artigos do corpus de artigos de periódicos em Ciência da Informação de Souza (2005) com respectivos metadados descritivos; 3) Desenvolver uma política de indexação social assistida adotando o Tesauro brasileiro em Ciência da Informação no processo de indexação colaborativa assistida, a ser registrado no campo de metadado Tags da coleção; 4) Instruir os usuários indexadores e guiá-los no processo de indexação social assistida; 5) Analisar o resultado do processo de indexação colaborativa realizada pelos grupos de usuários, mediante comparação daquilo que consta disponibilizado no campo de metadado “assuntos”; 6) Definir e aplicar regras para compilação do corpus de referência na área de Ciência da Informação para avaliação de sistemas de indexação automática. O resultado das análises do grau de qualidade da indexação tem-se média de 32% de precisão, 69% de revocação, 28% do coeficiente de consistência e 41% de medida F. As médias alcançadas apresentam assim, algumas discrepâncias no que pode ser tratado como nível de harmonização entre as palavras-chave definidas pelos autores, quando comparada às dos usuários, acarretando problemas, dentre tantas, no ato da recuperação dos artigos. Por fim, chegou-se a conclusão que o uso da Folksonomia Assistida pode vir a ser útil no aperfeiçoamento dos objetos, processos e produtos construídos no âmbito da Ciência da Informação, principalmente no que se refere ao corpus compilado que permitiu chegar a um cenário adequado frente as correção e exclusão de termos da folksonomia realizadas.
author2 CORRÊA, Renato Fernandes
format masterThesis
author SILVA, Bruno Felipe de Melo
author_sort SILVA, Bruno Felipe de Melo
title A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática
title_short A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática
title_full A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática
title_fullStr A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática
title_full_unstemmed A folksonomia assistida aplicada na construção de Corpus de Referência para avaliação de sistemas de indexação automática
title_sort folksonomia assistida aplicada na construção de corpus de referência para avaliação de sistemas de indexação automática
publisher Universidade Federal de Pernambuco
publishDate 2019
url https://repositorio.ufpe.br/handle/123456789/33698
_version_ 1648654993900699648
score 13.657419