Uma proposta de arquitetura para tratamento de dados não estruturados no âmbito dos institutos federais de educação
Uma das tendências para resolver os diversos problemas e desafios gerados pelo contexto do Big Data é o movimento denominado NoSQL (Not only SQL), o qual promove diversas soluções inovadoras de armazenamento e processamento de grande volume de dados. Os trabalhos disponíveis na literatura relacionad...
Main Author: | JAHN, Giovani Felipe |
---|---|
Other Authors: | GARCIA, Vinícius Cardoso |
Format: | masterThesis |
Language: | por |
Published: |
Universidade Federal de Pernambuco
2018
|
Subjects: | |
Online Access: |
https://repositorio.ufpe.br/handle/123456789/28002 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: |
Uma das tendências para resolver os diversos problemas e desafios gerados pelo contexto do Big Data é o movimento denominado NoSQL (Not only SQL), o qual promove diversas soluções inovadoras de armazenamento e processamento de grande volume de dados. Os trabalhos disponíveis na literatura relacionados a NoSQL explicam, além do seu surgimento, sistemas disponíveis para a manipulação de dados que necessitam de um poder de processamento eficiente, escalável e amplo. O que também impulsiona a criação de sistemas de tratamento de dados NoSQL é a sua inferência a dados complexos, semiestruturados ou não estruturados, presentes hoje em redes sociais, sensores, logs de Internet, entre outros. Em face dos desafios sobre a manipulação e processamento de dados neste contexto, um novo conjunto de plataformas de ferramentas voltadas para Big Data tem sido proposto. Muitas delas na forma open source ou de licenças livres revelando-se excelentes veículos para o desenvolvimento de soluções para tratamento de dados desta natureza. Este trabalho, proposto no Programa de Mestrado Profissional em Ciência da Computação, na linha de pesquisa Redes de Computadores, objetiva apresentar uma arquitetura de referência para tratamento de dados não estruturados, inerentes à realidade dos institutos federais de educação, para que possam prover análise sobre dados oriundos de redes sociais. Inicialmente, a revisão bibliográfica expõe os conceitos, linguagens e ferramentas das principais tecnologias a respeito de NoSQL. Produtos como Hadoop, Hive, HBase e outros denotam a grande quantidade de soluções NoSQL disponíveis no mercado para uma escolha futura na implementação de aplicações e são consideradas neste trabalho. A seguir, um levantamento de dados institucionais mostra que o tratamento de dados não estruturados ainda é considerado um ineditismo para estas instituições. Foi utilizada uma abordagem metodológica teórico-conceitual, agregando-se paradigmas do método DSR (Design Science Research) para dar à pesquisa um conhecimento sólido e potencialmente relevante quando da elaboração de uma proposta de arquitetura de referência para tratamento de dados não estruturados no âmbito dos institutos federais de educação. A realização de um adequado enquadramento conceitual e tecnológico sobre as ferramentas open source fomentaram esta proposta, a qual por sua vez, passa por avaliação e crivo de especialistas. |
---|