Extração semi-automática de dados não estruturados na Web baseada em algoritmos de similaridade para armazenamento em banco de dados objeto-relacional

dc.contributor.advisorCaldas, Paracelso de Oliveira
dc.contributor.authorCitadin, Mário Luís Scarpari
dc.coverage.spatialUniversidade do Extremo Sul Catarinensept_BR
dc.date.accessioned2026-05-08T23:24:19Z
dc.date.available2026-05-08T23:24:19Z
dc.date.created2010-07
dc.descriptionTrabalho de Conclusão de Curso apresentado para obtenção do Grau de Bacharel em Ciência da Computação da Universidade do Extremo Sul Catarinense.pt_BR
dc.description.abstractA crescente evolução e transformação da Web de forma desestruturada desencadeia uma série de dificuldades com relação ao tratamento e uso dos dados contidos neste ambiente. Com o objetivo de facilitar a manipulação destas informações e também recuperá-las de forma eficiente, este trabalho fundamenta e demonstra o funcionamento de um extrator de dados, que utiliza o conceito de wrappers para recuperar os dados do ambiente Web e transformá-los em um arquivo XML. Com a necessidade de tratar os dados extraídos e classificá-los de acordo com o que o usuário necessita, o protótipo desenvolvido na linguagem Java utiliza a biblioteca XSTREAM para realizar a leitura do arquivo XML e mapeá-lo para uma classe Java. Para classificar os dados, é utilizado o algoritmo editDistance para realizar a comparação entre as informações obtidas, e gerar um coeficiente de similaridade. Com o objetivo de armazenar um histórico das informações extraídas, estes dados podem ser armazenados, onde utiliza-se o framework Hibernate para fazer o mapeamento dos objetos para o Banco de dados. O resultado final deste processo é a obtenção de dados relevantes ao usuário operador do sistema e a possibilidade de recuperar estas informações posteriormente através dos algoritmos de similaridade.pt_BR
dc.identifier.urihttp://repositorio.unesc.net/handle/1/12409
dc.language.isopt_BRpt_BR
dc.subjectBanco de dadospt_BR
dc.subjectExtração de dadospt_BR
dc.subjectAlgoritmos de similaridadept_BR
dc.subjectJava (Linguagem de programação de computador)pt_BR
dc.titleExtração semi-automática de dados não estruturados na Web baseada em algoritmos de similaridade para armazenamento em banco de dados objeto-relacionalpt_BR
dc.typeTrabalho de Conclusão de Curso - TCCpt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Mário Luís Scarpari Citadin.pdf
Tamanho:
789.7 KB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: