Mineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysql

dc.contributor.advisorMartins, Paulo João
dc.contributor.authorSouza, Ânderson Luís de
dc.date.accessioned2022-04-22T11:50:27Z
dc.date.available2022-04-22T11:50:27Z
dc.date.created2021-12
dc.descriptionTrabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.pt_BR
dc.description.abstractO crescimento acelerado dos sites de redes sociais nos últimos anos criou uma enorme base de dados. Dentre o grande volume de informações compartilhadas diariamente, encontram-se dados que comprometem a segurança dos usuários. Atentos a esses dados, existem pessoas mal-intencionadas e à espera de qualquer tipo de informação que possa lhes trazer vantagens sobre determinado usuário. Utilizando de técnicas de engenharia social, alguns poucos dados são suficientes para planejar ataques diretos. O propósito desse trabalho foi realizar uma análise na rede social Twitter, utilizando técnicas de Descoberta de conhecimento em base de dados para localizar dados que possam ser possíveis alvos da engenharia social. Para execução das etapas de descoberta de conhecimento foram implementados algoritmos na linguagem de programação Python e os dados foram armazenados no banco de dados relacional MySQL. Para realizar extração dos dados da rede social, foi utilizado a biblioteca tweepy e para classificação dos dados, a biblioteca sklearn. Utilizando a biblioteca sklearn, dois modelos foram testados: Máquinas de Vetores de Suporte e Multinomial Naive Bayes. O modelo de Máquinas de Vetores de Suporte se mostrou superior e foi selecionado para realizar a classificação da base principal. Os resultados mostraram que mais de 99% dos usuários possuem algum tipo de exposição, porém, a falta da validação de um dos campos, diminuiu a credibilidade dos resultados. Ao final, o resultado foi satisfatório, identificando-se que uma pequena parcela dos usuários compartilha dados pessoais suscetíveis a ataques de engenharia social.pt_BR
dc.identifier.urihttp://unesc.acessoacademico.com.br/handle/1/9138
dc.language.isopt_BRpt_BR
dc.subjectMineração de dadospt_BR
dc.subjectDescoberta de conhecimentopt_BR
dc.subjectBase de dadospt_BR
dc.subjectDados pessoaispt_BR
dc.subjectTwitter (Rede social on-line)pt_BR
dc.titleMineração de dados no Twitter para verificar exposição de informações pessoais por meio de Python e Mysqlpt_BR
dc.typeTrabalho de Conclusão de Curso - TCCpt_BR

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Anderson de Souza.pdf
Tamanho:
363.46 KB
Formato:
Adobe Portable Document Format
Descrição:
TCC

Licença do Pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: