Análise de agrupamento pelos métodos hierárquico aglomerativo e particional fuzzy utilizados para educational data mining em dados de educação a distância

Data

Título da Revista

ISSN da Revista

Título de Volume

Editor

O crescimento da tecnologia, faz com que a quantidade de dados em repositórios aumente, impossibilitando a análise por métodos tradicionais, surgindo à mineração de dados, aplicada por meio da descoberta de conhecimento. A educação gera dados relacionados a alunos, principalmente a educação à distância em que os dados são provenientes de um ambiente virtual de aprendizagem, se tornando uma área de interesse dos pesquisadores educacionais. Com isso, surge o educational data mining, que utiliza métodos da mineração de dados. Mediante as técnicas e tarefas de mineração, tem o agrupamento, que é dividido em agrupamento hierárquico aglomerativo e agrupamento particional. De modo que nesta pesquisa é realizada a comparação entre o algoritmo de AGNES para o agrupamento hierárquico aglomerativo e o algoritmo fuzzy c-means para o agrupamento particional, com o objetivo de identificar qual dos métodos possui melhor desempenho em dados educacionais. Os dados são provenientes da disciplina ministrada a distância de Introdução a Engenharia de Segurança do Trabalho, na Universidade do Extremo Sul Catarinense. A ferramenta R foi usada, por ser um software livre, para implementação dos algoritmos e métodos de validação. Ao iniciar a mineração, é necessário definir a distância da matriz de similaridade, em que é aplicado as distâncias manhattan e euclidiana em AGNES e manhattan, euclidiana, correlattion e seuclidean no fuzzy c-means. O algoritmo AGNES, precisa da identificação do método de conexão, para gerar os resultados, sendo aplicado teste com os métodos de ward, distância média, maior distância e menor distância. A verificação dos resultados apresentados pelos algoritmos é realizada por meio das medidas de qualidade, aplicando índices de validação. O modelo final definido para fuzzy c-means, foi o que aplica a matriz de similaridade seuclidean e para o AGNES o que tem a matriz de similaridade de manhattan, pelo método de conexão distância média. Comparando o resultado gerado pelo índice de silhouette, o agrupamento particional, foi definido como modelo final de agrupamento sobre os dados educacionais.

Descrição

Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.

Citação