Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/158
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2007_HeldSouza_DanielaNaglis.pdf7,15 MBAdobe PDFver/abrir
Título: Mineração de Dados : uma aplicação na base de dados de artigos de periódicos científicos das áreas de informação (ABCDM)
Autor(es): Souza, Held Barbosa de
Naglis, Daniela Leite
Orientador(es): Pereira Júnior, Romualdo Alves
Vilan Filho, Jayme Leiro
Assunto: Mineração de dados
Mineração de texto
Áreas de informação
Brasil
Data de apresentação: 4-Nov-2008
Data de publicação: 17-Fev-2009
Referência: SOUZA, Held Barbosa de; NAGLIS, Daniela Leite. Mineração de Dados: uma aplicação na base de dados de artigos de periódicos científicos das áreas de informação (ABCDM). 2008. 155 f. Monografia (Especialização em Gestão de Tecnologia da Informação)-Universidade de Brasília, Brasília, 2008.
Resumo: Apresenta um estudo do processo de Mineração de Dados na ferramenta Rapid Miner com a base de dados ABCDM, que contém os artigos de periódicos científicos das áreas de informação publicados no Brasil. Com o foco na Mineração de Texto, o processo analisa os títulos dos artigos da base de dados e identifica os assuntos mais relevantes das décadas de 70, 80, 90 e dos anos 2000, até 2007, com base no índice TF/IDF. Os principais assuntos dos títulos dos artigos publicados nos anos 2000 são identificados com maior especificidade através do algoritmo K-Means. Conclui que os resultados confirmaram alguns comportamentos já percebidos pelos pesquisadores das áreas de informação, que o processo de Mineração de Dados também é eficiente na análise de dados bibliográficos e que estudos mais aprofundados poderão ser realizados posteriormente.
Abstract: Mining using the tool Rapid Miner over the database ABCDM, that contains the scientific periodic articles of the information science field published in Brazil. Focusing the Text Mining, the process analyzes the headings of articles in the database and identifies the most relevant subjects of the 70s, 80s, 90s and between 2000 and 2007, on the basis of the index TF/IDF. The main subjects of the articles headings published between 2000 and 2007 are identified with the greater specificity through the operator K-Means. The results had confirmed some behaviors already perceived by the researchers of the information areas. The process of Data Mining also is efficient in the analysis of bibliographical data and that deepened studies should be carried out later.
Informações adicionais: Monografia (especialização)—Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2008.
DOI: http://dx.doi.org/10.26512/2008.11.TCC.158
Aparece na Coleção:Gestão de Tecnologia da Informação



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.