Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/38509
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2023_EnzoPortoBrasil_tcc.pdf826,9 kBAdobe PDFver/abrir
Título: Técnicas de imputação de dados faltantes com uso de modelagem preditiva
Autor(es): Brasil, Enzo Porto
Orientador(es): Nakano, Eduardo Yoshio
Assunto: Banco de dados
Dados - recuperação
Análise estatística
Regressão linear (Estatística)
Data de apresentação: 20-Dez-2023
Data de publicação: 15-Mai-2024
Referência: BRASIL, Enzo Porto. Técnicas de imputação de dados faltantes com uso de modelagem preditiva. 2023. 61 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2023.
Resumo: A presença de dados faltantes em um banco de dados é comum, mas as análises estatísticas são fundamentadas para analisar dados completos. Uma das possíveis soluções para o tratamento da ausência de informações é utilizar imputação de dados. Este trabalho teve o objetivo de destacar o desempenho e importância de técnicas de imputação que utilizam regressão estatística, e propor assim um guia eficaz e prático aos pesquisadores com base na literatura e nos resultados observados. Além do estudo dos dois pilares principais desta pesquisa, regresssão estatística e técnicas de imputação, a metodologia implementada foi feita por meio de simulações, com a criação de bancos de dados artificiais, possibilitando a discussão de diferentes cenários de dados faltantes e técnicas. Questões relacionadas ao impacto da quantidade de dados faltantes, da natureza da variável incompleta e da quantidade de variáveis incompletas também foram verificadas. A partir de ajustes de modelos de regressão linear, os tipos de imputação (única e múltipla) e técnicas de imputação (medidas de tendência central e modelagem preditiva) foram comparados. Os resultados obtidos, junto às discussões, foram favoráveis ao uso de modelos de regressão em processos de imputação de dados, com evidências da importância ao selecionar métodos adequados com base nos motivos da ausência de dados e na proporção de dados faltantes.
Abstract: The presence of missing data in a database is common, but statistical analyses are typically performed on complete data. One possible solution for handling missing information is to use data imputation. This work aimed to highlight the performance and importance of imputation techniques that use statistical regression, and to propose an effective and practical guide for researchers based both on literature and the observed results. In addition to studying the two main pillars of this research, statistical regression and imputation techniques, the methodology implemented was done through simulations, with the creation of artificial databases, allowing for the discussion of different scenarios of missing data and techniques. Issues related to the impact of the amount of missing data, the nature of the incomplete variable, and the amount of incomplete variables were also verified. Based on adjustments of linear regression models, the types of imputation (single and multiple) and imputation techniques (measures of central tendency and predictive modelling) were compared. The results obtained, along with the discussions, were favorable to the use of regression models in data imputation processes, with evidence of the importance of selecting appropriate methods based on the reasons for missing data and the proportion of missing data.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2023.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.