Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/34257
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2022_BrunoHenriqueBrandaoDeSouza_tcc.pdf559,47 kBAdobe PDFver/abrir
Registro completo
Campo Dublin CoreValorLíngua
dc.contributor.advisorGomes, Eduardo Monteiro de Castro-
dc.contributor.authorSouza, Bruno Henrique Brandão de-
dc.identifier.citationSOUZA, Bruno Henrique Brandão de. Modelos de previsão da National Basketball Association (NBA). 2022. 44 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2022.pt_BR
dc.descriptionTrabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022.pt_BR
dc.description.abstractEsse trabalho teve como objetivo principal elaborar um modelo que fosse capaz de realizar predições se um time classifica aos playoffs da NBA com base nas estatísticas da equipe de até 26 jogos disputados. Os dados foram retirados de uma base disponibilizada no Kaggle e do site oficial da NBA via Web scraping. Esses dados eram referentes a cada partida disputada, com informações do time mandante e visitante. Depois foram criadas variáveis pelo processo de feature engineering para colaborar na predição dos modelos. Essas variáveis são relacionadas as estatísticas dos oponentes, média móvel das estatísticas dos time e dos seus adversários referente aos últimos jogos da quantidade de partidas estudadas e da força dos oponentes. Uma função foi criada para formar uma base de dados com as estatísticas para cada time de acordo com a quantidade de jogos que se deseja estudar. Depois uma outra função foi elaborada para realizar o ajuste dos modelos preditivos de acordo com a variação do número de jogos, número de jogos para a média móvel e a quantidade de temporadas utilizadas para a base de teste. Essa função elabora bancos de dados pelos parâmetros mencionados anteriormente, depois foram separadas as bases de treinamento e teste para a modelagem. As técnicas utilizadas foram de Lasso, Ridge, Random Forest e Árvore Binária. Por fim, uma grande tabela foi formada com as medidas que permitem a comparação dos modelos propostos. Após análises, foi verificado que o modelo com melhor desempenho de acordo as intenções deste trabalho foi elaborado utilizando a técnica de Random Forest, estatísticas dos 15 primeiros jogos, 4 jogos para o cálculo da média móvel e lidando com os dados das 3 últimas temporadas na base de teste dos modelos. As variáveis com maior significância foram as de vitórias, derrotas, plus-minus e suas derivaçõespt_BR
dc.rightsAcesso Abertopt_BR
dc.subject.keywordRegressão logística (Estatística)pt_BR
dc.subject.keywordBasquetebolpt_BR
dc.titleModelos de previsão da National Basketball Association (NBA)pt_BR
dc.typeTrabalho de Conclusão de Curso - Graduação - Bachareladopt_BR
dc.date.accessioned2023-03-22T13:00:14Z-
dc.date.available2023-03-22T13:00:14Z-
dc.date.submitted2022-
dc.identifier.urihttps://bdm.unb.br/handle/10483/34257-
dc.language.isoPortuguêspt_BR
dc.rights.licenseA concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.pt_BR
dc.description.abstract1This work had the objective of elaborating a model capable of predicting whether or not a team will achieve the NBA playoffs, based on up to 26 matches played. The data was acquired from a database available on Kaggle and the official NBA website via Web scraping. The data is related to each match played, for both home and away team. Afterwards, variables were created based on feature engineering to collaborate on the model predictive capabilities. Such variables are related to opponent statistics, mo ving average of both teams statistics, with respect to the most recent matches played and opponent strength. A function was then created to construct a database with each teams statistics according to number of games to be studied. Next, another function was created to ajust the predictive models according to number of games played, number of games considered in the moving average and quantity of seasons used in the test database. This second function creates databases based on the aforementioned parameters. Afterwards, the test databases and training database were separated. The tecniques utilized were Lasso, Ridge, Random Forest and Binary Tree. Finally, a table was created with all the useful information in comparison of proposed models. After analyses, it was verified that the model with best performance, according to this works objectives, was utilizing Random Forest, the first 15 games, 4 games for moving average and using the three most recent seasons as a test database. The variables with greatest significance were wins, losses, plus-minus and their derivationspt_BR
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.