Modelos de previsão da National Basketball Association (NBA)

Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/34257

Arquivos neste item:

Arquivo	Descrição	Tamanho	Formato
2022_BrunoHenriqueBrandaoDeSouza_tcc.pdf		559,47 kB	Adobe PDF	ver/abrir

Registro completo

Campo Dublin Core	Valor	Língua
dc.contributor.advisor	Gomes, Eduardo Monteiro de Castro	-
dc.contributor.author	Souza, Bruno Henrique Brandão de	-
dc.identifier.citation	SOUZA, Bruno Henrique Brandão de. Modelos de previsão da National Basketball Association (NBA). 2022. 44 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2022.	pt_BR
dc.description	Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2022.	pt_BR
dc.description.abstract	Esse trabalho teve como objetivo principal elaborar um modelo que fosse capaz de realizar predições se um time classifica aos playoffs da NBA com base nas estatísticas da equipe de até 26 jogos disputados. Os dados foram retirados de uma base disponibilizada no Kaggle e do site oficial da NBA via Web scraping. Esses dados eram referentes a cada partida disputada, com informações do time mandante e visitante. Depois foram criadas variáveis pelo processo de feature engineering para colaborar na predição dos modelos. Essas variáveis são relacionadas as estatísticas dos oponentes, média móvel das estatísticas dos time e dos seus adversários referente aos últimos jogos da quantidade de partidas estudadas e da força dos oponentes. Uma função foi criada para formar uma base de dados com as estatísticas para cada time de acordo com a quantidade de jogos que se deseja estudar. Depois uma outra função foi elaborada para realizar o ajuste dos modelos preditivos de acordo com a variação do número de jogos, número de jogos para a média móvel e a quantidade de temporadas utilizadas para a base de teste. Essa função elabora bancos de dados pelos parâmetros mencionados anteriormente, depois foram separadas as bases de treinamento e teste para a modelagem. As técnicas utilizadas foram de Lasso, Ridge, Random Forest e Árvore Binária. Por fim, uma grande tabela foi formada com as medidas que permitem a comparação dos modelos propostos. Após análises, foi verificado que o modelo com melhor desempenho de acordo as intenções deste trabalho foi elaborado utilizando a técnica de Random Forest, estatísticas dos 15 primeiros jogos, 4 jogos para o cálculo da média móvel e lidando com os dados das 3 últimas temporadas na base de teste dos modelos. As variáveis com maior significância foram as de vitórias, derrotas, plus-minus e suas derivações	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject.keyword	Regressão logística (Estatística)	pt_BR
dc.subject.keyword	Basquetebol	pt_BR
dc.title	Modelos de previsão da National Basketball Association (NBA)	pt_BR
dc.type	Trabalho de Conclusão de Curso - Graduação - Bacharelado	pt_BR
dc.date.accessioned	2023-03-22T13:00:14Z	-
dc.date.available	2023-03-22T13:00:14Z	-
dc.date.submitted	2022	-
dc.identifier.uri	https://bdm.unb.br/handle/10483/34257	-
dc.language.iso	Português	pt_BR
dc.rights.license	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.	pt_BR
dc.description.abstract1	This work had the objective of elaborating a model capable of predicting whether or not a team will achieve the NBA playoffs, based on up to 26 matches played. The data was acquired from a database available on Kaggle and the official NBA website via Web scraping. The data is related to each match played, for both home and away team. Afterwards, variables were created based on feature engineering to collaborate on the model predictive capabilities. Such variables are related to opponent statistics, mo ving average of both teams statistics, with respect to the most recent matches played and opponent strength. A function was then created to construct a database with each teams statistics according to number of games to be studied. Next, another function was created to ajust the predictive models according to number of games played, number of games considered in the moving average and quantity of seasons used in the test database. This second function creates databases based on the aforementioned parameters. Afterwards, the test databases and training database were separated. The tecniques utilized were Lasso, Ridge, Random Forest and Binary Tree. Finally, a table was created with all the useful information in comparison of proposed models. After analyses, it was verified that the model with best performance, according to this works objectives, was utilizing Random Forest, the first 15 games, 4 games for moving average and using the three most recent seasons as a test database. The variables with greatest significance were wins, losses, plus-minus and their derivations	pt_BR
Aparece na Coleção:	Estatística

Mostrar item em formato simples Recomendar este item Visualizar estatísticas