Utilize este link para identificar ou citar este item: https://bdm.unb.br/handle/10483/34171
Arquivos neste item:
Arquivo Descrição TamanhoFormato 
2021_LouiseBarbosaDosSantos_tcc.pdf7,51 MBAdobe PDFver/abrir
Título: Agrupamento por misturas finitas de normais com aplicação a dados de expressão gênica
Autor(es): Santos, Louise Barbosa dos
Orientador(es): Borries, George Freitas von
Assunto: Algoritmos
Alzheimer, Doença de
Análise de agrupamento (Estatística)
Data de apresentação: 5-Nov-2021
Data de publicação: 15-Mar-2023
Referência: SANTOS, Louise Barbosa dos. Agrupamento por misturas finitas de normais com aplicação a dados de expressão gênica. 2021. 88 f., il. Trabalho de Conclusão de Curso (Bacharelado em Estatística) — Universidade de Brasília, Brasília, 2021.
Resumo: Introdução: As técnicas de agrupamento e classificação de dados foram sendo refinadas e surgiram algoritmos que agrupam objetos por meio de características comuns de acordo com cada critério. Diversos algoritmos têm sido utilizados na área da genética para a identificação de padrões das doenças e como, futuramente, uma nova forma de diagnóstico. Neste trabalho, foi utilizado o algoritmo de agrupamento de misturas finitas de normais com o objetivo de analisar dados de expressão gênica de pacientes com diagnóstico de doença de Alzheimer. Metodologia: Foram analisadas as expressões gênicas diferenciadas obtidas por meio da diferença entre as expressões de pacientes com a DA e a mediana das expressões de idosos saudáveis, coletadas em seis regiões do cérebro. Para cada região, havia uma quantidade diferente de casos, controles e de transcritos a seres avaliados. O agrupamento por misturas finitas de normais foi aplicado dentro de cada região e, após identificar os grupos de transcritos mais extremos, foram identificadas as funções gênicas correspondentes. Resultados: Para cada região do cérebro, foram identificados, utilizando o critério ICL, ao menos 2 grupos de transcritos considerados mais super-expressos, seja em pacientes com a DA, seja em idosos saudáveis. Algumas funções, como a AUF 1 (hnRNP D0) binds and destabilizes mRNA, foram encontradas em mais de uma região em estudo. Conclusão: O modelo de misturas finitas de normais, utilizando o critério de seleção ICL, foi eficiente para identificar os grupos de transcritos considerados mais expressos e para obter os respectivos processos biológicos. Foi possível identificar funções específicas de cada grupo final selecionado dentro de determinada região, além de observar algumas funções comuns em mais de duas regiões.
Abstract: Introduction: Data clustering and classification techniques were refined and algorithms emerged that cluster objects by common characteristics according to each criterion. These algorithms have been used in the field of genetics to identify disease patterns and as, in the future, a new form of diagnosis. In this paper, the model-based clustering algorithm by finite mixtures of normal distribution was used to analyze gene expression data from patients diagnosed with Alzheimer’s disease. Methods: The differentiated gene expressions obtained through the difference between the expressions of patients with AD and the median expression of healthy elderly people, collected in six brain regions, were analyzed. For each region, there were a different number of cases, controls and transcripts to be evaluated. The model-based clustering by finite mixtures of normal distributions was applied within each region and, after the identification of the most extreme groups of transcripts, the corresponding gene functions were identified. Results: For each brain region, at least 2 groups of transcripts considered to be more over-expressed were identified, using the ICL criterion, either in patients with AD or in healthy elderly people. Some functions, such as AUF 1 (hnRNP D0) binds and destabilizes mRNA, were found in more than one region under study. Conclusions: The model-based clustering by finite mixtures of normal distribution, using the ICL selection criterion, was efficient to identify the groups of transcripts considered more expressed and to obtain the respective biological processes. It was possible to identify specific functions of each final group selected within a given region, in addition to observing some common functions in more than two regions.
Informações adicionais: Trabalho de Conclusão de Curso (graduação) — Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Estatística, 2021.
Licença: A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Aparece na Coleção:Estatística



Todos os itens na BDM estão protegidos por copyright. Todos os direitos reservados.