Próximas Defesas de Projeto Final II (PF-II)

Escondido

Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.

29/04 - 9 horas - BERNARDO JOSE MOURA FONSECA DOS SANTOS. Modelagem do baixo peso ao nascer para bebês nascidos no Estado do Rio de Janeiro, em 2019.

Resumo: O baixo peso ao nascer (BPN) está associado à ocorrência de morbimortalidade neonatal, assim como ao risco de mortalidade durante o primeiro ano de vida e a problemas de desenvolvimento na infância. É considerado um importante indicador de saúde pública relacionado a fatores como saúde materna, nutrição, assistência à saúde e pobreza. Usando os dados do Sistema de Informações sobre Nascidos Vivos (SINASC) de 2019, este trabalho teve como objetivo avaliar a associação entre as características maternas e do bebê e a prevalência de baixo peso ao nascer, no Estado do Rio de Janeiro, em 2019. Utilizou-se o modelo de regressão log-linear de Poisson (com estimador de variância robusta), pelo método de máxima verossimilhança (MV). A prevalência de BPN foi cerca de 9,5%; e observou-se maior prevalência de BPN entre mães com idade de 35 anos ou mais (RP=1,104, p-valor<0,001), que vivem sem companheiro (RP=1,045, p-valor=0,003), menos escolarizadas e de cor não branca (RP=1,079, p-valor<0,001). Presença de nuliparidade, prematuridade (RP=11,812, p-valor<0,001) e realização de parto cesáreo (RP=1,265, p-valor<0,001) e baixo número de consultas de acompanhamento pré-natal também estiveram associadas à maior prevalência de BPN, assim como o recém-nascido ser do sexo feminino (RP=1,240, p-valor<0,001) e apresentar índice de Apgar baixo (RP=1,550, p-valor<0,001) ou muito baixo (RP=1,620, p-valor<0,001). Conclui-se que características sociodemográficas da mãe, do recém-nascido, bem como da gestação e do parto, estão significativamente associadas a uma maior prevalência de BPN. Destaca-se assim a importância da realização de consultas de acompanhamento pré-natal e outros cuidados durante a gravidez, sobretudo para mães com idade mais elevada e com menores níveis socioeconômicos, a fim de reduzir o número de recém-nascidos com BPN.
Palavras-chave: Modelo de Regressão Log-linear de Poisson. Baixo Peso ao Nascer. Razões de Prevalência. Sistema de Informações sobre Nascidos Vivos.

Orientador: José Rodrigo de Moraes

Data da apresentação: 29/04/2021
Horário da apresentação: 09:00
Forma de apresentação: Google meet meet.google.com/fcp-bdpw-sbm 

30/04 - 14 horas - LEONARDO LUIS BARCELLOS RAPOSO. Análise e previsão dos homicídios dolosos de jovens no estado do Rio de Janeiro.

Resumo: A violência em todo mundo é algo amplamente destacado pela mídia como um grande problema para toda a sociedade de forma geral, gerando consequências irreversíveis a todos de forma direta e indireta. A população mais jovem é comumente afetada por diversas formas de violência, principalmente em relação aos homicídios dolosos, quando há intenção de cometer tal ato. Visando monitorar o desenvolvimento deste tipo de violência, utilizou-se a análise de séries temporais. Este trabalho tem como objetivo identificar o perfil da vítima, bem como do agressor e a possível relação entre ambos, visando também destacar períodos do dia e locais do estado do Rio de Janeiro onde seriam mais frequentes as ocorrências e realizar a previsão de homicídios dolosos para o ano de 2020 através dos modelos de Holt-Winters e Box & Jenkins em busca de um modelo que ajuste bem os dados. As estatísticas de aderência utilizadas foram o Coeficiente de Determinação (R²), Critério de Informação Bayesiano (BIC), Erro Médio Percentual Absoluto (MAPE), Raiz Quadrada do Erro Quadrático Médio (RMSE) e Desvio Médio Absoluto (MAD). Com a análise feita, foi visto que os Modelos de Box & Jenkins obtiveram os melhores resultados quando comparadas as estatísticas de aderência com os Modelos de Holt-Winters.
Palavras-chave: Violência. Homicídios dolosos. Rio de Janeiro. Séries temporais. Holt-Winters e Box & Jenkins.

Orientador: Moisés Lima de Menezes
Coorientadora: Núbia Karla de Oliveira Almeida

Data da apresentação: 30/04/2021
Horário da apresentação: 14:00
Forma de apresentação: Google meet meet.google.com/thv-mjmv-vqf

03/05 - 16 horas - LUCAS MOURA FARIA E SILVA. Propondo medidas indiretas baseadas em efeitos espacialmente dependentes e métodos de regularização: uma aplicação na disponibilidade de armas nas microrregiões brasileiras.

Resumo: Existe um consenso na literatura que a proporção de suicídios por arma de fogo é a melhor medida indireta de prevalência de arma de fogo. Entretanto, esta proxy não é uma boa medida em locais com baixa densidade populacional, o que pode ser um problema no contexto de interesse deste trabalho, visto que suicídios são eventos menos comuns no Brasil do que em outros países, como EUA. Recentemente, Cerqueira et al. (2018) propuseram medidas indiretas (proxies) que levam em consideração características pessoais das vítimas e um conjunto de efeitos espaciais como novas alternativas para a prevalência de armas de fogo. Entretanto, os efeitos espaciais foram considerados independentes, o que não parece apropriado dado o contexto espacial inerente. Assim, a proposta deste trabalho foi criar proxies para prevalência de armas de fogo, seguindo uma metodologia semelhante à proposta em Cerqueira et al. (2018), porém seguindo uma perspectiva completamente bayesiana, considerando a inclusão de diferentes estruturas de dependência no espaço, por meio de distribuições a priori condicionais autorregressivas (CAR). Assim como em Cerqueira et al. (2018), foram utilizados dois métodos de regularização, LASSO (least absolute shrinkage and selection operator) e Adaptive LASSO para a estimação de efeitos fixos. Foi realizado uma aplicação dos métodos em dados de suicídios nas microrregiões brasileiras, comparando os resultados obtidos em cada metodologia. As proxies geradas pelos métodos foram validadas utilizando um conjunto de dados americanos. Pôde-se observar resultados promissores para as proxies propostas, com destaque para modelos que incluem alguma estrutura espacial, que foram os modelos com os melhores ajustes e aqueles que apresentaram as correlações mais altas com a prevalência de armas de fogo nos estados americanos.
Palavras-chave: Armas. Suicídios. Inferência bayesiana. CAR. Métodos de regularização.

Orientador: Jony Arrais Pinto Junior

Data da apresentação: 03/05/2021
Horário da apresentação: 16:00
Forma de apresentação: Google meet http://meet.google.com/iis-pdvo-svt

05/05 – 9 horas - LYNCOLN SOUSA DE OLIVEIRA. Estudo sobre anomalia congênita no Brasil utilizando dados do SINASC 2017 e 2018 comparando os modelos logit, probit e complemento log-log com apoio de aprendizado de máquina.

Resumo:No presente trabalho, foram utilizados técnicas de aprendizado de máquinas supervisionado em conjunto com as técnicas de reamostragem k-fold e bootstrap utilizando os modelos logit, probit e complemento log-log, com o objetivo de realizar uma análise comparativa do poder discriminatório destes três modelos utilizados para avaliar a associação entre características da mãe e do recém-nascido e o desfecho de anomalia congênita. Os dados utilizados são provenientes do Sistema de Informações sobre Nascidos Vivos (SINASC) dos anos de 2017 e 2018. A variável resposta anomalia congênita observada pode ser considerada um evento raro pois somente 0,9% dos recém nascidos apresentaram essa característica na base de dados. Foram utilizados 70% dos dados gerais (amostra treino) para aplicação das técnicas k-fold com k = 10 e bootstrap com 50 amostras. Os resultados para as duas técnicas de reamostragem foram parecidos para os três modelos, obtendo valores médios de AUC semelhantes, porém as médias de acurácia e especificidade foram ligeiramente maiores para o modelo probit usando ambas as técnicas de reamostragem (kfold: A = 0; 739 e E = 0; 742; bootstrap A = 0; 738 e E = 0; 740). O modelo selecionado pelo k-fold removeu 2 variáveis explicativas (“raça/cor”do recém nascido e “local de nascimento”) a partir do teste de Wald de significância geral, enquanto a técnica de reamostragem bootstrap removeu 1 variável a mais (“número de consultas de pre-natal”) adotando um nível de significância de = 5%, assim resultando na seleção de dois ajustes de modelo probit distintos. Aplicando os modelos nos 30% dos dados restantes da base de dados geral (amostra teste), notou-se que as métricas que avaliam a capacidade discriminatória dos modelos foram bastante parecidas. Como a  aplicação da técnica bootstrap com 50 amostras demandou significantemente mais tempo para execução, a técnica de reamostragem que se mostrou mais eficiente foi a de k-fold com k = 10.
Palavras-chave: Aprendizado de máquina. Reamostragem. Modelo logit. Modelo probit. Modelo complemento log-log.

Orientador: José Rodrigo de Moraes
Coorientadora: Luciane Ferreira Alcoforado

Data da apresentação: 05/05/2021
Horário da apresentação: 09:00
Forma de apresentação: Google meet meet.google.com/gdh-jzxo-zhg

05/05 - 14 horas - RICARDO JUNQUEIRA DE SOUZA. Estendendo um modelo para identificação de clusters com distribuições a priori baseadas em grafos acíclicos direcionados.

Resumo: Dados de área são quantidades agregadas de um evento de interesse em sub-regiões de uma região de estudo. Um fenômeno comum ao se trabalhar com este tipo de dado é a autocorrelação espacial, que é a tendência de que sub-regiões mais próximas sejam mais similares do que sub-regiões mais distantes entre si e pode ocorrer tanto a nível global quanto local. Ao se modelar dados de área em cenários com a presença de autocorrelação espacial local torna-se necessária a utilização de modelos aptos a lidar com este fenômeno. Neste contexto, Anderson et al. (2014) e Adin et al. (2018) propuseram modelos em dois estágios para estimar uma medida de risco e identificar agrupamentos de sub-regiões com riscos extremos. Estes modelos utilizam como distribuições a priori para os efeitos espaciais o CAR Intrínseco e o Leroux respectivamente e, ainda que apresentem bom desempenho, estas distribuições possuem deficiências conhecidas na literatura. O modelo proposto nesta monografia estende o modelo de Adin et al. (2018) a patir da utilização do DAGAR como distribuição \textit{a priori} para os efeitos de cluster. O DAGAR é um modelo baseado em grafos acíclicos direcionados e parâmetros em escala, possuindo melhor escalabilidade e interpretabilidade. Os estudos aplicados mostraram que o modelo proposto possui desempenho bastante similar ao modelo de Adin et al. (2018), sugerindo que o modelo proposto é uma opção em potencial para utilização em cenários com grande número de sub-regiões, os quais os demais modelos não suportam.
Palavras-chave:Estatística espacial. Dados de área. Modelos hierárquicos Bayesianos. Identificação de clusters. 

Orientador: Jony Arrais Pinto Junior

Data da apresentação: 05/05/2021
Horário da apresentação: 14:00
Forma de apresentação: Google meet meet.google.com/vbp-mmts-yye

10/05 - 9 horas – MARINA CARDEAL SUDRÉ. Modelo de regressão para dados longitudinais: estudo do perímetro cefálico de crianças expostas e não expostas ao vírus Zika.

Resumo: A microcefalia é uma malformação congênita caracterizada pelo perímetro cefálico reduzido para a idade ou sexo, acompanhada de alterações no sistema nervoso central. No Brasil, no ano de 2015, foi observado um aumento inesperado no nascimento de crianças com microcefalia, coincidindo a epidemia de infecção pelo vírus Zika. Este fato foi alvo de muitas pesquisas no Brasil e no mundo. Diante disso, este estudo tem como objetivo modelar a evolução do perímetro cefálico de crianças acompanhadas no Hospital Antônio Pedro (UPC/HUAP-UFF) durante seu primeiro ano de vida e identificar quais são os fatores relacionados a essa evolução. O uso de modelos de regressão linear clássicos tem a limitação de que os dados precisam ser independentes, restrição que não permite explorar de forma adequada os dados deste trabalho, dispostos de forma longitudinal, isto é, observações feitas em sequência temporal em uma mesma criança. Por isso, neste trabalho foram utilizados modelos de regressão para dados longitudinais sob enfoque Bayesiano. O modelo contou com 62 crianças com pelo menos 5 observações cada, totalizando 310 dados. A variável resposta, perímetro cefálico, foi analisada em função das variáveis explicativas comprimento, idade, peso, sexo e grupo, em que comprimento, peso e idade são as variáveis que variam com o tempo. Após serem avaliadas separadamente, notou-se que as variáveis sexo e o grupo de expostos ao ZIKV não possuíam valor significativo em relação ao perímetro cefálico e, portanto, foram removidas. Já a variável idade, quando aplicada separadamente, mostrou exercer influência sobre o perímetro cefálico, mas quando testada em conjunto não foi estatisticamente significativa. De acordo com os métodos de seleção de modelos Critério de Informação de Akaike (AIC) e Critério de Informação Bayesiana (BIC), os resultados obtidos mostraram que o modelo completo apresentou melhor ajuste dos dados. Portanto, as variáveis comprimento, peso, grupo de Zika suspeito e grupo de microcefalia sem exantema materno se apresentaram associadas ao perímetro cefálico das crianças. Dessa forma, vimos que ajustar modelos para dados longitudinais sob enfoque Bayesiano permite analisar problemas altamente complexos, de forma fidedigna e de fácil interpretação.
Palavras-chave: Microcefalia. Dados longitudinais. Perímetro cefálico.

Orientador: Luis Guillermo Coca Velarde

Data da apresentação: 10/05/2021
Horário da apresentação: 09:00
Forma de apresentação: Google meet http://meet.google.com/cki-xnep-yda

10/05 – 10 horas - ANDRE RIBEIRO PINHEIRO DA SLVA. Modelando a probabilidade de ocorrência de eventos raros.

Resumo: O modelo de regressão logístico, surgiu na primeira metade do século XX, e é um dos mais populares para descrever a relação existente entre uma variável resposta binária e um conjunto de variáveis explicativas. Entretanto, é conhecido na literatura que este modelo apresenta problemas quando se trata da modelagem de um evento raro ou quando se trabalha com amostras pequenas. A estatística, considera um evento raro quando uma variável aleatória binária possui um número de ocorrências do evento de interesse (sucessos) consideravelmente mais baixo que o número de ocorrências de não interesse (fracassos). O desbalanceamento entre essas duas categorias, sucessos e fracassos, faz com que este modelo de regressão logística subestime a probabilidade de ocorrência do evento de interesse. Na literatura existem diversas alternativas apontadas para tentar solucionar este problema. Porém, a mais utilizada é o uso da abordagem de Firth à regressão logística. Este trabalho tem por objetivo entender este método proposto mais recentemente e fazer um estudo em cima de duas bases de dados reais verificando os ganhos da abordagem em relação ao uso da regressão logística usual. Os dois modelos são aplicados a duas bases de dados reais: a primeira é uma base de estudos Framinghanm Heart Study , o interesse do estudo é verificar o impacto de fatores de risco em doenças coronarianas. Já a segunda é uma base de estudos contendo dados para avaliar a questão de fraude em cartão de crédito.
Palavras-chave: Modelos lineares. Modelo de Regressão Logística. Evento Raro. Abordagem de Firth. .

Orientador: Jony Arrais Pinto Junior

Data da apresentação: 10/05/2021
Horário da apresentação: 10:00
Forma de apresentação: Google meet meet.google.com/xih-cfnd-rpf

10/05 - 10:30 horas – LARISSA FILGUEIRAS TEIXEIRA MAGALHAES ESTUDANTE. Uso de modelo de regressão para dados longitudinais no efeito do uso de corticoides em gestantes com risco de parto prematuro.

Resumo: Os óbitos de bebês resultados de partos prematuros são um problema constante, representado a maior parte dos óbitos neonatais. Dada a necessidade de um tratamento, busca-se ajustar um modelo de regressão para analisar os dados do índice de pulsatilidade da artéria umbilical, feitos pelo exame de Doppler, do banco de dados de gestantes da Maternidade Perinatal da unidade Laranjeiras com risco de parto prematuro que fizeram uso de corticoide. Conforme apresentado no estudo de Maria Cláudia Bayão em 2018, o uso de corticoide pode vir a ser benéfico para a saúde do bebê sob o risco de parto prematuro. Utilizando métodos de regressão linear múltipla, com estimações de seus parâmetros, tem-se como objetivo identificar se o uso de corticoides foi significativamente benéfico durante a gestação. Foram construídos dois modelos, com dois recortes diferentes da base, um com 4 e outro com 7 observações por cada grávida. Para ambos modelos a variável que identificava a intervenção do corticoide não apresentou relação significante com a pulsatilidade da artéria umbilical. Da mesma forma a variável que indicava o tempo em horas também não apresentou relação significante em nenhum dos dois. Logo foi concluído que a aplicação do corticoide não apresentou influências estatisticamente significativa no tratamento das pacientes.
Palavras-chave: Inferência bayesiana. Modelos de dados longitudinais. Parto prematuro. Artéria umbilical. 

Orientador: Luis Guillermo Coca Velarde

Data da apresentação: 10/05/2021
Horário da apresentação: 10:30
Forma de apresentação: Google meet http://meet.google.com/gzd-rwys-grf

10/05 – 11 horas - RODRIGO TRINDADE PEDROSA. Modelos preditivos esportivos aplicados a dados da NBA.

Resumo: A NBA sempre foi e continuará sendo uma das maiores ligas esportivas do mundo, atraindo milhares de fãs ao redor do planeta e movimentando bilhões de dólares todos os anos. Com a o objetivo de ajudar as pessoas a entenderem melhor os jogos desse campeonato, a estatística se faz presente, sendo um dos seus métodos, o ajuste de modelos para prever resultados. Neste trabalho foram ajustados 7 modelos lineares generalizados utilizando a distribuição de Poisson, tendo a quantidade de pontos marcados por cada time como a variável resposta e as pontuações de fundamentos básicos do basquete como variáveis explicativas, além de duas variáveis indicando o local e em qual temporada a partida ocorreu. Com a previsão dos pontos para cada time, foram simuladas 1000000 de partidas para todos os últimos confrontos que ocorreram em quatro temporadas da NBA. Os modelos foram comparados por algumas medidas e tiveram certas dificuldades para predizer o vencedor de uma partida, com o melhor dos modelos prevendo corretamente, em média, 52,43% das partidas das simulações.
Palavras-chave: NBA. Modelo Lineares Generalizados. Poisson. AIC. Predição.

Orientador: Hugo Henrique Kegler dos Santos

Data da apresentação: 10/05/2021
Horário da apresentação: 11:00
Forma de apresentação: Google meet https://meet.google.com/cch-brrw-iup

10/05 – 11 horas - THAIS DE ALMEIDA MACHADO. Inferência em cadeias de salto com memória de alcance variável.

Resumo: Saber o quanto de informação do passado é relevante para predições é a principal motivação deste trabalho. Aqui são apresentadas as cadeias de salto com memória de alcance variável, processos a tempo contínuo que dependem de uma parte do passado que não é fixa, mas variável – chamada de contexto. Esses processos se caracterizam por possuir uma árvore probabilística de contextos imersa, definidas como sendo o conjunto de contextos ao qual é relevante retornar. São apresentados métodos de estimação para os parâmetros desse processo, e, em particular, é estudado de forma mais aprofundada o estimador definido para a árvore de contextos, similar ao Algoritmo Contexto, mas que além de levar em conta os estados ele também considera o tempo de permanência em cada estado. A fim de avaliar a sua performance, são realizadas simulações de amostras geradas a partir de diversos conjuntos de parâmetros diferentes, com o objetivo de verificar em que situações há uma maior taxa de acertos ou de erros do estimador em estimar a verdadeira árvore desses processos. Também é realizado um estudo acerca do comportamento do estimador em amostras com ruídos. Para isso são inseridos três tipos de ruídos nas amostras em três quantidades diferentes, e é realizada uma comparação do desempenho do estimador conforme as mudanças de cenário apresentadas.
Palavras-chave: Processos de salto. Taxas de salto. Árvore de contextos. Algoritmo contexto.

Orientador: Douglas Rodrigues Pinto
Coorientadora: Karina Yuriko Yaginuma

Data da apresentação: 10/05/2021
Horário da apresentação: 11:00
Forma de apresentação: Google meet meet.google.com/oog-zujb-jsg

 

10/05 – 13 horas - RODOLFO HAURET SPOLADOR. Aplicação do método de Gradient Boosting.

Resumo: Devido ao aumento exponencial da quantidade de dados, os custos mais baixos de processamento computacional e uma maior acessibilidade no armazenamento de dados, as técnicas de aprendizado de máquinas tornaram-se mais atrativas. O aprendizado de máquina é um método de análise de dados que automatiza o desenvolvimento de modelos e permite a criação de modelos preditores, que auxiliam na tomada de decisões, reduzindo assim possíveis riscos. Os modelos de previsão de aprendizado de máquinas podem utilizar de regressões, árvores de classicação, entre outros. Neste trabalho é estudado o modelo supervisionado de Gradient Boosting que é baseado em árvores de classicação, ele se baseia na construção de uma sequência de árvores de classicação, na qual a árvore seguinte é construída com base nos erros da árvore anterior. O modelo utiliza as classicações geradas pelas árvores para gerar uma classificação final. Este método e o método de Regressão Logística serão aplicados em um conjunto de dados rotulados, afim de compará-los.
Palavras-chave:Aprendizado de máquina. Gradient Boosting. Regressão logística. Classificação.

Orientadora: Karina Yuriko Yaginuma

Data da apresentação: 10/05/2021
Horário da apresentação: 13:00
Forma de apresentação: Google meet meet.google.com/vbp-mmts-yye

10/05 - 16 horas – BEATRIZ DA SILVA MELLO. Risco de Crédito: uma aplicação no mercado de capitais para debêntures

Resumo: Nos últimos anos as debêntures, título de renda fixa e com boa rentabilidade, tem apresentado uma grande participação no mercado de capitais, em média 45\% desde 2015. Por esse motivo a análise de risco para esse produto tem se tornado cada vez mais relevante. O presente trabalho apresenta o modelo CreditRisk+ e o método de Simulação de Monte Carlo ajustados a uma carteira teórica de debêntures. O objetivo do estudo é mensurar o risco de crédito do portfólio em cenários com e sem stress, e variando o nível de confiança. Através da aplicação dos modelos, encontrou-se, empiricamente, a distribuição da variável Perdas considerando as premissas de cada método. Em seguida, calcularam-se as principais métricas utilizadas em uma análise de risco – Perda Esperada (PE), \textit{Value at Risk} (VaR), Capital Econômico (EC) e \textit{Expected Shortfall} (ES) – para auxiliar o investidor na mitigação das perdas que o portfólio pode apresentar. Verificaram-se diferenças entre as métricas otidas pelo CreditRisk+ e pela Simulação de Monte Carlo, entretanto ambas as técnicas são importantes para a gestão de risco de crédito de investimentos.
Palavras-chave:Debêntures. CreditRisk+. Simulação de Monte Carlo. Risco de Crédito.

Orientador: Marco Aurélio dos Santos Sanfins
Coorientadora: Daiane Rodrigues dos Santos

Data da apresentação: 10/05/2021
Horário da apresentação: 16:00
Forma de apresentação: Google meet https://meet.google.com/uqt-tiku-ewx 

Fechar Todos