2023 – Defesas no Primeiro Semestre Letivo

Escondido

Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.

ANA JACINTA CAVALCANTI BARRETO. Modelando churn através da regressão logística bayesiana.

Resumo: O fenômeno do churn, caracterizado pela perda de clientes, é uma preocupação crescente para as empresas. A retenção de clientes é fundamental, considerando que o custo de adquirir novos clientes é significativamente maior do que o de mantê-los. Portanto, a retenção de clientes torna-se crucial, exigindo uma compreensão aprofundada do churn. Modelos preditivos são ferramentas populares para identificar clientes propensos ao churn, mas a escolha adequada do modelo e das variáveis é desafiadora. Este trabalho visa identificar e interpretar as variáveis relevantes para o churn em uma empresa de telecomunicações fictícia. Foram construídos modelos de regressão logística bayesiana, utilizando uma amostra de dados de relacionamento com clientes. Os modelos foram comparados com base na relevância estatística das variáveis, e o modelo com melhor desempenho foi selecionado. O modelo escolhido apresentou um ajuste adequado aos dados, com alta acurácia, sensibilidade e área sob a curva (AUC), demonstrando sua eficácia na previsão do churn. Os resultados forneceram informações valiosas sobre as variáveis que influenciam o churn, permitindo que a empresa tome medidas de retenção de clientes. O estudo alcançou seus objetivos e forneceu um modelo preditivo eficaz para o churn na empresa analisada.

Palavras-chave: Regressão Logística. Modelos Lineares Generalizados. Inferência Bayesiana. Predição de Churn.if 1 02 511559

Orientadora: Patrícia Lusié Velozo da Costa (IME/UFF)

Banca:

  • Patrícia Lusié Velozo da Costa (IME/UFF)
  • Guilherme Augusto Veloso (IME/UFF)
  • Mariana Albi de Oliveira Souza (IME/UFF)
CAIO FERNANDO MARTINS CARNEIRO. Análise comportamental do perfil de consumidores de uma empresa após a utilização da ferramenta Google Ads

Resumo: Com as medidas restritivas para reduzir a contaminação da COVID-19, muitos empreendedores e/ou empresas de todos os portes foram afetadas e tiveram que buscar novas formas de trabalhar e atrair clientes. Para inovar e atrair clientes, essas empresas buscaram utilizar ferramentas digitais. No dia a dia são realizadas bilhões de pesquisas no Google e há uma popularização na utilização das ferramentas do Google. Essas ferramentas tem mostrado um grande potencial para o crescimentos das ações de marketing. Utilizando a ferramenta Google Ads as empresas podem usar anúncios para atrair potenciais clientes, divulgando e impulsionando o seu negócio. Este trabalho tem o objetivo de entender o comportamento do perfil do consumidor de uma empresa após o início da utilização da ferramenta Google Ads, ou seja, após serem impactadas pelos anúncios produzidos e divulgados pela ferramenta, além de modelar o número de cliques em anúncios, com base em informações dos usuários e nos parâmetros definidos para a veiculação do anúncio. Com esse intuito, foi utilizado um Modelo de Regressão Poisson sob o ponto de vista da Inferência Bayesiana, cujas estimativas dos parâmetros mostram que o sexo não é uma característica determinante no interesse dos usuários impactados pelos anúncios e que o principal público alcançado pelos anúncios em questão é da faixa etária 55 a 64 anos, enquanto o público menos alcançado é da faixa etária de 18 a 24 anos. Estas estimativas fornecem indicativos de como os investimentos da empresa nos anúncios podem ser otimizados; ou seja, a partir destas informações a empresa pode decidir restringir seus anúncios ao perfil de usuários mais interessado em seus anúncios, economizando recursos, ou redirecionar seus recursos para atrair usuários de um perfil não alcançado.

Palavras-chave: Modelo de regressao poisson. Google ads. Inferencia Bayesiana.if 1 02 511559

Orientadora: Mariana Albi de Oliveira Souza (IME/UFF)

Banca:

  • Mariana Albi de Oliveira Souza (IME/UFF)
  • Ana Beatriz Monteiro Fonseca (IME/UFF)
  • Luis Guillermo Coca Velarde (IME/UFF)
DANIEL MENDES MOREIRA DA SERRA. Avaliação da performance física de atletas de futebol profissional: um estudo baseado em dados extraídos de GPS.

Resumo: O presente estudo tem como objetivo analisar a performance física de jogadores profissionais de um clube brasileiro de futebol, a fim de compreender o desempenho nos treinamentos e jogos oficiais. A análise consiste na coleta de dados de dispositivos GPS conectados a cada jogador, tanto durante os treinos como nas partidas oficiais. A partir dessas informações, buscou-se relacionar o esforço físico realizado nos treinamentos com o desempenho físico nos jogos. Para alcançar esse objetivo, foram utilizadas análises de Componentes Principais (PCA) no sentido de compreender as métricas do jogo, e algoritmos de Aprendizado de Máquinas para relacionar os dados dos treinamentos com os jogos. Tanto no PCA quanto no modelo de predição, foram obtidos resultados suficientes, o que permitiu verificar que variáveis relacionadas à velocidade e treinamentos realizados imediatamente um dia antes das partidas desempenham um papel importante no esforço físico dos atletas durante esses jogos.

Palavras-chave: Futebol. Performance física. Pré-processamento de dados. Análise de Componentes Principais. Aprendizado de Máquinas.if 1 02 511559

Orientador:Douglas Rodrigues Pinto (IME/UFF)
Coorientadora: Karina Yuriko Yaginuma (IME/UFF)

Banca:

  • Douglas Rodrigues Pinto (IME/UFF)
  • Marco Aurélio dos Santos Sanfins (IME/UFF)
  • Reinaldo Castro Souza (DEI/PUC-Rio)
DESIREE MELO DA SILVA. Indicador de Vulnerabilidade Municipal e sua relação com indicadores meteorológicos.

Resumo: Este estudo buscou identificar a relação entre indicadores de vulnerabilidade e variáveis meteorológicas no Brasil. Utilizando um modelo de regressão linear, analisou-se o Indicador de Vulnerabilidade Municipal (IVM) e indicadores meteorológicos de temperatura, umidade e precipitação em diferentes regiões. A análise revelou maior vulnerabilidade em áreas com menor precipitação e menor amplitude de temperatura e umidade. A dependência espacial foi detectada, ressaltando a importância de considerar a dimensão espacial ao examinar o IVM. Esses resultados são relevantes para o planejamento de políticas públicas e tomada de decisões, visando a adaptação às mudanças climáticas e intervenções específicas para áreas mais vulneráveis.

Palavras-chave: Índice de vulnerabilidade. Regressão Linear Múltipla. Estatística Espacial.if 1 02 511559

Orientadora: Ludmilla da Silva Viana Jacobson (IME/UFF)

Banca:

  • Ludmilla da Silva Viana Jacobson (IME/UFF)
  • Jessica Quintanilha Kubrusly (IME/UFF)
  • Márcia Marques de Carvalho (IME/UFF)
EMILY HATTORI. Simulação de Sistema de Filas.

Resumo: O trabalho propõe comparar resultados teóricos de sistemas de filas com resultados simulados. Para isso foram estudadas diversas medidas de desempenho para diferentes sistemas de filas, e essas medidas foram estimadas também a partir da simulação. Os resultados mostraram a convergência das estimativas pela simulação para os valores teóricos, indicando um bom desempenho do algoritmo de simulação. Além disso, foi possível sugerir medidas de desempenho não conhecidas pela teoria, como por exemplo o percentual médio de clientes perdidos com tamanho de fila limitado.

Palavras-chave: Sistemas de Filas. Simulação de números pseudoaleatórios. Processo de nascimento e morte. M/M/1. M/M/1/k.if 1 02 511559

Orientadora: Jessica Quintanilha Kubrusly (IME/UFF)

Banca:

  • Jessica Quintanilha Kubrusly (IME/UFF)
  • Karina Yuriko Yaginuma (IME/UFF)
  • Antonio Augusto de Aragão Rocha (IC/UFF)
HILLARY DE OLIVEIRA DOS SANTOS. Atribuição de pesos em indicadores compostos: metodologias baseadas em dados e uma aplicação ao Brasil

Resumo: O uso de indicadores compostos vem sendo cada vez mais comum para avaliar e orientar a condução de políticas governamentais. Tais indicadores reconhecidamente sintetizam algum fenômeno complexo, muitas vezes descritos por uma coleção de indicadores simples que representam diferentes dimensões de tal fenômeno. Este é o caso, por exemplo, do Índice de Desenvolvimento Humano(IDH). Há várias etapas envolvidas na criação de um indicador composto, sendo uma das mais relevantes a escolha da importância relativa (pesos) dos diferentes indicadores a serem combinados. O presente trabalho compara duas metodologias de atribuição de pesos baseadas em dados: Análise de Componentes Principais e Análise Envoltória de Dados. Com base nestes métodos, dois indicadores compostos serão criados e comparados com as propostas de governo dos mandatos entre 1997 a 2022 afim de avaliar a qualidade das políticas econômicas adotadas.
Palavras-chave:  Indicadores compostos. Análise de Componentes Principais. Análise Envoltória de Dados. Avaliação de governos.
 if 1 02 511559

Orientador: Wilson Calmon Almeida dos Santos (IME/UFF)

Banca:

  • Wilson Calmon Almeida dos Santos (IME/UFF)
  • Jorge Nogueira de Paiva Britto (ESC/UFF)
  • Márcia Marques de Carvalho (IME/UFF)
ITALO DE MORAES DOLORES. Teoria Assintótica: uma Abordagem em Testes de Aderência.

Resumo: Os testes de hipóteses são amplamente utilizados para realizar inferências na população em estudo. Em particular, os Testes de Aderência constituem parte fundamental de orientação para demais investigações sobre as distribuições de probabilidade, por isso, o conhecimento metodológico é fundamental para análises fidedignas. Neste trabalho, foi estudado o Teste de Aderência de Qui-quadrado de Pearson tanto no caso de parâmetros conhecidos quanto no caso de parâmetros estimados. Esta pesquisa, resume-se como um trabalho investigativo para fornecer informações sobre o Teste de Aderência de Qui-quadrado de Pearson, ilustrar as conclusões dos teoremas e realizar revisão literária. Após extensivas revisões literárias, notou-se a importância da diferença entre os Testes de Aderência com e sem estimação de parâmetros, por isso, realizou-se simulações computacionais para ilustrar esta diferença. Nas simulações realizadas, fica evidente a diferença entre os números de graus de liberdade das distribuições Qui-quadrado para quais as estatísticas de testes nos casos sem estimação e com estimação de parâmetros convergem assintoticamente. Pode-se concluir que os nossos resultados das simulações computacionais coincidiram com os resultados teóricos descritos na literatura.

Palavras-chave: Teste de Aderência de Qui-quadrado de Pearson. Teoria Assintótica. Revisão Bibliográfica. Simulação computacional.if 1 02 511559

Orientador: Valentin Sisko (IME/UFF)

    Banca:

    • Valentin Sisko (IME/UFF)
    • Marco Aurélio dos Santos Sanfins (IME/UFF)
    • Mariana Albi de Oliveira Souza (IME/UFF)
    MARIANA BARROS RAMOS. Análise do Perfil dos Usuários Big Brother Brasil: Um estudo de caso dos assinantes do Globloplay .

    Resumo: O presente estudo teve como objetivo analisar dados fornecidos pela Globo para identificar o perfil do usuário do Big Brother Brasil (BBB). Para isso, foi utilizado um modelo logístico ajustado no software RStudio. O foco da pesquisa foi entender o comportamento dos assinantes do Globoplay que têm o BBB como seu primeiro conteúdo. Após análise dos dados, o perfil ideal do usuário do BBB foi identificado. Esse perfil é composto, em média, por pessoas de 36 anos, predominantemente do sexo feminino, e provenientes da região Sudeste do Brasil. Os usuários com esse perfil tendem a optar pelo plano Globoplay + Canais Ao Vivo e Premiere, consumindo séries pelo celular e filmes na TV. Além disso, demonstram um interesse significativo por programas do tipo reality, preferindo conteúdos ao vivo em vez de conteúdos on demand. É interessante notar que esses usuários não costumam assistir ao canal da Globo pelo serviço de streaming. Os resultados obtidos fornecem informações valiosas para explorar novas formas de interação e engajamento com o público-alvo, possibilitando a criação de experiências que atendam às suas expectativas. Compreender o comportamento desses usuários permitirá o desenvolvimento de estratégias mais eficientes e direcionadas, a fim de maximizar a satisfação e o envolvimento com o conteúdo oferecido pelo Globoplay, especialmente no contexto do BBB.

    Palavras-chave: Analise de perfil. Bbb. Streaming. Modelo logistico. if 1 02 511559

    Orientadora:  Ana Beatriz Monteiro Fonseca (IME/UFF)

    Banca:

    • Jessica Quintanilha Kubrusly (IME/UFF)
    • Jony Arrais Pinto Junior (IME/UFF)
    • Ludmilla da Silva Viana Jacobson (IME/UFF)
    MATHEUS CARL BEER. Modelos de tendência e ARIMA para análise e previsão de matrículas de uma escola de ensino de idiomas nos anos de 2017 a 2022.

    Resumo: Por causa da pandemia de Covid-19, diversos setores trabalhistas tiveram que fazer adaptações para a modalidade virtualmente ou remota. Esse trabalho tem como objetivo principal analisar o impacto da pandemia na quantidade de alunos ingressantes e matriculados em uma escola de ensino de idiomas na cidade do Rio de Janeiro. Modelos de Regressão Linear e o teste de Chow foram estimados para verificar se houve quebra estrutural no número de alunos matriculados por mês durante a pandemia, segundo a cliente e a filial. Os resultados mostraram que houve quebra estrutural em quase todas as localidades / clientelas. Modelos ARIMA foram estimados para previsão de ingressantes no último trimestre de 2022 e para o primeiro trimestre de 2023.
    Palavras-chave: Covid-19. Modelo de Regressão Linear. Séries temporais. Teste de Chow. Quebra estrutural.
    if 1 02 511559

    Orientador: Márcia Marques de Carvalho (IME/UFF) 

    Banca:

    • Márcia Marques de Carvalho (IME/UFF) 
    • Ludmilla da Silva Viana Jacobson (IME/UFF)
    • Moisés Lima de Menezes (IME/UFF)
    Fechar Todos

    2022 – Defesas no Segundo Semestre Letivo

    Escondido

    Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.

    ALINE D’AVILA PEREIRA. Modelos Bayesianos de Análise de Sobrevivência aplicados a dados de Neoplasia Trofoblástica Gestacional.

    Resumo: A Doença Trofoblástica Gestacional (DTG) constitui grupo de tumores relacionados à gestação e originários do tecido trofoblástico placentário, cujo marcador biológico-hormonal é o hCG (gonadotrofina coriônica humana). A verdadeira etiologia dessa anomalia ainda não está clara, no entanto a origem da DTG parece ser por gametogênese e fertilização anormais, além da transformação maligna do tecido trofoblástico. A DTG é classificada em dois grupos de importância clínica: mola hidatiforme e neoplasia trofoblástica gestacional (NTG). Esta última é a forma maligna da doença e inclui a mola invasora, o coriocarcinoma, o tumor trofoblástico do sítio placentário (TTSP) e o tumor trofoblástico epitelióide (TTE). Trata-se de patologia rara, que ainda demanda estudos para melhor compreendê-la, em especial com relação ao tempo até o óbito, uma variável que apresenta censura, uma subárea para análise de sobrevivência cuja definição está relacionada ao fato de não existir uma data de ocorrência do desfecho. Esse parâmetro pode possuir inúmeras distribuições, dentre elas a distribuição de Weibull, a qual foi abordada no presente estudo. Assim, o objetivo do presente estudo é avaliar a letalidade NTG, utilizando o modelo bayesiano de análise de sobrevivência para estimar o tempo até o óbito. As características coletadas foram analisadas através da técnica de análise de sobrevivência com enfoque Bayesiano para estimar o tempo até o óbito. Assim, utilizou-se como variáveis explicativas: classificação quanto à dosagem de hCG < 100 mil (UI/L), histologia, origem, escore prognóstico OMS, metástase, classificação do escore prognóstico, tratamento no centro de referência (CR), tratamento inicial e intervalo entre término da gravidez e início do tratamento. Sendo a sobrevida (em dias) a variável de interesse. Além disso, avaliou-se a curva de sobrevida a partir da utilização do estimador de Kaplan-Meier. Para a obtenção das curvas de sobrevida utilizou-se o software RStudio e para o modelo Bayesiano o OpenBugs. Vale destacar que para definir a $priori$ dos parâmetros da Weibull, utilizou-se uma $priori$ não informativa para beta e r. Foram acompanhadas 2181 pacientes, desde o primeiro registro em um Centro de Referência até o óbito ou remissão, sendo que dessas 89 foram a óbito devido à NTG, o que representa 4,08% de alcance do desfecho. Utilizando o estimador de Kaplan-Meier, observou-se diferenças nas curvas de sobrevida de todas as variáveis analisadas. Já em relação à avaliação do modelo Bayesiano, observou-se que as variáveis sem histologia, escore OMS menor ou igual 6 e tratamento inicial único contribuem para aumentar o tempo até o óbito. Com isso, notou-se que ajustar modelos com o enfoque Bayesiano permite analisar problemas altamente complexos, de forma eficiente e de fácil interpretação, sendo possível calcular a probabilidade do efeito positivo.

    Palavras-chave: Análise de Sobrevivência. Letalidade. Doença Trofoblástica Gestacional. Modelos Bayesianos.if 1 02 511559

    Orientador: Luis Guillermo Coca Velarde (GET/UFF)
    Coorientadora: Fernanda Freitas Oliveira Cardoso (ME/UFRJ)

    Banca:

    • Luis Guillermo Coca Velarde (GET/UFF)
    • Jony Arrais Pinto Junior (GET/UFF)
    • Antônio Rodrigues Braga Neto (ME/UFRJ)
    BRENDHA ALVES GOMES. Identificação de clusters persistentes de criminalidade no estado do Rio de Janeiro.

    Resumo:  A detecção de clusters espaciais ou espaço-temporais têm papel importante para a tomada de decisão das instituições competentes. O trabalho aqui proposto objetiva a detecção e identificação de clusters espaciais na ocorrência de crimes de roubo, furto e letalidade violenta no estado do Rio de Janeiro entre os anos de 2016 a 2020. Para tal, será utilizado a estatística Scan, proposta por Kulldorff (1997). Deseja-se identificar possíveis clusters persistentes em divisões territoriais da base de segurança feita pelo Instituto de Segurança Pública, ISP, que corresponde às menores áreas territoriais de apuração de indicadores de criminalidade, sendo as Circunscrições Integradas de Segurança Pública – CISP. As análises, para cada ano, serão realizadas de forma independente e será analisado se os possíveis clusters identificados apresentam comportamento semelhante ao longo dos trimestres. Dessa forma, foi possível observar que os municípios apresentam comportamentos diferentes em alguns trimestres. Entretanto, na grande maioria das vezes as áreas com risco mais alto de criminalidade, para os três desfechos de interesse, estão concentrados espacialmente na Região Metropolitana do estado.

    Palavras-chave: Estatística Espacial. Criminalidade. Rio de Janeiro. SaTScan. Cluster.if 1 02 511559

    Orientador: Jony Arrais Pinto Junior (GET/UFF)
    Coorientador: Rafael Santos Erbisti (GET/UFF)

    Banca:

    • Jony Arrais Pinto Junior (GET/UFF)
    • Rafael Santos Erbisti (GET/UFF)
    • Guilherme Augusto Veloso (GET/UFF)
    • Victor Eduardo Leite de Almeida Duca (GET/UFF)
    CAROLINE FERREIRA DA CRUZ GOMES. Modelagem de covariância espacial bivariada baseada em aproximações separáveis.

    Resumo: Os recursos computacionais se mostram cada vez mais necessários na área da Estatística e para diversas ciências, porém lidar com dados de alta dimensionalidade ainda é um desafio. Em estatística espacial, na área da geoestatística, as análises de dados multivariados espaciais necessitam da especificação de uma função de covariância cruzada, a qual define a dependência entre as variáveis do vetor resposta e as localizações do domínio espacial. Entretanto, o custo computacional para realizar o procedimento de inferência e predição pode ser proibitivo. Como consequência, o uso de modelos complexos é inviável. Neste trabalho, será considerado o modelo de covariância não separável para dados multivariados, apresentado em Porcu, Bevilacqua e Genton (2016), e a forma de aproximação da matriz de covariância cheia a partir de duas matrizes separáveis de menor dimensão, apresentada em Genton (2007) e Erbisti, Fonseca e Alves (2018). O método de aproximação é aplicado apenas no cálculo da verossimilhança, mantendo a interpretação do modelo original. Um estudo de simulação será conduzido para comparar a performance inferencial dos modelos aproximados, bem como o ganho em eficiência computacional. Diferentemente de Erbisti, Fonseca e Alves (2018), o objetivo é investigar o uso dessas aproximações separáveis para a matriz de covariância obtida a partir de funções que permitem diferentes alcances espaciais para cada componente do vetor resposta. O procedimento de estimação dos modelos será sob o enfoque bayesiano e implementado no software R. Por fim, desenvolveu-se um pacote no R para o cálculo da função de verossimilhança utilizando as aproximações separáveis.

    Palavras-chave: Estatística espacial. Modelos não separáveis. Aproximações separáveis. Inferência Bayesiana.if 1 02 511559

    Orientador: Rafael Santos Erbisti (GET/UFF)

    Banca:

    • Rafael Santos Erbisti (GET/UFF)
    • Patrícia Lusié Velozo da Costa (GET/UFF)
    • Viviana das Gra ̧cas Ribeiro Lobo (IM/UFRJ)
    CAROLINA TORRES BICHARA. Mensurando a influência de fatores socioeconômicos na taxa de incidência de Tuberculose entre os municípios do Rio de Janeiro.

    ResumoA Tuberculose é uma das mais antigas doenças infecciosas e tramissíveis da humanidade causada principalmente pelo bacilo aeróbico Mycobacterium tuberculosis. No Brasil, são notificados aproximadamente 100 mil casos novos e ocorrem cerca de 4,5 mil mortes por ano em decorrência da Tuberculose e, em especial, o Rio de Janeiro se destaca entre os três primeiros estados com maior taxa de incidência da doença nos últimos anos. O conhecimento da dinâmica da doença é imprescindível para subsidiar estratégias de vigilância e controle da mesma, desta forma, este trabalho tem como objetivo identificar associações entre a Taxa de Incidência de Tuberculose e indicadores socioeconômicos nos municípios do estado do Rio de Janeiro através de um Modelo de Regressão Linear Múltiplo. Primeiramente foi desenvolvida uma análise exploratória, via mapas coropléticos, para entender a distribuição da variável resposta e das variáveis explicativas no espaço geográfico. Posteriormente, constatou-se através do modelo que a cada uma unidade ou ponto percentual da densidade intradomiciliar, do percentual de ocupados com Ensino Médio completo ou da taxa de HIV existe um aumento na taxa de incidência de Tuberculose. O modelo final obteve um R2 = 0, 6001.

    Palavras-chave: Tuberculose. Taxa de incidência. Indicadores Sociais. Regressão Linear Múltipla. if 1 02 511559

    Orientadora: Ana Maria Lima de Farias (GET/UFF)

    Banca:

    • Ana Maria Lima de Farias (GET/UFF)
    • Jessica Quintanilha Kubrusly (GET/UFF)
    • Jony Arrais Pinto Junior (GET/UFF)
    ELIZABETH APARECIDA DE SOUZA MATOS. Análise e Previsão de Demanda de Energia Elétrica no Sudeste e Centro-Oeste do Brasil Através de Modelos de Séries Temporais.

    Resumo: A demanda por energia elétrica vem crescendo no país juntamente ao desenvolvimento tecnológico e aumento da população. O Brasil dispõe de diferentes recursos naturais, porém a energia hidrelétrica é responsável por mais de 65% de todo o consumo do país, sendo as demais gerações de energia utilizadas de forma complementar. A geração de energia pode ser otimizada a partir de uma perspectiva da demanda, cujo conhecimento prévio pode proporcionar um planejamento mais adequado para a distribuição. Este trabalho propôs gerar previsões de demanda de energia para as regiões Sudeste e Centro-Oeste para um horizonte de um ano, a partir de modelos de séries temporais pelos métodos de amortecimento exponencial de Holt-Winters e de modelos de Box & Jenkins. Na ocasião, estatísticas de aderência como MAPE, RMSE, R² e BIC foram utilizadas para avaliar a capacidade preditiva dos modelos e análises das FAC dos resíduos e testes de normalidade foram utilizados para fazer o diagnóstico dos mesmos a fim de se obter o melhor modelo para previsão. Os resultados mostraram que o modelo SARIMA apresenta melhores resultados do que as demais modelagens para a previsão de demanda de energia elétrica. Tais resultados contribuem para a utilização deste modelo no auxílio do planejamento energético do país.

    Palavras-chave: Estatística. Séries Temporais. Previsão. Demanda de energia. Modelo SARIMA.if 1 02 511559

    Orientador: Moisés Lima de Menezes (IME/UFF)

    Banca:

    • Moisés Lima de Menezes (GET/UFF)
    • Márcia Marques de Carvalho (GET/UFF)
    • Mariana Albi de Oliveira Souza (GET/UFF)
    FELIPE NELSON VICTORIA. Um modelo de previsão de resultados de partidas de futebol: Flamengo deveria ser o campeão em 2009?

    Resumo: O trabalho tem como principal objetivo desenvolver um modelo capaz de predizer os resultados para as partidas de futebol e o propósito secundário de demonstrar se o Flamengo era o time favorito para ser campeão brasileiro no ano de 2009. Para a realização do trabalho foi utilizado o método da Soma e Diferença 0, onde é assumido que X e Y são os números de gols marcados em uma dada partida pelos times mandante e visitante, respectivamente. Mais ainda, é admitido que X e Y são variáveis aleatórias independentes e ambas seguem uma distribuição de Poisson com parâmetros l-X e l-Y. Os ajustes dos modelos são feitos por meio das informações de quais são os times mandantes e visitantes e do número de gols marcados por cada um deles nas partidas do primeiro turno de cada campeonato analisado. Em posse do parâmetros, são feitas simulações para o segundo turno do torneio.
    Dessa forma torna-se viável apontar os times que mais vezes ganharam os campeonatos e assim, afirmar se um time é ou não um dos favoritos para se consagrar como campeão do Campeonato Brasileiro. O modelo desenvolvido foi capaz de prever os resultados finais das partidas disputadas na segunda metade dos campeonatos, apontando se houve uma equipe vencedora ou se o jogo terminou empatado e indicou que o Flamengo não era uma das equipes favoritas ao título em 2009.
    Palavras-chave: Método soma e diferença 0. Modelo de predição. Futebol.if 1 02 511559

    Orientadora: Karina Yuriko Yaginuma (GET/UFF)

    Banca:

    • Karina Yuriko Yaginuma (GET/UFF)
    • Hugo Henrique Kegler dos Santos (GET/UFF)
    • Marco Aur ́elio dos Santos Sanfins (GET/UFF)
    GABRIELA DE OLIVEIRA MONTEIRO. Análise de dados de luxação de quadril em crianças com Zika Congênita.

    Resumo: A Zika é uma doença transmitida pela picada do mosquito Aedes Aegypti, o mesmo transmissor da dengue. A doença foi identificada pela primeira vez no Brasil em abril de 2015, na cidade de Camaçari, próximo a Salvador (BA). Sua primeira descrição foi em um macaco em 1947, no país de Uganda, na floresta Zica, onde o vírus recebeu o nome do seu local de origem e o primeiro isolamento em humanos foi em 1952, também em Uganda. O vírus tem potencial de causar diversas formas de sintomas, de leves a graves, como exantema (manchas vermelhas na pele), dor de cabeça, febre baixa, conjuntivite e dores nas articulações. A Síndrome da Zika Congênita (SZC) se manifesta em recém-nascidos de mães que tenham sido infectadas pelo vírus durante a gravidez. Os principais sinais identificados nas crianças são alterações neurológicas (microcefalia), oftalmológicas e ortopédicas. O objetivo central do trabalho é descobrir possíveis fatores associados às luxações de quadril em crianças com Zika congênita. O estudo foi realizado com base nos dados de 31 crianças residentes no Estado do Rio de Janeiro e portadoras da Zika congênita. Foi usado um modelo de regressão logística sob um enfoque bayesiano, utilizando o Método de Monte Carlo via Cadeia de Markov (MCMC), para quantificar os efeitos dos diversos fatores sobre a condição de luxação das crianças do estudo. Inicialmente, foram considerados modelos com apenas uma variável regressora, e aquelas que se mostraram significativas foram consideradas no modelo múltiplo. Sendo assim, observou-se que os fatores que influenciam na ocorrência de luxação de quadril são a espasticidade, apresentando razão de chances de 19,79, e a alteração oftalmológica, com razão de chances de 7,35. Em outras palavras, as chances de uma criança ter luxação de quadril apresentando espasticidade são quase 20 vezes as chances de ter luxação quando a criança não apresenta espasticidade e a chance de apresentar luxação tendo observado a alteração oftalmológica é 7,35 vezes as chances em crianças que não possuem essa alteração.
    Palavras-chave: Zika congênita. Luxação de quadril. Regressão logística. Inferência Bayesiana.if 1 02 511559

    Orientador: Luis Guillermo Coca Velarde (GET/UFF)
    Coorientadora: Jakeline Oliveira da Fonseca (CMM/UFF)

    Banca:

    • Luis Guillermo Coca Velarde (GET/UFF)
    • Mariana Albi de Oliveira Souza (GET/UFF)
    • N ́ubia Karla de Oliveira Almeida (GET/UFF)
    GABRIELA SANTOS CORREIA. Processo de ramificação em modelos epidemiológicos.

    Resumo: Os modelos estatísticos desempenham um papel fundamental na vigilância epidemiológica, uma vez que o conhecimento da propagação de uma doença infecciosa facilita o direcionamento de políticas públicas. O processo de ramificação aparece na literatura como uma forma eficaz de entender a propagação de uma epidemia com características similares à de COVID-19, além de apresentar a vantagem da incorporação da aleatoriedade, intrínseca a um processo de contágio, de forma simples. Neste trabalho objetivou-se o estudo de teoria, aplicações e métodos do processo de ramificação. Para isso, desenvolveu-se o funcionamento deste processo, bem como sua média e variância, além do conceito de probabilidade de extinção. É exposto também um estudo de simulação, onde comparam-se os resultados obtidos com aqueles encontrados na literatura.

    Palavras-chave: Processos estocásticos. Modelos epidemiológicos. Probabilidade de extinção. Função geradora de probabilidade.if 1 02 511559

    Orientadora: Karina Yuriko Yaginuma (GET/UFF)

    Banca:

    • Karina Yuriko Yaginuma (GET/UFF)
    • Dougls Rodrigues Pinto (GET/UFF)
    • Jaime Antonio Utria Valdes (GET/UFF)
    INGRID TRINDADE MARROCOS. Modelando a relação entre fatores sociais e proficiência no ENEM.

    Resumo: O ENEM tem como principal objetivo analisar a proficiência dos alunos do ensino médio e possibilitar o seu ingresso no ensino superior. A partir de indicadores educacionais e socioeconômicos torna-se possível ter uma melhor compreensão sobre a real situação educacional de uma região e, com isso, auxiliar a discussão e criação de políticas públicas voltadas para ampliação e melhoria do sistema de educação. O objetivo deste trabalho é modelar a relação entre fatores que podem influenciar a proficiência dos alunos no ENEM, considerando a real desigualdade persistente no Brasil e suas diferenças regionais. Foi avaliada a proficiência dos alunos a partir das notas médias de matemática e português no ENEM de 2019 das escolas dos candidatos, em todo o Brasil. Após o agrupamento dos dados que estavam no nível do aluno para o nível da escola, obteve-se informação de 29.181 escolas para o modelo de matemática e 29.298 para o modelo de português. Neste trabalho foi utilizado o modelo de regressão linear normal incorporando a informação da localização espacial das escolas a partir de variáveis de efeitos fixos, identificando, assim, a microrregião na qual a escola pertence. Além disso, foi utilizado o método de regularização LASSO para selecionar os indicadores socioeconômicos e de infraestrutura escolar de maior relevância, bem como os efeitos fixos significativos relacionados às localizações das escolas, sendo usado o $lambda = 0,446$, pois possui o menor erro de predição. Os resultados encontrados não se diferenciam dos já discutidos na literatura: nota-se que alunos não brancos, de renda baixa, oriundos de escolas públicas das regiões Norte e Nordeste apresentam menor proficiência em ambas as provas. Ademais, a presença de quadra e de candidatas gestantes na escola não demostrou ser relevante para a nota de matemática, e escolas com alunos autistas possuem efeito negativo na nota média das escolas nas provas de matemática (-110 pontos) e português (-66,3 pontos). Observou-se também que a maioria das escolas são públicas (72%) e que as escolas localizadas no Sudeste são as que mais possuem candidatos de cor branca (72,5%). Na análise dos resíduos, o Teste de Breusch–Pagan e Teste de Lilliefors rejeitam os pressupostos de variância $sigma^2$ constante e normalidade, respectivamente.

    Palavras-chave: Modelo de regressão linear. LASSO. ENEM. Efeito espacial.if 1 02 511559

    Orientador: Rafael Santos Erbisti (GET/UFF)

    Banca:

    • Rafael Santos Erbisti (GET/UFF)
    • Ana Beatriz Monteiro Fonseca (GET/UFF)
    • Victor Eduardo Leite de Almeida Duca (COPPE/UFRJ)
    JOÃO PEDRO DE MATOS D’ASSUMPÇÃO. Definição rigorosa da distribuição uniforme no intervalo unitário.

    Resumo:  Neste texto, é exposto como é possível definir rigorosamente a distribuição uniforme no intervalo unitário. Para isto, definimos conceitos e demonstramos propriedades de medida. Infelizmente, a sigma-álgebra usada na definição não é a sigma-álgebra de todos os subconjuntos do intervalo real [0,1). Um dos exemplos apresentados indica impossibilidade de usar esta sigma-álgebra na definição.

    Palavras-chave: Probabilidade. Distribuição uniforme. Teoria da medida. Paradoxo de Banach-Tarski.if 1 02 511559

    Orientador: Valentin Sisko (GET/UFF)

    Banca:

    • Valentin Sisko (GET/UFF)
    • Jaime Antonio Utria Valdes (GET/UFF)
    • Douglas Rodrigues Pinto (GET/UFF)
    LETÍCIA FELIX BATISTA. Classificação da Polaridade de Tweets Relacionados a Artistas da Indústria Musical Brasileira.

    Resumo: Este trabalho teve como objetivo a criação de um classificador da polaridade de tweets relacionados a artistas da indústria musical. Para isso, foi construída uma base com mais de 5000 tweets mencionando a artista Anitta. Os tweets foram rotulados manualmente dentro das classes “negativa” e “positiva”, e com a base construída foram estudadas técnicas de classificação de texto como a utilização de um Léxico Rotulado e algoritmos de Aprendizado de Máquinas.

    Palavras-chave: Mineração de texto. Aprendizado de máquinas. Twitter. Estatistica. Indústria musical.if 1 02 511559

    Orientador: Douglas Rodrigues Pinto (GET/UFF)

    Banca:

    • Douglas Rodrigues Pinto (GET/UFF)
    • Jessica Quintanilha Kubrusly (GET/UFF)
    • Karina Yuriko Yaginuma (GET/UFF)
    MATHEUS FRANCO PEREIRA CARNEIRO. Modelagem dos casos de dengue em Florianópolis - SC, no período de 2017 a 2021.

    Resumo: A dengue é uma arbovirose causada pelo vírus DEN e possui quatro sorotipos diferentes: DENV-1, DENV-2, DENV-3 e DENV-4, sendo o mosquito textit{Aedes aegypti} o principal transmissor da doença no Brasil. A doença se manifesta predominantemente em locais urbanizados de clima tropical, e seus ciclos endêmicos e epidêmicos costumam ocorrer a cada 4 ou 5 anos, totalizando mais de 7 milhões de casos notificados em território nacional. Por ser um país de dimensões continentais, com diferentes cenários populacionais, econômicos e climáticos, o estudo da dengue em cada localidade apresenta particularidades e, consequentemente, medidas de enfrentamento diferentes. A região Sul, tratada como uma região de improvável disseminação da doença, tem reportado uma progressão da atividade do mosquito vetor e um aumento do número de casos da doença, registrando, pela primeira vez, em 2020, taxa de incidência da dengue maior que a média nacional. O presente trabalho buscou avaliar o comportamento dos casos de dengue em uma grande metrópole da região Sul com histórico recente de epidemias. Sendo assim, analisou-se, no período de janeiro de 2017 a dezembro de 2021, o número de casos de dengue em Florianópolis, além de fazer previsões para as seis primeiras semanas epidemiológicas do ano de 2022. Para isso, foram realizadas análises de séries temporais pela metodologia Box e Jenkins, investigando a existência de correlação temporal entre a série de contagem de casos e as séries de índice pluviométrico e temperatura mínima, com objetivo de encontrar modelos com boa capacidade preditiva para a incidência de novos casos semanais da doença. Nos resultados obtidos, ao incorporar nos modelos variáveis climáticas, não foi observada uma melhora no ajuste dos dados. O modelo que mostrou-se mais adequado utilizou somente os dados passados da contagem de casos da doença. As predições para as seis primeiras semanas epidemiológicas do ano de 2022 mostraram-se razoáveis comparadas àquelas observadas na cidade de Florianópolis.

    Palavras-chave: Séries temporais. Box e Jenkins. Dengue. ARIMA.if 1 02 511559

    Orientadora: Ana Beatriz Monteiro Fonseca (GET/UFF)

    Banca:

    • Ana Beatriz Monteiro Fonseca (GET/UFF)
    • Patrícia Lusié Velozo da Costa (GET/UFF)
    • Victor Eduardo Leite de Almeida Duca (GET/UFF)
    PATRÍCIA MELLO MARÇAL PINTO. Uma metodologia de construção de uma base de dados de perfis do Twitter rotulados em bot ou em legítimo.

    Resumo: O Twitter é uma plataforma que fornece uma estrutura de uso simples e permite fácil acesso às pessoas, favorecendo à utilização de perfis automatizados, os bots sociais, que são contas de mídia social controladas totalmente ou parcialmente por algoritmos de computador. Os bots sociais podem ser benignos, quando são inofensivos, ou seja, não são poluidores de conteúdo, ou podem ser maliciosos, quando se passam por usuários humanos com o objetivo de manipular e poluir conteúdo. Além disso, a natureza automatizada dos bots maliciosos ajudam a amplificar a desinformação. Dessa forma, este trabalho se propõe a criar uma base de dados de perfis do Twitter rotulados em bot ou em legítimo, bem como fazer uma análise comparativa das características de perfis bots e legítimos. Foram empregados dois métodos diferentes para a coleta de usuários do Twitter, sendo que em um deles foi utilizado o mecanismo de contas honeypots (LEE; EOFF; CAVERLEE, 2011). Após a coleta de usuários, foi realizada verificação manual por meio de um questionário, a fim de obter os limites da pontuação bruta geral do classificador Botometer para definição de usuários legítimos e bots. No total, a base de dados contou com 1.279 contas, sendo 679 rotuladas como bots e 600 rotuladas como legítimas. Para a base de dados completa, foram extraídas informações de cada conta, assim como de suas publicações. Algumas variáveis analisadas indicaram maior heterogeneidade das contas classificadas como bots, ao passo que outras variáveis analisadas mostraram que as contas classificadas como legítimas apresentam maior variabilidade.

    Palavras-chave:  Base de dados rotulada. Bots. Twitter. Contas honeypots.if 1 02 511559

    Orientadora: Karina Yuriko Yaginuma (GET/UFF)

    Banca:

    • Karina Yuriko Yaginuma (GET/UFF)
    • Jessica Quintanilha Kubrusly (GET/UFF)
    • Patr ícia Lusié Velozo da Costa (GET/UFF)
    RAFAEL ORNELLAS BARBOSA PEREIRA PIGOZZO. Análise de roubos no município do Rio de Janeiro via modelos aditivos generalizados.

    Resumo: A violência e a criminalidade causam danos e prejuízos à sociedade e ao Estado. O município do Rio de Janeiro, além de sofrer com problemas históricos na área de segurança pública, é afetado por um ciclo que envolve a menor participação na economia do país, indicadores sociais em queda, aumento do desemprego e o consequente aumento da criminalidade, em especial dos roubos. A coleta, estudo e análise de dados de roubos é importante para conseguir entender seus padrões. Pesquisar sobre a diferença de áreas geográficas e outros fatores que possam influenciar a ocorrência do roubo auxilia a prevenção e combate dos mesmos. Nesse contexto, este trabalho teve o objetivo de identificar, compreender e descrever o padrão de comportamento de dados de roubos na cidade do Rio de Janeiro no ano de 2019, através de modelos aditivos generalizados. Nesses modelos, foram incorporados indicadores sociais, econômicos, demográficos, educacionais e geográficos bem como componentes espaciais capazes de representar o padrão espacial dos roubos. Desejava-se avaliar os indicadores e associá-los com a ocorrência de roubos na cidade do Rio de Janeiro, no ano de 2019, utilizando modelos aditivos generalizados para estimar as probabilidades de ocorrência de roubos na cidade do Rio ao nível de quadrículas de 200 x 200 metros e incorporar os efeitos espaciais aos modelos aditivos generalizados a partir de suavizadores na localização geográfica de cada quadrícula. Dados foram obtidos do Instituto de Segurança Pública do Estado do Rio de Janeiro, do Censo demográfico de 2010 do Instituto Brasileiro de Geografia e Estatística, do Instituto Pereira Passos e do OpenStreetMap. As variáveis do modelo final deste trabalho foram selecionadas através de análise descritiva e testes no modelo proposto. Os resultados mostraram que as distâncias até a via rápida mais próxima, escola mais próxima e estação de trem mais próxima, as proporções de domicílios sem moradores do sexo masculino, domicílios em locais onde existe calçada, pessoas de mais de 59 anos de idade, a população média por célula e as coordenadas de longitude e latitude dos centroides das quadrículas possuem efeitos significativos na probabilidade de ocorrência de roubos no município. Dessa forma, a incorporação das informações espaciais ao modelo aditivo generalizado proposto pelo estudo se mostrou importante.

    Palavras-chave: Modelos aditivos generalizados. Splines. Roubos. Rio de Janeiro.if 1 02 511559

    Orientador: Rafael Santos Erbisti (GET/UFF)
    Coorientador: Jony Arrais Pinto Junior (GET/UFF)

    Banca:

    • Rafael Santos Erbisti (GET/UFF)
    • Jony Arrais Pinto Junior (GET/UFF)
    • Luis Guillermo Coca Velarde (GET/UFF)
    • Renata Souza Bueno (ENCE/IBGE)
    VITOR FERNANDES RODRIGUES. Uma Pandemia, a Probabilidade e Café: Uma Prosa Sobre Percolação.

    Resumo: Nessa monografia é feito um paralelo entre epidemia, e o porquê um surto viral pode vir a se transformar em uma pandemia, café e probabilidade, isto é, um estudo sobre Percolação. Para isso, foram expostos alguns conceitos preliminares sobre Funções Geradoras de Probabilidade, Processo de Ramificação, e Percolação, a fim de estudarmos um modelo epidêmico de Percolação de longo alcance em árvores homogêneas e em árvores alternadas.

    Palavras-chave: Ramificação. Percolação. Limitante superior. Limitante inferior. Comportamento crítico.if 1 02 511559

    Orientador: Jaime Antonio Utria Valdes (GET/UFF)

    Banca:

    • Jaime Antonio Utria Valdes (GET/UFF)
    • Valentin Sisko (GET/UFF)
    • Douglas Rodrigues Pinto (GET/UFF)
    Fechar Todos
    Skip to content