2018 – Defesas no Primeiro Semestre Letivo

Escondido

Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.

BRUNO CESAR SANTOS RODRIGUES. Estimadores para o alcance de uma cadeia de Markov: um estudo comparativo

Resumo: Neste trabalho abordamos as cadeias estocásticas de ordem finita em um alfabeto finito, estando interessados no quanto do presente é influenciado pelo passado. Observamos uma amostra implementada com programa na linguagem R (www.r-project.org), a fim de estimar as probabilidades de transição de uma cadeia de Markov de alcance k, com k fixado. Em seguida, estudamos os estimadores de alcance k de um processo de Markov com probabilidade de transição e alcance desconhecidos. Utilizamos o critério de informação Bayesiano(BIC), também conhecido como Critério de Schwarz, algoritmo contexto e o critério de determinação eficiente(EDC). Por fim, comparamos a precisão de cada método quando submetidos a amostras geradas computacionalmente.
Palavras-chave: Cadeia de Markov. Algoritmo contexto. Critério de informação bayesiano. Critério de determinação eficiente.
 if 1 02 511559

Orientador: Douglas Rodrigues Pinto

DAIANE DE SOUZA OLIVEIRA. A utilização da teoria dos valores extremos na área financeira: uma abordagem voltada para estratégias long-short

Resumo: Nos dias atuais, muitos investidores tem optado por fundos classificados como Hedge Funds objetivando melhorar seus desempenhos com a utilização de estratégias de arbitragem, como é o caso das estratégias Long-Short. Nesta monografia, a Teoria dos Valores Extremos (TVE) foi utilizada para modelar séries de preços de ativos, mais especificamente, a série de preços PETR4.SA (Petróleo Brasileiro S.A. – Petrobrás), usada como estudo de caso para exemplificar o processo de modelagem, e para modelar o spread obtido com os preços das ações ITUB4.SA (Itaú Unibanco Holding S.A.) e ABCB4.SA (Banco ABC Brasil S.A.), ativos base para a aplicação da estratégia Pair Trading. A estratégia Long-Short foi construída sobre o spread, considerando os quantis resultantes da modelagem deste, para obter limites distintos para montar e desmontar as operações efetuadas. Uma vez que a estratégia Long-Short foi montada, para os diferentes tipos de limites, o retorno e o retorno acumulado foram calculados com o intuito de identificar a melhor abordagem para gerar um grau estável de rentabilidade.
Palavras-chave: Teoria dos valores extremos. Estratégias long-short. Mercado financeiro. Bolsa de valores. Hedge funds.
if 1 02 511559

Orientador: Marco Aurélio dos Santos Sanfins

Coorientador: Vaslentin Sisko

FABRICIO ALBERNAZ TEIXEIRA FONSECA LOBO. Análise da autoavaliação de saúde bucal em adultos brasileiros utilizando modelos logísticos multinomiais

Resumo: A autoavaliação de saúde bucal é uma medida subjetiva que aponta a experiência pessoal de cada indivíduo, relacionado com o seu bem-estar funcional, social e psicólogo, e, muitas vezes, determina sua busca por atendimento odontológico. O objetivo deste trabalho foi avaliar a associação dos fatores demográficos, sociais e de saúde dos adultos brasileiros de 20 anos ou mais de idade com a sua autoavaliação de saúde bucal. Foram utilizados modelos logísticos multinomial (ordinal e não ordinal), considerando os dados da Pesquisa Nacional de Saúde (PNS) 2013. No que se refere ao modelo logístico multinomial não ordinal, a chance de autoavaliação de saúde bucal boa versus ruim (equação 2) foi menor em adultos com 40 a 49 anos e de 50 a 59 anos, não brancos, menos escolarizados, residentes na região Nordeste, assim como para adultos portadores de plano de saúde e fumantes. A chance de autoavaliação de saúde bucal regular versus ruim (equação 1) foi menor para adultos menos escolarizados, residentes na região Norte e fumantes. Adultos com maior grau de dificuldade para se alimentar por causa de problemas com seus dentes ou dentadura apresentaram menores chances de saúde bucal boa versus ruim e de saúde bucal regular versus ruim. Recomenda-se um maior acesso e utilização dos serviços odontológicos e o desenvolvimento de ações preventivas voltadas a mudanças de comportamentos dos adultos (como não fumar e não consumir álcool), estimulando um estilo de vida mais saudável e uma higiene bucal adequada, a fim de reduzir o risco de desenvolvimento de problemas bucais e dentários.
Palavras-chave: Autoavaliação de saúde bucal. Modelo logístico multinomial. Método de máxima pseudo-verossimilhança.
if 1 02 511559

Orientador: José Rodrigo de Moraes

FELLIPE CARVALHO GOMES. Uma aplicação de modelo hierárquico bayesiano na modelagem da dor em recém nascidos submetidos à punção de calcâneo

Resumo: Este trabalho tem como proposta avaliar os efeitos de três tipos de intervenções no alívio à dor dos recém-nascidos durante o procedimento de punção de calcâneo para verificação de glicemia. As intervenções consideradas foram: leite materno ordenhado da própria mãe, amamentação e contato pele a pele. Inicialmente realizou-se uma análise descritiva dos dados. Posteriormente, ajustou-se alguns modelos simples e inferiu-se sob os parâmetros desse modelo, possibilitando compreender como foram as respostas comportamentais e fisiológicas. Nesse estudo inicial, o tipo de intervenção contato pele a pele obteve os melhores resultados no alivio da dor. Em seguida, propôs-se um modelo hierárquico considerando dados longitudinais (antes, durante e após a punção do calcanhar). Para o ajuste do modelo apenas a resposta fisiológica da frequência cardíaca foi considerada e a estimação dos parâmetros desconhecidos da modelagem proposta foi realizada sob o paradigma bayesiano. Como a distribuição a posteriori dos parâmetros não possuiu forma analítica conhecida, uma amostra desta foi obtida através do amostrador de Gibbs, um método iterativo computacional de Monte Carlo via cadeias de Markov (MCMC). Com o ajuste do modelo observou-se que a Idade Gestacional, a Glicemia, o instante da observação e o tipo de intervenção se apresentaram associadas com a variação da frequência cardíaca e a intervenção do Contato Pele a Pele foi a que apresentou o melhor efeito, diminuindo em média 5,97\% do valor de base para os recém nascidos submetidos à este procedimento.
Palavras-chave: Dor em recém nascidos. Modelo hierárquico bayesiano. Método de Monte Carlo via cadeia de Markov.
if 1 02 511559

Orientadora: Patrícia Lusié Velozo da Costa

GABRIEL AGOSTINI DIAS COSTA MATOS. Uma análise em séries temporais: comparação entre as abordagens de suavização exponencial de Holt e Box-Jenkins aplicadas a indicadores socioeconômicos

Resumo: Mesmo com o passar do tempo, no campo social, o Brasil continua sendo um dos países mais desiguais do mundo. O país possui índices de pobreza extremamente altos e uma pequena parcela da população detém a maioria absoluta das riquezas. Diversos índices são usados para verificar a desigualdade na distribuição de renda e o desenvolvimento da população como um todo, entre os mais conceituados podemos destacar o índice de Gini e o Índice de Desenvolvimento Humano (IDH), respectivamente. Entender a trajetória das estatísticas sociais brasileiras e saber suas tendências futuras pode ser de grande valia na tomada de medidas mais assertivas em prol da sociedade. Assim sendo, o presente trabalho tem como escopo produzir, comparar e eleger as melhores previsões para o índice de Gini e para o IDH utilizando diferentes metodologias de séries temporais. Os modelos que serão usados para essas análises temporais irão ser gerados a partir dos seguintes métodos: Modelo de Suavização Exponencial de Holt (SEH) e modelos lineares do tipo ARIMA (p,d,q). Estes modelos serão comparados em termos da qualidade do ajuste e das previsões. Além disso, também será feito um estudo a respeito da associação entre esses indicadores sociais com o intuito de entender como eles se relacionam.
Palavras-chave:  Séries temporais. Desigualdade. Índice de Gini. Previsão. Brasil. Renda. Box-Jenkins. IDH. Correlação cruzada.
if 1 02 511559

Orientadora: Ana Beatriz Monteiro Fonseca

GABRIEL VIEIRA DA CRUZ. Análise da prevalência de diabetes em idosos no Brasil e sua associação com características sociodemográficas, comportamentais e de saúde

Resumo: O diabetes mellitus (DM) é uma das doenças crônicas não transmissíveis de maior prevalência em âmbito mundial, que apresenta elevada morbidade e mortalidade e redução da qualidade de vida. Neste estudo, será empregado o modelo de regressão log-linear de Poisson com variância robusta, usando os dados da Pesquisa Nacional de Saúde (PNS) 2013, para analisar a relação entre as características sociodemográficas, comportamentais e de saúde e a prevalência de diabetes autorreferido em idosos no Brasil. A PNS é uma pesquisa que utiliza um plano amostral complexo, considerando estratificação de setores, conglomeração e pesos amostrais diferentes para as unidades da amostra. A prevalência de diabetes em idosos no Brasil é de 19,1%. Quanto à modelagem estatística, observou-se maior prevalência de diabetes em idosos que residem na área urbana, que realizaram consulta médica pela última vez há menos de 1 ano e que reportaram ter hipertensão. Além disso, observou-se uma menor prevalência de diabetes em idosos que residem na região Sul (versus Sudeste), que reportaram ter uma saúde boa/muito boa, assim como em idosos fumantes e que fazem uso de bebidas alcóolicas. Desse modo, destaca-se a necessidade de ações que promovam o maior acesso dos idosos a serviços de saúde e ações de orientação em saúde para incentivar a maior adesão a tratamentos medicamentosos para aqueles idosos portadores de doenças crônicas. Recomenda-se ainda a realização de ações para estimular comportamentos e estilos de vida saudáveis, a fim de prevenir ou controlar doenças crônicas na população idosa, entre elas o diabetes. Estas ações devem ser priorizadas nas áreas urbanas do país.
Palavras-chave:  Estudos transversais. Modelos log-lineares. Diabetes mellitus. Envelhecimento. Razão de prevalência. Saúde do idoso.
if 1 02 511559

Orientador: José Rodrigo de Moraes

JOSELI MOREIRA FERRAZ. Exposição à poluição atmosférica e seus efeitos no nascimento de bebês prematuros em Porto Velho, Rondônia

Resumo: A poluição do ar ou atmosférica é um dos principais problemas vividos pela sociedade moderna. Mudanças ambientais podem contribuir para o aumento da exposição à poluentes de risco e, portanto, fatores externos podem provocar o desencadeamento de diversos problemas de saúde. Baseado nos resultados da literatura selecionou-se o grupo de mulheres grávidas, em virtude de serem mais suscetíveis a fatores externos. O objetivo principal foi avaliar os efeitos da exposição à poluentes atmosféricos sobre o nascimento de bebês prematuros de mães residentes no município de Porto Velho (RO). Foram utilizados os dados fornecidos pelo Sistema de Informações de Nascidos Vivos (SINASC) e pela estação de monitoramento de poluentes atmosféricos implantada pelo projeto FAPESP/AERO CLIMA, no período de Jul./2010 a Dez./2011. Na análise dos foram estimados Modelos de Regressão Logística. Os efeitos da exposição ao material particulado fino (PM2.5) foram estimados separadamente para cada trimestre gestacional. Foram criadas duas variáveis de estudo prematuridade 1 (nascimentos com até 37 semanas de gestação) e prematuridade 2 (nascimentos com até 31 semanas de gestação). O melhor modelo foi escolhido com base na análise dos resíduos. O estudo sugeriu que à exposição ao PM2.5 nos três trimestres da gestação contribuiu para o nascimento de bebês prematuros, tanto com 31 semanas quanto com 37 semanas de gestação, no município de Porto Velho.

Palavras-chave: Modelo de regressão logística. Prematuridade. Poluição atmosférica. Material particulado.if 1 02 511559

Orientadora: Ludmilla da Silva Viana Jacobson

MATHEUS MOURA DINIZ. Precificação de puts e calls para opções com a utilização da teoria de valores extremos

Resumo: No Mercado de Opções, investidores negociam o direito de comprar ou vender um ativo financeiro em um determinado período, por um preço pré-combinado. Um dos métodos mais utilizados para encontrar o preço justo de uma opção é o modelo de Black & Scholes, cujo um dos principais desafios em sua utilização é a determinação da volatilidade . No presente trabalho, fez-se uso dos principais conceitos da Teoria de Valores Extremos (TVE) para modelar os retornos da PETR4.SA (Petróleo Brasileiro S.A. – Petrobras), no período de 02 de janeiro de 2014 a 30 de maio de 2018, e utilizou-se os modelos ajustados dos máximos e dos mínimos na estimação da volatilidade do ativo. Esta monografia também utilizou a modelagem da Estrutura a Termo da Taxa de Juros (ETTJ) via método de Nelson Siegel para estimar a taxa de juro livre de risco, servindo, também, de input para o modelo de Black & Scholes. Por fim, compara-se os valores obtidos com o método usual praticado atualmente, na precificação das opções europeias de compra PETRG28 e PETRG172, e na opção europeia de venda PETRS10.

Palavras-chave:  Mercado de opções. Derivativos. Teoria de Valores Extremos. Mercado de capitais. Modelo de Black & Scholes.if 1 02 511559

Orientador: Marco Aurélio dos Santos Sanfins

RAPHAEL PAES PINTO. Indicador de saúde e ambiente para doenças de veiculação hídrica e seus efeitos na mortalidade infantil pós neonatal

Resumo: O Brasil apresenta tendência de decrescimento nas taxas de mortalidade infantil e de nascimento, porém quando comparado aos países desenvolvidos estas estatísticas são preocupantes. Como a mortalidade infantil é o indicador mais utilizado para avaliar situações socioeconômicas de uma determinada região e pode ser desagregado em três grupos (mortalidade infantil neonatal precoce, mortalidade infantil neonatal tardia e mortalidade infantil pós neonatal); foi de interesse para o presente trabalho a utilização da taxa de mortalidade infantil pós neonatal (representada pelo número de óbitos infantis entre 28 dias e 1 ano de idade), uma vez que, quando comparada com a criação de um indicador integrado de saúde e ambiente baseado nas doenças de veiculação hídrica, ambos indicadores podem ser avaliados devido a suas semelhanças geográficas, socioeconômicas e pelas condições de infra-estrutura e saneamento habitacional. É importante ressaltar que apesar dos avanços da globalização, muitas pessoas continuam em situações insalubres pela ausência ou ineficiência de abastecimento de água. Dessa forma o objetivo deste trabalho é elaborar um indicador composto de saúde e ambiente para doenças de veiculação hídrica e avaliar sua associação com a mortalidade infantil pós neonatal. As unidades de observação serão as microrregiões do Brasil, definidas pelo Instituto Brasileiro de Geografia e Estatística (IBGE). O indicador será construído a partir de dois métodos: (i) modelo FPEEE definido pela Organização Mundial de Saúde (OMS), no qual identifica indicadores simples para cada um dos domínios de força motriz, pressão, estado, exposição e efeito na saúde, e agrega estes indicadores por meio de correlação e média aritmética; (ii) o segundo método será a Análise Fatorial Exploratória. Os dois métodos serão comparados. Os resultados serão apresentados em mapas temáticos. Modelos de Regressão serão estimados, tendo como variável resposta a mortalidade infantil pós neonatal, e a variável explicativa será o indicador composto. Todas as análises foram realizadas no programa estatístico R, a partir do RStudio e Python, a partir do Spyder.
Palavras-chave: Indicador. Veiculação hídrica. Mortalidade infantil. Mortalidade neonatal. Risco.
if 1 02 511559

Orientadora: Ludmilla da Silva Viana Jacobson

RUAN DA SILVA VIANNA. Estimação pontual para modelos de processos de captura-recaptura

Resumo: O presente trabalho ilustra os procedimentos de estimação do tamanho de uma população utilizando o processo de captura-recaptura a tempo discreto, abordando o método dos momentos e método de máxima verossimilhança para estimação dos parâmetros populacionais. Além disso, são apresentados alguns modelos para a utilização do processo que surgem a partir das modificações das suposições sobre a população e sobre o método utilizado na captura dos elementos. Por fim, observa-se que esses estimadores precisam ser obtidos através de aproximações numéricas, e é feita uma comparação entre as estimativas encontradas pelos dois métodos propostos.


Palavras-chave: Captura-recaptura. Tempo discreto. Método dos momentos. Método da máxima verossimilhança. Modelo hipergeométrico. Modelo binomial sem mudança de probabilidade. Modelo binomial com mudança de probabilidade.
if 1 02 511559

Orientador: Hugo Henrique Kegler dos Santos

THAYS DE MATTOS MOLINA NAPOLEÃO FERREIRA. Análise exploratória do número de casos de febre amarela no Estado de Minas Gerais nos anos de 2015 a 2017

Resumo: A febre amarela, que surgiu na África Central, é uma infecção viral grave, semelhante à gripe, transmitida normalmente pelo mosquito Aedes aegypti. Existem dois ciclos epidemiológicos de transmissão distintos, silvestre(FAS) e urbano(FAU). A febre amarela silvestre e a urbana diferenciam-se através do mosquito transmissor, forma e local de sua ocorrência. Com o decorrer dos anos a febre amarela esteve presente na história do Brasil, assim como em 2017 no estado de Minas Gerais. Em novembro de 2015, dia 5, o município de Mariana, em Minas Gerais foi atingido com resíduos de lama após a queda da Barragem do Fundão, da mineradora Samarco contaminando o Rio Doce, um dos principais rios do estado. Biólogos estudam a relação do surto de febre amarela com a queda da Barragem do Fundão, pois detectaram casos de indivíduos com sintomas da febre amarela na região próxima ao Rio Doce, local onde a barragem foi rompida. O objetivo desse trabalho foi investigar a distribuição geográfica dos casos de Febre Amarela nos municípios atingidos pela lama da Barragem do Fundão nos Estado de Minas Gerais durante os anos de 2015 a 2017, utilizando métodos de Estatística Espacial. Foram usados quatro modelos e através da comparação de seu ajuste pelo critério AIC, não foi possível escolher o modelo, visto que o MLG Poisson não estava na mesma escala. Após colocar todos os modelos em uma mesma escala, foi usado o EQM para para a escolha do modelo. O modelo que apresentou menor EQM, foi o MLG Poisson. Na análise dos resíduos, o teste de significância aceita a hipótese de independência espacial. As variáveis explicativas não foram o suficiente para analisar se existe relações da tragédia com o aumento dos casos de Febre Amarela.

Palavras-chave: Febre amarela. Barragem do Fundão. Taxa de incidência. Semanas epidemiológicas. Modelagem espacial.if 1 02 511559

Orientadora: Ana Beatriz Monteiro Fonseca

Fechar Todos

2018 – Defesas no Segundo Semestre Letivo

Escondido

Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.

ALANA TAVARES VIANA. Análise discriminante aplicada a livros infantis e adultos

Resumo:   A análise discriminante é utilizada com o intuito de discriminar livros infantis e adultos através das variáveis quantidade de palavras diferentes por lauda e tamanho médio de sentenças por lauda.
Palavras-chave: Análise discriminante. Livros infantis. Livros adultos.
if 1 02 511559

Orientador: Hugo Henrique Kegler dos Santos

ANA ANDRADE MACHADO. Seleção de variáveis em modelos de regressão logística

Resumo: Este trabalho apresenta o modelo de regressão logística e alguns métodos de avaliação de ajuste deste modelo, como testes para avaliar se as estimativas para os coeficientes de regressão são significativas. Posteriormente, são apresentados alguns métodos de seleção de variáveis nos quais modelos hierárquicos são utilizados para selecionar as variáveis explicativas. Comparam-se alguns métodos clássicos com outros bayesianos. Sob o enfoque bayesiano, a inferência sob os parâmetros desconhecidos do modelo é realizada através de algoritmos de métodos de Monte Carlo via Cadeias de Markov (MCMC).
Palavras-chave: Regressão logística. Métodos de seleção de variáveis bayesianos. MCMC. Lasso. SSVS.
if 1 02 511559

Orientadora: Patrícia Lusié Velozo da Costa

Coorientadora: Mariana Albi de Oliveira Souza

BEATRIZ PINA JARDIM RODRIGUES. Cálculo de risco de crédito, uma aplicação utilizando o modelo CreditRisk+

Resumo: Devido à crescente instabilidade econêmica que se propaga pelo mundo, como aconteceu em 2008 a “Grande Recessão” e atualmente a tensão EUA X China, as instituições estão demandando metodologias robustas e mais poderosas de modelagem de risco de crédito a fim de garantir sua saúde financeira. O modelo estatístico do CreditRisk+ foi desenvolvido pela Crédit Suisse Financial Products (CSFP) e é muito difundido no mercado de seguros pois não é necessário assumir premissas. Isso ocorre, pois o modelo é baseado no risco de default [1], ou seja, risco de inadimplência. O objetivo principal é chegar à mensuração de perdas esperadas e não esperadas em uma carteira de crédito. O CreditRisk+ acredita que os pagamentos dos empréstimos são levados ao vencimento, ou seja, o pagamento ou o default é observado apenas na data do vencimento [2]. O modelo considera apenas dois eventos para o devedor: inadimplente ou não. Para mensurar os eventos de default o modelo sugere agrupamento dos devedores em faixas de exposição de tal forma que a distribuição de perda pode ser aproximada de uma Poisson [3]. No modelo básico, as taxas de default são fixas. Para retratar a realidade, foi proposta uma nova modelagem [1] onde as incertezas, volatilidades, das taxas de default são incorporadas, trata-se de um modelo que assume uma distribuição Gama associada a essas incertezas. A partir da distribuição obtida é possível calcular o VaR (Value-at-Risk) de crédito assim como a distribuição de perda e algumas estimativas pontuais como a perda esperada em um período de tempo e o capital econômico alocado. O presente trabalho realiza uma aplicação do modelo CreditRisk+ usando o software R em uma carteira de crédito. Além disso, foram observados resultados satisfatórios com diversos níveis de confiança.
Palavras-chave: CreditRisk+. Default. Carteira de crédito.
if 1 02 511559

Orientador: Marco Aurélio dos Santos Sanfins

CAMILA DE SANTANA DELGADO SIMÕES. Impactos do El Niño Oscilação Sul na produção de milho no Rio Grande do Sul

Resumo: O El Niño Oscilação Sul – ENOS, popularmente conhecido como El Niño ocorre no oceano Pacífico, próximo a região do Peru. A região Niño 3.4 é monitorada e caso seja percebido um aquecimento anormal na temperatura da superfíci da água, caracterizando a fase El Niño, mas caso haja resfriamento anormal da mesma, será caracterizada a fase La Niña.As consequências do fenômeno não se limitam à região de ocorrência, tendo capacidade de atingir diversas regiões no mundo, por isso a importância de estudá-lo. Uma das formas de influência do ENOS é na agricultura devido às mudanças clima´ticas que podem favorecer ou desfavorecer determinada produção. O objetivo deste trabalho consiste em tentar explicar a produção de milho no estado do Rio Grande do Sul a partir da temperatura da superfície do mar no oceano pacífico (TSM), da precipitação no estado e da temperatura mínima média . Também será avaliada relação da TSM com uma variável climática do estado. Em suma, os modelos de regressão linear dinâmicos propostos não foram suficientes para definir relações entre a produção, as variáveis climáticas e a TSM. Como alternativa, foi ajustado o modelo polinomial de 2ª ordem devido à necessidade de captar o crescimento da produção de milho no Rio Grande do Sul ao longo dos anos.
Palavras-chave: Modelagem. Regressão linear dinâmica. Séries temporais. El Niño. La Niña. Oceano. Produção. Clima.
 if 1 02 511559

Orientadora: Ana Beatriz Monteiro Fonseca

Coorientador: Victor Eduardo Leite de Almeida Duca

DEBORA ZAVA BELO. Modelo de equações estruturais - mínimos quadrados parciais

Resumo: O presente trabalho pretende apresentar o modelo de equações estruturais de mínimos quadrados parciais, quando deve ser usado, sua estimação e avaliação do modelo. Além de implementar no software R Studio a estimação e avaliação do modelo. Após, compara os resultados obtidos na implementação com os adquiridos com o pacote plspm, também do R Studio.

Palavras-chave: Modelagem. Modelo de equações estruturais. Mínimos quadrados parciais. PLS. SEM.if 1 02 511559

Orientador: Hugo Henrique Kegler dos Santos

DEBORAH CHOLODOYSKY BARBEDO PEREIRA. Aprendizado de máquina e aplicação do método de aprendizado supervisionado support vector machine

Resumo: Aprendizado de máquina também conhecido como aprendizado automático é um método de análise de dados que automatiza o desenvolvimento de modelos analíticos. Isto é, um algoritmo baseado em técnicas estatísticas que a partir de dados de treinamento possibilita a predição, espera-se que quanto mais experiências mais o algoritmo se torne assertivo. Programas de aprendizado de máquina são projetados utilizando métodos estatísticos como regressão, support vector machine (SVM), árvores de classificação entre outros, objetivando o aprendizado do algoritmo, é esperado que as previsões melhorem ao longo do tempo quando exposto a novos dados. Neste trabalho é estudado e aplicado o método supervisionado SVM, em que o programa é treinado sobre um conjunto de dados pré-definidos nos quais já se sabe qual é a saída correta.
Palavras-chave: Aprendizado de máquina. Aprendizado automático. Reconhecimento de padrões. Support vector machine.
if 1 02 511559

Orientadora: Karina Yuriko Yaginuma

EVELLYN ARAUJO DAS CHAGAS. Modelagem da migração campo-cidade usando teoria dos jogos evolucionária

Resumo: O presente trabalho faz uma análise das modelagens de uma economia que apresenta dualidade rural-urbana que converge para um equilíbrio. No trabalho de Harris e Todaro(1970) é apresentando como um processo de aprendizado social por imitação em um ambiente de racionalidade limitada e utiliza um modelo computacional baseado em agentes representativo. Espíndola et al. (2006) [3], propõe um ajustamento para o modelo de Harris e Todaro, implementando uma abordagem de jogo evolucionário por meio de uma simulação baseado em agentes, que a transição migratória é um processo de imitação de agentes vizinhos bem-sucedidos. A finalidade deste trabalho, é simular o processo de migração campo-cidade baseado modelo Harris e Todaro (1970) usando simulação baseada em agente e aprendizado bayesiano. Para propor um mecanismo de aprendizado Bayesiano através da metodologia baseada em modelos baseados em agentes, como proposto por Espíndola et al. (2006).
Palavras-chave:  Equilíbrio. Aprendizado. Dualidade rural-urbana. Jogos evolucionários. Representativo. Simulação baseada em agentes.
if 1 02 511559

Orientador: Eduardo Ferioli Gomes

Coorientador: Douglas Sad Silveira

FLAVIO FERRAZ VIEIRA. Emprego da teoria de valores extremos na construção de modelos espaço-temporais de temperaturas

Resumo: Os fundamentos da teoria dos valores extremos foram inicialmente expostos por Fisher e Tippett, que por definição introduziram os três tipos possíveis de distribuições assintóticas dos valores extremos, conhecidas como Gumbel, de Fréchet e de Weibull, respectivamente. No entanto, o primeiro a estudar e formalizar a aplicação estatística destas distribuições foi Gumbel, cuja a metodologia tem sido frequentemente aplicada. Outras contribuições importantes para o estudo de valores extremos foram dadas por Gnedenko, que mostrou as condições necessárias e suficientes para a existência das distribuições assintóticas dos valores extremos. Atualmente diversas areas do conhecimento estão utilizando a Teoria de Valores extremos para construir modelos preditivos, principalmente a dados relacionados ao meio ambiente. Esse fato decorre das grandes mudanças climáticas que vem ocorrendo em nosso planeta nos dias atuais. Atualmente vários centros mundiais de coleta de dados sobre condições climaticas, vem coletando informações sobre as maiores temperaturas observadas em diversas áreas do planeta. Em especial atualmente o governo da India possui estas temperaturas maximas coletadas com as respectivas latitude e longitude, possuindo um Historico que abrange os periodos de 1951 ate o ano de 2014. O objetivo deste projeto e utilizar a teoria de valores extremos e com esta ser capaz de modelar os dados mencionados anteriormente, como tambem obter um modelo preditivo.

Palavras-chave: Teoria de valores extremos. Estatistica espacial.if 1 02 511559

Orientador: Marco Aurélio dos Santos Sanfins

Coorientador: Valentin Sisko

GABRIELLE CARVALHO DA CRUZ FERNANDES. Avaliação da aderência de tábuas de mortalidade para a previdência complementar fechada: um estudo de caso

Resumo: Ao utilizar uma tábua de mortalidade que não reflita a verdadeira massa de segurados, podem ocorrer grandes distorções nas previsões previdenciárias. As entidades que atuam na área de previdência utilizam tábuas estrangeiras, que representam a mortalidade de diferentes culturas e níveis socioeconômicos. Com isso, o presente trabalho tem o objetivo de analisar a aderência das tábuas de mortalidade para uma determinada entidade fechada de previdência complementar com a finalidade de verificar a melhor tábua, ou seja, aquela onde os valores ajustados sejam próximos aos valores observados e, sendo assim, adequada para os estudos previdenciários da entidade no estudo em questão. Com as probabilidades de morte ajustadas, elaboraram-se tábuas de mortalidade para ambos os sexos e para o sexo masculino. Para realizar as comparações, utilizou-se a tábua do IBGE 2016 para ambos os sexos e as tábuas da família Annuity Table AT-83, AT-2000 e a BR-EMSsb2010 para a comparação com o sexo masculino. Após a elaboração das tábuas da Entidade em estudo, utilizou-se o Teste de Kolmogorov-Smirnov para avaliar a aderência entre as tábuas elaboradas com as tábuas do mercado. A escolha da tábua de mortalidade que mais se adeque as probabilidades de mortalidade da Entidade em estudo é essencial para que não se subestime a mortalidade de seus usuários, tornando assim o plano mais caro, por exemplo.
Palavras-chave: Previdência Complementar. Entidade de Previdência Fechada. Tábuas de Mortalidade. Hipóteses. Aderência. Kolmogorov-Smirnov.
if 1 02 511559

Orientadora: Ana Beatriz Monteiro Fonseca

GEORGE AMARANTE MELO. Mapeamento dos homicídios por arma de fogo no estado do Rio de Janeiro: uma abordagem via modelos hierárquicos bayesianos

Resumo: Com a crescente coleta de dados georreferenciados vivenciada nas últimas décadas, surge a necessidade da utilização de informação sobre localização geográfica na modelagem dos mais diversos fenômenos científicos, como, por exemplo, a violência. O foco deste trabalho é no ramo da Estatística Espacial conhecido como Análise de Dados de Área. Foi analisado um banco de dados contendo o número de homicídios por arma de fogo nos municípios do Rio de Janeiro, considerando como covariáveis explicativas a idade, o sexo e a raça da vítima, além do IDH do município. Para tal, utilizou-se o DIC para comparar três modelos no intuito de decidir qual fornece o melhor ajuste aos dados. O primeiro modelo, chamado de modelo com covariáveis espaciais, supõe independência espacial entre os municípios e considera apenas o IDH como variável explicativa. Já o segundo, o modelo com covariáveis espaciais e individuais, também supõe independência espacial, e considera tanto o IDH quanto as covariáveis associadas à vítima, acima mencionadas. O terceiro, denominado modelo CAR, se assemelha ao segundo, porém supõe que há a existência de uma estrutura de dependência espacial entre os municípios, por meio de uma distribuição a priori CAR. Foram feitas análises descritivas, um estudo simulado com os modelos e a aplicação destes aos dados reais. A análise descritiva sugeriu que há uma estrutura de dependência espacial global, além de apresentar a influência da população do município na contagem de homicídios do mesmo. Já os estudos simulados apresentaram, de maneira geral, que os modelos conseguem retornar de maneira satisfatória os verdadeiro valor dos parâmetros; a única exceção ficou por conta do modelo CAR, cuja estimação não recuperou corretamente o valor de tau (precisão). Por fim, ao analisar os dados reais identificou-se que sexo masculino e cor preta ou parda da vítima são fatores que tendem a aumentar a contagem do fenômeno estudado, enquanto IDH do município, idade e cor amarela ou indígena da vítima ocasionam o efeito oposto. Por fim, a comparação dos DICs aponta que o modelo com covariáveis espaciais, o mais simples, forneceu melhor ajuste aos dados. No entanto, caso o interesse seja considerar características da vítima na modelagem, o modelo CAR foi considerado o mais adequado.
Palavras-chave: Estatística espacial. Dados de área. Inferência bayesiana. Modelagem hierárquica. Modelo car.
if 1 02 511559

Orientador: Jony Arrais Pinto Junior

JONATHA AZEVEDO DA COSTA. BETS - desenvolvimento de um pacote estatístico para extração e análise de séries temporais econômicas

Resumo: Devido à desorganização e à problemática de se obter dados atualizados das principais fontes de informações no Brasil, faz-se necessária a criação de ferramentas de unificação e extração de dados. Esse trabalho de conclusão de curso apresenta a criação, elaboração e aplicação do pacote estatístico BETS (Brazilian Economic Time Series). O BETS fornece, de forma descomplicada, milhares de dados econômicos do Brasil de forma geral, além de ferramentas que auxiliam o pesquisador na modelagem e análise de dados temporais (série temporal). O pacote foi desenvolvido por mim em parceria com o Núcleo de Métodos Estatísticos e Computacionais do Instituto Brasileiro de Economia da Fundação Getúlio Vargas. Esse trabalho foca nas funcionalidades em que tive total responsabilidade no desenvolvimento. Esse trabalho aborda, desde a elaboração, criação, aplicação (em um estudo de caso) e os resultados que o pacote já obteve. No estudo de caso, a série da Produção Física Industrial sem ajuste sazonal com ano base 2012 disponibilizada pelo IBGE é abordada para uma típica ilustração de uso do pacote. Os resultados observados desde a primeira versão submetida ao principal e mundialmente conceituado repositório de pacotes estatísticos para a linguagem R, mostrou que o BETS foi bem aceito não somente pelo usuário comum, mas também no meio corporativo por empresas como banco BMG, banco BOCON BBM, grupo VINCI além do CEBRAI de Brasília dentre outros.
Palavras-chave: Séries temporais. R. Box & Jenkins. BETS. Previsão.
if 1 02 511559

Orientador: Jony Arrais Pinto Junior

JULIANA DE OLIVEIRA GOMES CRISTÓVÃO. Uso de redes neurais artificiais como ferramenta de otimização de vendas

Resumo: Com o crescimento da internet e das redes sociais nos últimos anos, a geração de dados se torna cada vez maior. Com essa massa de informações disponíveis, diversas empresas, dos mais variados setores, têm investido muito em tentar utilizar esses dados para melhorar os resultados de seus negócios. Dentro do processo de uso de dados com foco em melhorias na tomada de decisão, os métodos conhecidos como Redes Neurais Artificiais se destacam pela capacidade de lidar com grandes bases de dados e por sua habilidade de aprender com os dados, gerando sistemas computacionais que podem ser implementados para fazer trabalhos automatizados. Neste trabalho, os esforços serão concentrados em entender o comportamento dos usuários de um site no que diz respeito ao processo de compra de um produto. Redes neurais são utilizadas para desenvolver um modelo capaz de identificar, com base no rastro de dados deixado pelo usuário, o momento em que este está pronto para fazer uma compra. Através de um sistema inteligente, os usuários serão impactados de forma personalizada garantindo uma maximização das vendas.
Palavras-chave: Rede neural. RNA.
if 1 02 511559

Orientador: Marco Aurélio dos Santos Sanfins

Coorientador: Raphael Oliveira Lourenço

LEONARDO FILGUEIRA. Sistemas de recomendação usando o software R

Resumo: DO trabalho apresenta algumas técnicas utilizadas na realização de sistemas de recomendação e realiza um estudo de caso, ao utilizar uma base de dados de avaliações de filmes por usuários. É aplicada sobre essa base uma técnica de filtragem colaborativa a fim obter recomendações de filmes aos usuários. Informações como gêneros dos filmes, avaliação dos usuários e número de filmes avaliados serão utilizadas de forma a agrupar os usuários em clusters, utilizando as técnicas de particionamento CLARA e K-means, de forma a aplicar a filtragem colaborativa para cada um dos clusters, em separado. Realiza-se uma comparação de acurácia dos modelos, fazendo a divisão em base de treino (para construir o modelo) e base de teste (para verificar a acurácia), além de uma verificação do tempo de execução, com o objetivo de verificar se, nas condições desse estudo, a clusterização torna a recomendação mais acurada.

Palavras-chave: Sistemas de recomendação. Filtragem colaborativa. Clusterização.if 1 02 511559

Orientadora: Luciane Ferreira Alcoforado

LUANA FONTENELE VERDANT. Envelhecimento da população e a projeção da demanda por serviços de saúde no Estado do Rio de Janeiro

Resumo: A população brasileira está envelhecendo rapidamente sendo que a população idosa é a que mais utiliza os serviços de saúde, em termos relativos. Segundo a pesquisa “Acesso e utilização dos serviços de saúde” do IBGE, enquanto 62% dos homens e 66% das mulheres de até 18 anos procuraram o serviço de saúde no Estado do Rio de Janeiro, 72% dos homens e 77% das mulheres de 65 anos ou mais procuraram. O objetivo dessa pesquisa é projetar a demanda por serviços de saúde no Estado do Rio de Janeiro para 2018 e 2030, utilizando o número de pessoas por sexo e faixa etária fornecidas pela pesquisa Projeção Demográfica da População do IBGE, de 2000 a 2030 e aplicar sobre esse número de pessoas a probabilidade de cada grupo de sexo-faixa etária procurar o serviço de saúde. A probabilidade de procurar o serviço de saúde será estimada utilizando o modelo logístico binário com base nos microdados dos Suplementos das PNAD de 2003 e 2008 que tratam do acesso e utilização dos serviços de saúde. A maioria dos idosos são do sexo feminino e entre 60 a 64 anos de idade. O maior percentual de procura pelo serviço de saúde está na rede pública. A partir da probabilidade estimada de procura por algum serviço de saúde, projetou-se a demanda por serviço de saúde para os anos de 2018 e 2030. O número de idosos que irão procurar o serviço de saúde terá um grande aumento para os próximos anos. Consequentemente, precisará aumentar a quantidade de serviços de saúde, principalmente os públicos.

Palavras-chave: Regressão logística binária. Envelhecimento da população. Pesquisa Nacional por Amostra de Domicílios. Serviços de saúde.if 1 02 511559

Orientadora: Márcia Marques de Carvalho

MARCOS HENRIQUE FERREIRA ACRUCHE. A profissão dos dados: o estatístico brasileiro e o mercado de trabalho

Resumo: Este trabalho tem como objetivo traçar o perfil do estatístico brasileiro e suas relações com o mercado de trabalho. Para isso, foram avaliados de forma descritiva, por um lado, algumas características do indivíduo, tais como: sexo, idade, raça e escolaridade e, por outro lado, características empresariais tais como: porte da empresa, o tipo de vínculo, a área em que a empresa atua e o salário ofertado pela mesma a nível Brasil e regional. Estas informações terão como base os anos de 2007 a 2017 e serão oriundas da Relação Anual de Informações Sociais (RAIS) disponibilizada anualmente pelo Ministério do Trabalho e Emprego (MTE). Em seguida foram identificados alguns núcleos de características que predominam nos âmbitos nacionais e regionais assim como outros que são peculiares a determinada área do país por meio da Análise de Correspondência Múltipla (ACM) no último ano de dados disponibilizados pelo MTE. Juntas, estas duas análises forneceram uma base sólida para a devida compreensão do fenômeno da relação trabalhista sendo possível identificar o perfil deste profissional e suas relações com o mercado de trabalho. Portanto, é possível afirmar que o estatístico brasileiro é, essencialmente, homem com cerca de 42 anos de idade e que vem se aperfeiçoando academicamente nos últimos anos. Esse profissional, além disso, tem mais chances de encontrar vaga no mercado de trabalho em regiões como o Sudeste, onde se concentra cerca de 65% da mão de obra nacional, e no Nordeste, que vem apresentando um forte crescimento nos últimos anos. Outro fato curioso sobre esta especialidade é salário médio encontrado a nível Brasil de cerca de R$ 11.000,00.

Palavras-chave: Estatístico. Brasil. Grandes regiões. RAIS. Análise de correspondência múltipla. Ministério do Trabalho.if 1 02 511559

Orientador: Jony Arrais Pinto Junior

MATHEUS CAMELO DOS SANTOS ARAUJO. Modelos para dados de área sob a abordagem bayesiana

Resumo: Fenômenos das mais diversas áreas estão sendo cada vez mais influenciados pelo espaço onde ocorrem. Somadas às demais análises, a análise espacial vem tornando a modelagem desses eventos mais requintada. Diante dos principais tipos de dados em estatística espacial, esse trabalho visa a modelagem de variáveis aleatórias, com foco em dados de área, averiguando modelos adequados e ajustando-os via dados simulados. Como aplicação, serão utilizados dados referentes a hanseníase, doença crônica e infecciosa que apresenta altas taxas de ocorrências no Brasil, principalmente nas regiões Norte do país. Acredita-se que, além de fatores socioeconômicos e ambientais, as taxas da doença também são influenciadas segundo suas localizações geográficas, justificando a utilização da modelagem espacial nesse trabalho. Quando o interesse na modelagem é, por exemplo, relacionar as respostas de uma variável com seus vizinhos, os modelos CAR e SAR são os mais usados. Algumas restrições são necessárias e uma delas é a especificação adequada da matriz de vizinhança, que é responsável pela ponderação dos efeitos da vizinhança. Assumindo dados simulados, os modelos foram bem ajustados com uma análise de sensibilidade satisfatória, assumindo diferentes distribuições a priori para os parâmetros que foram estimados. Inicialmente e de forma exploratória, para verificar uma possível associação espacial dos dados em uma determinada região, os índices de Moran e Geary foram utilizados. Assim como no mapa coroplético, os resultados dos índices apresentaram um indicativo preliminar de que a hanseníase está correlacionada espacialmente. Considerando os dados de hanseníase em 2010, viu-se que as taxas de detecção em menores de 15 anos apresentaram uma alta variabilidade sendo necessária uma transformação dos dados. Mesmo com a transformação, foi visto que, considerando dados contínuos, os modelos propostos não de adequaram corretamente devido à inflação de zeros. Apesar disso, o ajuste de ambos os modelos apresentou que o IDHM é uma covariável significativa e que há uma relação entre o parâmetro de autocorrelação espacial com os índices de Moran e Geary.
Palavras-chave: Taxas de hanseníase. Estatística espacial. Dados de área. CAR. SAR. MCMC. Inferência bayesiana.
if 1 02 511559

Orientadora: Patrícia Lusié Velozo da Costa

RAFAELA BOCKORNY LEITE. Aplicações de teoria dos jogos evolucionários à estatística

Resumo: A Teoria dos Jogos Evolucionária surge como uma área de pesquisa que tenta modelar comportamentos aparentemente subótimos, mas que evolucionariamente se mostram bem-sucedidos. Este trabalho tem como objetivo estudar um caso especial da aplicação da teoria dos jogos à demografia com aplicação dos métodos tradicionais de imitação conjuntamente com métodos de aprendizado Bayesiano para probabilidades de migração. No estudo, foi utilizado o software R, capaz de simular um processo de migração entre áreas rurais e áreas urbanas. Inicialmente, foram feitas codificações com o intuito de simular todos os dados que serão utilizados neste trabalho. A partir disso, com os dados simulados, foi possível analisar as variações nos parâmetros iniciais. Além disso, aplicou-se um método de aprendizagem Bayesiano para auxiliar no processo da tomada de decisão dos indivíduos. Ao término do estudo, constatou-se que a informação proveniente dos indivíduos de referência e utilizada para a tomada de decisão leva à uma formação de clusters no modelo. Ademais, foi evidenciado que a variância dos erros relacionados à incerteza interfere diretamente neste processo de tomada de decisão do agente e nas variações salariais dos cenários estudados.
Palavras-chave: Agente-Iteração. Dinâmica evolucionária. Inferência Bayesiana. Migração. Modelo de Harris-Todaro. Teoria dos Jogos.
if 1 02 511559

Orientador: Eduardo Ferioli Gomes

Coorientador: Douglas Sad Silveira

THEO VEIGA DE AZEVEDO. Estimação do value at risk de ativos financeiros via método de núcleo

Resumo: No mercado financeiro, investidores ou organizações financeiras estão constantemente interessados em saber como lidar com as possíveis perdas oriundas de ativos negociados. Para tanto, existem modelos que são capazes de medir o risco que determinado ativo está sujeito a sofrer e, desta forma, contribuir com conhecimento prévio do valor de risco para tomada de decisão. Para tal, foi implementado o método da estimação do Value at Risk via estimação do alfa-quantil condicional dos retornos utilizando a F.D.A. Condicional estimada (baseada no método de núcleo). Neste sentido, o uso dos estimadores de núcleo é apropriado, uma vez que pode gerar estimativas de distribuições com diferentes padrões de curtose, assimetria, entre outros comportamentos. Realizamos uma análise empírica, utilizando as séries de retornos do Ouro (Gold Price London Fixing), do Petróleo Europeu (BRENT) e Indíce NASDAQ (National Association of Securities Dealers Automated Quotations). Conduzimos a análise empírica separando-as em duas partes: i) Estimação, ii) Teste. Após a modelagem, verificamos a qualidade do ajuste via método proposto através da realização de backtests. Por fim, comparamos as proporções de violações obtidas, para cada um dos ativos utilizados, através do método implementado com modelos usuais de estimação do VaR, como: GARCH, Gaussiano e Empírico. Tais comparações servem para mostrar que existe uma alternativa à esses métodos, e que, para os ativos trabalhados, os resultados se apresentaram, de uma maneira geral, mais satisfatórios.

Palavras-chave: Value at Risk. Riscos Financeiros. Função de distribuição condicional. Retornos. Método não-paramétrico. Estimação.if 1 02 511559

Orientador: Wilson Calmon Almeida dos Santos

Fechar Todos