2020 – Defesas no Primeiro Semestre Letivo

Escondido

Your content goes here. Edit or remove this text inline or in the module Content settings. You can also style every aspect of this content in the module Design settings and even apply custom CSS to this text in the module Advanced settings.

FÁBIO MELLO VALLADÃO. Avaliação do impacto da função de ligação na qualidade do ajuste de modelo linear generalizado para um desfecho binário de consulta ao médico

Resumo: A função de ligação é uma das três componentes de um modelo linear generalizado, e a escolha de uma função de ligação inapropriada pode influenciar a significância dos parâmetros e a qualidade do ajuste do modelo. Este trabalho teve como objetivo avaliar o impacto das funções de ligação logit, probit e complemento log-log na qualidade do ajuste, bem como no sentido, magnitude e significância das associações entre um conjunto de características sociodemográficas e de saúde de idosos e um desfecho binário referente ao tempo da última consulta médica realizada. Os modelos foram ajustados a partir dos dados da Pesquisa Nacional de Saúde 2013, usando o método de Máxima Pseudo-Verossimilhança (MPV). Com relação aos resultados do trabalho, nos modelos probit, logit e complemento log-log, as mesmas variáveis sociodemográficas e de saúde dos idosos apresentaram associação significativa com o desfecho de estudo. Além disso, os sinais das estimativas pontuais dos parâmetros nos três modelos foram iguais. Entretanto, as estimativas pontuais (padronizadas) do modelo complemento log-log foram maiores (variação relativa superior a 10%) que as respectivas estimativas obtidas nos modelos probit e logit, sendo que entre estes dois últimos modelos as estimativas pontuais foram similares (variação relativa inferior a 5%). As medidas de Pseudo-R2 de Cox-Snell (R_CS^2≅0,11) e Nagelkerke (R_N^2≅0,18), as medidas de sensibilidade e especificidade, assim como as áreas sob a curva ROC (A≅0,75), também foram bem similares nos três modelos. Conclui-se, portanto, que para os dados utilizados no presente estudo, a escolha da função de ligação não influenciou a significância e o sentido das associações entre as características dos idosos e o desfecho do estudo, e nem na qualidade do ajuste e na capacidade preditiva dos modelos. Desse modo, qualquer uma das três funções de ligação poderia ser escolhida, entretanto, em investigações na área de saúde, o modelo logit é o mais frequentemente utilizado pela facilidade de interpretação das estimativas e por possibilitar o cálculo de razão de chances (odds ratio), que é uma medida de associação utilizada em estudos epidemiológicos.
Palavras-chave: Modelo probit. Modelo logit. Modelo complemento log-log. Função de ligação. Plano amostral complexo.
 if 1 02 511559

Orientador: José Rodrigo de Moraes

ISABELLY DA SILVA ALMEIDA. Uso de Aprendizado de Máquinas para classificação de textos

Resumo: Com o crescimento do acesso a internet, um grande volume de dados textuais migraram do papel impresso para o meio eletrônico. E-mails, notícias, livros, artigos científicos e outros tipos de texto são produzidos diariamente. Por vezes surge a necessidade de classificar essas informações. A técnica de classificação de texto pode ser aplicada em várias áreas da mineração de texto. O uso de Aprendizado de Máquinas para resolver problemas desse tipo torna-se uma ferramenta bastante útil por dispor de vários algoritmos capazes de reconhecer padrões e criar regras de associação de forma automática. Este trabalho tem como objetivo verificar a eficiência de dois algoritmos de Aprendizado de Máquinas Supervisionado: Análise Discriminante e Máquinas de Vetor de Suporte, na resolução do problema de classificação de texto. Para isso, foram usados livros que passaram por um processo de etiquetagem morfológica. As etiquetas de cada palavra do livro serviram para criar as variáveis usadas nas análises. Desta maneira, pretendemos verificar se os algortimos são capazes de classificar, a partir de uma base de treinamento com livros de dois autores distintos, se um novo livro pertence a um determinado autor.
Palavras-chave: Aprendizado de Máquinas. Classificação de Texto. Análise Discriminante. Máquinas de Vetor de Suporte. Etiquetagem Morfológica. TreeTagger. Colonia Corpus.
 if 1 02 511559

Orientador: José Rodrigo de Moraes

LEIR LEON DOS SANTOS PAIVA. Análise da evolução temporal da violência contra a mulher no estado do Rio de Janeiro

Resumo: A violência contra a mulher é um problema de saúde e segurança pública, sendo considerada uma violação dos direitos humanos da mulher assim como de sua integridade física e psicológica, impactando em inúmeras consequências. Vista a necessidade de se monitorar a progressão desta violência, utilizou-se a análise de séries temporais. O objetivo desse projeto teve como intuito descrever as características do crime, investigar possíveis relações entre a vítima e o agressor utilizando o teste qui-quadrado e realizar a previsão das cinco séries de violência física, psicológica, moral, patrimonial e sexual contra a mulher através de modelos de Box-Jenkins. Para o tratamento estatístico, foram usados testes de normalidade e de estacionariedade, bem como testes de independência via análise de correlogramas e uso de estatísticas de aderências, como Mean Absolute Deciation (MAD), Mean Absolute Percentage Error, Root Mean Square Error (RMSE) e o Critério de Informação Bayesiano (BIC).  Após a realização das análises, foram constatadas as principais características dos crimes. O teste qui-quadrado indicou que todas as características entre a vítima e o agressor possuem algum tipo de associação e os modelos preditivos escolhidos permitiram uma melhor compreensão do comportamento de cada série. Foi constatado, dentre as violências, um perceptivo aumento no número de novos casos ao decorrer do ano, com exceção da violência psicológica e moral, que apontaram um valor alto em janeiro e fevereiro mas que decrescem ao longo dos meses seguintes.
Palavras-chave: Violência contra mulher. Estatística. Séries temporais. Modelagem.
 if 1 02 511559

Orientador: Moisés Lima de Menezes

Coorientadora: Núbia Karla de Oliveria Almeida

MARCEL CHACON GONÇALVES. Tópicos em aprendizagem estatística de máquinas com aplicações em finanças

Resumo: A cada dia, mais e mais empresas buscam formas de aproveitar a grande quantidade de dados disponíveis para melhorar o resultado de seus negócios. Nesse cenário, as técnicas de machine learninG, ou aprendizagem de máquinas, tem se destacado por implementar sistemas que buscam automatizar a incorporação de novas informações disponíveis nos dados, proporcionando uma utilização imediata nos processos de tomada de decisão. Nesse projeto de trabalho de conclusão de curso estudaremos alguns dos principais conceitos e modelos estatísticos utilizados em aprendizagem de máquinas e suas respectivas ferramentas no R, focando nos processos de análise de dados e predição, bem como na sua utilização prática em problemas de recente aplicação, como na área de finanças em que modelos estatísticos de machine learning tem substituído métodos clássicos como as medidas de credit score em análise de crédito. Então foi comparado o desempenho dos métodos através das amostras testes criadas com os dados disponíveis. A escolha do método pode ser diferente dependendo da métrica usada como parâmetro, e isso depende do objetivo da análise.
Palavras-chave: Aprendizagem estatística. Regressão logística. KNN. LDA e QDA. Métodos baseados em árvores
 if 1 02 511559

Orientador: Marcio Watanabe Alves de Souza

MICHELE MARIA DA SILVA. Previsão para o mercado de trabalho brasileiro através da metodologia de Box e Jenkins

Resumo: Este trabalho tem por objetivo fazer previsões para os mercados de trabalho formal e informal no período compreendido entre janeiro e dezembro de 2020. Por meio de uma análise descritiva preliminar constatou-se que, enquanto o mercado de trabalho formal, composto majoritariamente por trabalhadores com carteira e funcionários públicos, apresentou queda até meados de 2017 e um crescimento lento até o final de 2019 o mercado informal, formado majoritariamente por trabalhadores por conta própria sem CNPJ e trabalhadores sem carteira assinada, apresentou um crescimento contínuo em praticamente todo o período. Verificou-se ainda que a proporção dos mercados formal e informal sobre os ocupados manteve-se praticamente estável longo do período (participação média de 60% dos formais contra 40% dos informais). Por meio da metodologia de Box-Jenkins, com base nos critérios de informação e medidas de desempenho, os modelos SARIMA (1,1,0) x (1,1,0) e o modelo SARIMA (1,1,2) x (0,1,0) foram selecionados como os modelos com o menor número de parâmetros, mais bem ajustados e com os melhores desempenhos preditivos para o mercado formal e para o informal, respectivamente. As previsões segundo esses modelos indicam que haverá crescimento em ambos os mercados de trabalho para o ano de 2020, porém de modo mais acentuado para o mercado de trabalho formal. A variação interanual desse último também será superior à do mercado informal. Apesar disso, estima-se que a proporção dos mercados de trabalho formal e informal sobre a população ocupada permaneça praticamente inalterada indicando que as alterações nas relações contratuais de trabalho provocadas pela Reforma Trabalhista ainda não foram suficientes para promover uma transferência dos trabalhadores informais para o mercado de trabalho formal.
Palavras-chave: Mercado de trabalho. SARIMA. Previsões. Box-Jenkins.
if 1 02 511559

Orientadora: Maria Cristina Bessa Moreira

PAOLA DE OLIVEIRA PRADO. Aplicação de técnicas multivariada para visualização de dígitos manuscritos

Resumo: Atualmente, bases de imagens são bastante utilizadas para a classificação de objetos na área de aprendizado de máquina ou, como mais conhecido em inglês, \textit{Machine Learning}. Dentro dessa esfera, as bases de dígitos manuscritos vem sendo muito empregadas, principalmente, para um estudo inicial dessa área e testar o desempenho dos algoritmos. Este trabalho aplica as técnicas de Escalonamento Multidimensional, Análise de Agrupamento e \textit{t-SNE} a fim de verificar seus desempenhos na visualização dos dígitos manuscritos. Para tal, foi utilizada a base de dígitos manuscritos, \textit{MNIST}, com 10.000 observações. Devido a problemas de processamento computacional, realizou-se uma amostragem com 2.000 e 4.000 observações. O resultado para a técnica não linear, \textit{t-SNE}, apresentou melhores visualizações comparado as outras técnicas analisadas.
Palavras-chave: Análise multivariada. Aprendizado de máquina. Escalonamento multidimensional. MNIST. t-SNE
if 1 02 511559

Orientador: Hugo Henrique Kegler dos Santos

Coorientador: Valentin Sisko

RONDINELLI GOMES BRAGANCA. Inferência Bayesiana aplicada em modelo de regressão linear e modelo espacial

Resumo: Modelos estatísticos servem para descrever o comportamento probabilístico de fenômenos de interesse permitindo analisá-los, prevê-los e tomar decisões pertinentes. Modelos de regressão linear são muito utilizados em diversas áreas. Esses modelos possuem suposições fortes como independência que em geral não se ajustam a dados espaciais. Modelos de regressão linear podem ser combinados com modelos espaciais. Dados espaciais podem ser divididos em 3 tipos: padrão de pontos, dados de área e dados geoestatísticos. Esse trabalho visa avaliar modelos de regressão linear inicialmente e posteriormente modelos para dados geoestatísticos através da função de covariância exponencial. Parâmetros desconhecidos são encontrados nesses modelos e a inferência adotada nesse trabalho é a Bayesiana por permitir que a crença inicial do especialista seja incorporada a modelagem, aumentando a quantidade de informação avaliada e melhorando portanto as estimativas. Ao ajustar os modelos a conjuntos de dados simulados é possível verificar a capacidade dos ajustes recuperarem os verdadeiros valores dos parâmetros e selecionar o verdadeiro modelo.
Palavras-chave: Estatística espacial. Geoestatística. Inferência Bayesiana. Modelo de regressão linear. Métodos de Monte Carlo via cadeias de Markov. DIC. Erro médio quadrático.
if 1 02 511559

Orientadora: Patrícia Lusié Velozo da Costa

Coorientadora: Estelina Serrano de Marins Capistrano

STÉPHANIE DO AMARAL PIMENTA. Aplicação de métodos de regressão para o mercado financeiro

Resumo: O objetivo deste trabalho é aplicar métodos de regressão para dados financeiros, buscando prever o preço de ações três meses após uma certa data de observação. As variáveis explicativas adotadas foram algumas variáveis econômicas, como, por exemplo, o PIB, e algumas variáveis de indicadores financeiros das ações, como, por exemplo, o preço na data de observação. Os métodos de regressão aplicados foram: Regressão Linear Múltipla, Árvore de Regressão e Floresta Aleatória. Entre esses três métodos, o que apresentou melhor resultado foi a Regressão Linear Múltipla. Porém, para este, as interpretações do modelo final não são coerentes com a experiência do mercado financeiro.
Palavras-chave: Modelos lineares. Aprendizado de máquinas. Árvore de regressão. Floresta aleatória. Precificação de ações. 
if 1 02 511559

Orientadora: Jessica Quintanilha Kubrusly

VANESSA SANTOS MEDEIROS DA SILVA. Análise da taxa de retorno à educação na Região Metropolitana do Rio de Janeiro

Resumo:  Este trabalho avalia os retornos à educação dos indivíduos de 25 a 64 anos que vivem na Região Metropolitana do Estado do Rio de Janeiro. Os dados utilizados foram contemplados a partir da 5ª visita da PNAD Contínua de 2018. As taxas de retorno à educação são obtidas a partir da equação minceriana e medem, indiretamente, a distribuição de educação, além de refletir a demanda de mão de obra de determinada sociedade. As análises feitas indicam que este modelo se ajusta com imperfeições aos conjuntos de dados. Os resultados encontrados apontam que indivíduos que vivem na Capital do estado apresentam ganho médio na renda mais expressivo do que indivíduos, com o mesmo nível educacional, que vivem na Região Metropolitana (exceto Capital). A obtenção de um modelo que apresente melhor ajuste aos dados é de grande importância, pois caso ele confirme os resultados obtidos neste trabalho, será possível confirmar que o ganho médio no rendimento a cada ano de estudo alcançado é inferior para pessoas que habitam a Região Metropolitana (exceto Capital) do Estado do Rio de Janeiro.
Palavras-chave:  Retorno à educação. Equação minceriana. Estado do Rio de Janeiro. PNAD Contínua.
if 1 02 511559

Orientadora: Rafael Santos Erbisti

Fechar Todos