RCAAP Repository

Limite do fluído para o grafo aleatório de Erdos-Rényi

Neste trabalho, aplicamos o algoritmo Breadth-First Search para encontrar o tamanho de uma componente conectada no grafo aleatório de Erdos-Rényi. Uma cadeia de Markov é obtida deste procedimento. Apresentamos alguns resultados bem conhecidos sobre o comportamento dessa cadeia de Markov. Combinamos alguns destes resultados para obter uma proposição sobre a probabilidade da componente atingir um determinado tamanho e um resultado de convergência do estado da cadeia neste instante. Posteriormente, aplicamos o teorema de convergência de Darling (2002) a sequência de cadeias de Markov reescaladas e indexadas por N, o número de vértices do grafo, para mostrar que as trajetórias dessas cadeias convergem uniformemente em probabilidade para a solução de uma equação diferencial ordinária. Deste resultado segue a bem conhecida lei fraca dos grandes números para a componente gigante do grafo aleatório de Erdos-Rényi, no caso supercrítico. Além disso, obtemos o limite do fluído para um modelo epidêmico que é uma extensão daquele proposto em Kurtz et al. (2008).

Year

2022-12-06T14:52:58Z

Creators

Fabio Marcellus Lima Sá Makiyama Lopes

O modelo de percolação em grafos: Um estudo de condições para a transição de fase do parâmetro crítico

Este trabalho visa a estudar o modelo de percolação independente, de Bernoulli, em grafos, tendo como objetivo principal obter condições que garantam a ocorrência de transição de fase. Iniciamos apresentando as definições e algumas técnicas fundamentais para o modelo de percolação (de elos ou de sítios) em um grafo infinito, conectado e localmente finito. Demonstramos então dois resultados essenciais: os fatos do parâmetro crítico não depender da escolha do vértice e da existência de um aglomerado infinito ter probabilidade 0 ou 1. Também obtemos um limitante inferior para o parâmetro crítico quando o grafo é de grau limitado. Para finalizar esta parte introdutória, analisamos a percolação em grafos particulares, a saber, a rede hipercúbica Z^d (para a qual mostramos a existência de transição de fase em dimensão d >= 2 e a unicidade do aglomerado infinito na fase supercrítica) e alguns tipos de árvores (para as quais apresentamos os parâmetros críticos). Na parte mais importante da dissertação, tendo como base os trabalhos de Benjamini e Schramm, de Häggström, Schonmann e Steif e de Lyons e Peres, introduzimos os conceitos de transitividade, amenabilidade e amenabilidade forte para um grafo. Fazemos uma detalhada discussão destas definições: provamos que a constante de Cheeger ancorada não depende do vértice em que é ancorada, estudamos relações entre os conceitos (amenabilidade e amenabilidade forte são noções distintas, bem como condições necessárias e suficientes para ambas) e calculamos a constante de Cheeger e a constante de Cheeger ancorada para alguns grafos. Finalmente, utilizando a técnica de crescimento do aglomerado, apresentamos para a probabilidade crítica um limitante superior que depende da constante ancorada. Isto nos permite concluir que ocorre transição de fase para qualquer grafo infinito, conectado, fracamente não-amenável (de constante de Cheeger ancorada positiva) e de grau limitado.

Year

2022-12-06T14:52:58Z

Creators

Élcio Lebensztayn

Uso de transformações em modelos de regressão logística

Modelos para dados binários são bastante utilizados em várias situações práticas. Transformações em Análise de Regressão podem ser aplicadas para linearizar ou simplificar o modelo e também para corrigir desvios de suposições. Neste trabalho, descrevemos o uso de transformações nos modelos de regressão logística para dados binários e apresentamos modelos envolvendo parâmetros adicionais de modo a obter um ajuste mais adequado. Posteriormente, analisamos o custo da estimação quando são adicionados parâmetros aos modelos e apresentamos os testes de hipóteses relativos aos parâmetros do modelo de regressão logística de Box-Cox. Finalizando, apresentamos alguns métodos de diagnóstico para avaliar a influência das observações nas estimativas dos parâmetros de transformação da covariável, com aplicação a um conjunto de dados reais.

Year

2022-12-06T14:52:58Z

Creators

Noemi Ichihara Ishikawa

Tempo de chegada ao equilíbrio da dinâmica de Metropolis para o GREM

Neste trabalho consideramos um processo de Markov a tempo contínuo com espaço de estados finito em um meio aleatório, a saber, a dinâmica de Metropolis para o Modelo de Energia Aleatória Generalizado (GREM) com um número de níveis finito e discutimos o comportamento do seu tempo de chegada ao equilíbrio, o qual é dado pelo inverso da lacuna espectral de sua matriz de probabilidades de transição. No principal resultado desta tese provamos que o quociente entre o volume do sistema e o logaritmo do inverso da lacuna é quase sempre limitado, por cima, por uma função da temperatura, que também é a que descreve a energia livre do GREM sob o regime de temperaturas baixas. Como um estudo adicional, também é discutido um correspondente limitante inferior em um caso particular do GREM com 2 níveis.

Year

2022-12-06T14:52:58Z

Creators

Antonio Marcos Batista do Nascimento

Sistemas de partículas interagentes dependentes de tipo e aplicações ao estudo de redes de sinalização biológica

Neste trabalho estudamos os type-dependent stochastic spin models propostos por Fernández et al., os que chamaremos de modelos de spins estocástico dependentes de tipo, e que foram usados para modelar redes de sinalização biológica. A modelagem original descreve a evolução macroscópica de um modelo de spin-flip de tamanho finito com k tipos de spins, possuindo um número arbitrário de estados internos, que interagem através de uma dinâmica estocástica não reversível. No limite termodinânico foi provado que, em um intervalo de tempo finito as trajetórias convergem quase certamente para uma trajetória determinística, dada por uma equação diferencial de primeira ordem. Os comportamentos destes sistemas dinâmicos podem incluir bifurcações, relacionadas às transições de fase do modelo. O nosso objetivo principal foi de estender os modelos de spins com dinâmica de Glauber utiliza- dos pelos autores, permitindo trocas múltiplas dos spins. No contexto biológico tentamos incluir situações nas quais moléculas de tipos diferentes trocam simultaneamente os seus estados internos. Utilizando diversas técnicas, como as de grandes desvíos e acoplamento, tem sido possível demonstrar a convergência para o sistema dinâmico associado.

Year

2022-12-06T14:52:58Z

Creators

Manuel Alejandro Gonzalez Navarrete

Estimação indireta de modelos R-GARCH

Processos lineares não capturam a estrutura dos dados em finanças. Há uma variedade muito grande de modelos não lineares disponíveis na literatura. A classe de modelos ARCH (Autoregressive Conditional Heterokedastic) foi introduzida por Engle (1982) com o objetivo de estimar a variância da inflação. A idéia nesta classe é que os retornos sejam não correlacionados serialmente, mas a volatilidade (variância condicional) dependa de retornos passados. A classe de modelos GARCH (Generalized Autoregressive Conditional Heterokedastic) sugerida por Bollerslev (1986, 1987, 1988) pode ser usada para descrever a volatilidade com menos parâmetros que um modelo ARCH. Modelos da classe GARCH são processos estocásticos não lineares, suas distribuições tem cauda pesada com variância condicional dependente do tempo e modelam agrupamento de volatilidade. Apesar da razoável descrição, a forma como os modelos acima foram construídos apresentaram algumas limitações no que se refere ao peso das caudas em suas distribuições não condicionais. Muitos estudos em dados financeiros apontam para caudas com peso considerável. Modelos R-GARCH (Randomized Generalized Autoregressive Conditional Heterokedastic) foram propostos por Nowicka (1998) e incluem os modelos ARCH e GARCH possibilitando o uso de inovações estáveis além da conhecida distribuição normal. Estas permitem captar melhor a propriedade de cauda pesada. Como a função de autocovariância não existe para tais processos introduz-se novas medida de dependência. Métodos de estimação e análises empíricas da classe R-GARCH, assim como de suas medidas de dependência não estão disponíveis na literatura e são o foco deste trabalho.

Year

2022-12-06T14:52:58Z

Creators

Jhames Matos Sampaio

Tamanho amostral para estimar a concentração de organismos em água de lastro: uma abordagem bayesiana

Metodologias para obtenção do tamanho amostral para estimar a concentração de organismos em água de lastro e verificar normas internacionais são desenvolvidas sob uma abordagem bayesiana. Consideramos os critérios da cobertura média, do tamanho médio e da minimização do custo total sob os modelos Poisson com distribuição a priori gama e binomial negativo com distribuição a priori Pearson Tipo VI. Além disso, consideramos um processo Dirichlet como distribuição a priori no modelo Poisson com o propósito de obter maior flexibilidade e robustez. Para fins de aplicação, implementamos rotinas computacionais usando a linguagem R.

Year

2022-12-06T14:52:58Z

Creators

Eliardo Guimarães da Costa

Aperfeiçoamento de métodos estatísticos em modelos de regressão da família exponencial

Neste trabalho, desenvolvemos três tópicos relacionados a modelos de regressão da família exponencial. No primeiro tópico, obtivemos a matriz de covariância assintótica de ordem $n^$, onde $n$ é o tamanho da amostra, dos estimadores de máxima verossimilhança corrigidos pelo viés de ordem $n^$ em modelos lineares generalizados, considerando o parâmetro de precisão conhecido. No segundo tópico calculamos o coeficiente de assimetria assintótico de ordem n^{-1/2} para a distribuição dos estimadores de máxima verossimilhança dos parâmetros que modelam a média e dos parâmetros de precisão e dispersão em modelos não-lineares da família exponencial, considerando o parâmetro de dispersão desconhecido, porém o mesmo para todas as observações. Finalmente, obtivemos fatores de correção tipo-Bartlett para o teste escore em modelos não-lineares da família exponencial, considerando covariáveis para modelar o parâmetro de dispersão. Avaliamos os resultados obtidos nos três tópicos desenvolvidos por meio de estudos de simulação de Monte Carlo

Year

2022-12-06T14:52:58Z

Creators

Alexsandro Bezerra Cavalcanti

"Métodos de estimação na teoria de resposta ao item"

Neste trabalho apresentamos os mais importantes processos de estimação em algumas classes de modelos de resposta ao item (Dicotômicos e Policotômicos). Discutimos algumas propriedades desses métodos. Com o objetivo de comparar o desempenho dos métodos conduzimos simulações apropriadas.

Year

2022-12-06T14:52:58Z

Creators

Caio Lucidius Naberezny Azevedo

Modelos não lineares de família exponencial revisitados

O objetivo deste trabalho é fazer uma revisão dos modelos não lineares de família exponencial (Cordeiro & Paula (1989); Wei (1998)) para respostas independentes e apresentar possíveis extensões para o caso de dados correlacionados. Inicialmente são apresentados exemplos ilustrativos, alguns dos quais são reanalizados ao longo do texto. Em seguida são discutidos procedimentos de estimação e testes de hipóteses, tais como apresentação de um processo de estimação que pode ser adaptado ao processo iterativo usado na classe dos modelos lineares generalizados, e alguns resultados assintóticos. Técnicas usuais de diagnóstico, como pontos de alavanca, análise de resíduos e diagnóstico de influência são adaptados para a classe dos modelos não lineares de família exponencial. Extensões para a classe dos modelos não lineares com resposta binomial negativa são também apresentadas. Finalmente, são consideradas duas possíveis extensões dos modelos não lineares de família exponencial para dados correlacionados, através de equações de estimação generalizadas e através de modelagem mista em que efeitos aleatórios em forma linear são adicionados ao componente não linear da parte sistemática do modelo conforme sugerido recentemente por Tang et al. (2006a).

Year

2022-12-06T14:52:58Z

Creators

Adriana Alvarez Possamai

Modelos log-Birnbaum-Saunders mistos

O objetivo principal deste trabalho é introduzir os modelos log-Birnbaum-Saunders mistos (log-BS mistos) e estender os resultados para os modelos log-Birnbaum-Saunders t-Student mistos (log-BS-t mistos). Os modelos log-BS são bastante conhecidos desde o trabalho de Rieck e Nedelman (1991) e particularmente receberam uma grande atenção nos últimos 10 anos com vários trabalhos publicados em periódicos internacionais. Contudo, o enfoque desses trabalhos tem sido em modelos log-BS ou log-BS generalizados com efeitos fixos, não havendo muita atenção para modelos com efeitos aleatórios. Inicialmente, apresentamos no trabalho uma revisão das distribuições Birnbaum-Saunders e Birnbaum-Saunders generalizada (BSG) e em seguida discutimos os modelos log-BS e log-BS-t com efeitos fixos, para os quais revisamos alguns resultados de estimação e diagnóstico. Os modelos log-BS mistos são então apresentados precedidos de uma revisão dos métodos de quadratura de Gauss Hermite (QGH). Embora a estimação dos parâmetros nos modelos log-BS mistos seja efetuada através do procedimento Proc NLMIXED do SAS (Littell et al, 1996), aplicamos o método de quadratura não adaptativa a fim de obtermos aproximações para o logaritmo da função de verossimilhança do modelo log-BS de intercepto aleatório. Com essas aproximações derivamos as funções escore e a matriz hessiana, além das curvaturas normais de influência local (Cook, 1986) para alguns esquemas de perturbação usuais. Os mesmos procedimentos são aplicados para os modelos log-BS-t de intercepto aleatório. Discussões sobre a predição dos efeitos aleatórios, teste para o componente de variância dos modelos com intercepto aleatório e análises de resíduos são também apresentados. Finalmente, comparamos os ajustes de modelos log-BS e log-BS mistos a um conjunto de dados reais. Métodos de diagnóstico são utilizados na comparação dos modelos ajustados.

Year

2022-12-06T14:52:58Z

Creators

Cristian Marcelo Villegas Lobos

Coerência parcial e aplicações

Neste trabalho foram estudadas algumas formas de relação entre séries temporais multivariadas. Discutiu-se, inicialmente, a função de coerência, uma função análoga a função de correlação(que é dada no domínio do tempo) calculada no domínio da freqüência. Foram estudadas também as funções de coerência parcial e coerência parcial direcionada. A função de coerência parcial mede a relação entre duas componentes de uma série multivariada, isolados os efeitos de outra série. Em linhas gerais, a Coerência Parcial Direcionada pode ser interpredata como a decomposição da coerência parcial a partir de modelos autoregressivos multivariados. Esse conceito pode ser interpretado como uma representação do conceito de causalidade de Granger no domínio da freqüência. Finalmente, foram aplicadas as funções acima em dois conjuntos de dados: um modelo VAR(1) trivariado simulado e dados de medições de eletroencefalograma.

Year

2022-12-06T14:52:58Z

Creators

Kim Samejima Mascarenhas Lopes

Regressão linear com medidas censuradas

Consideramos um modelo de regressão linear simples, em que tanto a variável resposta como a independente estão sujeitas a censura intervalar. Como motivação utilizamos um estudo em que o objetivo é avaliar a possibilidade de previsão dos resultados de um exame audiológico comportamental a partir dos resultados de um exame audiológico eletrofisiológico. Calculamos intervalos de previsão para a variável resposta, analisamos o comportamento dos estimadores de máxima verossimilhança obtidos sob o modelo proposto e comparamos seu desempenho com aquele de estimadores obtidos de um modelo de regressão linear simples usual, no qual a censura dos dados é desconsiderada.

Year

2022-12-06T14:52:58Z

Creators

Marcel Frederico de Lima Taga

Não monotonicidade do parâmetro crítico no modelo dos sapos

Estudamos um modelo de passeios aleatórios simples em grafos, conhecido como modelo dos sapos. Esse modelo pode ser descrito de maneira geral da seguinte forma: existem partículas ativas e partículas desativadas num grafo G. Cada partícula ativa desempenha um passeio aleatório simples a tempo discreto e a cada momento ela pode morrer com probabilidade 1-p. Quando uma partícula ativa entra em contato com uma partícula desativada, esta é ativada e também passa a realizar, de maneira independente, um passeio aleatório pelo grafo. Apresentamos limites superior e inferior para o parâmetro crítico de sobrevivência do modelo dos sapos na árvore, e demonstramos que este parâmetro crítico não é uma função monótona do grafo em que está definido.

Year

2022-12-06T14:52:58Z

Creators

Alexandre Ribeiro Leichsenring

Um estudo comparativo entre abordagens Bayesianas à testes de hipóteses

Neste trabalho, consideramos uma população finita composta por N elementos, sendo que para cada unidade está associado um número (ou vetor) de tal forma que temos para a população o vetor de valores X = (X1, ... ,XN), onde Xi denota a característica de interesse do i-ésimo indivíduo da população, que suporemos desconhecida. Aqui assumimos que a distribuição do vetor X é permutável e que existe disponível uma amostra composta por n < N elementos. Os objetivos são a construção de testes de hipóteses para os parâmetros operacionais, através das distribuições a posteriori obtidas sob a abordagem preditivista para populações finitas e a comparação com os resultados obtidos a partir dos modelos Bayesianos de superpopulação. Nas análises consideramos os modelos Bernoulli, Poisson, Uniforme Discreto e Multinomial. A partir dos resultados obtidos, conseguimos ilustrar situações nas quais as abordagens produzem resultados diferentes, como prioris influenciam os resultados e quando o modelo de populações finitas apresenta melhores resultados que o modelo de superpopulação.

Year

2022-12-06T14:52:58Z

Creators

Brian Alvarez Ribeiro de Melo

Aspectos estatísticos da amostragem de água de lastro

A água de lastro de navios é um dos principais agentes dispersivos de organismos nocivos à saúde humana e ao meio ambiente e normas internacionais exigem que a concentração desses organismos no tanque seja menor que um valor previamente especificado. Por limitações de tempo e custo, esse controle requer o uso de amostragem. Sob a hipótese de que a concentração desses organismos no tanque é homogênea, vários autores têm utilizado a distribuição Poisson para a tomada de decisão com base num teste de hipóteses. Como essa proposta é pouco realista, estendemos os resultados para casos em que a concentração de organismos no tanque é heterogênea utilizando estratificação, processos de Poisson não-homogêneos ou assumindo que ela obedece a uma distribuição Gama, que induz uma distribuição Binomial Negativa para o número de organismos amostrados. Além disso, propomos uma nova abordagem para o problema por meio de técnicas de estimação baseadas na distribuição Binomial Negativa. Para fins de aplicação, implementamos rotinas computacionais no software R

Year

2022-12-06T14:52:58Z

Creators

Eliardo Guimarães da Costa

Long memory in high frequency time series using wavelets and conditional volatility models

The goal of this dissertation is to describe a methodology for modelling the volatility of high frequency financial data, considering its features and stylized facts. In order to account for the long-range dependence in conditional mean and conditional variance, ARFIMA and FI(E)GARCH models are used respectively, when observed. To account for the non-normality, skeweness and kurtosis, features observed in the the distribution of the log-returns in high frequency, the Skewed Student t and the Generalized Error Distribution (GED) are adopted for the innovation term of the aforementioned models. Wavelet shrinkage is used in a non-parametric identification and separation of the intraday jumps from the time series data. The application of this procedure is presented using real high frequency asset returns from the Brazilian Exchange and OTC, as well as exchange rates from cryptocurrencies traded in Crypto Exchanges.

Year

2022-12-06T14:52:58Z

Creators

Mateus Gonzalez de Freitas Pinto

Métodos estatísticos na análise de experimentos de microarray

Neste trabalho é proposto um estudo comparativo de alguns métodos de Agrupamento (Hierárquico, K-médias e Self-Organizing Maps) e de Classificação (K-Vizinhos, Fisher, Máxima Verossimilhança, Aggregating e Regressão Local), os quais são apresentados teoricamente. Tais métodos são testados e comparados em conjuntos de dados reais, gerados com a técnica de Microarray. Esta técnica permite mensurar os níveis de expressão de milhares de genes simultaneamente, possibilitando comparações entre amostras de tecidos pelos perfis de expressão. É apresentada uma revisão de conceitos básicos relacionados ao processo de normalização, sendo este uma das primeiras etapas da análise deste tipo de conjunto de dados. Em particular, estivemos interessados em encontrar pequenos grupos de genes que fossem ?suficientes? para distinguir amostras em condições¸ biológicas diferentes. Por fim, é proposto um método de busca que, dado os resultados de um experimento envolvendo um grande número de genes, encontra de uma forma eficiente os melhores classificadores.

Year

2022-12-06T14:52:58Z

Creators

Elier Broche Cristo

Análise de questionários com itens constrangedores

As pesquisas científicas na área da Psiquiatria freqüentemente avaliam características subjetivas de indivíduos como, por exemplo, depressão, ansiedade e fobias. Os dados são coletados através de questionários, cujos itens tentam identificar a presença ou ausência de certos sintomas associados à morbidade psiquiátrica de interesse. Alguns desses itens, entretanto, podem provocar constrangimento em parte dos indivíduos respondedores por abordarem características ou comportamentos socialmente questionáveis ou, até, ilegais. Um modelo da teoria de resposta ao item é proposto neste trabalho visando diferenciar a relação entre a probabilidade de presença do sintoma e a gravidade da morbidade de indivíduos constrangidos e não constrangidos. Itens que necessitam dessa diferenciação são chamados \\textbf{itens com comportamento diferencial}. Adicionalmente, o modelo permite assumir que indivíduos constrangidos em responder um item possam vir a mentir em suas respostas, no sentido de omitir a presença de um sintoma. Aplicações do modelo proposto a dados simulados para questionários com 20 itens mostraram que as estimativas dos parâmetros são próximas aos seus verdadeiros valores. A qualidade das estimativas piora com a diminuição da amostra de indivíduos, com o aumento do número de itens com comportamento diferencial e, principalmente, com o aumento do número de itens com comportamento diferencial suscetíveis à mentira. A aplicação do modelo a um conjunto de dados reais, coletados para avaliar depressão em adolescentes, ilustra a diferença do padrão de resposta do item ``crises de choro\" entre homens e mulheres.

Year

2022-12-06T14:52:58Z

Creators

Mariana Cúri

Extensões de distribuições com aplicação à analise de sobrevivência

Nesta tese serão estudadas diferentes generalizações de algumas distribuições bem conhecidas na literatura para os tempos de vida, tais como exponencial, Lindley, Rayleigh e exponencial segmentada, entre outras, e compará-las com outras extensões com suporte positivo. A finalidade dessas generalizações é flexibilizar a função de risco de modo que possam assumir formas mais flexíveis. Além disso, pretende-se estudar propriedades importantes dos modelos propostos, tais como os momentos, coeficientes de curtose e assimetria e função quantílica, entre outras. A estimação dos parâmetros é abordada através dos métodos de máxima verossimilhança, via algoritmo EM (quando for possível) ou também, do método dos momentos. O comportamento desses estimadores foi avaliado em estudos de simulação. Foram ajustados a conjuntos de dados reais, usando uma abordagem clássica, e compará-los com outras extensões na literatura. Finalmente, um dos modelos propostos é considerado no contexto de fração de cura.

Year

2022-12-06T14:52:58Z

Creators

Yolanda Magaly Gómez Olmos