Repositório RCAAP
Modelo de espaço de estados com efeitos retrospectivos para dados longitudinais multivariados
Neste trabalho, apresentamos um modelo de espaço de estados para dados longitudinais, no qual o processo latente é um processo de Markov de ordem `L > OU =1¦. Assumimos que, dado o processo latente, a distribuição condicional do processo observado depende do valor presente e de 'K > OU = 0' valores passados do processo latente e tanto o processo observado quanto o processo latente têm distribuição na família Tweedie dos modelos de dispersão. O modelo é log-linear em um conjunto de covariáveis que podem variar no tempo e a estimação dos parâmetros de regressão é feita por meio de equações de estimação de Kalman, resolvidas por um algoritmo de escores de Newton. Parâmetros de dispersão são estimados por meio de estimadores de Pearson corrigidos. O modelo admite ainda uma terceira classe de parâmetros, os parâmetros retrospectivos, que definem a ordem do processo latente. Para estimação destes parâmetros retrospectivos, propomos um procedimento inspirado na função de verossimilhança perfilada. Mostramos alguns resultados de simulação e uma aplicação do modelo a um conjunto de dados reais
2000
Antonieta D'Alcantara de Queiroz Peres
Modelos lineares hierárquicos
Estruturas hierárquicas de dados são encontradas freqüentemente em diversos estudos. Elas são caracterizadas pela presença de unidades experimentais agrupadas em outras unidades maiores. Para avaliar dados desta natureza podem ser utilizados osmodelos lineares hierárquicos. Eles constituem uma nova formulação para os modelos de efeitos aleatórios, que permite especificar cada um dos níveis de hierarquia separadamente e incorporar efeitos aleatórios associados a cada um destes níveis.O modelo linear hierárquico com 2 níveis é apresentado e ilustrado através de alguns sub modelos, juntamente com a sua teoria de estimação e testes de hipóteses. São apresentadas duas aplicações: uma em Educação e a outra em Medicina, executadasem dois programas computacionais: HLM e SAS. A última aplicação mostra como um estudo de dados longitudinais pode ser tratado sob o enfoque de um modelo linear hierárquico
Modelagem de equações estruturais
Esta monografia discute a modelagem de equações estruturais ('Structural Equation Modeling - SEM'), apresentando os aspectos teóricos, uma revisão dos casos da literatura aplicados à área de marketing, e um estudo de caso
Modelos GARCH com distribuições não Gaussianas
A ênfase do trabalho está na modelagem de séries financeiras. O presente trabalho investiga, em modelos GARCH, como a suposição de distribuição dos erros padronizados pode afetar a previsão por intervalo da série em estudo. Simulações foram realizadas com o intuito de comparar os modelos GARCH com erros padronizados seguindo distribuição normal, t-student e normal contaminada. Uma série real foi estudada utilizando três diferentes suposições sobre a distribuição dos erros padronizados. A conclusão geral é que existe considerável benefício na previsão por intervalo quando são utilizadas distribuições com excesso de curtose quando comparadas à distribuição normal
2000
Rogério Oliveira Ribeiro
Modelos de 'credit scoring': regressão logística, 'chaid' e real
O mercado financeiro de varejo brasileiro encontra-se em um momento de expansão da concessão de crédito, ocasionando um forte aumento na demanda por ferramentas capazes de avaliar o risco de inadimplência dos potenciais contratantes de produtos de crédito. Modelos estatísticos, denominados modelos de 'Credit Scoring', estão sendo utilizados para esta finalidade. Neste trabalho, descrevemos as caracteristicas dos processo de concessão de crédito e a partir de uma amostra de dados, fornecida por uma instituição financeira brasileira, aplicamos e comparamos três técnicas para classificação de clientes: a Regressão Logística Múltipla, o CHAID e o REAL. As duas primeiras técnicas são bastante utilizadas por profissionais do mercado e a terceira, trata-se de um novo algoritmo de Árvore de Classificação, sendo a primeira vez que é aplicado ao problema. Vantagens e desvantagens de cada um dos métodos são apresentadas
2000
Paulo de Tarso Marques Rosa
Modelos de percolação multi escalar
Estudamos as propriedades de conectividade de conjunto complementar no modelo de percolação de Poisson multi escalar e no modelo de percolação de Mandelbrot em dimensão arbitrária. Usando um resultado sobre a majoração de campos aleatórios dependentes por campos de Bernoulli, provamos que se o parâmetro de seleção é menor do que um certo valor crítico então escolhendo o parâmetro de escala suficientemente grande é possível garantir a ausência de percolação no conjunto complementar. Os resultados para o modelo de Mandelbrot são generalizados para o caso de um mosaico k-simétrico d-dimensional. O resultado obtido é aplicado ao modelo de percolação multi escalar por elo. Estudamos também o modelo Booleano de Poisson no caso de raio aleatório p não limitado. Para uma classe de modelos de percolação de longo alcance tais que as probabilidades p(x,z) de elo (x,z) ser aberto satisfazem algumas condições de regularidade e 'sigma'z pertence a'Z POT. 2' p(x,z) = 'infinito' provamos que a percolação ocorre mesmo se os elos maiores do que um certo número (que depende da família de probabilidades {p(x,z)}) forem cortados. Apresentamos também um exemplo de um modelo dependente de longo alcance para o qual isto não vale
Análise preqüencial
Basicamente, a análise preqüencial consiste na produção e avaliação de previsões para quantidades observáveis. Por previsão, entende-se uma distribuição de probabilidades para a quantidade desconhecida de interesse. Assim definida cada previsão é coerente segundo a noção de coerência de De Finetti. Neste trabalho são estudados sistemas de previsão e diversas medidas de avaliação, incluindo o comportamento assintótico destas medidas para um bom sistema de avaliação. Neste contexto, são apresentados os princípios preqüenciais. Por fim, são apresentadas quatro aplicações analisadas sob a ótica preqüencial
2000
Airlane Pereira Alencar
Novas quotas inferiores para a probabilidade crítica do processo de percolação orientada por meio de cadeias de Markov numa faixa de múltiplas vias
Apresentamos uma seqüência decrescente de passeios aleatórios em Z, que domina a margem direita do processo de percolação orientada. Através do conceito de cadeia de Markov numa faixa, descrevemos um algoritmo que gera uma seqüência crescente de quotas inferiores que converge para a probabilidade crítica do processo de percolação orientada em duas dimensões. Calculando numericamente os dez primeiros termos dessa seqüência, obtivemos uma nova quota inferior para a probabilidade crítica deste processo: 'p.IND. c' > OU = 0,63328
Teoria da resposta ao ítem para dados longitudinais
Neste trabalho consideramos a situação em que um grupo de indivíduos é acompanhado ao longo de várias condições de avaliação pré-fixadas. Seu desempenho (habilidade/proficiência) é obtido a partir de respostas dadas em testes formados por ítens (questões) com características próprias. Para modelar a dependência entre suas habilidades nos vários períodos estudados são propostas diversas estruturas de covariância. São apresentadas equações de estimação para o conjunto de características dos ítens e para os parâmetros da distribuição latente. É abordado o caso de dados incompletos, o caso em que há várias populações em estudo, e são apresentadas propostas para modelar as curvas de crescimento relativas aos parâmetros da distribuição latente. São feitas simulações e uma aplicação aos dados do projeto de Avaliação de Jornada Única, realizado pela Secretaria de Estado da Educação de São Paulo no período 1992-94
2001
Heliton Ribeiro Tavares
Instantes de ocorrência de eventos raros em processos misturadores
Esta tese trata das distribuições dos processos pontuais formados pelas sucessivas ocorrências de um evento raro em processos estocásticos misturadores. Este estudo abrange basicamente, três situações bem diferenciadas: o instante de primeira entrada em um evento, o instante de retorno a um evento e o tempo de permanência no evento. Se considerarmos os intantes das sucessivas ocorrências de um mesmo evento durante a realização de um processo, estes formarão então um processo pontual. O estudo destas três situações nos permitirá compreender como se distribui esse processo ao longo do tempo para processos estocásticos que perdem memória segundo uma condição geral, que chamamos de processos misturadores. Estes processos abrangem vários tipos de processos estocásticos a tempo discreto bem conhecidos, por exemplo, cadeias de Markov e medidas de Gibbs. Apresentaremos uma majoração e minoração para o erro na aproximação exponencial para o instante de entrada em um evento raro para processos 'alfa'-misturadores somáveis e processos 'fi'-misturadores quaisquer com alfabeto finito. Este estudo nos permitirá também fazer uma divisão entre os eventos segundo o comportamento da lei exponencial aproximante. A lei do instante de volta pode ser aproximada por uma combinação de uma lei degenerada e uma lei exponencial. Por sua vez, a lei do tempo de permanência pode ser aproximada por uma lei geométrica. Apresentaremos uma estimação do erro em ambos os casos. Como último resultados obtemos a aproximação poissoniana para os sucessivos instantes de entrada em um evento raro não recorrente para processos 'fi'-misturadores através do método Chen-Stein
Métodos de controle de processo on-line para atributos
Uma classe de procedimentos utilizados para monitorar processos por atributos são os procedimentos introduzidos por Taguchi (1981, 1984, 1985) e Taguchi et al. (1989). Esses procedimentos envolvem apenas a inspeção de um item retirado da linha de produção, a cada intervalo fixo de m itens produzidos, e o seu planejamento é tratado por Taguchi e seus colaboradores através de critérios econômicos. Este trabalho tem como objetivo apresentar um modelo formal, unificado, para descrever o procedimento de Taguchi para atributos e obter, a partir dele, a expressão analítica para o custo médio assintótico do procedimento de controle, por item produzido. Neste contexto, o trabalho corrige um resultado obtido por Nayebpour e WoodLL (1993), no desenvolvimento de uma modelagem alternativa para o mecanismo de falha, quando este é monitorado pelo procedimento de Taguchi. Aborda, ainda, a questão da estimação dos parâmetros do processo a partir dos dados observados no procedimento de controle. Neste último caso, dá-se ênfase, em particular, ao ponto de mudança ou instante da falha do processo
2001
Ana Cristina Vieira Belem
Modelagem de riscos proporcionais para dados de sobrevivência com estrutura hierarquica
As técnicas mais difundidas em análise de sobrevivência supõem independência entre as observações. No entanto, em muitos problemas práticos esta suposição não é adequada, pela própria natureza dos dados. Uma maneira de abordar o problema é a utilização de modelos multiníveis, que são desenvolvidos para dados com estrutura hierárquica. Nestes modelos, a inclusão de coeficientes aleatórios faz com que o modelo possa incorporar dependências entre observações. Neste trabalho, foram estudados modelos de sobrevivência multiníveis em que os coeficientes apresentam distribuição normal, considerando-se uma abordagem paramétrica (modelos exponencial e Weibull) e uma abordagem baseada no modelo de regressão do Cox. A estimação estudada baseia-se na metodologia desenvolvida para modelos lineares generalizados. São apresentados dois métodos de estimação, que foram utilizados para analisar três conjuntos de dados. Além disso, é utilizado o método bootstrap para verificação de hipóteses de interesse sobre os parâmetros
Transição de fase e forma assintótica em um modelo de reação em cadeia
Neste trabalho estudamos o comportamento assintótico (forma assintótica e transição de fase) de um sistema crescente de passeios aleatórios simples, cuja dinâmica pode ser descrita do seguinte modo: inicialmente temos um número aleatório de partículas em cada sítio de um grafo G. Um sítio arbitrário de G é destacado dos demais e denominado, a partir de então, sua raíz e denotado pelo símbolo 0. Todas as partículas estão ativas (acordadas). A cada novo instante de tempo, cada uma das partículas ativas morre com probabilidade 1-p, independentemente das demais. Uma vez que uma partícula ativa sobrevive, ela salta sobre um sítio vizinho mais próximo, que é escolhido com probabilidade uniforme. Assim, cada partícula ativa realiza um passeio aleatório simples a tempo discreto em G, enquanto estiver viva. Durante o seu percurso, uma partícula ativa acorda todas as partículas dormentes que encontra pelo caminho e estas começam a se mover. Não há interação entre partículas ativas
2001
Oswaldo Scarpa Magalhães Alves
Simulação perfeita via cadeias de Markov
Neste trabalho apresentamos dois algoritmos de simulação perfeita usando cadeias de Markov e as respectivas provas de que fornecem amostras de acordo com a distribuição desejada. Estes algoritmos são o Coupling from the past-CFTP introduzido por Propp e Wilson e o algoritmo de Fill. Para ilustração destes algoritmos aplicamo-nos ao modelo de ising ferromagnético em duas dimensões, usando o amostrador de Gibbs (Gibbs sampler)
2001
Edvaldo Capobiango Coelho
Estimação e precisão no modelo de regressão linear com erros nas variáveis e mensurações replicadas
Nesta tese apresentamos procedimentos baseados em replicações para o problema da falta de identificação em modelos com erros nas variáveis. Discutimos procedimentos para os casos estrutural e funcional. Os procedimentos considerados são baseados nos métodos de momentos e de máxima verossimilhança. Os modelos considerados apresentam extensões para resultados publicados na literatura. A utilização do método de máxima verossimilhança no caso funcional não está na literatura
Contribuições ao estudo de modelos com erros nas variáveis
Neste trabalho estudamos alguns modelos com erros nas variáveis. Consideramos um modelo de análise de covariância (ANCOVA) em que temos variáveis explicativas medidas com erros aditivos e também variáveis explicativas contaminadas por erros multiplicativos. Dois estimadores para os efeitos dos tratamentos são comparados em termos de eficiência relativa assintótica. Mostramos que o estimador de mínimos quadrados ordinários (que ignora os erros de medição) é o mais eficiente. Um estudo de simulação compara os méritos relativos dos dois estimadores em amostras de tamanho pequeno a moderado. Em seguida, uma abordagem de influência local para detectar os efeitos de pequenas perturbações dos dados ou do modelo é aplicada aos modelos de calibração comparativa. Tais modelos são usados tipicamente para comparar vários instrumentos ou métodos de medição e podem ser vistos tanto em uma versão funcional quanto em uma versão estrutural, como acontece com os modelos com erros nas variáveis usuais. Diferentes esquemas de perturbação são considerados e dois exemplos com dados reais ilustram a metodologia desenvolvida. Por último, estendemos o modelo de regressão linear simples para situações mais gerais onde temos erro de medição na variável explicativa e duas ou mais populações estão presentes. Identificabilidade, estimação, um teste de ajuste e influência local são investigadas. Um conjunto de dados reais é analisado de acordo com os métodos propostos
2001
Mário de Castro Andrade Filho
Fortalecimentos de representações de algumas sequências permutáveis
Neste trabalho, consideramos três problemas de caracterização de sequências de variáveis aleatórias (ou vetores) permutáveis. Apresentamos, primeiramente, teoremas do tipo de De Finetti (formas finita e infinita) para algumas distribuições uniformes bivariadas dependentes de um único parâmetro. Estes resultados fornecem uma representação preditivista, no sentido de De Finetti, para os modelos paramétricos bivariados. Na sequência, caracterizamos vetores aleatórios cujas densidades de probabilidade podem ser expressas como função do mínimo e do máximo ou do máximo das somas das componentes. Provamos que independência e específicas condições de simetria caracterizam modelos uniformes conhecidos (discretos e contínuos, univariados e bivariados). Finalmente, introduzimos uma nova versão do modelo de urna de Pólya-Eggenberger, considerando uma distribuição de probabilidade para a composição inicial da urna, isto é, para os números de bolas brancas e pretas inicialmente na urna. Determinamos também quando um processo permutável com valores em {0,1} pode ser bem aproximado por um adequado processo de Pólya com configuração inicial desconhecida
Análise não-paramétrica de dados ordinais com medidas repetidas
Neste trabalho comparamos duas metodologias de análise de dados ordinais coletados em experimenos com medidas repetidas. A primeira considera a atribuição de escores às categorias de resposta e a utilização de modelos paramétricos para comparar as médias destes escores. Esta técnica é amplamente utilizada uma vez que a metodologia de Análise de Variância para Medidas Repetidas na qual se baseia é bastante difundida e vários pacotes estatísticos disponibilizam rotinas de ajuste e análise. No entanto, sua utilização é criticada devido às suposições bastante restritivas dessa classe de modelos, como a continuidade da variável resposta, distribuição normal dos dados e estruturas especiais para as matrizes de covariância. Por essas razões, uma metodologia alternativa, baseada em técnicas não-paramétricas que apresenta suposições menos restritivas é descrita. Esta metodologia utiliza os postos das observações para estudar os efeitos dos fatores na distribuição da variável resposta. Os procedimentos utilizados para investigar as hipóteses de interesse são baseados na distribuição assintótica das estatísticas propostas e a exatidão das aproximações pode ser insatisfatória no caso de experimentos com amostras pequenas. Por intermédio de estudos de simulação, comparamos as taxas de erro Tipo-I e o poder dos testes para as técnicas paramétrica e não-paramétrica, sob planejamentos balanceados. Conclusões similares são obtidas utilizando modelos paramétricos para escores equiespaçados e a estatística tipo-ANOVA para o modelo não-paramétrico. Indicam ainda diferenças nas conclusões da análise paramétrica quando vários sistemas de pontuação para a mesma variável ordinal são utilizados
Comportamento assintótico de estimadores da entropia para cadeias de ordem inifnita com perda de memória exponencial
Nesta tese, apresentaremos resultados sobre as flutuações de dois estimadores da entropia para uma classe de cadeias de ordem infinita. Consideraremos uma cadeia estacionária de ordem infinita, isto é, na qual as probabilidades de transição dependem de todo o passado. Faremos a hipótese habitual em teoria de informação que a cadeia assume valores no alfabeto finito. Duponhamos também que a memória do passado decresce com velocidade exponencial. A partir de uma amostra finita da cadeia, de comprimento n, consideraremos a k-ésima distribuição empírica de um cilindro de comprimento k como sendo a freqüência relativa do cilindro na amostra. Nesta tese, será estudado caso em que esse comprimento k é uma função crescente do comprimento da amostra, isto é, k=k(n). Consideraremos dois estimadores da entropia. O primeiro deles é a k-ésima entropia empírica. Ele é definido como a razão entre a esperança, com respeito á distribuição empírica do logaritmo da probabilidade dos k-cilindros e o próprio comprimento k. O segundo deles é a k-ésima entropia empírica condicionada. Ele é definido considerando-se a esperança, com respeito à distribuição empírica do logaritmo da probabilidade condicional empírica. No capítulo 4 se encontram as condições originais desta tese. Os resultados principais são os Teoremas 4.6.4 e 4.6.5. Demonstramos no Teorema 4.6.4. que a k-ésima entropia empírica condicionada tem flutuações gaussianas em torno da verdadeir entropia do processo. Demonstramos também, no Teorema 4.6.5, que o mesmo não acontece com a entropia empírica de ordem k. Nossos resultados valem se k(n) , 1 sobre 2 log A log n. Esta é uma condição natural, já que log A é majorante da entropia do processo e que, em um contexto de aplicação concreta, a entropia do processo não é conhcida a priori. Os teoremas 4.6.4 e 4.6.5 respondem a uma questão deixada em aberto desde o artigo de Iosifescu (1965). Em particular o Teorema 4.6.5 ) aponta para uma diferença crucial entre cadeias de Markov e cadeias de ordem infinita
Modelos não-lineares com resposta binomial negativa
Técnicas de diagnóstico têm se constituído numa ferramenta muito popular na avaliação de afastamentos sérios das suposições feitas para os modelos de regressão. Uma das técnicas mais modernas, denominada influência local, avalia a robustez dos resultados produzidos pelo modelo contra pequenas perturbações feitas pelo próprio modelo. Essa técnica é investigada neste trabalho em modelos de regressão com resposta binomial negativa. Tais modelos têm sido utilizados quando os modelos com resposta de Poisson mostram-se inadequados. Assumimos, em princípio, uma função de ligação geral com preditor linear, porém com ênfase para os modelos log-lineares. Posteriormente, assumimos que o preditor possui uma forma não-linear nos prâmetros e por último consideramos a inclusão de um parâmetro na função de ligação. Em todos os casos discutimos a estimação e propriedades assintóticas dos estimadores de máxima verossimilhança dos parâmetros de interesse. Desenvolvemos também estudos de Monte Carlo para avaliar a distribuição empírica do resíduo componente de desvio e apresentamos vários modelos
2002
Carolina Fabiana Svetliza