RCAAP Repository
Estimação de modelos ARFIMA com quebra estrutural
Existem evidencias significativas que series macroeconomicas e financeiras mostram uma persistencia consideravel. Mais sera que esta persistencia deve ser modelada por um processo estocastico com raiz unitaria ou um processo estocastico estacionario de memoria longa. Neste trabalho, consideramos a estimacao do parâmetro d dos processos ARFIMA (0,d,0) que apresentam uma quebra estrutural no nivel e/ou variancia O metodo de estimacao utilizado foi o metodo semiparametrico proposto por Geweke -Porter Hudak (1983) e de maxima verossimilhanca. Um estudo simulado mostra as relacoes que existe entre a magnitude do pulo, o tamanho da serie e as estimativas do par^ametro d quando _e ignorada a presenca da quebra estrutural nos processos. A metodologia desenvolvida foi aplicada a conjuntos de dados reais da economia brasileira. Palavras-chave: Longa Dependencia, Modelos ARFIMA, Ponto de Mudanca, Quebra Estrutural.
2022-12-06T15:41:19Z
Mario Ernesto Piscoya Diaz
Estimação do coeficiente de tendência de uma equação diferencial estocática: uma aplicação à estrutura a termo das taxas de juros
Devido a sofisticacao dos produtos financeiros nos anos recentes, os modelos probabilisticos de tempo continuo dados por equacoes diferenciais estocasticas tem merecido a atencao crescente por parte de analistas do mercado financeiro e de academicos. Para superar a limitacao de alguns modelos, e necessario considerar a forma como as taxas de juros se desenvolvem ao longo do tempo. Neste trabalho a estimacao do coeficiente de tendencia dos modelos de Vasicek e de Cox-Ingersoll-Ross e realizada utilizando-se estimadores de maxima verossimilhanca discretizados e de mínimos quadrados ordinarios. Contorna-se a necessidade de se conhecer o valor do coeficiente de difusao e confirma-sea presenca do vício dos estimadores, por se considerar observacoes em tempo discreto para modelos de tempo contínuo. Sao apresentadas comparacoes dos desempenhos dos estimadores variando-se o intervalo de discretizaçao e o tempo de observa¸cao do processo. Os coeficientes de tendencia de ambos os modelos sao estimados pelos dois metodos, obtendo-se a trajetoria esperada das taxas de juros de cinco conjuntos de dados reais.
2022-12-06T15:46:46Z
Regis Queiroz Goncalves
Análise e implementação de redes neurais generalizadas
Esta dissertação propõe o estudo e a análise de modelos de redes neurais generalizadas. Estes modelos agregam a estrutura de verossimilhança dos modelos lineares generalizados e a flexibilidade das redes neurais artificiais na modelagem de interações não-lineares e não-aditivas entre as variáveis preditoras e a variável resposta. O treinamento é realizado segundo o método interativo do gradiente descendente, que procura minimizar a função desvio do modelo. O critério de qualidade do modelo é obtido via validação cruzada. Os resultados preliminares mostram que as redes neurais generalizadas apresentam resultados de previsão de excelente qualidade quando comparadas com os modelos lineares generalizados, de regressão de Cox e com a rede neural normal.
2022-12-06T15:43:20Z
Guilherme Guimaraes Moreira
Detecção de clusters espacias via algoritmo scan multi-objetivo
Situações em que clusters espaciais de doenças não têm um formato regular são muito comuns. Além disso, mapas com múltiplos clusters, que não têm um cluster primário claramente dominante, ocorrem freqüentemente. Nós desenvolvemos um método para analisar maisdetalhadamente os diversos níveis de clusterização que aparecem naturalmente em mapas de doenças divididos em m regiões.A estatística scan espacial é uma medida usual da intensidade de um cluster. Outra medida importante é a regularidade geométrica. O algoritmo genético multi-objetivo foi desenvolvido anteriormente para identificar o formato geométrico dos clusters. Este método realizauma busca para maximizar dois objetivos, a estatistica scan e a regularidade da forma (o conceito de compacidade). A solução encontrada é um conjunto de Pareto, consistindo de todos os clustersencontrados que não são piores que nenhum outro cluster em ambos objetivos simultaneamente. A avaliação da significância é feita paralelamente para todos os cluster através de simulações deMonte Carlo. Este procedimento determina a melhor solução.Ao invés de usarmos o algoritmo genético, nós desenvolvemos um novo método que incorpora a simplicidade do método scan circular, sendo capaz de detectar e avaliar clusters de formato irregulares. Nós definimos a ocupação circular (OC) de uma zona candidata a cluster como a sua população dividida pela população dentro do menor círculo que a contém. O conceito de OC é computacionalmente rápido, utiliza um conceito mais intuitivo, e substitui aqui o conceito de compacidade como outra medida de regularidade de forma. A estatística scan é calculada para cada uma das m regiões do mapa examinado-as individualmente. As regiões são ordenadas decrescentemente de acordo com o valor da estatística scan. Seja R(k) o conjunto contendo as k primeiras regiões. A modificação multi-objetivo do algoritmo scan circular é aplicada sucessivamente para cada conjunto R(k). Em cada círculo, a zona candidata a ser um cluster consiste das regiões pertencentes a R(k) e que estão no círculo. Na prática nós escolhemos somente alguns poucos valores de k tais como m, m/2, m/4,. . .1. Para cada valor de k nós construímos um conjunto de Pareto P(k). Reunimos todos os conjuntos de Pareto em um gráfico e calculamos o cojunto de Pareto Globlal P(0). Um procedimento de Monte Carlo é usado para avaliar a significância dos clusters.A presença de joelhos no conjunto de Pareto indica transições repentinas na estrutura dos clusters, correspondendo a rearranjos devido à coalescência de clusters fracamente ligados (geralmente desconectados). Cada conjunto de Pareto contém os cluster mais prováveis dentro de um certo nível de informação geográfica. Eles são relacionados, refletindo a distribuição dos casos,estrutura de população e vizinhança do mapa. Computacionalmente, o método é somente algumas vezes mais demorado que o scan circular usual.O scan circular multi-objetivo permite enxergar a estrutura de clusters de um mapa. A comparação do conjunto de Pareto de casos observados com aquele calculados sobre a hipótese nula fornece indicações valiosas sobre a ocorrência de clusters espaciais de doenças. O potencial para monitoramento de clusters incipientes e em diversas escalas geográficas simultaneamente o torna uma ferramenta promissora em vigilância sindrômica, especialmente para doenças contagiosas em que existem interações de curto e longo alcance.
Modelo com erros de classificação para a proporção de não- disjunção cromossômica na meiose I
As anomalias cromossomicas numericas ocorrem, geralmente, como eventos esporadicos de não disjuncao na meiose. Uma das tecnicas mais usadas para se analisar as anomalias cromossômicas e a Reacao em Cadeia de Polimerase (PCR) seguida por uma an´alise quantitativa via densitometria laser, na qual o individuo e classificado como tendo 1, 2 ou 3 picos em um loco de microssatelite polimorfico. Foi mostrado em trabalhos anteriores que o numero de indivíduos com 1, 2 ou 3 picos em uma dada amostra, tem distribuicao multinomial cujos parâmetros dependem da fracao de nao-disjuncao. Neste trabalho, propomos um modelo que leva em conta o erro de classificacao que pode ser cometido na coleta dos dados para estimar a proporcao de nao-disjuncao ' na meiose I. Usamos metodos numericos para extrair informações da distribuicao a posteriori de. Os estimadores de Bayes (media e moda a posteriori) dos modelos com e sem erro de classificacao sao comparados atraves de um estudo Monte Carlo, onde analisamos a influencia de diferentes tamanhos amostrais e diferentes probabilidades de ma classificacao nas estimativas. Nos aplicamos o modelo proposto para estimar em pacientes com trissomia no cromossomo 21 e fizemos uma analise de sensibilidade para o modelo. Neste caso usamos o Deviance Information Criterium (DIC) para comparar os modelos com e sem erro de classificacao. Os resultados obtidos mostram que o modelo proposto nao ´e o mais adequado para estimar , o que se justifica pela baixa proporcao estimada de erro de classificação encontrada nos dados analisados.Palavras Chave: Trissomia, distribuicao Multinomial, erro de classificacao, identificabilidade, estimador de Bayes.
Probabilidade de ruína com fluxo de caixa e investimento governados por processos de difusão.
O problema da ruína tem sido amplamente investigado sob diferentes suposições para o processo estocástico que modela as reservas de uma companhia de seguros. O foco desta dissertação consiste em estudar uma das mais importantes partes da matemática atuarial, a qual é reconhecida como Teoria da Ruína, dando ênfase ao cálculo da probabilidade de ruína de uma seguradora com o capital sujeito a investimento a uma taxa de juros constante. Supõe-se que as indenizações pagas pela seguradora têm distribuição do tipo cauda leve, o que na prática significa que nenhuma delas é grande o suficiente para afetar o resultado total significativamente. Este estudo começa com a descrição do modelo de risco sem investimentos fazendo-se, em particular, uma descrição minuciosa do modelo clássico de Cramér-Lundberg, o qual descreve, de maneira simples, a evolução do capital de uma companhia de seguros. Em seguida apresenta-se o modelo de risco com investimento, o qual descreve o capital de uma companhia de seguros que recebe juros de suas reservas a uma taxa constante no tempo. Feito isto, passa-se ao modelo de difusão para a reserva de uma seguradora. Salienta-se que este tópico será visto com um cuidado maior que os demais, sendo analisado em todos os detalhes. Considera-se um processo de risco com investimento das reservas, de forma que o fluxo de caixa e a taxa acumulada de juros são aproximados por processos de difusão com coeficientes dependendo do tempo e do atual saldo financeiro. Estuda-se uma equação diferencial parcial (ordinária) para a probabilidade de ruína em tempo finito (infinito). Nesta dissertação investiga-se o regime de validade desta aproximação comparando a solução numérica da referida equação diferencial parcial com os valores obtidos por simulação das probabilidades de ruína em tempo finito para o modelo de risco com investimento, para diferentes tipos de distribuição das indenizações. Realiza-se também o mesmo tipo de comparação para a probabilidade de ruína em tempo infinito. Neste caso, a solução da equação diferencial ordinária é exata e uma técnica de mudança de medida deve ser realizada a fim de realizar as simulações. Constata-se que a qualidade das aproximações depende dos parâmetros do modelo. Um objeto de estudo para o futuro seria encontrar uma relação entre os parâmetros, a qual defina em quais situações a aproximação por difusão é satisfatória.
2022-12-06T15:44:56Z
Roger William Camara Silva
Métodos clássicos e bayesianos de estimação da janela ótima em núcleo- estimadores
Neste trabalho é discutido o problema de estimação da função densidade de probabilidade através do núcleo-estimador, no caso univariado. São descritas algumas abordagens de núcleo-estimadores e suas propriedades, sob o enfoque de janela fixa e de janela variável.Consequentemente, também foram implementados alguns métodos, clássicos e bayesianos, de estimação da janela ótima. No contexto de janela fixa são abordados apenas métodos clássicos de estimação, mais especificamente metodologias Plug-in (CHIU, 1991;SHEATHER; JONES, 1991), uma vez que não foi encontrado nenhum método bayesiano na literatura de núcleo-estimadores para estimação da janela ótima neste contexto. Sob a óptica de janela variável são apresentados tanto métodos clássicos como métodos bayesianos(BREWER, 2000; GANGOPADHYAY; CHEUNG, 2002). O principal objetivo deste trabalho foi comparar o desempenho de algumas metodologias de estimação da janela ótima presentes na literatura em diferentes abordagens de núcleo-estimadores. Para as comparações foram realizadas diversas simulações para diferentes cenários, observando assim identificar vantagens, desvantagens ou características peculiares de cada metodologia, em termos erro de estimação. Também são apresentados exemplos de aplicação, como intuito de demonstrar o uso das metodologias no contexto prático.
Comparação de metodologias aplicadas à analise de agrupamentos na presença de variáveis categóricas e contínuas
A análise de agrupamentos é um procedimento de estatística multivariada que engloba técnicas que objetivam organizar objetos em grupos de acordo com a proximidade existente entre eles. Os objetos de um mesmo grupo são tão similares quanto possível (coesão interna) e ao mesmo tempo tão dissimilares quanto possível dos objetos dos demais grupos (isolamento externo). Os métodos são compostos de dois elementos: a medida de proximidade e o algoritmo de agrupamento. Apesar da sua vasta aplicabilidade, desde o início do seu desenvolvimento o foco principal tem sido nas situações em que somente variáveis contínuas caracterizam os objetos. Atualmente é grande a necessidade de se considerar também a informação de variáveis categóricas. No entanto, os estudos encontrados na literatura envolvendo esse tipo de variável não comparam os métodos de forma adequada, fazendo com que a diversidade de possibilidades dificulte a escolha da melhor técnica.Nesta dissertação é feito um estudo comparativo de cinco algoritmos de análise de agrupamentos somente na presença de variáveis categóricas e de três metodologias que são aplicáveis para casos de variáveis categóricas e contínuas. Dentre esses, a extensão do método ROCK para o caso de mistura de variáveis é uma proposta desta dissertação. Avaliam-se também outras questões tais como o efeito do grau de separação e sobreposição, do número de grupos, de variáveis e de categorias, a correlação entre as variáveis contínuas e a atribuição de pesos da medida de proximidade combinada, usada quando há os dois tipos de variáveis caracterizando os objetos em análise. A comparação é feita a partir de um esquema de simulação e de estudos de aplicação prática e a medida de desempenho utilizada é a taxa de alocação correta.Pelos resultados obtidos, conclui-se que o aumento do número de grupos, independente da estrutura desses, prejudica o desempenho dos algoritmos. A influência do número de variáveis e de categorias depende da disposição dos grupos. Observou-se também que a correlação existente entre as variáveis contínuas não influenciou as taxas de alocação correta dos métodos e que esse têm melhores resultados quando é dado maior peso às variáveis contínuas na medida de proximidade combinada. Quanto à eficiência, o ROCK foi o algoritmo que se destacou nos estudos de simulação realizados
Filtros de partículas: o algoritmo resample- move
Neste trabalho fornecemos uma breve introdução aos Métodos Seqüenciais de Monte Carlo, abordamos, em particular, um sistema adaptativo conhecido como Filtro de Partículas. Apresentamos o filtro Bootstrap e também uma discussão mais formal do filtro de partículas. São discutidas algumas propriedades teóricas e práticas destes algoritmos.
2022-12-06T15:42:04Z
Ana Flavia Cupertino Pinto
Estimação dos coeficientes de um processo de difusão
Os processos de difusão podem ser usados para a modelagem estocástica com aplicações em física, ciências biológicas, médicas e mais recentemente na economia. Entretanto, todos os modelos envolvem parâmetros desconhecidos ou funções desconhecidas que precisamos estimar utilizando as observações do processo. Em nosso trabalho estudamos uma forma de estimar as funções desconhecidas do modelo não-paramétrico de regressão polinomial local, de acordo com a proposta de Fan e Gijbels (1995). Além disso comparamos o método não-paramétrico com um paramétrico proposto por Cleur e Manfredi (1999) que utiliza a função de máxima verossimilhança. Os resultados obtidos faz com que acreditemos que o método não-paramétrico funciona tão bem quanto o paramétrico para estimular as funções desconhecidas de um modelo de difusão. Para finalizar, aplicamos o método a três conjuntos de dados e estimamos as funções do modelo.
2022-12-06T15:44:23Z
Michelle Ferreira Miranda
Controle on-line de atributos com erros de diagnóstico e classificações repetidas
O procedimento de controle on-line de processos por atributos, denominado controle on-line de Taguchi, consiste em amostrar um item a cada m produzidos e decidir, a cada inspeção, se houve ou não a redução da fração de itens conformes produzidos. Caso o item inspecionado for não conforme, pára-se o processo para ajuste. Como o sistema de inspeção pode estar sujeito a erros de classificação, desenvolve-se um modelo probabilístico que classifica repetidamente o item amostrado até que se observe uma determinada quantidade de classificações conformes (a) ou não conformes (b). O primeiro evento a ocorrer (a conformes ou b não conformes) define a classificação final do item amostrado. Utilizando-se as propriedades de uma cadeia de Markov ergódica, obtém-se uma expressão do custo médio do sistema de controle, que pode ser minimizada por três parâmetros: o intervalo entre inspeções (m); o número de classificações conformes repetidas (a); e o número de classificações não conformes repetidas (b). O resultado ótimo é comparado com duas abordagens alternativas: a primeira consiste de uma simples política preventiva onde ajusta-se o sistema (sem a necessidade de inspeção) a cada n itens produzidos; a segunda diferencia-se em relação ao sistema aqui proposto apenas nas classificações repetidas do item amostrado uma vez que este é classificado um número fixo (r) de vezes. Como resultado observamos que a política aqui proposta é superior ao procedimento que fixa o número de classificações repetidas no item amostrado. Também concluímos que o ajuste preventivo deve ser sempre verificado, pois dependendo da magnitude dos erros de classificação e custos envolvidos, este pode ser uma opção mais econômica em média do que políticas que requerem inspeção. Um exemplo numérico ilustra todo o procedimento proposto.
2022-12-06T15:47:18Z
Neander Ferreira Almeida
Tempo de vida de prateleira de produtos alimentícios levando em conta erros de avaliação
Esta dissertação é uma continuação do trabalho feito por Freitas, M. A.; Borges, W.; Ho, L.L. (2003) onde se propôs o modelo Weibull como subjacente para modelagem do tempo de vida de prateleira de produtos alimentícios com base em avaliações sensoriais. Nesta abordagem o modelo incorpora erros de classificação que possam ser cometidos ao se utilizar os métodos de avaliação sensoriais para determinação da vida de prateleira (shelf life). O estudo utilizou técnicas Bayesianas Foi utilizada a distribuição exponencial para a modelagem do termo de falha (ou tempo de vida de prateleira), como uma primeira abordagem desse problema. O efeito de erro de classificação nos intervalos de credibilidade para percentis de interesse foram estudados através de simulações. Este efeito foi estudado com base em distribuições a priori informativas e não informativas (neste caso, distribuições de Jeffreys). Finalmente, a modelagem foi aplicada aos dados do experimento real realizado no trabalho dos autores anteriormente citados.
2022-12-06T15:45:27Z
Fernando Ferreira Kelles
Detecção de conglomerados espaço-temporais com geometria cilíndrica e não-cilíndrica
A detecção de conglomerados no espaço-tempo tem como objetivo a delimitação de uma região geográfica em determinado tempo na qual a hipótese de ocorrência aleatória de um evento pontual é rejeitada. Tal informação é de extrema relevância em estudos epidemiológicos. Este estudo apresenta dois métodos de detecção de conglomerados espaço-temporais nos quais a estrutura de vizinhança espaço-temporal é definida a partir de um grafo interconectado e agregada ao processo de crescimento e busca de conglomerados. Esse procedimento possibilita a detecção de conglomerados espaço-temporais de geometria arbitrária (não-cilíndrica). Os métodos tradicionais de varredura espaço-temporal se restringem à geometria de busca a conglomerados com geometria cilíndrica, resultando em uma detecção parcial ou superestimação do conglomerado e apresenta alto poder nesse contexto. Uma avaliação do poder de detecção dos métodos abordados neste estudo para conglomerados espaço-temporais com geometria cilíndrica e arbitrária é realizada via dados simulados e reais. Nos dados reais, utilizou-se a ocorrência de casos de câncer cerebral no Novo México e registrado pelo Departamento de Saúde do Novo México no ano de 1973 a 1991. Também utilizou-se a ocorrência de casos reais de Dengue em Vitória, Espírito Santo, registrados pela Vigilância Epidemiológica de Vitória nos meses de janeiro a dezembro de 2006. Restrições durante o processo de crescimento dos conglomerados são sugeridas para evitar tamanho excessivo e geometria muito irregular.
Boas práticas estatísticas em estudos de bioequivalência para o delineamento crossover 2 x 2
Estudos de bioequivalência são exigidos para a liberação de medicamentos genéricos para o mercado. Freqüentemente o delineamento crossover 2x2 é utilizado com a administração a voluntários sadios de duas formulações (T= teste e R= referência). Seguindo um cronograma previamente estabelecido, são coletadas amostras de sangue e determinadas as concentrações do fármaco para gerar as seguintes medidas farmacocinéticas: área sob a curva de concentração plasmática versus tempo (ABC), o pico de concentração plasmática (C Max) e o tempo no qual a concentração máxima foi alcançada (T Max). Para declarar que dois medicamentos são bioequivalentes os intervalos de 90% de confiança para a razão ou diferença das médias tanto para ASC quanto para Cmax devem estar totalmente dentro do intervalo de bioequivalência. Há exigência em termos de Tmax somente quando este for clinicamente relevante. A equipe estatística tem um papel importante em estudos de bioequivalência, tanto no planejamento como na análise dos dados, seguindo uma metodologia especifica. No planejamento destacam-se a determinação do cronograma de coleta e o cálculo do número de voluntários. Na prática aparecem vários problemas, tais como a violação de pressupostos dos métodos estatísticos, além da ocorrência de não-conformidades. Outro questionamento recorrente é se as regras vigentes dos órgãos reguladores são realmente razoáveis, se podem ser flexibilizados ou devem ser adaptadas em certas circunstâncias. Nesse trabalho, várias situações com incidentes que podem ou não ser evitados, foram abordadas através de estudos de simulação de Monte Carlo visando aprofundar o conhecimento sobre o planejamento e a análise dos dados. Foram realizadas dois tipos de estudos: no primeiro foi gerada a medida farmacocinética diretamente e no segundo a curva de concentração individual. Alguns fatores podem prejudicar a conclusão de bioequivalência, tais como, a utilização de um número de voluntários menor que o necessário e a ocorrência de observação atípicas. Em geral, o coeficiente de variação de Cmax tente a ser maior que o de ASC e os percentuais de conclusões de bioequivalencia para Cmax não são superiores aos percentuais para ASC. Um aspecto fundamental do planejamento é o cronograma de coleta. Não existe um cronograma padrão, mas a recomendação é que as características das medidas farmacocinéticas devem ser consideradas. Uma opção interessante é simular possíveis cronogramas e juntamente com as informações sobre o fármaco elaborar o cronograma de coleta. Se os fármacos são realmente bioeuivalentes e o estudo for bem conduzido, espera-se que o resultado seja favorável. Entretanto, na prática não se pode ignorar dois possíveis erros: (i) apesar de haver bioequivalência entre T e R, a conclusão é de não bioequivalência; (ii) T e R são bioequivalentes, mas a conclusão é pela bioequivalência. O primeiro erro é relacionar ao patrocinador e o segundo ao paciente. Como o compromisso de um centro de bioequivalência, e em particular da equipe estatística, é com a verdade e não com interesses do patrocinador do estudo, torna-se fundamental a observância das boas práticas estatísticas, tema deste trabalho.
Estrutura de covariância de modelos espaciais para dados de área
Este trabalho está dividido em três Capítulos. Em todo o trabalho nós utilizamos o mapa dos EUA para facilitar a referência ao trabalho de Wall (2004), que foi o principal motivador deste trabalho. No primeiro Capítulo nós introduzimos os modelos SAR e CAR e fazemos uma análise de dados. Nós consideramos dados de Renda per Capita, Expectativa de vida e Percentual de Graduados nos EUA. O capítulo 2 é um artigo submetido. Nesse Capítulo, nós mostramos mais detalhadamente os resultados não intuitivos. Nós consideramos resultados de álgebra linear e obtemos uma expressão simples e intuitiva para a matriz de covariância que explica os resultados não intuitivos. Nós obtemos termos para aproximações da matriz de covariância e estudamos algumas aproximações para a matriz de covariância. Nós também estudamos o segundo autovalor da matriz de vizinhança utilizada pelos modelos SAR e CAR e sua relação com os termos da expressão obtida para a matriz de covariância. Também estudamos o impacto da conectividade e do tamanho do mapa no segundo autovalor. No Capítulo 3 nós consideramos um modelo espacial Bayesiano para dados gaussianos. Nesse modelo, consideramos um efeito aleatório com distribuição a priori CAR. Obtemos a distribuição a posteriori e uma expressão simples e intuitiva para a matriz de covariância a posteriori dos efeitos aleatórios. Nós avaliamos o impacto da informação a priori em relação a informação dos dados em termos da precisão da priori e da precisão dos dados. Obtemos também a expressão da covariância a distribuição posteriori dos efeitos aleatórios quando a distribuição à priori é CAR intrinsica. Nesse Capítulo, fazemos referência ao Capítulo 2 como um artigo submetido. No Capítulo 4 nós tiramos algumas conclusões e colocamos algumas linhas de pesquisa para trabalhos futuros
2022-12-06T15:47:03Z
Elias Teixeira Krainski
Estudo comparativo de testes de hipóteses multivariados para o vetor de médias via simulação de Monte Carlo.
Os testes de hipótese multivariados são mais apropriados que os testes univariados por considerarem a correlação entre as variáveis (Rencher, 1995). Assim torna-se interessante estudar as propriedades e qualidades destes testes. Nesta dissertação apresenta-se um estudo detalhado de alguns testes para o vetor de médias. Dentre estes, o teste mais conhecido e utilizado na literatura, que é o T2 de Hotelling fundamentado na matriz de covariâncias teórica ou amostral, será comparado com os testes de Hayter e Tsui (1994), T2 de Hotelling usando a matriz de diferenças sucessivas proposto em Holmes e Mergen (1993) e por último o teste stepwise de Mudholkar e Srivastava (2000b), que segundo os autores, apresenta ótimas propriedades em relação à falta de normalidade multivariada dos dados quando estes são gerados por distribuições simétricas. Além disso, serão ilustrados alguns exemplos na área de controle estatístico de processos, dado a vasta aplicação nessa área desses testes para comparação de vetores de médias. Os testes estatísticos multivariados mencionados foram comparados em termos de tamanho, do poder e do valor de ARL (Average Run Lenght), considerando-se diferentes cenário simulados com diversos tamanhos de amostra e número de variáveis com distribuição normal e não normal multivariada. Pelo extensivo estudo de simulações de Monte Carlo feito nesta dissertação, verificou-se que os testes de Hayter e Tsui (1994) e de Holmes e Mergen (1993) possuem bom desempenho, sendo similares ao teste T² de Hotelling em algumas situações e melhor que este em outras. Em relação ao teste de Mudholkar e Srivastava (2000b) observou-se que, em situações de correlação entre as variáveis e dados normais, este não é tão poderoso como os demais. No entanto, é mais robusto que o teste T² de Hotelling em relação a não normalidade dos dados para dados multivariados com distribuições simétricas. Os resultados demonstram que o teste de Mudholkar e Srivastava não é um bom competidor aos testes de Hayter e Tsui e T² de Hotelling para ser utilizado em controle de qualidade no caso de dados normais. Outras particularidades desse teste são também apresentadas na dissertação.
2022-12-06T15:47:34Z
Fernanda Karine Ruiz Colenghi
Modelos espaço-temporais: estudo de caso
Os dados provenientes de diversas áreas tais como ciência ambientais, biologia, epidemiologia, agricultura, sociologia etc. são caracterizados pela variabilidade no espaço e no tempos. Os procedimentos de estatística, freqüentemente, não consideram a interação entre as dimensões espacial e temporal, e nos últimos anos tem ocorrido um aumento crescente no desenvolvimento de técnicas para a análise de processos desta natureza devido principalmente, a grande aplicabilidade dos modelos espaço-temporais. O objetivo da análise de processos espaço-temporais, na maioria dos casos, resume-se na predição de observações em localizações e/ou tempos não amostrados. Segundo Schabenberger e Gotwwway (2005) há uma carência de softwares que lidam com dados no espaço e no tempo conjuntamente a maioria dos estudos da áreas utiliza-se de dados relacionados a fenômenos ambientais. Nesta dissertação implementamos computacionalmente alguns modelos muito citados na literatura como de Host et al.(1995), o de Kyriakidis e Journel (1999 )e as funções de covariância proposta por Gneiting (2002). Alem disso, implementamos o modelo espacial de séries temporais proposto por Niou et al. (2003) e uma nova estratégia de análise de dados combinando essa metodologia com a de Host et al. (1995). Todos esses modelos foram ajustados a dados reais provenientes de áreas distintas sendo a qualidade do ajuste avaliada a partir das predições de observações no espaço e/ou no tempo. Para os conjuntos de dados considerados observamos que a adequação dos modelos está relacionada com a variação dos dados no espaço e no tempo, ou seja, os erros de predição são menores em localizações onde os vizinhos têm um comportamento especialmente semelhante da característica de interesse e, além disso nos pontos nos quais a série temporal não sofre variações bruscas ao longo do tempo. Geostatística, Modelos espaço-temporais, predição, estudo de casos.
2022-12-06T15:46:46Z
Bruna de Castro Dias Bicalho
Análise estatística de processos pontuais bivariados ligados
Este trabalho considera uma nova classe especial de processos pontuais espaciais marcados, os processos pontuais bivariados ligados. Para cada evento de um padrão pontual N1 existem um ou mais eventos correspondentes em outro padrão pontual N2 , observando na mesma região geográfica. Pares de eventos de origem-destino são os exemplos mais comuns para esse tipo de dados. Um teste de correlação espacial entre os dois padrões pontuais é desenvolvido e, a partir de uma proposta simplificadora, alguns resultados úteis foram obtidos. Sugerimos um modelo de Gibbs para estes processos pontuais bivariados ligados, derivamos algumas estatísticas descritivas das propriedades do modelo e, em seguida, apresentamos métodos para simular, testar e estimar tais processos. Desenvolvemos uma ferramenta de análise exploratória gráfica -MaPPEA- para a visualização dos gráficos ligados dinâmicos apresentados. Esta ferramenta foi desenvolvida em C ++ com uma interface gráfica para auxiliar o usuário na análise estatística dos dados. A partir do "brushing" de janelas linkadas, MaPPEA fornece uma ilustração da estrutura e relações entre marcas e coordenadas de padrões pontuais. As principais funções incluídas neste software são a função de distribuição das marcas e a superfície de intensidade condicional das posições de destino correspondente a uma posição de origem selecionada, ambas mudando dinamicamente. Os métodos são ilustrados com dados de furto de veículos e a eventuais recuperações dos mesmos, bem como com dados de posições de árvores e suas marcas correspondentes.
Ensaios de degradação destrutivos: aplicação em tempo de vida de prateleira
A intensa competição das industrias por uma maior participação no mercado, aliada a crescente expectativa dos consumidores, tem pressionado os fabricantes a produzirem produtos de alta qualidade. a industria alimentícia esse panorama no e diferente. A competição entre as empresas pelo aumento da fatia de mercado, a intensificação de órgãos sociais de inspeção, bem como o apreço dos consumidores pela qualidade dos alimentos, contribuem para acelerar o processo de melhoria da qualidade neste ramo. Produtos alimentícios estão sujeitos a perda de nutrientes, oxidação, corrosão da embalagem, altercasses no odor, sabor, aparência geral, etc. Tecnologia e engenheiros de alimentos utilizam o termo vida de prateleira (shelf life) para referirem-se ao período de tempo compreendido entre a manufatura e o consumo de um produto alimentício no varejo, durante o qual ele tem qualidade satisfatória, em termos de seu valor nutricional, características relacionadas a saúde do consumidor (grau de deterioração, culturas, oxida cão, etc.) e, finalmente, em termos de aspectos sensoriais (odor, sabor, textura, cor, etc.)(IFT, 1974).A vida de prateleira e determinada pelo fabricante, sendo diferente para cada tipode alimento. Esta informação e um fator essencial para determinação das condições e métodos utilizados na distribuição do produto.Desta forma, estudos para estimação do tempo de vida de prateleira são parte essencial de todo programa de desenvolvimento, manutenção e melhoria da qualidade de produtos alimentícios. Estes estudos são baseados em avaliações sensoriais e não-sensoriais.Neste trabalho, apresentaremos uma abordagem - baseada em modelos de degradação para ensaios destrutivos - para analise de dados oriundos de testes sensoriais.
2022-12-06T15:44:56Z
Rosilaine de Menezes Vianei
Testes para quebras estruturais em modelos não-lineares
Grande parte das pesquisas empíricas e teóricas para detectar mudanças nos parâmetros em modelos não-lineares vem sendo acumuladas durante as últimas duas décadas. Diante disso, ainda não existe um consenso sobre o melhor teste estatístico para a detecção de quebras estruturais. O objetivo deste trabalho é fazer um estudo sobre os principais testes da família CUSUM para detectar pontos de mudanças nos parâmetros e comparar as suas taxas de rejeições. A investigação procedeu-se por meio de simulações de Monte Carlo na família de processos Auto-Regressivos Condicionalmente Heterocedásticos, ARCH. O estudo indica a robustez de cada teste sob mudanças dos parâmetros na suposição da variância incondicional ser pouco alterada. Palavras-chave: Pontos de mudanças, ARCH e CUSUM. Sim
2022-12-06T15:48:19Z
Edimeire Alexandra Pinto