Global RCAAP Repository | PISTA Digital

Planejamento de experimentos com várias replicações em paralelo em grades computacionais

Este trabalho de mestrado apresenta um estudo de Grades Computacionais e Simulações Distribuídas sobre a técnica MRIP. A partir deste estudo foi possível propor e implementar o protótipo de uma ferramenta para Gerenciamento de Experimento em Ambiente de Grade, denominada Grid Experiments Manager - GEM, organizada de forma modular podendo ser usada como um programa ou integrada com outro software, podendo ser expansível para vários middlewares de Grades Computacionais. Com a implementação também foi possível avaliar o desempenho de simulações sequenciais com aquelas executadas em cluster e em uma Grade Computacional de teste, sendo construído um benchmark que possibilitou repetir a mesma carga de trabalho para os sistemas sobre avaliação. Com os testes foi possível verificar um ganho alto no tempo de execução, quando comparadas as execuções sequenciais e em cluster, obteve-se eficiência em torno de 197% para simulações com tempo de execução baixo e 239% para aquelas com tempo de execução maior; na comparação das execuções em cluster e em grade, obteve-se os valores para eficiência de 98% e 105%, para simulações pequenas e grandes, respectivamente

2010

https://doi.org/10.11606/D.55.2010.tde-18082010-112815

Lourenço Alves Pereira Júnior

Uma contribuição para a melhoria colaborativa e distribuída de processos de software

A área de melhoria de processos de software (MPS) tem sido investigada sistematicamente, dadas as evidências de que a qualidade do processo pode influenciar significativamente na qualidade do produto final. Modelos e guias com boas práticas para a MPS têm sido sintetizados. Ainda assim, a literatura carece de trabalhos que estabeleçam estratégias de como implementar as boas práticas sugeridas por tais modelos e guias na indústria. Em paralelo, o desenvolvimento distribuído de software (DDS) tornou-se uma realidade, aumentando a complexidade e a importância do processo de desenvolvimento de software e demandando estratégias que permitam uma MPS também distribuída. O objetivo deste trabalho é investigar estratégias e mecanismos que possam promover uma MPS distribuída e colaborativa. A ColabSPI, uma estratégia colaborativa e distribuída para MPS, é proposta para apoiar a evolução estruturada do processo; o tratamento de propostas de melhorias de processo; e a comunicação e participação dos desenvolvedores na MPS. Durante a investigação, fatores que podem influenciar a MPS foram identificados e a relação entre eles foi mapeada, tanto a partir da literatura quanto a partir de um estudo em campo. Dois contextos foram explorados durante a investigação: (i) a MPS em uma organização de grande porte, com unidades distribuídas; e (ii) a MPS no desenvolvimento de software livre (SL). Contribuições para a MPS no desenvolvimento de SL foram geradas no contexto do projeto internacional Qualipso, com a co-autoria do Qualipso Open Source Maturity Model (OMM) e a adequação de ColabSPI para evoluir o OMM. Em ambiente industrial, estudos experimentais foram conduzidos para validar a aplicação de ColabSPI e revelaram que algumas práticas do desenvolvimento de software, inclusive do DDS e do desenvolvimento de SL, podem ser aplicadas com sucesso à MPS, trazendo ganhos de eficácia e eficiência para a melhoria de um processo de desenvolvimento de software. A estratégia proposta está sendo base também para a definição do ambiente de MPS do processo Demoiselle, um processo livre para desenvolvimento de software

2010

https://doi.org/10.11606/T.55.2010.tde-18082010-143052

Viviane Dias Malheiros de Pinho

Um método para previsão de sobrecarga transiente em sistemas computacionais por meio de modelos dinâmicos obtidos empiricamente

Este trabalho apresenta um método empírico para previsão de sobrecargas transientes em sistemas computacionais por meio de modelagem dinâmica. A técnica, baseada em aproximações lineares e invariantes no tempo, tem como objetivo identificar a capacidade de um sistema computacional absorver variações na carga de trabalho. Experimentalmente, a identificação dessa capacidade do sistema pode ser feita por meio de técnicas de avaliação de desempenho, em que a abordagem prevalente é a estimação da capacidade estática em regime estacionário de operação, observando-se o desempenho sob demanda constante. Entretanto, essa avaliação não considera o regime transiente do sistema, i.e durante o período de restabelecimento ao regime estacionário após uma perturbação, e durante o qual, o esforço exigido pode ser bastante diverso, e potencialmente acima daquele apurado sob condições de regime estacionário. A proposta deste trabalho é a formulação de uma metodologia para avaliação de desempenho em regime transiente em sistemas computacionais sob carga de trabalho variável e que forneça informação para o dimensionamento de recursos e políticas de controle de admissão que evitem sobrecargas por efeitos transitórios. A metodologia baseia-se na parametrização de um modelo dinâmico a partir de ensaios experimentais, considerando perturbações bruscas e de longa duração, e os resultados são avaliados por comparação das predições do modelo em relação aos objetivos por simulação ou aferição.

2014

https://doi.org/10.11606/D.55.2014.tde-18082015-084441

Helder Jefferson Ferreira da Luz

Sistema de visão baseado em redes neurais artificiais para o controle de robôs móveis

Sistemas de visão computacional (SVCs) são interessantes ferramentas para a navegação de robôs. Este trabalho propõe um SVC baseado em redes neurais multi-camadas para o controle de um robô móvel. Dois módulos principais compõe o SVC: módulo de visão e módulo de controle de navegação. O primeiro é dividido em três partes:pré-processamento, segmentação e reconhecimento das imagens. este módulo processa as imagens (obtidas por uma câmera) que podem conter diversos com cores diferentes, retornando a posição ou a forma e a posição de um dos objetos, o qual corresponde a cor especificada. O processamento das imagens é realizada por redes neurais multi-camadas. O módulo de controle é responsável por validar os resultados do módulo de visão e conduzir o robô utilizando os dados provenientes do módulo de visão. O objetivo do sistema proposto é capacitar um robô a realizar as tarefas: seguir um objeto de cor determinada, seguir um objeto de cor e forma determinada ou ainda navegar pelo ambiente seguindo um objeto de cor determinada evitando obstáculos. Vários experimentos são apresentados, em um ambiente real, utilizando o robô. Pioneer I, para mostrar as vantagens e desvantagens do sistema proposto.

2004

https://doi.org/10.11606/D.55.2016.tde-18082016-155035

Marcos Gonçalves Quiles

Desenvolvimento de um método numérico para resolver escoamentos viscoelásticos: Modelo de Maxwell

Neste trabalho é desenvolvido um método numérico para resolver escoamentos viscoelásticos com superfícies livres. As equações governantes para escoamentos governados pelo modelo de Maxwell juntamente com as condições de contorno para escoamentos bidimensionais usando coordenadas cartesianas são apresentadas. As equações são resolvidas utilizando o método de diferenças finitas numa malha deslocada. Também, é desenvolvida uma formulação para o cálculo do tensor não-Newtoniano em contornos rígidos. As condições de contorno na superfície livre são discutidas em detalhes. Resultados numéricos mostrando a convergência do método numérico desenvolvido nesse trabalho são apresentados. Finalmente, são apresentados resultados numéricos que mostram que a técnica numérica empregada nesse trabalho é capaz de simular escoamentos viscoelásticos governados pelo modelo de Maxwell. Em particular, os seguintes problemas são simulados: jato oscilante, inchamento do extrudado e uma gota de fluido viscoelástico incidindo sobre uma superfície rígida.

2004

https://doi.org/10.11606/D.55.2016.tde-18082016-155706

Dayene Miralha de Carvalho

Label operation for multi-label learning

Classification tasks in which instances are associated with multiple concepts are known as multilabel classification. They have attracted growing attention in the machine-learning community, given the high number of applications and multi-labeled data available nowadays. Consequently, many strategies have been proposed exploring different particularities, such as label imbalance, dimensionality reduction and labels dependence. Despite that, some aspects that may affect strategies as a whole have been overlooked. For instance, some strategies transform the original multi-labeled data into single-labeled data upon which a base algorithm can be applied. However, the impact of choosing a specific base algorithm against another is unknown and usually ignored. Moreover, it was observed that many labels are never correctly predicted regardless of the strategies used. So far, very little attention has been paid to theses issues, which may produce misleading results. Therefore, this thesis aims to investigate the multi-label strategies covering these particularities. For such, an extensive comparative study is performed focusing on the influence of the base algorithms on the results. Moreover, label operation is proposed as an optimization procedure able to reduce the number of labels never predicted. Through an empirical methodology, label expansion and reduction enhanced different evaluation measures, mitigating the label prediction problem, although it was not completely removed. Additionally, metalearning is used to reduce the complexity of the operations and to provide some understanding concerning the studied issue. Considering this, characterization measures for meta-learning were systematically investigated, which resulted in a new taxonomy to organize them. In summary, the findings and contributions presented here are relevant to the multi-label and meta-learning research fields. They potentially have an impact on the methodology, and raise open new questions concerning unnoticed aspects of these areas.

2020

https://doi.org/10.11606/T.55.2020.tde-18082020-161950

Adriano Rivolli da Silva

Classificação automática de questões baseada em competências: ENEM - Estudo de caso

Introdução: A grande quantidade de informação digital em formato textual existente na internet transforma em atividades essenciais a organização, análise e extração de conhecimento, tanto no universo acadêmico quanto no mercado de trabalho e, com isso, a classificação automática de textos vêm ganhando cada vez mais destaque. A classificação de questões é um subgrupo da classificação de textos e consiste, basicamente, da associação de um ou mais rótulos a cada questão, de acordo com um critério pré-determinado, mas com menos texto disponível que os documentos em geral. As principais aplicações dos sistemas de classificação automática de questões são: QA (Question/Answering), IR (Information Retrieval), Ambiente educacional e tratamento de linguagens específicas. Os sistemas de QA e RI têm como ponto de partida uma pergunta escrita em linguagem natural e, a partir daí, buscam uma coleção de documentos na Web que sejam compatíveis com o assunto descrito. Considerando especificamente o ambiente educacional, a geração automática de testes de avaliação tem aplicação prática imediata nos sistemas de e-learning por viabilizar a personalização do ensino através da busca de questões adequadas a um determinado perfil de aprendizado, os chamados sistemas de ensino adaptativo. Para viabilizar a personalização, é essencial classificar as questões dentro de uma variedade representativa de competências e habilidades. As avaliações em larga escala (ENEM, SAEB, Prova Brasil) podem ser uma fonte de informação para essa geração, pois utilizam Matrizes de Referência de Avaliação (MRA) para classificar as questões de acordo com as áreas do conhecimento, disciplinas, competências e habilidades esperadas dos estudantes. Uma forma de realizar esta classificação é através de algoritmos de Aprendizado de Máquina, capazes de extrair padrões ou generalizar classes através de geração de modelos matemáticos a partir dos dados disponíveis. São exemplos de algoritmos de Aprendizado de Máquina: redes neurais, árvores de decisão, máquinas de vetor de suporte SVM, naive bayes, KNN, entre outros. As diferentes formas de representação de texto para algoritmos de Aprendizado de Máquina possuem vasta pesquisa realizada quando se trata da classificação de documentos com grandes quantidades de texto; quando se trata de pequenos trechos (caso das questões), essa tarefa se torna mais complexa pois a quantidade de texto disponível para análise é reduzida em comparação aos outros tipos de documentos textuais. Além disso, a imensa maioria das pesquisas atuais se voltam para o problema de QA ou IR e há pouca pesquisa disponível considerando o ambiente educacional. Objetivos: (i) Identificar a arquitetura de um classificador ou conjunto de classificadores de forma a maximizar o desempenho do processo de classificação de questões no contexto educacional; (ii) realizar uma avaliação empírica para comparar o desempenho das diferentes combinações utilizadas; (iii) disponibilizar as representações, algoritmos, códigos-fonte e ferramentas desenvolvidos para a comunidade científica avaliar e replicar resultados e (iv) disponibilizar ferramentas de integração e aplicação dos conteúdos desenvolvidos para utilização por outras plataformas e instituições (escolas, empresas) interessadas em utilizar as competências do ENEM para realizar diagnósticos e acompanhamento de aprendizagem. Método: Estudo de caso com base em cerca de 25 mil questões pré-processadas retiradas de avaliações do ENEM até 2017 e classificadas por especialistas em educação dentro das disciplinas, competências e habilidades contidas na matriz de avaliação. A partir disso, foram realizados experimentos com classificadores gerados pelas diferentes combinações de representações de texto, cálculos de peso dos termos e algoritmos de Aprendizado de Máquina supervisionados produzindo, ao final, um comparativo com os indicadores de desempenho. Resultados: (i) modelo geral para construção de classificadores automáticos de questões voltadas a avaliações em larga escala; (ii) identificação do estado da arte na classificação de questões para contexto educacional e avaliações em larga escala; (iii) estado da arte nos resultados de classificação de questões em redes no contexto educacional; (iv) efetividade do método IQF *QF * ICF para o cálculo de pesos/frequências na classificação de questões; (v) banco de dados constantemente atualizável composto de questões classificadas e representativas do ENEM e suas competências; (vi) API para integração com outras plataformas das funcionalidades e (vii) análise de desempenho com comparativo dos indicadores gerados pelos classificadores de questões. Conclusões: Com base nos resultados obtidos, a combinação da representação de textos no modelo espaço-vetorial, técnica IQF * QF * ICF e o algoritmo KNN, se mostrou a melhor arquitetura para o classificador de questões do ENEM com desempenho geral médio em torno de 80% de acurácia. Destacam-se como principais contribuições: i) apoio às plataformas de ensino adaptativo; ii) ferramentas de classificação para as editoras de material didático; iii) apoio a professores e equipes pedagógicas na elaboração de avaliações diagnósticas contínuas sobre as facilidades e dificuldades de seus alunos. Relativamente aos trabalhos futuros, pretende-se gerar classificadores específicos para os exames Prova Brasil e SAEB, integrar a solução com um LMS de código aberto (Moodle, por exemplo) e desenvolver um algoritmo para conversão das questões do ENEM em imagens para classificação via rede neural convolucional.

2020

https://doi.org/10.11606/T.55.2020.tde-18082020-163540

Valtemir de Alencar e Silva

An approach to the sequential evaluation of emotional behaviors of depressive users on social networks in groups and individually

The constant growth in the use and sharing of data on social networks has provided opportunities to develop intelligent solutions for understanding different dimensions of human behavior online since users share social aspects, feelings, and opinions daily. In this way, several studies in Affective Computing have been conducted to recognize and predict emotional and indicative aspects of mental problems through the mining of complex data, such as texts, images, videos, and emoticons, available in social network posts. Depression is a common and growing health problem globally and is considered the third largest cause of incapacity for work, and the leading cause of emergency in health centers is characterized by the manifestation of a set of symptoms for at least two weeks. Symptoms can be compounded by profound sadness, guilt, loss of pleasure and mixed and atypical characteristics, which may be correlated to contexts and severely impact various social aspects. Although it is necessary to observe emotional characteristics over time, as it is known in the literature, studies have focused on classifying whether a given post is depressive and have not addressed the temporal recognition of mood manifestations and aspects of personality context. This Thesis aimed to answer \"how to recognize temporal patterns of behavior of depressive users in online social networks?\" In this way, an approach for the temporal recognition of behavioral patterns of depressed users on social networks is presented, composed of two methodologies that allow (i) the temporal evaluation of the behavioral patterns of user interactions in groups combining modeling and metrics of complex networks and recognition of emotions and feelings, and (i) sequential recognition of the patterns of behavior of individual depressive users, through the mining of frequent patterns of emotional and contextual characteristics. Information from posts and comments was used in both methodologies, composed of texts and emoticons present in the users timeline. Through complex network measures and frequent pattern recognition, the approach was evaluated, indicating to recognize strong patterns of interactional, emotional, and contextual behaviors online over time, which serve as indicative for human behavior specialists and are based on evidence in the literature.

2021

https://doi.org/10.11606/T.55.2021.tde-18082021-093843

Felipe Taliar Giuntini

Computational approaches for the discovery of significant genes in cancer

Cancer is a complex disease caused by the accumulation of genetic alterations during the individuals life. These alterations are named genetic mutations, which may be divided into two groups: 1) Passenger mutations: mutations that do not change the behavior of the cell; 2) Driver mutations: significant mutations for cancer, that cause carcinogenesis. Cancer cells have a large number of mutations, in which the large majority of them are passenger, and few mutations are drivers. The identification of significant mutated genes, i.e., genes with driver mutations, is essential for the understanding of the mechanisms of cancer initiation and progression. Such a task is a key challenge in cancer genomics, since several studies have shown many significant genes are mutated at a very low frequency. With the next generation DNA sequencing, large and complex genomic datasets have been generated, creating the challenge of analyzing and interpreting this data. Towards uncovering infrequently mutated genes, gene interaction networks combined with mutation data have been explored. This research presents computational approaches for the discovery of reliable significant cancer genes. Such a genes are prioritized by a network-based method which combines weighted mutation frequency and network neighbors influence, and possible false-positives are detected by machine learning-based method which uses mutation data and gene interaction networks to induce predictive models. An experimental study conducted with six types of cancer revealed the potential of the approaches on the discovering of known and possible novel reliable significant cancer genes.

2021

https://doi.org/10.11606/T.55.2021.tde-18082021-100555

Jorge Francisco Cutigi

Mineração de regras de associação em dados georreferenciados

Sistemas de informações geográficas permitem armazenar, manipular e armazenar, manipular e analisar dados espaciais e aspectos descritivos desses dados. A análise de dados espaciais pode ser realizada por meio de técnicas de extração de regras de associação, ou seja, regras que descrevem relacionamentos entre os dados. Porém, a mineração de regras de associação não considera as relações topológicas existentes entre dados georreferenciados. Para solucionar esse problema, Koperski and Han (1995) e Malerba et al. (2001) propuseram um processo de extração de regras integrado ao algoritmo de mineração e utilizavam predicados lógicos para representar as regras. Como alternativa a essa solução, este trabalho propõe pré-processar os dados referenciados para encontrar relações topológicas em separado e aplicar um algoritmo de mineração de regras de associação disponí?vel pela comunidade acadêmica. As regras geradas devem apresentar características descritivas dos dados e relações topológicas. Para atingir esse objetivo foi especificado um processo de extração de regras em dados georreferenciados e implementado um módulo de pré-processamento que extrai relações topológicas. O módulo foi avaliado por meio de um estudo de caso utilizando o sistema de informação geográfica da cidade de Jaboticabal, no contexto de planejamento urbano. As regras encontradas foram analisadas por um especialista utilizando as medidas de suporte e confiança. Além disso, uma análise sobre o tempo de processamento e consumo de memória para encontrar as relações topológicas foi realizada, mostrando que é possível extrair padrões utilizando o processo e o módulo proposto neste trabalho.

2006

https://doi.org/10.11606/D.55.2006.tde-18092006-104657

Marina Abichabki Pivato

Escalonamento em grids computacionais: estudo de caso

Esta dissertação tem por objetivo apresentar a proposta de uma política de escalonamento para grids computacionais. Essa política, intitulada Dynamic Max-Min2x, é orientada ao escalonamento de aplicações cujas tarefas não realizam comunicação entre si e visa a redução do tempo de resposta dessas aplicações através da utilização de atribuição dinâmica de tarefas e replicação das mesmas. Experimentos, feitos através de simulação, mostram que o tempo médio de resposta de aplicações utilizando-se a Dynamic Max-Min2x é inferior ao de outras políticas da literatura. Análises dos resultados desses experimentos apontam que esse tempo tende a ser mais atrativo principalmente quando as tarefas necessitam de muito processamento e quando há grande variação de carga no sistema, caracteristicas comuns em grids computacionais. Além disso, esta dissertação apresenta a implementação de um framework utilizando-se o Globus Toolkit, onde é possível a inserção de políticas de escalonamento para a submissão inteligente de tarefas em um grid computacional.

2005

https://doi.org/10.11606/D.55.2005.tde-18092006-115903

Valéria Quadros dos Reis

Avaliação de índices de carga de memória em sistemas computacionais distribuídos

Este trabalho apresenta uma análise de comportamento de índices de carga relacionados ao uso e à atividade de memória. São descritos 11 índices que refletem direta ou indiretamente a carga de memória. Esses índices podem ser obtidos facilmente no sistema peracional GNU/Linux através do sistema de arquivos /proc. Uma ferramenta de monitoramento foi criada para facilitar a análise de comportamento, podendo também servir para fornecer informações de carga para políticas de escalonamento. Os valores de cada índice foram monitorados durante a execução de uma carga de trabalho composta por aplicações reais que utilizam altas quantidades de memória. A partir dos resultados é possível descobrir a utilidade de cada índice, indicando como eles podem ser usados para auxiliar políticas de escalonamento a avaliar a carga de memória de uma máquina. Métricas de avaliação de carga originárias da combinação de mais de um índice são descritas. Essas métricas foram criadas em casos em que a combinação de mais de um índice permitia representar a carga de memória com mais precisão do que índices usados isoladamente. As métricas e índices pesquisados proporcionam formas precisas de representar a carga de memória em vários níveis, desde níveis de baixa utilização até níveis de saturação da memória principal com sintomas de ocorrência de thrashing.

2006

https://doi.org/10.11606/D.55.2006.tde-18092006-154843

William Voorsluys

Modelos flexíveis para dados de tempos de vida em um cenário de riscos competitivos e mecanismos de ativação latentes

Na literatura da área da análise de sobrevivência existem os modelos tradicionais, ou sem fração de cura, e os modelos de longa duração, ou com fração de cura. Recentemente tem sido proposto um modelo mais geral, conhecido como o modelo com fatores de risco latentes com esquemas de ativação. Nesta tese são deduzidas novas propriedades que possuem a função de sobrevivência, a função de taxa de risco e o valor esperado, quando e considerado o modelo com fatores de risco latentes. Estas propriedades são importantes, já que muitos outros modelos que tem aparecido na literatura recentemente podem ser considerados como casos particulares do modelo com fatores de risco latentes. Além disto, são propostos novos modelos de sobrevivência e estes são aplicados a conjuntos de dados reais. Também é realizado um estudo de simulação e uma análise de sensibilidade, para mostrar a qualidade destes modelos

2014

https://doi.org/10.11606/T.55.2014.tde-18092014-163743

José Julio Flores Delgado

Consolidation problems in freight transportation systems: mathematical models and algorithms

Freight distribution systems are under stress. With the world population growing, the migration of people to urban areas and technologies that allow purchases from virtually anywhere, efficient freight distribution can be challenging. An inefficient movement of goods may lead to business not being economically viable and also has social and environmental negative effects. An important strategy to be incorporated in freight distribution systems is the consolidation of goods, i.e., group goods by their destination. This strategy increases vehicles utilisation, reducing the number of vehicles and the number of trips required for the distribution and, consequently, costs, traffic, noise and air pollution. In this thesis, we explore consolidation in three different contexts (or cases) from an optimisation point of view. Each context is related to optimisation problems for which we developed mathematical programming models and solution methods. The first case in which we explore consolidation is in container loading problems (CLPs). CLPs are a class of packing problems which aims at positioning three-dimensional boxes inside a container efficiently. The literature has incorporated many practical aspects into container loading solution method (e.g. restricting orientation of boxes, stability and weight distribution). However, to the best of our knowledge, the case considering more dynamic systems (e.g. cross-docking) in which goods might have a schedule of arrival were yet to be contemplated by the literature. We define an extension of CLP which we call Container Loading Problem with Time Availability Constraints (CLPTAC), which considers boxes are not always available for loading. We propose an extension of a CLP model that is suitable for CLPTAC and solution methods which can also handle cases with uncertainty in the schedule of the arrival of the boxes. The second case is a more broad view of the network, considering an open vehicle routing problem with cross-dock selection. The traditional vehicle routing problem has been fairly studied. Its open version (i.e. with routes that start and end at different points) has not received the same attention. We propose a version of the open vehicle routing problem in which some nodes of the network are consolidation centres. Instead of shippers sending goods directly to their consumers, they must send to one of the available consolidation centres, then, goods are resorted and forwarded to their destination. For this problem, we propose a mixed integer linear programming model for cost minimisation and a solution method based on the Benders decomposition framework. A third case in which we explored consolidation is in collaborative logistics. Particularly, we focus on the shared use of the currently available infrastructure. We defined a hub selection problem in which one of the suppliers is selected as a hub. In a hub facility, other suppliers might meet to exchange their goods allowing one supplier to satisfy the demand from others. For this problem, we propose a mixed integer linear programming model and a heuristic based on the model. Moreover, we compared a traditional distribution strategy, with each supplier handling its demand, against the collaborative one. In this thesis, we explore these three cases which are related to consolidation for improving the efficiency in freight distribution systems. We extend some problems (e.g. versions of CLP) to apply them to a more dynamic setting and we also define optimisation problems for networks with consolidation centres. Furthermore, we propose solution methods for each of the defined problems and evaluate them using randomly generated instances, benchmarks from the literature and some cases based on real-world characteristics.

2019

https://doi.org/10.11606/T.55.2019.tde-18092019-162716

Pedro Belin Castellucci

Ensembles na classificação relacional

Em diversos domínios, além das informações sobre os objetos ou entidades que os compõem, existem, também, informaçõoes a respeito das relações entre esses objetos. Alguns desses domínios são, por exemplo, as redes de co-autoria, e as páginas Web. Nesse sentido, é natural procurar por técnicas de classificação que levem em conta estas informações. Dentre essas técnicas estão as denominadas classificação baseada em grafos, que visam classificar os exemplos levando em conta as relações existentes entre eles. Este trabalho aborda o desenvolvimento de métodos para melhorar o desempenho de classificadores baseados em grafos utilizando estratégias de ensembles. Um classificador ensemble considera um conjunto de classificadores cujas predições individuais são combinadas de alguma forma. Este classificador normalmente apresenta um melhor desempenho do que seus classificadores individualmente. Assim, foram desenvolvidas três técnicas: a primeira para dados originalmente no formato proposicional e transformados para formato relacional baseado em grafo e a segunda e terceira para dados originalmente já no formato de grafo. A primeira técnica, inspirada no algoritmo de boosting, originou o algoritmo KNN Adaptativo Baseado em Grafos (A-KNN). A segunda ténica, inspirada no algoritmo de Bagging originou trê abordagens de Bagging Baseado em Grafos (BG). Finalmente, a terceira técnica, inspirada no algoritmo de Cross-Validated Committees, originou o Cross-Validated Committees Baseado em Grafos (CVCG). Os experimentos foram realizados em 38 conjuntos de dados, sendo 22 conjuntos proposicionais e 16 conjuntos no formato relacional. Na avaliação foi utilizado o esquema de 10-fold stratified cross-validation e para determinar diferenças estatísticas entre classificadores foi utilizado o método proposto por Demsar (2006). Em relação aos resultados, as três técnicas melhoraram ou mantiveram o desempenho dos classificadores bases. Concluindo, ensembles aplicados em classificadores baseados em grafos apresentam bons resultados no desempenho destes

2011

https://doi.org/10.11606/D.55.2011.tde-18102011-095113

Nils Ever Murrugarra Llerena

Método híbrido de alta ordem para escoamentos compressíveis

A presença de onda de choque e vórtices de pequena escala exigem métodos numéricos mais sofisticados para simular escoamentos compressíveis em velocidades altas. Alguns desses métodos produzem resultados adequados para regiões com função suave, embora os mesmos não possam ser utilizados diretamente em regiões com função descontínua, resultando em oscilações espúrias. Dessa forma, métodos foram desenvolvidos para solucionar esse problema, apresentando um bom desempenho para regiões com função descontínua; entretanto, estes possuem termos de alta dissipação. Para evitar os problemas encontrados, foram desenvolvidos os métodos híbridos, onde dois métodos com características ideais para cada região são combinados através de uma função detectora que analisa numericamente a variação de uma quantidade em uma região através de fórmulas que envolvem derivadas. Um detector de descontinuidades foi desenvolvido a partir da revisão bibliográfica de diversos métodos numéricos híbridos existentes, sendo avaliadas as principais desvantagens e limitações de cada um. Diversas comparações entre o novo detector e os detectores de descontinuidades já desenvolvidos foram realizadas através da aplicação em funções unidimensionais e bidimensionais. Finalmente, o método híbrido foi aplicado para a solução das equações de Euler unidimensionais e bidimensionais.

2015

https://doi.org/10.11606/D.55.2016.tde-18102016-162530

Vitor Alves Pires

Integração de sistemas cognitivo e robótico por meio de uma ontologia para modelar a percepção do ambiente

A disseminação do uso de robôs na sociedade moderna é uma realidade. Do começo restrito às operações fabris como pintura e soldagem, até o início de seu uso nas residências, apenas algumas décadas se passaram. A robótica social é uma área de pesquisa que visa desenvolver modelos para que a interação direta de robôs com seres humanos ocorra de forma natural. Um dos fatores que compromete a rápida evolução da robótica social é a dificuldade em integrar sistemas cognitivos e robóticos, principalmente devido ao volume e complexidade da informação produzida por um mundo caótico repleto de dados sensoriais. Além disso, a existência de múltiplas configurações de robôs, com arquiteturas e interfaces distintas, dificulta a verificação e repetibilidade dos experimentos realizados pelos diversos grupos de pesquisa. Esta tese contribui para a evolução da robótica social ao definir uma arquitetura, denominada Cognitive Model Development Environment (CMDE) que simplifica a conexão entre sistemas cognitivos e robóticos. Essa conexão é formalizada com uma ontologia, denominada OntPercept, que modela a percepção do ambiente a partir de informações sensoriais captadas pelos sensores presentes no agente robótico. Nos últimos anos, diversas ontologias foram propostas para aplicações robóticas, mas elas não são genéricas o suficiente para atender completamente às necessidades das áreas de robótica e automação. A formalização oferecida pela OntPercept facilita o desenvolvimento, a reprodução e a comparação de experimentos associados a robótica social. A validação do sistema proposto ocorre com suporte do simulador Robot House Simulator (RHS), que fornece um ambiente onde, o agente robótico e o personagem humano podem interagir socialmente com níveis crescentes de processamento cognitivo. A proposta da CMDE viabiliza a utilização de qualquer sistema cognitivo, em particular, o experimento elaborado para validação desta pesquisa utiliza Soar como arquitetura cognitiva. Em conjunto, os elementos: arquitetura CMDE, ontologia OntPercept e simulador RHS, todos disponibilizados livremente no GitHub, estabelecem um ambiente completo que propiciam o desenvolvimento de experimentos envolvendo sistemas cognitivos dirigidos para a área de robótica social.

2018

https://doi.org/10.11606/T.55.2018.tde-18102018-103203

Helio Azevedo

Soluções de tomadas de decisões inteligentes para infraestruturas residenciais

Nos últimos anos, um dos principais desafios globais está relacionado com a eficiência energética, sendo o desperdício de energia um dos fatores a ser destacado. Tal desperdício pode ser superado com o uso do Sistema de Automação Residencial (SAR). Vale frisar que os SARs são fortemente dependentes da sua infraestrutura interna, visto que esta é a base de uma casa inteligente. A Rede de Sensores e Atuadores sem Fio (RSASF) é uma solução promissora e de fácil implantação para ser utilizada como infraestrutura em um SAR. Entretanto, o uso das RSASFs como infraestrutura para monitorar e atuar (isto é, processo de tomada de decisão) no contexto de um SAR traz um novo problema. Tal problema remete não apenas a falta de um método para realizar a decisão dentro do próprio nó da RSASF, mas também a ausência em investigar um trade-off entre a precisão nas tomadas de decisões e o consumo de energia dos nós da rede. Além disso, a falta de uma infraestrutura distribuída, com baixo overhead e que reduza a latência do serviço são algumas das novas problemáticas para serem exploradas. Com isso, tem-se como desafio embarcar uma maior inteligência em dispositivos com recursos escassos, característica presente em uma RSASF. Para superar tais limitações, esta tese apresenta duas soluções de decisões inteligentes para uma infraestrutura residencial, nomeadas como ResiDI e ImPeRIum. O ResiDI é baseado em uma rede neural para atuar no processo de tomada de decisão dentro da RSASF, bem como em um mecanismo de correlação temporal para maximizar a eficiência energética da infraestrutura de comunicação. Já o ImPeRIum é baseado em um conjunto heterogêneo de dispositivos inteligentes para formar um ambiente computacional de fog, o qual gerencia as aplicações da residência por meio de uma rede neural. As soluções foram avaliadas extensivamente em diferentes cenários e comparadas com um trabalho da literatura. Os resultados reais e simulados, avaliados mediante uma análise estatística paramétrica e não-paramétrica, mostrou atingir o objetivo desta tese, sendo quatro deles notáveis: (i) aumento da precisão nas tomadas de decisões; (ii) redução no consumo de energia dos nós da rede; (iii) redução no tempo de resposta da atuação com baixa sobrecarrega; e (iv) eficiência na disseminação das informações.

2018

https://doi.org/10.11606/T.55.2018.tde-18102018-104924

Geraldo Pereira Rocha Filho

Gamificação personalizada baseada no perfil do jogador

A Gamificação é uma técnica que a utiliza elementos de design de jogos em ambientes que não são jogos, visando aumentar a motivação e engajamento dos usuários e que vem ganhando espaço em diversos áreas como saúde, marketing e também na educação. Porém, ainda que o interesse pela técnica venha crescendo, os meios para sua aplicação nesses ainda não estão bem definidos e os resultados obtidos têm-se mostrado dependentes do contexto e da população alvo. Diversos autores atribuem essa inconstância nos resultados a problemas no design da gamificação, uma vez que a maior parte dos projetos tem utilizado abordagens one-size-fits-all, no qual todos os usuários utilizam o mesmo ambiente independente de suas preferências individuais. Diante desse cenário, tem-se proposto que a gamificação personalizada pode atender uma maior parcela dos usuários, adequando os ambientes gamificados ao perfil dos usuários. Uma das abordagens para a personalização da gamificação consiste no uso de tipologias de jogadores para determinar os elementos mais interessante para o usuário. No entanto, as tipologias utilizam estereótipos, criando constructos que ainda restringem as informações consideradas durante a personalização. Dessa forma, neste trabalho buscou-se investigar a personalização com base na teoria de motivações para se engajarem em jogos, que trata o perfil do usuário como um conjunto de diferentes subcomponentes motivacionais correlacionados, que se agrupam em macro-componentes. Para isso, adaptou-se a teoria para o contexto da gamificação e elaborou-se dois modelos o de Macro-Gamificação, o qual relaciona-se com a teoria de Autodeterminação e às necessidades de Competência, Relacionamento e Autonomia do usuário, e o de Micro-Gamificação, que relaciona os elementos de jogos a um determinado subcomponente motivacional e disponibilizá-lo mediante o interesse do usuário no subcomponente. Para avaliar então se a gamificação personalizada influencia no engajamento dos usuários quando comparada a gamificação não personalizada, os modelos foram implementados em um ambiente virtual de aprendizagem, preparado para criar os perfis de gamificação dos usuários dinamicamente e adaptar interface do em tempo real. Realizou-se então um estudo de caso com N=36, utilizando como domínio o estudo dos silabários do idioma japonês. Ao final do estudo foram identificados dois padrões de atuação no sistema com uma diferença de 65% de participação e que foi utilizado para segmentar os participantes. No segmento menos engajado, os participantes do grupo não personalizado apresentaram um engajamento aos grupos personalizados. Já no segmento dos usuários mais ativos o grupo utilizando o modelo Micro-Gamificado, apresentou-se mais engajado. Desse modo, não é possível afirmar que a gamificação personalizada proporcione um maior engajamento do que a gamificação sem personalização, embora os resultados sugiram que usuários que permanecem utilizando o sistema por mais tempo tem um maior engajamento no ambiente personalizado. Por fim, é possível afirmar que o desenvolvimento de sistemas gamificados com personalização ainda está em sua infância e por isso nesta pesquisa além de buscar evidencias sobre o impacto da gamificação personalizada no engajamento dos usuários, buscou-se também desenvolver ferramental para facilitar o processo para os membros da comunidade em ordem de impulsionar os avanços dessa área de pesquisa.

2018

https://doi.org/10.11606/T.55.2018.tde-18102018-111511

Fernando Roberto Hebeler Andrade

Collective dynamics in complex networks for machine learning

Machine learning enables machines to learn automatically from data. In literature, graph-based methods have received increasing attention due to their ability to learn from both local and global information. In these methods, each data instance is represented by a vertex and is linked to other vertices according to a predefined affinity rule. However, they usually have unfeasible time cost for large problems. To overcome this problem, techniques can employ a heuristic to find suboptimal solutions in a feasible time. Early heuristic optimization methods exploit nature-inspired collective processes, such as ants looking for food sources and swarms of bees. Nowadays, advances in the field of complex systems provide powerful tools to assess and to understand dynamical systems. Complex networks, which are graphs with nontrivial topology, are among these theoretical tools capable of describing the interplay of topology, structure, and dynamics of complex systems. Therefore, machine learning methods based on complex networks and collective dynamics have been proposed. They encompass three steps. First, a complex network is constructed from the input data. Then, the simulation of a distributed collective system in the network generates rich information. Finally, the collected information is used to solve the learning problem. The coordination of the individuals in the system permit to achieve dynamics that is far more complex than the behavior of single individuals. In this research, I have explored collective dynamics in machine learning tasks, both in unsupervised and semi-supervised scenarios. Specifically, I have proposed a new collective system of competing particles that shifts the traditional vertex-centric dynamics to a more informative edge-centric one. Moreover, it is the first particle competition system applied in machine learning task that has deterministic behavior. Results show several advantages of the edge-centric model, including the ability to acquire more information about overlapping areas, a better exploration behavior, and a faster convergence time. Also, I have proposed a new network formation technique that is not based on similarity and has low computational cost. Since addition and removal of samples in the network is cheap, it can be used in real-time application. Finally, I have conducted analytical investigations of a flocking-like system that was needed to guarantee the expected behavior in community detection tasks. In conclusion, the result of the research contributes to many areas of machine learning and complex systems.

2018

https://doi.org/10.11606/T.55.2018.tde-18102018-113054

Filipe Alves Neto Verri