Repositório RCAAP

Classificação automática de questões baseada em competências: ENEM - Estudo de caso

Introdução: A grande quantidade de informação digital em formato textual existente na internet transforma em atividades essenciais a organização, análise e extração de conhecimento, tanto no universo acadêmico quanto no mercado de trabalho e, com isso, a classificação automática de textos vêm ganhando cada vez mais destaque. A classificação de questões é um subgrupo da classificação de textos e consiste, basicamente, da associação de um ou mais rótulos a cada questão, de acordo com um critério pré-determinado, mas com menos texto disponível que os documentos em geral. As principais aplicações dos sistemas de classificação automática de questões são: QA (Question/Answering), IR (Information Retrieval), Ambiente educacional e tratamento de linguagens específicas. Os sistemas de QA e RI têm como ponto de partida uma pergunta escrita em linguagem natural e, a partir daí, buscam uma coleção de documentos na Web que sejam compatíveis com o assunto descrito. Considerando especificamente o ambiente educacional, a geração automática de testes de avaliação tem aplicação prática imediata nos sistemas de e-learning por viabilizar a personalização do ensino através da busca de questões adequadas a um determinado perfil de aprendizado, os chamados sistemas de ensino adaptativo. Para viabilizar a personalização, é essencial classificar as questões dentro de uma variedade representativa de competências e habilidades. As avaliações em larga escala (ENEM, SAEB, Prova Brasil) podem ser uma fonte de informação para essa geração, pois utilizam Matrizes de Referência de Avaliação (MRA) para classificar as questões de acordo com as áreas do conhecimento, disciplinas, competências e habilidades esperadas dos estudantes. Uma forma de realizar esta classificação é através de algoritmos de Aprendizado de Máquina, capazes de extrair padrões ou generalizar classes através de geração de modelos matemáticos a partir dos dados disponíveis. São exemplos de algoritmos de Aprendizado de Máquina: redes neurais, árvores de decisão, máquinas de vetor de suporte SVM, naive bayes, KNN, entre outros. As diferentes formas de representação de texto para algoritmos de Aprendizado de Máquina possuem vasta pesquisa realizada quando se trata da classificação de documentos com grandes quantidades de texto; quando se trata de pequenos trechos (caso das questões), essa tarefa se torna mais complexa pois a quantidade de texto disponível para análise é reduzida em comparação aos outros tipos de documentos textuais. Além disso, a imensa maioria das pesquisas atuais se voltam para o problema de QA ou IR e há pouca pesquisa disponível considerando o ambiente educacional. Objetivos: (i) Identificar a arquitetura de um classificador ou conjunto de classificadores de forma a maximizar o desempenho do processo de classificação de questões no contexto educacional; (ii) realizar uma avaliação empírica para comparar o desempenho das diferentes combinações utilizadas; (iii) disponibilizar as representações, algoritmos, códigos-fonte e ferramentas desenvolvidos para a comunidade científica avaliar e replicar resultados e (iv) disponibilizar ferramentas de integração e aplicação dos conteúdos desenvolvidos para utilização por outras plataformas e instituições (escolas, empresas) interessadas em utilizar as competências do ENEM para realizar diagnósticos e acompanhamento de aprendizagem. Método: Estudo de caso com base em cerca de 25 mil questões pré-processadas retiradas de avaliações do ENEM até 2017 e classificadas por especialistas em educação dentro das disciplinas, competências e habilidades contidas na matriz de avaliação. A partir disso, foram realizados experimentos com classificadores gerados pelas diferentes combinações de representações de texto, cálculos de peso dos termos e algoritmos de Aprendizado de Máquina supervisionados produzindo, ao final, um comparativo com os indicadores de desempenho. Resultados: (i) modelo geral para construção de classificadores automáticos de questões voltadas a avaliações em larga escala; (ii) identificação do estado da arte na classificação de questões para contexto educacional e avaliações em larga escala; (iii) estado da arte nos resultados de classificação de questões em redes no contexto educacional; (iv) efetividade do método IQF *QF * ICF para o cálculo de pesos/frequências na classificação de questões; (v) banco de dados constantemente atualizável composto de questões classificadas e representativas do ENEM e suas competências; (vi) API para integração com outras plataformas das funcionalidades e (vii) análise de desempenho com comparativo dos indicadores gerados pelos classificadores de questões. Conclusões: Com base nos resultados obtidos, a combinação da representação de textos no modelo espaço-vetorial, técnica IQF * QF * ICF e o algoritmo KNN, se mostrou a melhor arquitetura para o classificador de questões do ENEM com desempenho geral médio em torno de 80% de acurácia. Destacam-se como principais contribuições: i) apoio às plataformas de ensino adaptativo; ii) ferramentas de classificação para as editoras de material didático; iii) apoio a professores e equipes pedagógicas na elaboração de avaliações diagnósticas contínuas sobre as facilidades e dificuldades de seus alunos. Relativamente aos trabalhos futuros, pretende-se gerar classificadores específicos para os exames Prova Brasil e SAEB, integrar a solução com um LMS de código aberto (Moodle, por exemplo) e desenvolver um algoritmo para conversão das questões do ENEM em imagens para classificação via rede neural convolucional.

Ano

2022-12-06T14:47:11Z

Creators

Valtemir de Alencar e Silva

An approach to the sequential evaluation of emotional behaviors of depressive users on social networks in groups and individually

The constant growth in the use and sharing of data on social networks has provided opportunities to develop intelligent solutions for understanding different dimensions of human behavior online since users share social aspects, feelings, and opinions daily. In this way, several studies in Affective Computing have been conducted to recognize and predict emotional and indicative aspects of mental problems through the mining of complex data, such as texts, images, videos, and emoticons, available in social network posts. Depression is a common and growing health problem globally and is considered the third largest cause of incapacity for work, and the leading cause of emergency in health centers is characterized by the manifestation of a set of symptoms for at least two weeks. Symptoms can be compounded by profound sadness, guilt, loss of pleasure and mixed and atypical characteristics, which may be correlated to contexts and severely impact various social aspects. Although it is necessary to observe emotional characteristics over time, as it is known in the literature, studies have focused on classifying whether a given post is depressive and have not addressed the temporal recognition of mood manifestations and aspects of personality context. This Thesis aimed to answer \"how to recognize temporal patterns of behavior of depressive users in online social networks?\" In this way, an approach for the temporal recognition of behavioral patterns of depressed users on social networks is presented, composed of two methodologies that allow (i) the temporal evaluation of the behavioral patterns of user interactions in groups combining modeling and metrics of complex networks and recognition of emotions and feelings, and (i) sequential recognition of the patterns of behavior of individual depressive users, through the mining of frequent patterns of emotional and contextual characteristics. Information from posts and comments was used in both methodologies, composed of texts and emoticons present in the users timeline. Through complex network measures and frequent pattern recognition, the approach was evaluated, indicating to recognize strong patterns of interactional, emotional, and contextual behaviors online over time, which serve as indicative for human behavior specialists and are based on evidence in the literature.

Ano

2022-12-06T14:47:11Z

Creators

Felipe Taliar Giuntini

Computational approaches for the discovery of significant genes in cancer

Cancer is a complex disease caused by the accumulation of genetic alterations during the individuals life. These alterations are named genetic mutations, which may be divided into two groups: 1) Passenger mutations: mutations that do not change the behavior of the cell; 2) Driver mutations: significant mutations for cancer, that cause carcinogenesis. Cancer cells have a large number of mutations, in which the large majority of them are passenger, and few mutations are drivers. The identification of significant mutated genes, i.e., genes with driver mutations, is essential for the understanding of the mechanisms of cancer initiation and progression. Such a task is a key challenge in cancer genomics, since several studies have shown many significant genes are mutated at a very low frequency. With the next generation DNA sequencing, large and complex genomic datasets have been generated, creating the challenge of analyzing and interpreting this data. Towards uncovering infrequently mutated genes, gene interaction networks combined with mutation data have been explored. This research presents computational approaches for the discovery of reliable significant cancer genes. Such a genes are prioritized by a network-based method which combines weighted mutation frequency and network neighbors influence, and possible false-positives are detected by machine learning-based method which uses mutation data and gene interaction networks to induce predictive models. An experimental study conducted with six types of cancer revealed the potential of the approaches on the discovering of known and possible novel reliable significant cancer genes.

Ano

2022-12-06T14:47:11Z

Creators

Jorge Francisco Cutigi

Mineração de regras de associação em dados georreferenciados

Sistemas de informações geográficas permitem armazenar, manipular e armazenar, manipular e analisar dados espaciais e aspectos descritivos desses dados. A análise de dados espaciais pode ser realizada por meio de técnicas de extração de regras de associação, ou seja, regras que descrevem relacionamentos entre os dados. Porém, a mineração de regras de associação não considera as relações topológicas existentes entre dados georreferenciados. Para solucionar esse problema, Koperski and Han (1995) e Malerba et al. (2001) propuseram um processo de extração de regras integrado ao algoritmo de mineração e utilizavam predicados lógicos para representar as regras. Como alternativa a essa solução, este trabalho propõe pré-processar os dados referenciados para encontrar relações topológicas em separado e aplicar um algoritmo de mineração de regras de associação disponí?vel pela comunidade acadêmica. As regras geradas devem apresentar características descritivas dos dados e relações topológicas. Para atingir esse objetivo foi especificado um processo de extração de regras em dados georreferenciados e implementado um módulo de pré-processamento que extrai relações topológicas. O módulo foi avaliado por meio de um estudo de caso utilizando o sistema de informação geográfica da cidade de Jaboticabal, no contexto de planejamento urbano. As regras encontradas foram analisadas por um especialista utilizando as medidas de suporte e confiança. Além disso, uma análise sobre o tempo de processamento e consumo de memória para encontrar as relações topológicas foi realizada, mostrando que é possível extrair padrões utilizando o processo e o módulo proposto neste trabalho.

Ano

2022-12-06T14:47:11Z

Creators

Marina Abichabki Pivato

Escalonamento em grids computacionais: estudo de caso

Esta dissertação tem por objetivo apresentar a proposta de uma política de escalonamento para grids computacionais. Essa política, intitulada Dynamic Max-Min2x, é orientada ao escalonamento de aplicações cujas tarefas não realizam comunicação entre si e visa a redução do tempo de resposta dessas aplicações através da utilização de atribuição dinâmica de tarefas e replicação das mesmas. Experimentos, feitos através de simulação, mostram que o tempo médio de resposta de aplicações utilizando-se a Dynamic Max-Min2x é inferior ao de outras políticas da literatura. Análises dos resultados desses experimentos apontam que esse tempo tende a ser mais atrativo principalmente quando as tarefas necessitam de muito processamento e quando há grande variação de carga no sistema, caracteristicas comuns em grids computacionais. Além disso, esta dissertação apresenta a implementação de um framework utilizando-se o Globus Toolkit, onde é possível a inserção de políticas de escalonamento para a submissão inteligente de tarefas em um grid computacional.

Ano

2022-12-06T14:47:11Z

Creators

Valéria Quadros dos Reis

Avaliação de índices de carga de memória em sistemas computacionais distribuídos

Este trabalho apresenta uma análise de comportamento de índices de carga relacionados ao uso e à atividade de memória. São descritos 11 índices que refletem direta ou indiretamente a carga de memória. Esses índices podem ser obtidos facilmente no sistema peracional GNU/Linux através do sistema de arquivos /proc. Uma ferramenta de monitoramento foi criada para facilitar a análise de comportamento, podendo também servir para fornecer informações de carga para políticas de escalonamento. Os valores de cada índice foram monitorados durante a execução de uma carga de trabalho composta por aplicações reais que utilizam altas quantidades de memória. A partir dos resultados é possível descobrir a utilidade de cada índice, indicando como eles podem ser usados para auxiliar políticas de escalonamento a avaliar a carga de memória de uma máquina. Métricas de avaliação de carga originárias da combinação de mais de um índice são descritas. Essas métricas foram criadas em casos em que a combinação de mais de um índice permitia representar a carga de memória com mais precisão do que índices usados isoladamente. As métricas e índices pesquisados proporcionam formas precisas de representar a carga de memória em vários níveis, desde níveis de baixa utilização até níveis de saturação da memória principal com sintomas de ocorrência de thrashing.

Ano

2022-12-06T14:47:11Z

Creators

William Voorsluys

Modelos flexíveis para dados de tempos de vida em um cenário de riscos competitivos e mecanismos de ativação latentes

Na literatura da área da análise de sobrevivência existem os modelos tradicionais, ou sem fração de cura, e os modelos de longa duração, ou com fração de cura. Recentemente tem sido proposto um modelo mais geral, conhecido como o modelo com fatores de risco latentes com esquemas de ativação. Nesta tese são deduzidas novas propriedades que possuem a função de sobrevivência, a função de taxa de risco e o valor esperado, quando e considerado o modelo com fatores de risco latentes. Estas propriedades são importantes, já que muitos outros modelos que tem aparecido na literatura recentemente podem ser considerados como casos particulares do modelo com fatores de risco latentes. Além disto, são propostos novos modelos de sobrevivência e estes são aplicados a conjuntos de dados reais. Também é realizado um estudo de simulação e uma análise de sensibilidade, para mostrar a qualidade destes modelos

Ano

2022-12-06T14:47:11Z

Creators

José Julio Flores Delgado

Consolidation problems in freight transportation systems: mathematical models and algorithms

Freight distribution systems are under stress. With the world population growing, the migration of people to urban areas and technologies that allow purchases from virtually anywhere, efficient freight distribution can be challenging. An inefficient movement of goods may lead to business not being economically viable and also has social and environmental negative effects. An important strategy to be incorporated in freight distribution systems is the consolidation of goods, i.e., group goods by their destination. This strategy increases vehicles utilisation, reducing the number of vehicles and the number of trips required for the distribution and, consequently, costs, traffic, noise and air pollution. In this thesis, we explore consolidation in three different contexts (or cases) from an optimisation point of view. Each context is related to optimisation problems for which we developed mathematical programming models and solution methods. The first case in which we explore consolidation is in container loading problems (CLPs). CLPs are a class of packing problems which aims at positioning three-dimensional boxes inside a container efficiently. The literature has incorporated many practical aspects into container loading solution method (e.g. restricting orientation of boxes, stability and weight distribution). However, to the best of our knowledge, the case considering more dynamic systems (e.g. cross-docking) in which goods might have a schedule of arrival were yet to be contemplated by the literature. We define an extension of CLP which we call Container Loading Problem with Time Availability Constraints (CLPTAC), which considers boxes are not always available for loading. We propose an extension of a CLP model that is suitable for CLPTAC and solution methods which can also handle cases with uncertainty in the schedule of the arrival of the boxes. The second case is a more broad view of the network, considering an open vehicle routing problem with cross-dock selection. The traditional vehicle routing problem has been fairly studied. Its open version (i.e. with routes that start and end at different points) has not received the same attention. We propose a version of the open vehicle routing problem in which some nodes of the network are consolidation centres. Instead of shippers sending goods directly to their consumers, they must send to one of the available consolidation centres, then, goods are resorted and forwarded to their destination. For this problem, we propose a mixed integer linear programming model for cost minimisation and a solution method based on the Benders decomposition framework. A third case in which we explored consolidation is in collaborative logistics. Particularly, we focus on the shared use of the currently available infrastructure. We defined a hub selection problem in which one of the suppliers is selected as a hub. In a hub facility, other suppliers might meet to exchange their goods allowing one supplier to satisfy the demand from others. For this problem, we propose a mixed integer linear programming model and a heuristic based on the model. Moreover, we compared a traditional distribution strategy, with each supplier handling its demand, against the collaborative one. In this thesis, we explore these three cases which are related to consolidation for improving the efficiency in freight distribution systems. We extend some problems (e.g. versions of CLP) to apply them to a more dynamic setting and we also define optimisation problems for networks with consolidation centres. Furthermore, we propose solution methods for each of the defined problems and evaluate them using randomly generated instances, benchmarks from the literature and some cases based on real-world characteristics.

Ano

2022-12-06T14:47:11Z

Creators

Pedro Belin Castellucci

Ensembles na classificação relacional

Em diversos domínios, além das informações sobre os objetos ou entidades que os compõem, existem, também, informaçõoes a respeito das relações entre esses objetos. Alguns desses domínios são, por exemplo, as redes de co-autoria, e as páginas Web. Nesse sentido, é natural procurar por técnicas de classificação que levem em conta estas informações. Dentre essas técnicas estão as denominadas classificação baseada em grafos, que visam classificar os exemplos levando em conta as relações existentes entre eles. Este trabalho aborda o desenvolvimento de métodos para melhorar o desempenho de classificadores baseados em grafos utilizando estratégias de ensembles. Um classificador ensemble considera um conjunto de classificadores cujas predições individuais são combinadas de alguma forma. Este classificador normalmente apresenta um melhor desempenho do que seus classificadores individualmente. Assim, foram desenvolvidas três técnicas: a primeira para dados originalmente no formato proposicional e transformados para formato relacional baseado em grafo e a segunda e terceira para dados originalmente já no formato de grafo. A primeira técnica, inspirada no algoritmo de boosting, originou o algoritmo KNN Adaptativo Baseado em Grafos (A-KNN). A segunda ténica, inspirada no algoritmo de Bagging originou trê abordagens de Bagging Baseado em Grafos (BG). Finalmente, a terceira técnica, inspirada no algoritmo de Cross-Validated Committees, originou o Cross-Validated Committees Baseado em Grafos (CVCG). Os experimentos foram realizados em 38 conjuntos de dados, sendo 22 conjuntos proposicionais e 16 conjuntos no formato relacional. Na avaliação foi utilizado o esquema de 10-fold stratified cross-validation e para determinar diferenças estatísticas entre classificadores foi utilizado o método proposto por Demsar (2006). Em relação aos resultados, as três técnicas melhoraram ou mantiveram o desempenho dos classificadores bases. Concluindo, ensembles aplicados em classificadores baseados em grafos apresentam bons resultados no desempenho destes

Ano

2022-12-06T14:47:11Z

Creators

Nils Ever Murrugarra Llerena

Método híbrido de alta ordem para escoamentos compressíveis

A presença de onda de choque e vórtices de pequena escala exigem métodos numéricos mais sofisticados para simular escoamentos compressíveis em velocidades altas. Alguns desses métodos produzem resultados adequados para regiões com função suave, embora os mesmos não possam ser utilizados diretamente em regiões com função descontínua, resultando em oscilações espúrias. Dessa forma, métodos foram desenvolvidos para solucionar esse problema, apresentando um bom desempenho para regiões com função descontínua; entretanto, estes possuem termos de alta dissipação. Para evitar os problemas encontrados, foram desenvolvidos os métodos híbridos, onde dois métodos com características ideais para cada região são combinados através de uma função detectora que analisa numericamente a variação de uma quantidade em uma região através de fórmulas que envolvem derivadas. Um detector de descontinuidades foi desenvolvido a partir da revisão bibliográfica de diversos métodos numéricos híbridos existentes, sendo avaliadas as principais desvantagens e limitações de cada um. Diversas comparações entre o novo detector e os detectores de descontinuidades já desenvolvidos foram realizadas através da aplicação em funções unidimensionais e bidimensionais. Finalmente, o método híbrido foi aplicado para a solução das equações de Euler unidimensionais e bidimensionais.

Ano

2022-12-06T14:47:11Z

Creators

Vitor Alves Pires

Integração de sistemas cognitivo e robótico por meio de uma ontologia para modelar a percepção do ambiente

A disseminação do uso de robôs na sociedade moderna é uma realidade. Do começo restrito às operações fabris como pintura e soldagem, até o início de seu uso nas residências, apenas algumas décadas se passaram. A robótica social é uma área de pesquisa que visa desenvolver modelos para que a interação direta de robôs com seres humanos ocorra de forma natural. Um dos fatores que compromete a rápida evolução da robótica social é a dificuldade em integrar sistemas cognitivos e robóticos, principalmente devido ao volume e complexidade da informação produzida por um mundo caótico repleto de dados sensoriais. Além disso, a existência de múltiplas configurações de robôs, com arquiteturas e interfaces distintas, dificulta a verificação e repetibilidade dos experimentos realizados pelos diversos grupos de pesquisa. Esta tese contribui para a evolução da robótica social ao definir uma arquitetura, denominada Cognitive Model Development Environment (CMDE) que simplifica a conexão entre sistemas cognitivos e robóticos. Essa conexão é formalizada com uma ontologia, denominada OntPercept, que modela a percepção do ambiente a partir de informações sensoriais captadas pelos sensores presentes no agente robótico. Nos últimos anos, diversas ontologias foram propostas para aplicações robóticas, mas elas não são genéricas o suficiente para atender completamente às necessidades das áreas de robótica e automação. A formalização oferecida pela OntPercept facilita o desenvolvimento, a reprodução e a comparação de experimentos associados a robótica social. A validação do sistema proposto ocorre com suporte do simulador Robot House Simulator (RHS), que fornece um ambiente onde, o agente robótico e o personagem humano podem interagir socialmente com níveis crescentes de processamento cognitivo. A proposta da CMDE viabiliza a utilização de qualquer sistema cognitivo, em particular, o experimento elaborado para validação desta pesquisa utiliza Soar como arquitetura cognitiva. Em conjunto, os elementos: arquitetura CMDE, ontologia OntPercept e simulador RHS, todos disponibilizados livremente no GitHub, estabelecem um ambiente completo que propiciam o desenvolvimento de experimentos envolvendo sistemas cognitivos dirigidos para a área de robótica social.

Ano

2022-12-06T14:47:11Z

Creators

Helio Azevedo

Soluções de tomadas de decisões inteligentes para infraestruturas residenciais

Nos últimos anos, um dos principais desafios globais está relacionado com a eficiência energética, sendo o desperdício de energia um dos fatores a ser destacado. Tal desperdício pode ser superado com o uso do Sistema de Automação Residencial (SAR). Vale frisar que os SARs são fortemente dependentes da sua infraestrutura interna, visto que esta é a base de uma casa inteligente. A Rede de Sensores e Atuadores sem Fio (RSASF) é uma solução promissora e de fácil implantação para ser utilizada como infraestrutura em um SAR. Entretanto, o uso das RSASFs como infraestrutura para monitorar e atuar (isto é, processo de tomada de decisão) no contexto de um SAR traz um novo problema. Tal problema remete não apenas a falta de um método para realizar a decisão dentro do próprio nó da RSASF, mas também a ausência em investigar um trade-off entre a precisão nas tomadas de decisões e o consumo de energia dos nós da rede. Além disso, a falta de uma infraestrutura distribuída, com baixo overhead e que reduza a latência do serviço são algumas das novas problemáticas para serem exploradas. Com isso, tem-se como desafio embarcar uma maior inteligência em dispositivos com recursos escassos, característica presente em uma RSASF. Para superar tais limitações, esta tese apresenta duas soluções de decisões inteligentes para uma infraestrutura residencial, nomeadas como ResiDI e ImPeRIum. O ResiDI é baseado em uma rede neural para atuar no processo de tomada de decisão dentro da RSASF, bem como em um mecanismo de correlação temporal para maximizar a eficiência energética da infraestrutura de comunicação. Já o ImPeRIum é baseado em um conjunto heterogêneo de dispositivos inteligentes para formar um ambiente computacional de fog, o qual gerencia as aplicações da residência por meio de uma rede neural. As soluções foram avaliadas extensivamente em diferentes cenários e comparadas com um trabalho da literatura. Os resultados reais e simulados, avaliados mediante uma análise estatística paramétrica e não-paramétrica, mostrou atingir o objetivo desta tese, sendo quatro deles notáveis: (i) aumento da precisão nas tomadas de decisões; (ii) redução no consumo de energia dos nós da rede; (iii) redução no tempo de resposta da atuação com baixa sobrecarrega; e (iv) eficiência na disseminação das informações.

Ano

2022-12-06T14:47:11Z

Creators

Geraldo Pereira Rocha Filho

Gamificação personalizada baseada no perfil do jogador

A Gamificação é uma técnica que a utiliza elementos de design de jogos em ambientes que não são jogos, visando aumentar a motivação e engajamento dos usuários e que vem ganhando espaço em diversos áreas como saúde, marketing e também na educação. Porém, ainda que o interesse pela técnica venha crescendo, os meios para sua aplicação nesses ainda não estão bem definidos e os resultados obtidos têm-se mostrado dependentes do contexto e da população alvo. Diversos autores atribuem essa inconstância nos resultados a problemas no design da gamificação, uma vez que a maior parte dos projetos tem utilizado abordagens one-size-fits-all, no qual todos os usuários utilizam o mesmo ambiente independente de suas preferências individuais. Diante desse cenário, tem-se proposto que a gamificação personalizada pode atender uma maior parcela dos usuários, adequando os ambientes gamificados ao perfil dos usuários. Uma das abordagens para a personalização da gamificação consiste no uso de tipologias de jogadores para determinar os elementos mais interessante para o usuário. No entanto, as tipologias utilizam estereótipos, criando constructos que ainda restringem as informações consideradas durante a personalização. Dessa forma, neste trabalho buscou-se investigar a personalização com base na teoria de motivações para se engajarem em jogos, que trata o perfil do usuário como um conjunto de diferentes subcomponentes motivacionais correlacionados, que se agrupam em macro-componentes. Para isso, adaptou-se a teoria para o contexto da gamificação e elaborou-se dois modelos o de Macro-Gamificação, o qual relaciona-se com a teoria de Autodeterminação e às necessidades de Competência, Relacionamento e Autonomia do usuário, e o de Micro-Gamificação, que relaciona os elementos de jogos a um determinado subcomponente motivacional e disponibilizá-lo mediante o interesse do usuário no subcomponente. Para avaliar então se a gamificação personalizada influencia no engajamento dos usuários quando comparada a gamificação não personalizada, os modelos foram implementados em um ambiente virtual de aprendizagem, preparado para criar os perfis de gamificação dos usuários dinamicamente e adaptar interface do em tempo real. Realizou-se então um estudo de caso com N=36, utilizando como domínio o estudo dos silabários do idioma japonês. Ao final do estudo foram identificados dois padrões de atuação no sistema com uma diferença de 65% de participação e que foi utilizado para segmentar os participantes. No segmento menos engajado, os participantes do grupo não personalizado apresentaram um engajamento aos grupos personalizados. Já no segmento dos usuários mais ativos o grupo utilizando o modelo Micro-Gamificado, apresentou-se mais engajado. Desse modo, não é possível afirmar que a gamificação personalizada proporcione um maior engajamento do que a gamificação sem personalização, embora os resultados sugiram que usuários que permanecem utilizando o sistema por mais tempo tem um maior engajamento no ambiente personalizado. Por fim, é possível afirmar que o desenvolvimento de sistemas gamificados com personalização ainda está em sua infância e por isso nesta pesquisa além de buscar evidencias sobre o impacto da gamificação personalizada no engajamento dos usuários, buscou-se também desenvolver ferramental para facilitar o processo para os membros da comunidade em ordem de impulsionar os avanços dessa área de pesquisa.

Ano

2022-12-06T14:47:11Z

Creators

Fernando Roberto Hebeler Andrade

Collective dynamics in complex networks for machine learning

Machine learning enables machines to learn automatically from data. In literature, graph-based methods have received increasing attention due to their ability to learn from both local and global information. In these methods, each data instance is represented by a vertex and is linked to other vertices according to a predefined affinity rule. However, they usually have unfeasible time cost for large problems. To overcome this problem, techniques can employ a heuristic to find suboptimal solutions in a feasible time. Early heuristic optimization methods exploit nature-inspired collective processes, such as ants looking for food sources and swarms of bees. Nowadays, advances in the field of complex systems provide powerful tools to assess and to understand dynamical systems. Complex networks, which are graphs with nontrivial topology, are among these theoretical tools capable of describing the interplay of topology, structure, and dynamics of complex systems. Therefore, machine learning methods based on complex networks and collective dynamics have been proposed. They encompass three steps. First, a complex network is constructed from the input data. Then, the simulation of a distributed collective system in the network generates rich information. Finally, the collected information is used to solve the learning problem. The coordination of the individuals in the system permit to achieve dynamics that is far more complex than the behavior of single individuals. In this research, I have explored collective dynamics in machine learning tasks, both in unsupervised and semi-supervised scenarios. Specifically, I have proposed a new collective system of competing particles that shifts the traditional vertex-centric dynamics to a more informative edge-centric one. Moreover, it is the first particle competition system applied in machine learning task that has deterministic behavior. Results show several advantages of the edge-centric model, including the ability to acquire more information about overlapping areas, a better exploration behavior, and a faster convergence time. Also, I have proposed a new network formation technique that is not based on similarity and has low computational cost. Since addition and removal of samples in the network is cheap, it can be used in real-time application. Finally, I have conducted analytical investigations of a flocking-like system that was needed to guarantee the expected behavior in community detection tasks. In conclusion, the result of the research contributes to many areas of machine learning and complex systems.

Ano

2022-12-06T14:47:11Z

Creators

Filipe Alves Neto Verri

Reconhecimento de implicação textual em português

O reconhecimento de implicação textual (RIT) consiste em identificar automaticamente se um trecho de texto em língua natural é verdadeiro baseado no conteúdo de outro. Este problema vem sendo estudado por pesquisadores da área de Processamento de Línguas Naturais (PLN) há alguns anos, e ganhou certo destaque mais recentemente, com a maior disponibilidade de dados anotados e desenvolvimento de métodos baseados em deep learning. Esta pesquisa de doutorado teve como objetivo o desenvolvimento de recursos e métodos computacionais para o RIT, com especial foco em língua portuguesa. Durante sua realização, foi compilado o corpus ASSIN, o primeiro a fornecer dados para treinamento e avaliação de sistemas de RIT em português, e foi organizado o workshop de mesmo nome, que reuniu pesquisadores interessados no tema. Além disso, foram feitos experimentos computacionais com diferentes tipos de estratégias para o RIT, com dados em inglês e em português. Foi desenvolvido um novo modelo para o RIT, o TEDIN (Tree Edit Distance Network). O modelo é baseado no conceito de distância de edição entre árvores sintáticas, já explorado em outros trabalhos de RIT. Seu diferencial é combinar a representação de conhecimento linguístico explícito com a flexibilidade e capacidade representativa de redes neurais. Foi também desenvolvido o Infernal, um modelo para RIT que usa técnicas clássicas de aprendizado de máquina com engenharia de atributos. Os resultados experimentais do TEDIN ficaram abaixo de outros modelos da literatura, e uma análise cuidadosa de seu comportamento indica a dificuldade de se modelar as diferenças entre árvores sintáticas. Por outro lado, o Infernal teve resultados positivos no ASSIN, definindo o novo estado-da-arte para o RIT em português.

Ano

2022-12-06T14:47:11Z

Creators

Erick Rocha Fonseca

MDAPSP - Uma arquitetura modular distribuída para auxílio à predição de estruturas de proteínas

A predição de estruturas de proteínas é um campo de pesquisa que busca simular o enovelamento de cadeias de aminoácidos de forma a descobrir as funções das proteínas na natureza, um processo altamente dispendioso por meio de métodos in vivo. Inserida no contexto da Bioinformática, é uma das tarefas mais computacionalmente custosas e desafiadoras da atualidade. Devido à complexidade, muitas pesquisas se utilizam de gateways científicos para disponibilização de ferramentas de execução e análise desses experimentos, aliado ao uso de workflows científicos para organização de tarefas e disponibilização de informações. No entanto, esses gateways podem enfrentar gargalos de desempenho e falhas estruturais, produzindo resultados de baixa qualidade. Para atuar nesse contexto multifacetado e oferecer alternativas para algumas das limitações, esta tese propõe uma arquitetura modular baseada nos conceitos de Service Oriented Architecture (SOA) para oferta de recursos computacionais em gateways científicos, com foco nos experimentos de Protein Structure Prediction (PSP). A Arquitetura Modular Distribuída para auxílio à Predição de Estruturas de Proteínas (MDAPSP) é descrita conceitualmente e validada em um modelo de simulação computacional, no qual se pode identificar suas capacidades, detalhar o funcionamento de seus módulos e destacar seu potencial. A avaliação experimental demonstra a qualidade dos algoritmos propostos, ampliando a capacidade de atendimento de um gateway científico, reduzindo o tempo necessário para experimentos de predição e lançando as bases para o protótipo de uma arquitetura funcional. Os módulos desenvolvidos alcançam boa capacidade de otimização de experimentos de PSP em ambientes distribuídos e constituem uma novidade no modelo de provisionamento de recursos para gateways científicos.

Ano

2022-12-06T14:47:11Z

Creators

Edvard Martins de Oliveira

Acompanhamento remoto para a terapia do espelho utilizando smartphone e realidade aumentada

Soluções computacionais desenvolvidas para dispositivos móveis são cada vez mais comuns. A popularização de aplicativos móveis possibilitou o desenvolvimento de soluções para diversas áreas de grande potencial, como a área da saúde, entre ela a Terapia Ocupacional. Entre essas soluções, trabalhos apresentaram diversos métodos computacionais para o apoio a Terapia do Espelho. A terapia do espelho é um método que consiste na execução de exercícios com um membro saudável refletido em um espelho de modo que a visualização auxilie na redução da dor e na reabilitação do membro afetado. Essa terapia tem apresentado resultados, entre outros, na reabilitação para indivíduos que reportam dor do membro fantasma ou em recuperação pós-Acidente Vascular Cerebral (AVC). A literatura apresenta soluções computacionais para, entre outros, permitir a visualização do membro saudável a partir de tecnologias de realidade aumentada e de dispositivos vestíveis. Essas soluções muitas vezes são de difícil acesso e economicamente inviáveis. Um trabalho anterior, realizado em colaboração com equipe multidisciplinar, resultou na definição de um modelo de acompanhamento remoto que emprega dispositivos móveis para permitir o monitoramento de pacientes em tratamento por meio da terapia do espelho. Uma das limitações encontradas naquele trabalho foi o fato do terapeuta não conseguir acompanhar de maneira automática se o paciente está executando a terapia de maneira correta. Explorando essas contribuições e limitações, este trabalho teve como objetivo propor um modelo que permita o acompanhamento remoto da terapia do espelho com apoio de recursos de realidade aumentada. Como apoio computacional ao modelo, foi desenvolvida a aplicação para smartphones TEIRA (Terapia do Espelho Interativa com Realidade Aumentada) que, utilizada em conjunto com a tecnologia Google Cardboard, permite a execução da terapia do espelho com realidade aumentada. Além disso, com a integração do sistema TEIRA com o sistema de planejamento de intervenções ESPIM (Experience Sampling and Programmed Intervention Method), foi possível proporcionar um método de acompanhamento remoto com coleta de dados e vídeo. Consulta a especialistas indica que a solução apresenta benefícios potenciais para o monitoramento do paciente durante o acompanhamento remoto, que ajudem o paciente a executar a terapia de maneira correta.

Ano

2022-12-06T14:47:11Z

Creators

Yuri Nehase Zuliani Goulart Magagnatto

Otimização multinível em predição de links

A predição de links em redes é uma tarefa com aplicações em diversos cenários. Com a automatização de processos, as redes sociais, redes tecnológicas e outras cresceram muito em número de vértices e arestas. Portanto, a utilização de preditores de links em redes com alta complexidade estrutural não é trivial, mesmo considerando algoritmos de baixa complexidade computacional. A grande quantidade de operações necessárias para que os preditores possam escolher quais arestas são promissoras torna o processo de considerar a rede toda inviável na maioria dos casos. As abordagens existentes enfrentam essa característica de diversas formas, sendo que as mais populares são as que limitam o conjunto de pares de vértices que serão considerados para existência de arestas promissoras. Este projeto aborda a criação de uma estratégia que utiliza otimização multinível para contrair as redes, executar os algoritmos de predição de links nas redes contraídas e projetar os resultados de predição para a rede original, para reduzir o número de operações necessárias à predição de links. Os resultados mostram que a abordagem consegue reduzir o tempo necessário para predição, apesar de perdas esperadas na qualidade na predição.

Ano

2022-12-06T14:47:11Z

Creators

Vinícius Ferreira da Silva

"Métodos de pontos interiores aplicados ao problema de regressão pela norma Lp"

Neste trabalho a família de métodos de pontos interiores barreira logarítmica é desenvolvida para o problema de regressão pela norma Lp e a estrutura matricial resultante é explorada objetivando uma implementação eficiente. Apresentamos alguns conceitos sobre métodos de pontos interiores necessários para o desenvolvimento do método e descrevemos um método de convergência quadrática previamente conhecido. Uma implementação em Matlab dos métodos de pontos interiores desenvolvidos é comparada com uma implementação do método quadrático existente, obtendo desempenho computacional superior.

Ano

2022-12-06T14:47:11Z

Creators

Daniela Renata Cantane

Animação de fluidos em imagens digitais

Esta tese apresenta uma nova metodologia para animação de objetos líquidos em imagens. Contrariamente às técnicas existentes, este método é baseado em um modelo físico, o que proporciona efeitos realísticos. A perspectiva da imagem é obtida com a intervenção do usuário, por um esquema simples de calibração da câmera, o qual permite a projeção da camada da imagem a ser animada sobre um plano horizontal no espaço tridimensional. As equações de águas rasas conduzem a simulação e as informações de altura são projetadas de volta ao espaço da imagem utilizando traçado de raios. Além disso, efeitos de refração e iluminação são aplicados durante este estágio, resultando em animações realísticas e convincentes

Ano

2022-12-06T14:47:11Z

Creators

Marcos Aurélio Batista