Repositório RCAAP

Um sistema de Pergunta-Resposta para uma base de Documentos

Neste artigo apresentamos a metodologia seguida para a construção de um sistema de pergunta-resposta sobre uma base de documentos em Português. Descrevemos o sistema que tem dois módulos distintos: análise prévia dos documentos (extracção de informação) e processamento das perguntas (recuperação de informação). O nosso sistema procura fazer um processamento, do corpus e da perguntas, suportado em teorias da linguística computacional: análise sintáctica (gramática de restrições), seguida da análise semântica usando a teoria da representação do discurso e finalmente a interpretação semântica/pragmática usando ontologia e inferência lógica. Apresentamos resultados da avaliação do seu desempenho que foi feita sobre dois conjuntos de documentos: textos de dois anos de jornais diários, o Público e a Folha de São Paulo (1994-1995); e um conjunto de documentos jurídicos: decisões do supremo Tribunal, tribunal da Relação e pareceres da Procuradoria Geral da República (cerca de 100.000 documentos).

Ano

2006

Creators

Quaresma, Paulo Rodrigues, Irene Prolo, Carlos A. Vieira, Renata

Termos, relacionamentos e representatividade na indexação de texto para recuperação de informação

Uma das fases da recuperação de informação é a indexação dos textos dos documentos. Nesta fase, um conjunto de descritores (termos e/ou relacionamentos entre termos) descreve conceitos (atômicos e/ou complexos) presentes nos textos. Diversas estratégias com tais finalidades são encontrados na bibliografia, algumas consideram dependência de termos e outras não. Com o objetivo de apresentar uma visão geral das estratégias de representação de textos que consideram dependência de termos, são descritas quatro experiências onde as representatividades dos relacionamentos dependem dos termos componentes (estratégias com índices múltiplos, com árvore binária, com triplas e com famílias morfológicas), três onde as representatividades dos relacionamentos dependem de suas próprias freqüências de ocorrência (estratégias com expressões de índice, com pares lematizados e com expressões ternárias), duas onde os relacionamentos são reconhecidos mas não são utilizados como descritores (estratégias com nodos temáticos e com conexões gramaticais) e uma experiência onde os relacionamentos são eminentemente estatísticos (estratégia com bitermos).

Ano

2006

Creators

Gonzalez, Marco Lima, Vera L. S de Lima, José V. de

Un sistema para la segmentación en proposiciones de textos en español

Resumen: Se describe un sistema dedicado al reconocimiento de proposiciones y de las relaciones jerárquicas entre ellas, para textos en español. Dicho sistema fue concebido para brindar un servicio de base a tareas de extracción de información de texto y de análisis sintáctico. El sistema opera a partir de los resultados de un etiquetador probabilístico. Los conocimientos lingüísticos se expresan en un formalismo de reglas de reescritura, con reglas que permiten una especificación parcial de la parte de reescritura y tomar en cuenta el texto que rodea esta parte (contexto). La descripción se centra en la organización de las reglas en módulos que atacan distintos tipos de problemas lingüísticos, mostrando las sucesivas etapas del análisis completo de una oración ejemplo.

Ano

2006

Creators

Wonsever, Dina Caviglia, Serrana Rosá, Aiala Couto, Javier

Uma ferramenta de autoria para o professor. O que é e o que faz

O objetivo deste trabalho é descrever uma ferramenta de autoria voltada para a produção de materiais de ensino. Parte-se de uma diferenciação entre texto, hipertexto e atividade mediada por computador, caracterizando- se atividade como um artefato capaz de interagir com o usuário. Justifica- se o trabalho pela necessidade de capacitar o professor no uso dessa nova tecnologia, ainda pouco explorada em toda sua potencialidade. Faz-se um levantamento das principais ferramentas disponíveis para o professor, dos recursos que elas devem oferecer e das atividades que elas podem produzir. Seis tipos de atividades são analisadas em detalhe: (1) recuperação de texto, (2) cloze, (3) reordenação, (4) associação, (5) múltipla escolha e (6) perguntas abertas. As vantagens e limitações de uma ferramenta de autoria são também debatidas. Palavras-Chave: Ferramenta de autoria. Ensino a distância. Produção de materiais.CALL. Abstract The objective of this paper is to describe a teacher authoring tool, aimed at designing teaching materials. Initially a difference is made between text, hypertext and computer-mediated activity, which is characterized as an artifact capable of interacting with the user. The study is justified by the need to empower teachers in the use of this new technology, seen as still unexploited in all its potentiality. The main tools, available for the teacher, are surveyed, including the features they offer and the activities they may produce. Six types of activities are analyzed in detail: (1) text recovery, (2) cloze, (3) reordering, (4) matching, (5) multiple choice, and (6) open questions. The advantages and limitations of an authoring tool are also discussed. Key Words: Authoring tools. Distance learning. Materials design. CALL.

Cognitive Adaptation in Translation: an interface between language direction, time, and recursiveness in target text production

Este trabalho foi desenvolvido com três objetivos: (1) investigar, quantitativamente, o processo de tradução de dois grupos de tradutores, diferentes em sua experiência acadêmica e profissional, na tarefa de traduzir do inglês para o português e vice-versa; (2) corroborar, qualitativamente, os dados numéricos com a coleta de protocolos verbais; e (3) apresentar uma definição mensurável para o conceito de recursividade (revisão co-ocorrente com a produção textual). Os resultados mostram que a tradução da língua materna para a língua estrangeira consumiu mais tempo e aumentou a segmentação da tradução em ambos grupos. Entretanto, um aumento de revisões feitas ocorreu apenas no grupo mais experiente. Conclui-se que a recursividade pode ser utilizada como uma medida de adaptação à dificuldade da tarefa de traduzir. Palavras-chave: Processo de Tradução. Translog. Tempo. Recursividade. Abstract The objective of this paper is three-fold: (1) to quantitatively assess the process of translation of two groups of participants with different academic and professional experience, asked to render texts from English into Portuguese and vice-versa; (2) to qualitatively corroborate the figures with think aloud protocols; and (3) to present a measurable definition for the concept of recursiveness (online revision of the text). Results show that translation from the first language into the second language was more timeconsuming and broke down the process into more text segments for both groups; but it only elicited more revision for the more experienced group. In conclusion, the measure of recursiveness is presented as an indicator of adaptive behavior to translation task difficulty. Key words: Translation process. Translog. Time. Recursiveness.

Ano

2006

Creators

Buchweitz, Augusto Alves, Fábio

O Conetivo ‘E/&’ e ‘OU/∨’ na Interface Sintaxe/Semântica/Pragmática

Uma investigação sobre as propriedades lógico-lingüísticas do conetivo ‘E’ em sua função inferencial, tendo em vista as relações entre argumentos formais e informais, na interface externa Lingüística / Lógica Proposicional (LProp), dentro de uma interface interna Semântica / Pragmática. O roteiro da análise apresenta o ‘E’ tal como aparece em sua expressão lógica, seguida de uma descrição de suas ocorrências estruturais, sintáticas, nas formas tradicionais da gramática e de sua caracterização no contexto semântico e pragmático, lugar clássico da problematização para a interface lógica/Linguagem Natural. (LNat)

Preditibilidade: um estudo fundado pela Psicolingüística e pela Informática

No summary/description provided

Ano

2006

Creators

Piccini, Maurício da Silveira Pereira, Vera Wannmacher

A semântica dos adjetivos e os sistemas de extração de informação na web

No summary/description provided

Ano

2006

Creators

Bertoldi, Anderson Chishman, Rove Luiza de Oliveira

Lingüística Computacional: uma breve introdução

Este artigo apresenta a área da Lingüística Computacional, uma área híbrida que envolve pesquisadores da Lingüística e da Informática. A Lingüística Computacional é a parte da ciência lingüística que se preocupa com o tratamento computacional da linguagem, e sua aplicações englobam programas como tradutores automáticos, chatterbots, corretores ortográficos e gramaticais, parsers, entre outros. O conhecimento lingüístico é indispensável para desenvolver tais aplicativos, e somente a interação entre pesquisadores das duas áreas – Lingüística e Informática – pode conquistar bons resultados. Palavras-chave: Lingüística Computacional. Processamento de Linguagem Natural. Abstract This article presents some aspects of Computational Linguistics, a hybrid area that involves both Computational and Linguistic researchers. Computational Linguistics is a part of the linguistic science that is focused on the computational treatment of language. Its applications include programs such as automatic translators, chatterbots, grammar and spelling checkers, parsers, among others. A background in Linguistics is essential for the development of such software and only an interaction between researchers from these two fields – Linguistics and Computer Science – can achieve good results. Key-words: Computational Linguistics. Natural Language Processing.

Editoral

No summary/description provided

Ano

2006

Creators

Silva, Maria Cristina Figueiredo Matos, Gabriela Menuzzi, Sérgio de Moura

Editorial

No summary/description provided

Ano

2006

Creators

Remédios, Maria Luíza Ritzel

Estudos culturais e estudos literários

No summary/description provided

Choram o mesmo, aqueles que ficam

No summary/description provided

Ano

2006

Creators

Brasil, Luiz Antonio de Assis