Análise automática de textos em sistemas de informação

Auteurs-es

  • Johann Haller

Mots-clés :

Linguística. Análise linguística. Indexação automática. Armazenagem da informação. Aplicações de computador. Recuperação da informação.

Résumé

Uma análise linguística completa é um instrumento poderoso para melhorar a capacidade de um sistema automatizado de armazenamento e recuperação de informações. O presente artigo descreve um programa experimental que está sendo desenvolvido na Universidade de Brasília. Os passos da análise linguística são, no presente modelo: segmentação (de um texto em frases e palavras); procura no dicionário e análise morfológica de palavras portuguesas; clareza de homografias sintáticas; construção de uma árvore de dependência; análise de pronomes. Com estes algoritmos, várias contribuições podem ser produzidas para ajudar o indexador humano ou para integrar, junto com processos estatísticos adicionais, um sistema de indexação automática: descritores simples em forma base; descritores compostos (grupos nominais); descritores com peso, baseado nas funções sintáticas dentro da frase; correção estatística com as referências dos pronomes. O programa experimental está sendo testado com várias bases de dados. O desenvolvimento futuro vai se dirigir para a construção de redes semânticas a partir de textos em linguagem natural.

Téléchargements

Les données relatives au téléchargement ne sont pas encore disponibles.

Publié-e

1983-06-01

Comment citer

Haller, J. (1983). Análise automática de textos em sistemas de informação. Revista De Biblioteconomia De Brasília, 11(1), 105–113. Consulté à l’adresse https://periodicos.unb.br/index.php/rbbsb/article/view/30249

Numéro

Rubrique

Comunicações