Análise automática de textos em sistemas de informação

Autores

  • Johann Haller

Palavras-chave:

Linguística. Análise linguística. Indexação automática. Armazenagem da informação. Aplicações de computador. Recuperação da informação.

Resumo

Uma análise linguística completa é um instrumento poderoso para melhorar a capacidade de um sistema automatizado de armazenamento e recuperação de informações. O presente artigo descreve um programa experimental que está sendo desenvolvido na Universidade de Brasília. Os passos da análise linguística são, no presente modelo: segmentação (de um texto em frases e palavras); procura no dicionário e análise morfológica de palavras portuguesas; clareza de homografias sintáticas; construção de uma árvore de dependência; análise de pronomes. Com estes algoritmos, várias contribuições podem ser produzidas para ajudar o indexador humano ou para integrar, junto com processos estatísticos adicionais, um sistema de indexação automática: descritores simples em forma base; descritores compostos (grupos nominais); descritores com peso, baseado nas funções sintáticas dentro da frase; correção estatística com as referências dos pronomes. O programa experimental está sendo testado com várias bases de dados. O desenvolvimento futuro vai se dirigir para a construção de redes semânticas a partir de textos em linguagem natural.

Downloads

Não há dados estatísticos.

Downloads

Publicado

1983-06-01

Como Citar

Haller, J. (1983). Análise automática de textos em sistemas de informação. Revista De Biblioteconomia De Brasília, 11(1), 105–113. Recuperado de https://periodicos.unb.br/index.php/rbbsb/article/view/30249

Edição

Seção

Comunicações