Análise automática de textos em sistemas de informação
Palavras-chave:
Linguística. Análise linguística. Indexação automática. Armazenagem da informação. Aplicações de computador. Recuperação da informação.Resumo
Uma análise linguística completa é um instrumento poderoso para melhorar a capacidade de um sistema automatizado de armazenamento e recuperação de informações. O presente artigo descreve um programa experimental que está sendo desenvolvido na Universidade de Brasília. Os passos da análise linguística são, no presente modelo: segmentação (de um texto em frases e palavras); procura no dicionário e análise morfológica de palavras portuguesas; clareza de homografias sintáticas; construção de uma árvore de dependência; análise de pronomes. Com estes algoritmos, várias contribuições podem ser produzidas para ajudar o indexador humano ou para integrar, junto com processos estatísticos adicionais, um sistema de indexação automática: descritores simples em forma base; descritores compostos (grupos nominais); descritores com peso, baseado nas funções sintáticas dentro da frase; correção estatística com as referências dos pronomes. O programa experimental está sendo testado com várias bases de dados. O desenvolvimento futuro vai se dirigir para a construção de redes semânticas a partir de textos em linguagem natural.
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 1983 Revista de Biblioteconomia de Brasília
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.