Indexação automática de textos
Mots-clés :
Indexação automática. Aplicações de computador. Linguística computacional.Résumé
Descreve um programa experimental de análise automática de textos desenvolvido na Universidade de Brasília. Os passos da análise lingüística seguidos no presente modelo são: — segmentação (de um texto em frases e palavras); — procura no dicionário e análise morfológica de palavras portuguesas; — desembiguação de homografias sintáticas; — construção de uma árvore de dependência. Com estes algoritmos, várias contribuições podem ser produzidas para ajudar o indexador ou para integrar, junto com processos estatísticos adicionais, um sistema de indexação automática; — descritores simples em forma-base; — descritores compostos (grupos nominais); — descritores com peso, baseado nas funções sintáticas dentro da frase e em traços semânticos, com listas e/ou tesauros. O programa experimental está sendo testado com várias bases de dados.
Téléchargements
Téléchargements
Publié-e
Comment citer
Numéro
Rubrique
Licence
(c) Tous droits réservés Revista de Biblioteconomia de Brasília 1985
Cette œuvre est sous licence Creative Commons Attribution 4.0 International.