Extração automática de contextos definitórios em textos acadêmicos da ciência da informação

Autores

  • Carlos Duarte de Oliveira Junior Universidade de Brasília - UnB

Palavras-chave:

contexto definitório, extração automática de textos, organização da informação, terminologia

Resumo

O trabalho apresenta estudo sobre o papel da Ciência da Informação, sua interdisciplinaridade e interseção com a Linguística e a Ciência da Computação no que se refere à utilização dos textos como fonte de informação e conhecimento a ser organizado ou reorganizado, nos grandes repositórios de informação já existentes, com a finalidade de recuperação. A ênfase é na extração automática de Contextos Definitórios em textos, o que se entende como qualquer fragmento textual que introduz e associa um termo a uma definição. Cita teorias de Organização da Informação como Classificação Facetada de Ranganathan, a teoria do Conceito de Dahlberg e as teorias da terminologia, tais como a Teoria Geral da Terminologia de Wüster e a Teoria Comunicativa da Terminologia de Cabré. Todas as teorias são abordadas com enfoque na importância do termo e principalmente da definição como elemento primordial para o mapeamento semântico de um documento e de um domínio do conhecimento. Enfatiza a visão da definição como elemento de ligação entre os objetos e seus conceitos, identifica tipos de definições, cita estudos anteriores de identificação e extração automática de enunciados definitórios em inglês, espanhol e francês. Menciona as técnicas de Processamento de Linguagem Natural e Descoberta de Conhecimento em Textos como ferramentas para o processamento e extração de informação em documentos escritos em língua natural. Por fim, propõe um método de extração automática de Contextos Definitórios em textos acadêmicos da Ciência da Informação, a partir de uma gramática de padrões definitórios em língua portuguesa criada no âmbito da pesquisa. Entende-se gramática de padrões definitórios como um conjunto de expressões linguísticas capazes de identificar um CD em um texto. A gramática foi validada comparando uma extração manual com uma automática. O método foi aplicado nas teses e dissertações da Faculdade de Ciência da Informação

Downloads

Não há dados estatísticos.

Biografia do Autor

Carlos Duarte de Oliveira Junior, Universidade de Brasília - UnB

Possui mestrado em Ciência da Informação na Universidade de Brasília - UNB(2012). Tem especialização em Redes de Computadores pela União Educacional de Brasília (1999). Desde a graduação atua no desenvolvimento de sistemas de informação em Ciência e Tecnologia. Atualmente é analista de sistemas do Centro de Gestão e Estudos Estratégicos (CGEE). Possui experiência na implantação de sistemas computacionais e de internet com ênfase na gestão, disseminação e recuperação da Informação.

Downloads

Publicado

2016-03-02

Como Citar

Oliveira Junior, C. D. de. (2016). Extração automática de contextos definitórios em textos acadêmicos da ciência da informação. Revista Ibero-Americana De Ciência Da Informação, 9(1), 324. Recuperado de https://periodicos.unb.br/index.php/RICI/article/view/2264

Edição

Seção

Resumo de teses e dissertações