Extração automática de contextos definitórios em textos acadêmicos da ciência da informação
Palabras clave:
contexto definitorio, extracción automática de textos, organización de la información, terminologiaResumen
O trabalho apresenta estudo sobre o papel da Ciência da Informação, sua interdisciplinaridade e interseção com a Linguística e a Ciência da Computação no que se refere à utilização dos textos como fonte de informação e conhecimento a ser organizado ou reorganizado, nos grandes repositórios de informação já existentes, com a finalidade de recuperação. A ênfase é na extração automática de Contextos Definitórios em textos, o que se entende como qualquer fragmento textual que introduz e associa um termo a uma definição. Cita teorias de Organização da Informação como Classificação Facetada de Ranganathan, a teoria do Conceito de Dahlberg e as teorias da terminologia, tais como a Teoria Geral da Terminologia de Wüster e a Teoria Comunicativa da Terminologia de Cabré. Todas as teorias são abordadas com enfoque na importância do termo e principalmente da definição como elemento primordial para o mapeamento semântico de um documento e de um domínio do conhecimento. Enfatiza a visão da definição como elemento de ligação entre os objetos e seus conceitos, identifica tipos de definições, cita estudos anteriores de identificação e extração automática de enunciados definitórios em inglês, espanhol e francês. Menciona as técnicas de Processamento de Linguagem Natural e Descoberta de Conhecimento em Textos como ferramentas para o processamento e extração de informação em documentos escritos em língua natural. Por fim, propõe um método de extração automática de Contextos Definitórios em textos acadêmicos da Ciência da Informação, a partir de uma gramática de padrões definitórios em língua portuguesa criada no âmbito da pesquisa. Entende-se gramática de padrões definitórios como um conjunto de expressões linguísticas capazes de identificar um CD em um texto. A gramática foi validada comparando uma extração manual com uma automática. O método foi aplicado nas teses e dissertações da Faculdade de Ciência da Informação
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2016 Carlos Duarte de Oliveira Junior
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Aviso de derechos de autor/a
Los autores que publican en esta revista concuerdan con los siguientes términos:
Los autores mantiene los derechos autorales y conceden a la revista el derecho de primera publicación, con el trabajo simultáneamente licenciado bajo Creative Commons - Reconocimiento 4.0 Internacional (CC BY 4.0), permitiendo el reparto del trabajo con reconocimiento de la autoría y la publicación inicial en esta revista. Los autores tienen autorización para asumir contratos adicionales separadamente, para la distribución no-exclusiva de la versión del trabajo publicada en esta revista (p.ej.: distribuir en el repositório institucional o publicar como capítulo de libro), con reconocimiento de la autoría y la publicación inicial en esta revista. Los autores tienen permiso y son apoyados a distribuir su trabajo online (p.ej.: en repositórios institucionales o en su página personal) a cualquier punto antes o durante el proceso editorial, ya que eso puede generar efectos productivos, así como aumentar el impacto y la citación del trabajo publicado.