Archive | 2019

Etiquetado asistido de documentos de investigación mediante procesamiento de lenguaje natural y tecnologías de la web semántica

 
 
 
 

Abstract


El presente articulo se basa en la implementacion del procesamiento de lenguaje natural (PLN) y las tecnologias de la web semantica, con la intencion de facilitar la extraccion de palabras claves en documentos de investigacion de forma mas eficiente y eficaz. Para tal fin, por medio de una matriz de comparacion se selecciono un algoritmo para realizar el proceso de extraccion. Se eligio el algoritmo Keyword Extraction Based On Entropy Difference (C#) realizado por Zhen YANG, Jianjun LEI, Kefeng FAN y Yingxu LAI. Este algoritmo fue desarrollado para procesarlos documentos en idioma chino, por lo que fue requerida una adaptacion al idioma ingles y espanol anexando los vocabularios de correspondientes a estos idiomas configurando el codigo fuente del algoritmo. Adicionalmente se adapto el algoritmo para que usase una ontologia con la terminologia propia del dominio de conocimiento de ingenierias. El algoritmo fue evaluado por medio de ejemplos de articulos cientificos, obteniendo metricas de recuperacion de la informacion, como son la precision, exhaustividad y el valor F. Se obtuvo como resultado un valor F promedio 0.63 para una muestra de 13 articulos cientificos, lo que valida el algoritmo como optimo para la tarea propuesta.

Volume 23
Pages 528-537
DOI 10.22517/23447214.17721
Language English
Journal None

Full Text