Análisis comparativo de dos funcionalidades de extracción terminológica: evaluación del desempeño de Sketch Engine vs. Python
Loading...
Date
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Las herramientas informáticas son un recurso indispensable en cualquier área, y las humanidades no son una excepción dado que la incorporación de nuevos softwares y el aprendizaje de estas herramientas resultan beneficiosos para estudiantes e investigadores. Aunque las herramientas que ofrece el mercado varían en su usabilidad, interfaz y curva de aprendizaje, es fundamental poder conocer las opciones existentes para así poder seleccionar la más adecuada según cada tarea.La presente investigación tiene como objetivo evaluar de manera comparada el rendimiento de las funcionalidades de extracción terminológica de dos herramientas informáticas: Sketch Engine y Python. Para medir el desempeño de estas dos herramientas se seleccionaron tres parámetros: precisión, cobertura y puntaje F1, según lo descrito por Vivaldi y Rodríguez (2007). La evaluación requirió de un corpus modelo mediante el cual se realizó la comparación de los resultados. Para ello, este modelo se basó en una extracción terminológica manual a partir de un un corpus especializado en el área de Conservación y Restauración que consta de 15 informes de conservación y asesoría compilados en el marco del proyecto Conservaterm llevado a cabo por Pissolato, Tebé y Montero (2014). Esta extracción manual se comparó con la extracción automática realizada por los dos extractores para poder analizar y comparar su rendimiento. Los resultados muestran que el rendimiento de los extractores es bajo con el corpus de análisis, y que Sketch Engine resulta levemente superior en la tarea de extracción terminológica. Estos hallazgos sugieren que, si bien podemos preferir un extractor u otro dependiendo de la tarea a realizar, siempre es necesaria una extracción manual o un posprocesamiento profundo de los resultados de una extracción automática.
Description
Tesis (Magíster en Traducción)--Pontificia Universidad Católica de Chile, 2025
Keywords
Sketch Engine, Python, NLTK, Extracción terminológica, Procesamiento del lenguaje natural, Conservación-restauración