test
Search publications, data, projects and authors

Thesis

Spanish

ID: <

http://hdl.handle.net/10251/90174

>

Where these data come from
Efectividad de las transformaciones léxicas y sintácticas en los sistemas de memoria de traducción: memoq

Abstract

El presente trabajo se encuentra enmarcado dentro de los estudios de traducción,concretamente, en lo relativo a la traducción asistida por ordenador (TAO). Dentro de este propio campo, nuestro estudio está enfocado hacia las memorias de traducción (MT), cuyos máximos exponentes en la actualidad son Mitkov (2005) y Orasan (2015), ambos pertenecientes al Grupo de Investigación de Lingüística Computacional (RGCL) de la Universidad de Wolverhampton. El objetivo principal para llevar a cabo este trabajo se basa en la necesidad de comprobar si las MT son suficientemente funcionales como para detectar cambios producidos a nivel semántico y sintáctico y servir realmente de ayuda al traductor o si por el contrario, hay que adecuar las MT a nuevos enfoques. Entre los objetivos secundarios del trabajo, podemos destacar: diseñar un corpus que pueda servir para implementarse en otras MT o incluso utilizarse como recurso de ayuda, crear plantillas para examinar otras MT e implementar los resultados obtenidos en un sistema aplicable en otros trabajos relacionados con la misma línea de investigación. Nuestro trabajo consistirá en crear un corpus paralelo español/inglés con aproximadamente 150 segmentos de una longitud entre 5 y 25 palabras. El corpus ha sido compilado con documentos auténticos y reales en ambos idiomas (español-inglés) con una temática de carácter legislativo para que el léxico no resultara muy complicado y las oraciones no fueran excesivamente largas, y así, permitirnos conseguir el mayor número de transformaciones posibles. Los documentos han sido extraídos de las páginas web de la Unión Europea y de las Naciones unidas, respectivamente. El corpus lo hemos alineado manualmente, para que pudiéramos tener las oraciones enfrentadas y hemos extraído las 150 que hemos considerado más apropiadas para el experimento. Una vez tenemos las oraciones, hemos seleccionado 10 reglas semánticas y sintácticas para aplicar a las oraciones. El paso siguiente es subir el corpus original a la herramienta de traducción, este caso MemoQ, y traducir posteriormente las oraciones transformadas para ver estadísticamente que coincidencia encontramos con las frases originales. Nuestra hipótesis de investigación de partida es que el porcentaje de coincidencia se verá reducido después de realizar las transformaciones de las oraciones originales compiladas en la MT. Esperamos que los resultados muestren la necesidad de mejora de las memorias de traducción, ya que las estadísticas deben mostrar el déficit semántico que existe y por tanto, la necesidad de implementar las memorias de traducción. Esto, a largo plazo, puede significar una evolución en las MT y por tanto un punto de apoyo mayor al que los traductores podrán recurrir. Además, también puede significar la necesidad de introducir el procesamiento del lenguaje natural (PLN) para obtener una mejora sustancial de los sistemas, por ejemplo el uso de paráfrasis o parsing (análisis gramatical). Por último, es destacable mencionar que aunque este estudio es muy concreto, esperamos que en lo consiguiente pueda ser aplicado en otras herramientas de traducción y en otras combinaciones lingüísticas. Incluso sería posible aumentar el corpus de investigación y buscar temáticas más variadas que puedan tener mayor aplicabilidad. Silvestre Baquero, A. (2017). Efectividad de las transformaciones léxicas y sintácticas en los sistemas de memoria de traducción: memoq. http://hdl.handle.net/10251/90174

Your Feedback

Please give us your feedback and help us make GoTriple better.
Fill in our satisfaction questionnaire and tell us what you like about GoTriple!