Welcome
Resumen
El objetivo de MOLTO es desarrollar un conjunto de herramientas para traducir textos entre varios idiomas en tiempo real y con alta calidad. Las lenguas son módulos separados en la herramienta y por tanto se pueden cambiar, los prototipos que se construirán cubrirán la mayor parte de los 23 idiomas oficiales de la UE.
Como técnica principal, MOLTO utiliza gramáticas semánticas de dominio específico y interlingua basadas en ontologías. Estos componentes se implementan en GF (Grammatical Framework), un formalismo de gramáticas donde se relacionan varios idiomas a través de una sintaxis abstracta común. El GF se ha aplicado en varios dominios de tamaño pequeño y mediano, típicamente para tratar hasta un total de diez idiomas, pero MOLTO ampliará esto en términos de productividad y aplicabilidad.
Parte de la ampliación se dedicará a aumentar el tamaño de los dominios y el número de idiomas. Una parte importante es hacer que la tecnología sea accesible para expertos del dominio sin experiencia con GFs y reducir al mínimo el esfuerzo necesario para la construcción de un traductor. Idealmente, esto se puede hacer sólo extendiendo un lexicón y escribiendo un conjunto de frases de ejemplo.
Las partes con investigación más intensiva de MOLTO son la interoperabilidad en los dos sentidos entre estándares de ontologías (OWL) y las gramáticas GF, y la extensión de las traducciones basadas en reglas con métodos estadísticos. La interoperabilidad OWL-GF permitirá la interacción multilingüe basada en lenguaje natural con conocimiento válido para las máquinas. Los métodos estadísticos añadirán robustez al sistema. Se desarrollarán nuevos métodos para combinar las gramáticas GF con la traducción estadística en beneficio de ambos.
La tecnología de MOLTO será entregada como librerías de código abierto que podrán ser conectadas a las herramientas de traducción estándar y páginas web y, por tanto, podrán ser integradas en los flujos de trabajo estándar. Se crearán demos web y se aplicará en tres estudios de caso: ejercicios de matemáticas en 15 idiomas, datos de patentes en al menos 3 idiomas, y descripciones de objetos de museos en 15 idiomas.
Los idiomas de MOLTO
En MOLTO, la traducción se basa en GF y su librería de gramáticas (RGL, Resource Grammar Library), que actualment cuenta con los idiomas que se muestran en el siguiente diagrama. Las herramientas de MOLTO permitirán la especialización tanto de la sintaxis abstracta como de los fragmentos del lenguaje para uso idiomático en nuevos dominios de aplicación.
Participantes
- UGOT: University of Gothenburg, Goteborg, Suecia (coordinador)
- UHEL: University of Helsinki, Helsinki, Finlandia
- UPC: Universitat Politècnica de Catalunya, Barcelona, España
- Ontotext: Ontotext AD, Sofia, Bulgaria
- BI: Be Informed, Apeldoorn, Holanda
- UZH: University of Zurich, Zurich, Suiza
Síguenos
Para estar al dia, subscríbete a la sindicación de MOLTO o sigue nuestras noticias en Twitter.
Además, ocasionalmente, transmitimos en directo los eventos de MOLTO. Puedes vernos en Ustream y en YouTube.
Contacto
Háznos llegar tu opinión a través del formulario de contacto de MOLTO.
What links here
No backlinks found.