Tervetuloa
Tiivistelmä
MOLTO-projektin tavoitteena on kehittää työkaluja erikielisten tekstien korkeatasoiseen kääntämiseen tosiaikaisesti. Eri kieliä käsitellään erillisinä moduuleina työkalun sisällä, ja näitä moduuleja voidan vaihdella. Projektin tavoitteena on luoda prototyypit suurimmalle osalle EU:n 23 virallisesta kielestä.
MOLTO on toteutettu aihealueen mukaisten semanttisten kielioppien ja ontologioihin perustuvien interlingua-välikielten avulla. Nämä osat on yhdistetty GF (Grammatical Framework) -kielioppiformalismilla, jossa eri kieliä yhdistää yhteinen abstrakti kielioppi. GF-kielioppeja on käytetty usean keskikokoisen aihealueen toteuttamiseen korkeintaan kymmenellä eri kielellä, mutta MOLTO-järjestelmää ollaan laajentamassa tuottavammaksi.
Osa tätä laajentamista on uusien aihealueiden ja kielten lisääminen. Tärkeämpi osa on tehdä saada työkalut aihealueen asiantuntijoiden ulottuville siten, että niiden käyttö ei edellytä GF-osaamista ja niin, että kielenkääntimen luominen on mahdollisimman vaivatonta. Parhaimmillaan kielenkääntimen luomisen onnistuu laajentamalla käytettävää sanastoa ja kirjoittamalla joukko esimerkkilauseita.
MOLTO-projektin eniten tutkimusta edellyttävät osat ovat ontologiastandardien (esimerkiksi OWL)ja GF-kielioppien välinen yhteinen toiminnallisuus sekä sääntöpohjaisen konekäännöksen yhdistäminen tilastollisiin menetelmiin. OWL- ja GF-toiminnallisuuksien yhdistäminen mahdollistaa monikielisen, luonnolliseen kielen ja koneluettavan tiedon kaksisuuntaisen yhteiskäytön. Tilastollisten menetelmien avulla järjestelmään voidaan haluttaessa lisätä robustiutta. GF-kielioppien ja tilastollisen kääntämisen yhdistämiseen kehitetään uusia menetelmiä, jolloin molempien parhaat puolet saadaan hyödynnettyä.
MOLTO-työkalut julkaistaan avoimen lähdekoodin kirjastoina, jotka voidaan liittää yleisiin käännöstyökaluihin ja web-sivuihin. MOLTO-työkaluja esitellään web-demoissa ja kolmessa eri käyttötapauksessa: matemaattisten tehtävien, patenttitekstien ja museoesineiden kuvausten käännöksissä.
MOLTO-kielet
MOLTO-käännös perustuu GF-formalismiin ja sen resurssikielioppien kirjastoon, joka tällä hetkellä kattaa alla olevan kuvan esittämät kielet. MOLTO-työkalujen avulla voidaan muokata sekä abstraktia kielioppia että sovellusalueen erikoissanontoja vastaamaan uusia käyttötapauksia.
Yhteistyökumppanit
- UGOT: Göteborgin yliopisto, Ruotsi (koordinaattori)
- UHEL: Helsingin yliopisto, Suomi
- UPC: Universitat Politècnica de Catalunya, Barcelona, Espanja
- Ontotext: Ontotext AD, Sofia, Bulgaria
- BI: Be Informed, Apeldoorn, Alankomaat
- UZH: Zürichin yliopisto, Zürich, Sveitsi
Seuraa projektia
Voit tilata MOLTO RSS-syötteen tai lukea Twitter-tiliämme. Lähetämme ajoittain suoratoistovideota MOLTO-tapahtumista. Voit seurata tapahtumia Ustream-palvelussa ja YouTubessa.
Yhteydenotto
Kerro mielipiteesi MOLTO-yhteyslomakkeen avulla.
What links here
No backlinks found.