Apertium
Piattaforma libera/di codice aperto per la traduzione automatica
COS'È Apertium?
Apertium è una piattaforma di traduzione automatica libera/di codice aperto, inizialmente pensata per coppie di lingue imparentate, che è stata recentemente espansa per potere trattare coppie di lingue più divergenti (come per esempio inglese-catalano). La piattaforma proporziona
- un motore di traduzione indipendente di lingue
- strumenti per gestire i dati linguistici necessari per costruire un sistema di traduzione automatica di una coppia di lingue data
- dati linguistici per un numero crescente di coppie di lingue
Apertium utilizza traduttori di stati finiti per le operazioni di processamento lessicale (analisi e generazione morfologica, trasferimento lessicale), modelli occulti di Markov per la disambiguità categorica e chunking multitappa basato su stati finiti per il trasferimento superficiale.
Il disegno/progetto iniziale si basa sui sistemi già sviluppati dal gruppo Transducens dell'Università di Alicante, per esempio interNOSTRUM (spagnolo-catalano), e Traductor Universia (spagnolo-portoghese).
È possibile usare Apertium per costruire sistemi di traduzione automatica per una grande varietà di coppie di lingue; per questo Apertium usa formati semplici basati in XML per codificare i dati linguistici necessari (fatti a mano o per conversione di dati esistenti) che si compilano, con gli strumenti proporzionati, nei formati di grande velocità usati dal motore.
Chi sviluppa Apertium?
La piattaforma Apertium è sviluppata dal gruppo di ricerca Transducens del Departament de Llenguatges i Sistemes Informàtics dell'Università di Alacant in collaborazione con Prompsit Language Engineering.
Molti gruppi stanno sviluppando dati linguistici per Apertium.
Transducens e Prompsit stanno sviluppando le coppie
`- spagnolo-catalano
- spagnolo-portoghese
- catalano-francese
- occitano-catalano
- inglese-catalano
- spagnolo–gagliego
- occitano-catalano
- inglese-catalano
- francese-catalano
Anche molti altri sviluppatori stanno generando nuove coppie. Puoi visitare il repository SVN per visualizzare un'istantanea dell'attuale sviluppo.
Funding
Apertium è uno dei motori di traduzione automatica di codice aperto che cominciarono a svilupparsi all'interno del progetto OpenTrad (2004–2005); Apertium è disegnato per la traduzione tra lingue relazionate (vedi la Documentazione sopra). Il consorzio Opentrad è stato liderato da Eleka Ingeniaritza Linguistikoa.
Il progetto Opentrad ("Traducción automática de código abierto para las lenguas del Estado español") è stato finanziato dal Ministerio de Industria, Turismo y Comercio de España tramite gli incentivi PROFIT con codice FIT340101-2004-0003 e FIT340001-2005-0002.
Recentemente, Apertium è stato anche finanziato dalla Secretaria de Telecomunicacions i Societat de la Informació de Generalitat de Catalunya per sviluppare nuove coppie di lingue e un motore migliorato (Apertium 2.0) per includere coppie più difficili come inglese-catalano e nuovamente il Ministerio de Industria, Turismo y Comercio attraverso l'incentivo PROFIT numero FIT350401-2006-05 (EurOpenTrad).
Il progetto Trautorom ("Traducción automática rumano-español", pacchetto apertium-es-ro) è stato finanziato dal Departamento de Lenguajes y Sistemas Informáticos e dal Vicerrectorado de Extensión Universitaria della Università di Alicante , e dal Ministero degli Affari Esteri della Romania.
Alcune parti di Apertium sono state finanziate anche dall'Università di Alacant.