24-11-2011: Basque-English 0.3.0 Released, read more...

COS'È Apertium?

Apertium è una piattaforma di traduzione automatica libera/di codice aperto, inizialmente pensata per coppie di lingue imparentate, che è stata recentemente espansa per potere trattare coppie di lingue più divergenti (come per esempio inglese-catalano). La piattaforma proporziona

  1. un motore di traduzione indipendente di lingue
  2. strumenti per gestire i dati linguistici necessari per costruire un sistema di traduzione automatica di una coppia di lingue data
  3. dati linguistici per un numero crescente di coppie di lingue

Apertium utilizza traduttori di stati finiti per le operazioni di processamento lessicale (analisi e generazione morfologica, trasferimento lessicale), modelli occulti di Markov per la disambiguità categorica e chunking multitappa basato su stati finiti per il trasferimento superficiale.

Il disegno/progetto iniziale si basa sui sistemi già sviluppati dal gruppo Transducens dell'Università di Alicante, per esempio interNOSTRUM (spagnolo-catalano), e Traductor Universia (spagnolo-portoghese).

È possibile usare Apertium per costruire sistemi di traduzione automatica per una grande varietà di coppie di lingue; per questo Apertium usa formati semplici basati in XML per codificare i dati linguistici necessari (fatti a mano o per conversione di dati esistenti) che si compilano, con gli strumenti proporzionati, nei formati di grande velocità usati dal motore.

Chi sviluppa Apertium?

La piattaforma Apertium è sviluppata dal gruppo di ricerca Transducens del Departament de Llenguatges i Sistemes Informàtics dell'Università di Alacant in collaborazione con Prompsit Language Engineering.

Molti gruppi stanno sviluppando dati linguistici per Apertium.

Transducens e Prompsit stanno sviluppando le coppie

`
  • spagnolo-catalano
  • spagnolo-portoghese
  • catalano-francese
  • occitano-catalano
  • inglese-catalano
il Seminario de Lingüística Informática della Università di Vigo
  • spagnolo–gagliego
e l'Institut Universitari de Lingüística Aplicada della Università Pompeu Fabra en Barcelona
  • occitano-catalano
  • inglese-catalano
  • francese-catalano

Anche molti altri sviluppatori stanno generando nuove coppie. Puoi visitare il repository SVN per visualizzare un'istantanea dell'attuale sviluppo.

Funding

Apertium è uno dei motori di traduzione automatica di codice aperto che cominciarono a svilupparsi all'interno del progetto OpenTrad (2004–2005); Apertium è disegnato per la traduzione tra lingue relazionate (vedi la Documentazione sopra). Il consorzio Opentrad è stato liderato da Eleka Ingeniaritza Linguistikoa.

Il progetto Opentrad ("Traducción automática de código abierto para las lenguas del Estado español") è stato finanziato dal Ministerio de Industria, Turismo y Comercio de España tramite gli incentivi PROFIT con codice FIT340101-2004-0003 e FIT340001-2005-0002.

Recentemente, Apertium è stato anche finanziato dalla Secretaria de Telecomunicacions i Societat de la Informació de Generalitat de Catalunya per sviluppare nuove coppie di lingue e un motore migliorato (Apertium 2.0) per includere coppie più difficili come inglese-catalano e nuovamente il Ministerio de Industria, Turismo y Comercio attraverso l'incentivo PROFIT numero FIT350401-2006-05 (EurOpenTrad).

Il progetto Trautorom ("Traducción automática rumano-español", pacchetto apertium-es-ro) è stato finanziato dal Departamento de Lenguajes y Sistemas Informáticos e dal Vicerrectorado de Extensión Universitaria della Università di Alicante , e dal Ministero degli Affari Esteri della Romania.

Alcune parti di Apertium sono state finanziate anche dall'Università di Alacant.


Funding received from


Prompsit Language Engineering S.L.

MAE