STRUMENTI INFORMATICI PER IL LADINO

CORRETTORE ORTOGRAFICO COLD

COLD è un sistema di correzione/adattamento web-based per le 3 varianti ladine fassana, gardenese e badiotta e per il Ladin Standard, elaborato in collaborazione con l'Istitut Ladin “Micurà de Rü”. Le banche dati lessicografiche di partenza sono state elaborate ed espanse con un sintetizzatore-analizzatore morfologico (Morpho) sviluppato nel 2002 dall’ ITC-Irst, che ha permesso la creazione del formario fassano per la correzione ortografica.
COLD, similmente ai correttori ortografici disponibili per le lingue maggioritarie, permette non solo di sottoporre a verifica un brano, ma il sistema di correzione è stato integrato con la funzione di adattamento morfologico e sono state migliorate e ampliate le opzioni di correzione, applicando una serie di regole morfologiche e di correzioni puntuali.

NEO - SISTEMA DI NEOLOGIA E TERMINOLOGIA

NEO è una piattaforma integrata per lo sviluppo e il trattamento della neologia e della terminologia, che viene utilizzata attivamente dagli operatori dell'Ufficio Ladino per la Formazione e la Ricerca Didattica (OLFED) della Scuola Ladina di Fassa, in sinergia con i Servizi Linguistici dell'Istituto Culturale Ladino. Tramite un sistema integrato con le banche dati e i dizionari disponibili, vengono inserite le proposte di nuove coniazioni lessicali, che vengono poi sottoposte al processo di controllo e validazione e possono infine essere inserite direttamente nella banca dati del DILF.
Questo strumento ha permesso finora di creare e gestire circa 1200 nuovi termini afferenti discipline scolastiche e campi del sapere, arricchendo in modo significativo il lessico fassano di nuove parole indispensabili per l'utilizzo della lingua ladina in ambito didattico e amministrativo.

TRAD-IT TRADUTTORE ITALIANO - LADINO FASSANO

TRAD-IT sistema di traduzione automatica italiano - ladino fassano è un “traduttore a trasferimento” in grado di analizzare le forme italiane dal punto di vista morfosintattico e di trasferire e riprodurre tali informazioni nella versione ladina.
Il progetto, condotto per la parte propriamente linguistica di ampliamento della base lessicografica dai Servizi Linguistici dell’Istituto Ladino con il supporto dell’Ofize linguistich del Comun General, è stato realizzato nella parte tecnico-informatica dalla ditta SERLING di Udine, formata da linguisti computazionali e esperti informatici, i quali, sulla base dell’analoga esperienza condotta per il friulano, hanno sviluppato il software necessario ad assolvere le funzioni di traduzione, in stretto rapporto di collaborazione con gli operatori della lingua ladina.

TALL

CORPUSLAD

UNA RACCOLTA TESTUALE PER LO STUDIO DELLA LINGUA

Nell’ambito del progetto TALES sul trattamento automatico della lingua ladina, avviato nel 1999 in collaborazione con l’Istituto per la ricerca scientifica e tecnologica (IRST) di Trento, sono state create delle raccolte organiche di testi ladini, sia nello standard che nei singoli idiomi. Tale raccolta, denominata CORPUSLAD, è stata in seguito integrata nella piattaforma TALL per ottimizzare l'interazione fra i vari strumenti linguistici disponibili.
I corpora qui raccolti (afferenti a tutte le varianti ladine dolomitiche) contengono complessivamente circa 15.500.000 parole. I testi selezionati coprono un periodo che va dall’800 fino ai giorni nostri, con preponderanza di testi appartenenti alla seconda metà del XX secolo. Per garantire un certo equilibrio fra i vari generi, sono stati inseriti sia testi letterari (prosa, poesia, teatro, memorialistica, testi sul folclore e le tradizioni, libri di preghiere), sia testi non letterari (testi giuridici e amministrativi, modulistica, testi di informazione giornalistica e pragmatici, testi di divulgazione scientifica e culturale, testi scolastici).

Attualmente il corpus fassano è quello nella fase più avanzata di elaborazione. La sua strutturazione, che fornisce per ogni testo informazioni rilevanti (data, luogo di provenienza, tipologia testuale, autore), permette di affinare la ricerca secondo una serie di criteri predeterminati.

I corpora sono consultabili tramite il concordancer, uno strumento elaborato ad hoc e rivolto anzitutto al linguista e allo studioso del ladino; esso permette l’analisi dei testi attraverso la ricerca di concordanze, collocazioni e frequenze secondo la modalità KWIC (Keyword In Context, vale a dire che la parola oggetto della ricerca viene mostrata con il suo contesto).