• 49 

CORPUSLAD

UNA RACCOLTA TESTUALE PER LO STUDIO DELLA LINGUA

Nell’ambito del progetto TALES sul trattamento automatico della lingua ladina, avviato nel 1999 in collaborazione con l’Istituto per la ricerca scientifica e tecnologica (IRST) di Trento, sono state create delle raccolte organiche di testi ladini, sia nello standard che nei singoli idiomi. Tale raccolta, denominata CORPUSLAD, è stata in seguito integrata nella piattaforma TALL per ottimizzare l'interazione fra i vari strumenti linguistici disponibili. I corpora qui raccolti (afferenti a tutte le varianti ladine dolomitiche) contengono complessivamente circa 15.500.000 parole. I testi selezionati coprono un periodo che va dall’800 fino ai giorni nostri, con preponderanza di testi appartenenti alla seconda metà del XX secolo. Per garantire un certo equilibrio fra i vari generi, sono stati inseriti sia testi letterari (prosa, poesia, teatro, memorialistica, testi sul folclore e le tradizioni, libri di preghiere), sia testi non letterari (testi giuridici e amministrativi, modulistica, testi di informazione giornalistica e pragmatici, testi di divulgazione scientifica e culturale, testi scolastici).

Attualmente il corpus fassano è quello nella fase più avanzata di elaborazione. La sua strutturazione, che fornisce per ogni testo informazioni rilevanti (data, luogo di provenienza, tipologia testuale, autore), permette di affinare la ricerca secondo una serie di criteri predeterminati.

I corpora sono consultabili tramite il concordancer, uno strumento elaborato ad hoc e rivolto anzitutto al linguista e allo studioso del ladino; esso permette l’analisi dei testi attraverso la ricerca di concordanze, collocazioni e frequenze secondo la modalità KWIC (Keyword In Context, vale a dire che la parola oggetto della ricerca viene mostrata con il suo contesto).

Eventi

Shop

Newsletter

Per restare in contatto con l’Istituto e il Museo e ricevere i nostri aggiornamenti ti invitiamo a iscriverti al nostro nuovo servizio di newsletter.

Cookies | Web Policy | Impressum | Sitemap | P.IVA 00379240229