Lessico di frequenza dell'italiano radiofonico (LIR)

Lessico di frequenza della lingua delle principali radio a diffusione nazionale; in collaborazione con il Dipartimento di Italianistica dell’Università degli Studi di Firenze; 1997-2005.

La banca dati testuale e audio è stata progettata con l’intento di creare i presupposti per lo studio della varietà radiofonica di trasmesso. Il primo corpus, rappresentativo delle principali emittenti nazionali, è stato raccolto nel 1995, secondo un prelievo a scacchiera su una settimana di maggio. Le registrazioni, fornite dalle emittenti, sono state trascritte e marcate con il DBT di Eugenio Picchi, che ha poi realizzato una specifica versione del motore di ricerca (DBT-LIR) per la consultazione integrata di testi e file audio (il corpus comprende 64 ore di parlato, 650.000 occorrenze, 86.000 forme; per consistenza comparabile quindi con il LIP di De Mauro). Le trascrizioni sono state allineate alla registrazione e annotate informaticamente in base a generi, tipologie comunicative e parlanti.

A questo primo corpus ne è stato aggiunto un secondo per il 2003, con la stessa modalità di prelievo limitata però alle sole reti RAI (32 ore di parlato, 310.000 occorrenze, 39.000 forme). I due corpora sono interrogabili in contemporanea in modo da permettere, almeno per le reti RAI, una prima valutazione in diacronia dei cambiamenti in atto nella lingua della radio. DBT-LIR consente la ricerca di una forma o gruppi di forme, l’accesso ai dati quantitativi, e infine l’accesso diretto al punto specifico della registrazione con la trascrizione allineata.

La progettazione e la realizzazione del LIR sono state effettuate all’interno di progetti FIRB coordinati da Nicoletta Maraschio, responsabile di unità di ricerca del Dipartimento di Italianistica dell’Università degli Studi di Firenze.
L’Accademia della Crusca ha collaborato attivamente fin dalle prime fasi di attuazione del progetto nel 1995. Il progetto si inserisce infatti nel quadro degli studi sull'italiano parlato che in questi ultimi anni appare particolarmente ricco e innovativo, dall'altra prosegue su una linea di ricerca da tempo seguita dal Centro di Studi di Grammatica Italiana dell'Accademia della Crusca (si possono vedere in proposito i volumi Atti del Seminario sull'italiano parlato, Firenze 1976, La lingua italiana in movimento, Firenze 1982, Gli italiani parlati, Firenze 1985, Gli italiani trasmessi: la radio, Incontro di studio: Firenze, 13-14 maggio 1994, Firenze 1997).
Nell’ambito del progetto FIRB VIVIT è stata realizzata una versione web del LIR, con marcatura XML/TEI, che lo renderà interrogabile anche in modo integrato con il LIT.

I due DVD del LIR (con LIR-DBT) sono per ora consultabili presso l’Accademia della Crusca, in vista della pubblicazione. La versione web sarà disponibile da maggio 2014 con l’inaugurazione del portale VIVIT.