Progetto “La lingua di Dante e l’E-Taliano. Ricerche e riflessioni”

Progetto “La lingua di Dante e l’E-Taliano. Ricerche e riflessioni”

(approvato in data 4 luglio 2018 dalla “Commissione bandi progettuali per contributi in favore dei Comitati interni della Società Dante Alighieri)

RELAZIONE FINALE

Il progetto, nato da un’idea del prof. Giovanni Di Peio e coordinato insieme con il prof. Giuseppe Benedetti, ha coinvolto tre classi liceali del Liceo Classico Tasso di Roma per un totale di 65 studenti.

La ricerca ha seguito un percorso circolare. Si è partiti dalle riflessioni degli studenti sui loro rapporti con i social network per arrivare a isolare quella varietà linguistica dell’italiano tipicamente implicata nella comunicazione sincrona o quasi sincrona. Gli studenti, tutti nativi digitali, inizialmente hanno ricostruito le più diffuse modalità, in gran parte irriflesse, delle loro interazioni come utenti della rete. Questo primo passaggio ha costituito, soprattutto attraverso l’ascolto delle testimonianze dei pari, l’avvio di un processo di acquisizione di consapevolezza rispetto ad attività considerate naturali e ordinarie.

Un secondo passaggio si è realizzato nell’incontro con il dott. Giorgio Mariani, esperto di sistemi informatici e collaboratore del prof. Tullio De Mauro nella realizzazione del Primo Tesoro della Lingua Letteraria del Novecento, un vocabolario completo, una concordanza di 100 romanzi concorrenti al premio Strega. Il dott. Mariani ha mostrato agli studenti l’evoluzione degli strumenti informatici in rapporto ai cambiamenti dei processi comunicativi e quanto possano essere utili per approfondire gli studi linguistici questi stessi mezzi informatici.

La ricerca si è successivamente concentrata sulla lingua italiana nella rete con il contributo del prof. Giuseppe Benedetti, che si è soffermato in particolare sulla varietà dell’italiano digitato e sulle competenze linguistiche dei nativi digitali.

Il percorso si è concluso con la presentazione dei lavori degli studenti. La verbalizzazione delle proprie considerazioni sull’argomento si è alternata con la proiezione di suggestive immagini fotografiche come contributo alla discussione e con videointerviste incentrate sull’italiano digitato. In particolare, i lavori presentati hanno messo in risalto l’influenza del divario generazionale per alcuni aspetti rilevanti della comunicazione, come, ad esempio, la progettazione, il grande peso degli elementi visivi, che possono addirittura capovolgere il senso proprio delle parole, l’incerto confine tra funzione socializzante e funzione informativa nella comunicazione social, la tendenza alla semplificazione o, comunque, a ridurre la problematizzazione delle questioni trattate, l’estensione dell’oralità, la diffusione di una comunicazione astratta e smaterializzata, ovvero disumanizzata.

CALENDARIO DEGLI INCONTRI

18 OTTOBRE 2018
In occasione della XVIII Settimana della lingua italiana nel mondo, gli studenti partecipanti al progetto (classi IV-V C e VE del Liceo Classico Tasso) hanno trattato, con interventi singoli o di gruppo, il tema “Noi e i social. Testimonianze e riflessioni”.
Coordinatore prof. Giuseppe Benedetti.

28 FEBBRAIO 2019
Il dottor Giorgio Mariani, esperto di linguaggi informatici, ha tenuto agli studenti partecipanti al progetto una relazione sul tema “La lingua nella rete. L’informatica nell’analisi della lingua italiana”.
E’ seguito un dibattito coordinato dal prof. Benedetti.
N.B. Agli atti del Progetto esistono le slide utilizzate dal relatore.

21 MARZO 2019
Il prof. Benedetti ha tenuto agli studenti partecipanti al progetto una relazione sul tema “L’e-taliano”.
E’ seguito un dibattito
N.B. Agli atti del progetto esistono le slide utilizzate dal relatore.

29 MAGGIO 2019
Gli studenti partecipanti al Progetto hanno esposto, con interventi singoli o di gruppo, e con il supporto di slide e/o di foto, le loro “Riflessioni e proposte al termine del lavoro svolto.
Coordinatore degli interventi e del dibattito il prof. Benedetti.

Il presidente del Comitato, prof. Giovanni Di Peio, ha partecipato a tutte le sopra elencate riunioni ed esprime in questa sede il proprio più vivo compiacimento per il lavoro di preparazione e di elaborazione svolto dagli studenti, guidati e accompagnati nelle loro ricerche dal prof. Giuseppe Benedetti e dal Dottor Mariani.
Il grado di consapevolezza da loro raggiunto sulle tematiche trattate è da definirsi eccellente.

ALLEGATI
SINTESI DELLA RELAZIONE DEL PROF. BENEDETTI (All. 1)
Quale rapporto intercorre tra la perdita di certe competenze linguistiche nelle nuove generazioni e la pratica sempre più diffusa della comunicazione veloce in rete? C’è una lingua della rete, e-taliano o italiano digitato che dir si voglia, cioè una lingua condizionata dagli strumenti digitali a cui affidiamo molte delle nostre comunicazioni? Oppure è più pertinente dire che l’italiano scritto è finito nella rete, intrappolato in un vortice di messaggi approssimativi ed evanescenti? Si osserva, giustamente, che non si è mai scritto così tanto. Ma fino a che punto quel diluvio di documenti che si abbatte sulla rete può assimilarsi ai testi scritti come li abbiamo sempre concepiti, fino a che punto sono sovrapponibili digitato e scritto? Dal 2004 si parla del web 2.0 per riferirsi a tutte quelle applicazioni che facilitano l’interazione a distanza. Si tratta di una storia recente, quindi, che può fornire per ora solo indicazioni parziali. I passaggi storici dall’oralità esclusiva alla scrittura e poi dai primi libri stampati ai mass media hanno richiesto lunghi periodi di acclimatamento. Perciò c’è bisogno di un’azione educativa mirata all’uso consapevole della lingua nella rete. Si sfrutti a scuola il flusso continuo di testi digitati per riflettere anche sugli usi e sui registri dell’italiano scritto. Senza contrapporre in modo manicheo scritto e digitato. È necessario, al contrario, educare all’uso dell’italiano digitato, evidenziando le sue peculiarità, soffermandosi sui contesti d’uso e sull’adeguatezza dei registri adoperati. Avendo ben presente che la competenza linguistica si raggiunge per accumulazione e non per sostituzione o sottrazione. Se guardiamo alla fruizione dell’innumerevole massa di testi presenti in rete, spicca la diffusa tendenza ad adottare sistemi di lettura a salti, che isolano il brano di un documento ed esaltano il frammento, il punto specifico o la singola parola. Ci sono termini inglesi per indicare queste pratiche di lettura: “scanning” è la lettura alla ricerca di una parola o di un’informazione, mentre “skimming” è lo scorrimento veloce per farsi un’idea complessiva del testo. Sono pratiche sempre esistite, che però non hanno mai scalzato il concetto di lettura come comprensione, studio, conoscenza. Ma in questo inizio di civiltà digitale la rapidità della comunicazione sembra assurgere a valore assoluto. Se a livello formale ci rimettono i legami sintattici e l’articolazione logica del discorso, sul piano contenutistico ci si adegua con una sistematica semplificazione. Da manuale la tragica vicenda dello shuttle Columbia nel 2003: la commissione d’indagine ha stabilito che l’uso di diapositive PowerPoint al posto di una normale relazione tecnica, con tutti gli anche se e i tuttavia del caso, impedì ai responsabili, allertati di un incidente subito dopo il decollo, di prendere le misure necessarie ed evitare la morte dei sette componenti dell’equipaggio. La semplificazione comunicativa come parzialità e riduzione al frammento di un corpo complesso (in ultima analisi come distorsione della realtà) è una minaccia anche per la scuola e per il sapere critico su cui s’incardina. Tale pratica semplificatrice sembra trovare nella rete un potente alleato. Qui l’italiano digitato, attraverso i social media, sta occupando spazi già riservati allo scritto o al parlato. Si tratta di una varietà condizionata soprattutto dal contesto comunicativo del dialogo quasi sincrono. Infarcita di anglicismi, maccheronismi, dialettismi e abbreviazioni, come tratti distintivi del gergo del gruppo, è una varietà marcata per l’insofferenza nei confronti delle norme ortografiche e grammaticali, carente soprattutto sul piano argomentativo. Opportunamente, quindi, la nuova prova di italiano dell’esame di Stato impegna in questa direzione.

SINTESI DELL’INTERVENTO DEL DOTT. MARIANI (All. 2)
Dopo una breve introduzione su “l’evoluzione tecnologia e l’elaborazione dei dati” nonché su “Internet e Web”, il relatore si è soffermato sul tema “L’informatica nell’analisi della lingua italiana” analizzando le diverse fasi del progetto, pensato in vista delle celebrazioni del 60° anniversario del Premio Strega (anno 2007), con l’obbiettivo di preparare e pubblicare un vocabolario completo, una concordanza o thesaurus o Index locorum dei romanzi che avevano concorso negli anni al Premio.
Fare dei romanzi un corpus, un insieme di testi trasposto su supporto elettronico, indicizzato e interrogabile attraverso le parole che vi appaiono sembrava un modo non retorico di celebrare l’anniversario.
E’ nato così il Primo Tesoro della Lingua Letteraria Italiana del Novecento, a cura di Tullio De Mauro ed altri.
Prima di entrare nell’illustrazione delle caratteristiche e dei risultati del lavoro compiuto, Mariani fornisce utili definizioni relative all’analisi lessicografica. Eccone l’elenco:
Lessicografia (“Scienza e tecnica della registrazione e della definizione formale, funzionale e semantica dei vocaboli e delle unità lessicali di una lingua), Forme (“Qualunque parola, cioè qualunque sequenza di carattere alfanumerico compresa tra spazi bianchi o altri delimitanti – segni di interpunzione- che occorrono nei testi”), Lemma/Lessema (“Una voce del dizionario, alla quale si riconducono – nelle lingue flessive come l’italiano- una o più parole; il lemma ha la forma del singolare per i sostantivi, del singolare maschile per gli aggettivi, dell’infinito per i verbi”), Proprietà di un lemma (“Categoria grammaticale, marca d’uso, provenienza: dialettismo, regionalismo, esotismo, settore tecnico-specialistico”), Polirematico (“Gruppo di parole che ha un significato unitario, non desumibile da quello delle forme che lo compongono, comune nell’uso corrente; per es. veder rosso, essere al verde e nel linguaggio tecnico-specialistico; per es. motore a scoppio, particella elementare), Concordanze (“Repertorio alfabetico delle parole di un’opera o di più opere di un autore, con l’indicazione di tutti i luoghi in cui esse ricorrono”), Lemmatizzazione (“E’ il procedimento che consiste nell’assegnare le diverse forme flesse o invariabili, individuate nei testi oggetto dell’analisi lessicale, ai lemmi che compaiono nel dizionario; per es. vedo, vedevo, vidi vanno ricondotte al lemma vedere”).
A questo punto il relatore è passato alla Descrizione del Corpus la cui composizione ha riguardato 100 romanzi partecipanti al Premio Strega nell’arco di tempo che va dal 1947 al 2006 e cioè da Tempo di uccidere di Ennio Flaviano, vincitore della prima edizione, a Caos calmo di Sandro Veronesi, primo classificato nell’edizione del 2006. Sono stati infatti presi in esame non solo i 60 romanzi vincitori, ma anche altri 40 partecipanti: il tutto per un Totale di pagine pari a 29.043, corrispondenti a un totale di 8.076.576 parole, di 38.399.038 caratteri, di 598.829 frasi.
Quindi, dopo avere specificato i diversi momenti del processo di lemmatizzazione, dalla digitalizzazione del testo con una prima verifica manuale e correzione degli eventuali errori al caricamento dei risultati (data base e statistiche varie) su un DVD, nonché le possibili utilizzazioni dei risultati, Mariani presenta la seguente sintesi dei risultati ottenuti con un lavoro durato circa due anni, impegnando di media 10 “operatori”:
– Numero totale di forme distinte 157.670
– Numero totale di forme hapax 61.165
– Numero totale di lemmi distinti 94.254
– Numero totale di lemmi hapax 37.094
– Numero totale di nomi propri 26.542
– Numero totale di polirematiche 12.916
– Numero totale di polirematiche hapax 4.255

Avviandosi alla conclusione, il relatore ha quindi presentato 4 Indicatori statistici che, applicati al Corpus del Premio Strega, possono essere ovviamente utilizzati al termine di ogni processo di lemmatizzazione. Tali indicatori sono Leggibilità, Ricchezza lessicale, Specificità, Dispersione.
La Leggibilità si misura con il cosiddetto Indice Gulpease che consente di costruire una scala che va da 0 a 100, dove 100 indica la leggibilità più alta e 0 quella più bassa, In generale risulta che testi con un indice di leggibilità ˂ 80 risultano difficili da leggere per chi ha la licenza elementare; quelli con indice ˂ 60 e ˂ 40 risultano difficili da leggere, rispettivamente, da parte di chi possiede la licenza della scuola media e di chi possiede un diploma superiore.
Applicando tale indice al Corpus del Premio Strega risulta che è A caso di Tommaso Landolfi, anno 1975, il libro che presenta l’indice di leggibilità più alto, pari a 83,17, mentre è Danubio di Claudio Magris, anno 1987, quello che presenta l’indice di leggibilità più basso, pari a 48,39
La Ricchezza lessicale si misura con il cosiddetto Indice di Guiraud che mette in rapporto il numero dei diversi vocaboli adoperati in un testo con il numero complessivo delle loro occorrenze.
Dante scrive la Commedia adoperando poco più di 7.000 vocaboli, Manzoni scrive I Promessi Sposi utilizzandone poco più di 10.000. Tra i 100 romanzi “scrutinati” per il Corpus del Premio Strega, solo 15 usano meno di 7.000 parole, mentre 57 superano il numero di 10.000. In particolare, è il romanzo di Giuseppe Berto, Il cielo è rosso (1947), quello che presenta l’Indice di Guiraud più basso, pari a 12,56, mentre quello più alto, pari a 42,28, è di Danubio.
La Specificità è l’indice che rileva la specifica rilevanza di ciascun determinato lemma in un particolare documento o in una sezione di un testo e che può individuare le parole caratterizzate da valori alti dell’indice, cioè le parole-chiave di un testo.
La Dispersione, in un dato corpus di sezioni distinte misura il grado di presenza di un lemma nelle diverse sezioni. La Dispersione è massima per un lemma presente in ogni sezione, è minima per un lemma presente solo in una.
Il dottor Mariani, a questo punto, ha concluso l’intervento, evidenziato come la procedura messa a punto per il Corpus del Premio Strega attraverso l’utilizzazione degli strumenti informatici, possa essere applicata anche ad altre realtà linguistiche, compresa quella dell’italiano digitale.