Ricorrenze, ambiguità e rivelazioni di un italiano osservato da fuori
A volte, per capire davvero come funziona una lingua, bisogna guardarla da un’angolazione insolita. Non più come un insieme di regole da ricordare, ma come un organismo che lascia tracce, abitudini, ricorrenze. È da questa prospettiva che nasce la linguistica computazionale: dall’idea di osservare l’italiano attraverso grandi quantità di frasi, lasciando che siano i dati a mostrare ciò che i parlanti fanno senza accorgersene.
La sua storia comincia nel secondo dopoguerra, quando si tenta di automatizzare la traduzione tra lingue naturali. L’idea era semplice: se si potesse scomporre una frase nelle sue parti e ricomporla in un’altra lingua seguendo regole formali, la traduzione sarebbe un’operazione meccanica. L’idea si rivelò ingenua, ma aprì la strada a un’intuizione decisiva: per far lavorare una macchina sulla lingua, bisogna prima capire la lingua con un rigore che spesso sfugge all’intuizione umana. Da qui nascono le grammatiche formali, i modelli sintattici, le rappresentazioni del significato, i grandi archivi di testi annotati. Ogni volta che si tenta di fare eseguire a un computiere (sic!) ciò che un parlante fa senza pensarci, si scopre quanto sia complessa la nostra competenza linguistica.
Uno dei concetti più utili è quello delle ricorrenze, cioè delle forme che ritornano. Non c’è nulla di tecnico: una ricorrenza è un’abitudine della lingua. Se in migliaia di frasi trovi che dopo andare a compare quasi sempre un luogo, quella è una ricorrenza. Se noti che più… che introduce quasi sempre un confronto, è un’altra ricorrenza. La lingua, come le persone, ha gesti che ripete senza pensarci. E proprio osservando queste ripetizioni si capisce come funziona davvero.
Accanto alle ricorrenze c’è l’analisi automatica delle frasi. Anche qui, niente misteri: è un programma che scompone una frase per capire chi fa cosa, proprio come un insegnante che indica soggetto, verbo e complementi. La macchina non “capisce” come un essere umano, ma riconosce combinazioni tipiche, posizioni ricorrenti, modi abituali di costruire una frase. È un modo per trasformare l’intuizione in qualcosa che si può misurare.
La parte più affascinante arriva quando questi strumenti sbagliano. Perché quando sbagliano, rivelano qualcosa. Se un sistema automatico non riesce a interpretare una frase, spesso è perché quella frase contiene un’ambiguità che noi risolviamo senza pensarci. Se confonde un accordo, è perché nei testi reali quell’accordo non è così regolare come immaginiamo. Ogni errore della macchina diventa una lente che ingrandisce un tratto dell’italiano. È come se la lingua, messa sotto pressione, mostrasse le sue pieghe più nascoste.
La linguistica computazionale serve proprio a questo: vedere la lingua da fuori, come un organismo che lascia tracce, abitudini, ricorrenze. Non sostituisce la linguistica tradizionale, ma la completa. Mostra ciò che i parlanti fanno davvero, non ciò che credono di fare. E in questo sguardo esterno c’è una forma di verità che sorprende: la lingua non è solo un patrimonio culturale, ma un sistema vivo, pieno di regolarità e di deviazioni, di logiche e di eccezioni. La lingua non si svela a chi la interroga: si svela a chi la osserva abbastanza a lungo.
***
La lingua "biforcuta" della stampa
… intercettato un "oggetto aereo sospetto" entrato dallo Libano nello spazio aereo di Israele …
*
Ieri il sito di Reuters aveva scritto che gli Emirati Arabi Uniti aveva accettato di sbloccare miliardi di dollari per l'Iran.
*
C'è chi arrivare a ipotizzare, addirittura, uno scambio settimanale di messaggi.
*
L'ultima è avvenuta qualche giorno fa, quando la special raprelatrice speciale dell'Onu si è scagliata contro Sonja Bohl-Dencker …
*
Guerra in Iran, Trump: "Andiamo ben d'accordo con la uova leadership di Teheran".
*
L'annuncio del premier del Pakistan: "Raggiunto accordo di pace tra USA e Iran". Trump: "O"
*
"Il testo del memorandum d'intesa è stato finalizzato e la firma ufficiale del memorandum d'intesa avrà luogo a Islamabad venerdì in Svizzera". Lo conferma il viceministro degli Esteri iraniano.

Nessun commento:
Posta un commento