Abstract
Un assunto molto diffuso riguardo la varietà linguistica dell’italiano politico è che questa abbia subito una semplificazione nel corso della storia repubblicana. Secondo Antonelli (2007), col passaggio dal “paradigma della superiorità” a quello del “rispecchiamento” il livello stilistico del discorso politico si è abbassato per riflettere quello degli elettori. Tale ipotesi non è mai stata suffragata da metodi statistici applicati a un corpus rappresentativo. Il presente lavoro intende colmare questa lacuna esaminando diverse misure di complessità lessicale nel corpus di italiano politico IMPAQTS.
L’ipotesi della semplificazione è principalmente basata sull’analisi di varietà idiosincratiche o sul confronto tra pochi politici. Ad es., il politichese è rappresentato prototipicamente dai criptici sintagmi neologici di A. Moro (Desideri 1998), e il gentese dallo stile comunicativo “pubblicitario” di S. Berlusconi (Gualdo 2004, tra gli altri). Ricerche condotte con strumenti automatici su campioni di discorso politico con estensione diacronica non hanno finora confermato l’ipotesi della semplificazione (cfr. Giuliano 2016, Ondelli 2020). Inoltre, diversi studi sul discorso politico sui social media ne mettono in luce la densità e varietà lessicale (ad es. Spina 2012, Tavosanis 2016).
Questo studio indaga l’ipotesi della semplificazione con l’ausilio di IMPAQTS (Cominetti et al. 2022), un corpus di recente completamento che raccoglie 1500 discorsi (10 per 150 personalità politiche), pari a 2.65M token di parlato trascritto. I discorsi sono bilanciati per rappresentare i principali tipi di monologo politico: discorso d’aula, comizio, intervento in assemblea di partito e dichiarazioni (in presenza, trasmesse in tv/radio e trasmesse sui nuovi media). Il corpus non è ugualmente bilanciato in diacronia, ma presenta una numerosità crescente rispetto alla progressione temporale: comprende infatti 450 discorsi pronunciati nella Prima Repubblica (1946-1994), 507 nella Seconda e 543 nella Terza (dal 15 marzo 2013 a oggi).
A partire dalla definizione di complessità di Rescher (2020) e dalla proposta di Dahl (2009:51) di usare in linguistica il concetto di complessità effettiva (Gell-Mann, Lloyd 1996), il corpus è stato analizzato con l’indice di fluttuazione della complessità (Bates, Shepard 1993), che misura la volatilità del cambiamento di sorpresa associato alla transizione tra parole successive. Questo indice è complementato dal valore di entropia, ovvero la sorpresa media associata alle parole di un testo, e validato dal confronto con misure di diversità lessicale ampiamente utilizzate in letteratura, quali la R di Guiraud (correzione empirica del rapporto type/token, Guiraud 1954) e MATTR (una correzione statistica dello stesso rapporto, Covington, McFall 2010). I risultati mostrano una tendenza alla semplificazione lessicale in diacronia dalla Prima alla Terza Repubblica, nonostante un relativo aumento di complessità negli anni più recenti che viene messo in relazione alla comparsa del discorso sul Covid-19 (cf. Antonelli et al. 2023).
Nel contributo, gli indici di complessità lessicale vengono illustrati con esempi dal corpus utili a chiarirne l’interpretazione linguistica, con particolare riferimento ai casi che validano l’ipotesi della semplificazione anche a livello idiosincratico, nonché a quelli che ne mostrano una parziale contraddizione. Ad es., tra i testi che registrano valori di complessità in assoluto più bassi si hanno vari discorsi dei politici del M5S, dato che risulta coerente con la “cura della semplicità” (Petrilli 2015:114) osservata nei politici del Movimento (Giovinazzo 2020, Nasi 2021:74), mentre tra i più complessi si segnalano i discorsi di B. Craxi e di vari politici della DC, ma anche discorsi di politici considerati rappresentativi della Seconda Repubblica.