È noto che la comunicazione istituzionale e la lingua amministrativa non sono sempre accessibili a ampie fette della popolazione italiana (PIEMONTESE 2023a, 2023b). Il contributo mette a confronto l’attività di semplificazione manuale di alcuni testi amministrativi con la semplificazione automatica ottenuta utilizzando modelli di intelligenza artificiale (d’ora in poi preferiamo usare l’acronimo inglese e quindi useremo AI) basati sui Large Language Models (d’ora in poi LLMs) allo scopo di valutare similitudini e differenze tra i due metodi di semplificazione per validare il futuro sviluppo di un applicativo di semplificazione automatica dei testi basato su modelli di AI (che sarà denominato sempl.it). Per valutare contrastivamente la semplificazione manuale (umana) e quella automatica (AI) occorre disporre di una metrica per la misurazione della complessità / semplicità della lingua di un testo (FIORENTINO/GANFI 2024), in modo da verificare innanzitutto se le trasformazioni applicate al testo migliorano le metriche, ossia aumentano gli indici di leggibilità. In vista di addestrare un modello di AI basato sui LLMs specializzandolo nella semplificazione automatica di testi amministrativi occorre altresì disporre di un corpus di testi amministrativi di varie tipologie (VELLUTINO 2018). La prima parte del contributo introduce il tema della semplificazione della lingua amministrativa e in generale della comunicazione istituzionale semplice; la parte centrale presenta e discute l’impostazione dello studio sperimentale e i risultati della comparazione tra semplificazione manuale e semplificazione automatica. Nelle conclusioni ci si sofferma sulle prospettive future, tenuto conto dell’esistenza di alcune criticità relativamente all’affidabilità delle operazioni automatiche di semplificazione di testi (cfr. anche DE CESARE, 2023; TAVOSANIS 2024; FIORENTINO/TAVOSANIS in corso di stampa).
Umano vs AI: alcune considerazioni sulla semplificazione manuale e automatica del corpus ItaIst.
Giuliana Fiorentino
2025-01-01
Abstract
È noto che la comunicazione istituzionale e la lingua amministrativa non sono sempre accessibili a ampie fette della popolazione italiana (PIEMONTESE 2023a, 2023b). Il contributo mette a confronto l’attività di semplificazione manuale di alcuni testi amministrativi con la semplificazione automatica ottenuta utilizzando modelli di intelligenza artificiale (d’ora in poi preferiamo usare l’acronimo inglese e quindi useremo AI) basati sui Large Language Models (d’ora in poi LLMs) allo scopo di valutare similitudini e differenze tra i due metodi di semplificazione per validare il futuro sviluppo di un applicativo di semplificazione automatica dei testi basato su modelli di AI (che sarà denominato sempl.it). Per valutare contrastivamente la semplificazione manuale (umana) e quella automatica (AI) occorre disporre di una metrica per la misurazione della complessità / semplicità della lingua di un testo (FIORENTINO/GANFI 2024), in modo da verificare innanzitutto se le trasformazioni applicate al testo migliorano le metriche, ossia aumentano gli indici di leggibilità. In vista di addestrare un modello di AI basato sui LLMs specializzandolo nella semplificazione automatica di testi amministrativi occorre altresì disporre di un corpus di testi amministrativi di varie tipologie (VELLUTINO 2018). La prima parte del contributo introduce il tema della semplificazione della lingua amministrativa e in generale della comunicazione istituzionale semplice; la parte centrale presenta e discute l’impostazione dello studio sperimentale e i risultati della comparazione tra semplificazione manuale e semplificazione automatica. Nelle conclusioni ci si sofferma sulle prospettive future, tenuto conto dell’esistenza di alcune criticità relativamente all’affidabilità delle operazioni automatiche di semplificazione di testi (cfr. anche DE CESARE, 2023; TAVOSANIS 2024; FIORENTINO/TAVOSANIS in corso di stampa).I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.


