L’Evoluzione dell’Attribuzione d’Autore nell’Era dei Large Language Models
Tokenizzazione ed Embedding
Abstract
I Large Language Models stanno trasformando la filologia attributiva? Il saggio affronta questa questione esaminando in che modo le architetture neurali contemporanee incidano sui fondamenti metodologici e teorici dell’attribuzione d’autore. In particolare, l’analisi si concentra sulla tokenizzazione subword, che frammenta il testo in unità minime funzionali alla previsione statistica, e sugli embedding, che convertono tratti semantici, sintattici e stilistici in configurazioni vettoriali interpretabili nello spazio latente dei modelli. In questo quadro, lo stile non si presenta più soltanto come superficie linguistica o insieme di scelte lessicali e metriche, ma come struttura multidimensionale suscettibile di misurazione computazionale.
