L’Evoluzione dell’Attribuzione d’Autore nell’Era dei Large Language Models:  Tokenizzazione ed Embedding

Mirko Degli Esposti

L’Evoluzione dell’Attribuzione d’Autore nell’Era dei Large Language Models

Tokenizzazione ed Embedding

Authors

Mirko Degli Esposti

Abstract

I Large Language Models stanno trasformando la filologia attributiva? Il saggio affronta questa questione esaminando in che modo le architetture neurali contemporanee incidano sui fondamenti metodologici e teorici dell’attribuzione d’autore. In particolare, l’analisi si concentra sulla tokenizzazione subword, che frammenta il testo in unità minime funzionali alla previsione statistica, e sugli embedding, che convertono tratti semantici, sintattici e stilistici in configurazioni vettoriali interpretabili nello spazio latente dei modelli. In questo quadro, lo stile non si presenta più soltanto come superficie linguistica o insieme di scelte lessicali e metriche, ma come struttura multidimensionale suscettibile di misurazione computazionale.

Downloads

Published

2026-03-11

How to Cite

Degli Esposti, M. (2026). L’Evoluzione dell’Attribuzione d’Autore nell’Era dei Large Language Models: Tokenizzazione ed Embedding. Cognitive Philology, 18. Retrieved from https://rosa.uniroma1.it/rosa03/cognitive_philology/article/view/19425

Download Citation

Issue

Vol. 18 (2025): Special issue: Proceedings of the Conference “Filologia attributiva. Metodi computazionali a confronto” (Roma, Università degli Studi di Roma Tor Vergata, 21–22 novembre 2024)

Section

Articles