NICHOLAS ROSSETTI

Dottore di ricerca

ciclo: XXXVII


supervisore: Alfonso Gerevini
co-supervisore: Ivan Serina

Titolo della tesi: Learning General Policies for Planning through GPT Models

Le architetture basate sui Transformers, come BERT, GPT e T5, hanno ottenuto risultati eccezionali in diversi compiti di elaborazione del linguaggio naturale (NLP). Oltre a queste capacità testuali, questi modelli di grandi dimensioni (LLM) presentano vari gradi di conoscenza fattuale, ragionamento di senso comune e persino capacità di programmazione. Tuttavia, la loro efficacia nell'eseguire inferenze logiche e nella pianificazione automatica rimane un argomento di dibattito. Infatti, i recenti tentativi di applicare gli LLM alla pianificazione classica hanno prodotto risultati contrastanti. In questa tesi, affrontiamo questa sfida introducendo \model, un modello basato su GPT addestrato da zero su istanze di pianificazione risolte per apprendere una policy per la pianificazione classica. Sfruttando i dati di addestramento dello specifico dominio e incorporando tecniche derivanti della pianificazione automatica, \model è in grado di generare piani soluzione per problemi mai visti all'interno dello stesso dominio, dimostrando una coverage e prestazioni ottime rispetto ad altri approcci di deep learning. Tuttavia, non abbiamo garanzie formali di validità e \model può generare piani non validi che non soddisfano tutti gli obiettivi o contengono azioni con precondizioni non soddisfatte. Per mitigare questi problemi, proponiamo due approcci. In primo luogo, incorporiamo un validatore direttamente nel processo di generazione, che ci permette di eliminare al volo i piani parziali non validi e di generare soluzioni valide. In secondo luogo, combiniamo \model con un pianificatore in grado di riparare piani non validi, \lpg, che perfeziona i piani candidati non validi o incompleti in soluzioni valide. Le nostre valutazioni empiriche su diversi domini di pianificazione classica confermano l'efficacia di queste strategie. In definitiva, questo lavoro dimostra il potenziale dell'integrazione di policy apprese con il ragionamento simbolico.

Produzione scientifica

11573/1724777 - 2024 - Enhancing GPT-Based Planning Policies by Model-Based Plan Validation
Rossetti, N.; Tummolo, M.; Gerevini, A. E.; Olivato, M.; Putelli, L.; Serina, I. - 04b Atto di convegno in volume
congresso: Neural-Symbolic Learning and Reasoning (NeSy 2024) (Barcelona, Spain)
libro: Lecture Notes in Computer Science ((LNAI,volume 14980)) - (9783031711695; 9783031711701)

11573/1724772 - 2024 - Learning General Policies for Planning through GPT Models
Rossetti, N.; Tummolo, M.; Gerevini, A. E.; Putelli, L.; Serina, I.; Chiari, M.; Olivato, M. - 04b Atto di convegno in volume
congresso: International Conference on Automated Planning and Scheduling, ICAPS, 2024 (Banff, Canada)
libro: Proceedings International Conference on Automated Planning and Scheduling - ()

11573/1697118 - 2023 - Recurrent Neural Networks for Daily Estimation of COVID-19 Prognosis with Uncertainty Handling
Rossetti, Nicholas; Gerevini, Alfonso E.; Olivato, Matteo; Putelli, Luca; Chiari, Mattia; Serina, Ivan; Minisci, Davide; Foca, Emanuele - 04b Atto di convegno in volume
congresso: 27th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems (Athens)
libro: Procedia Computer Science, vol 225, 2023 - ()

11573/1671189 - 2022 - Machine Learning Models for Predicting Short-Long Length of Stay of COVID-19 Patients
Olivato, M.; Rossetti, N.; Gerevini, A. E.; Chiari, M.; Putelli, L.; Serina, I. - 04c Atto di convegno in rivista
rivista: PROCEDIA COMPUTER SCIENCE (Amsterdam : Elsevier) pp. 1232-1241 - issn: 1877-0509 - wos: (0) - scopus: 2-s2.0-85143348535 (9)
congresso: 26th International Conference on Knowledge-Based and Intelligent Information and Engineering Systems, KES 2022 (Verona; Italia)

11573/1671193 - 2021 - An Application of Recurrent Neural Networks for Estimating the Prognosis of COVID-19 Patients in Northern Italy
Chiari, M.; Gerevini, A. E.; Olivato, M.; Putelli, L.; Rossetti, N.; Serina, I. - 04b Atto di convegno in volume
congresso: 19th International Conference on Artificial Intelligence in Medicine, AIME 2021 (AIME 2021)
libro: Artificial Intelligence in Medicine - (978-3-030-77210-9)

© Università degli Studi di Roma "La Sapienza" - Piazzale Aldo Moro 5, 00185 Roma