Nel 2017 ho condiviso su questo blog una piccola provocazione. Dopo l’ennesima risposta paternalistica del mio medico di base, ho immaginato di scrivere invece a un assistente virtuale che ho chiamato R2-D2, in omaggio a Guerre Stellari. La risposta che ho attribuito a R2-D2 era al tempo stesso empatica, personalizzata, utile per me. Concludevo con una domanda: saranno le macchine ad aiutarci a superare il paternalismo nella relazione medico-paziente?
Nove anni dopo, con l’arrivo degli LLM, le chatbot empatiche esistono davvero ma l’interrogativo resta valido. Secondo uno studio di David Chen e colleghi del Princess Margaret Cancer Centre di Toronto, le persone con cancro valutano le risposte dei chatbot come più empatiche di quelle dei medici. La mia fantasia del 2017 è apparentemente diventata realtà. Ma non del tutto. Parlare di empatia per un chatbot rischia di non essere appropriato, visto che al massimo possiamo definirlo mirroring statistico. La situazione è al tempo stesso più problematica e più promettente.
Nel 2025 il Centro Studi SIMeN ha pubblicato un documento curato da Massimiliano Marinelli — Medicina Narrativa e Intelligenza Artificiale. Una breve introduzione — che sintetizza in modo molto efficace rischi e opportunità.
Il testo descrive un paradosso identificato da diversi studiosi: “i sistemi sanitari cercano nell’AI efficienza e standardizzazione; la medicina narrativa insiste sulla singolarità del vissuto, sull’illness script come evento fenomenologico irriducibile”. Il rischio centrale è la nascita di un “(a)iRecord”, dominato dall’algoritmo e dalla presunta oggettività del dato, derivato da una procedura di codifica automatca. Avverte Marinelli: “Quando la sofferenza di una madre — per il futuro dei figli, per esempio — viene compressa in una nota psicosociale o in una checkbox, la narrazione viene ‘dataficata’: trasformata in dato utile al sistema, ma impoverita come fonte di risonanza empatica e di comprensione condivisa. Il rischio, per la MN, è che la parola del paziente venga sì registrata, ma non davvero accolta.”
Sul risultato degli studi come quello di Chen et al., Marinelli segnala che il vero banco di prova dell’empatia non è la messaggistica asincrona, ma la relazione in presenza: “lo spazio in cui si sostengono silenzi, si tollera la confusione, si reggono sguardi che portano notizie che nessuno vorrebbe dare o ricevere”. L’empatia è contestuale e relazionale ed è per gli umani, non per l’AI.
Il dossier segnala poi i rischi più sottili: la passività narrativa del clinico che accetta quasi in blocco i testi generati dall’AI, l’erosione della competenza narrativa, i bias algoritmici che rischiano di produrre una medicina che “sente” meglio certi aspetti e ne ignora altri rilevanti. La proposta richiama il cosiddetto modello “centauro”: distant reading all’AI, close reading all’umano. Bella formula. Come si può applicare nella pratica?
Abbiamo provato a proporre una declinazione concreta con il progetto NARR-ARTI, realizzato con la Medicina di Precisione in Senologia, della Fondazione Policlinico Gemelli, guidata dalla dottoressa Alessandra Fabi, con il contributo incondizionato AstraZeneca.
Le donne con tumore al seno in fase avanzata raccontano la propria esperienza con il diario narrativo digitale DNMLab — validato per utilità e fattibilità in diverse aree terapeutiche. Nel diario sono state integrate le API di ChatGPT, con la garanzia che le storie non vengano utilizzate per l’addestramento del sistema, preservando la privacy. L’AI analizza le narrazioni e genera per ogni paziente la Illness Digital StoryMap (IDS), visibile al team curante.
Vale la pena soffermarsi su come l’analisi viene condotta, perché la scelta metodologica è tutt’altro che neutra. L’analisi tematica con LLM può essere induttiva — l’AI scopre i temi a partire dai testi — oppure deduttiva, cioè l’AI applica un framework di categorie definito a priori dai ricercatori. NARR-ARTI sceglie la seconda strada. Come sottolineano Wilson Ozuem e colleghi nel loro recente framework RIPES pubblicato sull’International Journal of Qualitative Methods, l’approccio induttivo non sorvegliato rischia che l’AI produca output tematicamente coerenti, ma privi di sensibilità contestuale, riproducendo i discorsi dominanti nei dati di addestramento e silenziando le voci più marginali. La scelta deduttiva inverte la direzione: non è l’algoritmo a decidere cosa conta, ma il framework clinico e narrativo costruito dal team.
L’Illness Digital StoryMap è organizzata intorno a tredici temi — andamento della malattia, cure ed esami diagnostici, percorso assistenziale e curanti, status fisico, status psico-emotivo, sessualità, relazioni e affetti, stili di vita, attività, valori e convinzioni, aspettative e progetti, copertura economica, ambiente sociale — che costituiscono la griglia di lettura definita dal team multidisciplinare di curanti ed esperti di medicina narrativa a partire dallo studio PERGIQUAL (Fabi et al., 2025), e modificabile a seconda delle esigenze cliniche.
Per ciascun tema, l’AI classifica ciò che emerge dalla narrazione in due colonne: risorse e problemi. Ma non con item standard: con le parole della persona. La caduta dei capelli, ad esempio, classificata come status fisico–problema, nell’IDS compare come è stata raccontata — e c’è una differenza clinicamente rilevante tra chi scrive ho la testa nuda e chi scrive mi cadono come foglie. L’AI non interpreta quella differenza. La rende visibile al team, la consegna al close reading del clinico.
È in questo incrocio che accade qualcosa che finora, con l’AI non generativa, non eravamo riusciti a ottenere: l’incontro tra l’idiografico e il nomotetico, tra la storia singola e la possibilità di derivarne costanti operative. La narrazione diventa ponte tra due dimensioni epistemologiche che la medicina fatica a tenere insieme: la soggettività irriducibile e la necessità clinica di categorizzare, misurare, agire, senza che l’una annulli l’altra. L’IDS generata con il supporto degli LLM standardizza senza sterilizzare l’unicità di ogni persona.
Cosa cambia, concretamente, nei team curanti? Molto. I clinici faticano a lavorare collettivamente sulla narrazione. Non è mancanza di volontà: è un problema strutturale di tempo, linguaggio condiviso, metodologia. L’IDS si sta dimostrando uno strumento di attivazione del ragionamento collettivo. Un punto di partenza, non un punto di arrivo.
E poi c’è l’effetto che osservo più spesso: i team clinici tendono a sovradimensionare i problemi e a non vedere le risorse. I questionari standardizzati sono costruiti per rilevare i problemi comuni. Le risorse invece sono soggettive per definizione: c’è chi trova una risorsa nel suonare il violino, chi in una passeggiata, chi nel sostegno di un’amica. I questionari non possono coglierle. La narrazione sì. E l’IDS le rende visibili al team — aprendo la strada a una cura che non è solo centrata sul farmaco, ma che considera fondamentali terapie integrate e prescrizione sociale. La disponibilità di strumenti come l’IDS supportata dall’AI rende possibile anche problematizzare il riduzionismo che ancora caratterizza la rappresentazione della qualità di vita in medicina, declinata soprattuto come mitigazione delle tossicità. La qualità di vita è un progetto esistenziale, un insieme di pratiche quotidiane e aspettative future, un insieme articolato di esperienze relazionali in cui le risorse contano quanto i problemi.
Nulla di tutto questo però può funzionare senza la competenza narrativa del team curante. L’AI può alimentarla e supportarla, non sostituirla. Ed è esattamente per questo che la domanda, nove anni dopo il mio R2-D2, non è più se le macchine possano aiutarci. È come le progettiamo — e con quale epistemologia decidiamo cosa devono e non devono fare per noi.