• Home
  • News
  • Il Programma di Intelligenza Artificiale Multimodale su Diverse Scale con Florian Jug

Il Programma di Intelligenza Artificiale Multimodale su Diverse Scale con Florian Jug

Il nuovo Programma di Intelligenza Artificiale Multimodale su Diverse Scale, all’interno del Centro di Ricerca di Biologia Computazionale di Human Technopole, sviluppa metodi di intelligenza artificiale che collegano dati biologici attraverso modalità e scale diverse, dalle molecole e cellule fino ai tessuti, agli organi, ai pazienti e alle popolazioni.

Guidato da Florian Jug, il Programma combina machine learning, modellazione generativa e probabilistica, computer vision e analisi delle bioimmagini, con un forte impegno verso strumenti consapevoli dell’incertezza, aperti e FAIR. La sua ambizione è chiara: fare dell’IA un partner affidabile per la ricerca biomedica e, nel tempo, per la salute umana.

Florian, perché Human Technopole lancia questo nuovo Programma proprio ora? A quale esigenza scientifica intende rispondere?

La ricerca biomedica sta cambiando simultaneamente su due fronti. Il primo è quello dei dati: oggi possiamo generare strutture cryo EM, trascrittomi spaziali, atlanti a singola cellula, ampie coorti cliniche e cartelle cliniche elettroniche longitudinali con un livello di profondità che, anche solo un decennio fa, sarebbe sembrato irrealistico. Il secondo è l’IA: i metodi moderni sono finalmente diventati abbastanza potenti da iniziare a dare un senso concreto a questi dati.

Il problema è che queste due trasformazioni sono cresciute in stanze separate. Esistono strumenti di IA eccellenti per la microscopia. Altri strumenti altrettanto eccellenti esistono per le omiche a singola cellula, per la trascrittomica spaziale o per la previsione del rischio clinico. La biologia, però, non rispetta queste pareti. Una malattia di norma inizia come un evento molecolare, si propaga attraverso cellule e tessuti, si manifesta in un organo ed è modellata dal resto della vita di una persona. Per comprendere e intervenire lungo una traiettoria di questo tipo, abbiamo bisogno di un’IA capace di muoversi insieme alla biologia — tra diverse modalità di dati e tra diverse scale.

Colmare questo divario è esattamente l’obiettivo del Programma di Intelligenza Artificiale Multimodale su Diverse Scale. E questo è il momento giusto per farlo: i metodi di cui abbiamo bisogno — modelli consapevoli dell’incertezza, apprendimento di rappresentazioni multimodali, IA informata dalla fisica e IA causale — stanno maturando rapidamente e, francamente, chiedono di essere combinati. La nostra ambizione è che l’IA diventi un partner realmente affidabile per gli scienziati biomedici, in HT e oltre, e le condizioni per costruire questa partnership sono finalmente presenti.

Qual è la principale domanda biologica a cui il vostro Programma mira a contribuire nei prossimi anni?

Vogliamo essere in grado di prevedere, con un’incertezza calibrata, come eventi molecolari e cellulari plasmino la malattia a livello del paziente, e farlo simultaneamente su molte scale.

In termini concreti: dato una struttura cryo EM, un trascrittoma spaziale e la traiettoria clinica di un paziente, possiamo identificare quali interventi hanno maggiori probabilità di modificare la progressione della malattia, e di quanto? Questa è la domanda generale. Al suo interno rientrano quesiti specifici lungo il nostro portafoglio di ricerca: come l’architettura molecolare delle ciglia si colleghi alle ciliopatie; come l’imaging del tessuto mammario e la storia clinica del paziente codifichino insieme il rischio di cancro; come istologia, trascrittomica spaziale e genomica possano insieme prevedere la progressione della malattia. Si tratta di aree applicative molto diverse, ma condividono la stessa sfida metodologica di fondo, ed è proprio questa la sfida che vogliamo affrontare.

Il Piano Strategico di HT si concentra sulla ricerca multiscala, dalle molecole alle popolazioni. Dove si colloca il vostro Programma all’interno di questa visione e quali ponti contribuirà a costruire?

La nostra ricerca si colloca nel cuore metodologico della visione multiscala di HT. Non presidiamo una singola scala biologica; costruiamo l’IA che permette alle diverse scale di dialogare tra loro.

In concreto, creiamo ponti tra la biologia strutturale e la cryo‑EM, da un lato, e le omiche spaziali e la microscopia ottica avanzata, dall’altro; colleghiamo poi queste aree alla genomica a singola cellula e di popolazione; e connettiamo tutto ciò alle coorti cliniche e ai dati sanitari che sostengono le ambizioni traslazionali di HT. In stretta sinergia con il Flagship Research Programme sulla IA Scientifica di HT, forniamo la base metodologica condivisa — modelli consapevoli dell’incertezza, spazi latenti multimodali, IA informata dalla fisica e IA causale — su cui il resto di HT può innestarsi. L’obiettivo è offrire a tutta la ricerca biomedica di HT una struttura portante comune.

HT è, francamente, il contesto ideale per un’agenda di questo tipo. È abbastanza piccolo da restare flessibile e agile — le decisioni possono essere rapide e le persone dei diversi Centres si conoscono davvero bene — e allo stesso tempo copre sotto un unico tetto l’intero spettro delle competenze biomediche di cui abbiamo bisogno, dalla biologia strutturale fino alle popolazioni. Questa combinazione è rara e, in questo caso, preziosissima.

Quali nuove competenze, tecnologie o modalità di lavoro porterà il Programma nell’ecosistema di ricerca di HT?

Direi soprattutto tre cose. Primo, una competenza profonda nel toolkit dell’IA moderna: Transformers, modelli state space, modelli di diffusione e basati sui flussi, metodi variazionali e causali, explainable AI e controfattuali. Tutto questo, però, viene applicato a problemi biomedici, così da contribuire ad accelerare la scoperta scientifica per i nostri colleghi di HT, in Italia e nel mondo.

Secondo, un impegno serio verso l’incertezza. Consideriamo “ciò che il modello non sa” come un output di primo livello. Nella nostra esperienza è questo che trasforma l’IA da oracolo inaffidabile in qualcosa con cui uno scienziato, o un clinico, può realmente lavorare: l’IA come partner affidabile.

Terzo, una modalità di lavoro che prende sul serio software aperto, FAIR e di livello professionale. Attraverso il nostro coinvolgimento, per esempio, in AI4Life e nel Bioimage Model Zoo, sappiamo già come trasformare codice di ricerca in strumenti che altri scienziati usano ogni giorno. Misureremo il nostro impatto non solo con le pubblicazioni, ma anche con i metodi che verranno adottati dalla comunità più ampia.

La collaborazione tra discipline è centrale nella missione di HT. Quali Centri di Ricerca, Piattaforme Nazionali o Flagship Research Programmes considera i partner più naturali?

Quasi tutto HT, a dire il vero — ed è proprio questo il punto. Ma, se devo indicare i partner quotidiani più naturali: il Centro di Ricerca di Biologia Strutturale e la Piattaforma Nazionale di Biologia Strutturale, dove stiamo integrando cryo ET e omiche spaziali nel contesto delle ciliopatie; i Centri di Ricerca di Genomica e Neurogenomica, con cui prevediamo di costruire atlanti multimodali che combinano istologia, trascrittomica spaziale e sequenziamento dell’intero genoma; il Centro di Ricerca Health Data Science, che ci collega a grandi coorti cliniche e ad approcci multimodali alla previsione del rischio di malattia; la Piattaforma Nazionale di Editing Genomico e Modelli di Malattia e la Piattaforma Nazionale di Microscopia Ottica, dove i readout basati su immagini alimentano direttamente i nostri modelli. Storicamente, ho sviluppato metodi e strumenti molto usati per l’analisi di dati di microscopia e, nel mio gruppo, continueremo certamente anche questa linea di ricerca.

Per quanto riguarda i Flagship Research Programmes, IA Scientifica è il nostro partner più vicino per definizione. I programme su Ciliopatie, malattie cardiovascolari e metaboliche e Immunogenomica e cancro sono gli ambiti in cui i nostri metodi, e quelli degli altri gruppi di HT con una forte componente AI, verranno messi alla prova sulle reali domande biomediche che contano.

Per chi è esterno al vostro campo, può essere difficile capire perché la ricerca di base sia importante per la salute umana. Può fare un esempio concreto di come il lavoro del vostro Programma possa aprire nuove opportunità per comprendere, prevenire o trattare le malattie?

Pensiamo allo screening del tumore al seno. Oggi la mammografia fornisce un’istantanea della mammella; una cartella clinica elettronica offre una lunga lista di fattori di rischio; e, quando disponibili, dati genomici e di stile di vita si trovano in un ulteriore silo. Un clinico deve integrare tutto questo nella propria mente, spesso sotto pressione temporale.

Stiamo lavorando su modelli di IA che integrano in modo nativo questi diversi flussi di dati e, cosa per noi molto importante, sono in grado di comunicare quanto siano sicuri delle proprie previsioni. Invece di restituire un singolo numero, il sistema può dire: “Sulla base dell’imaging di questa donna, della sua storia familiare e della sua traiettoria negli ultimi dieci anni, il suo rischio a cinque anni è X, con un’incertezza Y, e le caratteristiche dell’immagine che guidano questa previsione sono queste”. È proprio questo tipo di output che consente a un radiologo di fidarsi dell’IA come partner, anziché considerarla una scatola nera.

La stessa logica — integrazione multimodale, incertezza calibrata, spiegabilità — si applica alle malattie neurodegenerative, alle ciliopatie e a molte altre patologie in cui oggi utilizziamo poco i dati che possediamo o che potremmo decidere di acquisire.

Che tipo di persone volete attrarre nel vostro Programma? Quali competenze scientifiche, ma anche quali atteggiamenti, saranno fondamentali per costruire il team?

Dal punto di vista delle competenze, cerchiamo solide basi in AI e machine learning — deep learning moderno, modellazione probabilistica, ottimizzazione, inferenza causale — abbinate a una reale curiosità per la biomedicina. Abbiamo anche bisogno di eccellenti research software engineers: persone per cui costruire strumenti robusti, aperti e riutilizzabili è un mestiere, non un ripensamento.

Quanto all’atteggiamento, per me contano tre cose. Primo, la generosità intellettuale: la disponibilità a dedicare tempo per comprendere i dati di un collaboratore prima di correre verso un modello. Secondo, la pazienza: un’IA biomedica significativa non produce necessariamente un paper ogni sei mesi, e noi lavoriamo su un orizzonte più lungo. Terzo, una mentalità da costruttori: persone a cui importa che il proprio lavoro non sia solo pubblicato, ma venga davvero usato da altri. Se queste tre cose ti descrivono, qui troverai il tuo posto, indipendentemente dalla disciplina da cui provieni.

Di recente ho raccolto la “mentalità” con cui lavoriamo in 20 ISMs. Se ti interessa, dagli un’occhiata!

Guardando al futuro, se ci incontrassimo di nuovo tra cinque anni, quale risultato, cambiamento o nuova capacità spererebbe che questo Programma avesse reso possibile, per HT e per la comunità scientifica più ampia?

Mi piacerebbe poter indicare due tipi di impatto.

Primo, sulla scienza. In almeno un ambito di malattia — molto probabilmente il rischio di tumore al seno, o forse una ciliopatia — i nostri modelli multimodali e consapevoli dell’incertezza dovrebbero far parte di una pipeline operativa che abbia cambiato il modo in cui la domanda viene affrontata, sia all’interno di HT sia oltre. Non come dimostrazione, ma come parte del modo in cui scienziati e clinici svolgono il proprio lavoro.

Secondo, sull’ecosistema. Spero di vedere un insieme di strumenti di IA aperti e ben progettati utilizzati regolarmente dai laboratori in tutta Europa e oltre. Usati perché sono validi e perché rendono possibile una ricerca reale. Se, tra cinque anni, una ricercatrice o un ricercatore a Milano, Monaco, Madrid o Mumbai starà risolvendo un problema biologico con un metodo o uno strumento costruito da noi, allora avremo fatto il nostro lavoro.

Condividi:

  • Facebook
  • Twitter
  • LinkedIn
  • Email

Ti potrebbe anche interessare: