Machine learning e Deep learning
Gli approcci di radiomica possono essere raggruppati in tre gruppi:
- Radiomica tradizionale Nella radiomica tradizionale (hand-crafted radiomics), vengono estratte dalle immagini features di natura matematica, presentate sotto forma di dataset come tabelle, e analizzate tramite modelli di Machine learning (ML) statistici tradizionali o reti neurali.
- Radiomica profonda (deep radiomics) La radiomica profonda (deep radiomics) utilizza modelli di deep learning (DL), in particolare le reti neurali convoluzionali (CNN), per apprendere e estrarre automaticamente le caratteristiche dalle immagini.
- Radiomics end to end deep learning. L’approccio end-to-end DL integra l’intera pipeline di elaborazione delle immagini in un modello DL, prevedendo direttamente le risposte partendo dalle immagini grezze, senza nessun intervento manuale.
Le parole chiave della radiomica
- Features: sono le caratteristiche quantitavive estratte dalle immagini, e possono essere rappresentate in numeri. Esse vanno dalle più semplici basate sull’intensità dei pixels, a quelle legate alla forma (superficie, volume, sfericità…), alle caratteristiche di texture o trama, fino a features astratte e non definite esplicitamente generate negli strati profondi dei neural network.
- Machine Learning e Deep learning Sono i modelli che combinano le features estratte dalle immagini per generare algoritmi in grado di interpretarle. Questi algoritmi vengono “allenati” con dati di imput già categorizzati (per esempio una serie di immagini che sono già state etichettate con la relativa patologia), per poi riuscire a riconoscere quella patologia anche su immagini nuove che l’algoritmo non ha mai “visto”. Questi algoritmi imparano dagli esempi forniti imitando i processi di apprendimento umano e migliorando l’accuratezza nel tempo attraverso l’esperienza.
- Predittori e risposte Gli algoritmi (ML) comprendono una vasta gamma di approcci matematici usati per stimare funzioni che descrivono la relazione tra un input X e una variabile di output Y. A seconda del contesto, le variabili di input sono anche chiamate predittori o variabili indipendenti, mentre le variabili di output possono essere indicate come variabile dipendente, target o risposta. Nella radiomica, i predittori includono sempre le features delle immagini, ma possono anche incorporare variabili cliniche dei pazienti, dati demografici o di laboratorio. La variabile target, invece, può essere quantitativa (es. mesi di sopravvivenza) o qualitativa (es. sottotipo istologico, predizione di recidiva).
Algoritmi di machine learning e deep learning
Gli algoritmi di ML possono essere suddivisi in modelli tradizionali (statistici) e reti neurali.
- Modelli di ML tradizionali. I modelli di ML tradizionali consistono nell’automazione di approcci statistici classici e dei loro derivati, tipicamente rappresentati da formule matematiche, come la regressione lineare: (f(X) = β0 + β1X1 + β2X2 + … + βpXp). Altri esempi includono regressione logistica, alberi decisionali (decision trees DT), support vector machines (SVM), naive Bayes e k-nearest neighbors (KNN). In generale, i modelli di ML tradizionali richiedono meno dati di addestramento e offrono una maggiore interpretabilità e trasparenza, fornendo informazioni più chiare su come le variabili di input influenzano l’output. Tuttavia, le loro capacità computazionali sono più limitate.
- Reti neurali. Le reti neurali invece si ispirano alla struttura biologica del cervello umano. Questi modelli sono costituiti da diversi strati di nodi (neuroni) che elaborano i dati attraverso pesi e funzioni di attivazione. Quando le reti neurali contengono un gran numero di livelli intermedi, vengono chiamate reti neurali profonde (deep neural networks). Il deep learning (DL) utilizza queste reti neurali profonde, consentendo rappresentazioni non lineari più complesse, a scapito di una maggiore difficoltà di interpretazione della loro struttura interna, fenomeno noto come “black box” (l’algoritmo da una risposta ma è impossibile capire come ci sia arrivato).
- Reti neurali convoluzionali. Le reti neurali convoluzionali (CNN) sono un tipo specifico di reti neurali profonde progettate specificamente per l’analisi delle immagini. Esse utilizzano diversi strati convoluzionali che confrontano regioni sovrapposte dell’immagine input con piccole matrici di pesi, note come kernel o filtri, per codificare le features dell’immagine. Sebbene l’aumento del numero di strati migliori la capacità di apprendere pattern complessi, rende anche questi modelli DL più difficili da addestrare. Ciò ha portato a perfezionamenti architetturali, come le connessioni skip e i blocchi bottleneck (come nel ResNet), convoluzioni multi-ramo (GoogLeNet) e metodi ensemble. Le CNN sono ampiamente adottate negli studi radiomici e possono essere utilizzate in modalità end-to-end o per supportare sottocompiti specifici del pipeline radiomico, come l’aumentazione dei dati (data augmentation), l’estrazione di features, la segmentazione delle immagini, la classificazione, la predizione o l’integrazione multimodale.