L’elettrocardiogramma diventa multilingue! Ecco come

I modelli multilingue possono sovra-performare le loro controparti monolingua, fenomeno definito informalmente come la benedizione del multilinguismo

L’elettrocardiogramma (ECG) è una ricca fonte di informazioni sullo stato di salute di un paziente. Tuttavia, è spesso necessario un cardiologo esperto per interpretare i dati. Pertanto, l’uso della visione artificiale e dei metodi di elaborazione del linguaggio naturale sarebbe prezioso.

Un recente studio condotto da un team di ricercatori dell’Università di Oxford suggerisce un metodo per convertire un segnale cardiaco in un rapporto testuale clinico in più lingue.

- Advertisement -

Viene proposto un metodo di apprendimento della rappresentazione linguistica. I token in una sequenza vengono selezionati casualmente e sostituiti con token di lingue diverse. Quindi, la rete classifica la lingua dei token. L’approccio suggerito si comporta alla pari con modelli all’avanguardia. Può catturare condizioni mediche di alto livello riflesse nell’ECG e genera testo diversificato. Viene dimostrato che i modelli multilingue a volte possono sovra-performare quelli monolingua.

I segnali cardiaci, come l’elettrocardiogramma, trasmettono una quantità significativa di informazioni sullo stato di salute di un paziente che è tipicamente riassunto sotto forma di un rapporto clinico, un processo ingombrante che è soggetto a errori. Per semplificare questo processo di routine, proponiamo una rete neurale profonda in grado di riportare in didascalia i segnali cardiaci; ricevere un segnale cardiaco come input e generare un rapporto clinico come output. Estendiamo ulteriormente questo processo per generare relazioni multilingue. A tal fine, il team creerà e renderà disponibile al pubblico un set di dati multilingue per i report clinici. In assenza di dati etichettati sufficienti, le reti neurali profonde possono beneficiare di una procedura di avvio a caldo, o pre-training, in cui i parametri vengono appresi per la prima volta in un compito arbitrario. Proponiamo tale compito sotto forma di pre-formazione multilingue discriminante in cui i token dei rapporti clinici vengono sostituiti casualmente con quelli di altre lingue e la rete ha il compito di prevedere la lingua di tutti i token. Mostriamo che il nostro metodo funziona alla pari con metodi di pre-formazione all’avanguardia come MLM, ELECTRA e MARGE, generando allo stesso tempo rapporti clinici diversi e plausibili. Dimostriamo inoltre che i modelli multilingue possono sovra-performare le loro controparti monolingua, fenomeno definito informalmente come la benedizione del multilinguismo.

Francesca Angelica Ereddia
Francesca Angelica Ereddia
Classe 1990, Laureata in Giurisprudenza, siciliana, una passione per la scrittura, la musica e l'arte. Per aspera ad astra, dicevano. Io, nel frattempo, continuo a guardare le stelle.