Pin It

Libera traduzione e interpretazione a cura di Fabio Antonelli di: Recalculating time.  A novel algorithm enables statistical analysis of time series data, di  Sara Cody | Brain and Cognitive Sciences, apparso du MIT NEWS  December 21, 2017
Che si parli di tracciare l’attività del cervello umano in una sala operatoria o di scosse sismiche durante un terremoto o della biodiversità di un ecosistema lungo milioni di anni, l’analisi di serie ingenti di dati che descrivono l’evoluzione temporale di un qualche fenomeno di natura aleatoria è un aspetto importante in moltissimi campi. Il fine principale è riuscire a catturare la dinamica sottostante al fenomeno, sulla base delle osservazioni raccolte, per poterla utilizzare nella valutazione  dell’evoluzione futura. Non è un compito facile! Una serie storica si presenta come una lista lunghissima di numeri, dai quali estrarre delle informazioni salienti che permettano di costruire una rappresentazione (anche approssimata) della dinamica del fenomeno sottostante. Si può sperare che questa dinamica sia determinata da alcune quantità chiave o che presenti ripetizioni o ciclicità, ma come capirlo da questa nuvola di numeri?
In un recente studio, alcuni ricercatori del MIT hanno combinato due approcci già precedentemente utilizzati, State Space (SS) e MultiTaper (MT), in un unico paradigma che ha presentato molti vantaggi. Lo  hanno chiamato Analisi delle frequenze temporali State Space MultiTaper (SS-MT).
Emery Brown, Edward Hood Taplin Professor of  Medical Engineering and Computational Neuroscience, membro del Picower Institute for Learning and Memory, direttore associato dell’Institute for Medical Engineering and Science e uno degli autori dell’articolo [1 ]
S.-E. Kim, M. K. Behr, E. Demba, E. Brown:“State-space multitaper time-frequency analysis” Proceedings of the National Academy of Sciences PLUS, published online Dec. 2018


“l’algoritmo funziona in maniera simile a come un GPS ricalcola il percorso mentre si guida. Se ci si è allontanati dal percorso previsto, il GPS innesca la procedura di ricalcolo della posizione per incorporare la nuova informazione. Questo permette di usare quanto si è già calcolato per ottenere una stima più accurata di quanto si vuole calcolare nel successivo intervallo di tempo”.
 
Vediamo di capire come funziona e qual è la sua novità. Per farlo, occorre descrivere i due approcci che lo costituiscono.
Entrambi gli approcci vedono la serie storica come la realizzazione di un segnale che evolve nel tempo secondo una dinamica ignota. L’approccio State Space (SS) tenta di modellizzare direttamente questa dinamica mediante un’equazione, dove i dati raccolti ($$y_t$$, osservabili) sono visti come il risultato di un segnale ($$x_t$$, non osservabile) falsato da un errore aleatorio
$$y_t=x_t+e_t$$
L’errore aleatorio $$e_t$$  è stimato sulla base delle osservazioni fino al tempo precedente, quindi, incorporandolo alla nuova osservazione  $$y_t$$  si deduce il segnale al tempo t. Si ha quindi un metodo dinamico per seguire l’evoluzione temporale, il metodo può incorporare progressivamente tutti i dati, ma è piuttosto costoso dal punto di vista computazionale.
L’approccio MT invece analizza globalmente i dati relativi a un intervallo temporale, cercando di determinare una combinazione di seni e coseni che oscillano a frequenze diverse che riesca ad approssimare il profilo della serie di dati. Ovviamente il numero di frequenze che si possono utilizzare è infinito e la cosiddetta “analisi spettrale” cerca di individuare quelle frequenze le cui componenti danno il contributo maggiore.


 
 
 
 
 
 
 
Analizzare, però, tutta insieme una grandissima quantità di dati raccolti in un lungo periodo di tempo è estremamente difficile e i ricercatori sono costretti ad applicare l’analisi a piccoli sotto-intervalli di tempo per assemblare successivamente il quadro generale.
Questa suddivisione è efficiente se la serie storica è stazionaria, ovvero se le caratteristiche dell’evoluzione del fenomeno dipendono esclusivamente dall’ampiezza dell’intervallo temporale considerato e non dalla sua collocazione. In questo caso la stessa analisi spettrale funziona per tutti i sotto-intervalli di tempo di uguale lunghezza.
Lo è molto meno quando le serie di dati, come quelle che provengono dai prezzi dei titoli finanziari o dalle registrazioni dell’attività del cervello, non sono stazionarie. In questo caso effettuare l’analisi spettrale separatamente in sotto intervalli, pur così piccoli da poter pensare i dati contenuti pressoché stazionari, presenta vari inconvenienti. Infatti, questo metodo porta a trascurare l’informazione proveniente dall’interazione tra finestre temporali vicine che non sono indipendenti tra loro a causa della non stazionarietà dei dati.  Ciò si traduce anche in un incremento delle componenti corrispondenti alle frequenze basse (spectral leakage), falsando l’analisi spettrale relativa alla finestra considerata. Per ovviare a questo problema si applica un “taper” ad ogni finestra, ovvero una funzione regolare che decade a zero agli estremi dell’intervallo. L’effetto dello spectral leakage viene così ridotto significativamente, più o meno efficientemente a seconda del taper scelto. Per rendere il metodo ancora più efficiente, si applicano tanti tapers differenti allo stesso intervallo e si mediano i risultati.  Da qui il nome di metodo MultiTapering (MT).
L’algoritmo SS-MT tramite il metodo MT esegue l’analisi spettrale in un intervallo e applicando il metodo SS sposta progressivamente la finestra temporale, tenendo conto delle interazioni tra intervalli temporali vicini.
Il risultato di aver combinato i due approcci in un unico paradigma ha prodotto un’analisi dei dati con una migliore risoluzione delle frequenze, una maggiore riduzione dell’errore statistico e una maggiore robustezza rispetto agli errori di misurazione. Inoltre, riduce sensibilmente il tempo di calcolo rispetto ad un puro metodo MT, rendendo più vicina, qualora le future tecniche di raccolta dati lo consentano, un’analisi degli stessi in tempo reale, una caratteristica che sarebbe molto preziosa in molti campi di applicazione, tra cui quello  medico.
 

 
 
Per testare il loro metodo, infatti, gli autori dell’articolo lo applicano ai dati rilevati dal tracciato di un elettroencefalogramma (ECG) che registra l’attività di pazienti sottoposti ad anestesia generale durante un intervento chirurgico. Brown riporta: “l’analisi SS-MT produce spettrogrammi molto più puliti e precisi. Più riusciamo ad eliminare il rumore di fondo da uno spettrogramma, più riusciamo ad effettuare un’appropriata analisi statistica dei dati. La stima dello spettrogramma dei dati è comunemente usata in una grande varietà di problemi, come l’analisi delle variazioni solari, o dell’attività sismica, o dei prezzi di un mercato finanziario e quindi ci sentiamo di affermare che l’algoritmo SS-MT troverà molte aree di applicazione”.
Nella figura, nella prima riga è riportata la concentrazione di un certo anestetico, nella seconda il segnale grezzo registrato dall’ECG, nella terza il periodogramma ottenuto applicando il metodo MT, nella quarta il periodogramma con il metodo SS, nell’ultima il periodogramma applicando il metodo combinato SS-MT. Si nota chiaramente che si ottiene una notevole riduzione del rumore e si riesce ad avere un quadro più preciso delle frequenze più importanti.
 
 
 
 
 

Pin It

Bibliografia   [ + ]

1.
S.-E. Kim, M. K. Behr, E. Demba, E. Brown:“State-space multitaper time-frequency analysis” Proceedings of the National Academy of Sciences PLUS, published online Dec. 2018
this site uses the awesome footnotes Plugin