- Introduzione
- Descrizione del caso studio
- Descrizione del dataset
- Calcolo dei KPIs e del loro impatto
- FDD fully data-driven con CS-TAN
- Performance metrics
- Conclusioni
Questa repository fornisce strumenti per il calcolo di alcuni KPI fondamentali e per la quantificazione dell’impatto di ciascun guasto, considerando simultaneamente più criteri. Le informazioni ottenute da questa analisi multi-criterio vengono successivamente utilizzate per sviluppare e calibrare la struttura e le probabilità condizionate della rete bayesiana.
Il caso studio riguarda una Fan Coil Unit (FCU), caratterizzata da una configurazione idronica verticale a quattro tubi ed è dotata di un ventilatore a tre velocità: alta, media e bassa. Il ventilconvettore è controllato per mantenere la temperatura dell'aria ambiente entro i setpoint di riscaldamento e raffreddamento impostati dal termostato. I guasti analizzati sono più di 30 e coinvolgono tutti i componenti del sistema.
Il layout dell'impianto e le variabili monitorate sono riportate nella seguente immagine:
- Maggiori dettagli: Informazioni specifiche FCU (sviluppato da LBNL)
I dataset, in formato .csv, contenuti all'interno della cartella data/preprocessed hanno già subito una prima fase di pre-processamento. Ogni dataset contiene dati simulati relativi a una specifica condizione operativa del sistema (compresa la normal operation). Il periodo di simulazione di ogni dataset è pari a un anno intero, con un timestep di 15 minuti.
In questa analisi sono stati presi in considerazione 5 KPIs fondamentali:
- Consumo termico giornaliero della batteria di riscaldamento.
- Consumo termico giornaliero della batteria di raffreddamento.
- Consumo elettrico giornaliero del ventilatore.
- Deviazione cumulata giornaliera della temperatura interna dal setpoint (solo durante le ore occupate).
- Frazione media giornaliera di aria esterna rispetto all'aria totale (solo durante le ore occupate).
I KPIs di riferimento sono stati calcolati a livello mensile, facendo una media dei valori giornalieri ottenuti, per ogni dataset a disposizione.
L'impatto dei guasti è stato quantificato utilizzando il Fault Impact Ratio (FIR) come in Xing Lu et al. Tuttavia, per permette una comparazione equa tra i FIR, è stato calcolato il FIR normalizzato (contenuto tra [0, 100]) per ogni KPI, tramite il metodo di normalizzazione min/max.
L’impatto multi-criterio è stato calcolato generando combinazioni casuali di pesi da una distribuzione di Dirichlet, utilizzate per ottenere il FIR normalizzato medio pesato sui 5 KPIs, per ciascun tipo di guasto. Il risultato è una classifica che evidenzia i guasti con l’impatto globale più rilevante.
Il procedimento per la selezione delle variabili di input, la costruzione della struttura della rete bayesiana CS-TAN e la stima delle probabilità condizionate è descritto in dettaglio in questa repository GitHub. La principale differenza introdotta in questo lavoro riguarda la definizione dei pesi associati a ciascuna classe. In particolare, partendo dal ranking ottenuto nella fase di analisi multi-criterio, è stato possibile assegnare i pesi alle classi tramite il metodo degli Exponential Weights. Questa modifica consente di confrontare le prestazioni del modello di classificazione fully data-driven con e senza l’integrazione dell’analisi multi-criterio, evidenziando il contributo di quest’ultima al miglioramento del modello.
Le prestazioni del modello CS-TAN sono state valutate utilizzando le seguenti metriche (ottenibili dalla Confusion Matrix):
- Accuracy
- False Alarm Rate
- False Negative Rate
- Mis-Diagnosis Rate
- Precision (per ogni classe)
- Recall (per ogni classe)
L’approccio cost sensitive proposto dimostra come l’integrazione tra analisi multi-criterio e modelli fully data-driven possa migliorare l’efficacia e la sensibilità della diagnosi automatica dei guasti nei sistemi HVAC.
Per ulteriori dettagli, non esitare a contattare il creatore Marco Paolini.
