Novel hybrid FDD framework based on Bayesian Networks in building HVAC systems

Indice

Introduzione
Descrizione del caso studio
Descrizione del dataset
Definizione dei modelli di baseline
Definizione delle reti bayesiane (struttura e probabilità)
Post-processing per rilevazione e isolamento dei guasti
Diagnosi dei guasti knowledge-driven
Performance metrics
Conclusioni

Introduzione

In questa repository è possibile visionare il framework seguito per definire un processo ibrido di FDD basato su Bayesian Networks (BNs). Per informazioni più dettagliate, è possibile consultare l'articolo di riferimento: Hybrid FDD.

Descrizione del caso studio

Il caso studio riguarda un'UTA a condotto singolo (Single-Duct Air Handling Unit - SDAHU), i cui componenti principali includono ventilatori di mandata e ripresa con inverter, una batteria di raffreddamento, una valvola a 3 vie di controllo della batteria di raffreddamento e serrande per l'aria esterna, l’aria di espulsione e l’aria di ripresa. L'unità SDAHU è controllata per mantenere il set-point della temperatura dell’aria di mandata quando la batteria di raffreddamento è attiva. In caso contrario, mantiene il set-point della temperatura dell’aria di mix modulando le serrande dell’economizzatore. I guasti analizzati sono relativi alla valvola della batteria di raffreddamento bloccata, alla serranda dell’aria esterna bloccata e al sensore della temperatura dell'aria di mandata con offset. Ogni categoria di guasto presenta 4 diversi livelli di severity, per un totale di 12 guasti distinti.

Il layout dell'impianto e le variabili monitorate sono riportate nella seguente immagine:

Maggiori dettagli: Informazioni specifiche SDAHU (sviluppato da LBNL)

Descrizione dei dati simulati

I dataset, in formato .csv, contenuti all'interno della cartella data/preprocessed_data sono già stati preprocessati. In particolare, sono stati rimossi specifici periodi temporali, tra cui:

Inattività del sistema.
Fasi di transizione tra due diverse modalità operative.
Stati transitori.

In questo lavoro sono stati adottati tre approcci differenti, ciascuno rappresentante un diverso livello di conoscenza sul funzionamento del sistema HVAC. I tre scenari considerati sono i seguenti:

Scenario 1: conoscenza limitata del sistema.
Scenario 2: conoscenza completa del sistema e delle logiche di controllo.
Scenario 3: conoscenza completa del sistema e delle logiche di controllo unita all'accesso della Ground Truth.

Dopo aver etichettato i dati normali presenti in tutti i file .csv disponibili, ciascun dataset è stato suddiviso assegnando la prima settimana di ogni mese dell’anno al set di test, mentre le settimane rimanenti sono state suddivise tra training e validation con un rapporto 80%-20% (vedi splitting_data.py).

Le etichette dei dati relativi ai guasti, anch’essi presenti nei file .csv, sono stati invece classificati e raggruppati in base al componente coinvolto. In particolare:

Cooling Coil (CC): valvola di controllo della batteria di raffreddamento bloccata a 0%, 25%, 50% e 75%.
Economizer (ECO): serranda dell’aria esterna bloccata a 0%, 25%, 75% e 100%.
Supply Air Temperature Sensor (SAT Sensor): sensore di temperatura dell’aria di mandata con offset a -2°C, -4°C, +2°C e +4°C.

Definizione dei modelli di baseline

La baseline è stata definita utilizzando diversi modelli Random Forest (RF). In particolare, sono stati impiegati modelli RF di regressione per costruire un riferimento affidabile e robusto in condizioni prive di guasti. Alcune variabili operative chiave sono state selezionate come variabili target in modelli separati, mentre un sottoinsieme delle restanti variabili relative al sistema è stato utilizzato come input. Le variabili esogene, come le condizioni climatiche, sono state impiegate esclusivamente come variabili di ingresso. L'approccio seguito è lo stesso di quello riportato in Marco Savino Piscitelli et al.

I residui generati dai modelli RF addestrati sono stati utilizzati come virtual evidence nel successivo algoritmo basato su BN per la rilevazione e l’isolamento dei guasti. Le evidenze virtuali rappresentano condizioni incerte e possono essere ottenute dai residui dei modelli di stima (baseline). Assumendo che i residui seguano una distribuzione gaussiana, le deviazioni tra i valori reali e quelli stimati possono essere trasformate in valori di probabilità di guasto compresi tra 0 (normal) e 1 (fault). Questi valori probabilistici sono stati poi utilizzati per aggiornare la probabilità di specifici nodi della rete bayesiana.

Definizione delle reti bayesiane (struttura e probabilità)

L’architettura della BN è stata definita a partire da un modello semantico basato su ontologia, utilizzando Brick. Questo schema semantico fornisce una descrizione dettagliata dei componenti HVAC e dei sensori associati a ciascun componente. La struttura iniziale della rete è stata successivamente affinata, integrando conoscenze di dominio. Tale processo ha permesso di eliminare variabili monitorate ridondanti e di aggiungere nodi supplementari, utili a rappresentare regole esperte o specifici KPIs (hard evidence). Inoltre, i sensori che misurano variabili controllate (come la temperatura dell’aria di mandata e quella dell’aria di mix) sono stati aggiunti. In seguito si riportano le due strutture delle BN, in base alla rispettiva modalità operativa:

Cooling modes
Economizing mode

Per ogni nodo di guasto componente (in arancione) è stata assegnata una probabilità a priori pari a 0.1 (guasto) e 0.9 (normale). Il nodo di guasto sistema HVAC (in verde) è stato definito secondo una regola deterministica di tipo OR: se almeno un componente è guasto, il sistema è considerato guasto (probabilità = 1); altrimenti, è considerato normale (probabilità = 0). I nodi di evidence, che rappresentano sintomi osservabili del sistema, sono stati collegati ai nodi di guasto attraverso dipendenze probabilistiche. Le probabilità condizionate assegnate ai nodi di evidenza variano in base alla natura e alla gravità dei sintomi osservati (knowledge-based approach).

Post-processing per rilevazione e isolamento dei guasti

La rete bayesiana sviluppata analizza continuamente il comportamento del sistema HVAC, aggiornando le previsioni di guasto ogni 15 minuti. Tuttavia, per garantire maggiore affidabilità, i risultati non vengono valutati a ogni singolo intervallo, ma aggregati e analizzati su base giornaliera. In questa fase di post-processing, vengono applicate regole esperte per affinare i risultati, escludendo anomalie transitorie che potrebbero generare falsi allarmi. Queste regole tengono conto dei cambi di modalità operativa e delle interazioni gerarchiche tra componenti e guasti. In particolare:

Diagnosi dei guasti knowledge-driven

L’ultimo step del processo è dedicato alla diagnosi, completando il processo di rilevazione e isolamento con l’identificazione della tipologia e gravità del malfunzionamento individuato. A differenza degli approcci supervisionati, che richiedono etichette di guasto predefinite, la metodologia adotta un approccio knowledge-driven, combinando regole esperte, semplici KPI e analisi statistiche. La diagnosi viene eseguita a fine giornata, una volta che i componenti guasti sono stati identificati. Un esempio di diagnosi grafica, soltanto per lo Scenario 3, è riportata in figs/diagnosis_scenario3.

Performance metrics

Le prestazioni dei modelli di baseline (results/baseline_models) sono state valutate utilizzando le seguenti metriche:

MAE (Mean Absolute Error)
MSE (Mean Squared Error)
RMSE (Root Mean Squared Error)
R2 (coefficient of determination)

La Confusion Matrix è stata utilizzata per valutare le prestazioni della rilevazione dei guasti (results/fault_detection) e dell'isolamento dei guasti (results/fault_isolation).

Conclusioni

Questo progetto propone un approccio ibrido per la FDD nei sistemi HVAC, combinando metodi data-driven e knowledge-driven, con l’obiettivo di sviluppare un framework quanto più applicabile e aderente alla realtà operativa.

Per ulteriori dettagli, non esitare a contattare il creatore Marco Paolini.

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.idea		.idea
data		data
figs		figs
models		models
results		results
utils		utils
README.md		README.md
main_diagnosis_scenario3.py		main_diagnosis_scenario3.py
main_scenario1.py		main_scenario1.py
main_scenario2.py		main_scenario2.py
main_scenario3.py		main_scenario3.py
requirements.txt		requirements.txt
splitting_data.py		splitting_data.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Novel hybrid FDD framework based on Bayesian Networks in building HVAC systems

Indice

Introduzione

Descrizione del caso studio

Descrizione dei dati simulati

Definizione dei modelli di baseline

Definizione delle reti bayesiane (struttura e probabilità)

Post-processing per rilevazione e isolamento dei guasti

Diagnosi dei guasti knowledge-driven

Performance metrics

Conclusioni

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Novel hybrid FDD framework based on Bayesian Networks in building HVAC systems

Indice

Introduzione

Descrizione del caso studio

Descrizione dei dati simulati

Definizione dei modelli di baseline

Definizione delle reti bayesiane (struttura e probabilità)

Post-processing per rilevazione e isolamento dei guasti

Diagnosi dei guasti knowledge-driven

Performance metrics

Conclusioni

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages