Introduzione
La storia delle reti neurali è piuttosto recente nel panorama dell'intelligenza artificiale; lo sviluppo di tali reti si sta affermando come un promettente mezzo in diversi campi riguardanti, tra l'altro, l'identificazione, la classificazione, la teoria dei controlli. Le reti neurali operano come "black-box" e non richiedono alcuna informazione sulla struttura del sistema sottoposto ad indagine. La loro capacità consiste nell'apprendere il formalismo che regola il comportamento di un sistema analizzando una sequenza di numeri, presentati al loro ingresso, e fornendo in uscita una risposta confacente con le condizioni al contorno.
L'applicazione delle reti neurali alle problematiche riguardanti gli edifici, sembra essere un promettente mezzo per la valutazione delle prestazioni energetiche e la caratterizzazione del comportamento termico in regime dinamico. L'applicazione delle reti neurali agli edifici consente di descrivere il comportamento dinamico a partire da una serie di dati sperimentali non necessariamente estesa, tenendo in considerazione tutte le variabili indipendenti agenti sul sistema, compresi i contributi solari dei componenti passivi e i carichi termici. Possibili applicazioni possono riguardare: la certificazione e la diagnosi energetica, le valutazioni dell'efficacia di interventi di risanamento energetico, il controllo delle prestazioni dei sistemi di gestione energetica, lo sviluppo della ricerca riguardante la pre-normativa energetica, la predizione dei fabbisogni enegetici. In questo articolo vengono illustrate le capacità predittive delle reti neurali, attraverso alcuni casi studio. I casi studio riguardano la predizione di una temperatura, della potenza di raffrescamento e della densità di flusso termico che attraversa una parete. Nei primi due casi si dispone di dati sperimentali, e viene effettuata un'analisi quantitativa sulle capacità predittive delle reti neurali, attraverso le differenze (residui) tra i segnali predetti e quelli misurati. Nel terzo caso il data-set è riferito ad una parete di un edificio e contiene informazioni complete sui valori delle temperature interna ed esterna, ed informazioni incomplete sui valori della densità di flusso termico che attraversa la parete. Le predizioni effettuate, in assenza di valori di riferimento certi, sono state valutate attraverso il calcolo di un parametro termo-energetico della parete. L'applicazione delle Reti Neurali è stata effettuata utilizzando il pacchetto software: "Neural Network Toolbox" di MATLAB.
Generalità sulle Reti Neurali
Una rete neurale è composta da un insieme di elementi (neuroni) operanti in parallelo. Ciascun neurone svolge una funzione molto semplice (figura 1): effettua una somma dei segnali di ingresso ed utilizza il segnale risultante per generare un segnale di uscita sulla base di una determinata funzione, detta funzione di attivazione.
Una struttura di questo tipo viene chiamata perceptrone. La funzione del perceptrone consiste nel "pesare" i segnali di ingresso p, moltiplicandoli per un opportuno valore w, detto "peso", normalmente compreso tra -1 e 1, e nel produrre una risultante n=w*p. Alla somma dei prodotti (w*p) di ciascun ingresso per il corrispondente peso, viene aggiunto un termine b, di valore compreso tra -1 e 1, che tiene conto di eventuali elementi di disturbo. Il termine b può essere facoltativo. Il termine w*p+b costituisce infine l'argomento della funzione di attivazione F che produce l'uscita a. L'uscita a può essere la risposta finale della Rete o costituire un nuovo ingresso per un successivo perceptrone connesso in cascata.
I pesi costituiscono le interconnessioni tra i vari perceptroni. Un peso di valore 0 può essere assimilato ad una connessione aperta; un peso di valore 1 produce in uscita un segnale invariato (a meno del termine di disturbo). Il perceptrone agisce quindi come un processore e contiene, attraverso il valore dei pesi, la base di conoscenza tra le variabili dipendenti ed indipendenti del sistema. Una rete neurale è costituita da un insieme di perceptroni connessi in cascata ed organizzati in strati (figura 2).
Ciascuno strato è composto da un numero di perceptroni, dalla matrice dei pesi W, dal vettore contenente i termini di disturbo B, dalla matrice contenente i segnali di ingresso P, dalla matrice contenente i segnali di uscita A e dalla tipologia delle funzioni di attivazione. I dati di ingresso della rete neurale vengono propagati attraverso gli strati intermedi di perceptroni, subendo successive elaborazioni, e determinando la risposta della rete. Gli strati di una rete neurale assumono un significato differente a seconda della loro ubicazione. Lo strato la cui uscita diviene l'uscita della rete viene chiamato strato di uscita; lo strato i cui ingressi costituiscono gli ingressi per la rete viene chiamato strato di ingresso; gli altri eventuali strati vengono chiamati strati intermedi o strati nascosti.
In figura 2 viene illustrato un modello di rete neurale con 3 strati. I perceptroni appartenenti allo stesso strato sono caratterizzati dall'avere la stessa funzione di attivazione. Una struttura come quella illustrata in figura 2 viene chamata Perceptrone Multi-strato.
Per conformità con le caratteristiche delle funzioni di attivazione e con i valori dei pesi, gli ingressi di una rete neurale vengono normalizzati a valori confacenti, normalmente compresi tra 0 e 1. I valori iniziali dei pesi e dei termini di distrurbo vengono invece assegnati in modo casuale. Un Perceptrone Multi-strato (rete neurale) ha la capacità di apprendere il legame esistente tra i segnali presentati al suo ingresso ed i rispettivi segnali di riferimento. La fase di apprendimento riguarda ogni singolo perceptrone e consente di fornire una soluzione, finita nel tempo, ad un determinato problema, se questa soluzione esiste.
L'efficacia della fase di apprendimento viene valutata mediante le differenze (residui) tra il segnale di uscita predetto e quello di riferimento. Il processo di apprendimento del perceptrone viene condotto a cicli iterativi. Un ciclo iterativo costituisce una fase di apprendimento per la rete. Nel corso di un'epoca i segnali di ingresso presentati al perceptrone determinano un segnale di uscita, attraverso una variazione del valore dei pesi e dei termini di disturbo.
Ad ogni epoca, vengono "aggiustati" i valori dei pesi e dei termini di disturbo, mediante un segnale di uscita che, confrontato con un segnale di riferimento conosciuto produce delle informazioni quantitative (residui) sulle stime effettuate; tale tecnica viene chiamata "back-propagation" dell'errore.
Utilizzando questa tecnica una rete neurale il cui processo di apprendimento si è rivelato efficace, è in grado di predire un segnale ad essa sconosciuto in risposta a nuovi dati di ingresso. Questo aspetto consente dunque di "allenare" una rete neurale con dei segnali di ingresso e di riferimento conosciuti e rappresentativi del fenomeno che si vuole studiare, ed ottenere delle predizioni sull'andamento successivo del segnale di uscita, utilizzando le regole di apprendimento costruite nella fase di "allenamento".
Operativamente la tecnica di "back-propagation" può essere suddivisa in quattro fasi:
- fase 1: La matrice contenente i segnali di ingresso viene presentata allo strato di ingresso della rete e vengono calcolate tutte le uscite dai singoli strati costituenti la rete neurale, fino ad ottenere il segnale di uscita.
- fase 2: Il segnale di uscita ottenuto nella fase 1) viene confrontato con il segnale di riferimento e viene calcolato il vettore dei residui e la somma dei quadrati dei residui. Il processo di apprendimento della rete viene interrotto se la somma dei quadrati dei residui risulta minore di un valore prefissato o se il numero massimo di epoche stabilito per l'apprendimento viene raggiunto.
- fase 3: Vengono calcolate le modifiche da apportatare al valori dei pesi e dei termini di disturbo, utilizzando il vettore contenente i valori del segnale di riferimento.
- fase 4: Vengono calcolati i nuovi valori dei pesi e riapplicata la fase 1).
Se le risposte fornite dalla rete durante la fase di apprendimento non dovessero risultare soddisfacenti, allora bisogna riconsiderare la topologia della rete utilizzata. La creazione di un modello basato sulle reti neurale è dunque uno dei passi cruciali al fine di determinare le capacità nel fornire soluzioni ad un dato problema. La struttura di una rete neurale non è conosciuta a priori e viene dimensionata, attraverso cicli iterativi, valutando la congruità delle risposte ottenute. Il processo di apprendimento della rete richiede, dunque, un notevole dispendio di tempo per l'individuazione della struttura ottimale e la definizione dei parametri intrinsechi alla rete stessa.
Casi studio di applicazione delle rete neurali come elementi predittivi.
Le capacità predittive delle reti neurali sono state valutate attraverso alcune indagini condotte su dati sperimentali e simulati. Vengono di seguito presentati i risultati ottenuti in alcuni casi studio.
- Predizione di una temperatura.
Un sistema di schermatura è costituito da uno strato di 5 cm di poliuretano, da un doppio vetro 4-12-4 mm, da una veneziana metallica posta a 7.8 cm dal doppio vetro. Il pannello di puliuretano è stato aggiunto per eliminare i possibili disturbi sulla faccia interna del vetro e per valutare con accuratezza il flusso temico convettivo che attraversa il vetro. La parte esterna del doppio vetro è stata, invece, ricoperta con uno strato adesivo nero per eliminare i distrurbi provocati dalla radiazione solare sulla misura della temperatura superficiale. L'apparato sperimentale è stato installato nella parete sud di una cella di prova, presso il laboratorio Conphoebus, ed i dati sperimentali sono relativi al periodo 31 Luglio - 05 Agosto 1993.
L'applicazione delle reti neurali ha l'obiettivo di predire l'andamento delle temperature superficiali del vetro e delle alette metalliche della veneziana. La rete neurale ha una configurazione 8:4:1; consiste, cioè, di 8 neuroni nello strato di ingresso (tempo, temperatura dello strato di poliuretano, temperatura dell'intercapedine, temperatura dell'aria esterna, temperatura delle alette, temperatura del cielo, radiazione solare e velocità del vento), 4 neuroni nello strato intermedio ed un neurone nello strato di uscita (temperatura superficiale del vetro [Tglass], o temperatura delle alette metalliche [Tslats]).
Dei sei giorni di dati sperimentali orari, i primi quattro sono stati utilizzati come campione per la fase di apprendimento delle regole che legano la variabile di uscita alle variabili di ingresso, gli altri due per la predizione libera della temperatura. La fase di apprendimento, che utilizza la tecnica della "back-propagation" dell'errore, è stata condotta fino a quando i valori dei pesi hanno reso minime le differenze dei residui. I valori finali dei pesi, determinati alla fine della fase di apprendimento, sono stati quindi applicati per la predizione libera della stessa temperatura nei successivi due giorni. Di seguito vengono riportati i risultati finali delle predizioni, gli andamenti grafici delle temperature misurate e calcolate, ed i valori dei residui tra le grandezze di riferimento e quelle predette.
Tabella 1,
Figura 3,
Figura 4,
Tabella 2,
Figura 5,
Figura 6
- Predizione della potenza di raffrescamento.
Utilizzando dati sperimentali ottenuti da esperienze condotte in una cella di prova, presso il laboratorio Conphoebus, si è proceduto alla predizione delle richieste di utilizzo della potenza di raffrescamento istantanea, mediante l'applicazione di tecniche basate sulle reti neurali. Il data-base dei dati sperimentali è costituito da 3 giorni di dati, rilevati al minuto, delle seguenti grandezze: radiazione solare, temperatura ambiente esterna, temperatura interna, temperatura di mandata, di ritorno, e portata del fluido termovettore, potenza di raffrescamento, stato dell'attuatore utilizzato per il controllo di processo.
La rete neurale utilizzata ha una topologia 6:4:1; essa ha 6 neuroni nello strato di ingresso (radiazione solare, temperatura esterna ed interna, temperatura di mandata e ritorno e portata del fluido termovettore), 4 neuroni nello strato intermedio ed un neurone nello strato di uscita.
La fase di apprendimento è stata condotta utilizzando il primo giorno di dati (1440 valori) come campione, mentre i due giorni successivi hanno costituito elementi di confronto per valutare la congruità dei fabbisogni predetti con quelli realmente forniti. Durante la fase di apprendimento alla rete vengono resi noti i valori delle grandezze di ingresso ed il valori della potenza di raffrescamento fornita. Nella fase di predizione invece, la potenza di raffrescamento viene calcolata sulla base delle nuove condizioni al contorno e confrontata con gli effettivi valori misurati.
Le figure di seguito esposte riportano gli andamenti grafici ed i valori dei residui tra i valori misurati e predetti durante la fase di apprendimento e durante le fasi di predizione libera.
Figura 7,
Figura 8,
Figura 9,
Figura 10,
Figura 11,
Figura 12
Analizzando l'andamento dei residui di ciascun giorno, si nota come la fase di apprendimento della rete neurale sia stata condotta in maniera efficace per stabilire il legame esistente tra le variabili dipendenti ed indipendenti del sistema. Le predizioni successive infatti, analizzando serie temporali delle stesse grandezze mai presentate alla rete durante la fase di allenamento, confermano gli stessi andamenti e mostrano valori dei residui comparabili.
- Predizione di un flusso termico attraverso una parete
Viene descritto un metodo per la predizione della densità di flusso termico attraverso una parete (ideale) a due strati, utilizzando due set di dati ottenuti mediante simulazione al calcolatore. Il primo data-set è completo e dispone dei valori delle temperature interna ed esterna della parete e della densità di flusso. Il secondo data-set invece è incompleto, mancando dei valori relativi alla densità di flusso termico. I due data-set contengono i valori orari delle grandezze sopra citate per un periodo di 70 giorni ciascuno. I valori delle grandezze contenuti nei due data-set sono ottenuti mediante programmi di simulazione al calcolatore, e sono assunti come media di diversi sensori (flussimetri e PT100), e non contengono alcun rumore di fondo. L'obiettivo della predizione, dunque, è quello di ricostruire il segnale mancante nel secondo data-set, ovvero trovare dei valori per la densità di flusso termico che attraversa la parete, note le condizioni al contorno.
A differenza delle predizioni precedentemente illustrate, in questo caso, in assenza di un segnale di riferimento noto, non può essere effettuata alcuna stima quantitativa sulla predizione (basata sui valori dei residui), ma solo considerazioni di tipo qualitativo. La bontà delle predizioni effettuate quindi viene valutata attraverso il calcolo della Resistenza Termica (R) della parete. La stima della serie temporale richiesta è stata effettuata utilizzando una rete neurale di tipo Perceptrone Multi-strato con un solo strato nascosto. Il modello neurale proposto è del tipo:

dove k e' il tempo, x1,x2 sono gli ingressi (temperature interne ed esterne), y è l'uscita (densità di flusso termico) ed f e' la funzione non lineare realizzata dalla rete neurale. La topologia del Perceptrone è quindi costituita da 8 ingressi ed una uscita. Le variabili di ingresso sono le due temperature agli istanti t-1 e t, e la stessa uscita, opportunamente reazionata, agli istanti t-4, t-3, t-2 e t-1.
Per trovare il numero ottimale di unità dello strato nascosto sono state provate diverse reti, applicando una tecnica di 'growing' da 4 fino a 10 neuroni. Le prestazioni migliori sono state ottenute con 4 neuroni nascosti. La fase di apprendimento della rete e' stata condotta utilizzando l'algoritmo di 'back-propagation' dell'errore, calcolato sul 50 % dei campioni estratti dal primo dataset. Con i rimanenti campioni sono state effettuate predizioni libere in maniera da valutare le capacità di apprendimento delle regole che legano le variabili dipendenti alla variabile indipendente. Nelle figure che seguono viene riportato l’andamento dei valori dei residui ottenuti per la fase di apprendimento e per le fasi di predizione, a differenti epoche di apprendimento, ed il valore dei residui alla fine della fase di apprendimento.
Figura 13,
Figura 14
Avendo ottenuto congrui risultati durante le fasi di apprendimento e di test delle capacità predittive della Rete Neurale, sulla base delle regole di apprendimento acquisite, si è proceduto alla predizione dei valori mancanti della densità di flusso per il secondo data-set. Sono stati forniti allo stesso modello di rete neurale i valori delle variabili di ingresso, ma non è stato specificato alcun segnale di riferimento. In questo caso le informazioni corrispondenti alle variabili di ingresso delle temperature interna ed esterna (agli istanti t-1 e t) vengono prelevati dal secondo data set, mentre per la densità di flusso agli istanti t-4, t-3, t-2 e t-1 vengono prelevati i valori della stessa grandezza contenuti nel primo data-set. La predizione viene effettuata per l’intero data-set. In assenza di un segnale di riferimento che consenta di confrontare i valori predetti, la stima sulla bontà della predizione viene effettuata attraverso il calcolo della Resistenza Termica della parete.
La Resistenza Termica, in regime stazionario, viene calcolata come:

I valori calcolati per la Resistenza Termica in entrambi i data-set sono specificati nella seguente tabella:
| Fase di apprendimento |
|
Rt [°C*m2/W]
|
Deviazione standard
|
|
3.11724 |
0.543162 |
| Fase di predizione |
|
Rt [°C*m2/W]
|
Deviazione standard
|
|
3.21837 |
0.610842 |
Figura 15
Conclusioni
I risultati ottenuti nei differenti casi studio dimostrano come le tecniche basate sulle Reti Neurali siano un promettente mezzo nel campo della predizione. Risulta però poco agevole individuare la configurazione più ottimale del modello da applicare per lo studio che si vuole condurre. La struttura della Rete Neurale può essere individuata solo attraverso molteplici tentativi, mentre la fase di apprendimento può comportare un notevole dispendio di tempo (di elaborazione) prima di arrivare al target prefissato. Le capacità predittive di valori sconosciuti possono essere valutate, a priori, in maniera indiretta e solo in maniera qualitativa e mai quantitativa.
|