RETI NEURALI PER LA PREVISIONE
DELLA TEMPERATURA DELLA GHISA
IN ALTOFORNO
P. Bellomo(1), M. Falzetti(2)
(1) Centro Sviluppo Materiali
Via Appia Km 648, 74100, Taranto.
Tel.: 099 4766374 - Fax: 099 4700652 - E-mail: taranto1.csm@agora.stm.it
(2)
Centro Sviluppo MaterialiVia di Castel Romano 100, 00129, Roma.
Tel: 06 5055336 - Fax: 06 5055461 - E-mail: tecpro.csm@csm.stm.it
ABSTRACT
Uno dei più importanti problemi nella conduzione di un altoforno risiede nella stabilizzazione della temperatura della ghisa, sia dal punto di vista della sicurezza dell’impianto che da quella della qualità del prodotto. Per ottimizzare l’azione di controllo è necessario avere informazioni in tempo reale sulle tendenze di variazione di questo parametro. In questo intervento verrà descritta l’attività di realizzazione di un "predittore" della temperatura ghisa, basato sull’utilizzo di reti neurali. Varie architetture delle stesse sono state testate (Multi Layer Perceptron e Radial Basis Function, principalmente). Il lavoro è stato realizzato utilizzando il Neural Networks Toolbox di MATLAB.
1. Introduzione
1.1 Il Centro Sviluppo Materiali
Il Centro Sviluppo Materiali (CSM) è una società di ricerca nata nel 1963, a capitale pubblico e privato, in cui sono presenti le maggiori industrie nazionali e non, operanti nel settore siderurgico, meccanico e dei materiali avanzati. Il gruppo ha una dislocazione territoriale su scala nazionale, con la sua sede principale in Roma, nel centro di ricerca di Castel Romano, e tre unità periferiche presso, Terni, Taranto e Genova, per un complessivo di circa 350 dipendenti.
Le attività di ricerca, inizialmente centrate su problematiche di processo/prodotto proprie dell'industria siderurgica, sono andate negli ultimi anni via via diversificandosi, trasferendo le esperienze ed il know-how aziendale anche verso altri settori industriali. Nonostante ciò, il CSM riveste ancora il ruolo di centro di riferimento, sia in ambito nazionale che internazionale, per quanto riguarda le attività di ricerca e sviluppo nel settore siderurgico.
Nell'ambito di tale settore, ed in relazione agli argomenti di cui è interesse questa presentazione, il CSM svolge attività di ricerca per quanto riguarda problematiche di simulazione e controllo di processo, sull'intero ciclo siderurgico, con l'obiettivo di migliorare le prestazione degli attuali processi e/o sviluppare processi innovativi. Negli ultimi anni è stata concentrata molta attività per quanto riguarda proprio l'impiego di tecniche avanzate di simulazione e controllo, provenienti dal settore dell'Intelligenza Artificiale, con lo l'obiettivo di migliorare sensibilmente la capacità di controllo di quei molti aspetti dei processi, che, per la loro complessità, non hanno trovato ancora una soddisfacente risposta attraverso tecniche più tradizionali.
1.2 Riferimento Industriale
L'attività che viene illustrata in questa presentazione, fa parte di una più vasta attività di ricerca portata avanti con lo Stabilimento di Piombino della Lucchini Siderurgica, avente come obiettivo quello di sviluppare una serie di prodotti avanzati, per il controllo di alcuni aspetti del processo dell'altoforno. In particolare, le attività di sviluppo del sistema di previsione della temperatura ghisa, si inseriscono in un contesto più ampio, che prevede lo sviluppo di un sistema di controllo ad architettura Neuro-Fuzzy per la stabilizzazione della temperatura ghisa stessa.
1.3 Descrizione del problema
La produzione della ghisa in altoforno è un tipo di processo caratterizzato da complesse interazioni tra differenti fenomeni. Sono ad esso interessati scambi termici, reazioni chimiche e fenomeni gasdinamici, che coinvolgono grandi quantità di materiali; ciò porta allo svilupparsi di comportamenti non lineari del processo ed al manifestarsi di tempi di risposta molto lunghi.
L’altoforno è sostanzialmente un reattore in controcorrente (fig. 1). Dalla parte superiore del forno vengono introdotti essenzialmente minerali e sinterizzati ferrosi (agglomerato, pellets), il coke ( che si ottiene eliminando le materie volatili dal carbone), additivi per il miglioramento delle caratteristiche chimiche della carica. Dal basso, attraverso le tubiere, viene iniettata aria preriscaldata, con l’aggiunta, talvolta, di alcuni combustibili, ossigeno o vapore. Recentemente ha avuto grande sviluppo la tecnologia PCI (Powder Coal Injection) che prevede l’immissione anche di polvere di carbone.
Il minerale di ferro viene riscaldato e ridotto dal gas, generato nella zona di combustione vicino alle tubiere, via via che scende verso il basso . Il principale prodotto dell’altoforno è la ghisa liquida, mentre prodotti secondari sono la scoria ed il gas d’altoforno. L'ultimo dei quali viene generalmente riutilizzati in altre parti dello stabilimento.
Da un punto di vista processistico, il principale problema che pone la gestione dell’altoforno è quello del mantenere il più costante possibile la temperatura della ghisa liquida prodotta, in modo da avere sia vantaggi sulla qualità (stabilità della composizione chimica), sia vantaggi di tipo operativo (riduzione dei consumi energetici ed aumento della "vita" dell’altoforno).

Fig. 1 - Schema dei flussi di materiale nell’altoforno
Il processo viene governato mediante la regolazione di alcuni parametri di controllo; i principali sono:
Nel passato la qualità del controllo processo era sostanzialmente affidata all’abilità dell’operatore, il quale basava il proprio giudizio su una "sensibilità" affinata negli anni con l’esperienza. L’azione di controllo, a causa dei lunghi tempi di ritardo della risposta da parte del sistema, doveva essere effettuata con largo anticipo, a fronte di previsioni a lungo termine sull’andamento della temperatura della ghisa che, talvolta, potevano apparire quasi "profetiche" al non addetto ai lavori.
I primi passi verso uno sviluppo del controllo processo si sono avuto con la realizzazione di una serie di modelli dinamici deterministici dell’altoforno, i quali presentano, tra gli altri, lo svantaggio di richiedere una attenta taratura di alcuni parametri di riferimento, molto variabili da altoforno ad altoforno, od addirittura su uno stesso altoforno durante la sua (lunga) vita.
Più recentemente si è avuto lo sviluppo di tecniche di controllo adattivo e predittivo piuttosto avanzate, la cui applicazione al problema altoforno ha comunque fornito risultati non sempre pienamente soddisfacenti [1].
Infine, il tentativo di sistematizzare in qualche modo il "know-how" degli operatori dell’altoforno ha portato alla realizzazione di un gran numero di Sistemi Esperti , talvolta utilizzati, in modo "ibrido", insieme a modelli deterministici [2].
L’utilizzazione di tecniche di Intelligenza Artificiale innovative sembra essere una strada interessante per la risoluzione dei problemi di cui sopra, e, nell’ambito siderurgico come in molti altri, si stanno rapidamente sviluppando dei filoni di ricerca in questi campi.
In questo lavoro si presenta la prima parte di una ricerca, sponsorizzata dalla Comunità europea Carbone e Acciaio, intitolata "Investigation of Fuzzy Logic and Neural Network Based Strategies for Control Optimisation of Ironmaking Processes (FANCIM) ". In particolare, ci si sofferma sullo sviluppo di un predittore per la temperatura ghisa mediante reti neurali.
2. Perché le reti neurali ?
Nella letteratura tecnica, i vantaggi relativi all’adozione di reti neurali per problematiche di tipo predittivo-controllistico vengono in genere sintetizzati come segue [3]:
Proprio per poter valutare più attentamente quest’ultimo aspetto, si è previsto di effettuare dei confronti tra il modello neurale sviluppato ed un modello di tipo autoregressivo lineare (ARIMA).
Un altro aspetto interessante è quello relativo al fatto che le reti neurali si presentano molto adatte per lo sviluppo di un’applicazione in linea, in particolare per quanto riguarda la possibilità di riaddestrarle periodicamente su nuovi dati, e quindi potersi adeguare a variazioni della dinamica del processo.
3. Perché MATLAB ?
La principale attrattiva, nell’utilizzazione di MATLAB per il problema descritto, risiede nel fatto che si tratta di un ambiente integrato, in cui i vari Toolbox permettono di "avvicinare" i dati da differenti direzioni. La possibilità di avere a disposizione, in un unico ambito, un pacchetto per reti neurali, uno per applicazioni con Logica Fuzzy, un potente pacchetto per l’identificazione dei Sistemi e per l’elaborazione dei segnali, il tutto a fronte di buone capacità grafiche e di programmazione, rende MATLAB indubbiamente un punto di riferimento per chi sia interessato sia agli approcci più tradizionali che a quelli più moderni ed innovativi, per l'analisi dinamica dei sistemi.
Per quanto riguarda più specificamente il Neural Networks Toolbox, si tratta di uno strumento piuttosto efficace. In particolare, risulta apprezzabile la possibilità di accedere alle varie routine, per comprenderne meglio funzionamento e potenzialità. Le architetture di rete disponibili sono abbastanza numerose (anche se, certamente, non esaustive dell’ampio e sempre in espansione panorama). Gli algoritmi di ottimizzazione risultano abbastanza veloci (rispetto ad altri pacchetti commerciali esaminati) ed in alcuni casi (in particolare nell’utilizzazione delle Radial Basis Functions) addirittura straordinariamente rapidi.

Fig. 2 - Problema della previsione
4. Definizione dell’input
Il problema della previsione della temperatura ghisa può essere formulato come la stima di un valore di temperatura al tempo tm , essendo noti i valori della stessa variabile e di altre variabili di processo al tempo tn - t0 (fig. 2).
Di conseguenza, m misura l’orizzonte di previsione, mentre n determina la "storia" del processo, necessaria per avere una buona rappresentazione dello stesso.
N
ella presente ricerca sono stati adottati due tipi di approcci:La previsione del futuro valore della temperatura ghisa è fatta usando soltanto i valori passati della stessa variabile, senza nessuna ulteriore informazione.
La previsione è fatta usando, oltre i valori passati della temperatura ghisa, anche altre variabili di processo.
Dal punto di vista del controllo del processo, ovviamente questo secondo tipo di approccio risulta più attraente: se lo scopo deve essere quello di migliorare la capacità di controllo sul processo, è certamente importante avere informazioni sull’effetto delle variabili di controllo sulla dinamica del processo stesso. Tuttavia, in questa fase del lavoro interessava soffermarsi principalmente sull’ottenimento di una valutazione quanto più corretta possibile della temperatura ghisa. Come si vedrà, i migliori risultati in tal senso sono stati ottenuti proprio mediante l’analisi autoregressiva.
I dati utilizzati nel presente problema si riferiscono ad un periodo di circa un mese di funzionamento dell’altoforno n°4 dello Stabilimento di Piombino. Si hanno a disposizione i valori delle variabili prelevati ogni ora.
La variabilità della temperatura ghisa è soggetta a della fluttuazioni di breve periodo che si configurano sostanzialmente come "rumore" del segnale. Pertanto si è adottata una filtratura del segnale stesso mediante un filtro Butterworth passa-basso. Si sono testate differenti frequenze di taglio del filtro, ed alla fine si è fissato un periodo minimo di 4 ore.
I dati originali sono stati normalizzati nel range [-1,+1]. Dall’insieme dei dati originali sono stati estratti 400 dati consecutivi, suddivisi successivamente in training set (il 70%) ed in test set (il 30%).

Fig. 3 - Architettura Radial Basis
5. Architetture neurali utilizzate
Nell’arco dell’attività intrapresa sono state provate svariate architetture di rete, nonché differenti tecniche di apprendimento delle stesse. In particolare, oltre alla tradizionale rete Multi-Layer Perceptron (MLP), ci si è soffermati sulle cosiddette Radial Basis Functions (RBF) [5]. Queste ultime hanno, come peculiare caratteristica, dei neuroni dello strato intermedio i quali calcolano, invece della semplice somma degli input, la distanza tra il vettore degli input ed il vettore dei pesi (fig. 3 e tabella 1). Associata alla distanza viene anche considerata una larghezza di banda, assimilabile ad una deviazione standard ("spread"). La funzione di attivazione tipicamente usata è una Gaussiana.
I vantaggi legati all’utilizzo delle RBF sono essenzialmente dovuti al fatto che si introduce nella rete una forma di "clusterizzazione" dei dati di input in modo implicito. Le varie tipologie dei dati vengono così assegnate ad ognuno dei neuroni intermedi in base alla similitudine rispetto al riferimento che via via, durante la fase di apprendimento, viene fissato nei pesi di connessione.
Per quanto riguarda gli algoritmi di apprendimento, oltre al tradizionale 'Error Back-Propagation' (EBP), si è provato, con ottimi risultati, quello di Levenberg-Marquardt (LM). I tempi di apprendimento sono risultati estremamente differenziati, ed ovviamente molto dipendenti dalle caratteristiche della rete di volta in volta adottata. Tipicamente le MLP con algoritmo EBP hanno richiesto tempi dell’ordine delle ore, le stesse con algoritmo LM poche decine di minuti, le RBF pochi minuti.


Tabella 1 - Caratteristiche dei neuroni della rete RBF
6. Analisi autoregressiva
Per l’operatore dell’altoforno la previsione del valore di temperatura ghisa nell’immediato futuro ha una grande importanza per la scelta della migliore strategia di controllo, ma ancora più importante è la corretta determinazione della tendenza in termini di "raffreddamento" o "riscaldamento" del forno. In questo senso, è accettabile un errore nel valore assoluto di temperatura, se contenuto in un range di pochi gradi, ma risulta inaccettabile una non corretta informazione sul valore del segno del gradiente di temperatura.

Figura 4 - Struttura di un modello autoregressivo a reti neurali
|
INDICE1 |
INDICE2 |
|
Percentuale di punti totale con corretta valutazione del segno del gradiente |
Percentuale di punti con corretta valutazione del segno del gradiente, calcolata rispetto ai soli punti con variazione dello stesso segno |
Tabella 2- Definizione degli indici di valutazione
Per questo motivo sono stati elaborati degli indici di valutazione delle prestazioni delle reti basati su questo valore. Un primo indice calcola la percentuale di corrette valutazioni del segno del gradiente per tutti i dati considerati.
D’altra parte l’altoforno è caratterizzato da lunghi periodi di funzionamento regolare, durante i quali la temperatura non ha frequenti variazioni di tendenza. Pertanto, si è considerato un secondo indice che calcola questa percentuale solo per i punti in cui si abbia una effettiva variazione del segno (tabella 2).
La tipica struttura di un modello autoregressivo a reti neurali è mostrata in fig. 4. La rete neurale ha in ingresso il valore della temperatura ghisa al tempo t0 (il più recente valore noto) nonché alcuni dei valori passati . L’uscita è composta dalle temperature previste per l’orizzonte di previsione tm. E’ anche possibile limitare la previsione ad un solo valore di temperatura nel futuro, ma, nelle prove effettuate, si è constatato che la previsione di più valori consecutivi ha un effetto positivo sulla capacità della rete.
Uno dei principali problemi incontrati nelle prime prove effettuate, in particolare con le reti MLP, è stato quello del manifestarsi, nella previsione di temperatura, del cosiddetto ritardo sistematico. In pratica, la rete convergeva ad una soluzione in cui il valore di temperatura previsto coincideva con l’ultimo valore reale utilizzato nell'input (si veda ad esempio la fig. 5, per una previsione fatta 1 ora in avanti). E’ chiaro che adottare una soluzione del genere porta la rete a non commettere mai un errore molto grosso, a causa della lentezza delle dinamiche considerate; d’altra parte, di fatto la rete, della dinamica reale del sistema, non ha compreso nulla. E’ un chiaro caso di convergenza in un minimo locale dell’errore.

Le prove sono state effettuate considerando quattro valori di possibile previsione: a 1, 2, 3 e 4 ore nel futuro. Sono stati fatti anche alcuni tentativi di spingersi ancora più nel futuro (fino a 6 ore), ma con scarsi risultati. Dal punto di vista dell’altofornista, una previsione di temperatura a 3 ore assume già grande importanza, poiché consente di effettuare per tempo quelle azioni correttive necessarie alla migliore stabilità del processo.
Nelle figure 6 e 7 sono mostrati i risultati delle previsioni a 3 ore su valore assoluto di temperatura e gradiente, per una parte dei dati di test, ottenuti con una rete RBF. Si noti che in media l’errore sul valore di temperatura è minore di 1°C.

Fig. 6 - Confronto tra previsione e misura di temperatura

Fig. 7 - Confronto tra previsione e misura per il gradiente di temperatura
Nella tabella 3 sono riportati i risultati medi (10 differenti reti RBF addestrate e testate su 10 differenti set di dati) ottenuti per le previsioni.
|
|
Previsione a 1 ora |
Previsione a 2 ore |
Previsione a 3 ore |
Previsione a 4 ore |
||||
|
- |
Indice 1 |
Indice 2 |
Indice 1 |
Indice 2 |
Indice 1 |
Indice 2 |
Indice 1 |
Indice 2 |
|
% di correttezza |
99 |
95 |
97 |
92 |
92 |
84 |
83 |
67 |
|
dimensioni del test |
» 100 punti |
|||||||
Tabella 3 - Risultati prove con reti RBF
Il modello autoregressivo dà quindi risultati soddisfacenti fino ad un orizzonte previsionale di 3 ore, mentre le prestazioni decrescono notevolmente quando si vada sulle 4 ore di previsione o oltre.
In effetti, l’analisi delle correlazioni temporali tra temperatura ghisa e le principali variabili di processo mostra che la massima correlazione si ha attorno alle 3-5 ore di scarto. In altre parole, non sembra possibile ottenere buone previsioni di temperature, oltre le 3 ore, utilizzando solo i valori di temperatura precedenti. Questo aspetto verrà riconsiderato nel approccio cosiddetto multiregressivo.
Uno studio sistematico è stato effettuato sull’influenza di svariati parametri delle rete rispetto ai risultati. In particolare, è stato considerato il valore dello "spread", il numero dei neuroni dello strato nascosto ed il numero di valori passati di temperatura da considerare.
I valori di spread utilizzati per ottenere i migliori risultati sono piuttosto elevati (10-20). Questo indica che gli andamenti di temperatura nei set di train utilizzati non sono molto differenti tra loro (fig. 8).

Fig. 8 - Influenza dello spread sugli indici della rete RBF
Il numero di neuroni dello strato nascosto influenza molto poco il risultato. Al di sopra di 5, i miglioramenti sono poco significativi (fig. 9).

Fig. 9 - Influenza del numero di neuroni dello strato nascosto sugli indici della rete RBF
Per quanto riguarda il numero di valori passati di temperatura, si sono adottati due approcci differenti:
In fig. 10 e 11 sono riportati i risultati di queste prove. Si vede come, nel caso del primo tipo di approccio, i risultati sono accettabili quando si cominciano adottare i punti precedenti l’istante t-3, mentre è interessante notare, nel secondo caso, che gli indici hanno dei minimi quando si eliminano i primi 2-3 valori passati. Bisogna ricordare che un errore del 50% sul segno del gradiente è uguale all’errore che si commetterebbe se si scommettesse a caso su di esso. Perciò, qualora si eliminino dal modello i più vicini valori passati di temperatura, si ottiene un modello completamente non correlato con i dati.

Fig. 10 - Influenza del numero di valori passati di temperatura considerati sugli indici della rete RBF

Fig. 11- Influenza del numero di valori passati di temperatura rimossi sugli indici della rete RBF
Alcuni miglioramenti possibili al sistema di previsione neurale autoregressivo sono attualmente in fase di studio.
In particolare due strade sono state intraprese:
Al momento, i migliori risultati sembra che si possano ottenere con quest’ultimo metodo.
7. Confronto con modello ARIMA
Come detto precedentemente, per verificare il fatto che le reti neurali, con le loro caratteristiche di non linearità, riescano a cogliere in modo efficace la reale dinamica del processo, si è pensato di fare dei confronti con un modello lineare di tipo classico: il cosiddetto modello ARIMA (AutoRegressive Integrated Moving Average).
Il modello ARIMA ha una struttura di questo genere:

dove
t = tempo;
Yt = previsione;
m
= termine medio;B = operatore di spostamento all’indietro (BXt = Xt-1) ;
f(
B) = operatore autoregressivo, rappresentato come un polinomio dell’operatore B (f(B) = 1 - f2 B2 - ............... -fp Bp;q
(B) = operatore a media mobile, rappresentato anch’esso come un polinomio dell’operatore B (q(B) = 1- q1B - q2 B2 - ............... -qq Bq);at = errore casuale.
Il tipo di modello utilizzato è definito da indici che vengono posposti alla sigla ARIMA. Ad esempio, un modello ARIMA(1,1,1) è definito come:
![]()
ossia ha una componente autoregressiva di ordine 1, una componente a media mobile di ordine 1 e viene applicato alla differenza tra gli ultimi due valori della variabile da calcolare.
Se un modello ARIMA risulta valido, i residui (differenze tra valori reali e previsioni) si comportano come variabili random.
L’applicazione del modello ARIMA al problema considerato è stata effettuata utilizzando le routine del System Identification Toolbox di Matlab.
I migliori risultati ottenuti sono stati ottenuti con un modello ARIMA(9,1,5). Il comportamento è buono solo per previsioni a 1 ora, ottenendo indice1 = 97.5 e indice2 = 91, mentre le previsioni a 2 e 3 ore sono affette pesantemente dal ritardo sistematico, e gli indici si riducono a 81-17 e 63-5 rispettivamente.
Questo comportamento sembra confermare la presenza di componenti non lineari nel processo, che si evidenziano man mano che si tenta di spingere più in avanti nel futuro la previsione.
Pertanto, l’utilità di un approccio neurale al problema emerge in modo evidente.
8. Analisi multiregressiva
Come detto precedentemente, la necessità di spingere la previsione di temperatura su tempi più distanti nel futuro, spinge ad incorporare, in qualche modo, le informazioni disponibili con le variabili di controllo nella previsione stessa. In tal senso, è stato sviluppato il cosiddetto approccio multiregressivo, in cui la previsione viene effettuata con reti in cui l'ingresso sia formato sia dai passati valori di temperatura che dai valori delle variabili di controllo.
I primi tentativi in tal senso sono stati diretti ad un graduale inserimento delle variabili di processo (in particolare: portata, temperatura ed umidità vento, portata ossigeno, portata polvere di carbone) come input della rete, aggiungendo via via nuove variabili e più valori delle stesse nel passato.
Per i risultati di previsione oltre le 3 ore nel futuro, la presenza delle variabili di processo non ha migliorato le prestazioni del modello.
E’ stata invece del tutto esclusa la possibilità di fare delle previsioni di temperatura non utilizzando in ingresso i valori passati della stessa. In tal caso i risultati delle prove sono completamente insoddisfacenti.
Le ipotesi di lavoro sviluppate, a questo punto, sono le seguenti:
Attualmente sembra fornire risultati interessanti l’utilizzo di un sistema a 2 reti neurali, in cui l'uscita di una delle due viene applicato come parametro lineare per le variabili di controllo [6].
9. Alcuni interessanti aspetti della dinamica non lineare delle reti neurali
Come visto, è sicuramente possibile ottenere dei buoni modelli predittivi della temperatura ghisa mediante le reti neurali. Ciononostante, alcuni aspetti dell’approccio restano ancora abbastanza "strani", e rendono quindi il loro utilizzo comunque critico.
In particolare, nell’esperienza che si sta illustrando, questi aspetti sono emersi quando si è tentato di utilizzare il predittore di temperatura come "simulatore" dell’altoforno; ciò è stato fatto riutilizzando gli output della rete come input della stessa negli istanti successivi.
In queste prove si è sempre fatto ricorso ad una analisi multi-regressiva, poiché si è ritenuto, già a livello impostativo, che fosse necessario correggere eventuali derive della "dinamica" della rete.
In effetti, i comportamenti ottenuti hanno mostrato tutti i limiti di questo tipo di approccio.
Tipicamente, la temperatura ghisa cominciava ad oscillare in modo "caotico" tra valori molto distanti tra loro, e, dopo un certo tempo, si fermava su un valore fisicamente poco credibile. In pratica, mostrava tutte le caratteristiche di un comportamento non lineare, però non simile alla dinamica non lineare dell’altoforno, ma chiaramente legato alla dinamica della rete.

Figura 12 - Comportamento anomalo della rete in fase di simulazione
In fig. 12 sono rappresentati i risultati di due simulazioni, in una delle quali la rete fornisce, dopo alcune oscillazioni, una risposta costante, mentre nell’altra le oscillazioni proseguono indefinitamente.
L'analisi mostra che il fenomeno è legato alla "sensibilità" della rete rispetto all’errore che viene commesso nella previsione del valore di temperatura ghisa. Quando si effettua una previsione, quest’ultimo viene corretto dall’utilizzo dei reali valori di temperatura passati, mentre nella simulazione ciò non avviene, ed evidentemente l’utilizzazione dei valori delle variabili di controllo non è sufficiente ad eliminare il problema.
Anche in questo caso l’utilizzazione del sistema a 2 reti neurali indicato nel precedente paragrafo sembra fornire risultati interessanti, proprio grazie al fatto che con esso l’incorporazione ed utilizzazione delle informazioni sulle variabili di controllo è più efficace.
10. Conclusioni
Il lavoro sviluppato dimostra l’utilizzabilità delle reti neurali per risolvere il problema della previsione della temperatura ghisa in altoforno. In particolare, è stata riscontrata la maggiore efficacia delle architetture RBF rispetto alle altre, in termini di tempi di apprendimento minori.
Utilizzando la cosiddetta analisi autoregressiva, si sono ottenute percentuali di correttezza sufficientemente elevate per previsioni fino a 3 ore nel futuro.
L’obiettivo futuro è di migliorare le capacità di previsione su tempi più lunghi, utilizzando in combinazione modelli autoregressivi e multiregressivi.
11. Ringraziamenti
Si ringraziano i responsabili ed il personale operativo dell'altoforno n°4 dello Stabilimento di Piombino della Lucchini Siderurgica, per la collaborazione fornita nello svolgimento della ricerca.
Bibliografia
[1] C. Jian, " A Predicting System based on Combining an Adaptive Predictor and a Knowledge Base as Applied to a Blast Furnace", Journal of Forecasting, Vol. 12 (1993), pp. 93-102.
[2] K. Otsuka, Y. Matoba, Y. Kajiwara, M.Kojima, M. Yoshida, "A Hybrid Expert System Combined with a Mathematical Model for Blast Furnace Operation", ISIJ International, Vol. 30 (1990), N° 2, pp. 118-127.
[3] W.S. Sarle, "Neural Networks and Statistical Models", Proceedings del SUGI19, 19 Congresso Utenti SAS, Cary, Ind., USA,1994.
[4] M.J. Willis, G.A. Montague, C. Di Massimo, M.T. Tham, A. J. Morris, "Artificial Neural Networks in Process Estimation and Control", Automatica, vol. 28 (1992), N°6, pp. 1181-1187.
[5] C.M. Bishop, " Neural Networks for Pattern Recognition", Oxford press, 1992, pp. 165-193
[6] J. Moscinski, Z. Ogonowski "Advanced Control with Matlab & Simulink", Ellis Horwood, 1995, pp150-182.