|
Le reti neurali costituiscono potenti strutture di calcolo che hanno trovato svariate applicazioni come ad es. nel riconoscimento di immagini e nella simulazione di fenomeni complessi governati da leggi non perfettamente note. Nel presente lavoro si riferisce di una interessante applicazione di reti neurali per la diagnosi, nella fase di formazione, di alcuni fenomeni indesiderati che possono manifestarsi nella colata continua dell’acciaio. Lo studio rappresenta solo un primo contributo, perchè lo sviluppo di sistemi di controllo di processo idonei alla completa gestione automatica dell’impianto è attualmente uno dei problemi di punta in fonderia e non è stato ancora risolto in maniera del tutto soddisfacente. Le reti neurali sembrano offrire in questo settore buone opportunità per individuare in process la presenza di fenomeni indesiderati che avvengono all’interno della lingottiera; esse potrebbero pertanto costituire il nucleo sul quale basare un moderno sistema di controllo che rappresenterebbe nel settore un importante salto qualitativo. Gli autori hanno applicato nel loro studio il toolbox NEURAL NETWORK di MATLAB, che si è dimostrato di facile gestione e di idoneo all’impostazione di strutture neurali abbastanza complesse. Nel lavoro si riportano per sommi capi i risultati fondamentali della ricerca. Gli autori hanno inteso dare al loro lavoro un taglio divulgativo anche a dimostrazione del fatto che, disponendo degli strumenti opportuni uniti ad una preparazione scientifica di base, si possono affrontare con buoni risultati complessi problemi di natura fisico-matematica anche senza essere specialisti della programmazione con reti neurali. Nel lavoro si riassumono brevemente le caratteristiche generali delle reti neurali, si descrive sommariamente il problema affrontato e si evidenziano in fine mediante simulazioni i risultati della ricerca. Una rete neurale artificiale è costituita da una complessa struttura logica formata da elementi semplici (neuroni) interconessi con linee di comunicazione (sinapsi).La terminologia deriva chiaramente da quella medica per analogia con la struttura logica del cervello umano, secondo quanto formulato da Ramon e Cajàl (1991).Studi neurofisici hanno appurato che la velocità di reazione di un neurone del sistema nervoso umano è di 6 ordini di grandezza inferiore rispetto a quella di una porta logica di un microprocessore al silicio. Nonostante ciò, grazie alla complessità della struttura della corteccia celebrale dove si stima mediamente la presenza di circa 1010 neuroni interconnessi da circa 6x1014 sinapsi, il cervello umano ben addestrato risulta in molte operazione enormemente più efficiente e rapido di un computer. Pertanto una rete neurale artificiale può essere schematizzata come un insieme di neuroni interconnessi con un opportuno numero di collegamenti. L’elemento logico elementare, il k-esimo neurone (figura 1) riceve in ingresso n segnali xi ad ognuno dei quali assegna un peso Wkj; la somma uk dei segnali così pesati costituisce una delle due variabili di ingresso di una funzione di “attivazione” o di “trasferimento” che fornisce il valore di uscita del neurone. La funzione di attivazione è in genere non lineare e può essere scelta tra diverse tipologie. Basandosi su tale struttura elementare possiamo avere reti neurali o addirittura architetture di reti neurali assai complesse. Il buon funzionamento del complesso dipende ovviamente da una buona calibratura dei pesi e della polarizzazione. La scelta di tali parametri avviene nella fase di addestramento della rete ottenuta presentando alla rete stesa un adeguato insieme di segnali di ingresso, ricavati ad es. sperimentalmente, correlati con le uscite desiderate o obiettivo in corrispondenza a ciascuno di essi.
Gli algoritmi di calibrazione di detti parametri sono assai complessi: sono in genere di tipo evolutivo e ad ogni passo generano un parametro che indica il grado di addestramento della rete. I parametri più usati sono basati su una norma del vettore differenza tra il vettore degli obiettivi ed il vettore delle uscite in corrispondenza dei pesi e delle costanti di polarizzazione approssimati nei successivi passi di apprendimento. L’utilizzo di un processo di colata continua risulta estremamente conveniente in fonderia nel caso di produzione di lingotti poco diversi dimensionalmente tra loro e destinati, ad esempio, alla laminazione. L’acciaio fuso viene versato dalla siviera di colata in un serbatoio di accumulo detto ‘paniera’, dalla quale viene derivato un condotto di colata che alimenta una lingottiera di rame, raffreddata ad acqua, in modo da provocare una rapida solidificazione dello strato superficiale. La lingottiera è dotata di un moto oscillatorio verticale di frequenza opportuna per facilitare ,anche mediante l’introduzione di lubrificante, sotto forma di polvere di grafite, il moto relativo tra le pareti raffreddate e la colata. Il prodotto di colata, che si presenta sotto forma di solido a sezione rettangolare con superficie solidificata, viene fatta avanzare verso il basso da un sistema a rulli, e quindi tagliato in bramme della lunghezza voluta. Successivamente le bramme vengono inviate ai forni di omogeneizzazione della temperatura e poi alla laminazione. Gli impianti di colata continua, adatti per grandi produzioni, si sono sempre più largamente diffusi a partire degli anni ‘50-’60. Il processo richiede un controllo assai preciso della velocità di avanzamento dalla parte solidificata del lingotto e del livello dell’ acciaio fuso che scende nella lingottiera dal serbatoio superiore. Per il controllo di processo è necessario prevedere una diffusa monitorizzazione dell’impianto; in particolare si misura il livello del metallo fuso in lingottiera, la velocità di colata e la distribuzione di temperatura attraverso una serie di termocoppie applicate in punti opportunamente disposti in corrispondenza della superficie di interfaccia della lingottiera stessa. Il controllo della velocità di solidificazione è molto importante perché il metallo fuso deve essere completamente solidificato fino al cuore del lingotto prima di giungere alla sezione di taglio. La sempre maggiore qualità richiesta alle bramme ha fatto incrementare la complessità dei livelli di controllo rendendo indispensabile una automazione del processo sempre più sofisticata. L’impianto preso in esame è destinato a produrre acciaio inossidabile ed è alimentato da un forno elettrico da 180 t di capacità; la produzione ottenibile è di circa 450000 t/a . Si tratta di una macchina del tipo verticale curva servita da una siviera della capacità di 140 t; il raggio di curvatura è di 8 m; inoltre la macchina ha una velocità nominale di 1.25m/1’. La lingottiera è di tipo verticale si sviluppa per 800 mm di altezza. Nella figura 2 si riporta un semplice schema della macchina di colata e nella figura 3 un ingrandimento della sezione di colaggio in lingottiera. La regolazione del processo è manuale. Gli addetti provvedono direttamente a regolare, secondo l’esperienza maturata, i parametri di controllo del processo e cioè il livello dell’acciaio fuso in lingottiera, la velocità di colata e la quantità di polvere lubrificante, sparsa semplicemente sulla superficie fusa. La portata di acqua di refrigerazione della lingottiera viene invece mantenuta costante al suo massimo valore. Sull’impianto è previsto un complesso sistema di monitoraggio che fornisce agli operatori un supporto nella coordinazione delle loro attività. La conduzione della colata è essenzialmente basata sull’esperienza degli addetti; il sistema di controllo, oltre a gestire le fasi di fine batch (ad es. il cambio della siviera) fornisce anche un allarme in presenza di un presunto fenomeno di breakout (v. paragrafo successivo).La struttura funzionale del sistema di controllo consente comunque l’acquisizione automatica dei principali parametri di processo della colata, la loro elaborazione in tempo reale per la rappresentazione grafica delle variabili, l’archiviazione su file storico ed il trasferimento dei dati su PC. I dati di archivio possono essere elaborati off-line per indagini mirate di carattere operativo e/o metallurgico. Il fenomeno del breakout si verifica ogni qualvolta la pelle (o guscio) della bramma si rompe, strappandosi nel contatto con la superficie interna della lingottiera senza una successiva cicatrizzazione, di modo che provoca , all’uscita della lingottiera stessa, un getto di acciaio fuso sulle parti della macchina di colata sottostanti. Gravi sono le conseguenze, in termini di costo, a causa del fermo impianto necessario per gli interventi occorrenti al ripristino funzionale del complesso di colata. Se, durante il processo, ci si accorge del verificarsi di tale fenomeno con sufficiente anticipo, si può intervenire rallentando la velocità di colata e dando così la possibilità all’acciaio di risolidificarsi nel punto in cui è avvenuta la rottura della pelle. Allo stato dell’arte esistono nelle moderne fonderie sistemi diagnostici di allarme che funzionano in modo soddisfacente. Oltre al controllo del breakout nella colata continua degli acciai è di primaria importanza assicurare elevati livelli qualitativi delle bramme, per soddisfare le sempre più severe esigenze di qualità superficiali richieste sul prodotto finito. I difetti superficiali più comuni sono i seguenti:
L’esperienza di fonderia suggerisce che sia il breakout che i difetti superficiali lascino traccia nell’andamento delle temperature della superficie interna della lingottiera. Partendo da questo presupposto le moderne lingottiere sono strumentate con termocoppie atte a rilevare i segnali di temperatura suddetti. Nella figura 4 si riporta uno schema di possibile disposizione dei sensori di temperatura sulla superficie della lingottiera. L’esperienza di fonderia ha confermato che due strati di 12 sensori ciascuno disposti lungo il perimetro sono sufficienti alla rilevazione del breakout. Il riconoscimento dei difetti superficiali , soprattutto di natura localizzata richiede una strumentazione assai più diffusa e complessa. A tal fine i tecnici dell’impianto descritto hanno provveduto a mettere a punto una lingottiera sperimentale con tre strati di termocoppie, opportunamente disposte.
Particolare attenzione è stata posta a rilevare le temperature in vicinanza del menisco fluido, in corrispondenza del quale si generano i difetti più comuni. Un ulteriore problema è provocato dal fatto che le temperature puntuali, soprattutto in vicinanza del menisco, sono fortemente influenzate dal battente fluido sovrastante e pertanto nella elaborazione di detti segnali vanno predisposti opportuni accorgimenti per distinguere le variazioni di temperatura dovute ai difetti da quelle provocate dalla variazione di livello. In questa prima fase della ricerca ci siamo limitati a considerare 9 segnali di temperatura (3 per livello) rilevati sulla fascia centrale della lingottiera (ovviamente si sono presi in considerazione solo i difetti ricadenti in questa fascia). Nelle moderne fonderie esistono sistemi diagnostici che provvedono a generare tempestivamente un allarme all’insorgere del breakout; detti sistemi sono in genere basati su algoritmi di tipo euristico che controllano gli andamenti delle temperature su due livelli di lingottiera, correlando opportunamente i gradienti termici (differenze di temperatura tra due punti di misura adiacenti sullo stesso livello) e gli andamenti temporali delle temperature sui due livelli. L’inconveniente principale di questi sistemi è dovuto al fatto che generano troppi falsi allarmi in conseguenza della taratura in sicurezza dei criteri euristici usati. Komimami ed altri [1] propongono di ridurre i falsi allarmi utilizzando una rete neurale per la diagnostica del breakout. Si ritiene opportuno richiamare brevemente le caratteristiche di questa rete anche perchè questa esperienza, riportata in letteratura, costituisce la base della ricerca originalmente sviluppata con lo scopo più ,ambizioso di predire i difetti superficiali della bramma in via di formazione. La caratteristica fondamentale del sistema proposto dai ricercatori giapponesi è quella di basarsi su una complessa architettura di reti più semplici, ognuna delle quali elabora il segnale fornito da una singola termocoppia; le diverse reti sono opportunamente interconnesse per tener conto della complessità del fenomeno esaminato. Il vantaggio fondamentale di tale struttura è quello di ridurre drasticamente le risorse di calcolo nella fase di addestramento, nella quale ciascuna rete è addestrata indipendentemente dalle altre. L’architettura studiata è del tipo riportato in figura 5. Per rete temporale si intende una rete in grado di riconoscere gli andamenti nel tempo della temperatura. In figura 6 è riportato lo schema di detta rete. Si tratta di una rete con 10 input, uno strato di 8 neuroni nascosti ed un neurone in uscita che dà un valore tra 0 e 1. In ingresso si hanno i valori dei gradienti di temperatura sfasati nel tempo e che avanzano opportunamente cadenzati, grazie alla presenza di uno “schift register”. Compito di questa rete è quello di riconosce gradienti di temperatura elevati e persistenti provenienti dalla termocoppia ad essa collegata. Una volta costruite ed addestrate tutte le 24 reti neurali, occorre metterle in relazione tra loro al fine di valutare anche la diffusione spaziale del fenomeno. Ciò viene fatto attraverso l’utilizzo di un’ulteriore rete neurale che correla due reti spaziali tra loro adiacenti e poiché si tratta di una rete che tiene conto della distribuzione spaziale della temperatura la chiameremo rete spaziale (figura7). Si tratta di una rete con due input in ingresso, uno strato di 4 neuroni nascosti ed un neurone in uscita. I due input provengono dalle reti spaziali adiacenti ed ognuno di essi è scelto come il massimo tra 6 valori successivi di uscita da ogni rete spaziale, valori che attraverso uno “schift register” vengono sfasati con l’avanzamento del processo. La rete spaziale deve essere in grado di riconoscere se le temperature rilevate dalle due termocoppie adiacenti sono o no pericolose.
L’analisi dei segnali di temperatura si presenta assai complessa e manifesta anche la presenza di rumore di diversa natura (vedi figura 8) essenzialmente dovuto all’oscillazione della lingottiera ed all’influenza del livello del metallo fuso; una “colorazione” è inoltre causata dal non uniforme raffreddamento della lingottiera. Si rende pertanto necessario filtrare e depurare opportunamente i segnali prima di procedere all’analisi vera e propria. Ma, anche analizzando attentamente i segnali così trattati ( vedi la figura 9 corrispondente alla 8) non è possibile , a differenza di quanto accade in presenza di breakout, individuare criteri empirici atti a segnalare i difetti in via di formazione. Il trattamento dei segnali è stato effettuato con il toolbox “Signal Process di MATLAB”. Il contributo innovativo del presente lavoro consiste soprattutto nell’avere sperimentato l’idoneità di alcuni tipi di rete neurale per la diagnostica dei difetti superficiali. Dall’ipotesi che la maggior parte dei difetti si formino in vicinanza del menisco fluido i tecnici di fonderia hanno provveduto a strumentare una lingottiera inserendo numerose termocoppie. Nella ipotesi che una rete neurale di adeguata struttura e ben addestrata riesca a riconoscere i difetti cercati dagli andamenti dei segnali di temperatura, si sono eseguiti una serie di tentativi per individuare una rete neurale soddisfacente. In analogia con il monitoraggio del breakout, ci siamo basati sull’ipotesi che le reti neurali da noi cercate debbano comunque operare su campioni successivi delle grandezze misurate in guisa da essere in grado di ricostruire la storia temporale dei segnali rilevati. E’ infatti ben noto che il punto debole dei sistemi esperti basati su reti neurali è quello che non esistono criteri di progettazione atti ad individuare aprioristicamente la struttura della rete, che può essere scelta ,in pratica, solo in analogia con criteri simili o, con approssimazione euristica, per tentativi successivi. Grande importanza riveste poi la scelta dell’insieme dei segnali da usare per la fase di addestramento. Tale insieme deve soddisfare principalmente al requisito di essere sufficientemente numeroso per contemplare tutta la casistica dei difetti, ma non così voluminoso da richiedere tempi di addestramento eccessivi. Come già detto, è stato utilizzato il toolbox “NEURAL NETWORK” di MATLAB operante su un PC 486/66 MHz di adeguate caratteristiche. Scopo principale del lavoro, anche in considerazione delle limitate risorse disponibili, è semplicemente quello di dimostrare la fattibilità di una rete assai più complessa ed atta a tenere sotto controllo l’intera lingottiera e non solo la fascia centrale che viene presa in considerazione. Si ritiene infatti che lo sviluppo di un sistema diagnostico di valenza industriale richieda l’impiego di considerevoli risorse in termini di ore/uomo, piattaforma di calcolo ed impegni di natura finanziaria; tali risorse non sono assolutamente compatibili con quelle normalmente spendibili nell’ambito di un lavoro di ricerca universitaria. Dall’analisi dei segnali di temperatura provenienti da 9 termocoppie centrali si è ritenuto, dopo aver costruito alcune reti neurali, sufficiente considerare solo 3 termocoppie poste alla stessa altezza, privilegiando l’approfondimento della serie temporale dei dati rispetto ai gradienti termici nella direzione di colata. Tale rete è schematizzata in figura 10 ed ha le seguenti caratteristiche. Struttura: 3 strati di 12,8,1 neuroni con funzioni di trasferimento “logsig” , “logsig”, “purelin”. Input: Segnali filtrati di 3 termocoppie adiacenti, derivati e normalizzati con l’espressione: ![]() che naturalmente fornisce un numero compreso tra 0 e 1; i vettori di temperatura così normalizzati sono stati quindi presentati ognuno ad uno schift register di 8 campioni relativi alla durata di 8 secondi. Matrice di addestramento: formata da 24 righe e 1500 colonne in corrispondenza dei segnali forniti ogni secondo per 3 bramme successive. Vettore obiettivo: di 1500 componenti bistabili ( 0 in assenza di difetto, 1 in presenza di difetto). Osservazioni: E’ la rete che più di tutte ha dato risultati soddisfacenti in termini di velocità di addestramento e per la quale si è reputato opportuno proseguire l’addestramento fino a valori accettabili dell’errore.
Figura 10
[Wc1,bc1,Wc2,bc2,Wc3,bc3]=initff(Temp,12,’logsig’,8, ‘logsig’,1,’purelin’,bo1);
tp=[100 500 0.1 0.0098 ];
[Wc1,bc1,Wc2,bc2,Wc3,bc3,te,tr]=TRAINBPX(Wc1,bc1,'logsig',Wc2,bc2,'logsig',Wc3,bc3,
'purelin',Temp,bo1,tp);
a= simuff(Temp,Wc1,bc1,’logsig’,Wc2,bc2,’logsig’,Wc3,bc3,’purelin’);
Dalla propagazione delle simulazioni si nota, al diminuire del parametro di addestramento, come l’errore diminuisca rapidamente.
In figura 14 sono riportati i risultati ad addestramento completato. La presenza del difetto è evidenziata da un gradino unitario nella funzione obiettivo. Si nota come il sistema sia in grado di individuare con soddisfacente precisione la presenza dei difetti e di costituire pertanto la base per un sistema di controllo che abbia lo scopo di ridurre l’entità dei difetti superficiali durante la colata. |