Die Erfindung bezieht sich auf industrielle Prozesssteuerung und insbesondere
auf ein Verfahren und eine Vorrichtung zur adaptiven Steuerung verschiedener einfacher
bis komplexer, einfach bis mehrfach variabler Prozesssteuersysteme, ohne prozesspezifisches
Controller-Design, Prozessidentifizierung, quantitative Kenntnis des Prozesses oder
komplizierte Handabstimmung zu benötigen.
Hintergrund der Erfindung
Das Aufkommen der Informationstechnologie während des letzten Jahrzehnts
hat die heutige Zivilisation wesentlich beeinflusst. Die Informationsrevolution
hat in der Welt der industriellen Prozesssteuerung bedeutende Änderungen ausgelöst.
Eine derartige Intelligenz wie Steuerungsalgorithmen, die in der aktuellen Instrumentenebene
vertreten sind, dehnt sich nach oben auf die überwachende Computer-Ebene oder nach
unten auf die Sensor-/Transmitterebene aus. Zu dieser Änderung führt der Feldbus,
ein digitales Kommunikationsnetzwerk für Sensor, Vorrichtung und Feld. Die Vorteile
bei der Benutzung der Feldbustechnologie können u. a. Verdrahtungsersparnisse, flexiblere
und leistungsfähigere Optionen bei der Implementierung von Steuerungen, gegenseitige
Wartung und diagnostische Informationen beinhalten. Zukünftige Prozesssteuersysteme
werden daher durch Feldbus-Controller und Computer mit einer Feldbusverbindung implementiert
werden. Die herkömmliche Instrumentenebene mit verteilten Steuersystemen (Distributed
Control Systems (DCS)) und speicherprogrammierbaren Steuerungen (SPS) wird schließlich
verschwinden.
United States Patentschrift Nr. US
5,519,612 nach Liubakka et al ist für einen modellbasierten, adaptiven
Controller des bekannten Stands der Technik repräsentativ, der ein Prozessmodell
voraussetzt.
Der Feldbus-Controller ist, worauf sein Name hindeutet, ein an den
Feldbus angeschlossener Controller, der in einer Transmitter-Einfassung angeordnet
sein kann. Da der Feldbus-Controller im Feld und nicht in der Steuerzentrale installiert
ist, sollte er sehr robust sein und kontinuierlich ohne Beachtung arbeiten. Diese
Art von Controller benötigt solide Hardware, Software und Steuerungsalgorithmen.
Da der aktuelle konventionelle Proportional-Integral-Derivative-(PID)-Steuerungsalgorithmus
von Hand abgestimmt werden muss, ist er nicht immer eine gute Lösung für einen Feldbus-Controller.
In den letzten Jahren haben sich die Qualität, Funktionalität und
Zuverlässigkeit von Personal Computers (PCs) wesentlich verbessert. Mit Microsofts
Multitasking Windows NT Betriebssystem kann ein PC ein zuverlässiges und wirtschaftliches
Gerät für missionskritische Applikationen sein, wie zur direkten Prozessregelkreissteuerung.
Die Welt der traditionellen Prozesssteuerung ist auf diese bedeutende
Änderung schlecht vorbereitet. Jahrzehnte alte Steuerschemen wie PID werden heute
noch weit und breit eingesetzt. In der Fabrik stehen wir häufig komplizierten Steuerproblemen
gegenüber, deren Lösung hochgradige Fach- und Sachkenntnisse voraussetzt. Zur gleichen
Zeit werden die Prozesse Tag und Nacht von schlecht vorbereiteten Bedienern betrieben
– eine Tatsache, die ignoriert wird und nicht unberücksichtigt gelassen werden
kann. Es ist daher wünschenswert, gewöhnlichen Bedienern eine Steuertechnik sowie
Produkte zu bieten, mit denen sie einfache bis komplizierte Prozesse leicht und
effektiv steuern können.
Die derzeitige Steuertechnik im Bereich der Prozesssteuerung ist im
Wesentlichen wie folgt:
1. PID-Steuerung
Der alte PID-Controller ist bis heute noch der am meisten benutzte
industrielle Controller. PID ist einfach, kann leicht implementiert werden und benötigt
kein Prozessmodell, weist aber wesentliche Unzulänglichkeiten auf. Erstens funktioniert
PID für den wesentlich linearen, zeitinvarianten Prozess, der nur kleine oder keine
dynamischen Änderungen haben kann. Diese Voraussetzungen sind für viele industrielle
Prozesse zu einschränkend. Zweitens muss PID vom Benutzer richtig abgestimmt werden;
d. h., seine Parameter müssen auf Basis der Prozessdynamik ordnungsgemäß eingestellt
werden. Im wirklichen Einsatz ist die PID-Abstimmung häufig eine frustrierende Erfahrung.
Letztens kann PID nicht effektiv zur Steuerung komplizierter Systeme eingesetzt
werden, die gewöhnlich nicht linear, zeitvariant, gekuppelt sind und Unsicherheiten
in Bezug auf Parameter oder Struktur aufweisen. In der Fabrik ist häufig festzustellen,
dass viele Regelkreise in der manuellen Betriebsart gelassen werden, da die Bediener
es schwierig finden, in der automatischen Closed-loop-Steuerungsart
für den ruhigen Lauf des Regelkreises zu sorgen. Infolge dieser Unzulänglichkeiten
leiden viele industrielle Steuersysteme durch die fortgesetzte Benutzung der PID-Steuerung
heute an Problemen in Bezug auf Sicherheit, Qualität, Energieverschwendung und Produktivität.
Zur Bewältigung von PID-Abstimmproblemen sind manche selbst abgleichende
PID-Methoden entwickelt worden. Viele kommerzielle Controller mit einem Regelkreis
sowie viele verteilte Steuersysteme sind mit selbsttätig abstimmenden oder selbst
abgleichenden PID-Controllern ausgerüstet, deren Anwendungen jedoch auf wesentliche
Hindernisse getroffen sind. Wenn die Selbstabgleichung modellbasiert ist, muss in
der Closed-loop-Situation ein Bump eingefügt werden, um das Prozessmodell zur erneuten
PID-Abgleichung online zu finden. Bediener finden dieses Verfahren unangenehm. Wenn
die Selbstabgleichung regelbasiert ist, ist es häufig schwierig, zwischen den Auswirkungen
von Laststörungen und echten Änderungen der Prozessdynamik zu unterscheiden. Der
Controller kann auf eine Störung also überreagieren und einen unnötigen Adaptierungsübergang
erzeugen. Ferner kann die Abstimmungszuverlässigkeit in einem regelbasierten System
fraglich sein, da für die regelbasierten Systeme keine ausgereiften Methoden zur
Stabilitätsanalyse zur Verfügung stehen. Aus der Erfahrung ist daher bekannt, dass
viele selbst abgleichende PID-Controller eher in der so genannten selbsttätig abstimmenden
Methode als in der kontinuierlichen selbst abgleichenden Methode betrieben werden.
Selbsttätige Abstimmung ist gewöhnlich als ein Merkmal definiert, bei welchem die
PID-Parameter auf Grund eines vereinfachten Prozessmodells, das in der Open-loop-Situation
erreicht werden kann, automatisch kalkuliert werden.
2. Adaptive Steuerung
Ein adaptives Steuersystem kann als ein rückgekoppeltes Steuersystem
definiert werden, das intelligent genug ist, um seine Charakteristiken in einem
wechselnden Umfeld zu verstellen, damit es auf optimale Weise manchen spezifizierten
Kriterien entsprechend funktioniert. Im Allgemeinen haben adaptive Steuersysteme
in Steueranwendungen für Flugzeuge, Raketen und Raumfahrzeuge großen Erfolg verzeichnet.
In industriellen Prozesssteuerungsanwendungen ist die traditionelle adaptive Steuerung
jedoch nicht sehr erfolgreich gewesen. Die lobenswerteste Leistung ist einzig das
vorstehend beschriebene selbst abgleichende PID-Schema, das weit reichend in kommerziellen
Produkten implementiert ist, ohne aber vom Benutzer besonders gut benutzt oder anerkannt
zu werden.
Traditionelle adaptive Steuerungsmethoden, entweder modellbezogen
oder selbst abgleichend, benötigen für die Prozessdynamik gewöhnlich irgendeine
Art von Identifikation. Dies trägt zu einer Anzahl von grundlegenden Problemen bei,
wie das Ausmaß des u. U. erforderlichen Offline-Trainings, der Kompromiss zwischen
der ständigen Erregung von Signalen zur richtigen Identifizierung und die Reaktion
des stationären Systems im Sinn von Regelgüte, der Annahme der Prozessstruktur,
der Modellkonvergenz- und Systemstabilitätsfragen in reellen Applikationen. Ferner
setzen traditionelle adaptive Steuerungsmethoden die Kenntnis der Prozessstruktur
voraus. Sie haben bedeutende Schwierigkeiten, nicht lineare, strukturvariante oder
große zeitverzögerte Prozesse zu bewältigen.
3. Robuste Steuerung
Robuste Steuerung ist eine Controller-Designmethode, die auf die Zuverlässigkeit
(Robustheit) des Steuerungsgesetzes fokussiert ist. Robustheit ist gewöhnlich als
die Mindestanforderung definiert, die ein Steuersystem zu erfüllen hat, um im praktischen
Einsatz nützlich zu sein. Nach dem Design des Controllers ändern sich seine Parameter
nicht mehr, und Regelgüten sind garantiert. Die robusten Steuerungsmethoden setzen
entweder im Zeit- oder im Frequenzbereich voraus, dass die Prozessdynamik und ihre
Variationsbreiten bekannt sind. Manche Algorithmen benötigen u. U. kein präzises
Prozessmodell, sondern dann irgendeine Art von Offline-Identifizierung. Das Design
eines robusten Steuersystems basiert kennzeichnend auf der Annahme des ungünstigsten
Falls, sodass das System im Sinne der Regelgüte unter normalen Verhältnissen normalerweise
nicht im optimalen Zustand arbeitet.
Robuste Steuerungsmethoden sind gut für Anwendungen geeignet, bei
denen die Stabilität und Zuverlässigkeit des Steuersystems an erster Stelle stehen,
die Prozessdynamik bekannt ist und Variationsbreiten von Unsicherheiten geschätzt
werden können. Luft- und Raumfahrzeugsteuerungen sind einige Beispiele solcher Systeme.
Auch bei Prozesssteueranwendungen können manche Steuersysteme mit robusten Steuerungsmethoden
konstruiert werden. Das Design eines robusten Steuersystems setzt jedoch hochgradige
Fach- und Sachkenntnisse voraus. Sobald das Design fertig gestellt ist, kann das
System gut arbeiten. Andererseits benötigt das System ein neues Design, wenn Aktualisierungen
oder wesentliche Modifizierungen erforderlich sind.
4. Prädiktive Steuerung
Prädiktive Steuerung ist wahrscheinlich die einzig fortgeschrittene
Steuerungsmethode, die bis heute in industriellen Steuerungsanwendungen erfolgreich
benutzt worden ist. Die Essenz der prädiktiven Steuerung beruht auf drei Schlüsselelementen:
(1.) prädiktives Modell, (2.) Optimierung im Bereich eines Zeitfensters und (3.)
Rückkopplungskorrektur. Diese drei Schritte werden normalerweise von Computerprogrammen
kontinuierlich online durchgeführt.
Prädiktive Steuerung ist ein Steuerungsalgorithmus, der auf einem
prädiktiven Modell des Prozesses basiert. Das Modell dient sowohl der Voraussage
des zukünftigen Ausgangs auf Grund der historischen Informationen des Prozesses
als auch des zukünftigen Eingangs. Es betont die Funktion des Modells, nicht dessen
Struktur. Deshalb können Zustandsgleichung, Übertragungsfunktion und sogar Sprung-
oder Impulsantwort als das prädiktive Modell benutzt werden. Das prädiktive Modell
ist fähig, das zukünftige Verhalten des Systems aufzuweisen. Der Designer kann deshalb
mit verschiedenen Steuerungsgesetzen experimentieren, um anhand einer Computer-Simulation
den resultierenden Systemausgang festzustellen.
Prädiktive Steuerung ist ein Algorithmus der optimalen Steuerung.
Er kalkuliert eine zukünftige Steuerungsvorgang auf Basis einer Straf- oder Zielfunktion.
Die Optimierung der prädiktiven Steuerung ist jedoch auf einen Zeitraum begrenzt,
der sich bewegt, und sie wird kontinuierlich online vorgenommen. Der sich bewegende
Zeitraum wird manchmal als Zeitfenster bezeichnet. Das ist der ausschlaggebende
Unterschied im Vergleich zu traditioneller optimaler Steuerung, die zur Beurteilung
globaler Optimierung eine Zielfunktion heranzieht. Diese Idee funktioniert für komplizierte
Systeme mit dynamischen Änderungen und Unsicherheiten recht gut, da es in diesem
Fall keinen Anlass gibt, die Optimierungsleistung auf Grund des vollen Zeitbereichs
zu beurteilen.
Prädiktive Steuerung ist auch ein Algorithmus der rückgekoppelten
Steuerung. Bei einer Fehlanpassung zwischen dem Modell und Prozess oder bei einem
durch die Systemunsicherheiten verursachten Regelgüteproblem könnte die prädiktive
Steuerung den Fehler ausgleichen oder die Modellparameter auf Basis von Online-Identifizierung
abgleichen.
Infolge der Essenz prädiktiver Steuerung ist das Design eines solchen
Steuersystems äußerst kompliziert und fordert hochgradiges Fach- und Sachwissen,
obgleich das prädiktive Steuersystem bei der Steuerung verschiedener komplizierter
Prozesssteuersysteme gut funktioniert. Dieses vorausgesetzte Fach- und Sachwissen
scheint der Hauptgrund dafür zu sein, dass prädiktive Steuerung nicht so weit benutzt
wird, wie sie es verdient.
5. Intelligente Steuerung
Intelligente Steuerung ist ein anderes bedeutendes Feld der modernen
Steuertechnik. Obgleich verschiedene Definitionen der intelligenten Steuerung vorhanden
sind, ist sie hier als ein Steuerparadigma bezeichnet, das verschiedenartige künstliche
Intelligenzverfahren heranzieht, die u. U. die folgenden Methoden umfassen: Lernsteuerung,
Expertensteuerung, Fuzzy-Steuerung und neuronale Netzwerksteuerung.
Die Lernsteuerung benutzt Mustererkennungsverfahren, um den aktuellen
Zustand des Regelkreises festzustellen; und sie trifft dann Steuerentscheidungen
auf Grund des Regelkreiszustands sowie der vorher gespeicherten Erkenntnisse oder
Erfahrungen. Da Lernsteuerung durch ihr Speicherwissen begrenzt ist, ist ihre Anwendung
noch nie populär gewesen.
Expertensteuerung auf Grund der Expertensystemtechnik zieht für Steuerungsentscheidungen
eine Wissensbasis heran. Die Wissensbasis wird durch menschliche Fachkenntnisse,
online erworbene Systemdaten aufgebaut und hat ein Inferenzmaschinen-Design. Da
das Wissen der Expertensteuerung symbolisch dargestellt ist und immer ein diskretes
Format hat, ist sie zur Lösung von Entscheidungsfindungsproblemen geeignet, wie
z. B. Fertigungsplanung, Terminplanung und Fehlerdiagnose. Für kontinuierliche Steuerprobleme
ist sie ungeeignet.
Fuzzy-Steuerung ist anders als Lern- und Expertensteuerung auf mathematischen
Fundamenten mit Fuzzy-Mengentheorie aufgebaut. Sie stellt Wissen oder Erfahrung
in gutem mathematischen Format dar, sodass Arbeitscharakteristiken von Prozess und
Systemdynamik durch Fuzzy-Mengen und Fuzzy-Relationalfunktionen beschrieben werden
können. Steuerentscheidungen können auf Basis der Fuzzy-Mengen und Funktionen mit
Regeln erzeugt werden. Obgleich Fuzzy-Steuerung große Möglichkeiten zur Lösung von
komplizierten Steuerproblemen bietet, ist ihr Design-Verfahren
kompliziert und setzt ein hochgradiges Fachwissen voraus. Ferner gehört Fuzzy-Mathe
nicht zum Gebiet der Mathematik, da viele grundlegende mathematische Operationen
nicht existieren. Beispielsweise steht in Fuzzy-Mathe keine inverse Addition zur
Verfügung. Dazu kommt, dass es sehr schwierig ist, eine Fuzzy-Gleichung zu lösen,
obgleich die Lösung einer Differenzialgleichung zu den grundlegenden Übungen der
traditionellen Steuerungstheorie und -applikationen gehört. Der Mangel an guten
mathematischen Werkzeugen ist also ein fundamentales Problem, das die Fuzzy-Steuerung
bewältigen muss.
Neuronale Netzwerksteuerung ist eine Steuermethode, die künstliche
neuronale Netzwerke benutzt. Sie bietet große Möglichkeiten, da künstliche neuronale
Netzwerke auf einem festen mathematischen Fundament aufgebaut sind, das vielseitige
und wohlverstandene mathematische Werkzeuge umfasst. Künstliche neuronale Netzwerke
werden auch als ein Schlüsselelement des modellfreien adaptiven Controllers der
vorliegenden Erfindung benutzt.
Im Allgemeinen muss das Steuersystem, indem größtenteils die traditionelle
adaptive Steuerung, robuste Steuerung, prädiktive Steuerung und intelligenten Steuerungsmethoden
benutzt werden, mit hohen Fach- und Sachkenntnissen konstruiert werden, über welche
Durchschnittsbenutzer nicht verfügen. Die praktische Steuerung komplizierter Systeme
ist wegen der schwierigen Implementierung dieser Methoden sehr schwierig und kostspielig.
Deshalb besteht ein Bedürfnis nach einem fortgeschrittenen Allzweck-Controller,
der leicht und effektiv benutzt werden kann, um eine große Vielfalt einfacher und
komplizierter Systeme zu steuern. Ein derartiger Controller sollte gute Selbstlern-
und Anpassungsfähigkeiten aufweisen, um Änderungen und Unsicherheiten des Systems
zu bewältigen. Er sollte auf den Closed-loop-Echtzeit-Eingangs-/Ausgangsdaten sowie
auf einem qualitativen Wissen des Systemverhaltens allein basiert sein. Es sollten
weder Offline-Identifizierung noch präzise Kenntnis der Systemdynamik erforderlich
sein. Zusätzlich sollte der Controller keine komplizierten Design-Verfahren voraussetzen,
damit er leicht von Jedermann benutzt werden kann.
Zusammenfassung der Erfindung
Die vorliegende Erfindung bewältigt die Beschränkungen des Stands
der Technik, indem Steuersysteme geboten werden, die einen modellfreien adaptiven
(MFA) Controller benutzen. Der MFA dieser Erfindung benutzt einen solchen dynamischen
Block wie ein neuronales Netzwerk mit zeitverzögerten Eingängen, um jeglichen ein-
oder mehrfach variablen, stabilen, steuerbaren und konsistent direkt wirkenden oder
umgekehrt wirkenden, industriellen Open-loop-Prozess zu steuern, ohne komplizierte
Handabstimmung oder Identifizierer oder quantitative Kenntnis des Prozesses zu benötigen.
Die Erfindung erreichte dieses Resultat durch Benutzung eines Lernalgorithmus für
das neuronale Netzwerk, dessen Empfindlichkeitsfunktionsfaktor ∂y(t)/∂u(t)
durch eine arbiträre Nicht-Null-Konstante ersetzt wird. Als diese Konstante wird
vorzugsweise 1 gewählt. Erfindungsgemäß ist der MFA-Controller auch in der Kaskadensteuerung
und Steuerung von Prozessen mit langen Antwortverzögerungen vorteilhaft.
Kurze Beschreibung der Zeichnungen
1 ist ein Blockdiagramm, das ein einfach
variables, modellfreies, adaptives Steuersystem veranschaulicht, das dieser Erfindung
entspricht.
2 ist ein Blockdiagramm, das die Architektur
eines einfach variablen, modellfreien, adaptiven Controllers veranschaulicht, der
dieser Erfindung entspricht.
3 ist ein Blockdiagramm, das ein mehrfach
variables, modellfreies, adaptives Steuersystem veranschaulicht, das dieser Erfindung
entspricht.
4 ist ein Blockdiagramm, das ein 2 ×
2 mehrfach variables, modellfreies Steuersystem veranschaulicht, das dieser Erfindung
entspricht.
5 ist ein Blockdiagramm, das die Architektur
eines modellfreien, adaptiven MIMO-Kompensators veranschaulicht, der dieser Erfindung
entspricht.
6 ist ein Blockdiagramm, das einen 2
× 2 Prozess veranschaulicht, der durch zwei MFA-Controller mit je einem Regelkreis
gesteuert ist, die dieser Erfindung entsprechen.
7 ist ein Blockdiagramm, das ein 3 ×
3 mehrfach variables, modellfreies, adaptives Steuersystem veranschaulicht, das
dieser Erfindung entspricht.
8 ist ein Blockdiagramm, das ein modellfreies,
adaptives SISO-Antiverzögerungssteuersystem veranschaulicht, das dieser Erfindung
entspricht.
9 ist ein Blockdiagramm, das ein 2 ×
2 modellfreies, adaptives Antiverzögerungssteuersystem veranschaulicht, das dieser
Erfindung entspricht.
Modell 10 ist ein Blockdiagramm, das ein Kaskadensteuersystem mit
2 MFA- oder PID-Controllern veranschaulicht.
11 ist ein Zeit-Amplituden-Diagramm,
das die MFA- und PID-Steuerung des strukturvarianten Prozesses 1 veranschaulicht.
12 ist ein Zeit-Amplituden-Diagramm,
das die MFA- und PID-Steuerung des strukturvarianten Prozesses 2 veranschaulicht.
13 ist ein Zeit-Amplituden-Diagramm,
das einen 2 × 2 Prozess veranschaulicht, der durch einen MIMO-MFA-Controller
gesteuert ist.
14 ist ein Zeit-Amplituden-Diagramm,
das einen 2 × 2 Prozess veranschaulicht, der durch zwei SISO-MFA-Controller
gesteuert ist.
15 ist ein Zeit-Amplituden-Diagramm,
das einen 2 × 2 Prozess veranschaulicht, der durch zwei SISO-PID-Controller
gesteuert ist.
16 ist ein Zeit-Amplituden-Diagramm,
das einen MFA-Antiverzögenangs-Controller für Prozesse mit großen Zeitverzögerungen
veranschaulicht.
17 ist ein Zeit-Amplituden-Diagramm,
das eine MFA-Antiverzögerungs-Steuerung mit fehlangepasstem Prädiktormodell veranschaulicht.
18 ist ein Zeit-Amplituden-Diagramm,
das eine MFA- und PID-Steuerung für Prozesse mit großen Zeitverzögerungen veranschaulicht.
19 ist ein Zeit-Amplituden-Diagramm,
das eine modellfreie, adaptive Steuerung für Kaskadensysteme veranschaulicht.
20 ist ein Zeit-Amplituden-Diagramm,
das eine PID-Steuerung für Kaskadensysteme veranschaulicht.
21 ist ein Zeit-Amplituden-Diagramm,
das eine MIMO-MFA-Steuerung für Destillationskolonnen mit Sollwertänderung veranschaulicht.
22 ist ein Zeit-Amplituden-Diagramm,
das eine MIMO-MFA-Steuerung für Destillationskolonnen mit Laständerung veranschaulicht.
Beschreibung der vorgezogenen AusführungsformA. Einfach variable, modellfreie, adaptive Steuerung
1 veranschaulicht ein einfach variables,
modellfreies, adaptives Steuersystem, das die einfachste Form dieser Erfindung ist.
Die Struktur des Systems ist so einfach wie ein traditionelles Einzelkreis-Steuersystem
mit einem Einzeleingang-Einzelausgang-(SISO: single-input-single-output)Prozess
12, einem Controller 10 und Signaladdierern 14,
16. In 1 sind folgende Signale dargestellt:
r(t) – Sollwert y(t) – Gemessene Variable oder die Prozessvariable,
y(t) = x(t) + d(t).
x(t) – Prozessausgang
u(t) – Controllerausgang
d(t) – Störung, die durch Rausch- oder Laständerungen verursachte Störung. e(t) – Fehler zwischen dem Sollwert und der gemessenen Variablen,
e(t) = r(t) – y(t)
Da der modellfreie, adaptive Steuerungsalgorithmus ein adaptiver Online-Algorithmus
ist, ist es das Ziel der Steuerung, die gemessene Variable y(t) zu veranlassen,
die vorgegebene Trajektorie ihres Sollwerts r(t) unter Sollwert-, Störungs- und
Prozessdynamikvariationen zu verfolgen. Anders gesagt, der MFA-Controller hat die
Aufgabe, den Fehler e(t) auf eine Online-Weise zu minimieren.
Dann könnten wir als Zielfunktion für das MFA-Steuersystem auswählen
Es(t) = 1/2e(t)2
= ½[r(t) – y(t)]2(1)
Die Minimierung von Es(t) wird durch Einstellung der Gewichtungen
in dem MFA-Controller vorgenommen.
2 veranschaulicht die Architektur eines
SISO-MFA-Controllers. Ein artifizielles neuronales Netzwerk (ANN) 18 mit
Mehrlagen-Perzeptron (MLP) wird in das Design des Controllers eingeführt. Das ANN
hat eine Eingangsschicht 20, eine verdeckte Schicht 22 mit N Neuronen
und eine Ausgangsschicht 24 mit einem Neuron.
Das Eingangssignal e(t) zur Eingangsschicht 20 wird anhand
der Normalisierungseinheit 26 in ein normalisiertes Fehlersignal E1
mit einem Bereich von –1 bis 1 umgewandelt, wobei N(.) eine Normalisierungsfunktion
bezeichnet. Das E1-Signal geht dann iterativ durch eine Serie von Verzögerungseinheiten
28, wobei z–1 den Verzögerungsoperator der Einheit bezeichnet.
Dann wird ein Satz normalisierter Fehlersignale E2 bis EN
erzeugt. Auf diese Weise wird ein kontinuierliches Signal e(t) in eine Serie von
diskreten Signalen umgewandelt, die als die Eingänge des ANN benutzt werden. Diese
verzögerten Fehlersignale E1, i = 1, ... N werden dann durch die neuronalen
Netzwerkverbindungen zu der verdeckten Schicht übertragen. Das hat die gleiche Bedeutung,
als ob dem neuronalen Netzwerk eine Rückkopplungsstruktur hinzugefügt wäre. Das
reguläre statische Mehrlagen-Perzeptron wird dann zu einem dynamischen neuronalen
Netzwerk, das eine Schlüsselkomponente des modellfreien adaptiven Controllers ist.
Ein modellfreier adaptiver Controller benötigt als seine Schlüsselkomponente
einen solchen dynamischen Block wie ein dynamisches neuronales Netzwerk. Ein dynamischer
Block ist nicht mehr als ein anderer Name für ein dynamisches System, dessen Eingänge
und Ausgänge dynamische Beziehungen haben.
Jedes Eingangssignal wird separat an jedes der Neuronen in der verdeckten
Schicht 22 über eine Strecke übertragen, die durch einen individuellen
Gewichtungsfaktor wij gewichtet ist, wobei i = 1, 2 ... N und j = 1,
2 ... N. Die Eingänge zu jedem der Neuronen in der verdeckten Schicht werden durch
Addierer 30 mit E0 = 1, dem Schwellensignal für die verdeckte
Schicht, über die konstanten Gewichtungen W0j = 1 summiert, um Signal
pJ zu erzeugen. Dann wird das Signal pJ durch eine Aktivierungsfunktion
32 gefiltert, um qJ zu erzeugen, wo j das 1-te Neuron in der
verdeckten Schicht bezeichnet.
Eine Sigmoidfunktion ϕ(.) zur Abbildung der reellen Zahlen bis
(0,1), definiert durch
wird in dem ANN als die Aktivierungsfunktion benutzt.
Jedes Ausgangssignal von der verdeckten Schicht wird an das einzelne
Neuron in der Ausgangsschicht 24 über eine Strecke übertragen, die durch
einen individuellen Gewichtsfaktor hi gewichtet ist, wobei i = 1, 2 ...
N. Diese Signale werden durch Addierer 34 mit h0 = 1, dem Schwellensignal
für die Ausgangsschicht, summiert und dann durch Aktivierungsfunktion
36 gefiltert. Eine Funktion 38, definiert durch
bildet den Bereich der Ausgangsschicht von (0,1) zurück in den reellen Raum ab,
um den Ausgang o(t) des künstlichen neuronalen Netzwerks 18 zu erzeugen.
Der für den Eingang-Ausgang des Controllers maßgebliche Algorithmus
umfasst die folgenden Differenzialgleichungen:
qj(n) = ϕ(pj(n)),(5)v(t) = Kc[o(t) + e(l)],(7)
wobei n die n-te Iteration bezeichnet, o(t) die kontinuierliche Funktion von o(n)
ist, v(t) der Ausgang des modellfreien adaptiven Controllers ist, Kc
> 0, Controller-Gain 42 genannt, eine Konstante ist, die benutzt wird,
um die Größenordnung des Controllers einzustellen. Diese Konstante ist nützlich,
und zwar um die Controller-Leistung fein abzustimmen oder das System in einem beständigen
Bereich zu halten.
Ein Online-Lernalgorithmus wird entwickelt, um die Werte der Gewichtungsfaktoren
des MFA-Controllers kontinuierlich zu aktualisieren, wie folgt:
wobei &eegr; > 0 die Lernrate ist, und die partielle Ableitung ∂y(n)/∂u(n)
der Gradient von y(t) mit Bezug auf u(t) ist, wodurch die Empfindlichkeit des Ausgangs
y(t) auf Variationen des Eingangs u(t) dargestellt ist. Es ist gut geeignet,
als die Empfindlichkeitsfunktion des Prozesses zu definieren.
Da der Prozess unbekannt ist, ist die Empfindlichkeitsfunktion ebenfalls
unbekannt. Dies ist das klassische "Black-box"-Problem, das gelöst werden muss,
um den Algorithmus brauchbar zu machen.
Durch die Stabilitätsanalyse der modellfreien adaptiven Steuerung
wurde festgestellt, dass Begrenzung von Sf(n) – sofern der zu steuernde
Open-loop-Prozess stabil, steuerbar ist und seine Wirkungsart sich während der gesamten
Steuerungsperiode nicht ändert – mit einem Satz arbiträrer Nicht-Null-Konstanten
garantieren kann, dass das System eingangsbegrenzt-ausgangsbegrenzt (BIBO: bounded-input-bounded-output)
stabil ist.
Diese Untersuchung besagt, dass die Prozessempfindlichkeitsfunktion
Sf(n) einfach durch eine Konstante ersetzt werden kann; in Bezug auf
den Lernalgorithmus des modellfreien adaptiven Controllers sind für Sf(n)
keine besondere Behandlung oder keine detaillierten Kenntnisse des Prozesses erforderlich.
Durch Auswahl von Sf(n) = 1 ergibt sich der folgende Lernalgorithmus:
&Dgr;hj(n) = &eegr;Kce(n)q1(n),(12)
Die Gleichungen (1) bis (12) funktionieren für beide Prozessarten,
d. h. direkt wirkende oder umgekehrt wirkende. Direkt wirkend bedeutet, dass die
Erhöhung des Prozesseingangs eine Erhöhung seines Ausgangs veranlassen wird, und
umgekehrt. Umgekehrt wirkend bedeutet, dass die Erhöhung des Prozesseingangs eine
Verminderung seines Ausgangs veranlassen wird, und umgekehrt. Damit die Funktionsfähigkeit
der vorstehenden Gleichungen sowohl für direkt als auch umgekehrt wirkende Fälle
erhalten bleibt, muss e(t) anders, und zwar auf Basis der Wirkungsart des Prozesses
kalkuliert werden, wie folgt:
e(t) = r(t) – y(t), sofern direkt wirkend,(13a)e(t) = –[r(t) – y(t)], sofern umgekehrt wirkend.(13b)
Dies ist die allgemeine Behandlung für die Prozesswirkungsarten. Sie
trifft auf alle modellfreien adaptiven Controller zu, die nachstehend vorgestellt
werden.
B. Mehrfach variable, modellfreie, adaptive Steuerung
3 veranschaulicht ein mehrfach variables
rückgekoppeltes Steuersystem mit einem modellfreien adaptiven Controller. Das System
umfasst einen Multieingang-Multiausgang-(MIMO: multi-input-multi-output)Prozess
44, einen Satz Controller 46 und jeweils einen Satz Signaladdierer
48 bzw. 50 für jeden Regelkreis. Die Eingänge e(t) zu dem Controller
sind dargestellt, indem die Sollwerte r(t) mit den gemessenen Variablen y(t) verglichen
sind, die die Prozessreaktionen auf Controller-Ausgänge u(t) und die Störsignale
d(t) sind. Da dies ein mehrfach variables System ist, sind hier alle Signale als
fett gedruckte Vektoren wie folgt dargestellt:
r(t) = [r1(t), r2(t), ..., rN(t)]T.(14a)e(t) = [e1(t), e2(t), ..., eN(t)]T.(14b)u(t) = [u1(t), u2(t), ..., uN(t)]T.(14c)y(t) = [y1(t), y2(t), ..., yN(t)]T.(14d)d(t) = [d1(t), d2(t), ..., dN(t)]T.(14e),
wobei der obere Index T die Transponierte des Vektors und der untere Index N die
gesamte Elementzahl des Vektors bezeichnet.
Wir werden ohne Einbuße an Allgemeingültigkeit nachweisen, wie ein
mehrfach variables, modellfreies, adaptives Steuersystem mit einem 2-Eingang-2-Ausgang-(2
× 2)-System nach 4 arbeitet, die die 2 ×
2 Anordung von 3 ist. In dem 2 × 2 MFA-Steuersystem
umfasst der MFA-Controller-Satz 52 zwei Controller C11, C22
und zwei Kompensatoren C21 und C12. Der Prozess
54 hat vier Subprozesse G11, G21, G12
und G22.
Die Prozessausgänge als gemessene Variablen y1 und y2
werden als die Rückführsignale der Hauptregelkreise benutzt. Sie werden bei Addierern
56 mit den Sollwerten r1 und r2 verglichen, um Fehler
e1 und e2 zu erzeugen. Der Ausgang jedes Controllers, der
einem der Eingänge e1 oder e2 zugeordnet ist, wird durch Addierer
58 mit dem Ausgang des Kompensators kombiniert, der dem anderen Eingang
zugeordnet ist, um Steuersignale u1 und u2 zu erzeugen. Der
Ausgang eines jeden Subprozesses wird durch Addierer 60 quer addiert, um
gemessene Variablen y1 und y2 zu erzeugen. Es ist zu beachten,
dass die Ausgänge der Subprozesse in reellen Applikationen nicht messbar sind und
einzig ihre kombinierten Signale y1 und y2 gemessen werden
können. Die Eingänge u1 und u2 des Prozesses sind von Natur
des 2 × 2 Prozesses aus mit ihren Ausgängen y1 und y2
vermascht. Die Änderung eines Eingangs veranlasst die Änderung beider Ausgänge.
Bei diesem 2 × 2 System ist die Elementzahl N in Gleichung 14
gleich 2, und die in 4 gezeigten Signale sind wie folgt:
r1(t), r2(t) – Jeweiliger Sollwert von Controllern C11
bzw. C22.
e1(t), e2(t) – Fehler zwischen Sollwert und gemessener
Variablen.
v11(t), v22(t) – Jeweiliger Ausgang von Controller C11
bzw. C22.
v21(t), v12(t) – Jeweiliger Ausgang von Kompensatoren
C21 bzw. C12.
u1(t), u2(t) – Eingänge zum Prozess oder die Ausgänge
des 2 × 2 Controller-Satzes.
x11(t), x21(t), x12(t), x22(t) –
Jeweiliger Ausgang von Prozess G11, G21, G12 bzw.
G22. d1(t), d2(t) – Jeweilige Störung von
y1 bzw. y2.
y1(t), y2(t) – Gemessene Variablen des 2 × 2 Prozesses.
Die Beziehung zwischen diesen Signalen ist wie folgt:
e1(t) = r1(t) – y1(t)(15a)e2(t) = r2(t) – y2(t)(15b)y1(t) = x11(t) + x12(t)(15c)y2(t) = x21(t) + x22(t)(15d)u1(t) = v11(t) + v12(t)(15e)u2(t) = v21(t) + v22(t)(15f)
Die Controller C11 und C22 haben die gleiche
Struktur wie der in 3 gezeigte SISO-MFA-Controller.
Die Eingangs- und Ausgangsbeziehung dieser Controller wird durch die folgenden Gleichungen
ausgedrückt:
Für Controller C11:
q111(n) = &phgr;(p11j(n)),(17)&Dgr;h11j(n) = &eegr;11K11ce1(n)q11j(n),(20)
Für Controller C22:
q221(n) = &phgr;(p221(n)),(22)&Dgr;h22j(n) = &eegr;22K22ce2(n)q221(n).(25)
In diesen Gleichungen sind &eegr;11 > 0 und &eegr;22
> 0 die Lernrate. Kc11 > 0 und Kc22
> 0 sind der jeweilige Controller-Gain für C11 bzw. C22. Ei11(n)
ist das verzögerte Fehlersignal von e1(n), und Ei22(n)
ist das verzögerte Fehlersignal von e2(n).
5 zeigt die Struktur der Kompensatoren
C12 und C21. Diese Struktur unterscheidet sich von der Struktur
des SISO-MFA-Controllers von 2 insofern, als dem Ausgang
o(t) des neuronalen Netzwerks kein Fehlersignal hinzugerechnet wird. Die Eingangs-
und Ausgangsbeziehung in diesen Kompensatoren wird durch die folgenden Gleichungen
ausgedrückt:
Für Kompensator C21:
q21j(n) = &phgr;(p21i(n)),(27)&Dgr;h21j(n) = &eegr;21K21ie1(n)q21i(n),(30)
Für Kompensator C12:
q121(n) = &phgr;(p121(n)).(32)&Dgr;h12j(n) = &eegr;12K12ie2(n)q12i(n),(35)
In diesen Gleichungen sind &eegr;21 > 0 und &eegr;12 >
0 die Lernrate. Kc21 > 0 und Kc12 >
0 sind der jeweilige Controller-Gain für C21 bzw. C12. Ei21(n)
ist das verzögerte Fehlersignal von e1(n), und Ei12(n)
ist das verzögerte Fehlersignal von e2(n).
Die Kompensator-Vorzeichenfaktoren Ks21 und
Ks1243 sind ein Satz von Konstanten, die sich auf
die Wirkungsarten des Prozesses beziehen, wie folgt:
Ks21 = 1, sofern G22 und G21
unterschiedliche Wirkungsarten haben(36a)Ks21 = –1, sofern G22 und
G21 die gleiche Wirkungsart haben(36b)Ks12 = 1, sofern G11 und G12
unterschiedliche Wirkungsarten haben(36d)Ks12 = –1, sofern G11 und
G12 die gleiche Wirkungsart haben(36d)
Diese Vorzeichenfaktoren sind erforderlich um sicherzustellen, dass
die MFA-Kompensatoren Signale in der richtigen Richtung erzeugen, damit die Störungen,
die durch die Kopplungsfaktoren des mehrfach variablen Prozesses verursacht werden,
reduziert werden können.
Mehrfach variable Prozesse können auch durch Benutzung von MFA-Controllern
mit einem Regelkreis gesteuert werden. 6 zeigt ein
Systemdiagramm, in welchem 2 modellfreie, adaptive Controller 62 mit je
einem Regelkreis benutzt werden, um einen 2-Eingang-2-Ausgang-Prozess
64 zu steuern. In diesem Fall werden die Controller die Kopplungsfaktoren
des Prozesses als Störungen behandeln. Dieses Design hat den Vorteil, dass die Struktur
des Steuersystems einfacher ist. Infolge der mächtigen adaptiven Fähigkeit des modellfreien
adaptiven Controllers sollte dieses System für die mehrfach variablen Prozesse,
deren Kopplungsfaktoren nicht sehr stark sind, ziemlich gut funktionieren.
Ein 3 × 3 mehrfach variables, modellfreies, adaptives Steuersystem
ist in 7 mit einem Signalflussplan
gezeigt. In dem 3 × 3 MFA-Steuersystem umfasst der MFA-Controller-Satz
66 drei Controller C11, C22, C33, sowie
sechs Kompensatoren C21, C31, C12, C32,
C13 und C23. Der Prozess 68 hat neun Subprozesse
G11 bis G33. Die Prozessausgänge als gemessene Variablen y1,
y2 und y3 werden als die Rückführsignale der Hauptregelkreise
benutzt. Sie werden bei Addierern 70 mit den Sollwerten r1,
r2 und r3 verglichen, um Fehler e1, e2
und e3 zu erzeugen. Der Ausgang jedes Controllers, der einem der Eingänge
e1, e2 oder e3 zugeordnet ist, wird durch Addierer
72 mit dem Ausgang der Kompensatoren kombiniert, die den beiden anderen
Eingängen zugeordnet sind, um Steuersignale u1, u2 und u3
zu erzeugen.
Ohne Einbuße an Allgemeingültigkeit wird nachstehend ein Satz Gleichungen
angeführt, die für ein arbiträres, mehrfach variables, modellfreies, adaptives N
× N-Steuersystem gelten. Sofern N = 3, trifft es auf das vorstehend erwähnte
3 × 3 MFA-Steuersystem zu.
Für Controller Cll:
q111(n) = &phgr;(p11j(n)),(38)&Dgr;h11j(n) = &eegr;11K11ce1(n)q11j(n),(41)
wo l = 1, 2, ... N.
Für Kompensator Clm:
qlmj(n) = &phgr;(plmi(n)),(43)
&Dgr;hlmj(n) = &eegr;lmKlmcem(n)qlmi(n)(46)
wo l = 1, 2, ... N; m = 1, 2, ... N und l ≠ m.
In diesen Gleichungen sind &eegr;ll > 0 und &eegr;lm
> 0 die Lernrate. Kcll > 0 und Kclm
> 0 sind der jeweilige Controller-Gain für Cll bzw. Clm. Eilm(n)
ist das verzögerte Fehlersignal von e1(n), und Eilm(n)
ist das verzögerte Fehlersignal von em(n).
KlmS ist der Vorzeichenfaktor für den MFA-Kompensator,
der auf Grund der Wirkungsarten der Subprozesse wie folgt ausgewählt wird:
KSlm = 1, sofern Gll und Glm
unterschiedliche Wirkungsarten haben(47a)KSlm = –1, sofern Gll und
Glm die gleiche Wirkungsart haben(47b)wo l = 1, 2, ... N; m = 1, 2, ... N; und l ≠ m.
C. Modellfreie, adaptive Steuerung für Prozesse mit großen
Zeitverzögerungen
In Prozesssteuerungsapplikationen haben viele Prozesse große Zeitverzögerungen
infolge der Verzögerung bei der Transformation von Wärme, Materialien und Signalen
usw. Ein gutes Beispiel ist ein Bandrollprozess, z. B. ein Stahlwalzwerk oder eine
Papiermaschine. Es ist völlig gleich, welche Steuermaßnahmen ergriffen werden, ihre
Auswirkungen sind ohne eine Zeitverzögerungsperiode nicht messbar. Wenn in diesem
Fall ein PID benutzt wird, wird der Controller-Ausgang während der Verzögerungszeit
ständig weiter wachsen und eine große Überschwingzeit in Systemreaktionen verursachen
oder das System sogar unstabil machen. Smith Predictor ist ein nützliches Steuerschema
zur Bewältigung von Prozessen mit großen Zeitverzögerungen. Zur Konstruktion eines
Smith Predictor ist jedoch normalerweise eine genaues Prozessmodell erforderlich,
da seine Leistung sonst nicht zufrieden stellend sein könnte.
8 zeigt ein Blockdiagramm für ein modellfreies,
adaptives, Einzel-Eingang-Einzel-Ausgang-Antiverzögerungssteuersystem mit einem
MFA-Antiverzögerungs-Controller 74 und einem Prozess mit großen Zeitverzögerungen
76. Ein Spezialverzögerungsprädiktor ist zur Erzeugung eines dynamischen
Signals yc(t) ausgebildet worden, um die gemessene Variable y(t) als
das Rückführsignal zu ersetzen. Der Eingang zum Controller 80 wird dann
über Addierer 82 wie folgt errechnet:
e(t) = r(t) – yc(t).(48)
Die Idee hier ist, ein e(t)-Signal für den Controller zu erzeugen
und diesen seine Steuerwirkung ohne große Verzögerung "fühlen" zu lassen, damit
die Erzeugung ordnungsgemäßer Steuersignale fortgesetzt wird.
Da der MFA-Controller des Systems über eine starke adaptive Fähigkeit
verfügt, kann der Verzögerungsprädiktor in einer einfachen Form entworfen werden,
ohne die quantitativen Informationen des Prozesses zu kennen. Er kann beispielsweise
in einer generischen Lag-plus-Verzögerungsform (FOLPD: first-order-lag-plus-delay)
erster Ordnung ausgebildet werden, die durch die folgende Laplace-Transformationsfunktion
dargestellt ist:
wo Y(S), Yp(S), U(S) und Yc(S) jeweils die Laplace-Transformationen
von Signalen y(t), yp(t), u(t) bzw. yc(t) sind; wo yp(t)
das prädiktive Signal ist; wo yc(t) der Ausgang des Prädiktors ist; wo
K, T, &tgr; die Parameter für den Prädiktor auf Basis des Prozessapproximationsmodells
in einer FOLPD-Form sind. In echten Anwendungen kann DC-Gain K beim Geräteeichungs-
und Datenkonvertierungsverfahren nahe 1 eingestellt werden. Der Benutzer kann die
Prozessverzögerungszeit leicht grob abschätzen, die als &tgr; im MFA-Prädiktor benutzt
werden kann. T kann entweder vom Benutzer ausgewählt oder als 20T vorgegeben werden,
wo T das Stichprobenintervall ist. Spätere Simulationen weisen auf, dass das MFA-Antiverzögerungssystem
in Bezug auf diese Parameter nicht sehr empfindlich ist.
Verglichen mit dem traditionellen Smith Predictor ist das Prozessmodell
für dieses Design hier nicht erforderlich, und die Simulation zeigt, dass es für
Prozesse mit sehr großen Zeitverzögerungen doch noch eine große Regelgüte erzielen
kann.
9 veranschaulicht ein 2 × 2 mehrfach
variables, modellfreies, adaptives Antiverzögerungssteuersystem. Der MFA-Antiverzögerungs-Controller-Satz
84 umfasst zwei MFA-Controller C11 und C22, zwei
Kompensatoren C21 und C12 und zwei Prädiktoren D11
und D22. Der Prozess 86 hat große Zeitverzögerungen in den Hauptregelkreisen.
Gleichung (49) kann für das Design des Prädiktors verwendet werden. Ein mehrfach
variables MFA-Antiverzögerungs-Steuersystem höherer Ordnung kann ohne Einbuße an
Allgemeingültigkeit dementsprechend ausgebildet werden.
D. Modellfreies, adaptives Kaskadensteuersystem
Wenn ein Prozess zwei oder mehr wesentliche potenzielle Störungen
hat und der Prozess in zwei Regelkreise geteilt werden kann (einer ist schnell und
einer ist langsam), kann die Kaskadensteuerung benutzt werden, um störungsbezogene
Berichtigungsmaßnahmen schneller zu ergreifen und so die gesamte Regelgüte
zu verbessern. Wie in 10 gezeigt, umfasst ein Kaskadensystem
zwei Controller, den Primärcontroller C1 und den Sekundärcontroller C2.
Der innere Regelkreis 88 umfasst C2 und P2, und der
äußere Regelkreis 92 umfasst C1 und P1, wo P190 aus C2, P2 und P3 besteht. Der Ausgang
von C1 treibt den Sollwert von C2.
Obgleich Kaskadensteuerung eines der nützlichsten Steuerschemen der
Prozesssteuerung ist, wird häufig festgestellt, dass die Bediener in echten Kaskadensteueranwendungen
den äußeren Regelkreis nicht schließen. Sie machen gewöhnlich geltend, dass die
Systemreaktionen anfangen zu oszillieren, sobald der äußere Regelkreis geschlossen
wird.
Wegen der interagierenden Eigenschaft der Regelkreise im Kaskadensteuersystem
ist es weitaus wichtiger, dass Controller ordnungsgemäß abgestimmt werden. Wenn
jedoch PI- oder PID-Controller benutzt werden, müssen 4 bis 6 PID-Parameter abgestimmt
werden. Es ist nicht leicht, gute Kombinationen derartig zahlreicher Parameter zu
finden. Wenn die Prozessdynamik häufig wechselt, müssen die Controller dauernd neu
abgestimmt werden, denn die interagierende Eigenschaft des inneren und äußeren Regelkreises
kann sonst ernsthafte Probleme in Bezug auf Systemstabilität verursachen. Da der
MFA-Controller zu einem guten Ausgleich von Änderungen der Prozessdynamik fähig
ist, weist die Closed-loop-Dynamik des inneren Regelkreises mit MFA-Controller C2
keine große Änderung auf, auch wenn sich die Prozessdynamik von P2 u.
U. stark ändert. Das bedeutet, dass die Zusammenschaltung des äußeren und des inneren
Regelkreises viel schwächer wird. Ein stabilerer innerer Regelkreis trägt zu einem
stabileren äußeren Regelkreis zu, und umgekehrt. Da jeder einfach variable MFA-Controller
ferner nur einen Abstimmparameter hat, den Controller-Gain Kc, und er
normalerweise nicht abgestimmt werden muss, wird es viel leichter, das modellfreie,
adaptive Kaskadensteuersystem zu starten und aufrecht zu erhalten.
E. Simulationsresultate
Die durch Benutzung der Erfindung erzielten Resultate werden am Besten
durch die folgenden Simulationsdiagramme veranschaulicht. Die folgenden Notationen
werden bei der Besprechung dieser Diagramme benutzt:
S – Laplace-Transformationsoperator.
Gp(S) – Laplace-Übertragungsfunktion des Prozesses,
Y(S) – Laplace-Transformation von y(t), des Prozessausgangs oder der gemessenen
Variablen,
U(S) – Laplace-Transformation von u(t), des Prozesseingangs oder Controller-Ausgangs.
Die Beziehung zwischen Gp(S), Y(S) und U(S) ist:
Die in dieser Simulation benutzten Prozessmodelle sind in diesen Gleichungen
dargestellt:
11 und 12
zeigen die Simulationsresultate der MFA- und PID-Steuerung für einen strukturvarianten
Prozess, dessen Steuerung sehr schwierig ist. In diesem Fall werden Prozessmodelle
2 bis 5 benutzt. Die Prozessmodelle werden während der Simulation online geschaltet,
um die Strukturänderung zu erzeugen. Bei der Simulation ist die Mittelstellung des
MFA-Controller-Gain Kc = 1, und PID wird mit Kp = 1, Ki
= 10 und Kd = 2 auf Modell 2 abgestimmt. Die gesamten Controller-Abstimmparameter
bleiben unverändert, obgleich der Prozess sich ändert.
In 11 und 12
sind die Kurven 100 und 106 Sollwerte für MFA und PID, Kurven
104 und 110 sind gemessene Variablen für MFA und PID, und Kurven
102 und 108 sind die jeweiligen Controller-Ausgänge für MFA bzw.
PID.
In 11 beginnt das Prozessmodell mit Modell
2 und ändert sich dann auf 3, und zwar knapp vor der zweiten Sollwertänderung
ungefähr im Bereich der 4,5-Minuten-Stelle. In 12 beginnt
das Prozessmodell mit Modell 4 und ändert sich dann auf 5, und zwar knapp
vor der zweiten Sollwertänderung ungefähr im Bereich der 3,7-Minuten-Stelle. Es
ist ohne weiteres erkennbar, dass sich der MFA-Controller den Prozessstrukturänderungen
äußerst gut anpassen kann, während der PID-Controller dazu nicht im Stande ist.
13 bis 15
zeigen die Simulationsresultate eines 2 × 2 Prozesses, der jeweils durch einen
Satz von MIMO-MFA-Controllern, zwei SISO-MFA-Controllern bzw. zwei SISO-PID-Controllern
gesteuert ist. Der 2 × 2 Prozess ist anhand der Prozessmodelle 1, 2, 3 und
4 für jeweils P11, P21, P12 bzw. P22
simuliert. Dieser MIMO-Prozess ist schwer gekoppelt, sodass es ziemlich schwierig
ist, ihn zu steuern.
In 13 sind Kurven 112 und
118 die Sollwerte r1 und r2, Kurven 114
und 120 sind die gemessenen Variablen y1 und y2,
und Kurven 116 und 122 sind jeweils Ausgänge v11 und
v22 für MIMO-MFA-Controller C11 bzw. C22.
In 14 sind Kurven 124 und
130 die Sollwerte r1 und r2, Kurven 126
und 132 sind die gemessenen Variablen y1 und y2,
und Kurven 128 und 134 sind jeweils Ausgänge u1 und
u2 für SISO-MFA-Controller C1 bzw. C2.
In 15 sind Kurven 136 und
142 die Sollwerte r1 und r2, Kurven 138
und 144 sind die gemessenen Variablen y1 und y2,
und Kurven 140 und 146 sind jeweils Ausgänge u1 und
u2 für SISO-PID-Controller C1 bzw. C2.
Beim Vergleich von 13, 14
und 15 ist festzustellen, dass der MIMO-MFA
die beste Regelgüte und der SISO-PID die schlechteste Regelgüte haben. Ohne die
Kompensatoren fällt der Ausgang u2 des SISO-Controllers C2
auf 0 Prozent, eingeschränkt durch die untere Grenze. Mit den MIMO-MFA-Kompensatoren
erzielt der MIMO-Controller einen ausgedehnteren Betriebsbereich, sodass sein Ausgang
v22 im Arbeitsbereich bleiben kann. Zusätzlich wird der andere Regelkreis
von den durch die Sollwertänderungen verursachten Störungen in viel kleinerem Maßstab
beeinträchtigt. Abschließend kann die MIMO-MFA-Steuerung die Regelgüte des Systems
und seinen Stabilitätsbereich erhöhen. In diesen Simulationen sind die Kc
der MFA-Controller ohne Abstimmung auf 1 als Vorgabeeinstellung eingestellt. Der
PID-Controller ist gut abgestimmt, aber seine Leistung ist immer noch nicht besonders
zufrieden stellend.
16 und 17
zeigen die Simulationsresultate eines Prozesses, der durch einen MFA-Antiverzögerungscontroller
mit anderen Verzögerungsprädiktorparametern gesteuert ist. Modell 6 wird
zur Simulation eines Prozesses mit großen Zeitverzögerungen benutzt. In diesen Abbildungen
zeigen Kurven 148 und 158 den Sollwert r(t), Kurven
150 und 160 zeigen die echte gemessene Variable y(t), Kurven
152 und 162 zeigen den Controller-Ausgang u(t), Kurven
154 und 164 zeigen den Ausgang des Prädiktors yc(t),
und Kurven 156 und 166 zeigen das prädiktive Signal yp(t).
Die Auswirkungsweise der Zeitverzögerung auf die Prozessdynamik hängt
mit der Zeitkonstanten zusammen. Normalerweise wird das Verhältnis zwischen &tgr;
und T benutzt, um die Signifikanz von Zeitverzögerungswirkungen auf einen Prozess
zu messen, wie folgt:
Ein PID-Controller kann normalerweise einen Prozess mit einem Verhältnis zwischen
&tgr; und T von etwa 1 bewältigen. Hier bei Modell 6 ist dieses Verhältnis zwischen
&tgr; und T so hoch wie 9. (&tgr; = 90, dominante Zeitkonstante T = 10). Das zu
bewältigen, ist für jede Art normaler Controller sehr schwierig. Der MFA-Antiverzögerungs-Controller
kann diesen Prozess jedoch ganz leicht steuern. In 16
ist Prädiktor &tgr; = 90, T = 20, was ziemlich gut mit dem Prozess übereinstimmt.
In 17 wird vorsätzlich eine Fehlanpassung zwischen
Prädiktorparametern und Prozess erzeugt. Die Prädiktorparameter sind &tgr; = 75,
T = 20, die Prozessparamenter sind &tgr; = 90, Dominante T = 10. Ihre Fehlanpassung
ist signifikant. Entsprechend 17 kann der MFA den Prozess
aber immer noch gut steuern. Der MFA-Antiverzögerungs-Controller bietet wesentliche
Vorteile im Vergleich zum traditionellen Smith-Predictor-Steuerschema.
18 zeigt die Simulationsresultate in
Bezug auf die Steuerung von Prozessen mit großen Zeitverzögerungen mit normalen
MFA- und PID-Controllern. In 18 sind Kurven
168 und 174 die Sollwerte, Kurven 170 und 176
sind die gemessenen Variablen, und Kurven 172 und 178 sind die
Ausgänge. Das Prozessmodell 7 wird für die Simulation benutzt. Da das &tgr;/T-Verhältnis
für Modell 7 (&tgr; = 20, Dominante T = 10) 2 ist, kann es im Vergleich zu Modell
6 viel leichter gesteuert werden. Es ist jedoch ersichtlich, dass dieser Prozess
sogar von einem MFA nicht besonders gut gesteuert werden kann, während ein PID einen
Prozess dieser Art überhaupt nicht bewältigen kann, ganz gleich, wie man ihn abstimmt.
Diese Simulation impliziert auch den Wert des MFA-Antiverzögerungs-Controllers,
der in 16 und 17
gezeigt ist.
19 und 20
zeigen die MFA- und PID-Steuerung für Kaskadensysteme.
In 19 sind Kurven 180 und
186 Sollwerte für C1 und C2, Kurven 182
und 188 sind gemessene Variablen für C1 und C2, und
Kurven 184 und 190 sind jeweils Ausgänge für C1 bzw.
C2.
In 20 sind Kurven 192 und
198 Sollwerte für C1 und C2, Kurven 194
und 200 sind gemessene Variablen für C1 und C2, und
Kurven 196 und 202 sind jeweils Ausgänge für C1 bzw.
C2.
Die Simulation beginnt, wenn sowohl der innere Regelkreis als auch
der äußere Regelkreis offen sind und u2 (Kurve 190 oder
202) auf 20 Prozent gestellt ist. Der innere Regelkreis wird geschlossen,
indem der Auto-/Handschalter von C2 an der 3-Minuten-Stelle auf automatisch
gedreht und sein Sollwert r2 (Kurve 186 oder 198) von
20 auf 30 Prozent erhöht wird. Es ist ersichtlich, dass der innere Regelkreis sowohl
durch den MFA als auch den PID gut gesteuert werden kann. Der Fern-/Ortsschalter
von C2 ist auf Fern gestellt und fordert einen Fernsollwert an der 4,8
Minuten-Stelle. Er wird den Sollwert von C2, r2 (Kurve
186 oder 198) zwingen, dem Ausgang von C1, u1
(Kurven 184, 196) zu folgen. Danach wird der äußere Regelkreis
geschlossen, indem der Auto-/Handschalter von C1 auf Auto gedreht wird.
Daraufhin sind beide Regelkreise geschlossen, und das System ist in Kaskade geschaltet.
Die Regelgüte des Kaskadensystems wird durch Änderung des Sollwerts von C1,
r1 (Kurve 180 oder 192) simuliert. Es ist ersichtlich,
dass die MFA-Controller das Kaskadensystem ohne besondere Anforderungen steuern
können. Der Controller-Gain Kc = 1 ist die Vorgabeeinstellung sowohl
für MFA C1 als auch C2. Andererseits wird das PID-gesteuerte
System schnell unstabil. Während dieser Simulation gab man sich alle Mühe, den PID
abzustimmen, aber das Ergebnis blieb unbefriedigend. Der Grund ist die Empfindlichkeit
von PID auf Änderungen der Prozessdynamik. In der Tat erzeugen Wechselwirkungen
zwischen den inneren und äußeren Regelkreisen eines Kaskadensystems bedeutende dynamische
Änderungen.
F. Simulation des reellen Prozesses
Für die Simulation des MIMO-MFA-Steuersystems wird ein reelles Modell
einer Destillationskolonne, die Wood and Berry Kolonne 21, ausgewählt. Das Modell
ist durch die folgenden Laplace-Übertragungsfunktionen dargestellt:
wo XD die höchste Komposition oder Destillationskomposition ist, XB
die unterste Komposition ist, Rf die Rücklaufströmung ist, Sf
die Dampfströmung ist und Fr die Zuführgeschwindigkeit ist. D11
und D22 sind die Störungen, die durch die Änderung der Zuführgeschwindigkeit
verursacht werden.
21 und 22
zeigen die Simulationsresultate für diese Destillationskolonne mit einem 2 ×
2 MFA-Controller-Satz. 21 zeigt die Regelgüte für Sollwertänderungen,
und 22 zeigt die Regelgüte für Laständerungen.
In 21 sind Kurven 204 und
210 die Sollwerte für C11 und C22, Kurven
206 und 212 sind die gemessenen Variablen für C11 und
C22, und Kurven 208 und 214 sind die jeweiligen Ausgänge
für C11 bzw. C22. Es ist ersichtlich, dass r1 (Kurve
204) an der 1,3-Minuten-Stelle erhöht ist und r2 (Kurve
210) ungefähr an den 4-Minuten- und 6-Minuten-Stellen reduziert ist. Dies
demonstriert eine gute Regelgüte insgesamt. Infolge der Funktionen der MFA-Kompensatoren,
die im MIMO-MFA-Controller-Satz enthalten sind, sind die Störungen von geringer
Größe. Wenn normale PID-Controller benutzt würden, wären die Störungen weitaus signifikanter,
was bedeutende Steuerprobleme verursachen würde.
In 22 sind Kurven 216 und
222 die Sollwerte für C11 und C22, Kurven
218 und 224 sind die gemessenen Variablen für C11 und
C22, und Kurven 220 und 226 sind die jeweiligen Ausgänge
für C11 bzw. C22. Kurve 228 ist der Zuführgeschwindigkeitssollwert
fr(t) (Fr(S) in Laplace-Transformation), und Kurven
230 und 232 sind die Störsignale d11(t) und d22(t)
(D11(S) und D22(S) in Laplace-Transformation), die durch die
Zuführgeschwindigkeitsänderung verursacht sind. Die Simulation zeigt auf, dass sich
die Zuführgeschwindigkeit zweimal an der 2-Minuten- und 3,3-Minuten-Stelle ändert,
wodurch das System gestört wird. Die MFA-Controller können diese Störungen ausgleichen.
Anspruch[de]
Modellfreies adaptives Steuersystem für einen stabilen, kontrollierbaren
und direktwirkenden oder umgekehrt wirkenden industriellen Open-loop-Prozess
(12) mit einem Prozesseingang (u(t)), einem Prozessausgang (x(t)), der
ein Bestandteil einer gemessenen Prozessvariablen (y(t)) ist, einer Empfindlichkeitsfunktion,
die das Verhältnis ∂y(t)/∂u(t) zwischen den partiellen Ableitungen in
Bezug auf Zeit des genannten Prozessausgangs (x(t)) und dem genannten Prozesseingang
(u(t)) ist, und einer Steuerzielfunktion Es(t), die von dem Fehlerwert
(e(t)) errechnet wird, der die Differenz zwischen einer gemessenen Prozessvariablen
(y(t)) und einem gewählten Sollwert (r(t)) ist, dadurch gekennzeichnet, dass
das System Folgendes umfasst:
a) einen dynamischen Block mit einem Fehlerwerteingang (e(t)) und einem Steuerwertausgang
(v(t)), wobei der genannte dynamische Block so angeordnet ist, dass er iterativ
über ein sich bewegendes Zeitfenster den genannten Steuerwertausgang (v(t)) variiert,
um den genannten Fehlerwert (e(t)) zu minimieren; und
b) einen Lernmechanismus zum kontinuierlichen iterativen Modifizieren der Parameter
des genannten dynamischen Blocks zum Variieren des genannten Steuerwertausgangs
(v(t)), um den genannten Fehlerwert (e(t)) zu reduzieren;
c) wobei der genannte Prozess gemäß dem Steuerwertausgang (v(t)) gelenkt wird, der
als Prozesseingang (u(t)) verwendet wird.
System nach Anspruch 1, ferner dadurch gekennzeichnet, dass der genannte
Lernmechanismus nur auf der genannten gemessenen Prozessvariablen (y(t)), dem genannten
Steuerwert (v(t)) und dem genannten Sollwert (r(t)) basiert.
System nach Anspruch 1 oder 2, ferner dadurch gekennzeichnet, dass
eine arbiträre Nicht-Null-Konstante für die tatsächliche Empfindlichkeitsfunktion
des genannten Prozesses (12) in dem genannten Lernmechanismus substituiert
wird.
System nach Anspruch 3, dadurch gekennzeichnet, dass die genannte arbiträre
Konstante 1 ist.
System nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass
die genannte Steuerzielfunktion Es(t) = 1/2e(t)2
und e(t) der genannte Differenzwert zwischen der genannten gemessenen Prozessvariablen
(y(t)) und dem genannten Sollwert (r(t)) ist.
System nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass
der genannte dynamische Block ein neuronales Netzwerk (18) enthält, das
als direkte Eingänge (20) eine Mehrzahl von aufeinander folgenden zeitverzögerten
Eingängen (E1 bis EN) des genannten Fehlerwertes (e(t)) hat.
System nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass
der Ausgang (o(t)) des genannten neuronalen Netzwerkes (18) und der genannte
Fehlerwert (e(t)) zum Erzeugen des genannten Steuerwertes (v(t)) addiert werden.
System nach einem der Ansprüche 1 bis 7, angepasst an einen Prozess
(76), in dem die gemessene Prozessvariable (y(t)) eine große Zeitverzögerung
beim Reagieren auf den genannten Prozesseingang (u(t)) hat, dadurch gekennzeichnet,
dass es ferner Folgendes umfasst:
a) einen Verzögerungsprädiktor (78), dessen Eingänge die genannte gemessene
Prozessvariable (y(t)) und der genannte Prozesseingang (u(t)) sind, wobei der Ausgang
des genannten Verzögerungsprädiktors Folgendes ist:
wobei Y(S), U(S) und Yc(S) jeweils die Laplace-Transformationen der genannten
gemessenen Variablen (y(t)), der genannte Prozesseingang (u(t)) und der genannte
Verzögerungsprädiktorausgang (yc(t)) sind; K, T und &tgr; sind Konstanten;
und
b) der Fehlerwert (e(t)) wird durch e(t) = r(t) – yc(t) errechnet.
System nach Anspruch 8, dadurch gekennzeichnet, dass K im Wesentlichen
1 ist und T und &tgr; so gewählt werden, dass sie sich bekannten Antwortverzögerungsparametern
des genannten Prozesses nähern.
System nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass
a) der genannte dynamische Block ein dreischichtiges künstliches neuronales Netzwerk
(18) enthält, das Folgendes umfasst:
i) eine erste Schicht (20) aus einer ersten Mehrzahl von Neuronen, die
jeweils als Eingang und Ausgang (E1 bis EN) einen Wert haben,
der für den genannten Fehlerwert (e(t)) in einer aus der Mehrzahl von aufeinander
folgenden Iterationen repräsentativ ist; ii) eine zweite Schicht (22) aus einer zweiten Mehrzahl
von Neuronen (30), die jeweils als Eingänge die Ausgänge von jedem aus
der genannten ersten Mehrzahl von Neuronen multipliziert mit einem ersten Variablengewichtungsfaktor
(wij) haben und deren Ausgangswert (p1 bis pN)
die Summe ihrer Eingangswerte ist; und
iii) ein Dritte-Schicht-Neuron, dessen Eingänge (q1 bis qN)
Werte sind, die für den Ausgangswert (p1 bis pN) von jedem
aus der genannten zweiten Mehrzahl von Neuronen multipliziert mit einem zweiten
Variablengewichtungsfaktor (hj) sind, und dessen Ausgangswert die Summe
seiner Eingangswerte ist;
b) wobei der genannte Steuerwert (v(t)) ein Wert ist, der für die Summe des neuronalen
Netzwerkausgangs (o(t)) und des genannten Fehlerwertes (e(t)) in der aktuellen Iteration
repräsentativ ist;
c) wobei der genannte erste Gewichtungsfaktor (wij) kontinuierlich in
aufeinander folgenden Iterationen gemäß der folgenden Formel aktualisiert wird:
in der &Dgr;wij die Änderung des Gewichtungsfaktors des Ausgangs des
i-ten Erste-Mehrzahl-Neurons zum j-ten Zweite-Mehrzahl-Neuron von der letzten vorherigen
Iteration zur aktuellen Iteration ist; &eegr; ein vorgewählter Lernfaktor ist; Kc
eine vorgewählte Konstante ist; ∂y(t)/∂u(t) die Empfindlichkeitsfunktion
des genannten Prozesses ist; e der Fehlerwert ist; qj der normalisierte
Ausgang des j-ten Zweite-Mehrzahl-Neurons ist; Ei der normalisierte Fehlerwert
ist, der auf das i-te Erste-Mehrzahl-Neuron angewendet wird; N die Zahl von Erste-Mehrzahl-Neuronen
ist; &Sgr;hk die Summe der genannten zweiten Gewichtungsfaktoren ist;
und (n) die aktuelle Iteration bezeichnet; und
d) wobei der genannte zweite Gewichtungsfaktor (hj) kontinuierlich in
aufeinander folgenden Iterationen gemäß der folgenden Formel aktualisiert wird
in der &Dgr;hj die Änderung des Gewichtungsfaktors des Ausgangs des j-ten
Zweite-Mehrzahl-Neurons zum genannten Dritte-Schicht-Neuron von der letzten vorherigen
Iteration zur aktuellen Iteration ist.
Modellfreies adaptives Steuersystem für eine Mehrzahl von stabilen
interagierenden industriellen Open-loop-Prozessen (46, 54 oder
68) jeweils mit einem Prozesseingang (u1, u2, ...),
einem gemessenen Prozessausgang (x11, x21, x12,
x22, ...), einer Empfindlichkeitsfunktion, die das Verhältnis zwischen
den partiellen Ableitungen mit Bezug auf Zeit des genannten Prozessausgangs und
des genannten Prozesseingangs ist; und einer Steuerzielfunktion Es(t),
die von den Fehlerwerten (e1, e2, ...) errechnet wird, die
jeweils die Differenz zwischen der gemessenen Prozessvariablen (y1, y2,
...) eines entsprechenden Prozesses und einem gewählten Sollwert (r1,
r2, ...) für diesen Prozess sind; dadurch gekennzeichnet, dass das genannte
System Folgendes umfasst:
a) eine erste Mehrzahl von Controllern (C11, C22, ...) jeweils
mit einem Fehlerwerteingang (e1, e2, ...) und einem Steuerwertausgang
(v11, v22, ...); und eine zweite Mehrzahl von Kompensatoren
(C21, C12, ...) jeweils mit einem Fehlerwerteingang (e1,
e2, ...) und einem Kompensationswertausgang (v21, v12,
...);
b) eine Mehrzahl von Addierern (58 oder 72) mit der Aufgabe, zu
den einzelnen genannten Steuerwertausgängen (v11, v22, ...)
der genannten Controller (C11, C22, ...) die Kompensationswertausgänge
(v21, v12, ...) der genannten Kompensatoren (C21,
C12, ...) zu addieren;
c) wobei der Ausgang jedes genannten Addierers als Prozesseingang (u1,
u2, ...) von einem der genannten interagierenden Prozesse (G11,
G21, G12, G22, ...) verwendet wird; und
d) einen Lernmechanismus zum kontinuierlichen iterativen Modifizieren der Parameter
jedes der genannten Controller und Kompensatoren zum Variieren der genannten Steuerwerte
(v11, v22, ...) und Kompensationswerte (v21, v12,
...), um die genannten Fehlerwerte (e1, e2, ...) zu reduzieren;
wobei der genannte Lernmechanismus nur auf den genannten gemessenen Prozessvariablen
(y1, y2, ...), Steuerwerten (v11, v22,
...) und den genannten Sollwerten (r1, r2, ...) basiert.
System nach Anspruch 11, dadurch gekennzeichnet, dass der genannte
Lernmechanismus iterativ die genannten Parameter in Abhängigkeit von den genannten
Empfindlichkeitsfunktionen modifiziert, in denen arbiträre Nicht-Null-Konstanten
für die tatsächlichen Empfindlichkeitsfunktionen der genannten Prozesse substituiert
werden.
System nach Anspruch 12, dadurch gekennzeichnet, dass die genannte
arbiträre Konstante 1 ist.
System nach Anspruch 11 bis 13, dadurch gekennzeichnet, dass die genannte
Steuerzielfunktion Es(t) = 1/2e(t)2 ist, wobei
e(t) jeden der Fehlerwerte (e1(t), e2(t), ...) repräsentiert,
die die Differenzwerte zwischen den genannten gemessenen Prozessvariablen
(y1, y2, ...) und den genannten Sollwerten (r1,
r2, ...) sind.
System nach Anspruch 11 bis 14, dadurch gekennzeichnet, dass die genannten
Controller (C11, C22, ...) und Kompensatoren (C21,
C12, ...) künstliche neuronale Netzwerke sind.
System nach Anspruch 15, dadurch gekennzeichnet, dass
a) jeder genannte Controller (C11, C22, ...) und Kompensator
(C21, C12, ...) ein dreischichtiges künstliches neuronales
Netzwerk (18) beinhaltet, das wiederum Folgendes umfasst:
i) eine erste Schicht (20) aus einer ersten Mehrzahl von Neuronen, die
jeweils als Eingang und Ausgang (E1 bis EN) einen Wert haben,
der für den genannten Fehlerwert (e1, e2, ...) in einer aus
einer Mehrzahl von aufeinander folgenden Iterationen repräsentativ ist;
ii) eine zweite Schicht (22) aus einer zweiten Mehrzahl von Neuronen (30),
die jeweils als Eingänge die Werte der Ausgänge jedes aus der genannten ersten Mehrzahl
von Neuronen multipliziert mit einem ersten Variablengewichtungsfaktor (wij)
haben; und deren Ausgangswert (p1 bis pN) die Summe ihrer
Eingangswerte ist; und
iii) ein Dritte-Schicht-Neuron (34), dessen Eingänge (q1 bis
qN) Werte sind, die für den Ausgangswert (p1 bis pN)
jedes aus der genannten zweiten Mehrzahl von Neuronen multipliziert mit einem zweiten
Variablengewichtungsfaktor (hj) repräsentativ sind und dessen Ausgangswert
die Summe seiner Eingangswerte ist;
b) wobei jeder der genannten Steuerwerte (v11, v22, ...) ein
Wert ist, der für die Summe aus dem neuronalen Netzwerkausgang (o(t)) und dem genannten
Fehlerwert (e1, e2, ...) in der aktuellen Iteration repräsentativ
ist;
c) wobei der genannte erste Gewichtungsfaktor kontinuierlich in jedem genannten
Controller in aufeinander folgenden Iterationen gemäß der folgenden Formel aktualisiert
wird:
und in jedem genannten Kompensator gemäß der folgenden Formel:
wobei &Dgr;wij die Änderung des Gewichtungsfaktors des Ausgangs des i-ten
Erste-Mehrzahl-Neurons zum j-ten Zweite-Mehrzahl-Neuron von der letzten vorherigen
Iteration zur aktuellen Iteration ist; &eegr; ein vorgewählter Lernfaktor ist; Kc
ein vorgewählter positiver Controller-Gain ist, der die Empfindlichkeitsfunktion
∂y(t)/∂u(t) des genannten Prozesses ersetzt; e der Fehlerwert für einen
bestimmten Controller oder Kompensator ist; qj der normalisierte Ausgang
des j-ten Zweite-Mehrzahl-Neurons ist; Ei der normalisierte verzögerte
Fehlerwert ist, der auf die i-ten Erste-Mehrzahl-Neuronen dieses Controllers oder
Kompensators angewendet wird; &Sgr;hk die Summe der genannten zweiten
Gewichtungsfaktoren ist; (n) die aktuelle Iteration bezeichnet; N die genannte erste
Mehrzahl ist; und l und m = 1, 2, ... N mit l ≠ m ist; und
d) wobei der genannte zweite Gewichtungsfaktor kontinuierlich in aufeinander folgenden
Iterationen in jedem genannten Controller gemäß der folgenden Formel aktualisiert
wird:
&Dgr;hllj(n) = &eegr;llKllce1(n)qllj(n),
und in jedem der genannten Kompensatoren gemäß der folgenden Formel:
&Dgr;hlmj(n) = &eegr;lmKlmcem(n)qlmj(n),
wobei &Dgr;hj die Änderung des Gewichtungsfaktors des Ausgangs des j-ten
Zweite-Mehrzahl-Neurons zu dem genannten Dritte-Schicht-Neuron von der letzten vorherigen
Iteration zur aktuellen Iteration ist.
System nach Anspruch 16, dadurch gekennzeichnet, dass der Ausgang
von Controller ll wie folgt lautet:
und der Ausgang des Kompensators lm wie folgt lautet:
wobei Kslm ein Vorzeichenfaktor ist, der
1 ist, wenn Prozesse ll und lm von unterschiedlich wirkenden Typen sind, und –1,
wenn Prozesse ll und lm vom gleich wirkenden Typ sind.
System nach einem der Ansprüche 11 bis 17, angepasst an Prozesse (86),
in denen die gemessenen Prozessvariablen (y1, y2, ...) eine
große Zeitverzögerung bei der Reaktion auf die genannten Prozesseingänge (u1,
u2, ...) haben, dadurch gekennzeichnet, dass es ferner Folgendes umfasst:
a) Verzögerungsprädiktoren (D11, D22, ...), die als Eingänge
die genannten gemessenen Prozessvariablen (y1, y2, ...) und
die genannten Prozesseingänge (u1, u2, ...) haben, wobei die
Ausgänge der genannten Verzögerungsprädiktoren wie folgt lauten:
wobei Y(S), U(S) und Yc(S) die Laplace-Transformationen jedes der genannten
gemessenen Prozessvariablen (y1, y2, ...), der Prozesseingänge
(u1, u2, ...) und der Verzögerungsprädiktorausgänge (yc1,
yc2, ...) sind; K, T und &tgr; Konstanten sind, und
b) die Fehlerwerte (e1, e2, ...) errechnet werden durch e1(t)
= r1(t) – yc1(t), e2(t) = r2(t)
– yc2(t), ...
Modellfreies adaptives Kaskadensteuersystem für stabile, steuerbare
und direktwirkende oder umgekehrt wirkende industrielle Open-loop-Prozesse bestehend
aus einer Mehrzahl von seriell geschalteten Subprozessen (P2 und P3)
mit unterschiedlichen Steueranforderungen, wobei jeder Prozess einen Subprozesseingang,
einen Subprozessausgang, der der Subprozesseingang des nächsten Subprozesses in
der Serie ist, und eine Empfindlichkeitsfunktion hat, die das Verhältnis zwischen
den partiellen Ableitungen mit Bezug auf Zeit des genannten Prozessausgangs und
des genannten Prozesseingangs ist, wobei das genannte System Mittel zum Messen des
Ausgangs (y1) des letzten Subprozesses (P3) in der genannten
Serie hat und dadurch gekennzeichnet ist, dass es Folgendes umfasst:
a) eine Mehrzahl von seriell geschalteten Controllern (C1 und C2)
jeweils mit einem Fehlerwerteingang (e1 oder e2), wobei der
Eingang (e1) des ersten Controllers (C1) die Differenz zwischen
dem gemessenen Ausgang (y1) des letzten Subprozesses (P3)
und einem gewählten Sollwert (r1) ist, und der Eingang (e2)
des zweiten Controllers (C2) die Differenz zwischen dem gemessenen Ausgang
(y2) des ersten Subsprozesses (P2) und dem Ausgang (u1)
des ersten Controllers (C1) ist, wobei jeder Controller einen Steuerwertausgang
(u1, u2) hat und so gestaltet ist, dass er iterativ, über
ein sich bewegendes Zeitfenster, den genannten Steuerwert variiert, um die genannten
Fehlerwerte (e1, e2) zu minimieren;
b) wobei eine Steuerzielfunktion Es(t) = ½e(t)2 ist,
wobei e(t) jeweils die Fehlerwerte (e1(t), e2(t)) repräsentiert,
die die Differenzwerte zwischen den genannten gemessenen Prozessvariablen (y1,
y2) und den genannten Sollwerten (r1, r2) sind;
c) einen Lernmechanismus mit der Aufgabe, kontinuierlich iterativ die Parameter
für die genannten Controller zum Variieren der genannten Controllerausgänge (u1,
u2) zu modifizieren, um alle genannten Fehlerwerte (e1, e2)
zu reduzieren, wobei der genannte Lernmechanismus nur auf den genannten gemessenen
Prozessausgängen (y1, y2), den genannten Controller-Ausgängen
(u1, u2) und dem genannten Sollwert (r1, r2) basieren.
System nach Anspruch 19, ferner dadurch gekennzeichnet, dass eine
arbiträre Nicht-Null-Konstante für die tatsächliche Empfindlichkeitsfunktion jedes
der genannten Subprozesse in dem genannten Lernmechanismus substituiert wird.
Verfahren zum Steuern einer Anlage mit einem variablen Eingang, einem
Ausgang und einer unbekannten Beziehung zwischen dem genannten Eingang und dem genannten
Ausgang, ohne Approximation oder Modellierung der genannten Beziehung, dadurch gekennzeichnet,
dass das Verfahren die folgenden Schritte umfasst:
a) Wählen eines Sollwertes, der einen Sollwert des genannten Ausgangs repräsentiert;
b) Errechnen eines Fehlerwertes, der von der Differenz zwischen dem genannten Sollwert
und dem genannten Ausgang abhängig ist;
c) Anwenden des genannten Fehlerwertes auf einen Controller, der einen dynamischen
Block enthält, dessen einzige Eingänge zeitverzögerte Funktionen des genannten Fehlerwertes
sind und dessen Ausgang ein Teil eines Steuerwertes ist, der den genannten Werkseingang
variiert; und
d) kontinuierliches iteratives Variieren der Parameter des genannten dynamischen
Blockes, nur um den genannten Fehlerwert zu minimieren.
Verfahren nach Anspruch 21, ferner dadurch gekennzeichnet, dass das
Verfahren den Schritt des Addierens des genannten Fehlerwertes zu dem genannten
dynamischen Blockausgang beinhaltet, um den genannten Steuerwert
zu erzeugen.