PatentDe  


Dokumentenidentifikation DE69823049T2 17.03.2005
EP-Veröffentlichungsnummer 0001021752
Titel MODELLFREIE ADAPTIVE PROZESSSTEUERUNG
Anmelder General Cybernation Group, Inc., Rancho Cordova, Calif., US
Erfinder CHENG, Shu-Xing, George, Rancho Cordova, US
Vertreter Grosse, Bockhorni, Schumacher, 81476 München
DE-Aktenzeichen 69823049
Vertragsstaaten AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, IT, LI, LU, MC, NL, PT, SE
Sprache des Dokument EN
EP-Anmeldetag 06.10.1998
EP-Aktenzeichen 989509245
WO-Anmeldetag 06.10.1998
PCT-Aktenzeichen PCT/US98/20956
WO-Veröffentlichungsnummer 0099018483
WO-Veröffentlichungsdatum 15.04.1999
EP-Offenlegungsdatum 26.07.2000
EP date of grant 07.04.2004
Veröffentlichungstag im Patentblatt 17.03.2005
IPC-Hauptklasse G06E 1/00
IPC-Nebenklasse G06E 3/00   G05B 13/02   

Beschreibung[de]
Gebiet der Erfindung

Die Erfindung bezieht sich auf industrielle Prozesssteuerung und insbesondere auf ein Verfahren und eine Vorrichtung zur adaptiven Steuerung verschiedener einfacher bis komplexer, einfach bis mehrfach variabler Prozesssteuersysteme, ohne prozesspezifisches Controller-Design, Prozessidentifizierung, quantitative Kenntnis des Prozesses oder komplizierte Handabstimmung zu benötigen.

Hintergrund der Erfindung

Das Aufkommen der Informationstechnologie während des letzten Jahrzehnts hat die heutige Zivilisation wesentlich beeinflusst. Die Informationsrevolution hat in der Welt der industriellen Prozesssteuerung bedeutende Änderungen ausgelöst. Eine derartige Intelligenz wie Steuerungsalgorithmen, die in der aktuellen Instrumentenebene vertreten sind, dehnt sich nach oben auf die überwachende Computer-Ebene oder nach unten auf die Sensor-/Transmitterebene aus. Zu dieser Änderung führt der Feldbus, ein digitales Kommunikationsnetzwerk für Sensor, Vorrichtung und Feld. Die Vorteile bei der Benutzung der Feldbustechnologie können u. a. Verdrahtungsersparnisse, flexiblere und leistungsfähigere Optionen bei der Implementierung von Steuerungen, gegenseitige Wartung und diagnostische Informationen beinhalten. Zukünftige Prozesssteuersysteme werden daher durch Feldbus-Controller und Computer mit einer Feldbusverbindung implementiert werden. Die herkömmliche Instrumentenebene mit verteilten Steuersystemen (Distributed Control Systems (DCS)) und speicherprogrammierbaren Steuerungen (SPS) wird schließlich verschwinden.

United States Patentschrift Nr. US 5,519,612 nach Liubakka et al ist für einen modellbasierten, adaptiven Controller des bekannten Stands der Technik repräsentativ, der ein Prozessmodell voraussetzt.

Der Feldbus-Controller ist, worauf sein Name hindeutet, ein an den Feldbus angeschlossener Controller, der in einer Transmitter-Einfassung angeordnet sein kann. Da der Feldbus-Controller im Feld und nicht in der Steuerzentrale installiert ist, sollte er sehr robust sein und kontinuierlich ohne Beachtung arbeiten. Diese Art von Controller benötigt solide Hardware, Software und Steuerungsalgorithmen. Da der aktuelle konventionelle Proportional-Integral-Derivative-(PID)-Steuerungsalgorithmus von Hand abgestimmt werden muss, ist er nicht immer eine gute Lösung für einen Feldbus-Controller.

In den letzten Jahren haben sich die Qualität, Funktionalität und Zuverlässigkeit von Personal Computers (PCs) wesentlich verbessert. Mit Microsofts Multitasking Windows NT Betriebssystem kann ein PC ein zuverlässiges und wirtschaftliches Gerät für missionskritische Applikationen sein, wie zur direkten Prozessregelkreissteuerung.

Die Welt der traditionellen Prozesssteuerung ist auf diese bedeutende Änderung schlecht vorbereitet. Jahrzehnte alte Steuerschemen wie PID werden heute noch weit und breit eingesetzt. In der Fabrik stehen wir häufig komplizierten Steuerproblemen gegenüber, deren Lösung hochgradige Fach- und Sachkenntnisse voraussetzt. Zur gleichen Zeit werden die Prozesse Tag und Nacht von schlecht vorbereiteten Bedienern betrieben – eine Tatsache, die ignoriert wird und nicht unberücksichtigt gelassen werden kann. Es ist daher wünschenswert, gewöhnlichen Bedienern eine Steuertechnik sowie Produkte zu bieten, mit denen sie einfache bis komplizierte Prozesse leicht und effektiv steuern können.

Die derzeitige Steuertechnik im Bereich der Prozesssteuerung ist im Wesentlichen wie folgt:

1. PID-Steuerung

Der alte PID-Controller ist bis heute noch der am meisten benutzte industrielle Controller. PID ist einfach, kann leicht implementiert werden und benötigt kein Prozessmodell, weist aber wesentliche Unzulänglichkeiten auf. Erstens funktioniert PID für den wesentlich linearen, zeitinvarianten Prozess, der nur kleine oder keine dynamischen Änderungen haben kann. Diese Voraussetzungen sind für viele industrielle Prozesse zu einschränkend. Zweitens muss PID vom Benutzer richtig abgestimmt werden; d. h., seine Parameter müssen auf Basis der Prozessdynamik ordnungsgemäß eingestellt werden. Im wirklichen Einsatz ist die PID-Abstimmung häufig eine frustrierende Erfahrung. Letztens kann PID nicht effektiv zur Steuerung komplizierter Systeme eingesetzt werden, die gewöhnlich nicht linear, zeitvariant, gekuppelt sind und Unsicherheiten in Bezug auf Parameter oder Struktur aufweisen. In der Fabrik ist häufig festzustellen, dass viele Regelkreise in der manuellen Betriebsart gelassen werden, da die Bediener es schwierig finden, in der automatischen Closed-loop-Steuerungsart für den ruhigen Lauf des Regelkreises zu sorgen. Infolge dieser Unzulänglichkeiten leiden viele industrielle Steuersysteme durch die fortgesetzte Benutzung der PID-Steuerung heute an Problemen in Bezug auf Sicherheit, Qualität, Energieverschwendung und Produktivität.

Zur Bewältigung von PID-Abstimmproblemen sind manche selbst abgleichende PID-Methoden entwickelt worden. Viele kommerzielle Controller mit einem Regelkreis sowie viele verteilte Steuersysteme sind mit selbsttätig abstimmenden oder selbst abgleichenden PID-Controllern ausgerüstet, deren Anwendungen jedoch auf wesentliche Hindernisse getroffen sind. Wenn die Selbstabgleichung modellbasiert ist, muss in der Closed-loop-Situation ein Bump eingefügt werden, um das Prozessmodell zur erneuten PID-Abgleichung online zu finden. Bediener finden dieses Verfahren unangenehm. Wenn die Selbstabgleichung regelbasiert ist, ist es häufig schwierig, zwischen den Auswirkungen von Laststörungen und echten Änderungen der Prozessdynamik zu unterscheiden. Der Controller kann auf eine Störung also überreagieren und einen unnötigen Adaptierungsübergang erzeugen. Ferner kann die Abstimmungszuverlässigkeit in einem regelbasierten System fraglich sein, da für die regelbasierten Systeme keine ausgereiften Methoden zur Stabilitätsanalyse zur Verfügung stehen. Aus der Erfahrung ist daher bekannt, dass viele selbst abgleichende PID-Controller eher in der so genannten selbsttätig abstimmenden Methode als in der kontinuierlichen selbst abgleichenden Methode betrieben werden. Selbsttätige Abstimmung ist gewöhnlich als ein Merkmal definiert, bei welchem die PID-Parameter auf Grund eines vereinfachten Prozessmodells, das in der Open-loop-Situation erreicht werden kann, automatisch kalkuliert werden.

2. Adaptive Steuerung

Ein adaptives Steuersystem kann als ein rückgekoppeltes Steuersystem definiert werden, das intelligent genug ist, um seine Charakteristiken in einem wechselnden Umfeld zu verstellen, damit es auf optimale Weise manchen spezifizierten Kriterien entsprechend funktioniert. Im Allgemeinen haben adaptive Steuersysteme in Steueranwendungen für Flugzeuge, Raketen und Raumfahrzeuge großen Erfolg verzeichnet. In industriellen Prozesssteuerungsanwendungen ist die traditionelle adaptive Steuerung jedoch nicht sehr erfolgreich gewesen. Die lobenswerteste Leistung ist einzig das vorstehend beschriebene selbst abgleichende PID-Schema, das weit reichend in kommerziellen Produkten implementiert ist, ohne aber vom Benutzer besonders gut benutzt oder anerkannt zu werden.

Traditionelle adaptive Steuerungsmethoden, entweder modellbezogen oder selbst abgleichend, benötigen für die Prozessdynamik gewöhnlich irgendeine Art von Identifikation. Dies trägt zu einer Anzahl von grundlegenden Problemen bei, wie das Ausmaß des u. U. erforderlichen Offline-Trainings, der Kompromiss zwischen der ständigen Erregung von Signalen zur richtigen Identifizierung und die Reaktion des stationären Systems im Sinn von Regelgüte, der Annahme der Prozessstruktur, der Modellkonvergenz- und Systemstabilitätsfragen in reellen Applikationen. Ferner setzen traditionelle adaptive Steuerungsmethoden die Kenntnis der Prozessstruktur voraus. Sie haben bedeutende Schwierigkeiten, nicht lineare, strukturvariante oder große zeitverzögerte Prozesse zu bewältigen.

3. Robuste Steuerung

Robuste Steuerung ist eine Controller-Designmethode, die auf die Zuverlässigkeit (Robustheit) des Steuerungsgesetzes fokussiert ist. Robustheit ist gewöhnlich als die Mindestanforderung definiert, die ein Steuersystem zu erfüllen hat, um im praktischen Einsatz nützlich zu sein. Nach dem Design des Controllers ändern sich seine Parameter nicht mehr, und Regelgüten sind garantiert. Die robusten Steuerungsmethoden setzen entweder im Zeit- oder im Frequenzbereich voraus, dass die Prozessdynamik und ihre Variationsbreiten bekannt sind. Manche Algorithmen benötigen u. U. kein präzises Prozessmodell, sondern dann irgendeine Art von Offline-Identifizierung. Das Design eines robusten Steuersystems basiert kennzeichnend auf der Annahme des ungünstigsten Falls, sodass das System im Sinne der Regelgüte unter normalen Verhältnissen normalerweise nicht im optimalen Zustand arbeitet.

Robuste Steuerungsmethoden sind gut für Anwendungen geeignet, bei denen die Stabilität und Zuverlässigkeit des Steuersystems an erster Stelle stehen, die Prozessdynamik bekannt ist und Variationsbreiten von Unsicherheiten geschätzt werden können. Luft- und Raumfahrzeugsteuerungen sind einige Beispiele solcher Systeme. Auch bei Prozesssteueranwendungen können manche Steuersysteme mit robusten Steuerungsmethoden konstruiert werden. Das Design eines robusten Steuersystems setzt jedoch hochgradige Fach- und Sachkenntnisse voraus. Sobald das Design fertig gestellt ist, kann das System gut arbeiten. Andererseits benötigt das System ein neues Design, wenn Aktualisierungen oder wesentliche Modifizierungen erforderlich sind.

4. Prädiktive Steuerung

Prädiktive Steuerung ist wahrscheinlich die einzig fortgeschrittene Steuerungsmethode, die bis heute in industriellen Steuerungsanwendungen erfolgreich benutzt worden ist. Die Essenz der prädiktiven Steuerung beruht auf drei Schlüsselelementen: (1.) prädiktives Modell, (2.) Optimierung im Bereich eines Zeitfensters und (3.) Rückkopplungskorrektur. Diese drei Schritte werden normalerweise von Computerprogrammen kontinuierlich online durchgeführt.

Prädiktive Steuerung ist ein Steuerungsalgorithmus, der auf einem prädiktiven Modell des Prozesses basiert. Das Modell dient sowohl der Voraussage des zukünftigen Ausgangs auf Grund der historischen Informationen des Prozesses als auch des zukünftigen Eingangs. Es betont die Funktion des Modells, nicht dessen Struktur. Deshalb können Zustandsgleichung, Übertragungsfunktion und sogar Sprung- oder Impulsantwort als das prädiktive Modell benutzt werden. Das prädiktive Modell ist fähig, das zukünftige Verhalten des Systems aufzuweisen. Der Designer kann deshalb mit verschiedenen Steuerungsgesetzen experimentieren, um anhand einer Computer-Simulation den resultierenden Systemausgang festzustellen.

Prädiktive Steuerung ist ein Algorithmus der optimalen Steuerung. Er kalkuliert eine zukünftige Steuerungsvorgang auf Basis einer Straf- oder Zielfunktion. Die Optimierung der prädiktiven Steuerung ist jedoch auf einen Zeitraum begrenzt, der sich bewegt, und sie wird kontinuierlich online vorgenommen. Der sich bewegende Zeitraum wird manchmal als Zeitfenster bezeichnet. Das ist der ausschlaggebende Unterschied im Vergleich zu traditioneller optimaler Steuerung, die zur Beurteilung globaler Optimierung eine Zielfunktion heranzieht. Diese Idee funktioniert für komplizierte Systeme mit dynamischen Änderungen und Unsicherheiten recht gut, da es in diesem Fall keinen Anlass gibt, die Optimierungsleistung auf Grund des vollen Zeitbereichs zu beurteilen.

Prädiktive Steuerung ist auch ein Algorithmus der rückgekoppelten Steuerung. Bei einer Fehlanpassung zwischen dem Modell und Prozess oder bei einem durch die Systemunsicherheiten verursachten Regelgüteproblem könnte die prädiktive Steuerung den Fehler ausgleichen oder die Modellparameter auf Basis von Online-Identifizierung abgleichen.

Infolge der Essenz prädiktiver Steuerung ist das Design eines solchen Steuersystems äußerst kompliziert und fordert hochgradiges Fach- und Sachwissen, obgleich das prädiktive Steuersystem bei der Steuerung verschiedener komplizierter Prozesssteuersysteme gut funktioniert. Dieses vorausgesetzte Fach- und Sachwissen scheint der Hauptgrund dafür zu sein, dass prädiktive Steuerung nicht so weit benutzt wird, wie sie es verdient.

5. Intelligente Steuerung

Intelligente Steuerung ist ein anderes bedeutendes Feld der modernen Steuertechnik. Obgleich verschiedene Definitionen der intelligenten Steuerung vorhanden sind, ist sie hier als ein Steuerparadigma bezeichnet, das verschiedenartige künstliche Intelligenzverfahren heranzieht, die u. U. die folgenden Methoden umfassen: Lernsteuerung, Expertensteuerung, Fuzzy-Steuerung und neuronale Netzwerksteuerung.

Die Lernsteuerung benutzt Mustererkennungsverfahren, um den aktuellen Zustand des Regelkreises festzustellen; und sie trifft dann Steuerentscheidungen auf Grund des Regelkreiszustands sowie der vorher gespeicherten Erkenntnisse oder Erfahrungen. Da Lernsteuerung durch ihr Speicherwissen begrenzt ist, ist ihre Anwendung noch nie populär gewesen.

Expertensteuerung auf Grund der Expertensystemtechnik zieht für Steuerungsentscheidungen eine Wissensbasis heran. Die Wissensbasis wird durch menschliche Fachkenntnisse, online erworbene Systemdaten aufgebaut und hat ein Inferenzmaschinen-Design. Da das Wissen der Expertensteuerung symbolisch dargestellt ist und immer ein diskretes Format hat, ist sie zur Lösung von Entscheidungsfindungsproblemen geeignet, wie z. B. Fertigungsplanung, Terminplanung und Fehlerdiagnose. Für kontinuierliche Steuerprobleme ist sie ungeeignet.

Fuzzy-Steuerung ist anders als Lern- und Expertensteuerung auf mathematischen Fundamenten mit Fuzzy-Mengentheorie aufgebaut. Sie stellt Wissen oder Erfahrung in gutem mathematischen Format dar, sodass Arbeitscharakteristiken von Prozess und Systemdynamik durch Fuzzy-Mengen und Fuzzy-Relationalfunktionen beschrieben werden können. Steuerentscheidungen können auf Basis der Fuzzy-Mengen und Funktionen mit Regeln erzeugt werden. Obgleich Fuzzy-Steuerung große Möglichkeiten zur Lösung von komplizierten Steuerproblemen bietet, ist ihr Design-Verfahren kompliziert und setzt ein hochgradiges Fachwissen voraus. Ferner gehört Fuzzy-Mathe nicht zum Gebiet der Mathematik, da viele grundlegende mathematische Operationen nicht existieren. Beispielsweise steht in Fuzzy-Mathe keine inverse Addition zur Verfügung. Dazu kommt, dass es sehr schwierig ist, eine Fuzzy-Gleichung zu lösen, obgleich die Lösung einer Differenzialgleichung zu den grundlegenden Übungen der traditionellen Steuerungstheorie und -applikationen gehört. Der Mangel an guten mathematischen Werkzeugen ist also ein fundamentales Problem, das die Fuzzy-Steuerung bewältigen muss.

Neuronale Netzwerksteuerung ist eine Steuermethode, die künstliche neuronale Netzwerke benutzt. Sie bietet große Möglichkeiten, da künstliche neuronale Netzwerke auf einem festen mathematischen Fundament aufgebaut sind, das vielseitige und wohlverstandene mathematische Werkzeuge umfasst. Künstliche neuronale Netzwerke werden auch als ein Schlüsselelement des modellfreien adaptiven Controllers der vorliegenden Erfindung benutzt.

Im Allgemeinen muss das Steuersystem, indem größtenteils die traditionelle adaptive Steuerung, robuste Steuerung, prädiktive Steuerung und intelligenten Steuerungsmethoden benutzt werden, mit hohen Fach- und Sachkenntnissen konstruiert werden, über welche Durchschnittsbenutzer nicht verfügen. Die praktische Steuerung komplizierter Systeme ist wegen der schwierigen Implementierung dieser Methoden sehr schwierig und kostspielig.

Deshalb besteht ein Bedürfnis nach einem fortgeschrittenen Allzweck-Controller, der leicht und effektiv benutzt werden kann, um eine große Vielfalt einfacher und komplizierter Systeme zu steuern. Ein derartiger Controller sollte gute Selbstlern- und Anpassungsfähigkeiten aufweisen, um Änderungen und Unsicherheiten des Systems zu bewältigen. Er sollte auf den Closed-loop-Echtzeit-Eingangs-/Ausgangsdaten sowie auf einem qualitativen Wissen des Systemverhaltens allein basiert sein. Es sollten weder Offline-Identifizierung noch präzise Kenntnis der Systemdynamik erforderlich sein. Zusätzlich sollte der Controller keine komplizierten Design-Verfahren voraussetzen, damit er leicht von Jedermann benutzt werden kann.

Zusammenfassung der Erfindung

Die vorliegende Erfindung bewältigt die Beschränkungen des Stands der Technik, indem Steuersysteme geboten werden, die einen modellfreien adaptiven (MFA) Controller benutzen. Der MFA dieser Erfindung benutzt einen solchen dynamischen Block wie ein neuronales Netzwerk mit zeitverzögerten Eingängen, um jeglichen ein- oder mehrfach variablen, stabilen, steuerbaren und konsistent direkt wirkenden oder umgekehrt wirkenden, industriellen Open-loop-Prozess zu steuern, ohne komplizierte Handabstimmung oder Identifizierer oder quantitative Kenntnis des Prozesses zu benötigen. Die Erfindung erreichte dieses Resultat durch Benutzung eines Lernalgorithmus für das neuronale Netzwerk, dessen Empfindlichkeitsfunktionsfaktor ∂y(t)/∂u(t) durch eine arbiträre Nicht-Null-Konstante ersetzt wird. Als diese Konstante wird vorzugsweise 1 gewählt. Erfindungsgemäß ist der MFA-Controller auch in der Kaskadensteuerung und Steuerung von Prozessen mit langen Antwortverzögerungen vorteilhaft.

Kurze Beschreibung der Zeichnungen

1 ist ein Blockdiagramm, das ein einfach variables, modellfreies, adaptives Steuersystem veranschaulicht, das dieser Erfindung entspricht.

2 ist ein Blockdiagramm, das die Architektur eines einfach variablen, modellfreien, adaptiven Controllers veranschaulicht, der dieser Erfindung entspricht.

3 ist ein Blockdiagramm, das ein mehrfach variables, modellfreies, adaptives Steuersystem veranschaulicht, das dieser Erfindung entspricht.

4 ist ein Blockdiagramm, das ein 2 × 2 mehrfach variables, modellfreies Steuersystem veranschaulicht, das dieser Erfindung entspricht.

5 ist ein Blockdiagramm, das die Architektur eines modellfreien, adaptiven MIMO-Kompensators veranschaulicht, der dieser Erfindung entspricht.

6 ist ein Blockdiagramm, das einen 2 × 2 Prozess veranschaulicht, der durch zwei MFA-Controller mit je einem Regelkreis gesteuert ist, die dieser Erfindung entsprechen.

7 ist ein Blockdiagramm, das ein 3 × 3 mehrfach variables, modellfreies, adaptives Steuersystem veranschaulicht, das dieser Erfindung entspricht.

8 ist ein Blockdiagramm, das ein modellfreies, adaptives SISO-Antiverzögerungssteuersystem veranschaulicht, das dieser Erfindung entspricht.

9 ist ein Blockdiagramm, das ein 2 × 2 modellfreies, adaptives Antiverzögerungssteuersystem veranschaulicht, das dieser Erfindung entspricht.

Modell 10 ist ein Blockdiagramm, das ein Kaskadensteuersystem mit 2 MFA- oder PID-Controllern veranschaulicht.

11 ist ein Zeit-Amplituden-Diagramm, das die MFA- und PID-Steuerung des strukturvarianten Prozesses 1 veranschaulicht.

12 ist ein Zeit-Amplituden-Diagramm, das die MFA- und PID-Steuerung des strukturvarianten Prozesses 2 veranschaulicht.

13 ist ein Zeit-Amplituden-Diagramm, das einen 2 × 2 Prozess veranschaulicht, der durch einen MIMO-MFA-Controller gesteuert ist.

14 ist ein Zeit-Amplituden-Diagramm, das einen 2 × 2 Prozess veranschaulicht, der durch zwei SISO-MFA-Controller gesteuert ist.

15 ist ein Zeit-Amplituden-Diagramm, das einen 2 × 2 Prozess veranschaulicht, der durch zwei SISO-PID-Controller gesteuert ist.

16 ist ein Zeit-Amplituden-Diagramm, das einen MFA-Antiverzögenangs-Controller für Prozesse mit großen Zeitverzögerungen veranschaulicht.

17 ist ein Zeit-Amplituden-Diagramm, das eine MFA-Antiverzögerungs-Steuerung mit fehlangepasstem Prädiktormodell veranschaulicht.

18 ist ein Zeit-Amplituden-Diagramm, das eine MFA- und PID-Steuerung für Prozesse mit großen Zeitverzögerungen veranschaulicht.

19 ist ein Zeit-Amplituden-Diagramm, das eine modellfreie, adaptive Steuerung für Kaskadensysteme veranschaulicht.

20 ist ein Zeit-Amplituden-Diagramm, das eine PID-Steuerung für Kaskadensysteme veranschaulicht.

21 ist ein Zeit-Amplituden-Diagramm, das eine MIMO-MFA-Steuerung für Destillationskolonnen mit Sollwertänderung veranschaulicht.

22 ist ein Zeit-Amplituden-Diagramm, das eine MIMO-MFA-Steuerung für Destillationskolonnen mit Laständerung veranschaulicht.

Beschreibung der vorgezogenen Ausführungsform A. Einfach variable, modellfreie, adaptive Steuerung

1 veranschaulicht ein einfach variables, modellfreies, adaptives Steuersystem, das die einfachste Form dieser Erfindung ist. Die Struktur des Systems ist so einfach wie ein traditionelles Einzelkreis-Steuersystem mit einem Einzeleingang-Einzelausgang-(SISO: single-input-single-output)Prozess 12, einem Controller 10 und Signaladdierern 14, 16. In 1 sind folgende Signale dargestellt:

r(t) – Sollwert y(t) – Gemessene Variable oder die Prozessvariable, y(t) = x(t) + d(t).

x(t) – Prozessausgang

u(t) – Controllerausgang

d(t) – Störung, die durch Rausch- oder Laständerungen verursachte Störung.

e(t) – Fehler zwischen dem Sollwert und der gemessenen Variablen, e(t) = r(t) – y(t)

Da der modellfreie, adaptive Steuerungsalgorithmus ein adaptiver Online-Algorithmus ist, ist es das Ziel der Steuerung, die gemessene Variable y(t) zu veranlassen, die vorgegebene Trajektorie ihres Sollwerts r(t) unter Sollwert-, Störungs- und Prozessdynamikvariationen zu verfolgen. Anders gesagt, der MFA-Controller hat die Aufgabe, den Fehler e(t) auf eine Online-Weise zu minimieren.

Dann könnten wir als Zielfunktion für das MFA-Steuersystem auswählen Es(t) = 1/2e(t)2

= ½[r(t) – y(t)]2(1)

Die Minimierung von Es(t) wird durch Einstellung der Gewichtungen in dem MFA-Controller vorgenommen.

2 veranschaulicht die Architektur eines SISO-MFA-Controllers. Ein artifizielles neuronales Netzwerk (ANN) 18 mit Mehrlagen-Perzeptron (MLP) wird in das Design des Controllers eingeführt. Das ANN hat eine Eingangsschicht 20, eine verdeckte Schicht 22 mit N Neuronen und eine Ausgangsschicht 24 mit einem Neuron.

Das Eingangssignal e(t) zur Eingangsschicht 20 wird anhand der Normalisierungseinheit 26 in ein normalisiertes Fehlersignal E1 mit einem Bereich von –1 bis 1 umgewandelt, wobei N(.) eine Normalisierungsfunktion bezeichnet. Das E1-Signal geht dann iterativ durch eine Serie von Verzögerungseinheiten 28, wobei z–1 den Verzögerungsoperator der Einheit bezeichnet. Dann wird ein Satz normalisierter Fehlersignale E2 bis EN erzeugt. Auf diese Weise wird ein kontinuierliches Signal e(t) in eine Serie von diskreten Signalen umgewandelt, die als die Eingänge des ANN benutzt werden. Diese verzögerten Fehlersignale E1, i = 1, ... N werden dann durch die neuronalen Netzwerkverbindungen zu der verdeckten Schicht übertragen. Das hat die gleiche Bedeutung, als ob dem neuronalen Netzwerk eine Rückkopplungsstruktur hinzugefügt wäre. Das reguläre statische Mehrlagen-Perzeptron wird dann zu einem dynamischen neuronalen Netzwerk, das eine Schlüsselkomponente des modellfreien adaptiven Controllers ist.

Ein modellfreier adaptiver Controller benötigt als seine Schlüsselkomponente einen solchen dynamischen Block wie ein dynamisches neuronales Netzwerk. Ein dynamischer Block ist nicht mehr als ein anderer Name für ein dynamisches System, dessen Eingänge und Ausgänge dynamische Beziehungen haben.

Jedes Eingangssignal wird separat an jedes der Neuronen in der verdeckten Schicht 22 über eine Strecke übertragen, die durch einen individuellen Gewichtungsfaktor wij gewichtet ist, wobei i = 1, 2 ... N und j = 1, 2 ... N. Die Eingänge zu jedem der Neuronen in der verdeckten Schicht werden durch Addierer 30 mit E0 = 1, dem Schwellensignal für die verdeckte Schicht, über die konstanten Gewichtungen W0j = 1 summiert, um Signal pJ zu erzeugen. Dann wird das Signal pJ durch eine Aktivierungsfunktion 32 gefiltert, um qJ zu erzeugen, wo j das 1-te Neuron in der verdeckten Schicht bezeichnet.

Eine Sigmoidfunktion ϕ(.) zur Abbildung der reellen Zahlen bis (0,1), definiert durch

wird in dem ANN als die Aktivierungsfunktion benutzt.

Jedes Ausgangssignal von der verdeckten Schicht wird an das einzelne Neuron in der Ausgangsschicht 24 über eine Strecke übertragen, die durch einen individuellen Gewichtsfaktor hi gewichtet ist, wobei i = 1, 2 ... N. Diese Signale werden durch Addierer 34 mit h0 = 1, dem Schwellensignal für die Ausgangsschicht, summiert und dann durch Aktivierungsfunktion 36 gefiltert. Eine Funktion 38, definiert durch

bildet den Bereich der Ausgangsschicht von (0,1) zurück in den reellen Raum ab, um den Ausgang o(t) des künstlichen neuronalen Netzwerks 18 zu erzeugen.

Der für den Eingang-Ausgang des Controllers maßgebliche Algorithmus umfasst die folgenden Differenzialgleichungen:

qj(n) = ϕ(pj(n)),(5)
v(t) = Kc[o(t) + e(l)],(7) wobei n die n-te Iteration bezeichnet, o(t) die kontinuierliche Funktion von o(n) ist, v(t) der Ausgang des modellfreien adaptiven Controllers ist, Kc > 0, Controller-Gain 42 genannt, eine Konstante ist, die benutzt wird, um die Größenordnung des Controllers einzustellen. Diese Konstante ist nützlich, und zwar um die Controller-Leistung fein abzustimmen oder das System in einem beständigen Bereich zu halten.

Ein Online-Lernalgorithmus wird entwickelt, um die Werte der Gewichtungsfaktoren des MFA-Controllers kontinuierlich zu aktualisieren, wie folgt:

wobei &eegr; > 0 die Lernrate ist, und die partielle Ableitung ∂y(n)/∂u(n) der Gradient von y(t) mit Bezug auf u(t) ist, wodurch die Empfindlichkeit des Ausgangs y(t) auf Variationen des Eingangs u(t) dargestellt ist. Es ist gut geeignet,
als die Empfindlichkeitsfunktion des Prozesses zu definieren.

Da der Prozess unbekannt ist, ist die Empfindlichkeitsfunktion ebenfalls unbekannt. Dies ist das klassische "Black-box"-Problem, das gelöst werden muss, um den Algorithmus brauchbar zu machen.

Durch die Stabilitätsanalyse der modellfreien adaptiven Steuerung wurde festgestellt, dass Begrenzung von Sf(n) – sofern der zu steuernde Open-loop-Prozess stabil, steuerbar ist und seine Wirkungsart sich während der gesamten Steuerungsperiode nicht ändert – mit einem Satz arbiträrer Nicht-Null-Konstanten garantieren kann, dass das System eingangsbegrenzt-ausgangsbegrenzt (BIBO: bounded-input-bounded-output) stabil ist.

Diese Untersuchung besagt, dass die Prozessempfindlichkeitsfunktion Sf(n) einfach durch eine Konstante ersetzt werden kann; in Bezug auf den Lernalgorithmus des modellfreien adaptiven Controllers sind für Sf(n) keine besondere Behandlung oder keine detaillierten Kenntnisse des Prozesses erforderlich. Durch Auswahl von Sf(n) = 1 ergibt sich der folgende Lernalgorithmus:

&Dgr;hj(n) = &eegr;Kce(n)q1(n),(12)

Die Gleichungen (1) bis (12) funktionieren für beide Prozessarten, d. h. direkt wirkende oder umgekehrt wirkende. Direkt wirkend bedeutet, dass die Erhöhung des Prozesseingangs eine Erhöhung seines Ausgangs veranlassen wird, und umgekehrt. Umgekehrt wirkend bedeutet, dass die Erhöhung des Prozesseingangs eine Verminderung seines Ausgangs veranlassen wird, und umgekehrt. Damit die Funktionsfähigkeit der vorstehenden Gleichungen sowohl für direkt als auch umgekehrt wirkende Fälle erhalten bleibt, muss e(t) anders, und zwar auf Basis der Wirkungsart des Prozesses kalkuliert werden, wie folgt: e(t) = r(t) – y(t), sofern direkt wirkend,(13a) e(t) = –[r(t) – y(t)], sofern umgekehrt wirkend.(13b)

Dies ist die allgemeine Behandlung für die Prozesswirkungsarten. Sie trifft auf alle modellfreien adaptiven Controller zu, die nachstehend vorgestellt werden.

B. Mehrfach variable, modellfreie, adaptive Steuerung

3 veranschaulicht ein mehrfach variables rückgekoppeltes Steuersystem mit einem modellfreien adaptiven Controller. Das System umfasst einen Multieingang-Multiausgang-(MIMO: multi-input-multi-output)Prozess 44, einen Satz Controller 46 und jeweils einen Satz Signaladdierer 48 bzw. 50 für jeden Regelkreis. Die Eingänge e(t) zu dem Controller sind dargestellt, indem die Sollwerte r(t) mit den gemessenen Variablen y(t) verglichen sind, die die Prozessreaktionen auf Controller-Ausgänge u(t) und die Störsignale d(t) sind. Da dies ein mehrfach variables System ist, sind hier alle Signale als fett gedruckte Vektoren wie folgt dargestellt: r(t) = [r1(t), r2(t), ..., rN(t)]T.(14a) e(t) = [e1(t), e2(t), ..., eN(t)]T.(14b) u(t) = [u1(t), u2(t), ..., uN(t)]T.(14c) y(t) = [y1(t), y2(t), ..., yN(t)]T.(14d) d(t) = [d1(t), d2(t), ..., dN(t)]T.(14e), wobei der obere Index T die Transponierte des Vektors und der untere Index N die gesamte Elementzahl des Vektors bezeichnet.

Wir werden ohne Einbuße an Allgemeingültigkeit nachweisen, wie ein mehrfach variables, modellfreies, adaptives Steuersystem mit einem 2-Eingang-2-Ausgang-(2 × 2)-System nach 4 arbeitet, die die 2 × 2 Anordung von 3 ist. In dem 2 × 2 MFA-Steuersystem umfasst der MFA-Controller-Satz 52 zwei Controller C11, C22 und zwei Kompensatoren C21 und C12. Der Prozess 54 hat vier Subprozesse G11, G21, G12 und G22.

Die Prozessausgänge als gemessene Variablen y1 und y2 werden als die Rückführsignale der Hauptregelkreise benutzt. Sie werden bei Addierern 56 mit den Sollwerten r1 und r2 verglichen, um Fehler e1 und e2 zu erzeugen. Der Ausgang jedes Controllers, der einem der Eingänge e1 oder e2 zugeordnet ist, wird durch Addierer 58 mit dem Ausgang des Kompensators kombiniert, der dem anderen Eingang zugeordnet ist, um Steuersignale u1 und u2 zu erzeugen. Der Ausgang eines jeden Subprozesses wird durch Addierer 60 quer addiert, um gemessene Variablen y1 und y2 zu erzeugen. Es ist zu beachten, dass die Ausgänge der Subprozesse in reellen Applikationen nicht messbar sind und einzig ihre kombinierten Signale y1 und y2 gemessen werden können. Die Eingänge u1 und u2 des Prozesses sind von Natur des 2 × 2 Prozesses aus mit ihren Ausgängen y1 und y2 vermascht. Die Änderung eines Eingangs veranlasst die Änderung beider Ausgänge.

Bei diesem 2 × 2 System ist die Elementzahl N in Gleichung 14 gleich 2, und die in 4 gezeigten Signale sind wie folgt:

r1(t), r2(t) – Jeweiliger Sollwert von Controllern C11 bzw. C22.

e1(t), e2(t) – Fehler zwischen Sollwert und gemessener Variablen.

v11(t), v22(t) – Jeweiliger Ausgang von Controller C11 bzw. C22.

v21(t), v12(t) – Jeweiliger Ausgang von Kompensatoren C21 bzw. C12.

u1(t), u2(t) – Eingänge zum Prozess oder die Ausgänge des 2 × 2 Controller-Satzes.

x11(t), x21(t), x12(t), x22(t) – Jeweiliger Ausgang von Prozess G11, G21, G12 bzw. G22.

d1(t), d2(t) – Jeweilige Störung von y1 bzw. y2.

y1(t), y2(t) – Gemessene Variablen des 2 × 2 Prozesses.

Die Beziehung zwischen diesen Signalen ist wie folgt: e1(t) = r1(t) – y1(t)(15a) e2(t) = r2(t) – y2(t)(15b) y1(t) = x11(t) + x12(t)(15c) y2(t) = x21(t) + x22(t)(15d) u1(t) = v11(t) + v12(t)(15e) u2(t) = v21(t) + v22(t)(15f)

Die Controller C11 und C22 haben die gleiche Struktur wie der in 3 gezeigte SISO-MFA-Controller. Die Eingangs- und Ausgangsbeziehung dieser Controller wird durch die folgenden Gleichungen ausgedrückt:

Für Controller C11:

q111(n) = &phgr;(p11j(n)),(17)
&Dgr;h11j(n) = &eegr;11K11ce1(n)q11j(n),(20)

Für Controller C22:

q221(n) = &phgr;(p221(n)),(22)
&Dgr;h22j(n) = &eegr;22K22ce2(n)q221(n).(25)

In diesen Gleichungen sind &eegr;11 > 0 und &eegr;22 > 0 die Lernrate. Kc11 > 0 und Kc22 > 0 sind der jeweilige Controller-Gain für C11 bzw. C22. Ei11(n) ist das verzögerte Fehlersignal von e1(n), und Ei22(n) ist das verzögerte Fehlersignal von e2(n).

5 zeigt die Struktur der Kompensatoren C12 und C21. Diese Struktur unterscheidet sich von der Struktur des SISO-MFA-Controllers von 2 insofern, als dem Ausgang o(t) des neuronalen Netzwerks kein Fehlersignal hinzugerechnet wird. Die Eingangs- und Ausgangsbeziehung in diesen Kompensatoren wird durch die folgenden Gleichungen ausgedrückt:

Für Kompensator C21:

q21j(n) = &phgr;(p21i(n)),(27)
&Dgr;h21j(n) = &eegr;21K21ie1(n)q21i(n),(30)

Für Kompensator C12:

q121(n) = &phgr;(p121(n)).(32)
&Dgr;h12j(n) = &eegr;12K12ie2(n)q12i(n),(35)

In diesen Gleichungen sind &eegr;21 > 0 und &eegr;12 > 0 die Lernrate. Kc21 > 0 und Kc12 > 0 sind der jeweilige Controller-Gain für C21 bzw. C12. Ei21(n) ist das verzögerte Fehlersignal von e1(n), und Ei12(n) ist das verzögerte Fehlersignal von e2(n).

Die Kompensator-Vorzeichenfaktoren Ks21 und Ks12 43 sind ein Satz von Konstanten, die sich auf die Wirkungsarten des Prozesses beziehen, wie folgt: Ks21 = 1, sofern G22 und G21 unterschiedliche Wirkungsarten haben(36a) Ks21 = –1, sofern G22 und G21 die gleiche Wirkungsart haben(36b) Ks12 = 1, sofern G11 und G12 unterschiedliche Wirkungsarten haben(36d) Ks12 = –1, sofern G11 und G12 die gleiche Wirkungsart haben(36d)

Diese Vorzeichenfaktoren sind erforderlich um sicherzustellen, dass die MFA-Kompensatoren Signale in der richtigen Richtung erzeugen, damit die Störungen, die durch die Kopplungsfaktoren des mehrfach variablen Prozesses verursacht werden, reduziert werden können.

Mehrfach variable Prozesse können auch durch Benutzung von MFA-Controllern mit einem Regelkreis gesteuert werden. 6 zeigt ein Systemdiagramm, in welchem 2 modellfreie, adaptive Controller 62 mit je einem Regelkreis benutzt werden, um einen 2-Eingang-2-Ausgang-Prozess 64 zu steuern. In diesem Fall werden die Controller die Kopplungsfaktoren des Prozesses als Störungen behandeln. Dieses Design hat den Vorteil, dass die Struktur des Steuersystems einfacher ist. Infolge der mächtigen adaptiven Fähigkeit des modellfreien adaptiven Controllers sollte dieses System für die mehrfach variablen Prozesse, deren Kopplungsfaktoren nicht sehr stark sind, ziemlich gut funktionieren.

Ein 3 × 3 mehrfach variables, modellfreies, adaptives Steuersystem ist in 7 mit einem Signalflussplan gezeigt. In dem 3 × 3 MFA-Steuersystem umfasst der MFA-Controller-Satz 66 drei Controller C11, C22, C33, sowie sechs Kompensatoren C21, C31, C12, C32, C13 und C23. Der Prozess 68 hat neun Subprozesse G11 bis G33. Die Prozessausgänge als gemessene Variablen y1, y2 und y3 werden als die Rückführsignale der Hauptregelkreise benutzt. Sie werden bei Addierern 70 mit den Sollwerten r1, r2 und r3 verglichen, um Fehler e1, e2 und e3 zu erzeugen. Der Ausgang jedes Controllers, der einem der Eingänge e1, e2 oder e3 zugeordnet ist, wird durch Addierer 72 mit dem Ausgang der Kompensatoren kombiniert, die den beiden anderen Eingängen zugeordnet sind, um Steuersignale u1, u2 und u3 zu erzeugen.

Ohne Einbuße an Allgemeingültigkeit wird nachstehend ein Satz Gleichungen angeführt, die für ein arbiträres, mehrfach variables, modellfreies, adaptives N × N-Steuersystem gelten. Sofern N = 3, trifft es auf das vorstehend erwähnte 3 × 3 MFA-Steuersystem zu.

Für Controller Cll:

q111(n) = &phgr;(p11j(n)),(38)
&Dgr;h11j(n) = &eegr;11K11ce1(n)q11j(n),(41) wo l = 1, 2, ... N.

Für Kompensator Clm:

qlmj(n) = &phgr;(plmi(n)),(43)
&Dgr;hlmj(n) = &eegr;lmKlmcem(n)qlmi(n)(46) wo l = 1, 2, ... N; m = 1, 2, ... N und l ≠ m.

In diesen Gleichungen sind &eegr;ll > 0 und &eegr;lm > 0 die Lernrate. Kcll > 0 und Kclm > 0 sind der jeweilige Controller-Gain für Cll bzw. Clm. Eilm(n) ist das verzögerte Fehlersignal von e1(n), und Eilm(n) ist das verzögerte Fehlersignal von em(n).

KlmS ist der Vorzeichenfaktor für den MFA-Kompensator, der auf Grund der Wirkungsarten der Subprozesse wie folgt ausgewählt wird: KSlm = 1, sofern Gll und Glm unterschiedliche Wirkungsarten haben(47a) KSlm = –1, sofern Gll und Glm die gleiche Wirkungsart haben(47b) wo l = 1, 2, ... N; m = 1, 2, ... N; und l ≠ m.

C. Modellfreie, adaptive Steuerung für Prozesse mit großen Zeitverzögerungen

In Prozesssteuerungsapplikationen haben viele Prozesse große Zeitverzögerungen infolge der Verzögerung bei der Transformation von Wärme, Materialien und Signalen usw. Ein gutes Beispiel ist ein Bandrollprozess, z. B. ein Stahlwalzwerk oder eine Papiermaschine. Es ist völlig gleich, welche Steuermaßnahmen ergriffen werden, ihre Auswirkungen sind ohne eine Zeitverzögerungsperiode nicht messbar. Wenn in diesem Fall ein PID benutzt wird, wird der Controller-Ausgang während der Verzögerungszeit ständig weiter wachsen und eine große Überschwingzeit in Systemreaktionen verursachen oder das System sogar unstabil machen. Smith Predictor ist ein nützliches Steuerschema zur Bewältigung von Prozessen mit großen Zeitverzögerungen. Zur Konstruktion eines Smith Predictor ist jedoch normalerweise eine genaues Prozessmodell erforderlich, da seine Leistung sonst nicht zufrieden stellend sein könnte.

8 zeigt ein Blockdiagramm für ein modellfreies, adaptives, Einzel-Eingang-Einzel-Ausgang-Antiverzögerungssteuersystem mit einem MFA-Antiverzögerungs-Controller 74 und einem Prozess mit großen Zeitverzögerungen 76. Ein Spezialverzögerungsprädiktor ist zur Erzeugung eines dynamischen Signals yc(t) ausgebildet worden, um die gemessene Variable y(t) als das Rückführsignal zu ersetzen. Der Eingang zum Controller 80 wird dann über Addierer 82 wie folgt errechnet: e(t) = r(t) – yc(t).(48)

Die Idee hier ist, ein e(t)-Signal für den Controller zu erzeugen und diesen seine Steuerwirkung ohne große Verzögerung "fühlen" zu lassen, damit die Erzeugung ordnungsgemäßer Steuersignale fortgesetzt wird.

Da der MFA-Controller des Systems über eine starke adaptive Fähigkeit verfügt, kann der Verzögerungsprädiktor in einer einfachen Form entworfen werden, ohne die quantitativen Informationen des Prozesses zu kennen. Er kann beispielsweise in einer generischen Lag-plus-Verzögerungsform (FOLPD: first-order-lag-plus-delay) erster Ordnung ausgebildet werden, die durch die folgende Laplace-Transformationsfunktion dargestellt ist:

wo Y(S), Yp(S), U(S) und Yc(S) jeweils die Laplace-Transformationen von Signalen y(t), yp(t), u(t) bzw. yc(t) sind; wo yp(t) das prädiktive Signal ist; wo yc(t) der Ausgang des Prädiktors ist; wo K, T, &tgr; die Parameter für den Prädiktor auf Basis des Prozessapproximationsmodells in einer FOLPD-Form sind. In echten Anwendungen kann DC-Gain K beim Geräteeichungs- und Datenkonvertierungsverfahren nahe 1 eingestellt werden. Der Benutzer kann die Prozessverzögerungszeit leicht grob abschätzen, die als &tgr; im MFA-Prädiktor benutzt werden kann. T kann entweder vom Benutzer ausgewählt oder als 20T vorgegeben werden, wo T das Stichprobenintervall ist. Spätere Simulationen weisen auf, dass das MFA-Antiverzögerungssystem in Bezug auf diese Parameter nicht sehr empfindlich ist.

Verglichen mit dem traditionellen Smith Predictor ist das Prozessmodell für dieses Design hier nicht erforderlich, und die Simulation zeigt, dass es für Prozesse mit sehr großen Zeitverzögerungen doch noch eine große Regelgüte erzielen kann.

9 veranschaulicht ein 2 × 2 mehrfach variables, modellfreies, adaptives Antiverzögerungssteuersystem. Der MFA-Antiverzögerungs-Controller-Satz 84 umfasst zwei MFA-Controller C11 und C22, zwei Kompensatoren C21 und C12 und zwei Prädiktoren D11 und D22. Der Prozess 86 hat große Zeitverzögerungen in den Hauptregelkreisen. Gleichung (49) kann für das Design des Prädiktors verwendet werden. Ein mehrfach variables MFA-Antiverzögerungs-Steuersystem höherer Ordnung kann ohne Einbuße an Allgemeingültigkeit dementsprechend ausgebildet werden.

D. Modellfreies, adaptives Kaskadensteuersystem

Wenn ein Prozess zwei oder mehr wesentliche potenzielle Störungen hat und der Prozess in zwei Regelkreise geteilt werden kann (einer ist schnell und einer ist langsam), kann die Kaskadensteuerung benutzt werden, um störungsbezogene Berichtigungsmaßnahmen schneller zu ergreifen und so die gesamte Regelgüte zu verbessern. Wie in 10 gezeigt, umfasst ein Kaskadensystem zwei Controller, den Primärcontroller C1 und den Sekundärcontroller C2. Der innere Regelkreis 88 umfasst C2 und P2, und der äußere Regelkreis 92 umfasst C1 und P1, wo P1 90 aus C2, P2 und P3 besteht. Der Ausgang von C1 treibt den Sollwert von C2.

Obgleich Kaskadensteuerung eines der nützlichsten Steuerschemen der Prozesssteuerung ist, wird häufig festgestellt, dass die Bediener in echten Kaskadensteueranwendungen den äußeren Regelkreis nicht schließen. Sie machen gewöhnlich geltend, dass die Systemreaktionen anfangen zu oszillieren, sobald der äußere Regelkreis geschlossen wird.

Wegen der interagierenden Eigenschaft der Regelkreise im Kaskadensteuersystem ist es weitaus wichtiger, dass Controller ordnungsgemäß abgestimmt werden. Wenn jedoch PI- oder PID-Controller benutzt werden, müssen 4 bis 6 PID-Parameter abgestimmt werden. Es ist nicht leicht, gute Kombinationen derartig zahlreicher Parameter zu finden. Wenn die Prozessdynamik häufig wechselt, müssen die Controller dauernd neu abgestimmt werden, denn die interagierende Eigenschaft des inneren und äußeren Regelkreises kann sonst ernsthafte Probleme in Bezug auf Systemstabilität verursachen. Da der MFA-Controller zu einem guten Ausgleich von Änderungen der Prozessdynamik fähig ist, weist die Closed-loop-Dynamik des inneren Regelkreises mit MFA-Controller C2 keine große Änderung auf, auch wenn sich die Prozessdynamik von P2 u. U. stark ändert. Das bedeutet, dass die Zusammenschaltung des äußeren und des inneren Regelkreises viel schwächer wird. Ein stabilerer innerer Regelkreis trägt zu einem stabileren äußeren Regelkreis zu, und umgekehrt. Da jeder einfach variable MFA-Controller ferner nur einen Abstimmparameter hat, den Controller-Gain Kc, und er normalerweise nicht abgestimmt werden muss, wird es viel leichter, das modellfreie, adaptive Kaskadensteuersystem zu starten und aufrecht zu erhalten.

E. Simulationsresultate

Die durch Benutzung der Erfindung erzielten Resultate werden am Besten durch die folgenden Simulationsdiagramme veranschaulicht. Die folgenden Notationen werden bei der Besprechung dieser Diagramme benutzt:

S – Laplace-Transformationsoperator.

Gp(S) – Laplace-Übertragungsfunktion des Prozesses,

Y(S) – Laplace-Transformation von y(t), des Prozessausgangs oder der gemessenen Variablen,

U(S) – Laplace-Transformation von u(t), des Prozesseingangs oder Controller-Ausgangs.

Die Beziehung zwischen Gp(S), Y(S) und U(S) ist:

Die in dieser Simulation benutzten Prozessmodelle sind in diesen Gleichungen dargestellt:

11 und 12 zeigen die Simulationsresultate der MFA- und PID-Steuerung für einen strukturvarianten Prozess, dessen Steuerung sehr schwierig ist. In diesem Fall werden Prozessmodelle 2 bis 5 benutzt. Die Prozessmodelle werden während der Simulation online geschaltet, um die Strukturänderung zu erzeugen. Bei der Simulation ist die Mittelstellung des MFA-Controller-Gain Kc = 1, und PID wird mit Kp = 1, Ki = 10 und Kd = 2 auf Modell 2 abgestimmt. Die gesamten Controller-Abstimmparameter bleiben unverändert, obgleich der Prozess sich ändert.

In 11 und 12 sind die Kurven 100 und 106 Sollwerte für MFA und PID, Kurven 104 und 110 sind gemessene Variablen für MFA und PID, und Kurven 102 und 108 sind die jeweiligen Controller-Ausgänge für MFA bzw. PID.

In 11 beginnt das Prozessmodell mit Modell 2 und ändert sich dann auf 3, und zwar knapp vor der zweiten Sollwertänderung ungefähr im Bereich der 4,5-Minuten-Stelle. In 12 beginnt das Prozessmodell mit Modell 4 und ändert sich dann auf 5, und zwar knapp vor der zweiten Sollwertänderung ungefähr im Bereich der 3,7-Minuten-Stelle. Es ist ohne weiteres erkennbar, dass sich der MFA-Controller den Prozessstrukturänderungen äußerst gut anpassen kann, während der PID-Controller dazu nicht im Stande ist.

13 bis 15 zeigen die Simulationsresultate eines 2 × 2 Prozesses, der jeweils durch einen Satz von MIMO-MFA-Controllern, zwei SISO-MFA-Controllern bzw. zwei SISO-PID-Controllern gesteuert ist. Der 2 × 2 Prozess ist anhand der Prozessmodelle 1, 2, 3 und 4 für jeweils P11, P21, P12 bzw. P22 simuliert. Dieser MIMO-Prozess ist schwer gekoppelt, sodass es ziemlich schwierig ist, ihn zu steuern.

In 13 sind Kurven 112 und 118 die Sollwerte r1 und r2, Kurven 114 und 120 sind die gemessenen Variablen y1 und y2, und Kurven 116 und 122 sind jeweils Ausgänge v11 und v22 für MIMO-MFA-Controller C11 bzw. C22.

In 14 sind Kurven 124 und 130 die Sollwerte r1 und r2, Kurven 126 und 132 sind die gemessenen Variablen y1 und y2, und Kurven 128 und 134 sind jeweils Ausgänge u1 und u2 für SISO-MFA-Controller C1 bzw. C2.

In 15 sind Kurven 136 und 142 die Sollwerte r1 und r2, Kurven 138 und 144 sind die gemessenen Variablen y1 und y2, und Kurven 140 und 146 sind jeweils Ausgänge u1 und u2 für SISO-PID-Controller C1 bzw. C2.

Beim Vergleich von 13, 14 und 15 ist festzustellen, dass der MIMO-MFA die beste Regelgüte und der SISO-PID die schlechteste Regelgüte haben. Ohne die Kompensatoren fällt der Ausgang u2 des SISO-Controllers C2 auf 0 Prozent, eingeschränkt durch die untere Grenze. Mit den MIMO-MFA-Kompensatoren erzielt der MIMO-Controller einen ausgedehnteren Betriebsbereich, sodass sein Ausgang v22 im Arbeitsbereich bleiben kann. Zusätzlich wird der andere Regelkreis von den durch die Sollwertänderungen verursachten Störungen in viel kleinerem Maßstab beeinträchtigt. Abschließend kann die MIMO-MFA-Steuerung die Regelgüte des Systems und seinen Stabilitätsbereich erhöhen. In diesen Simulationen sind die Kc der MFA-Controller ohne Abstimmung auf 1 als Vorgabeeinstellung eingestellt. Der PID-Controller ist gut abgestimmt, aber seine Leistung ist immer noch nicht besonders zufrieden stellend.

16 und 17 zeigen die Simulationsresultate eines Prozesses, der durch einen MFA-Antiverzögerungscontroller mit anderen Verzögerungsprädiktorparametern gesteuert ist. Modell 6 wird zur Simulation eines Prozesses mit großen Zeitverzögerungen benutzt. In diesen Abbildungen zeigen Kurven 148 und 158 den Sollwert r(t), Kurven 150 und 160 zeigen die echte gemessene Variable y(t), Kurven 152 und 162 zeigen den Controller-Ausgang u(t), Kurven 154 und 164 zeigen den Ausgang des Prädiktors yc(t), und Kurven 156 und 166 zeigen das prädiktive Signal yp(t).

Die Auswirkungsweise der Zeitverzögerung auf die Prozessdynamik hängt mit der Zeitkonstanten zusammen. Normalerweise wird das Verhältnis zwischen &tgr; und T benutzt, um die Signifikanz von Zeitverzögerungswirkungen auf einen Prozess zu messen, wie folgt:

Ein PID-Controller kann normalerweise einen Prozess mit einem Verhältnis zwischen &tgr; und T von etwa 1 bewältigen. Hier bei Modell 6 ist dieses Verhältnis zwischen &tgr; und T so hoch wie 9. (&tgr; = 90, dominante Zeitkonstante T = 10). Das zu bewältigen, ist für jede Art normaler Controller sehr schwierig. Der MFA-Antiverzögerungs-Controller kann diesen Prozess jedoch ganz leicht steuern. In 16 ist Prädiktor &tgr; = 90, T = 20, was ziemlich gut mit dem Prozess übereinstimmt. In 17 wird vorsätzlich eine Fehlanpassung zwischen Prädiktorparametern und Prozess erzeugt. Die Prädiktorparameter sind &tgr; = 75, T = 20, die Prozessparamenter sind &tgr; = 90, Dominante T = 10. Ihre Fehlanpassung ist signifikant. Entsprechend 17 kann der MFA den Prozess aber immer noch gut steuern. Der MFA-Antiverzögerungs-Controller bietet wesentliche Vorteile im Vergleich zum traditionellen Smith-Predictor-Steuerschema.

18 zeigt die Simulationsresultate in Bezug auf die Steuerung von Prozessen mit großen Zeitverzögerungen mit normalen MFA- und PID-Controllern. In 18 sind Kurven 168 und 174 die Sollwerte, Kurven 170 und 176 sind die gemessenen Variablen, und Kurven 172 und 178 sind die Ausgänge. Das Prozessmodell 7 wird für die Simulation benutzt. Da das &tgr;/T-Verhältnis für Modell 7 (&tgr; = 20, Dominante T = 10) 2 ist, kann es im Vergleich zu Modell 6 viel leichter gesteuert werden. Es ist jedoch ersichtlich, dass dieser Prozess sogar von einem MFA nicht besonders gut gesteuert werden kann, während ein PID einen Prozess dieser Art überhaupt nicht bewältigen kann, ganz gleich, wie man ihn abstimmt. Diese Simulation impliziert auch den Wert des MFA-Antiverzögerungs-Controllers, der in 16 und 17 gezeigt ist.

19 und 20 zeigen die MFA- und PID-Steuerung für Kaskadensysteme.

In 19 sind Kurven 180 und 186 Sollwerte für C1 und C2, Kurven 182 und 188 sind gemessene Variablen für C1 und C2, und Kurven 184 und 190 sind jeweils Ausgänge für C1 bzw. C2.

In 20 sind Kurven 192 und 198 Sollwerte für C1 und C2, Kurven 194 und 200 sind gemessene Variablen für C1 und C2, und Kurven 196 und 202 sind jeweils Ausgänge für C1 bzw. C2.

Die Simulation beginnt, wenn sowohl der innere Regelkreis als auch der äußere Regelkreis offen sind und u2 (Kurve 190 oder 202) auf 20 Prozent gestellt ist. Der innere Regelkreis wird geschlossen, indem der Auto-/Handschalter von C2 an der 3-Minuten-Stelle auf automatisch gedreht und sein Sollwert r2 (Kurve 186 oder 198) von 20 auf 30 Prozent erhöht wird. Es ist ersichtlich, dass der innere Regelkreis sowohl durch den MFA als auch den PID gut gesteuert werden kann. Der Fern-/Ortsschalter von C2 ist auf Fern gestellt und fordert einen Fernsollwert an der 4,8 Minuten-Stelle. Er wird den Sollwert von C2, r2 (Kurve 186 oder 198) zwingen, dem Ausgang von C1, u1 (Kurven 184, 196) zu folgen. Danach wird der äußere Regelkreis geschlossen, indem der Auto-/Handschalter von C1 auf Auto gedreht wird. Daraufhin sind beide Regelkreise geschlossen, und das System ist in Kaskade geschaltet. Die Regelgüte des Kaskadensystems wird durch Änderung des Sollwerts von C1, r1 (Kurve 180 oder 192) simuliert. Es ist ersichtlich, dass die MFA-Controller das Kaskadensystem ohne besondere Anforderungen steuern können. Der Controller-Gain Kc = 1 ist die Vorgabeeinstellung sowohl für MFA C1 als auch C2. Andererseits wird das PID-gesteuerte System schnell unstabil. Während dieser Simulation gab man sich alle Mühe, den PID abzustimmen, aber das Ergebnis blieb unbefriedigend. Der Grund ist die Empfindlichkeit von PID auf Änderungen der Prozessdynamik. In der Tat erzeugen Wechselwirkungen zwischen den inneren und äußeren Regelkreisen eines Kaskadensystems bedeutende dynamische Änderungen.

F. Simulation des reellen Prozesses

Für die Simulation des MIMO-MFA-Steuersystems wird ein reelles Modell einer Destillationskolonne, die Wood and Berry Kolonne 21, ausgewählt. Das Modell ist durch die folgenden Laplace-Übertragungsfunktionen dargestellt:

wo XD die höchste Komposition oder Destillationskomposition ist, XB die unterste Komposition ist, Rf die Rücklaufströmung ist, Sf die Dampfströmung ist und Fr die Zuführgeschwindigkeit ist. D11 und D22 sind die Störungen, die durch die Änderung der Zuführgeschwindigkeit verursacht werden.

21 und 22 zeigen die Simulationsresultate für diese Destillationskolonne mit einem 2 × 2 MFA-Controller-Satz. 21 zeigt die Regelgüte für Sollwertänderungen, und 22 zeigt die Regelgüte für Laständerungen.

In 21 sind Kurven 204 und 210 die Sollwerte für C11 und C22, Kurven 206 und 212 sind die gemessenen Variablen für C11 und C22, und Kurven 208 und 214 sind die jeweiligen Ausgänge für C11 bzw. C22. Es ist ersichtlich, dass r1 (Kurve 204) an der 1,3-Minuten-Stelle erhöht ist und r2 (Kurve 210) ungefähr an den 4-Minuten- und 6-Minuten-Stellen reduziert ist. Dies demonstriert eine gute Regelgüte insgesamt. Infolge der Funktionen der MFA-Kompensatoren, die im MIMO-MFA-Controller-Satz enthalten sind, sind die Störungen von geringer Größe. Wenn normale PID-Controller benutzt würden, wären die Störungen weitaus signifikanter, was bedeutende Steuerprobleme verursachen würde.

In 22 sind Kurven 216 und 222 die Sollwerte für C11 und C22, Kurven 218 und 224 sind die gemessenen Variablen für C11 und C22, und Kurven 220 und 226 sind die jeweiligen Ausgänge für C11 bzw. C22. Kurve 228 ist der Zuführgeschwindigkeitssollwert fr(t) (Fr(S) in Laplace-Transformation), und Kurven 230 und 232 sind die Störsignale d11(t) und d22(t) (D11(S) und D22(S) in Laplace-Transformation), die durch die Zuführgeschwindigkeitsänderung verursacht sind. Die Simulation zeigt auf, dass sich die Zuführgeschwindigkeit zweimal an der 2-Minuten- und 3,3-Minuten-Stelle ändert, wodurch das System gestört wird. Die MFA-Controller können diese Störungen ausgleichen.


Anspruch[de]
  1. Modellfreies adaptives Steuersystem für einen stabilen, kontrollierbaren und direktwirkenden oder umgekehrt wirkenden industriellen Open-loop-Prozess (12) mit einem Prozesseingang (u(t)), einem Prozessausgang (x(t)), der ein Bestandteil einer gemessenen Prozessvariablen (y(t)) ist, einer Empfindlichkeitsfunktion, die das Verhältnis ∂y(t)/∂u(t) zwischen den partiellen Ableitungen in Bezug auf Zeit des genannten Prozessausgangs (x(t)) und dem genannten Prozesseingang (u(t)) ist, und einer Steuerzielfunktion Es(t), die von dem Fehlerwert (e(t)) errechnet wird, der die Differenz zwischen einer gemessenen Prozessvariablen (y(t)) und einem gewählten Sollwert (r(t)) ist, dadurch gekennzeichnet, dass das System Folgendes umfasst:

    a) einen dynamischen Block mit einem Fehlerwerteingang (e(t)) und einem Steuerwertausgang (v(t)), wobei der genannte dynamische Block so angeordnet ist, dass er iterativ über ein sich bewegendes Zeitfenster den genannten Steuerwertausgang (v(t)) variiert, um den genannten Fehlerwert (e(t)) zu minimieren; und

    b) einen Lernmechanismus zum kontinuierlichen iterativen Modifizieren der Parameter des genannten dynamischen Blocks zum Variieren des genannten Steuerwertausgangs (v(t)), um den genannten Fehlerwert (e(t)) zu reduzieren;

    c) wobei der genannte Prozess gemäß dem Steuerwertausgang (v(t)) gelenkt wird, der als Prozesseingang (u(t)) verwendet wird.
  2. System nach Anspruch 1, ferner dadurch gekennzeichnet, dass der genannte Lernmechanismus nur auf der genannten gemessenen Prozessvariablen (y(t)), dem genannten Steuerwert (v(t)) und dem genannten Sollwert (r(t)) basiert.
  3. System nach Anspruch 1 oder 2, ferner dadurch gekennzeichnet, dass eine arbiträre Nicht-Null-Konstante für die tatsächliche Empfindlichkeitsfunktion des genannten Prozesses (12) in dem genannten Lernmechanismus substituiert wird.
  4. System nach Anspruch 3, dadurch gekennzeichnet, dass die genannte arbiträre Konstante 1 ist.
  5. System nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass die genannte Steuerzielfunktion Es(t) = 1/2e(t)2 und e(t) der genannte Differenzwert zwischen der genannten gemessenen Prozessvariablen (y(t)) und dem genannten Sollwert (r(t)) ist.
  6. System nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass der genannte dynamische Block ein neuronales Netzwerk (18) enthält, das als direkte Eingänge (20) eine Mehrzahl von aufeinander folgenden zeitverzögerten Eingängen (E1 bis EN) des genannten Fehlerwertes (e(t)) hat.
  7. System nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass der Ausgang (o(t)) des genannten neuronalen Netzwerkes (18) und der genannte Fehlerwert (e(t)) zum Erzeugen des genannten Steuerwertes (v(t)) addiert werden.
  8. System nach einem der Ansprüche 1 bis 7, angepasst an einen Prozess (76), in dem die gemessene Prozessvariable (y(t)) eine große Zeitverzögerung beim Reagieren auf den genannten Prozesseingang (u(t)) hat, dadurch gekennzeichnet, dass es ferner Folgendes umfasst:

    a) einen Verzögerungsprädiktor (78), dessen Eingänge die genannte gemessene Prozessvariable (y(t)) und der genannte Prozesseingang (u(t)) sind, wobei der Ausgang des genannten Verzögerungsprädiktors Folgendes ist:
    wobei Y(S), U(S) und Yc(S) jeweils die Laplace-Transformationen der genannten gemessenen Variablen (y(t)), der genannte Prozesseingang (u(t)) und der genannte Verzögerungsprädiktorausgang (yc(t)) sind; K, T und &tgr; sind Konstanten; und

    b) der Fehlerwert (e(t)) wird durch e(t) = r(t) – yc(t) errechnet.
  9. System nach Anspruch 8, dadurch gekennzeichnet, dass K im Wesentlichen 1 ist und T und &tgr; so gewählt werden, dass sie sich bekannten Antwortverzögerungsparametern des genannten Prozesses nähern.
  10. System nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, dass

    a) der genannte dynamische Block ein dreischichtiges künstliches neuronales Netzwerk (18) enthält, das Folgendes umfasst:

    i) eine erste Schicht (20) aus einer ersten Mehrzahl von Neuronen, die jeweils als Eingang und Ausgang (E1 bis EN) einen Wert haben, der für den genannten Fehlerwert (e(t)) in einer aus der Mehrzahl von aufeinander folgenden Iterationen repräsentativ ist;

    ii) eine zweite Schicht (22) aus einer zweiten Mehrzahl von Neuronen (30), die jeweils als Eingänge die Ausgänge von jedem aus der genannten ersten Mehrzahl von Neuronen multipliziert mit einem ersten Variablengewichtungsfaktor (wij) haben und deren Ausgangswert (p1 bis pN) die Summe ihrer Eingangswerte ist; und

    iii) ein Dritte-Schicht-Neuron, dessen Eingänge (q1 bis qN) Werte sind, die für den Ausgangswert (p1 bis pN) von jedem aus der genannten zweiten Mehrzahl von Neuronen multipliziert mit einem zweiten Variablengewichtungsfaktor (hj) sind, und dessen Ausgangswert die Summe seiner Eingangswerte ist;

    b) wobei der genannte Steuerwert (v(t)) ein Wert ist, der für die Summe des neuronalen Netzwerkausgangs (o(t)) und des genannten Fehlerwertes (e(t)) in der aktuellen Iteration repräsentativ ist;

    c) wobei der genannte erste Gewichtungsfaktor (wij) kontinuierlich in aufeinander folgenden Iterationen gemäß der folgenden Formel aktualisiert wird:
    in der &Dgr;wij die Änderung des Gewichtungsfaktors des Ausgangs des i-ten Erste-Mehrzahl-Neurons zum j-ten Zweite-Mehrzahl-Neuron von der letzten vorherigen Iteration zur aktuellen Iteration ist; &eegr; ein vorgewählter Lernfaktor ist; Kc eine vorgewählte Konstante ist; ∂y(t)/∂u(t) die Empfindlichkeitsfunktion des genannten Prozesses ist; e der Fehlerwert ist; qj der normalisierte Ausgang des j-ten Zweite-Mehrzahl-Neurons ist; Ei der normalisierte Fehlerwert ist, der auf das i-te Erste-Mehrzahl-Neuron angewendet wird; N die Zahl von Erste-Mehrzahl-Neuronen ist; &Sgr;hk die Summe der genannten zweiten Gewichtungsfaktoren ist; und (n) die aktuelle Iteration bezeichnet; und

    d) wobei der genannte zweite Gewichtungsfaktor (hj) kontinuierlich in aufeinander folgenden Iterationen gemäß der folgenden Formel aktualisiert wird
    in der &Dgr;hj die Änderung des Gewichtungsfaktors des Ausgangs des j-ten Zweite-Mehrzahl-Neurons zum genannten Dritte-Schicht-Neuron von der letzten vorherigen Iteration zur aktuellen Iteration ist.
  11. Modellfreies adaptives Steuersystem für eine Mehrzahl von stabilen interagierenden industriellen Open-loop-Prozessen (46, 54 oder 68) jeweils mit einem Prozesseingang (u1, u2, ...), einem gemessenen Prozessausgang (x11, x21, x12, x22, ...), einer Empfindlichkeitsfunktion, die das Verhältnis zwischen den partiellen Ableitungen mit Bezug auf Zeit des genannten Prozessausgangs und des genannten Prozesseingangs ist; und einer Steuerzielfunktion Es(t), die von den Fehlerwerten (e1, e2, ...) errechnet wird, die jeweils die Differenz zwischen der gemessenen Prozessvariablen (y1, y2, ...) eines entsprechenden Prozesses und einem gewählten Sollwert (r1, r2, ...) für diesen Prozess sind; dadurch gekennzeichnet, dass das genannte System Folgendes umfasst:

    a) eine erste Mehrzahl von Controllern (C11, C22, ...) jeweils mit einem Fehlerwerteingang (e1, e2, ...) und einem Steuerwertausgang (v11, v22, ...); und eine zweite Mehrzahl von Kompensatoren (C21, C12, ...) jeweils mit einem Fehlerwerteingang (e1, e2, ...) und einem Kompensationswertausgang (v21, v12, ...);

    b) eine Mehrzahl von Addierern (58 oder 72) mit der Aufgabe, zu den einzelnen genannten Steuerwertausgängen (v11, v22, ...) der genannten Controller (C11, C22, ...) die Kompensationswertausgänge (v21, v12, ...) der genannten Kompensatoren (C21, C12, ...) zu addieren;

    c) wobei der Ausgang jedes genannten Addierers als Prozesseingang (u1, u2, ...) von einem der genannten interagierenden Prozesse (G11, G21, G12, G22, ...) verwendet wird; und

    d) einen Lernmechanismus zum kontinuierlichen iterativen Modifizieren der Parameter jedes der genannten Controller und Kompensatoren zum Variieren der genannten Steuerwerte (v11, v22, ...) und Kompensationswerte (v21, v12, ...), um die genannten Fehlerwerte (e1, e2, ...) zu reduzieren; wobei der genannte Lernmechanismus nur auf den genannten gemessenen Prozessvariablen (y1, y2, ...), Steuerwerten (v11, v22, ...) und den genannten Sollwerten (r1, r2, ...) basiert.
  12. System nach Anspruch 11, dadurch gekennzeichnet, dass der genannte Lernmechanismus iterativ die genannten Parameter in Abhängigkeit von den genannten Empfindlichkeitsfunktionen modifiziert, in denen arbiträre Nicht-Null-Konstanten für die tatsächlichen Empfindlichkeitsfunktionen der genannten Prozesse substituiert werden.
  13. System nach Anspruch 12, dadurch gekennzeichnet, dass die genannte arbiträre Konstante 1 ist.
  14. System nach Anspruch 11 bis 13, dadurch gekennzeichnet, dass die genannte Steuerzielfunktion Es(t) = 1/2e(t)2 ist, wobei e(t) jeden der Fehlerwerte (e1(t), e2(t), ...) repräsentiert, die die Differenzwerte zwischen den genannten gemessenen Prozessvariablen (y1, y2, ...) und den genannten Sollwerten (r1, r2, ...) sind.
  15. System nach Anspruch 11 bis 14, dadurch gekennzeichnet, dass die genannten Controller (C11, C22, ...) und Kompensatoren (C21, C12, ...) künstliche neuronale Netzwerke sind.
  16. System nach Anspruch 15, dadurch gekennzeichnet, dass

    a) jeder genannte Controller (C11, C22, ...) und Kompensator (C21, C12, ...) ein dreischichtiges künstliches neuronales Netzwerk (18) beinhaltet, das wiederum Folgendes umfasst:

    i) eine erste Schicht (20) aus einer ersten Mehrzahl von Neuronen, die jeweils als Eingang und Ausgang (E1 bis EN) einen Wert haben, der für den genannten Fehlerwert (e1, e2, ...) in einer aus einer Mehrzahl von aufeinander folgenden Iterationen repräsentativ ist;

    ii) eine zweite Schicht (22) aus einer zweiten Mehrzahl von Neuronen (30), die jeweils als Eingänge die Werte der Ausgänge jedes aus der genannten ersten Mehrzahl von Neuronen multipliziert mit einem ersten Variablengewichtungsfaktor (wij) haben; und deren Ausgangswert (p1 bis pN) die Summe ihrer Eingangswerte ist; und

    iii) ein Dritte-Schicht-Neuron (34), dessen Eingänge (q1 bis qN) Werte sind, die für den Ausgangswert (p1 bis pN) jedes aus der genannten zweiten Mehrzahl von Neuronen multipliziert mit einem zweiten Variablengewichtungsfaktor (hj) repräsentativ sind und dessen Ausgangswert die Summe seiner Eingangswerte ist;

    b) wobei jeder der genannten Steuerwerte (v11, v22, ...) ein Wert ist, der für die Summe aus dem neuronalen Netzwerkausgang (o(t)) und dem genannten Fehlerwert (e1, e2, ...) in der aktuellen Iteration repräsentativ ist;

    c) wobei der genannte erste Gewichtungsfaktor kontinuierlich in jedem genannten Controller in aufeinander folgenden Iterationen gemäß der folgenden Formel aktualisiert wird:
    und in jedem genannten Kompensator gemäß der folgenden Formel:
    wobei &Dgr;wij die Änderung des Gewichtungsfaktors des Ausgangs des i-ten Erste-Mehrzahl-Neurons zum j-ten Zweite-Mehrzahl-Neuron von der letzten vorherigen Iteration zur aktuellen Iteration ist; &eegr; ein vorgewählter Lernfaktor ist; Kc ein vorgewählter positiver Controller-Gain ist, der die Empfindlichkeitsfunktion ∂y(t)/∂u(t) des genannten Prozesses ersetzt; e der Fehlerwert für einen bestimmten Controller oder Kompensator ist; qj der normalisierte Ausgang des j-ten Zweite-Mehrzahl-Neurons ist; Ei der normalisierte verzögerte Fehlerwert ist, der auf die i-ten Erste-Mehrzahl-Neuronen dieses Controllers oder Kompensators angewendet wird; &Sgr;hk die Summe der genannten zweiten Gewichtungsfaktoren ist; (n) die aktuelle Iteration bezeichnet; N die genannte erste Mehrzahl ist; und l und m = 1, 2, ... N mit l ≠ m ist; und

    d) wobei der genannte zweite Gewichtungsfaktor kontinuierlich in aufeinander folgenden Iterationen in jedem genannten Controller gemäß der folgenden Formel aktualisiert wird: &Dgr;hllj(n) = &eegr;llKllce1(n)qllj(n), und in jedem der genannten Kompensatoren gemäß der folgenden Formel: &Dgr;hlmj(n) = &eegr;lmKlmcem(n)qlmj(n), wobei &Dgr;hj die Änderung des Gewichtungsfaktors des Ausgangs des j-ten Zweite-Mehrzahl-Neurons zu dem genannten Dritte-Schicht-Neuron von der letzten vorherigen Iteration zur aktuellen Iteration ist.
  17. System nach Anspruch 16, dadurch gekennzeichnet, dass der Ausgang von Controller ll wie folgt lautet:
    und der Ausgang des Kompensators lm wie folgt lautet:
    wobei Kslm ein Vorzeichenfaktor ist, der 1 ist, wenn Prozesse ll und lm von unterschiedlich wirkenden Typen sind, und –1, wenn Prozesse ll und lm vom gleich wirkenden Typ sind.
  18. System nach einem der Ansprüche 11 bis 17, angepasst an Prozesse (86), in denen die gemessenen Prozessvariablen (y1, y2, ...) eine große Zeitverzögerung bei der Reaktion auf die genannten Prozesseingänge (u1, u2, ...) haben, dadurch gekennzeichnet, dass es ferner Folgendes umfasst:

    a) Verzögerungsprädiktoren (D11, D22, ...), die als Eingänge die genannten gemessenen Prozessvariablen (y1, y2, ...) und die genannten Prozesseingänge (u1, u2, ...) haben, wobei die Ausgänge der genannten Verzögerungsprädiktoren wie folgt lauten:
    wobei Y(S), U(S) und Yc(S) die Laplace-Transformationen jedes der genannten gemessenen Prozessvariablen (y1, y2, ...), der Prozesseingänge (u1, u2, ...) und der Verzögerungsprädiktorausgänge (yc1, yc2, ...) sind; K, T und &tgr; Konstanten sind, und

    b) die Fehlerwerte (e1, e2, ...) errechnet werden durch e1(t) = r1(t) – yc1(t), e2(t) = r2(t) – yc2(t), ...
  19. Modellfreies adaptives Kaskadensteuersystem für stabile, steuerbare und direktwirkende oder umgekehrt wirkende industrielle Open-loop-Prozesse bestehend aus einer Mehrzahl von seriell geschalteten Subprozessen (P2 und P3) mit unterschiedlichen Steueranforderungen, wobei jeder Prozess einen Subprozesseingang, einen Subprozessausgang, der der Subprozesseingang des nächsten Subprozesses in der Serie ist, und eine Empfindlichkeitsfunktion hat, die das Verhältnis zwischen den partiellen Ableitungen mit Bezug auf Zeit des genannten Prozessausgangs und des genannten Prozesseingangs ist, wobei das genannte System Mittel zum Messen des Ausgangs (y1) des letzten Subprozesses (P3) in der genannten Serie hat und dadurch gekennzeichnet ist, dass es Folgendes umfasst:

    a) eine Mehrzahl von seriell geschalteten Controllern (C1 und C2) jeweils mit einem Fehlerwerteingang (e1 oder e2), wobei der Eingang (e1) des ersten Controllers (C1) die Differenz zwischen dem gemessenen Ausgang (y1) des letzten Subprozesses (P3) und einem gewählten Sollwert (r1) ist, und der Eingang (e2) des zweiten Controllers (C2) die Differenz zwischen dem gemessenen Ausgang (y2) des ersten Subsprozesses (P2) und dem Ausgang (u1) des ersten Controllers (C1) ist, wobei jeder Controller einen Steuerwertausgang (u1, u2) hat und so gestaltet ist, dass er iterativ, über ein sich bewegendes Zeitfenster, den genannten Steuerwert variiert, um die genannten Fehlerwerte (e1, e2) zu minimieren;

    b) wobei eine Steuerzielfunktion Es(t) = ½e(t)2 ist, wobei e(t) jeweils die Fehlerwerte (e1(t), e2(t)) repräsentiert, die die Differenzwerte zwischen den genannten gemessenen Prozessvariablen (y1, y2) und den genannten Sollwerten (r1, r2) sind;

    c) einen Lernmechanismus mit der Aufgabe, kontinuierlich iterativ die Parameter für die genannten Controller zum Variieren der genannten Controllerausgänge (u1, u2) zu modifizieren, um alle genannten Fehlerwerte (e1, e2) zu reduzieren, wobei der genannte Lernmechanismus nur auf den genannten gemessenen Prozessausgängen (y1, y2), den genannten Controller-Ausgängen (u1, u2) und dem genannten Sollwert (r1, r2) basieren.
  20. System nach Anspruch 19, ferner dadurch gekennzeichnet, dass eine arbiträre Nicht-Null-Konstante für die tatsächliche Empfindlichkeitsfunktion jedes der genannten Subprozesse in dem genannten Lernmechanismus substituiert wird.
  21. Verfahren zum Steuern einer Anlage mit einem variablen Eingang, einem Ausgang und einer unbekannten Beziehung zwischen dem genannten Eingang und dem genannten Ausgang, ohne Approximation oder Modellierung der genannten Beziehung, dadurch gekennzeichnet, dass das Verfahren die folgenden Schritte umfasst:

    a) Wählen eines Sollwertes, der einen Sollwert des genannten Ausgangs repräsentiert;

    b) Errechnen eines Fehlerwertes, der von der Differenz zwischen dem genannten Sollwert und dem genannten Ausgang abhängig ist;

    c) Anwenden des genannten Fehlerwertes auf einen Controller, der einen dynamischen Block enthält, dessen einzige Eingänge zeitverzögerte Funktionen des genannten Fehlerwertes sind und dessen Ausgang ein Teil eines Steuerwertes ist, der den genannten Werkseingang variiert; und

    d) kontinuierliches iteratives Variieren der Parameter des genannten dynamischen Blockes, nur um den genannten Fehlerwert zu minimieren.
  22. Verfahren nach Anspruch 21, ferner dadurch gekennzeichnet, dass das Verfahren den Schritt des Addierens des genannten Fehlerwertes zu dem genannten dynamischen Blockausgang beinhaltet, um den genannten Steuerwert zu erzeugen.
Es folgen 13 Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche


Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com