Share this

Intelligente Robotersteuerung basierend auf der Identifizierung des BP-Netzwerkmodells

2026-02-21 14:15:15 · · #1
Die Untersuchung der Robotersteuerung bei unbekanntem Modell ist von großer Bedeutung für die Weiterentwicklung der Robotik und die praktische Anwendung der Robotersteuerungstheorie. Dieser Artikel schlägt ein iteratives, lernbasiertes Verfahren zur intelligenten Steuerung vor, das auf der Identifizierung des Robotermodells mittels neuronaler Netze beruht. Simulationsergebnisse zeigen die zufriedenstellende Leistungsfähigkeit des Verfahrens. 1 Einleitung: Da Roboter in der Blütezeit der modernen Regelungstechnik aufkamen, ist die Entwicklung ihrer Steuerungstechnik eng mit der Entwicklung dieser Theorie verknüpft. In den über dreißig Jahren der Robotertechnologieentwicklung wurden nahezu alle von der modernen Regelungstechnik bereitgestellten Entwurfsmethoden auf Roboter angewendet. Diese Steuerungsmethoden erfordern bei der Erstellung des mathematischen Robotermodells sinnvolle Näherungen, wobei einige Unsicherheiten vernachlässigt werden. Die Roboterdynamik weist jedoch hochgradig nichtlineare und stark gekoppelte Eigenschaften auf, und ihre Unsicherheiten sind objektiv vorhanden. Diese unsicheren, nicht modellierten Aspekte beeinflussen dynamisch die praktische Anwendung dieser theoretischen Ergebnisse. Die Untersuchung der Robotersteuerung bei unbekanntem Modell ist daher von großer Bedeutung für die Weiterentwicklung der Robotik und die praktische Anwendung der Robotersteuerungstheorie. Künstliche neuronale Netze (KNN) basieren auf Erkenntnissen der modernen Neurologie, Biologie, Psychologie und anderer wissenschaftlicher Disziplinen. Sie bilden die grundlegenden Eigenschaften biologischer Nervensysteme ab und stellen eine Abstraktion, Vereinfachung und Simulation dieser Systeme dar. Als theoretische mathematische Modelle des neuronalen Netzwerks des menschlichen Gehirns bieten sie durch ihre Fähigkeit, beliebige nichtlineare Abbildungen zu approximieren, einen neuen Ansatz zur Lösung von Robotersteuerungsproblemen. In diesem Beitrag wird ein iteratives Lernsteuerungsverfahren vorgestellt, das auf der Identifizierung von Robotermodellen mittels neuronaler Netze beruht. Dieses Verfahren nutzt ein neuronales Netz, um das Vorwärts- oder Inverse-Modell des Robotersystems zu identifizieren und den Einfluss von Systemunsicherheiten und externen Störungen zu eliminieren. Simulationen belegen die Effektivität des Verfahrens. 2 Iterative Lernsteuerung von Robotern basierend auf der Identifizierung von Robotermodellen mittels neuronaler Netze: Iterative Lernsteuerungsverfahren bieten einzigartige Vorteile bei der Behebung von Unsicherheiten, die durch Nichtlinearität oder unzureichende Modellierung des Objekts verursacht werden. Sie ahmen menschliche Lernprozesse nach, indem sie fehlendes Vorwissen während des Lernprozesses kontinuierlich ergänzen und so die Steuerungsleistung des Systems stetig verbessern. Ein neuronales Netzwerk dient der Identifizierung des inversen Modells des Roboters. Dadurch können die Gelenkbewegungen des Roboters die gewünschte Trajektorie entlang der Iterationsachse approximieren. Der iterative Lernregler lernt die Regelparameter online, sodass die Gelenkbewegungen der gewünschten Trajektorie entlang der Zeitachse folgen. In jedem iterativen Lernprozess wird, nachdem das neuronale Netzwerk trainiert wurde, um eine relativ gute Approximationsgenauigkeit bei der Modellerkennung zu erreichen, das Regelungsgesetz des Vorsteuerungsteils für den nächsten iterativen Lernprozess anhand der Ausgabe des neuronalen Netzwerks erstellt. Dieses Gesetz wird dann mit einer Echtzeit-Rückkopplungsregelung kombiniert, um einen robusten iterativen Lernregelungsalgorithmus zu bilden. 2.1 Entwurf des Rückkopplungsreglers: Bei der Verwendung des Erkennungsmodells des neuronalen Netzwerks zur Approximation des tatsächlichen Modells des Robotersystems muss das neuronale Netzwerk bis zur Konvergenz ein oder mehrere Online-Trainingssitzungen durchlaufen, was die Echtzeitleistung der Regelung beeinträchtigt. Darüber hinaus kann die Lernregelung nicht garantieren, dass Nachführfehler in jeder Lerniteration kompensiert werden. Die traditionelle Rückkopplungsregelung hilft, diese Probleme zu überwinden. Um die Störfestigkeit und die anfängliche Robustheit des Systems zu verbessern, kann eine Rückkopplungsregelung eingeführt werden. Diese erhöht die Störfestigkeit und Robustheit des Systems und stellt sicher, dass Nachführfehler in jeder Lerniteration kompensiert werden. 2.2 Entwurf des neuronalen Netzwerk-Erkenners Die allgemeine Form des nichtlinearen autoregressiven Moving-Average-Modells ( NARMAX-Modell ) des Roboters lautet: y(t) = f(y(t-1), y(t-2), ..., y(tn); u(t-1), u(t-2), ..., u(tm)) , wobei u(t) und y(t) die Eingangs- bzw. Ausgangsvektoren des Systems sind; m und n die maximalen Zeitverzögerungen von Eingang und Ausgang darstellen. f ist eine unbekannte nichtlineare Eingangs-Ausgangs-Funktion. Die obige Formel lässt sich vereinfachen zu y(t) = f(I(t-1)) , wobei I(t-1) = [y(t-1)<sup>T</sup>,…,Y(t<sub>n</sub>),…,u(t-1)<sup>T</sup>,…,u(t<sub>m</sub>)<sup>T</sup>]∈R<sup>nq+mp</sup>. Das Identifikationsmodell des dreischichtigen BP- Neuronalnetzes kann dann wie folgt ausgedrückt werden: Hierbei repräsentiert W die Netzwerkgewichte, N die Eingabe-Ausgabe-Abbildungsfunktion des neuronalen Netzes, die Eingabe des neuronalen Netzes ist I(t)∈R<sup>nq+mp</sup>, und die Ausgabe des Netzes besteht aus N<sup>0 </sup> Ausgabeneuronen. Daher ist die Anzahl der Neuronen in der Ausgabeschicht dieses neuronalen Netzes N<sup>0</sup> = q . Für eine gegebene neuronale Netzwerkstruktur wird das Netz trainiert, um die Gewichtungsparameter zu finden, die die Anforderungen erfüllen und die gegebene Zielfunktion optimieren. Die Bestimmung der optimalen Gewichte ist in der Regel schwierig; es kann lediglich eine Annäherung an die wahre Funktion gefunden werden. Daher gilt bei einer Approximationsgenauigkeit ε > 0 und dem Finden eines Gewichts W* , sodass der Fehler zwischen Netzwerkausgabe und erwarteter Ausgabe kleiner als ε ist, das Netzwerkmodell y(t+1) = N(I(t), W*) als Approximation der unbekannten Funktion. Angenommen, der Erkennungsfehler des neuronalen Netzes ist so beschaffen, dass nach dem Training des neuronalen Netzes und dem Erreichen der optimalen Gewichte ( W *) die Bedingung ‖f(I(t)) - N(I(t), W * ) ‖ = ‖e<sup>n</sup>(t+1) ‖ ≤ ε erfüllt ist, und D ist eine Menge auf R<sup>nq+mp</sup> . Somit haben wir ein neuronales Netzwerkmodell erhalten, das das Robotersystem approximiert. Durch die Kombination von Training und Lernsteuerung des neuronalen Netzes lernt dieses in der i-ten Lerniteration mehrmals, das Robotersystemmodell zu approximieren. Ein Fehlerkriterium dient üblicherweise als Standard für die Approximation des Robotersystems durch das Netzwerkmodell. g(·) ist eine Funktion von e(t), wobei e die auf [0, r] definierte Fehlerfunktion ist, die die Abweichung zwischen dem Netzwerkmodell und dem realen System darstellt. Sie ist eine nichtlineare Funktion der Netzwerkparameter (üblicherweise als Gewichte ausgedrückt). Daher reduziert sich das Identifikationsproblem auf ein nichtlineares Optimierungsproblem. Neuronale Netze sind in der Lage, nichtlineare Optimierungsprobleme zu lösen und Informationen parallel mit relativ hoher Geschwindigkeit zu verarbeiten. Daher wird dieses Fehlerkriterium bei der Identifizierung mit neuronalen Netzen verwendet. Der Backpropagation-Algorithmus (BP) wird eingesetzt, um die Gewichte und Schwellenwerte des neuronalen Netzes so anzupassen, dass die Fehlerfunktion minimiert wird. Dabei steht k für die Anzahl der Iterationen, und und repräsentieren die tatsächliche Ausgabe bzw. die Ausgabe des Netzwerkmodells. T ist die Abtastzeit des neuronalen Netzes. Der Gradientenabstieg dient der rekursiven Anpassung der Gewichte. β ist der Lernfaktor, d. h. die Schrittweite der Gradientensuche. Ein großer β-Wert führt zu einer hohen Lerngeschwindigkeit, kann aber leicht zu Gewichtsschwankungen oder sogar Divergenzen führen. Ein kleiner β-Wert hingegen bedingt eine lange Trainingszeit und eine langsame Lerngeschwindigkeit. α ist der Momentumfaktor, dessen Größe den Einfluss vergangener Gewichtsänderungen auf den aktuellen Wert bestimmt. Er speichert die Richtung der vorherigen Gewichtsänderungen, unterdrückt mögliche Systemschwankungen und wirkt glättend. Durch die Wahl eines geeigneten Momentumfaktors lässt sich die Empfindlichkeit des Backpropagation-Algorithmus gegenüber der Fehlerfläche reduzieren und verhindern, dass das Netzwerk in lokalen Minima stecken bleibt. Üblicherweise wird ein Wert um 0,9 gewählt. γ repräsentiert die Anzahl der Trainingsiterationen. Im k-ten Durchlauf werden die Gewichte mit zunehmendem γ in Richtung der optimalen Richtung angepasst, wodurch der Fehler des Identifikationsmodells schrittweise reduziert wird. Sobald eine vorgegebene Approximationsgenauigkeit erreicht ist, kann das Training beendet werden, wodurch die optimalen Gewichte ermittelt werden. Anschließend wird die Netzwerkausgabe berechnet und zur Konstruktion der Vorwärtssteuerung für die (k+1)-te Iteration verwendet. Diese generiert zusammen mit der Echtzeit-Rückkopplungssteuerung den Steuereingang . 2.3 Entwurf des Robotersteuerungsschemas Nach dem Entwurf des neuronalen Netzwerkidentifikators und des Rückkopplungsreglers wird ein iterativer Lernregler eingeführt, um den Entwurf des gesamten Steuerungsschemas abzuschließen. Das Blockdiagramm des Gesamtsystems ist in Abbildung 1 dargestellt. [align=center]Abbildung 1. Blockdiagramm der Steuerungssystemstruktur[/align] Der iterative Lernregler verwendet eine einfache P-Typ-Struktur. u<sub>fb</sub> und u<sub>ff</sub> sind die vom Rückkopplungsregler bzw. vom Lernregler festgelegten Steuergesetze. Im k-ten Lernschritt des Roboters lautet das iterative Lernsteuerungsgesetz: Dabei ist der Rückkopplungssteuerungsterm, k<sub>p</sub> und k<sub>d</sub> sind die positiv definiten Positions- bzw. Geschwindigkeitsverstärkungsmatrizen, die gewünschte Trajektorie des Systems und der tatsächliche Systemausgang im k-ten Lernschritt. ist der Lernsteuerungsterm, k<sub>ILC</sub> ist die Lernverstärkungsmatrix und der Ausgang des neuronalen Netzes im k-ten Lernschritt. Das oben verwendete Lerngesetz kann kein aus anderen Steuerungsmethoden gewonnenes Vorwissen nutzen. Für neue gewünschte Trajektorien muss der Lernprozess von Neuem beginnen. Dieser Lernmechanismus entspricht nicht dem menschlichen Lernverhalten, was ein Hauptgrund dafür ist, dass iterative Lernsteuerung schwer zu etablieren ist. In der einschlägigen Literatur wurde ein Vergessensfaktor eingeführt, um dieses Problem zu beheben. Die Einführung des Vergessensfaktors reduziert die großen Schwankungen des Führungsfehlers zu Beginn der Iteration. Um die neue gewünschte Trajektorie zu verfolgen, werden zunächst die bisherigen Steuerungsdaten des Systems genutzt, um mithilfe eines neuronalen Netzes den gewünschten Eingangswert zu schätzen. Dieser dient als initialer Steuereingang für den iterativen Lernalgorithmus. Anschließend wird der Steuereingang durch das iterative Lernverfahren schrittweise verbessert, sodass die geforderte Genauigkeit bereits nach wenigen Iterationen erreicht werden kann. Dies erhöht die Lerngeschwindigkeit des Systems erheblich und macht die untersuchte Steuerungsmethode praxisnäher. Um eine asymptotische Nachführung der gewünschten Trajektorie y<sub>d</sub>(t) zu erreichen, wird ein verbessertes Lerngesetz verwendet: Dabei ist γ der Vergessensfaktor (0 ≤ γ ≤ 1), e<sub>k</sub>(t) der Nachführfehler (e<sub>k</sub>(t) = y<sub>d</sub>(t) - y<sub>k</sub>(t)) und R(t) die beschränkte Lernverstärkungsmatrix (R(t) ∈ ℝ<sup>m×r</sup>). Der anfängliche Korrekturterm γ<sub>u0</sub>(t) kann große Schwankungen in der iterativen Trajektorie vermeiden und somit die Konvergenzgeschwindigkeit der Iteration beschleunigen. 3. Robotersteuerungssimulation Die Effektivität des Robotersystem-Steuerungsschemas wurde durch Simulation analysiert und mit der einer herkömmlichen Roboter-PID-Regelung verglichen. Die Simulationsergebnisse zeigen, dass die iterative Lernregelung auf Basis neuronaler Netze eine schnelle Konvergenz, hohe Nachführgenauigkeit, geringes Überschwingen sowie gute Robustheit und Regelgüte aufweist. [align=center] Abbildung 2: Antwortkurve der iterativen Lernregelung mit neuronaler Netzwerkmodellidentifikation Abbildung 3: Antwortkurve der konventionellen PID-Regelung[/align] Die Antwortkurven der iterativen Lernregelung und der konventionellen PID-Regelung sind in Abbildung 2 bzw. 3 dargestellt. Die vertikale Achse der Simulationskurven ist in Radiant, die horizontale Achse in Sekunden angegeben. [align=center] Abbildung 4: Antwortkurve mit Störeingang, aber ohne neuronale Netzwerkidentifikation Abbildung 5: Antwortkurve mit Störeingang und neuronaler Netzwerkidentifikation Abbildung 6: Ausgabekurve des Nachführfehlers der iterativen Lernregelung[/align] Die neuronale Netzwerkidentifikation liefert ein genaueres Modell des Roboters und eliminiert den Einfluss von Systemunsicherheiten und externen Störungen. Die Antwortkurven des neuronalen Netzwerkidentifikators sind in den Abbildungen 4, 5 und 6 dargestellt. 4. Fazit Die Anwendung fortschrittlicher Modellierungs- und Regelungstechnologien auf nichtlineare, zeitvariante und stark gekoppelte Objekte wie Roboter hat sich zu einem zentralen Thema in der Forschung zu intelligenten Regelungsmethoden entwickelt. Die Weiterentwicklung intelligenter Regelungslösungen wird die Anwendung von Robotern unweigerlich beschleunigen. Die praktische Anwendung verschiedener intelligenter Regelungslösungen in Robotern ist jedoch noch nicht abgeschlossen.
Read next

Drehzahlregelung mit variabler Frequenz im Wechselstrombereich und Drehzahlregelung mit Gleichstrombereich

1. Entwicklung von Frequenzumrichtern: Gleichstrom- und Wechselstromantriebe wurden im 19. Jahrhundert, also vor über 10...

Articles 2026-02-20