Im Bereich der künstlichen Intelligenz hat die Adaptive Resonanztheorie (ART) als Modell zur Erforschung der Informationsverarbeitung im Gehirn zunehmend Aufmerksamkeit auf sich gezogen. Diese von Stephen Grossberg und Gail Carpenter entwickelte Theorie bietet eine Reihe künstlicher neuronaler Netzwerkmodelle, die überwachte und unüberwachte Lernmethoden zur Verarbeitung von Mustern verwenden. Probleme bei der Identifizierung und Vorhersage. Das Kernkonzept von ART besteht darin, dass das Erkennen und die Wahrnehmung von Objekten in der Regel das Ergebnis der Interaktion zwischen „Top-down“-Beobachtungserwartungen und „Bottom-up“-Sensorinformationen sind.
Das ART-Modell geht davon aus, dass „Top-down“-Erwartungen in Form von Erinnerungsvorlagen oder Prototypen vorliegen, die mit den tatsächlichen Eigenschaften des wahrgenommenen Objekts verglichen werden.
Dieser Vergleich ergibt ein Maß für den Grad der kategorialen Eigenschaften, und solange der Unterschied zwischen Wahrnehmung und Erwartung einen festgelegten Schwellenwert, den so genannten „Warnparameter“, nicht überschreitet, wird das wahrgenommene Objekt als der erwarteten Kategorie zugehörig betrachtet. . Mitglied. Das ART-System schlägt daher eine Lösung für das Problem der „Plastizität/Stabilität“ vor, nämlich inkrementelles Lernen bei gleichzeitigem Erwerb neuen Wissens, ohne vorhandenes Wissen zu zerstören.
Das grundlegende ART-System ist ein unüberwachtes Lernmodell, das normalerweise aus einem Vergleichsfeld und einem Erkennungsfeld besteht und Neuronen, Warnparameter und ein Reset-Modul enthält. Das Vergleichsfeld nimmt einen Eingangsvektor entgegen und überträgt ihn an das am besten passende Neuron im Erkennungsfeld. Das optimale Neuron für diese Übereinstimmung gibt ein negatives Signal aus, das andere Neuronen hemmt, sodass das Erkennungsfeld die Eigenschaften einer lateralen Hemmung aufweist und jedes Neuron eine Kategorie darstellen kann.
Nach Abschluss der Klassifizierung des Eingabevektors vergleicht das Reset-Modul die Stärke der Erkennungsübereinstimmung mit den Alarmparametern und entscheidet basierend auf dem Ergebnis, ob mit dem Training begonnen werden soll.
Wenn die Erkennungsübereinstimmung die Warnparameter überschreitet, wird das Training gestartet und die Gewichte der siegreichen Erkennungsneuronen werden angepasst; wenn sie nicht überschritten wird, wird ein Suchvorgang ausgeführt, um aktive Erkennungsneuronen kontinuierlich zu deaktivieren, bis eine Übereinstimmung gefunden wird, die Es wird ein Objekt gefunden, das die Alarmparameter erfüllt. Dieser Prozess und seine Auswirkungen werden maßgeblich durch Wachsamkeitsparameter beeinflusst, wobei hohe Wachsamkeitsparameter zu detaillierten Erinnerungen und niedrige Wachsamkeitsparameter zu allgemeineren Erinnerungen führen.
Es gibt zwei Haupttrainingsmethoden für ART-basierte neuronale Netzwerke: langsames Lernen und schnelles Lernen. Bei langsamen Lernverfahren wird mithilfe von Differentialgleichungen berechnet, wie stark die Gewichte angepasst werden müssen, je nachdem, wie lange der Eingabevektor vorhanden ist. Beim schnellen Lernen werden algebraische Gleichungen verwendet, um die erforderlichen Gewichtsänderungen zu berechnen.
Während schnelles Lernen bei vielen Aufgaben effizient und effektiv ist, sind langsame Lernmethoden biologisch plausibler und können für kontinuierliche Netzwerke verwendet werden.
Im Laufe der Entwicklung von ART sind verschiedene Typen entstanden, beispielsweise ART 1 mit Schwerpunkt auf binären Eingaben und ART 2, das kontinuierliche Eingaben unterstützt. ART 2-A ist eine optimierte Version von ART 2 mit einer deutlich höheren Laufgeschwindigkeit. ART 3 basiert auf ART 2 und simuliert die Regulierung der synaptischen Aktivität durch externe Neurotransmitter und bietet einen physiologisch plausibleren Mechanismus zur teilweisen Hemmung der Kategorie, die eine Fehlpaarungsrücksetzung bewirkt.
Neben den grundlegenden ART-Typen gibt es weitere, komplexere Strukturen wie Fuzzy ART, Fusion ART und TopoART, die Erweiterungen für Mehrmoduskanäle wie Ton und Bild sind.
Die von Fuzzy ART und ART 1 erlernten Kategorien werden jedoch erheblich von der Reihenfolge beeinflusst, in der die Trainingsdaten verarbeitet werden. Selbst bei langsameren Lernraten konnte dieser Effekt nicht vollständig eliminiert werden und wurde als Nebeneffekt des Mechanismus angesehen, der stabiles Lernen für beide Netzwerke gewährleistet. Neuere und fortschrittlichere ART-Netzwerke wie TopoART und Hypersphere TopoART bieten eine Lösung, ohne die Reihenfolge zu berücksichtigen, in der die Kategorien festgelegt werden.
Diese Netzwerke können zu Clustern zusammengefasst werden, wobei die Form der Cluster nicht von der Reihenfolge beeinflusst wird, in der die jeweiligen Kategorien erstellt werden.
Dank des wissenschaftlichen und technologischen Fortschritts und der anhaltenden intensiven Forschung der akademischen Gemeinschaft zur ART-Theorie werden dieses Modell auch weiterhin angewendet und verbessert. Wie können sich zukünftige ART-Systeme noch besser an komplexe Umgebungen anpassen, um die Entwicklung intelligenter Technologien zu fördern?