Mit dem Fortschritt der Technologie wird die Technologie zur Gesichtshalluzination im modernen Bereich der Bildverarbeitung immer attraktiver. Gesichtshalluzination ist eine Superauflösungstechnologie, die speziell zur Verbesserung von Gesichtsbildern eingesetzt wird. Sie wandelt verschwommene oder niedrig aufgelöste Gesichtsbilder durch die Analyse typischer Gesichtsmerkmale in hochauflösende Bilder um. Die Anwendungsgebiete der Technologie gehen über die persönliche Identifizierung hinaus und können auch bei strafrechtlichen Ermittlungen und in sozialen Medien eingesetzt werden.
Die Errungenschaften der Gesichtshalluzinationstechnologie haben die Effizienz von Gesichtserkennungssystemen erheblich verbessert und wurden umfassend untersucht.
Obwohl Gesichtshalluzinationen und Bild-Superauflösung Ähnlichkeiten aufweisen, gibt es zwischen ihnen deutliche Unterschiede. Ersteres konzentriert sich auf die Verbesserung von Gesichtsbildern, während es sich bei Letzterem um eine allgemeine Technologie zur Verbesserung der Bildauflösung handelt. Die Gesichtshalluzinationstechnologie nutzt typische Gesichtsvorinformationen, um sie stärker auf den Gesichtsbereich auszurichten.
Nach aktuellen Standards gilt ein Bild als hochauflösend, wenn es eine hohe Anzahl an Pixeln enthält, normalerweise 128 x 96 Pixel. Das Ziel der Gesichtshalluzination besteht darin, Eingabebilder mit niedrigerer Auflösung (beispielsweise 32 × 24 oder 16 × 12 Pixel) auf diesen hohen Standard zu konvertieren.
Bei Gesichtshalluzinationen ist die Bildausrichtung besonders schwierig und selbst kleine Ausrichtungsfehler können das Endergebnis beeinträchtigen.
In den letzten zwei Jahrzehnten wurden viele spezialisierte Algorithmen zur Gesichtshalluzination vorgeschlagen. Diese Methoden können grob in zwei Schritte unterteilt werden: Im ersten Schritt generiert das System ein globales Gesichtsbild unter Verwendung der Maximum-a-posteriori-Schätzung (MAP) der probabilistischen Methode. Der zweite Schritt besteht darin, ein Restbild zu erzeugen, um das Ergebnis des ersten Schritts zu kompensieren.
Interpolation ist eine der einfachsten Methoden zur Erhöhung der Bildauflösung. Sie verbessert die Pixelintensität des Eingabebildes durch benachbarte, bilineare und variante Methoden. Allerdings sind die Ergebnisse solcher Methoden oft unzureichend und es gelingt ihnen nicht, neue Informationen zu berücksichtigen. Daher müssen Forscher neue Ansätze entwickeln.
Diese Methode wurde erstmals von Baker und Kanade vorgeschlagen und basiert auf der Bayes’schen MAP-Formel zur Optimierung der Zielfunktion und zur Verwendung von Trainingsbeispielen zur Generierung hochfrequenter Details.
Diese von J. Yang und H. Tang vorgeschlagene Methode erfordert keine hochauflösenden Daten und verwendet die nicht-negative Matrixfaktorisierung (NMF), um den Unterraum lokaler Merkmale zu erlernen und so die Details der Gesichtsstrukturen hervorzuheben.
Der Erfolg dieser Algorithmen zeigt einmal mehr, wie wichtig die Technologie zur Gesichtshalluzination ist, in der praktischen Anwendung besteht jedoch weiterhin Verbesserungsbedarf.
Mit allen oben genannten Methoden wurden zufriedenstellende Ergebnisse erzielt. Es lässt sich jedoch nicht einfach sagen, welche Methode die wirksamste ist. Es ist zu beachten, dass unterschiedliche Algorithmen unterschiedliche Effekte erzeugen können. Beispielsweise kann die Methode von Baker und Kanade Gesichtszüge verzerren, während der Algorithmus von Wang und Tang einen Ringeffekt erzeugen kann.
Wie kann die Klarheit des Bildes verbessert werden, während die Gesichtszüge erhalten bleiben? Dies wird eine Schlüsselfrage bei der zukünftigen Entwicklung der Gesichtsillusionstechnologie sein.